2007 Bruno Campagnolo PDF

BRUNO CAMPAGNOLO DE PAULA
SISTEMA INTELIGENTE PARA JOGOS DE ESTRATGIA BASEADOS EM TURNOS:

UMA ABORDAGEM UTILIZANDO PLANEJAMENTO BASEADO EM CASOS
Dissertao apresentada ao Programa de PsGraduao
em
Informtica
da
Pontifcia
Universidade Catlica do Paran como requisito

parcial para obteno do ttulo de Mestre em
Informtica.
CURITIBA
MAIO / 2007
BRUNO CAMPAGNOLO DE PAULA
SISTEMA INTELIGENTE PARA JOGOS DE ESTRATGIA BASEADOS EM TURNOS:

UMA ABORDAGEM UTILIZANDO PLANEJAMENTO BASEADO EM CASOS
Dissertao apresentada ao Programa de PsGraduao
em
Informtica
da
Pontifcia
Universidade Catlica do Paran como requisito

parcial para obteno do ttulo de Mestre em
Informtica.
rea de Concentrao: Cincia da Computao
Orientador: Prof. Dr. Alessandro Lameiras Koerich
Co-orientador: Prof. Dr. Fabrcio Enembreck
CURITIBA
MAIO / 2007
D419s
2007
De Paula, Bruno Campagnolo

Sistema inteligente para jogos de estratgia baseados em turnos : uma
abordagem utilizando planejamento baseado em casos / Bruno Campagnolo
De Paula ; orientador, Alessandro Lameiras Koerich ; co-orientador, Fabrcio
Enembreck. 2007.
130 f. : il. ; 30 cm
Dissertao (mestrado) Pontifcia Universidade Catlica do Paran,
Curitiba, 2007
Inclui bibliografia
1. Jogos por computador. 2. Raciocnio. 3. Planejamento. 4. Inteligncia
artificial. I. Koerich, Alessandro Lameiras. II. Enembreck, Fabrcio.
III. Pontifcia Universidade Catlica do Paran. Programa de Ps-Graduao
em Informtica. IV. Ttulo.
CDD 20. ed. 004.16
ii
iii
A minha amada esposa

Daniele,
minha querida av
Flvia
e ao meu saudoso av
Sebastio.
iv
Agradecimentos
Meu primeiro agradecimento para o Professor Doutor Alessandro Koerich. Sem
dvida, alm de um exemplo como Professor, sua pacincia, profissionalismo, e,
principalmente, estmulos nos momentos difceis foram essenciais para o desenvolvimento
deste trabalho. Tambm agradeo a meu co-orientador Professor Doutor Fabrcio Enenbreck
pelas idias, crticas e pela coerncia em todos os momentos.
Registro meus agradecimentos, tambm, algumas pessoas e empresas que apoiaram
direta ou indiretamente minha vida acadmica e profissional nos ltimos anos: da PUCPR, os
Professores Marcos Shmeil, Edson Jos Pacheco, Marco Eleutrio, Henri Eberspcher e
Andreia Malucelli; da Continuum Entertainment, Alexandre Vrubel e demais companheiros;
do CEPIMC, os Professores Joo Batista da Rosa, Daniel Eggert, Gezelda de Moraes , Diogo
Domanski e Dbora Puppin. No posso furtar um agradecimento especial a meus alunos e ao
pessoal do TECPAR por participarem de testes com o prottipo de meu sistema.
A minha me Luci por dedicado toda sua vida a mim e por ter me ensinado a
importncia do estudo. A minha av Flvia pelas oraes e pelo carinho. Ao meu av
Sebastio pelo exemplo de vida e trabalho. A meu pai Dagoberto pela ajuda nos momentos
que precisei. Fica tambm minha gratido a Ccero e Ceclia pela presena alegre e constante.
Aos meus queridos amigos, Rafael Cavichioli, Juliana Dallagnol, Rafael Bardal, Adriane
Granatto e Luiz Cludio Guarita, cuja amizade foi essencial.
Devo irrestrito reconhecimento a minha amada esposa Daniele Bagatoli. Seu amor,
sua inteligncia, carinho e motivao so imprescindveis para minha vida.
SUMRIO
LISTA DE TABELAS ....................................................................................................VIII

LISTA DE FIGURAS ........................................................................................................IX
LISTA DE ABREVIATURAS............................................................................................ X
RESUMO ...........................................................................................................................XI
1 INTRODUO ............................................................................................................. 1
1. 1
APLICAO DE IA EM JOGOS CLSSICOS .................................................... 1
1. 2
APLICAO DE IA EM JOGOS DE COMPUTADOR ........................................ 4
1. 3
DESAFIO .............................................................................................................. 7
1. 4
MOTIVAES NO CONTEXTO ACADMICO E COMERCIAL...................... 8
1.4.1 Ausncia de pesquisa relacionada IA de jogos baseados em imprio............... 10
1.4.2 Necessidade de pesquisa relacionada IA de jogos de computador utilizando
tcnicas de Planejamento............................................................................................... 11
1.4.3 Oportunidade de pesquisa sobre algoritmos para jogos multiplayer................... 11
1.4.4 Oportunidade de pesquisa na rea de algoritmos para jogos multiplayer no
contexto comercial ........................................................................................................ 12
1.4.5 Necessidade de jogos assncronos para atingir os jogadores casuais .................. 12
1.4.6 Jogos de estratgia so um campo de testes para IA em tempo real.................... 13
1. 5
TRABALHO DESENVOLVIDO ........................................................................ 14
1. 6
CONTRIBUIES RELEVANTES.................................................................... 15
1. 7
ORGANIZAO DO DOCUMENTO ................................................................ 16
2 REVISO BIBLIOGRFICA.................................................................................... 17
2. 1
PLANEJAMENTO.............................................................................................. 17
2. 2
PLANEJAMENTO APLICADO A JOGOS......................................................... 19
2.2.1 Tcnicas de planejamento em jogos clssicos.................................................... 19
2.2.2 Aplicaes de planejamento em jogos comerciais ............................................. 20
2. 3
RACIOCNIO BASEADO EM CASOS .............................................................. 23
2. 4
PLANEJAMENTO BASEADO EM CASOS....................................................... 27
2.4.1 Recuperao e organizao da base de casos..................................................... 28
2.4.2 Adaptao e reutilizao de solues anteriores ................................................ 29
2.4.3 Reviso e avaliao da soluo ......................................................................... 29
2.4.4 Armazenamento de novos casos........................................................................ 29
2. 5
PBC E RBC APLICADO A JOGOS COMERCIAIS ........................................... 29
2.5.1 RBC aplicado em SimCity ................................................................................. 29
2.5.2 Reconhecimento de Planos em Space Invaders ................................................. 32
2.5.3 RBC em RTSs ................................................................................................... 34
2.5.4 O ambiente Wargus .......................................................................................... 34
2.5.5 Outras iniciativas de destaque ........................................................................... 36
2. 6
CONSIDERAES FINAIS ............................................................................... 36
3 METODOLOGIA ....................................................................................................... 38
3. 1
DESCRIO DO JOGADOR AUTOMTICO .................................................. 38
3.1.1 Gerao da base de planos ................................................................................ 39
3.1.2 Processo de recuperao dos subplanos............................................................. 44
vi
3.1.3 Preveno de falhas e realimentao da base de casos....................................... 46

3. 2
O JOGO PROMISANCE .................................................................................... 48
3. 3
ADAPTAES FEITAS AO JOGO ................................................................... 50
3. 4
REPRESENTAO DO ESTADO E AES .................................................... 52
3. 5
AVALIAO DO SISTEMA ............................................................................. 53
3. 6
4 RESULTADOS............................................................................................................ 56
4. 1
RESULTADOS DO PRIMEIRO TESTE............................................................. 56
4. 2
RESULTADOS DOS TESTES DE JANEIRO DE 2007 ...................................... 59
4. 3
RESULTADO DOS TESTES DE FEVEREIRO DE 2007 ................................... 67
4. 4
5 CONCLUSES E TRABALHOS FUTUROS ........................................................... 70
LUDOGRAFIA .................................................................................................................. 73
REFERNCIAS BIBLIOGRFICAS .............................................................................. 76
ANEXO 1 TCNICAS DE IA EM JOGOS COMERCIAIS......................................... 84
ANEXO 2 DESCRIO DO PROMISANCE................................................................ 87
ANEXO 3 GENEALOGIA E HISTRIA DOS JOGOS ONLINE............................... 96
ANEXO 4 RANKING DAS RODADAS ...................................................................... 115
vii
LISTA DE TABELAS
Tabela 1 - Desempenho de programas de computador em alguns jogos clssicos.[SMI1998]. 3

Tabela 2- Pesquisa relacionada a RBC em games [AHA2005].............................................. 36
Tabela 3- Aes que os jogadores humanos e automticos podem executar.......................... 53
Tabela 4- Aes mais executadas pelo grupo. ...................................................................... 57
Tabela 5 - Estados mais observados e caractersticas do estado. ........................................... 57
Tabela 6- Aes mais executadas pelo grupo. ...................................................................... 61
Tabela 7 - Estados mais observados e caractersticas do estado. ........................................... 61
viii
LISTA DE FIGURAS
Figura 1 - Exemplo de mtodo para decomposio da tarefa Domination [AVI2004]. ......... 21

Figura 2 - Comportamentos compartilhados entre diferentes NPCs [ORK2004]. .................. 23
Figura 3 - Ciclo do RBC....................................................................................................... 25
Figura 4 - Relao entre esforo para recuperao e para reuso [BER1998].......................... 28
Figura 5 - Caso exemplo do sistema MAYOR [FAS1996]. .................................................. 31
Figura 6 Exemplo de uma rede de dependncia [FAS1996]............................................... 31
Figura 7 Estados possveis no jogo Space Invaders ........................................................... 33
Figura 8 Ferramenta de Apoio Gerao dos Planos......................................................... 40
Figura 9 Criao da Biblioteca de Planos. ......................................................................... 41
Figura 10 Separao em subplanos concretos e abstratos................................................... 42
Figura 11 Criao da Base Definitiva de Planos. ............................................................... 43
Figura 12 Processo de Recuperao e Reparo dos Casos. .................................................. 46
Figura 13 Processo de Antecipao de Erros. .................................................................... 47
Figura 14 Interface grfica criada para o jogo Babel Promisance....................................... 51
Figura 15 Evoluo do networth comparando o jogador automtico simulado com os
melhores jogadores humanos. ........................................................................................ 59
Figura 16 Evoluo do Dinheiro comparando o jogador automtico simulado com os
melhores jogadores humanos. ........................................................................................ 59
Figura 17 Evoluo do networth no primeiro dia para os jogadores automticos................ 61
Figura 18 Evoluo do Dinheiro no primeiro dia. .............................................................. 62
Figura 19 Evoluo das terras no primeiro dia................................................................... 63
Figura 20 Evoluo do networth do primeiro ao quarto dia para os jogadores automticos.63
Figura 21 Evoluo do networth do primeiro ao quarto dia para os jogadores humanos..... 64
Figura 22 Evoluo do networth para um jogador automtico simulado. ........................... 65
Figura 23 Evoluo do dinheiro para um jogador automtico simulado. ............................ 65
Figura 24 Evoluo do networth dos jogadores automticos no terceiro round. ................. 68
Figura 25 Comparao entre jogador com e sem antecipao de erros. .............................. 68
Ilustrao A1 - Tela Inicial do Jogo...................................................................................... 88
Ilustrao A2 - Tela aps o login......................................................................................... 89
Ilustrao A3 - Vizinhana................................................................................................... 94
Ilustrao A4 Navegao pelos turnos............................................................................... 95
ix
LISTA DE ABREVIATURAS
ARG
Alternate Reality Games Jogos de Realidade Alternativa
BDI
Befief-Desire-Intention Crena-Desejo-Inteno
CAT
Case-Based Tactician
FPS
first-person shooter jogo de tiro em primeira pessoa
GDC
Game Developers Conference
GOAP
Goal Oriented Action Planning - Planejamento de Aes Orientado a

Objetivo
GPL
General Public Licence
GPS
General Problem Solver
HTN
Hierarquical Task Network Plannning
IA
Inteligncia Artificial
JA
Jogador Automtico
MMOG
Multiplayer Massive Online Game - jogos online massivos multiplayer
NPC
Non player character personagem controlado pelo computador
PBC
Planejamento Baseado em Casos
PDDL
Planning Definition Language - Linguagem de Definio de Planos
RBC
Raciocnio Baseado em Casos
RTS
Real Time Strategy Jogos de Estratgia em Tempo Real
SMS
Short Message System
RESUMO
Desde meados da dcada de 50, jogos tm sido utilizados para examinar e testar
conceitos em diversas reas da Inteligncia Artificial (IA). As primeiras pesquisas foram
baseadas em jogos clssicos como Damas e Xadrez que se caracterizam pela simplicidade das
regras e objetivos. Mais tarde, com o desenvolvimento dos primeiros jogos comerciais
diversas tcnicas foram aplicadas para simular uma inteligncia aos elementos da tela, sendo
que os jogos de estratgia destacam-se como os pioneiros na utilizao de tcnicas de IA e,
um campo de testes para a IA para ambientes em tempo real. O desempenho da IA dos jogos
de estratgia, entretanto, pobre para os padres humanos, no acompanhando a evoluo
apresentada pela IA de jogos clssicos.
Apresenta-se, neste trabalho, a criao de um jogador automtico para a classe dos
jogos de estratgia baseados em imprios (empire-based strategy games). Tal jogador
automtico foi construdo atravs de tcnicas de Planning (Planejamento), mais
especificamente Planejamento Baseado em Casos (PBC - Case-Based Planning). O jogo
escolhido para testes, chamado Promisance, um jogo multiplayer online no qual os
jogadores administram um imprio. Os planos realizados pelos jogadores humanos foram
armazenados em uma base de planos a partir da qual foram gerados jogadores automticos
que imitam as estratgias dos jogadores humanos. Os resultados experimentais mostram que
os jogadores automticos imitam as estratgias dos jogadores humanos de maneira
convincente, povoando o mundo do jogo com jogadores automticos semelhantes ao grupo de
jogadores humanos.
Palavras-chave: jogos de computador, Case-based reasoning, case-based Planning.
xi
INTRODUO
O objetivo deste captulo desenvolver uma contextualizao inicial para a rea de

Inteligncia Artificial (IA) para jogos e definir, dentro desta rea, qual o desafio enfrentado
por este trabalho. Finaliza-se com as motivaes para o trabalho e a proposta realizada de
resoluo do problema citado. Tal proposta desenvolvida nos captulos subseqentes
conforme a organizao referenciada no final deste captulo.
1. 1
APLICAO DE IA EM JOGOS CLSSICOS

Desde meados da dcada de 50, jogos vm sendo utilizados para examinar e testar
conceitos em diversas reas da Cincia da Computao, principalmente na subrea da IA. As

primeiras pesquisas foram baseadas em jogos clssicos como Damas [SAM1959] e Xadrez
[SHA1950] que se caracterizam pela simplicidade de compreenso das regras e objetivos e
por permitirem que um programa acesse o estado do mundo do jogo de maneira completa.
Com a percepo completa de cada movimento possvel e da conseqncia direta desses
movimentos, a criao de um programa jogador de Xadrez pode ser simplificada com a
utilizao de um algoritmo de busca que escolhe o melhor movimento a ser feito a partir das
finitas possibilidades de movimento em cada rodada. Destaca-se, todavia, que no caso do
Xadrez, a rvore de busca gerada de tamanho proibitivo. Considerando-se que cada turno
possui em mdia 35 jogadas possveis (branching factor) e os jogos perduram, em mdia, 50
turnos para cada jogador, a rvore de busca gerada ter 35100 ns [RUS1995]. Eliminando as
posies impossveis sobram 1040 diferentes posies possveis em um jogo de Xadrez.
Justifica-se, portanto, que a pesquisa na rea de IA para jogos manteve-se em
constante evoluo j que, para grande parte dos jogos clssicos, extremamente cara
computacionalmente a construo de um jogador automtico, quando se emprega um
algoritmo de busca. Deve-se destacar que Xadrez e Damas foram os jogos escolhidos como
campo de teste da IA devido propriedade de serem bem definidos, ou seja, com todas as
variveis de estado a cada turno sendo observveis. Nos jogos citados, alm de todas as
jogadas serem conhecidas por todos os jogadores envolvidos, no h o fator sorte envolvido.
Tais jogos podem ser classificados como jogos determinsticos de informao completa.
Outros jogos, porm, como Gamo e Banco Imobilirio inserem o fator sorte atravs
do uso de dados. Dessa forma, o nmero de ns da rvore de busca cresce em relao ao
nmero de possibilidades que o dado insere. Jogos deste tipo no deixam de ser classificados
como jogos de informao completa. Entretanto, so classificados como jogos nodeterminsticos.
Por outro lado, existe uma classe de jogos nos quais os jogadores possuem
informaes parciais referentes ao estado do jogo, estes so jogos de informao parcial.
Exemplos de jogos de informao parcial so: poker, bridge, pif e batalha naval. Dentre os
jogos citados apenas o jogo de batalha naval no influenciado pela sorte. Reafirma-se,
assim, a dificuldade para aplicar uma abordagem de busca por fora bruta em diversos tipos
de jogos. Em um jogo de bridge, por exemplo, se cada carta possvel for considerada um n
da rvore de busca sero gerados 5,6x1044 ns no pior caso e 2,3x1024 ns no caso mdio
[SMI1998].
Alm da busca heurstica, outras tcnicas de IA tambm foram utilizadas. Em 1959,
Samuel aplicou conceitos de aprendizagem de mquina para a gerao de um jogador
automtico de damas [SAM1959]. Os resultados obtidos, inclusive, constituram as bases para
a Aprendizagem de Mquina como cincia, sendo que a maioria das idias desenvolvidas por
Samuel para a aprendizagem continua em uso e com grande aplicao na rea de game
playing [FR2000].
Outro exemplo de tcnica aplicada foi o trabalho de [NEW1972] na rea de
solucionadores gerais de problemas (GPS General Problem Solver). Alm de provar
teoremas em lgica e geometria, o GPS tambm foi aplicado em jogos de xadrez.
Alm das tcnicas j citadas, Redes Neurais e Agentes destacam-se entre as tcnicas
mais usuais aplicadas a jogos. Em menor escala, para Algoritmos Genticos e Case-Based
Reasoning tambm existem aplicaes em jogos. Na dcada de 90, segundo Schaffer
[SCH2001], destacaram-se as tcnicas como Simulao de Montecarlo e Aprendizagem por
Diferena Temporal.
Os principais marcos para a IA em jogos clssicos so as vitrias [SCH2001] e, at
mesmo, derrotas dos jogadores automticos. Em 1994, Chinook torna-se o primeiro programa
de computador a vencer um campeo mundial em um jogo. Mais especificamente, o programa

venceu o campeo mundial de Damas, Marion Tinsley, que teve de se retirar devido a
problemas de sade aps seis empates. No domnio do Xadrez, tem importncia a vitria do
programa Deep Blue em uma srie de jogos de exibio contra o campeo mundial Kasparov.
Em outro marco, no ano de 1997, o programa Logistello venceu todos os jogos contra o
campeo mundial de Othello1, determinando a superioridade da mquina no jogo.
Independente da tcnica utilizada percebe-se que a evoluo dos jogadores
automticos foi bastante considervel nos ltimos anos. Alguns jogos, inclusive, j no
representam desafio algum para o computador, como, por exemplo, Othello. Tais jogos so
considerados
resolvidos,
ou seja, todas as
suas possibilidades so
discernveis
algoritmicamente e no existe possibilidade do computador ser derrotado. A Tabela 1

sumariza os jogos clssicos que j foram completamente resolvidos e os jogos que ainda no
so preo para o raciocnio humano.
Jogo
Connect Four (Lig 4)
Tipo do Jogo
Estado atual do jogador automtico
Determinstico
Resolvido
Informao Completa
Go-Moku
Determinstico
Resolvido
Informao Completa
Qubic
Determinstico
Resolvido
Informao Completa
Nine mans Morris (Trilha ou
Determinstico
Resolvido
Moinho)
Informao Completa
Othello
Determinstico
Joga melhor que os seres
Informao Completa
humanos.
Damas
Determinstico
Joga melhor que qualquer ser
Informao Completa
humano vivo.
Gamo
Jogo com Sorte
Joga melhor que todos os seres
Informao Completa
humanos exceto cerca de 10.
Xadrez
Determinstico
Joga melhor que qualquer ser
Informao Completa
humano exceto cerca de 250.
Go
Determinstico
Joga pior que o melhor campeo
Informao Completa
de nove anos de idade.
Bridge
Determinstico
Joga pior que jogadores humanos
Informao Completa
medianos.
Tabela 1 - Desempenho de programas de computador em alguns jogos clssicos.[SMI1998].
Observando a Tabela 1 deduz-se que jogos de informao parcial ou com um nmero

proibitivo de possibilidades como Go ainda constituem um desafio relevante para a pesquisa
no campo da IA para jogos clssicos. Quanto a Go, cabe um comentrio sobre o motivo da
1
Jogo de tabuleiro de duplas, tambm conhecido como Reversi. Em um tabuleiro de 8 x 8 peas, dois jogadores
se alternam de maneira a colocar uma pea de cada vez com o objetivo de transformar as peas do adversrio em
peas de seu time.
dificuldade. Alm de o jogo ter uma rvore de busca bastante profunda, os jogadores humanos
no sabem explicar o motivo de uma configurao ser boa ou ruim. A vantagem do ser
humano to significativa que existe um prmio de um milho de dlares para o primeiro
programa que vencer um campeo tailands jnior [THE2002].
Destaca-se, portanto, a necessidade da continuidade das pesquisas na rea de gerao
de jogadores automticos. O presente trabalho uma contribuio para esta continuidade. A
classe de jogos focalizada, porm, no pertence ao domnio dos jogos clssicos, mas ao
universo dos jogos exclusivamente para computador. Assim, torna-se importante uma sucinta
contextualizao desta rea.
1. 2
APLICAO DE IA EM JOGOS DE COMPUTADOR

Desde o desenvolvimento dos primeiros jogos comerciais diversas tcnicas foram
aplicadas para simular a inteligncia humana. Uma das primeiras estratgias perceptveis pelo
pblico em geral foi a IA dos fantasmas do jogo Pac-man. O algoritmo utilizado transmitia a
sensao que os fantasmas objetivavam a captura do jogador, perseguindo-o. Este
comportamento implementado atravs de regras. Entretanto, aps algumas partidas, era
perceptvel a previsibilidade de movimento dos fantasmas, pois as regras eram fixas e
simples. Pode-se afirmar, portanto, que os primeiros jogos no utilizavam tcnicas de IA
clssica, apenas tentavam transmitir uma iluso de inteligncia para o jogador.
Jogos de estratgia destacam-se como os pioneiros na utilizao de tcnicas de IA
[TOZ2002]. Tcnicas de pathfinding (busca de caminhos) foram caractersticas neste gnero
atravs da aplicao de algoritmos de busca como o A* [HAR1968]. A IA para jogos de
computador focou-se nesta rea por vrios anos devido ao fato que as restries quanto
velocidade de processamento e quantidade de memria exigida para a busca sempre foram
questes crticas a serem resolvidas. Como o processamento grfico era mais importante,
tcnicas de IA mais caras no poderiam ser aplicadas.
Aos poucos algumas tcnicas mais tradicionais foram utilizadas em gneros
especficos. Por exemplo, jogos de simulao como The Sims e Creatures utilizam conceitos
de vida artificial. FPSs (first-person shooters jogos de tiro em primeira pessoa) como Quake
aplicam mquinas de estado para representar o comportamento dos personagens. Mquinas de
estado do tipo Fuzzy, por sua vez, permitem mais profundidade e aleatoriedade no
comportamento dos personagens sendo utilizadas, tambm, em The Sims.
Um destaque na aplicao bem sucedida de tcnicas de IA, no caso, de Aprendizagem
de Mquina, Black & White2. Tal jogo foi projetado de forma a utilizar a IA como parte
integrante da jogabilidade. Dessa forma, o jogador controla um agente que possui capacidade
de aprender. O jogo merece uma explanao resumida por seu pioneirismo na aplicao
prtica de conceitos-chave de Aprendizagem de Mquina e Agentes. Embora em um jogo
comercial, geralmente, as decises de IA sejam fechadas, o projetista de sua IA disponibilizou
uma viso pessoal sobre a arquitetura utilizada no jogo em [EVA2001]. Os agentes do mundo
do jogo, representados por uma criatura semi-controlvel pelo jogador, deveriam preencher
dois requisitos: i) parecer pessoas, ou seja, serem psicologicamente plausveis, maleveis e
empticas; ii) deveriam ser teis para o jogador, auxiliando na resoluo de desafios no
mundo do jogo, sendo que para isso deveriam poder ser treinadas.
O primeiro requisito preenchido atravs da aplicao de uma arquitetura de agentes
BDI [RAO1995] (Befief-Desire-Intention Crena-Desejo-Inteno). Crenas referentes a
instncias de objetos individuais so representadas simbolicamente como uma lista de pares
atributo-valor, crenas sobre tipos de objetos so representadas atravs de rvores de deciso
e os desejos so representados atravs de perceptrons. Para fazer com que o agente seja
plausvel, h uma explanao clara durante o jogo dos motivos do agente possuir certas
crenas e desejos, sendo estas absorvidas atravs da percepo do ambiente por meio de seus
sentidos. Quanto maleabilidade, o agente tem capacidade de aprender atravs da
realimentao do jogador, atravs de comandos explcitos, observando as atitudes dos outros
agentes e refletindo sobre a sua prpria experincia. Para permitir estes tipos de aprendizagem
a criatura constri dinamicamente uma rvore de deciso para minimizar a entropia do
conhecimento adquirido a partir dos atributos observveis do mundo. Tal tarefa feita
baseando-se no trabalho de Quinlan com o sistema ID3 [QUI1986]. Para que o jogador
pudesse ter empatia pelas criaturas objetivou-se assegurar que estas tivessem empatia
recproca por quem as controla. Dessa forma, a mente da criatura inclui um modelo
simplificado da mente do jogador, construdo atravs das observaes do que ele est fazendo.
Esse modelo mental foi projetado atravs de uma representao com estruturas de dados
2
God game no qual o jogador faz o papel de um deus que possui seu avatar na terra e deve control-lo de forma
a interagir com seus sditos. O avatar aprende conforme as recompensas dadas a ele.
simblicas e no simblicas. Outro ponto interessante para a gerao da empatia a

associao de objetivos criatura relacionados diretamente com seu controlador, como, por
exemplo, o desejo de ajudar seu mestre e o desejo de ter ateno.
Rememora-se o segundo requisito referente aos agentes do Black & White: eles devem
ser teis para o jogador, ou seja, ajud-lo em algumas tarefas. Embora parea ser conflitante
com o primeiro requisito, por implicar no tolhimento da autonomia do agente, a soluo
encontrada foi criar um agente completamente autnomo de incio e que evolui, atravs do
treinamento, para um agente que s faz as atividades ordenadas pelo jogador. Tal modificao
no agente d ao jogador sentimento de satisfao por ter conseguido treinar a sua criatura.
Black & White o exemplo mais significativo, mas outros jogos tambm utilizaram
tcnicas de IA provenientes da academia. A Tabela no Anexo 1 sumariza exemplos de
tcnicas de IA para jogos e iniciativas comerciais que as aplicaram. Assim, cada vez mais a IA
est integrada ao ciclo de desenvolvimento dos jogos e, conforme ser explanado na seo
referente motivao para o projeto (Seo 1. 4), a IA para jogos e a sua integrao com a IA
acadmica esto sendo consideradas com mais seriedade tanto pelos desenvolvedores quanto
pela academia. Steve Rabin, editor da srie AI Game Programming Wisdom [RABIN2004] d
uma ordem de grandeza do tamanho da rea de IA para jogos: de 2002 ao incio de 2004 cerca
de 150 artigos envolvendo tcnicas de IA para jogos foram escritos por membros da indstria
de jogos. O autor tambm comenta que IAs que aprendam e se adaptem sero requeridas para
a maioria dos gneros de jogos. Ressalta-se, porm, que ainda existem desafios a serem
vencidos quanto aplicao de tcnicas de Aprendizagem de Mquina no contexto da IA
comercial (Seo 1. 4).
Independente da tcnica utilizada, a IA para jogos de computador tem uma diferena
importante quanto ao objetivo em relao IA para jogos clssicos. Enquanto esta se
preocupa em superar o ser humano, aquela se foca no na otimizao do desempenho de um
NPC (non player character personagem controlado pelo computador), mas na diverso do
jogador e sua experincia geral. Desafios persistem quanto ao desempenho dos NPCs (non
player characters personagens controlados pelo computador). Tais desafios, principalmente
quanto aos jogos de estratgia, so o foco deste trabalho e sero discutidos nas prximas
sees.
1. 3
DESAFIO
Um dos gneros de jogo de maior sucesso o jogo de estratgia, principalmente, o
sub-gnero da estratgia em tempo real (RTS Real Time Strategy). O desempenho da IA dos
RTSs, entretanto, pobre para os padres humanos, no acompanhando a evoluo
apresentada na IA de jogos clssicos. Tal atraso se deve a uma srie de motivos, segundo Buro
[BURO2003]:
O mundo do jogo apresenta muitos objetos, informao parcial e aes tanto

no nvel micro quanto macro;
O mercado limita os recursos destinados CPU;
H pouca competio entre os pesquisadores para desenvolver IAs que

competem entre si devido falta de padronizao na definio da arquitetura
da IA entre diferentes jogos. E, mesmo as iniciativas existentes no so focadas
em jogos de estratgia de mltiplos objetos;
Devido ao primeiro fator citado, a IA dos jogos de estratgia utiliza, geralmente,

mquinas de estado para representar seu comportamento. Se, para um jogo de informao
parcial como Bridge muito caro computacionalmente utilizar um mtodo de busca devido ao
tamanho da rvore gerada, em um jogo de estratgia as possibilidades elevam mais ainda a
complexidade. A aplicao de mquinas de estado, porm, implica em previsibilidade para o
sistema, pois as mquinas de estado caracterizam-se por serem determinsticas.
O ltimo problema a ser contextualizado relacionado avaliao da criao da IA.
Conforme o que j foi dito na seo anterior, as tcnicas de IA para jogos de computador
diferenciam-se por objetivar a maximizao da diverso. Como medir o quanto um jogador
est se divertindo? Poder-se-ia convencionar que o jogador se diverte quando se sente
desafiado e se estiver jogando com um adversrio humano a sua altura. Assim, para saber se
um jogador est se divertindo com um jogador automtico seria interessante a aplicao do
Teste de Turing [TUR1950] e conseqente verificao se o jogador cr que seu adversrio
seja humano. Uma crtica persiste: o objetivo da IA no pode ser apenas imitar o ser humano,
pois jogar com uma pessoa pode tambm no ser divertido dependendo da pessoa que
imitada.
O desafio do trabalho que se apresenta reside na implementao e teste de um sistema

inteligente como jogador automtico de jogos de estratgia para resolver os problemas
supracitados. Tal agente imita os estilos de jogo dos jogadores utilizando tcnicas de
Planejamento Baseado em Casos (PBC Case-Based Planning). E, tal imitao deve inserir
aspectos interessantes para o jogador, surpreendendo-o atravs de comportamentos
inesperados, e, at mesmo, gerando comportamentos inditos.
1. 4
MOTIVAES NO CONTEXTO ACADMICO E COMERCIAL

A presente seo apresenta a motivao para o projeto destacando seus aspectos
inditos e importantes. O foco desta motivao est tanto no ineditismo no aspecto

acadmico, relacionado pouca quantidade de publicaes nas reas em que o projeto se
encaixa, quanto na parca utilizao das tcnicas citadas em jogos comerciais.
Embora a pesquisa referente a jogos clssicos remonte dcada de 50, apenas nos
ltimos anos a academia voltou-se aos jogos de computador. O motivo deste interesse resulta
do crescimento da complexidade e do realismo dos jogos de computador atuais. Assim sendo,
o pesquisador pode trabalhar com outros campos da IA, os quais enfatizam aspectos diferentes
e mais complexos que os tratados pela pesquisa com jogos clssicos.
A lista de razes pelas quais os pesquisadores da academia devem mais seriedade
indstria de jogos extensa e foi trabalhada por Laird e van Lent em um dos primeiros artigos
que prega a interao entre academia e indstria [LAIRD2000]:
Os desenvolvedores de jogos reconhecem a necessidade de IA para controlar

comportamentos de personagens humanos;
A indstria de jogos altamente competitiva e a IA pode ser vendida at

mesmo como um fator impactante no marketing de um jogo. Por exemplo, o
jogo Full Spectrum Warrior, desenvolvido originalmente para o treinamento
do exrcito americano, destaca-se pelas suas tcnicas de IA adaptativa. Tal
fator citado em apresentaes sobre o jogo entre desenvolvedores
[MIL2005], em crticas sobre o jogo e, tambm na documentao ou caixa que
acompanha o jogo;
Desenvolvedores de jogos so tecnologicamente antenados com as ltimas

inovaes;
A indstria de jogos grande e comparvel indstria de cinema em lucro;
O processamento grfico, com o advento das placas de vdeo 3D, foi movido
do processador central para um processador exclusivo. Dessa forma, mais
processamento pode ser destinado a IA. Tal mudana d mais liberdade ao
pesquisador para justificar a implementao de tcnicas de IA mais caras
computacionalmente.
Por outro lado, a indstria tambm passou a respeitar mais as tcnicas provenientes da
academia. Paul Tozour do estdio Ion Storm discute os fatores que fizeram com que o
desenvolvimento da IA, uma atividade relegada aos ltimos meses do desenvolvimento de um
jogo, passasse a ter papel decisivo com programadores destinados a IA desde o primeiro dia
de um projeto [TOZ2002]. Primeiramente, as restries de hardware tornaram-se menos
proibitivas. O aumento da memria dos consoles e o processamento dos grficos em um
processador em separado tornaram possvel destinar uma proporo maior do processamento
IA. Por fim, a IA est deixando de ser considerada pela indstria como uma subrea da
magia, ou seja, era comum, anteriormente, a separao completa da IA das outras fases do
desenvolvimento de um jogo sem a sua compreenso quanto aos desafios e entendimento. Por
exemplo, era comum a escolha de uma linguagem de scripting para implementar a
inteligncia de um jogo considerando apenas o conhecimento da equipe de desenvolvimento e
sem considerar quais eram os desafios a serem resolvidos por essa linguagem e a sua
adequabilidade resoluo desses desafios.
Persistem, entretanto, alguns problemas quanto aplicao de tcnicas de
Aprendizagem de Mquina no mundo da IA comercial principalmente em um ambiente em
tempo real. Os principais problemas so tambm citados por Tozour [TOZ2002]:
Os sistemas de aprendizagem de mquina podem aprender as lies erradas a

partir de jogadores que joguem errado;
difcil fazer o ajuste de parmetros referentes diverso e a jogabilidade. As

funes de fitness no devem se preocupar apenas com a competncia do
jogador automtico, mas tambm com a diverso de quem est jogando;
Algumas tcnicas so difceis de modificar, testar e fazer a depurao, como,

por exemplo, Redes Neurais;
10
Os personagens em alguns jogos so efmeros e difcil (e, talvez,

desnecessrio) representar uma IA que seja observvel. Muitos jogos
apresentam personagens com uma vida curta ou mesmo fora do campo de
observao imediato do jogador.
Especificamente sobre a proposta corrente, alguns outros tpicos devem ser

considerados como as motivaes mais relevantes tanto no contexto comercial quanto
acadmico.
1.4.1 Ausncia de pesquisa relacionada IA de jogos baseados em imprio
Pouca literatura existe na rea de jogos de estratgia baseados em imprio (empirebased games). O tamanho proibitivo no espao de busca faz com que as tcnicas clssicas de
busca que j se mostraram bem sucedidas em jogos como Xadrez e Damas no sejam
aplicveis.
Alguns dos mtodos usuais para o game playing de jogos baseados em imprio so
citados por Freeburg [FRE2002]: sistemas baseados em regras, mquinas de estado finitas,
sistemas multi-agentes e goal-directed reasoning. A tcnica mais comum a utilizao de
regras fixas criadas no prprio cdigo do jogo. Embora tais scripts que implementam a
inteligncia do sistema possam ser construdos de forma complexa, imitando diversos
aspectos do raciocnio humano, uma vez que o jogador aprenda o seu funcionamento, o
desafio prejudicado, pois limita o jogador automtico utilizao de estratgias projetadas
pelo programador. Alm disso, o jogador automtico ter uma tendncia a repetir
comportamentos conforme receber os mesmos estmulos do jogador, ou seja, no h
aprendizado, mas memorizao.
Outro ponto relevante que no caso de sistemas baseados em regras, a inteligncia do
jogador automtico dificilmente ser boa o suficiente apenas utilizando as mesmas
informaes disponveis para o jogador humano. Dessa forma, os jogos comerciais utilizamse com freqncia de estratgias que podem ser consideradas como cheating (trapaa), tendo
acesso a informaes sobre o estado do mundo que um jogador humano no perceberia. A
percepo do cheating da IA por parte do jogador frustra e alvo de crticas em muitos jogos.
Um exemplo tpico de cheating quando, em um jogo de estratgia baseado em mapa, o
jogador automtico consegue visualizar a totalidade do mapa.
11
Consideradas estas limitaes relacionadas principal tcnica utilizada nos jogos

comerciais, desejvel que se desenvolvam novas tcnicas que sejam adaptativas e que
evitem a necessidade de cheating por parte da IA. Mock e Freeburg [MOC2002], por
exemplo, utilizaram, em uma verso Lite (simplificada) do jogo Empire, uma estratgia de
busca heurstica hierrquica para um jogador inteligente que no usa regras codificadas.
Shapiro [SHA2002], por sua vez, desenvolveu um jogador automtico para o jogo Diplomacy
utilizando aprendizagem por diferena temporal.
As referncias citadas acima so as poucas que utilizam tcnicas de IA adaptativas em
jogos de estratgia baseados em imprio. Justifica-se, portanto que uma das principais
motivaes para o projeto a necessidade de se aplicar tcnicas de IA mais eficientes em
jogos de estratgia baseados em imprio.
1.4.2 Necessidade de pesquisa relacionada IA de jogos de computador utilizando tcnicas
de Planejamento
As aes referentes implementao de agentes que antecipem e imaginem o que
devem fazer so apontadas como novos desafios para a IA baseada em personagens para jogos
[ISL2002]. A imaginao (ou, mais formalmente, o planejamento) j foco de algoritmos
para, dado um objetivo e o estado atual, executar um conjunto de aes. Entretanto, tais
algoritmos no so adaptados s restries em tempo real que so tpicas de um jogo.
Alm disso, mais especificamente quando se considera o planejamento efetuado por
um personagem deve-se destacar que personagens diferentes podem ter comportamentos
diferentes, ou seja, dependendo do estado mental, os planos podem ser pessimistas ou
otimistas, por exemplo. Considerar o estado mental de quem planeja foge do escopo de um
planejador tradicional e motivam o presente trabalho a buscar alternativas para a criao de
agentes que possuam comportamentos diferentes.
Destaca-se que a utilizao de Planejamento em IA para jogos um campo atual e
promissor, tendo algumas propostas discutidas na GDC (Game Developers Conference) do
ano de 2005 [MIL2005]. Uma delas aprofundada no Captulo 2 [ORK2004].
1.4.3 Oportunidade de pesquisa sobre algoritmos para jogos multiplayer
O desenvolvimento de algoritmos para jogos com mais de um jogador um desafio
devido ao nmero de possibilidades. Encaixam-se neste estilo, por exemplo, alguns jogos de
12
cartas. Quando o jogo possui um nmero indeterminado de jogadores a complexidade dos

algorimos aumenta. Destaca-se que alm dos algoritmos multiplayer serem uma pesquisa
nova [STU2002] h pouca pesquisa referente a jogos com dezenas de jogadores.
1.4.4 Oportunidade de pesquisa na rea de algoritmos para jogos multiplayer no contexto
comercial
Os jogos online massivos multiplayer (MMOG Multiplayer Massive Online Game)
permitem que milhares de jogadores interajam em um ambiente nico. O desenvolvimento da
IA para estes jogos uma motivao a ser considerada por ocuparem uma fatia cada vez
maior do mercado de games. O desafio principal nesta classe de jogo est principalmente em
relao inteligncia destinada aos personagens que interagem diretamente com o jogador
humano. Os ambientes multiplayer se baseiam na interao e sociabilizao entre os
jogadores. Uma comunidade interessante e que atraia diversos tipos de pessoas deve primar
pela diversidade que pode ser estimulada, atravs do enriquecimento do ambiente com
jogadores automticos semelhantes ao jogador humano.
Conforme contextualizado no Anexo 3, destaca-se que a quantidade de jogos
massivos lanados ou em desenvolvimento faz com que os jogadores tenham mais opes de
mundos a considerar. Assim, a tendncia a gerao de comunidades menores para cada jogo
e, logo, com uma densidade demogrfica menor. Cria-se, desta forma, um conjunto de nichos
de jogadores espalhados em diversos mundos. Pode-se questionar, de fato, se relevante a
preocupao com o povoamento de um mundo online frente s notcias de milhes de
jogadores interagindo nos principais jogos. Entretanto, cada vez mais, conforme a distribuio
e divulgao dos jogos online ficam mais baratas e eficientes, fica explcto o fenmeno da
Cauda Longa [AND2006]. Este fenmeno econmico tpico da economia na Internet, sendo
caracterizado quando a receita total de uma grande quantidade de produtos de nicho com
baixos volumes de vendas, igual receita total dos poucos grandes sucessos. relevante,
portanto, este povoamento de jogos massivos com jogadores diversos e que maximizem a
diverso mesmo com poucos jogadores humanos.
1.4.5 Necessidade de jogos assncronos para atingir os jogadores casuais
Os principais jogos online massivos atuais enfatizam a interao sncrona entre os seus
participantes. Tais jogos, atravs da utilizao de um avatar em um mundo virtual, exigem,
13
para que a evoluo de um jogador seja efetiva, sua dedicao por centenas de horas.
Enfatiza-se, no estilo de jogabilidade dos jogos atuais, a sada do jogador do mundo real em
favor do mundo virtual.
Pode-se questionar que esse nvel de dedicao exigida afugenta os jogadores casuais
dos jogos massivos. Jogos assncronos, por sua vez, surgem como uma maneira de conectar
pessoas em espaos multiplayer com maior flexibilidade e em conformidade com a vida diria
[BOG2004]. As interrupes entre os turnos dos jogadores so partes inerentes ao jogo
assncrono. Assim, os jogadores no precisam estar conectados de maneira sncrona por
diversas horas para se divertir com a sua comunidade, podendo escolher, com liberdade, qual
o melhor momento de jogar e integrar o jogo com sua vida diria.
O modelo assncrono configura-se interessante para jogos de celular, por exemplo.
Justifica-se tal observao referenciando o sucesso da troca de mensagens SMS (Short
Message System) como uma das aplicaes de maior sucesso nas redes celulares devido a sua
natureza rpida e de fcil integrao ao dia-a-dia.
Outro tipo de jogo com um aspecto assncrono bastante forte a classe dos ARGs
(Alternate Reality Games Jogos de Realidade Alternativa), na qual situaes de jogo so
combinadas com a realidade, interagindo com mdias do mundo real como sites, telefonemas
e vdeos. Nestes jogos, semelhantes a gincanas virtuais, geralmente seguem-se pistas com o
objetivo de descobrir novas pistas, caracterizando-se por exigir e encorajar a interao entre
os jogadores. ARGs so uma forma de MMOGs nos quais aproveita-se a mdia online como
uma forma conveniente e barata de distribuio [MAR2006].
Jogos assncronos massivos oferecem uma maneira factvel de inserir os jogadores
casuais no mundo dos jogos massivos online. A aplicao de tcnicas de IA tem aplicabilidade
na gerao de jogadores automticos interessantes para povoar os mundos online assncronos.
Destaca-se que diferentemente dos jogos sncronos, os quais exigem uma resposta em tempo
real, abre-se, em um mundo assncrono persistente, a possibilidade de aplicao de tcnicas
offline de IA.
1.4.6 Jogos de estratgia so um campo de testes para IA em tempo real
Uma grande variedade de problemas fundamentais da pesquisa com IA em tempo real
podem ser estudados atravs dos jogos de estratgia [BURO2003]:
14
Planejamento em tempo real das aes do adversrio;
Tomada de deciso mediante a incerteza;
Modelagem do oponente atravs de Aprendizagem de Mquina;
Raciocnio espacial e temporal;
Gerenciamento de recursos;
Colaborao;
Pathfinding.
Aps exposio das motivaes do projeto, passa-se descrio sucinta do trabalho e

o que ser apresentado nos prximos captulos.
1. 5
TRABALHO DESENVOLVIDO
Efetuou-se a criao de um jogador automtico para a classe dos jogos de estratgia
baseados em imprios (empire-based strategy games) e um conjunto de ferramentas para a

criao de jogadores automticos neste tipo de jogo. O jogo utilizado para testar a arquitetura
chama-se Promisance. Promisance um jogo multiplayer que pode ser jogado via Web
atravs de uma interface HTML e um servidor PHP.
O objetivo do jogo gerenciar um imprio de maneira a maximizar o tamanho e o
dinheiro deste imprio. O jogador pode, dentre outras aes possveis: explorar o ambiente,
construir mercados, treinar tropas e atacar outros imprios. O ataque, se bem sucedido,
implica no ganho de territrio. Cada ao desempenhada no jogo gasta um nmero de turnos
que so limitados. A cada perodo de tempo o jogador ganha mais um pacote de turnos, o qual
deve gastar, sendo penalizado se acumular turnos alm de um limite.
Considerando que o jogador possui cerca de vinte aes possveis (descritas na seo
3. 4 e, com mais detalhes, no Anexo 2) e o jogo permite infinitos adversrios, impossvel a
aplicao uma tcnica de busca tradicional para a criao de um jogador automtico que jogue
Promisance, encaixando-se no cumprimento das motivaes descritas nas sees anteriores.
Rememora-se tambm a taxonomia aplicvel ao Promisance: um jogo de informao
parcial, pois um jogador no tem informaes completas sobre o estado do adversrio. Quanto
15
ao aspecto do determinismo das aes, o jogo determinstico, ou seja, no considervel a

influncia da sorte.
Assim, o principal produto do projeto desenvolvido um sistema inteligente que
possui jogadores automticos construdos atravs de tcnicas de Planejamento, mais
especificamente PBC. Justifica-se em captulo subseqente o porqu da aplicabilidade desta
tcnica no projeto conforme suas caractersticas.
Devido caracterstica multiplayer do jogo possvel armazenar as aes e estados de
todos os jogadores que interagirem com o sistema. Dessa forma, prope-se a criao de
mdulos de aprendizagem que imitem os planos dos jogadores e abstraiam suas caractersticas
comportamentais em relao execuo das aes no jogo, imitando, portanto, os estilos de
jogo. Prope-se, tambm a criao de camadas que corrijem e antecipem erros nestes planos,
aprendendo tambm regras no explicitadas sobre o funcionamento do jogo.
1. 6
CONTRIBUIES RELEVANTES
As principais contribuies deste projeto so:
Discusso e aplicao de tcnicas de IA, mais especificamente PBC, em jogos

de estratgia;
Discusso e aplicao de tcnicas de IA, mais especificamente PBC, em jogos

multiplayer online;
Metodologia que possibilita a utilizao dos planos gerados pelos usurios dos
jogos online para criar jogadores automticos que imitem o estilo de jogo da
comunidade;
Atravs da aplicao da correo dos planos e da antecipao de erros nos

planos, o sistema capaz de criar planos inditos e explicar falha em planos
anteriormente aplicados;
Criao de uma ferramenta que facilite a construo de jogadores automticos

que utilizam PBC;
Proposio de uma arquitetura de sistema que seja genrica e adaptvel a

outros jogos online de estratgia.
16
1. 7
ORGANIZAO DO DOCUMENTO
Este trabalho tem por objetivo, portanto, apresentar um jogador automtico inteligente
para jogos de estratgia baseados em turnos. A inteligncia do jogador automtico ser uma
aplicao de tcnicas de PBC, conforme j citado anteriormente.
Divide-se o documento em cinco partes principais:
Introduo: na qual se delimita a rea do conhecimento na qual o problema se

classifica dentro do contexto da IA. Tambm possui seo referente motivao, ou
seja, comentrios referentes importncia e contribuies do trabalho;
Reviso Bibliogrfica: discusso das principais iniciativas utilizadas para o

embasamento da proposta de resoluo do problema descrito;
Metodologia: descrio das tcnicas e teorias que foram aplicadas para resolver o
problema e quais sero os procedimentos de validao aplicados;
Resultados: resultados obtidos com o teste do jogador automtico tanto em um

ambiente real quanto em um ambiente simulado;
Concluses e Trabalhos Futuros: Fechamento deste trabalho, reafirmando suas

contribuies relevantes e comentando sobre os resultados mais importantes obtidos.
17
REVISO BIBLIOGRFICA
Este captulo contextualiza as principais reas em que esta pesquisa se insere.

Considerando que o problema j foi definido na Introduo como pertencente rea de IA
para jogos de entretenimento, faz-se necessria a focalizao da classe de jogo que ser
tratada: os jogos online. Faz-se necessrio, portanto, uma contextualizao com a histria dos
jogos online citando os principais marcos e o panorama atual.
Tal discusso sucinta, pois foge do escopo este documento, o qual se concentra em
IA. Dessa forma, o tpico que discute a genealogia dos jogos online aparece no Anexo 3.
Assim, esse captulo se concentra na discusso das duas subreas da IA envolvidas no projeto:
Planejamento e Raciocnio Baseado em Casos. Alm dos principais fundamentos de cada
rea, algumas aplicaes em jogos tambm so discutidas.
2. 1
PLANEJAMENTO
Um dos grandes desafios da IA a gerao de um solucionador geral de problemas.
Tal programa aceitaria descries gerais de problemas e chegaria automaticamente a uma

soluo. Duas so as motivaes para a criao deste tipo de programa segundo Geffner
[GEF2002]. Primeiramente, facilitaria a compreenso dos processos de pensamento humano,
pois o ser humano um solucionador geral de problemas por natureza. Por outro lado, no
aspecto tcnico, a modelagem de programas em um alto nvel , geralmente, mais simples que
codificar sua soluo de forma procedural.
As tcnicas de Planejamento vm de encontro a essa necessidade de resolver
problemas em um alto nvel. Uma tcnica baseada em Planejamento se preocupa com a
sntese automtica de aes ordenadas para resolver um dado problema. Tais aes so
geradas a partir de trs partes que descrevem a situao [RUS1995]: um estado inicial, um
estado final desejado (objetivo) e operadores (aes), sendo os ltimos responsveis por
executar as transformaes de um estado a outro.
importante a diferenciao de uma estratgia de Planejamento em relao s tcnicas
de resoluo de problemas baseadas em busca. Trs idias-chave diferenciam as tcnicas
18
[RUS1995]. Primeiramente, no domnio do Planejamento, a representao de estados, aes e

objetivos aberta. Geralmente, os estados e objetivos so representados atravs de uma
linguagem formal como predicados da lgica de primeira ordem. As aes podem ser
representadas por pr-condies e efeitos que permitem a associao entre os estados e as
aes possveis para aquele estado. Em um problema de busca, tal conexo no explicitada,
provocando a expanso de uma rvore de busca mesmo que a ao a ser tomada no tenha
relao com o estado.
Outro ponto-chave a liberdade do sistema planejador em adicionar aes ao plano
sempre que forem necessrias e em qualquer ordem. Dessa forma, no h uma conexo entre
a ordem de execuo do processo de Planejamento e a escolha da ordem de execuo das
aes.
Finalmente, a maior parte dos objetos independente das outras partes em problemas
de Planejamento. Essa caracterstica faz com que se possa dividir o problema para resolv-lo.
O plano gerado pode, portanto, ser subdividido em subplanos com poucas interaes entre si e
gerados de maneiras diferentes. Problemas com grande interao entre os subplanos (puzzles,
por exemplo) so mais adaptveis a estratgias de busca do que a utilizao de Planejamento.
Existem diversas representaes possveis para os estados e operadores as quais
permitem a representao dos problemas de Planejamento. A representao clssica
caracterizada pelo uso da linguagem STRIPS [FIK1971]. Os estados, tanto o inicial quanto o
objetivo, so representados por conjunes de predicados aplicados a smbolos, possivelmente
negados. Os operadores ou aes consistem em uma descrio da ao, de pr-condies e de
efeitos. Pr-condies so conjunes de literais positivos que representam uma condio que
deve ser verdadeira antes que a ao possa ser executada. Os efeitos, por sua vez, podem ser
conjunes de literais positivos ou negativos e descrevem o que acontece aps a execuo da
ao.
Os planners clssicos consideram as transies entre os estados determinsticas e o
conhecimento completo do estado inicial. Em caso contrrio, necessrio trabalhar com uma
representao que considere a incerteza.
Vrias outras taxonomias podem ser aplicveis aos problemas de Planejamento. Faz-se
necessrio, portanto, o corte e a focalizao na sub-rea especfica de IA para jogos. Assim,
19
diversas aplicaes de Planejamento em jogos foram desenvolvidas tanto no contexto

acadmico quanto comercial. As prximas sees destacam algumas destas iniciativas.
2. 2
PLANEJAMENTO APLICADO A JOGOS

Conforme j comentado na introduo deste trabalho, a pesquisa sobre game playing
fixou-se, por muito tempo, em resolver os problemas usando tcnicas de busca e algoritmos
como o MINIMAX. Entretanto, essa abordagem difere da maneira como o ser humano pensa.
A mente humana no busca muitas jogadas a frente e, alm disso, a busca feita de forma
lenta. Por outro lado, a mente humana aprende e cria estratgias facilmente e guiada pela
intuio e por aspectos emotivos. Outro ponto a ser considerado o poder do crebro humano
em reconhecer padres e gerar planos a partir dos padres reconhecidos.
Assim, a ao de reconhecer os padres (o estado do mundo) e escolher um plano a
seguir uma atividade de planejamento. Como a ao de planejamento tambm pode ser feita
de maneira computacional, existem diversas iniciativas que aplicam tcnicas de Planejamento
a jogos clssicos e a jogos de entretenimento. A prxima seo trata das aplicaes clssicas,
relacionadas aos jogos com regras bem definidas como Xadrez e Bridge. Em seguida,
algumas aplicaes de tcnicas de Planejamento em jogos comerciais so citadas.
2.2.1 Tcnicas de planejamento em jogos clssicos
O jogo que obteve maior sucesso na aplicao de mtodos de Planejamento foi o jogo
de bridge [GHA2004]. Seu estudo principal foi o trabalho de Nau, Smith e Throop para o
desenvolvimento do software Bridge Baron [SMI1998]. Bridge um jogo de cartas no qual
quatro jogadores competem entre si sem conhecer as cartas do adversrio. Desta forma, um
jogo de informao parcial. A possibilidade de distribuio inicial das cartas muito grande.
Caso fosse aplicada uma tcnica de busca, no caso mdio 1024 ns de uma rvore de busca
deveriam ser percorridos e no pior caso 1044 ns seriam necessrios [SMI1998].
Alm disso, diferentemente do Xadrez, no qual cada partida dura horas, cada jogada
de Bridge tem um tempo de durao de poucos minutos. Para reduzir o tamanho do espao de
buscas, Nau utilizou uma tcnica de Planejamento Hierrquico (HTN Planning Hierarquical
Task Network Plannning). Nesta abordagem os planos so criados por decomposio de
tarefas (task decomposition). Neste processo, o sistema decompe as tarefas em subtarefas
20
cada vez menores at que sejam encontradas tarefas primitivas que possam ser executadas
diretamente. Tais tarefas so denominadas mtodos.
A abordagem supracitada aplica decomposio HTN para gerar uma rvore de busca
na qual cada movimento corresponde a uma diferente estratgia e no a uma diferente carta.
Assim, a base de conhecimentos do sistema conhece diferentes estratgias, as quais so
colees de mtodos. Caso um movimento no se encaixe em uma estratgia plausvel ele no
considerado na busca. As rvores de busca geradas com a aplicao desta tcnica foram
reduzidas para 26.000 ns no caso mdio e 300.000 ns no pior caso. Destaca-se que o
programa comercial Bridge Baron implementa tal abordagem sendo o vencedor do
campeonato mundial de Bridge por computador em 1997 [GHA2004].
As razes para o sucesso da aplicao de tcnicas de Planejamento em Bridge
exemplificam os tipos de jogos nos quais o Planejamento melhor se encaixa segundo Tella
[TEL1997]. O jogo deve possuir um nmero pequeno de estratgias disponveis as quais
podem ser programadas facilmente. O nmero de interaes dos planos no domnio do jogo
tambm deve ser controlvel e a cada jogada o nmero de esquemas possveis do conjunto de
estratgias deve, tambm, ser pequeno.
Em jogos como Go e Xadrez o conhecimento estratgico no suficiente e, por isso,
apenas a utilizao do Planejamento no suficiente para a construo de um jogador
automtico. Em Xadrez, por exemplo, a quantidade de estratgias possvel da ordem de
dezenas de milhares e, quando uma estratgia escolhida, devem-se considerar dezenas de
possibilidades de resposta para a estratgia. Um cenrio mais difcil ainda se configura em
relao aos jogos comerciais.
2.2.2 Aplicaes de planejamento em jogos comerciais
A necessidade de utilizao de Planejamento em jogos comerciais se baseia em um
desafio prtico. O desenvolvimento de um jogo comercial torna-se cada vez mais complexo.
O jogador tambm espera mais do jogo. Uma das expectativas mais difceis de ser
implementada a jogabilidade no-linear. Para que os jogos sejam mais abertos essencial a
implementao de NPCs, mais inteligentes para interagir com ambientes cada vez mais
dinmicos nos quais devem aprender rapidamente como agir e atuar de forma crvel. Mais que
o meio acadmico, as prprias desenvolvedoras percebem que mquinas de estado e/ou regras
21
fixas no esto mais sendo suficientes para modelar personagens que atuam nos jogos da
prxima gerao [ORK2004]. A aplicao de tcnicas de Planejamento pode ser um caminho
interessante para lidar com esses desafios.
vila [AVI2004] baseia-se na tcnica proposta por Smith, Nau e Throop [SMI1998]
para codificar estratgias que um ou mais NPCs deveriam executar em um ambiente
altamente dinmico. O ambiente escolhido foi o jogo de tiro em primeira pessoa Unreal
Tournment. Dessa forma, as tarefas de alto nvel foram modeladas de forma a indicarem
objetivos complexos que um agente ou time devem ter. Um exemplo de tarefa de alto nvel
Domination(X) a qual pode ser representada na Figura 1. Tais tarefas de alto nvel,
denominadas mtodos, so representados por pr-condies, subtarefas e ordenaes.
Observa-se que as pr-condies no mtodo Domination(X) (responsvel por dominar uma
regio) so relacionadas a um conjunto de agentes e no ao comportamento individual de um
agente. No caso deste mtodo, para sua execuo necessrio, dentre outras pr-condies, a
garantia de um certo nmero de indivduos em cada time (pr-condio numberPlayersTeam )
e a diviso em trs grupos (pr-condio Divide3Groups), dentre outras. Como sub-tarefas a
serem realizadas, tem-se a patrulha (PatrolLocations) e cobertura (CoverLocations) do
terreno. No caso deste mtodo no h nenhum tipo de relao de ordem temporal.
Figura 1 - Exemplo de mtodo para decomposio da tarefa Domination [AVI2004].
As tarefas de baixo nvel, ou seja, decompostas a partir das de alto nvel, variam desde
objetivos intermedirios como capturar certa localizao at aes concretas como atacar um
inimigo prximo. Deve-se destacar que o uso de HTN Planning justificado pelo fato de que
alm de ser mais expressivo que o STRIPS Planning [FIK1971], o planejamento hierrquico
22
natural em domnios como o de planejamento militar. Aes militares so feitas em nveis,

havendo uma distino entre os nveis operacional, estratgico e ttico. Cada nvel
controlado por um componente diferente da hierarquia militar. Por exemplo, enquanto o
sargento comanda as tropas em terra, os generais planejam as aes no nvel estratgico. Ou
seja, enquanto o nvel estratgico se preocupa com uma viso mais a longo prazo da batalha, o
nvel ttico traduz as decises estratgicas em aes efetivas de mdio prazo. O nvel
operacional eminentemente tcnico e direcionado a processos especficos. Dada esta
descrio, importante observar que se guarda uma certa semelhana entre o planejamento de
uma batalha e o planejamento dentro de organizaes empresariais.
Em uma outra aplicao de destaque no que se refere implementao de
planejamento em tempo real em jogos, a Monolith utiliza em seus jogos mais recentes uma
arquitetura modular para ajudar os game designers (projetistas de jogos) a caracterizar o
comportamento dos NPCs. Orkin descreve a arquitetura Goal Oriented Action Planning
(GOAP Planejamento de Aes Orientado a Objetivo) em [ORK2004]. Em tal arquitetura,
modelada utilizando a linguagem Planning Domain Definition Language (PDDL
Linguagem de Definio de Planos), definida em [MCD1998], o NPC possui em um nvel
macro um conjunto de objetivos a serem satisfeitos. O NPC tenta satisfazer esses objetivos
baseando-se em uma priorizao referente situao corrente. Como sada, o planejador gera
uma seqncia de aes para satisfazer o objetivo. PDDL modular, representando a IA do
NPC em objetivos e aes (com pr-condies e efeitos). Os objetivos e as aes so
desacoplados, no existindo mapeamento explcito entre objetivos e suas aes e aes e
outras aes. Tal caracterstica facilita o compartilhamento de comportamentos entre NPCs
diferentes.
Mesmo com a pouca aplicao atual, Planejamento uma tcnica com grande
potencial de contribuio para a indstria de jogos. Conforme citado por Orkin [ORK2004],
os projetos esto cada vez maiores e seria uma economia interessante o compartilhamento de
comportamentos entre NPCs e, at mesmo a reutilizao de comportamentos entre projetos
diferentes. A Figura 2 representa uma situao comum na qual NPCs de um mesmo jogo tm
alguns comportamentos semelhantes e outros diferentes. O mesmo ocorre entre NPCs
presentes em gneros de jogos diferentes. Por exemplo, na Figura 2, os objetivos de um
agente so representados por quadrados e as aes possveis por crculos, tanto um Soldado
(Soldier) quanto um Aliengena (Alien) apresentam o comportamento de Ataque (Attack) e os
23
objetivos de Perseguio (Chase) e Eliminao de Ameaa (Eliminate Threat). Caso fosse

utilizada a estratgia de implementao de uma mquina de estado ou regras para cada
comportamento, conforme normalmente feito nos jogos comerciais, alm da codificao de
tais mquinas ser responsabilidade do programador, podem-se criar relaes artificiais de
herana ou repetio de cdigo. Por exemplo, mesmo o soldado e o aliengena possuindo
comportamentos semelhantes h diversas diferenas entre eles, difceis de serem
representadas de maneira realista em uma abordagem orientada a objetos devido s
preocupaes com o momento e com os meios que um NPC realiza uma ao.
Figura 2 - Comportamentos compartilhados entre diferentes NPCs [ORK2004].
A utilizao de uma tcnica de Planejamento permite a definio em alto nvel dos

comportamentos de forma separada do cdigo. Enquanto os programadores preocupam-se em
implementar as aes e objetivos de forma atmica, os projetistas apenas especificam quais
so as aes, pr-condies, efeitos e objetivos de cada NPC, mas sem se preocupar com
quando e como um NPC realiza a ao.
2. 3
RACIOCNIO BASEADO EM CASOS

Raciocnio Baseado em Casos (RBC - Case-based reasoning) um mtodo de
resoluo de problemas no qual problemas so resolvidos relembrando-se situaes anteriores

similares e reutilizando-se tais situaes para chegar a soluo de um novo problema
[RIE1989]. Constitui uma tcnica particularmente apropriada quando existe um histrico bem
documentado de casos resolvidos. Tornou-se uma metodologia bastante enfatizada a partir do
final da dcada de 80 [HAM1989] e incio dos anos 90 [KOL1993]. RBC se baseia no
24
processo de raciocnio para resoluo de problemas. Tal processo muito semelhante ao

processo mental dos advogados para tratar um caso: constroem argumentos a partir de casos
precedentes (jurisprudncias) [KOL1993].
RBC contrasta diretamente com os sistemas baseados em regras. Nestes, a experincia
a partir do conhecimento do especialista permite a gerao de regras para se chegar a uma
soluo. O RBC, por sua vez, enfatiza o uso de uma memria, inspirada nos trabalhos de
Schank e Abelson sobre Memria Dinmica [SCH1982], representada por uma base de
conhecimentos indexada na qual os problemas e solues esto armazenados. Tal experincia
armazenada sob a forma de casos pertencentes a uma biblioteca de casos. Essa biblioteca
pode ser alimentada por novos casos conforme novos problemas forem resolvidos, ou seja, o
aprendizado em RBC pode ser incremental e online.
O caso um episdio vivido que permite uma representao simplificada da realidade
do contedo da experincia e reorganizado para facilitar a melhoria da performance conforme
novos casos so acumulados. Quanto maior a experincia, mais recheado de casos o sistema,
mas, no necessariamente, mais competente. RBC tem sido utilizado em uma srie de tarefas
de resoluo de problemas de foco analtico ou sinttico. Assim sendo, problemas tpicos de
classificao (seleo de produtos, deteco de fraudes e at mesmo, determinao de
sentenas de crimes [BAI1986]) e/ou que demandam a criao de uma nova soluo
(planejamento da manufatura, gesto de redes, planejamento de batalhas [GOO1989]) so
aplicaes comuns de RBC.
A representao de um caso contm o problema e a soluo e depende dos requisitos
do domnio e da tarefa. Casos podem conter em sua representao elementos como vetores de
caractersticas, pares ordenados atributo-valor ou predicados da lgica de primeira ordem.
Para acelerar o processo de recuperao dos casos, deve existir um processo de indexao
cujo objetivo dar ao sistema conhecimento sobre como armazenar e comparar casos levando
em conta o propsito do que o sistema faz. Por exemplo, para um mecnico e para um cliente
de locadora, a descrio de um automvel bem diferente. Assim, a indexao deve ser feita
a partir de atributos ou caractersticas tambm diferentes.
O clculo da similaridade um conceito essencial ao RBC e permite que se compare
quando dois casos so parecidos. Por exemplo, para uma representao de casos como pares
atributo-valor, a similaridade poderia ser calculada como a soma da similaridade entre cada
25
atributo do caso aplicando-se um peso diferente para cada atributo. O clculo da similaridade
utilizado em diversas etapas do ciclo de funcionamento do RBC e, primeiramente, na
recuperao do caso.
A Figura 3, a partir da proposta de Aamondt e Plaza [AA1994],
sumariza o
funcionamento desse ciclo.
Figura 3 - Ciclo do RBC.
Seguindo a figura acima, o Ciclo de Funcionamento do RBC pode ser resumido em

cinco passos, segundo descrio de [KER2003]:
1. Recuperao: Dada uma nova observao, recupera-se um conjunto de casos
na base de casos a partir das caractersticas relevantes e indexadas da
observao.
2. Seleo do caso: Dentre estes itens recuperados, selecionado o mais similar
segundo algum critrio de similaridade. Tal caso servir como base para
interpretao da observao.
3. Reutilizao: O caso adaptado a partir da diferena entre a antiga observao
e a nova.
4. Reviso: O novo caso aplicado e sua aplicabilidade avaliada.
5. Armazenamento: Se bem sucedido, o caso armazenado na biblioteca e
indexado.
26
Merece alguns comentrios a etapa de adaptao do caso. Diversas formas de

adaptao so discernveis segundo a viso geral dada por Wilke [WIL1998]. A adaptao
pode ser nula, por exemplo, em um problema de classificao cuja sada apenas uma classe
na qual o problema est associado. A adaptao pode ser feita de maneira estrutural
(transformational adaptation), com a utilizao de regras ou frmulas para preencher ou
alterar caractersticas do caso que est sendo adaptado. A adaptao pode ser derivacional
(generative adaptation), reutilizando no caso corrente as regras ou frmulas que produziram a
soluo no caso recuperado. Alm destas principais formas de adaptao, tambm se
distinguem a adaptao composicional e a adaptao hierrquica. Na primeira, novos
componentes de soluo adaptados de vrios casos anteriores so combinados para produzir
uma nova soluo composta. Na adaptao hierrquica existem vrios nveis de abstrao e a
adaptao realizada de cima para baixo.
A aplicao de RBC tem como vantagens relevantes a soluo de problemas em
domnios parcialmente compreendidos e a possibilidade da experincia mostrar o que deu
errado no passado, apontando para as partes importantes de um problema. Certas
desvantagens tambm se destacam [KER2003]. Primeiramente, nem sempre simples a
aquisio dos casos. Muitos sistemas limitam-se a utilizar um especialista humano para a
gerao da base de casos e no aplicar nenhuma regra de adaptao. A modelagem do caso
tambm deve ser feita com cuidado: o acmulo de semelhanas irrelevantes faz com que
certos casos sejam escolhidos em detrimento dos outros, ou seja, como ter certeza que as
propriedades A e B sero determinantes na recuperao de um caso que contm vinte
atributos?
Aps essa descrio sucinta dos principais elementos do RBC, faz-se necessria a
focalizao do presente trabalho em uma aplicao de RBC na rea de planejamento de aes
em jogos de estratgia, com o objetivo de criar jogadores automticos. A escolha de RBC para
a resoluo de tal problema vai de encontro a caracterstica de que muitas vezes o domnio da
aplicao parcialmente compreendido, ou seja, em um jogo de estratgia nem todas as
regras e implicaes das regras so conhecidas pelo jogador. Alm disso, RBC apresenta a
possibilidade do sistema aprender de forma incremental e online, sendo uma aplicao
conveniente para um ambiente em tempo-real. Na prxima seo, a aplicao de RBC em
Planejamento desenvolvida referenciando trabalhos nos quais ela foi utilizada.
27
2. 4
PLANEJAMENTO BASEADO EM CASOS

PBC consiste no reuso de planos bem sucedidos com o objetivo de resolver novos
problemas de planejamento [SPA2001]. PBC utiliza uma diferente abordagem em relao ao

Planejamento tradicional. Ao invs de um problema de busca de uma seqncia de aes que
transforma um estado inicial em um estado final, PBC baseado na adaptao de casos para
resolver novos problemas [COX2002]. Tal necessidade de modificao dos planos
justificvel devido grande quantidade de planos possveis [BER1998]. PBC tambm mais
uma tentativa de reduzir o custo computacional de um problema de Planejamento devido a
seu espao de busca proibitivo.
Um dos primeiros case-based planners foi desenvolvido por Hammond [HAM1989]
para auxiliar na construo de receitas de comida chinesa. O sistema, denominado CHEF,
recupera receitas de pratos e as adapta para um novo problema utilizando o conhecimento
especfico do domnio. Assim, dado um conjunto de objetivos e a situao corrente, o sistema
age em trs passos:
Buscar na base de planos um plano que resolva um problema similar situao

corrente;
Adaptar a soluo para que encaixe nas novas circunstncias;
Armazenar a nova soluo.
Como o conhecimento do plano pode ser incompleto um plano falho pode ser gerado.
Para corrigir a falha, o planejador deve explicar como a falha ocorreu e usar a explicao para
encontrar um conjunto de estratgias de reparo na memria, escolhendo uma para executar o
reparo [COX2002]. A estratgia de recuperao dos planos considera, tambm, a antecipao
de falhas, evitando situaes que gerem falhas no futuro.
Os passos caractersticos do PBC podem ser uma especializao dos j citados para o
RBC por Aamodt e Plaza [AA1994]. Em [BER1998] explica tais passos, os quais seguem a
maioria das abordagens para sistemas que usam PBC. As sees seguintes descrevem estes
passos segundo o autor.
28
2.4.1 Recuperao e organizao da base de casos

Um caso em PBC caracterizado por um problema e seu plano de resoluo. Dessa
forma, o planejador busca na memria solues bem sucedidas referentes a problemas
similares. Como vrios candidatos podem ser encontrados, deve-se utilizar um critrio para
orden-los. Tal ordenao construda atravs de uma medida de similaridade. Como
geralmente a adaptao do plano necessria, a medida de similaridade deve levar em conta o
esforo necessrio para reutilizar a soluo na resoluo de um novo problema [SMY1993].
A quantidade de trabalho desta fase depende da filosofia do planejador. Duas
estratgias so possveis: antecipate-and-avoid e create-and-debug. A primeira, introduzida
por Hammond [HAM1989], antecipa os problemas possveis, procurando planos que os
evitem. A segunda d nfase adaptao do problema com o objetivo de tratar as falhas aps
elas aparecerem no processo de planejamento.
Ainda quanto ao esforo necessrio para computar a similaridade, quanto maior a
quantidade de casos visitados durante a recuperao, mais cara computacionalmente fica a
recuperao de um caso. Entretanto, quanto maior a quantidade de casos visitados, menor o
esforo necessrio para a adaptao do caso. Dessa forma, existe um ponto timo, no qual o
esforo total mnimo. Essa situao representada na Figura 4. A linha 1 representa o
esforo de reutilizao do caso, o qual, quanto maior o nmero de casos, mais possibilidades
existem, e, portanto, mais fcil de realizar adaptaes. A crescente linha 2 representa a
situao de crescimento da dificuldade em se recuperar um caso conforme aumenta o nmero
de casos a ser pesquisado. A linha 3, por fim, representa a soma entre esses dois esforos e
deixa claro o ponto de esforo mnimo.
Figura 4 - Relao entre esforo para recuperao e para reuso [BER1998].
29
2.4.2 Adaptao e reutilizao de solues anteriores

Conforme j citado anteriormente na Seo 2. 3, so duas as principais abordagens em
RBC para a adaptao: estrutural e derivacional. A primeira foi utilizada em planejadores
pioneiros e limita-se a modificar a soluo baseada na diferena entre o caso recuperado e a
descrio do problema. A aplicao da segunda implica em repetir as decises que foram
feitas durante o processo de resoluo do problema recuperado.
2.4.3 Reviso e avaliao da soluo
A validao e avaliao da soluo podem ser feitas no mundo real ou em uma
simplificao deste mundo. Quando no se tem conhecimento exato do domnio, caso a
validao seja feita apenas no ambiente simulado, no se pode ter certeza de sua
aplicabilidade.
2.4.4 Armazenamento de novos casos
Aps a execuo do plano, se este for bem sucedido, um provvel candidato a ser
includo na biblioteca de planos. Entretanto, no ser esta a ao a ser tomada se o caso for
muito similar a algum j existente. Assim sendo, os casos novos ou que sofreram adaptao
so os casos que tm maior probabilidade de serem armazenados, pois agregam um valor
maior base de casos. No caso do plano falhar, a base de planos deve ser alterada de alguma
forma, para que a partir do entendimento do porqu da falha o problema possa ser prevenido.
2. 5
PBC E RBC APLICADO A JOGOS COMERCIAIS

Embora no se tenha encontrado jogos comerciais que utilizam as tcnicas de PBC,
algumas iniciativas acadmicas testaram a alternativa em ambientes simplificados. Ambas

tm influncia direta sobre o trabalho proposto. As prximas sees tratam destas iniciativas.
2.5.1 RBC aplicado em SimCity
Em uma das primeiras aplicaes de RBC na IA de um jogo comercial de destaque,
Fasciano [FAS1996] criou um jogador automtico para o jogo de simulao de gerenciamento
de cidades SimCity3. SimCity uma simulao em tempo real que permite que o jogador
3
Um dos primeiros jogos de simulao que primou pelo realismo na representao das cidades. Website do jogo:
http://simcity.ea.com/
30
assuma o papel de um prefeito. Com tais poderes, o jogador pode influenciar em diversos
aspectos sociais e econmicos, por exemplo, localizao de indstrias, infra-estrutura dos
transportes e resoluo dos efeitos de desastres naturais.
Grande parte do desafio para o jogador humano, e conseqentemente, para o jogador
automtico, prever quais sero os efeitos das construes nas cidades. No apenas o nmero
de construes influencia no decorrer da simulao, mas, principalmente, a localizao das
construes no terreno e como cada tipo de construo ligada entre si. Como a cidade
grande e complexa, no possvel prever o efeito imediato e exato de uma ao.
O autor construiu, portanto, um planejador baseado em casos chamado MAYOR. Este
agente trata os seguintes problemas, tpicos de um ambiente complexo e dinmico:
Conciliao de tarefas de resposta imediata e tarefas de melhorias da cidade;
Gerenciamento de interrupes, emergncias e oportunidades;
Priorizao de atividades que sejam mais importantes;
Resoluo de problemas sem ter um conhecimento completo do mundo.
O ltimo ponto merece um esclarecimento: assim como um jogador humano, o agente

no possui a priori uma noo da influncia exata de cada ao. O entendimento do mundo
vai ficando mais acurado conforme aumenta a experincia do jogador.
A arquitetura de MAYOR consiste em um conjunto de mdulos que monitoram e
trabalham independentemente para alcanar certas condies ao mundo. Tais mdulos geram
tarefas que so fornecidas a um escalonador de tarefas centralizado. O agendador prioriza as
tarefas e seleciona uma para execuo.
A utilizao de planejamento baseado em casos no sistema MAYOR aproveita uma
das caractersticas mais marcantes desta tcnica segundo Hammond [HAM1989] que
trabalhar com domnios de entendimento incompleto. O agente, portanto, se baseia na
reutilizao de um conjunto de planos que provaram ser bem sucedidos no passado.
Entretanto, tais planos no sero sempre bem sucedidos, e, neste caso o sistema analisa os
motivos da falha e como corrigir o plano para o domnio do SimCity.
A biblioteca de planos possua originalmente trinta planos construdos por um
especialista humano. A Figura 5 mostra o exemplo de um caso tpico, indexado pelas
31
demandas comerciais, residenciais e industriais de uma regio. O caso encontrado, portanto,

atravs dessas caractersticas ndice. Tambm fazem parte do caso as expectativas aps a
execuo do plano.
Figura 5 - Caso exemplo do sistema MAYOR [FAS1996].
A correo do plano, no caso de falhas, segue trs passos. Primeiramente, quando os

planos no atendem s expectativas, MAYOR tenta determinar quais fatores causaram a falha,
ou seja, contriburam para que as expectativas no fossem atendidas. Uma rede de
dependncia, baseada no trabalho de Riesbeck de modelagem do conhecimento na economia
[RIE1983], utilizada para gerar possveis explicaes para a falha a partir das dependncias
entre os parmetros que agem no mundo. Por exemplo, quando aumenta o trfego,
conseqentemente a poluio aumenta. Dessa forma, se a aplicao do caso da Figura 6
falhasse na expectativa relacionada poluio (pollution <= moderate), ento, talvez um dos
fatores que estivesse influenciando fosse o trfego. Uma representao grfica da rede de
dependncia utilizada ilustrada na Figura 6. Novamente, o conhecimento contido na rede foi
gerado por um especialista humano.
Figura 6 Exemplo de uma rede de dependncia [FAS1996].
32
O prximo passo gerar uma estratgia de reparo baseada no fator com maior
contribuio para a falha. Cada fator associado a um mdulo de reparo o qual convocado e
aplica uma estratgia de reparao para a vizinhana do local onde o plano foi aplicado
anteriormente e falhou.
O ltimo passo referente correo do plano age na preveno de falhas e alimentao
da base de casos. O reparador determina se o fator com maior contribuio para falha
descoberto no passo anterior existia em algum nvel antes do plano ser executado. Dessa
forma, antes que o plano seja executado da prxima vez, tal fator verificado e caso esteja
com um valor problemtico a estratgia de reparo disparada antes do plano ser feito.
2.5.2 Reconhecimento de Planos em Space Invaders
A IA nos jogos atuais deve suportar o desenvolvimento de personagens mais crveis.
Dois dos novos desafios para a pesquisa da IA de personagens para jogos, segundo Isla e
Blumberg so a antecipao e a imaginao [ISL2002]. Parecer inteligente no consiste
apenas na habilidade de ser previsvel (agir de forma inteligente para uma certa situao), mas
tambm na habilidade de fazer previses e agir em antecipao aos eventos previstos. Alm
disso, ao confrontar-se com um problema, um personagem inteligente deve analisar mltiplos
cenrios antes de tomar uma deciso, e, segundo algum parmetro, escolher qual o plano a
executar para resolv-lo. O personagem deve ser capaz de imaginar e planejar quais aes
devem ser tomadas/executadas.
Fagan e Cunninghan [FAG2003] remetem aos problemas acima, principalmente
antecipao, para um sistema que prev as prximas aes de um jogador no jogo clssico
Space Invaders. Seu objetivo principal dar suporte a NPCs que tenham um modelo do
comportamento do jogador para se antecipar e se adaptar s aes deste. O sistema, chamado
COMETS, usa reconhecimento de planos baseado em casos [KER2003] para implementar o
poder do NPC em observar o comportamento do jogador e identificar planos recorrentes. Os
planos observados so armazenados em uma biblioteca de planos e, em tempo real, o
comportamento atual do jogador comparado com a os casos na biblioteca para identificar
qual o plano que est sendo seguido. Deve-se comentar que o trabalho de [KER2003]
limitou-se ao problema de reconhecer o plano, ficando para o futuro o suporte a um
comportamento adaptativo por parte dos NPCs.
33
Uma das principais vantagens na utilizao de reconhecimento de planos baseado em

casos est na construo da biblioteca de planos. Ao invs de ser construda por um
especialista humano, so capturados os planos dos jogadores conforme vo jogando. Isto
implica na captura, tambm, das caractersticas de jogo e estilo dos jogadores.
Os planos so compostos de estados e aes que proporcionam transies entre os
estados. Nos planejadores tradicionais consideram-se tambm as pr-condies para que uma
certa ao seja executada. Entretanto, como o processo de [KER2003] se focou na observao
dos planos ao invs do gerenciamento do processo de planejamento, no se consideraram as
pr-condies.
Sobre a representao dos estados em Kerkez [KER2003], um estado representado
por um conjunto de predicados de primeira ordem. Alm disso, para facilitar a indexao
utilizada uma representao que divide os estados em abstratos e concretos. Fagan e
Cunninghan [FAG2003], por sua vez, utilizam uma simplificao dos estados para o plano do
jogador na qual trs estados so possveis, conforme ilustra a Figura 7:
Safe (a): quando a nave est em segurana atrs de um obstculo;
Unsafe (b): a nave est em terreno aberto, mas no est sendo ameaado por
tiros;
Very unsafe (c): a nave est em terreno aberto e ameaada por um tiro.
Figura 7 Estados possveis no jogo Space Invaders .
34
As aes que servem de ligao entre os estados so seis: fire, hide, emerge, dodge,
suicide e exogeneous, respectivamente: atirar, esconder-se, emergir, rodear, suicidar-se e
evento do jogador ficar sob o fogo inimigo. A biblioteca de planos foi construda
dinamicamente aps o jogador interagir com o ambiente por trs sees. Cada plano
dividido em pequenos subplanos caracterizados por um valor de suporte, ou seja, pelo nmero
de vezes que o subplano aparece na base. Os planos com alto valor de suporte so includos
na base. O reconhecimento do plano do jogador feito atravs do matching de trs passos
consecutivos existentes em um subplano na base de planos.
2.5.3 RBC em RTSs
Cheng e Thawonmas
[CHE2004] discutem a aplicabilidade de tcnicas de
reconhecimento de planos baseado em casos em RTSs. Os autores objetivam no a criao de

jogadores automticos, mas sim a utilizao da tcnica para auxiliar os jogadores humanos em
tomadas de deciso. E, devido ao tamanho proibitivo do conjunto de estados, sugerem que se
limite o escopo do ambiente a ser analisado, dividindo em nveis estratgicos, tticos e
operacionais a considerao do caso. Outra sugesto relevante refere-se necessidade de
estudo detalhado de consideraes temporais e cadeias de eventos.
2.5.4 O ambiente Wargus
Aha, Molineaux e Ponsen [AHA2005] introduzem o primeiro sistema baseado em
casos projetado para vencer oponentes aleatrios em RTSs. Tal sistema trabalha no nvel
ttico, sendo aplicado no jogo Wargus, um clone aberto de Warcraft II. Com um mapa de 128
por 128 e um espao de deciso por jogada de tamanho aproximado de 1.5 x 103, essencial a
diminuio deste espao de deciso para a criao de um jogador automtico. Uma
possibilidade colocar mais conhecimento sobre o domnio, o que exige um especialista.
A abordagem escolhida, Case-Based Tactician (CAT), trabalha com um formato de
caso composto por quatro partes:
BuildingState: Valor inteiro que indica o estado do imprio do jogador (por

exemplo iniciando uma construo, completando uma construo);
35
Description: Conjunto de caractersticas referentes situao atual (e.g.

nmero de construes do oponente, nmero de construes do jogador,
nmero de unidades de combate).
Tactic: Seqncia de aes de contra-estratgia referentes ao BuildingState.
Performance: Reflete a utilidade de escolher uma certa ttica em relao ao

BuildingState.
Destaca-se que aps cem jogos de teste, o jogador automtico consegue vencer cerca
de 80% dos jogos. Deve-se rememorar, porm, que este resultado embora indique uma
excelente performance, foge do objetivo do presente trabalho, que a criao de um
adversrio que seja desafiador, mas possvel de vencer. De [AHA2005], como trabalho
aproveita-se em parte a estratgia de representao dos casos.
36
2.5.5 Outras iniciativas de destaque

Aha, Molineaux e Ponsen [AHA2005] apresentam a tabela a seguir quanto pesquisa
relacionada a RBC em games.
Gnero
Exemplos
Esportes de time
RoboCup
Soccer
[WEN2001]
Descrio
Abordagem
Planejamento
em
tempo
real
Tarefa a ser
Otimizada
Vrias
Passe, seleo dos

membros
multiagente
Ao individual
games
em
um
time
Bilestoad
Planejamento
em
Visualizao
[GOO1989], Space
tempo
real
projteis,
reconhecimento de
Invaders
individual
Reconhecimento de
planos
[FAG2003]
God
de
SimCity [FAS1996]
tempo real
de
Inflingir
danos,
planos
Gerenciamento
de
cidade em tempo
Adaptao
de
Planejamento
de
Defender
planos
real
Estratgia
em
Freeciv [ULA2004]
turnos
Gerenciamento
de
Recuperao
civilizao baseado
falhas em planos
em turnos
baseado
uma
cidade
em
reflexo
Estratgia
tempo real
em
Wargus
Gerenciamento
Casos hierrquicos,
Gerenciamento
de
[CHE2004],
limitado de cidades
seleo de planos
sub-tarefas, vencer
[AHA2005]
em tempo real
Tabela 2- Pesquisa relacionada a RBC em games [AHA2005].
Na Tabela 2, alm das j citadas [FAS1996][CHE2004], interessante destacar que a

maior parte das iniciativas trata de problemas referentes a tempo real e envolvem a gerao de
estratgias para resoluo de problemas de Planejamento.
2. 6
CONSIDERAES FINAIS
Tratou-se, neste captulo, acerca das tcnicas e teorias que sero aplicadas para a
criao do jogador automtico. Destaca-se, primeiramente, que quanto maior a experincia de
37
um Sistema de Casos, maior a competncia do sistema. Alm disso, um sistema baseado em

RBC bastante adequado para ambiente multiusurio como um jogo online.
Quanto rea de Planejamento, essencial justificar o porqu da inaplicabilidade de
abordagens tradicionais e a necessidade de uma abordagem baseada em casos. Primeiramente,
o presente trabalho tem como objetivo a sua aplicao em um contexto genrico, incluindo
descries parciais e imprecisas de ambientes. As abordagens tradicionais exigem a definio
de pr-condies para a execuo e uma ao e, portanto, o conhecimento completo das
regras de comportamento.
Novamente, um jogo online foi escolhido como aplicao, pois possvel a captura de
uma quantidade considervel de planos dos jogadores diminuindo neste caso a dificuldade de
reuso e tambm a necessidade de adaptao. Mesmo assim, a adaptao do caso ser
necessria, pois permitir a extrao de conhecimento acerca do sistema. O prximo captulo
descreve a metodologia de desenvolvimento mostrando quais aplicaes das tcnicas descritas
foram efetivamente empregadas no projeto e de que maneira.
38
METODOLOGIA
Esta seo descreve a criao da arquitetura para construo de jogadores automticos

para a classe dos jogos de estratgia baseados em imprios. Tal arquitetura foi construda
atravs de tcnicas de RBC, mais especificamente PBC.
O objetivo da arquitetura povoar o mundo do jogo com jogadores automticos
interessantes. Tal arquitetura composta por trs camadas. A primeira camada responsvel
pela recuperao dos planos mais semelhantes ao estado atual do jogador automtico e pela
aplicao do plano no ambiente do jogo. Esta base de planos construda a partir da captura
das aes realizadas por jogadores humanos. Caso haja falha no plano, a segunda camada,
denominada camada reparadora, permite a correo do plano e a anotao do possvel motivo
do erro. A terceira camada, por sua vez, responsvel por prevenir possveis erros antes de
ocorrerem, a partir da informao de erro preenchida pela segunda camada.
O ambiente de aplicao desta arquitetura so jogos online multiplayer devido
necessidade de captura de planos. Nesta seo, aps a descrio detalhada de cada mdulo do
sistema, so justificadas as restries, adaptaes e cortes feitos no jogo original para a
gerao do jogador automtico e detalhes da tcnica de implementao do jogador automtico
de Promisance. Por fim, o mecanismo que ser utilizado para avaliao do sistema
apresentado.
3. 1
DESCRIO DO JOGADOR AUTOMTICO

O objetivo do jogador automtico em um jogo de estratgia no apenas maximizar
sua performance. Deve-se destacar que o objetivo da IA para jogos de entretenimento no a

gerao de um jogador que vena sempre. O que faz um jogo divertido no necessariamente
corresponde a fazer os personagens com mais inteligncia. O jogador humano deve ter a
possibilidade de vencer de alguma maneira. A diverso pode ser maximizada, portanto,
fazendo algumas falhas do NPC serem intencionais, mas plausveis.
Liden [LID2004] trata desta questo da estupidez artificial para a classe dos jogos
de tiro. Para os jogos de estratgia, alguns dos truques citados pelo autor poderiam ser
39
aplicveis. Por exemplo, o NPC poderia atacar um imprio do jogador at que este estivesse
quase morto. Quando o imprio fica num limite aceitvel, a efetividade do ataque
diminuda. Assim, o jogador tem a oportunidade de revidar e, com o sucesso do revide um
sentimento de desafio vencido estimulado. Esta e outras tcnicas poderiam ser
implementadas para estimular a diverso. Entretanto, deve-se destacar que caso o jogador
percebesse o truque, ao invs de divertir-se, ficaria decepcionado por ter sido enganado e a
sua imerso no jogo seria prejudicada. Alm disso, enquanto em um jogo de tiro, a vida til
de um NPC curta, um imprio de um jogo de estratgia tem suas mincias analisadas por
um tempo considervel pelo jogador humano.
A arquitetura proposta para a classe dos jogos de estratgia baseados em Imprio no
vai deixar de inserir erros e imperfeies. Entretanto, tais erros e imperfeies no sero
codificados no jogador automtico. O jogador automtico imitar os comportamentos e estilos
de jogo dos outros jogadores a partir de uma base de planos criada atravs da captura das
aes dos jogadores.
Deve-se destacar que isso no garante a diverso do jogador. Dessa forma, alm da
imitao dos estilos da comunidade, o jogador automtico tambm criar planos inditos
aprendendo a antecipar as falhas e evit-las. Esse conhecimento, alm de til para a prpria
comunidade de jogadores automticos, tambm pode ser utilizado, futuramente, para auxiliar
jogadores humanos.
3.1.1 Gerao da base de planos
A gerao inicial da base de planos no feita de maneira aleatria e tampouco sob a
responsabilidade de um especialista humano. Assim sendo, inicialmente, existem apenas
jogadores humanos cadastrados no sistema. Todos os jogadores so monitorados e seus planos
armazenados. Deve-se destacar que um plano formado, segundo a arquitetura proposta por
Kerzez [KER2003], por uma seqncia de pares estado-ao. Quanto s variveis de estado,
elas podem ser de dois tipos: algumas delas so usadas no processo de recuperao do caso e
outras no, servindo apenas como quantificadores do estado e, possivelmente, sendo usadas
durante a antecipao de falhas.
Quanto s variveis de ao, podem ser fixas, caracterizando e diferenciando cada uma
das aes, ou quantificadores de ao, ou seja, parmetros da ao que podem ser utilizados
40
no processo de adaptao. Destaca-se a gerao de uma ferramenta que facilita a captura dos
pares estado-ao. Tal ferramenta, com uma de suas telas ilustrada na Figura 8, permite que a
partir da captura dos planos dadas as aes realizadas pelos jogadores, se escolha para cada
varivel capturada quais so as variveis de estado, quantificadores de estado, variveis fixas
de ao e quantificadores de ao. Alm disso, a ferramenta tambm permite a associao de
filtros de entrada e de sada para os valores das variveis. Um ltimo passo explicitado na
Figura 8 que se optou pelo armazenamento destas informaes e das meta-informaes
relacionadas num formato de banco de dados relacional.
Associada a esta ferramenta de gerao de planos, todo o acesso base e ao jogo em si
foi encapsulado em dois web services. O primeiro responsvel por servir ao jogador
automtico de interface de acesso ao jogo permitindo a execuo das aes pelo jogador
automtico. Outro web service disponibiliza consultas base de planos para verificao, por
parte do jogador automtico, das aes mais adequadas em relao ao seu estado.
Figura 8 Ferramenta de Apoio Gerao dos Planos.
O tamanho mximo de cada plano o correspondente a uma seqncia de jogo do

jogador, ou seja, cada plano formado por todos os pares ao-estado desde o login at o
logout do jogador em uma seo. Destaca-se que, dependendo do jogo o tamanho dos planos
gerados pode ser um problema. Por exemplo, se cada jogador tiver at 300 turnos acumulados
para gastar e existissem aes cujo custo de apenas um turno, o tamanho mximo de um
plano seria de trezentos pares.
Observa-se, porm, que um plano pode conter diversos componentes distintos. Alm
disso, alguma ao executada pelo jogador tem chance de no pertencer ao plano que est
41
sendo executado. Dessa forma, o processo de reconhecimento de planos vai operar em

subplanos de tamanho menor. Tais subplanos sero armazenados em uma base de subplanos
temporria. Os subplanos com maior suporte, ou seja, com mais ocorrncias e com mais poder
de maximizao da posio do jogador no ranking, sero transferidos para a base de casos
definitiva. Esse processo ilustrado na Figura 9.
Um parmetro dever ser alvo de testes: o tamanho dos subplanos, ou seja, a
quantidade de pares estado-ao a serem armazenados. Fagan e Cunningan [FAG2003]
utilizam subplanos com tamanho quatro. Os planos de um jogo de estratgia, porm, so mais
complexos e devem envolver mais aes. Uma janela maior, porm, implica em dificultar o
matching de um subplano que seja semelhante a outro. Uma janela menor desejvel se o
ambiente do jogo contiver poucos pares estado-ao e objetivar-se que o matching seja
facilitado.
Figura 9 Criao da Biblioteca de Planos.
Na Figura 9, o plano formado por cinco pares, representado pelo par (s1/a) at (s5/b) ,
segundo um tamanho de janela de subplano igual a trs pares estado-ao, gerador de trs
subplanos que so colocados em uma base temporria de subplanos. Os subplanos com maior
suporte (os que mais ocorrem) so copiados para a Biblioteca de Planos. Observa-se que a
necessidade deste passo se d apenas quando existe a possibilidade de alta repetio de
42
subplanos, por exemplo, em ambientes nos quais se apresentam um nmero limitado de

estados. Outra justificativa possvel para a execuo deste passo, rememora o exposto quanto
ao esforo para a recuperao versus esforo para reuso (Figura 4). Se o esforo para
recuperao for baixo, no se justifica a necessidade de uma base temporria.
Outro ponto a ser considerado o mtodo de comparao dos subplanos. Um subplano
provavelmente deve ter pequenas diferenas em relao a outro. Diferenas inclusive em
relao ordem de execuo das aes. Prope-se, para facilitar o matching entre subplanos
semelhantes, a utilizao de uma representao abstrata dos planos [KER2003]. Tal
representao aponta para os subplanos concretos com aspecto semelhante. Um subplano
abstrato seria representado pelas aes que esto associadas a ele e pelo nmero de vezes que
cada ao aparece no subplano. Cada subplano concreto associado ao subplano abstrato
incrementa um contador de suporte. Assim, os subplanos com maior suporte so os subplanos
com maior freqncia. A necessidade deste plano abstrato justifica-se caso o mundo do jogo
possua como caracterstica a repetio de subplanos. Um subplano abstrato ou estratgia pode
ser considerado como pertencente ao contexto do planejamento ttico-estratgico. Ou seja, se
for comum a repetio de estratgias e a ordem de execuo das tarefas no to relevante,
justifica-se o uso de uma camada de planos abstratos. Entretanto, se a ordem de execuo das
aes muito importante, a gerao de subplanos abstratos esconde caractersticas do plano e
gera uma semelhana falsa entre dois planos diferentes. No houve preocupao com a
escolha entre dois planos com a mesma representao abstrata.
Figura 10 Separao em subplanos concretos e abstratos.
43
Na Figura 10, por exemplo, esto sendo armazenados os subplanos abstratos quanto s
aes. Por exemplo, a seqncia de s9/b=>s10/b=>s11/b e s2/a=>s2/b=>s5/b, so indexadas
como um mesmo subplano abstrato pois os dois subplanos possuem a mesma distribuio de
aes.
Subplanos com aes diferentes, porm, podem ter objetivos semelhantes. Por
exemplo, o dinheiro de um imprio pode ser aumentado tanto pela venda de itens no mercado
quanto por um ataque bem sucedido a um inimigo. Outra indexao faz-se necessria: o
agrupamento de subplanos semelhantes em relao ao estado inicial e estado final do
subplano. Tal indexao, alm de incrementar o contador de suporte do subplano abstrato,
ser essencial no processo de recuperao do caso. Deve-se recordar que atravs da diferena
entre o estado inicial e o estado final obtm-se qual o objetivo do plano. Voltando Figura
10, a seqncia (s2/a) at (s5/d) indexada no mesmo subplano que a seqncia (s2/a) at
(s5/b), pois possuem o mesmo estado inicial e final. J que o objetivo final o mesmo, a
ordenao do plano mais eficiente pode ser feito atravs do menor plano ou o mais barato
computacionalmente segundo alguma mtrica do domnio.
Os subplanos com maior suporte so candidatos para a incluso na base de planos
(Figura 11). Outro parmetro a ser configurado, portanto, qual o valor de suporte que
justifica a aceitao do subplano. De tal base de planos provem a inteligncia do jogador
automtico.
Figura 11 Criao da Base Definitiva de Planos.
Outro critrio possvel de ser utilizado para o corte na base de planos o sucesso do
plano. Por exemplo, planos pertencentes a jogadores automticos cuja performance em
44
relao aos outros piorou em um perodo de tempo poderiam ser excludos da base de planos.
Este corte discutvel, pois o objetivo do sistema garantir a credibilidade dos jogadores
automticos. Planos mal sucedidos tambm podem ser interessantes de serem explicitados e
trazem mais humanidade ao comportamento dos jogadores automticos. Destaca-se que a
base de planos compartilhada por todos os jogadores automticos. Dessa forma, os
jogadores automticos podem ter acesso a todos os planos da base de planos tanto gerados
pelos jogadores humanos quanto pelos automticos.
3.1.2
Processo de recuperao dos subplanos

Inicialmente o sistema no possui nenhum jogador automtico. Decorrido alguns dias
de jogo, conforme os jogadores forem interagindo com o ambiente, os planos vo sendo

includos na base de planos e chega o momento de utilizar estes planos atravs da gerao de
uma populao de jogadores automticos que execute os planos que foram acrescentados
base de planos at o momento.
A IA destes jogadores automticos possui trs camadas distintas para decidir a ao
executada pelo jogador automtico. Tal arquitetura guarda semelhana com a arquitetura de
subsumption de Brooks [BRO1991] na qual uma camada inibe e tem precedncia sobre a
outra.
A primeira camada, denominada Camada Planificadora, tem precedncia sobre a
segunda, a qual responsvel por corrigir erros. A terceira camada, denominada Camada
Antecipadora, por sua vez, ativada sempre aps a escolha do plano que ser seguido. Tal
camada, conforme descrito na prxima seo, previne os possveis erros que estiverem
relacionados ao plano escolhido. No incio, os planos no possuem seqncias de correo
associadas a eles.
A Camada Planificadora faz uma busca em todos os estados componentes dos planos
da base de planos usando algum critrio de similaridade. Para o estado mais similar
encontrado, a ao associada a este estado executada. O prximo passo do jogador
automtico seguir a prxima ao do plano. Todavia, antes de executar a prxima ao, o
jogador automtico verifica se a ao gerou o estado previsto ou semelhante. No caso de
falha, o processo de busca de um estado semelhante pode ser executado novamente, se isso
45
for possvel. Uma nova falha implica na inexistncia de um estado em um plano que se adapte
a situao. Neste caso, a segunda camada da IA (Camada Reparadora) fica responsvel por
decidir o comportamento do jogador automtico.
Tal camada baseada no mdulo Neighborhood Repair contido no trabalho de
Fasciano [FAS1996] com o jogo SimCity. O jogador automtico procura verificar as
diferenas entre o estado atual e o estado que era esperado com a execuo do plano. Para os
parmetros com diferenas significativas aplicada uma ou mais estratgias de reparo. Por
exemplo, a ao selecionada pela Camada Planificadora era um ataque a um imprio de
tamanho X, e raa Y, um pouco maior em relao ao imprio do jogador automtico. Tal ao
deveria conquistar as terras desse imprio. Entretanto, o imprio escolhido para o ataque foi
um imprio semelhante ao atacado pelo plano (tamanho X e raa Y), mas as tropas do jogador
automtico desertaram. Nas regras do jogo, essa situao representada por uma diferena
mxima de duas vezes o mximo do nmero de setores do imprio para um ataque ser bem
aceito pelas tropas. Assim, a segunda camada vai perceber-se o motivo do ataque ter sido mal
sucedido est em alguma diferena entre o imprio do plano que foi bem sucedido e o outro e
vai realizar alguma ao para ficar mais semelhante a esse imprio. Neste caso, o jogador
automtico perceberia que a diferena entre o nmero de setores um fator de diferena e
realizaria uma ao cujo objetivo fosse aumentar o nmero de setores. S ento, o jogador
automtico tentaria novamente executar o plano. Se o plano for bem sucedido provvel que
a ao de correo tenha sido eficiente. Neste momento a rotina de preveno realizada
associada tanto ao plano realizado quanto ao. Dessa forma, da prxima vez que o plano
for realizado, previne-se o problema.
Esta estratgia s vlida em jogos com aspecto determinstico ou quase
determinstico e que seja possvel o acesso a maior parte das variveis representativas do
estado. De outra forma, em um jogo cujo resultado das aes fosse dependente da sorte no
seria possvel a certeza que a alterao em um parmetro teria sido a responsvel por corrigir
um problema. A Figura 12 exemplifica o processo descrito. Alm disso, a aplicao da
correo pela camada reparadora tambm s possvel no caso de jogos cujas aes no
impliquem em uma mudana significativa no estado do jogo quando uma ao errada for
realizada. Se for este o caso, ganha prioridade na execuo a Camada Antecipadora e a
Camada de Reparo pode ser usada para, ao invs de aplicar a correo, apenas anotar
hipteses que explicam o fracasso do plano. Na Figura 12, isso representaria a eliminao do
46
passo 5 e, no passo 6, o armazenamento no de um plano de correo, mas sim de hipteses

de erro que seriam testadas no mais pela Camada de Reparo mas sim pela antecipadora.
Figura 12 Processo de Recuperao e Reparo dos Casos.
Quanto s possveis estratgias de correo, o principal desafio de sua codificao est

na interdependncia entre os parmetros. Por exemplo, uma estratgia de correo que
aumente um valor de parmetro tambm pode aumentar outro. Dessa forma, alm do aumento
de um dos parmetros necessria alguma ao para manter o equilbrio nos outros. Seria
interessante passar a responsabilidade a um especialista que determinasse estas
interdependncias a priori e explicitamente associasse aes corretivas aos parmetros.
Seguindo o modelo apresentado por Fasciano [FAS1996], pode ser utilizada uma rede de
dependncias para modelar as dependncias entre os parmetros. Outra alternativa seria a
prospeco, na prpria base de planos, de planos que provoquem a correo dos parmetros
diferentes em relao ao estado objetivo.
3.1.3 Preveno de falhas e realimentao da base de casos
O algoritmo de preveno de falhas introduz a preocupao em antecipar as falhas nos
planos antes de sua ocorrncia. Caso uma rotina de correo seja bem sucedida e um
problema tenha sido detectado, ela pode ser chamada antes da execuo do plano para garantir
o seu sucesso.
47
Um problema detectado pela Camada Reparadora atravs dos valores das diferenas
entre as variveis de estado entre o estado desejado e o estado atual. Cada diferena ser
candidata a ser combatida por uma estratgia de reparo.
As estratgias de reparo bem sucedidas provocam a associao da condio para que a
estratgia seja chamada ao plano cujo reparo foi necessrio. Destaca-se que as aes
realizadas para o reparo do plano e o plano associado, se bem sucedido, tambm podem ser
acrescentados biblioteca de planos. Dessa forma, planos novos no so gerados apenas pela
interveno humana, mas tambm pela aprendizagem dos jogadores automticos, os quais
anotam na base de planos as possveis pr-condies para um plano ser executado.
Figura 13 Processo de Antecipao de Erros.
Na Figura 13, o processo de antecipao de erros caracterizado pela busca de prcondies descobertas pela camada de reparo devido a uma correo bem sucedida ou uma
hiptese para correo da falha no passo 1. Caso a pr-condio seja falsa, executa-se a
estratgia de reparo associada a ela (passo 3). Sendo verdadeira, retorna-se a Camada
Planificadora ao comando, executando a ao desejada antes da execuo da correo,
conforme a Figura 12. Dependendo se houver falha ou sucesso na execuo da ao de reparo
realizada a anotao em relao ao plano se aquela ao de reparo foi bem sucedida ou no.
Tal anotao aumenta ou diminui o suporte pr-condio associada ao de reparo.
Define-se o suporte como a quantidade de vezes que a ao de reparo bem sucedida menos a
quantidade de falhas. Alm dessa informao poder ser utilizada para ordenao na
48
recuperao de aes de reparo, ela tambm importante para povoar e validar a rede de
dependncia entre os parmetros. Ou seja, pode-se inferir quais aes conseguem modificar
quais parmetros do estado do jogador automtico.
A arquitetura proposta foi testada em um jogo online baseado em turnos com interface
web chamado Promisance. A prxima seo descreve este jogo e quais adaptaes foram
necessrias para encaix-lo infra-estrutura descrita.
O JOGO PROMISANCE
3. 2
Promisance4 um jogo multiplayer de estratgia em turnos que permite o

gerenciamento de um imprio persistente. Sua interface essencialmente textual, implicando
na possibilidade de ser jogado em qualquer navegador web.
Promisance foi lanado em 1999 e um jogo aberto cujo cdigo est sob a licena
5
GPL (General Public Licence). Seu mecanismo de funcionamento por turnos semelhante
ao dos door games, sendo esta classe de jogos sua principal inspirao. Os principais jogos
que precederam o Promisance quanto a mecnica e temtica foram TradeWars, Solar Realms
Elite e Falcons Eye.
Aps se cadastrar no sistema o jogador recebe um imprio. Esse imprio
caracterizado, principalmente, pelos valores de:
Money (Dinheiro): dinheiro que o imprio possui. Dinheiro permite que sejam
feitas construes.
Land (Terra): nmero de setores que o imprio possui. Cada construo ocupa
um setor.
Mana (Magia): Energia utilizada pelos magos para fazer magias.
Grains (Gros): Quantidade de comida disponvel para a populao.
Health (Felicidade): Sade da populao em geral (civis, tropas e magos).

Influencia na capacidade de defesa e ataque.
Cada novo imprio recebe inicialmente uma quantidade padro para cada uma das
variveis acima. Independente do momento que o imprio for criado, todos os novos
4
O cdigo-fonte do jogo est disponvel em: http://sourceforge.net/projects/promisance/
49
jogadores recebem imprios iguais. No decorrer do jogo, porm, conforme as escolhas do

jogador, tais imprios se tornaro diferentes. Alm disso, durante a criao do imprio
tambm pode ser feita a escolha de sua raa, o nome do imprio e a era temporal que ele est
alocado. A raa reflete em multiplicadores para a evoluo do imprio. Por exemplo, um
imprio com raa Troll tem 24% a mais de poder ofensivo que um imprio humano com o
mesmo nmero de tropas, mas, por outro lado, tem 10% a menos de poder defensivo que o
mesmo imprio. A era reflete as construes possveis de se construir e as tropas que podem
ser treinadas.
O objetivo principal do jogo fazer com que o valor do imprio cresa. Esse valor,
denominado networth calculado a partir do tamanho do imprio e de quanto dinheiro o
imprio possui. Como o valor do networth pblico, o jogo apresenta um ranking que
permite a comparao do valor de networth entre todos. Considera-se, portanto, que os
imprios vencedores so aqueles que estiverem nas primeiras colocaes do ranking ao final
de um round de jogo. Os rounds geralmente tem uma durao de dois a quatro meses.
Quanto ao gerenciamento do imprio, diversas aes esto disponveis. Tais aes
esto relacionadas, principalmente, construo da infra-estrutura da civilizao,
explorao e prospeco de novas terras e a gerao de tropas. Para executar uma ao, um
certo nmero de turnos gasto. Inicialmente, os jogadores tm disponveis 400 turnos. A cada
10 minutos, dois turnos so ganhos pelo jogador. Um total de 800 turnos, no mximo, pode
ser acumulado para cada imprio.
As tropas so essenciais ao aspecto multiplayer do ambiente, pois os imprios podem
interagir de trs maneiras diferentes:
Ataque direto: o ataque a um imprio inimigo alm de diminuir as tropas do

adversrio, conquista parte de seu territrio. Caso seja mal-sucedido, o ataque
diminui o nmero de tropas e a moral da populao.
Ataques mgicos: tal classe de ataques dependente do nmero de magos que

o imprio possui e da quantidade de mana disponvel. Ataques mgicos so
poderosos, mas so mais caros ao imprio.
Licena de cdigo que libera as modificaes no cdigo contanto que elas tambm sejam liberadas ao pblico.
50
Criao de Alianas: quando dois ou mais imprios se aliam, proibido

declarar guerra entre os membros da aliana. Alm disso, todos devem ajudar
com o envio de tropas quando um dos membros atacado. Um imprio que
faz parte de uma aliana tem mais chance de evoluir.
Um imprio destrudo quando perde todas as suas terras. proibido a um mesmo

jogador possuir mais de um imprio. Essa restrio se d pela vantagem associada s alianas
em relao aos imprios que no fazem parte de alianas.
3. 3
ADAPTAES FEITAS AO JOGO

O mundo de Promisance desafiador e complexo para o jogador iniciante. Dada a
vantagem dos imprios participantes de uma aliana, o novato tende a coligar-se logo de
incio. Para entrar em uma aliana h uma fase de negociao que foge ao ambiente do jogo,
ou seja, geralmente a entrada em uma aliana combinada em frum, por email ou qualquer
outra forma de comunicao fora do ambiente do jogo.
Foge do escopo deste trabalho o desenvolvimento de um jogador automtico apto a
participar de uma negociao neste sentido. Desta forma, todos os tipos de comunicao entre
os jogadores sero impossibilitados dentro da interface do jogo para que tanto o jogador
automtico quanto os jogadores humanos tenham as mesmas aes possveis. Alm disso,
para dificultar a comunicao entre os jogadores humanos em um frum externo, o jogador
humano no ter acesso ao nome e identificador dos imprios inimigos ao acessar o ranking.
Por exemplo, o jogador A visualiza para os imprios B, C e D, os nomes X, Y e Z. O jogador
E, por sua vez, enxerga os nomes Z, X e Y para os imprios citados, respectivamente. A
Figura 14 mostra a nova interface grfica implementada para o jogo e viso que um imprio
tem de seus adversrios.
51
Figura 14 Interface grfica criada para o jogo Babel Promisance.
Toda a funcionalidade referente formao de alianas ser, portanto, extirpada, j

que a comunicao entre os imprios no ser mais fator chave na jogabilidade. Salienta-se,
porm, que seria um trabalho futuro relevante implementao de um jogador automtico
apto a negociao e participao em alianas.
Outro mdulo excludo do sistema a loteria. O jogador poderia comprar at trs
bilhetes e, se sorteado, ganharia o prmio referente a uma porcentagem de todo o lucro obtido
com os bilhetes. Justifica-se a retirada deste mdulo por ele ser dependente apenas da sorte.
No Anexo 2 esto descritos mais detalhes sobre o funcionamento bsico do
Promisance, descrevendo cada tela do jogo e as aes que um jogador, inclusive o jogador
automtico, devero considerar.
52
3. 4
REPRESENTAO DO ESTADO E AES

Os planos so formados por pares estado-ao. O estado, por sua vez, formado por
uma srie de dados numricos referentes ao status do imprio. As variveis de estado que
sero utilizadas no processo de recuperao do caso so: dinheiro, valor, raa, terra, magia,
comida e felicidade. A medida de similaridade utilizada para a recuperao dos planos foi a
distncia Euclidiana entre o estado do jogador automtico e os estados na base de planos.
Nem todas as caractersticas so utilizadas para o processo de indexao dos casos,
tendo, portanto, um peso zero durante o clculo da similaridade. Tais caractersticas sero
utilizadas, se necessrio, pela Camada Reparadora e pela Camada Antecipadora no caso de
falhas no plano e/ou antecipao de erros. As caractersticas usadas por essas duas camadas
so: populao; produo estimada; consumo estimado; porcentagem de aes ofensivas;
porcentagem de aes defensivas; quantidade de reas comerciais, residenciais, militares,
industriais, escolares, agrcolas, defesas nas fronteiras, terra no utilizada, magos, soldados;
catapultas, avies, navios; despesas esperadas; renda per capita; pontos ofensivos e pontos
defensivos. Tais caractersticas so valores inteiros contnuos armazenados na base de dados
relacional. As estratgias de reparo so utilizadas tentando aumentar ou diminuir algum
desses parmetros antes da execuo de um plano.
A Tabela 3 sumariza as aes disponveis para o jogador humano e para os jogadores
automticos. Rememora-se que a descrio mais completa destas aes est disponvel no
Anexo 2.
53
Ao
Gerar Dinheiro
Explorar
Plantar
Construir
Parmetros
Nmero de turnos gastos na especulao.
Nmero de turnos gastos na explorao.
Nmero de turnos gastos na agricultura.
Nmero de reas comerciais, residenciais, militares, industriais,
escolares, agrcolas e defesas nas fronteiras.
Gerenciar Indstria Porcentagem de soldados, catapultas, avies e navios.
Gerenciar Taxas
Mudana na taxa de impostos.
Atacar
Alvo a ser atacado.
Ataque Surpresa
Alvo a ser atacado.
Ataque Terrestre
Alvo a ser atacado.
Ataque Areo
Alvo a ser atacado.
Ataque Martmo
Alvo a ser atacado.
Bola de Fogo
Alvo a ser atacado.
Tufo
Alvo a ser atacado.
Tempestade
Alvo a ser atacado.
Terremoto
Alvo a ser atacado.
Assalto
Alvo a ser atacado.
Login
Email e Senha.
Tabela 3- Aes que os jogadores humanos e automticos podem executar.
3. 5
AVALIAO DO SISTEMA
Trs mtricas principais para verificao do sucesso do sistema foram utilizadas. A
primeira, de aspecto mais subjetivo um teste realizado periodicamente com alguns

jogadores, para os quais ser relacionada uma lista de imprios. Cada jogador dever
discernir, nesta lista, quais so os jogadores automticos e quais so os jogadores humanos.
Tal teste permite a descoberta e discusso se podemos atribuir aos jogadores automticos a
noo de inteligncia no domnio do jogo. Tem-se, portanto, semelhana de objetivos com o
Teste de Turing, o qual consiste em instruir um operador, fechado em uma sala, a descobrir
quem responde suas perguntas, introduzidas atravs do teclado: um outro homem ou uma
mquina. O projeto proposto, portanto, no objetiva a gerao de um jogador automtico
muito melhor que o humano. O foco principal a criao de jogadores automticos com os
quais os jogadores humanos possam se identificar.
A abordagem baseada em casos permite a imitao dos estilos dos jogadores humanos,
logo, a identificao com eles. Por exemplo, em um jogo online de estratgia se o imprio
atacado, muitas vezes o jogador humano tem vontade de retribuir o ataque. Existem situaes
54
nas quais claramente essa revanche pode ser mal sucedida. O jogador humano mais passional,
dessa forma, no avalia os riscos e, mesmo que perca parte de suas tropas, deseja o revide de
alguma maneira. Essa estratgia, mesmo que no to bem sucedida, se tiver alto valor de
suporte poder entrar na base de planos. Ou seja, os jogadores automticos podero ter um
estilo de jogo agressivo como um jogador humano. Justifica-se, portanto, a aplicabilidade do
teste proposto para verificar se os jogadores automticos esto imitando de maneira crvel o
estilo humano.
Entretanto, existe a possibilidade do estilo dos jogadores humanos imitados no ser
divertido ou interessante para alguns jogadores. Como a diverso um fator subjetivo,
prope-se um segundo teste associado ao Teste de Turing: alm de questionar ao jogador
quem um jogador automtico, tambm se questionar uma nota para a experincia que o
jogador teve ao interagir com o imprio adversrio.
Quanto validao do sucesso das tcnicas de planejamento e da infra-estrutura de
jogadores automticos, ser necessrio verificar o posicionamento e distribuio do jogador
automtico no ranking aps a execuo de um plano. O aprendizado de novos planos ocorre
devido ao trabalho das camadas Reparadora e Antecipadora. Para mensurar a qualidade e
ineditismo destes planos, ser necessria a anlise por um especialista humano. No se v
outra mtrica possvel para a medio da criatividade do jogador automtico. Outra alternativa
verificar numericamente a performance do plano gerado, ou seja, o aumento no networth
que a execuo do plano proporciona ignorando possveis influncias dos outros imprios no
momento.
Para verificar se o sistema est efetivamente aprendendo, deve-se verificar a criao de
estratgias de reparo bem sucedidas ou at mesmo, novos jogadores automticos podem ser
acrescentados ao sistema periodicamente e sua performance deve ser comparada com os
anteriores ou com os jogadores humanos. Tal periodicidade de criao, tambm deve ser alvo
de ajustes, mas est estimada em uma ou duas semanas.
Os jogadores automticos novos devem ter acesso a toda a base de planos at o
momento. Novos planos inseridos, contudo, no sero visualizados pelos jogadores
automticos
recm-criados. Dessa forma, ser possvel a comparao entre jogadores
automticos criados em momentos diferentes do round. Se a biblioteca de planos estiver

sendo til para a aprendizagem do jogador automtico, a velocidade de evoluo dos novos
55
jogadores automticos deve ser maior do que a dos jogadores automticos antigos. Define-se
a velocidade de evoluo de um jogador automtico atravs da quantidade de networth que o
jogador automtico cresce para uma quantidade fixa de turnos ou aes realizadas.
3. 6
CONSIDERAES FINAIS
Esse captulo descreveu os pormenores da implementao do jogador automtico
construdo para interagir com jogos de estratgia baseados em turnos. Descreveu-se, tambm,
sua aplicao ao jogo Promisance. No prximo captulo so descritos os resultados obtidos.
56
RESULTADOS
Esta seo apresenta alguns resultados obtidos atravs da aplicao da arquitetura

proposta em um jogo online multiplayer real com um grupo de teste. O primeiro teste,
realizado em Agosto de 2006 descrito inicialmente. Atravs deste teste foi possvel
compreender melhor do funcionamento do jogo alvo e, alm disso, foram obtidas
interessantes concluses referentes ao comportamento do grupo.
O segundo teste, realizado no final de Janeiro e incio de Fevereiro de 2007, nos
permitiu verificar a adequabilidade dos jogadores automticos resoluo do problema e a
credibilidade dos jogadores automticos em relao ao comportamento humano. Por fim, um
terceiro teste envolveu uma pequena quantidade de jogadores automticos e uma quantidade
maior de jogadores humanos. Neste caso, observou-se que os jogadores automticos no se
destacaram no ambiente sendo indistinguveis dos humanos.
4. 1
RESULTADOS DO PRIMEIRO TESTE

No teste realizado, com um grupo limitado a sete jogadores humanos, focalizou-se o
processo de captura dos planos. Foram obtidos 5.133 pares estado-ao em um perodo de
jogo de trs semanas. O tamanho da janela de subplanos foi o tamanho da prpria seo de
jogo, ou seja, todos os pares entre um login e um logout aos jogadores humanos. Com esse
tamanho de janela de subplanos no houve a necessidade de uma base temporria, conforme
descrito na seo 3.1.1.
A indexao do estado, objetivando a recuperao do plano, foi feita utilizando-se as
seguintes caractersticas: dinheiro, networth (valor do imprio), quantidade de terra,
quantidade de magia, quantidade de comida e felicidade geral do povo. Com estas
caractersticas pode-se extrair 2.357 estados diferentes pelos quais os jogadores passaram.
Esse nmero j considera a normalizao dos valores das variveis de estados aplicando um
filtro nestas caractersticas atravs da retirada dos dois caracteres menos significativos.
Quanto s aes associadas ao estado, foram capturadas dezesseis aes diferentes dentre
aes de gerenciamento e tipos de ataque. Cada ao, exceto a alterao na taxa de impostos e
57
a alterao nas propores de produo de cada tipo de armamento, gasta um certo nmero de
turnos. A Tabela 4, a seguir, sumariza as aes que foram mais executadas pelo grupo.
# de execues
938
793
729
474
247
Ao
Ataque padro a outro imprio
Construo
Gerao de dinheiro
Explorao do terreno
Agricultura
Tabela 4- Aes mais executadas pelo grupo.
A informao sobre os planos mais executados permite detectar a necessidade de

separar em planos abstratos e planos concretos. Verificou-se que com o tamanho de janela
utilizado no havia necessidade de efetuar tal separao. Os planos gerados pelos jogadores
humanos so bastante diferentes entre si e nenhum plano caracterizou-se por ter o mesmo
nmero de aes ou o mesmo estado final e estado inicial.
Com estes dados observa-se que o grupo de jogadores, embora impedido de
comunicar-se diretamente, priorizou a execuo de uma ao de ataque, a qual reflete a
necessidade de interao entre os jogadores.
Quanto aos estados mais observveis, encontramos o estado que se caracteriza por ter
valor zero na quantidade de dinheiro. Tal estado ocorreu para mais de um jogador humano ou
jogador automtico e aparentou, inicialmente, ser uma falha do jogo. Posteriormente,
verificou-se que este estado (e outros cujo valor de dinheiro chega a zero) seria gerado pela
inexperincia dos jogadores que gastavam demais seus recursos sem se preocupar com a
gerao de novos recursos. Por fim, tambm foi possvel a utilizao destes recursos como
estratgia de jogo, ou seja, houve casos em que deliberadamente o jogador no tentou
eliminar a falta de dinheiro.
#
55
54
Dinheiro
Networth
12 milhes
Terra
Mana
1,6 milho
9 mil
960 milhes
19 milhes
11 mil
7 milhes
38
33
270 mil
100 mil
200 mil
150 mil
330
250
31
580 milhes
20 milhes
1,2 mil
500
500
7,7
milhes
Tabela 5 - Estados mais observados e caractersticas do estado.
Comida
91 milhes
130
milhes
47 mil
10 mil
140
milhes
58
Este primeiro teste, foi relevante no sentido de entender melhor como um grupo de
jogadores interage permitindo prever o comportamento que seria esperado pelos jogadores
automticos. As tendncias do grupo podem ser utilizadas pelos jogadores automticos
tornando bastante comum a ocorrncia desses estados e das aes citadas em jogadores
automticos. Alm disso, esse teste permitiu a delimitao do tamanho da janela de subplanos
como sendo o prprio tamanho do plano (seo completa entre um login e um logout no jogo)
e a verificao de que no era necessria a separao em planos abstratos e concretos. Tal
separao s seria necessria, portanto, quando existisse uma repetio de estados
significativa.
importante destacar que quanto seleo do plano a ser escolhido, no teste realizado
com o Promisance optou-se pela escolha do plano que maximizasse o networth, que o valor
do imprio, calculado atravs da composio entre o dinheiro e a quantidade de terras. Neste
primeiro teste no houve a interao entre os jogadores automticos e os jogadores humanos.
Entretanto, a ttulo de ilustrao, foi executado um jogador automtico em um
ambiente simulado, ou seja, sem a evoluo caracterstica de um ambiente com jogadores
humanos, com o mesmo conjunto de jogadores humanos. O jogador automtico utilizou os
5.133 pares estado-ao do grupo de jogadores do primeiro teste. Tal jogador foi executado
durante quatro mil turnos, ou seja, uma quantidade maior do que a quantidade de turnos gasta
por um jogador humano individualmente durante o teste sem os jogadores automticos. A
Figura 15 demonstra a evoluo do jogador automtico durante estes turnos. interessante
observar a existncia de um patamar no grfico de dinheiro (Figura 16) que explicita a
utilizao do estado 55, ou similar, citado na Tabela 5. Observa-se que o jogador automtico
segue a tendncia de comportamento do Jogador 1. Isso se deve ao fato que ao chegar num
estado com dinheiro nulo, o jogador automtico procurou executar planos de quem: (1) fosse
semelhante a ele e (2) tivesse uma performance com aumento do networth. interessante
destacar que o Jogador 1 usou a falta de dinheiro como estratgia e o jogador automtico
seguiu essa estratgia, pois possvel aumentar o networth mesmo sem dinheiro.
Clarificando-se: se outro jogador humano tambm casse nessa situao, mas fosse perdendo
em networth, o jogador automtico preferiria sempre a estratgia vencedora, seguindo o estilo
de jogo do Jogador 1.
59
Figura 15 Evoluo do networth comparando o jogador automtico simulado com os melhores jogadores
humanos.
Figura 16 Evoluo do Dinheiro comparando o jogador automtico simulado com os melhores jogadores
humanos.
4. 2
RESULTADOS DOS TESTES DE JANEIRO DE 2007

O segundo teste realizado se limitou a um conjunto de dez jogadores humanos. Neste
teste, realizado durante o perodo de dez dias compreendido entre 27 de janeiro a 5 de

fevereiro, o perfil de usurios semelhante ao do perfil anterior. Este segundo teste destaca-se
por ter sido realizado com os jogadores automticos inseridos no ambiente. Destaca-se que os
jogadores humanos no tinham conhecimento da existncia de jogadores automticos ou da
investigao cientfica que estava sendo realizada. O sistema contou com doze jogadores
automticos com raas diferentes, porm, executados durante os ltimos quatro dias de teste.
Os jogadores automticos eram de raas distintas: quatro humanos, dois elfos, dois anes,
60
dois trolls, e dois elfos negros. Cada raa possui caractersticas diferentes. Essa distribuio
foi escolhida para repetir a distribuio dos jogadores no ambiente do jogo.
No fim deste teste, os jogadores foram informados a cerca da existncia de jogadores
automticos e questionados sobre quem eram os jogadores automticos no ambiente. Para
evitar possveis dedues a partir do nome dos jogadores automticos, os nomes foram
criptografados de maneira diferente para cada jogador. Assim, mesmo conversando com outro
jogador fica dificultada a descoberta de quem um jogador automtico.
Primeiramente, deve ser feita uma anlise das caractersticas do ambiente e uma
comparao com o ambiente anterior. Quanto ao nmero de pares estado-ao, obteve-se
cerca de 3427 pares no total. Cada par identifica uma interao de um jogador com o sistema,
ou seja, a realizao de uma ao, e usado na construo da base de casos. O nmero de
estados nicos obtidos foi de 2135 estados diferentes. Assim como no teste anterior, todos os
pares estado-ao foram transportados para a tabela de planos definitiva no apenas os planos
com maior suporte. Da mesma forma, como a janela para a realizao da recuperao dos
casos de tamanho igual seo de jogo, tambm no existiu a indexao em estados
abstratos, muito menos a base temporria de planos. Quanto representao do estado, as
variveis utilizadas para o matching foram, conforme citado anteriormente: dinheiro, networth
(valor do imprio), quantidade de terra, quantidade de magia, quantidade de comida e
felicidade geral da populao. As demais variveis foram utilizadas no processo de
antecipao de erros.
Semelhante ao teste anterior, a informao sobre os estados e aes mais recorrentes
pode ajudar a caracterizar o comportamento do grupo. Quanto s aes prediletas dos
jogadores, diferentemente do outro grupo, a produo de dinheiro foi tarefa mais executada
conforme a Tabela 6. O contato com os jogadores permitiu descobrir que isso se deve ao fato
desta ao ser interpretada como soluo para a diminuio no dinheiro do imprio.
61
517
467
407
378
179
# de execues
Ao
Produo de dinheiro
Ataque padro a outro imprio
Construo
Explorao do Terreno
Ataque terrestre com catapultas
Tabela 6- Aes mais executadas pelo grupo.
Quanto aos estados mais observveis interessante constatar que o estado com valor
nulo no aparece entre os mais freqentes.
# de
Dinheiro
observaes
116
501 mil
33
100 mil
160 mil
148 mil
300
300
Mil
Mil
19
6,4 milhes
6,1 milhes
8,3 mil
47 mil
18
346 mil
6,2 milhes
8,3 mil
16 mil
15
3,5 milhes
7,6 milhes
5,5 mil
1,4 milhes
Networth
Terra
Mana
Comida
100 mil
10 mil
19,4
milhes
17,5
milhes
70 milhes
Tabela 7 - Estados mais observados e caractersticas do estado.
Das mtricas citadas no captulo anterior (seo 3. 5), primeiro trata-se da evoluo
dos jogadores automticos e sua velocidade de evoluo. Dois parmetros refletem
diretamente no desempenho do jogador automtico: o valor do imprio (networth) e a
quantidade de terras. Tambm se analisa a evoluo do dinheiro do Imprio, pois a prcondio mais importante para a execuo das aes ser bem sucedida.
Figura 17 Evoluo do networth no primeiro dia para os jogadores automticos.
62
Quanto execuo dos jogadores automticos, a bases de casos de todos a mesma.

Mesmo o jogo sendo determinstico a evoluo dos jogadores automticos no idntica pois:
a raa dos jogadores automticos difere e a interao com os outros jogadores automticos
implica em mudanas no estado do jogador. Foram criados um nmero prximo de jogadores
automticos em relao aos jogadores humanos: 12 automticos para 10 humanos.
No primeiro dia de execuo dos jogadores automticos, as primeiras aes
executadas levaram inicialmente a um estado similar at meados da quinta ao. A partir deste
ponto, os jogadores automticos, por serem pertencentes a raas diferentes, responderam s
aes de maneira diferente. Percebe-se, portanto, na Figura 17, o agrupamento de trs
jogadores automticos da raa humana (jogador automtico 1 ao 3). Quanto ao dinheiro e
terra (Figura 18 e 19) fica dentro do previsto a distribuio, principalmente para os jogadores
automticos 5 e 11. Os grficos de ambas as figuras so semelhantes pois pode existir uma
relao proporcional entre Terra e Dinheiro. No caso dos Elfos (Jogador automtico 5), h
uma bonificao na explorao e na renda per capita, impulsionando a quantidade de terras
obtida.
Figura 18 Evoluo do Dinheiro no primeiro dia.
63
Figura 19 Evoluo das terras no primeiro dia.
Sob o prisma de quatro rodadas completas (correspondendo a quatro dias), pode-se

fazer uma comparao entre resultado da execuo dos jogadores automticos e o resultado
das interaes dos jogadores humanos. Nas Figuras 20 e 21 observa-se um agrupamento mais
coeso no caso dos jogadores automticos e uma tendncia mais uniforme de crescimento.
Quanto ao desempenho, o melhor jogador automtico, em quatro dias, alcanou um networth
de quase 14 milhes, enquanto dois jogadores humanos ultrapassaram a barreira dos 15
milhes. interessante, portanto, destacar, que o comportamento dos jogadores automticos
assumiu um valor mdio em relao ao grupo. Nem se destacou demais, nem se encontrou
entre os piores. O povoamento do ranking, inclusive, projetou os jogadores automticos s
posies medianas do ranking, nunca chegando a ameaar a liderana.
Figura 20 Evoluo do networth do primeiro ao quarto dia para os jogadores automticos.
64
Figura 21 Evoluo do networth do primeiro ao quarto dia para os jogadores humanos.
Tambm foi implementada uma simulao quanto evoluo do jogador automtico

alm do tempo previsto, ou seja, sem o suporte de uma base de casos com quantidade de
planos coerente com a quantidade de iteraes executadas. Nesse caso, ilustrado nas Figuras
22 e 23, interessante constatar que o networth do jogador automtico cresceu rapidamente,
por sempre procurar a melhor estratgia, mas ficou estagnado em um patamar fixo, que,
embora fosse ainda com um networth maior que a maioria dos outros jogadores automticos,
ainda assim, parece esperar pela chegada dos outros, ou seja, permanece estvel em um
patamar constante pois no tinha mais como evoluir devido a inexistncia de planos de
jogadores humanos que tivessem passado por aquela situao.
Esse comportamento anlogo ao comportamento tpico em jogos de carro para
Fliperama, nos quais o jogador automtico vai mais devagar de maneira imperceptvel para
dar chance ao jogador humano de alcan-lo. , portanto, uma tcnica de estupidez
artificial [LID2004] que surgiu de maneira emergente. Provavelmente, conforme os outros
jogadores humanos fossem alcanando o estado do jogador automtico existiriam estados os
quais o jogador automtico copiaria para melhorar seu desempenho.
65
Figura 22 Evoluo do networth para um jogador automtico simulado.
Figura 23 Evoluo do dinheiro para um jogador automtico simulado.
Ainda dentro do escopo de comportamentos emergentes ou inesperados ao jogador

automtico e em relao aos planos de reparo gerados pelos jogadores automticos tambm h
situaes nas quais o jogador automtico implementa aes que parecem ser falhas, mas, na
verdade, deixam o jogador automtico mais interessante. Por exemplo, um erro ocorreu
quando o jogador automtico tentou executar uma ao de ataque em relao a um imprio
mais fraco. A Camada Reparadora anotou as diferenas em relao ao imprio que havia
atacado o imprio de maneira bem sucedida. Dentre essas diferenas, destaca-se uma
estratgia que consiste em diminuir o nmero de magos. Tal estratgia enfraquece as foras
do imprio do jogador automtico, mas, pelo menos, permite que ele esteja apto a atacar um
imprio no muito forte.
66
Outro exemplo de estratgia emergente que foi descoberta pelo jogador automtico foi
relacionado a pr-requisitos para a realizao de magias. A realizao de uma magia implica
na necessidade de uma quantidade mnima de poder mgico. Era esperada a utilizao de uma
estratgia de reparo que aumentasse a quantidade de poder mgico, por exemplo, a construo
de escolas de magia. Entretanto, as aes que foram escolhidas pelo jogador automtico eram
aes que sempre aumentavam o lucro esperado pelo imprio (diferena entre o que gasto e
o que arrecadado), como, por exemplo, a construo de reas comerciais. Percebeu-se que o
aumento do lucro, proporcionava um aumento na populao e no nmero de magos o que,
conseqentemente, gerava um aumento no poder mgico do imprio.
Os resultados descritos limitam-se a apresentar uma anlise quantitativa da evoluo
do jogador automtico. essencial, tambm, apresentar uma anlise qualitativa atravs do
questionamento aos jogadores sobre quem so os jogadores automticos. De maneira similar
ao Teste de Turing, os jogadores humanos foram estimulados a responderem quais imprios
so jogadores automticos no fim do perodo de testes. Dos dez jogadores ativos, quatro
responderam pesquisa.
O primeiro jogador constatou a existncia de seis jogadores automticos. Destes,
foram classificados corretamente apenas dois jogadores automticos. Verificando o ranking,
esse jogador sups que os piores jogadores seriam os jogadores automticos.
O segundo jogador, aps tentar atacar diversos imprios no primeiro dia fechou-se em
um regime pacifista, ou seja, no atacou nenhum outro imprio e investiu em defesas. Dessa
forma, no soube responder quais seriam os jogadores automticos por no haver maneira de
diferenci-los. O perfil deste jogador tambm caracterstico em muitos jogos online:
algumas pessoas preferem no interagir com o seu grupo de jogo. Mesmo assim, no se pode
retirar para estes jogadores a importncia de estarem inseridos em um ambiente bem povoado:
o jogador pode usar o ranking para poder comparar sua performance com a de outros
jogadores e sentir-se estimulado e desafiado a continuar a jogar e vencer seus adversrios. E,
o ranking manteve-se coerente, doutra forma o jogador poderia perceber mudanas bruscas e
irreais caso o jogador automtico no fosse crvel.
O terceiro jogador sups que trs outros jogadores humanos fossem jogadores
automticos. Sua justificativa para a escolha de cada jogador foram os ataques mal sucedidos
que recebeu e com os horrios de jogo singulares de um dos jogadores automticos. Um ponto
67
pode ser retirado desta explicao: primeiramente, a IA, nos jogos tradicionais, ainda
associada a um comportamento diferente ao de um grupo de jogadores. Nos testes
implementados, como os jogadores automticos imitaram o comportamento mdio do grupo,
as falhas tambm ficaram na mdia do esperado. Ou seja, o nmero de sucessos e de falhas
nas interaes entre jogadores automticos e humanos deve ser compatvel.
O quarto jogador escolheu dezesseis candidatos a jogador automtico na lista de vinte
e duas opes (doze automticos e dez humanos) disponibilizada. Destes dezesseis, onze eram
realmente os jogadores automticos. Assim, o jogador tambm no conseguiu distinguir
corretamente humanos e jogadores automticos, pois acabou escolhendo a maioria dos
jogadores presentes no sistema, deixando de fora apenas os mais bem sucedidos no ranking.
Novamente, o jogador humano tem a expectativa que os jogadores automticos tenham
sempre uma performance pior que a dos jogadores humanos.
4. 3
RESULTADO DOS TESTES DE FEVEREIRO DE 2007

No ltimo conjunto de testes realizado seis jogadores automticos interagiram com
vinte e cinco jogadores humanos, gerando um conjunto de 11.000 pares-estado ao

capturados em um total de 700 planos. Alm da j esperada evoluo semelhante dos
jogadores autoimticos, conforme se pode visualizar na Figura 24, tambm foi feito teste no
sentido de comparar a performance de um jogador automtico usando antecipao de erros e
um jogador automtico que no a utilizou. Neste teste, mostrado na Figura 25, observou-se
que o jogador automtico utilizando estratgias de correo faz menos iteraes e obtm um
resultado semelhante de networth.
Quanto ao Teste de Turing realizado, oito jogadores humanos responderam pesquisa,
indicando cinco possveis jogadores automticos. Novamente, foi feita a suposio que os
piores e os melhores jogadores no ranking eram automticos e em mdia a taxa de acerto foi
de 25%.
68
Figura 24 Evoluo do networth dos jogadores automticos no terceiro round.
Figura 25 Comparao entre jogador com e sem antecipao de erros.
4. 4
CONSIDERAES FINAIS
Este captulo apresentou os resultados obtidos. Destaca-se a adaptao do jogador
automtico frente ao ambiente, comportando-se conforme o perfil dos jogadores. Tal

adaptao implementa um balanceamento emergente dentro do jogo. Ou seja, a dificuldade se
adaptou ao grupo de maneira no esperada e no previsvel. Observa-se, tambm, o
espalhamento uniforme dos jogadores automticos em relao ao ranking. Rankings das
rodadas 2 e 3 esto disponveis em anexo.
69
Tambm encorajador o resultado obtido no Teste de Turing. No foi possvel aos

jogadores, dentro sistema, distinguir quem era um jogador automtico e quem era um jogador
humano. Na prxima seo, faz-se a reviso do exposto e o fechamento com possveis
propostas de continuidade deste trabalho.
70
CONCLUSES E TRABALHOS FUTUROS
O presente trabalho apresentou uma srie de contribuies relevantes no apenas para

a rea de IA para Jogos de Entretenimento. Em primeiro lugar, discutiu-se e aplicou-se com
sucesso tcnicas de PBC em um jogo de estratgia baseado em web. Assim sendo, to
importante quanto o teste da adequabilidade da tcnica em um jogo, tambm se pode afirmar
que um sistema de PBC teve sucesso em um ambiente multiusurio. Dessa forma, outros tipos
de sites poderiam ser beneficiados com a aplicao de PBC no modelo de tratamento e
representao dos casos trabalhado, o qual revela uma preocupao em seguir o modelo de
comportamento do usurio. Por exemplo, pode-se estender o modelo para permitir o
povoamento de mundos virtuais como sites de relacionamento e ARGs, por exemplo.
Outra contribuio foi a implementao do preenchimento da base de estratgias de
reparo por parte da Camada Reparadora. Alm de permitir por parte do jogador automtico
jogador a possibilidade de antecipar erros e evit-los atravs da chamada de planos que
reparem o erro, o conhecimento armazenado por essa camada tambm permitiu descobrir
relaes implcitas entre diferentes parmetros. Tais relaes j podem servir de auxlio para
um especialista gerar uma rede de dependncias semelhante da Figura 6, explicitando o
conhecimento que est oculto. O jogador automtico pode, portanto, ter um papel de
facilitador na descoberta de relaes dentro do sistema.
Alm do especialista, mesmo o jogador comum poderia se beneficiar desse
conhecimento. Podem-se vislumbrar trs abordagens possveis: i) um agente assistente pode
servir de conselheiro e sugerir ao jogador qual a melhor ao a ser tomada conforme o estado
do imprio, ii) utilizando a informao de erros, o assistente poderia avisar, antes do jogador
realizar uma ao, que possivelmente ela seria mal sucedida e sugerir uma estratgia de
reparo, iii) por fim, o assistente poderia apenas responder ao jogador como fazer para
aumentar ou diminuir um certo parmetro de seu imprio a partir das estratgias de reparo
bem sucedidas. Esse agente conselheiro fica como uma possvel diretiva futura. Entretanto, a
utilizao de um assistente neste estilo pode abrir o questionamento por parte dos outros
jogadores que o uso de um assistente uma forma de trapaa.
71
Quanto ao comportamento apresentado pelos jogadores automticos obtiveram-se

resultados encorajadores. O jogador automtico segue a tendncia do grupo gerador da base
de casos, ou seja, apresenta um crescimento com velocidade coerente com a velocidade do
grupo. Dessa maneira, cumpre-se a expectativa do jogador em interagir com um adversrio
semelhante a ele mesmo. interessante destacar o teste realizado em um ambiente simulado
no qual o jogador automtico cresce at um patamar e, posteriormente tem seu desempenho
piorado devido a inexistncia de planos que possuam estados semelhantes ao estado atual do
jogador automtico.
Quanto ao Teste de Turing, ou seja, o questionamento subjetivo aos jogadores
humanos sobre quem seriam os jogadores automticos, observou-se que no foi possvel ser
feita essa diferenciao. O jogador automtico desenvolvido, portanto, foi bem sucedido em
apresentar um comportamento crvel em relao ao esperado para um jogador humano,
ficando indiscernvel dentro do universo dos jogadores.
Para estimular a interao entre os jogadores automticos e humanos, como trabalho
futuro, seria possvel e desejvel a implementao de um jogador automtico com habilidade
em negociao e participao de alianas de jogadores automticos com seres humanos. Tal
jogador automtico, destaca-se, no necessariamente envolve tcnicas de processamento de
linguagem natural. Poder-se-ia, por exemplo, criar uma interface de comunicao neutra
responsvel por limitar a interao entre os jogadores humanos e automticos.
A arquitetura desenvolvida genrica o suficiente permitindo sua aplicao em outro
jogo semelhante apenas com redefinies das aes e variveis de estado, a captura dos
planos e um servio que faa uma interface de execuo com o jogo. Alternativas de jogos
online para futuros testes no faltam, conforme verifica-se no Anexo 3.
importante destacar a importncia do presente trabalho principalmente para os jogos
com menos jogadores. Embora os grandes jogos online sejam responsveis pela maior parte
dos jogadores, cada vez mais comum a criao de nichos de jogadores com interesses por
jogos diferentes. Seguindo a tendncia atual na web [AND2006], a contribuio econmica
desses nichos poder ser relevante no mercado de jogos. Deve-se salientar, porm, que o
requisito para um jogo ser bem sucedido na aplicao do Planejamento a pouca integrao
entre subplanos. Jogos que envolvam puzzles, por exemplo, no so uma boa escolha.
72
Um outro trabalho futuro de possvel valor seria a comparao da tcnica baseada em

RBC com alguma abordagem hierrquica semelhante aplicada no Bridge Baron [SMI1998].
O Promisance, e os jogos de sua famlia permitem a especificao de estratgias. Tais
estratgias poderiam ser utilizadas para alimentar um planejador hierrquico.
Por fim, tambm parece interessante a utilizao de reconhecimento de planos no
apenas para copiar os estilos do jogador, mas tambm para manter um modelo mental dos
adversrios. Essa implementao envolveria apenas a modificao da representao do
estado, armazenando tambm informaes sobre o adversrio. Embora o jogador automtico
no possa ter acesso a todas as variveis referentes ao jogador, ele pode manter uma
representao simplificada do usurio. Tal representao pode auxiliar na tomada das
decises de ataque e defesa.
73
LUDOGRAFIA
ADVENTURE. Will Crowther. 1974.

AIRFIGHT. Kevin Gorey. 1974.
AIR WARRIOR. GEnie. Kesmai.1986.
AVATAR. 1978.
BARREN REALMS ELITE. 1990.
BLACK & WHITE. Eletronic Arts Games. Lionhead Studios. 2001.
CITY OF HEROES. NCSoft. Cryptic Studios. 2004.
CLUB CARIBE. QuantumLink. LucasFilm. 1988.
CREATURES. Millenium Interactive. Mindscape Group. 1996.
DECWAR.
DIPLOMACY.
DND. Daniel Lawrence; Gary Whisenhunt; Ray Wood . 1974.
DOOM. Activision. iD Software. 1993.
DOGFIGHT. 1973.
DRAGONS GATE. 1991.
EVE ONLINE. CCP Games. CCP Games. 2003.
FALCONS EYE.
EMPIRE. John Daleske; Silas Warner. 1974.
EVERQUEST. Sony Online Entertainment. Sony Online Entertainment. 1999.
EVERQUEST II. Sony Online Entertainment. Sony Online Entertainment. 2004.
FULL SPECTRUM WARRIOR. THC Inc. Pandemic Studios. 2004.
74
GEMSTONE II. 1988.

HABITAT. QuantumLink. LucasFilm. 1985.
HUNT THE WUMPUS. Gregory Yob. 1972.
ISLANDS OF KESMAI. Compuserve. Kesmai. 1984.
LEGEND OF RED DRAGON. Seth Able. 1989.
LINEAGE. NCSoft. NCSoft. 2003.
MATRIX ONLINE. Sega. Monolith Productions. 2005.
MAZE WAR. Steve Colley. 1973.
MEGA WARS I.
MEGA WARS III.
MERIDIAN 59. 3DO Company. 3DO Studios. 1996.
MINES OF MORIA. Chuck Miller. 1974.
MUD. Richard Bartle, Roy Trubshaw. 1978.
NEVERWINTER NIGHTS. QuantumLink. Stormfront Studios. 1991.
OUBLIETTE. Jim Schwaiger. 1977.
PAC-MAN. Midway. Namco. 1979.
QUAKE. Activision. Id Software. 1996.
RABBIT JACKS CASINO. QuantumLink. Rob Fulop. 1986.
RAGNAROK ONLINE. Level Up Games. Gravity Corp. 2002.
RIM WORLDS WAR. GEnie. Jessica Mulligan. 1986.
SIM CITY. Eletronic Arts. Maxis. 1989.
SOLAR REALMS ELITE. Amit Patel. 1990.
SPACE INVADERS. Midway. Taito. 1978.
SPACEWAR!. Steve Russell; Dan Edwards; Alan Kotok; Peter Sampson; Martin
Graetz. 1962.
75
SPASIM. Jim Bowery. 1974.

STAR TRADER. Dave Kaufman. 1974.
STAR TREK. Mike Mayfield. 1972.
STAR WARS GALAXIES. LucasArts. Sony Online Entertainment. 2003.
STELLAR WARRIOR. GEnie. Kesmai. 1985.
TENNIS FOR TWO. Willy Higinbothan. 1958.
TRADE WARS. Chris Sherrick. 1984.
THE SIMS. Eletronic Arts Games. Maxis. 2000.
THE SIMS ONLINE. Eletronic Arts Games. Maxis. 2002.
Unreal Tournment
UNREAL TOURNMENT. GT Interactive. Epic Games. 1999.
ULTIMA ONLINE. Eletronic Arts. Origin Systems. 1997.
USURPER. 1993.
UTOPIA. Swirve. Disponvel em: http://games.swirve.com/utopia/
WARCRAFT. Blizzard Entertainment. 1994.
WARCRAFT II. Blizzard Entertainment. 1995.
WORLD OF WARCRAFT. Vivendi Universal. Blizzard Entertainment. 2004.
ZORK. Tim Anderson, Marc Blank, Bruce Daniels, Dave Lebling. 1977.
76
REFERNCIAS BIBLIOGRFICAS
[AA1994] AAMODT, A.; PLAZA, E. Case-Based Reasoning: Foundational Issues,

Methodological Variations and System Approaches. AICom - Artificial
Intelligence Communications, IOS Press,Vol. 7, N. 1, 1994, p. 39-59
[AND2006] ANDERSON, C. A Cauda Longa: Do mercado de massa para o mercado
de nicho. Rio de Janeiro, Elsevier, 2006.
[AHA2005] AHA, D.W., MOLINEAUX, M.; PONSEN, M. Learning to win: Casebased plan selection in a real-time strategy game. In: ICCBR - Proceedings of the
Sixth International Conference on Case-Based Reasoning, 2005, p. 5-20, Chicago,
IL: Springer.
[AHL1977] AHL, D.H. What to do after you hit RETURN: A computer games book
from People'
s Computer Company. Hayden Book Company. 1977.
[AVI2004] AVILA, H. M.; FISHER, T. Strategic Planning for Unreal Tournment
Bots.
Workshop
on Challenges
in
Game
AI,
2004.
disponvel
em:
http://www.cse.lehigh.edu/%7Emunoz/Publications/AAAIWS04Munozh.PDF. Acesso
em: 26/03/2005.
[BAI1986] BAIN, W. M. Case-Based Reasoning: A Computer Model of Subjective
Assessment. Ph.D. Thesis, Yale University, New Haven, CT, 1986.
[BER1998] BERGMANN, R.; AVILA, H. M.; VELOSO, M. et al. Case-Based
Reasoning applied to Planning Tasks. In: LENZ, M., BARTSCH-SPOERL, B.,
Burkhard, H. D.; WESS, S. Case-Based Reasonig Technology from Foundations
to Applications, Berlim, Springer, 1998. p. 166-199.
[BIG1998] BIGUS, J. P.; BIGUS, J. Constructing intelligent agents with Java: a
programmers guide to smarter applications. New York: Wiley, 1998.
[BOG2004] BOGOST, IAN. Asynchronous Multiplay: Futures for Casual Multiplayer
Experience. Paper presented at the Other Players Conference. Center for
Computer Games Research, IT University of Copenhagen, Denmark, 2004.
Disponvel em: http://itu.dk/op/proceedings.htm. Acesso em: 15/5/2005.
77
[BOW2001] BOWERY, J. Spasim (1974): The First First-Person-Shooter 3D Multiplayer

Networked Game. Disponvel em: http://www.geocities.com/jim_bowery/spasim.html .
Acesso em: 16/4/2005.
[BRO1991] BROOKS, R.A. How to build complete creatures rather than isolated
cognitive simulators. In: VANLEHN, K. Architectures for Intelligence: The
Twenty-second Carnegie Mellon Symposium on Cognition, New Jersey,
Hillsdale, Lawrence Erlbaum Assosiates, 1991, p. 225-239.
[BURO2003] BURO, M.; FURTACK, T. RTS Games as a Test-Bed for Real-Time AI
Research. In: CHEN, K. et al. Proceedings of the 7th Joint Conference on
Information Science, Alberta, Edmonton, 2003, p. 481484.
[BUR1995]
BURKA,
L.
P.
The
MUDLine.
Disponvel
em:
http://www.linnaean.org/~lpb/muddex/mudline.html. Acesso em: 16/3/2005.

[CHE2004] CHENG, D. C.; THAWONMAS, R. Case-Based Plan Recognition For
Real Time Strategy Games. In: Proceedings of the Fifth Game-On International
Conference, Reading, UK, 2004, p. 36-40.
[COS2000] COSTIKYAN, G. The Future of Online Games. In: Creative Good. 2000.
Disponvel em: http://www.costik.com/ogrfinal.zip . Acesso em: 12/1/2005.
[COX2002] COX, M. T.; MUOZ-AVILA, H.; BERGMANN, R. Planning in CaseBased Reasoning: Commentary. 2002.
[EHR2002] EHRENREICH, R. Legend of the Red Dragon Case History. School
Report,
2002.
Disponvel
em:
http://www.bbsdocumentary.com/library/PROGRAMS/DOORS/LORD/ehrenreic
h.pdf. Acesso em: 9/1/2005.
[EVA2001] EVANS, R. The Future of AI in Games: A personal view. Game
Developer
Magazine,
Agosto
de
2001.
Disponvel
em:
http://www.gameai.com/blackandwhite.html. Acesso em: 15/3/2005.

[FAG2003] FAGAN, M.; CUNNINGHAM, P. Case-Based Plan Recognition in
Computer
Games.
In:
ICCBR,
2003.
Disponvel
em:
http://www.cs.tcd.ie/publications/tech-reports/reports.03/TCD-CS-2003-01.pdf
Acesso em: 14/3/2005.
78
[FAS1996] FASCIANO, M. J. Real Time Case Based Reasoning in a Complex World.

Technical Report TR-9605, University of Chicago. 1996. Disponvel em:
http://www.cs.uchicago.edu/files/tr_authentic/TR-96-05.ps.
Acesso
em:
15/3/2005.
[FIK1971] FIKES, R. E., NILSSON, N. J. STRIPS: A New Approach to the
Application of Theorem Proving to Problem Solving. Artificial Intelligence, 2(34), 1971.
[FRE2002] FREEBURG, N. A Heuristic Search Algorithm for Empire-Based Games.
CS 470 Project, 2002.
[FR2000] FRNKRANZ, J. Machine Learning in Games: a Survey. Nova Science
Publishers, 2000, p. 11-59.
[GEF2002] GEFFNER, H. Perspectives on Artificial Intelligence Planning. In:
Eighteenth National Conference on Artificial Intelligence, 2002, p. 1013-1023.
Disponvel em: http://www.tecn.upf.es/%7Ehgeffner/html/reports/perspectives.ps.
Acesso em: 15/6/2006.
[GHA2004] GHALLAB, M. NAU, D. TRAVERSO, P. Automated Planning: Theory
and Practice. Morgan Kauffmann Publishers, 2004.
[GOO1989] GOODMAN, M. CBR in Battle Planning. In: Proceedings of the Second
Workshop on Case-Based Reasoning, Pensacola Beach, FL, US. 1989. p. 264269.
[GOL2001] GOLDBERG, M. The History of Computer Gaming, 2001. Disponvel
em:
http://www.classicgaming.com/features/articles/computergaminghistory/.
Acesso em: 16/3/2005.

[HAM1989] HAMMOND, K. J. Case-Based Planning: Viewing Planning as a
Memory Task. San Diego: Academic Press, 1989.
[HAM1994] HAMMOND, K. J. Case-Based Planning: A Framework for Planning
from Experience, In: Cognitive Science. Vol. 14. 1994. p. 385-443.
79
[HAR1968] HART, P. E.; NILSSON, N. J.; RAPHAEL, B. A Formal Basis for the
Heuristic Determination of Minimum Cost Paths. IEEE Transactions on Systems
Science and Cybernetics SSC4. 1968, Vol 2., p 100-107.
[HUN2005] HUNTER, W. The Dot Eaters - Player4 Stage1 - Classic Video Game
History. 2005. Disponvel em: http://www.emuunlim.com/doteaters/ . Acesso em:
11/1/2005.
[ISL2002] ISLA , D.; BLUMBERG, B. New Challenges for Character-Based AI for
Games. AAAI Spring Symposium on AI and Interactive Entertainment, Palo Alto,
CA, 2002, p. 41-45.
[KEN2003] KENT, S. L. Alternate Reality: The History of Massively Multiplayer Games.
2003. Disponvel em: http://archive.gamespy.com/amdmmog/week1/index.shtml.
Acesso em: 15/3/2005.
[KER2003] KERKEZ, B. Incremental Case-Based Plan Recognition With Incomplete
Plan Libraries. 2003. Disponvel em:
http://personal.ashland.edu/~bkerkez/Research/public/BKerkez_PhD_Dissertation_WSU_2003.pdf
Acesso em: 16/3/2005.
[KLA2005] KLASTRUP, L. Towards a Poetics of Virtual Worlds - Ph.D.thesis by

Lisbeth Klastrup. 2005. Disponvel em: http://www.klastrup.dk/thesis.htm.
Acesso em: 15/3/2005.
[KOL1993] KOLODNER, J. Case-Based Reasoning. So Mateo: Kaufmann
Publishers, Inc., 1993.
[KOS2002] KOSTER, R. Raph'
s Page: Online World Timeline. 2002. Disponvel em:
http://www.legendmud.org/raph/gaming/mudtimeline.html. Acesso em: 9/1/2005.
[LAIRD2000] LAIRD, J. E.; VAN LENT, M. Human-Level AI'
s Killer Application:
Computer Game AI. Proceedings of AAAI 2000, Austin, TX, Agosto de 2000. p.
1171-1178.
[LEB1979] LEBLING, P. D.; BLANK, M. S.; ANDERSON, T. A. Zork: A
Computarized Fantasy Simulation Game. IEEE Computer. 12(4). 1979. p. 51-59.
[LID2004] LIDEN, L. Artificial Stupidity: The Art of Intentional Mistakes. In: AI
Game Programming Wisdom II. Charles River Media. Rockland. 2004.
80
[MCD1998] MCDERMOTT, D., et al. PDDL The Planning Domain Definition

Language. 1998.
[MAR2001] MARKOWITZ, M. Space Games of Fame - About the Games. 2001.
Disponvel em: http://www3.sympatico.ca/maury/games/space. Acesso em:
12/1/2005.
[MAR2006] MARTIN, A. Alternate Reality Games White Paper : The IGDA
Alternate Reality Games SIG. 2006. Disponvel em:
http://igda.org/arg/resources/IGDA-AlternateRealityGames-Whitepaper-2006.pdf.
Acesso em: 15/1/2007.
[MIL2005] MILLER, A. AI Roundup. 2005. Disponvel em:
http://www.gamedev.net/columns/events/coverage/feature.asp?feature_id=77. Acesso
em: 22/3/2005.
[MOC2002] MOCK, K. Hierarchical Heuristic Search Techniques for Empire-Based
Games. In: International Conference on Artificial Intelligence, Las Vegas, NV,
2002.
[MOR1990] MORNINGSTAR, C.; FARMER, F. R. The lessons of Lucasfilm'
s
habitat. In BENEDIKT, M. Cyberspace: First steps Cambridge, MA: MIT Press,
1990, p. 273-302.
[MUL1999] MULLIGAN, J. GateCentral: Ultima: Timeline1. 1999. Disponvel em:
http://www.gatecentral.com/shared_docs/Timeline1.html. Acesso em: 11/1/2005.
[NEW1972] NEWELL, A.; SIMON H. A. Human Problem Solving. Englewood
Cliffs. Prentice Hall, 1972.
[ORK2004] ORKIN, J. Symbolic Representation of Game World State: Toward RealTime Planning in Games. AAAI Fall Symposium, Perth, Australia, 2004, p. 4146.
[PAT2005] PATEL, A. Solar Realms Elite 0.995: Documentation. Disponvel em:
http://www-cs-students.stanford.edu/~amitp/Articles/SRE-Documentation.html.
Acesso em: 19/3/2005.
81
[PRI2003] PRITCHETT, J. History of Trade Wars Variations. Disponvel em:

http://www.eisonline.com/twhistory/. Acesso em: 9/2/2005.
[QUI1986] QUINLAN, J. Induction of decision trees. Machine Learning, 1986, Vol. 1
p. 81106.
[RAO1995] RAO A. S.; GEORGEFF, M. BDI Agents: from theory to practice. In:
Proceedings of the First International Conference on Multi-Agent Systems
(ICMAS-95), San Francisco, CA, 1995, p. 312319.
[RABIN2004] RABIN, S. AI Game Programming Wisdom II. Charles River Media.
Rockland, 2004.
[RIE1983] RIESBECK, C. K. Knowledge Reorganization and Reasoning Style.
Technical Report. YALEU/DCS/RR 270. Yale University. 1983.
[RIE1989] RIESBECK, C. K.; SCHANK, R. C. Inside Case-Based Reasoning.
Lawrence Erlbaum, 1989.
[RUS1995] RUSSELL, S.; NORVIG, P. Artificial Intelligence: A Modern Approach.
Prentice Hall. 1995.
[SAM1959] A. L. Samuel. Some Studies in Machine Learning using the Game of
Checkers. IBM Journal of Research and Development, 1959, 3(3), p. 210-229.
[SCH1982] SCHANK, R. C. Dynamic Memory: A Theory of Learning in Computers
and People. Cambridge University Press, 1982.
[SCH2001] SCHAEFFER, J. A Gamut of Games. AI Magazine, 2001, p. 30-46.
[SHA1950] SHANNON, C. E., Programming a computer for playing chess,
Philosophical Magazine Vol. 41, 1950, 256-275
[SHA2002] SHAPIRO, A.; FUCHS, G.; LEVINSON, R. Learning Game Strategy
Using Pattern-Weights and Self-Play. In: International Conference on Computers
and Games, Edmond, Canada, 2002, p. 42-60.
[SMI1998] SMITH, S. J. J.; NAU, D. S.; THROOP, T. Computer Bridge: A Big Win
for AI Planning. AI Magazine, 1998, p. 93-105.
82
[SMY1993] SMYTH, B.; K. M. T. Retrieving Adaptable Cases: The role of

Adaptation Knoledge in Case Retrievals. In Lecture Notes in Articial Intelligence,
837. Springer Verlag, 1993, p. 209-20.
[SPA2001] SPALAZZI, L. A. Survey on Case-Based Planning. Artificial Intelligence
Review, 2001, Vol. 16, Num. 1, p.3-36.
[STU2002] STURTEVANT, N. A Comparison of Algorithms for Multi-player Games.
In: Procedings of the 3o Conference on Computers and Games, 2002, p. 108-122.
[TEL1997] TELLA, J. Seminar on Knowledge Engineering: Planning in Games.
Seminar on Knowledge Engineering - Helsinki University of Technology, 1997.
[THE2002] THE GUARDIAN. Guardian Unlimited | Online | Do not pass Go. 2002.
disponvel em: http://www.guardian.co.uk/online/story/0,3605,817484,00.html.
Acesso em: 1/4/2005.
[THO2004] THOMPSON, G. The aMazing history of Maze Its a small world after all.
DigiBarn Computer Museum/Computer History Museum. Disponvel em:
http://www.digibarn.com/history/04-VCF7-MazeWar/index.html . Acesso em:
15/3/2005.
[TOZ2002] TOZOUR, P. The Evolution of Game AI. AI Programming Wisdom,

Charles River Media, 2002, p. 3-15.
[TUR1950] TURING, A. M. Computing machinery and intelligence. In: Mind: A
Quarterly Review of Psychology and Philosophy, 1950.
[ULA2004] ULAM, P. GOEL, A. JONES, J. Reflection in action: Model-based selfadaptation in game playing agents. In D. Fu & J. Orkin (Eds.) Challenges in
Game Artificial Intelligence: Papers from the AAAI Workshop (TR WS-04-04).
San Jose, CA: AAAI Press., 2004.
[WEN2001] WENDLER, J. KAMINKA, GA. & VELOSO M.. Automatically
improving team cooperation by applying coordination models. In B. Bell & E.
Santos (Eds.) Intent Inference for Collaborative Tasks: Papers from the AAAI Fall
Symposium (TR FS-01-05). Falmouth, MA: AAAI Press. 2001.
83
[WIL1998] WILKE, W. B. Techniques and Knowledge Used for Adaptation during

Case-Based Problem Solving. In: Proceedings of 11th International Conference On
Industrial and Engineering Applications of Artificial Intelligence and Expert
Systems, 1998, p. 497-506.
[WOO1994] WOOLLEY, D. R. Plato: The Emergence of Online Community. 1994.
Disponvel
em:
http://www.thinkofit.com/plato/dwplato.htm.
Acesso
em:15/03/2005.
[WOO2005]
WOODCOCK,
S.
MMOPG
Chart.
2005.
http://www.mmorpgchart.com/ . Acesso em: 16/01/2005.
Disponvel
em:
84
ANEXO 1 TCNICAS DE IA EM JOGOS COMERCIAIS
A tabela sumariza as principais tcnicas de IA aplicadas em jogos comerciais e

exemplos de jogos nas quais elas foram aplicadas.
Os tpicos da primeira coluna foram extrados dos dois primeiros captulos de AI
Game Programming Wisdom 2 [RABIN2004] e refletem as tcnicas de IA sob a tica do
desenvolvedor de jogos.
85
Tcnica
Pathfinding com
A*
Command
Hierarchy
(hierarquia de
comandos)
Dead Reckoning
Principais gneros de
jogo aplicveis
RTS (Real time
strategy - Jogos de
estratgia em tempo
real)
RTS
Exemplos de Jogos (e
desenvolvedores) que
utilizaram cada tcnica
Praticamente todos os
RTSs desde Warcraft
(Blizzard).
Srie Close Combat
(Atom Games)
FPS (First-person
shooter);
jogos de esporte;
jogos online
Quake III (id Games)
Emergent
Behaviour
(comportamento
emergente)
Jogos de corrida;
Jogos de simulao
de vida artificial
Downforce (Smartdog)
Flocking
RTS
FPS
Half-life (Valve);
Unreal (Atari)
Formations
(formaes)
RTS
Empire Earth (Stainless

Stell Studios)
Influence
Mapping
(mapeamento de
influncia)
RTS;
Jogos de simulao
Age of Empires
(Emsemble Studios)
Sim City (Maxis);
Level-of-detail
AI (LOD-AI)
RPG;
RTS;
Jogos de simulao
Republic The
Revolution (Elixir
Studios)
Manager Task
Assignment
(Atribuio de
tarefas por um
gerenciador)
Jogos de esporte
Microsoft Baseball 3D
(Microsoft)
Obstacle
Avoidance
(desvio de
FPS;
RTS
Comentrio
Busca de caminhos atravs de busca
heurstica.
Estratgia para lidar com a IA em
diferentes nveis: do general ao soldado
raso modelados atravs de uma
hierarquia militar.
Mtodo que objetiva a projeo do
movimento futuro de cada agente a partir
de sua velocidade, posio e acelerao.
Em jogos online utilizado para
combater a latncia. Em jogos de esporte
para prever a posio do jogador de
outro time.
Comportamento que no
explicitamente programado mas emerge
devido a interao de comportamentos
mais simples. Flocking o exemplo
clssico de comportamento emergente.
Tcnica inserida em Emergent
Behaviour e responsvel pelo
movimento de grupos de criaturas
atravs da utilizao de regras simples.
Tcnica que objetiva mimetizar as
formaes militares. Diferencia-se de
flocking pois cada unidade guiada a
partir de um objetivo especfico a partir
de sua hierarquia e posio.
Mapeamento de influncia um mtodo
de visualizao da distribuio do poder
em um espao a partir de uma
representao bidimensional que reflete
a influncia de cada unidade na clula
que est contida e em seus vizinhos.
Variao na freqncia de atualizao
das computaes realizadas pela IA
conforme a proximidade do jogador. Por
exemplo, se o personagem no est
sendo visto pelo jogador, a sua IA pode
ser atualizada apenas quando o resultado
for perceptvel.
O gerenciamento de tarefas considera,
para a resoluo de um problema, um
conjunto de tarefas e um grupo de
agentes. Um gerenciador centralizado
prioriza as tarefas e as distribui ao
melhor candidato para resolver cada
tarefa.
Enquanto algoritmos de pathfinding
utilizando A* encaixam em ambientes
estticos, nos jogos os ambientes, muitas
86
obstculos)
Scripting
Todos os gneros
Black & White

(Lionheart);
Half-Life II (Valve);
Monkey Island 4
(LucasArts).
FSM - FiniteState machines

(mquinas de
estado)
Todos os gneros
Half-Life (Valve)
Stack-based
State Machine
tambm
conhecido como
push-down
automata
Subsumption
Architecture
Todos os gneros
principalmente FPS e
RTS
Thief: The Dark Project

(Looking Glass
Studios)
FPS;
RTS
Jogos cujo
movimento de uma
unidade no pode
conflitar com os
objetivos de altonvel.
Halo (Bungie)
Halo 2 (Bungie)
RTS
FPS
Empire Earth(Stainless
Stell Studios)
Age Of Empires
(Emsemble Studios)
C&C
Renegade(Westwood
Studios)
Terrain Analysis
vezes so dinmicos e o personagem

deve desviar de obstculos no caminho.
Tcnica que corresponde especificao
dos dados ou da lgica do jogo fora do
cdigo-fonte principal do jogo. Cada
jogo pode ter um nvel de scripting
diferente e quanto mais scriptado
maior o poder do designer no cdigo
do jogo, abrindo a possibilidade, at
mesmo, de criao de IAs extensveis
pelo jogador. Linguagens comuns
utilizadas para a gerao de scripts so
Lua e Python.
Conjunto finito de estados e transies,
com apenas um estado ativo de cada vez.
Cada estado representa, geralmente, um
comportamento. um dos padres de
projeto mais populares na indstria de
jogos.
Extenso FSM que permite o retorno a
um estado pelo qual a mquina j
passou. til para tratar interrupes
momentneas causadas por eventos
externos mquina.
Nesta arquitetura h a separao do
comportamento de um agente em
diversas camadas concorrentes. A
camada mais baixa, e com mais
prioridade, cuida dos comportamentos
mais elementares e as mais altas vo
sendo responsveis por comportamentos
cada vez mais complexos, como, por
exemplo, estratgias de ataque.
Conjunto de mtodos que objetivam a
anlise de terrenos dentro de um jogo
para encontrar locais com elementos
estratgicos como recursos e
emboscadas.
Esta abordagem contrasta com a
determinao destes elementos de forma
fixa pelo editor do mapa.
87
ANEXO 2 DESCRIO DO PROMISANCE
Descrio em formato livre do jogo e a partir do manual original contendo as

principais telas e aes que podem ser feitas pelo usurio. As telas apresentadas so do jogo
reimplementado, j com as adaptaes e simplificao da interface do jogo original.
O jogo original est disponvel em: http://sourceforge.net/projects/promisance/
88
Babel Promisance um Jogo de Gerenciamento de Imprios baseado em turnos.

Ao se cadastrar, o jogador recebe um Imprio online persistente e o objetivo ser fazer com
que o imprio cresa e se destaque no ranking.
Para isso, o jogador pode:
Explorar novas terras;
Construir obras para estimular o comrcio, a emigrao ou, at mesmo a

agricultura;
Atacar outros imprios da vizinhana com suas tropas;
Investir em magos, que tambm podem atacar outros imprios;
E outras atividades.
A tela inicial do jogo apresentada abaixo. As opes disponveis so a criao de um

novo imprio ou entrar no jogo para os jogadores j cadastrados. Os demais links esto
desabilitados.
Ilustrao A1 - Tela Inicial do Jogo.
89
Aps o login, ao jogador so apresentadas as principais caractersticas de seu imprio.

Alm disso, j possvel acessar qualquer uma das funcionalidades laterais. Ou os botes
centrais.
Ilustrao A2 - Tela aps o login.
Na barra superior, so apresentadas as principais informaes sobre o imprio. Tais

informaes so utilizadas no processo de recuperao dos planos como as caractersticas
indexadas:
Turnos: Nmero de turnos que voc possui para utilizar durante o jogo.
Cada ao que voc realiza consome um certo nmero de turnos.
De tempos em tempos o imprio recebe mais turnos;
Dinheiro:
Quantidade
de
dinheiro
que
imprio
possui.
Cada construo ou unidade possui um preo para ser obtida ou para ser
mantida. Se o valor de dinheiro ficar com valor negativo, o imprio est em
crise e nenhuma ao pode ser feita at conseguir torn-lo positivo;
Terra: Acres que cada imprio possui. Cada acre permite que se faa uma
construo. Acres so obtidos atravs de explorao ou atacando outros
imprios.
90
Magia: Poder mgico que o imprio possui. Quanto mais magos, maior o
poder mgico do imprio. Magia utilizada para realizar feitios de ataque.
Cada feitio tem um custo varivel, o qual depende da evoluo do imprio.
Comida: Sacas de comida produzidas nas fazendas e armazenadas em seus

armazns. A cada turno sua populao consome e produz comida. Se a
quantidade de comida consumida for maior que a produo, as pessoas
comeam a morrer ou fugir de seu imprio.
Felicidade: Felicidade geral das pessoas e das tropas. Quanto maior a

felicidade, mais a populao vai produzir. Se a felicidade ficar muito baixa, as
tropas se recusaro a atacar. Impostos muito altos tambm diminuem a
felicidade da populao.
Valor: Valor do imprio em relao aos outros. O objetivo do jogo aumentar

o valor. Assim, quanto maior o imprio, maior seu valor. O clculo do valor
feito atravs do tamanho do imprio e do dinheiro.
As demais caractersticas do imprio no so usadas na recuperao dos planos, mas

algumas delas so usadas no processo de antecipao de erros:
Civis: Quantidade de pessoas que vivem no imprio. Pessoas so necessrias

para produzir dinheiro e pagar impostos. Pessoas necessitam de comida para
sobreviver;
Soldados: Unidade especializada em ataques terrestres. Unidade militar mais

bsica e barata;
Catapultas: Unidade especializada em ataques terrestres mais poderosos que os

soldados;
Avies: Unidade militar especializada em ataques areos;
Navios: Unidade militar especializada em ataques martmos;
Magos: Magos produzem poder mgico para se realizar feitios. Em feitios

ofensivos, quanto maior o nmero de magos, maior a chance do feitio ser
bem-sucedido. Para produzir magos, o imprio deve possuir reas escolares.
Quando os feitios falham, uma parcela dos magos morre;
91
Taxa de impostos: A porcentagem da populao multiplicada pela renda per

capita que vai para os cofres pblicos a cada turno. Para cada 2% acima de
10%, a felicidade mxima da populao cortada em 1%.
Raa: Raa da populao do imprio. Cada raa possui multiplicadores

diferentes para o resultado da execuo das aes. As raas disponveis so:
humanos, elfos, anes, trolls, gnomos, gremlins, orcs, elfos negros e goblins.
Clicando no boto Mais Informaes, outra tela apresenta as demais caractersticas do

imprio, sendo que algumas delas tambm entram no processo de antecipao de erros:
Turnos Usados: Total de turnos j utilizados no gerenciamento de seu imprio

desde o cadastramento do imprio;
Produo Estimada: Tanto fazendas quanto setores no utilizados contribuem

na produo de comida. A produo agrcola estimada uma previso do valor
no prximo turno;
Consumo Estimado: O consumo da comida feito pelos militares, magos e

civis do imprio. Este valor o consumo estimado para o prximo turno;
Lucro: Diferena entre a comida produzida e a comida consumida. Quando

este valor negativo, a populao est passando fome;
Ataques: Nmero de ataques realizados pelas tropas;
Ataques bem sucedidos: Nmero de ataques realizados por suas tropas que
conseguiram ser bem sucedido. Um ataque bem sucedido quando captura
terra do imprio adversrio;
Defesas: Nmero de ataques sofridos por um imprio;
Defesas bem sucedidas: Nmero de ataques sofridos por seu imprio que
foram repelidos;
reas comerciais: reas comerciais estimulam o crescimento da economia do

imprio. Alm de aumentarem a renda per capita da populao tambm
contribuem na gerao de dinheiro;
92
reas residenciais: Nas reas residenciais a populao estimulada a morar.

Embora as pessoas possam se instalar nos setores vazios do imprio, nas reas
residenciais mais pessoas podem morar;
reas militares: reas militares reduzem os custos de armazenamento e

manuteno das tropas. Entretanto, s fazem efeito se o imprio conter, pelo
menos, 30% das reas como reas militares;
reas industriais: A indstria completamente destinada produo de tropas.

A porcentagem de cada tropa produzida, a cada turno, pode ser alterada;
reas escolares: As escolas so destinadas ao treinamento dos magos do

imprio. Outra utilidade das escolas servir de morada e produzir certa
quantidade de mana;
Fazendas: Nas fazendas os gros que produzem a comida do imprio so

cultivados. Quanto mais fazendas, mais comida produzida a cada turno;
Defesa Fronteiria: Cada unidade de defesa fronteiria aumenta em 500 pontos

defensivos a defesa geral do imprio;
Terra no utilizada: Cada construo feita em seu imprio deve ser alocada em
um acre de terra livre. Acres so obtidos atravs de explorao ou de ataques.
Acres livres tambm servem de morada para sua populao, embora de
maneira menos efetiva que as reas residenciais;
Receita esperada: Quantidade estimada de dinheiro que vai para os cofres

pblicos no prximo turno. Depende da populao, da renda per capita, da taxa
de impostos e da felicidade;
Gastos esperados: Quantidade estimada de dinheiro que sai dos cofres pblicos
no prximo turno. Depende dos custos para manter as tropas e da quantidade
de terra que um imprio tem para administrar. Para baixar esse valor, sem
diminuir o nmero de tropas, o imprio deve investir em reas militares;
Lucro esperado: Quantidade estimada de dinheiro que sobra ou falta a cada

turno. Se o valor for negativo, o que faltou retirado do valor total de dinheiro
do imprio;
93
Renda per capita: Representa a quantidade de dinheiro que cada civil gera por
turno. A taxa de impostos uma porcentagem aplicada sobre este valor;
Pontos ofensivos: Indica o valor ofensivo total do imprio, ou seja, uma

estimativa do poder mximo do conjunto das tropas;
Pontos defensivos: Indica o valor defensivo total do imprio, ou seja, uma

estimativa da defesa mxima do conjunto das tropas.
Clicando no boto Alterar Taxa de Impostos, outra tela apresenta a possibilidade de se

alterar a taxa de impostos do imprio. A taxa de impostos a porcentagem da renda per capita
que vai para os cofres pblicos. Tambm influencia na emigrao e imigrao do imprio.
Assim, se os impostos estiverem muito altos sua populao vai fugir. Alm disso, para cada 2
pontos percentuais acima de 10%, a felicidade da populao diminui em 1 ponto percentual.
Clicando no boto Alterar indstria, outra tela apresenta a possibilidade de se alterar as
porcentagens de produo industrial. A produo industrial indica o quanto, a cada turno,
cada unidade produzida em relao ao potencial total de produo. Cada unidade tem um
potencial ofensivo e defensivo diferente. Por exemplo, um navio tem potencial ofensivo cerca
de 7 vezes a mais que um soldado.
Na Figura a seguir mostrada a tela de Vizinhana. Nesta tela o usurio pode interagir
com os imprios controlados por outras pessoas ou por jogadores automticos. Ao clicar sobre
o nome de um imprio, uma caixa de texto permite a escolha de 10 possveis aes dentre
ataques com tropas e ataques mgicos:
Ataque padro: Obtm terra e algumas construes se bem sucedido Diminui

em 8% a felicidade da populao;
Ataque surpresa: Diminui em 18% a felicidade da populao, mas garante um

bnus ofensivo de 25%;
Ataque terrestre: Idntico ao ataque padro. Ataca com catapultas e o

adversrio tambm defende apenas com catapultas.
Ataque areo: Idntico ao ataque padro. Ataca com avies e o adversrio

tambm defende apenas com avies.
94
Ataque martmo: Idntico ao ataque padro. Ataca com navios e o adversrio

tambm defende apenas com navios.
Bola de Fogo: Destri de 1% a 3% das tropas inimigas;
Tufo: Destri 10% da comida do imprio inimigo. Destri 12% do dinheiro

do imprio inimigo;
Tempestade: Acaba com 3% do poder mgico do imprio inimigo;
Terremoto: Inutiliza 3% das construes adversrias. O adversrio deve ter

pelo menos 15 construes de cada para ser atingido;
Assalto: Inutiliza 3% das construes adversrias. O adversrio deve ter pelo

menos 15 construes de cada para ser atingido;
Ilustrao A3 - Vizinhana.
Para impedir que os imprios descubram quem so os jogadores automticos e quem

so os seres humanos, o nome dos imprios criptografado. importante destacar que cada
jogador tem uma viso diferente do seu conjunto de adversrios, ou seja, o nome
criptografado de uma maneira diferente.
95
Todos os ataques realizados so exibidos na tela de Notcias, que permite que se

responda tambm ao ataque.
As funcionalidades de Agricultura, Finanas e Explorao so aes semelhantes.
Quanto primeira, durante os turnos gastos na produo agrcola, a populao vai produzir
25% a mais de do que o normal. Na ao de Finanas, embora as despesas no sejam afetadas,
o imprio produz 25% a mais de receita. E, a explorao a nica maneira de obter setores
livres para o imprio sem ser atravs de um ataque. Cada setor livre pode ser usado para uma
construo. A tela de construo, por fim, permite que se construam reas comerciais,
residenciais, militares, industriais, escolares, agrcolas e defesas nas fronteiras. Cada
construo tem um preo e, conforme j citado, ocupa um setor livre. Agricultura, Finanas,
Explorao e Construo so aes que se caracterizam por um gasto varivel de turnos. Ao
jogador apresentada a evoluo do imprio a cada turno, conforme mostrado abaixo.
Ilustrao A4 Navegao pelos turnos.
96
ANEXO 3 GENEALOGIA E HISTRIA DOS JOGOS ONLINE
Discusso e contextualizao dos principais jogos e marcos referentes histria dos

jogos online. Tal seo importante para reafirmar a importncia dos jogos online tanto em
relao ao mercado quanto em relao academia.
Devido classificao do Promisance como um jogo online multiplayer e a possvel e
desejvel aplicabilidade da metodologia proposta em captulo posterior em problemas e jogos
semelhantes, faz-se necessrio o enquadramento do jogo em relao aos jogos online e,
principalmente, jogos online de gerenciamento de imprio. Tal enquadramento abre a
possibilidade de trabalhos futuros que apliquem as tcnicas de IA propostas em outros jogos e,
principalmente, contextualiza a origem do jogo em questo.
Colocada como anexo, para no destoar do foco da dissertao, a qual se concentra no
aspecto da disciplina da IA e, tambm, por basear-se, principalmente, em referncias online.
97
Um mundo virtual uma representao online persistente que contm a possibilidade

de comunicao sncrona entre usurios e entre o usurio e o mundo com uma infra-estrutura
espacial projetada para ser um universo navegvel [KLA2005]. Diversos mundos virtuais so
jogos online. Tais ambientes so caracterizados pelo objetivo primrio de entreter os usurios
que compartilham o mundo.
Nesta seo, no apenas jogos online multiplayer em um sentido restrito so
contextualizados. As suas influncias e heranas nos jogos em geral tambm merecem
comentrios com o objetivo de expandir a aplicabilidade das tcnicas de IA que esto sendo
propostas em domnios diferentes, como, por exemplo, em jogos de estratgia single-player.
As principais referncias utilizadas para construir essa seo foram as referncias
online: [MUL1999], [KOS2002], [HUN2005], [WOO2005], [MAR2001] e [GOL2001]. Alm
destas, as principais fontes so referenciadas durante o texto para cada era dos jogos online.
Convencionou-se a separao em seis fases distintas, separadas em um tpico cada:
Pr-histria dos jogos online;
A dcada de 70 e os primeiros jogos online;
A pr-histria da indstria de jogos online e sua era de ouro;
Jogos online em BBS;
A exploso dos jogos para computador;
A era moderna dos jogos online: os jogos massivos multiplayer.
interessante observar que cada gerao parece ignorar os eventos da anterior, mal
convencionando os seus marcos. Por exemplo, os jogos para BBS, em algumas fontes, nem
so citados em relao linha do tempo dos jogos online.
Em outro exemplo caracterstico, muitos acreditam que o primeiro jogo online foi
Doom em 1993 por causa do grande sucesso e influncia na indstria de jogos. Isto posto,
surpreendente a existncia de conceitos que so reinventados desde a dcada de 70. No caso
citado, os jogos de tiro de 1 pessoa foram criados em 1973. O objetivo desta seo ,
portanto, estabelecer os jogos online como um tipo de jogo e conceito recorrente e
estabelecido no universo ldico.
98
Pr-histria dos jogos online

Convenciona-se como marco inicial dos jogos eletrnicos o jogo desenvolvido pelo
fsico Willy Higinbotham em 1958 para distrair os visitantes do Brookhaven National
Laboratories. Na poca, era comum a abertura para visitao ao pblico e o demonstrativo
desenvolvido pelo fsico fazia sucesso.
O referido jogo, um precursor do Pong chamado Tennis for Two, era executado em
um osciloscpio de tela de 5 polegadas conectado a duas caixas com um dial e um boto.
Cada dial permitia que o jogador controlasse a trajetria de uma bola e o boto rebatia a bola
para o outro lado da tela. Embora no houvesse escore, relata-se que os visitantes ficavam
horas na fila para jogar a demonstrao.
Apesar do sucesso entre os visitantes, o jogo no foi registrado por ser considerado por
seu criador como uma idia bvia e que no valia a pena sua comercializao. Alm disso,
Tennis for Two era s um demonstrativo. Dessa forma, o papel de primeiro jogo eletrnico
geralmente atribudo para o jogo SpaceWar! de 1962. De fato, o primeiro software
desenvolvido para um computador de uso geral, no caso um mainframe PDP-1 utilizado pelos
pesquisadores do MIT.
O jogo era uma competio entre duas naves atradas por um sol central que tinham
que controlar seu combustvel e possuam armas para destruir o adversrio. Os controles, para
dois jogadores, tambm incluam um boto de pnico que fazia uma rotina de fuga, a qual
levava a nave ao hiperespao e fazia com que a nave sumisse por alguns instantes e fosse
rematerializada em um local aleatrio. Como programa demonstrativo, atendeu com
eficincia aos critrios de demonstrar os recursos do computador testando-os ao limite, alm
de consistir em um framework consistente para testes j que em cada execuo do jogo era
diferente o comportamento da simulao.
Deve-se destacar que alm de serem os primeiro jogos eletrnicos, os jogos citados,
embora no tenham nenhum aspecto online, como por exemplo, uma rede de computadores,
j possuam caractersticas multiplayer. Tanto que o incio da era online se d com uma
verso de SpaceWar! para o sistema online PLATO.
99
A dcada de 70 e os primeiros jogos online

Koster [KOS2002]cita como o primeiro jogo realmente em rede uma verso de
SpaceWar! para o servio PLATO em 1969. Tal jogo, escrito por Rick Blomme,
considerado como o marco inicial da era dos mundos online segundo a Linha do Tempo dos
jogos online compilada por Jessica Mulligan [MUL1999]. A mesma autora tambm
contextualiza que de 1970 a 1977 uma srie de outros jogos multiplayer surgiram no mesmo
sistema.
Dois fatores explicam o sucesso do PLATO (Programmed Logic for Automatic
Teaching Operations), originalmente um sistema de tempo compartilhado dedicado a
experimentos na rea de educao, como plataforma para jogos: poder grfico superior a
qualquer plataforma da poca e a uniformidade do hardware, ou seja, como nos consoles
atuais, os terminais tinham o mesmo poder computacional. Dessa forma, os jogos tinham a
mesmo desempenho em todos os pontos da rede, embora a velocidade de conexo pudesse
variar. Outros fatores para o sucesso da plataforma em jogos so citados por Woolley
[WOO1994], alm dos acima:
reas de memria compartilhadas;
Processamento centralizado de cada tecla pressionada;
Resposta rpida das teclas;
Possibilidade de abortar a sada do display.
Alguns jogos de destaque da poca populares ou surgidos na plataforma PLATO so

citados abaixo. Deve-se destacar que as datas e funcionalidades dos jogos so polmicas, e,
muitas vezes imprecisas. Alm disso, por seu carter online e completamente centralizado,
novas funcionalidades eram agregadas e retiradas dos jogos no decorrer dos anos. Outro ponto
importante a ser considerado o fato dos jogos poderem ser apagados do sistema. Assim,
outra pessoa poderia refazer o jogo anterior a partir do que lembrava e, claro, adapt-lo e
melhor-lo. Os jogos sempre se renovavam, e tal dinamismo era o que mantinha o interesse
dos jogadores.
Sem seguir uma ordem de importncia ou cronolgica, destaca-se:
100
Dogfight - 1973: simulador de vo no qual dois jogadores controlam avies

que tentam se destruir entre si. Era um jogo simples, mas que j exibia o
problema hoje conhecido como lag, ou seja, o jogador com maior velocidade
de conexo com o servidor tinha vantagem em relao ao outro.
Empire 1974: jogo de gerenciamento de imprios espaciais com ambientao

baseada no universo do seriado Star Trek. Empire suportava at 32 jogadores
divididos em 4 times (Federao, Romulanos, Klingons e Orions). A primeira
verso foi escrita por John Daleske e Silas Warner. Empire um dos jogos que
mais influenciou os jogos de estratgia posteriores, sendo o primeiro jogo
online de estratgia com times competindo entre si. Predecessor dos jogos de
estratgia em tempo real.
Spasim 1974: Jogo referenciado como primeiro jogo de tiro 3D em primeira

pessoa [BOW2001]. Semelhante a Empire, era um jogo com 32 jogadores
desenvolvido por Jim Bowery. Cada jogador era representado para o outro por
uma espaonave em wireframe cuja visualizao era atualizada a cada
segundo. Existe uma controvrsia relacionada a um outro jogo, chamado Maze
sobre qual dos dois jogos o pioneiro no universo dos jogos 3D. Destaca-se
que Spasim melhor documentado que Maze e, alm disso, este ltimo,
utilizava uma perspectiva fixa.
Airfight 1974 / 1975: Inspirado no cdigo do Spasim, o programador Silas

Warner criou o primeiro simulador de vo 3D, chamado Airace. Inspirado em
tal cdigo, o programador Kevin Gorey criou uma verso 3D do jogo Dogfight.
Era um simulador de vo em tempo real com viso 3D do horizonte, do
aeroporto e do inimigo.
DND - 1974: No era um jogo multiplayer, mas foi um dos primeiros jogos de
masmorra grficos a serem executados no sistema PLATO. Provavelmente
derivado de um jogo de 1972 de outro sistema. DND serviu de inspirao para
todos os subseqentes. Foi o primeiro jogo a ter incio, meio e fim e a
apresentar lojas para comprar itens e um chefe protegendo o objetivo final.
Mines of Moria 1974: Primeiro jogo de explorao de masmorras, no qual

mltiplos jogadores exploravam 248 diferentes labirintos em bandos ou
101
individualmente. Cada cena era composta por uma viso detalhada incluindo a
sala, monstros, portas e corredores, alm da fora e poderes do personagem.
Oubliette 1977: Um jogo de RPG (Role Playing Game jogo de

interpretao de papis) com bastante influncia do Dungeons & Dragons. Foi
desenvolvida a possibilidade de criar o seu personagem e salv-lo para
utilizao posterior. O jogador, assim, desenvolvia os atributos, classes e raas
de seu personagem. O ambiente 3D em primeira pessoa desenhado por linhas
(wireframe) tambm se destaca como contribuio deste jogo.
Avatar 1978: jogo de masmorras tambm baseado no recm lanado universo

do RPG de mesa Dungeons and Dragons. Possivelmente o jogo mais popular
na histria do sistema [WOO1994]. Foi feito com o objetivo de suplantar
Oubliette.
tamanho
complexidade
do
jogo
demandaram
um
desenvolvimento de trs a quatro anos para ser completado. Permitia a

comunicao entre os jogadores, troca de itens e a atribuio de quests
essenciais para a troca de nvel. O jogo ainda tem muitos fs e pode ser
acessado em servidores dedicados.
Embora o sistema PLATO, pelos motivos j citados, seja o bero da maior parte dos
jogos online da dcada de 70, alguns outros sistemas tiveram iniciativas de destaque. Cita-se,
portanto, outros jogos online da dcada de 70 com importncia em outros sistemas:
Maze (tambm conhecido como Maze War) 1974: Tambm referenciado

como o primeiro jogo de tiro 3D em primeira pessoa [THO2004]. Introduz o
conceito de jogadores online usando avatares e perseguindo uns aos outros em
um labirinto.
DECWAR (tambm conhecido como DECWARS) - 1978: Sofisticado jogo de

estratgia em tempo real destinado para de um a dezoito jogadores
desenvolvido para a plataforma DEC-10 na University of Texas at Austin.
Semelhante ao Empire do sistema PLATO. O primeiro jogo espacial
multiplayer de gerenciamento de imprio (MegaWars III) derivado das idias
expostas em DECWARS [MAR2001].
102
Empire
1972 / 1978: Precursor dos jogos de guerra entre civilizaes.
Tambm um jogo em tempo real no qual de 4 a 100 jogadores interpretam

lderes de uma nao e devem gerenciar recursos e populao civil e militar. O
jogo e suas variantes persistem at hoje com torneios e servidores disponveis
pela Internet. diferente do Empire da plataforma PLATO e foi escrito
originalmente para uma plataforma HP e depois adaptado para o DEC-10 em
1978.
MUD (Multiple User Dimension, Multiple User Dungeon, ou Multiple User

Dialogue) 1978: Richard Bartle e Roy Trubshaw comeam
desenvolvimento do MUD em 1978. MUDs so ambientes virtuais nos quais os

usurios controlam um personagem virtual. O jogador pode explorar reas,
conversar com outros personagens, combater monstros, obter itens, etc. MUDs
so jogos textuais bastante dependentes da interpretao e imaginao dos
participantes assim como em um RPG (Role-playing game) de mesa. Tais
ambientes, com temtica medieval influenciada pela ambientao criada por
Tolkien, so a principal influncia para os jogos online mais visitados na
atualidade como World of Warcraft, Everquest e outros.
Alguns jogos da poca, mesmo no sendo online, merecem tambm destaque por
conter elementos que foram agregados por jogos online posteriores:
Star Trek 1972: Jogo de estratgia por turnos escrito em BASIC por Mike
Mayfield no ano de 1972. Um dos primeiros jogos espaciais a serem criados.
Sua fama e contribuio esto em ser um dos primeiros jogos textuais. Tal fato
implicou na pouca necessidade de recursos computacionais necessrios para
jog-lo [MAR2001]. Devido a sua simplicidade, portanto, Star Trek foi um dos
jogos mais adaptados para computadores pessoais e mainframes da poca.
Empire (do sistema PLATO) se baseia em Star Trek.
Hunt the Wumpus 1972: Escrito por Gregory Yob em 1972, Hunt the
Wumpus um jogo de esconde-esconde em um labirinto com o formato de um
dodecaedro. Pode ser considerado um precursor dos jogos do gnero Adventure
(Aventura, jogos com histrias interativas). Sua inovao est em provar que
um mundo virtual poderia ser em qualquer formato e tamanho diferente do
103
tradicional grid com duas dimenses. Alm disso, demonstrou tambm como o
formato do mundo do jogo tem influncia direta na jogabilidade. Outra
contribuio relevante a introduo perspectiva do jogador em incorporar
um personagem. Em todos os jogos anteriores, o jogador controlava algum
objeto, no Hunt the Wumpus, entretanto, o jogador passou a ser tratado como
voc, ou seja, o jogador algum no mundo do jogo.
Adventure (tambm conhecido como Advent ou Colossal Cave) 1974:

Primeiro jogo do gnero de Adventure. Desenvolvido por Will Crowther era
um simulador de explorao de cavernas expandido por Don Woods, em 1976,
em uma aventura medieval com elfos e trolls. O sucesso deste tipo de jogo
provocou o surgimento de diversas variantes e jogos semelhantes. O mais
famoso Zork [LEB1979]. Uma das variantes do jogo chamada DUNGEN tem
influncia direta sobre o desenvolvimento do MUD [BUR1995]. Destaca-se
que o MUD no deixa de ser uma verso multiplayer de um jogo de Adventure.
Star Trader- 1974: Jogo de nave baseado em setores no qual a nave do jogador
movimenta-se entre esses setores vendendo e comprando combustvel, comida
e equipamento. A principal contribuio desse jogo o fato de ter servido de
base para as dinmicas de trading (negociao) em jogos de estratgia como
Trade Wars e posteriores [PRI2003].
Uma observao pertinente em relao ambientao da maioria dos jogos da poca.

O sucesso dos universos das franquias Star Trek, Star Wars e dos livros de Tolkien era grande
no meio acadmico. A influncia de Tolkien se d, principalmente, atravs do lanamento do
primeiro RPG (Role Playing Game jogo de interpretao de papis), Dungeons & Dragons
em 1973. Dessa forma, justifica-se o porqu da maioria dos jogos da poca e subseqentes ter
temtica relacionada fantasia medieval ou fico cientfica.
O cenrio descrito nesta seo com servidores mainframe e jogos em terminal com
temtica espacial ou medieval foi restrito, portanto, ao meio acadmico, que, efetivamente,
tinha acesso ao uso de redes de computadores. A indstria de jogos, e, conseqentemente, o
consumidor comum no teve acesso a jogos online at a popularizao do modem. A dcada
de 80 foi o incio desta popularizao.
104
A pr-histria da indstria de jogos online e sua era de ouro

Em 1979, a Compuserve tornou-se o primeiro servio a oferecer email para usurios
de computadores pessoais. Alguns dos primeiros jogos online comerciais tambm floresceram
neste ambiente: MegaWars I, MegaWars III e Islands of Kesmai. O primeiro, lanado em
1983, era uma converso de DECWARS para a plataforma da Compuserve removendo
qualquer referncia ao universo de Star Trek para evitar problemas de copyright [MAR2001].
Seu diferente sucessor na Compuserve, MegaWars III, segundo a linha do tempo de Koster
[KOS2002], derivado de outro jogo chamado S, de 1979, ambos criados pela Kesmai,
empresa fundada por Kelton Flinn e John Taylor. MegaWars III guarda a honra de ter uma
das vidas mais longas para um jogo online pago. Ele foi descontinuado apenas em 1998
[MAR2001]. Lanado em 1984, a Kesmai desenvolveu, tambm na Compuserve, Islands of
Kesmai. O potencial comercial dos jogos online j comea a se configurar: para jog-lo, o
jogador deveria pagar doze dlares a hora. Islands of Kesmai foi um RPG online que
permaneceu por treze anos [MUL1999].
Com o sucesso da Compuserve na rea de jogos online, outros servios surgiram. O
principal competidor da Compuserve era o servio GEnie (GE Network for Information
Exchance) lanado em 1985. Stellar Warrior, uma verso simplificada de Mega Wars III, foi
um dos primeiros jogos a serem lanados para o servio. O preo para acessar os servios da
GEnie era de seis dlares a hora. Com o tempo, o preo de acesso diminuiu para trs dlares.
Insiste-se, novamente, no potencial comercial j existente: Mulligan cita em [KOS2002] que
no ano de 1991, o usurio mdio de jogos online do servio GEnie gastava uma mdia de 156
dlares, ou seja, 32 horas de jogatina mensal.
Outros jogos relevantes do servio GEnie foram Rim Worlds War e Air Warrior. Rim
Worlds War o primeiro PBEM (Play by email jogo por email) em um servidor comercial
[MUL1999]. Air Warrior, lanado em 1986, o primeiro jogo massivo multiplayer baseado
nos recursos grficos. Era um simulador de combate areo nico, at ento, por ter sido
portado para mltiplas plataformas (Macintosh, Amiga, Atari ST, e IBM PC) e os clientes de
cada plataforma conseguiam competir entre si em um mesmo mundo virtual [KOS2002]. O
sucesso desse jogo s foi suplantado pelo jogo de RPG Gemstone II, lanado em 1988. Outro
RPG de importncia foi Dragons Gate, surgido em 1991.
105
Outro competidor importante a entrar no mercado em Novembro de 1985 foi o servio

QuantumLink. O destaque desta plataforma era ter uma interface grfica diferenciada
construda especialmente para os usurios de computadores Commodore 64/128. Os usurios
dos demais servios estavam acostumados com uma interface textual. Assim, os jogos da
QuantumLink aproveitaram desde o princpio o potencial grfico possvel ao Commodore.
Um comentrio merece ser feito evoluo da QuantumLink. Aps alguns anos seu nome foi
mudado para America Online, empresa que foi o embrio para a atual AOL-Time-Warner.
Um dos jogos de maior impacto da QuantumLink foi Habitat, lanado em 1985
[MOR1990]. Desenvolvido pela LucasFilm, Habitat foi uma das primeiras tentativas de criar
um mundo virtual multiplayer nos moldes dos atuais MMORPGs (Massive Multiplayer Online
RPGs). Sua contribuio mais marcante foi a introduo ao uso do termo avatar como a
representao grfica do usurio no mundo digital. Habitat era um mundo virtual no qual os
personagens podiam se comunicar, jogar, casar com outros, fundar religies, etc. A lio
ensinada por Habitat foi que o cyberespao definido mais pelas interaes entre os atores
envolvidos do que pela tecnologia implementada.
Outros destaques da QuantumLink foram Rabbit Jack'
s Casino (1985 / 1986), o
primeiro jogo multiplayer grfico do sistemas; AppleLink (1988), era uma rede de jogos para
os computadores Apple II; Club Caribe (1988), ambiente derivado do Habitat; Neverwinter
Nights, lanado no incio da dcada de 90 foi o jogo primeiro jogo online a licenciar a
ambientao de Dungeons & Dragons.
Iniciava-se, com as iniciativas citadas, a era de ouro dos servios online proprietrios
pagos. A indstria online em 1993 tinha um nmero estimado de 3 a 10 milhes de casas
conectadas e um faturamento de 10 a 15 milhes de dlares num universo de cerca de 15
jogos online espalhados pelos cinco principais servios. Por outro lado, a Internet (na poca
ainda no formato de DARPA-net) ainda era limitada ao meio acadmico. Os jogos mais
populares nesse ambiente eram os derivados do MUD de Richard Bartle.
Por fim, a era de ouro dos provedores de rede fechada durou at os servios online
comearem a ser suplantados pelo acesso Internet em 1993 e os jogos em computadores
pessoais da linha IBM-PC terem um crescimento com o sucesso com o lanamento do jogo
Doom. Em seo subseqente, tal era ser focalizada. Antes, todavia, faz-se necessria a
106
abertura de um parntese para a explorao de um universo paralelo ao descrito, mas no

menos importante: os jogos para BBS (Bulletin Board System) ou door games.
A gerao representada pelos jogos supracitados teve grande influncia na indstria
atual, sendo chave para criao dos principais conceitos que hoje so aplicados nos jogos
online. Destaca-se o modelo de negcios aplicado: o interesse dos servios online
proprietrios pagos era a maximizao das horas de acesso, pois quanto mais horas o usurio
jogasse, mais ele pagava.
Na mesma poca que os jogos descritos nesta seo, existiam jogos nos quais no
havia vantagem ao jogador que passar mais tempo conectado j que todos tm a mesma
quantidade de turnos para gastar diariamente. Tal modelo de jogo, essencialmente assncrono,
derivado diretamente dos door games, os jogos disponveis em BBSs a partir da metade da
dcada de 80.
Jogos online em BBS

A partir da segunda metade da dcada de 70, o computador pessoal comeou a se
popularizar entre os jovens hobbystas americanos. Comearam a surgir os primeiros
computadores com poder de processamento e preo considerveis ao uso domstico. Nada
mais natural do que as principais aplicaes para um microcomputador serem jogos,
principalmente na linguagem BASIC.
Em 1977, Dennis Hayes desenvolve o modem para computadores pessoais e comea a
vender aos hobbystas. Tal dispositivo popularizou-se entre os donos de computadores
pessoais que podiam utiliz-lo, inicialmente, para troca de arquivos ou para se conectar com
as redes disponveis nas Universidades. Em 1978, Ward Christensen e Randy Suess lanaram
o primeiro CBBS (Computer Bulletin Board System). Quem possua um modem poderia
conectar-se ao microcomputador da CBBS, chamada RCPM (Remote CP/M sistema
operacional da poca), e oper-lo distncia. Foi a primeira iniciativa civil com objetivo de
criar uma comunidade virtual, ou seja, independente de uma Universidade ou empresa.
Depois de certo tempo, os criadores comearam a cobrar pelo acesso aos arquivos que
estavam disponibilizando. Em 1980, a CBBS tinha cerca de 11000 usurios. O pioneirismo da
iniciativa merece destaque tambm pelo fato dos criadores no conhecerem, na poca que o
sistema foi lanado, PLATO, a ARPAnet, ou qualquer rede comercial.
107
Vrios CBBSs (ou, simplesmente BBSs) surgiram, com as funcionalidades de sistemas

de mensagens, discusses e, principalmente, troca de arquivos entre os usurios e os
operadores do sistema. O ano de 1981 destaca-se pelo lanamento da plataforma que
divulgou, realmente, a computao ao alcance de todos: o IBM-PC. Logo aparecem BBSs
compatveis com o sistema.
Tom Jennings lana em 1984, o software FidoNet. Tal programa permitia o transporte
automtico da mensagens de uma BBS a outra que tivesse o software instalado. Em um
horrio pr-determinado, o servidor de uma BBS telefonava para o servidor de outra e estes
trocavam mensagens. O sistema teve sucesso no apenas por permitir o intercmbio de
informaes entre usurios de BBSs diferentes, mas tambm por rodar em computadores
IBM-PC. No fim de 1984 a primeira conexo internacional foi feita pela FidoNet. Em 1985 j
existiam 600 ns da rede principalmente nos Estados Unidos e Canad.Com o software de
Jennings, qualquer um poderia montar ser um sysop (System Operator operador do sistema)
e ter sua BBS em casa. As BBSs tornaram-se, portanto, bastante populares entre as pessoas
fora do meio acadmico ou militar.
Outro elemento responsvel pela popularizao das BBSs, no contexto da mdia, foi o
filme War Games (Jogos de Guerra). Na histria, um adolescente hacker conecta-se ao
computador do departamento de defesa americano e quase deflagra uma guerra mundial.
J que a conexo com as BBSs era telefnica, e, geralmente as pessoas possuam
apenas uma linha disponvel, os primeiros jogos disponveis no tinham aspecto multiplayer,
alm de um possvel ranking no qual as pessoas poderiam comparar sua performance. No
havia, portanto, real competio entre os jogadores, j que, provavelmente eles no estariam
conectados ao mesmo tempo como em um sistema online de rede fechada. E, mesmo os jogos
para mais de um jogador previam que apenas uma pessoa estivesse conectada ao jogo ao
mesmo tempo, sendo, por esta caracterstica, assncronos. Tais jogos, com apenas um jogador
conectado em uma fatia de tempo, podem ser classificados como multiplayer, single user
(MPSU).
Os jogos para BBS tambm eram chamados de Door Games. Outra caracterstica
interessante que os usurios recebiam, geralmente, um nmero limitado de aes
disponveis durante uma seo. Essa limitao garantia que os usurios pudessem jogar pelo
menos uma vez por dia. Os jogos nasciam nas prprias BBS e, quando faziam sucesso, seu
108
criador disponibilizava para as outras BBS gratuitamente ou mediante uma taxa. interessante
observar que o modelo de jogos shareware foi aplicvel aos Door Games, ou seja, os sysops
poderiam instalar gratuitamente em seus sistemas uma verso limitada de um jogo e caso ele
fizesse sucesso entre sua comunidade, a verso sem restries seria comprada.
Em 1984, Chris Sherrick escreve Trade Wars para sua BBS. Tal jogo tornou-se um dos
door games mais influentes e um dos primeiros a permitir a interao entre jogadores. Trade
Wars um jogo de imprios espaciais baseado em turnos. No h combate em tempo real.
Cada jogador recebe um nmero limitado de turnos por dia. Quando os turnos acabam, outro
jogador recebe turnos e pode jogar. Embora acredite-se na influncia de DECWAR e
MegaWars como inspirao para Trade Wars, o criador do jogo comenta que no conhecia
tais jogos na poca [PRI2003]. Assim, os conceitos de Trade Wars so originrios de Star
Trader, do boardgame Risk e do jogo Hunt the Wumpus. Como o cdigo do Trade Wars era
aberto o que provocou o surgimento de diversas verses que evoluram o conceito inicial,
implementando, por exemplo, a possibilidade dos jogadores interagirem com o sistema de
forma concorrente.
Com certeza um dos door games mais populares foi LORD (Legend of the Red
Dragon), criado por Seth Able em 1989 [EHR2002]. LORD um RPG com temtica
medieval com um mundo bastante completo. Embora o jogador tivesse um conjunto limitado
de aes disponveis, como a maior parte dos door games, LORD era um jogo textual, o apelo
imersivo era grande pois o mundo do jogo era bem construdo e possua uma srie de
ocorrncias aleatrias que faziam com que cada seo de jogo fosse diferente da outra. Uma
srie de histrias secundrias tambm mantinha o interesse dos jogadores estimulando a sua
imaginao devido riqueza do mundo online apresentado. Na poca, as BBSs comerciais
comearam a crescer. Tais BBSs poderiam disponibilizar dezenas de linhas para seus clientes.
Os jogadores tambm tinham capacidade de se comunicar com outros, fazendo alianas,
lutando entre si ou apenas conversando em uma interface parecida em formato de chat. LORD
foi o primeiro jogo a dar importncia a atividades cotidianas de interao virtual entre os
jogadores humanos. No ambiente do jogo, por exemplo, o jogador poderia conversar em uma
taverna, fazer apostas e, at mesmo, casar.
O sucesso de LORD influenciou o surgimento de outros jogos e trouxe um pblico
diferente para o mundo das BBSs: as pessoas que acessavam as BBSs com o objetivo de
109
jogar. A expanso da base de usurios das BBSs a partir do fim da dcada de 90 s

interrompida com a popularizao da Internet.
Do fim da dcada de 80 at o incio da segunda metade de dcada de 90 foi o auge das
BBSs, principalmente da plataforma IBM-PC. Alguns jogos de destaque:
Solar Realms Elite (SRE) [PAT2005] - 1990: O objetivo deste jogo de

gerenciamento de imprios o controle de um sistema estelar com inicialmente
seis planetas. O jogo enfatizava a colonizao de novos planetas, a troca de
itens com outros imprios e a conquista atravs do poder blico das tropas.
Tem como inspirao o Space Empire Elite, jogo das BBSs de plataforma
Atari ST.
Barren Realms Elite (BRE) 1990: Jogo semelhante ao SRE, no qual 25

jogadores interagem. possvel o envolvimento de at 255 BBSs em um jogo
s.
Falcons Eye Tem como caracterstica a construo de imprio no perodo

medieval e do mesmo autor do BRE. Influenciou na inspirao dos jogos por
turnos textuais modernos como Utopia, que tambm do mesmo autor.
Usurper- 1993: RPG online com temtica medieval. Permite que os jogadores
formem times. A caracterstica inovadora deste jogo a presena de NPCs com
as mesmas caractersticas do jogador e com uma IA simples. Dessa forma, o
jogo, em uma BBS comeava menos vazio para os primeiros jogadores.
Uma funcionalidade interessante de alguns destes jogos como, por exemplo, no BRE
a possibilidade de jogos inter-BBS. Utilizando uma tcnica de envio de mensagens anloga
de redes do tipo FidoNet, era possvel organizar campeonatos, nos quais os imprios de uma
BBS competiam com os de outra.
A Internet provocou a perda de interesse pelas das pessoas pelas BBSs. Aos poucos os
sistemas foram fechando e os door games foram esquecidos. Era difcil para os sistemas com
interface essencialmente textual competir com a rica interface grfica do navegador Web. A
principal contribuio dos door games foi a popularizao dos jogos online fora do meio
acadmico e/ou das grandes empresas de jogos.
110
Outro ponto relevante a se destacar a possvel descentralizao do jogo em diversos

servidores. Assim, enquanto nos servios de rede fechada havia um servidor que abrigava o
mundo do jogo, nos jogos de BBS surgiram jogos com suporte a mltiplos servidores
descentralizados, existindo, como j citado, at mesmo competio entre os servidores de
BBSs diferentes.
A exploso dos jogos para computador

O lanamento do jogo de tiro em primeira pessoa Doom, da idSoftware, no fim de
dezembro de 1993, pode ser considerado o ponto-chave para a popularizao dos jogos para
PC. E, um dos destaques de Doom era a possibilidade de jogar com at 4 adversrios via
modem ou rede. Warcraft, jogo de estratgia em tempo real de combate entre imprios,
tambm se destacou neste momento de transio.
A indstria de jogos para computador teve um crescimento extraordinrio a partir de
1994 com o surgimento de outros ttulos do gnero FPS e RTS (Real-Time Strategy
estratgia em tempo real). Essenciamente eram clones de Doom e Warcraft, muitos destes
implementando a jogatina online atravs do protocolo TCP/IP, utilizado na Internet. Quake
(1996), tambm da idSoftware e tambm um FPS, foi um dos primeiros a ter suporte a criao
de servidores do jogo via Internet. Aps o lanamento, os servidores de Quake se espalham
pelo mundo. Em algumas noites, mais de 80000 pessoas simultneas jogam espalhadas pela
Internet [MUL1999].
Comparando com o contexto explanado na seo referente a servios online de rede
fechada, a nova estrutura popularizou os jogos que permitiam que qualquer provedor com um
n da Internet, ou, at mesmo, jogadores individuais, instalassem um servidor de um jogo.
Assim, alm dos jogadores no estarem mais limitados a usarem os jogos disponveis na rede
proprietria que acessavam, as pessoas poderiam interagir pela Internet com indivduos de
qualquer parte do mundo com acesso rede mundial. Por outro lado, a maioria dos jogos
online da gerao de Doom e Warcraft explorava a jogatina entre grupos pequenos at no
mximo 16 pessoas. Jogos com centenas de pessoas simultneas como Air Warrior e Habitat,
nos quais havia o compartilhamento de um mesmo mundo online, demandavam uma
estrutura no adaptada Internet naquele momento.
111
At 1996, enquanto os jogos online pela Internet se multiplicavam, os provedores de

rede fechada foram se tornando provedores Internet e/ou fechando suas portas. Em 1997
apenas a AOL, aps comprar a Compuserve no ano anterior, permanecia ativa. Entretanto, seu
modelo de negcio foi alterado: ao invs de cobrar pela quantidade de horas de acesso,
seguindo o modelo dos provedores Internet, a AOL comeou a cobrar um valor mensal fixo.
Essa mudana quebrou, definitivamente, o modelo de negcios dos provedores de jogos. No
modelo anterior eles recebiam uma frao do valor referente a cada hora que o jogador ficasse
conectado. Dessa forma, os jogos foram construdos para encorajar s pessoas a ficarem
conectadas o maior tempo possvel. No modelo novo, maior tempo de conexo a um preo
fixo era extremamente prejudicial AOL. A natural conseqncia foi a sada da maioria dos
provedores de jogos da AOL ou sua adaptao atravs do pagamento de um valor mensal extra
referente ao acesso ao jogo [COS2000]. Essa mudana justifica o porqu da receita de jogos
online ter diminudo entre 1996 e 1997 quando era esperada uma expanso.
Os jogos online de todos os servios online de modelo fechado, portanto, foram
desaparecendo por no estarem adequados ao modelo de pagamentos mensais. Alguma
iniciativa tinha que ocupar aquele espao. O surgimento dos jogos massivos multiplayer, em
1996, marcou o incio de uma nova gerao. Tal gerao, iniciada pelos jogos Meridian 59 e
Ultima Online, alm de atender a necessidade de mundos online persistentes com muitas
pessoas interagindo, suplantou todas as escalas das geraes anteriores em tamanho e
complexidade.
A era moderna dos jogos online: os jogos massivos multiplayer

Embora todos os elementos caracterizadores de um jogo online massivo multiplayer j
existissem desde a dcada de 80 (por exemplo, em Habitat), os jogos estavam limitados a
redes fechadas e atendiam ao modelo de negcio de pagamento pelo tempo. O primeiro jogo
massivo multiplayer acessvel pela Internet com um mundo persistente representado de forma
grfica foi Meridian 59. Lanado em 1996, existem controvrsias se tal jogo realmente pode
ser considerado como um jogo massivo [KEN2003]. A definio de massivo no clara, mas
Meridian 59 permitia apenas 250 pessoas em cada servidor, valor muito distante do comum
para os jogos posteriores. Entretanto, certamente foi o primeiro jogo online grfico baseado
em Internet com modelo de mensalidade. O jogo, de ambientao medieval, funcionava como
112
um MUD grfico com viso em primeira pessoa 2.5 D, ou seja, uma falsa sensao de 3
dimenses como no jogo Doom. No se obteve grande sucesso comercial: o jogo limitou-se a
12000 pessoas.
Ultima Online foi o sucesso que realmente iniciou a era moderna dos jogos online.
Segundos os dados de pesquisa realizada por Woodcock [WOO2005], sobre a quantidade de
assinantes em jogos online massivos, em pouco mais de um ano alcanou a marca de 100000
jogadores pagantes. Seu pico de pagantes foi no primeiro semestre de 2003, quando havia
250.000 assinantes. Oito anos aps seu lanamento manteve uma base de mais de 150000
usurios.
Ultima um RPG online medieval com viso top-down em terceira pessoa. Tal viso,
embora tenha sido utilizada pelo jogo Diablo, anteriormente, foi uma das principais inovaes
e foi aplicada na maioria dos jogos subseqentes. Com Ultima as portas foram abertas para o
lanamento de diversos outros jogos online massivos. A sigla cunhada para classific-los, a
partir de Ultima, MMOG.
Outro jogo online surgido em 1999 foi Everquest. Diferente do mundo totalmente
medieval de Ultima, Everquest um mundo fantstico repleto de magia e raas diferentes.
Everquest mantm uma mdia de 400.000 assinantes. Outro mundo medieval pioneiro foi
Asherons Call, criado pela Microsoft em 1999. Teve seu pico de assinantes em janeiro de
2002 com cerca de 120.000 assinantes. Em sua pesquisa, Woodcock [WOO2005] considera a
era de ouro dos jogos online o perodo at abril de 2001 quando os jogos citados tiveram
grande crescimento e inspiraram outras iniciativas. De maio de 2001 a abril de 2002 um
perodo de transio indicou a saturao do mercado dos MMORPGs de fantasia. Nesse
perodo o nmero de assinantes diminuiu e se espalhou em diversos sistemas. Muitos jogos
foram cancelados, conduzindo a uma fase caracterizada pela competio.
O mercado continua a crescer com mais pessoas interessadas em jogar online. Estimase que de Outubro de 2004 a Janeiro de 2004, nos Estados Unidos, cerca de 1 milho de
pessoas comearam a assinar algum jogo. Entretanto, o processo de canibalizao dos
assinantes caracterstico da atualidade. Dessa forma, os novos jogos roubam a ateno e os
assinantes dos anteriores em um processo de renovao contnua. Como a infra-estrutura para
manter um MMOG cara, a perda de assinantes implica em prejuzo. Nesse cenrio, difcil
acreditar que os jogos online da gerao iniciada por Ultima Online tenham durao to longa
113
quanto os da dcada de 80. Os ambientes esto mais descartveis e o jogador tem inmeras
opes de mundos para compartilhar. S na Coria, por exemplo, existem centenas de jogos
massivos online.
Outro ponto a se destacar a temtica comum maioria dos jogos de sucesso. Embora
existam ambientes como Matrix Online (mundo da franquia Matrix), Eve Online (fico
cientfica), City Of Heroes (cidade com super-heris e viles), The Sims Online (extenso
online ao jogo The Sims) e Star Wars Galaxies (universo da franquia Star Wars), mais de 80%
dos MMOGs so RPGs de fantasia. World of Warcraft (WoW) e Everquest II, lanados no
segundo semestre de 2004, despontam como os principais responsveis pelo crescimento do
mercado e canibalizao dos assinantes dos outros jogos. Ambos tambm contriburam com a
manuteno da proporo destinada ao gnero dos RPGs de fantasia. WoW, inclusive, o
MMORPG com crescimento mais rpido na base de usurios: no primeiro dia, 200,000
jogadores criaram contas no sistema, em dois meses mais de 700,000 unidades do jogo j
haviam sido vendidas nos EUA, Austrlia e Nova Zelndia. Alm disso, em poucos meses o
jogo tambm quebrou o recorde de nmero de usurios concorrentes nos EUA, com mais de
200.000 pessoas simultneas jogando. O jogo tambm foi disponibilizado em fevereiro de
2005 para o mercado europeu e tambm alcanou recordes expressivos com 180000 usurios
concorrentes, distribudos em 80 servidores. Seu sucesso em todas as regies justificado
pelo seu apelo tanto para o jogador casual quanto para o harcore.
At agora, apenas o mercado americano de jogos online foi contextualizado com
destaque. Deve-se discernir, porm, que o maior mercado para jogos online do mundo a
Coria do Sul. Alguns fatores polticos e culturais explicam tal situao [KEN2003]:
Banimento dos produtos japoneses: devido a situao gerada aps a segunda

guerra mundial, haviam leis banindo a importao de produtos japoneses.
Dessa forma, era impossvel ao coreano ter acesso aos principais consoles de
vdeo-game, j que estes eram fabricados por empresas japonesas.
Densidade populacional: a Coria um dos pases mais densos

populacionalmente. Um computador alm de caro, tambm ocupa um espao
no desejvel na residncia. Isso justifica a enorme quantidade de centros com
computadores disponveis populao (chamados de PC-Baangs), um modelo
muito semelhante s lan-houses brasileiras. Tais locais so centros de lazer e
114
de interao social entre os coreanos, ou seja, estimulam a criao de

comunidades.
Incentivo do governo coreano: o governo coreano investiu em servios de

banda larga e telefonia. Muitos jogos tem acesso estimulado pelas operadoras
de telefonia.
Modelo facilitado de tarifao: os americanos estavam acostumados a pagar

utilizando carto de crdito. Na Coria um jogo online pode ser tarifado
atravs de desconto direto na conta corrente ou conta telefnica. Alm disso, o
coreano est acostumado a pagar diretamente pelo contedo, realizando micropagamentos, por exemplo, se o jogador deseja jogar 10 partidas de um certo
jogo ele paga por estas 10 partidas e no uma mensalidade.
Neste cenrio, os jogos online coreanos so jogos que estimulam a interao em

grupos. Alm disso, so jogos ideais para jogar em lan-houses na presena de amigos. O
primeiro jogo coreano de destaque Lineage. Lanado pela NCSoft em 1997, chega a ter mais
de 3.000.000 de assinantes em meados de 2003. Recorda-se, porm: o modelo coreano no se
baseia em assinaturas. Pelo menos 50% dos jogadores vo aos PC-Baangs e pagam pelo
nmero de horas jogam, efetivamente, o jogo.
Os jogos de peso no mercado coreano tambm so essencialmente com temtica de
fantasia medieval seguindo a tendncia iniciada no mercado americano. Dessa forma, os
coreanos tambm tm a possibilidade de exportar seus jogos. Alm disso, por se focarem mais
no aspecto social do jogo, tem possibilidade de aceitao em pases diferentes dos focalizados
pelos americanos. Ragnarok Online, por exemplo, j tem servidores nas Filipinas, Japo,
Taiwan e, foi o primeiro MMORPG importado a ser disponibilizado para o mercado
brasileiro. Com 250.000 em 2005 e mais de um milho de jogadores cadastrados o jogo
online mais bem sucedido no Brasil. Deve-se destacar, porm, que o primeiro MMORPG
brasileiro Erinia lanado em 2004 por uma empresa originalmente curitibana.
Uma das principais contribuies desta gerao que o modelo de negcio. O foco
passou a ser no servio e no no produto. Ou seja, a manuteno da comunidade tem papel
chave. Tcnicas de IA podem ser facilitadores para tal manuteno. A IA no serve para
substituir o jogador, mas sim para melhorar a experincia.
115
ANEXO 4 RANKING DAS RODADAS
Este anexo apresenta o ranking obtido para as rodadas nas quais os jogadores humanos
e automticos interagiram.
116
Resultado da Segunda Rodada (Jan/Fev 2007)

Colocao
Tipo
Networth
Humano
72591982
Humano
19297506
Humano
18655559
Jogador Automtico 6
15483631
Humano
15411470
Jogador Automtico 10
15142742
Jogador Automtico 5
13495338
13028227
Jogador Automtico 3
12443893
10
12379579
11
Jogador Automtico 4
12078996
12
Jogador Automtico 1
11764931
13
Humano
11382933
14
Jogador Automtico 2
10403998
15
Humano
10389575
16
Jogador Automtico 9
7969393
17
Jogador Automtico 8
6749882
18
Humano
6735699
19
Humano
6587604
20
Jogador Automtico 7
6568127
117
Resultados da Terceira Rodada (Fev/2007)

Colocao
Tipo
Networth
Humano
135072907
Humano
25354862
Humano
19060877
Humano
16831230
Humano
12424323
Humano
11749395
Humano
11192230
Humano
10926308
Jogador Automtico 1
10835310
10
Humano
10059101
11
Humano
9969258
12
Humano
9887671
13
Jogador Automtico 2
9853419
14
Humano
9679473
15
Jogador Automtico 6
8979769
16
Humano
8386124
17
Jogador Automtico 4
7955111
18
Jogador Automtico 3
7256574
19
Jogador Automtico
6350844
20
Humano
6296287
21
Humano
6038672
118
22
Humano
5859799
23
Jogador Automtico 7
5714609
24
Humano
4305934
25
Humano
4209886
26
Jogador Automtico 5
4047388
27
Humano
3806810
28
Humano
3547342
29
Humano
3382718
30
Humano
3066850
31
Humano
2761314

2007 Bruno Campagnolo PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

2007 Bruno Campagnolo PDF

Enviado por

Direitos autorais:

Formatos disponíveis

BRUNO CAMPAGNOLO DE PAULA

SISTEMA INTELIGENTE PARA JOGOS DE ESTRATGIA BASEADOS EM TURNOS:

Dissertao apresentada ao Programa de PsGraduao

Universidade Catlica do Paran como requisito

BRUNO CAMPAGNOLO DE PAULA

SISTEMA INTELIGENTE PARA JOGOS DE ESTRATGIA BASEADOS EM TURNOS:

Universidade Catlica do Paran como requisito

De Paula, Bruno Campagnolo

A minha amada esposa

LISTA DE TABELAS ....................................................................................................VIII

3.1.3 Preveno de falhas e realimentao da base de casos....................................... 46

Tabela 1 - Desempenho de programas de computador em alguns jogos clssicos.[SMI1998]. 3

Figura 1 - Exemplo de mtodo para decomposio da tarefa Domination [AVI2004]. ......... 21

Alternate Reality Games Jogos de Realidade Alternativa

first-person shooter jogo de tiro em primeira pessoa

Game Developers Conference

Goal Oriented Action Planning - Planejamento de Aes Orientado a

General Public Licence

General Problem Solver

Hierarquical Task Network Plannning

Multiplayer Massive Online Game - jogos online massivos multiplayer

Non player character personagem controlado pelo computador

Planejamento Baseado em Casos

Planning Definition Language - Linguagem de Definio de Planos

Raciocnio Baseado em Casos

Real Time Strategy Jogos de Estratgia em Tempo Real

Short Message System

Palavras-chave: jogos de computador, Case-based reasoning, case-based Planning.

O objetivo deste captulo desenvolver uma contextualizao inicial para a rea de

APLICAO DE IA EM JOGOS CLSSICOS

conceitos em diversas reas da Cincia da Computao, principalmente na subrea da IA. As

de computador a vencer um campeo mundial em um jogo. Mais especificamente, o programa

algoritmicamente e no existe possibilidade do computador ser derrotado. A Tabela 1

Observando a Tabela 1 deduz-se que jogos de informao parcial ou com um nmero

APLICAO DE IA EM JOGOS DE COMPUTADOR

simblicas e no simblicas. Outro ponto interessante para a gerao da empatia a

O mundo do jogo apresenta muitos objetos, informao parcial e aes tanto

O mercado limita os recursos destinados CPU;

H pouca competio entre os pesquisadores para desenvolver IAs que

Devido ao primeiro fator citado, a IA dos jogos de estratgia utiliza, geralmente,

O desafio do trabalho que se apresenta reside na implementao e teste de um sistema

MOTIVAES NO CONTEXTO ACADMICO E COMERCIAL

inditos e importantes. O foco desta motivao est tanto no ineditismo no aspecto

Os desenvolvedores de jogos reconhecem a necessidade de IA para controlar

A indstria de jogos altamente competitiva e a IA pode ser vendida at

Desenvolvedores de jogos so tecnologicamente antenados com as ltimas

A indstria de jogos grande e comparvel indstria de cinema em lucro;

Os sistemas de aprendizagem de mquina podem aprender as lies erradas a

difcil fazer o ajuste de parmetros referentes diverso e a jogabilidade. As

Algumas tcnicas so difceis de modificar, testar e fazer a depurao, como,

Os personagens em alguns jogos so efmeros e difcil (e, talvez,

Especificamente sobre a proposta corrente, alguns outros tpicos devem ser

Consideradas estas limitaes relacionadas principal tcnica utilizada nos jogos

cartas. Quando o jogo possui um nmero indeterminado de jogadores a complexidade dos

Planejamento em tempo real das aes do adversrio;

Tomada de deciso mediante a incerteza;

Modelagem do oponente atravs de Aprendizagem de Mquina;

Raciocnio espacial e temporal;

Aps exposio das motivaes do projeto, passa-se descrio sucinta do trabalho e

baseados em imprios (empire-based strategy games) e um conjunto de ferramentas para a

ao aspecto do determinismo das aes, o jogo determinstico, ou seja, no considervel a

Discusso e aplicao de tcnicas de IA, mais especificamente PBC, em jogos

Discusso e aplicao de tcnicas de IA, mais especificamente PBC, em jogos