Unidade So Gabriel Disciplina: Matemtica Computacional Professor: Joo Sarubbi
Uma introduo teoria dos jogos
Gustavo Veloso Hlio Ribeiro Igor Gama
Belo Horizonte, 2007 Histria A origem da teoria dos jogos est intimamente ligada figura do matemtico hngaro John Von Neumann, conhecido por suas contribuies na computao moderna, ao passo que sua evoluo est ligada s figuras de John Nash, John Harsanyi e Reinhard Selten, ganhadores do Prmio Nobel de Economia de 1994. Em 1928, Von Neumann publicou seu primeiro trabalho sobre o tema, demonstrando uma soluo para jogos de soma zero, definio esta a ser vista em diante, usando-se de tcnicas matemticas. Mais tarde em 1944, em parceria com o economista alemo Oskar Morgenstern, Von Neumann publicou o livro que se tornaria um marco na teoria dos jogos, o The Teory of Games and Economic Behaviour, que apesar de ter formalizado grande parte dos termos usados na teoria dos jogos concentrava-se somente nos jogos de soma zero. Com o livro de Von Neumann e Morgenstern percebeu-se que os jogos de soma zero no conseguiam representar grande parte das interaes sociais devido ao seu carter restritivo. Foi desta necessidade que, a partir de 1950, a teoria dos jogos evoluiu e ganhou espao, principalmente, no mundo corporativo e econmico. A seguir as principais contribuies de outros matemticos e economistas para a evoluo da teoria dos jogos. John Nash Junior, matemtico norte-americano, definiu, em 1951, uma noo de equilbrio para modelos de jogos, que no se restringia apenas aos jogos de soma zero. Com esta noo foi possvel provar que, em alguns casos, quando cada jogador escolhe racionalmente a melhor resposta em relao aos demais jogadores pode ocorrer que o resultado final para todos os jogadores no seja satisfatrio, ou seja, nem sempre a busca de um jogador pelo melhor para si reflete no melhor para todos. John Harsanyi, economista hngaro, percebeu que at aquele momento no havia uma maneira correta para tratar a situao de informao assimtrica, aquela em que jogadores possuem algum tipo de informao privilegiada em relao aos demais sobre determinado elemento do jogo. A partir desta constatao desenvolveu um modelo para tratar este tipo situao, ao qual deu o nome de modelo de informao incompleta. Reinhard Selten, economista alemo, em 1965, aprimorou a noo de equilbrio de Nash, o que ficou conhecido como equilbrio perfeito em subjogos, definio que tambm ser apresentada na prxima seo deste trabalho. A importncia deste aprimoramento foi fundamental para as anlises estratgicas de jogos que envolvam compromissos e ameaas, pois permitiu separar quais compromissos e ameaas eram plausveis e quais no eram.
Definies No estudo da teoria dos jogos algumas definies se fazem necessrias: Jogo Situaes que envolvam interaes entre agentes racionais que se comportam estrategicamente podem ser analisadas formalmente como um jogo. um modelo formal, portanto existem regras para apresentar e estudar um jogo. Agentes Na teoria dos jogos so os jogadores. Um jogador qualquer individuo ou organizao envolvido no processo de interao estratgica que tenha autonomia para tomar decises. Ao a escolha que um jogador pode fazer em um dado momento do jogo. Interaes Significa que as aes de cada agente, consideradas individualmente, afetam os demais.
Estratgia um plano de aes que especifica, para um determinado jogador, qual ao tomar, em todos os momentos em que ter que decidir o que fazer. Estratgia dominante Uma estratgia dita dominante quando, no importando a estratgia dos outros jogadores, um jogador tem sempre uma mesma estratgia classificada como melhor. Quando todas as recompensas de uma estratgia dominante so maiores do que as recompensas das demais estratgias, dito que a estratgia estritamente dominante. Estratgia mista Uma estratgia dita mista quando um jogador decide alternar entre suas aes aleatoriamente, atribuindo uma probabilidade a cada ao. a tentativa de surpreender. Caso contrrio a estratgia dita pura. Racionalidade Assumir que os jogadores so racionais significa supor que eles empregam os meios mais adequados aos objetivos que pretendem alcanar. Comportamento estratgico Por comportamento estratgico entende-se que cada jogador, ao tomar sua deciso, leva em considerao o fato de que os demais jogadores interagem entre si, e que, portanto, sua deciso ter conseqncias sobre os demais jogadores, assim como as decises dos outros jogadores tero conseqncias sobre ele.
Jogo de soma zero o jogo em que um ganho para um dos jogadores significa a perda equivalente para o outro jogador. Caso isso no acontea o jogo de soma diferente de zero. Jogo de informao perfeita o jogo em que todos os jogadores conhecem toda a histria do jogo previamente. Caso contrrio o jogo dito como sendo de informao imperfeita. Jogo de informao completa o jogo que as recompensas dos jogadores so de conhecimento comum. Recompensa aquilo que todo jogador obtm depois de terminado o jogo, de acordo com as suas prprias escolhas e as dos demais jogadores. Jogo cooperativo o jogo que os jogadores podem estabelecer compromissos com garantias efetivas. Caso contrrio o jogo classificado como no-cooperativo. Jogo simultneo o jogo que cada jogador toma sua prpria deciso independente das decises tomadas pelos demais jogadores. O jogador no se preocupa com as conseqncias futuras de suas escolhas. As decises de todos os jogadores so tomadas simultaneamente.
Jogo seqencial o jogo que os jogadores realizam seus movimentos em uma ordem pr-determinada. O jogo se desenrola em etapas sucessivas e os jogadores conhecem as decises dos demais jogadores. Jogo repetido Jogo que, embora os jogadores conheam as decises que foram tomadas nas etapas anteriores, a cada nova etapa da disputa o jogador desconhece as decises dos demais jogadores no momento em que toma uma nova deciso. As estratgias dos jogadores especificam, dada a histria do jogo at aquele momento, que ao tomar em cada etapa do jogo. Conjunto de informao o que um jogador acredita ter alcanado em uma determinada etapa do jogo, na qual a sua vez de jogar. Equilbrio de Nash Diz-se que uma combinao de estratgias constitui um equilbrio de Nash quando cada estratgia a melhor resposta possvel s estratgias dos demais jogadores, e isso verdade para todos os jogadores. Em estratgias puras um ponto onde cada jogador no tem incentivo de mudar sua estratgia se os demais jogadores no o fizerem. Em estratgias mistas um ponto onde cada jogador no tem incentivo de mudar sua escolha de distribuio de probabilidades se os demais jogadores no o fizerem.
Equilbrio perfeito em subjogos , simultaneamente, um equilbrio de Nash para o jogo na sua totalidade e um equilbrio de Nash em cada subjogo. Subjogo Um subjogo sempre se inicia em um nico n de deciso. Um subjogo contm sempre todos os ns que se seguem ao n no qual ele se iniciou. Se um subjogo contm qualquer parte de um conjunto de informao, ele conter todos os ns do conjunto de informao. A Teoria De forma sucinta a teoria dos jogos pode ser vista como uma forma de se entender, teoricamente, o processo de deciso quando h interaes entre agentes. O estudo da teoria dos jogos tem como benefcio imediato o desenvolvimento da capacidade de raciocnio estratgico no indivduo, tendo que ela explora as possibilidades de interaes racionais entre agentes, possibilidades estas que, s vezes, no correspondem intuio. Exatamente por explorar as possibilidades de interaes racionais entre agentes, a teoria dos jogos limitada por esta racionalidade, j que, sabido que o ser humano, por sua essncia, no totalmente racional. A teoria dos jogos pode ser aplicada nos mais variados campos do conhecimento, porm no estudo da administrao e da economia que esta teoria tem um carter quase fundamental nos dias de hoje. Da mesma forma que existe uma definio formal de jogo, a teoria dos jogos tem formas de modelagem de jogos definidas formalmente:
Forma Normal ou Estratgica a forma mais simples de modelar um jogo simultneo. A representao em forma normal constituda por uma tabela com a seguinte disposio: as estratgias de um jogador se encontram listadas nas linhas e as estratgias do outro jogador so listadas nas colunas. O interior da tabela apresenta as recompensas que cada jogador recebe pelas suas escolhas, dadas as escolhas do outro jogador. Essas recompensas tanto podem ser constitudas pela utilidade que um jogador obtm depois de ter jogado o jogo, como podem ser constitudas pelo valor monetrio que resulta no fim do jogo. A forma normal nos fornece todas as combinaes de aes possveis dos jogadores, com seus respectivos resultados. A seguir um exemplo de um jogo simultneo. Possivelmente o exemplo mais conhecido na teoria dos jogos o dilema dos prisioneiros. Ele foi formulado por Albert W. Tucker em 1950, em um seminrio para psiclogos na Universidade de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos. A situao a seguinte: dois marginais, Al e Bob, so capturados e acusados de um mesmo crime. Presos em celas separadas e sem poderem se comunicar entre si, o delegado de planto faz seguinte proposta: cada um pode escolher entre confessar ou negar o crime. Se nenhum deles confessar, ambos sero submetidos a uma pena de um ano de priso. Se os dois confessarem, ento ambos sero submetidos a uma pena de cinco anos de priso. Mas se um confessar e o outro negar, ento o que confessou ser libertado e o outro ser condenado a dez anos de priso.
Exemplo 1: Representao pela forma normal do dilema dos prisioneiros.
Estratgias de Al: {Confessar, Negar} Estratgias de Bob: {Confessar, Negar} Recompensa Confessar x Confessar: -5, -5 Recompensa Confessar x Negar: 0, -10 Recompensa Negar x Confessar: -10, 0 Recompensa Negar x Negar: -1, -1 Forma Estendida a maneira recomendada de modelar um jogo seqencial. O jogo seqencial possui uma caracterstica que dificulta sua modelagem atravs da forma normal, a caracterstica de que os jogadores podem fazer escolhas a partir do que os outros jogadores decidiram no passado, ou seja, os jogadores levam em conta as decises tomadas pelos outros jogadores. Para preservar toda a seqncia do jogo a forma estendida usa uma rvore de jogos. rvore de jogos composta de ramos e ns. Cada n representa uma etapa do jogo em que um dos jogadores tem de tomar uma deciso. Um ramo representa uma escolha possvel para o jogador a partir do seu n. Regras a. Todo n deve ser precedido por, no mximo, um outro n. b. Nenhuma trajetria pode ligar um n a ele mesmo. c. Todo n na rvore de jogos deve ser sucessor de um nico e mesmo n inicial. medida que um determinado n alcanado no jogo, outros ns se tornam possveis, isto , determinadas escolhas de um jogador em uma etapa do jogo tornam possveis outras opes dos demais jogadores nas prximas etapas. A seguir um exemplo de um jogo seqencial. Em um dado cenrio temos duas montadoras de veculos. Uma empresa quer lanar um novo veculo inovador. Por outro lado a outra empresa quer permanecer no posto de lder de mercado. Exemplo 2: Representao de um jogo seqencial na forma estendida.
Soluo de jogos No presente trabalho sero analisadas as solues de jogos simultneos e seqenciais. O mtodo mais simples para se determinar o resultado de um jogo simultneo a chamada eliminao iterativa de estratgias estritamente dominadas. Como o prprio nome diz, este mtodo consiste em eliminar as estratgias estritamente dominadas, estratgias estas que, no importando as estratgias dos outros jogadores, nunca deve ser tomada. Este mtodo s valido quando a racionalidade dos jogadores de conhecimento comum. A partir da se tornou necessrio um conceito mais geral de soluo de jogos, que permita tratar tanto jogos que possuam estratgias estritamente dominadas que podem ser resolvidos pelo mtodo apresentado acima quanto jogos que no seja possvel identificar estratgias dominadas. Este conceito conhecido como equilbrio de Nash, j definido formalmente na primeira parte deste trabalho. O princpio bsico do equilbrio de Nash de que cada jogador individualmente adota a melhor resposta s estratgias dos demais jogadores. Isto no implica que a situao resultante dessas respostas, em conjunto, ser a melhor possvel. Exemplo 3: Soluo de um jogo simultneo de estratgia pura usando o equilbrio de Nash. Considere o dilema dos prisioneiros, apresentado no Exemplo 1.
Estratgias do prisioneiro 1: {Confessar, Negar} Estratgias do prisioneiro 2: {Confessar, Negar} Recompensa Confessar x Confessar: -5, -5 Recompensa Confessar x Negar: 0, -10 Recompensa Negar x Confessar: -10, 0 Recompensa Negar x Negar: -1, -1
Considere as seguintes afirmaes sobre o prisioneiro 1: Se o prisioneiro 2 confessar, a melhor opo para o prisioneiro 1 tambm confessar. Nesta situao o prisioneiro 1 minimiza ao mximo sua pena. Se o prisioneiro 2 negar, a melhor opo para o prisioneiro 1 confessar. Nesta situao o prisioneiro 1 libertado. Melhor opo: confessar. Agora considere as seguintes afirmaes sobre o prisioneiro 2: Se o prisioneiro 1 confessar, a melhor opo para o prisioneiro 2 tambm confessar. Nesta situao o prisioneiro 2 minimiza ao mximo sua pena. Se o prisioneiro 1 negar, a melhor opo para o prisioneiro 2 confessar. Nesta situao o prisioneiro 2 libertado. Melhor opo: confessar. O equilbrio de Nash dado pela combinao das estratgias confessar x confessar, logo o equilbrio de Nash e, portanto, a soluo do jogo, a confisso dos dois prisioneiros, que ficaro presos durante cinco anos. Note que esta soluo no a melhor para ambos.
Concluso Aps a leitura deste trabalho o leitor fica apto a compreender os elementos fundamentais da teoria dos jogos, bem como a maioria das definies comumente utilizadas por estudiosos da rea. Pretendamos apresentar a teoria dos jogos, uma cincia recente e em franco desenvolvimento, de uma maneira simplificada, feita com uma linguagem de alunos de graduao para alunos de graduao. Deixamos uma anlise mais profunda dos tipos de jogos para um trabalho futuro, j que, neste momento, o mais indicado no seria faz-la. Tambm gostaramos de registrar neste trabalho a falta, mesmo que passageira, de uma maior diversidade de fontes bibliogrficas nacionais sobre o tema hoje j indispensvel para as organizaes e para os economistas.
Bibliografia SARTINI, B. A. et al. Uma Introduo Teoria dos Jogos. Disponvel em: < http://www.bienasbm.ufba.br/M45.pdf> Acesso em: 31 out. 2007. FIANI, R. Teoria dos Jogos: para cursos de administrao e economia. Rio de Janeiro: Elsevier, 2004.