Escolar Documentos
Profissional Documentos
Cultura Documentos
Teoria de Jogos
1 2 Introduo ................................................................................................................................................................................ 2 Exemplo de jogos..................................................................................................................................................................... 5 2.1 Pilha de palitos ............................................................................................................................................................. 5 2.2 Jogo de sinuca (bilhar ingls ou snooker) .................................................................................................................... 5 2.3 Duelo ............................................................................................................................................................................ 6 2.4 Lanamento de novos produtos no mercado................................................................................................................ 6 2.5 Dilema do prisioneiro................................................................................................................................................... 7 Terminologia para teoria de jogos............................................................................................................................................ 9 Jogos de soma nula e dois jogadores...................................................................................................................................... 12 4.1 Descrio na forma extensiva .................................................................................................................................... 12 4.2 Descrio na forma normal ........................................................................................................................................ 16 4.3 Anlise do jogo a partir da descrio na forma normal ............................................................................................. 19 4.4 Estratgias mistas e garantia de soluo .................................................................................................................... 23 4.5 Dominao e estratgias vantajosas ........................................................................................................................... 26 4.6 Soluo de jogos com matriz de pagamento n m.................................................................................................... 27 Jogos de soma no-nula e dois jogadores .............................................................................................................................. 28 5.1 Generalizao do conceito de soluo: operador maximin-maximin ........................................................................ 29 5.2 O equilbrio de Nash .................................................................................................................................................. 31 5.3 Soluo no sentido de Nash ....................................................................................................................................... 33 5.4 Tpicos adicionais...................................................................................................................................................... 34 Estratgias para o dilema do prisioneiro ................................................................................................................................ 35 6.1 Tragdia dos comuns.................................................................................................................................................. 37 6.2 Emergncia de altrusmo e o Tit-for-Tat.................................................................................................................... 38 Referncias bibliogrficas...................................................................................................................................................... 40
3 4
1 Introduo
a teoria de jogos representa uma forma de modelar problemas que envolvem dois ou mais tomadores de deciso. No se trata, portanto, de prescries de como jogar um jogo e sim de mecanismos de anlise de conflitos de interesse. ela se originou ao final da Segunda Guerra Mundial, como um ramo da matemtica aplicada. na verdade, a humanidade tem se ocupado com jogos ao longo de toda a sua histria, embora as ferramentas de anlise e a formalizao dos processos envolvidos tenham sido propostas to recentemente. um aspecto marcante da teoria de jogos que inferncias lgicas extremamente complexas podem ser expressas rigorosamente, com um mnimo de sofisticao matemtica. mas sua maior atratividade est nas aplicaes, pois o conceito de jogo pode ser empregado na modelagem de situaes to diversas quanto:
Tpico P2.7: Teoria de Jogos
conflitos entre pases, entre grupos sociais e entre grupos tnicos; polticas de preo, de mercado financeiro e de expanso de mercado; polticas de impostos e taxas; polticas sociais e de sade; campanhas eleitorais e outras disputas de poder entre faces polticas; prticas esportivas; dinmica de comportamento animal. os objetivos tambm so variados e podem envolver: o tipo de resultado que pode ser obtido, dadas as estratgias dos jogadores; a determinao da melhor estratgia a ser tomada por um dado jogador ou por todos os jogadores, dado o cenrio que se apresenta; o tipo de modelo que cada jogador deve estabelecer para os demais jogadores de modo que um dado resultado ocorra para o jogo.
de fato, sempre que h uma disputa de interesse entre partes que possuem algumas alternativas para tomada de deciso a cada passo, a formalizao matemtica destes cenrios denominada jogo. a teoria de jogos se configura, portanto, como o conjunto de tcnicas para anlise desses cenrios. Por exemplo, ela no indica ao jogador como jogar o jogo, mas aponta o que acontece quando se adota esta ou aquela estratgia de jogo. evidente que alguns jogos so demasiadamente complexos para serem completamente modelados. Mesmo assim, espera-se que um modelo simplificado seja capaz de descrever os principais tipos de deciso, assim como as estratgias mais indicadas e os resultados predominantes quando todos os jogadores fazem o melhor que podem a todo momento. embora a denominao de jogo induza a conceitos como recreao e passa-tempo, as aplicaes pretendidas envolvem um cenrio bem mais abrangente, que excursiona do mais louvvel ao mais ignbil dos jogos.
Tpico P2.7: Teoria de Jogos
2 Exemplo de jogos
exemplos bvios so os jogos de carta e de tabuleiro. sero apresentados a seguir outros jogos, sendo que o dilema do prisioneiro ser melhor analisado mais adiante. 2.1 Pilha de palitos partindo de uma configurao de palitos amontoados, sendo uma configurao aleatria para cada jogador, vence o jogo o jogador que conseguir retirar o maior nmero de palitos do seu monte sem mover qualquer outro palito que ainda permanece no monte. 2.2 Jogo de sinuca (bilhar ingls ou snooker) dada uma bola branca e sete bolas coloridas com valores de 1 a 7, cada jogador tem a sua vez de jogar e nessa vez ele pode decidir encaapar as bolas na ordem de valor ou ento posicionar a bola branca de modo a dificultar a jogada seguinte
Tpico P2.7: Teoria de Jogos
do seu adversrio. Obedecendo a vrias regras de pontuao, que consideram todas as possibilidades de eventos durante o jogo, vence aquele jogador que obtiver a maior quantidade de pontos quando todas as bolas forem encaapadas. 2.3 Duelo dois duelistas, posicionados a uma distncia expressiva entre si, esto de posse de uma pistola carregada com uma bala e passam a caminhar um em direo ao outro, na mesma velocidade. A cada passo dado, cada duelista pode decidir atirar ou no, sabendo que a chance de matar o seu oponente aumenta conforme a distncia entre eles diminui. 2.4 Lanamento de novos produtos no mercado considere que duas empresas dividem o mercado junto a uma certa linha de produtos e que elas esto em constante disputa por ampliar sua fatia de mercado e pela reduo de custos de produo. Se uma das empresas anuncia o lanamento
Tpico P2.7: Teoria de Jogos
de um produto revolucionrio naquela linha, sendo que o investimento para viabilizar a sua produo foi elevado, o comportamento da empresa concorrente pode ser de trs tipos: no lanar nenhum produto novo e prestigiar ainda mais os seus produtos j lanados no mercado, esperando pelo fracasso de mercado do produto concorrente; passar a investir forte no lanamento de um novo produto muito semelhante quele j lanado pela concorrncia; passar a investir forte no lanamento de um novo produto, distinto daquele j lanado pela concorrncia, mas que concorre pela mesma fatia de mercado. 2.5 Dilema do prisioneiro duas pessoas so presas de posse de produtos roubados e elas so interrogadas separadamente pelas autoridades judiciais. Ambas sabem que:
Tpico P2.7: Teoria de Jogos
se ambas se declararem inocentes (no declarando ter roubado e nem acusando a outra pessoa de roubo), no h evidncias suficientes para acus-las de roubo, havendo uma pena de um ano de priso por posse de produtos roubados; se ambas delatarem uma a outra (acusar a outra de roubo e se declarar inocente), a pena ser de 3 anos de priso para cada uma; se uma pessoa delatar a outra (acusar a outra de roubo e se declarar inocente), e a outra no delatar a primeira (inocentar a primeira), ento a primeira pessoa pega uma pena de servios comunidade, sendo solta imediatamente, e aquela que no delatou mas foi delatada pega uma pena de 5 anos de priso. quais so as semelhanas entre o lanamento de novos produtos no mercado e o dilema do prisioneiro? o que caracteriza uma estratgia de jogo neste caso?
Tpico P2.7: Teoria de Jogos
a uma partida de futebol com tempo seco, FC = ir assistir a uma partida de futebol com tempo chuvoso e C = ir ao cinema. Sua funo de utilidade pode agora indicar u(FS) > u(C) > u(FC). Quaisquer valores podem ser empregados aqui, por exemplo, u(FS) = 4, u(C) = 2 e u(FC) = 0. evidente que esses valores influenciam outros indicativos de preferncia associados. Supondo que exista uma chance de tempo chuvoso de 50%, ento, com a funo de utilidade acima, possvel indicar que o jogador indiferente entre ir ao futebol ou ir ao cinema com base na seguinte equao:
1 1 u ( FS ) + u ( FC ) = u (C ) 2 2
Existe um conjunto de axiomas fundamentando a teoria de utilidade (LUCE & RAIFFA, 1957), a qual foi proposta j na concepo da teoria de jogos por VON NEUMANN & MORGENSTERN (1944). A funo de utilidade deve refletir todos os aspectos vinculados aos possveis resultados de um jogo, incluindo o sentimento de satisfao de um jogador frente ao que ocorre com seus adversrios.
Tpico P2.7: Teoria de Jogos
10
estratgia: a estratgia de um jogador a descrio das decises a serem tomadas frente a todas as possveis situaes que podem se apresentar durante o jogo. Portanto, a estratgia no depende do que o adversrio ir fazer naquele lance. Vo existir jogos, no entanto, que a enumerao de todas as possveis situaes intratvel, como no caso do jogo de xadrez. jogos de soma nula: so aqueles para os quais o somatrio dos pagamentos efetuados a todos os jogadores nulo, no importa a estratgia adotada por cada um dos jogadores. Neste caso, o que um jogador ganha corresponde ao que perdido pelos demais. jogos de soma no-nula: so aqueles que no respeitam as condies que caracterizam os jogos de soma nula. Um exemplo aqui o dilema do prisioneiro. jogos de informao completa: so os jogos em que cada jogador tem conhecimento de todos os lances j ocorridos. Exemplos contrrios aqui so alguns jogos de carta, como o pquer.
Tpico P2.7: Teoria de Jogos
11
12
Forma extensiva para o jogo de pquer com dois jogadores e duas cartas apenas: um s e um Dois cada jogador aposta uma unidade monetria e o jogador I fornece uma carta ao jogador II, o qual toma conhecimento de que carta tem em mos.
13
Forma extensiva para o jogo dos palitos com dois jogadores, duas pilhas e dois palitos por pilha
14
os jogadores se alternam retirando palitos das pilhas. A cada vez, cada jogador deve retirar ao menos um palito de uma pilha, mas ele pode retirar mais, desde que o faa de uma mesma pilha. o perdedor o jogador que retirar o ltimo palito. repare que a parte destacada da rvore de deciso indica o que o jogador II deve fazer para sempre vencer o jogo. vantagens da forma extensiva: fornece um retrato completo do jogo; permite que se descubra a melhor estratgia para vencer o jogo (se possvel, para cada jogador), caminhando das folhas para a raiz. desvantagens da forma extensiva: geralmente, a forma extensiva para a maioria dos jogos leva a rvores de deciso de difcil tratamento, devido ao seu tamanho. s permite anlise para jogos de informao completa.
Tpico P2.7: Teoria de Jogos
15
4.2 Descrio na forma normal esta forma de descrio se inicia pela listagem de todas as estratgias possveis para cada jogador: I1, I2, ..., In para o jogador I; II1, II2, ..., IIm para o jogador II. a prpria rvore de deciso pode ser empregada para se chegar a essas estratgias. de posse da listagem com todas as estratgias dos dois jogadores, possvel verificar como ficaria o pagamento de cada jogador para cada par de estratgias adotada. Supondo que o jogador I adotou a estratgia Ii e que o jogador II adotou a estratgia IIj, como o jogo de soma nula, o pagamento indicado na forma: (pij, pij) se houver lances aleatrios durante o jogo, as probabilidades de cada resultado sero consideradas na estimativa do pagamento.
16
sempre possvel, ento, obter uma matriz de pagamento, como ser exemplificado nos dois jogos cujas rvores de deciso j foram apresentadas. repare que a matriz de pagamento sempre apresentada para o jogador I. Forma normal para o jogo de pquer com dois jogadores e duas cartas apenas: um s e um Dois I1: believe II when he says Ace; I2: dont believe II when he says Ace; II1: say Two when you have a Two and Ace when you have an Ace; II2: say Ace either when you have a Two or an Ace. a matriz de pagamento fica:
I1 I2
Tpico P2.7: Teoria de Jogos
II1 0 1 2
II 2 1 0
17
Forma normal para o jogo dos palitos com dois jogadores, duas pilhas e dois palitos por pilha.
I1: take 1 match in the (=,=) case, and 1 match in the (=, ) case; I2: take 1 match in the (=,=) case, and 2 matches in the (=, ) case; I3: take 2 matches in the (=,=) case; II1: if (=, ) take 2 matches, and if (=,) take 1 match from the smaller pile; II2: if (=, ) take 2 matches, and if (=,) take 1 match from the larger pile; II3: if (=, ) take 2 matches, and if (=,) take 2 matches from the larger pile; II4: if (=, ) take 1 match, and if (=,) take 1 match from the smaller pile; II5: if (=, ) take 1 match, and if (=,) take 1 match from the larger pile; II6: if (=, ) take 1 match, and if (=,) take 2 matches from the larger pile;
18
I1 I2 I3
II1 1 1 1
II 2 1 1 1
II3 1 1 1
II 4 1 1 1
II5 1 1 1
II6 1 1 1
4.3 Anlise do jogo a partir da descrio na forma normal dispondo da matriz de pagamento, como analisar o jogo? que estratgia deve ser sugerida a cada jogador? uma suposio importante, particularmente no contexto de jogos de soma nula, que todo jogador deve ser pessimista: Toda vez que o meu adversrio visar maximizar o pagamento dele, ele estar visando minimizar o meu pagamento (como uma conseqncia direta). com isso, para cada estratgia passvel de ser adotada pelo jogador I, ele deve se concentrar no menor pagamento que ele poderia receber ao adot-la. Assim, ele pode optar pela estratgia que produz o mximo desse menor pagamento.
Tpico P2.7: Teoria de Jogos
19
por buscar maximizar o menor pagamento, esse critrio recebe a denominao de critrio maximin. Com esse critrio, o jogador I ter a garantia de receber um pagamento de, no mnimo: pmin = max min pij .
i j
j o jogador II, usando a matriz de pagamento do jogador I, ir minimizar o mximo pagamento do jogador I. por buscar minimizar o maior pagamento, esse critrio recebe a denominao de critrio minimax. Com esse critrio, o jogador II ter a garantia de que o jogador I no receber um pagamento maior que: pmax = min max pij
j i
20
II 2 1 0 0
0 1 0
2
Mnimo usando I i 1 1 2
}= 12
Como se pode constatar, pmin = 1 < 0 = pmax . Com isso, o jogador I pode estar 2 certo de receber um pagamento mnimo de 1 , mas o jogador II tem apenas a 2 garantia de que ele vai conseguir evitar que o jogador I receba um pagamento maior do que 0. no est claro qual ser o resultado do jogo, pois o jogador I ir adotar a estratgia I2 certamente, mas o jogador II poder adotar tanto II1 como II2.
Tpico P2.7: Teoria de Jogos
21
II 2 1 1 1 1
II3 1 1 1 1
II 4 1 1 1 1
II5 1 1 1 1
II6 1 1 1 1
1 1 1 1
Mnimo usando I i 1 1 1
pmin = max min pij = max{ 1,1,1} = 1 1,1,1,1,1,1} = 1 pmax = min max pij = min{
j i
Como se pode constatar, pmin = 1 = pmax . Com isso, o menor pagamento que o jogador I pode estar certo de receber igual ao pagamento que o jogador II tem certeza que o jogador I no ir ultrapassar. Isso o que se entende por soluo do jogo: o jogador II deve empregar a estratgia II6 e o jogador I pode empregar qualquer uma das 3 estratgias, sendo o pagamento 1 para o jogador I. esse resultado j havia sido indicado pela anlise da forma extensiva.
Tpico P2.7: Teoria de Jogos
22
no est claro qual ser o resultado do jogo, pois o jogador I ir adotar a estratgia I2 certamente, mas o jogador II poder adotar tanto II1 como II2.
onde xi 0, i=1,2,...,n,
Tpico P2.7: Teoria de Jogos
i =1 xi = 1
n
e yj 0, j=1,2,...,m,
j =1 y j = 1.
m
23
diz-se que X o conjunto de estratgias admissveis para x e Y o conjunto de estratgias admissveis para y. dada a matriz de pagamentos envolvendo as estratgias puras e dados os vetores x e y, o pagamento esperado passa agora a ser:
m n
p (x, y ) = xi y j pij
j =1 i =1
x
1 x
y 0 1
1 y 1 2 0
24
1 p (x, y ) = 0 x y 1 x (1 y ) (1 x ) y + 0 (1 x ) (1 y ) = 2 1 3 = x y + x y 2 2 necessrio redefinir pmin e pmax , os quais passam a ser expressos na forma:
M pmin = max min p (x, y ) x X yY
repare que o conceito de estratgia mista implica na suposio de que se vai jogar aquele jogo vrias vezes, sendo que quanto mais se joga mais confiana se tem no pagamento esperado. mesmo que o jogo s seja jogado uma vez, se os jogadores jogarem com a expectativa de jogarem novamente, j se justifica a estratgia mista. a soluo do jogo agora envolve encontrar x e y, sendo que todo jogo de soma nula e dois jogadores tem soluo.
Tpico P2.7: Teoria de Jogos
25
(1937).
Teorema: Em um jogo de soma nula e dois jogadores, com o jogador I tendo n estratgias puras e o jogador II tendo m estratgias puras, sendo n e m finitos, ento, ao admitir estratgias mistas, sempre existe a soluo tima do jogo, ou seja, sempre vale pmin = pmax = v .
M M
26
27
DANTZIG (1951) e GALE et al. (1951) demonstraram que resolver um jogo de soma nula e dois jogadores equivalente a resolver um problema de programao linear, sendo esta a tcnica mais eficaz e mais empregada atualmente.
28
pares de equilbrio distintos no necessariamente apresentam o mesmo valor do jogo; no h um conceito bvio de soluo para o jogo.
29
II 2 (3,3) . (4,4)
e, aplicando o operador maximin, optar pela estratgia I1, a qual fornece um pagamento mnimo de 2.
e, aplicando o operador maximin, optar pela estratgia II2, a qual fornece um pagamento mnimo de 3.
Tpico P2.7: Teoria de Jogos
30
observe que o emprego das estratgias I1 e II2 fornece pagamento (3,3), diferente
dos valores obtidos por cada jogador, que corresponde a (2,3). Isso esperado, medida que no h a preocupao explcita em minimizar o ganho do adversrio.
o par de estratgias (I2,II2) pode ser mostrado ser o par de equilbrio neste caso,
com pagamento (4,4), sendo distinto do par de estratgias indicado pelos operadores maximin.
onde p1(,) toma a matriz de pagamento do jogador I e p2(,) toma a matriz de pagamento do jogador II.
Tpico P2.7: Teoria de Jogos
31
32
alm disso, embora existam tcnicas grficas para obter os pares de equilbrio para
o caso de n = m = 2, para outros valores de n e m a tarefa se torna bem mais desafiadora (WINKELS, 1979).
33
34
ser tomado como caso de estudo o dilema do prisioneiro, o qual tem recebido
muita ateno ao longo dos ltimos anos por diversas razes: representa um modelo adequado para muitos problemas de interesse prtico; estabelece um conflito de interesses, permitindo contrastar interesses individuais e coletivos no contexto de jogos cooperativos; a soluo maximin-maximin e o par de equilbrio so os mesmos, mas esta no representa a soluo que normalmente adotada na prtica.
35
no entanto, todo grupo social acaba impondo restries a uma parcela ou a todos
os seus membros, implicando que deve se manifestar algum tipo de comportamento altrusta.
altrusta aquele indivduo que paga um preo para beneficiar um outro indivduo
ou grupo de indivduos.
36
mas, como todo mundo pensa assim, o grupo acaba por gastar muito mais do que
teria gasto se cada um pagasse individualmente pelo que consumisse, ou se o grupo tivesse se dividido por vrias mesas menores.
37
tecnicamente, por razes histricas, chamam esse tipo de jogo de tragdia dos
comuns. Explorao de recursos coletivos sempre leva a tragdias dos comuns, e elas s podem ser evitadas introduzindo-se regras para que os participantes sejam recompensados por agirem de forma altrusta. Quer dizer, o altrusmo comprado, de certa forma.
como h duas possveis estratgias puras para cada jogador, adotou-se o bit 0 para
a ao de cooperar e o bit 1 para a ao de delatar. Sendo assim, a matriz de pagamentos do jogo assume a forma:
38
Ao (Jogador A)
0 1
ela s foi batida anos depois, por estratgias concebidas via computao evolutiva.
As solues evolutivas tambm permitiram realizar estudos sobre cooperao.
39
7 Referncias bibliogrficas
AXELROD, R. The Evolution of Cooperation, Basic Books, 1984. DANTZIG, G.B. A proof of the equivalence of the programming problem and the game problem, in Koopmans, T.C. (ed.) Activity Analysis of Production and Allocation, pp. 330-338, Wiley, 1951. DAVIS, M.D. Game Theory: A Nontechnical Introduction, Dover Publications, 1997. GALE, D., KUHN, H.W. & TUCKER, A.W. Linear Programming and the Theory of Games, in Koopmans, T.C. (ed.) Activity Analysis of Production and Allocation, pp. 317-329, Wiley, 1951. JONES, A.J. Game Theory: Mathematical Models of Conflict, Ellis Horwood, 1980. LUCE, R.D. & RAIFFA, H. Games and Decisions, Wiley, 1957. NASH, J.F. Non-cooperative games, Annals of Mathematics, vol. 54, pp. 286-295, 1951. SHUBIK, M. Game Theory in the Social Sciences, MIT Press, 1982. THOMAS, L.C. Games, Theory and Applications, Dover Publications, 2003.
VON NEUMANN, J.
ber ein konomisches Gleichingssystem und eine Verallgemeinering des Brouwerschen Fixpunktsetzes, in Menger, K. (ed.) Ergebnisse eines Math. Coll., vol. 8, pp. 73-83, 1937.
VON
NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behaviour, Princeton University Press, 1944.
VOROBEV, N.N. Game Theory, Lectures for Economists and Systems Scientists, Springer-Verlag, 1977. WINKELS, H.M. An algorithm to determine all equilibrium points of a bimatrix game, in Moeschlin, O. & Pallescke, D. (eds.) Game Theory and Related Topics, North-Holland, 1979.
40