Você está na página 1de 20

EA072 Prof. Fernando J.

Von Zuben DCA/FEEC/Unicamp

Teoria de Jogos
1 2 Introduo ................................................................................................................................................................................ 2 Exemplo de jogos..................................................................................................................................................................... 5 2.1 Pilha de palitos ............................................................................................................................................................. 5 2.2 Jogo de sinuca (bilhar ingls ou snooker) .................................................................................................................... 5 2.3 Duelo ............................................................................................................................................................................ 6 2.4 Lanamento de novos produtos no mercado................................................................................................................ 6 2.5 Dilema do prisioneiro................................................................................................................................................... 7 Terminologia para teoria de jogos............................................................................................................................................ 9 Jogos de soma nula e dois jogadores...................................................................................................................................... 12 4.1 Descrio na forma extensiva .................................................................................................................................... 12 4.2 Descrio na forma normal ........................................................................................................................................ 16 4.3 Anlise do jogo a partir da descrio na forma normal ............................................................................................. 19 4.4 Estratgias mistas e garantia de soluo .................................................................................................................... 23 4.5 Dominao e estratgias vantajosas ........................................................................................................................... 26 4.6 Soluo de jogos com matriz de pagamento n m.................................................................................................... 27 Jogos de soma no-nula e dois jogadores .............................................................................................................................. 28 5.1 Generalizao do conceito de soluo: operador maximin-maximin ........................................................................ 29 5.2 O equilbrio de Nash .................................................................................................................................................. 31 5.3 Soluo no sentido de Nash ....................................................................................................................................... 33 5.4 Tpicos adicionais...................................................................................................................................................... 34 Estratgias para o dilema do prisioneiro ................................................................................................................................ 35 6.1 Tragdia dos comuns.................................................................................................................................................. 37 6.2 Emergncia de altrusmo e o Tit-for-Tat.................................................................................................................... 38 Referncias bibliogrficas...................................................................................................................................................... 40

3 4

Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

1 Introduo
a teoria de jogos representa uma forma de modelar problemas que envolvem dois ou mais tomadores de deciso. No se trata, portanto, de prescries de como jogar um jogo e sim de mecanismos de anlise de conflitos de interesse. ela se originou ao final da Segunda Guerra Mundial, como um ramo da matemtica aplicada. na verdade, a humanidade tem se ocupado com jogos ao longo de toda a sua histria, embora as ferramentas de anlise e a formalizao dos processos envolvidos tenham sido propostas to recentemente. um aspecto marcante da teoria de jogos que inferncias lgicas extremamente complexas podem ser expressas rigorosamente, com um mnimo de sofisticao matemtica. mas sua maior atratividade est nas aplicaes, pois o conceito de jogo pode ser empregado na modelagem de situaes to diversas quanto:
Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

conflitos entre pases, entre grupos sociais e entre grupos tnicos; polticas de preo, de mercado financeiro e de expanso de mercado; polticas de impostos e taxas; polticas sociais e de sade; campanhas eleitorais e outras disputas de poder entre faces polticas; prticas esportivas; dinmica de comportamento animal. os objetivos tambm so variados e podem envolver: o tipo de resultado que pode ser obtido, dadas as estratgias dos jogadores; a determinao da melhor estratgia a ser tomada por um dado jogador ou por todos os jogadores, dado o cenrio que se apresenta; o tipo de modelo que cada jogador deve estabelecer para os demais jogadores de modo que um dado resultado ocorra para o jogo.

Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

de fato, sempre que h uma disputa de interesse entre partes que possuem algumas alternativas para tomada de deciso a cada passo, a formalizao matemtica destes cenrios denominada jogo. a teoria de jogos se configura, portanto, como o conjunto de tcnicas para anlise desses cenrios. Por exemplo, ela no indica ao jogador como jogar o jogo, mas aponta o que acontece quando se adota esta ou aquela estratgia de jogo. evidente que alguns jogos so demasiadamente complexos para serem completamente modelados. Mesmo assim, espera-se que um modelo simplificado seja capaz de descrever os principais tipos de deciso, assim como as estratgias mais indicadas e os resultados predominantes quando todos os jogadores fazem o melhor que podem a todo momento. embora a denominao de jogo induza a conceitos como recreao e passa-tempo, as aplicaes pretendidas envolvem um cenrio bem mais abrangente, que excursiona do mais louvvel ao mais ignbil dos jogos.
Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

2 Exemplo de jogos
exemplos bvios so os jogos de carta e de tabuleiro. sero apresentados a seguir outros jogos, sendo que o dilema do prisioneiro ser melhor analisado mais adiante. 2.1 Pilha de palitos partindo de uma configurao de palitos amontoados, sendo uma configurao aleatria para cada jogador, vence o jogo o jogador que conseguir retirar o maior nmero de palitos do seu monte sem mover qualquer outro palito que ainda permanece no monte. 2.2 Jogo de sinuca (bilhar ingls ou snooker) dada uma bola branca e sete bolas coloridas com valores de 1 a 7, cada jogador tem a sua vez de jogar e nessa vez ele pode decidir encaapar as bolas na ordem de valor ou ento posicionar a bola branca de modo a dificultar a jogada seguinte
Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

do seu adversrio. Obedecendo a vrias regras de pontuao, que consideram todas as possibilidades de eventos durante o jogo, vence aquele jogador que obtiver a maior quantidade de pontos quando todas as bolas forem encaapadas. 2.3 Duelo dois duelistas, posicionados a uma distncia expressiva entre si, esto de posse de uma pistola carregada com uma bala e passam a caminhar um em direo ao outro, na mesma velocidade. A cada passo dado, cada duelista pode decidir atirar ou no, sabendo que a chance de matar o seu oponente aumenta conforme a distncia entre eles diminui. 2.4 Lanamento de novos produtos no mercado considere que duas empresas dividem o mercado junto a uma certa linha de produtos e que elas esto em constante disputa por ampliar sua fatia de mercado e pela reduo de custos de produo. Se uma das empresas anuncia o lanamento
Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

de um produto revolucionrio naquela linha, sendo que o investimento para viabilizar a sua produo foi elevado, o comportamento da empresa concorrente pode ser de trs tipos: no lanar nenhum produto novo e prestigiar ainda mais os seus produtos j lanados no mercado, esperando pelo fracasso de mercado do produto concorrente; passar a investir forte no lanamento de um novo produto muito semelhante quele j lanado pela concorrncia; passar a investir forte no lanamento de um novo produto, distinto daquele j lanado pela concorrncia, mas que concorre pela mesma fatia de mercado. 2.5 Dilema do prisioneiro duas pessoas so presas de posse de produtos roubados e elas so interrogadas separadamente pelas autoridades judiciais. Ambas sabem que:
Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

se ambas se declararem inocentes (no declarando ter roubado e nem acusando a outra pessoa de roubo), no h evidncias suficientes para acus-las de roubo, havendo uma pena de um ano de priso por posse de produtos roubados; se ambas delatarem uma a outra (acusar a outra de roubo e se declarar inocente), a pena ser de 3 anos de priso para cada uma; se uma pessoa delatar a outra (acusar a outra de roubo e se declarar inocente), e a outra no delatar a primeira (inocentar a primeira), ento a primeira pessoa pega uma pena de servios comunidade, sendo solta imediatamente, e aquela que no delatou mas foi delatada pega uma pena de 5 anos de priso. quais so as semelhanas entre o lanamento de novos produtos no mercado e o dilema do prisioneiro? o que caracteriza uma estratgia de jogo neste caso?
Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

3 Terminologia para teoria de jogos


jogador: so os participantes do jogo, e podem ser em nmero de 2 ou mais. lance: todo jogo consiste de uma seqncia de lances, alguns deles simultneos, que correspondem ou a decises dos jogadores ou a resultados de eventos aleatrios. pagamento: ao final do jogo, cada jogador recebe um pagamento (acumulado dos pagamentos efetuados ao longo dos lances), que vai corresponder a um nmero real. Exemplo: quantia de dinheiro ganha em um jogo de cartas. utilidade: um conceito que reflete sua preferncia frente a vrias alternativas de resultado de um jogo. Exemplo: Suponha que o resultado de um jogo seja F = ir assistir a uma partida de futebol ou C = ir ao cinema. Se voc prefere F a C, ento a funo de utilidade deve indicar u(F) > u(C). Quaisquer valores podem ser empregados aqui, por exemplo, u(F) = 4 e u(C) = 2. H a possibilidade de estender este conceito para o caso de o tempo estar seco ou chuvoso. Sejam FS = ir assistir
Tpico P2.7: Teoria de Jogos

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

a uma partida de futebol com tempo seco, FC = ir assistir a uma partida de futebol com tempo chuvoso e C = ir ao cinema. Sua funo de utilidade pode agora indicar u(FS) > u(C) > u(FC). Quaisquer valores podem ser empregados aqui, por exemplo, u(FS) = 4, u(C) = 2 e u(FC) = 0. evidente que esses valores influenciam outros indicativos de preferncia associados. Supondo que exista uma chance de tempo chuvoso de 50%, ento, com a funo de utilidade acima, possvel indicar que o jogador indiferente entre ir ao futebol ou ir ao cinema com base na seguinte equao:
1 1 u ( FS ) + u ( FC ) = u (C ) 2 2

Existe um conjunto de axiomas fundamentando a teoria de utilidade (LUCE & RAIFFA, 1957), a qual foi proposta j na concepo da teoria de jogos por VON NEUMANN & MORGENSTERN (1944). A funo de utilidade deve refletir todos os aspectos vinculados aos possveis resultados de um jogo, incluindo o sentimento de satisfao de um jogador frente ao que ocorre com seus adversrios.
Tpico P2.7: Teoria de Jogos

10

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

estratgia: a estratgia de um jogador a descrio das decises a serem tomadas frente a todas as possveis situaes que podem se apresentar durante o jogo. Portanto, a estratgia no depende do que o adversrio ir fazer naquele lance. Vo existir jogos, no entanto, que a enumerao de todas as possveis situaes intratvel, como no caso do jogo de xadrez. jogos de soma nula: so aqueles para os quais o somatrio dos pagamentos efetuados a todos os jogadores nulo, no importa a estratgia adotada por cada um dos jogadores. Neste caso, o que um jogador ganha corresponde ao que perdido pelos demais. jogos de soma no-nula: so aqueles que no respeitam as condies que caracterizam os jogos de soma nula. Um exemplo aqui o dilema do prisioneiro. jogos de informao completa: so os jogos em que cada jogador tem conhecimento de todos os lances j ocorridos. Exemplos contrrios aqui so alguns jogos de carta, como o pquer.
Tpico P2.7: Teoria de Jogos

11

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

4 Jogos de soma nula e dois jogadores


4.1 Descrio na forma extensiva uma forma de descrever o jogo armazenar todas as possveis seqncias de lances que podem ocorrer e o pagamento ao final de cada seqncia. essa representao pode se dar na forma de uma rvore de deciso. Cada n da rvore representa uma situao do jogo, sendo que todos os lances possveis a partir daquela situao devem conduzir a ns-filhos. Lembre-se que um lance corresponde ou a uma deciso dos jogadores ou a um resultado de eventos aleatrios. sempre que existirem situaes idnticas que podem ser obtidas por diferentes seqncias de lances, essas iro ser representadas por ns distintos da rvore, permitindo assim indicar sem ambigidade o que ocorreu at agora no jogo. seguem dois exemplos de descrio na forma extensiva.

Tpico P2.7: Teoria de Jogos

12

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

Forma extensiva para o jogo de pquer com dois jogadores e duas cartas apenas: um s e um Dois cada jogador aposta uma unidade monetria e o jogador I fornece uma carta ao jogador II, o qual toma conhecimento de que carta tem em mos.

Tpico P2.7: Teoria de Jogos

13

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

Forma extensiva para o jogo dos palitos com dois jogadores, duas pilhas e dois palitos por pilha

Tpico P2.7: Teoria de Jogos

14

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

os jogadores se alternam retirando palitos das pilhas. A cada vez, cada jogador deve retirar ao menos um palito de uma pilha, mas ele pode retirar mais, desde que o faa de uma mesma pilha. o perdedor o jogador que retirar o ltimo palito. repare que a parte destacada da rvore de deciso indica o que o jogador II deve fazer para sempre vencer o jogo. vantagens da forma extensiva: fornece um retrato completo do jogo; permite que se descubra a melhor estratgia para vencer o jogo (se possvel, para cada jogador), caminhando das folhas para a raiz. desvantagens da forma extensiva: geralmente, a forma extensiva para a maioria dos jogos leva a rvores de deciso de difcil tratamento, devido ao seu tamanho. s permite anlise para jogos de informao completa.
Tpico P2.7: Teoria de Jogos

15

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

4.2 Descrio na forma normal esta forma de descrio se inicia pela listagem de todas as estratgias possveis para cada jogador: I1, I2, ..., In para o jogador I; II1, II2, ..., IIm para o jogador II. a prpria rvore de deciso pode ser empregada para se chegar a essas estratgias. de posse da listagem com todas as estratgias dos dois jogadores, possvel verificar como ficaria o pagamento de cada jogador para cada par de estratgias adotada. Supondo que o jogador I adotou a estratgia Ii e que o jogador II adotou a estratgia IIj, como o jogo de soma nula, o pagamento indicado na forma: (pij, pij) se houver lances aleatrios durante o jogo, as probabilidades de cada resultado sero consideradas na estimativa do pagamento.

Tpico P2.7: Teoria de Jogos

16

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

sempre possvel, ento, obter uma matriz de pagamento, como ser exemplificado nos dois jogos cujas rvores de deciso j foram apresentadas. repare que a matriz de pagamento sempre apresentada para o jogador I. Forma normal para o jogo de pquer com dois jogadores e duas cartas apenas: um s e um Dois I1: believe II when he says Ace; I2: dont believe II when he says Ace; II1: say Two when you have a Two and Ace when you have an Ace; II2: say Ace either when you have a Two or an Ace. a matriz de pagamento fica:

I1 I2
Tpico P2.7: Teoria de Jogos

II1 0 1 2

II 2 1 0
17

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

Forma normal para o jogo dos palitos com dois jogadores, duas pilhas e dois palitos por pilha.
I1: take 1 match in the (=,=) case, and 1 match in the (=, ) case; I2: take 1 match in the (=,=) case, and 2 matches in the (=, ) case; I3: take 2 matches in the (=,=) case;

II1: if (=, ) take 2 matches, and if (=,) take 1 match from the smaller pile; II2: if (=, ) take 2 matches, and if (=,) take 1 match from the larger pile; II3: if (=, ) take 2 matches, and if (=,) take 2 matches from the larger pile; II4: if (=, ) take 1 match, and if (=,) take 1 match from the smaller pile; II5: if (=, ) take 1 match, and if (=,) take 1 match from the larger pile; II6: if (=, ) take 1 match, and if (=,) take 2 matches from the larger pile;

ao combinar as estratgias par-a-par, obtm-se a seguinte matriz de pagamento:

Tpico P2.7: Teoria de Jogos

18

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

I1 I2 I3

II1 1 1 1

II 2 1 1 1

II3 1 1 1

II 4 1 1 1

II5 1 1 1

II6 1 1 1

4.3 Anlise do jogo a partir da descrio na forma normal dispondo da matriz de pagamento, como analisar o jogo? que estratgia deve ser sugerida a cada jogador? uma suposio importante, particularmente no contexto de jogos de soma nula, que todo jogador deve ser pessimista: Toda vez que o meu adversrio visar maximizar o pagamento dele, ele estar visando minimizar o meu pagamento (como uma conseqncia direta). com isso, para cada estratgia passvel de ser adotada pelo jogador I, ele deve se concentrar no menor pagamento que ele poderia receber ao adot-la. Assim, ele pode optar pela estratgia que produz o mximo desse menor pagamento.
Tpico P2.7: Teoria de Jogos

19

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

por buscar maximizar o menor pagamento, esse critrio recebe a denominao de critrio maximin. Com esse critrio, o jogador I ter a garantia de receber um pagamento de, no mnimo: pmin = max min pij .
i j

j o jogador II, usando a matriz de pagamento do jogador I, ir minimizar o mximo pagamento do jogador I. por buscar minimizar o maior pagamento, esse critrio recebe a denominao de critrio minimax. Com esse critrio, o jogador II ter a garantia de que o jogador I no receber um pagamento maior que: pmax = min max pij
j i

retornando aos dois casos de estudo, resulta:

Tpico P2.7: Teoria de Jogos

20

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

II1 I1 I2 Mximo usando II j pmin = max min pij = max 1, 1


i j

II 2 1 0 0

0 1 0
2

Mnimo usando I i 1 1 2

}= 12

pmax = min max pij = min{0,0} = 0


j i

Como se pode constatar, pmin = 1 < 0 = pmax . Com isso, o jogador I pode estar 2 certo de receber um pagamento mnimo de 1 , mas o jogador II tem apenas a 2 garantia de que ele vai conseguir evitar que o jogador I receba um pagamento maior do que 0. no est claro qual ser o resultado do jogo, pois o jogador I ir adotar a estratgia I2 certamente, mas o jogador II poder adotar tanto II1 como II2.
Tpico P2.7: Teoria de Jogos

21

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

II1 I1 I2 I3 Mximo usando II j


i j

II 2 1 1 1 1

II3 1 1 1 1

II 4 1 1 1 1

II5 1 1 1 1

II6 1 1 1 1

1 1 1 1

Mnimo usando I i 1 1 1

pmin = max min pij = max{ 1,1,1} = 1 1 pmax = min max pij = min{ ,1,1,1,1,1} = 1
j i

Como se pode constatar, pmin = 1 = pmax . Com isso, o menor pagamento que o jogador I pode estar certo de receber igual ao pagamento que o jogador II tem certeza que o jogador I no ir ultrapassar. Isso o que se entende por soluo do jogo: o jogador II deve empregar a estratgia II6 e o jogador I pode empregar qualquer uma das 3 estratgias, sendo o pagamento 1 para o jogador I. esse resultado j havia sido indicado pela anlise da forma extensiva.
Tpico P2.7: Teoria de Jogos

22

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

no est claro qual ser o resultado do jogo, pois o jogador I ir adotar a estratgia I2 certamente, mas o jogador II poder adotar tanto II1 como II2.

4.4 Estratgias mistas e garantia de soluo


como lidar com o caso em que pmin pmax ? von Neumann ofereceu resposta a esta questo propondo uma ampliao do conjunto de estratgias que podem ser adotadas, incluindo estratgias mistas. uma estratgia mista consiste na escolha aleatria de uma dentre as estratgias puras, a cada lance do jogo. dado que o jogador I tem n estratgias puras e que o jogador II tem m estratgias puras, ento uma estratgia mista dada pelos dois vetores:
x = [x1 y = [ y1 x2 y2 L L xn ] ym ]

onde xi 0, i=1,2,...,n,
Tpico P2.7: Teoria de Jogos

i =1 xi = 1
n

e yj 0, j=1,2,...,m,

j =1 y j = 1.
m

23

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

diz-se que X o conjunto de estratgias admissveis para x e Y o conjunto de estratgias admissveis para y. dada a matriz de pagamentos envolvendo as estratgias puras e dados os vetores x e y, o pagamento esperado passa agora a ser:
m n

p (x, y ) = xi y j pij
j =1 i =1

por exemplo, no caso do jogo de pquer, tomando estratgias mistas com


x = [x 1 x] e y = [ y 1 y ], sendo a matriz de pagamento dada por:

x
1 x

y 0 1

1 y 1 2 0

ento o pagamento esperado dado por:

Tpico P2.7: Teoria de Jogos

24

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

1 p (x, y ) = 0 x y 1 x (1 y ) (1 x ) y + 0 (1 x ) (1 y ) = 2 1 3 = x y + x y 2 2 necessrio redefinir pmin e pmax , os quais passam a ser expressos na forma:
M pmin = max min p (x, y ) x X yY

M pmax = min max p (x, y ) yY x X

repare que o conceito de estratgia mista implica na suposio de que se vai jogar aquele jogo vrias vezes, sendo que quanto mais se joga mais confiana se tem no pagamento esperado. mesmo que o jogo s seja jogado uma vez, se os jogadores jogarem com a expectativa de jogarem novamente, j se justifica a estratgia mista. a soluo do jogo agora envolve encontrar x e y, sendo que todo jogo de soma nula e dois jogadores tem soluo.
Tpico P2.7: Teoria de Jogos

25

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

o resultado a seguir o mais importante da teoria de jogos e foi demonstrado por


VON NEUMANN

(1937).

Teorema: Em um jogo de soma nula e dois jogadores, com o jogador I tendo n estratgias puras e o jogador II tendo m estratgias puras, sendo n e m finitos, ento, ao admitir estratgias mistas, sempre existe a soluo tima do jogo, ou seja, sempre vale pmin = pmax = v .
M M

v chamado de valor do jogo. v e as estratgias timas x* e y* compem a soluo do jogo.

4.5 Dominao e estratgias vantajosas


os conceitos de dominao e de estratgias vantajosas permitem introduzir diversas simplificaes junto matriz de pagamentos, facilitando assim o tratamento de problemas com um nmero elevado de estratgias puras. Eles no sero abordados neste curso, no entanto.
Tpico P2.7: Teoria de Jogos

26

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

4.6 Soluo de jogos com matriz de pagamento n m


inicialmente, relevante apontar que podem existir mltiplos pares de estratgias mistas timas, cuja notao (x*,y*). Todos eles levam ao mesmo valor do jogo e so chamados de pares de equilbrio. Definio: Um par de estratgias mistas x* X, y* Y um par de equilbrio para um jogo de soma nula se, para quaisquer x X, y Y, vale: p (x, y*) p (x*, y*) p (x*, y ) .
Teorema: Se (x*,y*) um par de estratgias em um jogo de soma nula e dois jogadores, com o jogador I tendo n estratgias puras e o jogador II tendo m estratgias puras, sendo n e m finitos, ento, ao admitir estratgias mistas, (x*,y*) um par de equilbrio se e somente se [x*, y*, p ( x*, y*)] a soluo tima do jogo.

Tpico P2.7: Teoria de Jogos

27

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

DANTZIG (1951) e GALE et al. (1951) demonstraram que resolver um jogo de soma nula e dois jogadores equivalente a resolver um problema de programao linear, sendo esta a tcnica mais eficaz e mais empregada atualmente.

5 Jogos de soma no-nula e dois jogadores


a partir de agora, no mais verdade que, para todas as situaes do jogo, o pagamento para o jogador I igual a menos o pagamento para o jogador II. em termos de notao, cada elemento da matriz de pagamentos vai ser dado por um par, onde o primeiro nmero indica o pagamento do jogador I e o segundo nmero indica o pagamento do jogador II. em jogos de soma no-nula, as principais diferenas frente ao que se viu no caso de jogos de soma nula so: os jogadores no so mais necessariamente adversrios; um par maximin no necessariamente um par de equilbrio e viceversa;
Tpico P2.7: Teoria de Jogos

28

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

pares de equilbrio distintos no necessariamente apresentam o mesmo valor do jogo; no h um conceito bvio de soluo para o jogo.

5.1 Generalizao do conceito de soluo: operador maximin-maximin


dada a matriz de pagamentos, no caso de jogos de soma nula envolvendo dois jogadores, a determinao das melhores estratgias puras se dava pela aplicao dos operadores maximin e minimax. em jogos de soma no-nula, ser necessrio generalizar este conceito, visto que o pagamento para cada jogador pode ser distinto. a generalizao se d de forma simples: ambos os jogadores aplicam o operador maximin, pensando apenas em maximizar o seu prprio pagamento, deixando de lado a minimizao do pagamento do seu adversrio. como um exemplo, considere a seguinte matriz de pagamento:

Tpico P2.7: Teoria de Jogos

29

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

II1 I1 I2 (2,2) (1,1)

II 2 (3,3) . (4,4)

o jogador I vai tomar a sua poro da matriz:


II1 I1 I2 2 1 II 2 3 4

e, aplicando o operador maximin, optar pela estratgia I1, a qual fornece um pagamento mnimo de 2.

o jogador II vai tomar a sua poro da matriz:


I1 II1 II 2 2 3 I2 1 4

e, aplicando o operador maximin, optar pela estratgia II2, a qual fornece um pagamento mnimo de 3.
Tpico P2.7: Teoria de Jogos

30

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

observe que o emprego das estratgias I1 e II2 fornece pagamento (3,3), diferente
dos valores obtidos por cada jogador, que corresponde a (2,3). Isso esperado, medida que no h a preocupao explcita em minimizar o ganho do adversrio.

o par de estratgias (I2,II2) pode ser mostrado ser o par de equilbrio neste caso,
com pagamento (4,4), sendo distinto do par de estratgias indicado pelos operadores maximin.

5.2 O equilbrio de Nash


inicialmente, necessrio estender a noo de par de equilbrio para jogos de
soma no-nula e estratgias mistas.

Definio: Um par de estratgias mistas x* X, y* Y um par de equilbrio para


um jogo de soma no-nula se, para quaisquer x X, y Y, vale:
p1 (x, y*) p1 (x*, y*) ; p2 ( x*, y ) p2 ( x*, y*)

onde p1(,) toma a matriz de pagamento do jogador I e p2(,) toma a matriz de pagamento do jogador II.
Tpico P2.7: Teoria de Jogos

31

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

NASH (1951) apresentou uma generalizao do teorema de von Neumann para


jogos de soma no-nula, como segue:
Teorema: Em um jogo de dois jogadores, com soma nula ou soma no-nula, com o jogador I tendo n estratgias puras e o jogador II tendo m estratgias puras, sendo n e m finitos, ento, ao admitir estratgias mistas, sempre existe ao menos um par de equilbrio.

o alcance desse teorema, no entanto, menor que aquele associado a jogos de


soma nula, pois l foi provada a equivalncia entre pares de equilbrio e solues timas do jogo.

para jogos de soma no-nula, sempre existem pares maximin-maximin e sempre


existem pares de equilbrio, mas eles no precisam ser os mesmos e nem em igual nmero.

Tpico P2.7: Teoria de Jogos

32

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

5.3 Soluo no sentido de Nash


os pares de equilbrio so considerados os mais aceitveis conceitos de soluo,
mas a dificuldade com eles que podem existir muitos pares de equilbrio em um jogo.

alm disso, embora existam tcnicas grficas para obter os pares de equilbrio para
o caso de n = m = 2, para outros valores de n e m a tarefa se torna bem mais desafiadora (WINKELS, 1979).

a sugesto mais aceita tomar um subconjunto dos pares de equilbrio como


soluo, tomando como critrio alguma propriedade especfica.

a seguir, apresentada a proposta de soluo de Nash.


A soluo do jogo, no sentido de Nash, um subconjunto dos pares de equilbrio que obedecem a propriedade de intercmbio de estratgias, ou seja, se ( x1 , y1 ) e ( x 2 , y 2 ) so pares de equilbrio, ento ( x1 , y 2 ) e ( x 2 , y1 ) tambm o so.
Tpico P2.7: Teoria de Jogos

33

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

tanto esta proposta de soluo como outras j apresentadas na literatura possuem


limitaes e no podem ser aplicadas de forma geral (THOMAS, 2003).

5.4 Tpicos adicionais


no sero cobertos aqui tpicos importantes em teoria de jogos, tais como:
solues Pareto timas; jogos cooperativos e no-cooperativos; barganha ou negociao; jogos com 2 ou mais jogadores; jogos de mercado; teoria de oligoplios; leiles; metajogos e metaequilbrio; jogos evolutivos.

Tpico P2.7: Teoria de Jogos

34

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

6 Estratgias para o dilema do prisioneiro


a anlise aqui se restringir a jogos que so jogados um nmero infinito de vezes,
fornecendo um valor preciso para o pagamento mdio por partida.

ser tomado como caso de estudo o dilema do prisioneiro, o qual tem recebido
muita ateno ao longo dos ltimos anos por diversas razes: representa um modelo adequado para muitos problemas de interesse prtico; estabelece um conflito de interesses, permitindo contrastar interesses individuais e coletivos no contexto de jogos cooperativos; a soluo maximin-maximin e o par de equilbrio so os mesmos, mas esta no representa a soluo que normalmente adotada na prtica.

a cooperao um dos marcos em qualquer organizao social. A formao de


grupos sociais de fato representa uma soluo cooperativa para a luta pela sobrevivncia e pela reproduo das espcies.

Tpico P2.7: Teoria de Jogos

35

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

no entanto, todo grupo social acaba impondo restries a uma parcela ou a todos
os seus membros, implicando que deve se manifestar algum tipo de comportamento altrusta.

altrusta aquele indivduo que paga um preo para beneficiar um outro indivduo
ou grupo de indivduos.

um dos maiores transtornos para grupos de indivduos que dependem da


cooperao para sobreviver a presena de freelancers entre eles, ou seja, indivduos que violam as regras de cooperao para maximizar seu proveito prprio.

o interessante perceber que os freelancers inicialmente preponderam na


populao, mas so paulatinamente substitudos por indivduos altrustas.

o que preciso para haver cooperao? Em quais circunstncias o mais racional


no cooperar? Que polticas devem ser adotadas para garantir a cooperao?

Tpico P2.7: Teoria de Jogos

36

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

6.1 Tragdia dos comuns


suponha um almoo de fim de ano com umas 20 pessoas. Voc, que est com
algumas dificuldades financeiras, pensa em pedir um prato barato, mas os primeiros a pedir escolhem pratos carssimos. Voc sabe que vai pagar s 5% da conta, independente do que comer, e decide ento pedir o prato mais caro do restaurante. O custo incremental para seus colegas vai ser mnimo, e voc vai ter uma refeio muito melhor.

mas, como todo mundo pensa assim, o grupo acaba por gastar muito mais do que
teria gasto se cada um pagasse individualmente pelo que consumisse, ou se o grupo tivesse se dividido por vrias mesas menores.

no foi culpa de ningum. As coisas simplesmente aconteceram assim. O grupo


explorou a si mesmo. A deciso racional de cada indivduo leva a um resultado irracional (negativo) para o grupo.

Tpico P2.7: Teoria de Jogos

37

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

tecnicamente, por razes histricas, chamam esse tipo de jogo de tragdia dos
comuns. Explorao de recursos coletivos sempre leva a tragdias dos comuns, e elas s podem ser evitadas introduzindo-se regras para que os participantes sejam recompensados por agirem de forma altrusta. Quer dizer, o altrusmo comprado, de certa forma.

6.2 Emergncia de altrusmo e o Tit-for-Tat


processos evolutivos simulados em computador permitem identificar alguns tipos
de comportamento altrusta que emergem como estratgias de jogo (AXELROD, 1984). Esse cenrio ser exemplificado aqui tomando o dilema do prisioneiro e a evoluo de estratgias via computao evolutiva.

como h duas possveis estratgias puras para cada jogador, adotou-se o bit 0 para
a ao de cooperar e o bit 1 para a ao de delatar. Sendo assim, a matriz de pagamentos do jogo assume a forma:

Tpico P2.7: Teoria de Jogos

38

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

Ao (Jogador A)

0 1

Ao (Jogador B) 0 1 (A,B) = (3, 3) (A,B) = (0, 5) (A,B) = (5, 0) (A,B) = (1, 1)

Axelrod estabeleceu uma competio entre estratgias mistas para o dilema do


prisioneiro, sendo que os jogadores poderiam utilizar uma memria do resultado dos 3 ltimos jogos.

todas as propostas de estratgias deveriam competir duas-a-duas com todas as


demais, e a estratgia vitoriosa foi a Tit-for-Tat, a mais simples de todas.

ela prope inicialmente cooperao, no primeiro jogo, e a partir da fornece como


ao a mesma ao tomada pelo adversrio no jogo passado. Repare que ela emprega apenas a memria do ltimo jogo.

ela s foi batida anos depois, por estratgias concebidas via computao evolutiva.
As solues evolutivas tambm permitiram realizar estudos sobre cooperao.

Tpico P2.7: Teoria de Jogos

39

EA072 Prof. Fernando J. Von Zuben DCA/FEEC/Unicamp

7 Referncias bibliogrficas
AXELROD, R. The Evolution of Cooperation, Basic Books, 1984. DANTZIG, G.B. A proof of the equivalence of the programming problem and the game problem, in Koopmans, T.C. (ed.) Activity Analysis of Production and Allocation, pp. 330-338, Wiley, 1951. DAVIS, M.D. Game Theory: A Nontechnical Introduction, Dover Publications, 1997. GALE, D., KUHN, H.W. & TUCKER, A.W. Linear Programming and the Theory of Games, in Koopmans, T.C. (ed.) Activity Analysis of Production and Allocation, pp. 317-329, Wiley, 1951. JONES, A.J. Game Theory: Mathematical Models of Conflict, Ellis Horwood, 1980. LUCE, R.D. & RAIFFA, H. Games and Decisions, Wiley, 1957. NASH, J.F. Non-cooperative games, Annals of Mathematics, vol. 54, pp. 286-295, 1951. SHUBIK, M. Game Theory in the Social Sciences, MIT Press, 1982. THOMAS, L.C. Games, Theory and Applications, Dover Publications, 2003.
VON NEUMANN, J.

ber ein konomisches Gleichingssystem und eine Verallgemeinering des Brouwerschen Fixpunktsetzes, in Menger, K. (ed.) Ergebnisse eines Math. Coll., vol. 8, pp. 73-83, 1937.

VON

NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behaviour, Princeton University Press, 1944.

VOROBEV, N.N. Game Theory, Lectures for Economists and Systems Scientists, Springer-Verlag, 1977. WINKELS, H.M. An algorithm to determine all equilibrium points of a bimatrix game, in Moeschlin, O. & Pallescke, D. (eds.) Game Theory and Related Topics, North-Holland, 1979.

Tpico P2.7: Teoria de Jogos

40

Você também pode gostar