Teoria Dos Jogos - Resumo

UnB- Universidade de Braslia Projeto: Jogos Aplicados Promoo do Desempenho Cognitivo de Idosos (ProDC) Professora: Lourdes Mattos Brasil
l Aluna: Dandara Pereira Aranha
Resumo
Livro: Teoria dos Jogos 2 Edio . Editora: Pearson Autores: H. Scott Bierman , Luis Fernandez
Introduo
Embora dirigido a estudantes de graduao em economia, este livro pode ser til para quem quiser aprender a linguagem e as idias da teoria dos jogos em um nvel de introduo. O livro d nfase na aplicao de um conjunto relativamente pequeno de ferramentas da teoria dos jogos para entender fenmenos econmicos importantes. Ele seleciona exemplos de uma ampla gama de reas para que os estudantes possam perceber o poder da teoria dos jogos para quem estuda economia. Podemos encontrar aplicaes da teoria na economia do trabalho, na economia do setor pblico, no comrcio internacional, na economia de recursos naturais, na macroeconomia, e finanas corporativas, em atividades bancrias e, claro na organizao industrial, citando apenas algumas. Lendo o livro inteiro, alm de aprender muito sobre teoria dos jogos, v-se muita coisa sobre a moderna modelagem em economia.
Parte I Jogos Estticos com informao Completa
Teoria dos jogos A teoria dos jogos preocupa-se com o modo como indivduos tomam decises quando esto cientes de que suas aes afetam uns aos outros e quando cada indivduo leva isso em conta. a interao entre tomadores de decises individuais, todos eles com um propsito em vista, cuja decises tem implicaes para outras pessoas,o que torna as decises estratgicas diferentes de outras decises. uma teoria matemtica criada para se modelar fenmenos que podem ser observados quando dois ou mais agentes de deciso interagem entre si. Ela fornece a linguagem para a descrio de processos de deciso conscientes e objetivos envolvendo mais do que um indivduo. A Teoria dos jogos usada para se estudar assuntos tais como eleies, leiles, balana de poder, evoluo gentica, etc. Ela tambm uma teoria matemtica pura, que pode e tem sido estudada como tal, sem a necessidade de relacion-la com problemas comportamentais ou jogos per se. Algumas pessoas acreditam que a Teoria dos Jogos formar em algum dia o alicerce de um conhecimento tcnico estrito de como decises so feitas e de como a economia funciona. O desenvolvimento da teoria ainda no atingiu este patamar e, hoje, a Teoria dos Jogos mais estudada em seus aspectos matemticos puros e, em aplicaes, ela usada como uma ferramenta ou alegoria que auxiliam no entendimento de sistemas complexos. Assim conclumos que a teoria dos jogos pode ser definida como a teoria dos modelos matemticos que estuda a escolha de decises timas sob condies de conflito. O elemento bsico em um jogo /e o conjunto de jogadores
que dele participam. Cada jogador tem um conjunto de estratgias. Quando cada jogador escolhe sua estratgia, temos ento uma situao ou contigncia no espao de todas as situaes (contigncias) possveis. Cada jogador tem interesse ou preferncias para cada situao no jogo. Em termos matemticos, cada jogador tem uma funo utilidade que atribui um nmero real (o ganho ou payoff do jogador) a cada situao do jogo. Mais especificamente, um jogo tem os seguintes elementos bsicos: existe um conjunto finito de jogadores, representado por G = {g1, g2, . . . , gn}. Cada jogador gi G possui um conjunto finito Si = {si1, si2, . . . , simi} de opes, denominadas estratgias puras do jogador gi (mi 2). Um vetor s = (s1j1, s2j2, . . . , snjn), onde siji uma estratgia pura para o jogador gi G, denominado um perfil de estratgia pura. O conjunto de todos os perfis de estratgia pura formam, portanto, o produto cartesiano:
denominado espao de estratgia pura do jogo. Para jogador gi G, existe uma funo utilidade ui : S R s : ui(s) que associa o ganho (payoff) ui(s) do jogador gi a cada perfil de estratgia pura s S. Um exemplo: Dilema do prisioneiro. Possivelmente o exemplo mais conhecido na teoria dos jogos o dilema do prisioneiro. Ele foi formulado por Albert W. Tucker em 1950, em um seminrio para psiclogos na Universidade de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos.
A situao a seguinte: dois ladres, Al e Bob, so capturados e acusados de um mesmo crime. Presos em selas separadas e sem poderem se comunicar entre si, o delegado de planto fez a seguinte proposta: cada um pode escolher entre confessar ou negar o crime. Se nenhum deles confessar, ambos sero submetidos a uma pena de 1 ano. Se os dois confessarem, ento ambos tero pena de 5 anos. Mas se um confessar e o outro negar, ento o que confessou ser libertado e o outro ser condenado a 10 anos de priso. Neste contexto, temos
G = {Al, Bob},
SAl = {confessar, negar},
SBob = {confessar, negar},
S={(confessar,confessar),(confessar, negar),(negar, confessar),(negar, negar)}.
As duas funes utilidade uAl : S R so dadas por uAl(confessar, confessar) = 5, uAl(negar, confessar) = 0, uAl(confessar, negar) = 10, uAl(negar, negar) = 1, e uBob : S R
(que representam os ganhos (payoffs) de Al) e uBob(confessar, confessar) = 5, uBob(negar, confessar) = 10, uBob(confessar, negar) = 0, uBob(negar, negar) = 1
(que representam os ganhos (payoffs) de Bob). uma prtica se representar os payoffs dos jogadores atravs de uma matriz, denominada matriz de payoffs.
BOB
ALL Confessar Negar Confessar (-5,-5) (-10,0) Negar (0,-10) (-1,-1)
Nesta matriz, os nmeros de cada clula representam, respectivamente, os payoffs de Al e Bob para as escolhas de Al e Bob correspondentes a clula.
Equilbrio de Nash
Diz-se que uma combinao de estratgias constitui um equilbrio de Nash quando cada estratgia a melhor resposta possvel s estratgias dos demais jogadores, e isso verdade para todos os jogadores. Ou seja, cada um dos jogadores que fazem parte do jogo, ao definir sua estratgia, estar fazendo o melhor que pode, levando em conta o que seus oponentes esto fazendo. Definio: em um jogo simultneo, as estratgias (a*1,....,a*n) constituem um Equilbrio de Nash se, para todo jogador i, a*i a melhor resposta s estratgias especificadas dos outros (N-1) jogadores, a*-i , isto , se: ui(a*i, a*-i) ui(ai,a*-i) para todo ai Ai , para todo jogador i = 1,......,N. De forma equivalente, podemos definir as estratgias (a*1,...,a*n) como um Equilbrio de Nash caso, para todo jogador i, a estratgia a*i resolver o problema de max ui(ai, a-i*), escolhendo entre todos ai Ai . Podemos, ainda, dizer que um conjunto de estratgias constitui um Equilbrio de Nash se, caso todos os jogadores N - 1 (menos um), joguem as estratgias definidas pelo E.N, de modo que, para o N-simo jogador no exista
nada melhor a fazer a no ser, tambm, escolher a estratgia para ele definida no Equilbrio de Nash. Isso deve valer para todos os jogadores tomados individualmente. Para encontrar um Equilbrio de Nash, basta identificar a(s) melhor(es) resposta(s) de um jogador, diante de cada estratgia escolhida pelo(s) outro(s) jogador(es). Ao proceder assim para todos eles, quando houver uma coincidncia entre as melhores respostas para todos os envolvidos, esse conjunto de estratgias ser identificada como um equilbrio de Nash. Uma forma de fazer isso seria: Primeiro: indicar a estratgia que resulta na maior recompensa para o jogador que est situado nas linhas, para cada uma das estratgias escolhidas pelo jogador que se encontra nas colunas. Podemos fazer isso colocando a letra l no lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida pelo jogador da linha. Segundo: indicar a estratgia que resulta na maior recompensa para o jogador que est situado nas colunas, para cada uma das estratgias escolhidas pelo jogador que se encontra nas linhas. Podemos fazer isso colocando a letra c no lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida pelo jogador da coluna. Este processo se repete para cada uma das linhas, bem como, para cada uma das colunas. Aps aplicarmos o mtodo de assinar a melhor resposta do jogador nas linhas para cada estratgia do jogador nas colunas, bem como, assinalar a melhor resposta do jogador nas colunas para cada estratgia do jogador nas linhas, sempre que uma combinao de estratgias estiver assinalada simultaneamente, essa combinao de estratgias ser um Equilbrio de Nash.
Oligoplios
Muitos mercados importantes no so nem perfeitamente competitivos nem perfeitamente monopolizados. Citamos, como alguns exemplos, automveis, redes de transmisses televisivas, servios telefnicos de longa distncia, aeronaves militares de auto desempenho e equipamentos de gerao de eletricidade. Esses mercados so geralmente denominados Oligopolistas ou Imperfeitamente competitivos. Em mercados oligopolistas, as decises de precificao e produo de cada empresa no setor tem um efeito significativo sobre a lucratividade de seus competidores. Essas empresas nem so competitivas tomadoras de preos, nem so monopolistas definidoras de preos. Seus preos e nveis de produo so escolhas estratgicas em um jogo de oligoplio.
Oligoplio de Cournot
Um oligoplio uma estrutura de mercado intermediria entre os casos limites de monoplio e de competio perfetia. Nesse sentido a definio decorre de imediato: em um oligoplio h um nmero de firmas n > 1 tal que nenhuma das firmas capaz, sozinha, de determinar o preo do produto no mercado (como
seria o caso de um ambiente monopolista) mas no entanto cada uma dessas firmas capaz de influenciar em alguma medida o preo que se estabelecer. O modelo de Cournot um dos mais tradicionais modelos de oligoplios existentes na literatura. Embora originalmente, no trabalho de Cournot (1897, com a primeira edio em 1838), no tenha sido utilizado o conceito de equilbrio de Nash (dado que esse no havia nem mesmo sido definido), a abordagem necessariamente de teoria dos jogos - assim como a maior parte da literatura moderna de organizao industrial. A hiptese bsica do modelo que os jogadores (as firmas envolvidas) escolhem isoladamente a quantidade a se produzir, ignorando a escolha da(s) outra(s) firma(s). O preo de mercado torna-se, portanto, endgeno: dada a quantidade total produzida no mercado, ele definido com base na demanda agregada do setor. Outra hiptese que os produtos de cada firma no so diferenciados pelos consumidores, i.e., so homogneos. Definiremos as funes de custo de cada firma e a de demanda do mercado da maneira mais simples possvel, assim como faz Gibbons (1992), de modo a evitar .algebrismos desnecessrios e a destacar o mais importante, que o processo de resoluo do modelo. Segue ento que o modelo de Cournot diz respeito a um jogo esttico onde as firmas escolhem simultaneamente o quanto produzir. Ainda que numa primeira aproximao possa parecer estranho conceber firmas decidindo simultneamente, como num jogo de par ou mpar, isso tem uma apelo intuitivo imediato: significa apenas que cada firma, ao fazer a sua escolha, no sabe qual foi a escolha da rival, situao essa que extremamente comum no mundo real. Cada firma sabe apenas que a rival sabe que ela tambm no conhece a sua escolha e que a rival sabe que ela sabe que a rival no conhece a sua escolha e assim infinitamente. Como habitual, o problema da firma consiste em fazer suas escolhas de forma a obter o maior lucro possvel. No entanto - e distintamente do modelo competitivo - a firma toma sua escolha considerando o fato de que as escolhas alheias (no caso as decises de produo de suas competidoras) vo afetar o seu payo, caracterizando um
elemento estratgico. Basicamente, ao tomar suas decises, as firmas vo considerar um conjunto de restries dadas pelas demanda dos consumidores do bem (especificada pela curva de demanda pelo produto), por restries tecnolgicas (que sero incorporadas na estrutura de custo de cada firma) e por restries de competio dadas pelo nmero e pelas caractersticas dos seus competidores.
Vamos considerar um modelo simples onde duas firmas, 1 e 2, produzem um bem homogneo cuja demanda dada por P (Q) = a Q onde a > 0 e Q = q1 + q2 a oferta da indstria, dada pela soma do produto das firmas que compes essa indstria. Vamos considerar que para ambas as firmas o custo fixo nulo que o custo marginal (aqui ao custo mdio) constante e idntico para as empresas, C1 (q1) = cq1 C2 (q2) = cq2 onde C pertence (0; a] por um motivo que ficar claro adiante. Podemos ento representar esse jogo na forma normal G = (S1; S2; u1; u2) tal que temos 1. os jogadores: as firmas 1 e 2; 2. os espaos de estratgias dos jogadores, S1e S2 onde vamos supor que
Si = [0; qi], i = 1; 2 . Note que nesse caso os conjuntos de escolhas das firmas dado pelo espao aonde as firmas podem escolher produzir: no mnimo zero e no mximo uma quantidade muito grande porm finita; 3. a funo de ganho dos jogadores, u1 e u2. No caso de firmas, essas funes de ganhos so exatamente a funo de lucro de cada uma delas, dadas por
1 (q1; q2) = P (Q) q1 - cq1
2 (q1; q2) = P (Q) q2 - cq2
que se expressa na diferena entre a receita e o custo da firma. Note que, como esperado, a funo de ganho caracteriza o elemento de comportamento estratgico.O ganho de cada firma determinado no s pela sua escolha - pela quantidade que ela resolveu produzir - como tambm pela escolha da concorrente. Como dito anteriormente, no modelo de Cournot o problema das firmas escolher quantidades simultaneamente, procurando maximizar seus respectivos lucros. Tomemos o caso da firma 1 inicialmente. O seu problema :
de modo que as condies de primeira ordem do problema acima nos mostram que
tal que, resolvendo,
o que nos d exatamente a melhor resposta que a firma 1 pode dar para toda conjectura a respeito da produo da firma 2. Chamamos essa expresso de funo de reao da firma 1 e colocamos o termo entre aspas pelo fato de se tratar de um jogo de escolha simultnea: as firmas no esto reagindo exatamente uma ao que elas observaram, mas sim uma ao esperada da(s) concorrente(s). No entanto essa expectativa no tomada aleatoriamente, mas assumindo que a .rma rival est operando tambm na sua funo de reao correspondente. Uma outra observao relevante diz respeito inclinao da .funo de reao.. Observe que
o que nos mostra que a melhor reao que uma firma pode tomar em relao variaes na oferta da concorrente seguir na direo contrria. Procedendo da mesma forma para a firma 2, decorre (faa as contas) que
ser a .funo de reao. da firma 2, a melhor resposta que ela pode dar s escolhas da rival. Uma vez que temos em mos as respectivas melhores respostas das firmas, fica trivial determinar o equilbrio de Nash desse jogo: como
definimos anteriormente, esse dado pela interseo das melhores respostas. Substituindo q2 (q1) em q1 (q2), fcil verificar que
q1 = (a - c)
de modo que o equilbrio de Nash desse jogo dado por
(q*1; q*2) = ( (a - c); (a - c))
Como qi
[0; qi], conclumos que a c. A oferta da indstria
e o preo de mercado
de modo que o lucro da firma 1 seria
Analogamente,
2=
Por fim note que as hipteses utilizadas de que h apenas duas firmas com estruturas de custos idnticos produzindo so apenas para simplificar a nossa anlise. Na verdade, no h problemas algum em relax-las. Mostraremos abaixo o caso onde existem n oligopolistas e manteremos a hiptese de custos marginais iguais entre as firmas, apenas para obter um resultado de comparao mais fcil com o caso inicial, com duas firmas. Resolva como exerccio o duoplio de Cournot onde, por exemplo, o custo marginal das duas firmas se diferem, comparando os resultados com os obtidos acima. Utilizando a mesma estrutura anterior, teremos certamente quantidades produzidas idnticas para todas as n firmas, uma vez que suas estruturas de custos so as mesmas, o que de resto vai caracterizar um equilbrio simtrico. Segue o problema de uma firma i qualquer
de modo que as CPO.s nos mostram que
A .funo de reao do jogador i dada por
onde, notemos,
; a funo de reao, como usual em
Cournot, tem inclinao negativa. Nesse ambiente, com bens homogneos e tecnologias similares (funo custo), a implicao imediata de um equilbrio simtrico que, em equilbrio, q1 = q2 = ::: = qn, de modo que
Segue que a expresso acima fica
Logo, em equilbrio,
O equilbrio de Nash desse jogo portanto cada firma produzir oferta da indstria e o preo do produto sero, respectivamente,
(a - c). A
Segue que o lucro da i-sima firma em equilbrio ser
Se n
, ento podemos verificar (L.Hopital) que a oferta da indstria e o preo
sero, respectivamente,
e o lucro de equilbrio i = 0, i = 1; 2; :::; n caracterizando um equilbrio em competio perfeita (veri.que). Se n = 1, ento
como esperaramos em um monoplio. Dito de outra maneira, quanto maior for o nmero de firmas do mercado, n, menor ser a produo de cada firma. Particularmente, se existirem apenas duas firmas, voltaramos ao caso anterior, como mostramos. Por outro lado, se n tende a infinito, a produo tende a zero, denotando o reduzido espao que cada uma teria no mercado. Note por fim que o resultado acima nos d outra interpretao genrica para esse ambiente: se a estrutura da indstria for um duoplio, o mercado corresponder a apenas 2/3 do mercado de concorrncia perfeita. Para
uma indstria com 3 firmas, seria 3/4. Para 4 firmas, 4/5 e assim sucessivamente dado pelo termo .
Oligoplio de Bertrand
Betrand (1883): como Cournot, trata-se de um jogo de escolha simultnea e de informao completa, mas aqui as firmas competem entre si via escolha de preo, no de quantidade.
Hipteses: - duas firmas, 1 e 2, que produzem um bem homogneo. - custo fixo nulo e o custo marginal constante e idntico para ambas as firmas, c > 0. - assuma uma curva de demanda linear (para compararmos com Cournot) no produto total Q=ap onde p o preo de mercado.
as firmas declaram simultaneamente os preos e se dispem a ofertar tudo o que for demandado queles preos.
- os consumidores compram da firma que cobra mais barato: segue que a firma anuncia o menor preo detm todo o mercado enquanto a outra firma fica forma do mercado. - se ambas as firmas declaram o mesmo preo, ento elas dividem o mercado igualmente, cada uma com metade.
o lucro de cada firma, como habitual, depende no apenas de sua prpria escolha mas tambm afetado pela escolha da rival. Tome o caso da firma 1, por exemplo, seu lucro ser
- note que o lucro de 1 positivo se p1 > c. Alm disso, ele ser tanto maior se seu preo for menor do que o da rival e apenas a metade se for igual. Por fim o lucro nunca ser negativo na medida em que cada firma tem a prerrogativa de cobrar um preo igual ao custo marginal e assegurar lucro 0 na pior das hipteses. - como a situao a mesma para a firma 2, vamos restringir nossa ateno para preos tais que pi c, i = 1; 2 qual o equilbrio de Nash desse mercado? - paradoxo de Bertrand: o nico equilbrio de Nash ser ambas as firmas cobrarem um preo igual ao custo marginal e ambas terem lucro zero. - como a funo lucro descontnua, ns no podemos mostrar esse resultado pelos argumentos padres, diferenciando e resolvendo as condies de primeira ordem. - ento, o que fazer???
observe que a firma com o menor preo detm todo o mercado. Segue que cada firma tem um incentivo a anunciar um preo menor do que o da rival. Em ltima instncia, isso direcionar o preo de equilbrio para baixo, at o custo marginal.
Vejamos agora o argumento formal para isso. 1. note que um equilbrio de Nash do jogo cada firma cobrar o custo marginal: nesse caso cada firma tem metade do mercado e aufere lucro zero porque cada unidade vendida ao seu custo de produo.
- porque um equilbrio? Se ela elevar seu preo, ela perder toda a demanda que tinha posto que o preo da rival ser estritamente menor! nenhuma firma tem incentivos a desviar. - segue que no possvel que nenhuma firma tenha lucro maior do que zero, de modo que a escolha de preo de cada firma tima dada a escolha alheia (melhor resposta). 2. agora vamos mostrar que no h outro equilbrio de Nash. Como cada firma i = 1; 2 escolhe pi c, suficiente mostrar que no h equilbrio para pi > c. Ento, deixe (p1; p2) ser um equilbrio. - se p1 > c, ento porque p2 maximiza o lucro de 2 dada a escolha de 1, teremos p2 (c; p1], de modo a ter um lucro estritamente positivo fora desse intervalo seria nulo. - alm disso, p1 p2, pois se firma 2 pode ter lucro positivo escolhendo p2 = p1 e
dividindo o mercado com 1, ela pode ter um lucro maior ainda cobrando um preo um pouco abaixo de p1 e desfrutando de todo mercado quase ao mesmo preo. Logo p1 > c p2 > c e p2 < p1 - mas para uma estria similar para as firmas com os papis trocados p2 > c p1 > c e p1 < p2 de modo que se o preo de uma firma est acima do custo marginal, ambos os preo devem estar acima do custo marginal e cada firma deve anunciar um preo um pouco menor do que a rival, o que impossvel.
no modelo de Bertrand, o preo ser igual ao custo marginal com apenas duas firmas. Isso est em forte contraste com o que ocorre em Cournot, onde a diferena entre o preo e o custo marginal cai apenas na medida em que o nmero de firmas no mercado aumenta.
Parte II Jogos Dinmicos com Informao Completa

Na parte I, consideramos situaes nas quais os jogadores se moviam simultaneamente , isto , sem saber quais eram os movimentos dos outros participantes do jogo. Na parte II, analisamos jogos nos quais os jogadores se movimentam em uma sequncia fixa . Em tais jogos dinmicos , os jogadores que se movem mais tarde sabem quais movimentos os demais fizeram antes deles. Os que se movem mais ced0 devem levar isso em conta quando projetam a sua estratgia tima. Um exemplo bem conhecido de jogo dinmico o xadrez. Isso deve servir como uma advertncia de que prever comportamento em jogos dinmicos nem sempre direto. Muitas vezes a barganha por um contrato de trabalho ou por um carro novo desenvolve-se com ofertas e contraofertas seqenciais . Decidir onde comprar uma casa muitas vezes depende de quem tomou a deciso de morar em um bairro antes e quem se pode esperar que se mudar pra l . Por conseqncia, esse tambm um jogo dinmico. A questo central nos jogos dinmicos diz respeito credibilidade das ameaas e promessas dos agentes. s vezes, por exemplo, pode ser timo saber que o outro jogador observa sua atitude antes de tomar suas decises. Ns representamos os jogos at agora apenas pela forma normal (ou estratgica). Veremos, entretanto, que h uma outra forma de representao: a forma extensiva, uma forma mais detalhada do que a forma normal. Segue da que um jogo na forma extensiva em geral sofre perdas de informao quando o passamos para a forma normal, enquanto o inverso nem sempre possvel de se
fazer. Nos jogos estticos, no h problemas em trat-lo apenas na forma estratgica, sendo inclusive mais conveniente. Todavia, isso com certeza ocorreria nos jogos dinmicos. Por isso, os abordaremos utilizando a forma extensiva. Um jogo (de informao completa e perfeita) na forma extensiva nos d as seguintes informaes: quais so os jogadores participantes,
quais so as aes possveis para cada jogador em cada vez em que ele for chamado a decidir,
a ordenao do jogo: quem age e quando, toda a histria pregressa do jogo quando cada jogador tem de tomar uma deciso,
os payoffs dos jogadores para cada conjunto possvel de aes que tenham sido tomadas, at o final do jogo.
Exemplo
Na figura acima temos a representao de um jogo na forma extensiva. Por conveno (mas, novamente, nem sempre) o jogador 1 (j.1) o primeiro a jogar. Esse ponto dito "n inicial"e nico, no sentido a ficar claro ao longo do texto. Esse jogador pode jogar duas estratgias, ou e ou d. Diferentemente de jogos estticos, agora o jogador 2 observa a escolha de 1 e s ento faz a sua escolha.
Ele tambm ou joga e ou joga d. No entanto fundamental dizer que em jogos dinmicos a noo de estratgia (e de conjunto de estratgias) de um jogador mais complexa do que a mesma noo em jogos de escolha simultnea. Aqui
uma estratgia deve ser vista como "um plano completo de ao", deve
especificar para o jogador em questo as suas possibilidades de ao contingentes todas as aes possveis dos jogadores que jogaram antes dele. No jogo acima, por exemplo, o espao de estratgias do jogador 2
Uma vez que os jogadores 1 e 2 fizeram as suas escolhas, o payoffs so dados pelos nmeros situados aps os ltimos ns de deciso, ditos ns terminais. Por conveno, o primeiro nmero se refere ao payoffs do jogador que jogou primeiro, o segundo nmero ao payoff do jogador que jogou em segundo lugar e assim sucessivamente no caso de jogos com mais de dois jogadores. Logo, lendo o jogo acima na forma extensiva, temos 1. os jogadores: 1 e 2, 2. os espaos de estratgias, S1 = fe; dg e S2 como acima exposto, 3. a ordenao: 1 joga primeiro, 2 observa a escolha de 1 e ento faz a sua escolha, 4. a histria pregressa do jogo: quando 2 chamado a jogar ele sabe inequivocadamente qual foi a escolha de 1, 5. os payoffs: os ganhos dos jogadores para toda combinao possvel de escolhas dos jogadores. Note ento que a representao na forma extensiva apresenta todas as caractersticas destacadas acima. Ela possui em geral (mas nem sempre, como veremos em exemplos abaixo) o formato de rvores crescendo para baixo E a ttulo de curiosidade - discutiremos isso logo - o resultado desse jogo ser "o
jogador 1 jogar d e o jogador 2 jogar e se 1 jogou e, jogar d se 1 jogou d". Os payoffs sero (4; 1).
Induo Retroativa: jogos de informao completa e perfeita
Os jogos de informao completa e perfeita podem ser sintetizados da seguinte forma (para o caso de dois jogadores; com mais de dois, no h mudana significativa): 1. o jogador 1 escolhe uma ao entre as suas possibilidades delimitadas pelo conjunto de possibilidades de estratgias, 2. o jogador 2 observa a escolha do jogador 1 e ento escolhe uma ao no seu conjunto de estratgias factveis, que agora depende da ao que o jogador 1 tomou, 3. o jogo termina e os payoffs cada jogador so determinados em funo da sua escolha e tambm do elemento de interao estratgica, a escolha do outro jogador. Essa definio simples segue a apresentao de Gibbons (1992), mas pode ser muito ampliada. Alm da possibilidade de existncia de mais de dois jogadores, poderia ocorrer que dentro de um mesmo jogo um ou mais jogadores pudessem vir a jogar mais de uma vez. Alm de diversas situaes mais relevantes, inclusive de natureza econmica, mesmo outras mais simples se adaptariam claramente a esses casos. Pense, por exemplo, na maior parte dos jogos de cartas ou de tabuleiros: em geral, jogam de duas a seis pessoas, uma aps a outra, com aes tomadas um grande nmero de vezes durante o jogo. Normalmente, pelo menos a maioria deles pode ser analisada como
jogos dinmicos de informao perfeita e completa. A forma de se resolver situaes dessa natureza a descrita a seguir. Assim como em jogos estticos, solucionar jogos dinmicos tambm um exerccio de previso em que o analista busca antever o comportamento dos jogadores envolvidos tendo em mente algumas premissas sobre a postura geral dos jogadores. Mas se antes os jogadores consideravam estratgias que fossem racionalizveis apenas, agora eles tm de trabalhar com estratgias que sejam sequencialmente racionais. Isto , aquelas que no envolvam promessas/ameaas no crveis (como a do sequestrador que ameaa explodir a granada e se matar). Definio - Uma estratgia que seja sequencialmente racional deve prescrever formas de agir que sejam racionais em cada ponto de deciso que o jogador possa estar. Ou seja, o jogador no joga apenas estratgias racionalizveis, ele jogar estratgias racionalizveis sempre que for chamado a jogar. Ou seja, caso o jogador esteja em determinado ponto na rvore de deciso, ele deve ter estratgias que so timas a partir da, dadas as possveis estratgias e escolhas futuras dos outros jogadores. Trabalhando inicialmente apenas com o exemplo mais simples de jogos de informao perfeita e completa dado acima (com apenas dois jogadores fazendo uma escolha cada um durante o desenrolar do jogo), o procedimento que adotamos para resolv-lo dito induo retroativa ("backward induction") e descrito da seguinte forma. Comeamos sempre pelo final do jogo, analisando o jogador que joga por ltimo, no caso o jogador 2. Esse jogador j observou a escolha do jogador 1 e deve escolher uma estratgia tal que, condicional escolha de 1, lhe d o maior payoff possvel. O jogador 2 faz ento a sua escolha. Passamos a seguir para a anlise do problema de escolha do jogador 1. O fundamental aqui entender que, como se trata de um ambiente de informao completa, o jogador 1 tambm sabe qual ser a melhor atitude que o jogador 2 pode tomar para cada escolha que ele, jogador 1, venha a fazer. O jogador 1, por isso, no escolher aleatoriamente sua estratgia ficando, depois, torcendo para que o outro jogador faa algo que tambm seja favorvel a ele. Na verdade, no
momento de fazer a opo da melhor estratgia a se tomar ele j considerar que, dependendo do que ele escolher, isso afetar a escolha do jogador 2 e esse pensar apenas no seu prprio bem-estar no momento de definir sua estratgia. Procedendo assim, e dado que a forma de resposta do jogador 2 dada pela sua escolha condicional deciso de 1, o seu problema o problema de escolher uma estratgia que lhe d o maior payoff possvel dado que o jogador 2 reagir de forma tima sua tomada de deciso. Da soluo desse conjunto de tomadas de deciso, do jogador 1 e do jogador 2, teremos um (ou mais) par de estratgias que caracterizar o resultado de induo retroativa desse jogo. Esse resultado elimina qualquer tipo de ameaa ou promessa que no sejam crveis, pois o jogador 1 antecipa o que o jogador 2 far em cada uma das situaes possveis, buscando o seu prprio bem-estar. Assim, jogador 1 no acredita em eventuais ameaas que possam ser feitas pelo jogador 2 e que incorporem atitudes desse ltimo que no sejam timas para ele mesmo, uma vez que o jogador 1 j fez a sua ao. Exemplo1
Qual o resultado de induo retroativa do jogo acima? Vejamos o que o jogador 2 deve fazer em cada uma das situaes possveis:
se o jogador 1 joga e, o jogador 2 deve jogar e tambm e obter payoff de 3 unidades (dando 1 para o jogador 1), pois a alternativa seria obter apenas 2 unidades, caso escolhesse d.
se o jogador 1 joga d, o jogador 2 deve tambm jogar d e obter payoff de 1 unidade (gerando 2 para o jogador 1), prefervel a zero, que o que seria obtido se nesse caso ele escolhesse e.
Como o jogador 1 antecipa isso perfeitamente, ele sabe que as opes efetivamente alcanveis so apenas (e; e) e (d; d). Diante disso, ir jogar d e assim garantir utilidade de 2 unidades. O resultado de induo retroativa , portanto, (d; jogar d dado que 1 jogou d). Note, por outro lado, que esse resultado est longe de constituir algo prximo do que se poderia denominar .socialmente timo., eficiente ou afim. Se ele fosse, por exemplo, (e; d), ambos os jogadores estariam melhor. Sendo assim, por que no sugerir um acordo entre os jogadores que possa levar a esse resultado? Porque o jogador 1 sabe que, uma vez que ele cumprisse sua parte no acordo, o jogador 2 no teria incentivos em mant-lo, pois poderia obter um payoff superior. Ciente disso, o jogador 1 no se deixa levar por promessas como essas, por no serem crveis. Da mesma forma, mesmo que o jogador 2 ameace jogar e, caso o jogador 1 jogue d, esse ltimo sabe que tal ameaa tambm no crvel, e portanto no a aceita. Tudo isso simples consequncia do pleno conhecimento de racionalidade (sequencial) entre os jogadores. Nesse caso, no se requer muito, bastando que ambos os indivduos sejam racionais e que o jogador 1 saiba que o jogador 2 tambm o seja. importante lembrar tambm que no necessrio que cada jogador jogue apenas uma vez durante o jogo, como j comentamos antes. Cada um deles pode ser chamado a escolher mais de uma vez, sendo que a lgica de resoluo no se altera. Sempre se olhar inicialmente para o .m do jogo, destacando as respostas timas em cada situao, e se encontrar o resultado de induo retroativa tomando como base tais possibilidades. Exemplo 2
Considere o tradicional jogo onde uma firma est instalada (I) em um mercado enquanto monopolista e uma outra firma (E) est considerando entrar nesse mercado. Ela escolhe entre entrar ou no. Caso entre, a antiga monopolista escolhe entre lutar (fazer uma guerra de preos, por exemplo) ou acomodar-se (constituir um duoplio, um mercado onde apenas duas firmas produzem). Vejamos a forma extensiva deste jogo :
Na forma extensiva teramos: 1. os jogadores: as firmas E e I, 2. os espaos de estratgia: SE = (fora, entra) SI = (luta se a firma E entra, acomoda se a firma E entra) 3. ordenao: a firma E decide se entra ou no, a firma I observa a deciso de E e ento decide se reage ou se acomoda, 4. a histria pregressa: I, ao fazer sua escolha, sabe o que E jogou, 5. os payoffs.
O resultado por induo retroativa ser a firma E entrar no mercado e a firma I acomodar-se. Isto porque, se E entra, o payoff de I maior caso ela acomode. Como E sabe disso, ela ir entrar, apesar de uma eventual ameaa da firma I de lutar caso ela faa isso. Podemos representar o jogo acima tambm na forma normal:
Nota-se, portanto, que h dois equilbrios de Nash no jogo acima: o resultado por induo retroativa e o conjunto de estratgias onde E no entra e I luta se E entra. A questo central aqui que essa ltima ameaa no crvel e portanto no deveria ser considerada. Temos, portanto, que o conceito de equilbrio de Nash no elimina tais possibilidades, pois ele no incorpora a idia de que as estratgias devem ser sequencialmente racionais. Apenas um equilbrio de Nash no jogo acima pode ser obtido via induo retroativa e, portanto, apenas esse equilbrio um resultado sequencialmente racional. Um outro resultado muito importante na teoria de jogos dinmicos o chamado Teorema de Zermelo. Ele nos diz que todo jogo finito de informao perfeita possui um equilbrio de Nash em estratgias puras que pode ser obtido via induo retroativa (e que ser, portanto, sequencialmente racional). Alm disso, se nenhum jogador possui payoffs iguais em pontos terminais distintos, ento existe apenas um equilbrio de Nash que pode ser derivado dessa forma.
Barganha seqencial
Barganha algum tipo de situao que encontramos corriqueiramente no dia-a-dia.Observamos desde situaes muito simples, quando um filho adolescente barganha com o pai o horrio que ele pode chegar em casa nas noites de sexta-feira e sbado, em que ele prope chegar mais tarde em troca de
algum tempo a mais de estudo dirio, at situaes complexas, em que presidirios barganham com os representantes do Estado o fim de uma rebelio, ou pases que barganham tarifas comerciais sobre o conjunto de produtos que eles comercializam. Na verdade, exemplos de situaes de barganha so extremamente fceis de encontrar e ns de fato nos deparamos com tais situaes em todos os momentos - ainda que no tenhamos em mente que tal caso especfico possa ser analisado teoricamente como um jogo dinmico de informao completa. O processo de barganha geralmente interpretado como o processo de construo de um acordo mtuo sobre a proviso de um contrato. No mundo real, o prottipo bsico a negociao entre um vendedor e um comprador sobre um bem em troca de dinheiro: o contrato especifica o preo a ser pago pelo tem. Em uma negociao salarial, por exemplo, o sindicato o vendedor, a firma o comprador e o preo o salrio-base. Tanto em contextos econmicos quanto legais, um acordo pode ser retardado na medida em que as partes prolonguem a negociao. Eventualmente pode acontecer de as partes interessadas nunca chegarem a um acordo. Via de regra esse atraso implica em algum tipo de custo s partes interessadas: um custo de oportunidade da negociao, ou seja, dos ganhos que cada parte poderia estar obtendo se o acordo j tivesse sido fechado, e um custo pecunirio inerentes negociao, como por exemplo custos processuais. Esses custos de oportunidade podem ser representados pela produo que no se realizou e os custos pecunirios pelos gastos com a intermediao do acordo. Tais custos podem ser significativos em casos importantes, como aquisies corporativas, greves patrocinadas por sindicatos de trabalhadores e em diversos litgios civis. Se no se chega a um acordo, ento em algum perodo de tempo as partes param de barganhar, como no caso em que comprador e vendedor buscam parceiros alternativos para fazer seus negcios. Nesse caso, se pensarmos no contexto legal, uma corte impe alguma regra que as partes devem seguir. Nesse sentido, essas cortes legais so um exemplo de resoluo judicial de impasses. No que se segue vamos analisar o modelo terico de barganha tendo como pano de fundo um processo de negociao entre um sindicato de trabalhadores e uma entidade patronal, representante das empresas na quais esses trabalhadores
so funcionrios. No custa uma palavra de precauo aqui: como em todo modelo terico, essa representao uma simplificao das negociaes que de fato ocorrem no mundo real e nesse sentido no buscamos generalizar os resultados que obtivermos para enriquecer a nossa compreenso de negociaes como um todo, mas to somente entender esses processos de negociaes como jogos dinmicos de informao completa. O jogo se d como se segue. H, dois jogadores, 1 e 2, onde vamos considerar que 1 representa uma associao patronal e que 2 representa um sindicato de trabalhadores. Eles esto a negociar sobre a diviso dos benefcios da produo de um determinado perodo, um ano por exemplo. Esse benefcio de conhecimento comum e, obviamente, sua totalidade soma 100%. A negociao se d entre as partes de forma a decidir o percentual que cada um dos interessados tem direito sobre essa totalidade. Ambas as associaes desejam obter o mximo possvel para os seus associados e a dinmica da negociao se d do seguinte modo: 1. a associao patronal prope uma diviso; 2. o sindicato pode aceitar ou rejeitar a proposta: se o sindicato aceita, o jogo termina e cada jogador obtm o acordado. Caso contrrio, ele no aceita, o jogo continua; 3. o sindicato prope uma diviso; 4. a associao patronal pode aceitar ou rejeitar a proposta: se aceita o jogo termina e cada parte recebe o combinado. Se rejeita a proposta, ento a Justia do Trabalho impem uma diviso de 50% para cada uma das partes e o jogo tambm termina. necessrio algum tempo para preparar cada proposta e contra proposta. Por isso, se o acordo for fechado em 2, ento os jogadores tm 1 (100%) para repartir. Se terminar com a associao patronal aceitando a proposta no quaem 4, os benefcios sero apenas de
(0; 1); e se a barganha terminar com a
interveno da Justia, ento os benefcios so apenas de
. Esse termo
dito taxa de desconto intertemporal e reflete o fato de que as pessoas (e instituies) avaliam de maneira distinta uma mesma quantia monetria em diferentes perodos de tempo, captando portanto o custo de oportunidade acima
discutido. Ou seja, reflete o custo de oportunidade de no receber o valor imediatamente. Em geral essa taxa de desconto determinada pela taxa de juros da seguinte forma,
onde r a taxa de juros de mercado. Observe que quanto maior r, menor a taxa de desconto, de forma que os agentes estariam descontando com peso maior o tempo. Observe ainda que essa taxa pode refletir caractersiticas especficas das partes engajadas na barganha. Imagine por exemplo o custo de uma greve seja maior para uma das partes. Ou que um trabalhador especfico assumiu compromissos tais com sua renda que uma paralisao no seu fluxo de renda nesse perodo especfico pode lhe ser particularmente custosa. Para facilitar a nossa anlise e sem perda de generalidade, vamos considerar que ambas as partes tm a mesma taxa de desconto. Logo h dois jogadores (1 e 2), as estratgias so as descritas na rvore, assim como a ordenao e os payoffs. Como trata-se de um ambiente de memria perfeita, os movimentos dos jogadores em cada n de deciso de conhecimento comum em cada um desses ns. Sendo mais especfico, observe o que acontece no primeiro movimento: o jogador 1 diz ao jogador 2 que do total que eles esto barganhando, ele quer x [0; 1], ou x%, de forma que ele est oferecendo a 2 (1 - x)%. Como dito, 2 pode ou no aceitar. Se aceita a barganha termina e os ganhos so dados. Caso contrrio 2 faz a contraproposta ao jogador 1: do total a ser dividido, ele que (1 y)%, de modo que oferece a 1 y%. Da mesma forma o jogador 1 pode aceitar ou rejeitar. Se 1 aceita o jogo termina e os ganhos so dados. Note porm que agora j estamos no segundo estgio do jogo, de forma que as partes j incorreram em algum custo decorrente do fato de que elas no chegaram a um acordo no primeiro perodo. De Pede-se:
1. Taxa de desconto intertemporal (j est feita em jogos repetidos, mas ter em mente a questo da in.ao, taxa de juros, reputao e o exemplo do sorvete derretendo). 2. Represente o jogo na sua forma extensiva.
Os payoffs so (x; 1 - x) no primeiro estgio, segundo estgio do Trabalho.
no
caso seja necessria a interveno da Justia
2. Quanto cada jogador vai obter em equilbrio perfeito.
Por induo retroativa, no segundo (e ltimo) estgio da barganha, o sindicato oferece (y) aos empresrios, que aceitam se e somente se
Logo a proposta ser
e os ganhos nesse estgio seriam
No
primeiro estgio do jogo os empresrios ofertam (1 - x) aos trabalhadores que
aceitam se e somente se
de modo que a oferta tima ser e os ganhos
Logo o equilbrio de Nash perfeito em subjogos (o que nesse jogo equivale ao resultado por induo retroativa) ser a associao patronal ofertar
aos trabalhadores no primeiro estgio, os trabalhadores aceitarem a proposta feita, o jogo terminarbe os ganhos sero dados por
3. Se voc representasse os trabalhadores, voc preferiria fazer a proposta em primeiro lugar ou ouvir primeiro a oferta dos empresrios?
A primeira coisa a ser feita representar o jogo na forma extensiva supondobque o sindicato de trabalhadores faa a oferta em primeiro lugar, no primeiro estgio. Nesse caso os payos seriam (1 - x; x) no primeiro
estgio,
no segundo estgio e
caso fosse necessria a interveno da Justia do Trabalho. Resolvemos o jogo da mesma maneira, de modo que no segundo estgio da barganha, os empresrios oferecem (1 - y) aos trabalhadores, que aceitam se e somente se
Logo a proposta ser
e os ganhos nesse estgio seriam No primeiro estgio do jogo os trabalhadores ofertam x aos empresrios. Estes aceitam se e somente se
de modo que a oferta tima ser
e os ganhos seriam Segue que o equilbrio de Nash perfeito em subjogos ser o sindicato dos
trabalhadores ofertar empresrios aceitarem essa proposta
aos patres no primeiro estgio, os o jogo terminar ali. Os ganhos seriam
dados por
Note que os trabalhadores estaro melhor fazendo a oferta no primeiro estgio se
ou seja, se
o que sempre verdade para todo
Equilbrio Perfeito em Subjogos

At agora estudamos separadamente jogos dinmicos e jogos estticos. Entretanto, bastante usual trabalharmos com jogos que tenham partes simultneas e outras no simultneas, i.e., que tenham informao imperfeita em pelo menos algum de seus estgios. A forma de resoluo segue a mesma lgica anterior: comear de trs para diante at chegarmos no incio do jogo. Entretanto, sempre quando nos depararmos com um mini-jogo com lances simultneos (ou, no mesmo sentido, que tenha informao imperfeita), devemos resolv-lo como visto anterioriormente e ento tomarmos seu resultado (o equilbrio de Nash encontrado) como os payoffs a serem distribudos caso o jogo atinja essa parte simultnea. Vamos a uma definio:
Um subjogo de um jogo J na forma extensiva um subconjunto do jogo que tem as seguintes propriedades:
inicia-se em um ponto de deciso nico (no ligado a nenhum outro por .linhas tracejadas.) contm todos os pontos de deciso que o sucedem, e apenas esses pontos; no divide nenhum subjogo, no sentido de que se um determinado ponto de deciso pertence a um subjogo, ento todo ponto ligado a ele por alguma linha tracejada, tambm pertence, i.e., os subjogos no cortam tais linhas.
Vimos em geral que quando analisamos equilbrios de Nash de jogos em forma extensiva estes podem conter muitos equilbrios. Muitos desses equilbrios podem parecer no razoveis pois so baseados em ameaas inacreditveis. Equilbrio de Subjogo Perfeito um refinamento de equilbrio de Nash que no permite ameaas inacreditveis. Induo Reversa A tcnica mais comum para encontrar os equilbrios de subjogo perfeito de um jogo finito conhecida como induo reversa. Intuitivamente, temos que a tcnica sugere que se comece pelo fim do jogo e v resolvendo at chegar ao comeo do jogo. Podemos descrever mais formalmente esta tcnica nos seguintes passos: 1. Seja k = 1 e (k) = . 2. Seja Z1 o conjunto de todas as histrias que so antecessoras imediatas das histrias terminais do jogo (k). Para todo i N e h Z1 Hi, o jogador i enfrenta um problema de deciso aps histria h, e portanto deve escolher a ao que maximiza sua utilidade esperada. Se houver mais de uma ao que produza a mesma utilidade esperada, existir um equilbrio de subjogo perfeito contendo cada uma dessas aes. Escolha uma delas para ser a ao escolhida por i
segundo a estratgia s, isto , faa si(h) = a argmaxbMhui(h (b)). Passe ao passo seguinte. 3. Defina o jogo (k + 1) da seguinte maneira: (a) Para todo h Z (i NHi), substitua as aes em Mh do jogo (k), pelo vetor de utilidades que corresponde a histria terminal atingida pela ao escolhida no passo anterior. Passe ao passo seguinte. (b) Para todo h Z1 (iNHi)c, isto uma histria imediatamente antecessora a uma histria terminal do jogo (k) onde chance se move, substitua as aes em Mh, pelo vetor de utilidades que corresponde a utilidade esperada dos jogadores de acordo com a distribuio de probabilidade que descreve as probabilidades do jogador chance escolher cada uma das aes em Mh. Passe ao passo seguinte. 4. Se o conjunto de todas as histrias de (k+1) em que algum jogador i N se move for vazio. Pare a iterao e temos que s um equilbrio de subjogo perfeito em estratgias puras de . Caso contrrio, passe ao passo seguinte. 5. Faa k = k + 1. Volte ao passo 2. fcil ver que como o jogo finito, aps um nmero finito de iteraes o algoritmo acima descrito produzir um equilbrio de subjogo perfeito em estratgias puras. Desta forma, provamos construtivamente o seguinte teorema: Teorema: Qualquer jogo em forma extensiva com informao perfeita finito tem um equilbrio de subjogo perfeito puro.
Jogos Repetidos
Nesse tpico analisaremos novamente se ameaas e promessas em relao ao futuro podem influenciar o comportamento atual dos agentes. Ao fazer isso, buscamos mostrar o que muda em uma anlise de previso do resultado de jogos quando esses so jogados mais de uma vez. Uma das principais idias a de cooperao: ser possvel obt-la caso o jogo se repita? Intuitivamente, poderamos pensar que sim, pois um jogador poderia cooperar hoje para que os outros cooperem com ele amanh, e isso poderia valer para todos os
envolvidos. Deve-se, portanto, verificar quando e sob que condies essa intuio de fato poder se manifestar na realidade. Os jogos repetidos so divididos em dois grupos: aqueles repetidos um nmero finito de vezes e aqueles repetidos infinitamente. Em relao ao primeiro grupo, a intuio fundamental pode ser apreendida apenas analisando-se o caso de jogos repetidos duas vezes, o que iremos fazer a seguir.
Jogos repetidos finitos

A caracterstica fundamental dos jogos repetidos finitos que todos os jogadores envolvidos sabem, antecipadamente, quantas vezes aquele jogo se repetir. Pense, por exemplo, em um Congresso X de trs dias que ocorrer em um determinado hotel. Existindo dois vendedores de pipoca naquela regio, eles sabem que esse jogo (o mercado que vende pipocas na porta do hotel naqueles dias com demanda especialmente ampliada) durar exatamente trs dias, e com base nessa informao que definem suas estratgias. A questo a se verificar o que muda no caso onde o jogo jogado apenas uma vez, como visto at agora, e quando se repete um nmero especfico de vezes. Como sempre, vamos iniciar a exposio atravs do um exemplo do dilema dos prisioneiros. Suponha ento que o jogo fosse jogado duas vezes, sendo que, quando se reinicia o jogo, o resultado do primeiro estgio j conhecimento comum. Os payoffs dos jogadores sero tidos como simplesmente a soma dos payoffs nas duas vezes em que se joga. Na forma de resoluo de jogos de tal natureza deve-se analisar de trs para frente. No caso especfico citado acima, os jogadores, uma vez que se iniciar a segunda rodada do dilema dos prisioneiros, sabem que o resultado do primeiro estgio j foi consolidado e, portanto, no tm mais como mud-lo. Sendo assim, eles se preocupam apenas com o que vir, ou seja, a segunda rodada do jogo em questo. Pensando dessa forma, o que eles iro fazer no segundo estgio do jogo? Iro proceder como fariam se o jogo fosse jogado apenas uma vez (pois, afinal, o que ocorreu na primeira rodada no poder mais
ser mudado): como ambos tm uma estratgia dominante, que confessar, a jogaro na segunda vez.
Como dito acima, a idia por trs dos jogos repetidos que, como ele ser jogado mais de uma vez, pode ser que valha a pena cooperar no incio para que o outro tambm coopere com voc nos estgios subsequentes. Todavia, perceba que uma vez que se saiba que se alcanou o ltimo estgio do jogo, ningum mais ir cooperar, pois no mais se necessitar que o outro tambm coopere no futuro, uma vez que o futuro, para tal jogo, no existir - pois aquela a ltima rodada. Portanto, podemos concluir que: Observao Em um jogo repetido um nmero finito de vezes, onde os payoffs dos jogadores so a soma dos payoffs obtidos em cada vez que o jogo repetido, na ltima rodada ser jogado um Nash do jogo no repetido em questo, ainda que exista uma combinao de estratgias que d payoffs maiores para todos os jogadores mas que no seja em equilbrio de Nash. Esta seria atingvel apenas via cooperao, mas essa no existir na ltima vez em que o jogo repetido. No dilema dos prisioneiros jogado duas vezes, no primeiro estgio, os jogadores, portanto, sabem que na rodada seguinte ambos iro confessar e, assim, obter um payoff de -6 cada. Eles podem ento pensar o jogo repetido duas vezes apenas como o jogo em seu primeiro estgio acrescido de -6 para ambos nos payoffs referentes a todos os resultados possveis, uma vez que eles antecipam que esse ser o ganho de cada um na ltima rodada. O jogo original , portanto, encarado como se fosse o seguinte:
O que se fez acima foi simplesmente adicionar .6.em todos os payos possveis de todos os jogadores. Visualizando esse jogo, eles devem ento novamente confessar, dado que essa permanece sendo uma estratgia dominante para ambos. Conclui-se que o resultado do dilema dos prisioneiros repetido duas vezes ser os dois jogadores confessarem em todas elas. A cooperao no pode, portanto, ser atingida em nenhum estgio, ainda que houvesse a promessa de um deles de que iria cooperar na primeira vez, por exemplo. Ainda assim o outro no cooperaria, porque ele saberia que, agindo assim, uma vez que o resultado do primeiro estgio emergisse, no segundo ningum iria cooperar. E ento no cooperar no primeiro daria um payoff total superior a ele, independente do que o outro fizesse, sendo, pois, uma estratgia dominante. Essas concluses permanecem inalteradas mesmo se mudssemos apenas o nmero de vezes em que o jogo repetido. Isto , o resultado vlido mesmo para o dilema - ou qualquer outro jogo de informao completa - jogado n vezes, sendo n um nmero finito. Imagine que ele fosse repetido quatro vezes. Na ltima ningum cooperaria, pois no haveria um futuro para o jogo que justificasse essa atitude. Na penltima rodada, tambm ningum cooperaria, porque todos saberiam que na ltima no haveria cooperao. O mesmo ocorreria na segunda rodada: cooperar para qu, dado que na terceira e na quarta ningum o far? Na primeira, o mesmo raciocnio se manteria. O resultado geral pode ser apresentado da seguinte maneira: Observao Definindo um jogo repetido T vezes como J (T), sendo J o jogo simultneo de informao completa que repetido e tendo que, quando se reinicia um estgio de J (T), todos sabem quais so os resultados dos estgios anteriores; e definindo-se os payoffs dos jogadores como simplesmente a soma dos payoffs obtidos nos T estgios de J (T), se cada um dos estgios (J) de J (T) possui um equilbrio de Nash nico, J (T) possui um nico ENPS, qual seja, o equilbrio de Nash de J em todo estgio de J (T). Se o jogo J dinmico (mas tambm com
informao completa) e possui um nico ENPS, o ENPS do jogo repetido, J (T)47, ser tambm o ENPS de J em cada estgio. Em suma, se um jogo com apenas um Nash - ou ENPS - (e com informao completa, como todos os que vimos at agora) for repetido um nmero finito de vezes, o ENPS do jogo repetido ser o equilbrio de Nash - ou ENPS - sendo jogado em todos os seus estgios - desde que os payoffs do jogo repetido seja apenas a soma dos payoffs obtidos em cada estgio. Apesar do resultado desanimador visto acima, de que mesmo se o jogo for repetido n vezes a cooperao no ser atingida em nenhum estgio - dadas nossas hipteses adicionais -, um caso diferente emerge se existem mais de um Nash no jogo que ser jogado mais de uma vez.
Parte III Jogos com resultados incertos
Todos os jogos que analisamos at aqui eram determinsticos. Isso significa que todos os jogadores sabem com certeza o resultado de qualquer perfil de estratgia. claro que o mundo muito mais complicado do que isso. Empresas nunca sabem exatamente quanto vendero a mais quando reduzem seus preos. Negociadores de sindicatos de trabalhadores nunca sabem ao certo quais contratos sero aceitos por seus afiliados. Operadores de bolsas de valores no sabem o valor de liquidao de todas as empresas cujas aes negociam . Nesta parte mostraremos como incorporar incerteza em um jogo. Ou seja, quando um jogador escolhe entre suas estratgias, ele no sabe quais estratgias os outros jogadores escolheram, por isso no tem certeza quanto s consequncias de suas escolhas. Para analisar as decises dos jogadores em um jogo, seria til ento ter uma teoria de tomada de deciso que nos permita expressar as preferncias de um agente sobre escolhas com consequncias incertas em termos de sua atitude perante as consequncias.
Existem muitas regras de deciso que podem ser adotadas dependendo da situao por um agente que tem que realizar uma escolha sob incerteza. Assumiremos que o agente escolhe aes que so funes do estado da natureza para consequncias ou prmios e que o agente capaz de determinar qual a utilidade dessas consequncias, onde um estado da natureza uma descrio de todos os aspectos do mundo relevantes ao problema de deciso. Algumas regras requerem que o agente seja capaz de determinar uma probabilidade sobre o espao dos estados da natureza, outras no precisam desta descrio probabilstica e podem ser usadas em casos onde tal informao no disponvel ao agente.
Teoria da Utilidade Esperada
A Teoria da Utilidade ou Teoria da Preferncia surge como um mtodo de anlise de investimentos capaz de considerar as preferncias individuais dos decisores em relao ao risco. Esta importante ferramenta deve ser sempre aplicada em situaes onde esto envolvidos riscos e incertezas. A grande vantagem da Teoria da Utilidade que sua aplicao possvel no apenas em anlises de decises que envolvam resultados quantitativos, mas tambm qualitativos. A quantificao realizada pela associao de um valor abstrato de utilidade para cada uma das situaes possveis. Portanto, um evento que no tem correspondente numrico ou monetrio pode ser transformado em valores de utilidade. A primeira apresentao de utilidade como unidade para medir preferncias foi realizada por Daniel Benoulli em um artigo publicado em 1738, no qual esto descritas idias bsicas como: quantificao do quanto gostamos mais de um bem do que de outro, e quanto maior quantidade temos de algo, menos estamos dispostos a pagar mais por ele. No entanto, o grande marco na Teoria da
Utilidade foi a publicao de Theory of games and economic behaviour por John von Neumann e Oskar Morgenstern em 1944, quando houve a associao da Teoria da Utilidade com a Teoria da Deciso e a Teoria dos Jogos.
Preferncia ao Risco
O nvel de averso ao risco de determinada empresa pode ser definido atravs de entrevistas, visando determinao da utilidade que cada valor monetrio representa para os tomadores de deciso. Ela fundamental para modelarmos a melhor deciso a ser tomada pelos gerentes, atravs da definio dos projetos a serem priorizados em um ambiente de recursos limitados. Durante as entrevistas, deve ficar claro ao tomador de deciso que o analista deseja conhecer suas reais preferncias e esperanas, e que isso fundamental para o sucesso do processo. Deve haver cincia de que no existem utilidades corretas ou incorretas, mas utilidades que representem realmente os sentimentos subjetivos do indivduo.
Normalmente, os investidores buscam oportunidades de negcio com maior retorno esperado diante de um mesmo risco ou de menor risco, quando apresentam o mesmo retorno. Portanto, este o comportamento racional no mundo dos negcios, onde empresrios sempre procuram maximizar o retorno esperado e minimizar o risco do empreendimento. No entanto, a situao crtica a que se tem que decidir entre um investimento de elevado retorno monetrio, mas alto risco e um de menor retorno, porm de baixo risco. E, na realidade, so estes os tipos de decises de investimento que definem o sucesso ou o fracasso da maioria dos empresrios. Portanto, focaremos nossa anlise no comportamento dos gerentes em situaes onde eles
devem ponderar suas preferncias individuais e subjetivas entre o retorno e o risco dos projetos. Este tipo de ponderao bastante conhecido como tradeoff entre risco e retorno, e ocorre quando o investidor abre mo de um maior retorno para evitar maior exposio ao risco ou d prioridade ao projeto mais atrativo financeiramente apesar de seu elevado risco. O primeiro tipo de comportamento tpico do gerente avesso ao risco, e o segundo caracteriza um indivduo propenso ao risco, ou seja, aquele que se arrisca sem temer o fracasso, colocando tudo a perder, pois sempre acredita que alcanar o atraente resultado de sucesso. Dessa forma, este novo modelo decisrio ser capaz de determinar a melhor estratgia a ser tomada levando em considerao a disposio do investidor em assumir riscos. Por fim, o ltimo tipo de indivduo o indiferente ao risco, que baseia suas decises apenas no critrio de maximizao do valor monetrio esperado, sem considerar sua limitao de recursos. Abaixo esto ilustradas as funes-utilidade dos trs tipos de
comportamento frente ao risco.
A partir de agora iremos concentrar nossa discusso em como se define a utilidade de cada valor monetrio para os tomadores de deciso.
Funo-Utilidade
A forma mais conveniente de expressar a preferncia de um indivduo ao risco atravs da construo de sua funo-utilidade, tambm conhecida como funo de preferncia. Conforme apresentado na Figura , os mais variados comportamentos dos indivduos frente ao risco so apresentados atravs dessas funes As funes-utilidade foram primeiramente definidas por Von Neumann,em 1953. Posteriormente, foram aprimoradas e desenvolvidas por vrios outros.
Elas podem ser determinadas analiticamente atravs do uso de funes matemticas, que tm seus parmetros ajustados de modo a melhor se adequarem ao comportamento da organizao. As mais usualmente aplicadas so a linear, exponencial, logartmica e quadrada.
O coeficiente de averso ao risco est sempre presente nas funes-utilidade. Trata-se de um valor individualizado e nico para cada empresa, que reflete quantitativamente seu comportamento mais ou menos avesso ao risco. Ele inversamente proporcional tolerncia ao risco:
A funo-utilidade exponencial a mais aplicada devido facilidade de modelagem do coeficiente de averso ao risco, que coincide exatamente com o parmetro c da funo, como pode ser verificado pela formulao:
Essas funes so obtidas atravs da definio da utilidade para o tomador de deciso de cada um dos possveis resultados do evento incerto. Como no poderia ser diferente, o melhor resultado tem mxima utilidade e o pior, mnima. A utilidade um valor abstrato que serve para quantificar o quo desejvel cada uma das ocorrncias para determinada pessoa. Portanto, flagrante o elevado grau de subjetividade envolvido na definio das funes-utilidade. E, por esta razo, elas so absolutamente especficas para determinada pessoa em determinada situao, no podendo jamais serem extrapoladas para outro decisor ou outro cenrio.
Valor Esperado da Utilidade
A melhor deciso a ser tomada definida com auxlio da funo utilidade atravs do critrio de maximizao do Valor Esperado da Utilidade (VEU). O Valor Esperado da Utilidade de um projeto dado por:
Onde
VPLs Valor Presente Lquido do Sucesso; ps Probabilidade de Sucesso; VPLf Valor Presente Lquido do Fracasso; e pf Probabilidade de Fracasso.
Assim como a metodologia do VME, a tomada de deciso atravs do Valor Esperado da Utilidade (VEU) estabelece que o projeto deve ser aceito e empreendido se apresentar um VEU positivo; do contrrio, deve ser abandonado.
Vamos resolver o mesmo exemplo ilustrado na Figura , s que, dessa vez, atravs da maximizao do Valor Esperado da Utilidade (VEU) que, diferentemente da resoluo anterior pelo critrio do VME, leva em considerao a preferncia do decisor frente ao risco financeiro. Inicialmente, vamos obter junto ao tomador de deciso fictcio sua opinio pessoal a respeito da utilidade de cada um dos resultados possveis nas duas loterias oferecidas, considerando uma escala de utilidade de (-100) a 100: Para a Loteria A:
U(R$ 1.200.000,00) = 80 U( - R$ 200.000,00) = -90
Para a Loteria B:
U(R$ 12,00) = 20 U( - R$ 2,00) = - 5
Vamos agora calcular o valor esperado da utilidade: VEUA = 0,5(80)+0,5(-90) VEUA = -5 VEUB = 0,5(20)+0,5(-5) VEUB = 7,5 Portanto, o decisor, assim como a maioria dos brasileiros, nem se arriscaria na Loteria A tem utilidade negativa , pois no seria capaz de suportar a perda
de R$ 200.000,00. A loteria de valores de menor vulto seria aceita, tendo utilidade positiva para o indivduo. Atravs deste exemplo fica ntida a vantagem de se utilizar a Teoria da Utilidade como ferramenta de suporte tomada de deciso, que sempre se d de maneira individual e subjetiva.
Equivalente Certo
Outro conceito fundamental para a aplicao da Teoria da Utilidade o de Equivalente Certo. Ele corresponde ao menor valor monetrio certo e seguro que o investidor aceita para deixar de se aventurar em uma determinada situao incerta, tambm conhecida como loteria. O Equivalente Certo surge da comparao entre uma opo de investimento incerto e arriscado, com possibilidade de perdas, e outra sem incertezas ou risco, bastando colocar o dinheiro no bolso. Ento ele o valor certo oferecido para o qual ficamos indiferentes entre receb-lo ou participar de um determinado jogo. No que diz respeito a um projeto em que estejam envolvidos riscos e incertezas, o Equivalente Certo o valor mnimo que estaramos dispostos a receber para nos desfazermos dele, ou seja, o valor justo de venda do projeto. Em uma deciso de investimentos sob incertezas, podemos definir o comportamento do indivduo frente ao risco atravs da comparao entre o Equivalente Certo (EqC) e o Valor Monetrio Esperado (VME) do negcio. Vejamos: Indiferente ao Risco: EqC = VME Propenso ao Risco: EqC > VME Avesso ao Risco: EqC < VME
Alguns autores gostam de apresentar a averso ao risco como um temor do desconhecido e incerto, um sentimento de estar fora do controle da situao. Nesses casos de averso ao risco, a diferena entre o Valor Monetrio Esperado e o Equivalente Certo do investidor chamada de Prmio de Risco. Assim sendo, o tomador de deciso ser recompensado com este prmio pelo risco de perda ao decidir pela opo arriscada em detrimento ao ganho certo, dado pelo EqC. De maneira anloga, seria o valor que o indivduo avesso ao risco abre mo para se prevenir do risco de perder.
O melhor entendimento do que realmente o Equivalente Certo na prtica ser possvel com o exemplo apresentado: Um milionrio excntrico prope a referida Loteria I, incluindo em seu jogo o risco financeiro de perdas. Ele lanar uma moeda no viciada ao ar e, no caso de a face que estiver voltada para cima ser cara, lhe paga R$ 1.200,00 e, se for coroa, lhe exige R$ 200,00. Qual seria o mnimo valor monetrio certo que voc aceitaria dele para no entrar neste jogo?
Ou seja, qual o menor valor que o torna indiferente entre receb-lo com certeza ou arriscar-se no jogo proposto pelo milionrio?
Ressaltemos que o milionrio far ofertas partindo de R$ 50,00, e crescentes de forma aritmtica em R$ 50,00 at que o indivduo abordado aceite o montante oferecido para abandonar a loteria.
Sabemos que o Valor Monetrio Esperado (VME) deste jogo de R$ 500,00. No entanto, como j vimos anteriormente, o comportamento dos indivduos frente ao risco muito varivel, e influenciado principalmente por suas capacidades financeiras. O milionrio oferece a loteria a trs pessoas bem diferentes: Maurcio: Engenheiro com renda mensal de R$ 2.000,00; Alexandre: Presidente de uma corretora com renda mensal de R$ 40.000,00; e Joo: Assalariado com renda mensal de R$ 200,00.
Maurcio, que estava estacionando seu carro quando encontrou o milionrio, usaria seu raciocnio lgico, tendo um comportamento frio, sem se deixar levar muito pela emoo, frente a essa boa oportunidade de complementao do oramento mensal. A perda de R$ 200,00 no seria bemvinda, mas em nada mudaria o rumo de sua vida. De forma que se portou de
forma indiferente ao risco e aceitou no jogar quando o milionrio lhe ofereceu R$ 500,00 o Valor Monetrio Esperado da loteria. Alexandre, que estava apressado nas ruas do centro da cidade quando reencontrou um antigo amigo o milionrio excntrico , no pde perder muito tempo com a loteria oferecida. No entanto, como comumente se arrisca em jogos de azar porque sempre acredita ser possvel ganhar o maior prmio, apostava que iria conseguir os R$ 1.200,00, at porque passar aquele encontro perdendo somente R$ 200,00 lhe faria pouca falta. Dessa forma, se comportou como propenso ao risco e s aceitou deixar a loteria quando lhe foram oferecidos R$ 700,00. Joo tinha acabado de sacar da agncia bancria todo o seu salrio quando foi abordado pelo milionrio excntrico. Ponderando bastante os efeitos negativos da opo arriscada, percebeu que a perda dos R$ 200,00 seria trgica para toda a sua famlia, cuja subsistncia no ms dependia de seus rendimentos. Apesar da probabilidade de ganhar uma quantia maior ser a mesma da de perder uma menor, as pessoas avessas ao risco temem mais a segunda situao do que acreditam na primeira. Ele acabou tendo um comportamento avesso ao risco, bastante comedido, aceitando abandonar o jogo quando a oferta alcanou R$ 300,00, valor que representava o salrio de um ms e meio de trabalho duro. O milionrio, que tinha por hobby analisar o complexo comportamento dos seres humanos em relao ao dinheiro, resolveu refinar um pouco seu jogo pedindo para os trs participantes relacionarem utilidades, em uma escala definida entre (-100) e 100, para cada um dos valores monetrios oferecidos. Veremos como cada um dos trs considerou as utilidades para cada um dos resultados:
Maurcio (EqC = R$ 500,00): UM (R$1.200,00) = 30 e UM ( - R$200,00) = -10. VEUM = 0,5(30)+ 0,5(-10) VEUM = 10.
UM (EqC) = UM (R$500,00) = 10.
Alexandre (EqC = R$ 700,00): UA (R$1.200,00) = 10 e UA ( - R$200,00) = -2. VEUA = 0,5(10)+ 0,5(-2) VEUA = 4. UA (EqC) = UA (R$700,00) = 4.
Joo (EqC = R$ 300,00): UJ (R$1.200,00) = 90 e UJ (- R$200,00) = -50. VEUJ = 0,5(90)+ 0,5(-50) VEUJ = 20. UJ (EqC) = UJ (R$300,00) = 20.
Apresentamos plotada na Figura a funo-utilidade de cada um dos trs participantes, que nos permite concluir graficamente como cada um se comporta frente ao risco. A funo-utilidade linear de Maurcio explicita seu comportamento indiferente ao risco. Joo nitidamente se comporta com averso ao risco, como mostra sua funo-utilidade convexa. A curva de Alexandre a mais difcil de ser interpretada, pois o jogo oferecido apresenta baixa utilidade para ele. Se os valores monetrios fossem superiores, perceberamos com maior clareza a forma cncava de sua funo-utilidade.
Atravs deste exemplo simples e descontrado pudemos verificar como o dinheiro apresenta utilidades variadas para os indivduos. E comprovamos atravs de uma ferramenta quantitativa sem grandes complexidades matemticas, aquilo que j espervamos: a loteria oferecida pelo milionrio excntrico apresenta maior utilidade para Joo que para Mauro, e muito pouca utilidade para Alexandre. Conforme apresentado anteriormente, a capacidade de absorver perdas financeiras um dos critrios principais que definem o comportamento frente ao risco. A tolerncia ao risco destes trs personagens pode ser vista de forma anloga a das companhias de petrleo. Quanto maior a renda mensal, no caso das pessoas fsicas, ou maior o capital exploratrio das empresas de petrleo, maior a capacidade financeira de suportar perdas, e, conseqentemente, maior tolerncia ao risco. A apresentao terica e a aplicao prtica do conceito de Equivalente Certo nos permite concluir que para determinado indivduo ou organizao existe a mesma preferncia ou utilidade entre o recebimento da quantia do Equivalente Certo e a participao no evento incerto e arriscado. Dessa forma:
Verificamos anteriormente que o decisor racional em condies de risco e incerteza deixa de lado o critrio de maximizao do VME, que apresenta limitaes, passando a adotar o de maximizao do VEU. Mas observamos pela definio acima que atingiremos este objetivo atravs da maximizao da utilidade do EqC, ou simplesmente pela prpria maximizao dele, uma vez que quanto maior ele for, maior sempre ser sua utilidade para o tomador de deciso. Portanto, no processo de tomada de deciso em investimentos sob risco e incerteza devemos sempre buscar a maximizao do Equivalente Certo atravs da definio do nvel timo de participao no projeto.
Parte IV- Jogos Estticos com Informao Incompleta
Uma das novas idias mais importantes na economia que informao privada constitui um recurso valioso cujo uso pode afetar o bem-estar econmico e social tanto quanto o uso de trabalho, terra ou tecnologia. Aqui , informao privada quer dizer conhecimento sobre o estado do mundo que alguns jogadores possuem, mas outros no. Exemplos de informao privada so a financeira de uma empresa que alguns acionistas sabem qual e outros no; a disposio de um candidato a um novo emprego tem de fazer horas extras de ltima hora que no do conhecimento de seu empregador potencial; e os resultados de um levantamento entre afiliados de um sindicato trabalhista sobre um novo contrato de trabalho proposto por uma empresa e que no compartilhado com o negociador da empresa. Tais casos so conhecidos como jogos com Informao Incompleta, tambm ditos jogos bayesianos. Lembre-se que em jogos, estticos e dinmicos, de informao completa, por definio, a funo de ganho dos jogadores era de conhecimento comum. Em contraste, nos jogos de informao incompleta, a funo payoff de pelo menos um dos jogadores no ser de conhecimento comum, o que denota um elemento de incerteza na medida em que pelo menos um jogador estar incerto sobre a funo payoff dos outros jogadores. Manteremos o formato que estamos seguindo desde o comeo e apresentaremos primeiro jogos bayesianos estticos e posteriormente trataremos de jogos dinmicos. Um exemplo padro de jogos estticos de informao incompleta so leiles fechados. Cada participante (bidder) sabe a sua prpria avaliao do bem leiloado mas no conhece as avaliaes dos demais participantes. O lances (bids) so submetidos em envelopes fechados, de modo que os movimentos dos jogadores podem ser considerados simultneos. No entanto, a maioria dos jogos bayesianos interessantes economicamente so dinmicos. Como ns veremos no prximo tpico, a existncia de informao privada leva naturalmente tentativas da parte informada de se comunicar (ou enganar) e tentativas da parte no
informada de aprender e responder. Essas questes so inerentemente dinmicas. Na prxima seo vamos definir a forma de representar de um jogo bayesiano esttico e a noo de equilbrio correspondente, qual seja equilbrio bayesiano de Nash. Como tais noes so mais complexas e abstratas do que as vistas at aqui, faremos isso atravs de um exemplo, um oligoplio de Cournot sob informao incompleta. Cournot sob informao incompleta Considere um duoplio de Cournot padro em que as firmas escolhem simultaneamente o quanto produzir. A curva de demanda inversa P (Q) = a - Q e Q = q1 + q2 A funo custo da firma 1 dada por C1 (q1) = cq1 e isso de conhecimento comum. J a funo custo da firma 2 no. Ela dada por
A firma 1 no sabe ao certo qual a funo custo da firma 2 (essa firma pode ser uma firma nova no mercado ou pode ter inventado uma nova tecnologia): o que de conhecimento comum aqui a distribuio de probabilidades sobre a eficincia da firma 2 e a prpria estrutura de informao, no sentido de que a firma 1 sabe que 2 tem informao superior, a firma 2 sabe que a firma 1 sabe isso e assim sucessivamente. Como resolver esse jogo? Considere primeiro o caso da firma 2, a firma que tem mais informao. Caso ela seja ineficiente, o seu problema ser
E analogamente, caso ela seja mais eficiente, vai
Decorre das CPOs dos problemas acima que
que so as melhores respostas que a firma 2 pode dar s escolhas de 1 caso ela seja de custo alto ou de custo baixo. J o problema da firma 1, a firma no informada, maximizar o seu ganho esperado em funo da chance de 2 ser ou no eficiente. Ou seja, a firma 1
tal que as CPOs implicam que
tal que
ser a melhor resposta (esperada) que a firma 1 pode dar s escolhas de 2. Da interseo dessas 3 equaes de melhores respostas segue que
Substituindo essa expresso acima em q2 (cH) e em q2 (cL), teremos as demais ex- presses de equilbrio,
Analogamente, a firma 2 de custo baixo produzir
Logo em equilbrio as firmas produziro
A oferta esperada da indstria ser
Ou seja,
Logo
ou ainda,
tal que
O preo esperado por sua vez ser
J com relao aos lucros das firmas em equilbrio, observe que o lucro da firma 1 ser
Para mostrarmos que o raciocnio acima est correto, tome a funo lucro da firma1 um pouco mais aberta,
Ou seja,
tal que
exatamente a mesma expresso inicial. Como comum em Cournot, repare que
O lucro da firma 2 ineficiente, de custo alto, ser por sua vez
e portanto agora teremos Cournot.
, o que bastante comum em
Para podermos ter uma interpretao mais direta do lucro da firma 2 de custo alto, considere a expresso abaixo
Logo
Analogamente para a firma 2 de custo baixo, teremos
de modo que o lucro dessa firma no ser negativo se e somente se
A representao na forma normal de um jogo bayesiano esttico com n jogadores especifica os espaos das aes dos jogadores A1 , A2 , , An , os espaos dos tipos dos jogadores T1 , T2 , , Tn , suas crenas p1, p2 , , pn , e suas funes de ganhos u1, u2 , , un. O tipo ti do jogador i uma informao privada deste jogador, determina sua funo de ganhos ui(a1 , , an ; ti) , e elemento do conjunto Ti dos possveis tipos para este jogador. A crena pi(t-i| ti) do jogador i descreve a incerteza de i a respeito dos tipos possveis t-i dos n-1 outros jogadores dado o tipo ti de i . Este jogo denotado por G = { A1, A2 , , An ; T1 , T2 , , Tn ; p1 , p2 , , pn ; u1, u2 , , un }.
Conforme Harsanyi, supe-se que inicialmente a natureza sorteia um vetor de tipos ti Ti , segundo uma distribuio a priori de probabilidades p(t). A natureza revela a cada jogador i seu tipo i, ignorado pelos outros jogadores. A seguir os jogadores escolhem simultaneamente suas aes ai Ai . Finalmente os ganhos ui(a1, , an; ti) so distribuidos. Observe que desta maneira, introduzindo o jogador fictcio natureza, um jogo com informao incompleta transformado em jogo com informao imperfeita. Note que quando a natureza revela ao jogador i seu tipo i, este e os outros jogadores podem calcular sua crena pi(t-i| ti) segundo a regra de Bayes:
Note tambm que um jogador i pode dispor de informaes privadas relativas as funes de payoff dos outros jogadores alm daquelas relativas a sua funo de payoff. Neste caso sua funo de ganho depende dos tipos t1 , , tn e a escrevemos ui(a1 , , an ; ti , , tn ). Definio de um equilbrio de Nash bayesiano: Uma estratgia pura para o jogador i num jogo bayesiano esttico deve contemplar uma ao para cada tipo ti possvel. Os conjunto Si das estratgias possveis o conjunto de todas as funes com domnio Ti e contradomnio Ai : No jogo bayesiano esttico G = { A1, A2 , , An ; T1 , T2 , , Tn ; p1 , p2 , , pn ; u1, u2 , , un } uma estratgia do jogador i uma funo si(ti) onde para cada tipo ti Ti , si(ti) determina a ao pertecente ao conjunto das aes possveis Ai que o tipo ti escolheria se sorteado pela natureza. As estratgias s* = (s1*, , sn*) so um equilbrio de Nash bayesiano (em estratgias puras) se para cada jogador i e para cada ti Ti , si* (ti) soluo de
Em outras palavras, a estratgia de cada jogador (ateno: uma estratgia agora uma funo) deve ser a melhor resposta s estratgias dos outros. 3.2 Aplicaes 3.2.A Reinterpretando a estratgia mista (Harsanyi) Um NE em estratgias mistas num jogo com informao completa pode ser reinterpretando enquanto BNE em estatgias puras num jogo semelhante com um pouco de informao incompleta. Exemplo: batalha dos sexos 3.2.B Leiles de primeiro preo, envelopes fechados com valores privados vi distribuidos uniformamente e se as estratgias bi(vi) forem estritamente crescentes e diferencaveis o nico BNE simtrico bi(vi) = vi /2. 3.2.C Jogos de dupla oferta Neste jogo o vendedor e o comprador simultaneamente propem um preo de venda pv e um preo de compra pc. A venda realizada a um preo p = (pv + pc) / 2 somente se pc pv. Myerson e Satterthwaite obtiveram um importante resultado negativo: no existe BNE onde uma troca voluntria ser realizada se ela for eficiente; por exemplo se uma firma possui uma informao privada sobre a produtividade marginal m de seu empregado e se este empregado possui uma informao privada sobre seu salrio v de reservao, nenhum acordo voluntrio ocorrer se for eficiente (i.e. se v m).
Parte V Jogos Dinmicos com Informao Incompleta
Em um jogo dinmico, jogadores mal informados podem aprender alguma coisa sobre o jogo observando os movimentos de oponentes mais bem informados. Visto que incorporar tal aprendizado anlise difcil, comeamos esta parte apresentando conceitos importantes, como o teorema de Bayes. Teorema de Bayes: Suponha que os eventos A1, , Ak formem uma partio do espao S de maneira que P(Ai) > 0, i , e seja B um evento tal que P(B) >0. Ento
O teorema de Bayes oferece uma regra simples para calcular a probabilidade condicional de cada evento Aj dado B a partir da probabilidade condicional de B dado cada evento Aj e da probabilidade no condicionada de cada evento Aj. Exemplo: suponha que, conforme as estatsticas do ministrio da sade, a probabilidade de ser portador de um virus seja de 1 / 10 000. Um teste permite detectar esta doena com um grau de confiabilidade de 90 %(i.e. caso um indivduo seja portador da doena e faa o teste, o resultado ser positivo em 90 % dos casos;enquanto que caso um indivduo no seja portador da doena e faa o teste, o resultado ser positivo em 10% dos casos). Voc realiza o teste e o resultado positivo. Qual agora sua probabilidade de ter esta doena (no 90 % !)? A resposta 9 / 10 000 .
Equilbrio Bayesiano
Para um jogo bayesiano, define-se um equilbrio Bayesiano como sendo um equilbrio de Nash da representao tipo-agente do jogo bayesiano em forma
normal. Portanto, um equilbrio bayesiano especifica uma ao pura ou uma distribuio de probabilidades sobre as aesbpara cada tipo de cada jogador de forma que cada um desses tipos maximiza sua utilidade esperada quando ele sabe o seu tipo mas no sabe o tipo dos demais jogadores. Note que em um equilbrio bayesiano, a estratgia de um jogador depende apenas do seu tipo mas no dos tipos dos outros jogadores. Conforme explicamos, uma estratgia deve especificar uma ao para cada tipo de jogador no apenas para o verdadeiro tipo, pois caso contrrio no poderamos determinar a utilidade esperada dos outros jogadores que no sabem qual o verdadeiro tipo dos demais. Formalmente, um equilbrio bayesiano em estratgias mistas de um jogo bayesiano b qualquer perfil de estratgias iN tiTi (Ci) tal que para todo i N e ti Ti,
onde j(cj |tj) a probabilidade com que o tipo tj do jogador j escolhe ao cj . Exemplo: Considere um jogo bayesiano com dois jogadores, suponha que C1={x1, y1}, C2 = {x2, y2}, T1 = {1}, T2 = {2.1, 2.2}, p1(2.1|1) = 0,6, e as utilidades so dadas nas tabelas a seguir:
Para o tipo 2.1:
Para o tipo 2.2:
Neste jogo, y2 uma estratgia fortemente dominada para o tipo 2.1 e x2 fortemente dominada para o tipo 2.2, ento 2.1 deve escolher x2 e 2.2 deve escolher y2. Portanto, para o tipo 1, temos que a utilidade esperada de x1 0,6 e a utilidade esperada de y1 0,4. Portanto, o nico equilbrio bayesiano deste jogo : 1(x1|1) = 1, 2(x2|2.1) = 1, e 2(y2|2.2) = 1. Exemplo: Considere o seguinte jogo Bayesiano no qual o jogador 1 pode ter tipo ou , onde segundo o nico tipo do jogador 2, jogador 1 do tipo com probabilidade 0,9. As utilidades dos jogadores so dadas de acordo com o as tabelas a seguir: Para o tipo :
Para o tipo :
Note que existem trs equilbrios Bayesianos neste jogo: (1) 2(x2) = 1, 1(x1|) = 1, e 1(y1|) = 1; (2) 2(y2) = 1, 1(y1|) = 1, e 1(y1|) = 1; e (3) 2(x2) = 1/2, 1(x1|) = 5/9, e 1(y1|) = 1. Exemplo: Suponha que duas pessoas esto envolvidas em uma disputa. Pessoa 1 no sabe se a pessoa 2 forte ou fraca; ela associa probabilidade a pessoa 2 ser forte. Pessoa 2 est perfeitamente informada. Cada pessoa pode lutar ou se entregar. Cada pessoa recebe uma utilidade 0 se ela se entregar no importa o que a outra pessoa faa. Alm disso, cada pessoa recebe uma utilidade 1 se ela lutar e seu adversrio se entregar. Se ambas pessoas lutarem, ento suas utilidades so (1; 1) se a pessoa 2 for forte e (1;1) se a pessoa 2 for fraca. Formulando esta situao como um jogo Bayesiano e encontrando os equilbrios bayesianos se < 1 2 e se > 1 2 . Soluo: O jogo Bayesiano : N = {1, 2}; Ci = {L,E}, i N; T1 = {1}; T2 = {Ft,Fr}; p(Ft|1) = ; e as utilidades so dadas por: se o jogador 2 for forte:
se o jogador 2 for fraco:
Seja 1(L), 2(L|Ft), e 2(L|Fr) o perfil de estratgias misto. Ento, a utilidade esperada do jogador 2 forte de lutar 1, e de se entregar 0. Logo, este
tipo do jogador 2 sempre luta, isto em qualquer equilbrio Bayesiano 2(L|Ft) = 1. A utilidade esperada do jogador 2 fraco de lutar 1(L) + (1 1(L)), e de se entregar 0. Portanto, ele ir lutar se 1(L) < 1 2 ; se entregar se 1(L) > 1 2 ; e indiferente se 1(L) = 1 2 . A utilidade esperada do jogador 1 de lutar [2(L|Ft) (1) + (1 2(L|Ft))] + (1 ) = 1 22(L|Ft), e de se entregar 0. Portanto, ele ir lutar se 2(L|Ft) < 1 2 ; se entregar se 2(L|Ft) > 1 2 ; e est indiferente se 2(L|Ft) = 1 2 . Como j vimos que em todo equilbrio Bayesiano 2(L|Ft) = 1, ento o jogador 1 ir lutar se < 1 2 , e se entregar se > 1 2 . Logo, se < 1 2 ; ento o nico equilbrio bayesiano dado por 1(L) = 1; 2(L|Ft) = 1; e 2(L|Fr) = 0. Se > 1 2 ; ento o nico equilbrio bayesiano dado por 1(L) = 0; 2(L| Ft) = 1; e 2(L|Fr) = 1. Em um problema de deciso ter mais informao nunca prejudicial, pois o tomador de deciso pode sempre ignorar a informao recebida. Em um jogo, isto nem sempre verdade. Se um jogador possui mais informao e os outros jogadores souberem disso, ento o jogador pode estar numa situao pior como mostra o seguinte exemplo. Exemplo: Considere que ambos jogadores consideram igualmente provveis que esto participando dos seguintes jogos, onde 0 < < 1 2 :
Ou
Ento, a estratgia L estritamente dominante para o jogador 2, pois se 1 escolher T, L ter uma utilidade esperada de 2 enquanto M e R tero utilidade
2 , e se 1 escolher B, L ter utilidade esperada 2, enquanto M e R tero utilidade esperada 3 2 . Sabendo disto, 1 ento escolher B e no nico equilbrio de Nash, teremos que ambos jogadores recebem 2. Suponha agora que o jogador 2, antes do jogo recebe um sinal indicando qual o verdadeiro jogo. Neste caso, a estratgia R estritamente dominante para o tipo do jogador 2 que acredita que o jogo o primeiro, enquanto que a estratgia M estritamente dominante para o tipo do jogador 2 que acredita que o jogo o segundo. Sabendo disto, o jogador 1, escolher T. Ento, neste equilbrio o jogador 1 recebe 1 enquanto o jogador 2 recebe 3<2. Ento, ambos os jogadores saem perdendo com a informao extra adquirida pelo jogador 2.

Teoria Dos Jogos - Resumo

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teoria Dos Jogos - Resumo

Enviado por

Direitos autorais:

Formatos disponíveis

UnB- Universidade de Braslia Projeto: Jogos Aplicados Promoo do Desempenho Cognitivo de Idosos (ProDC) Professora: Lourdes Mattos Brasil

l Aluna: Dandara Pereira Aranha

Parte I Jogos Estticos com informao Completa

SAl = {confessar, negar},

SBob = {confessar, negar},

S={(confessar,confessar),(confessar, negar),(negar, confessar),(negar, negar)}.

ALL Confessar Negar Confessar (-5,-5) (-10,0) Negar (0,-10) (-1,-1)

2 (q1; q2) = P (Q) q2 - cq2

tal que, resolvendo,

de modo que o equilbrio de Nash desse jogo dado por

(q*1; q*2) = ( (a - c); (a - c))

[0; qi], conclumos que a c. A oferta da indstria

de modo que o lucro da firma 1 seria

de modo que as CPO.s nos mostram que

A .funo de reao do jogador i dada por

; a funo de reao, como usual em

Segue que a expresso acima fica

Segue que o lucro da i-sima firma em equilbrio ser

, ento podemos verificar (L.Hopital) que a oferta da indstria e o preo

e o lucro de equilbrio i = 0, i = 1; 2; :::; n caracterizando um equilbrio em competio perfeita (veri.que). Se n = 1, ento

Parte II Jogos Dinmicos com Informao Completa

Induo Retroativa: jogos de informao completa e perfeita

interveno da Justia, ento os benefcios so apenas de

Os payoffs so (x; 1 - x) no primeiro estgio, segundo estgio do Trabalho.

caso seja necessria a interveno da Justia

2. Quanto cada jogador vai obter em equilbrio perfeito.

Logo a proposta ser

e os ganhos nesse estgio seriam

primeiro estgio do jogo os empresrios ofertam (1 - x) aos trabalhadores que

de modo que a oferta tima ser e os ganhos

Logo a proposta ser

de modo que a oferta tima ser

trabalhadores ofertar empresrios aceitarem essa proposta

aos patres no primeiro estgio, os o jogo terminar ali. Os ganhos seriam

Note que os trabalhadores estaro melhor fazendo a oferta no primeiro estgio se

o que sempre verdade para todo

Equilbrio Perfeito em Subjogos

Jogos repetidos finitos

Parte III Jogos com resultados incertos

Teoria da Utilidade Esperada

comportamento frente ao risco.

Valor Esperado da Utilidade

U(R$ 1.200.000,00) = 80 U( - R$ 200.000,00) = -90

U(R$ 12,00) = 20 U( - R$ 2,00) = - 5

UM (EqC) = UM (R$500,00) = 10.

Parte IV- Jogos Estticos com Informao Incompleta

E analogamente, caso ela seja mais eficiente, vai

Decorre das CPOs dos problemas acima que

tal que as CPOs implicam que

Analogamente, a firma 2 de custo baixo produzir

Logo em equilbrio as firmas produziro

A oferta esperada da indstria ser

O preo esperado por sua vez ser

exatamente a mesma expresso inicial. Como comum em Cournot, repare que

O lucro da firma 2 ineficiente, de custo alto, ser por sua vez

e portanto agora teremos Cournot.

, o que bastante comum em

Analogamente para a firma 2 de custo baixo, teremos

de modo que o lucro dessa firma no ser negativo se e somente se

Parte V Jogos Dinmicos com Informao Incompleta

Para o tipo 2.1:

Para o tipo 2.2:

se o jogador 2 for fraco:

(q1; q2) = ( (a - c); (a - c))