Escolar Documentos
Profissional Documentos
Cultura Documentos
Guilherme Hamdan
Departamento de Economia, PUC-Minas e EPGE/FGV
Emanuel Ornelas
Departament of Economics, University of Georgia, USA
13 de novembro de 2006
Sumário
1 Introdução 3
1.1 O Que é Um Jogo? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Os Elementos Básicos de Um Jogo . . . . . . . . . . . . . . . . . . . . . 7
1
3 Jogos Dinâmicos de Informação Completa 74
3.1 Forma Extensiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2 Indução Retroativa: jogos de informação completa e perfeita . . . . . . . 77
3.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.3.1 O modelo de Stackelberg . . . . . . . . . . . . . . . . . . . . . . 85
3.3.2 Barganha sequencial . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.4 Equilíbrio Perfeito em Subjogos . . . . . . . . . . . . . . . . . . . . . . . 92
2
1 Introdução
Essas notas pretendem dar uma visão compreensiva da noção de comportamento
estratégico e de como essa noção se relaciona intimamente com as ciências sociais em
geral e com economia em particular. Na verdade, no que podemos caracterizar como
uma de…nição “cotidiana” do que entende-se por um jogo, poderíamos dizer que a
primeira idéia que geralmente nos ocorre é que um jogo é “uma disputa de qualquer
espécie”. No entanto isso apenas não basta: uma noção razoável do que seria um jogo
por certo nos informaria que jogos também são jogados de acordo com algumas regras
particulares associadas à cada jogo ou a um conjunto deles. Isto é, se observamos dois
jovens trocando “sopapos” na rua ou em alguma casa noturna qualquer, não diríamos
que se caracteriza um jogo, mas tão somente um destempero ou uma estupidez. No
entanto, se os levarmos para um ringue, selecionarmos oponentes com características
físicas relativamente próximas às deles, colocarmos luvas e especi…carmos quanto tempo
eles têm para lutar, o que vale e o que não vale, tudo isso sob o julgo de um terceiro que
chamamos juíz ou árbitro, então uma boa parcela das pessoas vai concordar que aquilo
pode ser chamado de um jogo - no caso, um esporte. Posto isso, não é exatamente um
problema pensarmos em exemplos imediatos a partir da caracterização sugerida. Jogos
incluem jogos esportivos, de cartas, de mesa, etc.
A grande maioria dos jogos de…nidos de acordo com essa lógica possuem um el-
emento competitivo e outro interativo. Isto é, um jogador deve levar em conta o
comportamento do(s) outro(s) jogador(res) envolvidos no jogo. Nesse sentido, seu grau
de sucesso nesse jogo dependerá não apenas da forma como ele próprio se comporta,
mas também e efetivamente das ações dos demais jogadores que estão no jogo. Por ex-
emplo, no tênis, não basta meramente tentar devolver a bola para o outro jogador, mas
sim devolvê-la de uma maneira tal que o adversário não consiga retorná-la. Portanto,
notemos, no tênis, a questão “aonde jogar a bola?”dependerá, dentre vários fatores, de
aonde o outro jogador está localizado. Da mesma forma ocorre no “War”, quando não
devemos apenas atacar as regiões em função do nosso objetivo sorteado (e lembre-se, a
vitória de um jogador nesse jogo signi…ca a derrota de todos os demais participantes),
mas também em função do poder de fogo do(s) adversário(s), que pode(m) retaliar um
ataque qualquer. Esse elemento de interação é a principal característica das situações
que estudamos em teoria dos jogos e é o que a distingue das outras áreas cujo elemento
objeto de análise é algum tipo de processo de tomada de decisão por parte de agentes
racionais, em um sentido que …cará claro no decorrer do texto.
Há várias características que são comuns a um grande leque de jogos. Primeiro, os
jogos possuem regras, mas exatamente o quê essas regras irão especi…car? Sabemos
que as regras de uma situação de interação estratégica podem ser as mais diversas
possívies, mais ou menos pormenorizadas e também mais ou menos complexas. No
entanto podemos sugerir algumas características mais gerais que vão estar incorporadas
3
pela quase totalidade dos jogos tais quais a gente os conhece. Primeiro, quais são os
jogadores. Em todo jogo há dois ou mais jogadores1 , cada um deles consciente do que
é melhor para si próprio. Logo, para a gente, um jogador é tão somente um agente
inserido em um processo de tomada de decisão, de escolha, no qual o comportamento
alheio importa. Segundo, as regras especi…cam a ordem nas quais as ações são tomadas,
assim como que ações são essas, que ações que cada jogador pode escolher. Nós vamos
chamar essas ações passíveis de escolha por um jogador de estratégia. E terceiro, as
regras de…nem qual(is) é(são) o(s) resultado(s) do jogo em função das escolhas tomadas
por cada um dos jogadores. Observe então que o resultado que um jogador (ou um
grupo de jogadores com o mesmo objetivo, uma equipe) qualquer obterá depende não
apenas de seu comportamento como também das escolhas (ações) feitas pelos demais
jogadores. Cada jogador sabe disso, e sabe que escolher a sua melhor ação possível
requer uma “previsão” e…ciente do que ele acha que os outros jogadores irão escolher.
Essas características gerais de jogos tipi…cam várias situações do mundo real que não
são jogos no sentido esportivo ou de diversão. Por exemplo, quando um representante
patronal e um líder sindical se engajam em um processo de barganha sobre a formação
de um novo contrato, pode-se caracterizar facilmente uma situação de jogo. As regras,
nesse ambiente, não são tão detalhadas e formais como um “Scotland Yard”, por ex-
emplo, mas há regras: ofertas e contra-ofertas são feitas pelas partes interessadas, que
buscam um acordo …nal o mais favorável possível para o seu lado. E mais, a formulação
da oferta por um dos lados da negociação deve considerar qual será a reação do outro
lado em função dessa oferta que ele recebeu. Outros exemplos de barganha podem
ser extraídos no nosso dia-a-dia, como é o caso quando compramos ou vendemos um
automóvel, fazemos um contrato de aluguel etc. Obviamente cada situação tem suas
especi…cidades, mas há vários elementos comuns em todos esses tipos de negociação.
A moderna teoria dos jogos iniciou sua evolução já há algum tempo. Um primeiro
marco teórico da sua fase moderna constituiu-se na contribuição de Von Neumann e
Morgenstern (1944). Entretanto, seu conceito mais difundido surgiu de um artigo de
John Nash - um dos três2 agraciados com o Prêmio Nobel de economia em 1994, de-
vido aos trabalhos na área de teoria dos jogos -, em 1951. Depois disso, muito já se
fez, embora a teoria dos jogos tenha alcançado a importância que hoje detém apenas
em períodos mais recentes, especialmente a partir da década de 1980. Atualmente,
o arcabouço de jogos ganha valor crescente, à medida em que aumentam suas possi-
bilidades de aplicação. Ele é hoje amplamente utilizado em economia - em análises
de consistências intertemporais de políticas econômicas, em organização industrial,
política antitruste e regulação, em teoria de leilões, em estrutura penal ótima e em
1
Se você estiver pensando em algum jogo no qual não há outros jogadores em “carne e osso” como
você, como é o caso de diversos vídeo-games, lembre-se que você está jogando contra a máquina. Da
mesma forma, alguém que está jogando “paciência” está jogando contra o baralho.
2
Os outros dois foram John Harsany e Reinhard Selten.
4
muitos outros casos -, mas não se restringe a ela: envereda-se também por outras área
das ciências sociais, como a sociologia, ciência política e direito, por exemplo. Um mo-
tivo para não estudá-la não pode ser, portanto, alguma eventual falta de abrangência
e aplicabilidade.
Outro ponto relevante a se ressaltar aqui nessa introdução diz respeito à taxanomia
da disciplina. Podemos dividir o estudo de teoria dos jogos em dois grandes grupos
ditos jogos cooperativos e os não-cooperativos, cuja distinção formal foge do escopo
do nosso estudo. Apenas o segundo grupo será estudado. Essa escolha baseia-se no
fato de que são sobre os jogos não-cooperativos que a teoria é mais desenvolvida e
tem maior aplicabilidade de interesse especí…co à economia. Além disso, pode-se, com
algumas hipóteses adicionais, tratar os jogos cooperativos como se também fossem
não-cooperativos. Por trás desses, a idéia básica é que cada indivíduo é eminentemente
egoísta, ou seja, procura sempre agir de modo a obter o maior benefício possível para
si mesmo, independente do que possa acontecer às outras pessoas. Evidentemente nem
sempre se veri…cam situações como essas. Pode ocorrer de um indivíduo preocupar-se
com o que acontecerá com outros indivíduos, alterando por isso a sua forma de agir em
função de algum tipo deliberado de altruísmo - pense, por exemplo, em situações que
envolvam familiares próximos. Todavia, essas possibilidades podem ser abordadas tam-
bém pela ótica individualista. Para isso, basta supor que todos os aspectos que afetam
(positiva ou negativamente) outras pessoas já estejam considerados nos números refer-
entes aos níveis de ganhos (ou utilidade) relacionados a cada situação (que chamaremos
de “payo¤s”). Essa é a abordagem que utilizaremos em todo o texto: cada jogador
escolherá suas ações de modo a ter o maior benefício para si mesmo em cada situação,
sendo que esse termo “maior benefício” considerará todos os aspectos da realidade
relacionados à própria pessoa e às outras pessoas que o indivíduo leva em consideração
de alguma forma. Agindo assim, esse indivíduo poderá ser chamado de “racional”,
hipótese que adotaremos indiscriminadamente.
Uma vez que esteja claro que trataremos apenas de jogos não-cooperativos, vamos
adotar um taxonomia padrão nos cursos de teoria dos jogos e que decorre basicamente
de duas noções associadas respectivamente à dinâmica (ao “timing”) das escolhas do
jogadores e à idéia de “informação”que adotaremos. Com relação ao “timing”do jogo,
classi…camos os jogos como jogos estáticos e jogos dinâmicos. No primeiro caso as escol-
has dos jogadores são simultâneas (como em um jogo de par ou ímpar) e no segundo são
sequenciais, no sentido de que algum jogador, ao tomar sua decisão, já observou alguma
escolha alheia que é relevante para essa sua escolha. Por outro lado, para cada tipo de
jogo que venhamos a analisar nesse curso, estará associada, explícita ou implicitamente,
alguma caracterização informacional do ambiente. Essa caracterização é fundamental e
para termos uma idéia inicial da explicação de sua relevância basta focarmos mais uma
vez no caráter de interdependência da interação entre os agentes: se é verdade que o
5
comportamento alheio importa para cada jogador em particular, então o processamento
das informações (ou seja, o conhecimento) que cada um tem sobre esse comportamento
alheio é em si um elemento relevante de análise. Jogos não-cooperativos são portanto
classi…cados de acordo com uma série de conceitos associados à cada situação, como in-
formação completa ou incompleta, perfeita ou imperfeita, simétrica ou assimétrica etc.
Para nós aqui nesse curso será de fato importante entender o que signi…ca “conhecer
um fato sequencialmente” e trabalharmos com as idéias de jogos estáticos e dinâmi-
cos de informação completa (e perfeita/imperfeita) e jogos estáticos e dinâmicos de
informação incompleta, nessa ordem. Para cada uma dessas noções especi…caremos um
conceito de equilíbrio segundo o qual faremos previsões sobre o comportamento dos
jogadores envolvidos de forma a inferir alguma coisa sobre o resultado daquele jogo.
Isto posto, tenha em mente que o objetivo deste texto é apresentar os principais de-
senvolvimentos e aplicações da teoria dos jogos. Para tanto seus conceitos mais impor-
tantes são apresentados, no sentido de possibilitar a previsão dos resultados de alguns
jogos, com maior ou menor acuidade. O texto procurará se ater às formalizações apenas
na medida em que as consideramos necessárias para de…nir precisamente o objeto em es-
tudo, mas espera-se que em momento algum o aluno se veja em di…culdades em função
de algum tipo de formalização. Praticamente nenhuma demonstração matemática é
desenvolvida, uma vez que a nossa meta é apresentar um texto de nível introdutório,
acessível àqueles com razoável domínio dos conceitos básicos de (micro)economia. Vale
ressaltar também que não é um objetivo apresentar qualquer inovação teórica, mas
apenas sistematizar alguns dos aspectos mais importantes e já consolidados de teoria
dos jogos, uma vez que ainda não existe nenhum texto satisfatório publicado em por-
tuguês que tenha as características de referência básica e, ao mesmo tempo, trate do
assunto com a profundidade mínima requerida. Obviamente, uma in…nidade de de-
senvolvimentos recentes da teoria não serão incorporados no texto, que, pode-se dizer,
tenta simplesmente cumprir o papel de um “livro-texto”para estudantes de graduação
em economia - e nada mais além disso.
6
rada. Sendo assim, naqueles casos os indivíduos, as …rmas ou as instituições (governo,
por exemplo), ao de…nirem suas escolhas ótimas, não se preocupam com o que os out-
ros agentes poderão fazer. Por outro lado, se existe a interdependência, caracteriza-se
então uma situação onde há externalidades nas ações dos agentes, e por isso cada
um, ao fazer suas escolhas, preocupa-se com como os outros irão (ou poderão) agir.
Dessa forma o que estamos buscando em última instância é tão somente emprestar à
anàlise das situações de interesse um elemento a mais de realismo que decorre do fato
de que pessoas, empresas e instituições interagem entre si e que essas interações têm
implicações relevantes do ponto de vista individual e social.
Com essa de…nição, podemos perceber que praticamente todas as situações que
usualmente as pessoas chamam correntemente de “jogo” de fato são aqui também
caracterizadas como tal. Todavia, muitas outras situações, inclusive (mas não apenas)
econômicas e jurídicas, também se enquadram na de…nição.
2. as regras (quem move quando? O que se sabe quando for sua vez de jogar? etc.),
3. os resultados (para cada conjunto de ações dos jogadores, quais são os resulta-
dos?),
7
racionais. Sem perda de generalidade, considere por enquanto que agentes racionais
são aqueles que, tendo que escolher uma opção dentre um conjunto de possibilidades,
escolhe aquela que melhor lher convier - ou dito de outra forma, aquela que lhe dá a
maior utilidade. Vamos rapidamente quali…car esse processo de escolha5 .
Considere um cidadão que está sendo acusado pelo Estado de um delito qualquer.
Em um depoimento à autoridade legal constituída, ele pode contar três estórias que
são igualmente críveis, não importando se alguma delas é ou não verídica. Chamemos
essas opções de escolha de 1; 2; 3. Por algum motivo qualquer, esse cidadão sabe que
sua pena no caso de escolher cada uma das opções é de 3,6 ou 9 meses, respectivamente.
Considerando que no caso dele …car preso lhe confere um custo (crescente no tempo de
prisão, de maneira que esse indivíduo está tanto pior quanto maior for o seu tempo de
prisão), então podemos dizer que a opção 1 é (estritamente) preferível à opção 2, que a
opção 1 é (estritamente) preferível à opção 3 e que a opção 2 é (estritamente) preferível
à opção 36 . Logo, se esse cidadão escolhe a opção 1, dizemos que ele é racional. Se
as penas fossem de 3,3 e 6 meses , respectivamente, então diríamos que a opção 1 é
preferível à opção 2, que a opção 2 é preferível à opção 1 (de modo que as opções 1 e
2 são opções semelhantes do ponto de vista de quem está escolhendo - dizemos que o
agente é indiferente entre 1 e 2), que a opção 1 é (estritamente) preferível à opção 3. e
que a opção 2 é (estritamente) preferível à opção 3. Nesse caso, se o cidadão escolhesse
a opção 1 ou a opção 2 diríamos que ele é racional.
Na verdade o que estamos propondo aqui é tão somente uma forma de organizar
teoricamente o processo de escolha de um agente qualquer. Adotamos a hipótese de
que, no caso em que ele tem que fazer uma escolha dentre um leque de opções, esse
agente é capaz de ordenar todas essas opções de acordo com suas preferências7 . Essas
preferências, por sua vez, são formalmente representadas por funções matemáticas ditas
"funções utilidade". Antes que alguém se assuste com algum argumento formal, vamos
logo dizer que uma função utilidade apenas traduz de maneira numérica o processo
através do qual um agente, um jogador, faz a sua escolha. No exemplo acima, suponha
que essa função fosse dada por
1
u (x) = , onde x 2 f3; 6; 9g .
x
no sentido de não estar inserido em algum sistema legal constituído, como por exemplo uma …rma que
opera no setor informal da economia ou um criminoso) que possa ser representada em alguma situação
de comportamento estratégico.
5
Essa seção é uma inserção muito breve de textos encontrados comumente em livros-textos de
microeconomia. Os alunos interessados devem recorrer a esses livros para uma exposição mais completa
do assunto.
6
Dizemos que as preferências de um agente qualquer são "transitivas"quando, por exemplo, dadas
três opções 1,2 e 3 tais que 1 é prefeível a 2 e 2 é preferível a 3, podemos dizer que 1 é preferível a 3.
7
Nesse caso dizemos que as preferências são "completas": entre um conjunto de duas ou mais opções
no processo de escolha, o agente é sempre capaz de ordenar essas opções de acordo com um índice indica
seu bem-estar, uma função utilidade.
8
Isso é, a utilidade do agente depende das escolhas que ele deve fazer e que, cada uma,
lhe custarão algum tempo de cadeia, x = 3; 6 ou 9 meses. Então
8
> 1
< u (3) = 3
u (6) = 16 tal que, observe, u (3) > u (6) > u (9)
>
: u (9) = 1
9
de maneira que, por esse critério, o agente seria racional8 se escolhesse a opção 1, na
medida em que a sua utilidade seria maior do que se escolhesse qualquer das outras
duas possibilidades. É importante notar que a função acima, u (x) = x1 , não é a única
função que pode representar as preferências do nosso agente - na verdade há inúmeras
possibilidades. Por exemplo, suponha que
a
u (x) = , onde a > 1é uma constante e x 2 f3; 6; 9g .
x
Nesse caso, 8
> a
< u (3) = 3
a
u (6) = 6
tal que, novamente, u (3) > u (6) > u (9)
>
: u (9) = a
9
Segue então que para a gente não importa exatamente o quanto um agente prefere uma
opção à outra, mas tão somente a ordem na qual ele estabelece essas opções. Nesse
sentido, ambas as funções utilidades representam as preferências do mesmo agente
descrito acima. Faça a mesma coisa para o segundo ordedamento proposto acima, 3,3
e 6 meses, e veri…que o que se dá.
Isto posto, uma função de ganho ("payo¤") é tão somente uma representação
numérica das preferências dos jogadores em função de suas possibilidades de escolha.
No entanto, como se trata de situações de interdependência estratégica, essa função
depende também das possibilidades de escolha dos demais jogadores envolvidos. Mas
no …nal o número associado àquelas opções escolhidas na verdade re‡etem um conjunto
de preferências subjacentes que nos permitirão ordenar as opções de escolha de cada
jogador de uma forma clara que …cará expressa nos exemplos abaixo.
8
Nesse ponto do texto, sem considerarmos elementos de interação estratégica, dizemos que um
agente é racional se suas preferências são completas e transitivas.
9
Exemplos: De…nidos os elementos principais e feita essa breve explanação sobre a
representação das preferências dos jogadores, podemos sugerir alguns exemplos simples
para começarmos a pensar em situações passíveis de serem modeladas como jogos.
3. se o resultado das duas moedas for o mesmo, 1 paga R$1,00 para 2; caso contrário,
a ordem do pagamento se inverte,
2. como todos quase certamente conhecem o jogo, de…na você mesmo(a) como um
exercício os seus elementos básicos.
Os exemplos acima são situações de claro con‡ito, uma vez que o que um jogador
ganha o outro perde: são exemplos do que chamamos de jogos de soma zero. Essa é
uma possibilidade, mas que não necessariamente sempre ocorrerá. O exemplo abaixo
fornece um caso diferente, onde dois jogadores ou ganham juntos ou perdem juntos.
Exemplo 3 - Encontro em BH
4. eles teriam payo¤ s iguais a uma unidade (qualquer que seja) almoçando juntos,
e de zero almoçando sozinhos.
Como se percebe nesse último caso, os jogadores têm interesses alinhados - o prob-
lema a se tentar superar é a falta de coordenação entre eles. Claramente, portanto,
esse não é um jogo de soma zero.
10
2 Jogos Estáticos de Informação Completa
A primeira classe de jogos que serão apresentados são chamados jogos estáticos, em
comparação com os sequenciais (ou dinâmicos), que serão vistos mais à frente. Esses
jogos são ditos também jogos simultâneos, uma vez que os jogadores de…nem suas
formas de agir “ao mesmo tempo”. O exemplo imediato é o jogo de “par ou ímpar”,
no qual os dois jogadores revelam suas estratégias ao mesmo tempo. Antes que se faça
alguma restrição sobre a realidade dessa premissa, note que não é necessário que de
fato os jogadores façam suas escolhas literalmente ao mesmo tempo, mas tão somente
que cada um dos jogadores, ao fazer a sua escolha sobre qual estratégia adotar, não
tenha observado as escolhas feitas pelos demais jogadores. Nesse caso poderíamos ter
um jogo de “par ou ímpar”, estático, em que um dos jogadores fez a escolha, digamos,
10 minutos antes do outro. Basta que o outro jogador, ao escolher o seu número, não
saiba qual foi a escolha daquele que jogou primeiro.
Quanto ao caráter de informação completa, refere-se ao fato de que cada um dos
envolvidos conheçam as funções de ganho de todos os outros. Sendo um pouco mais
rigoroso, isso signi…ca que a “função payo¤ de cada jogador é de conhecimento comum
(common knowledge)”. Como exemplo, considere um jogo com dois jogadores, 1 e 2.
Como já sabemos, esses jogadores têm um conjunto de opções dentre as quais cada
um deve escolher uma da melhor forma que lhe convier. Mas sabemos cada par de
escolhas possíveis associa a cada jogador uma utilidade, um número de acordo com o
qual pode-se identi…car se cada um está em melhor ou pior situação do que nas demais
opções. Nesse contexto, dizer que o jogo é de informação completa signi…ca dizer que
cada jogador sabe não apenas a sua utilidade para cada combinação de escolha mas
conhece também a utilidade do outro jogador em cada situação. Mas mais do que
isso: cada jogador sabe também que o outro conhece a sua utilidade associada a essas
opções. E mais ainda: cada jogador sabe que o outro sabe que ele sabe a utilidade do
outro jogador em cada situação. E assim sucessivamente.
Sendo um pouco mais formal, dizemos que um jogo qualquer é de informação com-
pleta quando a função de ganho (payo¤) de cada jogador é de "conhecimento comum".
Para entendermos o que esse termo signi…ca, considere como exemplo uma situação com
apenas dois agentes, 1 e 2. Nós dizemos que um evento X qualquer é de “conhecimento
comum” nesse jogo se
1 sabe que 2 sabe que X ocorreu; 2 sabe que 1 sabe que X ocorreu.
1 sabe que 2 sabe que 1 sabe que X ocorreu; 2 sabe que 1 sabe que 2 sabe que
X ocorreu
11
e assim in…nitamente. Sendo assim, um jogo estático com dois jogadores, 1 e 2, é
de informação completa se, na de…nição acima
Ou seja,
1 sabe que 2 conhece a função payo¤ de 1; 2 sabe que 1 conhece a função payo¤
de 2.
1 sabe que 2 sabe que 1 sabe a função payo¤ de 2; 2 sabe que 1 sabe que 2 sabe
a função payo¤ de 1.
e assim sequencialmente.
Nesse jogos estáticos de informação completa (por de…nição, a função de ganho é
de conhecimento comum) assumimos também que a racionalidade9 dos jogadores é de
conhecimento comum. Nesse caso,
1 sabe que 2 sabe que 1 é racional; 2 sabe que 1 sabe que 2 é racional.
1 sabe que 2 sabe que 1 sabe que 2 é racional; 2 sabe que 1 sabe que 2 sabe que
1 é racional
e assim in…nitamente.
Logo adiante, quando começarmos a analisar a resolução de jogos estáticos de infor-
mação completa, …cará claro porque a noção de conhecimento comum de um determi-
nado evento é relevante. Essa hipótese (informação completa) será utilizada em quase
todo o texto, sendo ‡exibilizada apenas no …nal - isso se houver tempo hábil. O motivo
fundamental dessa restrição é que a sua não utilização di…cultaria signi…cativamente
a análise, fugindo do escopo do texto e do curso - embora a teoria dos jogos de in-
formação incompleta já tenha sido signi…cativamente desenvolvida e consolidada, mas
de…nitivamente está em um patamar de complexidade superior ao aqui pretendido.
Vamos a partir de agora propor uma estrutura que será seguida ao longo dessas
notas: uma vez entendido o conceito mais amplo (aqui, jogos estáticos de informação
completa), vamos fazer uma exposição sobre a forma correta de representar esse tipo
de jogo e posteriormente discutir como solucionar essa classe de jogos, com diversas
nuances especí…cas associadas a cada uma das situações. Disso tratamos agora.
9
A de…nição de racionalidade nesse contexto de interdependência está descrita na próxima seção do
texto.
12
2.1 Representação de Jogos Estáticos de Informação Completa: Forma
Normal ou Estratégica.
A forma que utilizamos para representar jogos estáticos de informação completa é
dita forma normal (ou estratégica). De acordo com a forma normal, devemos ter as
seguintes informações sobre um jogo com n > 1 jogadores:
1. Os jogadores: 1; 2; :::; n.
2. O espaço (ou conjunto) de estratégia de cada jogador. Esse conjunto vai nos dizer
quais são as possibilidade de escolha de cada um dos jogadores. Por exemplo, no
jogo “par ou ímpar” o espaco de cada jogador i = 1; 2 é
Si = fpar, ímparg
Nesse ponto deve estar claro que o que chamamos de estratégia é apenas uma
opção, uma escolha, uma ação possível que cada jogador pode tomar.
3. A função de ganho (payo¤) para cada jogador i = 1; 2; :::; n. Essa função, para
um jogador i qualquer, associa um número em função das possibilidades de escolha
de cada jogador. É ela que caracteriza o elemento de comportamento estratégico
dos jogos na medida em que o ganho de cada jogador é afetado pela sua própria
escolha mas também é afetado em alguma medida pelas estratégias adotadas por
cada cada um dos demais jogadores.
Nos jogos estáticos, o conjunto das estratégias disponíveis a cada jogador são de
fácil visualização, correspondendo às opções de ação que cada jogador pode escolher.
Veremos posteriormente que nem sempre elas serão tão claras, como no caso dos jogos
dinâmicos. Sendo um pouco mais rigoroso, tome a de…nição abaixo:
1. os jogadores 1,2,...,n.
13
2. os espaçoes de estratégias,
8
>
> S1 = fs11 ; s12 ; :::; s1k1 g
>
< S = fs ; s ; :::; s g
2 21 22 2k2
>
> :::
>
:
Sn = fsn1 ; sn2 ; :::; snkn g
onde sij 2 Si é a j-ésima opção (estratégia) que o jogador i pode adotar no jogo.
Ou seja, uma função especí…ca a cada jogador que associda um nível de utili-
dade a partir da sua escolha (si 2 Si ) e das escolhas dos demais n 1 jogadores
(s i 2 S i ). Aqui o termo s i denota as escolhas de todos o jogadores que não o
jogador i.
Exemplo 4 - Dilema dos Prisioneiros: este constitui certamente o exemplo mais con-
hecido em teoria dos jogos, em função da sua estrutura simples e do seu resultado
intrigante. Há inúmeras versões do jogo, que pode ser adaptado a situações muito dis-
tintas entre si. Mostraremos aqui primeiro a versão de Dixit e Nalebu¤ (1994), uma
das mais criativas. Depois analisamos a estória padrão.
A idéia é que havia um maestro que viajava de trem na antiga URSS. Com aparência
não convencional, foi interpelado pelos policiais da KGB, que imaginaram poder tratar-
se de um espião. Revistando suas bagagens, os policiais encontraram partituras, que
interpretaram como códigos. Apesar do maestro insistir que eram apenas partituras
de músicas de Tchaikóvski que ele interpretava, acabou sendo preso. Passado algum
tempo na prisão, chegaram os o…ciais ao maestro e disseram-lhe que ele teria um dia
para decidir-se entre confessar ou não, mas que seria melhor confessar, uma vez que
eles já haviam prendido o tal de “Tchaikóvski”. A proposta, feita aos dois prisioneiros,
era a seguinte: se ambos confessassem, cada um …caria preso seis anos; se ninguém
confessasse, como não haveriam provas concretas, …cariam ambos presos por um ano; se
um confessasse e o outro não, o primeiro seria solto imediatamente, como prêmio à sua
colaboração com a KGB, enquanto o outro, que além de culpado não havia colaborado,
…caria detido por nove anos. O jogo é representado abaixo na forma normal em uma
(bi)matriz, que é uma matriz aonde cada entrada possui dois números:
Tchaiskóvski
NC C
Maestro NC 1; 1 9; 0
C 0; 9 6; 6
14
Logo, se está na forma normal, devemos extrair as três informações: (i) os jogadores:
Maestro e Tchaiskóvski; (ii) para cada um dos jogadores, as estratégias possíveis: con-
fessar (C) e não confessar (NC) e (iii) a função de ganho de cada jogador: os payo¤s
do jogador 1 - Maestro - situam-se à esquerda em cada célula. Por sua vez, os payo¤s
do jogador 2 - o que teve o azar de se chamar Tchaikóvski - encontram-se à direita.
Essa será a regra utilizada em todo o texto e que é padrão na representação na forma
estratégica: o jogador 1 e suas estratégias à esquerda, o jogador 2 e suas estratégias
acima e, em cada célula, os payo¤s dos jogadores 1 e 2 à esquerda e à direita, re-
spectivamente. Aqui, portanto, o número de jogadores é igual a dois, o conjunto de
estratégias do Maestro é fC; N Cg, assim como o é o do jogador Tchaikóvski também
é esse. Os resultados possíveis e os payo¤s para cada um deles são os mostrados no
quadro acima: por exemplo, se ambos não confessam, cada jogador ganha ( 1; 1),
que é uma medida do “bem-estar”, da “utilidade (ou desutilidade, no caso)” dos jo-
gadores Maestro e Tchaiskóvski, respectivamente, caso ambos de declaram inocente. A
lógica é que se ambos confessam, …cam cada um 6 anos presos. Se ambos se declaram
inocentes, não há provas su…cientes mas em função do processo cada um …ca 1 ano
preso. E se um jogador confessa e o outro não, então aquele que confessou tem um
prêmio por ter confessado e é imediatamente libertado, enquanto que aquele que não
confessou é punido por sua atitude de suposta não-cooperação e …ca preso por 9 anos.
Essa é tão somente uma primeira representação do Dilema dos Prisioneiros adaptada
para a estória acima. Outra estória, mais simples e recorrente, é tão somente que duas
pessoas foram presas pela polícia e acusadas de cometer um delito qualquer - mas
nós não sabemos (nem ninguém, a não ser os próprios jogadores) se efetivamente eles
(ou um deles) são ou não culpados. Eles estão presos em celas separadas e cada um
tem a opção de confessar ou não a autoria do delito. Sendo um jogo estático de
informação completa, quando cada jogador faz a sua escolha ele não sabe a escolha
do outro jogador (jogo estático). Além disso, a matriz de ganhos é de conhecimento
comum (jogo de informação completa), de modo que ambos os jogadores visualizam sem
nenhuma incerteza a matriz de ganhos, com as estratégias de cada jogador e os payo¤s
de cada um para cada combinação de estratégias possíveis. Note que esses payo¤s são
representações relativas das preferências de cada jogador e de forma alguma é único -
observe que os payo¤s no jogo acima são distintos dos payo¤s no jogo abaixo. O que
importa é que toda representação possível dessa estória preserve o ordenamento dos
ganhos dos jogadores. Por exemplo, a matriz
Jogador 2
Não Confessa (N C) Confessa (C)
Jogador 1 Não Confessa (N C) 5; 5 1; 7
Confessa (C) 7; 1 4; 4
15
também pode ser a forma normal da mesma estória que descreve o Dilema dos Pri-
sioneiros.
Esse jogo, veremos adiante, tem um resultado surpreendente: ainda que ambos
os jogadores.sejam inocentes e que ambos estejam melhor quando ambos jogam não
confessar, N C, o melhor que cada um pode fazer individualmente é se declarar culpado e
jogar C. Esse resultado decorre em função do elemento de interdependência estratégica
que caracteriza o Dilema dos Prisioneiros.
Exemplo 5 - Par ou ímpar. Como exercício, descreva o jogo de par ou ímpar a partir
da matriz abaixo. Quais são os jogadores? E as estratégias de cada um? Quem jogou
par e quem jogou ímpar?
Jogador 2
Par Ímpar
Jogador 1 Par 1; 1 1; 1
Ímpar 1; 1 1; 1
Exemplo 6 - Guerra dos sexos. Um homem e uma mulher (na verdade um casal)
devem decidir o programa que farão hoje à noite. Eles podem ir ao teatro ou ir ao
Mineirão ver um jogo de futebol. A matriz abaixo descreve o jogo:
Mulher
Mineirão Teatro
Homem Mineirão 3; 2 1; 1
Teatro 1; 1 2; 3
Descreva o jogo (jogadores, estratégias e payo¤ s) e note que o homem prefere ir ao
futebol acompanhado da mulher. Mas ele prefere ir ao teatro acompanhado da mulher
do que ir sozinho ao Maracanã. O mesmo acontece com a mulher, só que ela dá
preferência pelo teatro.
Exemplo 7 - O jogo do covarde ("the chicken game"). Nesse jogo dois motoristas,
1 e 2, se encontram em um estrada. Naquele lugar especí…co, há uma ponte estreita,
de modo que apenas um veículo passa de cada vez. Logo, cada um pode avançar ou
esperar o outro passar primeiro. Se algum dos jogadores, 1 por exemplo, avança e o
outro espera, ele segue sua viagem e o outro espera um pouco mais - e vice-versa. Mas
se ele avança e o oponente também, então há uma colisão e ambos perdem. O jogo é
representado na bimatriz abaixo:
Motorista 2
Avança Espera
Motorista 1 Avança 5; 5 5; 0
Espera 0; 5 1; 1
16
Exemplo 8 - Pedra x Papel x Tesoura. Neste jogo (um par ou ímpar mais so…sticado),
cada jogador escolhe simultaneamente um dos três objetos relacionados abaixo (suas
estratégias). Dependendo da combinação …nal, pode-se ganhar 1, -1 ou 0 (a lógica é
que pedra ganha de tesoura, que vence o papel, que se sobrepõe à pedra; se o objeto for
o mesmo, ninguém ganha).
Jogador 2
pedra papel tesoura
pedra 0; 0 1; 1 1; 1
Jogador 1 papel 1; 1 0; 0 1; 1
tesoura 1; 1 1; 1 0; 0
Temos portanto na forma normal (ou estratégica):
1. os jogadores: 1 e 2.
3. a função de ganho (payo¤) de cada jogador: qual o ganho que jogador terá para
cada combinação possível de estratégias.
17
de previsão utilizado. A outra refere-se à abrangência do método, que diz respeito ao
número de situações onde exista interdependência estratégica entre os envolvidos que
ele consegue oferecer um resultado provável para ele. Infelizmente, em geral os métodos
mais precisos são os menos abrangentes, e vice-versa. Procuraremos apresentá-los em
ordem decrescente de precisão (consequentemente, em ordem crescente de abrangên-
cia). Portanto, o primeiro gerará respostas a muito poucos jogos, com a vantagem
de que, quando a apresentar, essa será altamente con…ável. Por outro lado, o último
propiciará respostas a um número muito superior de situações, embora seus resultados
devam ser compreendidos com algumas ressalvas que nós iremos discutir.
Jogador 2
NC C
Jogador 1 NC 5; 5 1; 7
C 7; 1 4; 4
18
dos Prisioneiros o per…l de estratégias ("Confessar", "Confessar") é um equilíbrio com
estratégias estritamente dominantes.
Ou seja, em um jogo estático de informação completa J com n jogadores, considere
o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que a
estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é uma
estratégia estritamente dominante para o jogador i quando, independente das
escolhas alheias, o ganho que o jogador i tem jogando si 2 Si é estritamente maior do
que o ganho que ele teria jogando qualquer outra estratégia disponível no seu espaço de
estratégias, s0i 2 Si . Se para cada jogador i = 1; 2; :::; n há uma estratégia estritamente
dominante s1 2 S1 ; s2 2 S2 ; :::; sn 2 Sn , então (s1 ; s2 ; :::; sn ) é dito um equilíbrio com
estratégias estritamente dominantes. Formalmente,
Logo, se um jogador tem uma estratégia que é estritamente dominante, ele, sendo
racional, deve sempre jogá-la, pois, por de…nição, não haverá nada melhor a se fazer. Se
todos os envolvidos em um determinado jogo possuem estratégias estritamente dom-
inantes, seu resultado torna-se portanto facilmente conhecido, dada a racionalidade
dos jogadores. O grau de acuidade dessa previsão é, de fato, extremamente potente.
A…nal, é pouco provável que alguém não escolha fazer algo que seja reconhecidamente
preferível a ele(a) sempre.
Observe também a curiosidade da seguinte nuance no Dilema dos Prisioneiros. Con-
sidere que a polícia permita que os prisioneiros possam se comunicar entre si e, eventual-
mente, estabelecer algum acordo no sentido de nenhum deles confessar, para …carem
detidos por menos tempo. Nesse caso, qualquer acordo que emergisse do contato entre
19
eles não teria credibilidade no sentido de que ambos os jogadores teriam incentivos a
não cumprir o acordo, independentemente do fato de um jogador acreditar ou não que
o outro irá cumprí-lo ou não. Como resultado, ambos acabam obtendo um resultado
que é pior para todos, …cando ambos com um payo¤ de 4. É curioso perceber tam-
bém que esse é o resultado que deverá prevalecer mesmo que ambos fossem inocentes,
como seriam no exemplo dado o Maestro e o que teve a má sorte de possuir pais que
apreciassem o nome Tchaikóvski.
Caso tenhamos uma situação onde todos os jogadores, menos um, tenham estraté-
gias estritamente dominantes, o resultado da interação também pode ser facilmente
previsto. O que ocorrerá é que o jogador que não possui uma estratégia que seja estri-
tamente dominante escolherá a alternativa que lhe dará maior utilidade, tomando como
dado11 que os outros jogadores irão jogar aquelas estratégias que forem dominantes para
eles.
jogador 2
E C D
A 0; 1 4; 0 5; 3
jogador 1 M 4; 0 2; 0 5; 3
B 3; 2 3; 5 6; 6
No jogo acima na forma normal (ou estratégica) temos
1. os jogadores: 1 e 2
20
2.2.2 Estratégias Estritamente Dominadas
Jogador 2
NC C
Jogador 1 NC 5; 5 1; 7
C 7; 1 4; 4
Em um jogo como este (e em todo jogo estático de informação completa), dizemos que
uma estratégia de um jogador qualquer (do jogador 1, por exemplo) é uma estratégia
estritamente dominada por alguma outra estratégia desse jogador se, independente
da escolha do outro jogador, o ganho que ele tem jogando esta estratégia é estrita-
mente menor do que o ganho que ele teria jogando a outra estratégia. Novamente,
como há duas estratégias, "Não Confessar"e "Confessar", devemos analisar as duas
possibilidades. Para veri…car se há a existência de estratégias estritamente dominadas,
olhamos, para cada jogador, os payo¤s associados às estratégias comparadas duas a
duas. Em um jogo representado na forma normal, na forma de matriz, deve-se então
supor que o outro jogador escolha cada uma das suas estratégias possíveis. Compara-
mos então as duas estratégias (se houvessem mais as compararíamos também), e se o
ganho for sempre estritamente menor, então essa se constitui em uma estratégia estri-
tamente dominada pela outra. Considere as estratégias do jogador 1, "Não Confessar"e
"Confessar". Se o outro jogador, 2, joga "Não Confessar", o ganho de 1 jogando "Não
Confessar"é menor do que jogando "Confessar", 5 < 7. E se 2 joga "Confessar", o
ganho de 1 jogando "Nào Confessar"também é menor do que jogando "Confessar",
1 < 4. Logo dizemos que para o jogador 1 a estratégia "Não Confessar"é uma estraté-
gia estritamente dominada: independente das escolhas alheias, o ganho de 1jogando
"Nào Confessar"é estritamente menor do que jogando "Confessar". Dito ainda de outra
maneira, a estratégia "Não Confessar"é uma estratégia estritamente dominada para o
jogador 1 porque ela gera um payo¤ menor para este jogador relativamente à outra al-
ternativa, "Confessar", toda vez que ele a jogar, independente das estratégias do outro
jogador. Faça raciocínio análogo para o jogador 2 e veri…que que também para este
jogador a estratégia "Não Confessar"é uma estratégia estritamente dominada. Dizemos
então que no Dilema dos Prisioneiros o per…l de estratégias ("Não Confessar", "Não
Confessar") é um equilíbrio com estratégias estritamente dominadas: "Não con fes-
sar"é uma estratégia estritamente dominada por "Confessar"se ela conferir ao jogador
2 um payo¤ sempre inferior ao propiciado pela segunda, independente do que o outro
jogadore possa fazer.
Ou seja, em um jogo estático de informação completa J com n jogadores, considere
o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que a
estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é uma
21
estratégia estritamente dominada por outra estratégia s0i 2 Si qualquer no seu
espaço de estratégias para o jogador i quando, independente das escolhas alheias,
o ganho que o jogador i tem jogado si 2 Si é estritamente menor do que o ganho que
ele teria jogando s0i 2 Si . Formalmente,
Uma regra básica de teoria dos jogos é que indivíduos racionais não jogam estraté-
gias estritamente dominadas, pois fazendo isso eles não estão agindo da melhor forma
possível para eles mesmos. Vejamos agora as implicações deste princípio, em particular
…cará claro aqui a relevância da noção de conhecimento comum, tanto dos payo¤s dos
jogadores envolvidos como também da racionalidade destes12 . Para isso, considere o
jogo abaixo:
jogador 2
C D E
jogador 1 A 2; 2 1; 5 1; 3
B 1; 3 0; 1 1; 2
tal que na forma normal ou estratégica temos
1. os jogadores: 1 e 2
Verique inicialmente que nesse jogo não há estratégia estritamente dominante para
nenhum jogador, de forma que se buscássemos fazer uma previsão do resultado do
jogo tendo em mente essa noção, nada poderíamos dizer. Note também que no jogo
acima, para o jogador 2, a estratégia E é estritamente dominada pela estratégia D:
12
Obviamente, aqui, um jogador é racional se ele não joga estratégias estritamente dominadas por
alguma outra.
22
comparando-se as duas temos que se o jogador.1 escolhe A, o jogador 2 estará pior
jogando E do que jogando D, pois 3 < 5. Se, por outro lado, o jogador.1 escolhe a
alternativa B, para o jogador.2 a estratégia E continua sendo uma estratégia pior do
que D, na medida em que 2 < 1. Consequentemente, sendo o jogador 2 racional, ele
nunca terá incentivos a jogar E, pois ela sempre gerará payo¤s inferiores à D. Perceba
também que, apesar da dominância de D sobre E, D não é uma estratégia estritamente
dominante, pois para 2 a estratégia C não é estritamente dominada nem por D nem
por E.
Como assumimos, 2 é racional, de modo que não devemos esperar que ele nunca
escolha E Mas mais ainda, essa racionalidade é de conhecimento comum, assim como
a racionalidade de 1. E como se trata de um jogo de informação completa, não apenas
2 não joga E como também 1 também sabe. E 2 sabe que 1 sabe que ele nunca a jogará
e 1 sabe que 2 sabe... e assim sucessivamente. Isso implica que podemos eliminar os
resultados do jogo que consideram essa estratégia. Procedendo assim e eliminando a
coluna E do jogo, o jogo assume a seguinte forma reduzida,
jogador 2
C D
jogador 1 A 2; 2 1; 5
B 1; 3 0; 1
Note atentamente: repetindo o raciocínio acima, nós podemos proceder dessa forma
porque não apenas trata-se de um jogo estático de informação completa mas também a
racionalidade dos jogadores é também de conhecimento comum. Nesse sentido, sendo 2
racional (de acordo com o segundo princípio de racionalidade), ele não jogará E. Mas
(muito!!!) mais do que isso: como 1 sabe que 2 é racional (de acordo com o mesmo
princípio), ele conjectura que 2 nunca a jogará. E como 2 sabe que 1 sabe que ele, 2, é
racional, então 2 sabe que 1 sabe que ele nunca jogará E e assim inde…nidamente, de
modo que a estratégia E torna-se irrelevante para o jogo, pois nenhum jogador levará
em consideração a possibilidade de 2 jogá-la.
Por outro lado, tendo em mente o jogo reduzido apresentado acima, observe que
para o jogador 1 a estratégia B torna-se estritamente dominada13 pela estratégia A,
uma vez essa gera payo¤ de uma unidade a mais para o jogador 1, comparando-se com
o que a B proveria, independente do que o jogador 2 …zer. O jogador 1, portanto, não
deverá jogar B (e 2 sabe disso, e 1 sabe que 2 sabe e...) e podemos da mesma forma
13
Aqui temos um resultado básico interessante que o aluno um pouco mais atento já deve ter perce-
bido: em um jogo 2 2 (dois jogadores, cada uma com duas estratégias em seus espaços de estratégias),
o fato de um jogador qualquer ter uma estratégia estritamente dominada implica que a outra estratégia
é estritamente dominante. No jogo em questão, nesse segundo estágio, A torna-se dominante. Mas
apenas no jogo reduzido!
23
eliminar essa linha, reduzindo ainda mais o jogo,
jogador 2
C D
jogador 1 A 2; 2 1; 5
Com o jogo dessa forma, sabemos que o jogador 1 jogará A. Consciente de tal fato, o
jogador 2 fará o que mais lhe dará utilidade: jogar D (pois 5 > 2). O resultado previsto
para o jogo é, portanto, (A; D).
O processo mostrado no exemplo acima é denominado eliminação iterada de
estratégias estritamente dominadas (EIEED) e o conjunto de estratégias (A; D)
é dito ser um equilíbrio por EIEED. Esse processo de eliminação, como vimos,
depende que os agentes sejam racionais, mas também que cada um deles saiba que os
outros também são racionais, e que saibam que todos sabem que todos eles são racionais
etc. Assumir tais hipóteses é o mesmo que assumir que existe “common knowledge”
(conhecimento comum) de que os jogadores são racionais. No caso acima, dado que
trata-se de um jogo de informação completa, foi necessário que:
o jogador 1 fosse racional e soubesse que o jogador 2 também era racional, não
jogando, por isso, B;
Isto posto, veri…que que no Dilema dos Prisioneiros o per…l de estratégias ("Não
Confessar", "Não Confessar") é um equilíbrio por EIEED.
Observe agora a relação entre estratégias estritamente dominantes e estratégias
estritamente dominadas. Se uma estratégia é uma estratégia estritamente dominante
para um jogador qualquer, então ela “sobrevive” ao processo de EIEED. Por outra
lado, se uma estratégia sobrevive ao processo de EIEED, não necessariamente será
uma estratégia estritamente dominate para aquele jogador. Isso será verdade em jogos
2 x 2, onde cada jogador tem apenas duas possibilidades de escolha (como, por exemplo,
o Dilema dos Prisioneiros), mas saindo dessa classe restrita de jogos, nada nos garante
que tal relação se preserva. Podemos então generalizar e propor a seguinte relação entre
as duas maneiras vistas até aqui de solucionar jogos estáticos de informação completa:
24
Observação 10 Dito de outra maneira, dizemos aqui que o primeiro princípio de
racionalidade implica no segundo mas o segundo princípio não necessariamente implica
no primeiro.
Uma observação importante aqui é que a maior parte dos jogos não são resolvidos
via EIEED. Eventualmente isso ocorre, mas em geral apenas reduz as possibilidades
do jogo. Considere o exemplo abaixo.
Exemplo 11
jogador 2
D E F
A 2; 3 3; 1 3; 2
jogador1 B 4; 1 5; 4 0; 3
C 1; 1 3; 5 6; 3
Ímpar
P I
Par P 1; 1 1; 1
I 1; 1 1; 1
Nota-se que, também no Par ou Ímpar, EIEED não colabora em nada com a resolução
do jogo.
Podemos relaxar um pouco a noção de estratégia estritamente dominada e tro-
car a desigualdade estrita dessa de…nição por uma relação apenas desiguladade (não
estrita). Emerge portanto a idéia de estratégia fracamente dominada. Generica-
mente, em um jogo estático de informação completa qualquer, dizemos que (para um
jogador qualquer) uma determinada estratégia é uma estratégia fracamente dominada
por outra estratégia qualquer no seu espaço de estratégias para este jogador quando,
independente das escolhas alheias, o ganho que o jogador tem jogado tal estratégia
é menor (mas não necessariamente estritamente menor) do que o ganho que ele teria
jogando a outra estratégia.
25
Considere então um jogo estático de informação completa J com n jogadores e
tome o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que
a estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é
uma estratégia fracamente dominada por outra estratégia s0i 2 Si qualquer no seu
espaço de estratégias para o jogador i quando, independente das escolhas alheias,
o ganho que o jogador i tem jogado si 2 Si é menor (não necessariamente estritamente
menor) do que o ganho que ele teria jogando s0i 2 Si :Formalmente,
Exemplo 12
jogador 2
a b
A 3; 4 4; 3
jogador 1 B 5; 3 3; 5
C 5; 3 4; 3
Pode-se perceber no jogo acima que algumas estratégias podem eliminadas ao se
considerar o conceito de dominância fraca:
1. B é fracamente dominada por C (pois nunca gera payo¤s superiores a C): elimina-
se B;
26
3. no jogo ainda mais reduzido, o jogador 1 escolhe C e o resultado do jogo é (C; a).
3. no jogo ainda mais reduzido, jogador 1 escolhe C e o resultado do jogo é (C; b).
Um outro método que pode ser utilizado para se prever resultados de jogos si-
multâneos é o de eliminação de estratégias não racionalizáveis. Em geral, o “common
knowledge”da racionalidade dos jogadores permite eliminar outras estratégias que não
aquelas eliminadas via EIEED (ou pelo menos essas). Para de…nir melhor tal possibil-
idade, é necessário termos em mente alguns outros conceitos, abaixo apresentados.
Em um jogo estático de informação completa, considere o espaço de estratégias
de um jogador qualquer. Uma estratégia especí…ca nesse conjunto é dita a melhor
resposta que ele pode dar às escolha alheias se, dadas as escolhas alheias, o ganho
que ele tem jogando tal estratégia é maior (não necessariamente estritamente maior) do
que jogando alguma outra estratégia qualquer. Nesse caso dizemos que esta estratégia
é uma estratégia racionalizável. Mas se não existe uma combinação de escolhas dos
demais jogadores tal que o ganho desse jogador em escolher tal estratégia seja maior do
que as demais estratégias, dizemos que ela é não-racionalizável. Dizemos portanto
que tal estratégia não é nunca a melhor resposta que este jogador pode dar às
escolhas alheias. Seguem abaixo as de…nições de uma forma mais rigorosa.
Como foi dito, um outro método que pode ser utilizado para se prever resultados
de jogos simultâneos é o de eliminação de estratégias não racionalizáveis. Em geral, o
“common knowledge” da racionalidade dos jogadores permite eliminar outras estraté-
gias que não aquelas eliminadas via EIEED (ou pelo menos essas). Para de…nir melhor
tal possibilidade, é necessário termos em mente alguns outros conceitos.
27
De…nição: Em J = (Si ; ui (si ; s i )) um jogo estático de informação completa.
Uma estratégia si 2 Si , i 2 n, é a melhor resposta que i pode dar às escolhas
dos demais jogadores se existe s i 2 S i tal que
Note que, em geral, existem várias melhores respostas para cada jogador envolvido,
dependendo do que os outros possam fazer (no caso especí…co onde existe apenas uma
melhor resposta para um determinado jogador, essa seria então uma estratégia estrita-
mente dominante).
Se uma determinada estratégia não for nunca a melhor resposta para um jogador,
em que circunstâncias deverá ele jogá-la? Sendo racional, isso nunca deverá acontecer,
uma vez que, sempre que ele imaginar a possibilidade de escolhe-la, haverá uma alter-
nativa que gera um payo¤ superior, por de…nição. Segue desse raciocínio que estratégia
racionalizáveis são estratégias que sobrevivem à eliminação iterada de estratégias que
nunca são a melhor resposta que um jogador pode dar às escolhas alheias.
Como no caso de estratégias estritamente dominadas, também pode-se fazer elim-
inação iterada de estratégias não racionalizáveis (EIENR)14 . Novamente, a ordem de
eliminação não afeta o resultado …nal. As estratégias que sobrevivem à EIENR são
aquelas que um jogador racional pode justi…car, ou racionalizar, dada alguma conjec-
tura razoável a respeito da escolha dos outros jogadores, onde razoável signi…ca uma
escolha que não contenha estratégias não racionalizáveis.
Comparando com estratégias estritamente dominadas, observamos que uma estraté-
gia que é estritamente dominada nunca é melhor resposta, mas o inverso nem sempre é
correto. Portanto, eliminar iteradamente estratégias que nunca são a melhor resposta
elimina pelo menos tantas estratégias quanto se retiraria ao fazer EIEED, e em geral
elimina-se mais. Em suma, tem-se que
(
Conjunto de estratégias estratégias que sobrevivem à EIEED
estratégias que sobrevivem à EIENR
14
Isso é verdade enquanto não tratamos ainda de estratégias mistas, o que veremos logo a seguir.
Quando isso ocorrer, esse resultado se altera radicalmente. A intenção aqui é tão somente inserir a
noção de estratégias (não) racionalizáveis e "preparar terreno"para inserirmos a noção de equilíbrio de
Nash.
28
Exemplo 13 Considere o jogo abaixo, um jogo estático de informação completa. Na
forma normal (ou estratégica)
1. os jogadores: 1 e 2
jogador 2
e f g h
a 2; 6 3; 3 5; 1 0; 0
jogador 1 b 3; 1 6; 4 0; 2 0; 1
c 8; 1 2; 2 0; 5 0; 4
d 4; 1 1; 0 0; 1 5; 1
Nesse jogo, qual é o conjunto de estratégias racionalizáveis?
Uma forma que facilita sensivelmente a visualização das estratégias racionalizáveis
(ou não) é marcar as melhores respostas para cada jogador em todas as circunstâncias
possíveis, sendo essas dadas pelas alternativas que o outro jogador possui. Por exemplo,
quando o jogador 1 escolhe a, o melhor para o jogador 2 será escolher e, pois lhe dará
um payo¤ de 6, e não 3, 1 ou 0, que obteria se …zesse outras escolhas. O mesmo deve
ser feito supondo escolhas de b; c e d pelo jogador 1. Por sua vez, se o jogador 2 utilizar
a estratégia e, o melhor para o jogador 1 será lançar mão da estratégia c (payo¤ de 8
contra outros de 2, 3 e 4). O mesmo também deve ser feito supondo as escolhas de f; g
e h pelo jogador 2. Se uma determinada estratégia não corresponder a uma melhor
resposta em nenhuma circunstância, então ela não será racionalizável, pois signi…cará
que, independente do que o outro jogador …zer, ela nunca gerará o maior payo¤ e
portanto não corresponderá ao melhor a se fazer. Uma vez que alguma estratégia for
eliminada por esse critério, pode-se novamente analisar se, no jogo reduzido, há alguma
outra que nunca será jogada, e assim sucessivamente, até reduzir-se o jogo ao máximo.
No caso acima, temos que:
eliminado h, d também pode ser eliminado, pois não será mais melhor resposta
para o jogador 1 em nenhuma possibilidade do jogo reduzido.
A partir desse ponto, nenhuma outra eliminação poderá ser feita, sendo que todas
as estratégias sobreviventes são racionalizáveis: podem ser justi…cadas por alguma
hipótese a respeito do que o outro jogador poderá fazer. Portanto, nesse jogo não é
29
possível prever um resultado …nal pelo método de EIENR, obtendo apenas a redução
da sua complexidade:
jogador 2
e f g
a 3; 1 6; 4 0; 2
jogador 1 b 8; 1 2; 2 0; 5
c 4; 1 1; 0 0; 1
Em geral, portanto, EIENR (assim como, e ainda mais, EIEED) não gera previsões
bem de…nidas para grande parte dos jogos. O mais comum é que apenas de…na alguns
resultados que não serão jogados, caso de fato exista pleno conhecimento de racionali-
dade dos jogadores por todos eles. Contudo, isso não signi…ca que seja sempre assim.
Vejamos o exemplo 8 dado na seção anterior, onde, via EIEED nada podia ser feito.
jogador 2
D E F
A 2; 3 3; 1 3; 2
jogador 1 B 4; 1 5; 4 0; 3
C 1; 1 3; 5 6; 3
Percebe-se que, mesmo sem possuir estratégias estitamente dominadas, no jogo acima
existem algumas estratégias que nunca são melhores respostas, e portanto não são
racionalizáveis. Esse é o caso da estratégia F para o jogador 2 e da A para o jogador
1. Eliminando-as, o jogo se reduz a
jogador 2
D E
jogador 1 B 4; 1 5; 4
C 1; 1 3; 5
Nesse jogo reduzido, porém, outras estratégias passam a não constituirem-se de mel-
hores respostas: a estratégia D, para o jogador.2, e a estratégia C, para o jogador
1. Eliminando-as, temos então (B; E) como resultado previsto para o jogo, que será
jogado caso exista conhecimento comum de racionalidade entre os jogadores.
Por …m, uma palavra de precaução é necessária aqui. Ainda que tenhamos proposto
e feito nesses exemplos um processo de eliminação de estratégias segundo a noção de
racionalidade de jogadores associada à estratégias racionalizáveis, não é verdade que
esse processo é sempre válido quando permitimos que os jogadores aleatorizem suas
escolhas. Nesse caso podemos ter estratégias não racionalizáveis que serão jogadas com
probabilidades positivas, possibilidade que decorre em função da presença do elemento
de interação estratégica. Por exemplo, no caso acima, pode ser que os jogadores 1 e 2
30
joguem A e F com probabilidade não nula, respectivamente. Nós veremos essa situação
abaixo, quando estudarmos estratégias mistas. Segue portanto que a análise acima tem
perda signi…cativa de generalidade quando incorporamos estratégias mistas na análise.
max ui si ; s i
si 2Si
Jogador 2
NC C
Jogador 1 NC 5; 5 1; 7
C 7; 1 4; 4
31
C a melhor resposta também é jogar C. Logo (C; C) é uma interseção de melhores
respostas e como tal caracteriza o equilíbrio de Nash no Dilema dos Prisioneiros.
Identi…cado o equilíbrio de Nash, veja que nenhum dos jogadores tem qualquer
incentivo a se desviar. Se algum dos jogadores propõe ao outro que ambos joguem
"Não Confessar", de forma que cada um ganhe 5 (e portanto ambos estejam melhor do
que no equilíbrio de Nash), o melhor que cada um pode fazer é não cumprir o acordo,
pois na conjectura de o oponente cumprí-lo, a melhor resposta é sempre não cumprir e
jogar "Confessar", pois 7 > 5.
Portanto, para encontrar um equilíbrio de Nash, basta ver a(s) melhor(es) re-
sposta(s) de um jogador para cada estratégia do(s) outro(s) jogador(es), procedendo
assim para todos eles. Quando houver coincidência entre as melhores respostas para
todos os envolvidos, esse conjunto de estratégias será um equilíbrio de Nash.
Exemplo 14
jogador 2
D E F
A 2; 3 5; 1 3; 2
jogador 1 B 4; 2 1; 4 0; 3
C 1; 1 0; 5 6; 8
No caso acima, não há estratégia dominante para nenhum dos jogadores nem nen-
huma estratégia pode ser eliminada via EIEED ou EIENR. Mas o conceito de equilíbrio
de Nash nos diz que o resultado do jogo será (C; F ), o único onde há coincidência de
melhores respostas: se o jogador 2 joga F , o melhor para o jogador 1 é escolher C, e
vice-versa. Consequentemente, nenhum dos dois terá incentivos a desviar desse resul-
tado, caso acreditem que ele deva se veri…car.
32
estratégia alternativa (s00i 6= s0i ) tal que o ganho desse jogador seria maior jogando-a,
e o jogador i preferirá jogar s00i , de onde temos que (s01 ; :::; s0n ) não pode ser uma solução,
ao menos um jogador se desviaria.
Teorema 15 Nash (1951). Em todo jogo …nito (com o número de jogadores n, …nito
e espaço de estratégias Si , para todo i, também …nito) existe pelo menos um equilíbrio
de Nash (ainda que envolva apenas estratégias mistas, conceito a ser visto à frente).
jogador 2
P I
jogador 1 P 1; 1 1; 1
I 1; 1 1; 1
O jogo par ou ímpar é um jogo …nito, uma vez que há apenas dois jogadores com
duas estratégias para cada um deles. Pelo Teorema enunciado acima, ele deveria possuir
algum equilíbrio de Nash, o que não se percebe na matriz acima. Obviamente não
estamos mostrando uma contradição ao Teorema de Nash nem sugerindo que o Par
ou Ímpar não tenha solução teórica. Entretanto, ali está sendo mostrado apenas as
possíveis estratégias puras. O par ou ímpar, de fato, possui um equilíbrio de Nash
(a…nal, não consta que o Teorema tenha sido provado de maneira errada), mas em
estratégias mistas, onde cada jogador joga 50% das vezes par e 50% ímpar. Esse
processo será explicado mais adiante.
Exemplo 17 Comsidere um jogo que tenha a seguinte regra: há dois (ou mesmo um
número maior qualquer) jogadores que têm de escrever simultaneamente em um pedaço
de papel um número qualquer. Após terem escrito, ambos revelam seus números. O
que tiver escrito o maior número recebe R$100, enquanto o(s) outro(s) não ganha(m)
nada. Sendo igual, também não ganham nada. Qual é o equilíbrio de Nash?
Pensando um pouco, você notará que não existe nenhum equilíbrio de Nash nesse
jogo. Para concluir isso, veja que o perdedor sempre poderá melhorar sua situação,
15
Para nós aqui nesse curso, um jogo é dito …nito se o número de jogadores for …nito e se o espaço
de estratégias de cada jogador também for …nito.
33
dizendo um número maior que o vencedor; sempre havendo perdedor (ou empate),
sempre alguém poderá melhorar e, assim, nunca se alcançará um resultado que con-
stitua um equilíbrio de Nash. Esse jogo é uma prova contrária ao teorema de Nash?
Certamente não, pois o referido teorema foi provado e não há o que discutí-lo. A
questão é que neste jogo não são satisfeitas todas as hipóteses necessárias à validade
do teorema, uma vez que ele não é …nito: note que o conjunto de estratégias possíveis
a cada jogador possui in…nitos elementos, e é isso que possibilita a não existência do
equilíbrio neste jogo.
Unicidade Com relação à unicidade, nada nos garante em um jogo estático de in-
formação completa o equilíbrio de Nash seja único. Pode existir e é bastante comum
encontrar jogos com mais de um equilíbrioa de Nash.
Mulher
Futebol Teatro
Homem Futebol 2; 1 0; 0
Teatro 0; 0 1; 2
jogador 2
Antiquarius O Cantão
jogador 1 Antiquarius 1; 1 0; 0
O Cantão 0; 0 1; 1
Novamente temos dois equilíbrios de Nash, e também não podemos determinar qual
deles será jogado.
Nesses jogos, ainda que haja mais de um equilíbrio de Nash, nós podemos de alguma
forma reduzir as possibilidades dos resultados. Mas em alguns jogos essa redução pode
ser irrelevante e frustante. Considere por exemplo o jogo entre dois jogadores, 1 e 2.
34
Ambos devem escrever em um pedaço de papel um número inteiro entre 0 e 100. Se
a soma de ambos os números (a escolha do jogador 1 mais a escolha do jogador 2) for
menor do que 100, cada um leva o número que escreveu no papel. Se a soma der mais
de 100, cada um perde uma quantia, R$1,00 por exemplo. Inicialmente alguém poderia
dizer que nesse jogo há um único equilíbrio de Nash de jogo, cada um jogar 50. No
entanto esse é apenas um dos equilíbrios de Nash desse jogo, provavelmente decorrente
de algum critério subjetivo de justiça na cabeça do aluno. Mas não é isso que buscamos
e sim caracterizar todos os equilíbrios do jogo - e nesse jogo há 101 equilíbrios de Nash.
s1 s2
0 100
1 99
2 98
::: :::
50 50
::: :::
99 1
100 0
Embora nos exemplos acima não tenhamos especi…cado, a princípio, como apontar
um ou outro equilíbrios de Nash como o mais provável a ser jogado, em alguns casos,
nesses jogos com múltiplos equilíbrios de Nash, existem formas de identi…car qual deles
deverá ser jogado (ao menos com uma “certa” probabilidade).
35
estágio do procedimento. Segue que para ao menos um jogador i qualquer,
dadas as escolhas s i 2 S i dos demais jogadores, existiria uma estratégia
si 2 Si , si 6= si , tal que ui si ; s i < ui s0i ; s i . Decorre que si ; s i não
seria um equilíbrio de Nash em J, caracterizando a contradição.
– Prova: Por contradição, suponha que não. Isto é, que esse conjunto seja
um equilíbrio de Nash do jogo mas foi eliminada no processo de EIEED em
algum estágio do procedimento. Segue que para ao menos um jogador qual-
quer, dadas as escolhas dos demais jogadores (que estão jogando o equilíbrio
de Nash), existiria uma outra estratégia tal que o seu ganho jogando o equi-
líbrio de Nash seria menor do jogando esta estratégia alternativa. Decorre
portanto que o conjunto inicial não seria um equilíbrio de Nash nesse jogo,
caracterizando a contradição.
– Prova: (i) Pelo teorema de Nash, nesse jogo existe ao menos um equilíbrio
de Nash. (ii) Pela proposição anterior, se um per…l de estratégias é um
equilíbrio de Nash, então sobrevive ao processo de EIEED. Segue que se um
conjunto de estratégias é um per…l que sobrevive à EIEED, único, no jogo,
então tal conjunto é o (único) equilíbrio de Nash no jogo.
36
O que as proposições acima mostram é que todo Nash sobrevive à EIEED mas que
nem toda estratégia que sobrevive à EIEED constitui um Nash em um jogo …nito na
forma estratégica. Seguindo na direção que tomamos - e como já foi dito acima - isso
nos sugere que a noção de equilíbrio de Nash é mais tênue do que a idéia de equilíbrio
por EIEED mas no entanto é extremamente mais ampla.
Analisando com relação à estratégias não-racionalizáveis, note que isso ocorre porque
uma estratégia que está em algum equilíbrio de Nash nunca será uma estratégia não
racionalizável, pelo menos pelas estratégias desse equilíbrio de Nash dos outros jo-
gadores - pela própria de…nição de equilíbrio de Nash. Por outro lado, suponha um
resultado (a; b) qualquer, sendo a uma estratégia racionalizável do jogador.1 e b uma
outra, racionalizável para o jogador 2. Nada garante que a justi…cativa para que o
jogador 1 escolha a seja a possibilidade de ocorrência de b, assim como também nada
garante que a justi…cativa para que o jogador 2 escolha b seja a possibilidade de ocor-
rência de a. Portanto, não necessariamente o resultado (a; b) constituirá um equilíbrio
de Nash.
Sendo assim, podemos dizer que toda estratégia que compõe um equilíbrio de Nash
é racionalizável porque pode ser justi…cada pelas estratégias de equilíbrio de Nash dos
demais jogadores, enquanto o inverso em geral não será verdade. Por isso, tem-se que
a capacidade de predição de um jogo é muito superior quando se utiliza o conceito de
equilíbrio de Nash, comparando-se com EIEED e EIENR.
Em suma, pode-se dizer que:
(
Conjunto de estratégias estratégias que sobrevivem à EIEED
estratégias que sobrevivem à EIENR estratégias que são equilíbrio de Nash
Entretanto, o grau de precisão de uma previsão utilizando apenas o conceito de equi-
líbrio de Nash não é tão apurado quanto o dos métodos apresentados anteriormente,
como …ca claro no exemplo acima em que os jogadores devem escrever um número
inteiro de 0 a 100 em um pedaço de papel. Não há nenhuma dúvida da alta probabili-
dade de que um jogador sempre escolha uma estratégia estritamente dominante, caso
a tenha. No entanto, um estratégia que constitua um equilíbrio de Nash será jogada
com alta probabilidade apenas se cada jogador realmente acreditar que o(s) outro(s)
também escolherá(ão) as estratégias de…nidas naquele equilíbrio de Nash.
37
O equilíbrio de Nash no jogo acima é (b; f ), onde existe coincidência de melhores
respostas e portanto nenhum jogador tem incentivos a desviar.
Embora nas de…nições tenhamos sempre utilizado a hipótese de existência de n
jogadores, até agora todos os exemplos dados contavam com apenas dois jogadores
envolvidos. Isso foi feito por também dois motivos. O primeiro é que, de fato, grande
parte das situações reais de interdependência ocorre realmente com apenas dois jo-
gadores. O outro é que a análise de jogos com apenas dois envolvidos é tecnicamente
muito mais simples, embora a lógica da análise permaneça exatamente a mesma. Bus-
cando mostrar os passos para se encontrar equilíbrios de Nash em jogos com mais de
dois jogadores, apresentaremos abaixo um exemplo com três deles.
A representação do jogo na forma normal, via matrizes de payo¤s, não será mais
tão simples como antes. Como seria extremamente complicado desenhar uma “ma-
triz” tridimensional, deve-se construir tantas matrizes (bidimensionais) quantas forem
as estratégias do jogador 3 (por exemplo). No caso abaixo são três: S3 = fnúmeroI,
númeroII, númeroIIIg. Por sua vez, são claros o conjunto de possibilidades dos out-
ros jogadores: o jogador 1 escolhe entre “alto” e “baixo” enquanto o jogador 2 entre
“esquerda” e “direita” Em relação aos payo¤s, os apresentaremos em cada célula na
seguinte ordem: o mais à esquerda refere-se ao do jogador 1, o central ao do jogador
2, e o à direita ao payo¤ do jogador 3. Para encontrar-se as melhores respostas de
cada jogador, procede-se como antes, veri…cando a estratégia que gera o maior payo¤
para cada possibilidade existente. A diferença é que, agora, essas possibilidades são
combinações de escolhas dos outros dois jogadores. Para deixar claro, daremos alguns
exemplos do procedimento, deixando os restantes para o leitor concluir por si mesmo,
segundo as marcações de melhores respostas nas matrizes:
38
Se jogador 3 escolhe número I:
jogador 2
esquerda direita
jogador 1 alto 0; 0; 0 2; 3; 4
baixo 1; 3; 2 7; 3; 1
jogador 2
esquerda direita
jogador 1 alto 2; 8; 6 0; 7; 1
baixo 2; 1; 1 3; 2; 5
jogador 2
esquerda direita
jogador 1 alto 3; 2; 6 1; 3; 1
baixo 2; 4; 0 5; 3; 1
Pode-se notar que existem três equilíbrios de Nash neste jogo: (baixo, esquerda, número
I), (alto, esquerda, número II) e (baixo, direita, número II). Em nenhuma dessas situ-
ações existe algum jogador que queira mudar sua escolha, dada as escolhas dos outros,
uma consequência da própria de…nição de equilíbrio de Nash.
às vezes se diz que, como cada jogador pode pensar através das consider-
ações estratégicas dos outros jogadores, a simples racionalidade implicaria
a correta previsão do que os outros irão fazer. Entretanto, como visto, a
consequência desse “common knowledge”das racionalidades dos jogadores é
apenas que os jogadores devem jogar estratégias que sejam racionalizáveis,
mas nada além disto.
39
a idéia é que, se há um único resultado previsto para o jogo, então os jo-
gadores devem entendê-lo. E para que eles não tenham estímulos a desviar,
tal resultado deve ser um Nash. De outra forma: se os jogadores acham
que há um caminho óbvio de se jogar o jogo, então esse caminho deve ser
um equilíbrio de Nash. Este argumento é particularmente relevante quando
há apenas um equilíbrio de Nash no jogo: se supusermos que o equilíbrio
de Nash é esse caminho óbvio, então poderemos trabalhar com a hipótese
de que ele se constituirá realmente no seu resultado. Entretanto, apenas
“common knowledge das racionalidades”dos jogadores não é su…ciente para
isso, como visto. Além disso, o simples fato de que existe um equilíbrio de
Nash não faz com que ele se constitua necessariamente em uma justi…cativa
para que seja jogado, mesmo sendo único. Sendo assim, temos que encontrar
motivos que justi…quem a obviedade de se jogar um conjunto especí…co de
estratégias, especialmente se existem mais de um equilíbrio de Nash no jogo
em questão. Os outros ítens seguintes discutem esse ponto.
3. Pontos focais:
4. Negociação prévia:
supondo que os jogadores podem ter comunicação prévia, caso eles façam
algum acordo, esse resultado torna-se um caminho óbvio a se jogar. Como
os jogadores não têm obrigação de cumprir seus acordos (no caso de esses
serem apenas informais), para que eles sejam estáveis, as estratégias que os
compõe têm de constituir um equilíbrio de Nash.
40
se uma forma particular de jogar um jogo é jogada muitas vezes, pode emer-
gir um resultado que é uma convenção social estável. Ocorrendo isso, essa
convenção torna-se focal. Um exemplo típico é o lado a se andar de carro.
Em geral, se dirige à direita, e todos fazem isto. Na Inglaterra, por sua
vez, sempre se andou à esquerda, e isto permanece até hoje. Note que aqui
também temos que uma convenção social é estável se é equilíbrio de Nash.
Caso contrário, as pessoas teriam estímulos a desviar.
Exemplo 21
jogador 2
esquerda direita
jogador 1 alto 0; 0 2; 2
baixo 8; 9 2; 1
Nesse caso acima, temos dois equilíbrios de Nash, mas seria razoável imaginar que o
resultado do jogo será (baixo, esquerda), onde ambos os jogadores têm payo¤s superi-
ores aos que obteriam no outro equilíbrio de Nash16 . Isso é particularmente verdade se
os jogadores podem se comunicar antes de jogar, pois então seria bastante provável que
eles …rmassem um acordo (que seria self-enforcing) que gerassem o resultado (baixo,
esquerda).
Exemplo 22
jogador 2
esquerda direita
jogador 1 alto 0; 1 3; 2
baixo 2; 4 1; 0
Nesse jogo, assim como antes, temos dois equilíbrios de Nash. Mas agora não
podemos dizer que há um “caminho óbvio” a se jogar. Isto porque um equilíbrio de
Nash não é preferível ao outro pelos dois jogadores, como tínhamos antes. A previsão
do jogo, principalmente se não há comunicação antes de iniciá-lo, torna-se portanto
tarefa mais difícil.
Coordenação implícita Há outros casos onde pode ocorrer algum tipo de “coorde-
nação implícita” nas próprias regras do jogo. Vejamos o exemplo seguinte.
Exemplo 23 O jogo das listas. Há dois jogadores e nove …guras geométricas. É dado
o nome de uma delas a um jogador e o de uma outra …gura ao outro jogador, com
16
Em uma análise de equilíbrio (parcial), dizemos que o equilíbrio (baixo, esquerda) é Pareto-superior
ao equilíbrio (alto, direita) na medida em que no primeiro equilíbrio todos os jogadores estão pelo menos
tão bem quanto no segundo caso e ao menos um jogador está estritamente melhor - no caso, ambos
estão com maiores payo¤s.
41
o conhecimento de ambos. A proposta é que, sem comunicação, cada um faça em um
pedaço de papel uma lista com o nome de quaisquer das outras sete …guras. Entretanto,
ambos ganham um prêmio qualquer apenas se, unidas as duas listas, todas as …guras
estiverem incluídas, mas sem duplicação. Caso contrário, não ganham nada.
Exemplo 24 Em um exemplo muito parecido com um caso analisado acima, dois jo-
gadores escrevem, simultaneamente, um número natural entre zero e mil. Caso a soma
dos dois números não ultrapasse mil, cada um recebe, em unidades monetárias, um valor
17
Como seria o caso se, ao invés das …guras, tivéssemos uma lista de países? A lista é: Inglaterra,
Argentina, Uruguai, Itália, Brasil, França, Alemanha, Paraguai, Portugal. Você recebe Brasil e o
oponente Portugal. Qual(is) seria(m) o(s) equilíbrio(s) de Nash do jogo?
42
correspondente ao número que escreveu. Caso a soma seja maior que mil, ninguém re-
cebe nada. Qual(is) é(são) o(s) equilíbrio(s) de Nash deste jogo? Algum deles pode ser
considerado focal?
Quanto aos equilíbrios de Nash, neste caso existem simplesmente mil e um deles,
correspondentes a todos as estratégias dos jogadores que, conjuntamente, somem exata-
mente mil: em todos esses casos, nenhum dos jogadores poderá aumentar o seu payo¤.
O conceito de equilíbrio de Nash, portanto, diz muito pouco a respeito do provável
resultado da interação. Todavia, parece razoável imaginar um ponto focal onde cada
um escreva 500 em seus papéis, baseando-se em alguma vaga noção de justiça inerente
a maioria das pessoas. Esse foi, de longe, o resultado mais encontrado quando …zemos
experiências em sala com alunos da PUC-Minas. E isso ocorreu tanto quando foi per-
mitido uma coordenação prévia entre os jogadores, mas também quando isso não foi
permitido.
Em geral, se os jogadores já se interrelacionam há algum tempo, pode-se criar um
modo usual de se jogar. Em situações econômicas, muitas vezes isso ocorre, o que
facilita a análise do jogo, ainda que ele tenha mais de um equilíbrio de Nash.
Exemplo 26 No Guerra dos Sexos. O que você diria se nesse jogo houvesse a seguinte
informação: "o jogo será jogado no Irã"?
43
Exemplo 27 Dirigir no Brasil ou em algum país da Comunidade Britânica.
jogador 2
esquerda direita
jogador 1 esquerda 0; 0 100; 100
direita 100; 100 0; 0
Ou seja, uma estratégia mista especi…ca probabilidades para estratégias puras, de-
notando que essas serão escolhidas não de modo determinista, mas probabilístico. Ob-
viamente, o somatório das probabilidades é igual a um. Note também que que uma
18
Para uma formalização mais rigorosa dos conceitos associados à estratégias mistas, ver o apêndice.
44
estratégia pura nada mais é que uma estratégia mista degenerada, no sentido de que
ela especi…ca probabilidade um para um elemento do conjunto de estratégias e zero
para todos os outros.
Exemplo 30 (Par ou ímpar): as estratégias puras de cada jogador são jogar par ou
ímpar. Uma estratégia mista é a distribuição de probabilidade (p; 1 p), onde p 2 [0; 1]
é a probabilidade de se jogar par e (1 p) é a probabilidade de se jogar ímpar. A
estratégia mista (0, 1), por exemplo, é simplesmente a estratégia pura de se jogar
ímpar.
Exemplo 31 Em um jogo onde um jogador tenha três estratégias puras possíveis (A; B; C),
uma estratégia mista é a distribuição de probabilidade (p; q; 1 p q), onde p 2 [0; 1],
q 2 [0; 1] e (p + q) 2 [0; 1]. A estratégia pura B, por exemplo, seria representada por
(0; 1; 0). Por sua vez, se esse jogador jogasse cada uma delas com a mesma chance,
teríamos a estratégia mista (1=3; 1=3; 1=3).
De…nição 32 Um jogo pode ser representado na sua forma normal ou estratégica, com
a possibilidade de se adotar estratégias mistas. A diferença agora é que incorporamos
a possibilidade de que o jogador aleatorize ao fazer as suas escolhas.
45
Independentemente portanto do valor de E (a probabilidade do jogador 2 escolher E).
Tal estratégia é, portanto, preferível em relação à estratégia pura C.
Antes tínhamos que, se uma estratégia fosse dominada, ela nunca seria jogada e
portanto não seria racionalizável. Agora temos também o reverso dessa proposição: se
ela nunca será jogada, então ela é dominada, ainda que seja por uma estratégia mista,
como visto no exemplo acima19 .
Outra característica a se destacar é que uma estratégia pura pode ser a melhor
resposta a uma estratégia mista, ainda que não seja a melhor resposta a nenhuma
estratégia pura. A veri…cação de estratégias que nunca serão melhores respostas …ca,
portanto, mais sutil, pois torna-se necessário veri…car também as possibilidades de
respostas à estratégias mistas do(s) outro(s) jogador(es).
Exemplo 34
jogador 2
D E
A 5; 0;
jogador 1 B 0; 5;
C 4; 4;
Nesse jogo, para o jogador 1, C não é a melhor resposta para E e nem para D.
Todavia, é a melhor resposta, por exemplo, para a estratégia mista ( D ; 1 D ), D 2
1 4 20
5; 5 .
A caracterização anterior de equilíbrio de Nash considerava apenas estratégias puras
como possibilidades. Contudo, podemos também incorporar o conceito de estratégias
mistas para determinar o equilíbrio de Nash. Nesse sentido, um conjunto de estratégias
mistas = ( 1 ; :::; n ) constitui um equilíbrio de Nash (em estratégias mistas) em um
jogo estático de informação completa se, para cada jogador, a estratégia mista que ele
adotou for a melhor respostas às estratégias mistas jogadas pelos demais jogadores.
Portanto segue que que o conceito de equilíbrio de Nash é exatamente o mesmo de
antes. A diferença é que agora permite-se também a utilização de estratégias mistas.
46
outros jogadores permanecem jogando suas estratégias de equilíbrio). Além disso, todas
elas provêem o mesmo payo¤ , que é maior ou igual ao payo¤ obtido caso se utilizasse
outra estratégia pura que não compõe a estratégia mista do equilíbrio de Nash (também
supondo que os outros jogadores permaneçam jogando suas estratégias de equilíbrio).
O que essa observação nos sugere é uma maneira mais fácil de computar o equi-
líbrio de Nash em estratégias mistas. Se o ganho esperado de um jogador quando é
jogado o equilíbrio em estratégias mistas é igual ao seu ganho esperado se ele adotar
uma estratégia pura e os demais jogadores jogarem o equilíbrio em estratégias mistas,
então basta nos ater ao segundo caso para gerarmos o resultado. Com relação ao se-
gundo ponto, o argumento é trivial. Vamos organizar essas assertativas em forma de
proposições que serão importantes pelos motivos acima sugeridos.
é igual ao seu ganho esperado se ele jogasse alguma estratégia pura dado que o oponente
jogou alguma estratégia de equilíbrio,
tal que
u1 (s11 ; 2) = u1 (s12 ; 2) = u1 ( ).
O mesmo é verdade para o jogador 2:
u2 ( 1 ; s21 ) = u2 ( 1 ; s22 ) = u2 ( ).
Prova. (Demonstração informal) Suponha que jogar duas das estratégias puras
que compõem a mista que é equilíbrio de Nash dê payo¤s diferentes. Então o jogador
preferirá jogar apenas a que lhe confere maior utilidade e consequentemente a estratégia
mista não pode ser equilíbrio de Nash, o que contradiz a hipótese original e portanto não
21
A Proposição vale para todo jogo …nito. Esse formato é apenas para facilitar a compreensão.
47
pode ser verdadeiro. Temos então que o payo¤ obtenível utilizando a mista ou qualquer
das puras que ela contém confere o mesmo payo¤ para o jogador, uma vez que os outros
mantêm suas estratégias de equilíbrio de Nash. Isso …cará claro no exemplo abaixo,
quando mostramos que isso é verdade em um jogo de coordenação.
Como já visto antes, no jogo acima não existe um conjunto de estratégias puras que
formem um equilíbrio de Nash. Todavia, podemos encontrar algum equilíbrio de Nash
se possibilitarmos que se joguem estratégias mistas. Para tanto, devemos proceder da
forma apresentada abaixo.
48
Primeiro calcula-se o payo¤ de um dos jogadores quando ele escolhe apenas estraté-
gias puras, mas possibilitando o outro de escolher mistas. No caso do Par X Ímpar,
as estratégias puras possíveis são apenas duas, par (P ) ou ímpar (I). Começaremos
observando a estratégia do jogador 1 supondo que ele jogou par e depois ímpar:
u1 (P; 2) = 1 2P 1 (1 2P )
u1 (I; 2) = 1 2P +1 (1 2P )
u1 (P; 2) = u1 (I; 2)
Exemplo 39 Considere mais uma variação do jogo “Encontro no Rio”. Agora, temos
um jovem casal querendo se encontrar para uma “namoradinha”. Eles têm duas opções
para o encontro: botecos do Centro da cidade ou um local do Leblon. Os dois não
podem se comunicar, e como é um namoro recente, nenhum dos dois resultados pode
ainda ser considerado um ponto focal, ou algo a…m (eles não sabem ainda o “estilo”
do outro). A representação do jogo na forma normal é:
garota
Leblon Centro
rapaz Leblon 10; 10 0; 0
Centro 0; 0 4; 4
49
dependerão da estratégia (ou, da mesma forma, da probabilidade escolhida entre ir ao
Centro ou ao Leblon) do outro jogador - o rapaz, representada no eixo horizontal.
O que temos então no caso acima: se a probabilidade do rapaz ir ao Leblon for
menor que r (L), o melhor para garota será ir para o Centro com certeza, o que
pode ser visto pelas linha de payo¤s. Se ela faz isso, o melhor para o rapaz é fazer
r (S) = 0, como se vê na matriz. Então um Nash é, de fato, (C; C), um Nash em
estratégias puras. O mesmo raciocínio aplica-se ao equilíbrio de Nash (L; L). Mas há
também um equilíbrio de Nash em estratégias mistas. Para encontrá-lo, primeiramente
vamos calcular r (L). Ele deve ser tal que iguale o payo¤ da garota em jogar cada
uma das estratégias, dado r (L):
2 2 2 5 5 2 5 5 20
ur r; g = 10 + 0+ 0+ 4=
7 7 7 7 7 7 7 7 7
Da mesma forma o seu ganho esperado quando joga cada uma das estratégias puras
que compõe o equilíbrio com estratégias mistas é dado por
(
ur r (L) ; g = 27 10 + 57 0 = 20 7
ur r (C) ; g = 72 0 + 57 4 = 20 7
ur r; g = ur r (L) ; g = ur ( r (C) ; r)
ug r; g = ug ( r; g (L)) = ug ( r; g (C))
50
(o primeiro para chutar a bola e o segundo para pular na hora da cobrança). Suponha
que seja sabido que o goleiro seja mais ágil para saltar para a direita, enquanto para o
cobrador o lado, em princípio, não faça diferença. A representação na forma normal
é a seguinte:
goleiro
E D
cobrador E 6; 6 3; 3
D 2; 2 9; 9
A idéia é que números maiores para cada um deles denota uma maior probabilidade
de sucesso na cobrança. Assim, o cobrador chutar à direita e o goleiro pular para esse
mesmo canto é o resultado que maximiza o payo¤ do goleiro e minimiza o do jogador,
pois trata-se da situação onde há maiores probabilidades de o goleiro defender o pênalti.
Por outro lado, a melhor situação para o jogador (e pior para o goleiro) seria um chute
à esquerda, com o arqueiro indo para o outro lado. Na representação acima …ca claro
que, em estratégias puras, não existe nenhum equilíbrio de Nash. Pelo teorema de
Nash sabemos então que pelo menos um em estratégias mistas existirá. Para começar
a análise, olhemos o diagrama para o goleiro (fazer!!!).
51
O equilíbrio em estratégias mistas será dado por
Assim, caso o goleiro salte para a direita com probabilidade de 30%, o cobrador …cará
indiferente entre qual lado escolher para chutar a bola. Portanto, temos que o único
equilíbrio de Nash desse jogo é o jogador bater o pênalti à direita com 40% de proba-
bilidade e o goleiro pula para esse lado com 30% de chances. Qualquer desvio dessas
probabilidades de um dos envolvidos fará com que o outro não mais …que indiferente
entre suas estratégias puras, escolhendo uma delas com probabilidade de 100%, o que
fará com que o primeiro também altere sua escolha anterior e assim inde…nidamente,
caracterizando a ausência de outros resultados que caracterizem um equilíbrio de Nash.
Exemplo 41 Vejamos agora um caso um pouco mais complexo, que envolve mais de
duas estratégias puras para um dos jogadores, baseado em exemplo parecido apresentado
em Kreps (1994):
jogador 2
C D E
jogador 1 A 1; 100 100; 1 0; 0
B 100; 1 1; 100 0; 0
Como solucionar esse jogo??? Dê uma olha e veri…que como uma pequena alteração
na estrutura do jogo (agora passamos a ter um jogo onde um dos jogadores, o jogador
2, tem um espaço de estratégias com três elementos, C; D e E) pode complicar de uma
forma signi…cativa a busca do equilíbrio.
Note que no jogo acima não há nenhum Nash em estratégias puras, o que, pelo
teorema da existência do equilíbrio em jogos …nitos, nos garante que haverá pelo menos
um equilíbrio em estratégias mistas. Devemos começar procurando condições que façam
com que os jogadores …quem indiferentes entre estratégias puras, o que torna possível
a utilização de estratégias mistas (em situações de equilíbrio). O processo aqui é mais
trabalhoso porque um dos jogadores possui três alternativas de escolhas de estratégias
puras.
Os payo¤s do jogador 2 em cada situação, dado que o jogador 1 joga A com a
probabilidade genérica 1 (A), são
u2 ( 1 (A) ; E) = 0
A randomização do jogador 2 poderá ser entre as três estratégias puras possíveis a ele
ou entre um par delas. Todas essas possibilidades têm de ser observadas.
52
o jogador 2 é indiferente entre C e D tal que
1
Como 1 (A) = 101 , u2 ( 1 (A) ; C) = u2 ( 1 (A) ; E) = 0 > u2 ( 1 (A) ; D) =
1 100
101 100 101 = 1 101
10000
. Portanto, é possível que o jogador 2 randomize entre
C e E.
53
O jogador 1 …cará indiferente entre A e B se o payo¤ jogando cada uma dessas
possibilidades for o mesmo:
2 = (0; 0; 1)
54
2 pre…rirá estritamente a opção C, e então o jogador 1 jogará A com probabilidade
um, que corresponde à extrema direita do desenho e portanto não é compatível com a
1
hipótese utilizada de 1 (A) < 101 . Raciocínio análogo aparece no caso de 1 (A) > 100
101 .
Uma nota importante a respeito de estratégias mistas que constituem equilíbrios
de Nash é o fato de que os jogadores, como assinalado acima, não têm preferências
em jogar a estratégia mista ou alguma das estratégias puras que a constitui. Além
disso, o que determina as probabilidades em que os jogadores randomizam é a necessi-
dade do outro(s) jogador(es) …car(em) indiferente(s) entre as estratégias em que ele(s)
coloca(m) probabilidade positiva na(s) sua(s) estratégia(s) mista(s). Isto leva ao fato
de se questionar o porquê de um jogador se preocupar em aleatorizar, dado que isso
não incrementaria seu payo¤ esperado. Se o jogo for jogado várias vezes, torna-se fácil
de se perceber a vantagem do comportamento aleatório, pois não procedendo assim
o(s) outro(s) jogador(es) explorarão em proveito deles essa previsibilidade de compor-
tamento (lembre, por exemplo, o caso do pôquer citado no início da seção). No caso de
um jogo que não irá mais se repetir (ao menos com uma certa probabilidade), a questão
torna-se mais delicada. Uma resposta possível é que, na realidade, as pessoas em geral
não aleatorizam. O que elas fazem é guiarem-se por alguns sinais inconsequentes (para
o jogo em si) e, a partir daí, de…nem suas opções. O importante é que o outro jogador
não perceba o signi…cado de tais sinais e enxergue o primeiro como se ele estivesse
aleatorizando. Voltemos ao exemplo do goleiro à frente de uma penalidade máxima.
Pode ser que o jogador saiba em que lado ele irá chutar. Mas como o goleiro não tem
essa informação, pode acreditar que o jogador irá aleatorizar de alguma forma, e apenas
isso já seria su…ciente para justi…car um comportamento aleatório de sua parte.
2.5 Aplicações
Nessa seção apresentaremos algumas aplicações do conceito de equilíbrio de Nash.
Temos, ao fazer isso, dois objetivos em mente. O primeiro é mostrar o quanto pode
ser útil a utilização da linguagem de teoria dos jogos em situações descritas a partir
do comportamento de agentes econômicos bem de…nidos, como por exemplo as …rmas
que compõem um determinado oligopólio. O segundo obejtivo é apresentar a teoria
de escolha sob interdependência estratégica a partir de espaços de estratégias tão ricos
quanto se queira. Ou seja, vamos trocar as situações descritas nos exemplos apresenta-
dos no texto até aqui, em que cada jogador tem no máximo cinco estratégias disponíveis,
por casos em que há um contínuo de possibilidades de escolha. O nosso foco principal
será a teoria de concorrência imperfeita, quando trataremos de alguns modelos canôni-
cos de oligopólio e cartel. No entanto também discutiremos uma interessante situação
de …nanciamento e provimento de um bem público.
55
2.5.1 Oligopólio de Cournot
56
do modelo competitivo - a …rma toma sua escolha considerando o fato de que as escolhas
alheias (no caso as decisões de produção de suas competidoras) vão afetar o seu payo¤,
caracterizando um elemento estratégico. Basicamente, ao tomar suas decisões, as …rmas
vão considerar um conjunto de restrições dadas pelas demanda dos consumidores do
bem (especi…cada pela curva de demanda pelo produto), por restrições tecnológicas (que
serão incorporadas na estrutura de custo de cada …rma) e por restrições de competição
dadas pelo número e pelas características dos seus competidores.
Vamos considerar um modelo simples onde duas …rmas, 1 e 2, produzem um bem
homogêneo cuja demanda é dada por
P (Q) = a Q
1. os jogadores: as …rmas 1 e 2;
que se expressa na diferença entre a receita e o custo da …rma. Note que, como es-
perado, a função de ganho caracteriza o elemento de comportamento estratégico.
O ganho de cada …rma é determinado não só pela sua escolha - pela quantidade
que ela resolveu produzir - como também pela escolha da concorrente.
57
Como dito anteriormente, no modelo de Cournot o problema das …rmas é es-
colher quantidades simultaneamente, procurando maximizar seus respectivos lucros.
Tomemos o caso da …rma 1 inicialmente. O seu problema é
8
>
> max 1 (q1 ; q2 ) = P (Q) q1 cq1 =
> q1 2S
> 01 1
>
>
>
>
>
> B C
>
< = @a QA q1 cq1 =
| {z }
>
> 0 P (Q) 1
>
>
>
>
>
> B C
>
> = @a (q1 + q2 )A q1 cq1
>
: | {z }
Q
de modo que as condições de primeira ordem do problema acima nos mostram que
@ 1
=a 2q1 q2 c=0
@q1
tal que, resolvendo,
a
c q2
q1 (q2 ) =
2
o que nos dá exatamente a melhor resposta que a …rma 1 pode dar para toda conjectura
a respeito da produção da …rma 2. Chamamos essa expressão de “função de reação”
da …rma 1 e colocamos o termo entre aspas pelo fato de se tratar de um jogo de escolha
simultânea: as …rmas não estão reagindo exatamente à uma ação que elas observaram,
mas sim à uma ação esperada da(s) concorrente(s). No entanto essa expectativa não
é tomada aleatoriamente, mas assumindo que a …rma rival está operando também na
sua função de reação correspondente.
Uma outra observação relevante diz respeito à inclinação da “função de reação”.
Observe que
@q1 (q2 ) 1
= >0
@q2 2
o que nos mostra que a melhor reação que uma …rma pode tomar em relação à variações
na oferta da concorrente é seguir na direção contrária.
Procedendo da mesma forma para a …rma 2, decorre (faça as contas) que
a c q1
q2 (q1 ) =
2
será a “função de reação” da …rma 2, a melhor resposta que ela pode dar às escolhas
da rival.
Uma vez que temos em mãos as respectivas melhores respostas das …rmas, …ca
trivial determinar o equilíbrio de Nash desse jogo: como de…nimos anteriormente, esse
58
é dado pela intereseção das melhores respostas. Substituindo q2 (q1 ) em q1 (q2 ), é fácil
veri…car que
1
q1 = (a c)
3
de modo que o equilíbrio de Nash desse jogo é dado por
1 1
(q1 ; q2 ) = (a c) ; (a c)
3 3
59
i qualquer é
n
X
a 2qi qj c=a (2 + (n 1)) qi c=0
j=1
j6=i
Logo, em equilíbrio,
1
qi = (a c) > 0 para a > c.
n+1
1
O equilíbrio de Nash28 desse jogo é portanto cada …rma produzir n+1 (a c). A oferta
da indústria e o preço do produto serão, respectivamente,
8
< Q = P qj = n (a c)
n
n+1
j=1 .
: a+nc
P (Q) = a Q = n+1
28
Note que obtemos um resultado genérico. Veja o que ocorre quando n = 2 e compare o equilíbrio
desse jogo. Faça o mesmo para a oferta da indústria, o preço de mercado e o lucro de cada …rma.
60
Segue que o lucro da i-ésima …rma em equilíbrio será
61
2
não confessa confessa
1 não confessa 1; 1 9; 0
confessa 0; 9 6; 6
Como sabemos, o único equilíbrio de Nash desse jogo é (C; C), ainda que não seja
um resultado e…ciente. É fácil ver que (N C; N C) é um resultado em que ambos os
jogadores estão melhores do que no equilíbrio. A questão que surge é se há algum tipo
de arranjo que pode ser feito entre os jogadores de forma a dar suporte a (N C; N C)
como resultado do jogo. Por exemplo, podemos permitir que haja comunicação entre os
jogadores, de modo que eles estabeleçam um compromisso mútuo sobre as suas escolhas.
Ainda que isso seja possível (a comunicação e o compromisso) restaria questionar se
esse acordo seria merecedor de credibilidade. Isso é, deveríamos acreditar que algum
do jogadores de fato iria cumprir a sua promessa e adotar a estratégia acordada com o
outro jogador? A resposta a essa pergunta é um estrondoso não! Se foi feito o acordo
e ambos prometram “não confessar”, ainda assim devemos esperar que o resultado do
jogo seja o equilíbrio de Nash, (C; C). É fácil ver porque: uma vez que o acordo foi feito,
cada jogador se questionaria sobre a sua escolha. Se ele acredita que o outro jogador irá
cumprir o compromisso, a melhor resposta que ele pode dar a essa posição ainda assim
é “confessar”. Nesse caso seu ganho seria de 0 e o do oponente seria 9. Em uma outra
conjectura, se ele por algum motivo crê que o outro jogador não cumprirá o acordo,
“confessa”continua sendo a melhor resposta. Se …zermos um raciocínio análogo para o
outro jogador a resposta seria a mesma. Concluímos portanto que o compromisso não
é crível e que o resultado do jodo de fato será o equilíbrio de Nash.
Para ilustrarmos o que foi dito acima, considere o oligopólio de Cournot acima
descrito. Nesse mesmo ambiente, considere agora o que seria a escolha ótima de um
monopolista. Ou seja, considerando que haja apenas uma …rma nesse mercado - a sua
oferta é igual à oferta da indústria, Qm = qm - o problema dessa …rma é
de modo que
1
qm = (a c) = Qm
2
menor do que a oferta da indústria em duopólio, como esperado. O preço em monopólio
será maior
1
P (qm ) = (a + c)
2
62
e o lucro do monopolista será também maior do que o lucro dos duopolistas em Cournot,
1 1
m = (P (qm ) c) qm = (a + c) c (a c)
2 2
1
= (a c)2
4
Mas mais do que maior do que o lucro dos duopolistas em Cournot, podemos
veri…car que o lucro de monopólio é mais do que duas vezes maior que o lucro das
…rmas em competição,
m 1 1
= (a c)2 > i = (a c)2
2 8 9
Emerge então uma questão natural natural: talvez devêssemos esperar que os duopolis-
tas de Cournot se coordenassem e constituíssem um cartel de forma a aumentar o seu
poder de determinação do preço de mercado. Nesse acordo, cada …rma produziria a
metade da quantidade de monopólio, qi = q2m = 14 (a c), tal que a oferta da indústria
seja aquela de monopólio, Q = q1 + q2 = qm , o preço seria o mesmo de monopólio,
P (Q) = P (qm ) = 21 (a + c), e o lucro da INDÚSTRIA seria o lucro de monopólio,
1
4 (a c)2 . Como cada …rma produziu a mesma quantidade, elas dividiriam o lucro da
indústria igualmente, de modo que os lucros seriam
1
i = (a c)2 , i = 1; 2
8
que seriam os lucros das …rmas em cartel. Como ambas as …rmas estão melhor se co-
ordenando em cartel do que competindo em Cournot, podemos imaginar num primeiro
momento que essa arranjo de fato seria a estratégia ótima a ser adotada pelas …rmas.
No entanto, pelo argumento desenvolvido no começo dessa seção, restaria analisar se
o cartel é um equilíbrio, no sentido de, uma vez que ele seja constituído, nenhum dos
jogadores, das …rmas, venha a ter incentivos para desviar do compromisso de produzir
exatamente a quantidade acordada, 41 (a c).
Considere então uma situação em que o cartel foi constituído e que as …rmas con-
cordaram sobre o plano de produção acima descrito. Vejamos o caso da …rma 1 - o
caso da …rma decorre por analogia de imediato. Há duas conjecturas que a …rma 1
pode fazer sobre o comportamento da …rma 2, quais sejam (i) a …rma 2 vai cumprir o
acorddo e (ii) a …rma 2 não vai cumprir o acordo. No caso (ii) a melhor resposta que a
…rma 1 pode dar é não cumprir o acordo também e se estabeleecer uma competição de
Cournot, com os payo¤s dados pelos valores acima descritos. Esse resultado está rep-
resentado no jogo abaixo. Vejamos qual é problema da …rma 1 quando ela conjectura
que a …rma 2 vai cumprir o acordo feito na constituição do cartel.
Nessa hipótese de o cartel ter sido constituído e 2 respeitá-lo, o problema de otimiza-
ção da …rma é escolher a sua oferta de forma a maximizar o seu lucro, dado que a …rma
63
2 está cumprindo o acordo e produzindo q2 = 14 (a c). Ou seja, como era de se es-
perar, a …rma 1 vai incorporar no seu processo de decisão a informação de que a outra
…rma estaria respeitando o acordo. Isto é, o seu problema seria
1
max 1 =q2 = (a c)
q1 2S1 4
1
= max P (Q) q1 cq1 =q2 =
(a c)
q1 2S1 4
1
= max (a Q) q1 cq1 =q2 = (a c)
q1 2S1 4
1
= max (a q1 q2 ) q1 cq1 =q2 = (a c)
q1 2S1 4
1
= max a q1 (a c) q1 cq1
q1 2S1 4
de modo que as condições de primeira ordem nos mostram que
(
a 2q1 41 (a c) c = 0
q1 = 38 (a c) > 41 (a c)
Concluímos portanto que seria ótimo para …rma 1 não cumprir o acordo e produzir
uma quantidade maior do que aquela estabelecida no cartel. Essa otimalidade …ca
claro quando notamos que a oferta da indústria será
5
Q = (a c)
8
e o preço
3a + 5c
P (Q) =
8
de onde segue que o lucro da …rma 1 seria
1 = (P (Q) c) q1
3a + 5c 3
= c (a c)
8 8
9 1
= (a c)2 > (a c)2
64 8
Note que o lucro da …rma 1 seria superior ao lucro de cartel, o que nos permite concluir
que a …rma teria incentivos a não respeitar o acordo com a …rma 2 e produzir uma
quantidade maior do que aquela acordada. Já o lucro da …rma 2 seria
2 = (P (Q) c) q2
3a + 5c 1
= c (a c)
8 4
3 1
= (a c)2 < (a c)2
32 9
64
auferindo ganhos menores do que aqueles que ela teria se engajasse em uma competição
com a …rma 1. Podemos desenvolver um raciocínio análogo para a …rma 2 e gerar, por
simetria, resultados semelhantes. Segue que na forma normal esse jogo seria exatamente
um Dilema dos Prisioneiros, como abaixo descrito,
…rma 2
cartel compete
…rma 1 cartel 1
8 (a c)2 ; 18 (a c)2 3
32 (a c)2 ; 649
(a c)2
compete 9
64 (a c)2 ; 323
(a c)2 1
9 (a c)2 ; 19 (a c)2
onde o único equilíbrio de Nash é competir em Cournot. Podemos ver que o payo¤
associado ao cartel é estritamente maior do que o ganho de equilíbrio para ambas as
…rmas, de modo que o equilíbrio não é e…ciente. No entanto o acordo não é crível na
medida em que nenhuma das …rmas tem incentivos a jogar nenhuma estratégia que
não aquela(s) que compõem o equilíbrio de Nash do jogo: o equilíbrio de Nash é um
resultado (estrategicamente) estável.
Antes de discutirmos o resultado acima a partir de um exemplo no mundo real,
considere uma palavra de precaução. O que a análise mostrou não foi que cartéis não
existem ou mesmo que não devemos esperar que venham a existir. O que mostramos
foi que nessa estrutura, analisando um jogo estático de informação completa NÃO
REPETIDO, o cartel não é um resultado crível. Não obstante, podemos adiantar que
mesmo em situações em que o cartel possa ser caracterizado como uma estratégia de
equilíbrio, haverá um componente de instabilidade signi…cativo. O ponto é que em
relacionamenteos repetidos, onde os jogadores usam suas respectivas reputações (o que
eles …zeram no passado) para suportar esse resultado de cartel, a constituição de um
sistema penal entre os jogadores que dê lastro ao compromisso pode ser extremamente
complexa e via de regra vai estar sujeita a choques que irão comprometer essa credi-
bilidade ao longo do tempo.
65
boicote de 1972, a OPEP tinha pouco impacto sobre o mercado mundial e apenas no
começo dos anos 80 a organização tentou explicitamente aumentar o preço do óleo30 .
A estratégia adotada para manter altos preços foi similar à descrita acima nessa
nota. Os países membros deveriam restringir a sua produção; ou eles acabariam pro-
duzindo uma quantidade maior do que a demanda mundial, convergindo para uma
situação de competição perfeita. Nesse sentido cada país acordou em respeitar uma
quota de produção, de modo que em 1982 a OPEP determinou um produto limite
diário de 18 milhões de barris de petróleo - em 1979 havia sido de 31 milhões barris -
e o preço chegou a US$ 34,00 por barril. No arranjo …rmado entre os membros, cada
país tinha uma quota individual de produção, exceto a Arábia Saudita, que era o maior
produtor e que …cou responsável em ajustar a sua oferta como necessário para manter
os preços.
Como argumentamos no modelo apresentado acima, o estabelecimento e a manutenção
de um cartel não é algo trivial de se conseguir. No caso da OPEP não foi diferente.
Não obstante o baixo número de membros e a natureza pública das informações com
relação ao cumprimento ou não das quotas estabelecidas, via de regra o acordo era
quebrado. Em algumas situações a Arábia Saudita colocou no mercado um volume de
petróleo que fazia com que o preço do barril estivesse abaixo daquele estabelecido no
acordo, auferindo dessa forma lucros acima daqueles que obteria se cumprisse o acordo
e provocando perdas aos outros países que respeitaram as suas quotas. Outro exem-
plo interessante de violação do cartel ocorreu durante o período da guerra Irã-Iraque
(1980-1985), quando não raramente o volume total ofertado de óleo excedia aquele
acordado entre os países. Esse tipo de comportamento acabou abarrotando o mercado
de petróleo e, a despeito dos esforços da Arábia Saudita para controlar a ofeta global,
os preços despencaram. Além de todas essas questões relacionadas à instabilidade do
arranjo arquitetado entre os países, ocorreram várias disputas envolvendo empresas que
não pertenciam ao cartel, como a British National Oil Company que estabeleceu um
preço de US$ 3,00 em 1983, provocando uma guerra de preços com alguns dos países
membros da Opep. Hoje em dia a produção da Opep ocupa pouco menos do que 30%
do mercado mundial de petróleo. Com o preço do barril estando abaixo dos US$ 20,00,
o efeito do cartel sobre a determinação desse preço é em certa medida negligível.
Em vários outros mercados de commodities tem havido esforços para cartelização,
como café, chá etc. Alguns destes têm experimentado algum sucesso no curto prazo,
como foi o caso dos produtores de bauxita e urânio, mas não se sustentaram ao longo
do tempo - uma excessão digna de crédito diz respeito à produção de diamantes. Em
geral, a maioria dos cartéis internacionais têm se mostrado ine…cazes em afetar de uma
30
Um ponto relevante nesse ambiente diz respeito aos aspectos legais desse tipo de comportamento
colusivo. Na medida em que a OPEP é controlada por países, as leis antitrustes das demais a nações
não têm alcance sobre as medidas de…nidas pela organização.
66
maneira substancial os preços por um longo período de tempo.
Hipóteses:
– os consumidores compram da …rma que cobra mais barato: segue que a …rma
anuncia o menor preço detém todo o mercado enquanto a outra …rma …ca
forma do mercado.
– se ambas as …rmas declaram o mesmo preço, então elas dividem o mercado
igualmente, cada uma uma com metade.
o lucro de cada …rma, como habitual, depende não apenas de sua própria escolha
mas também é afetado pela escolha da rival. Tome o caso da …rma 1, por exemplo,
seu lucro será
8
>
< (p1 c) (a p1 ) se c < p1 < p2
1
1 (p ;
1 2p ) = 2 (p1 c) (a p1 ) se c < p1 = p2
>
: 0 caso contrário
– note que o lucro de 1 é positivo se p1 > c. Além disso, ele será tanto maior
se seu preço for menor do que o da rival e apenas a metade se for igual.
Por …m o lucro nunca será negativo na medida em que cada …rma tem a
prerrogativa de cobrar um preço igual ao custo marginal e assegurar lucro 0
na pior das hipóteses.
67
– como a situação é a mesma para a …rma 2, vamos restringir nossa atenção
para preços tais que
pi c, i = 1; 2
observe que a …rma com o menor preço detém todo o mercado. Segue que cada
…rma tem um incentivo a anunciar um preço menor do que o da rival. Em última
instância, isso direcionará o preço de equilíbrio para baixo, até o custo marginal.
Vejamos agora o argumento formal para isso.
1. note que um equilíbrio de Nash do jogo é cada …rma cobrar o custo marginal:
nesse caso cada …rma tem metade do mercado e aufere lucro zero porque
cada unidade é vendida ao seu custo de produção.
– porque é um equilíbrio? Se ela elevar seu preço, ela perderá toda a
demanda que tinha posto que o preço da rival será estritamente menor!
nenhuma …rma tem incentivos a desviar.
– segue que não é possível que nenhuma …rma tenha lucro maior do que
zero, de modo que a escolha de preço de cada …rma é ótima dada a
escolha alheia (melhor resposta).
2. agora vamos mostrar que não há outro equilíbrio de Nash. Como cada …rma
i = 1; 2 escolhe pi c, é su…ciente mostrar que não há equilíbrio para pi > c.
Então, deixe (p1 ; p2 ) ser um equilíbrio.
– se p1 > c, então porque p2 maximiza o lucro de 2 dada a escolha de 1,
teremos p2 2 (c; p1 ], de modo a ter um lucro estritamente positivo - fora
desse intervalo seria nulo.
– além disso, p1 6= p2 , pois se …rma 2 pode ter lucro positivo escolhendo
p2 = p1 e dividindo o mercado com 1, ela pode ter um lucro maior
ainda cobrando um preço um pouco abaixo de p1 e desfrutando de todo
o mercado quase ao mesmo preço. Logo
68
– mas para uma estória similar para as …rmas com os papéis trocados
no modelo de Bertrand, o preço será igual ao custo marginal com apenas duas
…rmas. Isso está em forte contraste com o que ocorre em Cournot, onde a diferença
entre o preço e o custo marginal cai apenas na medida em que o número de …rmas
no mercado aumenta.
Os modelos de Cournot e Bertrand que apresentamos acima são modelos que tomas
como hipótese que as …rmas produzirão um bem homogêneo e nesse sentido a ínica
variável que vai distinguir esse bem aos olhos dos consumidores é o preço. Na ver-
dade, essa hipótese poderia ser relexada naquele ambiente, mas vamos tomar isso como
motivação para abordarmos o modelo de Bertrand (Joseph Louis François Bertrand,
1822-1900), que toma um modelo que em certa medida se assemelha com Cournot - por
se tratar de um jogo simultâneo - e no entanto tem uma característica que o distingue,
qual seja o fato de que a variável de escolha das …rmas é o preço.
Nesse sentido trataremos novamente de um duopólio onde duas …rmas, 1 e 2, pro-
duzem bens difereciados31 onde a demanda por cada um dos bens é dada por
(
q1 (p1 ; p2 ) = a p1 + bp2
q2 (p1 ; p2 ) = a p2 + bp1
onde a > 0 e b > 0. O fato de que b > 0 re‡ete o grau em que o produto de uma das
…rmas é substituto do produto da outra. Como no modelo anterior, e sem perda de
generalidade, vamos assumir que não há custo …xo para as …rmas produzirem e que o
custo marginal é constante e igual a c > 0.
Na forma normal temos (i) os jogadores, que são as …rmas 1 e 2, (ii) o espaço de
estratégia de cada …rma, que em Bertrand é dado pelo conjunto no qual as …rmas
podem estabelecer seu preço, pi 2 (0; p] ; i = 1; 2 e que supomos ser tal que a …rma
cobra no mínimo um preço muito baixo mas positivo pelo bem e no máximo um preço
muito alto porém de…nido tal que o conjunto (0; p] seja compacto e (iii) a função de
ganho de cada jogador que, no caso de …rmas, é dada pela função lucro, i (p1 ; p2 ),
31
Aqui, diferente do caso de bens homogêneos, os produtos se distinguem aos olhos dos consumidores
potenciais não mais apenas em função de preços, mas também em função de outras características, físi-
cas ou não, tais que torna-se necessário especi…car para cada produtor uma curva de demana particular.
69
i = 1; 2 e que caracteriza a interação estratégica entre as partes na medida em que os
payo¤s de cada jogador são afetados pelas escolhas alheias. O problema de uma …rma
qualquer, por exemplo da …rma 1, é portanto
a 2p1 + bp2 + c = 0
tal que
a + c + bp2
p1 (p2 ) =
2
é a “função de reação” da …rma 1 e nesse sentido nos diz qual é a melhor resposta
que a …rma 1 pode dar às eventuais escolhas da …rma 2. Note agora que @p@p 1 (p2 )
2
=
b
2 > 0 tal que, ao contrário de de Cournot, em Bertrand a função de reação das …rmas
tem inclinação positiva, o que nos diz que a melhor resposta que uma …rma pode
dar à variações nos preços das concorrentes é seguir na direção oposta, reduzindo ou
aumentando seus preços de forma a maximizar os seus ganhos.
Fazendo raciocínio análogo para a …rma 2, temos
a + c + bp1
p2 (p1 ) =
2
tal que torna-se trivial encontrar o equilíbrio de Nash na medida em que tenhamos
entendido o conceito como uma interseção de melhores respostas dos jogadores. Susti-
tuindo p2 (p1 ) em p1 (p2 ) obtemos
a+c b a + c + bp1
p1 = +
2 2 2
4p1 = 2 (a + c) + b (a + c) + b2 p1
4 b2 p1 = (2 + b) (a + c)
a+c
p1 =
2 b
Analogamente para a …rma 2,
a+c
p2 =
2 b
tal que o equilíbrio de Nash é cada …rma cobrar o preço
a+c
p1 = p 2 =
2 b
70
Para pi 2 (0; p] e (a; b; c) 0 temos que b 2 (0; 2). Com isso em mãos, a oferta da
…rma i = 1; 2 será
a+c a+c
qi (p1 ; p2 ) = a +b ; i = 1; 2
2 b 2 b
a c + bc
qi (p1 ; p2 ) = , i = 1; 2
2 b
e o lucro de cada …rma será dado por
2
a c + bc
i = ; i = 1; 2.
2 b
71
precisa de no mínimo de um certo montante de grama para sobreviver, há um número
máximo de bodes que pode pastar no gramado, de modo que
(
v (G) > 0 para G < Gmax
v (G) = 0 para G Gmax
Além disso, como os primeiros bodes a pastar encontram grama em abundância, adi-
cionar um animal a mais na área comum implica em um pequeno dano para aqueles
que já estão se alimentanto, mas quando muitos bodes já estão pastando (um número
tão grande que eles se alimentam apenas para sobreviver), então a adição de um bode
a mais no gramado provoca um dano dramático dos demais animais. Formalmente,
para G < Gmax
v 0 (G) < 0 e v 00 (G) < 0
como na …gura abaixo
…gura - aqui
Durante a primavera, os fazendeiros escolhem simultaneamente o tamanho de seu
rebanho. Assuma que os animais sejam continuamente divisíveis. Uma estratégia para
um fazendeiro i 2 n qualquer é a escolha do número de bodes ele levará para pastar
no campo da vila, gi 2 [0; Gmax ]. O payo¤ desse fazendeiro quando leva gi bodes para
pastar e o número de bodes pastando dos demais fazendeiros é g1 + g2 + ::: + gi 1 +
gi+1 + ::: + gn é dado por
@ui (gi ; g i )
= v gi + g i + gi v 0 gi + g i c=0
@gi
ou ainda,
v (G ) + gi v 0 (G ) c=0
condição que é verdade para todo fazendeiro i = 1; 2; :::; n. Somando para esses n
fazendeiros, temos
nv (G ) + G v 0 (G ) nc = 0
ou melhor,
1
v (G ) + G v 0 (G ) c=0
n
72
P
n
onde G = gi = g1 + g2 + ::: + gn . Por outro lado, o ótimo social, denotado por G ,
i=1
decorre do problema de
max Gv (G) cG
0 G<
Prova. Suponha que não, que G G . Nesse caso, como v 0 < 0, então v (G )
v (G ). Do mesmo modo, como v 00 < 0, então 0 < v 0 (G ) v 0 (G ). Por …m,
G
n < G . Logo, o lado esquerdo do problema de Nash excede o lado esquerdo do
problema social, o que é impossível na medida em que ambos são iguais a zero.
O fato de que G > G implica que há muitos bodes pastando no campo público
quando comparado com a quantidade que seria desejável do ponto de vista social. As
cpo’s do problema de Nash re‡etem os incentivos que têm um fazendeiro que já tem gi
bodes pastando mas que está considerando adicionar um animal a mais no pasto (ou,
falando corretamente, um fração de um bode). O valor do bode adicional é v gi + g i
e seu custo é c. O dano aos fazendeiros cujos bodes que já estão pastando é v 0 gi + g i
por bode, ou gi v 0 gi + g i no total. O recurso comum é sobre-utilizado porque cada
fazendeiro considera apenas os seus próprios incentivos, não os efeitos de suas ações
0
sobre os demais fazendeiros, como mostra a presença de G vn(G ) no problema de Nash
ao invés de G v 0 (G ) do ótimo social.
73
3 Jogos Dinâmicos de Informação Completa
Essa seção inicialmente abordará jogos de informação completa que tenham também
informação perfeita. Isto é, quando escolhem suas estratégias, os jogadores sabem qual
foi toda a história pregressa do jogo até então, o que não ocorria nos jogos vistos até
aqui, onde cada jogador não sabia, não observava, o que demais jogadores tinham feito.
De outra forma, antes o jogo ocorria como se fosse simultâneo (estático) - agora iremos
trabalhar com jogos em que as escolhas dos jogadores se dão sequencialmente. Esses
jogos são ditos jogos dinâmicos. No …nal da seção, analisaremos também situações que
sejam parcialmente dinâmicas e parcialmente estáticas. Ou seja, trabalharemos com
jogos dinâmicos ditos jogos de informação imperfeita, que são jogos com movimentos
sequenciais dos jogadores, mas que não seja necessário que todos os jogadores saibam
toda a história pregressa do jogo. O que caracteriza a informação completa é que
os payo¤s dos jogadores para cada combinação de movimentos são de conhecimento
comum (“common knowledge”).
A questão central nos jogos dinâmicos diz respeito à credibilidade das ameaças e
promessas dos agentes. Às vezes, por exemplo, pode ser ótimo saber que o outro jogador
observa sua atitude antes de tomar suas decisões. Essas questões serão detalhadas
durante esta seção e na próxima.
Suponha que um sequestrador possa fazer apenas uma ameaça a seu sequestrado:
caso esse último não lhe dê um cheque de R$1.000.000,00 , ele irá explodir uma granada
no esconderijo em que estão, que certamente matará ambos. A vítima pode lhe dar
o cheque ou não. O que você faria? Supondo que o sequestrador é racional, como
usualmente se faz, você não deveria fazer o cheque. É claro que o sequestrador não
gostará disso, mas, uma vez que você resolveu não dar o cheque, o melhor que ele pode
fazer é não explodir a granada, pois isso pioraria muito o seu bem-estar. Portanto,
o equilíbrio (como iremos de…nir abaixo) neste jogo será você não fazer o cheque e o
sequestrador, ainda que “malvado”, não explodir a granada. O ponto fundamental é
que a ameaça do sequestrador não é crível, pois se ele a cumprir ele se prejudicará mais
que se não a cumprisse. O sequestrado, estando ciente disso, não deve deixar se levar
por uma ameaça que não será cumprida34 .
33
Baseado em Gibbons (1992).
34
Estamos supondo aqui que o sequestrador é racional (faz o melhor para ele mesmo) e que morrer
é a pior coisa que pode ocorrer a ele. Obviamente, se ele aparentar sinais de pouca lucidez ou, mesmo
em sã consciência, não estiver aparentando dar muito valor à vida ou pertencer a seitas radicais ou
qualquer coisa que o valha, então é claro que será preferível ao sequestrado fazer o cheque, preservando
sua própria vida.
74
3.1 Forma Extensiva
Nós representamos os jogos até agora apenas pela forma normal (ou estratégica).
Veremos, entretanto, que há uma outra forma de representação: a forma extensiva, uma
forma mais detalhada do que a forma normal. Segue daí que um jogo na forma extensiva
em geral sofre perdas de informação quando o passamos para a forma normal, enquanto
o inverso nem sempre é possível de se fazer. Nos jogos estáticos, não há problemas em
tratá-lo apenas na forma estratégica, sendo inclusive mais conveniente. Todavia, isso
com certeza ocorreria nos jogos dinâmicos. Por isso, os abordaremos utilizando a forma
extensiva.
Um jogo (de informação completa e perfeita) na forma extensiva nos dá as seguintes
informações:
quais são as ações possíveis para cada jogador em cada vez em que ele for chamado
a decidir,
toda a história pregressa do jogo quando cada jogador tem de tomar uma decisão,
os payo¤s dos jogadores para cada conjunto possível de ações que tenham sido
tomadas, até o …nal do jogo.
Exemplo 44
75
em jogos de escolha simultânea. Aqui uma estratégia deve ser vista como "um plano
completo de ação", deve especi…car para o jogador em questão as suas possibilidades
de ação contingentes à todas as ações possíveis dos jogadores que jogaram antes35 dele.
No jogo acima, por exemplo, o espaço de estratégias do jogador 2 é
8 9
>
> (jogar e dado que o jogador 1 jogou e, jogar e dado que o jogador 1 jogou d), >
>
>
< (jogar e dado que o jogador 1 jogou e, jogar d dado que o jogador 1 jogou d), >
=
S2 =
>
> (jogar d dado que o jogador 1 jogou e, jogar e dado que o jogador 1 jogou d), >
>
>
: >
;
(jogar d dado que o jogador 1 jogou e, jogar d dado que o jogador 1 jogou d)
Uma vez que os jogadores 1 e 2 …zeram as suas escolhas, o payo¤s são dados pelos
números situados após os últimos nós de decisão, ditos nós terminais. Por convenção, o
primeiro número se refere ao payo¤ do jogador que jogou primeiro, o segundo número
ao payo¤ do jogador que jogou em segundo lugar e assim sucessivamente no caso de
jogos com mais de dois jogadores. Logo, lendo o jogo acima na forma extensiva, temos
1. os jogadores: 1 e 2,
76
Podemos veri…car se no jogo abaixo há memória perfeita dos jogadores envolvidos.
1. o jogador 1 escolhe uma ação entre as suas possibilidades delimitadas pelo con-
junto de possibilidades de estratégias,
3. o jogo termina e os payo¤s cada jogador são determinados em função da sua es-
colha e também do elemento de interação estratégica, a escolha do outro jogador.
Essa de…nição simples segue a apresentação de Gibbons (1992), mas pode ser muito
ampliada. Além da possibilidade de existência de mais de dois jogadores, poderia
ocorrer que dentro de um mesmo jogo um ou mais jogadores pudessem vir a jogar
77
mais de uma vez. Além de diversas situações mais relevantes, inclusive de natureza
econômica, mesmo outras mais simples se adaptariam claramente a esses casos. Pense,
por exemplo, na maior parte dos jogos de cartas ou de tabuleiros: em geral, jogam de
duas a seis pessoas, uma após a outra, com ações tomadas um grande número de vezes
durante o jogo. Normalmente, pelo menos a maioria deles pode ser analisada como
jogos dinâmicos de informação perfeita e completa.
A forma de se resolver situações dessa natureza é a descrita a seguir. Assim como
em jogos estáticos, solucionar jogos dinâmicos é também um exercício de previsão
em que o analista busca antever o comportamento dos jogadores envolvidos tendo em
mente algumas premissas sobre a postura geral dos jogadores. Mas se antes os jogadores
consideravam estratégias que fossem racionalizáveis apenas, agora eles têm de trabalhar
com estratégias que sejam sequencialmente racionais. Isto é, aquelas que não envolvam
promessas/ameaças não críveis (como a do sequestrador que ameaça explodir a granada
e se matar).
De…nição 45 Uma estratégia que seja sequencialmente racional deve prescrever for-
mas de agir que sejam racionais em cada ponto de decisão que o jogador possa estar.
Ou seja, o jogador não joga apenas estratégias racionalizáveis, ele jogará estratégias
racionalizáveis sempre que for chamado a jogar.
Ou seja, caso o jogador esteja em determinado ponto na árvore de decisão, ele deve
ter estratégias que são ótimas a partir daí, dadas as possíveis estratégias e escolhas
futuras dos outros jogadores.
Trabalhando inicialmente apenas com o exemplo mais simples de jogos de infor-
mação perfeita e completa dado acima (com apenas dois jogadores fazendo uma escolha
cada um durante o desenrolar do jogo), o procedimento que adotamos para resolvê-
lo é dito indução retroativa ("backward induction") e é descrito da seguinte forma.
Começamos sempre pelo …nal do jogo, analisando o jogador que joga por último37 , no
caso o jogador 2. Esse jogador já observou a escolha do jogador 1 e deve escolher uma
estratégia tal que, condicional à escolha de 1, lhe dê o maior payo¤ possível. O jogador
2 faz então a sua escolha. Passamos a seguir para a análise do problema de escolha do
jogador 1. O fundamental aqui é entender que, como se trata de um ambiente de infor-
mação completa, o jogador 1 também sabe qual será a melhor atitude38 que o jogador
2 pode tomar para cada escolha que ele, jogador 1, venha a fazer. O jogador 1, por
isso, não escolherá aleatoriamente sua estratégia …cando, depois, “torcendo” para que
o outro jogador faça algo que também seja favorável a ele. Na verdade, no momento
37
Daí o termo "retroativa". Para uma descrição formal do método, veja o apêndice.
38
Dito de outra maneira, o jagador 1 consegue antecipar perfeitamente qual será a reação do jogador
2 para cada ação que ele tomar. Segue daí que o problema de 1 pode ser posto como o problema de
tomar uma ação tal que induza o jogador 2 a uma reação que seria ótima do ponto de vista do jogador
1.
78
de fazer a opção da melhor estratégia a se tomar ele já considerará que, dependendo
do que ele escolher, isso afetará a escolha do jogador 2 e esse pensará apenas no seu
próprio bem-estar no momento de de…nir sua estratégia. Procedendo assim, e dado
que a forma de resposta do jogador 2 é dada pela sua escolha condicional à decisão de
1, o seu problema é o problema de escolher uma estratégia que lhe dê o maior payo¤
possível dado que o jogador 2 reagirá de forma ótima à sua tomada de decisão. Da
solução desse conjunto de tomadas de decisão, do jogador 1 e do jogador 2, teremos
um (ou mais) par de estratégias que caracterizará o resultado de indução retroativa
desse jogo. Esse resultado elimina qualquer tipo de ameaça ou promessa que não sejam
críveis, pois o jogador 1 antecipa o que o jogador 2 fará em cada uma das situações pos-
síveis, buscando o seu próprio bem-estar. Assim, jogador 1 não acredita em eventuais
ameaças que possam ser feitas pelo jogador 2 e que incorporem atitudes desse último
que não sejam ótimas para ele mesmo, uma vez que o jogador 1 já fez a sua ação.
Exemplo 46 Considere o Exemplo 43, no início dessa dessa seção. Por indução
retroativa, analisemos incialmente o problema do jogador 2. Se o jogador 1 jogou
e, será ótimo para ele jogar e também39 , pois o ganho que ele teria nesse caso seria
4, maior do que 2, o ganho que ele teria se jogasse d. Por outro lado, conjecturando
que o jogador 1 jogou d, será ótimo para 2 jogar d também40 , pois o ganho que ele
teria seria 1, maior do que 0, o ganho que ele teria se jogasse e. Porém o jogador 1
consegue antecipar os possíveis movimentos do oponente: como se trata de um jogo de
informação completa onde a racionalidade sequencial dos jogadores é de conhecimento
comum, então ele sabe quais serão as reações de 2 para cada ação que ele tomar. Tendo
isso em mente, o melhor que ele pode fazer é jogar d, pois nesse caso 2 jogaria também
d e seu ganho seria 4, maior do que o ganho que ele teria se jogasse e, pois nesse caso
o jogador 2 também escolheria e e seu ganho seria 1. Logo o resultado do jogo por
indução retroativa é "o jogador 1 jogar a estratégia d e o jogador 2 jogar a estratégia
jogar d dado que 1 jogou d". O payo¤ s de equilíbrio serão (4; 1).
Exemplo 47
39
Na verdade seria jogar a estratégia "jogar e dado que o jogador 1 jogou e".
40
Ou mehor, jogar a estratégia "jogar d dado que o jogador 1 jogou d".
79
Qual o resultado de indução retroativa do jogo acima? Vejamos o que o jogador 2
deve fazer em cada uma das situações possíveis:
Como o jogador 1 antecipa isso perfeitamente, ele sabe que as opções efetivamente
alcançáveis são apenas (e; e) e (d; d). Diante disso, irá jogar d e assim garantirá utilidade
de 2 unidades. O resultado de indução retroativa é, portanto, (d; jogar d dado que 1 jogou d).
Note, por outro lado, que esse resultado está longe de constituir algo próximo do
que se poderia denominar “socialmente ótimo”, e…ciente ou a…m. Se ele fosse, por
exemplo, (e; d), ambos os jogadores estariam melhor. Sendo assim, por que não sugerir
um acordo entre os jogadores que possa levar a esse resultado? Porque o jogador 1 sabe
que, uma vez que ele cumprisse sua parte no acordo, o jogador 2 não teria incentivos em
mantê-lo, pois poderia obter um payo¤ superior. Ciente disso, o jogador 1 não se deixa
levar por promessas como essas, por não serem críveis. Da mesma forma, mesmo que
o jogador 2 ameace jogar e, caso o jogador 1 jogue d, esse último sabe que tal ameaça
também não é crível, e portanto não a aceita. Tudo isso é simples consequência do
pleno conhecimento de racionalidade (sequencial) entre os jogadores. Nesse caso, não
se requer muito, bastando que ambos os indivíduos sejam racionais e que o jogador 1
saiba que o jogador 2 também o seja.
É importante lembrar também que não é necessário que cada jogador jogue apenas
uma vez durante o jogo, como já comentamos antes. Cada um deles pode ser chamado
a escolher mais de uma vez, sendo que a lógica de resolução não se altera. Sempre
se olhará inicialmente para o …m do jogo, destacando as respostas ótimas em cada
situação, e se encontrará o resultado de indução retroativa tomando como base tais
possibilidades.
80
conhecido como “mini-centopéia”.
1. os jogadores: 1 e 2,
5. os payo¤s: se 1 joga a o jogo termina no primeiro estágio e os ganhos são (2; 0).
Se 1 joga b e o jogador 2 joga c,o jogo termina no segundo estágio e os ganhos
são (1; 1). Se 1 joga b e 2 joga d, o jogo vai para o terceiro estágio. Ali, se 1 joga
e o jogo termina e os ganhos são (3; 0) e se 1 joga f o jogo também termina e os
ganhos são (0; 2).
Por indução retroativa, primeiramente vejamos qual seria a opção escolhida pelo
jogador 1 (o jogador que joga por último nesse caso) se o jogo alcançar o terceiro estágio.
Nessa possibilidade, o melhor para ele será escolher a opção e e obter payo¤ de 3 > 0.
Sabendo disso, o jogador 2, caso jogue, preferirá escolher c e terminar o jogo sem que
esse alcance o terceiro estágio, pois assim obteria payo¤ de uma unidade, e não de zero
81
- o que ocorreria se o jogador 1 voltasse a jogar. Por sua vez, o jogador 1, ao fazer a sua
primeira opção, já sabe dessa estratégia do jogador 2. Para ele é preferível, portanto,
terminar o jogo (jogando a) logo na primeira rodada, obtendo payo¤ de 2, e não de 1,
que ele teria caso o jogo continuasse - com o jogador 2 …nalizando-o em seguida. Sendo
assim, o resultado de indução retroativa é o jogador 1 jogar a na primeira rodada e
terminar o jogo. Podemos escrever as estratégias que levam a isso da seguinte forma:
jogador 1: joga a na primeira vez que joga e na segunda vez joga e se ele jogou b
e 2 jogou d
Em palavras:
No jogo anterior - assim como em qualquer outro -, perceba que, apesar do jogo ter-
minar no seu primeiro estágio, saber o que ocorreria caso ele continuasse é fundamental
para determinarmos o resultado por indução retroativa. Deve-se portanto sempre con-
siderar o que ocorreria caso o jogo continuasse. Eventualmente poderá valer a pena
para os jogadores continuar o jogo. No jogo acima, esse não foi o caso, mas essa é
apenas uma possibilidade. O fundamental é ver que, mesmo para saber que ele seria
terminado na primeira rodada, foi necessário analisar toda a estrutura do jogo.
Pense, por outro lado, o que estaria ocorrendo caso o jogador 1 não terminasse o
jogo na primeira rodada. A conclusão é que, nesse caso, a racionalidade dos indivíduos
não seria de conhecimento comum (“common knowledge”). Poder-se-ia pensar, como
uma hipótese, que o jogador 1 não seria racional. Entretanto, poderia ser o caso
também de o jogador 1 acreditar que o jogador 2 não fosse racional e esperar que ele
não termine o jogo. Assim ele poderia tentar obter payo¤ de 3 unidades, uma vez que
o jogo atingisse a terceira rodada. Uma outra possibilidade é o jogador 1 saber que o
jogador 2 é racional, ser ele mesmo racional mas achar que o jogador 2 possa não ter tal
informação. Assim, ele poderia continuar o jogo esperando que o jogador 2 também o
…zesse, na expectativa de incrementar para 2 o seu payo¤ - o que ocorreria caso o jogador
1 jogasse d na terceira rodada. Portanto, não se pode determinar precisamente onde
está o desvio de racionalidade. Sabe-se apenas que ele existe, i.e., que a racionalidade
não é de pleno conhecimento entre os jogadores. Nesse caso, a indução retroativa perde
o seu poder em determinar o resultado do jogo. A idéia, contudo, é trabalhar sempre
supondo a existência de “common knowledge” da racionalidade entre os jogadores, de
modo a viabilizar as previsões das situações onde exista interdependência estratégica.
82
Uma observação pertinente é notar a fraqueza do conceito de equilíbrio de Nash em
jogos dinâmicos. Nesses casos, sua utilização pode levar a resultados que incorporem
ameaças/promessas não críveis. É por esse motivo que trabalhamos acima com um con-
ceito diferente para se prever os resultados desses jogos. Equilíbrio de Nash é, de fato,
uma forma adequada de se prever os resultados em muitos jogos, mas desde que esses
tenham caráter estático. No caso dinâmico, é necessário que se re…ne esse conceito no
sentido de se eliminar as possibilidades de que as tais ameaças e promessas enão críveis
sejam consideradas - e é exatamente daí que segue a necessidade de representarmos
jogos dinâmicos na forma extensiva, pois a forma normal poderia viesar a análise do
resultado do jogo.
Exemplo 49 Considere o tradicional jogo onde uma …rma está instalada (I) em um
mercado enquanto monopolista e uma outra …rma (E) está considerando entrar nesse
mercado. Ela escolhe entre entrar ou não. Caso entre, a antiga monopolista escolhe
entre lutar (fazer uma guerra de preços, por exemplo) ou acomodar-se (constituir um
duopólio, um mercado onde apenas duas …rmas produzem). Vejamos a forma extensiva
deste jogo :
1. os jogadores: as …rmas E e I,
2. os espaços de estratégia,
SE = ffora, entrag
SI = fluta se a …rma E entra, acomoda se a …rma E entrag
5. os payo¤s.
83
Como E sabe disso, ela irá entrar, apesar de uma eventual ameaça da …rma I de lutar
caso ela faça isso.
Podemos representar o jogo acima também na forma normal:
…rma I
luta se …rma E entra acomoda se …rma E entra
…rma E fora 0; 2 0; 2
entra 3; 1 2; 1
Nota-se, portanto, que há dois equilíbrios de Nash no jogo acima: o resultado por in-
dução retroativa e o conjunto de estratégias onde E não entra e I luta se E entra. A
questão central aqui é que essa última ameaça não é crível e portanto não deveria ser
considerada. Temos, portanto, que o conceito de equilíbrio de Nash não elimina tais
possibilidades, pois ele não incorpora a idéia de que as estratégias devem ser sequen-
cialmente racionais. Apenas um equilíbrio de Nash no jogo acima pode ser obtido via
indução retroativa e, portanto, apenas esse equilíbrio é um resultado sequencialmente
racional.
Um outro resultado muito importante na teoria de jogos dinâmicos é o chamado
Teorema de Zermelo. Ele nos diz que todo jogo …nito de informação perfeita possui um
equilíbrio de Nash em estratégias puras que pode ser obtido via indução retroativa (e
que será, portanto, sequencialmente racional). Além disso, se nenhum jogador possui
payo¤s iguais em pontos terminais distintos, então existe apenas um equilíbrio de Nash
que pode ser derivado dessa forma.
84
3.3 Aplicações
3.3.1 O modelo de Stackelberg
1. os jogadores: as …rmas 1 e 2;
2. os espaços de estratégias dos jogadores, S1 e S2 , tais que
(
S1 = [0; q 1 ]
S2 = f[0; q 2 ] =s1 2 S1 g
> = (a Q) q2 cq2 =
:
= (a q1 q2 ) q2 cq2
CPO:
@ 2
=a 2q2 q1 c=0
@q2
a c q1
q2 (q1 ) =
2
85
– função de reação da …rma 2 (sem aspas)! jogo dinâmico.
B a c q1 C
B C
= Ba q1 C q1 cq1 =
@ 2 A
| {z }
q2 (q1 )
a c q1
= 2 q1
CPO:
@ 1 a c
= q1 = 0
@q1 2
a c
q1 =
2
– substituindo na reação de 2,
a c
q2 (q1 ) =
4
– o ENPS (e por IR também) é portanto
a c a c
q1 = ; q2 (q1 ) =
2 4
a oferta da indústria é
1 1 3
Q = q1 + q2 = (a c) + (a c) = (a c)
2 4 4
– e o preço de mercado
1
P (Q) = a Q= (a + 3c)
4
– tal que o lucro da líder será
86
– e o lucro da seguidora
Stackelberg X Cournot.
3 2
1. Qs = 4 (a c) > 3 (a c) = Qc , e portanto
1
2. ps = 4 (a + 3c) < 13 (a + 2c) = pc
3. note que o lucro da líder em Stackelberg é maior do que o lucro dos duopolis-
tas em Cournot mas que esse é maior do que o lucro da seguidora em Stack-
elberg.
– no entanto nada podemos dizer com relação ao bem-estar social: ainda que
a soma dos ganhos das …rmas em Cournot seja maior do que em Stackelberg
3 2
16 < 9 , o fato de o preço do bem ser menor em Stackelberg faz com que
o excedente do consumidor seja maior nesse caso.
87
Tanto em contextos econômicos quanto legais, um acordo pode ser retardado na
medida em que as partes prolonguem a negociação. Eventualmente pode acontecer
de as partes interessadas nunca chegarem a um acordo. Via de regra esse atraso im-
plica em algum tipo de custo às partes interessadas: um custo de oportunidade da
negociação, ou seja, dos ganhos que cada parte poderia estar obtendo se o acordo já
tivesse sido fechado, e um custo pecuniário inerentes à negociação, como por exemplo
custos processuais. Esses custos de oportunidade podem ser representados pela pro-
dução que não se realizou e os custos pecuniários pelos gastos com a intermediação do
acordo. Tais custos podem ser signi…cativos em casos importantes, como aquisições
corporativas, greves patrocinadas por sindicatos de trabalhadores e em diversos litígios
civis.
Se não se chega a um acordo, então em algum período de tempo as partes param de
barganhar, como no caso em que comprador e vendedor buscam parceiros alternativos
para fazer seus negócios. Nesse caso, se pensarmos no contexto legal, uma corte impõe
alguma regra que as partes devem seguir. Nesse sentido, essas cortes legais são um
exemplo de resolução judicial de impasses.
No que se segue vamos analisar o modelo teórico de barganha tendo como pano de
fundo um processo de negociação entre um sindicato de trabalhadores e uma entidade
patronal, representante das empresas na quais esses trabalhadores são funcionários.
Não custa uma palavra de precaução aqui: como em todo modelo teórico, essa rep-
resentação é uma simpli…cação das negociações que de fato ocorrem no mundo real e
nesse sentido não buscamos generalizar os resultados que obtivermos para enriquecer
a nossa compreensão de negociações como um todo, mas tão somente entender esses
processos de negociações como jogos dinâmicos de informação completa4142 .
O jogo se dá como se segue. Há, dois jogadores, 1 e 2, onde vamos considerar que 1
representa uma associação patronal e que 2 representa um sindicato de trabalhadores.
Eles estão negociar sobre a divisão dos benefícios da produção de um determinado
período, um ano por exemplo. Esse benefício é de conhecimento comum e, obviamente,
sua totalidade soma 100%. A negociação se dá entre as partes de forma a decidir o
41
Existe uma literatura consolidada de barganha em ambientes de informação incompleta. De…n-
itivamente essa literatura foge do escopo deste curso. O aluno curioso e interessado pode achar em
Rubinstein (19??) uma exposição do tema, mas não há nenhuma exposição do assunto que não demande
um conhecimento mais pormenorizado tanto de teoria dos jogos quanto da parte formal.
42
Como dito acima, uma transação, contrato ou disputa legal qualquer requer algum tipo de barganha
entre as partes, seja sobre o preço seja sobre outros aspectos do acordo. Via de regra esse processo
parece ser ine…ciente em função de atrasos (por exemplo uma greve que prejudica tanto os salários
dos trabalhadores quanto a produção da …rma) e de gastos diretos que poderiam ter sido evitados
concluindo um acordo similar antes. Os estudos do papel de informação privada (jogos de informação
incompleta) em negociações indicam, entretanto, que esses custos são consequências dos incentivos das
partes em se comportarem estrategicamente e da necessidade de comunicação para estabelecer uma
base comum de forma a montar o acordo.
88
percentual que cada um dos interessados tem direito sobre essa totalidade43 . Ambas
as associações desejam obter o máximo possível para os seus associados e a dinâmica
da negociação se dá do seguinte modo:
89
que uma paralisação no seu ‡uxo de renda nesse período especí…co pode lhe ser partic-
ularmente custosa44 . Para facilitar a nossa análise e sem perda de generalidade, vamos
considerar que ambas as partes têm a mesma taxa de desconto.
Na forma extensiva o jogo é representado como especi…cado pela árvore abaixo
Logo há dois jogadores (1 e 2), as estratégias são as descritas na árvore, assim como
a ordenação e os payo¤s. Como trata-se de um ambiente de memória perfeita, os
movimentos dos jogadores em cada nó de decisão é de conhecimento comum em cada
um desses nós.
Sendo mais especí…co, observe o que acontece no primeiro movimento: o jogador 1
diz ao jogador 2 que do total que eles estão barganhando, ele quer x 2 [0; 1], ou x%,
de forma que ele está oferecendo a 2 (1 x) %. Como dito, 2 pode ou não aceitar. Se
aceita a barganha termina e os ganhos são dados. Caso contrário 2 faz a contraproposta
ao jogador 1: do total a ser dividido, ele que (1 y) %, de modo que oferece a 1 y%.
Da mesma forma o jogador 1 pode aceitar ou rejeitar. Se 1 aceita o jogo termina e os
ganhos são dados. Note porém que agora já estamos no segundo estágio do jogo, de
forma que as partes já incorreram em algum custo decorrente do fato de que elas não
chegaram a um acordo no primeiro período.
De
Pede-se:
1. Taxa de desconto intertemporal (já está feita em jogos repetidos, mas ter em
mente a questão da in‡ação, taxa de juros, reputação e o exemplo do sorvete
derretendo).
90
Por indução retroativa, no segundo (e último) estágio da barganha, o sindicato
oferece (y) aos empresários, que aceitam se e somente se
2
y
2
Logo a proposta será
y=
2
2 2
e os ganhos nesse estágio seriam Up = y = 2 e Ut = (1 y) = 2 . No
primeiro estágio do jogo os empresários ofertam (1 x) aos trabalhadores que
aceitam se e somente se
2
1 x
2
de modo que a oferta ótima será
2
1 x=
2
2 2
e os ganhos seriam Up = x = 1 + 2 e Ut = 1 x = 2 . Logo o equilíbrio
de Nash perfeito em subjogos (o que nesse jogo equivale ao resultado por indução
2
retroativa) será a associação patronal ofertar (1 x) = 2 aos trabalhadores
no primeiro estágio, os trabalhadores aceitarem a proposta feita, o jogo terminar
2 2
e os ganhos serão dados por Up = 1 + 2 e Ut = 2.
91
de modo que a oferta ótima será
2
x=
2
2 2
e os ganhos seriam Up = x = 2 e Ut = 1 x= 1 + 2 . Segue que o
equilíbrio de Nash perfeito em subjogos será o sindicato dos trabalhadores ofertar
2
x= 2 aos patrões no primeiro estágio, os empresários aceitarem essa proposta
2 2
e o jogo terminar ali. Os ganhos seriam dados por Up = 2 e Ut = 1 + 2.
Note que os trabalhadores estarão melhor fazendo a oferta no primeiro estágio se
2 2
1 +
2 2
ou seja, se
2
2 +1 0
o que é sempre verdade para todo 2 [0; 1].
92
O signi…cado da linha tracejada entre dois pontos de decisão signi…ca que essa parte
do jogo é simultânea, i.e., quando o segundo joga ele não sabe o que o primeiro fez.
Note que, sendo assim, não faz diferença se, nessa parte do jogo, trocássemos a ordem
dos jogadores na árvore de decisão. De qualquer forma, nenhum dos dois sabe o que o
outro está fazendo nesse instante.
Antes de analisar o jogo com informação imperfeita, vamos ignorar a linha tracejada
e analisar o jogo no caso em que não uma parte dele que seja simultânea. Tomando o
jogo na forma extensiva, observe que o espaço de estratégias dos jogadores (entendido,
como sempre, como um plano completo de ação) será
onde, por exemplo, (F; a) para o entrante signi…ca que ele joga “fora, acomodar se ele
entra” e (a se el e l se ea) para o incumbente signi…ca que ele “acomoda se o entrante
entra e luta e luta se o entrante entra e acomoda”. Podemos representar o jogo 4 4
na forma normal e veri…car o(s) equilíbrio(s) de Nash - faça isso como exercício. Por
indução retroativa, veri…que que o resultado será
f(E; a) ; (l se el e a se ea)g
93
No jogo reduzido acima, apenas a …rma E escolhe. Ela preferirá claramente entrar e
obter payo¤ de 3 unidades, ao invés de zero, que obteria caso não entrasse. Isto porque
ela acredita que, entrando, o resultado do jogo simultâneo será o seu equilíbrio de Nash,
onde ambas as …rmas resolvem se acomodar. O resultado será
f(E; a) ; (a se E entra)g
Observe a diferença com indução retroativa nesse caso: as payo¤s serão os mesmos e
o jogo no …m seguirá na mesma direção nos dois casos (nem sempre isso será verdade,
nesse exemplo foi). Porém observe a diferença nas estratégias dos jogadores dada pela
presença ou não de informação imperfeita, de uma parte do jogo que se assemelha a
um jogo simultâneo.
Podemos também representar todo o jogo inicial na forma normal, especi…cando
cada estratégia (de…nida, como visto na seção II, como um plano completo de ações45 )
possível para os jogadores.
…rma I
acomoda se E entra luta se E entra
fora, acomoda se entra 0; 2 0; 2
…rma E fora, luta se entra 0; 2 0; 2
entra, acomoda se entra 3; 1 2; 1
entra, luta se entra 1; 2 2; 1
Podemos notar que existem três equilíbrios de Nash no jogo acima. Um deles é o
resultado que havia sido encontrado via indução retroativa tomando o equilíbrio de
Nash da parte simultânea do jogo como dado. Os outros dois, embora constituam
equilíbrio de Nash, não são sequencialmente racionais. O problema deles é admitir
que a …rma E considere a ameaça da …rma I de lutar caso ela entre. Tal ameaça, no
45
Nos jogos simultâneos, a percepção do que é uma estratégia é extremamente simples, constituindo-
se simplesmente em uma ação possível a um determinado jogador. Nos jogos sequenciais, essa de…nição
é bem mais sutil. Nesse tipo de jogo, uma estratégia tem que de…nir qual seria a escolha do jogador em
cada uma das possibilidades que ele pudesse vir a ser chamado a jogar. Isso signi…ca que, mesmo que,
quando o jogo vier a ser efetivamente jogado, o jogador não tenha que fazer uma escolha em um ponto
especí…co dele, porque esse não ter sido alcançado, uma estratégia terá que de…nir o que ele faria caso
fosse necessário escolher naquela circunstância. A idéia é que, se o jogador especi…casse uma estratégia
e a dissesse a um procurador, esse saberia o que fazer em qualquer hipótese que porventura viesse a se
veri…car quando o jogo fosse efetivamente jogado.
94
entanto, não é crível: uma vez que a …rma E resolveu entrar e o fez, é pouco razoável
que a …rma I lute, pois essa estratégia não compõe nenhum equilíbrio de Nash no
jogo simultâneo que se inicia após a entrada de E. Con…rma-se então, novamente, a
fragilidade do conceito de equilíbrio de Nash quando trabalhamos com jogos dinâmicos.
O conceito que utilizaremos para resolver jogos dinâmicos que tenham informação
imperfeita é um re…namento de equilíbrio de Nash, chamado Equilíbrio de Nash Perfeito
em Subjogos (ENPS). O resultado encontrado no exemplo anterior (onde a …rma E entra
no mercado e, em seguida, ambas acomodam) é um caso de um resultado caracterizado
por um Equilíbrio de Nash Perfeito em Subjogos. Entretanto, para de…nir o conceito
mais precisamente, é necessário de…nir previamente a noção do que vem a ser um
subjogo.
inicia-se em um ponto de decisão único (não ligado a nenhum outro por “linhas
tracejadas”)
De…nição 55 (Selten, 1965) Um conjunto de estratégias ' = ('1 ; :::; 'I ) em um jogo
J dinâmico com I jogadores é um Equilíbrio de Nash Perfeito em Subjogos (ENPS) se
ele induz a um equilíbrio de Nash em cada um dos subjogos de J.
95
equilíbrio de Nash é perfeito em subjogo. Esse último não permite que os jogadores
considerem ameaças não críveis, como o equilíbrio de Nash permite. Por exemplo, o
primeiro resultado que encontramos no jogo do exemplo 1 desta seção consatitui um
ENPS, mas não os outros dois EN encontrados.
Em jogos com informação perfeita, o resultado de indução retroativa coincide com o
conjunto de estratégias que constituem ENPS. Como consequência imediata do teorema
de Zermelo, temos que todo jogo …nito de informação perfeita possui um ENPS em
estratégia puras. Além disso, se nenhum jogador tem os mesmos payo¤s em dois dos
postos terminais dos jogos, pode-se garantir também que existe um ENPS que é único.
onde, por exemplo, para o jogador 1 a estratégia (e1 ; d4 ) signi…ca “jogar e1 , jogar d4 se
1 jogou d1 e 2 jogou e2 ou d2 ”e para o jogador 2 a estratégia (e3 ; d2 ) signi…ca “jogar e3
se 1 jogou e1 e jogar d2 se 1 jogou d1 ”. Em seguida identi…camos os subjogos do jogo.
Nesse jogo acima há três, identi…que-os.
Feito isso, resolvemos o subjogo com informação imperfeita:
jogador 2
e2 d2
jogador 1 d4 2; 2 0; 0
e4 1; 4 3; 1
96
se reduz a
Podemos agora resolver o subjogo em que o jogador 2 começa jogando: uma vez
alcançado aquele ponto de decisão, o jogador 2 escolherá d3 , que lhe dará utilidade de
3 (>1). Substituindo esse resultado no jogo, teremos a árvore reduzida abaixo, onde
apenas o jogador 1 tem de escolher:
Simpli…cadamente, escreveremos
97
Inicialmente, iden…quemos as estratégias dos jogadores,
( )
(a; h) ; (a; i) ; (a; j) ;
S1 =
(b; h) ; (b; i) ; (b; j)
( )
(c; e) ; (c; f ) ; (c; g) ;
S2 =
(d; e) ; (d; f ) ; (d; g)
onde, por exemplo, para o jogador 1 a estratégia (b; i) signi…ca “jogar b e jogar i se 1
jogou b e 2 jogou e; f ou g” e para o jogador a estratégia (c; f ) signi…ca “jogar c se 1
jogou a e jogar f se 1 jogou b”. Novamente há três subjogos no jogo e você deve ser
capaz de identi…cá-los.
Vamos agora solucionar o subjogo que se inicia no nó de decisão de 2 condicional
ao jogador 1 ter adotado a ação “b”. Teremos o seguinte subjogo simultâneo:
jogador 2
e f g
h 1; 1 3; 0 4; 0
jogador 1 i 2; 0 5; 2 0; 1
j 3; 4 0; 0 1; 0
Neste subjogo há dois equilíbrios de Nash. Para encontrar-se o(s) ENPS, o procedi-
mento é o mesmo de antes, com a diferença de que se deve fazê-lo utilizando os dois
equilíbrios de Nash encontrados no subjogo.
Substituindo inicialmente o resultado (j; e), a decisão inicial do jogador 1 será entre
escolher a e obter payo¤ de 4 unidades (pois nesse caso o jogador.2 irá preferir d) e
optar por b e alcançar apenas 3, …cando, logicamente, com a primeira opção. Por outro
lado, substituindo o equilíbrios de Nash (i; f ) na árvore de decisão, o jogador 1 preferirá
optar por b em sua primeira escolha, pois nesse caso obterá payo¤ de 5 unidades. Os
ENPS do jogo são, portanto, dois, assim de…nidos:
ENPS 1:
ENPS 2:
98
Exemplo 58 O jogo da “centopéia”. Este conhecido jogo, popularizado por Rosenthal
(1981), é representado na Figura 13 abaixo, onde cada vez que um jogador tem a vez de
jogar, ele tem a opção de parar o jogo ou continuá-lo, passando a vez ao outro jogador.
Os payo¤ s, no entanto, têm uma lógica especial: em cada estágio, sempre que um
jogador resolve não terminar o jogo, no ponto terminal seguinte (que seria alcançado
se o outro jogador terminasse o jogo logo em seguida) ele terá uma unidade a menos,
enquanto o outro jogador obterá duas unidades de payo¤ s a mais.
O resultado do jogo acima, como de praxe, deve começar a ser pesquisado analisando-
se o seu …nal. Caso se alcance a última rodada, o jogador 2 preferirá jogar para baixo e
obter payo¤ de 101 (>100). Sabendo disso, o jogador 1 prefere terminar o jogo antes de
o jogador 2 fazer sua última jogada, pois assim ele ganharia 99 (>98). Mas o jogador
2 , sabendo disso, preferiria terminar o jogo uma rodada antes para obter 100 (>99).
E assim sucessivamente, até se chegar no início do jogo, onde o jogador 1 o termina
sem dar chances do jogador 2 jogar. Cada um deles ganha, portanto, uma unidade
de payo¤. Tal resultado parece paradoxal, mas é apenas consequência do “common
knowledge” da racionalidade sequencial dos jogadores.
Pense o que ocorreria se o jogador 1 não terminasse a partida na primeira rodada.
Talvez ele não fosse racional, ou achasse que o outro jogador não fosse racional, ou
que o jogador 2 não soubesse que ele era racional e quisesse “…ngir” que era irra-
cional, ou ainda outras possibilidades. Nesse caso não haveria “common knowledge”
da racionalidade dos jogadores e o jogo poderia se prolongar por mais algum tempo.
Não poderíamos, no entanto, determinar até quando isso iria ocorrer.
Sendo jogado algumas vezes com alunos do curso de Teoria dos Jogos da PUC-MG
(com uma versão simpli…cada da “centopéia”, correspondente a 90% inferior ao jogo
mostrado acima), em nenhuma delas o jogo terminou na primeira rodada. Isso ocorria
apenas quando se estava faltando duas ou três rodadas para que o jogo terminasse de
qualquer forma (no …m da centopéia). Tais resultados indicam que nesse caso a hipótese
de pleno conhecimento da racionalidade pode ser forte demais. O que veri…camos
nas experiências em sala de aula foi que, na verdade, apenas após várias escolhas
fazendo o jogo continuar, vendo esse caminhar para o seu …nal automático (a última
rodada possível), é que os jogadores envolvidos paravam realmente para pensar no
melhor a se fazer. Isso leva a uma outra possibilidade de explicação: como os payo¤s
eram apenas imaginários e os alunos, com pouco tempo para se decidirem sobre o que
fazer, encaravam a experiência como uma brincadeira, não faziam grandes esforços para
pensar na sua melhor etratégia, pelo menos no início do jogo, quando esse se apresentava
99
relativamente ainda muito complexo. Eventualmente, com payo¤s reais e signi…cativos
para os jogadores, e com um tempo superior para a análise do jogo, poderia ser que o
resultado fosse de fato o de indução retroativa (que também é ENPS).
Outra forma de explicação para o resultado improvável de indução retroativa no
jogo da centopéia é que a exigência de “racionalidade” é exagerada. O problema é
que as iterações necessárias do tipo “todos são racionais; todos sabem que todos são
racionais; todos sabem que todos sabem que todos são racionais etc.” para se chegar
ao resultado de indução retroativa nesse caso são muito numerosas. Quando se exigem
apenas duas ou três, nenhuma contestação é feita ao mecanismo e o resultado previsto
parece con…ável. Entretanto, quando esse número cresce, a credibilidade das previsões
derivadas desse método se reduz. No jogo da centopéia, exige-se 200 iterações! Uma
alternativa é tentar modelar a “irracionalidade” emergente em casos como esses. Não
é nosso objetivo entrar nessa discussão, mas apenas introduzir a questão e alertar para
as de…ciências da teoria. No entanto, o leitor interessado pode consultar Kreps (1990)
para avançar no tema.
Além disso, hoje estuda-se uma outra linha de pesquisa chamada de “racionalidade
limitada”, que também procura dar respostas a questões como essas. Ou seja, jogos
onde as previsões dadas pela teoria dos jogos convencional são “pouco razoáveis”, não
sendo assim muito úteis. Uma das idéias básicas da “racionalidade limitada” é que os
agentes aprendem com o tempo. Além disso, ela tenta explicar as falhas da teoria con-
vencional em jogos que sejam muito complexos para os jogadores resolverem utilizando
os conceitos de equilíbrio usuais. Um exemplo claro é o jogo de xadrez: é um jogo de
informação completa e perfeita; entretanto, nem mesmo o melhor computador da IBM,
o Deep Blue, construído essencialmente para jogar xadrez, obteve êxito de decifrar
todas as possibilidades do jogo - uma vez que perdeu uma partida para o campeão
Gary Kasparov. Os novos desenvolvimentos que incorporam a idéia de “racionalidade
limitada”, contudo, ainda não se consolidaram e também ultrapassam o escopo dessas
notas. Para uma didática introdução ao tema, ver Kreps (1994).
Exemplo 59 Pode ocorrer também que em um determinado jogo não exista nenhum
ENPS. Esse é o caso deste jogo, baseado em Kreps (1994). No primeiro estágio, dois
jogadores escolhem, simultaneamente, entre duas opções, X e Y. Caso ambos escolham
Y, cada um recebe $5. Se um escolher Y e o outro X, ninguém recebe nada. Se
ambos escolherem X, passa-se ao segundo estágio, onde eles, também simultaneamente,
escolhem um número inteiro qualquer. O que escolher o maior, recebe o correspondente
em unidades monetárias, enquanto o outro …ca com metade daquele valor.
O subjogo …nal, similar a outro já apresentado na seção anterior, não possui nenhum
equilíbrio de Nash. Sendo assim, não pode existir um resultado que induza a um
equilíbrio de Nash em todos os subjogos, constituindo um ENPS. O que há nesse
100
jogo é um equilíbrio de Nash, no jogo como um todo. Esse corresponde a ambos os
jogadores escolherem inicialmente a opção Y. Nenhum teria, pois, incentivo a desviar.
Obviamente, o conceito de equilíbrio de Nash em jogos sequenciais é falho, por motivos
já comentados. Nesse caso, mais uma vez, ele terá muito pouca relação com a realidade,
uma vez que é muito pouco provável que algum jogador escolha inicialmente Y. Note
que o teorema de Zermelo não se aplica aqui, uma vez que o jogo não é de informação
perfeita. Por isso foi possível a não existência de um ENPS.
4 Jogos Repetidos
Nesse tópico analisaremos novamente se ameaças e promessas em relação ao futuro
podem in‡uenciar o comportamento atual dos agentes. Ao fazer isso, buscamos mostrar
o que muda em uma análise de previsão do resultado de jogos quando esses são jogados
mais de uma vez. Uma das principais idéias é a de cooperação: será possível obtê-la caso
o jogo se repita? Intuitivamente, poderíamos pensar que sim, pois um jogador poderia
cooperar “hoje” para que os outros cooprerem com ele “amanhã”, e isso poderia valer
para todos os envolvidos. Deve-se, portanto, veri…car quando e sob que condições essa
intuição de fato poderá se manifestar na realidade.
Os jogos repetidos são divididos em dois grupos: aqueles repetidos um número …nito
de vezes e aqueles repetidos “in…nitamente”. Em relação ao primeiro grupo, a intuição
fundamental pode ser apreendida apenas analisando-se o caso de jogos repetidos duas
vezes, o que iremos fazer a seguir. Aqueles repetidos in…nitamente exigem alguns
conceitos adicionais, apresentados na seção dois.
101
A forma de resolução de jogos de tal natureza é similar àquela vista para se encontrar
ENPS, i.e., deve-se analisar de trás para frente. No caso especí…co citado acima, os
jogadores, uma vez que se iniciará a segunda rodada do “dilema dos prisioneiros”,
sabem que o resultado do primeiro estágio já foi consolidado e, portanto, não têm mais
como mudá-lo. Sendo assim, eles se preocupam apenas com o que virá, ou seja, a
segunda rodada do jogo em questão. Pensando dessa forma, o que eles irão fazer no
segundo estágio do jogo? Irão proceder como fariam se o jogo fosse jogado apenas uma
vez (pois, a…nal, o que ocorreu na primeira rodada não poderá mais ser mudado): como
ambos têm uma estratégia dominante, que é confessar, a jogarão na segunda vez.
jogador 2
NC C
jogador 1 NC 1; 1 9; 0
C 0; 9 6; 6
Como dito acima, a idéia por trás dos jogos repetidos é que, como ele será jogado
mais de uma vez, pode ser que valha a pena cooperar no início para que o outro também
coopere com você nos estágios subsequentes. Todavia, perceba que uma vez que se saiba
que se alcançou o último estágio do jogo, ninguém mais irá cooperar, pois não mais
se necessitará que o outro também coopere no futuro, uma vez que o futuro, para tal
jogo, não existirá - pois aquela é a última rodada. Portanto, podemos concluir que:
102
dado que essa permanece sendo uma estratégia dominante para ambos. Conclui-se
que o resultado do “dilema dos prisioneiros”repetido duas vezes será os dois jogadores
confessarem em todas elas. A cooperação não pode, portanto, ser atingida em nenhum
estágio, ainda que houvesse a promessa de um deles de que iria cooperar na primeira
vez, por exemplo. Ainda assim o outro não cooperaria, porque ele saberia que, agindo
assim, uma vez que o resultado do primeiro estágio emergisse, no segundo ninguém
iria cooperar. E então não cooperar no primeiro daria um payo¤ total superior a ele,
independente do que o outro …zesse, sendo, pois, uma estratégia dominante.
Essas conclusões permanecem inalteradas mesmo se mudássemos apenas o número
de vezes em que o jogo é repetido. Isto é, o resultado é válido mesmo para o “dilema”
- ou qualquer outro jogo de informação completa - jogado n vezes, sendo n um número
…nito. Imagine que ele fosse repetido quatro vezes. Na última ninguém cooperaria,
pois não haveria um “futuro” para o jogo que justi…casse essa atitude. Na penúltima
rodada, também ninguém cooperaria, porque todos saberiam que na última não haveria
cooperação. O mesmo ocorreria na segunda rodada: cooperar para quê, dado que na
terceira e na quarta ninguém o fará? Na primeira, o mesmo raciocínio se manteria. O
resultado geral pode ser apresentado da seguinte maneira:
103
adicionais -, um caso diferente emerge se existem mais de um Nash no jogo que será
jogado mais de uma vez. Um exemplo deixa claro tal possibilidade:
Exemplo 62
jogador 2
D E F
A 1; 1 5; 0 0; 0
jogador 1 B 0; 5 4; 4 0; 0
C 0; 0 0; 0 3; 3
No jogo acima, temos dois Nash: (A; D) e (C; F ). Vamos supor que ele será jogado
duas vezes. Pela lógica vista acima, sabemos que, no segundo estágio, será jogado um
Nash. Mas não sabemos qual!!! Os jogadores podem fazer então o seguinte acordo:
se no primeiro estágio o resultado for (B; E), no segundo eles jogam (C; F ). Caso
contrário, jogam (A; D) na segunda vez em que o jogo é jogado. Essa poderá ser
uma forma de se conseguir um resultado de cooperação, no caso caracterizado
por (B; E) - onde ambos ganham mais que em qualquer dos equilíbrios de Nash
do jogo não repetido -, pelo menos no primeiro estágio do jogo repetido, uma
vez que se sabe que no último isso não será possível. Se não há possibilidade de
renegociação após efetivada a primeira rodada, o jogo que os jogadores visualizam
no momento de começar, segundo o acordo, é o jogo estático apresentado acima
somados os payo¤s que eles terão no segundo estágio em cada possibilidade que
possa vir a ocorrer. Portanto, soma-se os payo¤s (1; 1) em todas as células, com
exceção de (B; E), onde deve se somar (3; 3), que gera a seguinte matriz:
jogador 2
D E F
A 2; 2 6; 1 1; 1
jogador 1 B 1; 6 7; 7 1; 1
C 1; 1 1; 1 4; 4
Há, no jogo visualizado no primeiro estágio, três equilíbrios de Nash. Todos eles con-
stituem ENPS, quando consideramos o jogo completo, em seus dois estágios. Contudo,
um deles confere payo¤s maiores para ambos os jogadores, sendo assim um caminho
óbvio a se jogar. Uma observação interessante é que podemos encontrar um ENPS
que compreenda no primeiro estágio um resultado que não seja um Nash do jogo jo-
gado apenas uma vez, neste caso o resultado (B; E). Essa possibilidade é obtenível
em função da multiplicidade (dois, neste caso) de equilíbrios de Nash no jogo que será
repetido e do arranjo que foi feito antes do jogo começar. Fundamental aqui foi também
a hipótese de que não poderia ocorrer renegociação após o primeiro estágio.
104
O resultado obtido no exemplo acima é uma prova de que promessas/ameaças críveis
a respeito de comportamentos futuros podem ser consideradas e, de fato, in‡uenciar
o comportamento corrente dos agentes. A cooperação pode então ser obtida em es-
tágios anteriores aos últimos, em tais casos. Note, porém, que a existência de tais
ameaças/promessas críveis requer que no jogo não repetido existam pelo menos dois
EN, pois, se elas considerarem a hipótese de se jogar ao …nal estratégias que não con-
stituem EN, não deverão ser consideradas como possibilidades concretas .
Uma outra questão é a possibilidade de renegociação: caso ela exista, então não
poderíamos ter o resultado cooperativo descrito acima. Por que? Ora, caso se possa
renegociar, porque não, antes do segundo estágio se iniciar, os jogadores - mesmo se um
deles tiver ”traído”o pacto inicial - não se reúnem e combinam de jogar o equilíbrio de
Nash que dê maior payo¤ para ambos? Mesmo com algum dos jogadores se sentindo
”traído”pelo seu “companheiro”, ele deveria aceitar a renegociação, pois assim ganharia
mais do que não agindo assim. A…nal, as perdas passadas são irrecuperáveis e ele
deve preocupar-se em maximizar seu payo¤ daquele momento em diante. Portanto,
caso se saiba que a renegociação seja possível, não há porque cooperar no primeiro
estágio, e então o resultado desse também tem de ser um equilíbrio de Nash no jogo
não repetido. No exemplo anterior, isso corresponderia a simplesmente adicionar aos
payo¤s do primeiro estágio os payo¤s do resultado do jogo em sua segunda rodada,
(3; 3). Os ENPS restantes seriam então apenas (A; D) ou (C; F )) no primeiro estágio, e
(C; F ) no segundo. O arranjo proposto anteriormente, portanto, pode ser considerado
um ENPS no jogo repetido duas vezes, mas não é um ENPS a prova de renegociação.
O conceito de ENPS em jogos de informação completa não é, pois, uma panacéia, não
eliminando os resultados sensíveis a renegociações nos jogos repetidos …nitos.
O problema destacado acima emerge porque o “traído”, ao punir o “traidor”, jo-
gando o equilíbrio de Nash que é pior para ambos no segundo estágio, está ao mesmo
tempo punindo a ele mesmo. Por isso, uma renegociação destituiria de sentido prático
tal possibilidade. Todavia, em alguns jogos é possível encontrarmos ameaças/promessas
que induzam à cooperação nos seus estágios iniciais e que sejam também resistente a
renegociações.
Exemplo 63 O exemplo anterior com mais duas estratégias possíveis para cada jo-
gador:
jogador 2
D E F G H
A 1; 1 5; 0 0; 0 0; 0 0; 0
B 0; 5 4; 4 0; 0 0; 0 0; 0
jogador 1 C 0; 0 0; 0 3; 3 0; 0 0; 0
Y 0; 0 0; 0 0; 0 4; 0:5 0; 0
Z 0; 0 0; 0 0; 0 0; 0 0:5; 4
105
Existem no jogo não repetido acima quatro equilíbrios de Nash, como se percebe.
Suponha que os jogadores combinem antes do primeiro estágio o seguinte acordo:
se o resultado desse for (B; E), na segunda vez ambos jogam (C; F );
caso o jogador 2 isoladamente desvie, no segundo estágio joga-se (Y; G), punindo-
se esse último;
Dessa forma, eles terão incentivos a cooperar no primeiro estágio do jogo repetido
e, mesmo que ocorresse alguma “traição”, nenhum deles gostaria de deixar de aplicar
a punição ao que desviou, pois, ao aplicá-la, ele está fazendo algo que é melhor para
ele mesmo, e então não aceitará renegociar. Como ambos sabem disso, nenhum irá
querer deixar de cooperar no primeiro estágio, e teremos então entre os ENPS, um
com (B; E) no primeiro estágio e (C; F ) no segundo, que incorpora um resultado que
não é um equilíbrio de Nash no jogo não repetido e, além disso, é também fechado
para renegociações. Para que essas conclusões …quem mais claras, vejamos o jogo que
é visualizado por ambos os jogadores caso as estratégias de…nidas pelo acordo citado
acima se veri…cassem. Para tanto, basta adicionar os payo¤s (0:5; 4) em todas as células
onde o jogador 2 escolhe E e o jogador 1 não escolhe B; (4; 0:5) em todas as células
onde o jogador 1 joga B mas o jogador 1 não joga E; e (3; 3) em todas as outras:
jogador 2
D E F G H
A 4; 4 5:5; 4 3; 3 3; 3 3; 3
B 4; 5:5 7; 7 4; 0:5 4; 0:5 4; 0:5
jogador 1 C 3; 3 0:5; 4 6; 6 3; 3 3; 3
Y 3; 3 0:5; 4 3; 3 7; 3:5 3; 3
Z 3; 3 0:5; 4 3; 3 3; 3 3:5; 7
Portanto, temos nesse jogo repetido duas vezes também três ENPS, com um deles
tornando-se focal segundo as estratégias sugeridas, pelo fato de gerar payo¤s superiores
a todos os jogadores. Como comentado, esse incorpora na sua primeira rodada um
resultado que não é Nah no jogo estático jogado apenas uma vez, correspondendo a
um autêntico resultado de “cooperação”, obtenível apenas porque existem mais de um
Nash no jogo sem repetição. Além disso, é à prova de renegociação, uma vez que é
possível penalizar um eventual “traidor” sem que se puna a si mesmo.
Novamente, vale lembrar que resultados como esse último poderiam ser alcançáveis
também se o jogo se repetisse mais de duas vezes, com a cooperação sendo possível
106
até o penúltimo estágio. Bastaria que a mesma estrutura se mantivesse, com o número
de repetições determinado e por todos conhecido, sendo também os payo¤s no jogo
repetido a simples soma dos ganhos em todos os estágios.
107
pior) a ele mesmo daqui a algum tempo futuro qualquer; e quanto mais distante for o
período de recebimento, menos valor ele terá para você hoje (imagine o valor de mil
reais a se receber, por exemplo, daqui a setenta e cinco anos...).
O que fazemos é utilizar uma taxa de desconto (d) para os payo¤s futuros, que
será tanto maior quanto mais distante o período. O payo¤ de um jogador em um jogo
repetido in…nitamente será então o somatório do que ele irá ganhar em cada estágio,
mas com esses valores descontados para o presente. Isto é o mesmo que dizer que
trabalharemos com o “valor presente”do ‡uxo dos payo¤s que os jogadores irão obter,
ou seja, quanto vale hoje para o jogador um determinado payo¤ que deverá receber
apenas em um período seguinte. Isso é equivalente a se perguntar, por exemplo, qual
seria o valor que faria com que um determinado jogador …casse indiferente entre recebê-
lo hoje e receber cem reais (corrigidos pela taxa de juros nominal) daqui a um ano. Se
ele dissesse que seria 93 reais, seria um indicador de que a sua taxa de desconto anual
seria algo em torno de 7:5%48 .
Ao invés de trabalhar com a taxa de desconto, utilizaremos um indicador similar -
de manuseio mais simples -, que denominaremos fator de desconto e representaremos
pelo símbolo , com 2 (0; 1). Em relação à taxa, ele signi…ca
1
= ,
1+d
de modo que, quanto maior d, menor será . Um fator de desconto quase igual a
um, por exemplo, corresponde a um caso onde payo¤s futuros valem quase o mesmo
que os presentes. Por outro lado, se for muito próximo de zero, representará uma
situação onde o relevante será fundamentalmente o presente, com pouco valor para
acontecimentos futuros. Em suma, quanto maior for o valor do fator de desconto, mais
se valorizará o futuro, e vice-versa.
Entretanto, o fator de desconto pode signi…car, além da redução do valor que o
indivíduo confere hoje a um valor futuro, também a probabilidade do jogo terminar
no próximo período. Nesta interpretação, um jogo repetido in…nitamente é entendido
como um jogo que a cada período tem uma probabilidade (menor que um) de terminar.
Ainda que o indivíduo valorizasse igualmente presente e futuro, ele preferiria um payo¤
no estágio atual do jogo a esse mesmo valor no próximo período, pois existe determinada
probabilidade de tal estágio não ocorrer. Pense, por exemplo, na briga de mercado para
refrigerantes sabor cola entre Coca-Cola e Pepsi. É provável que tal jogo se repita um
número muito grande de vezes. Mas existe, em cada período - seja qual for a sua
de…nição de período -, uma chance de o jogo acabar - com uma das …rmas fechando,
48
Não seria exatamente 7%, como se poderia imaginar, porque a de…nição de uma taxa de desconto
VF
é um valor d que faz com que V P = 1+d , onde V P é o valor presente e V F é o valor futuro. No
exemplo dado, V F é 100 e V P é 93. O valor de d, portanto, é dado por d = V FV PV P , que nesse caso é
aproximadamente 0:075.
108
por exemplo -, ainda que pequena49 . Portanto, o fator de desconto re‡ete os dois fatos:
a menor valorização de payo¤s futuros em relação a presentes e a probabilidade do jogo
terminar sem alcançar o próximo estágio.
Quanto às diferenças entre os jogos repetidos …nita e in…nitamente, a principal
delas é que nesses últimos não existe um último estágio - pelo menos ele não existe
com certeza. Esse era o fato que levava à não cooperação nos jogos …nitos com apenas
um Nash em cada estágio. Como nos jogos repetidos in…nitamente isso não existe, a
cooperação é possível - como veremos abaixo - mesmo se houver apenas um Nash no
jogo não repetido.
O que iremos utilizar nesta seção são as chamadas “estratégias de gatilho (trigger)”.
Elas possuem esse nome por se referirem a estratégias que de…nem para o jogador que a
utiliza uma posição de cooperação50 com os demais, que é mantida enquanto os outros
também cooperam. Caso algum deles cesse o “acordo”, o jogador “dispara o gatilho”,
i.e., pára de cooperar daí em diante, enquanto durar o jogo. Deve-se ter em vista que
essa é uma possibilidade, embora seja uma das mais estudadas em teoria dos jogos
repetidos in…nitamente - provavelmente pela sua facilidade analítica.
Nos jogos repetidos, dinâmicos por de…nição, o conceito-chave para se fazer pre-
visões a respeito de possíveis resultados de jogos é também o de ENPS. Como visto,
para um conjunto de estratégias constituir em um ENPS, ela deve induzir um equilíbrio
de Nash em todos os subjogos do jogo em questão. Mas, no caso de repetição in…nita,
o que seria um subjogo? Dada a de…nição mostrada anteriormente, é fácil perceber
que nesses casos haverá um número in…nito de subjogos. Sendo o jogo repetido in…ni-
tamente simultâneo - como no dilema dos prisioneiros -, existirão subjogos se iniciando
em cada vez que um novo estágio se iniciar. Raciocínio análogo aplica-se se o jogo sem
repetição for dinâmico. Note que um estágio do jogo visto isoladamente não constitui
um subjogo! Eles apenas se iniciam nesse ponto (recorde a de…nição de subjogo, se
necessário). Veja, por outro lado, que quando se inicia um estágio do jogo, cada sub-
jogo é exatamente idêntico ao que havia começado anteriormente, uma vez que o jogo
é in…nito! Por exemplo, um subjogo que se inicia no primeiro estágio é exatamente o
mesmo que se inicia no quarto, oitavo ou n ésimo (para um n …nito) estágio.
Sabendo disso, o que se poderá concluir a respeito de um resultado que seja um
equilíbrio de Nash no jogo como um todo? Que ele deve ser também um equilíbrio de
Nash em todos os outros subjogos, e, portanto, um ENPS! Assim, basta encontrar os
49
Se não fosse assim, estaríamos supondo que Coca e Pepsi interagir-se-iam no mercado de refriger-
antes sabor cola durante muito mais que, por exemplo, um trilhão de séculos, o que não seria razoável
- nem para esse e nem para nenhuma outra situação de interdependência estratégica.
50
Por “cooperação”, tanto aqui como nos jogos …nitos, entende-se uma escolha que, tendo em vista
apenas o estágio do jogo isoladamente, não seria uma opção ótima para o jogador. Entretanto, pode
constituir-se em uma desde que ela induza os outros jogadores a também cooperarem em estágios
futuros.
109
equilíbrios de Nash do jogo inteiro (que de…ne um subjogo que será igual a todos os
demais) para termos também os ENPS.
Exemplo 64 Dilema dos prisioneiros repetido in…nitamente. Tome o jogo abaixo jo-
gado in…nitas vezes, de…nindo-se o payo¤ dos jogadores como o valor presente dos
payo¤ s obtidos em cada estágio do jogo, e sendo o fator de desconto entre dois períodos
consecutivos chamado de 2 (0; 1).
jogador 2
NC C
jogador 1 NC 1; 1 9; 0
C 0; 9 6; 6
Vamos propor uma ”estratégia de gatilho” para ambos os jogadores:
2 3
0 + ( 6) + ( 6) + ( 6) + ::: = ( 6)
1
Mas, para saber se o desvio proposto acima é uma boa alternativa, temos que
comparar o payo¤ que ele confere ante o payo¤ que seria obtido caso o jogador resolvesse
não desviar, e portanto também jogasse a estratégia de gatilho acima descrita. Como o
outro, por hipótese, também a está seguindo, o payo¤ que ele receberá em cada estágio
110
será aquele emergente de quando ambos cooperam. No caso do dilema dos prisioneiros
apresentado acima, seria obter sempre 1. O valor presente do ‡uxo total dos payo¤s
seria então
1 + ( 1) + ( 1) 2 + ( 1) 3 + ::: = ( 1)
1
Portanto desviar no primeiro estágio vale a pena apenas se
1
( 6) ( 1) $ .
1 1 6
Ou seja, para valores relativamente pequenos de - o que signi…ca que o jogador
valoriza pouco o futuro -, vale a pena para ele desviar, pois o fato de ganhar menos
no futuro é menos signi…cativo para ele que a vantagem de obter um payo¤ superior
no primeiro período. De outra forma, caso o fator de desconto não seja tão pequeno
(não seja menor que 1=6), então será preferível ao jogador também utilizar a estratégia
de gatilho inicialmente proposta, dado que o outro também a está utilizando. Como o
jogo, neste exemplo, é simétrico, a mesma condição obtida para um jogador vale para o
outro: se > 1=6 , nenhum dos jogadores terá incentivo a desviar no primeiro estágio
da estratégia de gatilho proposta.
Vimos acima, portanto, qual a condição necessária para que a estratégia de gatilho
seja um equilíbrio de Nash no dilema dos prisioneiros repetido in…nitamente. Entre-
tanto, requer-se que ela seja também ENPS, i.e., que seja um equilíbrio de Nash em
cada subjogo. Como sabe-se que os subjogos nesse caso são idênticos, temos então que
o requerimento para que se obtenha um equilíbrio de Nash no jogo inteiro é exatamente
o mesmo para que ela seja ENPS. Nesse caso, a estratégia de gatilho proposta para os
dois prisioneiros/jogadores serão ENPS também caso o fator de desconto seja maior do
que ou igual a 1=6.
Após concluirmos para um exemplo especí…co, somos levados a mostrar um resul-
tado mais geral, conhecido como Teorema de Friedman, ou, mais usualmente, como
Folk theorem (“teorema popular”)51 . Vamos de…ní-lo de uma maneira informal:
111
Podemos então concluir esta seção a…rmando que, sob determinadas condições (um
“grande”, basicamente), resultados inalcançáveis em jogos não repetidos ou repetidos
tendo-se em vista um horizonte …nito são atingíveis se o jogo se repete inde…nidamente
(com uma probabilidade entre zero e um), acarretando payo¤s (considerando-se o jogo
inteiro) superiores ao que poderiam ser obtidos de outra forma.
Algumas observações …nais devem ser feitas. A primeira refere-se ao fato de que
trabalhamos apenas com as chamadas ”estratégias de gatilho”. Na realidade, muitas
outras podem ser construídas, como já comentado, levando a uma maior ou menor
e…ciência no cumprimento de acordos e a penalizações maiores ou menores caso esses
não sejam cumpridos. Contudo, vamos deixá-las de lado por acreditar que a idéia
básica já …ca su…cientemente clara apenas pela análise das “estratégias de gatilho”.
Assim como várias estratégias podem ser elaboradas, há um outro problema com
jogos repetidos que diz respeito à multiplicidade de “equilíbrios” que podem ser en-
contrados. Inclusive para se gerar um mesmo resultado, várias estratégias podem ser
utilizadas pelos jogadores. Esse fato enfraquece o poder de previsão da teoria em jogos
com essas características, especialmente se não for possível algum tipo de coordenação
prévia e caso não exista qualquer indício da existência de pontos focais.
Um último ponto diz respeito ao fator de desconto. Durante toda a seção, foi suposta
a existência, conhecida pelos jogadores, de um fator para cada jogo. Na verdade, essa
é uma simpli…cação, pois é razoável que se tenha não apenas um em cada jogo, mas,
em cada um deles, também um para cada jogador. Ou seja, o futuro pode ter valor
diferente para jogadores distintos, assim como eles podem vislumbrar a possibilidade de
continuação de um jogo com probabilidades também distintas. Em termos de resolução,
nada se altera signi…cativamente com essa modi…cação. A diferença é que os valores
críticos dos fatores de desconto (para gerar cooperação sob determinada estratégia, por
exemplo) terão de ser calculados para cada jogador.
4.3 Aplicações
4.3.1 Duopólio de Cournot repetido in…nitamente
112
Quando supomos que elas tinham a possibilidade de formar um cartel, produzindo
cada uma a metade do que um monopolista produziria, incrementariam assim o lucro
agregado do mercado e, também, o de cada uma delas isoladamente. A produção e o
lucro nesse caso seriam (resolvendo o problema do monopolista):
(
qi = q2m = 14 (a c) ; i = 1; 2
1
i = 2 = 8 (a
m
c)2 ; i = 1; 2
Entretanto, veri…camos também que tal conluio não era estável, pois ambas iriam
ter incentivos em desviar da estratégia proposta. O jogo que resultava dessa análise é o
que está descrito abaixo, um Dilema dos Prisoneiros onde o (único) equilíbrio de Nash
era as …rmas não constituirem o cartel e competirem em Cournot:
…rma 2
cartel compete
…rma 1 cartel 1
8 (a c)2 ; 18 (a c)2 3
32 (a c)2 ; 64
9
(a c)2
compete 9
64 (a c)2 ; 323
(a c)2 1
9 (a c) ; 9 (a c)2
2 1
Como antes, é fácil ver que o payo¤s associado ao cartel é estritamente maior do que o
ganho de equilíbrio para ambas as …rmas, de modo que o equilíbrio não é e…ciente. No
entanto o acordo não é crível na medida em que nenhuma das …rmas tem incentivos
a jogar nenhuma estratégia que não aquela(s) que compõem o equilíbrio de Nash do
jogo: o equilíbrio de Nash é um resultado (estrategicamente) estável.
Mas vejamos o que poderia se alterar caso o jogo fosse repetido com horizonte
in…nito. Primeiramente, veri…quemos a condição, no jogo repetido in…nitamente, para
que constitua um equilíbrio de Nash a seguinte estratégia de gatilho:
produzir q2m no primeiro período; manter q2m em cada período se a outra …rma
também tiver produzido essa quantidade no período anterior; senão, produzir a
quantidade do equilíbrio de Nash de Cournot não repetido para sempre.
8 1
1
64 + (a 9c) 1 $
9
17
Pela lógica vista anteriormente, sabemos que se não é menor que 9=17, então
ambos os jogadores jogarem a estratégia de gatilho acima será um Nash e um ENPS
no jogo repetido in…nitamente. Nesse caso, o cartel, para esse dado problema, torna-se
estável.
113
Todavia, essa não é uma regra para todos os conluios de mercado possíveis. Intuiti-
vamente, caso existissem mais jogadores no oligopólio e se houvesse di…culdades de se
veri…car quem “furou” o acordo, por exemplo, a coordenação seria muito di…cultada e
a estabilidade poderia não ser alcançada. Questões como essas podem ser respondidas,
portanto, apenas a partir de uma perspectiva especí…ca para cada caso.
114
produto através da compressão dos salários reais, como descrito acima. Podemos então
reescrever o payo¤ da autoridade monetária como
e 2 e 2
W( ; )= c [(b 1) y + d ( )]
Para resolver o resultado perfeito em subjogos desse jogo não-repetido, nós primeiro
computamos a escolha ótima da autoridade monetária de , dada a expectativa dos
empregadores, e . Ou seja, a autoridade monetária vai
e
maxW ( ; )
@W ( ; e)
e
= 2c 2d [(b 1) y + d ( )] = 0
@
tal que, resolvendo para a variável de escolha,
e d e
( )= [(1 b) y + d ]
c + d2
Como (por indução retroativa) as …rmas antecipam perfeitamente a escolha da autori-
dade monetária, o problema das empresas torna-se escolher uma previsão de in‡ação
que maximiza seu payo¤ dado que a função de reação da autoridade monetária, ( e ),
é de conhecimento comum. Isto é,
e 2 e
max
e
( ) = ( )
2
d e e
= [(1 b) y + d ]
c + d2
2
d d2 e
= (1 b) y + 1
c + d2 c + d2
2
d c e
= (1 b) y
c + d2 c + d2
d c e c
2 (1 b) y =0
c + d2 c + d2 c + d2
tal que
e d (1 b)
= y
c
115
Substituindo em ( e) temos
e d d2 (1 b)
( ) = (1 b) y + y
c + d2 c
d (1 b) d2
= 1 + y
c + d2 c
d (1 b)
= y
c
onde, observe, = e.
Outra forma de analizar a questão (mais simples, inteligente e que, obviamente,
deve gerar o mesmo resultado) é lembrar que decorre do problema das …rmas que no
ótimo
e
=
tal que temos
e e d e
( )= = [(1 b) y + d ]
c + d2
ou seja,
e d2 d
1 = (1 b) y
c + d2 c + d2
e c d
= (1 b) y
c + d2 c + d2
tal que
e b) d (1
=y = s>0
c
onde o subscrito s denota o stage-game. De uma maneira equivalente, poderíamos dizer
que a expectativa racional para as …rmas formarem é aquela que subsequentemente
seja con…rmada pela autoridade monetária, tal que ( e ) = e e portanto e = s .
Quando as empresas formam a expectativa de in‡ação e = s , o custo marginal para
a autoridade monetária em determinar a in‡ação um pouco acima de s equivale
exatamente ao benefício marginal da in‡ação não-esperada. Nesse resultado perfeito
em subjogos, espera-se que a autoridade monetária gere in‡ação positiva e de fato ele
assim fará, mas seria ainda melhor se ela pudesse se comprometer a não gerar in‡ação.
Logo, se as …rmas têm expectativas racionais ( = e ), então in‡ação zero maximiza o
payo¤ da autoridade monetária, pois
e 2 2
W( ; )= c (b 1) y
116
= e = 0 em todo período seja um equilíbrio perfeito de acordo com as seguintes
estratégias: no primeiro período, as empresas …xam uma expectativa in‡acionária e =
0, nos períodos subsequentes …xam e = 0 se todas expectativas anteriores foram e = 0
e se todas as in‡ações realizadas até então tenham sido = 0; caso contrário …xam
e =
s - a expectativa racional do jogo não repetido. Similarmente, a autoridade
monetária escolhe = 0 se a expectativa corrente for e = 0, todas as expectativas
passadas tiverem sido e = 0 e toda in‡ação realizada até então tiver sido = 0; caso
contrário escolhe = ( e ), a melhor resposta que ela pode dar às expectativas das
…rmas.
Suponha que as …rmas formem a expectativa e = 0 no primeiro período. Dada a es-
tratégia das …rmas (isto é, a forma que elas determinam suas expectativas in‡acionárias
após realizar a in‡ação de fato), a autoridade monetária pode restringir sua atenção
para duas possibilidades de escolha: (1) = 0, o que leva a e = 0 no próximo período
e daí à mesma decisão da autoridade monetária no próximo período e (2) = (0),
e d e e
de ( ) = c+d2 [(1 b) y + d ], o que leva a = s daí em diante, caso no qual
seria ótimo para a autoridade monetária …xar = s daí em diante. Fixando = 0
nesse período resultará em um payo¤ de W (0; 0) em cada período e …xando = (0)
nesse período resultará em um payo¤ de W ( (0) ; 0) no período corrente mas em um
payo¤ de W ( s ; s ) daí em diante. Logo a estratégia da autoridade monetária será a
melhor resposta à regra adotada pelas …rmas se
1
W (0; 0) W( (0) ; 0) + W( s; s)
1 1
Simpli…cando a expressão acima teremos que in‡ação zero será crível, será um
equilíbrio perfeito no jogo repetido in…nito, se
c
2c + d2
onde cada um dos parâmetros, c e d, tem dois efeitos. Um aumento em d torna a
in‡ação não antecipada pelo mercado mais efetiva ao afetar o produto e o desemprego,
de modo que torna-se mais tentador para a autoridade monetária gerar in‡ação acima
daquela esperada, mas pelo mesmo motivo um aumento em d também aumenta s , a
in‡ação do jogo não repetido, o que torna a punição mais custosa para a autoridade
monetária. Da mesma forma, um aumento em c torna a in‡ação mais custosa, o que faz
com que gerar in‡ação não antecipada seja menos atraente, mas também reduz s . Em
ambos os casos, o último efeito domina o primeiro, tal que o valor crítico do fator de
c
desconto necessário para sustentar esse equilíbrio é 2c+d 2 , crescente em c e decrescente
em d, 8 c
> @ 2 2c
< 2c+d2 d2
@c = 2c+d
(2c+d2 )2
= (2c+d 2 )2
>0
>
: @ c
2c+d2 2dc
@d = (2c+d2 )2
<0
117
Nós mostramos até aqui que a estratégia da autoridade monetária é a melhor re-
d
sposta à estratégia das …rmas se ( e ) = c+d 2 [(1 b) y + d e ] vale. Para mostrar
que essa estratégia é um equilíbrio de Nash, resta mostrar que ela é a melhor resposta
às …rmas, o que decorre da observação de que as …rmas obtêm seus maiores payo¤s pos-
síveis (zero) em cada período. Mostrar que tais estratégias são perfeitas em subjogos
segue os mesmos argumentos utilizados na seção anterior.
P (Q) = a Q e Q = q1 + q2
C1 (q1 ) = cq1
118
e isso é de conhecimento comum. Já a função custo da …rma 2 não. Ela é dada por
(
cH q2 com probabilidade
C2 (q2 ) = , onde 0 < cL < cH
cL q2 com probabilidade 1
A …rma 1 não sabe ao certo qual é a função custo da …rma 2 (essa …rma pode ser
uma …rma nova no mercado ou pode ter inventado uma nova tecnologia): o que é
de conhecimento comum aqui é a distribuição de probabilidades sobre a e…ciência da
…rma 2 e a própria estrutura de informação, no sentido de que a …rma 1 sabe que 2 tem
informação superior, a …rma 2 sabe que a …rma 1 sabe isso e assim sucessivamente.
Como resolver esse jogo? Considere primeiro o caso da …rma 2, a …rma que tem
mais informação. Caso ela seja ine…ciente, o seu problema será
119
será a melhor resposta (esperada) que a …rma 1 pode dar às escolhas de 2. Da interseção
dessas 3 equações de melhores respostas segue que
a cH q 1 a cL q 1
a c 2 + (1 ) 2
q1 =
2
ou seja,
4q1 = 2a 2c a + cH + q1 + (1 ) cL + (1 ) q1
ou ainda,
a
2c + cH + (1 ) cL
q1 =
3
Como curiosidade, veja o que ocorre quando cH = cL = c e compare com o equilíbrio
de Nash em Cournot com informação completa.
Substituindo essa expressão acima em q2 (cH ) e em q2 (cL ), teremos as demais ex-
pressões de equilíbrio,
a cH 1
q2 (cH ) = [a 2c + cH + (1 ) cL ]
2 6
tal que
ou seja,
2cH + c (1
a )
q2 (cH ) = + (cH cL )
3 6
Analogamente (faça as contas como exercício), a …rma 2 de custo baixo produzirá
a 2cL + c
q2 (cL ) = (cH cL )
3 6
Logo em equilíbrio as …rmas produzirão
8
>
< q1 = a 2c+ cH3+(1 )cL
q2 (cH ) = a 2c3H +c + (1 6 ) (cH cL )
>
:
q2 (cL ) = a 2c3L +c 6 (cH cL )
A oferta esperada da indústria será
Q = q1 + q2 = q1 + q2 (cH ) + (1 ) q2 (cL )
Ou seja,
a 2c + cH + (1 ) cL
Q = +
3
a 2cH + c (1 )
+ + (cH cL ) +
3 6
a 2cL + c
+ (1 ) (cH cL )
3 6
120
Logo
3Q = a 2c + cH + (1 ) cL + (a 2cH + c) + (1 ) (a 2cL + c)
ou ainda,
3Q = 2a c cH (1 ) cL
tal que
2a c cH (1 ) cL
Q=
3
O preço esperado por sua vez será
2a c cH (1 ) cL
P (Q) = a Q=a
3
a + c + cH + (1 ) cL
=
3
Já com relação aos lucros das …rmas em equilíbrio, observe que o lucro da …rma 1
será
Ou seja,
2 a 2c+ cH +(1 )cL 3
a c 3
6 a 2cH +c (1 ) 7 a 2c + cH + (1 ) cL
1 = 4 3 + 6 (cH cL ) 5
3
a 2cL +c
(1 ) 3 6 (cH cL )
" #
a c a 2c+ cH3+(1 )cL a 2c + cH + (1 ) cL
= a 2cH +c
3 (1 ) a 2c3L +c 3
121
tal que
" #
3a 3c a + 2c cH (1 ) cL a 2c + cH + (1 ) cL
3 1 =
(a 2cH + c) (1 ) (a 2cL + c) 3
" #
2a c + cH + (1 ) cL a 2c + cH + (1 ) cL
3 1 =
a c a c+ a+ c 3
a 2c + cH + (1 ) cL
3 1 = [a 2c + cH + (1 ) cL ]
3
e portanto
(a
2c + cH + (1 ) cL )2
1 =
9
exatamente a mesma expressão inicial. Como é comum em Cournot, repare que 1 = q12 .
O lucro da …rma 2 ine…ciente, de custo alto, será por sua vez
2 (cH ) = (P (Q) cH ) q2
a + c + cH + (1 ) cL a 2cH + c (1 )
= cH + (cH cL )
3 3 6
a 3cH + c + cH + (1 ) cL a 2cH + c (1 )
= + (cH cL )
3 3 6
a 2cH + c cH cH + (1 ) cL a 2cH + c (1 )
= + + (cH cL )
3 3 3 6
a 2cH + c (1 ) 1 1 a 2cH + c (1 )
= + (cL cH ) = + (cH cL )
3 3 2 2 3 6
a 2cH + c (1 ) a 2cH + c (1 )
= + (cH cL ) ( 2) + (cH cL )
3 6 3 6
e portanto agora teremos 2 (cH ) 6= (q2 (cH ))2 , o que é bastante comum em Cournot.
Para podermos ter uma interpretação mais direta do lucro da …rma 2 de custo alto,
considere a expressão abaixo
a + c + cH + (1 ) cL a + c ( cH + (1 ) cL )
2 (cH ) = cH cH
3 3
a + c 3cH + cH + (1 ) cL a + c 3cH ( cH + (1 ) cL )
=
3 3
9 2 (cH ) = (a + c 3cH + cH + (1 ) cL ) (a + c 3cH ( cH + (1 ) cL ))
= (a + c 3cH )2 (a + c 3cH ) ( cH + (1 ) cL ) +
+ (a + c 3cH ) ( cH + (1 ) cL ) ( cH + (1 ) cL )2
= (a + c 3cH )2 ( cH + (1 ) cL )2
tal que
(a + c 3cH )2 ( cH + (1 ) cL )2
2 (cH ) =
9
122
Logo
2 (cH ) 0 () a + c 3cH > cH + (1 ) cL
ou seja, se
(1 a+c
) cL
cH
3+
Analogamente para a …rma 2 de custo baixo, teremos
(a + c 3cL )2 ( cH + (1 ) cL )2
2 (cH ) =
9
de modo que o lucro dessa …rma não será negativo se e somente se
isto é, se
a+c cH
cL
3 + (1 )
123
re‡ete o custo de oportunidade de aceitar o contrato. Como o A não pode fazer uma
contraproposta ao P , segue que todo poder de barganha pertence ao P .
Se o A aceita o contrato, ele deve decidir uma ação a tomar. No nosso “benchmark”
essa ação se refere a quanto se dedicar ao trabalho, o quanto se esforçar, o que vai afetar
o resultado do relacionamento e que tem um custo para o A. Notemos que os interesses
das partes são claramente con‡itantes: o custo de um (o quanto o P paga ao A) é a
remuneração de outro e o esforço do A, que lhe gera desutilidade, favorece ao P .
Notemos então que um contrato não pode ser estabelecido sob uma variável não
veri…cável (por exemplo, o esforço de um funcionário qualquer) de modo que o A tem
uma vantagem informacional sobre o P . Nesse ambiente o objetivo é analisar situações
nas quais uma parte sabe coisas relevantes que a outra parte não sabe.
…gura1 (aqui)
A solução desse jogo é determinada através do(s) equilíbrio(s) de Nash perfeito(s)
em subjogo(s). Disso decorre que em cada ponto do tempo a estratégia adotada pelos
jogadores é ótima sobre todas as possibilidades: o A escolhe a sua ação (esforço) que
maximiza a sua utilidade esperada dado que ele aceitou o contrato. Como o P antecipa
o comportamento do A, então para cada estado factível ele oferece um formato de
contrato que maximiza a sua utlidade esperada.
124
6.2 Informação simétrica: …rst-best
Como dito acima, ainda que não haja assimetria de informação, há um resultado
aleatório aos participantes. Essa aleatoriedade não é perfeita na medida em que o
resultado é afetado parcialmente pelo comportamento do A e que caracteriza o risco
do ambiente. Iremos mostrar que o solução do problema acima nos dará os ganhos
do A e do P como função da distribuição ótima do risco entre eles, o que de resto vai
depender do grau de aversão ao risco dos participantes em cada ambiente.
UA = u (w (x)) v (e) :
125
6.2.2 O contrato de informação simétrica
Com todo informação relevante veri…cável, buscamos o ENPS do jogo acima. Daí
o P desenha um contrato que o A aceita nas melhores condições ao P ; semelhante
à indução retroativa. Nesse ambiente o P escolhe a ação e que ele deseja que o A
exerça e o salário que ele pagará, fw (xi )gni=1 condicional à realização de X. Para
isso ele considera os contratos aceitáveis (que satisfazem a restrição de participação)
para o A e escolhe o mais barato. É uma situação e…ciente (veremos isso adiante) e a
questão central torna-se achar qual o risk-sharing ótimo entre os participantes emerge
do relacionamento. Formalmente, o problema do P é
P
n
max pi (e) B (xi w (xi ))
fe;[w(xi )]ni=1 g i=1
Pn
s. a pi (e) u (w (xi )) v (e) U :
i=1
quais sejam a ação e a remuneração condicionada aos resultados. Decorre então que o
contrato inclui uma penalização su…cientemente grande para que o A tome o esforço
combinado.
O Lagrangeano associado ao problema acima é tal que
n
" n #
X X
L= pi (e) B (xi w (xi )) + pi (e) u (w (xi )) v (e) U
i=1 i=1
@L 0 0
= pi (eo ) B (xi wo (xi )) + o
pi (e) u (wo (xi )) = 0
@w (xi )
de modo que
0
o B (xi wo (xi ))
= ; 8i = 1; :::; n:
u0 (wo (xi ))
Observe que eo é o esforço e…ciente e (wo (xi ))ni=1 a remuneração associada a ele. Além
disso, as condições de Kuhn-Tucker implicam que
( n
)
X
min ; pi (e) u (w (xi )) v (e) U = 0
i=1
126
Proposição 68 > 0:
P
n
Prova. Suponha que não, de modo que pi (e) u (w (xi )) v (e) U > 0. Então
i=1
o P poderia extrair mais renda ao diminuir w (xi ) em todo o espaço de resultados
possíveis sem afetar a restrição de participação do A. Para um P racional, segue que
Pn
pi (e) u (w (xi )) v (e) U = 0 e que > 0.
i=1
L = p1 (e) B (x1 w (x1 ))+p2 (e) B (x2 w (x2 ))+ [p1 (e) u (w (x1 )) + p2 (e) u (w (x2 )) v (e) U]
Figura2 (aqui)
127
0
B (:)
Como = 0
u (:)
, segue que
0 00
00 0 B (:) u (:) 0
B (:) 1 w (xi ) + w (xi ) = 0
u0 (:)
00
B (:)
de modo que, de…nindo o grau de aversão ao risco absoluta do principal como RP = B 0 (:)
00
u (:)
e o do agente como RA = u0 (:)
, obtemos
00
B (:)
0 B 0 (:) RP
w (xi ) = = 2 [0; 1] :
B 00 (:) u00 (:) RP + RA
B 0 (:)
+ u0 (:)
o
P neutro e A avesso ao risco Nesse caso, para a condição de otimalidade =
0
B (xi wo (x i )) 0 0
= cte > 0, o fato de que B (:) = cte implica que u
u0 (wo (xi ))
= 1; :::; n (wo (xi )) ; i
também é constante. Com o A avesso ao risco, a única possibilidade que emerge do
0 0
fato de que u (w (xi )) = u (w (xj )) ; 8xi ; xj 2 X é que
w (xi ) = w (xj ) = wo 8xi ; xj 2 X:
Logo, no ponto ótimo o payo¤ do A é invariante ao resultado e todo o risco está com
o P.
Figura3 (aqui)
u (wo ) = v (eo ) + U
de modo que o salário oferecido pelo P é
wo = u 1
(v (eo ) + U )
128
P avesso e A neutro ao risco: franchise Pelo mesmo motivo argumentado
0 o
acima, o = B u(x0 (w
i w (xi )) 0 0
o (x )) = cte > 0, o fato de que u (:) = cte implica que B (xi wo (xi )) ; i =
i
1; :::; n também é constante. Com o P avesso ao risco, segue que
0 0
B (xi w (xi )) = B (xj w (xj )) ; 8xi ; xj 2 X de maneira que
x1 w (x1 ) = x2 w (x2 ) = k
segue que
wo (xi ) = xi k
de modo que
w (x1 ) 6= w (x2 ) 8 x1 6= x2
Nesse caso o P não incorre em nenhum risco, que será totalmente alocado para o A.
P
n
Da restrição de participação do A, temos que pi e0 u w0 (xi ) v e0 = U .
i=1
Para um A avesso ao risco, podemos fazer
n
X
pi e0 w0 (xi ) = U + v e0
i=1
n
X
pi e0 (xi k) = U + v e0
i=1
wo (xi ) = xi k
Xn
wo (xi ) = xi pi e0 xi + U + v e0
i=1
129
O nível ótimo de esforço
P
n
P neutro e A avesso ao risco Como vimos, pi (eo ) u (wo (xi )) = v (eo ) +
i=1
U ; w = cte, tal que
u (wo ) = v (eo ) + U
wo = u 1
(v (eo ) + U )
O P portanto
n
X
max pi (eo ) B xi u 1
(v (eo ) + U )
e
i=1
ou ainda, para um P neutro ao risco,
Xn
1
max pi (e) xi u (v (eo ) + U )
e | {z }
i=1
w0
As CPO’s desse problema implicam que
Xn 0 0
0 v (eo ) v (eo )
pi (eo ) xi = 0 o = 0 :
u (w ) u (v (eo ) + U )
i=1
Exercício 74 Mostre que para que a CPO acima seja uma condição su…ciente para o
nível ótimo da ação (esforço) temos que
n
X 00
pi (eo ) xi 0:
i=1
130
6.3 Trade-o¤ entre incentivos e risk-sharing: moral hazard
Moral hazard ocorre em um relacionamento quando a ação do A não é veri…cável
pelo P ou quando o A recebe algum tipo de informação privada após o estabelecimento
do contrato. Nesse caso o P não pode controlar diretamente a ação do A. No nosso
setup o esforço e do A não é veri…cável e portanto não pode ser explicitamente incluído
no contrato; o ganho do A não depende diretamente da ação que ele toma. A dinâmica
do jogo é tal que
…gura4 (aqui)
Pode também ocorrer que antes de tomar a sua ação o A observe o estado de
natureza e o P não. Daí
…gura5 (aqui)
e a dinâmica do jogo é a mesma.
O fato de ação escolhida pelo A não ser veri…cável pelo P vai implicar em perda
de e…ciência no relacionamento especi…cado, alterando o tipo de contrato ofertado e as
escolhas ótimas em relação à situações de simetria. Além disso disso, o contrato ótimo
agora será determinado pelo trede-o¤ entre dois objetivos con‡itantes: e…ciência (no
risk-sharing, seguro, ótimo) e incentivos ao A (risco adicional). Segue dessa estrutura
que para o contrato ter o poder de in‡uenciar o comportamento do A, o P deve pagar
mais por um ”bom sinal” (resultado) que informa sobre o tipo de A.
6.3.1 Introdução
O modelo que nós iremos analisar é semelhante ao modelo da seção anterior exceto
pelo fato de que o esforço e não é veri…cável pelo P , ainda que o resultado desse esforço
o seja ao …m do período. Para entendermos a natureza exata do problema, suponha que
o P ofereça um contrato de …rst-best ao A quando a ação e não é observável. Tome um
P neutro e um A avesso ao risco. Como vimos, nesse caso o A teria uma remuneração
constante w (xi ) = w (xj ) = wo 8xi ; xj 2 X de modo que, substituindo na restrição
de participação, u (wo ) = v (eo ) + U , com todo o risco sendo alocado ao P .
Como a ação e não é veri…cável, se o contrato acima for ofertado a melhor resposta
0
que o A pode dar é aceitá-lo e exercer o menor esforço possível (pois v (e) > 0), de
maneira que o retorno esperado do P seria menor do que o correspondente no caso
simétrico, já que em{n é menor do que o e…ciente, eo . Essa reação seria antecipada pelo
P , que proporia a remuneração
h i
wo = wm{n = u 1 U + v em{n .
131
Segue que, como
(eo ; wo ) 6= em{n ; wm{n
caracteriza-se ine…ciência. Para lidar com essa situação o P irá tomar o ganho do A
como dependente do estado, de modo que a remuneração não seja mais constante como
em …st best, ainda que tenhamos um P neutro e um A avesso ao risco.
Com e não observável, ao propor o contrato (w; e), o P deve estar certo que a ação
requerida seja aceita pelo A. Isso signi…ca que
( n )
X
e 2 arg max pi (e) u (w (xi )) v (e) .
e
i=1
Essa restrição é dita restição de compatibilidade de incentivos (IC).e re‡ete, nesse setup,
a presença de moral hazard: dado que o contrato foi aceito e a ação e não é observável,
o A escolhe e que maximiza o seu ganho esperado.
Disso decorre que o problema do P passa a ser
P
n
max pi (e) B (xi w (xi ))
fe;[w(xi )]ni=1 g i=1
P n
st pi (e) u (w (xi )) v (e) U
i=1
P
n
e 2 arg max pi (e) u (w (xi )) v (e)
e i=1
w = wm{n = u 1
U + v eL
onde
u wL v eL u wH v eH
| {z }
IC
132
é naturalmente satisfeita na medida em que a remuneração é constante.
Por outro lado, se o P preferir eH , o seu problema seria
P
n
max pi eH B (xi w (xi ))
fe;[w(xi )]ni=1 g i=1
Pn
st pi eH u (w (xi )) v eH U
i=1
P
n P
n
pi eH u (w (xi )) v eH pi eL u (w (xi )) v eL
i=1 i=1
onde, notemos,
n
X n
X
pi eH < pi eL 8k = 1; 2; :::; n 1
i=1 i=1
que mostra que maus resultados ocorrem com mais frequência quando o A trabalha sem
muito do esforço do que quando trabalha duro, caracterizado dominânica estocástica
de primeira ordem,
pi eH
= pi eH + pi eH pi eL
u0 (w (xi ))
P
n
onde, como já vimos, > 0, pois pi eH u (w (xi )) v eH = U .
i=1
133
Proposição 76 > 0.
Prova. Por contradição, suponha que não, que = 0. Nesse caso a restrição de
incentivos não estaria ativa (voltaríamos ao caso sem assimetria, com e veri…cável) e
daí w = wm{n ; e = em{n . Logo > 0 tal que
n
X n
X
pi eH u (w (xi )) v eH = pi eL u (w (xi )) v eL
i=1 i=1
tal que 8 9
0
< 1 =
1 h i
w (xi ) = u
: + 1 pi (eL ) ;
pi (eH )
pi (eL )
Ou seja, quanto maior a razão p (eH ) menor será a remuneração w, caracterizando
i
antes de mais nada o fato de que nesse setup o salário não é …xo, ainda que o P seja
neutro e o A avesso ao risco. Note que isso decorre do fato de que > 0 (se = 0
então a remuneração seria constante entre os estados de natureza), oque caracteriza o
custo que incide sobre o P em função da presença de moral hazard; os ganhos do P na
presença de moral hazard são estritamente menores do que os seus ganhos em situação
de simetria.
Seguindo a análise acima, podemos genericamente fazer
!
pi eL 0
w (xi ) = f H
; f <0
pi (e )
pi (eL )
onde pi (eH )
é dita razão de verossimilhança e nos informa a precisão na qual o resultado
realizado xi sinaliza que o esforço exercido foi eH - uma redução na razão de verossim-
ilhança é um aumento na probabilidade de que o esforço exercido foi eH quando o
resultado observado foi xi . É portanto uma estatística do esforço do A, não tão infor-
mativa quanto o esforço em si mas o su…ciente para que o P pague (dê incentivos) ao
A por resultados melhores.
134
risco de cada um. Essa proposição continua sendo verdadeira na presença de moral
hazard, porém com uma razão adicional, os incentivos que o P fornece ao A para
realização de uma dada ação.
Um ponto particularmente
8 relevante
9 que decorre da análise acima é que
0 1
< =
1
w (xi ) = u não implica que sempre será ótimo pagar salários
: + 1 pi (eHL ) ;
p i (e )
maiores para resultados melhores (salários monótonos no resultado). Por exemplo, em
situações onde a probabilidade de resultados ruins e de resultados muito bons são altas
e a probabilidade de resultados intermediários é baixa, é preferível indexar salários
maiores à resultados ruins do que intermediários.
0
Uma condição necessária para que w (xi ) > 0 é que a razão de verossimilhança,
pi (eL )
pi (eH )
, seja decrescente em xi . Nesse caso dizemos que vale a “propriedade de monotoni-
cidade da razão de verossimilhança, MLRP”. Segue que se a MLRP é satisfeita, então
pi eL pj eL
< 8 xj > xi ,
pi (eH ) pj (eH )
o que mostra que a razão é tanto mais informativa sobre o a ação e do A quanto maior
for o resultado. 8 9
0 1
< =
1
Como no ótimo w (xi ) = u L , então
: + 1 pi (eH) ;
p i (e )
0
1- se pi eL = pi eH , então w (xi ) = u 1 1 = cte, de modo que w (xi ) =
w (xj ) = w 8 xi ; xj 2 X. Tomando w como referência, podemos facilmente ver então
que
2- se pi eL > pi eH , w (xi ) < w e se
3- se pi eL > pi eH , w (xi ) > w.
@w(xi )
Proposição 78 A MLRP não é su…ciente para que @xi > 0.
Prova. Exercício.
Quando temos um principal neutro ao risco, note que se ele paga ao agente de
acordo com o resultado é tão somente para lhe dar incentivos. Decorre daí que o P
deve buscar um equilíbrio entre os benefícios de segurar o A - como no …rst best- e os
benefícos de estabelecer os incentivos corretos. Para atingir esse objetivo, no contrato
ele usa a única variável veri…cável como uma fonte de informação do comportamento do
agente; o P usa o resultado nesse caso com um objetivo similar ao de um problema de
inferência estatística. Segue então que o benefíco de introduzir o resultado no contrato
é a informação que tal resultado fornece sobre o esforço do A.
Por …m devemos notar que em última instância o P não se preocupa de fato com esse
problema de inferência estatística na medida em que é ele quem efetivamente escolhe o
135
nível de esforço do A ao resolver o problema de otimização acima especi…cado; ele sabe
com certeza como o A se comportará. O salário do A depende do resultado porque
essa é a única maneira de in‡uenciar o seu esforço e não porque a escolha que ele faz
sobre o esforço uma vez que o contrato foi estabelecido não seja previsível.
6.4.1 Introdução
136
problema do principal passa a ser encontrar uma forma de reduzir a sua desvantagem
informacional. Segue que essa dinâmica vai gerar uma situação claramente distinta do
…rst-best no equilíbrio de mercado, caracterizando portanto ine…ciência.
Considere então um P que é um vendedor de vinhos e um A que é um comprador.
O A é um amador na degustação de vinhos e tanto pode ser um apreciador de bons
vinhos quando ter gostos mais modestos. Nós vamos dizer que há dois “tipos”: um A
so…sticado (que está disposto a pagar um quantia maior por um bom vinho) e outro
cujas preferências são menos esmeradas. Assumiremos que o P não pode observar
o tipo do A ou que a lei o proíba de descriminar perfeitamente preços entre os dois
tipos. A chave para a solução do problema de seleção adversa é a seguinte: se o agente
so…sticado está disposto a pagar mais do que o outro por um aumento na qualidade
do vinho, então o P pode segmentar o mercado ofertando duas garrafas diferentes de
vinho:
(
um vinho de alta qualidade por um alto preço
um vinho de baixa qualidade por um baixo preço
Veremos abaixo como essas qualidade e os preços serão determinados otimamente.
Se todos se comportam de acordo o esquema acima, o tipo so…sticado ecolheria o
vinho de alta qualidade e de alto preço enquanto o agente de outro tipo selecionaria o
vinho mais barato, de qualidade pior. Ou seja, os dois tipos de A “se revelam”através
das suas escolhas. Nós veremos logo adiante que o consumidor de tipo baixo escolherá
um vinho que será de qualidade inferior do que aquela que seria socialmente ótima. O
ponto central nos problemas de seleção adversa é fazer com que os agentes revelem os
seus tipos sem incorrer em distorções sociais muito signi…cativas.
Antes de solucionar o problema acima, vamos ver alguns exemplos de seleção adversa
que encontramos com alguma facilidade em diversas situações.
os bancos costumeiramente encontram clientes cujo risco de default não podem ser
monitorarados perfeitamente. Por exemplo, considere empresários que desejam
…nanciamento para algum projeto arriscado. Uma idéia natural é usar a taxa
de juros para discriminar entre os empresários; no entanto isso pode induzir um
racionamento de crédito, a não ser que os bancos também variem os níveis de
colateral.
137
no mercado de trabalho, empregadores se deparam com empregados em potencial
que têm vantagem no que eles sabem sobre suas habilidades melhor do que as
…rmas. Essa então pode discriminar os trabalhadores de modo a selecionar aqueles
que ela deseja e descartar os demais.
várias …rmas (estatais ou não) são reguladas pelo governo ou por agências regu-
ladoras especializadas na área. Claramente a …rma regulada tem mais imformação
sobre os custos e sua produtividade do que o regulador. Isso implica que a …rma
muito provavelmente tentaria manipular a forma na qual ela informa o governo
de modo a aumentar os seus lucros.
U ( ; q; t) = u ( ; q) t= q t
onde q é a qualidade do vinho que ele compra, é um parâmetro positivo que indexa
as suas preferências por qualidade e t é o preço do vinho. Se ele decide não comprar o
vinho a sua utilidade é zero.
Com essa especi…cação,
0
8 > ; u (q; ) u (q; ) é crescente em q.
138
vinho tem um impacto maior na satisfação de um consumidor de tipo alto do que no
consumidor de tipo baixo.
Há dois valores possíveis para : L < H , o que nos permite identi…car o tipo do
consumidor (baixa ou alta qualidade). Esse tipo é de informação privada de cada agente
mas a sua distribuição é conhecimento público e de conhecimento comum. Temos então
que a distribuição de tipos é dada por ( L ; H ) v ( ; 1 ).
V =t c (q)
max [ i qi c (qi )]
qi
é o contrato ótimo ofertado para um consunidor de tipo i , que por construção leva
a um resultado e…ciente: o P extrai todo o excedente e o consumidor A …ca com sua
utilidade de reserva, 0 no caso.
…gura 6 (aqui)
139
Na …gura acima …ca claro que (qL ; qH ) são as qualidades e…cientes. Note então que
0 00
como qi = c 1 ( i ) e c > 0, então o fato de que H > L implica que53 qH > qL , de
modo que tH > tL .
Esse tipo de discriminação, chamada de discriminação de preços de primeiro grau
(ou discriminação perfeita), geralmente não é permitida por lei - a venda dever ser
anônima e não se pode negar a um indivíduo qualquer um contrato que está sendo
ofertado para outro. Entretanto nós vamos abordar o caso em que o vendedor não
pode observar diretamente o tipo do agente, de modo que torna-se impossível praticar
discriminação perfeita, independente do arcabouço legal.
Suponha gora que nós estamos em uma situação de second-best no qual a informação
é assimétrica: o tipo do A não é observável e o P sabe apenas a distribuição ( L ; H ) v
( ;1 ) dos tipos dos agentes.
Proposição 80 se o P oferta o contrato de …rst-best (tL ; qL ), (tH ; qH ), mesmo H
escolhe (tL ; qL ), caracterizando seleção adversa.
(
U ( H ; t L ; q L ) = H q L tL
Prova. Como , então podemos ver que
U ( H ; t H ; q H ) = H q H tH
H qL tL = H qL L qL =( H L ) qL >0
H qH tH = H qH H qH =0
de maneira que U ( H ; tL ; qL ) > U ( H ; tH ; qH ). Segue que o agente de tipo alto, H ,
prefere mentir e não se auto-seleciona.
Concluímos portanto que o contrato (ti ; qi )i=L;H não é implementável54 para
i desconhecido. Nesse caso há um equilíbrio com pooling, com ambos os tipos se-
lecionando o mesmo contrato. Segue que o P pode aumentar seus lucros dando os
incentivos corretos aos agentes para que estes revelem os seus tipos. Nesse sentido o
programa do principal passa a ser
max [ (tL c (qL )) + (1 ) (tH c (qH ))]
qi ;ti
st L qL tL 0
H qH tH 0
L qL tL L qH tH
H qH tH H qL tL
00 0 0
53
Isso é verdade na medida em que, como c > 0, o fato de que c (qH ) > c (qL ) implica que qH > qL .
| {z } | {z }
H L
54
Para a nossa compreensão, vamos dizer que um contrato é implementável se ele satisfaz as restrições
de compatibilidade de incentivos subjacente ao relacionamento.
140
de modo a garantir a implementalção do contrato ótimo sobre (IR) e (IC).
tH tL = H (qH qL )
tH = L qL + H (qH qL )
Proposição 83 qH qL
141
max [ (tL c (qL )) + (1 ) (tH c (qH ))]
qi ;ti
st L qL tL 0
H q tH tL
ou melhor55 ,
0
de modo que as condições de primeira ordem implicam que L c (qL ) = (1 )
tal que
0 (1 )
L = c (qL ) +
0
e (1 ) H c (qH ) = 0 e daí
0
H = c (qH ) 7 ! qH = qH .
todo tipo de agente - exceto o de tipo mais baixo - é indiferente entre o seu
contrato e o contrato do tipo imediatamente inferior.
55
Tome q = qH qL . Fazemos então tH = L qL + H (qH qL ) = H qH qL , onde = H L.
142
todo tipo de agente - exceto o de tipo mais baixo - tem um excedente (quase-renda
informacional) que é crescente no tipo do agente: Ff (( )) ( i ) q ( ).
todo tipo de agente - exceto o de tipo mais alto - tem alocação sube…ciente. Daí
qi = qi 8i 6= H.
0 1
F( ) B C
o agente de tipo mais baixo tem excedente zero: f( ) @|{z}
i A q ( ) = 0.
6.5 Sinalização
essa parte (Salanié e notas do Felli).
143