Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo
Introdução
A Teoria dos jogos é usada para se estudar assuntos tais como eleições,
leilões, balança de poder, evolução genética, etc. Ela é também uma teoria
matemática pura, que pode e tem sido estudada como tal, sem a necessidade de
relacioná-la com problemas comportamentais ou jogos per se.
Algumas pessoas acreditam que a Teoria dos Jogos formará em algum dia
o alicerce de um conhecimento técnico estrito de como decisões são feitas e de
como a economia funciona. O desenvolvimento da teoria ainda não atingiu este
patamar e, hoje, a Teoria dos Jogos é mais estudada em seus aspectos
matemáticos puros e, em aplicações, ela é usada como uma ferramenta ou
alegoria que auxiliam no entendimento de sistemas complexos.
Assim concluímos que a teoria dos jogos pode ser definida como a teoria
dos modelos matemáticos que estuda a escolha de decisões ótimas sob
condições de conflito. O elemento básico em um jogo /e o conjunto de jogadores
que dele participam. Cada jogador tem um conjunto de estratégias. Quando cada
jogador escolhe sua estratégia, temos então uma situação ou contigência no
espaço de todas as situações (contigências) possíveis. Cada jogador tem
interesse ou preferências para cada situação no jogo. Em termos matemáticos,
cada jogador tem uma função utilidade que atribui um número real (o ganho ou
payoff do jogador) a cada situação do jogo.
uAl : S → R e uBob : S → R
ALL
Confessar Negar
Confessar (-5,-5) (0,-10)
Negar (-10,0) (-1,-1)
Equilíbrio de Nash
Oligopólio de Cournot
Segue então que o modelo de Cournot diz respeito a um jogo estático onde
as firmas escolhem simultaneamente o quanto produzir. Ainda que numa primeira
aproximação possa parecer estranho conceber firmas decidindo
simultâneamente, como num jogo de par ou ímpar, isso tem uma apelo intuitivo
imediato: significa apenas que cada firma, ao fazer a sua escolha, não sabe qual
foi a escolha da rival, situação essa que é extremamente comum no mundo real.
Cada firma sabe apenas que a rival sabe que ela também não conhece a sua
escolha e que a rival sabe que ela sabe que a rival não conhece
a sua escolha e assim infinitamente. Como é habitual, o problema da firma
consiste em fazer suas escolhas de forma a obter o maior lucro possível. No
entanto - e distintamente do modelo competitivo - a firma toma sua escolha
considerando o fato de que as escolhas alheias (no caso as decisões de
produção de suas competidoras) vão afetar o seu payo¤, caracterizando um
elemento estratégico. Basicamente, ao tomar suas decisões, as firmas vão
considerar um conjunto de restrições dadas pelas demanda dos consumidores do
bem (especificada pela curva de demanda pelo produto), por restrições
tecnológicas (que serão incorporadas na estrutura de custo de cada firma) e por
restrições de competição dadas pelo número e pelas características dos seus
competidores.
P (Q) = a – Q
C1 (q1) = cq1
C2 (q2) = cq2
onde C pertence (0; a] por um motivo que ficará claro adiante. Podemos então
representar esse jogo na forma normal
1. os jogadores: as firmas 1 e 2;
que se expressa na diferença entre a receita e o custo da firma. Note que, como
esperado, a função de ganho caracteriza o elemento de comportamento
estratégico.O ganho de cada firma é determinado não só pela sua escolha - pela
quantidade que ela resolveu produzir - como também pela escolha da
concorrente.
o que nos dá exatamente a melhor resposta que a firma 1 pode dar para toda
conjectura a respeito da produção da firma 2. Chamamos essa expressão de
função de reação da firma 1 e colocamos o termo entre aspas pelo fato de se
tratar de um jogo de escolha simultânea: as firmas não estão reagindo
exatamente à uma ação que elas observaram, mas sim à uma ação esperada
da(s) concorrente(s). No entanto essa expectativa não é tomada aleatoriamente,
mas assumindo que a .rma rival está operando também na
sua função de reação correspondente.
o que nos mostra que a melhor reação que uma firma pode tomar em relação à
variações na oferta da concorrente é seguir na direção contrária.
será a .função de reação. da firma 2, a melhor resposta que ela pode dar às
escolhas da rival. Uma vez que temos em mãos as respectivas melhores
respostas das firmas, fica trivial determinar o equilíbrio de Nash desse jogo: como
definimos anteriormente, esse é dado pela interseção das melhores respostas.
Substituindo q2 (q1) em q1 (q2), é fácil verificar que
q1 = (a - c)
e o preço de mercado
Analogamente,
Π2=
Por fim note que as hipóteses utilizadas de que há apenas duas firmas com
estruturas de custos idênticos produzindo são apenas para simplificar a nossa
análise. Na verdade, não há problemas algum em relaxá-las. Mostraremos abaixo
o caso onde existem n oligopolistas e manteremos a hipótese de custos marginais
iguais entre as firmas, apenas para obter um resultado de comparação mais fácil
com o caso inicial, com duas firmas. Resolva como exercício o duopólio de
Cournot onde, por exemplo, o custo marginal das duas firmas se diferem,
comparando os resultados com os obtidos acima.
Utilizando a mesma estrutura anterior, teremos certamente quantidades
produzidas idênticas para todas as n firmas, uma vez que suas estruturas de
custos são as mesmas, o que de resto vai caracterizar um equilíbrio simétrico.
Segue o problema de uma firma i qualquer é
Logo, em equilíbrio,
.
Segue que o lucro da i-ésima firma em equilíbrio será
e o lucro de equilíbrio
πi = 0, i = 1; 2; :::; n
Oligopólio de Bertrand
• Hipóteses:
- duas firmas, 1 e 2, que produzem um bem homogêneo.
- custo fixo é nulo e o custo marginal é constante e idêntico para ambas as
firmas, c > 0.
- assuma uma curva de demanda linear (para compararmos com Cournot) no
produto total
Q=a–p
- os consumidores compram da firma que cobra mais barato: segue que a firma
anuncia o menor preço detém todo o mercado enquanto a outra firma fica
forma do mercado.
- se ambas as firmas declaram o mesmo preço, então elas dividem o mercado
igualmente, cada uma com metade.
• o lucro de cada firma, como habitual, depende não apenas de sua própria
escolha mas também é afetado pela escolha da rival. Tome o caso da firma
1, por exemplo, seu lucro será
- note que o lucro de 1 é positivo se p1 > c. Além disso, ele será tanto maior se
seu preço for menor do que o da rival e apenas a metade se for igual. Por fim o
lucro nunca será negativo na medida em que cada firma tem a prerrogativa de
cobrar um preço igual ao custo marginal e assegurar lucro 0 na pior das
hipóteses.
- como a situação é a mesma para a firma 2, vamos restringir nossa atenção para
preços tais que
pi ≥ c, i = 1; 2
• observe que a firma com o menor preço detém todo o mercado. Segue que
cada firma tem um incentivo a anunciar um preço menor do que o da rival.
Em última instância, isso direcionará o preço de equilíbrio para baixo, até o
custo marginal.
Vejamos agora o argumento formal para isso.
1. note que um equilíbrio de Nash do jogo é cada firma cobrar o custo marginal:
nesse caso cada firma tem metade do mercado e aufere lucro zero porque cada
unidade é vendida ao seu custo de produção.
- porque é um equilíbrio? Se ela elevar seu preço, ela perderá toda a demanda
que tinha posto que o preço da rival será estritamente menor! nenhuma firma tem
incentivos a desviar.
- segue que não é possível que nenhuma firma tenha lucro maior do que zero, de
modo que a escolha de preço de cada firma é ótima dada a escolha alheia
(melhor resposta).
2. agora vamos mostrar que não há outro equilíbrio de Nash. Como cada firma
i = 1; 2 escolhe pi ≥ c, é suficiente mostrar que não há equilíbrio para pi > c.
Então, deixe (p1; p2) ser um equilíbrio.
- se p1 > c, então porque p2 maximiza o lucro de 2 dada a escolha de 1, teremos
p2 € (c; p1], de modo a ter um lucro estritamente positivo – fora desse intervalo
seria nulo.
- além disso, p1 p2, pois se firma 2 pode ter lucro positivo escolhendo p2 = p1 e
dividindo o mercado com 1, ela pode ter um lucro maior ainda cobrando um preço
um pouco abaixo de p1 e desfrutando de todo mercado quase ao mesmo preço.
Logo
- mas para uma estória similar para as firmas com os papéis trocados
de modo que se o preço de uma firma está acima do custo marginal, ambos os
preço devem estar acima do custo marginal e cada firma deve anunciar um preço
um pouco menor do que a rival, o que é impossível.
Nós representamos os jogos até agora apenas pela forma normal (ou
estratégica). Veremos, entretanto, que há uma outra forma de representação: a
forma extensiva, uma forma mais detalhada do que a forma normal. Segue daí
que um jogo na forma extensiva em geral sofre perdas de informação quando o
passamos para a forma normal, enquanto o inverso nem sempre é possível de se
fazer. Nos jogos estáticos, não há problemas em tratá-lo apenas na forma
estratégica, sendo inclusive mais conveniente. Todavia, isso com certeza
ocorreria nos jogos dinâmicos. Por isso, os abordaremos utilizando a forma
extensiva.
Um jogo (de informação completa e perfeita) na forma extensiva nos dá as
seguintes informações:
• quais são os jogadores participantes,
• quais são as ações possíveis para cada jogador em cada vez em que ele
for chamado a decidir,
• a ordenação do jogo: quem age e quando,
• toda a história pregressa do jogo quando cada jogador tem de tomar uma
decisão,
• os payoffs dos jogadores para cada conjunto possível de ações que
tenham sido tomadas, até o final do jogo.
Exemplo
1. os jogadores: 1 e 2,
2. os espaços de estratégias, S1 = fe; dg e S2 como acima exposto,
3. a ordenação: 1 joga primeiro, 2 observa a escolha de 1 e então faz a sua
escolha,
4. a história pregressa do jogo: quando 2 é chamado a jogar ele sabe
inequivocadamente qual foi a escolha de 1,
5. os payoffs: os ganhos dos jogadores para toda combinação possível de
escolhas dos jogadores.
Exemplo 2
Considere o tradicional jogo onde uma firma está instalada (I) em um mercado
enquanto monopolista e uma outra firma (E) está considerando entrar nesse
mercado. Ela escolhe entre entrar ou não. Caso entre, a antiga monopolista
escolhe entre lutar (fazer uma guerra de preços, por exemplo) ou acomodar-se
(constituir um duopólio, um mercado onde apenas duas firmas produzem).
1. os jogadores: as firmas E e I,
2. os espaços de estratégia:
SE = (fora, entra)
SI = (luta se a firma E entra, acomoda se a firma E entra)
5. os payoffs.
O resultado por indução retroativa será a firma E entrar no mercado e a
firma I acomodar-se. Isto porque, se E entra, o payoff de I é maior caso ela
acomode.
Como E sabe disso, ela irá entrar, apesar de uma eventual ameaça da
firma I de lutar caso ela faça isso.
Podemos representar o jogo acima também na forma normal:
Barganha seqüencial
onde r é a taxa de juros de mercado. Observe que quanto maior r, menor a taxa
de desconto, de forma que os agentes estariam descontando com peso maior o
tempo. Observe ainda que essa taxa pode refletir caracterísiticas específicas das
partes engajadas na barganha. Imagine por exemplo o custo de uma greve seja
maior para uma das partes. Ou que um trabalhador específico assumiu
compromissos tais com sua renda que uma paralisação no seu fluxo de renda
nesse período específico pode lhe ser particularmente custosa. Para facilitar a
nossa análise e sem perda de generalidade, vamos considerar que ambas as
partes têm a mesma taxa de desconto.
Logo há dois jogadores (1 e 2), as estratégias são as descritas na árvore,
assim como a ordenação e os payoffs. Como trata-se de um ambiente de
memória perfeita, os movimentos dos jogadores em cada nó de decisão é de
conhecimento comum em cada um desses nós.
Sendo mais específico, observe o que acontece no primeiro movimento: o
jogador 1 diz ao jogador 2 que do total que eles estão barganhando, ele quer x €
[0; 1], ou x%, de forma que ele está oferecendo a 2 (1 - x)%. Como dito, 2 pode
ou não aceitar. Se aceita a barganha termina e os ganhos são dados. Caso
contrário 2 faz a contraproposta ao jogador 1: do total a ser dividido, ele que (1 -
y)%, de modo que oferece a 1 y%.
Da mesma forma o jogador 1 pode aceitar ou rejeitar. Se 1 aceita o jogo
termina e os ganhos são dados. Note porém que agora já estamos no segundo
estágio do jogo, de forma que as partes já incorreram em algum custo decorrente
do fato de que elas não chegaram a um acordo no primeiro período.
De
Pede-se:
1. Taxa de desconto intertemporal (já está feita em jogos repetidos, mas ter em
mente a questão da in.ação, taxa de juros, reputação e o exemplo do sorvete
derretendo).
2. Represente o jogo na sua forma extensiva.
aceitam se e somente se
e os ganhos
Logo o equilíbrio de Nash perfeito em subjogos (o que nesse jogo equivale ao
resultado por indução retroativa) será a associação patronal ofertar
dados por .
Note que os trabalhadores estarão melhor fazendo a oferta no primeiro estágio se
ou seja, se
Indução Reversa
1. Seja k = 1 e Γ(k) = Γ.
2. Seja Z−1 o conjunto de todas as histórias que são antecessoras imediatas das
histórias terminais do jogo Γ(k). Para todo i ∈ N e h ∈ Z−1 ∩ Hi, o jogador i
enfrenta um problema de decisão após história h, e portanto deve escolher a ação
que maximiza sua utilidade esperada. Se houver mais de uma ação que produza
a mesma utilidade esperada, existirá um equilíbrio de subjogo perfeito contendo
cada uma dessas ações. Escolha uma delas para ser a ação escolhida por i
segundo a estratégia s, isto é, faça si(h) = a ∈ argmaxb∈Mhui(h · (b)). Passe ao
passo seguinte.
3. Defina o jogo Γ(k + 1) da seguinte maneira:
(a) Para todo h ∈ Z−¹ ∩(∪i∈ NHi), substitua as ações em Mh do jogo Γ(k), pelo
vetor de utilidades que corresponde a história terminal atingida pela ação
escolhida no passo anterior. Passe ao passo seguinte.
(b) Para todo h ∈ Z−1 ∩ (∪i∈NHi)c, isto é uma história imediatamente
antecessora a uma história terminal do jogo Γ(k) onde chance se move, substitua
as ações em Mh, pelo vetor de utilidades que corresponde a utilidade esperada
dos jogadores de acordo com a distribuição de probabilidade que descreve as
probabilidades do jogador chance escolher cada uma das ações em Mh. Passe
ao passo seguinte.
4. Se o conjunto de todas as histórias de Γ(k+1) em que algum jogador i ∈ N se
move for vazio. Pare a iteração e temos que s é um equilíbrio de subjogo perfeito
em estratégias puras de Γ. Caso contrário, passe ao passo seguinte.
5. Faça k = k + 1. Volte ao passo 2.
É fácil ver que como o jogo é finito, após um número finito de iterações o
algoritmo acima descrito produzirá um equilíbrio de subjogo perfeito em
estratégias puras. Desta forma, provamos construtivamente o seguinte teorema:
Teorema: Qualquer jogo em forma extensiva com informação perfeita finito tem
um equilíbrio de subjogo perfeito puro.
Jogos Repetidos
Como dito acima, a idéia por trás dos jogos repetidos é que, como ele será
jogado mais de uma vez, pode ser que valha a pena cooperar no início para que o
outro também coopere com você nos estágios subsequentes. Todavia, perceba
que uma vez que se saiba que se alcançou o último estágio do jogo, ninguém
mais irá cooperar, pois não mais se necessitará que o outro também coopere no
futuro, uma vez que o futuro, para tal jogo, não existirá - pois aquela é a última
rodada. Portanto, podemos concluir que:
Ou seja, quando um jogador escolhe entre suas estratégias, ele não sabe
quais estratégias os outros jogadores escolheram, por isso não tem certeza
quanto às consequências de suas escolhas. Para analisar as decisões dos
jogadores em um jogo, seria útil então ter uma teoria de tomada de decisão que
nos permita expressar as preferências de um agente sobre escolhas com
consequências incertas em termos de sua atitude perante as consequências.
Existem muitas regras de decisão que podem ser adotadas dependendo da
situação por um agente que tem que realizar uma escolha sob incerteza.
Assumiremos que o agente escolhe ações que são funções do estado da
natureza para consequências ou prêmios e que o agente é capaz de determinar
qual a utilidade dessas consequências, onde um estado da natureza é uma
descrição de todos os aspectos do mundo relevantes ao problema de decisão.
Algumas regras requerem que o agente seja capaz de determinar uma
probabilidade sobre o espaço dos estados da natureza, outras não precisam
desta descrição probabilística e podem ser usadas em casos onde tal informação
não é disponível ao agente.
Preferência ao Risco
Por fim, o último tipo de indivíduo é o indiferente ao risco, que baseia suas
decisões apenas no critério de maximização do valor monetário esperado, sem
considerar sua limitação de recursos.
Função-Utilidade
Onde
Para a Loteria A:
U(R$ 1.200.000,00) = 80
U( - R$ 200.000,00) = -90
Para a Loteria B:
U(R$ 12,00) = 20
U( - R$ 2,00) = - 5
Equivalente Certo
Veremos como cada um dos três considerou as utilidades para cada um dos
resultados:
UA (EqC) = UA (R$700,00) = 4.
P (Q) = a - Q e Q = q1 + q2
A função custo da firma 1 é dada por
C1 (q1) = cq1
A firma 1 não sabe ao certo qual é a função custo da firma 2 (essa firma
pode ser uma firma nova no mercado ou pode ter inventado uma nova
tecnologia): o que é de conhecimento comum aqui é a distribuição de
probabilidades sobre a eficiência da firma 2 e a própria estrutura de informação,
no sentido de que a firma 1 sabe que 2 tem informação superior, a firma 2 sabe
que a firma 1 sabe isso e assim sucessivamente.
Como resolver esse jogo? Considere primeiro o caso da firma 2, a firma
que tem mais informação. Caso ela seja ineficiente, o seu problema será
E analogamente, caso ela seja mais eficiente, vai
que são as melhores respostas que a firma 2 pode dar às escolhas de 1 caso ela
seja de custo alto ou de custo baixo.
Já o problema da firma 1, a firma não informada, é maximizar o seu ganho
esperado em função da chance de 2 ser ou não eficiente. Ou seja, a firma 1
tal que
será a melhor resposta (esperada) que a firma 1 pode dar às escolhas de 2. Da
interseção dessas 3 equações de melhores respostas segue que
Ou seja,
Logo
ou ainda,
tal que
Já com relação aos lucros das firmas em equilíbrio, observe que o lucro da firma 1
será
Para mostrarmos que o raciocínio acima está correto, tome a função lucro
da firma1 um pouco mais “aberta”,
Ou seja,
tal que
Equilíbrio Bayesiano
onde σj(cj |tj) é a probabilidade com que o tipo tj do jogador j escolhe ação cj .
Exemplo: Considere o seguinte jogo Bayesiano no qual o jogador 1 pode ter tipo
α ou β, onde segundo o único tipo do jogador 2, jogador 1 é do tipo α com
probabilidade 0,9. As utilidades dos jogadores são dadas de acordo com o as
tabelas a seguir:
Para o tipo α:
Para o tipo β:
Note que existem três equilíbrios Bayesianos neste jogo: (1) σ2(x2) = 1, σ1(x1|α)
= 1, e σ1(y1|β) = 1; (2) σ2(y2) = 1, σ1(y1|α) = 1, e σ1(y1|β) = 1; e (3) σ2(x2) = 1/2,
σ1(x1|α) = 5/9, e σ1(y1|β) = 1.
Exemplo: Suponha que duas pessoas estão envolvidas em uma disputa. Pessoa
1 não sabe se a pessoa 2 é forte ou fraca; ela associa probabilidade α a pessoa 2
ser forte. Pessoa 2 está perfeitamente informada. Cada pessoa pode lutar ou se
entregar. Cada pessoa recebe uma utilidade 0 se ela se entregar não importa o
que a outra pessoa faça. Além disso, cada pessoa recebe uma utilidade 1 se ela
lutar e seu adversário se entregar. Se ambas pessoas lutarem, então suas
utilidades são (−1; 1) se a pessoa 2 for forte e (1;−1) se a pessoa 2 for fraca.
Formulando esta situação como um jogo Bayesiano e encontrando os equilíbrios
bayesianos se α < 1 2 e se α > 1 2 .
Solução: O jogo Bayesiano é: N = {1, 2}; Ci = {L,E}, i ∈ N; T1 = {1}; T2 = {Ft,Fr};
p(Ft|1) = α; e as utilidades são dadas por:
Ou