Você está na página 1de 56

Jogos

A teoria dos jogos lida com as


interaes estratgicas que ocorrem
entre os agentes
Teoria dos Jogos
a) Descrio de um jogo
Jogadores: quem est envolvido
Regras: quem joga e quando? (jogos
simultneos ou sequenciais?) O que ele sabe
quando joga? (conjunto de informao) O que
ele pode fazer? (aes disponveis)
Payoffs/Recompensas: aquilo que o jogador
obtm depois de terminado o jogo, de acordo
com as suas prprias escolhas e as dos demais
jogadores.
JOGOS SIMULTNEOS

OS DOIS JOGAM AO MESMO


TEMPO!
b) Representao matricial ou
estratgica de um jogo
Exemplo: jogo do par ou mpar valendo um
real Estratgias para
Jogador 2 o jogador 2
Estratgias
(mpar)
para o jog.1 par mpar
Jogo
1,0 0,1 simultneo
par
Jogador 1
(par)
mpar 0,1 1,0

Payoff do jog. 1 Payoff do jog. 2


Resultado do jogo
Par ou mpar = No tem um resultado
previsvel
Jogos de interesse = so aqueles para os
quais podemos dizer algo sobre qual deve
ser o resultado final
Exemplo
Equilbrio com
estratgias Jogador 2
dominantes
esquerda direita

acima 3,3 2,1


Jogador 1

abaixo 1,2 1,1

Estratgia dominante para o jogador 1: jogar acima


Estratgia dominante para o jogador 2: jogar esquerda
c) Estratgias dominantes
Uma estratgia dominante uma estratgia
que tima para um jogador
independentemente da(s) estratgia(s)
escolhida(s) pelo(s) outro(s) jogador(es).
Quando cada jogador possui uma estratgia
dominante, dizemos que a combinao
dessas estratgias um equilbrio com
estratgias dominantes.
Exemplo: o dilema dos prisioneiros
Dois parceiros em um crime so presos por um
policial.
Para cada ladro, o policial prope que ele confesse
o crime e sirva de testemunha de acusao.
Se um dos ladres confessa o crime e o outro no,
aquele que confessou ser posto em liberdade e o
outro cumprir pena de 10 anos. Caso os dois
confessem, ambos ficaro presos por 3 anos. Se
nenhum dos dois confessarem, a penalidade ser de
apenas um ano.
Prisioneiro 2

confessa no confessa

confessa -3,-3 0,-10


Prisioneiro 1
no confessa -10,0 -1,-1

Equilbrio com estratgias dominantes: confessa, confessa


Equilbrio no eficiente no sentido de Pareto. Ambos
poderiam melhorar caso no confessassem.
Forma de jogar depende de quantas vezes o jogo jogado.
Dominante e Fracamente
dominante

si' , si si , si , p/ todo si e todo si
si, (estritamente/fortemente) dominante.


s , si si , si , p/ todo si e
''
i

s , s s , s , p/ algum s
''
i i i i i
,,
s fracamente dominante.
i
Exemplo
empresa de sabo em p Limpo decidir se
lana, ou no, uma marca biodegradvel
empresa Brilhante decidir se aumenta, ou no,
seus gastos com propaganda
BRILHANTE Cenrio 2
Cenrio 1 NO
NO

5,5 7,3 lana 2,5 7,3


lana
LIMPO
no lana 2,4 2,7 no lana 2,4 2,7

LANAR uma estratgia estritamente dominante para a empresa


LIMPO no cenrio 1 e fracamente dominante no cenrio 2.
Eliminao recursiva de estratgias dominadas
Definies:
Uma estratgia dita estritamente dominada quando
h uma outra estratgia que gera sempre um melhor
resultado independentemente da estratgia escolhida
pelo outro jogador.
Uma estratgia dita fracamente dominada quando h
uma outra estratgia que gera sempre um resultado
melhor ou igual independentemente da estratgia
escolhida pelo outro jogador.
Hiptese de Racionalidade: cada jogador procura maximizar suas
recompensas isso garante que o jogador no vai jogar uma
estratgia estritamente dominada.
Estratgia
dominante
para B Exemplo: Estratgia
quando dominada para A
Jogador B
excluda a
estratgia 1 a b c
para A

1 20,20 20,40 15,45

Jogador A
2 40,20 30,30 16,24

3 45,15 24,16 10,10


d) Equilbrio de Nash
O conjunto das estratgias escolhidas pelos
jogadores de um jogo constitui um equilbrio de
Nash se, para cada jogador, a sua estratgia
tima dadas as estratgias adotadas pelos outros
jogadores.
Todo equilbrio com estratgias dominantes
um equilbrio de Nash mas nem todo equilbrio
de Nash um equilbrio com estratgias
dominantes.
No necessariamente um equilbrio de Nash
eficiente no sentido de Pareto.
Exemplo: Batalha dos sexos
ELA
Luta livre pera

Luta livre 2,1 0,0

ELE
pera 0,0 1,2

Dois equilbrios de Nash.


Questo 11/ 2003
Considere um jogo na forma normal resumido em termos da
seguinte matriz de ganhos Jogador 2
L R
U 3,1 ,0
Jogador 1
D 0,0 ,

Para = 1, U uma estratgia dominante para o jogador 1 V


desde que > 1.
Para = 2 e = 1, existe um nico equilbrio de Nash em V
estratgias puras.
Para = 7 e = 6, o equilbrio de Nash em estratgias
puras Pareto eficiente. F
Equilbrio de Nash com
estratgias mistas
Dizemos que um jogador escolhe uma
estratgia mista quando ele atribui
probabilidades escolha de cada estratgia.
Um equilbrio de Nash com estratgias
mistas se d quando cada jogador escolheu
uma estratgia mista que maximiza seu
payoff esperado dada a estratgia mista
escolhida pelo outro jogador.
Exemplo: Batalha dos sexos
ELA

Luta livre pera

Luta livre 2,1 0,0


ELE

pera 0,0 1,2


Continuao
Sejam p1 e p2 as probabilidades com que
ele e ela, respectivamente escolhem luta
livre.
O payoff esperado dele ser dado por
2p1p2+(1-p1) (1-p2)=p1(3p2-1) +1-p2
O payoff esperado dela ser dado por
p1p2+2(1-p1) (1-p2)= p2(3p1-2) +2-2p1
Continuao
Funes de reao:
0 caso 2 1
3

1 qualquer valor entre 0 e 1 caso 2 1 3

1 caso 2 1 3

0 caso 1 2
3

2 qualquer valor entre 0 e 1 caso 1 2 3

1 caso 1 2 3
Equilbrio de Nash
2
Curva de reao dela
1
Equilbrios
de Nash em
estratgias Curva de reao dele
puras
1/3 Equilbrio de Nash
em estratgias
mistas.
1
2/3 1
JOGOS SEQUENCIAIS

Um jogador joga depois do outro!


Jogos sequenciais
Jogos sequenciais so aqueles nos quais os
jogadores no fazem os movimentos
simultaneamente, mas sequencialmente.
Isto , os agentes tomam suas decises
estratgicas em uma sequncia definida
anteriormente (conhecida pelos jogadores).
Jogos repetitivos so um caso especfico de
jogos sequenciais.
Exemplo
Duas empresas esto prestes a lanar produtos com
uma tecnologia revolucionria para gravao de
dados em discos. Elas devem optar por um tamanho
de disco associado ao seu produto.
Se as duas empresas empregarem o mesmo
tamanho de disco, as vendas conjuntas de seus
produtos tero melhor desempenho.
A empresa 1 consegue produzir equipamentos para
disco pequenos a custos mais baixos. A empresa 2
produz equipamentos para discos grandes a custos
mais baixos.
Payoffs do jogo
empresa 1:
discos pequenos
Empresa 2
empresa 2:
discos grandes Disco Disco
grande pequeno
Disco
Empresa 1

(2;3) (1;1)
grande
Disco
(1,5;1,5) (3;2)
pequeno
Jogo caso a empresa 1 comece a
produzir antes da empresa 2
Empresa 1

Disco grande Disco pequeno


Empresa 2 Empresa 2

Disco grande Disco pequeno Disco grande Disco pequeno

(2;3) (1;1) (1,5;1,5) (3;2)


Conjunto de informao
Suponha que, no momento em que tem que
decidir uma ao, um jogador no sabe
exatamente como ele se posiciona no jogo.
Chamamos de conjunto de informao o
conjunto de todas as posies possveis
desse jogador nesse momento de deciso.
Quando o conjunto de informao consiste
de mais de um n ele ser indicado por uma
curva que circunscreve todos os seus ns.
Exemplo: par ou mpar
Jogador 1

0 1
Jogador 2 Jogador 2
Conjunto de
informao
0 1 0 1

1,0 0,1 0,1 1,0


Exemplo: entrada
A empresa E deve decidir se entra ou no
em um mercado que monoplio da
empresa I.
Se ela permanece fora desse mercado, o
lucro da empresa I igual a $2.
Se ela entra no mercado, as duas empresas
devem decidir simultaneamente se lutam ou
se acomodam.
Empresa E

No entra Entra

Empresa E
0,2
Luta Acomoda

Empresa I Empresa I

Luta Acomoda Luta Acomoda

3,1 1,2 2,1 3,1


Jogo caso a empresa 1 comece a
produzir antes da empresa 2
Empresa 1

Disco grande Disco pequeno


Empresa 2 Empresa 2

Disco grande Disco pequeno Disco grande Disco pequeno

(2;3) (1;1) (1,5;1,5) (3;2)

Os ns unitrios para a empresa 2 indicam que a empresa 2 sabe


exatamente onde est naquele momento do jogo.
Definio: Subjogo
Um subjogo um subconjunto de um jogo em
forma extensiva com as seguintes
propriedades:
Comea sempre em um nico n de deciso;
Contm sempre todos os ns que se seguem
ao n no qual ele se iniciou;
Se um subjogo contm qualquer parte de um
conjunto de informao, ele conter todos os
ns do conjunto de informao.
Empresa E
Exemplo

Empresa E O Jogo todo um


subjogo

Empresa I Empresa I
Empresa E
Exemplo

Empresa E Outro subjogo

Empresa I Empresa I
Empresa E
Exemplo

No um
Empresa E
subjogo

Empresa I Empresa I
Empresa E
Exemplo
No um subjogo

Empresa E

Empresa I Empresa I
Empresa E
Exemplo

Empresa E No um subjogo

Empresa I Empresa I
Definio: Estratgia
Uma estratgia um plano de aes que
especifica, para um determinado jogador,
que ao tomar em todos os momentos em
que ele tiver que tomar uma deciso. Ou
seja, especifica quais so as aes que sero
adotadas pelo jogador , em todos os
momentos em que tiver que jogar.
Definio
Uma combinao de estratgias um
equilbrio de Nash perfeito de subjogos caso
preencha duas condies:
a) um equilbrio de Nash para o jogo em sua
totalidade;
b) um equilbrio de Nash em cada subjogo.
Exemplo
Empresa 1

Disco grande Disco pequeno


Empresa 2 Empresa 2

Disco grande Disco pequeno Disco grande Disco pequeno

(1;1) (1,5;1,5) (3;2)


(2;3)

Temos 3 subjogos!
Possveis estratgias
Empresa 1
Lanar disco pequeno (P)
Lanar disco grande (G)
Empresa 2
Lanar disco pequeno independentemente da escolha
da empresa 1 (P/P; P/G)
Lanar disco grande independentemente da escolha
da empresa 1 (G/P; G/G)
Lanar o mesmo produto que a empresa 1 (P/P; G/G)
Lanar produto diferente da empresa 1 (G/P; G/G)
Representao estratgica

1 ao da empresa 2
Empresa 2
P/P; P/G G/P; G/G P/P; G/G G/P; P/G
Empresa 1

P 3;2 1,5;1,5 3;2 1,5;1,5

G 1;1 2;3 2;3 1;1

Payoff da Payoff da Trs estratgias que geram


empresa 1 empresa 2 equilibrios de Nash
Trs EN: P; P/P,P/G G; G/P,G/G P; P/P,G/G
Mas P e (G/P; G/G) no induz um equilbrio de
Nash no subjogo B; e G e P/P; P/G no induz um
equilbrio de Nash no subjogo A.
Logo, o equilbrio perfeito de subjogo P e G/G;
P/P. A Empresa 1 B

Disco grande Disco pequeno


Empresa 2 Empresa 2

Disco grande Disco pequeno Disco grande Disco pequeno

(1;1) (1,5;1,5) (3;2)


(2;3)
Questo 14 de 2001
Considere o jogo na forma extensiva
apresentada a seguir.
1
A B
2 2
a b a b
(3,2) (5,5) (0,0) (7,4)

A estratgia A domina estritamente a estratgia B. F


Existe um equilbrio de Nash que resulta nos ganhos (5, 5). V
F
No existe equilbrio de Nash que resulte nos ganhos (7, 4).
F
Todo equilbrio de Nash do jogo perfeito em subjogos.
Todo equilbrio de Nash em estratgias puras do jogo eficiente no V
sentido de Pareto.
Jogo repetido um nmero
determinado de vezes
Se o jogo jogado um nmero finito de vezes os dois
jogadores sabem que na ltima rodada no haver
incentivo para a cooperao.
Mas, como os dois jogadores no vo cooperar na ltima
rodada, no h porqu cooperar na penltima.
Continuando com o raciocnio, no haver cooperao em
nenhuma rodada.
QQ jogo repetido um nmero finito de vezes, em que o
jogo-base apresente apenas um equilibrio de Nash, possui
um nico equilibrio de Nash perfeito em subjogos, o qual
consiste em jogar o equilbrio de Nash do jogo-base em
todas as n etapas.
Jogos repetidos um nmero
indeterminado de vezes
Nesse caso, no h ltima rodada e o
raciocnio desenvolvido acima no se
aplica.
Embora seja difcil definir estratgias
timas para um jogo do tipo dilema dos
prisioneiros jogado um nmero infinito de
vezes, o equilbrio de Nash pode ocorrer
com cooperao em todas as rodadas.
Exemplo: estratgia tit-for-tat
Considere um jogo dilema dos prisioneiros
jogado repetidas vezes.
A estratgia tit-for-tat consiste em cooperar
na primeira rodada e, nas rodadas
subsequentes, adotar a estratgia adotada
pelo outro jogador na ltima rodada.
Note que, se os dois jogadores, adotam a
estratgia tit-for-tat emergir um equilbrio
de Nash com os dois colaborando em todas
as rodadas.
Estratgia do disparo (gatilho)
Chama-se estratgia do disparo ou
estratgia do gatilho (trigger strategy)
qualquer estratgia que faa com que o
jogador sustente para sempre uma ao
punitiva contra qualquer desvio da conduta
cooperativa.
Exemplo: Jogo do dilema dos prisioneiros
com repetio: Na primeira rodada cooperar
e, em qualquer outra rodada, cooperar
apenas se o outro jogador tiver cooperado
em todas as rodadas anteriores.
Exemplo de Cartel
Duas empresas com as funes de custo CT1=q12
e CT2=q22.
A funo de demanda p = 120 - q, sendo q =
(q1+ q2).
A soluo de cartel CMg1= CMg2=RMg ou
seja, 2q1= 2q2 = (120 (q1+ q2)) (q1+q2) = 120
2(q1+q2)
q1= q2 = 60 (q1+q2) q2 = 60 2q2 q2 = 20
q1= q2 = 20; p = 120 40 = 80 S pude fazer
isso porque as
Lucro de Cartel = 20x80 (20)2= duas empresas
so iguais
= 1200
Problema do cartel
Dado que a empresa 1 est produzindo a
quantidade de cartel (q1=20):
RT2 = (120 q1 q2) q2 = 120q2 q1q2 q22
RMg2=120 - q1 - 2q2 = 100 2q2.
A quantidade que maximizaria o lucro da empresa
2, portanto seria tal que
RMg2= CMg2 100 2q2= 2q2 q2=25.
Ou seja, dado que a outra empresa est
produzindo a quantidade de cartel, cada empresa
tem incentivo para produzir mais do que essa
quantidade.
Estratgia do disparo para cartis
Nem toda estratgia de disparo constitui uma
ameaa crvel. No exemplo, se a ao punitiva
for passar a produzir 40 unidades, caso uma das
empresas fure o cartel, o lucro da outra empresa
adotando uma ao punitiva ser igual a $600,
no adotando essa ao, seu lucro ser igual a
$1.100,00.
q2 = 25
Se no cumpre promessa = q1= 20; qt = 45; p=75
Lucro1 = 75x20 (20)2 = 1100
Se cumpre promessa = q1 = 40; qt = 65, p=55;
Lucro1 = 55x40 (40)2 = 600
Estratgia de disparo crvel
Considere a seguinte estratgia para um
duoplio repetido um nmero indefinido de
vezes: a) comear produzindo a quantidade
de cartel; b) continuar produzindo a
quantidade de cartel caso o outro duopolista
tenha produzido essa quantidade no perodo
anterior e produzir a quantidade de Cournot,
caso contrrio.
Continuao:
Suponha que a empresa 1 adote a estratgia
descrita acima.

Empresa 2 pensando se burla ou no o cartel:


Caso ela produza a quantidade de cartel seu
lucro ser igual a 1.200 em todos os perodos.
Caso ela produza a quantidade que maximiza
seu lucro dada a produo da empresa 1, ela ir
ter lucros iguais a 1.250 no primeiro perodo e
1.152 nos perodos subsequentes.
Primeiro perodo
RT2 = [120 (q1+q2)]q2 = 120 q2 q1q2 - q22
RMg2 = 120 q1 + 2q2
Se ela toma o que a outra est produzindo
como dado, ento, RMg2 = 120 20 + 2q2 =
100-2q2
100 2q2 = 2q2 q2 = 25
P = 120 (20+25) = 75 ;
Lucro2 = 75x25 (25)2 = 1250
Perodos subsequentes: Soluo
de Cournot
p=120(q1+q2); CT1=q12; CT2=q22
Empresa 1
Lucro = [120(q1+q2)]q1- q12
CPO: [120(q1+q2)] - q1- 2q1 = 0
F de reao da empresa 1 q1= (120q2) / 4;
F de reao da empresa 2 q2= (120q1) / 4;
Resolvendo: q1= q2= 24; P = 72;
Li=72x24 (24)2 = 1152
A condio para ela escolher cartel que:

1.200 1.152
1.200 1.250
i i

48 48
50 i 96%
i 50

a1 * ( q n 1)
Sn
q 1