Você está na página 1de 25

TEORIA DOS JOGOS NÃO COOPERATIVOS

ESTÁTICOS E DINÂMICOS

Susan Schommer
Formas estratégicas e extensivas

I Teoria dos jogos é o estudo da interação dos tomadores de


decisão
I Para descrever a interação estratégica, precisamos conhecer:
(i) Os jogadores: Quem está envolvido?
(ii) As regras: Quem movimenta quando? O que eles sabem
quando eles movem? O que pode eles fazerem?
(iii) Os resultados: Para cada possı́vel conjunto de ações,
estratégias pelos jogadores, qual é o resultado do jogo?
(iv) Os payoffs: Qual é a utilidade que cada jogador recebe se uma
particular combinação de estratégias é escolhida?
I Existem duas principais formas de descrever um jogo: forma
estratégica (normal ou reduzida) e a forma extensiva
Formas estratégicas e extensivas
I Jogo de combinar moedas:
(i) Jogadores: 2 que chamaremos de J1 e J2
(ii) Regra: cada jogador (sequencialmente ou simultaneamente)
coloca uma moeda para baixo, ambas cara ou coroa
(iii) Resultado: se as duas moedas são iguais (2 caras ou 2 coroas)
o J1 paga 1 unidade monetária para o J2, caso contrário J2
para 1 para J1
(iv) Payoffs: são as funções de utilidade
I A forma extensiva de representação do jogo é:
Jogo sequencial Jogo simultâneo
Jogador 1 Jogador 1

Cara Coroa Cara Coroa

Jogador 2 Jogador 2 Jogador 2

Cara Coroa Cara Coroa Cara Coroa Cara Coroa

(-1,+1) (+1,-1) (+1,-1) (-1,+1) (-1,+1) (+1,-1) (+1,-1) (-1,+1)

(Payoff J1,Payoff J2) (Payoff J1,Payoff J2)


Formas estratégicas e extensivas
I Mesmo jogo de combinar moedas com movimento simultâneo
com a forma estratégica de representação:

Jogo simultâneo

Jogador 1
Cara Coroa
Jogador 2 Cara -1,+1 +1,-1
Coroa +1,-1 -1,+1

I Postulados básicos:
(1) Todos os jogadores sabem a estrutura do jogo
(2) Conhecem o que os seus rivais sabem
(3) Conhecem o que seu rivais conhecem que eles sabem disso,...
I Estes postulados são conhecidos como conhecimento
comum
Jogos não cooperativos estáticos

I Inicialmente analisamos jogos :


(i) Estáticos: jogadores escolhem suas ações
simultaneamente
(ii) Informação completa: cada função payoff do jogador é
de conhecimento comum
(1) Todos os jogadores sabem a estrutura do jogo
(2) Conhecem o que os seus rivais sabem
(3) Conhecem o que seu rivais conhecem que eles sabem disso,...
I Usamos a forma estratégica (ou normal) para representar
estes jogos
I Começaremos ilustrando com o Dilema dos Prisioneiros
Dilema do Prisioneiro
I Dilema do Prisioneiro:
I 2 indivı́duos suspeitos de cometerem um crime sério
I são colocados em celas diferentes e interrogados
I se ele é o único a confessar o crime recebe 1 ano de prisão,
enquanto o outro que não confessou ficará 10 anos na prisão
I se ambos confessam eles ficam 5 anos da prisão
I se os dois não confessarem ficam 2 anos na prisão
I casa jogador quer minimizar o tempo na cadeia

Dilema do Prisioneiro
Prisioneiro 2
Não confessa Confessa
Não -2,-2 -10,-1
Prisioneiro 1 confessa
-1,-10 -5,-5
Confessa
Notação para o caso geral

I Exitem n-jogadores e um arbitrário jogador i


I Si conjunto de estratégias de i, sendo si ∈ Si
I (s1 , ..., sn ) combinação de estratégias
I ui (s1 , ..., sn ) função payoff de i

Definição:
A forma estratégica de um jogo com n-jogadores especifica o
espaço de estratégicas S1 , ..., Sn e suas funções payoffs u1 , ..., un .
Denotamos este jogo por G = {S1 , ..., Sn ; u1 , ..., un }
Resolvendo o jogo

I Primeiro passo: jogadores racionais não jogarão uma


estratégia estritamente dominada

Definição:
No jogo G = {S1 , ..., Sn ; u1 , ..., un }, seja s0i e s00i as estratégias
viávies do jogador i. A estratégia s0i é dominada estritamente
pela estratégia s00i se:

ui (s−i , s0i ) < ui (s−i , s00i )

I Fazendo apenas o procedimento de eliminação de


estratégias dominadas não necessariamente resolvemos o
jogo.
Equilı́brio de Nash

I Usaremos um conceito para solução mais forte que é o


Equilı́brio de Nash, no sentido que as estratégias sempre
sobrevivem a eliminação de estratégias dominadas, mas o
inverso não é verdade.

Definição:
No jogo G = {S1 , ..., Sn ; u1 , ..., un }, as estratégias (s∗1 , ..., s∗n ) são
um Equilı́brio de Nash (EN) se para cada jogador i, s∗i é a
melhor resposta do jogador i para as especificadas estratégias dos
outros n − 1 jogadores:

ui (s∗−i , s∗i ) ≥ ui (s∗−i , si )

para cada estratégia viável si ∈ Si , isto é, s∗i resolve:

maxsi ∈Si ui (s∗−i , si )


Dilema do Prisioneiro
I Dilema do Prisioneiro: temos um único EN
(confessar,confessar)
I O resultado não é o melhor se eles jogassem conjuntamente,
ambos poderiam escolher não confessar.
I Exemplo evidencia que o próprio interesse e comportamento
racional pode não levar ao ótimo social.
Prisioneiro 2
Não confessa Confessa
Não -2,-2 -10,-1
Prisioneiro 1 confessa
Confessa -1,-10 -5,-5
I Podemos ter múltiplos EN
I Podemos não ter EN em estratégias puras

Jogo de combinar moedas


Jogador 1
Cara Coroa
Cara -1,+1 +1,-1
Jogador 2
Coroa +1,-1 -1,+1
Equilı́brio de Nash em estratégias mistas

I Podemos extender a definição de EN considerando que os


jogadores tornem aleatórias as suas estratégias puras.

Definição:
No jogo G = {S1 , ..., Sn ; u1 , ..., un }, suponha que o jogador i
tenha K estratégias puras: Si = {si1 , ..., siK ). Então, uma
estratégia mista para o jogador i é uma probabilidade de
distribuição pi = (pi1 , ..., piK ), onde 0 ≤ pik ≤ 1 para k = 1, ..., K
e pi1 + · · · + piK = 1

I Para extender a definição de equilı́brio de Nash requeremos


que cada estratégia mista do jodador seja a melhor resposta
para as outras estratégias mistas dos jogadores.
Existência de Equilı́brio de Nash

Proposição:
Todo o jogo G = {S1 , ..., Sn ; u1 , ..., un } com estratégias mistas no
qual os conjuntos S1 , ..., Sn tem um numéro finito de elementos
tem um equilı́brio de Nash em estratégia mista.

I Em aplicações econômicas podemos ter jogos no qual as


estratégias são modeladas como variáveis contı́nuas. Isso pode
ser útil para a existência de EN em estratégias puras
Existência de Equilı́brio de Nash
Proposição:
Um Equilı́brio de Nash existe no jogo G = {S1 , ..., Sn ; u1 , ..., un }
se para todo i = 1, ...n
(i) Si é um subconjunto não vazio, convexo e compacto de algum
espaço Euclidiano RM
(ii) ui (s1 , ..., sn ) é contı́nuo em (s1 , ..., sn ) e quase-côncavo em si .

I Se (i) e (ii) se mantém, então a melhor resposta


(correspondência) do jogador i é não vazia, valor convexo e
hemi-contı́nua superior
I Com estas propriedades aplicamos diretamente o teorema de
Kakutani e então existe um ponto fixo para a correspondência
I Se todas as hipóteses do EN em estratégias puras são
satifeitas, então o EN em estratégias mistas é vista como um
corolário da proposição com estratégias puras.
Jogos Bayesianos. Equilı́brio de Nash Bayesiano

I Cada jogador sabe a sua própria função payoff mas pode ter
incerteza sobre a função payoff do outro jogador
I Seja a função payoff do jogador i ui (a1 , ..., an ; ti ) onde ti é
chamado o tipo de i e pertence ao conjunto dos possı́veis
tipos Ti
I Cada tipo ti corresponde a uma função payoff diferente que o
jogador i pode ter.
I Usamos a distribuição de probabilidade pi (t−i |ti ) para denotar
a crença do jogador i sobre os outros tipos
I A representação normal de um jogo estático com n-jogadores
é especificada pelas suas ações A, tipos T , crenças p e payoff
u. Denotamos esse jogo por
G = {A1, ..., An ; T1 , ...Tn ; p1 , ..., pn ; u1 , ..., un }
Jogos Bayesianos. Equilı́brio de Nash Bayesiano

I No jogo estático Bayesiano


G = {A1, ..., An ; T1 , ...Tn ; p1 , ..., pn ; u1 , ..., un }, uma
estratégia para o jogador i é uma função si (ti ) onde cada tipo
ti em Ti , si (ti ) especifica a ação de um conjunto viável Ai
que o tipo ti poderia escolher.
I No jogo estático Bayesiano
G = {A1, ..., An ; T1 , ...Tn ; p1 , ..., pn ; u1 , ..., un }, as estratégias
s∗ = (s∗1 , ..., s∗n ) são um equilı́brio de Nash Bayesiano
(estratégia pura) se para cada jogador i e para cada tipo ti
em Ti , si (ti ) resolve
X
max ui (s∗−i (ti ), ai ; t)pi (t−i |ti )
ai ∈Ai
t−i ∈T−i

Isto é, o jogador não quer trocar sua estratégia, mesmo se as


trocas envolvem somente uma ação de um tipo.
Equilı́brio de Nash Bayesianos

I Para provar a existência, basta mostrar que um jogo Bayesiano


estático finito existe um EN Bayesiano em estratégias mistas.
I A prova se aproxima bastante da prova da existência de um
EN com estratégias mistas em jogos finitos de completa
informação.
I Aplicações: leilões selados de primeiro preço
Caracterı́sticas
I Para entender a estrutura dinâmica do jogo usaremos a forma
extensiva de representação.
I A questão central em todos os jogos dinâmicos é a
credibilidade de uma estratégia do jogador
I As caracterı́sticas do jogo com informação completa e
perfeita:
(i) o movimento ocorrem em sequência - o jogador 1 escolhe a
ação a1 ; o jodador 2 observa a1 e então escolhe a2
(ii) todos os anteriores movimentos são observados antes do
próximo movimento
(iii) os payoffs (u1 (a1 , a2 ) e u2 (a1 , a2 )) dos jogadores de cada
combinação viável dos movimentos são de comum
conhecimento
I Ilustraremos com um exemplo em que o conceito de EN não
será suficiente para eliminar estratégias não crı́veis.
I Introduziremos um novo conceito de Equilı́brio de Nash
Perfeito em Subjogos
Exemplo: Jogo de predação

Jogo sequencial
Firma E

Fora Entra

Firma I
(uE,uI) (0,2)
Briga Acomoda

(-3,-1) (2,1)

Firma I
Briga Acomoda
se Firma E joga Entra se Firma E joga Entra
Fora 0,2 0,2
Firma E
Dentro -3,-1 2,1
Indução reversa
I Resolvemos o jogo por indução reversa.
I Quando o jogador 2 começa o movimento na segunda etapa
do jogo, terá o seguinte problema, dado a ação a1
previamente escolhida pelo jogador 1

max u2 (a1 , a2 )
a2

Assuma que para cada a1 o prob de otimização do jogador 2


tem um única solução denotada por R2 (a1 ) (função reação ou
melhor resposta)
I O jogador 1 antecipa a função reação e seu problema será:

max u1 (a1 , R2 (a1 ))


a1

Assuma que tenha uma única solução a∗1


I Chamaremos de (a∗1 , R2 (a∗1 )) o resultado da indução reversa.
Indução reversa e racionalidade sequencial

I O resultado da indução reversa não envolve ameaças não


crı́veis: o jogador 1 antecipa que o jogador 2 responderá
otimamente para qualquer ação a1
I Exemplo: Duopólio de Stackelberg
I A Indução reversa está relacionada com a ideia de
racionalidade sequencial, pois assegura que as estratégias dos
jogadores especificam o comportamento ótimo para todo o nó
de decisão do jogo
I O Exemplo do jogo de predação faz parte de uma classe geral
de jogos finitos com informação perfeita
I Consideraremos outro exemplo no qual sugere como podemos
identificar EN que satisfaça o princı́pio da racionalidade
sequencial em jogos com informação imperfeita
Exemplo: Jogo de predação com movimento simultâneo

Jogo sequencial
Firma E

Fora Entra

Firma E
(0,2)
Briga Acomoda

Firma I

Briga Acomoda
Briga Acomoda

(-3,-1) (1,-2) (-2,-1) (3,1)


Equilı́brio de Nash Perfeito em Subjogos

I Um subjogo da forma extensiva é um subconjunto de jogo


contendo as seguintes propriedades:
(i) começa com um nó de decisão n que é um conjunto de
informação único
(ii) inclui toda a decisão e nós terminais seguindo n na árvore
do jogo
(iii) não corta algum conjunto de informação

Definição:
Um Equilı́brio de Nash é perfeito em subjogos se as estratégias dos
jogadores constituem um Equilı́brio de Nash em todo subjogo
Equilı́brio de Nash Perfeito em Subjogos

I Podemos mostrar que um jogo finito dinâmico com completa


informação tem um EN perfeito em subjogos (ENPS)
I O argumento por construção é baseado em duas observações:
(i) O teorema de Nash se aplica para todos finitos jogos de
informação completa e estes jogos podem ser estáticos ou
dinâmicos
(ii) Um jogo dinâmico finito com completa informação tem
um número finito de subjogos, em que cada satisfaz as
hipóteses do teorema de Nash
I Note que qualquer ENPS é um EN (desde que o jogo com um
todo é um subjogo), mas nem todo EN é perfeito subjogo
Jogo de predação modificado

Jogo sequencial
Firma E

Fora Entra2
Entra1

Firma I
(0,2)
Briga Acomoda
Briga Acomoda

(-1,-1) (3,0) (-1,-1) (2,1)

I ENPS pode falhar para assegurar racionalidade sequencial


I Introduzimos o conceito de Equilı́brio Bayesiano perfeito
Equilı́brio Bayesiano perfeito

I Um equiı́brio Bayesiano perfeito consiste de estratégias e


crenças safisfazendo os seguintes requerimentos:
(1) Para cada conjunto de informação, o jogador com o
movimento deve ter uma crença sobre qual nó no conjunto de
informação tem sido alcançado pelo jogo. Para um conjunto
de informação não único, a crença é a distribuição de
probabilidade sobre os nós no conjunto de informação, para um
conjunto de informação único, a crença tem probabilidade um
no único nó de decisão
(2) Dada as suas crenças a estratégia do jogador deve ser
sequencialmente racional
(3) Para os conjuntos de informações na trajetória de equilı́brio,
crenças são determinadas pela regra de Bayes e as estratégias
de equilı́brio dos jogadores
(4) Para os conjuntos de informações na trajetória de equilı́brio,
crenças são determinadas pela regra de Bayes e as estratégias
de equilı́brio dos jogadores onde possı́vel

Você também pode gostar