Aula7 2015

TEORIA DOS JOGOS NÃO COOPERATIVOS
ESTÁTICOS E DINÂMICOS
Susan Schommer
Formas estratégicas e extensivas
I Teoria dos jogos é o estudo da interação dos tomadores de

decisão
I Para descrever a interação estratégica, precisamos conhecer:
(i) Os jogadores: Quem está envolvido?
(ii) As regras: Quem movimenta quando? O que eles sabem
quando eles movem? O que pode eles fazerem?
(iii) Os resultados: Para cada possı́vel conjunto de ações,
estratégias pelos jogadores, qual é o resultado do jogo?
(iv) Os payoffs: Qual é a utilidade que cada jogador recebe se uma
particular combinação de estratégias é escolhida?
I Existem duas principais formas de descrever um jogo: forma
estratégica (normal ou reduzida) e a forma extensiva
I Jogo de combinar moedas:
(i) Jogadores: 2 que chamaremos de J1 e J2
(ii) Regra: cada jogador (sequencialmente ou simultaneamente)
coloca uma moeda para baixo, ambas cara ou coroa
(iii) Resultado: se as duas moedas são iguais (2 caras ou 2 coroas)
o J1 paga 1 unidade monetária para o J2, caso contrário J2
para 1 para J1
(iv) Payoffs: são as funções de utilidade
I A forma extensiva de representação do jogo é:
Jogo sequencial Jogo simultâneo
Jogador 1 Jogador 1
Cara Coroa Cara Coroa
Jogador 2 Jogador 2 Jogador 2
Cara Coroa Cara Coroa Cara Coroa Cara Coroa
(-1,+1) (+1,-1) (+1,-1) (-1,+1) (-1,+1) (+1,-1) (+1,-1) (-1,+1)
(Payoff J1,Payoff J2) (Payoff J1,Payoff J2)

I Mesmo jogo de combinar moedas com movimento simultâneo
com a forma estratégica de representação:
Jogo simultâneo
Jogador 1
Cara Coroa
Jogador 2 Cara -1,+1 +1,-1
Coroa +1,-1 -1,+1
I Postulados básicos:
(1) Todos os jogadores sabem a estrutura do jogo
(2) Conhecem o que os seus rivais sabem
(3) Conhecem o que seu rivais conhecem que eles sabem disso,...
I Estes postulados são conhecidos como conhecimento
comum
Jogos não cooperativos estáticos
I Inicialmente analisamos jogos :

(i) Estáticos: jogadores escolhem suas ações
simultaneamente
(ii) Informação completa: cada função payoff do jogador é
de conhecimento comum
(1) Todos os jogadores sabem a estrutura do jogo
(2) Conhecem o que os seus rivais sabem
(3) Conhecem o que seu rivais conhecem que eles sabem disso,...
I Usamos a forma estratégica (ou normal) para representar
estes jogos
I Começaremos ilustrando com o Dilema dos Prisioneiros
Dilema do Prisioneiro
I Dilema do Prisioneiro:
I 2 indivı́duos suspeitos de cometerem um crime sério
I são colocados em celas diferentes e interrogados
I se ele é o único a confessar o crime recebe 1 ano de prisão,
enquanto o outro que não confessou ficará 10 anos na prisão
I se ambos confessam eles ficam 5 anos da prisão
I se os dois não confessarem ficam 2 anos na prisão
I casa jogador quer minimizar o tempo na cadeia
Prisioneiro 2
Não confessa Confessa
Não -2,-2 -10,-1
Prisioneiro 1 confessa
-1,-10 -5,-5
Confessa
Notação para o caso geral
I Exitem n-jogadores e um arbitrário jogador i

I Si conjunto de estratégias de i, sendo si ∈ Si
I (s1 , ..., sn ) combinação de estratégias
I ui (s1 , ..., sn ) função payoff de i
Definição:
A forma estratégica de um jogo com n-jogadores especifica o
espaço de estratégicas S1 , ..., Sn e suas funções payoffs u1 , ..., un .
Denotamos este jogo por G = {S1 , ..., Sn ; u1 , ..., un }
Resolvendo o jogo
I Primeiro passo: jogadores racionais não jogarão uma

estratégia estritamente dominada
Definição:
No jogo G = {S1 , ..., Sn ; u1 , ..., un }, seja s0i e s00i as estratégias
viávies do jogador i. A estratégia s0i é dominada estritamente
pela estratégia s00i se:
ui (s−i , s0i ) < ui (s−i , s00i )
I Fazendo apenas o procedimento de eliminação de

estratégias dominadas não necessariamente resolvemos o
jogo.
Equilı́brio de Nash
I Usaremos um conceito para solução mais forte que é o

Equilı́brio de Nash, no sentido que as estratégias sempre
sobrevivem a eliminação de estratégias dominadas, mas o
inverso não é verdade.
Definição:
No jogo G = {S1 , ..., Sn ; u1 , ..., un }, as estratégias (s∗1 , ..., s∗n ) são
um Equilı́brio de Nash (EN) se para cada jogador i, s∗i é a
melhor resposta do jogador i para as especificadas estratégias dos
outros n − 1 jogadores:
ui (s∗−i , s∗i ) ≥ ui (s∗−i , si )
para cada estratégia viável si ∈ Si , isto é, s∗i resolve:
maxsi ∈Si ui (s∗−i , si )

I Dilema do Prisioneiro: temos um único EN
(confessar,confessar)
I O resultado não é o melhor se eles jogassem conjuntamente,
ambos poderiam escolher não confessar.
I Exemplo evidencia que o próprio interesse e comportamento
racional pode não levar ao ótimo social.
Prisioneiro 2
Não confessa Confessa
Não -2,-2 -10,-1
Prisioneiro 1 confessa
Confessa -1,-10 -5,-5
I Podemos ter múltiplos EN
I Podemos não ter EN em estratégias puras
Jogo de combinar moedas

Jogador 1
Cara Coroa
Cara -1,+1 +1,-1
Jogador 2
Coroa +1,-1 -1,+1
Equilı́brio de Nash em estratégias mistas
I Podemos extender a definição de EN considerando que os

jogadores tornem aleatórias as suas estratégias puras.
Definição:
No jogo G = {S1 , ..., Sn ; u1 , ..., un }, suponha que o jogador i
tenha K estratégias puras: Si = {si1 , ..., siK ). Então, uma
estratégia mista para o jogador i é uma probabilidade de
distribuição pi = (pi1 , ..., piK ), onde 0 ≤ pik ≤ 1 para k = 1, ..., K
e pi1 + · · · + piK = 1
I Para extender a definição de equilı́brio de Nash requeremos

que cada estratégia mista do jodador seja a melhor resposta
para as outras estratégias mistas dos jogadores.
Existência de Equilı́brio de Nash
Proposição:
Todo o jogo G = {S1 , ..., Sn ; u1 , ..., un } com estratégias mistas no
qual os conjuntos S1 , ..., Sn tem um numéro finito de elementos
tem um equilı́brio de Nash em estratégia mista.
I Em aplicações econômicas podemos ter jogos no qual as

estratégias são modeladas como variáveis contı́nuas. Isso pode
ser útil para a existência de EN em estratégias puras
Existência de Equilı́brio de Nash
Proposição:
Um Equilı́brio de Nash existe no jogo G = {S1 , ..., Sn ; u1 , ..., un }
se para todo i = 1, ...n
(i) Si é um subconjunto não vazio, convexo e compacto de algum
espaço Euclidiano RM
(ii) ui (s1 , ..., sn ) é contı́nuo em (s1 , ..., sn ) e quase-côncavo em si .
I Se (i) e (ii) se mantém, então a melhor resposta

(correspondência) do jogador i é não vazia, valor convexo e
hemi-contı́nua superior
I Com estas propriedades aplicamos diretamente o teorema de
Kakutani e então existe um ponto fixo para a correspondência
I Se todas as hipóteses do EN em estratégias puras são
satifeitas, então o EN em estratégias mistas é vista como um
corolário da proposição com estratégias puras.
Jogos Bayesianos. Equilı́brio de Nash Bayesiano
I Cada jogador sabe a sua própria função payoff mas pode ter
incerteza sobre a função payoff do outro jogador
I Seja a função payoff do jogador i ui (a1 , ..., an ; ti ) onde ti é
chamado o tipo de i e pertence ao conjunto dos possı́veis
tipos Ti
I Cada tipo ti corresponde a uma função payoff diferente que o
jogador i pode ter.
I Usamos a distribuição de probabilidade pi (t−i |ti ) para denotar
a crença do jogador i sobre os outros tipos
I A representação normal de um jogo estático com n-jogadores
é especificada pelas suas ações A, tipos T , crenças p e payoff
u. Denotamos esse jogo por
G = {A1, ..., An ; T1 , ...Tn ; p1 , ..., pn ; u1 , ..., un }
Jogos Bayesianos. Equilı́brio de Nash Bayesiano
I No jogo estático Bayesiano

G = {A1, ..., An ; T1 , ...Tn ; p1 , ..., pn ; u1 , ..., un }, uma
estratégia para o jogador i é uma função si (ti ) onde cada tipo
ti em Ti , si (ti ) especifica a ação de um conjunto viável Ai
que o tipo ti poderia escolher.
I No jogo estático Bayesiano
G = {A1, ..., An ; T1 , ...Tn ; p1 , ..., pn ; u1 , ..., un }, as estratégias
s∗ = (s∗1 , ..., s∗n ) são um equilı́brio de Nash Bayesiano
(estratégia pura) se para cada jogador i e para cada tipo ti
em Ti , si (ti ) resolve
X
max ui (s∗−i (ti ), ai ; t)pi (t−i |ti )
ai ∈Ai
t−i ∈T−i
Isto é, o jogador não quer trocar sua estratégia, mesmo se as

trocas envolvem somente uma ação de um tipo.
Equilı́brio de Nash Bayesianos
I Para provar a existência, basta mostrar que um jogo Bayesiano

estático finito existe um EN Bayesiano em estratégias mistas.
I A prova se aproxima bastante da prova da existência de um
EN com estratégias mistas em jogos finitos de completa
informação.
I Aplicações: leilões selados de primeiro preço
Caracterı́sticas
I Para entender a estrutura dinâmica do jogo usaremos a forma
extensiva de representação.
I A questão central em todos os jogos dinâmicos é a
credibilidade de uma estratégia do jogador
I As caracterı́sticas do jogo com informação completa e
perfeita:
(i) o movimento ocorrem em sequência - o jogador 1 escolhe a
ação a1 ; o jodador 2 observa a1 e então escolhe a2
(ii) todos os anteriores movimentos são observados antes do
próximo movimento
(iii) os payoffs (u1 (a1 , a2 ) e u2 (a1 , a2 )) dos jogadores de cada
combinação viável dos movimentos são de comum
conhecimento
I Ilustraremos com um exemplo em que o conceito de EN não
será suficiente para eliminar estratégias não crı́veis.
I Introduziremos um novo conceito de Equilı́brio de Nash
Perfeito em Subjogos
Exemplo: Jogo de predação
Jogo sequencial
Firma E
Fora Entra
Firma I
(uE,uI) (0,2)
Briga Acomoda
(-3,-1) (2,1)
Firma I
Briga Acomoda
se Firma E joga Entra se Firma E joga Entra
Fora 0,2 0,2
Firma E
Dentro -3,-1 2,1
Indução reversa
I Resolvemos o jogo por indução reversa.
I Quando o jogador 2 começa o movimento na segunda etapa
do jogo, terá o seguinte problema, dado a ação a1
previamente escolhida pelo jogador 1
max u2 (a1 , a2 )
a2
Assuma que para cada a1 o prob de otimização do jogador 2

tem um única solução denotada por R2 (a1 ) (função reação ou
melhor resposta)
I O jogador 1 antecipa a função reação e seu problema será:
max u1 (a1 , R2 (a1 ))

a1
Assuma que tenha uma única solução a∗1

I Chamaremos de (a∗1 , R2 (a∗1 )) o resultado da indução reversa.
Indução reversa e racionalidade sequencial
I O resultado da indução reversa não envolve ameaças não

crı́veis: o jogador 1 antecipa que o jogador 2 responderá
otimamente para qualquer ação a1
I Exemplo: Duopólio de Stackelberg
I A Indução reversa está relacionada com a ideia de
racionalidade sequencial, pois assegura que as estratégias dos
jogadores especificam o comportamento ótimo para todo o nó
de decisão do jogo
I O Exemplo do jogo de predação faz parte de uma classe geral
de jogos finitos com informação perfeita
I Consideraremos outro exemplo no qual sugere como podemos
identificar EN que satisfaça o princı́pio da racionalidade
sequencial em jogos com informação imperfeita
Exemplo: Jogo de predação com movimento simultâneo
Jogo sequencial
Firma E
Fora Entra
Firma E
(0,2)
Briga Acomoda
Firma I
Briga Acomoda
Briga Acomoda
(-3,-1) (1,-2) (-2,-1) (3,1)

Equilı́brio de Nash Perfeito em Subjogos
I Um subjogo da forma extensiva é um subconjunto de jogo

contendo as seguintes propriedades:
(i) começa com um nó de decisão n que é um conjunto de
informação único
(ii) inclui toda a decisão e nós terminais seguindo n na árvore
do jogo
(iii) não corta algum conjunto de informação
Definição:
Um Equilı́brio de Nash é perfeito em subjogos se as estratégias dos
jogadores constituem um Equilı́brio de Nash em todo subjogo
Equilı́brio de Nash Perfeito em Subjogos
I Podemos mostrar que um jogo finito dinâmico com completa

informação tem um EN perfeito em subjogos (ENPS)
I O argumento por construção é baseado em duas observações:
(i) O teorema de Nash se aplica para todos finitos jogos de
informação completa e estes jogos podem ser estáticos ou
dinâmicos
(ii) Um jogo dinâmico finito com completa informação tem
um número finito de subjogos, em que cada satisfaz as
hipóteses do teorema de Nash
I Note que qualquer ENPS é um EN (desde que o jogo com um
todo é um subjogo), mas nem todo EN é perfeito subjogo
Jogo de predação modificado
Jogo sequencial
Firma E
Fora Entra2
Entra1
Firma I
(0,2)
Briga Acomoda
Briga Acomoda
(-1,-1) (3,0) (-1,-1) (2,1)
I ENPS pode falhar para assegurar racionalidade sequencial

I Introduzimos o conceito de Equilı́brio Bayesiano perfeito
Equilı́brio Bayesiano perfeito
I Um equiı́brio Bayesiano perfeito consiste de estratégias e

crenças safisfazendo os seguintes requerimentos:
(1) Para cada conjunto de informação, o jogador com o
movimento deve ter uma crença sobre qual nó no conjunto de
informação tem sido alcançado pelo jogo. Para um conjunto
de informação não único, a crença é a distribuição de
probabilidade sobre os nós no conjunto de informação, para um
conjunto de informação único, a crença tem probabilidade um
no único nó de decisão
(2) Dada as suas crenças a estratégia do jogador deve ser
sequencialmente racional
(3) Para os conjuntos de informações na trajetória de equilı́brio,
crenças são determinadas pela regra de Bayes e as estratégias
de equilı́brio dos jogadores
(4) Para os conjuntos de informações na trajetória de equilı́brio,
crenças são determinadas pela regra de Bayes e as estratégias
de equilı́brio dos jogadores onde possı́vel

Aula7 2015

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula7 2015

Enviado por

Direitos autorais:

Formatos disponíveis

TEORIA DOS JOGOS NÃO COOPERATIVOS

I Teoria dos jogos é o estudo da interação dos tomadores de

Cara Coroa Cara Coroa

Jogador 2 Jogador 2 Jogador 2

Cara Coroa Cara Coroa Cara Coroa Cara Coroa

(-1,+1) (+1,-1) (+1,-1) (-1,+1) (-1,+1) (+1,-1) (+1,-1) (-1,+1)

(Payoff J1,Payoff J2) (Payoff J1,Payoff J2)

I Inicialmente analisamos jogos :

I Exitem n-jogadores e um arbitrário jogador i

I Primeiro passo: jogadores racionais não jogarão uma

ui (s−i , s0i ) < ui (s−i , s00i )

I Fazendo apenas o procedimento de eliminação de

I Usaremos um conceito para solução mais forte que é o

ui (s∗−i , s∗i ) ≥ ui (s∗−i , si )

para cada estratégia viável si ∈ Si , isto é, s∗i resolve:

maxsi ∈Si ui (s∗−i , si )

Jogo de combinar moedas

I Podemos extender a definição de EN considerando que os

I Para extender a definição de equilı́brio de Nash requeremos

I Em aplicações econômicas podemos ter jogos no qual as

I Se (i) e (ii) se mantém, então a melhor resposta

I No jogo estático Bayesiano

Isto é, o jogador não quer trocar sua estratégia, mesmo se as

I Para provar a existência, basta mostrar que um jogo Bayesiano

Assuma que para cada a1 o prob de otimização do jogador 2

max u1 (a1 , R2 (a1 ))

Assuma que tenha uma única solução a∗1

I O resultado da indução reversa não envolve ameaças não

(-3,-1) (1,-2) (-2,-1) (3,1)

I Um subjogo da forma extensiva é um subconjunto de jogo

I Podemos mostrar que um jogo finito dinâmico com completa

(-1,-1) (3,0) (-1,-1) (2,1)

I ENPS pode falhar para assegurar racionalidade sequencial

I Um equiı́brio Bayesiano perfeito consiste de estratégias e

Você também pode gostar