Escolar Documentos
Profissional Documentos
Cultura Documentos
Definição
Formalmente, temos que um jogo em forma extensa com informação perfeita é
um vetor Γ = (N, M, H, P, fc , {ui : i ∈ N}), onde
N é um conjunto que consiste dos agentes participando do jogo.
M é um conjunto cujos elementos são os movimentos ou ações
disponíveis aos jogadores ou a chance durante o jogo.
H é um conjunto de seqüências de movimentos (elementos de M) que é
fechado com relação a prefixos, isto é, se h ∈ H e h′ for um prefixo de h,
então h′ ∈ H.a Além disso, se ha1 , . . . aK i ∈ H para todo inteiro finito K ,
então (an )∞
n=1 ∈ H. Denotaremos por X (h) o conjunto de prefixos de h.
a
Um prefixo de uma seqüência (xn ) de comprimento K é qualquer
subseqüência de (xn ) que consiste dos primeiros l ≤ K termos de (xn ). Por
exemplo, se h = hm5 , m8 , m1 i os prefixos de h são hi,hm5 i,hm5 , m8 i, e
hm5 , m8 , m1 i.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Definição
Intuitivamente, cada membro de H é uma possível história do jogo. Podemos
identificar nós em uma árvore com histórias em H. Cada nó n é caracterizado
por uma seqüência de ações necessárias para atingirmos n. Uma trajetória
completa em H é uma história terminal, uma que não é prefixo estrito de
nenhuma outra história em H. Seja Z o conjunto de trajetórias completas de
H. Seja Mh = {m ∈ M : h · hmi ∈ H} (onde utilizamos · para denotar
concatenação de seqüências); Mh é o conjunto de ações que podem ser
tomadas após a história h.
Definição
fc é um função que associa a cada história em que P(h) = c uma medida
de probabilidade fc (· | h) em Mh . Intuitivamente, fc (· | h) descreve uma
distribuição de probabilidade sobre as ações disponíveis para a natureza
uma vez que a história h é atingida.
ui : Z → IR é a função utilidade para o jogador i, que associa um número
real (utilidade de i) para cada trajetória completa do jogo.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
No jogo da Figura 1, temos
N = {A, B}, H = {h i, hdownA i, hacrossA i,
hacrossA , downB i, hacrossA , acrossB i},
P(h i) = A, P(hacrossA i) = B,
uA (hdownA i) = uB (hdownA i) = 1,
uA (hacrossA , acrossB i) = 0,
uB (hacrossA , acrossB i) = 2,
uA (hacrossA , downB i) = 2, e
uB (hacrossA , downB i) = 3.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Competição de Stackelberg
Exemplo
Suponha que uma firma 1 desenvolve uma nova tecnologia antes que uma
firma 2 e como conseqüência tem a oportunidade de construir uma fábrica e
escolher um nível de produção q1 antes que a firma 2 comece sua produção. A
firma 2 então observa a escolha da firma 1 antes de escolher seu nível de
produção q2 . Por exemplo, assuma que qi ∈ {0, 1, 2}, que o preço de mercado
é dado por p(q1 , q2 ) = 3 − q1 − q2 , e que o custo de produção é zero. As
firmas são obrigadas a vender toda a produção pelo preço de mercado pois não
possuem local para armazenagem e a destruição de produtos tem um custo
muito elevado.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Competição de Stackelberg
Exemplo
Deste modo temos que:
N = {1, 2}, H = {h i, h0i, h1i, h2i, h0, 0i, h0, 1i, h0, 2i, h1, 0i, h1, 1i,
h1, 2i, h2, 0i, h2, 1i, h2, 2i},
P(h i) = 1, P(h0i) = P(h1i) = P(h2i) = 2,
u1 (h0, q2 i) = u1 (h1, 2i) = u1 (h2, 1i) = 0,
u1 (h1, 0i) = u1 (h2, 0i) = 2,
u1 (h1, 1i) = u2 (h1, 1i) = 1,
u1 (h2, 2i) = u2 (h2, 2i) = −2,
u2 (hq1 , 0i) = u2 (h1, 2i) = u2 (h2, 1i) = 0, e
u2 (h0, 1i) = u2 (h0, 2i) = 2.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Estratégias
Definição 2.1
Uma ação para um jogador é uma opção disponível que pode escolher após
uma determinada história do jogo, onde uma história do jogo é uma
sequência de ações realizadas pelos jogadores no passado e pelo jogador
chance. Por exemplo, definição da capacidade instalada, quantidade de
recursos destinados ao marketing, preços, etc.
Definição 2.2
Uma estratégia pura para o jogador i em um jogo em forma extensa com
informação perfeita é uma função si que associa cada história h ∈ Hi um
elemento de Mh , ou seja, uma ação disponível para i em h.
Definição 2.3
Se Ci é o conjunto de estratégias puras para o jogador i em um jogo em
forma extensa com informação perfeita, uma estratégia mista para o
jogador i em um jogo em forma extensa é uma distribuição de
probabilidade δi em Ci , ou seja, um elemento de ∆(Ci ).
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Estratégia Comportamental
Para jogos em forma extensa com informação perfeita existe uma outra noção
de estratégia, chamada de estratégia comportamental, que especifica uma
randomização independente para cada história em que o jogador se move.
Definição 2.4
Uma estratégia comportamental para o jogador i em um jogo em forma
extensa com informação perfeita é uma função σi que associa cada história
h ∈ Hi um elemento de ∆(Mh ), ou seja, uma distribuição de probabilidade
sobre as ações disponíveis para i em h.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Observação
Exemplo
Forma Normal
Forma Normal
Forma Normal
Forma Normal
Forma Normal
Definição
Definição 3.1
A representação em forma normal de um jogo em forma extensa com
informação perfeita Γ = (N, M, H, P, fc , {vi : i ∈ N}) é o jogo em forma
normal Γn = (N, {Ci : i ∈ N}, {ui : i ∈ N}), onde Ci são as estratégias puras
do jogador i em Γ e para todo s ∈ ×i ∈N Ci , temos
X
ui (s) = Prs (z)vi (z),
z∈Z
Exemplo
C D
AE 1,1 1,1
AF 1,1 1,1
BE 0,3 2,2
BF 0,3 1,4
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
C D
A 1,1 1,1
BE 0,3 2,2
BF 0,3 1,4
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
D E
A 6,0 6,0
B 0,8 8,0
C 3,4 7,0
Representação Multiagente
Definição 3.2
A representação multiagente de um jogo em forma extensa com informação
perfeita Γ = (N, M, H, P, fc , {vi : i ∈ N}) é o jogo em forma normal
Γn = (HN , {Mh : h ∈ HN }, {uh : h ∈ HN }), onde relembrando se h ∈ Hi ,
temos que Mh são as ações disponíveis ao jogador i após história h. Para
todo perfil de estratégias de Γn , t ∈ ×h∈HN Mh , seja s t um perfil de
estratégias de Γ tal que para todo j ∈ N e h ∈ Hj temos sjt (h) = th . Então,
se h ∈ Hi , uhP
: ×a∈HN Ma → IR é uma função utilidade para um jogador h tal
que uh (t) = z∈Z Prs t (z)vi (z).
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
Exemplo
C D
A 1,1,1 1,1,1
B 0,3,0 2,2,2
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
C D
A 1,1,1 1,1,1
B 0,3,0 1,4,1
Equilíbrio de Nash
Definição 4.1
Dado um jogo em forma extensa com informação perfeita
Γ = (N, M, H, P, fc , {vi : i ∈ N}), um perfil de estratégias s é um equilíbrio
de Nash em estratégias puras de G se, e somente se,
X
ui (s) = Prs (z)vi (z)
z∈Z
X
≥ ui (s−i , di ) = Pr(s−i ,di ) (z)vi (z)
z∈Z
Equilíbrio de Nash
Definição 4.2
Dado um jogo em forma extensa com informação perfeita
Γ = (N, M, H, P, fc , {vi : i ∈ N}), um perfil de estratégias δ é um equilíbrio
de Nash em estratégias mistas de G se, e somente se,
X X
ui (δ) = δ(s) Prs (z)vi (z)
s∈C z∈Z
X X
≥ ui (δ−i , βi ) = δ−i (s−i )βi (si ) Prs (z)vi (z)
s∈C z∈Z
Equilíbrio de Nash
Definição 4.3
Dado um jogo em forma extensa com informação perfeita
Γ = (N, M, H, P, fc , {vi : i ∈ N}), um perfil de estratégias σ é um equilíbrio
de Nash em estratégias comportamentais de G se, e somente se,
X
ui (σ) = Prσ (z)vi (z)
z∈Z
X
≥ ui (σ−i , τi ) = Pr(σ−i ,τi ) (z)vi (z)
z∈Z
Exemplo
Exemplo 4.4
No jogo do Exemplo 13, temos que (A, C , E ), (A, C , F ), e (A, D, F ) são os
únicos equilíbrios de Nash em estratégias puras.
Exemplo
Exemplo
Neste jogo temos que (downA ,acrossB ) é um equilíbrio de Nash do jogo. Neste
equilíbrio, jogador A escolhe downA por que ele pensa que o jogador B
escolherá acrossB . Então, a ameaça do jogador B de jogar acrossB faz com que
o jogador A escolha downA . Note que neste equilíbrio esta ameaça nunca se
concretiza, pois o jogador B não tem chance de escolher. Contudo, se o
jogador B em algum caso tivesse oportunidade de participar deste jogo, temos
que ele não cumpriria sua ameaça, pois lhe é vantajoso escolher downB .
Portanto, a ameaça do jogador B é inacreditável. Isto sugere que devemos
apenas considerar um subconjunto dos equilíbrios de Nash que não são
baseados em ameaças inacreditáveis. O próximo conceito de solução é
conhecido como equilíbrio de subjogo perfeito e impede que equilíbrios
contenham ameaças inacreditáveis.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Definição de Subjogo
Um subjogo G de um jogo em forma extensiva
Γ = (N, M, H, P, fc , {vi : i ∈ N}) é um outro jogo em forma extensiva que
satisfaz:
1 O conjunto de histórias H G em G consiste de uma única história em H e
todos as histórias subseqüentes a h;
2 A distribuição de probabilidade sobre as ações da natureza em G são as
mesmas das correspondentes ações em Γ;
3 A utilidades de trajetórias completas em G são as mesmas utilidades das
correspondentes trajetórias completas em Γ.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Definição de Subjogo
Definição 5.1
Um perfil de estratégia (puro, misto, ou comportamental) s ∗ é um equilíbrio
de subjogo perfeito em estratégias (puras, mistas, ou comportamentais,
respectivamente) de Γ se ele for equilíbrio de Nash em estratégias (puras,
mistas, ou comportamentais, respectivamente) de todo subjogo de Γ.
Indução Reversa
Indução Reversa
Indução Reversa
É fácil ver que como o jogo é finito, após um número finito de iterações o
algoritmo acima descrito produzirá um equilíbrio de subjogo perfeito em
estratégias puras. Desta forma, provamos construtivamente o seguinte teorema:
Teorema 5.2
Qualquer jogo em forma extensiva com informação perfeita finito tem um
equilíbrio de subjogo perfeito puro.
Exemplo 5.3
No jogo do Exemplo 13, temos que (A, C , E ) é o único equilíbrio de subjogo
perfeito.
Exemplo 5.4
No jogo do Exemplo 31, temos que (acrossA ,downB ) é o único equilíbrio de
subjogo perfeito.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Definição
Exemplo
Exemplo
Na maior parte deste curso, como na maioria dos trabalhos em teoria dos
jogos, nós assumimos que jogadores têm memória perfeita: eles recordam de
todas as ações que eles tomaram e de todos os conjuntos de informação pelos
quais eles passaram. Formalmente, vamos requerer que
se h e h′ estão no mesmo conjunto de informação do jogador i e h1 é um
prefixo de h tal que P(h1 ) = i, então existe um prefixo h1′ de h′ tal que
h1 e h1′ estão no mesmo conjunto de informação; além disso, se h1 · hmi
for um prefixo de h (de forma que m foi a ação realizada quando h1 foi
atingida na história h), então h1′ · hmi é um prefixo de h′ (portanto, i
lembra que ele realizou ação m).
Podemos ver um jogo extenso com informação perfeita como um caso
particular do jogo extenso com informação imperfeita onde todos os conjuntos
de informação contém uma única história. É fácil verificar que em todo jogo
com informação perfeita, todos os jogadores têm memória perfeita.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Memória Imperfeita
Exemplos
Observações
Apesar de não ter recebido muita atenção da literatura, jogos com memória
imperfeita tem tido cada vez mais aplicações principalmente quando estamos
tratando de agentes computacionais que possuem memória finita e têm de
realizar uma dada escolha repetidas vezes. Eventualmente, tais agentes não se
recordam das ações que eles realizaram no passado, ou que conjuntos de
informação eles já visitaram. Existem outras situações onde também modelos
de jogos com memória imperfeita parecem ser razoáveis. Suponha, por
exemplo, que queremos modelar uma partida de xadrez. Parece razoável supor
que os jogadores não necessariamente se lembram de todas as jogadas
efetuadas ao longo da partida e em que ordem elas foram executadas.
A análise de jogos com memória imperfeita envolve sutilezas fora do escopo
deste curso. Portanto, no que se segue estaremos sempre assumindo jogos com
memória perfeita, exceto quando mencionarmos explicitamente o contrário.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Estratégias
Definição 6.1
Uma estratégia pura para o jogador i em um jogo em forma extensa com
informação imperfeita é uma função si que associa cada conjunto de
informação Ii do jogador i um elemento de MIi , ou seja, uma ação
disponível para i quando se move no conjunto de informação Ii .
Definição 6.2
Se Ci é o conjunto de estratégias puras para o jogador i em um jogo em
forma extensa com informação imperfeita, uma estratégia mista para o
jogador i em um jogo em forma extensa é uma distribuição de
probabilidade δi em Ci , ou seja, um elemento de ∆(Ci ).
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Estratégias
Definição 6.3
Uma estratégia comportamental para o jogador i em um jogo em forma
extensa com informação imperfeita é uma função σi que associa cada
conjunto de informação Ii do jogador i um elemento de ∆(MIi ), ou seja,
uma distribuição de probabilidade sobre as ações disponíveis para i quando
se move no conjunto de informação Ii .
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Estratégias
Exemplo
No jogo do Exemplo 40, temos que o jogador 1 possui 12 estratégias puras:
AFH, AFI , AGH, AGI , BFH, BFI , BGH, BGI , CFH, CFI , CGH, e CGI . O
jogador 2 possui 2 estratégias puras: D e E .
Observação
Eventualmente, abusaremos um pouco da notação e para todo h ∈ I , usaremos
si (h) e σi (h) para denotar as ações escolhidas pelas estratégias si e σi no
conjunto de informação I .
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Nosso objetivo nesta seção é provar que para jogos extensivos com informação
imperfeita finitos onde os jogadores possuem memória perfeita, existe uma
equivalência entre estratégias mistas e comportamentais. Antes de enunciarmos
e provarmos a equivalência, precisamos de duas definições.
Definição 6.4
Definem-se duas estratégias (mistas ou comportamentais) de um dado
jogador como equivalentes em utilidade, se para qualquer coleção de
estratégias puras para os demais jogadores, as duas estratégias induzem a
mesma distribuição de probabilidade sobre as histórias terminais do jogo.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Definição 6.5
Para qualquer história h, temos que uma estratégia pura si para o jogador i é
consistente com h, se para todo prefixo h′ · hmi de h, onde P(h′ ) = i, temos
que si (h′ ) = m. Intuitivamente, si é consistente com h se existe algum perfil
de estratégias puras dos outros jogadores que juntamente com si tornem
possível que a história h seja atingida com probabilidade positiva. No
Exemplo do Jogo com Informação Imperfeita visto anteriormente, temos
que a estratégia BGH do jogador i é consistente com a história hB, Di, mas
não é consistente com a história hB, E , F i nem com a história hC , E i. Seja
Ci (h) o conjunto de estratégias puras do jogador i consistentes com a
história h.
Teorema 6.6
Se em um jogo em forma extensiva finito, não existe falta de memória sobre se o
jogador já realizou ou não uma dada ação, então temos que toda estratégia
comportamental de um jogador tem uma estratégia mista equivalente em
utilidade.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Prova
Prova
Por outro lado, para uma estratégia pura si temos que Pr(si ,t−i ) (h) = 0 se
/ Ci (h) e, em caso contrário temos:
si ∈
fc (m|h′ ).
Y
Pr(si ,t−i ) (h) =
h′ ∈Hc ,
h′ ·hmi∈X (h)
Prova
X
Pr(δi ,t−i ) (h) = δ(si )Pr(si ,t−i ) (h)
si ∈Ci
fc (m|h′ )
X Y Y
= σi (I )(si (I ))
si ∈Ci (h) I ∈Ii ′
h ∈Hc ,
h′ ·hmi∈X (h)
fc (m|h′ )
Y X Y
= σi (I )(si (I ))
h′ ∈Hc , si ∈Ci (h) I ∈Ii
h′ ·hmi∈X (h)
fc (m|h′ )
Y X Y Y
= ( σi (I )(si (I )) σi (I )(si (I )))
h′ ∈Hc , si ∈Ci (h) I ∈Ii , I ∈Ii ,
h′ ·hmi∈X (h) X (h)∩I 6=∅ X (h)∩I =∅
Prova
onde
, se h ∈
P Q
si ∈Ci (h) I ∈Ii , σi (I )(si (I )) / Hi
X (h)∩I
Q=∅
A(h) =
, se h ∈ Hi
P
si ∈Ci (h) σi (h)(si (h)) I ∈Ii , σi (I )(si (I ))
X (h)∩I =∅
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Prova
Como a única restrição para uma estratégia pura si pertencer a Ci (h) é que ela
especifique uma ação que leve a história h em qualquer prefixo estrito de h
onde o jogador i se move, então temos que essas estratégias podem especificar
qualquer ação nos conjuntos de informação para o jogador que contém h ou
que não contenham prefixos de estritos de h. Desta forma rearrumando os
termos dos somatório podemos reescrever:
, se h ∈
Q P
I ∈Ii , a∈MI σi (I )(a) / Hi
X (h)∩I =∅
A(h) =
, se h ∈ Hi
P Q P
( a∈M σi (h)(a)) I ∈Ii , a∈MI σi (I )(a)
h
X (h)∩I =∅
= 1.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Prova
Portanto,
Exemplo
1/2, se h = hAi
1/4, se h = hBi ou h = hC i ou h = hB, Di
Pr(σ1 ,D) = Pr(δ1 ,D) (h) =
ou h = hC , Di
0, caso contrário
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
1/2, se h = hAi
1/4, se h = hBi ou h = hC i ou h = hB, E i
Pr(σ1 ,E ) = Pr(δ1 ,E ) (h) =
ou h = hC , E i ou h = hB, E , G i ou h = hC , E , Hi
0, caso contrário
Representação Mista
Dada uma estratégia comportamental σi para o jogador i. A estratégia mista
δi que dá probabilidade I ∈Ii σi (I )(si (I )) a estratégia pura si é chamada uma
Q
representação mista de σi .
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Para ver um exemplo da necessidade da hipótese que o jogo não pode ter falta
de memória se um jogador já realizou ou não uma ação para encontrarmos uma
estratégia mista equivalente considere o seguinte exemplo.
Exemplo
Exemplo
A Recíproca
Teorema 6.7
Para qualquer estratégia mista de um jogo extensivo finito com memória
perfeita, existe uma estratégia comportamental equivalente em utilidade.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Prova
Seja δi uma estratégia mista para o jogador i. Para qualquer história h, seja
X
πi (h) = δ(si ),
si ∈Ci (h)
Prova
Prova
Prova
Finalmente, considere o caso em que πi (h) > 0. Por definição, temos que
πi (h′ ) > 0, ∀h′ ∈ X (h). Note ainda que se h′ é o primeiro prefixo de h no qual
o jogador i se move, temos que πi (h′ ) = 1, e que se h′ · hmi e h′′ são dois
prefixos de h tais que o jogador i se move em h′ e h′′ , e não existe nenhum
outro prefixo de h entre h′ e h′′ no qual i se move, então πi (h′ · hmi) = πi (h′′ ).
Além disso, se h3 e h4 são dois prefixos de h tal que o jogador i não se move
entre h3 e h4 , temos que πi (h3 ) = πi (h4 ). Então, temos que:
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Prova
πi (h′ · hmi)
fc (m|h′ ))
Y Y
=( )(
′
πi (h′ ) ′
h ∈Hi , h ∈Hc ,
h′ ·hmi∈X (h) h′ ·hmi∈X (h)
fc (m|h′ ))
Y
= πi (h)(
h′ ∈Hc ,
h′ ·hmi∈X (h)
fc (m|h′ ))
X Y
=( δ(si ))(
si ∈Ci (h) ′
h ∈Hc ,
h′ ·hmi∈X (h)
X
= δ(si )Pr(si ,t−i ) (h) = Pr(δi ,t−i ) (h)
si ∈Ci (h)
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
Exemplo
Definição 6.8
A representação multiagente de um jogo em forma extensa com informação
imperfeita Γ = (N, M, H, P, fc , {Ii : i ∈ N}, {vi : i ∈ N}) é o jogo em forma
normal Γn = ({I : I ∈ ∪i ∈N Ii }, {MI : I ∈ ∪i ∈N Ii }, {uI : I ∈ ∪i ∈N Ii }), onde
relembrando se I ∈ Ii , temos que MI são as ações disponíveis ao jogador i
no conjunto de informação I . Para todo perfil de estratégias de Γn ,
t ∈ ×J∈∪i ∈N Ii MJ , seja s t um perfil de estratégias de Γ tal que para todo
j ∈ N e J ∈ Ij temos sjt (J) = tJ . Então, uI : ×J∈∪i ∈N Ii MP J → IR é uma
função utilidade para um jogador I ∈ Ii tal que uI (t) = z∈Z Prs t (z)vi (z).
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
Exemplo
Equilíbrio de Nash
Definição 6.9
Dado um jogo em forma extensa com informação imperfeita
Γ = (N, M, H, P, fc , {Ii : i ∈ N}, {vi : i ∈ N}), um perfil de estratégias s é
um equilíbrio de Nash em estratégias puras de Γ se, e somente se,
X
ui (s) = Prs (z)vi (z)
z∈Z
X
≥ ui (s−i , di ) = Pr(s−i ,di ) (z)vi (z)
z∈Z
Equilíbrio de Nash
Definição 6.10
Dado um jogo em forma extensa com informação imperfeita
Γ = (N, M, H, P, fc , {Ii : i ∈ N}, {vi : i ∈ N}), um perfil de estratégias δ é
um equilíbrio de Nash em estratégias mistas de Γ se, e somente se,
X X
ui (δ) = δ(s) Prs (z)vi (z)
s∈C z∈Z
X X
≥ ui (δ−i , βi ) = δ−i (s−i )βi (si ) Prs (z)vi (z)
s∈C z∈Z
Equilíbrio de Nash
Definição 6.11
Dado um jogo em forma extensa com informação imperfeita
Γ = (N, M, H, P, fc , {Ii : i ∈ N}, {vi : i ∈ N}), um perfil de estratégias σ é
um equilíbrio de Nash em estratégias comportamentais de Γ se, e somente
se,
X
ui (σ) = Prσ (z)vi (z)
z∈Z
X
≥ ui (σ−i , τi ) = Pr(σ−i ,τi ) (z)vi (z)
z∈Z
Equilíbrio Sequencial
Equilíbrio Sequencial
Equilíbrio Sequencial
Equilíbrio Sequencial
Podemos agora enunciar dois importantes teoremas que justificam que esta é
uma noção razoável de equilíbrio.
Teorema 6.12
Se (σ, µ) for um equilíbrio sequencial de um jogo em forma extensiva com
memória perfeita, então σ é um equilíbrio de Nash em estratégias
comportamentais do jogo.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Prova
Prova
Prova
Consideremos agora dois casos. Primeiro, se h∈I ∗ Pr(σ−i ,τi ) (h) = 0, neste
P
caso temos então que ui (σ−i , τi∗ ) = ui (σ−i , τi ) > ui (σ). Segundo, suponha que
h∈I ∗ Pr(σ−i ,τi ) (h) > 0. Como temos um jogo com memória perfeita, para
P
qualquer estratégia ρ, temos que para qualquer h ∈ I , onde I ∈ Ii ,
Prρ (h)
P
h∈IPrρ (h)
Prova
Logo,
h∈I ∗ h∈I ∗
Prova
Portanto,
Teorema 6.13
Para todo jogo finito em forma extensiva com memória perfeita, o conjunto de
avaliações que são equilíbrio sequencial é não vazio.
Exemplo
Exemplo
Exemplo
Exemplo
É fácil ver que µ(1.1)(h0, 95i) = 0, 95 e µ(1.1)(h0, 05i) = 0, 05. Além disso,
racionalidade sequencial implica que σ2 (2.2)(o) = 1. Vamos então considerar
os possíveis suportes de σ1 (1.2). Existem três suportes possíveis para
considerar: hmi, hni, hm, ni. A utilidade esperada para o jogador 1 de escolher
n no conjunto de informação 1.2 é
8µ(1.2)(h0, 05, g i) + 3(1 − µ(1.2)(h0, 05, g i)), enquanto a utilidade esperada
de escolher m é 4. Consistência entre µ e σ implica que:
0, 05σ1 (1.1)(g )
µ(1.2)(h0, 05, g i) =
0, 05σ1 (1.1)(g ) + 0, 95σ1 (1.1)(g )σ2 (2.1)(h)
1
= .
1 + 19σ2 (2.1)(h)
Note que mesmo que σ1 (1.1)(g ) = 0, consistência implica a mesma fórmula
acima.
Informação Perfeita Estratégias Representação Equilíbrio de Nash Subjogo Perfeito Informação Imperfeita
Exemplo
Exemplo
Exemplo
Exemplo
Portanto, σ1 (1.1)(g ) = 1.
Observe que se tivéssemos um jogo onde o jogador chance só tivesse a opção
de escolher a alternativa superior, então no único equilíbrio sequencial do jogo,
os jogadores escolheriam f , i, m, o, com probabilidade 1. Este exemplo, serve
para ilustrar o importante papel que pequenas incertezas no jogo podem gerar
no equilíbrio.
Observação
Vimos alguns refinamentos de equilíbrios de Nash para jogos em forma extensa.
A seguir, analisaremos refinamentos de equilíbrio de Nash também para jogos
em forma normal.