Escolar Documentos
Profissional Documentos
Cultura Documentos
i i
2017/2/2
page 1
i i
Gilmar Garbugio
Universidade Federal Fluminense
Brı́gida Sartini
Universidade Federal Rural do Rio de Janeiro
VERSÃO 1.1.2
2 de fevereiro de 2017
i i
i i
“tdj”
i i
2017/2/2
page 2
i i
Aos meus pais Orlando e Iraci e aos meus irmãos Roseli, Rosinei,
Rosana, Carla, Andréia e Reginaldo.
G. G.
i i
i i
“tdj”
i i
2017/2/2
page 3
i i
i i
i i
“tdj”
i i
2017/2/2
page 1
i i
Sumário
Prefácio 3
i i
i i
“tdj”
i i
2017/2/2
page 2
i i
2 Sumário
6 Exemplos 120
6.1 O jogo Le Her simplificado . . . . . . . . . . . . . . . . 120
6.2 O modelo de duopólio de Cournot . . . . . . . . . . . 126
6.3 O modelo de duopólio de Bertrand . . . . . . . . . . . 129
6.4 O modelo de duopólio de Stackelberg . . . . . . . . . . 131
6.5 A tragédia dos comuns . . . . . . . . . . . . . . . . . . 133
A Convexidade 137
Bibliografia 173
Índice 183
i i
i i
“tdj”
i i
2017/2/2
page 3
i i
Prefácio
A teoria dos jogos é uma teoria matemática criada para se modelar
fenômenos que podem ser observados quando dois ou mais “agentes de
decisão” interagem entre si. Ela fornece a linguagem para a descrição
de processos de decisão conscientes e objetivos envolvendo mais de
um indivı́duo.
Suas aplicações incluem eleições, leilões, balanço de poder, evolu-
ção genética, etc. Ela também é uma teoria matemática pura, que
pode e tem sido estudada como tal, sem a necessidade de relacioná-la
com problemas comportamentais ou jogos per se.
Algumas pessoas acreditam que a teoria dos jogos formará, algum
dia, o alicerce de um conhecimento técnico estrito de como decisões
são feitas e de como a economia funciona. A teoria ainda não atingiu
este patamar e, hoje, é mais estudada em seus aspectos matemáticos
puros e, em aplicações, ela é usada como uma ferramenta ou alegoria
que auxiliam no entendimento de sistemas mais complicados.
Neste texto trataremos da teoria matemática dos jogos não-coope-
rativos estáticos de informação completa e dos jogos dinâmicos de
informação perfeita.
A Teoria Econômica dos Jogos não deve ser confundida com a
Teoria Combinatória dos Jogos, iniciada por Sprague e Grundy na
década de 30. Enquanto que a primeira tem motivações predomi-
nante econômicas e procura estabelecer métodos para se maximizar
o ganho (payoff ), a segunda se concentra nos aspectos combinatórios
de jogos de mesa (por exemplo, a estratégia do jogo de nim) e não
permite “elementos imprevisı́veis” como o lançamento de um dado
ou o embaralhamento de cartas.
Acreditamos que o assunto seja estimulante para o estudante de
matemática: ele terá a oportunidade de ver como conceitos de análise,
i i
i i
“tdj”
i i
2017/2/2
page 4
i i
4 Prefácio
Agradecimentos 1
Gostarı́amos de agradecer a Hilmar Ilton Santana Ferreira, Polya-
ne Alves Santos e Larissa Santana Barreto, que participaram ativa-
mente dos seminários sobre teoria dos jogos realizados no perı́odo
2003-2004, momento no qual uma versão preliminar deste texto foi
escrita. Também gostarı́amos de agradecer a Rita de Cássia Silva
Costa, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, que
leram o texto e fizeram várias sugestões. Finalmente, gostarı́amos de
agradecer a Seção de Referência (SRE) da Divisão de Bibliotecas e
Documentação da PUC-Rio pela agilidade e eficiência na aquisição
de alguns artigos difı́ceis de se encontrar.
Agradecimentos 2
Gostarı́amos de agradecer às várias pessoas que, após a divulgação
da versão Creative Commons deste livro, colaboraram com sugestões:
Doherty Andrade, Carlos Frederico Palmeira.
1 de fevereiro de 2017
i i
i i
“tdj”
i i
2017/2/2
page 5
i i
Capı́tulo 1
Alguns marcos
históricos
i i
i i
“tdj”
i i
2017/2/2
page 6
i i
i i
i i
“tdj”
i i
2017/2/2
page 7
i i
i i
i i
“tdj”
i i
2017/2/2
page 8
i i
i i
i i
“tdj”
i i
2017/2/2
page 9
i i
i i
i i
“tdj”
i i
2017/2/2
page 10
i i
Capı́tulo 2
Jogos na forma
estratégica
10
i i
i i
“tdj”
i i
2017/2/2
page 11
i i
i i
i i
“tdj”
i i
2017/2/2
page 12
i i
i i
i i
“tdj”
i i
2017/2/2
page 13
i i
G = {homem, mulher},
Shomem = {futebol, cinema}, Smulher = {futebol, cinema},
S = Shomem × Smulher =
{(futebol, futebol), (futebol, cinema),
(cinema, futebol), (cinema, cinema)}.
i i
i i
“tdj”
i i
2017/2/2
page 14
i i
i i
i i
“tdj”
i i
2017/2/2
page 15
i i
i i
i i
“tdj”
i i
2017/2/2
page 16
i i
i i
i i
“tdj”
i i
2017/2/2
page 17
i i
u1 |S (1) e u2 |S (1) .
1 2
Para o novo jogo, vemos que as estratégias s11 e s14 são estritamente
dominadas pelas estratégias s12 e s13 , respectivamente. Logo, pode-
mos simplificar o jogo mais uma vez, considerando os conjuntos de
estratégias puras
(2) (2)
S1 = {s12 , s13 } e S2 = {s22 , s23 , s24 }.
i i
i i
“tdj”
i i
2017/2/2
page 18
i i
Definição 2.4
(a) (Dominância Fraca Iterada) Dominância fraca iterada
é o processo no qual, seqüencialmente, se eliminam as es-
tratégias que são fracamente dominadas.
(b) (Equilı́brio de Estratégia Fracamente Dominante)
Quando o processo de dominância fraca iterada reduz o jogo
para um único perfil de estratégias puras s∗ , dizemos que
s∗ é um equilı́brio de estratégia fracamente dominante.
i i
i i
“tdj”
i i
2017/2/2
page 19
i i
g2
s21 s22
s11 (1, 1) (1, 0) .
g1
s12 (1, 0) (0, 1)
g2
s21 s22
.
g1 s11 (1, 1) (1, 0)
g2
s21 s22 s23
s11 (0, 2) (0, 0) (1, 0) .
g1
s12 (0, 3) (1, 0) (0, 0)
i i
i i
“tdj”
i i
2017/2/2
page 20
i i
é um equilı́brio de Nash se
i i
i i
“tdj”
i i
2017/2/2
page 21
i i
Exemplo 2.5
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias
(confessar, confessar) é um equilı́brio de Nash. De fato:
i i
i i
“tdj”
i i
2017/2/2
page 22
i i
i i
i i
“tdj”
i i
2017/2/2
page 23
i i
definida por
MR : S → 2S
definida por
Exemplo 2.7
(a) No dilema do prisioneiro (Exemplo 2.1), temos
MRAl : SBob →→ SAl
confessar → {confessar}
negar → {confessar}
i i
i i
“tdj”
i i
2017/2/2
page 24
i i
i i
i i
“tdj”
i i
2017/2/2
page 25
i i
(1)
S = S1 × · · · × Sn S (1) = S1 × · · · × Sn(1)
(k)
· · · S (k) = S1 × · · · × Sn(k) .
s∗i ∈ Si
(l+1) (0)
para algum l = 0, . . . , k − 1 (se l = 0, defina Si = Si ).
Sem perda de generalidade, vamos supor que esta propriedade ocorre
pela primeira vez para o ı́ndice i, isto é, s∗i é a primeira estratégia do
perfil de estratégias
para todo s−i ∈ S−i . Como s∗i é a primeira estratégia a ser eliminada,
(l)
i i
i i
“tdj”
i i
2017/2/2
page 26
i i
∗
e dado que s∗ι ∈ Sι para todo ι = 1, . . . n
(l)
i , s−i ) ∈ S
Dado que (s[1] (k)
si = s∗i . Como (si , s∗−i ) também não pertence a S (k) , segue-se que a
[2] [2]
∗
si = si . Prosseguindo desta maneira, construirı́amos uma sequência
[3]
i i
i i
“tdj”
i i
2017/2/2
page 27
i i
g2
s21 s22 s23
s11 (−1, +1) (+1, −1) (−1, +1)
i i
i i
“tdj”
i i
2017/2/2
page 28
i i
x2
1
0 1 x1
Figura 2.1: Δ2 = (x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1 .
i i
i i
“tdj”
i i
2017/2/2
page 29
i i
x3
0 1 x2
1
x1
Figura 2.2: Δ3 = (x1 , x2 , x3 ) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 +
x2 + x3 = 1}.
(pi , p−i )
(sik , p−i )
i i
i i
“tdj”
i i
2017/2/2
page 30
i i
então
m1
m2 mn
ui (p) = ··· p1j1 · p2j2 · · · pnjn · ui (s1j1 , s2j2 , . . . , snjn ).
j1 =1 j2 =1 jn =1
(2.1)
Cuidado com o abuso de notação: estamos usando ui para representar
a função utilidade tanto em estratégias puras quanto em estratégias
mistas.
Como exemplo, considere o jogo de comparar moedas na pági-
na 22. Se g1 escolhe a distribuição de probabilidade p1 = (1/4, 3/4)
e g2 escolhe a distribuição de probabilidade p2 = (1/3, 2/3), então
os payoffs esperados associados ao perfil de estratégias mistas p =
(p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) são dados por
2
2
u1 (p) = p1j1 · p2j2 · u1 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 · p21 · u1 (s11 , s21 ) + p11 · p22 · u1 (s11 , s22 ) +
p12 · p21 · u1 (s12 , s21 ) + p12 · p22 · u1 (s12 , s22 )
1 1 1 2 3 1 3 2
= · · (+1) + · · (−1) + · · (−1) + · · (+1)
4 3 4 3 4 3 4 3
1
= +
6
i i
i i
“tdj”
i i
2017/2/2
page 31
i i
e, analogamente,
2
2
u2 (p) = p1j1 · p2j2 · u2 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 · p21 · u2 (s11 , s21 ) + p11 · p22 · u2 (s11 , s22 ) +
p12 · p21 · u2 (s12 , s21 ) + p12 · p22 · u2 (s12 , s22 )
1 1 1 2 3 1 3 2
= · · (−1) + · · (+1) + · · (+1) + · · (−1)
4 3 4 3 4 3 4 3
1
= − .
6
Em particular, se
mi
p∗i = (p∗i1 , . . . , p∗imi ) = p∗ik · ek , (2.3)
k=1
i i
i i
“tdj”
i i
2017/2/2
page 32
i i
g2
s21 s22
s11 (5, 3) (0, 0)
.
g1 s12 (0, 0) (5, 3)
i i
i i
“tdj”
i i
2017/2/2
page 33
i i
>
u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 2 · p21 + 2 · p22 = 2
g2
s21 s22
s11 (5, 3) (2, 0)
.
g1 s12 (2, 0) (5, 3)
i i
i i
“tdj”
i i
2017/2/2
page 34
i i
pois
u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 4 · p21 + 4 · p22 = 4
>
1 1 7 7 7
u1 (p1 , p2 ) = u1 , , 0; p21 , p22 = · p21 + · p22 =
2 2 2 2 2
(n) (n−1)
Si = {s ∈ Si | pi ∈ Δ(n−1)
mi tal que
(n−1)
∀s−i ∈ S−i , ui (pi , s−i ) > ui (s, s−i )}
A interseção
∞
Si∞ =
(n)
Si
n=0
i i
i i
“tdj”
i i
2017/2/2
page 35
i i
Δ∞
mi = {pi ∈ Δmi | pi ∈ Δmi
Note que Si(n) é o conjunto de estratégias puras em Si(n−1) que não são
estritamente dominadas pelas estratégias mistas em Δ(n−1)mi e que Δ(n)
mi
é o conjunto de estratégias mistas que dá probabilidades positivas
apenas para as estratégias puras em Si(n) .
S ∞ = {s∗ },
i i
i i
“tdj”
i i
2017/2/2
page 36
i i
Exemplo 2.10
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias
mistas
p∗ = (p∗1 , p∗2 ) = (1, 0; 1, 0)
é um equilı́brio de Nash, pois
s∗ = (confessar, confessar).
i i
i i
“tdj”
i i
2017/2/2
page 37
i i
MRi (p−i )
=
i i
i i
“tdj”
i i
2017/2/2
page 38
i i
definida por
com p ∈ Δ.
e, portanto, uHomem (p11 , p12 ; 1/2, 1/2) = 5 · p11 + (5/2) · p12 . Desta
maneira,
i i
i i
“tdj”
i i
2017/2/2
page 39
i i
cuja solução é (p∗11 , p∗12 ) = (1, 0). Sendo assim, MRHomem (1/2, 1/2) =
{(1, 0)}.
Δ2 = {(p, 1 − p) ∈ R2 | 0 ≤ p ≤ 1},
isto é, cada elemento de Δ2 pode ser identificado com um número real
no intervalo [0, 1]. Com isto, as funções de melhor resposta podem
ser reescritas de forma a depender de apenas de um número real. Por
exemplo, se o homem escolhe uma estratégia mista (p, 1 − p) ∈ Δ2 ,
qual é a melhor resposta da mulher a esta estratégia do homem?
Escrevendo as estratégias mistas da mulher na forma (q, 1 − q) ∈ Δ2 ,
vemos que
uMulher(p, 1 − p; q, 1 − q) = 15 pq + 10 − 10 q − 10 p
= 5 (3 p − 2) q + 10 (1 − p).
Sendo assim,
i i
i i
“tdj”
i i
2017/2/2
page 40
i i
(Mulher) q
(Futebol) 1
(Cinema)
0 2/3 1 p (Homem)
(Cinema) (Futebol)
uHomem (p, 1 − p; q, 1 − q) = 15 pq + 5 − 5 q − 5 p
= 5 (3 q − 1) p + 5 (1 − q),
de modo que
i i
i i
“tdj”
i i
2017/2/2
page 41
i i
(Homem) p
(Futebol) 1
(Cinema)
0 1/3 1 q (Mulher)
(Cinema) (Futebol)
i i
i i
“tdj”
i i
2017/2/2
page 42
i i
(Mulher) q
(Futebol) 1
1/3
(Cinema)
0 2/3 1 p (Homem)
(Cinema) (Futebol)
i i
i i
“tdj”
i i
2017/2/2
page 43
i i
Isto significa que o chefe deve escolher sua estratégia de acordo com
um gerador de números aleatórios com distribuição de probabili-
dade (3/4, 1/4) e o operador deve escolher sua estratégia de acordo
i i
i i
“tdj”
i i
2017/2/2
page 44
i i
Fiscalizar Trabalhar
chefe empregado
Jogos deste tipo têm sido usados para se estudar temas como controle
de armas ([03, 10, 83]), prevenção de crimes ([04]) e incentivos no
trabalho ([53]).
i i
i i
“tdj”
i i
2017/2/2
page 45
i i
i i
i i
“tdj”
i i
2017/2/2
page 46
i i
i i
i i
“tdj”
i i
2017/2/2
page 47
i i
i i
i i
“tdj”
i i
2017/2/2
page 48
i i
i i
i i
“tdj”
i i
2017/2/2
page 49
i i
para todo s−i ∈ S−i e, pelo menos para algum s•−i ∈ S−i ,
é um equilı́brio de Nash se
i i
i i
“tdj”
i i
2017/2/2
page 50
i i
2.6 Exercı́cios
[01] Use o processo de dominância estrita iterada para reduzir o jogo
cuja matriz de payoffs é dada abaixo.
i i
i i
“tdj”
i i
2017/2/2
page 51
i i
g2
s21 s22 s23 s24
s11 (3, 0) (1, 1) (5, 4) (0, 2)
C
c1 c2
l1 (3, 3) (0, 1)
L
l2 (1, 1) (2, 3)
Pede-se:
(a) Determinar se existe alguma estratégia estritamente domi-
nante para algum jogador.
(b) Determinar se existe algum equilı́brio de Nash (em estraté-
gias puras). Caso exista mais do que um equilı́brio, quantos
e quais são.
[03] A partir da matriz de payoffs a seguir para os jogadores L (li-
nhas) e C colunas,
C
c1 c2
l1 (3, 2) (4, 4)
L
l2 (1, 1) (9, 2)
determine:
i i
i i
“tdj”
i i
2017/2/2
page 52
i i
limite do que pode ser considerado seguro, para conseguir determinado desfecho.
i i
i i
“tdj”
i i
2017/2/2
page 53
i i
g2
desviar não desviar
desviar (2, 2) (1, 3) .
g1
não desviar (3, 1) (0, 0)
Pede-se:
(a) Determinar se existe alguma estratégia estritamente domi-
nante para algum jogador.
(b) Determinar se existe algum equilı́brio de Nash (em estraté-
gias puras). Caso exista mais do que um equilı́brio, quantos
e quais são.
i i
i i
“tdj”
i i
2017/2/2
page 54
i i
g2
brigar ameaçar
V −C V −C
brigar , (V, 0) .
g1 2 2
V V
ameaçar (0, V ) ,
2 2
i i
i i
“tdj”
i i
2017/2/2
page 55
i i
C
z1 z2 z3 z4
x1 (5, 0, 2) (1, 0, 1) (3, 0, 6) (1, 2, 1)
C
z1 z2 z3 z4
x1 (0, 1, 1) (0, 1, 2) (2, 1, 3) (0, 3, 9)
i i
i i
2017/2/2
page 56
i
i
“tdj”
i
i
[CAP. 2: JOGOS NA FORMA ESTRATÉGICA
Eixo
A B C D E F
1 (+13, −13) (+29, −29) (+ 8, − 8) (+12, −12) (+16, −16) (+23, −23)
2 (+18, −18) (+22, −22) (+21, −21) (+22, −22) (+29, −29) (+31, −31)
3 (+18, −18) (+22, −22) (+31, −31) (+31, −31) (+27, −27) (+37, −37)
Aliados
4 (+11, −11) (+22, −22) (+12, −12) (+21, −21) (+21, −21) (+26, −26)
5 (+18, −18) (+16, −16) (+19, −19) (+14, −14) (+19, −19) (+28, −28)
6 (+23, −23) (+22, −22) (+19, −19) (+23, −23) (+30, −30) (+34, −34)
Tabela 2.1: Análise da invasão da Europa na Normandia na Segunda Guerra Mundial.
56
i
i
i
i
“tdj”
i i
2017/2/2
page 57
i i
C
z1 z2 z3 z4
x1 (1, 2, 9) (2, 9, 9) (3, 7, 9) (2, 8, 9)
C
z1 z2 z3 z4
x1 (2, 1, 9) (3, 9, 9) (2, 9, 9) (1, 9, 9)
i i
i i
“tdj”
i i
2017/2/2
page 58
i i
C
z1 z2 z3 z4
x1 (0, 0, 0) (1, 2, 3) (1, 3, 0) (1, 1, 1)
Jogador 2
L C R
T (1, 0) (3, 1) (1, 1)
Jogador 1
.
M (1, 1) (3, 0) (0, 1)
i i
i i
“tdj”
i i
2017/2/2
page 59
i i
i i
i i
“tdj”
i i
2017/2/2
page 60
i i
Capı́tulo 3
O teorema de equilı́brio
de Nash
60
i i
i i
“tdj”
i i
2017/2/2
page 61
i i
zij : Δ → R
p → zij (p) = ui (sij , p−i ) − ui (pi , p−i )
(isto é, zij mede o ganho ou perda do jogador gi quando ele troca
a distribuição de probabilidade pi pela estratégia pura sij ). Te-
mos que p∗ é um equilı́brio de Nash se, e somente se,
zij (p∗ ) ≤ 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
Demonstração:
(⇒) Se p∗ = (p∗i , p∗−i ) é um equilı́brio de Nash, então ui (p∗i , p∗−i )
≥ ui (sij , p∗−i ) para cada i = 1, . . . , n e j = 1, . . . , mi . Conseqüente-
mente,
zij (p∗ ) = ui (sij , p∗−i ) − ui (p∗i , p∗−i ) ≤ 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
(⇐) Se
i i
i i
“tdj”
i i
2017/2/2
page 62
i i
gij : Δ → R
.
p → gij (p) = max{0, zij (p)}
gij (p) = 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
onde
i i
i i
“tdj”
i i
2017/2/2
page 63
i i
F(p∗ ) = p∗ ,
i i
i i
“tdj”
i i
2017/2/2
page 64
i i
l
p∗ik · ui ek , p∗−i
k=1
>
l
l
p∗ik · ui p∗i , p∗−i = ui p∗i , p∗−i · p∗ik = ui p∗i , p∗−i ,
k=1 k=1
∗
um absurdo. Isto demonstra que gij (p ) = 0 para todo j = 1, . . . , mi
e j = 1, . . . , m e, assim, p∗ é um equilı́brio de Nash em estratégias
mistas.
i i
i i
“tdj”
i i
2017/2/2
page 65
i i
φ : X → 2X
p∗ ∈ φ(p∗ ).
i i
i i
“tdj”
i i
2017/2/2
page 66
i i
3/4
1/2
1/4
0 1/2 1 x
i i
i i
“tdj”
i i
2017/2/2
page 67
i i
3/4
1/2
1/4
0 1/2 1 x
i i
i i
“tdj”
i i
2017/2/2
page 68
i i
ui ((1 − λ) · q(•)
i + λ · qi , p−i ) =
(◦)
(1 − λ) · ui (q(•)
i , p−i ) + λ · ui (qi , p−i ).
(◦)
Agora,
ui (q(•) (◦)
i , p−i ) = ui (qi , p−i ) = constante = max ui (pi , p−i ).
pi ∈Δ(Si )
ui (p(0)
i , p−i ) = constante = max ui (pi , p−i ).
pi ∈Δ(Si )
i i
i i
“tdj”
i i
2017/2/2
page 69
i i
i i
i i
“tdj”
i i
2017/2/2
page 70
i i
3.4 Exercı́cios
[01] O objetivo deste exercı́cio é mostrar que as hipóteses do teorema
do ponto fixo de Brouwer não podem ser removidas.
(a) Exiba uma função F : Δ → Δ descontı́nua, definida em um
subconjunto Δ compacto, convexo e não-vazio de Rn , que
não possui ponto fixo.
(b) Exiba uma função F : Δ → Δ contı́nua, definida em um
subconjunto Δ não-compacto, convexo e não-vazio de Rn ,
que não possui ponto fixo.
(c) Exiba uma função F : Δ → Δ contı́nua, definida em um
subconjunto Δ compacto, não-convexo e não-vazio de Rn ,
que não possui ponto fixo.
[02] Exiba um exemplo de função φ : X → 2X definida em um
subconjunto X compacto, convexo e não-vazio de Rn , que é
semicontı́nua superiormente, mas não possui ponto fixo. Isto
mostra que a hipótese de φ(x) ser um conjunto convexo para
todo x ∈ X não pode ser removida do enunciado do teorema
do ponto fixo de Kakutani.
[03] Dê um exemplo de jogo com um número par de equilı́brios de
Nash em estratégias mistas.
i i
i i
“tdj”
i i
2017/2/2
page 71
i i
Capı́tulo 4
Calculando equilı́brios
de Nash
Com efeito: a soma de quadrados é zero se, e somente se, cada parcela
é igual a zero. McKelvey demonstrou em [58] que a função objetivo
mi
n
2
p → (gij (p))
i=1 j=1
71
i i
i i
“tdj”
i i
2017/2/2
page 72
i i
Exemplo 4.2 Para a batalha dos sexos (Exemplo 2.2, página 13),
(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2
é um equilı́brio de Nash se, e somente se, (p, q) é solução do seguinte
problema de otimização
Como vemos pela Figura 4.2, que mostra o gráfico e o mapa de con-
torno de G, os pontos
(p∗ , q∗ ) = (1, 0; 1, 0), (p∗ , q∗ ) = (0, 1; 0, 1) e
∗ ∗
(p , q ) = (2/3, 1/3; 1/3, 2/3)
i i
i i
“tdj”
i i
2017/2/2
page 73
i i
(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2
2
minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)}) +
2
(max {0, −2 p (2 q − 1)}) +
2
(max {0, 2 (2 p − 1) (−1 + q)}) +
2
(max {0, 2 (2 p − 1) q})
sujeito a 0 ≤ p ≤ 1,
0 ≤ q ≤ 1.
Como vemos pela Figura 4.3, que mostra o gráfico e o mapa de con-
torno de G, o ponto
(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2
i i
i i
“tdj”
i i
2017/2/2
page 74
i i
Como vemos pela Figura 4.4, que mostra o gráfico e o mapa de con-
torno de G, o ponto
Mais ainda,
i i
i i
“tdj”
i i
2017/2/2
page 75
i i
25
20
15
10
5 1
0.5 q
0
0 0.2 0.4 0.6 0
0.8 1
p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
i i
i i
“tdj”
i i
2017/2/2
page 76
i i
2.5
1.5
1
0.5 0.8
0.6
0.4 q
0 0.2
0 0.2 0.4 0.6 0
0.8 1
p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
i i
i i
“tdj”
i i
2017/2/2
page 77
i i
0.8
0.6
q
0.4
0.2
0.8 1
0 0.4 0.6
0 0.2 p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
i i
i i
“tdj”
i i
2017/2/2
page 78
i i
0.8
0.6
q
0.4
0.2
0.8 1
0 0.4 0.6
0 0.2 p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
i i
i i
“tdj”
i i
2017/2/2
page 79
i i
i ∈ Δ(Si ) e, portanto,
para todo p
pi , p−i ) ≤ max ui (siji , p−i ).
max ui (
pi ∈Δ(Si ) siji ∈Si
Por outro lado, ui (siji , p−i ) = ui (eji , p−i ), onde eji é a distribuição
de probabilidades em Δ(Si ) que dá peso 1 à estratégia pura siji .
Assim,
ui (siji , p−i ) = ui (eji , p−i ) ≤ pi , p−i )
max ui (
pi ∈Δ(Si )
Isto implica que ui (sik , p−i ) < maxsiji ∈Si ui (siji , p−i ). Uma vez que
ui (siji , p−i ) ≤ maxsiji ∈Si ui (siji , p−i ) para todo ji = k, segue-se que
mi
ui (p∗i , p−i ) = p∗iji · ui (siji , p−i )
ji =1
mi
< p∗iji · max ui (siji , p−i ) = max ui (siji , p−i )
siji ∈Si siji ∈Si
ji =1
= pi , p−i ).
max ui (
pi ∈Δ(Si )
i i
i i
“tdj”
i i
2017/2/2
page 80
i i
= pi , p−i ).
max ui (
pi ∈Δ(Si )
i i
i i
“tdj”
i i
2017/2/2
page 81
i i
isto é,
10 · p∗21 = 5 · p∗22 e 5p∗11 = 10 · p∗12 .
Como p∗21 + p∗22 = 1 e p∗11 + p∗12 = 1, obtemos então um sistema linear
com 4 equações e 4 incógnitas. A solução deste sistema dá o equilı́brio
de Nash
(p∗11 , p∗12 ; p∗21 , p∗22 ) = (2/3, 1/3; 1/3, 2/3).
i i
i i
“tdj”
i i
2017/2/2
page 82
i i
mais do que dois jogadores e com mais do que duas estratégias puras
por jogador. Neste caso, é preciso (1) considerar os vários casos que
resultam das diferentes escolhas das estratégias puras que farão parte
do suporte de cada perfil em estratégias mistas e (2) resolver o sistema
não-linear resultante. Mais precisamente, para cada jogador gi e para
cada subconjunto não-vazio Ti = {sik1 , . . . , sikti } de Si (que especifica
quais estratégias puras farão parte do suporte), devemos resolver o
sistema descrito na Figura 4.5 (neste sistema, wi representa o ganho
constante que o jogador gi obtém escolhendo qualquer uma de suas
estratégias puras que recebeu probabilidade positiva de p∗i ).
Para jogos com muitos jogadores e muitas estratégias, o sistema
da Figura 4.5 não é prático para o cálculo a mão dos equilı́brios de
Nash. Contudo, métodos numéricos para a solução de um sistema
de equações polinomiais podem ser aplicados: o método de Newton
com uma estratégia de subdivisão espacial, bases de Gröbner e conti-
nuação homotópica poliedral. O leitor interessado pode consultar as
referências [21, 22, 51]
1 Por este motivo, jogos de soma zero também são denominados jogos estrita-
mente competitivos.
i i
i i
i
i
i
i
m1 mi−1 mi+1 mn
··· ··· p∗1j1 · · · p∗(i−1)ji−1 · p∗(i+1)ji+1 · · · p∗njn · ui (s1j1 , . . . , sij−i , sikτ , siji+1 , snjn ) = wi ,
j1 =1 ji−1 =1 ji+1 =1 jn =1
[SEC. 4.3: JOGOS DE SOMA ZERO
∀i = 1, . . . , n, ∀sikτ ∈ Ti ,
p∗ikτ = 0, ∀i = 1, . . . , n, ∀τ = 1, . . . , ti ,
ti
p∗ikτ = 1, ∀i = 1, . . . , n.
τ =1
i
i
“tdj”
i
i
page 83
2017/2/2
“tdj”
i i
2017/2/2
page 84
i i
jogador coluna
1 2 ··· n
1 (a11 , b11 ) (a12 , b12 ) ··· (a1n , b1n )
jogador linha
m
n
ul (p, q) = pi qj aij
i=1 j=1 ⎡ ⎤⎡ ⎤
a11 a12 ··· a1n q1
⎢ a21 a22 ··· a2n ⎥⎢ q2 ⎥
⎢ ⎥⎢ ⎥
= p1 p2 · · · pm ⎢ .. .. .. .. ⎥⎢ .. ⎥,
⎣ . . . . ⎦⎣ . ⎦
am1 am2 · · · amn qn
i i
i i
“tdj”
i i
2017/2/2
page 85
i i
isto é,
⎡ ⎤
a11 a12 ··· a1n
⎢ a21 a22 ··· a2n ⎥
⎢ ⎥
ul (p, q) = pT Aq, com A = ⎢ .. .. .. .. ⎥.
⎣ . . . . ⎦
am1 am2 · · · amn
isto é,
⎡ ⎤ ⎡ ⎤
c c ··· c 1 1 ··· 1
⎢ c c ··· c ⎥ ⎢ 1 1 ··· 1 ⎥
⎢ ⎥ ⎢ ⎥
A+B = C = ⎢ .. .. .. .. ⎥ = c ⎢ .. .. .. .. ⎥ = c 1 ,
⎣ . . . . ⎦ ⎣ . . . . ⎦
c c ··· c 1 1 ··· 1
i i
i i
“tdj”
i i
2017/2/2
page 86
i i
Demonstração:
(⇒) Seja aij um ponto de sela da matriz A. Como aij é máximo
em sua coluna, vale que
ul (i, j) = aij ≥ akj = ul (k, j)
i i
i i
“tdj”
i i
2017/2/2
page 87
i i
payoff
has
Colunas Lin
i i
i i
“tdj”
i i
2017/2/2
page 88
i i
Como aij e ars são pontos de sela, sabemos que eles são mı́nimos
em suas respectivas linhas e máximos em suas respectivas colunas.
Assim,
aij ≤ ais ≤ ars e aij ≥ arj ≥ ars ,
e, portanto,
aij = ais = arj = ars .
Observe que ais é mı́nimo em sua linha, pois aij = ais é mı́nimo
da mesma linha e que ais é máximo em sua coluna, pois ars = ais
é máximo da mesma coluna. Analogamente, arj é mı́nimo em sua
linha, pois ars = arj é mı́nimo da mesma linha e arj é máximo em
sua coluna, pois arj = aij é máximo da mesma coluna. Concluı́mos
então que ais e arj também são pontos de sela da matriz A.
al = max akl .
1≤k≤m
i i
i i
“tdj”
i i
2017/2/2
page 89
i i
Defina
vl (A) = max ak = max min akl
1≤k≤m 1≤k≤m 1≤l≤n
e
vc (A) = min al = min max akl .
1≤l≤n 1≤l≤n 1≤k≤m
Demonstração:
(⇒) Se aij é um ponto de sela da matriz A, então vale que
aij = min1≤l≤n ail = ai . Como vl (A) = max1≤k≤m ak , é claro que
vl (A) ≥ ai = aij . Por outro lado, aij = max1≤k≤m akj = aj . Como
vc (A) = min1≤l≤n al , segue-se que vc (A) ≤ aj = aij . Combinando
estas duas desigualdades, concluı́mos que vc (A) ≤ aij ≤ vl (A). Mas,
pelo teorema anterior, vc (A) ≥ vl (A) e, sendo assim, vc (A) = vl (A).
(⇐) Como vl (A) = max1≤r≤m ar , existe uma linha i tal que
vl (A) = ai . Como, por sua vez, ai = min1≤s≤n ais , existe uma co-
luna l tal que ai = ail . Assim, vl (A) = ai = ail . Analogamente, como
i i
i i
“tdj”
i i
2017/2/2
page 90
i i
vl (A) = vc (A).
i i
i i
“tdj”
i i
2017/2/2
page 91
i i
Assim,
max pT Aq ≥ max min pT Ay = vl (A).
p∈Δm p∈Δm y∈Δn
Conseqüentemente,
vc (A) = min max pT Aq ≥ max min pT Ay = vl (A).
q∈Δn p∈Δm p∈Δm y∈Δn
i i
i i
“tdj”
i i
2017/2/2
page 92
i i
Demonstração:
(⇒) Se (p∗ , q∗ ) é um equilı́brio de Nash, então
i i
i i
“tdj”
i i
2017/2/2
page 93
i i
p∗T Aq∗
=
i i
i i
“tdj”
i i
2017/2/2
page 94
i i
(problema primal)
maximizar bT y
sujeito a Ay ≤ c,
y ≥ 0,
(problema dual)
minimizar cT x
sujeito a x A ≥ bT ,
T
x ≥ 0.
i i
i i
“tdj”
i i
2017/2/2
page 95
i i
de Nash para o jogo definido pela matriz A se, e somente se, (p∗ , q∗ )
é um equilı́brio de Nash para o jogo definido pela matriz A.
Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os proble-
mas de programação linear:
(problema primal)
maximizar bT y
sujeito a Ay ≤ c,
y ≥ 0,
(problema dual)
minimizar cT x
sujeito a x A ≥ bT ,
T
x ≥ 0.
X = {x ∈ Rm | xT A ≥ bT e x ≥ 0}
é não vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a função ob-
jetivo do problema é escrita como x = (x1 , x2 , . . . , xm ) → cT x =
x1 + x2 + · · · + xm . Assim, o problema dual consiste em encontrar o
ponto do conjunto X mais próximo da origem segundo a norma da
soma || · ||1 , um problema que certamente possui uma solução pois,
se p ∈ X, então podemos “compactificar” o conjunto admissı́vel in-
cluindo a restrição ||x||1 ≤ ||p||1 e, com isso, podemos usar o teorema
de Weierstrass para garantir a existência de um mı́nimo.
Passo 2: construção do equilı́brio de Nash.
Dado que o problema dual possui uma solução, pelo teorema de
dualidade, o problema primal também possui. Mais ainda: se x∗ é
solução do problema dual e y∗ é solução do problema primal, então
cT x∗ = (x∗ )T Ay∗ = bT y∗ .
i i
i i
“tdj”
i i
2017/2/2
page 96
i i
e
m
n
yj∗ bT y∗ θ
qj = = = = 1.
j=1 j=1
θ θ θ
i i
i i
“tdj”
i i
2017/2/2
page 97
i i
vı́rus
sorotipo 1 sorotipo 2
(85/100, −85/100) (70/100, −70/100)
governo
vacina 1
(problema primal)
maximizar ' y1 +(y'2 ( ' (
85/100 70/100 y1 1
sujeito a ≤ ,
60/100 90/100 ' y2 ( ' 1 (
y1 0
≥ ,
y2 0
(problema dual)
minimizar ' x1 + x2 (
85/100 70/100
sujeito a x1 x2 ≥ 1 1 ,
60/100 90/100
' ( ' (
x1 0
≥ ,
x2 0
isto é,
i i
i i
“tdj”
i i
2017/2/2
page 98
i i
(problema primal)
maximizar y1 + y2
sujeito a 17y1 + 14y2 ≤ 20,
6y1 + 9y2 ≤ 10,
y1 ≥ 0,
y2 ≥ 0,
(problema dual)
minimizar x1 + x2
sujeito a 7x1 + 12x2 ≥ 20,
7x1 + 9x2 ≥ 10,
x1 ≥ 0,
x2 ≥ 0.
i i
i i
“tdj”
i i
2017/2/2
page 99
i i
x2
30/23
10/23
0 20/23 30/23 x1
y1
30/23
50/69
0 40/69 30/23 y1
i i
i i
“tdj”
i i
2017/2/2
page 100
i i
∀q ∈ Δn , v ∗ = uc (p∗ , q∗ ) ≥ uc (p∗ , q)
⇓
∗T
∀q ∈ Δn , pAq ≥ p∗T Aq∗ = v ∗ (4.3)
⇓
O ganho esperado do jogador linha nunca é menor
do que v ∗ se ele jogar com p∗ , independentemente
da escolha q do jogador coluna.
e, analogamente,
∀p ∈ Δm , v ∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ )
⇓
∀p ∈ Δm , pAq ≤ p∗T Aq∗ = v ∗ ∗
(4.4)
⇓
A perda esperada do jogador coluna nunca é maior
do que v ∗ se ele jogar com q∗ , independentemente
da escolha p do jogador linha.
Mais ainda: se (p∗ , q ∗ ) é um equilı́brio de Nash do jogo, então
n
aij · qj∗ = v ∗ , para todo i tal que p∗i > 0 e (4.5)
j=1
m
p∗i · aij = v ∗ , para todo j tal que qj∗ > 0. (4.6)
i=1
De fato: suponha,
n por absurdo, que exista algum ı́ndice k tal que
p∗k > 0 e a
j=1 kj · qj∗ = v ∗ . Usando as desigualdades 4.4 com
n
p = ei , sabemos que j=1 aij · qj∗ ≤ v ∗ para todo i = 1, . . . , m. Logo,
n
se j=1 akj · qj∗ = v ∗ , então nj=1 akj · qj∗ < v ∗ . Mas, então,
⎛ ⎞
m
n
m
∗
v = p∗i ⎝ aij · qj∗ ⎠ < p∗i v∗ = v∗ ,
i=1 j=1 i=1
i i
i i
“tdj”
i i
2017/2/2
page 101
i i
minimizar λ minimizar μ
sujeito a ½m λ ≥ Aq∗ , sujeito a ½n μ ≥ B T p∗ .
i i
i i
“tdj”
i i
2017/2/2
page 102
i i
Esta condição diz que p∗ e ½m λ∗ −Aq∗ são ortogonais. Dado que estes
vetores são não-negativos, eles têm que ser complementares, no sen-
tido que eles não podem ter componentes positivas na mesma posição.
Esta caracterização de um par primal-dual ótimo é conhecida como
folgas complementares em programação linear. Dado que p∗ é uma
distribuição de probabilidades, pelo menos uma de suas componen-
tes é positiva, de modo que a respectiva componente de ½m λ∗ − Aq∗
é zero e λ∗ é a maior das entradas de Aq∗ . Qualquer estratégia
pura i do jogador 1 é uma melhor resposta a q∗ se, e somente se,
a i-ésima componente de ½m λ∗ − Aq∗ é igual a zero. Desta forma,
a Equação 4.7 obtém o Corolário 4.1 na página 80: uma estratégia
mista p∗ é uma melhor resposta para q∗ se, e somente se, ela dá pro-
babilidade positiva apenas para as estratégias puras que são melhores
respostas para q∗ . Analogamente, se μ∗ é a solução ótima do segundo
problema dual, então
q∗T (½n μ∗ − B T p∗ ) = 0. (4.8)
½Tm p∗ = 1,
½Tn q∗ = 1,
½m λ∗ − Aq∗ ≥ 0, (4.9)
½n μ∗ − B T p∗ ≥ 0,
p∗, q∗ ≥ 0,
i i
i i
“tdj”
i i
2017/2/2
page 103
i i
(p∗T Aq∗ )½m ≥ (eTi Aq∗ )½m = ½m (eTi Aq∗ ) = (½m eTi )(Aq∗ ) = Aq∗ .
Analogamente, como
w + M z = t, w ≥ 0, z≥0 e zT w = 0,
i i
i i
“tdj”
i i
2017/2/2
page 104
i i
x∗ y∗
p∗ = e q∗ =
½Tm x∗ ½Tn y∗
constituem um equilı́brio de Nash do jogo bimatricial.
Além de programação linear, programação quadrática e teoria dos
jogos, aplicações do problema de complementaridade linear incluem
o estudo de modelos financeiros, a análise não-linear de certas estru-
turas elasto-plásticas e muitas outras áreas ([64]).
4.5 Gambit
Desenvolvido por Richard D. McKelvey (California Institute of
Technology), Andrew M. McLennan (University of Minnesota) e The-
odore L. Turocy (Texas A&M University), Gambit é um programa de
computador, gratuito e multiplataforma, orientado para a construção
e análise de jogos finitos. Ele oferece uma interface gráfica intuitiva
para o cálculo de equilı́brios de Nash e a análise das estruturas de
dominância das estratégias do jogo. Para baixá-lo, acesse o endereço:
http://econweb.tamu.edu/gambit.
i i
i i
“tdj”
i i
2017/2/2
page 105
i i
i i
i i
“tdj”
i i
2017/2/2
page 106
i i
4.6 Exercı́cios
[01] Calcule os pontos de sela da matriz
⎡ ⎤
24 23 22 25
⎢ 10 22 20 19 ⎥
A=⎢ ⎣ 27
⎥.
25 22 23 ⎦
20 28 16 15
i i
i i
“tdj”
i i
2017/2/2
page 107
i i
1 3 2 5 3
4 15 14 1
Este quadrado mágico aparece na gravura Melencolia I de Al-
brecht Dürer:
http://en.wikipedia.org/wiki/Melancholia_I.
i i
i i
“tdj”
i i
2017/2/2
page 108
i i
Capı́tulo 5
5.1 Definição
Um jogo na forma extensa (também denominado jogo seqüencial)
é aquele em que os jogadores realizam seus movimentos em uma or-
dem predeterminada. Por este motivo, uma maneira muito adequada
108
i i
i i
“tdj”
i i
2017/2/2
page 109
i i
c (2, 4)
2
d
a
(1, 0)
1
b
e (6, 12)
2
f
(9, {1)
i i
i i
“tdj”
i i
2017/2/2
page 110
i i
S1 = {a, b}.
Por outro lado, o jogador 2 tem dois nós de decisão: um que se segue
depois que o jogador 1 jogou a e o outro depois que o jogador 1 jogou b.
Por este motivo, cada estratégia do jogador 2 deve conter duas ações:
uma para o primeiro nó e a outra para o outro nó. Assim, uma
estratégia possı́vel para o jogador 2 é “jogar c se o jogador 1 jogar a
e jogar f se o jogador 1 jogar b”. Outra é “jogar c se o jogador 1
jogar a e jogar e se o jogador 1 jogar b”. Escrevendo apenas as ações
que o jogador 2 pode tomar em cada nó de decisão, o conjunto de
suas estratégias pode ser então representado da seguinte maneira:
S1 = {a, b}, S2 = {(c, e), (c, f ), (c, g), (d, e), (d, f ), (d, g)}
e
S2 = {(c, e), (c, f ), (d, e), (d, f )}.
i i
i i
“tdj”
i i
2017/2/2
page 111
i i
c (2, 4)
2
d
a (1, 0)
1
b (6, 12)
e
2 f
(9, {1)
g
(8, 9)
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
i i
i i
“tdj”
i i
2017/2/2
page 112
i i
S = S1 × S2 = {(a, (c, e)), (a, (c, f )), (a, (d, e)), (a, (d, f )),
(b, (c, e)), (b, (c, f )), (b, (d, e)), (b, (d, f ))}.
c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)
i i
i i
“tdj”
i i
2017/2/2
page 113
i i
c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)
c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)
i i
i i
“tdj”
i i
2017/2/2
page 114
i i
e
u2 (b, (c, f )) = 4 > 0 = u2 (b, (c, e)),
u2 (b, (c, f )) = 4 > 0 = u2 (b, (d, e)),
u2 (b, (c, f )) = 4 ≥ 4 = u2 (b, (d, f )).
O jogo possui mais um equilı́brio de Nash: o perfil (b, (c, f )).
i i
i i
“tdj”
i i
2017/2/2
page 115
i i
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
i i
i i
“tdj”
i i
2017/2/2
page 116
i i
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
c (2, 1)
2
d
a
(0, 0)
1
b
(1, 2)
i i
i i
“tdj”
i i
2017/2/2
page 117
i i
da Figura 5.11.
l (2, 3)
1
m
e ±
2 (1, 4)
° f
p (5, 0)
1
q
²
(5, 4)
i i
i i
“tdj”
i i
2017/2/2
page 118
i i
i i
i i
“tdj”
i i
2017/2/2
page 119
i i
5.5 Exercı́cios
[01] (Jogo da centopéia) Use indução retroativa para obter um
equilı́brio de Nash do jogo seqüencial da figura abaixo. O
equilı́brio é Pareto eficiente?
1 Continuar 2 Continuar 1 Continuar 2 Continuar
(64, 16)
Parar
Parar
Parar
Parar
(4, 1) (2, 8) (16, 4) (8, 32) .
trair ({1, 2)
2
fiar
con honrar ( 1, 1)
1
não
con
fiar
(0, 0) .
i i
i i
“tdj”
i i
2017/2/2
page 120
i i
Capı́tulo 6
Exemplos
120
i i
i i
“tdj”
i i
2017/2/2
page 121
i i
http://www.professores.uff.br/hjbortol/arquivo/2007.1/
applets/leher1_br.html.
i i
i i
“tdj”
i i
2017/2/2
page 122
i i
{5, 7, 9}
{5, 6, 7, 8, 9, 10, Q, J, K}
i i
i i
i
i
i
i
jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
A 0.500 0.462 0.429 0.404 0.385 0.372 0.365 0.365 0.372 0.385 0.404 0.429 0.462
2 0.538 0.500 0.468 0.442 0.423 0.410 0.404 0.404 0.410 0.423 0.442 0.468 0.500
3 0.571 0.538 0.506 0.480 0.460 0.447 0.440 0.439 0.445 0.457 0.476 0.501 0.533
4 0.596 0.569 0.543 0.517 0.496 0.481 0.473 0.471 0.476 0.487 0.505 0.529 0.559
5 0.613 0.592 0.571 0.550 0.529 0.513 0.503 0.499 0.502 0.512 0.527 0.550 0.578
6 0.622 0.606 0.590 0.573 0.557 0.541 0.529 0.523 0.523 0.530 0.544 0.564 0.590
[SEC. 6.1: O JOGO LE HER SIMPLIFICADO
7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593
jogador 1
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
10 0.566 0.563 0.559 0.556 0.552 0.549 0.545 0.542 0.538 0.535 0.533 0.538 0.549
Q 0.526 0.524 0.523 0.521 0.519 0.517 0.516 0.514 0.512 0.510 0.509 0.508 0.514
J 0.474 0.474 0.473 0.473 0.472 0.471 0.471 0.470 0.470 0.469 0.469 0.468 0.468
K 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410
i
i
“tdj”
i
i
page 123
2017/2/2
2017/2/2
page 124
i
i
“tdj”
i
i
[CAP. 6: EXEMPLOS
jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
jogador 1
7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
Tabela 6.2: Matriz de payoffs do jogador 1 para o jogo Le Her após mais uma eliminação de estratégias
estritamente dominadas.
124
i
i
i
i
“tdj”
i i
2017/2/2
page 125
i i
jogador 2
9 10
jogador 1
7 0.538 0.543
8 0.547 0.548
9 0.549 0.545
jogador 2
9 10
jogador 1
8 0.547 0.548
9 0.549 0.545
i i
i i
“tdj”
i i
2017/2/2
page 126
i i
deste jogo 2 × 2:
e
(q1 , q2 ) = (3/5, 2/5) para o jogador 2.
Os payoffs médios são, respectivamente, 0.5474 e 0.4526. Vemos,
portanto, que o jogador 1 leva vantagem nesta versão simplificada
do Le Her supondo, é claro, que ele aja racionalmente seguindo o
equilı́brio de Nash.
Observações.
1. No jogo original com 52 cartas, o jogador 2 pode se negar a trocar
de cartas com o jogador 1 se sua carta for K (a de maior valor). No
caso de cartas de mesmo valor (mas naipes diferentes), o jogador 2
vence. Mesmo na versão original, a probabilidade média de ganho
do jogador 1 é maior do que a do jogador 2 no equilı́brio de Nash.
Os detalhes podem ser encontrados nas referências [25] e [37].
2. O jogo Le Her foi investigado por Pierre Rémond de Montmort
(1678–1719) e Nicholas Bernoulli (1687–1759), mas foi James Wal-
degrave (1684–1741) que forneceu uma solução para o jogo usando
o conceito de equilı́brio em estratégias mistas. As referências [90]
e [37] apresentam em detalhes a história deste jogo, incluindo a
troca de correspondência entre Montmort, Bernoulli e Waldegrave
e os erros cometidos na solução apresentada por Bernoulli.
3. Benjamim e Goldman mostram em [05] que, para a versão sim-
plificada do Le Her, a redução da matriz de payoffs para uma
matriz 2 × 2 ocorre para qualquer baralho com um número N ≥ 3
de cartas de um mesmo naipe.
i i
i i
“tdj”
i i
2017/2/2
page 127
i i
e, assim, eles tomam suas decisões sobre qual produto comprar con-
siderando apenas o preço, independentemente do fabricante. Vamos
assumir a situação de market-clearing, isto é, não existe excesso de
demanda ou excesso de oferta no mercado. Assim, a quantidade de-
mandada do produto é igual à quantidade ofertada do mesmo. Para
simplificar, vamos supor que o preço de mercado é uma função linear
da quantidade agregada Q = q1 + q2 do produto no mercado. Mais
precisamente,
A − Q, se Q < A, A − (q1 + q2 ), se q1 + q2 < A,
P (Q) = =
0, se Q ≥ A, 0, se q1 + q2 ≥ A.
Aqui, A é o preço máximo aceitável pelo mercado. Os custos to-
tais de produção das empresas 1 e 2 são dados, respectivamente,
por C1 (q1 ) = c · q1 e C2 (q2 ) = c · q2 , com c > 0. Vamos supor que
c < A. As duas empresas devem escolher simultaneamente as quan-
tidades que irão produzir. O ganho de cada empresa é o lucro que
ela obtém.
Temos então um jogo infinito com dois jogadores, g1 = Empresa 1,
g2 = Empresa 2, S1 = [0, +∞), S2 = [0, +∞) e S = S1 × S2 . As fun-
ções de utilidade u1 , u2 : S → R são dadas por
u1 (q1 , q2 ) = q1 · P (q1 + q2 ) − c · q1
q1 · [A − (q1 + q2 ) − c], se q1 + q2 ≤ A,
=
q1 · [−c], se q1 + q2 > A,
q1 · (−q1 + (A − q2 − c)), se q1 + q2 ≤ A,
=
q1 · [−c], se q1 + q2 > A,
u2 (q1 , q2 ) = q2 · P (q1 + q2 ) − c · q2
q2 · [A − (q1 + q2 ) − c], se q1 + q2 ≤ A,
=
q2 · [−c], se q1 + q2 > A,
q2 · (−q2 + (A − q1 − c)), se q1 + q2 ≤ A,
=
q2 · [−c], se q1 + q2 > A.
Desta maneira, as funções de melhor resposta das duas empresas são
dadas por
{(A − c − q2 )/2}, se q2 ≤ A − c,
MR1 (q2 ) =
{0}, se q2 > A − c,
i i
i i
“tdj”
i i
2017/2/2
page 128
i i
{(A − c − q1 )/2}, se q1 ≤ A − c,
MR2 (q1 ) =
{0}, se q1 > A − c.
q2
A{c
(A { c)/2
(q 1*, q2* )
0 (A { c)/2 A{c q1
i i
i i
“tdj”
i i
2017/2/2
page 129
i i
onde j = i = 1, 2.
Quais são os equilı́brios de Nash em estratégias puras deste mo-
delo? Certamente (p∗1 , p∗2 ) = (c, c) é um equilı́brio de Nash pois, neste
caso,
(a) Se p∗2 < c e p∗1 ≥ p∗2 , então u2 (p∗1 , p∗2 ) < 0 = u2 (p∗1 , c). Logo, neste
caso, (p∗1 , p∗2 ) não é um equilı́brio de Nash do jogo.
i i
i i
“tdj”
i i
2017/2/2
page 130
i i
p2
A
Caso (e)
Caso (d)
Caso (c)
(f)
so
Caso (g)
Ca
c Caso (h)
)
(b
Caso (a)
so
Ca
0 c A p1
(b) Se p∗1 = p∗2 < c, então u1 (p∗1 , p∗2 ) < 0 = u1 (c, p∗2 ). Logo, neste
caso, (p∗1 , p∗2 ) não é um equilı́brio de Nash do jogo.
(c) Se p∗1 < c e p∗2 ≥ p∗1 , então u1 (p∗1 , p∗2 ) < 0 = u1 (c, p∗2 ). Logo, neste
caso, (p∗1 , p∗2 ) não é um equilı́brio de Nash do jogo.
(d) Suponha que p∗1 = c e p∗2 > c. Se p∗2 < A, então u1 (p∗1 , p∗2 ) = 0 <
u1 (p∗2 , p∗2 ). Se p∗2 = A, então
(e) Suponha que p∗2 > p∗1 > c. Como u2 (p∗1 , p∗2 ) = 0 < u2 (p∗1 , p∗1 ).
segue-se que (p∗1 , p∗2 ) também não é um equilı́brio de Nash do
jogo.
i i
i i
“tdj”
i i
2017/2/2
page 131
i i
( f ) Suponha que p∗2 = p∗1 > c. Se p∗1 = p∗2 ∈ ((A + c)/2, A], então
u1 (p∗1 , p∗2 ) < u1 ((A + c)/2, p∗2 ). Se p∗1 = p∗2 ∈ (c, (A + c)/2], seja
p•1 a solução da equação (c − x) · (A − x) = u∗ no intervalo (c, p∗1 ),
onde u∗ = (c − p∗1 ) · (A − p∗1 )/2, isto é, seja
)
A+c c2 + A2 − 2 · p∗1 · A + 2 · p∗1 2 − 2 · c · p∗1
•
p1 = − .
2 2
Então u1 (p∗1 , p∗2 ) < u1 ((p•1 + p∗1 )/2, p∗2 ). Vemos então que, neste
caso, (p∗1 , p∗2 ) também não é um equilı́brio de Nash do jogo.
(g) Suponha que p∗1 > p∗2 > c. Como u1 (p∗1 , p∗2 ) = 0 < u1 (p∗2 , p∗2 ).
segue-se que (p∗1 , p∗2 ) também não é um equilı́brio de Nash do
jogo.
(h) Suponha que p∗2 = c e p∗1 > c. Se p∗1 < A, então u2 (p∗1 , p∗2 ) = 0 <
u2 (p∗1 , p∗1 ). Se p∗1 = A, então
Vemos então que, neste caso, (p∗1 , p∗2 ) também não é um equilı́brio
de Nash do jogo.
i i
i i
“tdj”
i i
2017/2/2
page 132
i i
u2
0 c (A + c)/2 A p2
u1 (q1 , q2 ) = q1 · P (q1 + q2 ) − c · q1 ,
u2 (q1 , q2 ) = q2 · P (q1 + q2 ) − c · q2 ,
A − q1 − c
q2 = A2 (q1 ) = ,
2
i i
i i
“tdj”
i i
2017/2/2
page 133
i i
i i
i i
“tdj”
i i
2017/2/2
page 134
i i
Two Lectures on the Checks to Population de 1833, que depois foi po-
pularizada e estendida por Garret Hardin no seu artigo The Tragedy
of the Commons publicado na revista Science em 1968 ([38]).
A palavra “tragédia” tem o significado dado por Alfred North
Whitehead em seu livro Science and The Modern World : “The es-
sence of dramatic tragedy is not unhappiness. It resides in the solem-
nity of the remorseless working of things.”. Já a palavra “comuns”
designa uma área de pastagem coletiva, sem dono e sem qualquer
regulamentação, usada por pastores na Idade Média, que cuidavam
do rebanho de ovelhas para obter a lã que vendiam para a confecção
de roupas.
Com o crescimento do número de famı́lias de camponeses ao longo
do tempo, ocorreu um aumento do número de ovelhas necessárias
para o sustento de cada famı́lia. Como a área de pastagem era de uso
comum, nenhuma famı́lia tinha incentivo para controlar o número de
ovelhas de seu rebanho pois, se o fizesse, outras famı́lias usariam as
pastagens de qualquer forma. Com uma superpopulação de ovelhas, a
terra que antes era fértil, começou a se exaurir. A redução da área de
pastagem afetou tanto o rebanho quanto a indústria local de roupas.
A parábola mostra, então, que a imprudência em administrar um
recurso finito do qual todos se beneficiam pode levar à ruı́na.
Vamos usar teoria dos jogos para modelar uma versão ingênua da
tragédia dos comuns. Considere uma aldeia com n pastores e seja oi
o número de ovelhas do i-ésimo pastor, de modo que o número total
de ovelhas da aldeia é o = o1 + · · · + on . O custo de compra de uma
ovelha é c, independentemente do número de ovelhas que o pastor
já possui. O benefı́cio de um pastor em deixar uma ovelha pastando
é v(o) por ovelha. Como o campo de pastagem é um recurso finito,
existe um número máximo o de ovelhas que ele pode suportar. As-
sim, v(o) > 0 se o < o e v(o) = 0 se o ≥ o. Naturalmente, v é uma
função decrescente, pois quanto mais ovelhas no pasto, menor será a
área útil de pastagem para a próxima ovelha. Mais ainda: se existem
poucas ovelhas pastando, colocar uma a mais para pastar não vai
afetar muito as ovelhas que já estão pastando mas, por outro lado, se
existem muitas ovelhas no pasto, digamos, quase que completando a
cota máxima o, o acréscimo de uma ovelha prejudica mais acentua-
damente a pastagem das demais ovelhas. Admitindo que as ovelhas
sejam infinitamente divisı́veis, estas condições podem ser modeladas
i i
i i
“tdj”
i i
2017/2/2
page 135
i i
0 o o
ui (o1 , . . . , oi , . . . , on ) = oi · v(o1 + · · · + oi + · · · + on ) − c · oi .
(1) μi é contı́nua,
∗
(2) μi tem a mesma classe de diferenciabilidade de v em [0, o − σ−i ),
∗ ∗
(3) μi (0) = 0, μi (o − σ−i ) < 0, μi (oi ) ≤ 0 para oi ≥ o − σ−i ,
i i
i i
“tdj”
i i
2017/2/2
page 136
i i
∗
(5) μi é côncava em 0, o − σ−i .
Logo, a função de melhor resposta do pastor i está bem definida:
MRi (o∗ ) = argmaxoi ∈(0,o−σ−i ∗
∗ ) oi · v oi − σ−i − c · oi .
Se o∗i ∈ MRi (o∗ ), então, pela regra de Fermat, μi (o∗i ) = 0, isto é,
v(o∗i + σ−i
∗
) + o∗i · v (o∗i + σ−i
∗
) − c = 0.
Somando-se estas equações para i = 1, . . . , n e, então, dividindo-se
por n, obtemos que σ ∗ deve satisfazer a seguinte equação:
1 ∗ ∗
v(σ ∗ ) + · σ · v (σ ) = 0. (6.2)
n
Por outro lado, se o objetivo é maximizar a utilidade coletiva, isto
é, a soma das funções utilidades individuais, então devemos resolver
o seguinte problema de otimização:
max (o · v(o) − c · o) .
o∈(0,o)
i i
i i
“tdj”
i i
2017/2/2
page 137
i i
Apêndice A
Convexidade
137
i i
i i
“tdj”
i i
2017/2/2
page 138
i i
(a) (b)
H+ = {x ∈ Rn | ax ≥ c} e H− = {x ∈ Rn | ax ≤ c}
λ1 · x1 + · · · + λi · xk .
i i
i i
“tdj”
i i
2017/2/2
page 139
i i
139
(a) (b)
i i
i i
“tdj”
i i
2017/2/2
page 140
i i
f(p)
seg
me
nto
(1{ t) . f(p)+t . f(q) de r
eta
sec
ant
e gráfico de f
f(q)
f ((1{ t) . p +t . q)
0 p (1{ t) . p+t . q q x
Teorema A.3
i i
i i
“tdj”
i i
2017/2/2
page 141
i i
141
gráfico de f
0 x
i i
i i
“tdj”
i i
2017/2/2
page 142
i i
0 x
√
3
Figura A.5: y = f (x) = x2 é quase-convexa, mas não é convexa
em R.
i i
i i
“tdj”
i i
2017/2/2
page 143
i i
143
f (t · x1 + (1 − t) · x2 ) ≤ f (x2 ).
f (t · x1 + (1 − t) · x2 ) ≥ f (x2 ).
i i
i i
“tdj”
i i
2017/2/2
page 144
i i
0 x
i i
i i
“tdj”
i i
2017/2/2
page 145
i i
Apêndice B
Programação Linear
minimizar x1 + x2
x1 ,x2 ∈R
sujeito a 3 x1 + 2 x2 ≥ 8,
x1 + 5 x2 ≥ 7, (B.1)
x1 ≥ 0,
x2 ≥ 0,
K = {(x1 , x2 ) ∈ R2 | 3 x1 + 2 x2 ≥ 8, x1 + 5 x2 ≥ 7, x1 ≥ 0, x2 ≥ 0}
145
i i
i i
“tdj”
i i
2017/2/2
page 146
i i
x2
0 2 3 7 x1
minimizar ∈ R c1 x1 + · · · + cn xn
x1 ,...,xn
sujeito a a11 x1 + ··· + a1n xn = b1 ,
.. .. .. .. ..
. . . . .
am1 x1 + · · · + amn xn = bm ,
e x1 ≥ 0, . . . , xn ≥ 0.
Todo programa linear pode ser reescrito na forma padrão com o uso
de variáveis de folga. Por exemplo, uma restrição da forma
ai1 x1 + · · · + ain xn ≥ bi
pode ser substituı́da, de maneira equivalente, pelas restrições
ai1 x1 + · · · + ain xn − yi = bi e yi ≥ 0.
Se uma variável de decisão xi pode assumir qualquer valor real, isto é,
se não existe restrição de não-negatividade em xi , então podemos
i i
i i
“tdj”
i i
2017/2/2
page 147
i i
147
minimizar
n
cT x
x∈R (B.3)
sujeito a Ax = b e x ≥ 0,
maximizar
n
cT x
x∈R
sujeito a Ax = b e x ≥ 0,
minimizar
n
−cT x
x∈R
sujeito a Ax = b e x ≥ 0.
i i
i i
“tdj”
i i
2017/2/2
page 148
i i
i i
i i
“tdj”
i i
2017/2/2
page 149
i i
149
x2
4 x1 x6 x7
x5
3
x2
1 x4
x3
0
2 3 7 x1
Os teoremas B.1 e B.2 dizem que, para se resolver o problema B.3, não
é preciso considerar todos os pontos do conjunto admissı́vel K: basta
procurar pelo ponto ótimo entre os pontos extremos (vértices) de K!
O método simplex explora esta estrutura para construir um algoritmo
muito popular para se resolver B.3. Outra categoria de métodos que
i i
i i
“tdj”
i i
2017/2/2
page 150
i i
minimizar
n
cT x
x∈R (B.4)
sujeito a Ax ≥ b e x ≥ 0,
é o programa linear
maximizar
m
λT b
λ∈R (B.5)
sujeito a AT λ ≤ c e λ ≥ 0,
m
onde λT b = i=1 λi bi . B.5 é denominado o problema dual
de B.4. Neste contexto, B.4 é denominado problema primal.
minimizar 8 λ1 + 7 λ2
λ1 ,λ2 ∈R
sujeito a 3 λ1 + λ2 ≤ 1,
2 λ1 + 5 λ2 ≤ 1, (B.6)
λ1 ≥ 0,
λ2 ≥ 0.
i i
i i
“tdj”
i i
2017/2/2
page 151
i i
151
minimizar
n
cT x
x∈R
' ( ' (
A b
sujeito a x≥ e x ≥ 0.
−A −b
minimizar
n
uT b − vT b
x∈R
sujeito a AT u − AT v ≤ c, u ≥ 0 e v ≥ 0.
i i
i i
“tdj”
i i
2017/2/2
page 152
i i
i i
i i
“tdj”
i i
2017/2/2
page 153
i i
153
3/7
1/5
(4/13, 1/13)
3/8
0 1/3 ¸1
i i
i i
“tdj”
i i
2017/2/2
page 154
i i
K = {x ∈ Rn | Ax = b e x ≥ 0} ,
então existem ponto extremo x e raio extremo r de K tal que o valor
da função objetivo de B.3 em x = x +tr tende a −∞ quando t tende
a +∞. Em particular,
cT
r < 0.
Dizemos que r é um raio de K se, e somente se, r = 0 e o conjunto
{p ∈ Rn | p = x + t r e t ≥ 0} está contido em K para todo x ∈ K.
Um raio r de K é extremo, se não existem outros dois raios r1 e r2
de K (com r1 = t r2 para todo t > 0) e um escalar s no intervalo (0, 1)
tal que
r = s r1 + (1 − s) r2 .
x2
r1
r2
r3
K
0 x1
i i
i i
“tdj”
i i
2017/2/2
page 155
i i
Apêndice C
Capı́tulo 2
[01] O processo de dominância estrita iterada reduz o jogo para uma
matriz 1×1 com um único perfil de estratégias puras: (s13 , s22 ).
[02] (a) Não existem estratégias dominantes neste jogo.
(b) (l1 , c1 ) e (l2 , c2 ) são os únicos equilı́brios de Nash em es-
tratégias puras do jogo.
[03] (a) c2 domina estritamente c1 .
(b) (l2 , c2 ) é o único equilı́brio de Nash em estratégias puras do
jogo.
[04] (a) Não existem estratégias dominantes neste jogo.
(b) (desviar, não desviar) e (não desviar, desviar) são os únicos
equilı́brios de Nash em estratégias puras do jogo.
[05] (a) Não existem estratégias dominantes neste jogo.
(b) (brigar, ameaçar) e (ameaçar, brigar) são os únicos equilı́brios
de Nash em estratégias puras do jogo.
[06] Usando o processo de dominância fraca iterada, o jogo se reduz
para uma matriz 3 × 3:
155
i i
i i
“tdj”
i i
2017/2/2
page 156
i i
Eixo
A B C
1 (+13, −13) (+29, −29) (+ 8, − 8)
Aliados .
3 (+18, −18) (+22, −22) (+31, −31)
i i
i i
“tdj”
i i
2017/2/2
page 157
i i
157
Das desigualdades
e
i , s−i ) < ui (si , s−i )
ui (s[1] [2] [2] [2]
∗
i = si e si = si .
segue-se que s[2] [2] [1]
Agora, por sua vez, o perfil (s[2]i , s−i ) também foi eliminado du-
[2]
Logo, ui (si , s−i ) ≤ ui (si , s−i ) para todo s−i que pode ser
[2] [3]
desigualdades
e
i , s−i ) < ui (si , s−i )
ui (s[2] [3] [3] [3]
∗
i = si , si = si e si = si .
segue-se que s[3] [3] [1] [3] [2]
i i
i i
“tdj”
i i
2017/2/2
page 158
i i
onde
m1 mi−1 mi+1 mn
vji = ··· ··· cj1 ,...,jn · ui (s1j1 , . . . , snjn ),
j1 =1 ji−1 =1 ji+1 =1 jn =1
i i
i i
“tdj”
i i
2017/2/2
page 159
i i
159
mi
< pir · ui (sir , s−i ) + pik · ui (pi , s−i ),
r=1
r =k
Conseqüentemente,
ui (pi , s−i )
<
mi
mi
pir · ui (sir , s−i ) + pik · pir · ui (sir , s−i )
r =1 r =1
r =k
=
mi
(pir + pik · pir ) · ui (sir , s−i ) + pik · pik · ui (sik , s−i )
r=1
r =k
=
mi
pir · ui (sir , s−i ),
r=1
i i
i i
“tdj”
i i
2017/2/2
page 160
i i
i i
i i
“tdj”
i i
2017/2/2
page 161
i i
161
(Bob) q
(Confessar) 1
(Negar)
0 1 p (Al)
(Negar) (Confessar)
g2
s21 s22
s11 (12, 10) (28, 26) ,
g1
s12 (20, 46) (20, 46)
i i
i i
“tdj”
i i
2017/2/2
page 162
i i
(g2) q
(s21 ) 1
1/2
(s22 )
0 1/2 1 p (g1)
(s12 ) (s11 )
Capı́tulo 3
[01] (a) Considere Δ = [0, 1] e F : Δ → Δ cujo gráfico é dado na
Figura C.3.
(b) Considere Δ = (0, 1) e F : Δ → Δ cujo gráfico é dado na
Figura C.4.
(c) Considere Δ = [0, 1/3] ∪ [2/3, 1] e F : Δ → Δ cujo gráfico é
dado na Figura C.5.
i i
i i
“tdj”
i i
2017/2/2
page 163
i i
163
1/2
0 1/2 1 x
2/3
0 1/3 1 x
i i
i i
“tdj”
i i
2017/2/2
page 164
i i
2/3
1/3
0 1/3 2/3 1 x
3/4
1/4
0 1/2 1 x
i i
i i
“tdj”
i i
2017/2/2
page 165
i i
165
g2
s21 s22
s11 (1, 1) (0, 0) ,
g1
s12 (0, 0) (0, 0)
Capı́tulo 4
[01] A matriz A tem dois pontos de sela: a13 e a33 .
[02] No jogo de comparar moedas,
' (
+1 −1
A=
−1 +1
Assim:
(problema primal)
maximizar y1 + y2
sujeito a 3 y1 + y2 ≤ 1,
y1 + 3 y2 ≤ 1,
y1 ≥ 0,
y2 ≥ 0,
i i
i i
“tdj”
i i
2017/2/2
page 166
i i
(problema dual)
minimizar x1 + x2
sujeito a 3 x1 + x2 ≥ 1,
x1 + 3 x2 ≥ 1,
x1 ≥ 0,
x2 ≥ 0.
1
θ = x∗1 + x∗2 = y1∗ + y2∗ = ,
2
segue-se que o único equilı́brio de Nash do jogo de comparar
moedas é dado por (p∗ , q∗ ), onde
(x∗ , x∗ ) 1 1 (y ∗ , y ∗ ) 1 1
p∗ = 1 2 = , e q∗ = 1 2 = , .
θ 2 2 θ 2 2
(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ )
i i
i i
“tdj”
i i
2017/2/2
page 167
i i
167
a p∗ + d (1 − p∗ ) = b p∗ + c (1 − p∗ )
c−d
p∗ =
(a − b) + (c − d)
ac− bd
v ∗ = a p∗ + d (1 − p∗ ) = .
(a − b) + (c − d)
ac − bd
v ∗ = a q ∗ + d(1 − q ∗ ) = .
(a − b) + (c − d)
[04] Como A não possui pontos de sela, o jogo possui apenas equilı́brios
de Nash
(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ )
totalmente mistos, isto é, com 0 < p∗ , q ∗ < 1. Se v ∗ é o valor
do jogo, então usando as desigualdades 4.3 com q = ek ∈ R4
para k = 1, 2, 3, 4, vemos que
⎡ ∗ ⎤
' ( v
∗ −1 +5 +1 −2 ⎢ v∗ ⎥
p 1 − p∗ ≥⎢ ⎥
⎣ v∗ ⎦ ,
+1 −3 −2 +5
v∗
i i
i i
“tdj”
i i
2017/2/2
page 168
i i
v*
5 Coluna 2
3
v*
*{
=
8p
{7
=
p*
v*
+
v* = 5
2 Coluna 3
1 {2p p*
{
*+ =3
1 v*
0 1 p*
{1 Coluna 1
{2 Coluna 4
{3
isto é, ⎧ ∗
⎪
⎪ v ≤ −2 p∗ + 1,
⎨ ∗
v ≤ 8 p∗ − 3,
(C.1)
⎪ v∗
⎪ ≤ 3 p∗ − 2,
⎩ ∗
v ≤ −7 p∗ + 5.
As funções afins v ∗ = −2 p∗ + 1, v ∗ = 8 p∗ − 3, v ∗ = 3 p∗ − 2
e v ∗ = 3 p∗ − 2 representam os ganhos médios do jogador linha
quando ele escolhe a distribuição de probabilidades (p∗ , 1−p∗) e
o jogador coluna escolhe as colunas 1, 2, 3 e 4, respectivamente.
Os gráficos destas funções para 0 ≤ p∗ ≤ 1 estão desenhados na
Figura C.7.
Para um valor fixo de p∗ , o jogador linha está seguro de que seu
ganho médio é pelo menos o mı́nimo destas quatro funções cal-
culadas em p∗ , o envelope inferior destas quatro funções. Como
o jogador linha pretende maximizar os seus ganhos médios,
i i
i i
“tdj”
i i
2017/2/2
page 169
i i
169
e
max (−uc (ek , q∗ )) = −uc (ek∗ , q∗ ),
1≤k≤m
isto é, p∗T Ael ≥ p∗T Ael∗ para todo l e eTk Aq∗ ≤ eTk∗ Aq∗ para
todo k. Desta maneira,
eTk Aq∗ ≤ eTk∗ Aq∗ = −(−p∗T Ael∗ ) = p∗T Ael∗ ≤ p∗T Ael ,
i i
i i
“tdj”
i i
2017/2/2
page 170
i i
M
min ul (p∗ , el ) = = max (−uc (ek , q∗ )).
1≤l≤n n 1≤k≤m
i i
i i
“tdj”
i i
2017/2/2
page 171
i i
171
i i
i i
“tdj”
i i
2017/2/2
page 172
i i
i i
i i
“tdj”
i i
2017/2/2
page 173
i i
Referências
Bibliográficas
[07] E. Borel, The Theory of Play and Integral Equations with Skew
Symmetric Kernels. Econometrica, vol. 21, no. 1, pp. 97-100,
1953. Originalmente publicado em: Comptes Rendus Hebdo-
madaires des Seances de l’Academie des Sciences, 1921.
173
i i
i i
“tdj”
i i
2017/2/2
page 174
i i
[08] E. Borel, On Games that Involve Chance and the Skill of the
Players. Econometrica, vol. 21, no. 1, pp. 101-115, 1953. Origi-
nalmente publicado em: Elements de la Théorie des Probabi-
lités, 1924.
i i
i i
“tdj”
i i
2017/2/2
page 175
i i
i i
i i
“tdj”
i i
2017/2/2
page 176
i i
i i
i i
“tdj”
i i
2017/2/2
page 177
i i
i i
i i
“tdj”
i i
2017/2/2
page 178
i i
i i
i i
“tdj”
i i
2017/2/2
page 179
i i
[63] J. Milnor, Analytic Proofs of the “Hairy Ball Theorem” and the
Brouwer Fixed Point Theorem. The American Mathematical
Monthly, vol. 85, no. 7, pp. 521-524, 1978.
i i
i i
“tdj”
i i
2017/2/2
page 180
i i
i i
i i
“tdj”
i i
2017/2/2
page 181
i i
i i
i i
“tdj”
i i
2017/2/2
page 182
i i
i i
i i
“tdj”
i i
2017/2/2
page 183
i i
Índice
183
i i
i i
“tdj”
i i
2017/2/2
page 184
i i
184 ÍNDICE
i i
i i
“tdj”
i i
2017/2/2
page 185
i i
ÍNDICE 185
Teorema
do ponto fixo de Brouwer,
60
do ponto fixo de Kakutani,
65
forte de dualidade, 152
fraco de dualidade, 152
fundamental da programação
linear, 148
Tucker, Albert W., 11
Utilidade, 11
esperada, 30
Variável
i i
i i