Você está na página 1de 188

“tdj”

i i
2017/2/2
page 1
i i

UMA INTRODUÇÃO À TEORIA


ECONÔMICA DOS JOGOS

Humberto José Bortolossi


Universidade Federal Fluminense

Gilmar Garbugio
Universidade Federal Fluminense

Brı́gida Sartini
Universidade Federal Rural do Rio de Janeiro

VERSÃO 1.1.2
2 de fevereiro de 2017

Por favor, envie suas sugestões, correções e crı́ticas para


hjbortol@vm.uff.br, gilmarg@id.uff.br e brigida.sartini@gmail.com.

i i

i i
“tdj”
i i
2017/2/2
page 2
i i

À minha esposa Joselı́ e à minha filha Hillary Winry.


H. J. B.

À minha mãe Rita e aos meus irmãos Humberto e Reginaldo.


B. A. S.

Aos meus pais Orlando e Iraci e aos meus irmãos Roseli, Rosinei,
Rosana, Carla, Andréia e Reginaldo.
G. G.

i i

i i
“tdj”
i i
2017/2/2
page 3
i i

i i

i i
“tdj”
i i
2017/2/2
page 1
i i

Sumário

Prefácio 3

1 Alguns marcos históricos 5

2 Jogos na forma estratégica 10


2.1 O que é um jogo? . . . . . . . . . . . . . . . . . . . . . 10
2.2 Soluções de um jogo em estratégias puras . . . . . . . 13
2.2.1 Dominância em estratégias puras . . . . . . . . 14
2.2.2 Equilı́brio de Nash em estratégias puras . . . . 20
2.2.3 Relações entre dominância e equilı́brio de Nash 24
2.3 Estratégias mistas . . . . . . . . . . . . . . . . . . . . 27
2.4 Soluções de um jogo em estratégias mistas . . . . . . . 31
2.4.1 Dominância em estratégias mistas . . . . . . . 32
2.4.2 Equilı́brio de Nash em estratégias mistas . . . . 35
2.4.3 Relações entre dominância e equilı́brio de Nash 45
2.4.4 Como interpretar estratégias mistas? . . . . . . 45
2.5 Jogos infinitos . . . . . . . . . . . . . . . . . . . . . . . 48
2.6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 O teorema de equilı́brio de Nash 60


3.1 Usando o teorema de Brouwer . . . . . . . . . . . . . . 60
3.2 Usando o teorema de Kakutani . . . . . . . . . . . . . 65
3.3 Algumas propriedades dos equilı́brios de Nash . . . . . 69
3.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 70

i i

i i
“tdj”
i i
2017/2/2
page 2
i i

2 Sumário

4 Calculando equilı́brios de Nash 71


4.1 Equilı́brio de Nash via um problema de otimização . . 71
4.2 Equilı́brio de Nash via equações polinomiais . . . . . . 74
4.3 Jogos de soma zero . . . . . . . . . . . . . . . . . . . . 82
4.3.1 Jogos de soma constante com dois jogadores . . 82
4.3.2 Equilı́brio de Nash em estratégias puras . . . . 86
4.3.3 Equilı́brio de Nash em estratégias mistas . . . . 91
4.3.4 O teorema minimax de von Neumann . . . . . 93
4.4 Equilı́brio de Nash via um problema de complementa-
ridade . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.1 Jogos bimatriciais . . . . . . . . . . . . . . . . 101
4.4.2 O algoritmo de Lemke-Howson . . . . . . . . . 104
4.5 Gambit . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 106

5 Jogos na forma extensa 108


5.1 Definição . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.2 Equilı́brio de Nash . . . . . . . . . . . . . . . . . . . . 110
5.3 Indução retroativa e equilı́brio perfeito em subjogos . . 114
5.4 O teorema de Kuhn-Zermelo . . . . . . . . . . . . . . 118
5.5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 119

6 Exemplos 120
6.1 O jogo Le Her simplificado . . . . . . . . . . . . . . . . 120
6.2 O modelo de duopólio de Cournot . . . . . . . . . . . 126
6.3 O modelo de duopólio de Bertrand . . . . . . . . . . . 129
6.4 O modelo de duopólio de Stackelberg . . . . . . . . . . 131
6.5 A tragédia dos comuns . . . . . . . . . . . . . . . . . . 133

A Convexidade 137

B Programação Linear 145

C Respostas dos exercı́cios 155

Bibliografia 173

Índice 183

i i

i i
“tdj”
i i
2017/2/2
page 3
i i

Prefácio
A teoria dos jogos é uma teoria matemática criada para se modelar
fenômenos que podem ser observados quando dois ou mais “agentes de
decisão” interagem entre si. Ela fornece a linguagem para a descrição
de processos de decisão conscientes e objetivos envolvendo mais de
um indivı́duo.
Suas aplicações incluem eleições, leilões, balanço de poder, evolu-
ção genética, etc. Ela também é uma teoria matemática pura, que
pode e tem sido estudada como tal, sem a necessidade de relacioná-la
com problemas comportamentais ou jogos per se.
Algumas pessoas acreditam que a teoria dos jogos formará, algum
dia, o alicerce de um conhecimento técnico estrito de como decisões
são feitas e de como a economia funciona. A teoria ainda não atingiu
este patamar e, hoje, é mais estudada em seus aspectos matemáticos
puros e, em aplicações, ela é usada como uma ferramenta ou alegoria
que auxiliam no entendimento de sistemas mais complicados.
Neste texto trataremos da teoria matemática dos jogos não-coope-
rativos estáticos de informação completa e dos jogos dinâmicos de
informação perfeita.
A Teoria Econômica dos Jogos não deve ser confundida com a
Teoria Combinatória dos Jogos, iniciada por Sprague e Grundy na
década de 30. Enquanto que a primeira tem motivações predomi-
nante econômicas e procura estabelecer métodos para se maximizar
o ganho (payoff ), a segunda se concentra nos aspectos combinatórios
de jogos de mesa (por exemplo, a estratégia do jogo de nim) e não
permite “elementos imprevisı́veis” como o lançamento de um dado
ou o embaralhamento de cartas.
Acreditamos que o assunto seja estimulante para o estudante de
matemática: ele terá a oportunidade de ver como conceitos de análise,

i i

i i
“tdj”
i i
2017/2/2
page 4
i i

4 Prefácio

topologia, otimização e probabilidade se integram em uma teoria apli-


cada.

Agradecimentos 1
Gostarı́amos de agradecer a Hilmar Ilton Santana Ferreira, Polya-
ne Alves Santos e Larissa Santana Barreto, que participaram ativa-
mente dos seminários sobre teoria dos jogos realizados no perı́odo
2003-2004, momento no qual uma versão preliminar deste texto foi
escrita. Também gostarı́amos de agradecer a Rita de Cássia Silva
Costa, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, que
leram o texto e fizeram várias sugestões. Finalmente, gostarı́amos de
agradecer a Seção de Referência (SRE) da Divisão de Bibliotecas e
Documentação da PUC-Rio pela agilidade e eficiência na aquisição
de alguns artigos difı́ceis de se encontrar.

Agradecimentos 2
Gostarı́amos de agradecer às várias pessoas que, após a divulgação
da versão Creative Commons deste livro, colaboraram com sugestões:
Doherty Andrade, Carlos Frederico Palmeira.

Humberto José Bortolossi


Brı́gida Alexandre Sartini
Gilmar Garbugio

1 de fevereiro de 2017

i i

i i
“tdj”
i i
2017/2/2
page 5
i i

Capı́tulo 1

Alguns marcos
históricos

Neste capı́tulo apresentaremos alguns marcos históricos da teoria


dos jogos relacionados principalmente com os tópicos que iremos ex-
plorar no texto. Para uma cronologia mais completa, recomendamos
as referências [46, 50, 65, 86, 95, 96].
O conceito de solução de um jogo por estratégia mista1 surgiu pela
primeira vez no estudo do jogo Le Her, realizado por James Walde-
grave e descrito por ele em uma carta a Pierre Rémond de Montmort,
em 13 de novembro de 1713. Em seu estudo, ele procurou encontrar
uma estratégia que maximizasse a probabilidade de vitória do joga-
dor, independentemente da escolha de estratégia de seu oponente.
Este jogo foi discutido por Montmort e por Nicholas Bernoulli em
1713 e os resultados foram publicados nesse ano por Montmort, que
incluiu a solução de Waldegrave em um apêndice.
Em 1838, Augustin Cournot publicou sua obra Recherches sur
les Principes Mathematiques de la Theorie des Richesses, na qual
analisou um caso especial de duopólio. As empresas decidiam as
quantidades a produzir e Cournot definiu o conceito de equilı́brio de
1 Uma estratégia pura é uma das escolhas que o jogador pode fazer. Uma

estratégia mista é uma distribuição de probabilidades sobre o conjunto de es-


tratégias puras. Definições formais serão apresentadas no próximo capı́tulo.

i i

i i
“tdj”
i i
2017/2/2
page 6
i i

6 [CAP. 1: ALGUNS MARCOS HISTÓRICOS

Figura 1.1: Antoine Augustin Cournot (1801–1877).

mercado como sendo a situação em que ambas as empresas reagem


de forma ótima à decisão da empresa concorrente. Este conceito
de solução é uma versão do equilı́brio de Nash aplicado ao caso do
duopólio.
No inı́cio do século XX, apareceram vários artigos sobre teoria dos
jogos. Ernst Zermelo, em 1913, publicou um teorema sobre o jogo
de xadrez no artigo Uber eine Anwendung der Mengenlehre auf die
Theorie des Schachspiels, afirmando que, em cada etapa do jogo, pelo
menos um dos jogadores possui uma estratégia que o levará a vitória
ou ao empate. Contudo, Zermelo não demonstrou o teorema em seu
artigo. A primeira demonstração foi dada por Laszlo Kalmar. Apa-
rentemente, foi Zermelo quem primeiro destacou o uso da semântica
de otimalidade em teoria dos jogos: “Whether one could calculate
with mathematical objectivity, or even give a participant some idea
of, the value of a possible position in the game, as well as of the best
move in this position: information without which the player would
have to eliminate both subjective and psychological guesses and the
opinions of ‘the perfect player’, etc.?” ([95]).
No perı́odo de 1921 a 1927, Émile Borel publicou uma série de
notas sobre jogos simétricos de soma zero com dois jogadores com
um número finito n de estratégias puras para cada jogador. Borel
foi o primeiro a tentar formular matematicamente este jogo. Ele in-
troduziu o conceito de “método de jogada” (o que hoje corresponde
à estratégia pura) e procurou por uma solução em estratégias mis-
tas (o que hoje é conhecido como solução minimax). Em 1921, ele
provou a existência de tal solução para n = 3 ([07]) e, em 1924,

i i

i i
“tdj”
i i
2017/2/2
page 7
i i

Figura 1.2: Ernst Friedrich Ferdinand Zermelo (1871–1953).

para n = 5 ([08]). Borel acreditava que o resultado de existência


não seria válido para um n qualquer, mas como não encontrou um
contra-exemplo, deixou o problema em aberto.

Figura 1.3: Félix Edouard Justin Émile Borel (1871-1956).

No artigo Zur Theorie der Gesellschaftsspiele de 1928, usando


topologia e cálculo funcional ([50]), John von Neumann demonstrou
a existência de solução em estratégias mistas de um jogo finito de
soma zero com dois jogadores e um número arbitrário de estratégias
puras. Este artigo também introduziu a forma extensa de um jogo.
Até a década de 40, os artigos publicados sobre teoria dos jogos
não tinham despertado muito o interesse dos cientistas sociais e de
outras áreas que pesquisavam sobre conflitos de interesses. Talvez
isto se deva ao fato de que os artigos eram escritos por matemáticos
e publicados em revistas matemáticas. Este panorama foi alterado
com a publicação em 1944 do livro Theory of Games and Economic

i i

i i
“tdj”
i i
2017/2/2
page 8
i i

8 [CAP. 1: ALGUNS MARCOS HISTÓRICOS

Behavior, escrito por John von Neumann e pelo economista Oskar


Morgenstern, um marco na teoria dos jogos.

Oskar Morgenstern John von Neumann


(1902-1977) (1903-1957)

Figura 1.4: Oskar Morgenstern e John von Neumann.

Eles detalharam a formulação de problemas econômicos e mostraram


várias possibilidades de aplicação da teoria dos jogos em economia,
procurando apresentar as motivações, os raciocı́nios e as conclusões
da teoria de forma acessı́vel, atraindo assim a atenção de pesquisa-

i i

i i
“tdj”
i i
2017/2/2
page 9
i i

dores de diversas áreas. Na reedição de 1947, tomada como padrão,


os autores estabeleceram os axiomas da teoria da utilidade. O livro
foi republicado em 1953 e sua mais recente edição é de 1980.
Na Universidade de Princeton, John Forbes Nash Jr. escreveu sua
tese de doutorado em 1949, sob o tı́tulo Non-Cooperative Games. Ele
definiu o conceito de ponto de equilı́brio, atualmente conhecido como
equilı́brio de Nash de um jogo e provou sua existência para jogos não-
cooperativos. Os resultados mais importantes de sua tese estão no
artigo Equilibrium Points in N-Person Games de 1950 ([66]) e, mais
detalhadamente, no artigo Non-Cooperative Games de 1951 ([69]).
Ainda em 1950, Nash escreveu sobre o problema da barganha em
The Bargaining Problem ([68]) e, no ano de 1953, sobre jogos coo-
perativos em Two Person Cooperative Games ([70]). Nestes, Nash
definiu o conceito de solução da barganha de Nash em um jogo coo-
perativo com dois jogadores, estabeleceu um sistema de axiomas que
esta solução deveria satisfazer e provou a existência e unicidade desta
solução.
Em 1994, John Harsanyi, John Nash e Reinhard Selten receberam
o Prêmio Nobel de Economia em reconhecimento ao trabalho pioneiro
sobre análise de equilı́brio na teoria de jogos não-cooperativos.

(a) (b) (c)

Figura 1.5: Ganhadores do prêmio Nobel de Economia em 1994:


(a) John Harsanyi (1920-2000), (b) John Forbes Nash Jr.
(1928-2015) e (c) Reinhard Selten (1930-2016).

i i

i i
“tdj”
i i
2017/2/2
page 10
i i

Capı́tulo 2

Jogos na forma
estratégica

2.1 O que é um jogo?


A teoria dos jogos pode ser definida como a teoria dos modelos
matemáticos que estuda a escolha de decisões ótimas sob condições
de conflito. O elemento básico em um jogo é o conjunto de jogadores
que dele participam. Cada jogador tem um conjunto de estratégias.
Quando cada jogador escolhe sua estratégia, temos então uma si-
tuação ou perfil no espaço de todas as situações (perfis) possı́veis.
Cada jogador tem interesse ou preferências para cada situação no
jogo. Em termos matemáticos, cada jogador tem uma função uti-
lidade que atribui um número real (o ganho ou payoff do jogador)
a cada situação do jogo. Mais especificamente, um jogo tem os se-
guintes elementos básicos: existe um conjunto finito de jogadores,
representado por
G = {g1 , g2 , . . . , gn },

e cada jogador gi ∈ G possui um conjunto finito

Si = {si1 , si2 , . . . , simi }

10

i i

i i
“tdj”
i i
2017/2/2
page 11
i i

[SEC. 2.1: O QUE É UM JOGO? 11

de opções, denominadas estratégias puras do jogador gi (mi ≥ 2).


Um vetor
s = (s1j1 , s2j2 , . . . , snjn ),
onde siji é uma estratégia pura para o jogador gi ∈ G, é denomi-
nado um perfil de estratégias puras. O conjunto de todos os perfis de
estratégias puras formam, portanto, o produto cartesiano
n

S= Si = S1 × S2 × · · · × Sn ,
i=1

denominado espaço de estratégias puras do jogo. Para cada joga-


dor gi ∈ G, existe uma função utilidade
ui : S → R
s → ui (s)
que associa o ganho (payoff) ui (s) do jogador gi a cada perfil de
estratégias puras s ∈ S. Esta função utilidade é uma forma de re-
presentar a preferência do jogador gi com relação aos vários perfis de
estratégias do jogo ([13]).
Jogos descritos nesta forma são denominados jogos estratégicos ou
jogos na forma normal . Neles, cada jogador deve fazer a sua escolha
de estratégia sem o conhecimento das escolhas dos demais jogadores.
Admite-se, contudo, que cada jogador conhece toda a estrutura do
jogo. Por este motivo, jogos deste tipo também são denominados
jogos não-cooperativos de informação completa.
Assume-se também que os jogadores sejam racionais, isto é, eles
sempre escolherão ações que maximizem a sua função utilidade. Além
de ser racional, cada jogador (1) sabe que seus adversários também
são racionais, (2) sabe que eles sabem que o jogador sabe que eles são
racionais, ad infinitum.

Exemplo 2.1 (O dilema do prisioneiro) Possivelmente o exem-


plo mais conhecido na teoria dos jogos é o dilema do prisioneiro. Ele
foi formulado por Albert W. Tucker em 1950, em um seminário para
psicólogos na Universidade de Stanford, para ilustrar a dificuldade de
se analisar certos tipos de jogos.
A situação é a seguinte: dois ladrões, Al e Bob, são capturados
e acusados de um mesmo crime. Presos em selas separadas e sem

i i

i i
“tdj”
i i
2017/2/2
page 12
i i

12 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

poderem se comunicar entre si, o delegado de plantão faz a seguinte


proposta: cada um pode escolher entre confessar ou negar o crime.
Se nenhum deles confessar, ambos serão submetidos a uma pena de
1 ano. Se os dois confessarem, então ambos terão pena de 5 anos. Mas
se um confessar e o outro negar, então o que confessou será libertado
e o outro será condenado a 10 anos de prisão. Neste contexto, temos
G = {Al, Bob},
SAl = {confessar, negar}, SBob = {confessar, negar},
S = SAl × SBob =
{(confessar, confessar), (confessar, negar),
(negar, confessar), (negar, negar)}.
As duas funções utilidade
uAl : S → R e uBob : S → R
são dadas por
uAl (confessar, confessar) = −5, uAl (confessar, negar) = 0,
uAl (negar, confessar) = −10, uAl (negar, negar) = −1,
(que representam os ganhos de Al) e
uBob (confessar, confessar) = −5, uBob (confessar, negar) = −10,
uBob (negar, confessar) = 0, uBob (negar, negar) = −1

(que representam os ganhos de Bob). É uma prática representar os


payoffs dos jogadores através de uma matriz, denominada matriz de
payoffs.
Bob
confessar negar
confessar (−5, −5) (0, −10)
Al

negar (−10, 0) (−1, −1)

Nesta matriz, os números de cada célula representam, respectiva-


mente, os payoffs de Al e Bob para as escolhas de Al e Bob corres-
pondentes a célula.

i i

i i
“tdj”
i i
2017/2/2
page 13
i i

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 13

Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulher


desejam sair para passear. O homem prefere assistir a um jogo de
futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem
juntos para o futebol, então o homem tem satisfação maior do que a
mulher. Por outro lado, se eles forem juntos ao cinema, então a mu-
lher tem satisfação maior do que o homem. Finalmente, se eles saı́rem
sozinhos, então ambos ficam igualmente insatisfeitos. Esta situação
também pode ser modelada como um jogo estratégico. Temos:

G = {homem, mulher},
Shomem = {futebol, cinema}, Smulher = {futebol, cinema},
S = Shomem × Smulher =
{(futebol, futebol), (futebol, cinema),
(cinema, futebol), (cinema, cinema)}.

As duas funções utilidade uhomem : S → R e umulher : S → R são


descritas pela seguinte matriz de payoffs:
Mulher
futebol cinema
futebol (10, 5) (0, 0) .
Homem

cinema (0, 0) (5, 10)

2.2 Soluções de um jogo em estratégias


puras
Uma solução de um jogo é uma prescrição ou previsão sobre o re-
sultado do jogo. Existem vários conceitos diferentes de solução. Nesta
seção, investigaremos os dois conceitos mais comuns: dominância e
equilı́brio de Nash.
Considere o dilema do prisioneiro. Como encontrar uma solução
para o dilema de Al e Bob, isto é, que estratégias são plausı́veis

i i

i i
“tdj”
i i
2017/2/2
page 14
i i

14 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

se os dois prisioneiros querem minimizar1 o tempo de cadeia? Se


analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da
seguinte maneira:

“Duas coisas podem acontecer: Bob pode confessar ou


Bob pode negar. Se Bob confessar, então é melhor para
mim confessar também. Se Bob não confessar, então eu
fico livre se eu confessar. Em qualquer um dos casos, é
melhor para mim confessar. Então, eu confessarei.”

Se analisarmos agora o jogo do ponto de vista de Bob, podemos


aplicar a mesma linha de raciocı́nio e concluir que Bob também irá
confessar. Assim, ambos confessarão e ficarão presos por 5 anos.
Em termos da teoria dos jogos, dizemos que (1) os dois joga-
dores possuem uma estratégia dominante, isto é, todas menos uma
estratégia é estritamente dominada, (2) que o jogo é resolúvel por do-
minância estrita iterada e (3) que o jogo termina em uma solução que
é um equilı́brio de estratégia dominante, conceitos que definiremos a
seguir.

2.2.1 Dominância em estratégias puras


Freqüentemente, iremos discutir perfis de estratégia na qual ape-
nas a estratégia de um único jogador gi ∈ G irá variar, enquanto que
as estratégias de seus oponentes permanecerão fixas. Denote por

s−i = (s1j1 , . . . , s(i−1)ji−1 , s(i+1)ji+1 , . . . , snjn ) ∈


S−i = S1 × · · · × Si−1 × Si+1 × · · · × Sn

uma escolha de estratégia para todos os jogadores, menos o jogador gi .


Desta maneira, um perfil de estratégias pode ser convenientemente
denotado por

s = (siji , s−i ) = (s1j1 , . . . , s(i−1)ji−1 , siji , s(i+1)ji+1 , . . . , snjn ).

1 No Exemplo 2.1, os payoffs foram definidos como números ≤ 0. Desta ma-

neira, minimizar o tempo de cadeia é equivalente a maximizar o payoff.

i i

i i
“tdj”
i i
2017/2/2
page 15
i i

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 15

Definição 2.1 (Estratégia Pura Estritamente Domi-


nada) Dizemos que uma estratégia pura sik ∈ Si do joga-
dor gi ∈ G é estritamente dominada pela estratégia sik ∈ Si se,
independentemente das escolhas dos demais jogadores, o joga-
dor gi ganhar mais escolhendo sik do que sik , isto é, se

ui (sik , s−i ) > ui (sik , s−i ),

para todo s−i ∈ S−i .

Definição 2.2 (em estratégias puras)


(a) (Dominância Estrita Iterada) Dominância estrita ite-
rada é o processo no qual, seqüencialmente, se eliminam as
estratégias que são estritamente dominadas.
(b) (Equilı́brio de Estratégia Estritamente Dominan-
te) Quando o processo de dominância estrita iterada reduz
o jogo para um único perfil de estratégias puras s∗ , dizemos
que s∗ é um equilı́brio de estratégia estritamente dominante.

Exemplo 2.3 Considere o jogo determinado pela matriz de payoffs


abaixo.
g2
s21 s22 s23 s24
s11 (5, 2) (2, 6) (1, 4) (0, 4)

s12 (0, 0) (3, 2) (2, 1) (1, 1)


g1
s13 (7, 0) (2, 2) (1, 1) (5, 1)

s14 (9, 5) (1, 3) (0, 2) (4, 8)

i i

i i
“tdj”
i i
2017/2/2
page 16
i i

16 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Neste jogo, para o jogador g2 , a estratégia s21 é estritamente domi-


nada pela estratégia s24 e, assim, a primeira coluna da matriz pode
ser eliminada.
g2
s22 s23 s24
s11 (2, 6) (1, 4) (0, 4)

s12 (3, 2) (2, 1) (1, 1)


g1
s13 (2, 2) (1, 1) (5, 1)

s14 (1, 3) (0, 2) (4, 8)

Agora, nesta matriz reduzida, para o jogador g1 , as estratégias s11


e s14 são estritamente dominadas pelas estratégias s12 e s13 , respec-
tivamente. Portanto, as linhas 1 e 4 podem ser eliminadas. Além
disso, a estratégia s23 do jogador g2 é estritamente dominada pela es-
tratégia s22 . Assim, a coluna 2 também pode ser eliminada. Obtemos
então uma matriz reduzida 2 × 2.
g2
s22 s24
s12 (3, 2) (1, 1)
g1
s13 (2, 2) (5, 1)

Finalmente, a estratégia s24 do jogador g2 é estritamente dominada


pela estratégia s22 e, na matriz 2 × 1 resultante, a estratégia s13 do
jogador g1 é estritamente dominada pela estratégia s12 . Vemos então
que (s12 , s22 ) é o equilı́brio de estratégias estritamente dominantes do
jogo: o jogador g1 escolhe a estratégia s12 (ganhando 3) e o jogador g2
escolhe a estratégia s22 (ganhando 2).

Note que, em cada passo do processo de eliminação das estratégias


estritamente dominadas, o jogo é substituı́do por um outro jogo

i i

i i
“tdj”
i i
2017/2/2
page 17
i i

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 17

mais simples, no sentido de que o conjunto de estratégias puras


de um jogador (aquele que tem uma estratégia estritamente domi-
nada) é substituı́do por um subconjunto com menos elementos (ob-
tido removendo-se justamente as estratégias que são estritamente do-
minadas). No exemplo acima, os conjuntos de estratégias puras ini-
ciais dos dois jogadores são dados, respectivamente, por

S1 = {s11 , s12 , s13 , s14 } e S2 = {s21 , s22 , s23 , s24 }.

Como a estratégia pura s21 é estritamente dominada por s24 , o con-


junto S2 é substituı́do por {s22 , s23 , s24 } = S2 − {s21 }. O conjunto S1
permanece o mesmo. Sendo assim, podemos substituir o jogo original
por um mais simples, onde os conjuntos de estratégias puras dos dois
jogadores são dados por
(1) (1)
S1 = {s11 , s12 , s13 , s14 } e S2 = {s22 , s23 , s24 }.

As funções utilidade do novo jogo são as restrições das funções utili-


dade do jogo original aos novos conjuntos de estratégias puras:

u1 |S (1) e u2 |S (1) .
1 2

Para o novo jogo, vemos que as estratégias s11 e s14 são estritamente
dominadas pelas estratégias s12 e s13 , respectivamente. Logo, pode-
mos simplificar o jogo mais uma vez, considerando os conjuntos de
estratégias puras
(2) (2)
S1 = {s12 , s13 } e S2 = {s22 , s23 , s24 }.

Seguindo com as outras eliminações, terminamos com um jogo muito


simples, onde cada conjunto de estratégias puras é unitário:
(5) (5)
S1 = {s12 } e S2 = {s22 }.

Este processo de eliminação gerou, portanto, uma cadeia de espaços


de estratégias puras:

(1) (1) (2) (2)


S = S1 × S2  S (1) = S1 × S2  S (2) = S1 × S2  ···
(5) (5)
 S (5) = S1 × S2 = {(s12 , s22 )}.

i i

i i
“tdj”
i i
2017/2/2
page 18
i i

18 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Neste exemplo, a técnica de dominância estrita iterada forneceu um


único perfil de estratégias como solução do jogo, no caso, o perfil
(5) (5)
(s12 , s22 ) ∈ S1 × S2 .
Contudo, pode acontecer da técnica fornecer vários perfis ou, até
mesmo, fornecer todo o espaço de estratégias, como é o caso da bata-
lha dos sexos, onde não existem estratégias estritamente dominadas.

Um outro conceito importante é o de estratégia pura fracamente


dominada.

Definição 2.3 (Estratégia Pura Fracamente Domi-


nada) Dizemos que uma estratégia pura sik ∈ Si do joga-
dor gi ∈ G é fracamente dominada pela estratégia sik ∈ Si
se
ui (sik , s−i ) ≥ ui (sik , s−i ),
para todo s−i ∈ S−i e, pelo menos para algum s•−i ∈ S−i ,

ui (sik , s•−i ) > ui (sik , s•−i ).

Em outras palavras, sik ∈ Si é fracamente dominada por


sik ∈ Si se, independentemente das escolhas dos demais joga-
dores, o jogador gi nada perde se trocar a estratégia sik ∈ Si
pela estratégia sik ∈ Si e, pelo menos para uma escolha dos
demais jogadores, esta troca dá ao jogador gi um ganho maior.

Definição 2.4
(a) (Dominância Fraca Iterada) Dominância fraca iterada
é o processo no qual, seqüencialmente, se eliminam as es-
tratégias que são fracamente dominadas.
(b) (Equilı́brio de Estratégia Fracamente Dominante)
Quando o processo de dominância fraca iterada reduz o jogo
para um único perfil de estratégias puras s∗ , dizemos que
s∗ é um equilı́brio de estratégia fracamente dominante.

i i

i i
“tdj”
i i
2017/2/2
page 19
i i

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 19

Exemplo 2.4 Considere o jogo cuja matriz de payoffs é dada por:

g2
s21 s22
s11 (1, 1) (1, 0) .
g1
s12 (1, 0) (0, 1)

A estratégia s12 do jogador g1 é fracamente dominada pela estra-


tégia s11 . Eliminando-a, obtemos a matriz reduzida:

g2
s21 s22
.
g1 s11 (1, 1) (1, 0)

Vemos agora que a estratégia s22 do jogador 2 é estritamente do-


minada pela estratégia s21 . Sendo assim, (s11 , s21 ) é o equilı́brio de
estratégias fracamente dominadas do jogo.

Uma pergunta natural é se o processo de eliminação das estratégias


dominadas depende ou não da ordem em que são realizadas. Para
o caso de estratégias estritamente dominadas, pode-se mostrar que
esta ordem é irrelevante, isto é, independentemente da ordem em
que as estratégias (estritamente dominadas) são eliminadas, obtém-se
sempre a mesma matriz reduzida no final do processo. Por outro lado,
o processo de eliminação das estratégias fracamente dominadas pode
conduzir a resultados diferentes, dependendo da ordem de eliminação.
Considere, por exemplo, o jogo (conforme [32]):

g2
s21 s22 s23
s11 (0, 2) (0, 0) (1, 0) .
g1
s12 (0, 3) (1, 0) (0, 0)

i i

i i
“tdj”
i i
2017/2/2
page 20
i i

20 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Eliminando-se, em sequência, as estratégias s23 (que é estritamente


dominada por s21 ), s11 (que é fracamente dominada por s12 ) e s22
(que é estritamente dominada por s21 ), obtemos (s12 , s21 ) como res-
posta. Agora, eliminando-se, em sequência, as estratégias s22 (que
é estritamente dominada por s21 ), s12 (que é fracamente dominada
por s11 ) e s23 (que é estritamente dominada por s21 ), obtemos outra
resposta: (s11 , s21 ). Para detalhes sobre este assunto, recomendamos
as referências [01, 15, 26, 32, 47, 55].
Com relação à complexidade computacional, os resultados mos-
tram que os problemas relacionados com estratégias estritamente do-
minadas tendem a ser mais fáceis (no sentido que eles podem ser
resolvidos em tempo polinomial), enquanto que questões envolvendo
estratégias fracamente dominadas são mais difı́ceis (no sentido que
eles são NP-completos). Por exemplo, saber se uma dada submatriz
de uma matriz de payoffs pode ser obtida através do processo de
eliminação de estratégias dominadas é um problema polinomial para
o caso de estratégias estritamente dominadas e é um problema NP-
Completo para o caso de estratégias fracamente dominadas. Detalhes
sobre o assunto podem ser encontrados nas referências [18, 33].

2.2.2 Equilı́brio de Nash em estratégias puras


Uma solução estratégica ou equilı́brio de Nash de um jogo é um
perfil de estratégias onde cada jogador não tem incentivo de mudar
sua estratégia se os demais jogadores não o fizerem.

Definição 2.5 (Equilı́brio de Nash) Dizemos que um perfil


de estratégias

s∗ = (s∗1 , . . . , s∗(i−1) , s∗i , s∗(i+1) , . . . , s∗n ) ∈ S

é um equilı́brio de Nash se

ui (s∗i , s∗−i ) ≥ ui (siji , s∗−i )

para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi ≥ 2.

i i

i i
“tdj”
i i
2017/2/2
page 21
i i

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 21

Exemplo 2.5
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias
(confessar, confessar) é um equilı́brio de Nash. De fato:

uAl (confessar, confessar) = −5 > −10 = uAl (negar, confessar)

uBob (confessar, confessar) = −5 > −10 = uBob (confessar, negar).

Estas desigualdades mostram que, para o perfil de estratégias


(confessar, confessar), um prisioneiro não se sente motivado a
mudar a sua estratégia se o outro não o fizer (ele não vai ficar
menos tempo na cadeia fazendo isto).
Já o perfil (negar, confessar) não é um equilı́brio de Nash do
jogo pois, neste caso, dado que Bob decide confessar, Al fica
menos tempo na cadeia se mudar a sua estratégia de negar para
confessar. Em outras palavras, para o perfil (negar, confessar),
Al se sente motivado a mudar a sua estratégia se Bob não o fizer.
Os perfis (confessar, negar) e (negar, negar) também não são
equilı́brios de Nash. Em (confessar, negar), Bob se sente moti-
vado a mudar a sua estratégia se Al não o fizer e, em (negar,
negar), cada um dos prisioneiros se sente motivado a mudar a
sua estratégia se o outro não o fizer. Desta maneira, vemos que
o único equilı́brio de Nash do jogo é (confessar, confessar).

(b) Na batalha dos sexos (Exemplo 2.2), os perfis de estratégia (fu-


tebol, futebol) e (cinema, cinema) são os únicos equilı́brios de
Nash do jogo.

(c) No Exemplo 2.3, o único equilı́brio de Nash do jogo é o perfil de


estratégias (s12 , s22 ).

Existem, contudo, jogos que não possuem equilı́brios de Nash em


estratégias puras. Este é o caso, por exemplo, do jogo de comparar
moedas (matching pennies).

i i

i i
“tdj”
i i
2017/2/2
page 22
i i

22 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Exemplo 2.6 (Comparar moedas) Nesse jogo, dois jogadores exi-


bem, ao mesmo tempo, a moeda que cada um esconde em sua mão.
Se ambas as moedas apresentam cara ou coroa, o segundo jogador
dá sua moeda para o primeiro. Se uma das moedas apresenta cara,
enquanto a outra apresenta coroa, é a vez do primeiro jogador dar
sua moeda para o segundo. Esse jogo se encontra representado por
sua matriz de payoffs dada abaixo.
g2
s21 s22
s11 (+1, −1) (−1, +1)
g1
s12 (−1, +1) (+1, −1)

Observe que o perfil de estratégias (s11 , s21 ) não é um equilı́brio de


Nash em estratégias puras, pois se o jogador g1 mantiver a sua es-
tratégia s11 , o jogador g2 terá um ganho maior se mudar sua es-
tratégia de s21 para s22 , isto é, ele se sente motivado a mudar a sua
estratégia se o jogador g1 não mudar a sua escolha. O mesmo com-
portamento ocorre para o perfil de estratégias (s12 , s22 ). Já, para os
perfis (s11 , s22 ) e (s12 , s21 ), é o jogador g1 que se sente motivado a
mudar de estratégia para ganhar mais, se o jogador g2 mantiver a sua
estratégia. Isto mostra que o jogo de comparar moedas não possui
equilı́brios de Nash em estratégias puras.

Existe uma maneira conveniente de se caracterizar equilı́brios de


Nash através das funções de melhor resposta. De maneira informal,
a melhor resposta de um jogador para uma determinada escolha de
estratégias dos demais jogadores é o conjunto de estratégias do jo-
gador que maximizam o seu ganho quando os demais jogadores não
mudam as suas escolhas. Mais precisamente, temos a seguinte

Definição 2.6 (Funções de melhor resposta) A função de


melhor resposta do jogador gi é a aplicação

MRi : S−i → 2Si

i i

i i
“tdj”
i i
2017/2/2
page 23
i i

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 23

definida por

MRi (s−i ) = argmaxsi ∈Si ui (si , s−i )


= {s∗i ∈ Si | ∀si ∈ Si , ui (s∗i , s−i ) ≥ ui (si , s−i )},

com s−i ∈ S−i (aqui 2Si representa o conjunto das partes de Si ).


A função de melhor resposta do jogo é a aplicação

MR : S → 2S

definida por

MR(s) = (MR1 (s−1 ), MR2 (s−2 ), . . . , MRn (s−n )),

com s ∈ S. Observação: alguns autores usam as notações


MRi : S−i ⇒ Si e MRi : S−i →→ Si para representar a função
de melhor resposta MRi : S−i → 2Si .

Exemplo 2.7
(a) No dilema do prisioneiro (Exemplo 2.1), temos
MRAl : SBob →→ SAl
confessar → {confessar}
negar → {confessar}

MRBob : SAl →→ SBob


confessar → {confessar}
negar → {confessar}.

(b) Na batalha dos sexos (Exemplo 2.2), temos


MRHomem : SMulher →→ SHomem
futebol → {futebol}
cinema → {cinema}

MRMulher : SHomem →→ SMulher


futebol → {futebol}
cinema → {cinema}.

i i

i i
“tdj”
i i
2017/2/2
page 24
i i

24 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

(c) No Exemplo 2.3, temos

MR1 (s21 ) = {s14 }, MR1 (s22 ) = {s12 },


MR1 (s23 ) = {s12 }, MR1 (s24 ) = {s13 },
MR2 (s11 ) = {s22 }, MR2 (s12 ) = {s22 },
MR2 (s13 ) = {s22 }, MR2 (s14 ) = {s24 }.

(d) No jogo de comparar moedas (Exemplo 2.6), temos

MR1 (s21 ) = {s11 }, MR1 (s22 ) = {s12 },


MR2 (s11 ) = {s22 }, MR2 (s12 ) = {s21 }.

A próxima proposição é uma consequência direta das definições


de equilı́brio de Nash e funções de melhor resposta.

Proposição 2.1 s∗ = (s∗1 , . . . , s∗i , . . . , s∗n ) ∈ S é um equilı́brio


de Nash em estratégias puras se, e somente se, s∗i ∈ MRi (s∗−i )
para todo i = 1, . . . , n.

Observação. Como vimos, nem sempre um jogo possui um equi-


lı́brio de Nash em estratégias puras. Contudo, é possı́vel garantir
esta existência para certos tipos de jogos com estruturas especiais.
O leitor interessado pode consultar os jogos descritos nos artigos [28,
61, 80, 94]. Para resultados quantitativos, veja [60].

2.2.3 Relações entre dominância e equilı́brio de


Nash

Proposição 2.2 O processo de dominância estrita iterada não


pode eliminar um equilı́brio de Nash ao simplificar um jogo.

Demonstração: Lembramos que, em cada etapa do processo de eli-


minação de estratégias estritamente dominadas, o conjunto de es-
tratégias puras de algum jogador é substituı́do por um subconjunto

i i

i i
“tdj”
i i
2017/2/2
page 25
i i

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 25

com menos elementos, obtido removendo-se as estratégias do jogador


que são estritamente dominadas. Cada eliminação gera um espaço de
estratégias puras com menos elementos o que, sucessivamente, sim-
plifica o jogo original:

(1)
S = S1 × · · · × Sn  S (1) = S1 × · · · × Sn(1) 
(k)
· · ·  S (k) = S1 × · · · × Sn(k) .

Com esta notação, o enunciado da proposição pode ser colocado as-


sim: se s∗ ∈ S é um equilı́brio de Nash, então s∗ ∈ S (k) .
A demonstração será feita por contradição: suponha, por absurdo,
que exista s∗ = (s∗1 , . . . , s∗n ) ∈ S tal que s∗ é um equilı́brio de Nash,
mas s∗ ∈ S (k) . Isto significa que existe i tal que s∗i ∈ Si mas
(l)

s∗i ∈ Si
(l+1) (0)
para algum l = 0, . . . , k − 1 (se l = 0, defina Si = Si ).
Sem perda de generalidade, vamos supor que esta propriedade ocorre
pela primeira vez para o ı́ndice i, isto é, s∗i é a primeira estratégia do
perfil de estratégias

s∗ = (s∗1 , . . . , s∗(i−1) , s∗i , s∗(i+1) , . . . , s∗n )

que é eliminada por uma estratégia estritamente dominante. Sendo


assim, existe s•i ∈ Si tal que
(l)

ui (s∗i , s−i ) < ui (s•i , s−i )

para todo s−i ∈ S−i . Como s∗i é a primeira estratégia a ser eliminada,
(l)

isto significa que s∗−i ∈ S−i e, portanto,


(l)

ui (s∗i , s∗−i ) < ui (s•i , s∗−i ).

Mas isto é um absurdo pois, por hipótese, s∗ = (s∗i , s∗−i ) é um


equilı́brio de Nash.

Proposição 2.3 Se o processo de dominância estrita iterada


deixa apenas um único perfil de estratégias puras s∗ , então s∗
é o único equilı́brio de Nash do jogo.

i i

i i
“tdj”
i i
2017/2/2
page 26
i i

26 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Demonstração: Suponha que o processo de dominância estrita iterada


gere uma cadeia de espaços de estratégias puras
(1)
S = S1 × · · · × Sn  S (1) = S1 × · · · × Sn(1) 
(k)
· · ·  S (k) = S1 × · · · × Sn(k) ,

onde o último conjunto da cadeia é unitário:

S (k) = S1 × · · · × Sn(k) = {s∗ } = {(s∗1 , . . . , s∗i , . . . , s∗n )}.


(k)

Note que, em particular, s∗1 ∈ S1 , s∗2 ∈ S2 , . . . , s∗n ∈ Sn , para


(l) (l) (l)

todo l = 0, . . . , k. Vamos mostrar que, nesta situação, s∗ é o único


equilı́brio de Nash do jogo. De fato, basta mostrar que s∗ é um
equilı́brio de Nash, pois a unicidade é uma consequência direta da
Proposição 2.2. Suponha então, por absurdo, que s∗ não seja um
equilı́brio de Nash. Neste caso, devem existir ı́ndice i e estratégia

i ∈ Si , com si = si , tais que
pura s[1] [1]

ui (s∗i , s∗−i ) < ui (s[1] ∗


i , s−i ).


e dado que s∗ι ∈ Sι para todo ι = 1, . . . n
(l)
i , s−i ) ∈ S
Dado que (s[1] (k)

e para todo l = 0, . . . , k, segue-se que a estratégia s[1] i é estritamente


dominada por alguma outra estratégia s[2] i ∈ S i . Segue-se então que,
∗ ∗
em particular, ui (s[1]
i , s−i ) < u (s
i i
[2]
, s −i ) e, portanto,

ui (s∗i , s∗−i ) < ui (s[1] ∗ ∗


i , s−i ) < ui (si , s−i ).
[2]

Note que, por causa destas desigualdades, segue-se que s[2] i = si e


[1]

si = s∗i . Como (si , s∗−i ) também não pertence a S (k) , segue-se que a
[2] [2]

i é estritamente dominada por uma outra estratégia si ∈


estratégia s[2] [3]

Si . Sendo assim, ui (si , s∗−i ) < ui (si , s∗−i ) e, portanto,


[2] [3]

ui (s∗i , s∗−i ) < ui (s[1] ∗ [2] ∗ [3] ∗


i , s−i ) < ui (si , s−i ) < ui (si , s−i ).

Como antes, destas desigualdades, segue-se que s[3] i = si , si = si e


[2] [3] [1]


si = si . Prosseguindo desta maneira, construirı́amos uma sequência
[3]

infinita (s[1] [2] [3] [r]


i , si , si , . . . , si , . . .) de estratégias puras distintas do jo-
gador gi satisfazendo as desigualdades

ui (s∗i , s∗−i ) < ui (s[1] ∗ ∗


i , s−i ) < · · · < ui (si , s−i ) < · · · .
[r]

i i

i i
“tdj”
i i
2017/2/2
page 27
i i

[SEC. 2.3: ESTRATÉGIAS MISTAS 27

Mas isto é um absurdo, pois Si é um conjunto finito.

A recı́proca da Proposição 2.3 é falsa, isto é, mesmo que o jogo


tenha um único equilı́brio de Nash, ele não é necessariamente obtido a
partir do processo de dominância estrita iterada. O jogo cuja matriz
de payoffs é

g2
s21 s22 s23
s11 (−1, +1) (+1, −1) (−1, +1)

g1 s12 (+1, −1) (−1, +1) (+1, −1)

s13 (−1, +1) (+1, −1) (+5, +5)

fornece um contra-exemplo: s∗ = (s13 , s23 ) é o único equilı́brio de


Nash do jogo, mas não existem estratégias estritamente dominadas.
A Proposição 2.2 é falsa se trocarmos dominância estrita por do-
minância fraca, isto é, o processo de dominância fraca iterada pode
eliminar um equilı́brio de Nash (veja o exercı́cio [10] na página 58
para um contra-exemplo). Se o processo de dominância fraca iterada
reduz o jogo para apenas um único perfil de estratégias (como na
Proposição 2.3), então este perfil é obrigatoriamente um equilı́brio de
Nash, contudo, ele não é necessariamente o único equilı́brio de Nash
do jogo.

2.3 Estratégias mistas


Como vimos no jogo de comparar moedas do Exemplo 2.6, existem
jogos que não possuem equilı́brios de Nash em estratégias puras. Uma
alternativa para estes casos é a de considerar o jogo do ponto de vista
probabilı́stico, isto é, ao invés de escolher um perfil de estratégias
puras, o jogador deve escolher uma distribuição de probabilidade sobre
suas estratégias puras.
Uma estratégia mista pi para o jogador gi ∈ G é uma distribuição
de probabilidades sobre o conjunto Si de estratégias puras do jogador,

i i

i i
“tdj”
i i
2017/2/2
page 28
i i

28 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

isto é, pi é um elemento do conjunto


 mi


Δmi = (x1 , . . . , xmi ) ∈ Rmi | x1 ≥ 0, . . . , xmi ≥ 0 e xk = 1 .
k=1

Assim, se pi = (pi1 , pi2 , . . . , pimi ), então


mi

pi1 ≥ 0, pi2 ≥ 0, ..., pimi ≥ 0 e pik = 1.
k=1

Note que cada Δmi é um conjunto compacto e convexo. Nas


Figuras 2.1 e 2.2 temos os desenhos de Δ2 e Δ3 , respectivamente. Os
pontos extremos (vértices) de Δmi , isto é, os pontos da forma

e1 = (1, 0, . . . , 0, 0), e2 = (0, 1, . . . , 0, 0), . . . , emi = (0, 0, . . . , 0, 1)

dão, respectivamente, probabilidade 1 às estratégias puras si1 , si2 ,


. . . , simi . Desta maneira, podemos considerar a distribuição de pro-
babilidade ek como a estratégia mista que representa a estratégia
pura sik do jogador gi .

x2
1

0 1 x1

 
Figura 2.1: Δ2 = (x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1 .

i i

i i
“tdj”
i i
2017/2/2
page 29
i i

[SEC. 2.3: ESTRATÉGIAS MISTAS 29

x3

0 1 x2

1
x1


Figura 2.2: Δ3 = (x1 , x2 , x3 ) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 +
x2 + x3 = 1}.

O espaço de todos os perfis de estratégia mista é o produto car-


tesiano
Δ = Δm1 × Δm2 × · · · × Δmn ,
denominado espaço de estratégias mistas. Como o produto cartesiano
de conjuntos compactos e convexos é compacto e convexo, vemos que
Δ é compacto e convexo.
Um vetor p ∈ Δ é denominado um perfil de estratégias mistas.
Como no caso de estratégias puras, usaremos a notação p−i para
representar as estratégias mistas de todos os jogadores, excluindo-se
a do jogador gi . Desta maneira, escreveremos

(pi , p−i )

para representar p = (p1 , . . . , pi , . . . , pn ). Como a estratégia pura sik


pode ser identificada com a distribuição de probabilidades que dá
peso 1 a sik e peso 0 às demais estratégias do jogador gi , usaremos

(sik , p−i )

i i

i i
“tdj”
i i
2017/2/2
page 30
i i

30 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

como uma notação alternativa para o perfil de estratégias mistas


(ek , p−i ). Do mesmo modo, usaremos
(pi , s−i )
para indicar o perfil de estratégias mistas onde o jogador gi escolhe
a distribuição de probabilidades pi e os demais jogadores escolhem
distribuições que dão peso 1 às estratégias puras em s−i .
Cada perfil de estratégias mistas p = (p1 , . . . , pn ) ∈ Δ determina
um payoff esperado (utilidade esperada), uma média dos payoffs pon-
derada pelas distribuições de probabilidades p1 , . . . , pn . Mais preci-
samente, se
p = (p1 , p2 , . . . , pn )
= (p11 , p12 , . . . , p1m1 ; p21 , p22 , . . . , p2m2 ; . . . ; pn1 , pn2 , . . . , pnmn ),




p1 p2 pn

então
m1 
 m2 mn

ui (p) = ··· p1j1 · p2j2 · · · pnjn · ui (s1j1 , s2j2 , . . . , snjn ).
j1 =1 j2 =1 jn =1
(2.1)
Cuidado com o abuso de notação: estamos usando ui para representar
a função utilidade tanto em estratégias puras quanto em estratégias
mistas.
Como exemplo, considere o jogo de comparar moedas na pági-
na 22. Se g1 escolhe a distribuição de probabilidade p1 = (1/4, 3/4)
e g2 escolhe a distribuição de probabilidade p2 = (1/3, 2/3), então
os payoffs esperados associados ao perfil de estratégias mistas p =
(p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) são dados por

2 
2
u1 (p) = p1j1 · p2j2 · u1 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 · p21 · u1 (s11 , s21 ) + p11 · p22 · u1 (s11 , s22 ) +
p12 · p21 · u1 (s12 , s21 ) + p12 · p22 · u1 (s12 , s22 )
1 1 1 2 3 1 3 2
= · · (+1) + · · (−1) + · · (−1) + · · (+1)
4 3 4 3 4 3 4 3
1
= +
6

i i

i i
“tdj”
i i
2017/2/2
page 31
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 31

e, analogamente,


2 
2
u2 (p) = p1j1 · p2j2 · u2 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 · p21 · u2 (s11 , s21 ) + p11 · p22 · u2 (s11 , s22 ) +
p12 · p21 · u2 (s12 , s21 ) + p12 · p22 · u2 (s12 , s22 )
1 1 1 2 3 1 3 2
= · · (−1) + · · (+1) + · · (+1) + · · (−1)
4 3 4 3 4 3 4 3
1
= − .
6

Observação. Se p∗ = (p∗i , p∗−i ) ∈ Δ, então a função x → ui (x, p∗−i )


preserva combinações convexas. Mais precisamente, se x1 , . . . , xr ∈
Δmi e λ1 , . . . , λr são escalares não-negativos com rk=1 λk = 1, então
r  r
 

ui λk · xk , p−i = λk · ui (xk , p∗−i ). (2.2)
k=1 k=1

Em particular, se
mi

p∗i = (p∗i1 , . . . , p∗imi ) = p∗ik · ek , (2.3)
k=1

com ek o k-ésimo vetor da base canônica de Rmi , então


m  mi
 i 
∗ ∗ ∗ ∗ ∗
ui (p ) = ui (pi , p−i ) = ui pik · ek , p−i = p∗ik · ui (ek , p∗−i ).
k=1 k=1
(2.4)

2.4 Soluções de um jogo em estratégias


mistas
Todos os critérios básicos para soluções de jogos em estratégias
puras podem ser estendidos para estratégias mistas.

i i

i i
“tdj”
i i
2017/2/2
page 32
i i

32 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

2.4.1 Dominância em estratégias mistas

Definição 2.7 (Estratégia Mista Estritamente Domi-


nada) Dizemos que uma estratégia mista pi ∈ Δmi do joga-
dor gi ∈ G é estritamente dominada pela estratégia pi ∈ Δmi
se, independentemente das escolhas de distribuições de proba-
bilidade dos demais jogadores, o jogador gi ganha mais esco-
lhendo pi do que pi , isto é, se

ui (pi , p−i ) > ui (pi , p−i ),

para todo p−i ∈ Δ−i = Δm1 ×· · ·×Δmi−1 ×Δmi+1 ×· · ·×Δmn .

Como os payoffs ui (pi , p−i ) e ui (pi , p−i ) são, respectivamente,


combinações convexas dos payoffs ui (pi , s−i ) e ui (pi , s−i ),
segue-se que a condição acima é equivalente a

ui (pi , s−i ) > ui (pi , s−i ),

para todos perfis de estratégias puras s−i ∈ S−i .

Exemplo 2.8 ([30], página 21) Considere o jogo com a seguinte


matriz de payoffs:

g2
s21 s22
s11 (5, 3) (0, 0)
.
g1 s12 (0, 0) (5, 3)

s13 (2, 1) (2, 1)

A estratégia mista p1 = (0, 0, 1) ∈ Δ3 do jogador g1 é estritamente

i i

i i
“tdj”
i i
2017/2/2
page 33
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 33

dominada pela estratégia mista p1 = (1/2, 1/2, 0) ∈ Δ3 , pois


 
1 1 5 5 5
u1 (p1 , p2 ) = u1 , , 0; p21 , p22 = · p21 + · p22 =
2 2 2 2 2

 

>
u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 2 · p21 + 2 · p22 = 2

para todo p2 = (p21 , p22 ) ∈ Δ2 . Como p1 = (0, 0, 1) representa


a estratégia pura s13 do jogador g1 , este exemplo também mostra
que uma estratégia pura pode não ser dominada por nenhuma outra
estratégia puras mas, ainda sim, ser dominada por uma estratégia
mista.

Exemplo 2.9 ([31], página 7) Uma estratégia mista que atribui


probabilidade positiva para uma estratégia pura estritamente domi-
nada também é estritamente dominada (Exercı́cio [13]). Contudo,
uma estratégia mista pode ser estritamente dominada mesmo que ela
atribua probabilidades positivas apenas para as estratégias puras que
não são nem mesmo fracamente dominadas. Considere, por exemplo,
o jogo com a seguinte matriz de payoffs:

g2
s21 s22
s11 (5, 3) (2, 0)
.
g1 s12 (2, 0) (5, 3)

s13 (4, 1) (4, 1)

As estratégias puras s11 e s12 não são fracamente dominadas, mas


a estratégia mista p1 = (1/2, 1/2, 0) é estritamente dominada pela
estratégia mista p1 = (0, 0, 1) (que corresponde à estratégia pura s13 ),

i i

i i
“tdj”
i i
2017/2/2
page 34
i i

34 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

pois
 
u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 4 · p21 + 4 · p22 = 4

>
 
1 1 7 7 7
u1 (p1 , p2 ) = u1 , , 0; p21 , p22 = · p21 + · p22 =
2 2 2 2 2

para todo p2 = (p21 , p22 ) ∈ Δ2 .

A definição de dominância estrita iterada para estratégias mistas que


daremos aqui segue a linha proposta pelas referências [26, 31, 74].
Abordagens alternativas podem ser encontradas em [01, 15].

Definição 2.8 (Dominância Estrita Iterada em Estra-


(0) (0)
tégias Mistas) Sejam Si = Si e Δmi = Δmi . Defina, recur-
sivamente,

(n) (n−1)
Si = {s ∈ Si | pi ∈ Δ(n−1)
mi tal que
(n−1)
∀s−i ∈ S−i , ui (pi , s−i ) > ui (s, s−i )}

mi = {pi = (pi1 , . . . , pimi ) ∈ Δmi |


Δ(n)
(n)
∀k = 1, . . . , mi , pik > 0 somente se sik ∈ Si }.

A interseção


Si∞ =
(n)
Si
n=0

é o conjunto de estratégias puras que sobrevivem a remoção


iterada de estratégias estritamente dominadas e

i i

i i
“tdj”
i i
2017/2/2
page 35
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 35

Δ∞ 
mi = {pi ∈ Δmi | pi ∈ Δmi

tal que ∀s−i ∈ S−i , ui (pi , s−i ) > ui (pi , si )}


(∞)

é o conjunto de todas as estratégias mistas do jogador gi que


sobreviveram a técnica de dominância estrita iterada.

Note que Si(n) é o conjunto de estratégias puras em Si(n−1) que não são
estritamente dominadas pelas estratégias mistas em Δ(n−1)mi e que Δ(n)
mi
é o conjunto de estratégias mistas que dá probabilidades positivas
apenas para as estratégias puras em Si(n) .

Definição 2.9 (Equilı́brio de Estratégia Estritamente


Dominante) Se, no processo de dominância estrita iterada, o
conjunto S ∞ = S1∞ × · · · × Sn∞ é unitário, isto é, se

S ∞ = {s∗ },

então dizemos que s∗ é um equilı́brio de estratégia estritamente


dominante.

Como no caso de estratégias puras, é possı́vel mostrar que os con-


juntos S ∞ = S1∞ × · · · × Sn∞ e Δ∞ = Δ∞ ∞
m1 × · · · × Δmn não depen-
dem da ordem em que as estratégias estritamente dominadas são
removidas. Não apresentaremos a demonstração deste fato aqui.
O leitor interessado poderá encontrá-la (bem como as definições e
resultados sobre estratégias mistas fracamente dominadas) nas re-
ferências [01, 15, 26, 55].

2.4.2 Equilı́brio de Nash em estratégias mistas

Definição 2.10 (Equilı́brio de Nash) Dizemos que um per-


fil de estratégias mistas

i i

i i
“tdj”
i i
2017/2/2
page 36
i i

36 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

p∗ = (p∗1 , p∗2 , . . . , p∗n ) ∈ Δ = Δm1 × Δm2 × · · · × Δmn


é um equilı́brio de Nash se

ui (p∗i , p∗−i ) ≥ ui (p, p∗−i )

para todo p ∈ Δmi , isto é, nenhum jogador sente motivação


de trocar a sua estratégia mista se os demais jogadores não o
fizerem.

Exemplo 2.10
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias
mistas
p∗ = (p∗1 , p∗2 ) = (1, 0; 1, 0)
é um equilı́brio de Nash, pois

u1 (p1 , p∗2 ) = u1 (p11 , p12 ; 1, 0) = 5 · p11 − 10 ≤


− 5 = u1 (1, 0; 1, 0) = u1 (p∗1 , p∗2 )

para todo p1 = (p11 , p12 ) ∈ Δ2 e

u2 (p∗1 , p2 ) = u2 (1, 0; p21 , p22 ) = 5 · p21 − 10 ≤


− 5 = u2 (1, 0; 1, 0) = u2 (p∗1 , p∗2 )

para todo p2 = (p21 , p22 ) ∈ Δ2 . Observe que este equilı́brio


corresponde ao equilı́brio em estratégias puras

s∗ = (confessar, confessar).

Mostraremos mais adiante que este é o único equilı́brio de Nash


em estratégias mistas do jogo.
(b) Na batalha dos sexos (Exemplo 2.2), os equilı́brios de Nash em
estratégias mistas são

(1, 0; 1, 0), (0, 1; 0, 1) e (2/3, 1/3; 1/3, 2/3).

i i

i i
“tdj”
i i
2017/2/2
page 37
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 37

Os dois primeiros perfis de estratégias mistas correspondem às


estratégias puras (futebol, futebol) e (cinema, cinema), respec-
tivamente. Mostraremos mais adiante que estes são os únicos
equilı́brios de Nash em estratégias mistas do jogo.
(c) No Exemplo 2.3, o único equilı́brio de Nash em estratégia mista
é o ponto
(0, 1, 0, 0; 0, 1, 0, 0)
que corresponde ao equilı́brio de Nash (s12 , s22 ) em estratégias
puras.
(d) No jogo de comparar moedas do Exemplo 2.6, o único equilı́brio
de Nash em estratégias mistas é o ponto
(1/2, 1/2; 1/2, 1/2).

Como no caso de estratégias puras, podemos caracterizar equilı́-


brios de Nash em estratégias mistas através das funções de melhor
resposta. Considere um jogo com espaço de estratégias mistas Δ =
Δm1 × · · · × Δmi × · · · × Δmn . No que se segue, usaremos as seguintes
notações:
Δ(Si ) = Δmi e Δ(S−i ) = Δm1 × · · · × Δmi−1 × Δmi+1 × · · · Δmn .

Definição 2.11 (Funções de melhor resposta em estra-


tégias mistas) A função de melhor resposta do jogador gi é a
aplicação
MRi : Δ(S−i ) → 2Δ(Si )
definida por MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ), isto é,

MRi (p−i )
=

{p∗i ∈ Δ(Si ) | ∀pi ∈ Δ(Si ), ui (p∗i , p−i ) ≥ ui (pi , p−i )},

com p−i ∈ Δ(S−i ). A função de melhor resposta do jogo é a


aplicação
MR : Δ → 2Δ

i i

i i
“tdj”
i i
2017/2/2
page 38
i i

38 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

definida por

MR(p) = (MR1 (p−1 ), MR2 (p−2 ), . . . , MRn (p−n )),

com p ∈ Δ.

Note que, como Δ(Si ) é um conjunto compacto não-vazio e a


função pi → ui (pi , p−i ) é contı́nua, podemos usar o teorema de Wei-
erstrass para garantir que MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ) é
um conjunto não-vazio para todo p−i ∈ Δ(S−i ).
A próxima proposição é uma consequência direta das definições
de equilı́brio de Nash e funções de melhor resposta em estratégias
mistas.

Proposição 2.4 p∗ = (p∗1 , . . . , p∗i , . . . , p∗n ) ∈ Δ é um equilı́brio


de Nash em estratégias mistas se, e somente se, p∗i ∈ MRi (p∗−i )
para todo i = 1, . . . , n, isto é, p∗ ∈ MR(p∗ ).

Exemplo 2.11 Suponha que, na batalha dos sexos (Exemplo 2.2),


a mulher escolha a estratégia mista p2 = (1/2, 1/2). Qual é a melhor
resposta do homem a esta estratégia da mulher? Para responder a
esta pergunta, observe inicialmente que

uHomem(p1 , p2 ) = uHomem (p11 , p12 ; p21 , p22 )


= p11 · p21 · uHomem (futebol, futebol) +
p11 · p22 · uHomem (futebol, cinema) +
p12 · p21 · uHomem (cinema, futebol) +
p12 · p22 · uHomem (cinema, cinema)
= 10 · p11 · p21 + 5 · p12 · p22

e, portanto, uHomem (p11 , p12 ; 1/2, 1/2) = 5 · p11 + (5/2) · p12 . Desta
maneira,

MRHomem (1/2, 1/2) = argmax(p11 ,p12 )∈Δ2 (5 · p11 + (5/2) · p12 ).

i i

i i
“tdj”
i i
2017/2/2
page 39
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 39

Segue-se que a melhor resposta do homem à estratégia mista p2 =


(1/2, 1/2) da mulher é obtida resolvendo-se o seguinte problema de
otimização:

maximizar 5 · p11 + (5/2) · p12


sujeito a p11 + p12 = 1,
p11 ≥ 0,
p12 ≥ 0,

cuja solução é (p∗11 , p∗12 ) = (1, 0). Sendo assim, MRHomem (1/2, 1/2) =
{(1, 0)}.

No caso de jogos com apenas dois jogadores, cada um com apenas


duas estratégias puras, é possı́vel escrever as estratégias mistas de
uma maneira mais simplificada:

Δ2 = {(p, 1 − p) ∈ R2 | 0 ≤ p ≤ 1},

isto é, cada elemento de Δ2 pode ser identificado com um número real
no intervalo [0, 1]. Com isto, as funções de melhor resposta podem
ser reescritas de forma a depender de apenas de um número real. Por
exemplo, se o homem escolhe uma estratégia mista (p, 1 − p) ∈ Δ2 ,
qual é a melhor resposta da mulher a esta estratégia do homem?
Escrevendo as estratégias mistas da mulher na forma (q, 1 − q) ∈ Δ2 ,
vemos que

uMulher(p, 1 − p; q, 1 − q) = 15 pq + 10 − 10 q − 10 p
= 5 (3 p − 2) q + 10 (1 − p).

Sendo assim,

MRMulher(p) = argmax(q,1−q)∈Δ2 (5 (3 p − 2) q + 10 (1 − p))


= argmaxq∈[0,1] (5 (3 p − 2) q + 10 (1 − p)),

onde, por simplicidade, estamos escrevendo MRMulher(p) no lugar


de MRMulher (p, 1 − p). Assim, dada a escolha de p ∈ [0, 1] do homem,
a mulher quer encontrar os valores de q ∈ [0, 1] que maximizam o valor
de sua utilidade uMulher = 5 (3 p − 2) q + 10 (1 − p). Se p ∈ [0, 2/3),
então 3 p − 2 < 0 e, para maximizar a sua utilidade, a mulher deverá

i i

i i
“tdj”
i i
2017/2/2
page 40
i i

40 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

escolher q = 0. Se p = 2/3, então 3 p − 2 = 0 e, portanto, a utilidade


uMulher = 10 (1 − p) da mulher não dependerá de q. Neste caso, a
mulher poderá escolher qualquer valor de q em [0, 1]. Se p ∈ (2/3, 1],
então 3 p − 2 > 0 e, para maximizar a sua utilidade, a mulher deverá
escolher q = 1. Mostramos então que

⎨ {0}, se p ∈ [0, 2/3),
MRMulher (p) = [0, 1], se p = 2/3,

{1}, se p ∈ (2/3, 1].

Esta função de melhor resposta pode ser representada graficamente,


como mostra a Figura 2.3.

(Mulher) q

(Futebol) 1

(Cinema)
0 2/3 1 p (Homem)

(Cinema) (Futebol)

Figura 2.3: Representação gráfica da função de melhor resposta da


mulher no jogo da batalha dos sexos.

Do mesmo modo, se a mulher escolhe uma estratégia mista (q, 1−q) ∈


Δ2 , então

uHomem (p, 1 − p; q, 1 − q) = 15 pq + 5 − 5 q − 5 p
= 5 (3 q − 1) p + 5 (1 − q),

de modo que

MRHomem (q) = argmax(p,1−p)∈Δ2 (5 (3 q − 1) p + 5 (1 − q))


= argmaxp∈[0,1] (5 (3 q − 1) p + 5 (1 − q)).

i i

i i
“tdj”
i i
2017/2/2
page 41
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 41

Assim, dada a escolha de q ∈ [0, 1] da mulher, o homem quer en-


contrar os valores de p ∈ [0, 1] que maximizam o valor de sua utili-
dade uHomem = 5 (3 q − 1) p + 5 (1 − q). Se q ∈ [0, 1/3), então 3 q −
1 < 0 e, para maximizar a sua utilidade, o homem deverá esco-
lher p = 0. Se q = 1/3, então 3 q − 1 = 0 e, portanto, a utilidade
uHomem = 5 (1 − q) do homem não dependerá de p. Neste caso, o
homem poderá escolher qualquer valor de p em [0, 1]. Se q ∈ (1/3, 1],
então 3 q − 1 > 0 e, para maximizar a sua utilidade, o homem deverá
escolher p = 1. Mostramos então que

⎨ {0}, se q ∈ [0, 1/3),
MRHomem (q) = [0, 1], se q = 1/3,

{1}, se q ∈ (1/3, 1].

Esta função de melhor resposta pode ser representada graficamente,


como mostra a Figura 2.4.

(Homem) p

(Futebol) 1

(Cinema)
0 1/3 1 q (Mulher)

(Cinema) (Futebol)

Figura 2.4: Representação gráfica da função de melhor resposta do


homem no jogo da batalha dos sexos.

Agora, pela Proposição 2.4, segue-se que um perfil de estratégias


mistas (p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ ) é um equilı́brio de Nash se, e somente se,
q ∗ ∈ MRMulher (p∗ ) e p∗ ∈ MRHomem (q ∗ ). Desta maneira, os valores
de p∗ e q ∗ que geram equilı́brios de Nash correspondem aos pontos
de interseção entre as representações gráficas das funções de melhor

i i

i i
“tdj”
i i
2017/2/2
page 42
i i

42 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

resposta da mulher e do homem, quando representadas em um mesmo


sistema de eixos, como ilustra a Figura 2.5.

(Mulher) q

(Futebol) 1

1/3

(Cinema)
0 2/3 1 p (Homem)

(Cinema) (Futebol)

Figura 2.5: Calculando os equilı́brios de Nash usando as representa-


ções gráficas das duas funções de melhor resposta.

Vemos, portanto, que a batalha dos sexos possui apenas 3 equilı́brios


de Nash em estratégias mistas:

(0, 1; 0, 1), (2/3, 1/3; 1/3, 2/3) e (1, 0; 1, 0),

que correspondem, respectivamente, aos três únicos pontos de inter-


seção (p∗ , q ∗ ) = (0, 0), (p∗ , q ∗ ) = (2/3, 1/3) e (p∗ , q ∗ ) = (1, 1) das
duas representações gráficas.

Exemplo 2.12 ([31], página 17) (O jogo da inspeção) O che-


fe de uma empresa de computação desconfia que seu operador de
computadores está usando o tempo de serviço para “bater papo”
na internet. Se o operador trabalha corretamente, ele gasta g em
esforço e produz um lucro bruto de v unidades para a empresa. O
chefe, por sua vez, pode fiscalizar ou não o trabalho do operador.
Fiscalizar custa h unidades para a empresa. Se o operador for pego
“batendo papo” na internet, ele perde o seu salário de w unidades
(o chefe não pode condicionar o valor do salário w ao valor do lucro
bruto v). Para limitar o número de casos a considerar, vamos assumir

i i

i i
“tdj”
i i
2017/2/2
page 43
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 43

que g > h > 0 e que w > g. Os dois jogadores escolhem suas


estratégias simultaneamente (em particular, ao decidir se vai fiscalizar
ou não, o chefe não sabe se o empregado decidiu trabalhar ou decidiu
“bater papo” na internet). Neste contexto, o jogo da inspeção tem a
matriz de payoffs indicada abaixo.
empregado
não trabalhar trabalhar
fiscalizar (−h, 0) (v − w − h, w − g)
chefe

não fiscalizar (−w, w) (v − w, w − g)

Observe que este jogo não possui equilı́brio de Nash em estratégias


puras e, como ele deve se repetir em cada dia útil de trabalho, não é
sensato escolher sempre a mesma estratégia pura para todos os dias.
A solução, neste caso, é escolher entre as estratégias puras a cada dia
seguindo uma distribuição de probabilidades, isto é, através de es-
tratégias mistas. Como as funções de melhor resposta do empregado
e do chefe são dadas, respectivamente, por

MREmpregado (p) = argmaxq∈[0,1] ((−wp + g) q + w − g)



⎨ {1}, se p ∈ [0, g/w),
= [0, 1], se p = g/w,

{0}, se p ∈ (g/w, 1],
MRChefe (q) = argmaxp∈[0,1] ((+wq − h) p + v (1 − q) − w)

⎨ {0}, se q ∈ [0, h/w),
= [0, 1], se q = h/w,

{1}, se q ∈ (h/w, 1],

segue-se que o (único) equilı́brio de Nash em estratégias mistas é


obtido tomando-se p∗ = g/w e q ∗ = h/w. Se, por exemplo, v = 5,
w = 4, g = 3 e h = 2, então

(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ ) = (3/4, 1/4; 1/2, 1/2).

Isto significa que o chefe deve escolher sua estratégia de acordo com
um gerador de números aleatórios com distribuição de probabili-
dade (3/4, 1/4) e o operador deve escolher sua estratégia de acordo

i i

i i
“tdj”
i i
2017/2/2
page 44
i i

44 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

com um gerador de números aleatórios com distribuição de probabili-


dade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas “rodas
da fortuna” da Figura 2.6.

Fiscalizar Trabalhar

Não fiscalizar Não trabalhar

chefe empregado

Figura 2.6: Distribuições de probabilidade que constituem um equilı́-


brio de Nash para o jogo do Exemplo 2.12.

A partir deste resultado, podemos calcular o valor ótimo de contrato


do empregado, isto é, o valor de w que maximiza o payoff esperado
do chefe:
 
h
uChefe (w) = (+wq ∗ − h) p∗ + v (1 − q ∗ ) − w) = v 1 − − w.
w
√ ∗
√ por exemplo, vh >∗ g, então este valor ótimo é dado por w =
Se,
vh (note que uChefe (w ) = 0 e uChefe (w) ≤ 0 para w > 0).

Jogos deste tipo têm sido usados para se estudar temas como controle
de armas ([03, 10, 83]), prevenção de crimes ([04]) e incentivos no
trabalho ([53]).

Como vimos no jogo de comparar moedas no Exemplo 2.6, existem


jogos que não possuem equilı́brios de Nash em estratégias puras e, até
agora, todos os jogos apresentados em nossos exemplos possuem pelo
menos um equilı́brio de Nash em estratégias mistas. Uma pergunta
natural é se a existência de equilı́brios de Nash em estratégias mistas
é um resultado geral ou não. A resposta é sim! No próximo capı́tulo
apresentaremos e demonstraremos o teorema de equilı́brio de Nash,

i i

i i
“tdj”
i i
2017/2/2
page 45
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 45

que garante a existência de equilı́brios em estratégias mistas para


jogos finitos.

2.4.3 Relações entre dominância e equilı́brio de


Nash
As Proposições 2.2 e 2.3 para estratégias puras continuam válidas
para estratégias mistas: (1) o processo de dominância estrita ite-
rada em estratégias mistas não pode eliminar um equilı́brio de Nash
e (2) se o processo de dominância estrita iterada em estratégias mistas
deixa apenas um único perfil de estratégias, então este perfil é um
equilı́brio de Nash do jogo. Não apresentaremos as demonstrações
destes resultados aqui. O leitor interessado poderá encontrá-las nas
referências [15, 26].

2.4.4 Como interpretar estratégias mistas?


Existe muita controvérsia sobre as interpretações e usos de es-
tratégias mistas ([02, 12, 17, 57, 74, 77, 81, 73, 92, 93]). Aumann,
por exemplo, em [02], afirma que
“Mixed strategy equilibria have always been intuitively
problematic because they are not ‘strict’: a player will not
lose if he abandons the randomization and uses instead
any arbitrary one of the pure strategy components of the
randomization.”
(veja as Equações 4.1 na página 81) e, segundo Rardner e Roshen-
tal ([76]),
“One of the reasons why game-theoretic ideas have not
found more widespread application is that randomization,
which plays a major role in game theory, seems to have
limited appeal in many practical situations.”
Ainda, segundo Rubinstein ([81]),
“The reason for the criticism is that the naive interpreta-
tion of a mixed strategy as an action which is conditional
on the outcome of a lottery executed by the player before

i i

i i
“tdj”
i i
2017/2/2
page 46
i i

46 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

the game, goes against our intuition. We are reluctant to


believe that our decisions are made at random. We prefer
to be able to point to a reason for each action we take.
Outside of Las Vegas we do not spin roulettes.”
De fato, testes experimentais recentes mostraram que jogadores não
seguem a estratégia mista prevista pela teoria, mesmo quando o jogo
possui um único equilı́brio de Nash em estratégias mistas ([57]).
Existem também certas análises feitas com estratégias mistas que
produzem resultados não-intuitivos. Considere, por exemplo, a se-
guinte situação. Um contribuinte C deve decidir se vai ou não sonegar
imposto, sabendo que existe um fiscal F que pode ou não fiscalizá-lo.
Na matriz de payoffs abaixo, vamos assumir que valem as seguintes
desigualdades
(1) c21 > c11 : o contribuinte C prefere não sonegar se souber que
o fiscal F irá fiscalizar,
(2) c12 > c22 : o contribuinte C prefere sonegar se souber que o fis-
cal F não irá fiscalizar,
(3) f11 > f12 : o fiscal F prefere fiscalizar se souber que o contribuin-
te C irá sonegar e
(4) f22 > f21 : o fiscal F prefere não fiscalizar se souber que o contri-
buinte C não irá sonegar.
Você pode pensar que os cij são números negativos que representam
o quanto será debitado de C pelo pagamento de imposto e que os fij
são números positivos que representam bônus salariais de F .
F
fiscalizar não fiscalizar
sonegar (c11 , f11 ) (c12 , f12 ) .
C
não sonegar (c21 , f21 ) (c22 , f22 )

Usando a técnica descrita no Exemplo 2.11, vemos que o único equi-


lı́brio de Nash do jogo é dado por (p∗C , 1 − p∗C ; p∗F , 1 − p∗F ), onde
 
∗ ∗ f22 − f21 c22 − c12
(pC , pF ) = , .
f22 − f21 − f12 + f11 c22 − c12 − c21 + c11

i i

i i
“tdj”
i i
2017/2/2
page 47
i i

[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 47

Aqui, p∗C representa a probabilidade com que C decide sonegar e p∗F


representa a probabilidade com que F decide fiscalizar. Dois resulta-
dos não-intuitivos advêm destas expressões para p∗C e p∗F :
(a) Se a receita federal decide aumentar a multa de sonegação, isto
é, se ela resolve diminuir o valor de c11 , então a freqüência p∗C de
sonegações não muda e a freqüência de fiscalizações p∗F diminui.
(b) Se a receita federal decide aumentar o bônus salarial para os fis-
cais que identificam contribuintes sonegadores, isto é, se ela resol-
ver aumentar o valor de f11 , então a freqüência de fiscalizações p∗F
não muda e a freqüência de sonegações p∗C diminui.
Isto acontece porque alterações introduzidas nos payoffs de um jo-
gador afeta apenas a expressão para o perfil de estratégias mistas
do equilı́brio de Nash do outro jogador (Proposição da Irrelevância
do Payoff [43]).
Existem, contudo, interpretações que são mais robustas. Uma de-
las é imaginar o jogo como uma interação entre n populações nume-
rosas: cada partida ocorre depois que n jogadores são selecionados
de maneira aleatória nestas populações. As probabilidades piji no
perfil de estratégias mistas pi do jogador gi são interpretadas como
as freqüências dos jogadores que escolheram a estratégia pura siji na
i-ésima população. Outra interpretação é devida a Harsanyi. Apre-
sentamos aqui o abstract de seu artigo [39]:
“Equilibrium points in mixed strategies seem to be unsta-
ble, because any player can deviate without penalty from
his equilibrium strategy even if he expects all other players
to stick to theirs. This paper proposes a model under
which most mixed-strategy equilibrium points have full
stability. It is argued that for any game Γ the players’
uncertainty about the other players’ exact payoffs can be
modeled as a disturbed game Γ∗ , i.e., as a game with small
random fluctuations in the payoffs. Any equilibrium point
in Γ, whether it is in pure or in mixed strategies, can ‘al-
most always’ be obtained as a limit of a pure-strategy
equilibrium point in the corresponding disturbed game
Γ∗ when all disturbances go to zero. Accordingly, mixed-
strategy equilibrium points are stable – even though the

i i

i i
“tdj”
i i
2017/2/2
page 48
i i

48 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

players may make no deliberate effort to use their pure


strategies with the probability weights prescribed by their
mixed equilibrium strategies – because the random fluc-
tuations in their payoffs will make them use their pure
strategies approximately with the prescribed probabili-
ties.”

Não nos aprofundaremos neste tema polêmico. O leitor interessado


pode consultar as referências citadas no inı́cio desta subseção e, em
especial, [81] e a Seção 3.2 de [74].

2.5 Jogos infinitos


Os jogos que estudamos até agora são finitos, isto é, eles possuem
um número finito de jogadores, cada um com um número finito de es-
tratégias puras. Contudo, existem situações que, para serem modela-
das, necessitam de um número infinito de jogadores ou de um número
infinito de estratégias ([06, 44, 62]). Jogos em estratégias mistas, por
exemplo, podem ser pensados como jogos com um número finito de
jogadores e com um número infinito de estratégias (as infinitas dis-
tribuições de probabilidade que cada jogador pode escolher). Vamos
nos concentrar no caso de jogos com um número finito de jogadores e
um número infinito de estratégias puras (o caso de estratégias mistas
requer como pré-requisito teoria da medida e não será tratado aqui).
As definições de estratégias estritamente dominadas, estratégias fra-
camente dominadas e equilı́brios de Nash são análogas ao caso finito,
com a diferença de que, agora, os conjuntos Si podem ser infinitos.

Definição 2.12 (Estratégia Pura Estritamente Domi-


nada) Dizemos que uma estratégia pura si ∈ Si do jogador gi ∈
G é estritamente dominada pela estratégia si ∈ Si se

ui (si , s−i ) > ui (si , s−i ),

para todo s−i ∈ S−i .

i i

i i
“tdj”
i i
2017/2/2
page 49
i i

[SEC. 2.5: JOGOS INFINITOS 49

Definição 2.13 (Estratégia Pura Fracamente Domi-


nada) Dizemos que uma estratégia pura si ∈ Si do joga-
dor gi ∈ G é fracamente dominada pela estratégia si ∈ Si se

ui (si , s−i ) ≥ ui (si , s−i ),

para todo s−i ∈ S−i e, pelo menos para algum s•−i ∈ S−i ,

ui (siκ , s•−i ) > ui (siκ , s•−i ).

Definição 2.14 (Equilı́brio de Nash)Dizemos que um perfil


de estratégias

s∗ = (s∗1 , . . . , s∗(i−1) , s∗i , s∗(i+1) , . . . , s∗n ) ∈ S

é um equilı́brio de Nash se

ui (s∗i , s∗−i ) ≥ ui (si , s∗−i )

para todo i = 1, . . . , n e para todo si ∈ Si .

Exemplo 2.13 ([26], página 2009) Considere o seguinte jogo in-


finito: G = {g1 , g2 }, S1 = S2 = [0, 1] e u1 , u2 : S = S1 × S2 → R
definidas por

⎨ x, se x < 1,
u1 (x, y) = 0, se x = 1 e y < 1,

1, se x = 1 e y = 1,
e ⎧
⎨ y, se y < 1,
u2 (x, y) = 0, se y = 1 e x < 1,

1, se y = 1 e x = 1,
Observe que toda estratégia pura x ∈ [0, 1) do jogador g1 é estrita-
mente dominada. De fato, (1 + x)/2 ∈ (x, 1) e

u1 (x, y) = x < (1 + x)/2 = u1 ((1 + x)/2, y), ∀y ∈ [0, 1].

i i

i i
“tdj”
i i
2017/2/2
page 50
i i

50 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Do mesmo modo, toda estratégia pura y ∈ [0, 1) do jogador g2 é


estritamente dominada por (1 + y)/2 ∈ (y, 1). Como

u1 (1, 1) = 1 ≥ u1 (x, 1) e u2 (1, 1) = 1 ≥ u2 (1, y), ∀x, y, ∈ [0, 1],

segue-se que (x∗ , y ∗ ) = (1, 1) é o único equilı́brio de Nash em es-


tratégias puras do jogo. Eliminando-se todas as estratégias em S1 −
{1, t} e S2 − {1, t}, para algum t < 1, obtemos um jogo 2 × 2, que
não pode ser mais reduzido:
g2
1 t
1 (1, 1) (0, t)
g1
t (t, 0) (t, t)

Como t é arbitrário, este exemplo mostra que, em jogos infinitos,


o processo de eliminação de estratégias puras estritamente domina-
das pode produzir reduções que dependem da ordem em que as eli-
minações são realizadas. O exemplo também mostra que, em jogos
infinitos, a melhor resposta de um jogador pode não existir. Por
exemplo, não existe uma melhor resposta (em estratégias puras) do
jogador g1 à uma escolha y ∈ (0, 1) do jogador g2 .

Como no caso de jogos finitos, um jogo infinito nem sempre pos-


sui equilı́brios de Nash em estratégias puras. Contudo, é possı́vel
mostrar que se os espaços de estratégias Si são subconjuntos com-
pactos, convexos e não-vazios de um espaço euclidiano e as funções
utilidade s = (si , s−i ) → ui (s) são contı́nuas em s e quase-côncavas
em si , então o jogo possui pelo menos um equilı́brio de Nash em es-
tratégias puras ([23, 31, 34]). Note que este resultado inclui, como
caso particular, os jogos finitos em estratégias mistas.

2.6 Exercı́cios
[01] Use o processo de dominância estrita iterada para reduzir o jogo
cuja matriz de payoffs é dada abaixo.

i i

i i
“tdj”
i i
2017/2/2
page 51
i i

[SEC. 2.6: EXERCÍCIOS 51

g2
s21 s22 s23 s24
s11 (3, 0) (1, 1) (5, 4) (0, 2)

g1 s12 (1, 1) (3, 2) (6, 0) (2, −1)

s13 (0, 2) (4, 4) (7, 2) (3, 0)

[02] Considere a matriz de payoffs para os jogadores L (linhas) e C


(colunas), a seguir:

C
c1 c2
l1 (3, 3) (0, 1)
L
l2 (1, 1) (2, 3)

Pede-se:
(a) Determinar se existe alguma estratégia estritamente domi-
nante para algum jogador.
(b) Determinar se existe algum equilı́brio de Nash (em estraté-
gias puras). Caso exista mais do que um equilı́brio, quantos
e quais são.
[03] A partir da matriz de payoffs a seguir para os jogadores L (li-
nhas) e C colunas,

C
c1 c2
l1 (3, 2) (4, 4)
L
l2 (1, 1) (9, 2)

determine:

i i

i i
“tdj”
i i
2017/2/2
page 52
i i

52 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

(a) Se algum jogador possui alguma estratégia dominante.


(b) Quantos equilı́brios de Nash em estratégias puras existem.
[04] (Jogo do covarde) Neste jogo, dois adolescentes pilotam
carros roubados em direção a um abismo em um teste de co-
ragem: aquele que desviar o carro primeiro será chamado de
covarde (chicken).

Este tipo de jogo ficou popular depois do filme Juventude Trans-


viada (Rebel Without a Cause) de 1955, estrelado por James
Dean, que morreu em decorrência de um acidente de automóvel.
Bertrand Russell, em [82], compara uma variação deste jogo
com a tática de brinkmanship 2 na corrida nuclear:
“Since the nuclear stalemate became apparent, the
Governments of East and West have adopted the
policy which Mr. Dulles calls ‘brinkmanship’. This
is a policy adapted from a sport which, I am told, is
practised by some youthful degenerates. This sport
is called ‘Chicken!’. It is played by choosing a long
straight road with a white line down the middle and
starting two very fast cars towards each other from
opposite ends. Each car is expected to keep the wheels
of one side on the white line. As they approach each
other, mutual destruction becomes more and more
imminent. If one of them swerves from the white
2 Arte ou prática de se levar uma situação perigosa ou confrontação além do

limite do que pode ser considerado seguro, para conseguir determinado desfecho.

i i

i i
“tdj”
i i
2017/2/2
page 53
i i

[SEC. 2.6: EXERCÍCIOS 53

line before the other, the other, as he passes, shouts


‘Chicken!’, and the one who has swerved becomes
an object of contempt. As played by irresponsible
boys, this game is considered decadent and immoral,
though only the lives of the players are risked. But
when the game is played by eminent statesmen, who
risk not only their own lives but those of many hun-
dreds of millions of human beings, it is thought on
both sides that the statesmen on one side are dis-
playing a high degree of wisdom and courage, and
only the statesmen on the other side are reprehensi-
ble. This, of course, is absurd. Both are to blame
for playing such an incredibly dangerous game. The
game may be played without misfortune a few times,
but sooner or later it will come to be felt that loss
of face is more dreadful than nuclear annihilation.
The moment will come when neither side can face
the derisive cry of ‘Chicken!’ from the other side.
When that moment is come, the statesmen of both
sides will plunge the world into destruction.”
O jogo do covarde pode ser modelado com a seguinte matriz
de payoffs:

g2
desviar não desviar
desviar (2, 2) (1, 3) .
g1
não desviar (3, 1) (0, 0)

Pede-se:
(a) Determinar se existe alguma estratégia estritamente domi-
nante para algum jogador.
(b) Determinar se existe algum equilı́brio de Nash (em estraté-
gias puras). Caso exista mais do que um equilı́brio, quantos
e quais são.

i i

i i
“tdj”
i i
2017/2/2
page 54
i i

54 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

[05] (Jogo Hawk-Dove) Dois animais disputam um recurso (uma


presa, por exemplo). Cada animal tem duas opções: (1) brigar
pelo recurso (estratégia hawk ) ou (2) ameaçar o seu oponente
(estratégia dove). Se os dois animais resolverem brigar pelo
recurso, o conflito continuará até que um deles fique ferido e
o vencedor será o outro. Se somente um animal decide ata-
car, então ele vencerá o animal que decidiu apenas ameaçar.
Se os dois escolherem fazer ameaças, então existe um empate
e cada animal recebe um ganho menor do que ganharia na si-
tuação onde um escolhe brigar e o outro ameaçar. Este jogo
foi apresentado pela primeira vez por John Maynard Smith e
George Price no artigo The Logic of Animal Conflict na re-
vista Nature [56]. A forma tradicional da matriz de payoffs é a
seguinte:

g2
brigar ameaçar
 
V −C V −C
brigar , (V, 0) .
g1 2 2
 
V V
ameaçar (0, V ) ,
2 2

Aqui, V é o valor do recurso sendo disputado e C é o custo da


briga. Em geral, assume-se que o valor do recurso é menor do
que o custo da briga, isto é, C > V > 0. Pede-se:

(a) Determinar se existe alguma estratégia estritamente domi-


nante para algum jogador.
(b) Determinar se existe algum equilı́brio de Nash (em estraté-
gias puras). Caso exista mais do que um equilı́brio, quantos
e quais são.

[06] No artigo “Nornmandy: Game and Reality”, de W. Draker na


revista “Moves”, no. 6 (1972), é feita uma análise da invasão da
Europa na Normandia na Segunda Guerra Mundial. Seis confi-
gurações possı́veis de ataque (1 a 6) pelos Aliados e seis possı́veis

i i

i i
“tdj”
i i
2017/2/2
page 55
i i

[SEC. 2.6: EXERCÍCIOS 55

estratégias defensivas (A a F ) pelo Eixo foram simuladas e cal-


culadas, num total de 36 simulações. A matriz da Tabela 2.1
foi estimada pelos Aliados para cada batalha hipotética. Use o
processo de dominância fraca iterada para reduzir ao máximo
possı́vel o tamanho da matriz.
[07] Considere um jogo com três jogadores: A, B e C. As estratégias
do jogador A são {x1 , x2 , x3 }, as estratégias do jogador B são
{y1 , y2 } e as estratégias do jogador C são {z1 , z2 , z3 , z4 }. Se
o jogador B escolhe a estratégia y1 , os payoffs são dados pela
matriz

C
z1 z2 z3 z4
x1 (5, 0, 2) (1, 0, 1) (3, 0, 6) (1, 2, 1)

A x2 (3, 2, 2) (9, 1, 8) (2, 0, 5) (2, 0, 2)

x3 (1, 0, 0) (1, 0, 9) (4, 0, 8) (3, 0, 3)

Por outro lado, se o jogador B escolhe a estratégia y2 , então os


payoffs são dados por

C
z1 z2 z3 z4
x1 (0, 1, 1) (0, 1, 2) (2, 1, 3) (0, 3, 9)

A x2 (0, 3, 2) (1, 2, 3) (2, 1, 8) (2, 1, 0)

x3 (1, 1, 0) (2, 1, 1) (3, 2, 2) (3, 1, 3)

Use a técnica de dominância estrita iterada para reduzir a ma-


triz deste jogo.

i i

i i
2017/2/2
page 56
i

i
“tdj”
i

i
[CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Eixo
A B C D E F
1 (+13, −13) (+29, −29) (+ 8, − 8) (+12, −12) (+16, −16) (+23, −23)
2 (+18, −18) (+22, −22) (+21, −21) (+22, −22) (+29, −29) (+31, −31)
3 (+18, −18) (+22, −22) (+31, −31) (+31, −31) (+27, −27) (+37, −37)
Aliados

4 (+11, −11) (+22, −22) (+12, −12) (+21, −21) (+21, −21) (+26, −26)
5 (+18, −18) (+16, −16) (+19, −19) (+14, −14) (+19, −19) (+28, −28)
6 (+23, −23) (+22, −22) (+19, −19) (+23, −23) (+30, −30) (+34, −34)
Tabela 2.1: Análise da invasão da Europa na Normandia na Segunda Guerra Mundial.
56
i

i
i

i
“tdj”
i i
2017/2/2
page 57
i i

[SEC. 2.6: EXERCÍCIOS 57

[08] Repita o exercı́cio anterior com a matriz de payoffs

C
z1 z2 z3 z4
x1 (1, 2, 9) (2, 9, 9) (3, 7, 9) (2, 8, 9)

A x2 (3, 8, 3) (4, 5, 4) (4, 1, 3) (3, 9, 3)

x3 (2, 9, 9) (3, 9, 9) (3, 9, 9) (2, 9, 9)

caso o jogador B escolha a estratégia y1 e a matriz de payoffs

C
z1 z2 z3 z4
x1 (2, 1, 9) (3, 9, 9) (2, 9, 9) (1, 9, 9)

A x2 (4, 9, 1) (4, 2, 2) (3, 2, 1) (2, 2, 1)

x3 (1, 9, 9) (2, 9, 9) (2, 9, 9) (1, 9, 9)

caso ele escolha a estratégia y2 .


[09] Considere um jogo com três jogadores: A, B e C. As estratégias
do jogador A são {x1 , x2 , x3 }, as estratégias do jogador B são
{y1 , y2 } e as estratégias do jogador C são {z1 , z2 , z3 , z4 }. Se
o jogador B escolhe a estratégia y1 , os payoffs são dados pela
matriz
C
z1 z2 z3 z4
x1 (1, 2, 1) (2, 3, 1) (1, 0, 2) (1, 4, 1)

A x2 (2, 0, 1) (1, 2, 1) (3, 1, 3) (3, 2, 1)

x3 (1, 0, 1) (1, 1, 1) (2, 5, 1) (1, 3, 1)

i i

i i
“tdj”
i i
2017/2/2
page 58
i i

58 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

Por outro lado, se o jogador B escolhe a estratégia y2 , então os


payoffs são dados por

C
z1 z2 z3 z4
x1 (0, 0, 0) (1, 2, 3) (1, 3, 0) (1, 1, 1)

A x2 (2, 1, 0) (1, 5, 1) (2, 2, 3) (1, 5, 2)

x3 (2, 1, 1) (1, 0, 1) (1, 0, 4) (1, 5, 3)

Calcule os equilı́brios de Nash em estratégias puras deste jogo.


[10] Considere o jogo cuja matriz de payoffs é dada por:

Jogador 2
L C R
T (1, 0) (3, 1) (1, 1)
Jogador 1

.
M (1, 1) (3, 0) (0, 1)

B (2, 2) (3, 3) (0, 2)

(a) Identifique, para cada jogador, todos os pares de estratégias


onde uma estratégia é fracamente dominada pela outra.
(b) Usando o processo de eliminação das estratégias fracamente
dominadas, encontre todas as possı́veis de maneiras de re-
duzir o jogo para uma matriz 1 × 1.
(c) Quais são os equilı́brios de Nash em estratégias puras do
jogo?
[11] Suponha que o processo de dominância fraca iterada em es-
tratégias puras reduza um jogo finito para apenas um único
perfil de estratégias s∗ . Mostre que s∗ é um equilı́brio de Nash
em estratégias puras do jogo.

i i

i i
“tdj”
i i
2017/2/2
page 59
i i

[SEC. 2.6: EXERCÍCIOS 59

[12] Demonstre a propriedade 2.2 da página 31 da função utilidade


esperada definida em 2.1.
[13] Mostre que uma estratégia mista que atribui probabilidade po-
sitiva para uma estratégia pura estritamente dominada também
é estritamente dominada.
[14] Use a técnica descrita no Exemplo 2.11 para calcular as funções
de melhor resposta dos jogadores dos Exemplos 2.1 (o dilema
dos prisioneiros) e 2.6 (comparar moedas). Em seguida, use as
representações gráficas destas funções para calcular os equilı́-
brios de Nash em estratégias mistas de cada jogo.
[15] Um equilı́brio de Nash em estratégias mista pode dar probabi-
lidade positiva a uma estratégia pura que é estritamente domi-
nada? E em uma estratégia pura que é fracamente dominada?
[16] (Eficiência de Pareto) Um perfil de estratégias puras é Pa-
reto eficiente (também denominado ponto ótimo de Pareto) se
nenhum outro perfil de estratégias puras oferece a todos os joga-
dores um ganho maior, isto é, nenhum jogador pode aumentar o
seu ganho sem que algum outro jogador tenha uma perda. Mais
precisamente, s∗ ∈ S é Pareto eficiente se, não existe s• ∈ S
tal que

ui (s• ) > ui (s∗ ), para todo i = 1, . . . , n.

O equilı́brio de Nash s∗ = (confessar, confessar) do jogo do


dilema dos prisioneiros é Pareto eficiente?

i i

i i
“tdj”
i i
2017/2/2
page 60
i i

Capı́tulo 3

O teorema de equilı́brio
de Nash

O teorema de equilı́brio de Nash estabelece que todo jogo finito


possui pelo menos um equilı́brio de Nash em estratégias mistas. Este
resultado foi provado por John Forbes Nash Jr. em sua tese de dou-
torado em 1949 na Universidade de Princeton. Neste capı́tulo apre-
sentaremos duas demonstrações do teorema, obtidas através de dois
teoremas de ponto fixo: o de Brouwer e o de Kakutani.

3.1 Usando o teorema de Brouwer

Teorema 3.1 (do ponto fixo de Brouwer) Se Δ é um


subconjunto compacto, convexo e não-vazio de um espaço eucli-
diano de dimensão finita e se F : Δ → Δ é uma função contı́nua,
então F possui um ponto fixo em Δ, isto é, existe p∗ ∈ Δ tal
que
F(p∗ ) = p∗ .

A demonstração deste teorema pode ser encontrada, por exemplo,


em [63, 79]. A dissertação de mestrado [89] oferece um excelente

60

i i

i i
“tdj”
i i
2017/2/2
page 61
i i

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 61

survey sobre o assunto: ela inclui dados históricos, generalizações e


aplicações do teorema do ponto fixo de Brouwer.
Com as notações dadas na Seção 2.3, estabeleceremos uma se-
qüência de teoremas que fornecem caracterizações alternativas para
um equilı́brio de Nash.

Teorema 3.2 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as


funções

zij : Δ → R
p → zij (p) = ui (sij , p−i ) − ui (pi , p−i )

(isto é, zij mede o ganho ou perda do jogador gi quando ele troca
a distribuição de probabilidade pi pela estratégia pura sij ). Te-
mos que p∗ é um equilı́brio de Nash se, e somente se,

zij (p∗ ) ≤ 0

para cada i = 1, . . . , n e j = 1, . . . , mi .

Demonstração:
(⇒) Se p∗ = (p∗i , p∗−i ) é um equilı́brio de Nash, então ui (p∗i , p∗−i )
≥ ui (sij , p∗−i ) para cada i = 1, . . . , n e j = 1, . . . , mi . Conseqüente-
mente,
zij (p∗ ) = ui (sij , p∗−i ) − ui (p∗i , p∗−i ) ≤ 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
(⇐) Se

zij (p∗ ) = ui (sij , p∗−i ) − ui (p∗i , p∗−i ) ≤ 0

para cada i = 1, . . . , n e j = 1, . . . , mi , então

ui (sij , p∗−i ) = ui (ej , p∗−i ) ≤ ui (p∗i , p∗−i )

para cada i = 1, . . . , n e j = 1, . . . , mi , onde ej é o vetor em Rmi que


tem 1 na j-ésima coordenada e zero nas demais. Devemos mostrar
que para todo pi = (pi1 , . . . , pimi ) ∈ Δmi

ui (pi , p∗−i ) ≤ ui (p∗i , p∗−i ).

i i

i i
“tdj”
i i
2017/2/2
page 62
i i

62 [CAP. 3: O TEOREMA DE EQUILÍBRIO DE NASH

Mas, como x → ui (x, p∗i ) preserva combinações convexas, temos que


m  mi
 i   
∗ ∗
ui (pi , p−i ) = ui pik · ek , p−i = pik · ui ek , p∗−i
k=1 k=1

mi
 mi
      
pik · ui p∗i , p∗−i = ui p∗i , p∗−i · pik = ui p∗i , p∗−i ,
k=1 k=1
mi
onde, na última igualdade, usamos o fato de que k=1 pik = 1, dado
que pi ∈ Δmi .

Teorema 3.3 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as


funções

gij : Δ → R
.
p → gij (p) = max{0, zij (p)}

Temos que p é um equilı́brio de Nash se, e somente se,

gij (p) = 0

para cada i = 1, . . . , n e j = 1, . . . , mi .

Demonstração: A prova segue imediatamente do teorema anterior.

Teorema 3.4 Defina a aplicação

F : Δ = Δm1 × · · · × Δmn → Δ = Δm1 × · · · × Δmn


,
p = (p1 , . . . , pn ) → F(p) = (y1 (p), . . . , yn (p))

onde

yi (p) = (yi1 (p), . . . , yimi (p)), pi = (pi1 , . . . , pimi )

i i

i i
“tdj”
i i
2017/2/2
page 63
i i

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 63

pij + gij (p)


yij (p) = mi .

1+ gik (p)
k=1

Temos que p∗ é um equilı́brio de Nash se, e somente se,

F(p∗ ) = p∗ ,

isto é, se, e somente se, p∗ é um ponto fixo da aplicação F.

Demonstração: Observe que, de fato, F(Δ) ⊆ Δ, pois claramente


yij ≥ 0 e
⎛ ⎞ mi mi
 
mi ⎜ ⎟
mi
pik + gik (p)
  ⎜ pik + gik (p) ⎟
yik (p) = ⎜ ⎟= k=1 k=1
⎜ mi ⎟ mi

k=1 k=1 ⎝ ⎠
1+ gik (p) 1+ gik (p)
k=1 k=1
mi

1+ gik (p)
k=1
= mi = 1,

1+ gik (p)
k=1

isto é, cada yi (p) ∈ Δmi .


(⇒) Se p∗ é um equilı́brio de Nash, então gij (p∗ ) = 0 para cada
i = 1, . . . , n e j = 1, . . . , mi . Desta maneira, yij (p∗ ) = p∗ij para cada
i = 1, . . . , n e j = 1, . . . , mi , isto é, yi (p∗ ) = p∗i para cada i = 1, . . . , n
ou, ainda, F(p∗ ) = p∗ .
(⇐) Suponha que p∗ = (p∗1 , p∗2 , . . . , p∗n ) ∈ Δ = Δm1 × · · · × Δmn
seja um ponto fixo da aplicação F : Δ → Δ, isto é, suponha que

p∗ij + gij (p∗ )


p∗ij = mi

1+ gik (p∗ )
k=1

i i

i i
“tdj”
i i
2017/2/2
page 64
i i

64 [CAP. 3: O TEOREMA DE EQUILÍBRIO DE NASH

para todo j = 1, . . . , mi e i = 1, . . . , n. Segue-se então que


mi

p∗ij · gik (p∗ ) = gij (p∗ ),
k=1

para todo j = 1, . . . , mi e i = 1, . . . , n. Afirmamos agora que α =


mi ∗ ∗
k=1 gik (p ) = 0, de modo que gik (p ) = 0 para todo k = 1, . . . , mi
e i = 1, . . . , n. De fato: se, por absurdo, α > 0, vemos a partir da
relação acima que
gij (p∗ ) > 0 se, e somente se, p∗ij > 0.
Sem perda de generalidade, suponha que p∗i1 > 0, p∗i2 > 0, . . . , p∗il > 0
e p∗i(l+1) = p∗i(l+2) = · · · = p∗imi = 0. Observe que
mi

p∗i = p∗ik ek ,
k=1

onde ei é o i-ésimo vetor da base canônica de Rmi . Dado que


gik (p∗ ) > 0 para todo k = 1, . . . , l, temos que
ui (ek , p∗−i ) > ui (p∗i , p∗−i ),
para todo k = 1, . . . , l. Desta maneira,
m  mi
 i   
∗ ∗ ∗ ∗
ui (pi , p−i ) = ui pik ek , p−i = p∗ik · ui ek , p∗−i
k=1 k=1
=

l
  
p∗ik · ui ek , p∗−i
k=1

>
l
 l
      
p∗ik · ui p∗i , p∗−i = ui p∗i , p∗−i · p∗ik = ui p∗i , p∗−i ,
k=1 k=1

um absurdo. Isto demonstra que gij (p ) = 0 para todo j = 1, . . . , mi
e j = 1, . . . , m e, assim, p∗ é um equilı́brio de Nash em estratégias
mistas.

i i

i i
“tdj”
i i
2017/2/2
page 65
i i

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 65

Teorema 3.5 (do equilı́brio de Nash) Todo jogo definido


por matrizes de payoffs possui um equilı́brio de Nash.

Demonstração: A aplicação F : Δ → Δ definida no teorema anterior


é contı́nua e Δ é um conjunto compacto e convexo. Pelo teorema
do ponto fixo de Brouwer, F possui um ponto fixo p∗ . Pelo teorema
anterior, p∗ é um equilı́brio de Nash.

3.2 Usando o teorema de Kakutani


Seja X um subconjunto de Rn . Dizemos que p∗ ∈ X é um ponto
fixo de uma função φ : X → 2X se p∗ ∈ φ(p∗ ). O teorema do ponto
fixo de Kakutani estabelece condições suficientes para que φ possua
pelo menos um ponto fixo.

Teorema 3.6 (do ponto fixo de Kakutani) Seja X um


subconjunto compacto, convexo e não-vazio de Rn . Se

φ : X → 2X

é semicontı́nua superiormente e φ(x) é não-vazio e convexo para


todo x ∈ X, então φ possui pelo menos um ponto fixo, isto é,
existe p∗ ∈ X tal que

p∗ ∈ φ(p∗ ).

Suponha que exista um subconjunto compacto K de Rn tal que


φ(x) ⊆ K para todo x ∈ X e suponha que φ(x) é um subconjunto
fechado de Rn para todo x ∈ X. Dizemos que φ : X → 2X é contı́nua
superiormente se, e somente se, y0 ∈ φ(x0 ) sempre que (a) x0 ∈ X,
(b) xk ∈ X para k = 1, 2, . . ., (c) limk→+∞ xk = x0 , (d) yk ∈ φ(xk )
e (e) limk→+∞ yk = y0 . Neste contexto, φ é contı́nua superiormente
se, e somente se, o gráfico de φ,

Gr(φ) = {(x, y) ∈ X × X | y ∈ φ(x)},

i i

i i
“tdj”
i i
2017/2/2
page 66
i i

66 [CAP. 3: O TEOREMA DE EQUILÍBRIO DE NASH

é um subconjunto fechado de X × X. Por exemplo, se X = [0, 1],


então 
{1/2}, se 0 ≤ x < 1/2,
φ(x) =
[1/4, 3/4], se 1/2 ≤ x ≤ 1,

é semicontı́nua superiormente (Figura 3.1), enquanto que



{1/2}, se 0 ≤ x ≤ 1/2,
ϕ(x) =
[1/4, 3/4], se 1/2 < x ≤ 1,

não o é (Figura 3.2).

3/4

1/2

1/4

0 1/2 1 x

Figura 3.1: Gráfico de uma função que é semicontı́nua superiormente.

Usaremos o teorema do ponto fixo de Kakutani para mostrar que


a função de melhor resposta MR : Δ → 2Δ definida por

MR(p) = (MR1 (p−1 ), MR2 (p−2 ), . . . , MRn (p−n )),

com p ∈ Δ e MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ), possui um


ponto fixo p∗ que, em virtude da Proposição 2.4, será um equilı́brio
de Nash.

i i

i i
“tdj”
i i
2017/2/2
page 67
i i

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 67

3/4

1/2

1/4

0 1/2 1 x

Figura 3.2: Gráfico de uma função que não é semicontı́nua superior-


mente.

Teorema 3.7 (do equilı́brio de Nash) Todo jogo definido


por matrizes de payoffs possui um equilı́brio de Nash.

Demonstração: Basta verificarmos que a função de melhor resposta


satisfaz as hipóteses do teorema do ponto fixo de Kakutani.
(1) O conjunto X = Δ = Δ(S1 ) × · · · × Δ(Sn ) é não-vazio, com-
pacto (como produto cartesiano de conjuntos compactos) e con-
vexo (como produto cartesiano de conjuntos convexos).
(2) Para todo p ∈ Δ, o conjunto MR(p) está contido no compacto
K = Δ.
(3) Para todo p ∈ Δ, o conjunto MR(p) é convexo. De fato: supo-
nha, por absurdo, MR(p) não seja um conjunto convexo. Então
existem q(•) , q(◦) ∈ MR(p) e λ ∈ (0, 1) tais que

(1 − λ) · q(•) + λ · q(◦) ∈ MR(p).

i i

i i
“tdj”
i i
2017/2/2
page 68
i i

68 [CAP. 3: O TEOREMA DE EQUILÍBRIO DE NASH

Mas, para todo ı́ndice i, vale que

ui ((1 − λ) · q(•)
i + λ · qi , p−i ) =
(◦)

(1 − λ) · ui (q(•)
i , p−i ) + λ · ui (qi , p−i ).
(◦)

Agora,

ui (q(•) (◦)
i , p−i ) = ui (qi , p−i ) = constante = max ui (pi , p−i ).
pi ∈Δ(Si )

Conseqüentemente, ui ((1 − λ) · q(•)


i + λ · qi , p−i ) = constante,
(◦)

isto é, (1 − λ) · qi + λ · qi ∈ MRi (p−i ), para todo i = 1, . . . , n,


(•) (◦)

o que é uma contradição.


(4) Para todo p ∈ Δ, o conjunto MR(p) é fechado. Para ver isto,
basta mostrar que MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ) é fe-
chado. Seja então p(k) i uma sequência de pontos em MRi (p−i ) que
converge para p(0) i . Desta maneira, ui (p(k)
i , p−i ) = constante =
maxpi ∈Δ(Si ) ui (pi , p−i ) e, como x → ui (x, p−i ) é uma função
contı́nua, concluı́mos que

ui (p(0)
i , p−i ) = constante = max ui (pi , p−i ).
pi ∈Δ(Si )

Sendo assim, p(0)


i ∈ MRi (p−i ).

(5) MR : Δ → 2Δ é semicontı́nua superiormente. Com efeito, mos-


traremos que se (a) p(0) ∈ Δ, (b) p(k) é uma sequência de pontos
em Δ, (c) limk→+∞ p(k) = p(0) , (d) q(k) ∈ MR(p(k) ) e (e) q(k)
converge para q(0) , então q(0) ∈ MR(p(0) ). Se, por absurdo,
q(0) ∈ MR(p(0) ), então existe ı́ndice i tal que q(0)
i ∈ MR(p(0)
−i ).
Portanto, existem  > 0 e qi ∈ Δ(Si ) tais que
(•)

i , p−i ) > ui (qi , p−i ) + 3 · .


ui (q(•) (0) (0) (0)

Mas, desde que ui é uma função contı́nua e (q(k) (k)


i , p−i ) converge
(0) (0)
para (qi , p−i ), então para todo k suficientemente grande,

i , p−i ) > ui (qi , p−i ) −  >


ui (q(•) (k) (•) (0)

i , p−i ) + 2 ·  > ui (qi , p−i ) + .


ui (q(0) (0) (k) (k)

i i

i i
“tdj”
i i
2017/2/2
page 69
i i

[SEC. 3.3: ALGUMAS PROPRIEDADES DOS EQUILÍBRIOS DE NASH 69

i ∈ MRi (p−i ), pois ui (qi , p−i ) > ui (qi , p−i ),


Sendo assim, q(k) (k) (•) (k) (k) (k)

o que contradiz (d).

Shizuo Kakutani demonstrou o seu teorema no artigo [45]. Debreu


lista mais de 300 aplicações do teorema do ponto fixo de Kakutani
ao provar a existência de um equilı́brio econômico em [24].

3.3 Algumas propriedades dos equilı́brios


de Nash
Wilson ([97]) mostrou que, a menos de um conjunto fechado e
de medida zero, todo jogo finito possui um número finito e ı́mpar
de equilı́brios de Nash em estratégias mistas. Pelo menos para jogos
com dois jogadores, cada um com duas estratégias, este resultado
pode ser antecipado através da análise das funções de melhor resposta
que fizemos na Subseção 2.4.2 (veja, por exemplo, a Figura 2.5 na
página 42). Harsanyi, em [40], apresentou uma prova alternativa para
este resultado. Também tratam do assunto as referências [35, 36, 59].
Por outro lado, os casos degenerados podem ter topologias diver-
sificadas. De fato, Datta provou que toda variedade algébrica real
(soluções reais de um sistema de equações polinomiais) é isomorfa
ao conjunto de equilı́brios de Nash em estratégias totalmente mistas
de algum jogo com 3 jogadores e, também, de algum jogo com n
jogadores, cada um com apenas 2 estratégias puras ([20]). Um per-
fil de estratégias totalmente mistas é um perfil que dá probabilidade
positiva a cada estratégia pura.
Existem jogos cujos payoffs são todos números racionais, mas to-
dos os equilı́brios de Nash em estratégias mistas possuem coordenadas
irracionais ([69]). Contudo, Markakis mostrou que, neste contexto,
existe sempre pelo menos um equilı́brio de Nash em estratégias mistas
com coordenadas algébricas ([51, 54]).
Torres-Martı́nez ([91]) e Zhao ([99]) demonstram que é possı́vel
deduzir os teoremas de ponto fixo de Brouwer e Kakutani a partir de
um teorema de existência de equilı́brios de Nash.

i i

i i
“tdj”
i i
2017/2/2
page 70
i i

70 [CAP. 3: O TEOREMA DE EQUILÍBRIO DE NASH

3.4 Exercı́cios
[01] O objetivo deste exercı́cio é mostrar que as hipóteses do teorema
do ponto fixo de Brouwer não podem ser removidas.
(a) Exiba uma função F : Δ → Δ descontı́nua, definida em um
subconjunto Δ compacto, convexo e não-vazio de Rn , que
não possui ponto fixo.
(b) Exiba uma função F : Δ → Δ contı́nua, definida em um
subconjunto Δ não-compacto, convexo e não-vazio de Rn ,
que não possui ponto fixo.
(c) Exiba uma função F : Δ → Δ contı́nua, definida em um
subconjunto Δ compacto, não-convexo e não-vazio de Rn ,
que não possui ponto fixo.
[02] Exiba um exemplo de função φ : X → 2X definida em um
subconjunto X compacto, convexo e não-vazio de Rn , que é
semicontı́nua superiormente, mas não possui ponto fixo. Isto
mostra que a hipótese de φ(x) ser um conjunto convexo para
todo x ∈ X não pode ser removida do enunciado do teorema
do ponto fixo de Kakutani.
[03] Dê um exemplo de jogo com um número par de equilı́brios de
Nash em estratégias mistas.

i i

i i
“tdj”
i i
2017/2/2
page 71
i i

Capı́tulo 4

Calculando equilı́brios
de Nash

4.1 Equilı́brio de Nash via um problema


de otimização
O Teorema 3.3 sugere uma maneira de se calcular os equilı́brios
de Nash de um jogo. Eles são soluções do seguinte problema de
otimização não-linear:
mi
n 
 2
minimizar (gij (p))
i=1 j=1
sujeito a p ∈ Δ.

Com efeito: a soma de quadrados é zero se, e somente se, cada parcela
é igual a zero. McKelvey demonstrou em [58] que a função objetivo
mi
n 
 2
p → (gij (p))
i=1 j=1

é uma função de classe C 1 . Assim, algoritmos numéricos de oti-


mização que usam derivadas (Newton, Davidon-Fletcher-Powell) po-
dem ser usados.

71

i i

i i
“tdj”
i i
2017/2/2
page 72
i i

72 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Exemplo 4.1 Para o dilema do prisioneiro (Exemplo 2.1, página 11),


(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2
é um equilı́brio de Nash se, e somente se, (p, q) é solução do seguinte
problema de otimização

minimizar G(p, q) = (max {0, − (−1 + p) (4 q + 1)})2 +


(max {0, −p (4 q + 1)})2 +
2
(max {0, − (4 p + 1) (−1 + q)}) +
2
(max {0, −q (4 p + 1)})
sujeito a 0 ≤ p ≤ 1,
0 ≤ q ≤ 1.
Como vemos pela Figura 4.1, que mostra o gráfico e o mapa de con-
torno de G, o ponto
(p∗ , q∗ ) = (1, 0; 1, 0)
é o único equilı́brio de Nash do jogo.

Exemplo 4.2 Para a batalha dos sexos (Exemplo 2.2, página 13),
(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2
é um equilı́brio de Nash se, e somente se, (p, q) é solução do seguinte
problema de otimização

minimizar G(p, q) = (max {0, −5 (−1 + p) (3 q − 1)})2 +


2
(max {0, −5 p (3 q − 1)}) +
2
(max {0, −5 (3 p − 2) (−1 + q))) +
2
(max {0, −5 q (3 p − 2)})
sujeito a 0 ≤ p ≤ 1,
0 ≤ q ≤ 1.

Como vemos pela Figura 4.2, que mostra o gráfico e o mapa de con-
torno de G, os pontos
(p∗ , q∗ ) = (1, 0; 1, 0), (p∗ , q∗ ) = (0, 1; 0, 1) e
∗ ∗
(p , q ) = (2/3, 1/3; 1/3, 2/3)

i i

i i
“tdj”
i i
2017/2/2
page 73
i i

[SEC. 4.1: EQUILÍBRIO DE NASH VIA UM PROBLEMA DE OTIMIZAÇÃO 73

são os únicos equilı́brios de Nash do jogo.

Exemplo 4.3 Para o jogo do Exemplo 2.6 da página 22,

(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2

é um equilı́brio de Nash se, e somente se, (p, q) é solução do seguinte


problema de otimização

2
minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)}) +
2
(max {0, −2 p (2 q − 1)}) +
2
(max {0, 2 (2 p − 1) (−1 + q)}) +
2
(max {0, 2 (2 p − 1) q})
sujeito a 0 ≤ p ≤ 1,
0 ≤ q ≤ 1.

Como vemos pela Figura 4.3, que mostra o gráfico e o mapa de con-
torno de G, o ponto

(p∗ , q∗ ) = (1/2, 1/2; 1/2, 1/2)

é o único equilı́brio de Nash do jogo.

Exemplo 4.4 Para o jogo do exemplo 2.12 da página 42,

(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2

é um equilı́brio de Nash se, e somente se, (p, q) é solução do seguinte


problema de otimização

minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)})2 +


2
(max {0, −2 p (2 q − 1)}) +
2
(max {0, (−3 + 4 p) (−1 + q)}) +
2
(max {0, q (−3 + 4 p)})
sujeito a 0 ≤ p ≤ 1,
0 ≤ q ≤ 1.

i i

i i
“tdj”
i i
2017/2/2
page 74
i i

74 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Como vemos pela Figura 4.4, que mostra o gráfico e o mapa de con-
torno de G, o ponto

(p∗ , q∗ ) = (3/4, 1/4; 1/2, 1/2)

é o único equilı́brio de Nash do jogo.

4.2 Equilı́brio de Nash via equações poli-


nomiais
A próxima proposição estabelece que a maior utilidade esperada
que o jogador gi pode obter contra qualquer escolha de estratégias
mistas dos demais jogadores não depende se o jogador gi está usando
estratégias mistas ou somente estratégias puras. Mais ainda, as es-
tratégias mistas ótimas para o jogador gi são justamente aquelas que
atribuem probabilidade positiva somente para as estratégias puras
ótimas.

Proposição 4.1 Para todo i = 1, . . . , n e para todo p =


(p1 , . . . , pi , . . . , pn ) ∈ Δ = Δ(S1 ) × · · · × Δ(Si ) × · · · Δ(Sn ),

max ui (siji , p−i ) = pi , p−i ).


max ui (
siji ∈Si 
pi ∈Δ(Si )

Mais ainda,

p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ) ∈ argmaxpi ∈Δ(Si ) ui (


pi , p−i )

p∗ik = 0 para todo k tal que sik ∈ argmaxsiji ∈Si ui (siji , p−i ).

Demonstração: Pela Propriedade 2.4, sabemos que


mi

pi , p−i ) =
ui ( piji · ui (siji , p−i ).
ji =1

i i

i i
“tdj”
i i
2017/2/2
page 75
i i

[SEC. 4.2: EQUILÍBRIO DE NASH VIA EQUAÇÕES POLINOMIAIS 75

25

20

15

10

5 1

0.5 q
0
0 0.2 0.4 0.6 0
0.8 1
p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.1: Encontrando os equilı́brios de Nash para o dilema do pri-


sioneiro via um problema de otimização.

i i

i i
“tdj”
i i
2017/2/2
page 76
i i

76 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

2.5

1.5

1
0.5 0.8
0.6
0.4 q
0 0.2
0 0.2 0.4 0.6 0
0.8 1
p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.2: Encontrando os equilı́brios de Nash para a batalha dos


sexos via um problema de otimização.

i i

i i
“tdj”
i i
2017/2/2
page 77
i i

[SEC. 4.2: EQUILÍBRIO DE NASH VIA EQUAÇÕES POLINOMIAIS 77

0.8

0.6
q
0.4

0.2
0.8 1
0 0.4 0.6
0 0.2 p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.3: Encontrando os equilı́brios de Nash do jogo de comparar


moedas via um problema de otimização.

i i

i i
“tdj”
i i
2017/2/2
page 78
i i

78 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

0.8

0.6
q
0.4

0.2
0.8 1
0 0.4 0.6
0 0.2 p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.4: Encontrando os equilı́brios de Nash do jogo do Exem-


plo 2.12 via um problema de otimização.

i i

i i
“tdj”
i i
2017/2/2
page 79
i i

[SEC. 4.2: EQUILÍBRIO DE NASH VIA EQUAÇÕES POLINOMIAIS 79

pi , p−i ) é a média ponderada dos valores ui (siji , p−i ), onde


Assim, ui (
os pesos piji são não-negativos e somam 1. Esta média ponderada
não pode ser maior do que o maior dos valores que participam no
cálculo da média. Assim,
pi , p−i ) ≤ max ui (siji , p−i )
ui (
siji ∈Si

i ∈ Δ(Si ) e, portanto,
para todo p
pi , p−i ) ≤ max ui (siji , p−i ).
max ui (

pi ∈Δ(Si ) siji ∈Si

Por outro lado, ui (siji , p−i ) = ui (eji , p−i ), onde eji é a distribuição
de probabilidades em Δ(Si ) que dá peso 1 à estratégia pura siji .
Assim,
ui (siji , p−i ) = ui (eji , p−i ) ≤ pi , p−i )
max ui (

pi ∈Δ(Si )

para todo siji ∈ Si e, portanto,


max ui (siji , p−i ) ≤ pi , p−i ).
max ui (
siji ∈Si 
pi ∈Δ(Si )

Para a segunda parte da proposição, suponha por absurdo que exista


p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ) ∈ argmaxpi ∈Δ(Si ) ui (
pi , p−i )
onde, para algum ı́ndice k, ocorre que
p∗ik > 0 e sik ∈ argmaxsiji ∈Si ui (siji , p−i ).

Isto implica que ui (sik , p−i ) < maxsiji ∈Si ui (siji , p−i ). Uma vez que
ui (siji , p−i ) ≤ maxsiji ∈Si ui (siji , p−i ) para todo ji = k, segue-se que
mi

ui (p∗i , p−i ) = p∗iji · ui (siji , p−i )
ji =1
mi
< p∗iji · max ui (siji , p−i ) = max ui (siji , p−i )
siji ∈Si siji ∈Si
ji =1

= pi , p−i ).
max ui (

pi ∈Δ(Si )

i i

i i
“tdj”
i i
2017/2/2
page 80
i i

80 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Masisto contradiz o fato de p∗i pertencer a argmaxpi ∈Δ(Si ) ui (


pi , p−i ).
Reciprocamente, se p∗i satisfaz a condição p∗ik = 0 para todo k tal que
sik ∈ argmaxsij ∈Si ui (siji , p−i ), então
i

ui (sik , p−i ) = max ui (siji , p−i )


siji ∈Si

sempre que p∗ik > 0. Assim


mi
 
ui (p∗i , p−i ) = p∗ik · ui (sik , p−i ) = p∗ik · ui (sik , p−i )
k=1 p∗
ik >0

= p∗ik · max ui (siji , p−i ) = max ui (siji , p−i )
siji ∈Si siji ∈Si
p∗
ik >0

= pi , p−i ).
max ui (

pi ∈Δ(Si )

Isto mostra que p∗i pertence a a argmaxpi ∈Δ(Si ) ui (


pi , p−i ).

Corolário 4.1 p∗ = (p∗1 , . . . , p∗i , . . . , p∗n ) ∈ Δ é um equilı́brio


de Nash em estratégias mistas se, e somente se, para todo i =
1, . . . , n,

p∗ik > 0 ⇒ sik ∈ argmaxsiji ∈Si ui (siji , p∗−i ),

onde p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ).

O suporte de um perfil p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ) de estratégias


mistas é o conjunto de estratégias puras do jogador gi que recebe
probabilidade positiva por p∗i . Mais precisamente,

supp(p∗i ) = {sik ∈ Si | p∗ik > 0}.

Assim, o Corolário 4.1 diz que p∗ = (p∗1 , . . . , p∗i , . . . , p∗n ) é um equilı́-


brio de Nash se, e somente se, para todo i = 1, . . . , n,

supp(p∗i ) ⊆ argmaxsiji ∈Si ui (siji , p∗−i ).

i i

i i
“tdj”
i i
2017/2/2
page 81
i i

[SEC. 4.2: EQUILÍBRIO DE NASH VIA EQUAÇÕES POLINOMIAIS 81

A Proposição 4.1 pode ser usada para calcular equilı́brios de Nash


em estratégias mistas. O ponto chave é observar que, pela Pro-
posição 4.1, se p∗ ∈ Δ é um equilı́brio de Nash em estratégias mistas,
então, para todo i = 1, . . . , n,

ui (sik , p∗−i ) = constante = max ui (siji , p∗−i ) (4.1)


siji ∈Si

sempre que p∗ik > 0, isto é, em um equilı́brio de Nash, o jogador gi


tem o mesmo ganho se trocar sua estratégia p∗i por qualquer outra
estratégia pura que recebeu probabilidade positiva de p∗i .

Exemplo 4.5 No Exemplo 2.11, vimos que as funções utilidade dois


jogadores da batalha dos sexos são dadas por

uHomem (p11 , p12 ; p21 , p22 ) = 10 · p11 · p21 + 5 · p12 · p22 ,


uMulher(p11 , p12 ; p21 , p22 ) = 5 · p11 · p21 + 10 · p12 · p22 .

Vamos usar as relações 4.1 para calcular o equilı́brio de Nash em


estratégias mistas que não é um equilı́brio em estratégias puras,
isto é, o equilı́brio de Nash cujas estratégias mistas tem suporte
nas duas estratégias puras de cada jogador. Para isto, considere
p∗ = (p∗11 , p∗12 ; p∗21 , p∗22 ) ∈ Δ2 × Δ2 , com 0 < p∗11 , p∗12 , p∗21 , p∗22 < 1.
Pelas relações 4.1, se p∗ é um equilı́brio de Nash, então

uHomem ( 1 , 0 ; p∗21 , p∗22 ) = uHomem( 0 , 1 ; p∗21 , p∗22 ),


uMulher(p∗11 , p∗12 ; 1 , 0 ) = uMulher(p∗11 , p∗12 ; 0 , 1 ),

isto é,
10 · p∗21 = 5 · p∗22 e 5p∗11 = 10 · p∗12 .
Como p∗21 + p∗22 = 1 e p∗11 + p∗12 = 1, obtemos então um sistema linear
com 4 equações e 4 incógnitas. A solução deste sistema dá o equilı́brio
de Nash
(p∗11 , p∗12 ; p∗21 , p∗22 ) = (2/3, 1/3; 1/3, 2/3).

A técnica descrita no exemplo acima pode ser usada para o cálculo


dos equilı́brios de Nash que não são estratégias puras para jogos com

i i

i i
“tdj”
i i
2017/2/2
page 82
i i

82 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

mais do que dois jogadores e com mais do que duas estratégias puras
por jogador. Neste caso, é preciso (1) considerar os vários casos que
resultam das diferentes escolhas das estratégias puras que farão parte
do suporte de cada perfil em estratégias mistas e (2) resolver o sistema
não-linear resultante. Mais precisamente, para cada jogador gi e para
cada subconjunto não-vazio Ti = {sik1 , . . . , sikti } de Si (que especifica
quais estratégias puras farão parte do suporte), devemos resolver o
sistema descrito na Figura 4.5 (neste sistema, wi representa o ganho
constante que o jogador gi obtém escolhendo qualquer uma de suas
estratégias puras que recebeu probabilidade positiva de p∗i ).
Para jogos com muitos jogadores e muitas estratégias, o sistema
da Figura 4.5 não é prático para o cálculo a mão dos equilı́brios de
Nash. Contudo, métodos numéricos para a solução de um sistema
de equações polinomiais podem ser aplicados: o método de Newton
com uma estratégia de subdivisão espacial, bases de Gröbner e conti-
nuação homotópica poliedral. O leitor interessado pode consultar as
referências [21, 22, 51]

4.3 Jogos de soma zero


Nesta seção estudaremos os jogos de soma zero com dois jogado-
res, uma classe especial de jogos onde a soma dos payoffs dos dois
jogadores é sempre zero: o que um jogador ganha, o outro perde1 .
Veremos que, para este tipo de jogo, os equilı́brios de Nash em es-
tratégias mistas podem ser facilmente calculados resolvendo-se um
problema de otimização linear.

4.3.1 Jogos de soma constante com dois jogadores

Definição 4.1 (Jogos de soma constante com dois jo-


gadores) Um jogo de soma constante com dois jogadores é um
jogo com dois jogadores, comumente denominados jogador linha
e jogador coluna, com estratégias

1 Por este motivo, jogos de soma zero também são denominados jogos estrita-

mente competitivos.

i i

i i
i
i

i
i

m1 mi−1 mi+1 mn
   
··· ··· p∗1j1 · · · p∗(i−1)ji−1 · p∗(i+1)ji+1 · · · p∗njn · ui (s1j1 , . . . , sij−i , sikτ , siji+1 , snjn ) = wi ,
j1 =1 ji−1 =1 ji+1 =1 jn =1
[SEC. 4.3: JOGOS DE SOMA ZERO

∀i = 1, . . . , n, ∀sikτ ∈ Ti ,

p∗ikτ = 0, ∀i = 1, . . . , n, ∀τ = 1, . . . , ti ,
ti

p∗ikτ = 1, ∀i = 1, . . . , n.
τ =1

Figura 4.5: Calculando equilı́brios de Nash através de um sistema não-linear.


83

i
i
“tdj”

i
i
page 83
2017/2/2
“tdj”
i i
2017/2/2
page 84
i i

84 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Sjogador linha = {1, 2, . . . , m}


e
Sjogador coluna = {1, 2, . . . , n}
e matriz de payoffs

jogador coluna
1 2 ··· n
1 (a11 , b11 ) (a12 , b12 ) ··· (a1n , b1n )
jogador linha

2 (a21 , b21 ) (a22 , b22 ) ··· (a2n , b2n )


.. .. .. .. ..
. . . . .

m (am1 , bm1 ) (am2 , bm2 ) ··· (amn , bmn )

satisfazendo aij + bij = c = constante, para todo i = 1, . . . , m


e j = 1, . . . , n. No caso particular em que a constante c é zero,
dizemos que o jogo tem soma zero.

Em termos de estratégias mistas, se p = (p1 , . . . , pm ) ∈ Δm é uma


distribuição de probabilidades para as estratégias puras do jogador
linha e q = (q1 , . . . , qn ) ∈ Δn é uma distribuição de probabilidades
para as estratégias puras do jogador coluna, então o payoff esperado
para o jogador linha é

m 
 n
ul (p, q) = pi qj aij
i=1 j=1 ⎡ ⎤⎡ ⎤
a11 a12 ··· a1n q1
 ⎢ a21 a22 ··· a2n ⎥⎢ q2 ⎥
⎢ ⎥⎢ ⎥
= p1 p2 · · · pm ⎢ .. .. .. .. ⎥⎢ .. ⎥,
⎣ . . . . ⎦⎣ . ⎦
am1 am2 · · · amn qn

i i

i i
“tdj”
i i
2017/2/2
page 85
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 85

isto é,
⎡ ⎤
a11 a12 ··· a1n
⎢ a21 a22 ··· a2n ⎥
⎢ ⎥
ul (p, q) = pT Aq, com A = ⎢ .. .. .. .. ⎥.
⎣ . . . . ⎦
am1 am2 · · · amn

Analogamente, o payoff esperado para o jogador coluna é dado por


⎡ ⎤
b11 b12 · · · b1n
⎢ b21 b22 · · · b2n ⎥
⎢ ⎥
uc (p, q) = pT Bq, com B = ⎢ . .. .. .. ⎥ .
⎣ .. . . . ⎦
bm1 bm2 · · · bmn

Uma vez que o jogo tem soma constante, vemos que


⎡ ⎤ ⎡ ⎤
a11 a12 · · · a1n b11 b12 ··· b1n
⎢ a21 a22 · · · a2n ⎥ ⎢ b21 b22 ··· b2n ⎥
⎢ ⎥ ⎢ ⎥
A+B = ⎢ . .. .. .. ⎥ + ⎢ .. .. .. .. ⎥
⎣ .. . . . ⎦ ⎣ . . . . ⎦
am1 am2 · · · amn bm1 bm2 · · · bmn
⎡ ⎤
c c ··· c
⎢ c c ··· c ⎥
⎢ ⎥
= ⎢ . . .
. . ... ⎥
,
⎣ .. .. ⎦
c c ··· c

isto é,
⎡ ⎤ ⎡ ⎤
c c ··· c 1 1 ··· 1
⎢ c c ··· c ⎥ ⎢ 1 1 ··· 1 ⎥
⎢ ⎥ ⎢ ⎥
A+B = C = ⎢ .. .. .. .. ⎥ = c ⎢ .. .. .. .. ⎥ = c 1 ,
⎣ . . . . ⎦ ⎣ . . . . ⎦
c c ··· c 1 1 ··· 1

onde 1 denota a matriz m × n formada com 1 em todas as suas


entradas. Sendo assim, é fácil de ver que

uc (p, q) = pT Bq = pT (c 1 − A)q = cpT 1 q − pT Aq = c − ul (p, q)

i i

i i
“tdj”
i i
2017/2/2
page 86
i i

86 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

onde, na última igualdade, usamos que pT 1 q = 1, pois p e q são


distribuições de probabilidades e, por isto,
m
 n

pi = 1 e qj = 1.
i=1 j=1

Em particular, vale a seguinte propriedade importante:


ul (p∗ , q∗ ) ≥ ul (p, q∗ ) ⇔ uc (p∗ , q∗ ) ≤ uc (p, q∗ ). (4.2)

4.3.2 Equilı́brio de Nash em estratégias puras

Definição 4.2 (Ponto de sela) Dizemos que um elemento


aij de uma matriz A é um ponto de sela da matriz A se ele for
simultaneamente um mı́nimo em sua linha e um máximo em sua
coluna, isto é, se

aij ≤ ail para todo l = 1, . . . , n e


aij ≥ akj para todo k = 1, . . . , m.

O termo ponto de sela vem do fato que se desenharmos o gráfico


dos payoffs do jogador linha, a vizinhança do ponto de sela lembra o
formato de uma sela de cavalo (Figura 4.6).

Teorema 4.1 O elemento aij é um ponto de sela da matriz A


se, e somente se, o par (i, j) é um equilı́brio de Nash em es-
tratégias puras para o jogo.

Demonstração:
(⇒) Seja aij um ponto de sela da matriz A. Como aij é máximo
em sua coluna, vale que
ul (i, j) = aij ≥ akj = ul (k, j)

i i

i i
“tdj”
i i
2017/2/2
page 87
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 87

payoff

has
Colunas Lin

Figura 4.6: Ponto de sela.

para todo k = 1, . . . , m, isto é, o jogador linha não pode aumentar o


seu payoff se o jogador coluna mantiver a escolha da coluna j. Por
outro lado, como aij é mı́nimo em sua linha, vale que

uc (i, j) = bij = c − aij ≥ c − ail = bil = uc (i, l)

para todo l = 1, . . . , n, isto é, o jogador coluna não pode aumentar


o seu payoff se o jogador linha mantiver a escolha da linha i. Isto
mostra que o perfil de estratégias puras (i, j) é um equilı́brio de Nash
do jogo.
(⇐) Seja (i, j) é um equilı́brio de Nash do jogo. A partir das
considerações acima, é fácil de ver que aij é máximo em sua coluna
e mı́nimo em sua linha e que, portanto, aij é um ponto de sela da
matriz A.

i i

i i
“tdj”
i i
2017/2/2
page 88
i i

88 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Teorema 4.2 Se aij e ars são dois pontos de sela da matriz A,


então ais e arj também são pontos de sela da matriz A e

aij = ars = ais = arj .

Demonstração: Considere a matriz


⎡ ⎤
.. ..
⎢ . . ⎥
⎢ · · · aij · · · ais ··· ⎥
⎢ ⎥
⎢ .. .. .. ⎥
A=⎢ . . . ⎥.
⎢ ⎥
⎢ · · · arj · · · ars ··· ⎥
⎣ ⎦
.. ..
. .

Como aij e ars são pontos de sela, sabemos que eles são mı́nimos
em suas respectivas linhas e máximos em suas respectivas colunas.
Assim,
aij ≤ ais ≤ ars e aij ≥ arj ≥ ars ,
e, portanto,
aij = ais = arj = ars .
Observe que ais é mı́nimo em sua linha, pois aij = ais é mı́nimo
da mesma linha e que ais é máximo em sua coluna, pois ars = ais
é máximo da mesma coluna. Analogamente, arj é mı́nimo em sua
linha, pois ars = arj é mı́nimo da mesma linha e arj é máximo em
sua coluna, pois arj = aij é máximo da mesma coluna. Concluı́mos
então que ais e arj também são pontos de sela da matriz A.

O payoff mı́nimo do jogador linha, se ele escolher a linha k, é dado


por
ak = min akl .
1≤l≤n

Analogamente, o payoff mı́nimo do jogador coluna, se ele escolher a


coluna l, é dado por c − al , onde

al = max akl .
1≤k≤m

i i

i i
“tdj”
i i
2017/2/2
page 89
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 89

Defina
vl (A) = max ak = max min akl
1≤k≤m 1≤k≤m 1≤l≤n
e
vc (A) = min al = min max akl .
1≤l≤n 1≤l≤n 1≤k≤m

Teorema 4.3 Para toda matriz A, tem-se vc (A) ≥ vl (A).

Demonstração: Temos que para todo k = 1, . . . , m e j = 1, . . . , n,


akj ≥ min akl .
1≤l≤n
Assim,
max akj ≥ max min akl = vl (A),
1≤k≤m 1≤k≤m 1≤l≤n

para todo j = 1, . . . , n. Conseqüentemente,

vc (A) = min max akj ≥ max min akl = vl (A).


1≤j≤n 1≤k≤m 1≤k≤m 1≤l≤n

O próximo teorema caracteriza a existência de pontos de sela e,


portanto, a existência de equilı́brios de Nash em estratégias puras,
em termos das funções vl e vc .

Teorema 4.4 Uma matriz A tem um ponto de sela se, e so-


mente se, vl (A) = vc (A).

Demonstração:
(⇒) Se aij é um ponto de sela da matriz A, então vale que
aij = min1≤l≤n ail = ai . Como vl (A) = max1≤k≤m ak , é claro que
vl (A) ≥ ai = aij . Por outro lado, aij = max1≤k≤m akj = aj . Como
vc (A) = min1≤l≤n al , segue-se que vc (A) ≤ aj = aij . Combinando
estas duas desigualdades, concluı́mos que vc (A) ≤ aij ≤ vl (A). Mas,
pelo teorema anterior, vc (A) ≥ vl (A) e, sendo assim, vc (A) = vl (A).
(⇐) Como vl (A) = max1≤r≤m ar , existe uma linha i tal que
vl (A) = ai . Como, por sua vez, ai = min1≤s≤n ais , existe uma co-
luna l tal que ai = ail . Assim, vl (A) = ai = ail . Analogamente, como

i i

i i
“tdj”
i i
2017/2/2
page 90
i i

90 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

vc (A) = min1≤s≤n as , existe uma coluna j tal que vc (A) = aj . Como,


por sua vez, aj = max1≤r≤m arj , existe uma linha k tal que aj = akj .
Assim, vc (A) = aj = akj . Uma vez que, por hipótese, vl (A) = vc (A),
temos que
ail = ai = vl (A) = vc (A) = aj = akj .
Afirmamos que aij é um ponto de sela da matriz A. Com efeito, aij ≤
aj = ai ≤ ais , para todo s = 1, . . . , n, isto é, aij é o mı́nimo de sua
linha. Por outro lado, aij ≥ ai = aj ≥ arj , para todo r = 1, . . . , m,
isto é, aij é o máximo de sua coluna. Portanto, aij é um ponto de
sela da matriz A.

Corolário 4.2 Um jogo de dois jogadores com soma constante


definido pela matriz de payoffs A do jogador linha tem um
equilı́brio de Nash em estratégias puras se, e somente se,

vl (A) = vc (A).

Exemplo 4.6 Considere o jogo de soma zero cujos payoffs do jogador


linha são dados pela matriz A abaixo.

mı́nimo das linhas


⎡ ⎤
3 1 1 0 0
⎢0 0⎥
⎢ 1 2 ⎥ 0
A =⎢ ⎥
⎣1 0 2 1⎦ 0
3 1 2 2 1
máximo das colunas 3 1 2 2

Como vl (A) = máximo dos mı́nimos das linhas = 1 = vc (A) = mı́nimo


dos máximos das colunas, segue-se que o jogo possui um equilı́brio
de Nash em estratégias puras. De fato, a42 é um ponto de sela da
matriz A.

i i

i i
“tdj”
i i
2017/2/2
page 91
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 91

Exemplo 4.7 Considere o jogo de soma zero cujos payoffs do jogador


linha são dados pela matriz A abaixo.

mı́nimo das linhas


⎡ ⎤
3 2 1 0 0
⎢0 0⎥
⎢ 1 2 ⎥ 0
A =⎢ ⎥
⎣1 0 2 1⎦ 0
3 1 2 2 1
máximo das colunas 3 2 2 2

Como vl (A) = máximo dos mı́nimos das linhas = 1 < 2 = vc (A) =


mı́nimo dos máximos das colunas, segue-se que o jogo não possui um
equilı́brio de Nash em estratégias puras.

4.3.3 Equilı́brio de Nash em estratégias mistas


Defina
vl (A) = max min pT Aq e vc (A) = min max pT Aq.
p∈Δm q∈Δn q∈Δn p∈Δm

Teorema 4.5 Para toda matriz A, tem-se vc (A) ≥ vl (A).

Demonstração: Temos que para todo p ∈ Δm ,


pT Aq ≥ min pT Ay.
y∈Δn

Assim,
max pT Aq ≥ max min pT Ay = vl (A).
p∈Δm p∈Δm y∈Δn

Conseqüentemente,
vc (A) = min max pT Aq ≥ max min pT Ay = vl (A).
q∈Δn p∈Δm p∈Δm y∈Δn

O próximo teorema caracteriza a existência de equilı́brios de Nash


em estratégias mistas em termos das funções vl e vc .

i i

i i
“tdj”
i i
2017/2/2
page 92
i i

92 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Teorema 4.6 Um perfil de estratégias mistas (p∗ , q∗ ) é um


equilı́brio de Nash de um jogo de dois jogadores com soma cons-
tante definido pela matriz de payoffs A do jogador linha se, e
somente se,
vl (A) = vc (A) = p∗T Aq∗ .

Demonstração:
(⇒) Se (p∗ , q∗ ) é um equilı́brio de Nash, então

p∗T Aq∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ ) = pT Aq∗ ,

para todo p ∈ Δm . Em particular,

p∗T Aq∗ = max pT Aq∗ ≥ min max pT Ay = vc (A).


p∈Δm y∈Δn p∈Δm

Vale também que

p∗T Aq∗ = c − uc (p∗ , q∗ ) ≤ c − uc (p∗ , q) = p∗T Aq,

para todo q ∈ Δn . Em particular,

p∗T Aq∗ = min p∗T Aq ≤ max min xT Aq = vl (A).


q∈Δn x∈Δm q∈Δn

Desta maneira, vl (A) ≥ vc (A). Como, pelo teorema anterior, vl (A) ≤


vc (A), concluı́mos que vl (A) = vc (A).
(⇐) Como vl (A) = maxp∈Δm minq∈Δn pT Aq, existe p∗ ∈ Δm tal
que
vl (A) = min p∗T Aq.
q∈Δn

Analogamente, como vc (A) = minq∈Δn maxp∈Δm pT Aq, existe q∗ ∈


Δm tal
vc (A) = max pT Aq∗ .
p∈Δm

Uma vez que, por hipótese, vl (A) = vc (A), temos que

min p∗T Aq = vl (A) = vc (A) = max pT Aq∗ .


q∈Δn p∈Δm

i i

i i
“tdj”
i i
2017/2/2
page 93
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 93

Afirmamos que (p∗ , q∗ ) é um equilı́brio de Nash do jogo. Com efeito,

ul (p∗ , q∗ ) = p∗T Aq∗ ≥ min p∗T Aq =


q∈Δn

max pT Aq∗ ≥ xT Aq∗ = ul (x, q∗ ),


p∈Δm

para todo x ∈ Δm . Por outro lado,

uc (p∗ , q∗ ) = c − p∗T Aq∗ ≥ c − max pT Aq∗ =


p∈Δm

c − min p∗T Aq ≥ c − p∗T Ay = uc (p∗ , y),


q∈Δn

para todo y ∈ Δn . Desta maneira, (p∗ , q∗ ) é um equilı́brio de Nash


do jogo.

4.3.4 O teorema minimax de von Neumann


O próximo teorema estabelece que, para jogos de dois jogadores
com soma zero, vl (A) = vc (A) sempre. Sendo assim, pelo teorema 4.6,
segue-se que, para esta classe de jogos, sempre existe pelo menos um
equilı́brio de Nash em estratégias mistas.

Teorema 4.7 (minimax de von Neumann) Para todo jogo


de soma zero com dois jogadores, representado pela matriz
de payoffs A do jogador linha, sempre existe um perfil de es-
tratégias mistas (p∗ , q∗ ) ∈ Δm × Δn satisfazendo

vl (A) = max min pT Aq


p∈Δm q∈Δn
=

p∗T Aq∗
=

min max pT Aq = vc (A).


q∈Δn p∈Δm

Em particular, (p∗ , q∗ ) é um equilı́brio de Nash do jogo.

i i

i i
“tdj”
i i
2017/2/2
page 94
i i

94 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Daremos uma demonstração deste teorema minimax de von Neu-


mann usando o teorema de dualidade da teoria de programação linear.
Lembramos que um problema de programação linear é um problema
de otimização com função objetivo e restrições lineares:

(problema primal)
maximizar bT y
sujeito a Ay ≤ c,
y ≥ 0,

onde as desigualdades devem ser interpretadas componente a com-


ponente. A cada problema de programação linear (problema primal)
podemos associar um outro problema de otimização (problema dual):

(problema dual)
minimizar cT x
sujeito a x A ≥ bT ,
T

x ≥ 0.

Teorema 4.8 (da dualidade em programação linear)


(a) O problema primal possui uma solução se, e somente se, o
problema dual possui uma solução.
(b) Se y∗ é solução do problema primal e x∗ é solução do pro-
blema dual, então cT x∗ = bT y∗ .

Uma demonstração do teorema de dualidade pode ser encontrada


em [14, 52].
Demonstração do teorema minimax: sem perda de generalidade,
podemos assumir que todas as entradas da matriz de payoffs A do jo-
gador linha são positivas. Caso contrário, basta substituir A por A =
A + D e B = −A por B  = −D + B, onde D = d 1 , com d >
max1≤i≤m,1≤j≤n |aij |. Observe que A +B  = 0 (isto é, o jogo definido
 
pelas matrizes A e B tem soma zero) e que (p∗ , q∗ ) é um equilı́brio

i i

i i
“tdj”
i i
2017/2/2
page 95
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 95

de Nash para o jogo definido pela matriz A se, e somente se, (p∗ , q∗ )
é um equilı́brio de Nash para o jogo definido pela matriz A. 
Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os proble-
mas de programação linear:
(problema primal)
maximizar bT y
sujeito a Ay ≤ c,
y ≥ 0,

(problema dual)
minimizar cT x
sujeito a x A ≥ bT ,
T

x ≥ 0.

Passo 1: o problema dual possui uma solução.


Como A > 0, o conjunto admissı́vel

X = {x ∈ Rm | xT A ≥ bT e x ≥ 0}

é não vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a função ob-
jetivo do problema é escrita como x = (x1 , x2 , . . . , xm ) → cT x =
x1 + x2 + · · · + xm . Assim, o problema dual consiste em encontrar o
ponto do conjunto X mais próximo da origem segundo a norma da
soma || · ||1 , um problema que certamente possui uma solução pois,
se p ∈ X, então podemos “compactificar” o conjunto admissı́vel in-
cluindo a restrição ||x||1 ≤ ||p||1 e, com isso, podemos usar o teorema
de Weierstrass para garantir a existência de um mı́nimo.
Passo 2: construção do equilı́brio de Nash.
Dado que o problema dual possui uma solução, pelo teorema de
dualidade, o problema primal também possui. Mais ainda: se x∗ é
solução do problema dual e y∗ é solução do problema primal, então

cT x∗ = (x∗ )T Ay∗ = bT y∗ .

Seja θ = cT x∗ = bT y∗ (que é > 0 pois (0, 0, . . . , 0) não é admissı́vel)


e defina
x∗ y∗
p∗ = e q∗ = .
θ θ

i i

i i
“tdj”
i i
2017/2/2
page 96
i i

96 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Afirmamos que (p∗ , q∗ ) é um equilı́brio de Nash do jogo. Com efeito:


claramente p∗ ∈ Δm e q∗ ∈ Δn , pois p∗ ≥ 0 (já que x∗ ≥ 0 e θ > 0),
q∗ ≥ 0 (já que y∗ ≥ 0 e θ > 0),
m
 m
 x∗ i cT x∗ θ
pi = = = =1
i=1 i=1
θ θ θ

e
m
 n
 yj∗ bT y∗ θ
qj = = = = 1.
j=1 j=1
θ θ θ

Agora, como x∗T A ≥ bT , temos que para todo q ∈ Δn , x∗T Aq ≥


T n
b q = j=1 qj = 1. Mas p∗ = x∗ /θ. Desta maneira, p∗T Aq ≥ θ =
p∗T Aq∗ , para todo q ∈ Δn . Conseqüentemente,

uc (p∗ , q∗ ) = −p∗T Aq∗ ≥ −p∗T Aq = uc (p∗ , q)

para todo q ∈ Δn . Mostramos então que o jogador coluna não pode


aumentar o seu payoff esperado trocando q∗ por q, se o jogador linha
mantiver a escolha p∗ . Analogamente, como
m Ay ≤ c, temos ∗que
para todo p ∈ Δm , pT Ay∗ ≤ pT c = i=1 pi = 1. Mas y =
q∗ /θ. Desta maneira, p∗ Aq∗ ≤ θ = p∗T Aq∗ , para todo p ∈ Δm .
Conseqüentemente,

ul (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = ul (p, q∗ ),

para todo p ∈ Δm . Mostramos então que o jogador linha não pode


aumentar o seu payoff esperado trocando p∗ por p, se o jogador co-
luna mantiver a escolha q∗ . Concluı́mos, portanto, que (p∗ , q∗ ) é um
equilı́brio de Nash do jogo.

Além de estabelecer a existência de equilı́brios de Nash, a demons-


tração que demos sugere uma maneira de calculá-los: resolvendo-se
dois problemas de programação linear.

Exemplo 4.8 O governo deseja vacinar seus cidadãos contra um


certo vı́rus da gripe. Este vı́rus possui dois sorotipos, sendo que é
desconhecida a proporção na qual os dois sorotipos ocorrem na po-
pulação do vı́rus. Foram desenvolvidas duas vacinas onde a eficácia

i i

i i
“tdj”
i i
2017/2/2
page 97
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 97

da vacina 1 é de 85% contra o sorotipo 1 e de 70% contra o soro-


tipo 2. A eficácia da vacina 2 é de 60% contra o sorotipo 1 e de 90%
contra o sorotipo 2. Qual polı́tica de vacinação deveria ser tomada
pelo governo?
Esta situação pode ser modelada como um jogo de soma zero
com dois jogadores, onde o jogador linha L (o governo) deseja obter
a maior compensação (a fração dos cidadãos resistentes ao vı́rus) o
maior possı́vel e o jogador coluna C (o vı́rus) deseja obter a maior
compensação a menor possı́vel. A matriz de payoffs é a seguinte:

vı́rus
sorotipo 1 sorotipo 2
(85/100, −85/100) (70/100, −70/100)
governo

vacina 1

vacina 2 (60/100, −60/100) (90/100, −90/100)

Para encontrar um equilı́brio de Nash, devemos resolver os seguintes


problemas de programação linear

(problema primal)
maximizar ' y1 +(y'2 ( ' (
85/100 70/100 y1 1
sujeito a ≤ ,
60/100 90/100 ' y2 ( ' 1 (
y1 0
≥ ,
y2 0

(problema dual)
minimizar ' x1 + x2 (
 85/100 70/100 
sujeito a x1 x2 ≥ 1 1 ,
60/100 90/100
' ( ' (
x1 0
≥ ,
x2 0

isto é,

i i

i i
“tdj”
i i
2017/2/2
page 98
i i

98 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

(problema primal)
maximizar y1 + y2
sujeito a 17y1 + 14y2 ≤ 20,
6y1 + 9y2 ≤ 10,
y1 ≥ 0,
y2 ≥ 0,

(problema dual)
minimizar x1 + x2
sujeito a 7x1 + 12x2 ≥ 20,
7x1 + 9x2 ≥ 10,
x1 ≥ 0,
x2 ≥ 0.

A solução do problema dual é x∗ = (20/23, 10/23) (Figura 4.7) e a


solução do problema primal é y∗ = (40/69, 50/69), com
30
θ = x∗1 + x∗2 = y1∗ + y2∗ = .
23
Desta maneira, o único equilı́brio de Nash para o problema é dado
pelo ponto (p∗ , q∗ ), onde
   
x∗ 2 1 y∗ 4 5
p∗ = = , e q∗ = = , .
θ 3 3 θ 9 9

O teorema minimax de von Neumann garante que, para jogos de


soma zero, existem estratégias mistas p∗ e q∗ tais que:
(a) Se o jogador linha jogar com p∗ , então o seu ganho esperado
nunca é menor do que v ∗ = p∗T Aq∗ , independentemente da es-
colha do jogador coluna.
(b) Se o jogador coluna jogar com q∗ , então a sua perda esperada
nunca é maior do que v ∗ = p∗T Aq∗ , independentemente da esco-
lha do jogador linha.
Como efeito: como (p∗ , q∗ ) é um equilı́brio de Nash em estratégias
mistas, segue-se que v ∗ = uc (p∗ , q∗ ) ≥ uc (p∗ , q), ∀q ∈ Δn , e v ∗ =

i i

i i
“tdj”
i i
2017/2/2
page 99
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 99

x2

30/23

10/23

0 20/23 30/23 x1

Figura 4.7: Solução do problema dual.

y1

30/23

50/69

0 40/69 30/23 y1

Figura 4.8: Solução do problema primal.

i i

i i
“tdj”
i i
2017/2/2
page 100
i i

100 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

ul (p∗ , q∗ ) ≥ uc (p, q), ∀p ∈ Δm . Mas uc (p, q) = −pT Aq e ul (p, q) =


+pT Aq. Assim,

∀q ∈ Δn , v ∗ = uc (p∗ , q∗ ) ≥ uc (p∗ , q)

∗T
∀q ∈ Δn , pAq ≥ p∗T Aq∗ = v ∗ (4.3)

O ganho esperado do jogador linha nunca é menor
do que v ∗ se ele jogar com p∗ , independentemente
da escolha q do jogador coluna.
e, analogamente,

∀p ∈ Δm , v ∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ )

∀p ∈ Δm , pAq ≤ p∗T Aq∗ = v ∗ ∗
(4.4)

A perda esperada do jogador coluna nunca é maior
do que v ∗ se ele jogar com q∗ , independentemente
da escolha p do jogador linha.
Mais ainda: se (p∗ , q ∗ ) é um equilı́brio de Nash do jogo, então
n

aij · qj∗ = v ∗ , para todo i tal que p∗i > 0 e (4.5)
j=1
m
p∗i · aij = v ∗ , para todo j tal que qj∗ > 0. (4.6)
i=1

De fato: suponha,
n por absurdo, que exista algum ı́ndice k tal que
p∗k > 0 e a
j=1 kj · qj∗ = v ∗ . Usando as desigualdades 4.4 com
n
p = ei , sabemos que j=1 aij · qj∗ ≤ v ∗ para todo i = 1, . . . , m. Logo,
n
se j=1 akj · qj∗ = v ∗ , então nj=1 akj · qj∗ < v ∗ . Mas, então,
⎛ ⎞ 
m
 n
 m


v = p∗i ⎝ aij · qj∗ ⎠ < p∗i v∗ = v∗ ,
i=1 j=1 i=1

i i

i i
“tdj”
i i
2017/2/2
page 101
i i

[SEC. 4.4: EQUILÍBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE 101

o que é uma contradição. Um argumento análogo pode ser usado


para provar 4.6. Note que 4.5 e 4.6 nada mais são do que as condições
estabelecidas no Corolário 4.1 na página 80 para o caso particular de
jogos de soma zero.

4.4 Equilı́brio de Nash via um problema


de complementaridade
4.4.1 Jogos bimatriciais
Sejam u1 (p, q) = pT Aq e u2 (p, q) = pT Bq são, respectivamente,
as funções utilidade dos jogadores 1 e 2. Sem perda de generalidade,
podemos assumir que A > 0 e B > 0 pois, caso contrário, basta
substituir A por A + c 1 e B por B + c 1 para alguma constante
c > 0 suficientemente grande. Observe agora que (p∗ , q∗ ) ∈ Δ =
Δm × Δn é um equilı́brio de Nash em estratégias mistas do jogo se,
e somente se, p∗ e q∗ satisfazem os seguintes programas lineares, um
dependendo do outro:

maximizar (Aq∗ )T p maximizar (B T p∗ )T q


sujeito a ½Tm p = 1, sujeito a ½Tn q = 1,
p ≥ 0, q ≥ 0,

onde ½m e ½n são, respectivamente, matrizes de tamanho m×1 e n×1


com todas as entradas iguais a 1. Os problemas duais destes dois PLs
são dados por:

minimizar λ minimizar μ
sujeito a ½m λ ≥ Aq∗ , sujeito a ½n μ ≥ B T p∗ .

Se λ∗ é a solução ótima do primeiro problema dual, então pelo teo-


rema forte da dualidade, vale que (Aq∗ )T p∗ = λ∗ . Mas (Aq∗ )T p∗ =
q ∗T AT p∗ = p∗T Aq∗ e λ∗ = (p∗ ½m )λ∗ . Assim, p∗T Aq∗ = (p∗ ½m )λ∗
ou, equivalentemente,

p∗T (½m λ∗ − Aq∗ ) = 0. (4.7)

i i

i i
“tdj”
i i
2017/2/2
page 102
i i

102 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Esta condição diz que p∗ e ½m λ∗ −Aq∗ são ortogonais. Dado que estes
vetores são não-negativos, eles têm que ser complementares, no sen-
tido que eles não podem ter componentes positivas na mesma posição.
Esta caracterização de um par primal-dual ótimo é conhecida como
folgas complementares em programação linear. Dado que p∗ é uma
distribuição de probabilidades, pelo menos uma de suas componen-
tes é positiva, de modo que a respectiva componente de ½m λ∗ − Aq∗
é zero e λ∗ é a maior das entradas de Aq∗ . Qualquer estratégia
pura i do jogador 1 é uma melhor resposta a q∗ se, e somente se,
a i-ésima componente de ½m λ∗ − Aq∗ é igual a zero. Desta forma,
a Equação 4.7 obtém o Corolário 4.1 na página 80: uma estratégia
mista p∗ é uma melhor resposta para q∗ se, e somente se, ela dá pro-
babilidade positiva apenas para as estratégias puras que são melhores
respostas para q∗ . Analogamente, se μ∗ é a solução ótima do segundo
problema dual, então
q∗T (½n μ∗ − B T p∗ ) = 0. (4.8)

Teorema 4.9 O perfil de estratégias mistas (p∗ , q∗ ) é um


equilı́brio de Nash se, e somente se, existem números reais λ∗
e μ∗ tais que

½Tm p∗ = 1,
½Tn q∗ = 1,
½m λ∗ − Aq∗ ≥ 0, (4.9)
½n μ∗ − B T p∗ ≥ 0,
p∗, q∗ ≥ 0,

e as Equações 4.7 e 4.7 sejam satisfeitas.

Dado um vetor t ∈ Rn e uma matriz M de tamanho n × n, o


problema de complementaridade linear (PCL) associado ao par (t, M )
consiste em encontrar z, w ∈ Rn tais que
w + M z = t, w ≥ 0, z≥0 e zT w = 0.
Veremos agora como caracterizar os equilı́brios de Nash em estra-
tégias mistas de jogos bimatriciais (jogos finitos com apenas dois

i i

i i
“tdj”
i i
2017/2/2
page 103
i i

[SEC. 4.4: EQUILÍBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE 103

jogadores) através de um problema de complementaridade linear.


Se (p∗ , q∗ ) é um equilı́brio de Nash do jogo, então

u1 (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = u1 (p, q∗ ), ∀p ∈ Δm .

Mas, por linearidade, p∗T Aq∗ ≥ pT Aq∗ para todo p ∈ Δm se, e


somente se, p∗T Aq∗ ≥ eTi Aq∗ , ∀i = 1, . . . , m, onde ei representa
o i-ésimo vetor da base canônica. Mas, então,

(p∗T Aq∗ )½m ≥ (eTi Aq∗ )½m = ½m (eTi Aq∗ ) = (½m eTi )(Aq∗ ) = Aq∗ .

Analogamente, como

u2 (p∗ , q∗ ) = p∗T Bq∗ ≥ p∗T Bq = u2 (p∗ , q), ∀q ∈ Δn ,

segue-se que p∗T Bq∗ ≥ p∗T Bej = eTj B T p∗ , ∀j = 1, . . . , n e, por-


tanto,

(p∗T Bq∗ )½n ≥ (eTj B T p∗ )½m =


½m (eTj B T p∗ ) = (½m eTj )(B T p∗ ) = B T p∗ .
Desta maneira, (p∗ , q∗ ) é um equilı́brio de Nash se, e somente se,

(p∗T Aq∗ )½m ≥ Aq∗ e (p∗T Bq∗ )½n ≥ B T p∗ . (4.10)

Como A e B possuem todas as entradas positivas, segue-se que os


números p∗T Aq∗ e p∗T Bq∗ são positivos. Sejam então
p∗ q∗
x∗ = e y∗ = .
p∗T Bq∗ p∗T Aq∗

Introduzindoas variáveis de folga w∗ = (u∗ , v∗ ), vemos que se (p∗ , q∗ )


é um equilı́brio de Nash, então z∗ = (x∗ , y∗ ) e w∗ constituem uma
solução do problema de complementaridade linear

w + M z = t, w ≥ 0, z≥0 e zT w = 0,

onde ' ( ' (


t=
½m 0 A
e M= .
½n BT 0

i i

i i
“tdj”
i i
2017/2/2
page 104
i i

104 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Reciprocamente, se z∗ = (x∗ , y∗ ) e w∗ = (u∗ , v∗ ) constituem uma


solução do problema de complementaridade linear acima, então

x∗ y∗
p∗ = e q∗ =
½Tm x∗ ½Tn y∗
constituem um equilı́brio de Nash do jogo bimatricial.
Além de programação linear, programação quadrática e teoria dos
jogos, aplicações do problema de complementaridade linear incluem
o estudo de modelos financeiros, a análise não-linear de certas estru-
turas elasto-plásticas e muitas outras áreas ([64]).

4.4.2 O algoritmo de Lemke-Howson


Um dos métodos mais importantes para se encontrar uma solução
de um PCL é o algoritmo de Lemke-Howson. Ele foi apresentado no
artigo [49] em 1964. Muito mais do que um método de cálculo de
equilı́brios de jogos bimatriciais, o algoritmo de Lemke-Howson dá
uma prova algébrica construtiva para a existência de equilı́brios, além
de estabelecer que, genericamente, o número de equilı́brios de Nash é
finito e ı́mpar. Sendo similar ao algoritmo Simplex para programação
linear, sua complexidade é exponencial ([84]). Além do artigo origi-
nal, o leitor interessado em mais detalhes do algoritmo pode consultar
a referência [87].

4.5 Gambit
Desenvolvido por Richard D. McKelvey (California Institute of
Technology), Andrew M. McLennan (University of Minnesota) e The-
odore L. Turocy (Texas A&M University), Gambit é um programa de
computador, gratuito e multiplataforma, orientado para a construção
e análise de jogos finitos. Ele oferece uma interface gráfica intuitiva
para o cálculo de equilı́brios de Nash e a análise das estruturas de
dominância das estratégias do jogo. Para baixá-lo, acesse o endereço:

http://econweb.tamu.edu/gambit.

i i

i i
“tdj”
i i
2017/2/2
page 105
i i

[SEC. 4.5: GAMBIT 105

Figura 4.9: Gambit eliminando as estratégias fracamente domina-


das do Jogo da Segunda Gerra Mundial descrito no
Exercı́cio 6 na página 54.

i i

i i
“tdj”
i i
2017/2/2
page 106
i i

106 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH

Observação. A equipe do Gambit recentemente desenvolveu uma


versão on-line do software que está disponı́vel no endereço: http:
//gte.csc.liv.ac.uk/gte/builder/ (é preciso habilitar o uso de
janelas pop-up).

4.6 Exercı́cios
[01] Calcule os pontos de sela da matriz
⎡ ⎤
24 23 22 25
⎢ 10 22 20 19 ⎥
A=⎢ ⎣ 27
⎥.
25 22 23 ⎦
20 28 16 15

[02] Como no Exemplo 4.8, escreva os problemas primal e dual do


jogo de comparar moedas (Exemplo 2.6, página 22). Resolva
estes problemas de otimização para encontrar o equilı́brio de
Nash em estratégias mistas do jogo.

[03] Mostre como encontrar pelo menos um equilı́brio de Nash de


um jogo de soma zero 2 × 2 geral.

[04] Encontre pelo menos um equilı́brio de Nash em estratégias mis-


tas do jogo de soma zero definido pela matriz
' (
−1 +5 +1 −2
A= .
+1 −3 −2 +5

[05] Sejam p∗ ∈ Δm e q∗ ∈ Δn duas estratégias mistas de um jogo


de soma zero com dois jogadores. Mostre que se o mı́nimo dos
ganhos médios do jogador linha usando p∗ é igual ao máximo
das perdas médias do jogador coluna usando q∗ , isto é, se

min ul (p∗ , el ) = max (−uc (ek , q∗ )),


1≤l≤n 1≤k≤m

então (p∗ , q∗ ) é um equilı́brio de Nash do jogo. Aqui ek re-


presenta o k-ésimo vetor da base canônica de Rm e el o l-
ésimo vetor da base canônica de Rn . Use este resultado para

i i

i i
“tdj”
i i
2017/2/2
page 107
i i

[SEC. 4.6: EXERCÍCIOS 107

mostrar que as estratégias mistas p∗ = (6/37, 20/37, 0, 11/37)


e q∗ = (14/37, 4/37, 0, 19/37, 0) constituem um equilı́brio de
Nash do jogo de soma zero definido pela matriz
⎡ ⎤
5 8 3 1 6
⎢ 4 2 6 3 5 ⎥
A=⎢ ⎣ 2 4 6 4 1 ⎦.

1 3 2 5 3

[06] (Jogos de quadrados mágicos) Um quadrado mágico é uma


matriz quadrada n × n cujas entradas são constituı́das pelos
números 1, 2, . . . , n2 , arranjados de tal forma que a soma das
n entradas em qualquer linha, coluna ou diagonal principal é
sempre o mesmo número. Mostre como encontrar pelo menos
um equilı́brio de Nash em estratégias mistas de um jogo de soma
zero cuja matriz é um quadrado mágico. Aplique a técnica para
a matriz ⎡ ⎤
16 3 2 13
⎢ 5 10 11 8 ⎥
A=⎢ ⎣ 9 6 7 12 ⎦ .

4 15 14 1
Este quadrado mágico aparece na gravura Melencolia I de Al-
brecht Dürer:

http://en.wikipedia.org/wiki/Melancholia_I.

[07] Considere um jogo de soma zero definido por uma matriz A


inversı́vel que possui um equilı́brio de Nash (p∗ , q∗ ) totalmente
misto (isto é, 0 < p∗i , qj∗ < 1 para todo i, j ∈ {1, . . . , n}). Mostre
que
½T A−1 A−1 ½
p∗ = T −1 e q∗ = T −1 ,
½ A ½ ½ A ½
 T
onde ½ = 1 · · · 1 .

i i

i i
“tdj”
i i
2017/2/2
page 108
i i

Capı́tulo 5

Jogos na forma extensa

A forma normal de um jogo é usada em situações onde os jogado-


res escolhem sua estratégia simultaneamente ou o fazem sem conhecer
a estratégia dos outros jogadores. Contudo, existem situações em que
os jogadores tomam suas decisões de forma seqüencial, depois de ob-
servar a ação que um outro jogador realizou. A forma extensa tem
uma estrutura mais adequada para analisar jogos desta natureza, es-
pecificando assim quem se move, quando, com qual informação e o
ganho de cada jogador. Ela contém toda informação sobre um jogo.
Existem várias formas de se representar um jogo da forma extensa, to-
das elas tentando formalizar a ideia de árvore. Entre elas: (1) relações
de ordem, (2) teoria de grafos ([41]) e (3) alfabetos ([27]). Nossa abor-
dagem aqui será mais informal. Trataremos dos jogos seqüencias de
informação perfeita: os ganhos são de conhecimento comum de todos
os jogadores, um único jogador faz um movimento por vez e cada
jogador conhece as escolhas dos jogadores que o antecederam toda
vez que for jogar.

5.1 Definição
Um jogo na forma extensa (também denominado jogo seqüencial)
é aquele em que os jogadores realizam seus movimentos em uma or-
dem predeterminada. Por este motivo, uma maneira muito adequada

108

i i

i i
“tdj”
i i
2017/2/2
page 109
i i

[SEC. 5.1: DEFINIÇÃO 109

de se representar um jogo na forma extensa é através de uma árvore.


Por exemplo, na Figura 5.1, o jogador 1 joga primeiro: ele pode es-
colher entre as ações a e b. Depois, é a vez do jogador 2 jogar. Se 1
jogou a, então 2 pode escolher entre c ou d e, se 1 jogou b, então 2 pode
escolher entre e e f . Depois que todos jogadores realizaram (seqüen-
cialmente) suas ações, cada jogador recebe o seu ganho. A convenção
é que a primeira coordenada do vetor de payoffs represente o ganho
de quem jogou em primeiro lugar, a segunda coordenada represente
o ganho de quem jogou em segundo lugar, e assim por diante.

c (2, 4)
2
d
a
(1, 0)
1
b
e (6, 12)
2
f
(9, {1)

Figura 5.1: Um jogo na forma extensa.

Uma árvore é composta por nós e ramos. Os ramos representam


as ações dos jogadores. No jogo da Figura 5.1 existem 6 ramos: a, b,
c, d, e e f . Alguns são do jogador 1 (a e b), enquanto que outros são
do jogador 2 (c, d, e e f ). Os nós são de dois tipos: existem aqueles
que emanam ramos e existem aqueles que não. Estes últimos são as
folhas da árvore e neles estão os valores dos payoffs dos jogadores.
Um nó que não é uma folha identifica o jogador que deve escolher
uma das ações representadas pelos ramos que saem do nó. Nós que
não são folhas são denominados nós de decisão. Por exemplo, no
primeiro nó (também denominado raiz da árvore) o jogador 1 que
deve fazer a sua escolha entre os ramos (ações) a e b.
Uma estratégia de um jogador é um plano de ação completo que
especifica uma ação factı́vel deste jogador em cada nó de decisão
em que o jogador pode atuar. No jogo da Figura 5.1, o jogador 1
tem apenas um nó de decisão. Por este motivo, suas estratégias se

i i

i i
“tdj”
i i
2017/2/2
page 110
i i

110 [CAP. 5: JOGOS NA FORMA EXTENSA

confundem com suas ações:

S1 = {a, b}.

Por outro lado, o jogador 2 tem dois nós de decisão: um que se segue
depois que o jogador 1 jogou a e o outro depois que o jogador 1 jogou b.
Por este motivo, cada estratégia do jogador 2 deve conter duas ações:
uma para o primeiro nó e a outra para o outro nó. Assim, uma
estratégia possı́vel para o jogador 2 é “jogar c se o jogador 1 jogar a
e jogar f se o jogador 1 jogar b”. Outra é “jogar c se o jogador 1
jogar a e jogar e se o jogador 1 jogar b”. Escrevendo apenas as ações
que o jogador 2 pode tomar em cada nó de decisão, o conjunto de
suas estratégias pode ser então representado da seguinte maneira:

S2 = {(c, e), (c, f ), (d, e), (d, f )}.

É muito importante notar a diferença entre ações e estratégias. Neste


contexto, (c, e) é uma estratégia do jogador 2, enquanto que c e e são
ações (uma para cada nó de decisão do jogador). Uma ação é um
conceito local: ela representa o comportamento do jogador em um
momento particular do jogo, isto é, em um nó de decisão. Uma
estratégia é um conceito global: ela especifica o comportamento do
jogador no jogo inteiro, isto é, em todos os nós de decisão do jogador.
Mais exemplos: no jogo da Figura 5.2,

S1 = {a, b}, S2 = {(c, e), (c, f ), (c, g), (d, e), (d, f ), (d, g)}

e, no jogo da Figura 5.3,

S1 = {(a, l, p), (a, l, q), (a, m, p), (a, m, q),


(b, l, p), (b, l, q), (b, m, p), (b, m, q)}

e
S2 = {(c, e), (c, f ), (d, e), (d, f )}.

5.2 Equilı́brio de Nash


A definição de equilı́brio de Nash para jogos seqüenciais é a mesma
dada para jogos na forma normal: se Si é o conjunto de estratégias

i i

i i
“tdj”
i i
2017/2/2
page 111
i i

[SEC. 5.2: EQUILÍBRIO DE NASH 111

c (2, 4)
2
d
a (1, 0)
1

b (6, 12)
e
2 f
(9, {1)
g

(8, 9)

Figura 5.2: Um jogo na forma extensa.

c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)

Figura 5.3: Um jogo na forma extensa.

i i

i i
“tdj”
i i
2017/2/2
page 112
i i

112 [CAP. 5: JOGOS NA FORMA EXTENSA

do jogador i, 1 ≤ i ≤ n, então um perfil de estratégias

s∗ = (s∗1 , . . . , s∗i , . . . , s∗n ) ∈ S1 × · · · × Si × · · · × Sn

é um equilı́brio de Nash (em estratégias puras) se

ui (s∗i , s∗−i ) ≥ ui (siji , s∗−i )

para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi o número


de estratégias do jogador i. A caracterização via funções de melhor
resposta também pode ser usada: s∗ = (s∗1 , . . . , s∗i , . . . , s∗n ) ∈ S é um
equilı́brio de Nash em estratégias se, e somente se, s∗i ∈ MRi (s∗−i )
para todo i = 1, . . . , n, onde MRi (s−i ) = argmaxsi ∈Si ui (si , s−i ).
No jogo da Figura 5.4, temos que

S1 = {a, b}, S2 = {(c, e), (c, f ), (d, e), (d, f )}

Assim, existem 8 perfis de estratégias:

S = S1 × S2 = {(a, (c, e)), (a, (c, f )), (a, (d, e)), (a, (d, f )),
(b, (c, e)), (b, (c, f )), (b, (d, e)), (b, (d, f ))}.

c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)

Figura 5.4: Calculando equilı́brios de Nash em um jogo seqüencial.

Vamos mostrar que o perfil (a, (c, f )) não é um equilı́brio de Nash


do jogo. Inicialmente, observe que, para calcular o ganho dos joga-
dores associado a um determinado perfil de estratégias, basta seguir

i i

i i
“tdj”
i i
2017/2/2
page 113
i i

[SEC. 5.2: EQUILÍBRIO DE NASH 113

o caminho de execução do jogo. Por exemplo, para o perfil de es-


tratégia (a, (c, f )), a execução do jogo se dá da seguinte maneira:
o jogador 1 escolhe a ação a e, em seguida, o jogador 2 escolhe a
ação c, o que resulta no ganho 2 para o jogador 1 (Figura 5.5). Já,
para o perfil de estratégia (b, (c, f )), o jogador 1 escolhe a ação a
e o jogador 2 escolhe a ação f , dando o ganho 5 para o jogador 1
(Figura 5.6).

c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)

Figura 5.5: Caminho de execução associado ao perfil de estraté-


gias (a, (c, f )).

c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)

Figura 5.6: Caminho de execução associado ao perfil de estraté-


gias (b, (c, f )).

Desta maneira, se o jogador 2 mantiver a sua estratégia (c, f ), o


jogador 1 ganhará mais trocando sua estratégia a pela estratégia b:

u1 (a, (c, f )) = 2 < 5 = u1 (b, (c, f )).

i i

i i
“tdj”
i i
2017/2/2
page 114
i i

114 [CAP. 5: JOGOS NA FORMA EXTENSA

Isto mostra que (a, (c, f )) não é um equilı́brio de Nash. O per-


fil (b, (c, f )), por sua vez, é um equilı́brio de Nash, pois

u1 (b, (c, f )) = 5 > 2 = u1 (a, (c, f ))

e
u2 (b, (c, f )) = 4 > 0 = u2 (b, (c, e)),
u2 (b, (c, f )) = 4 > 0 = u2 (b, (d, e)),
u2 (b, (c, f )) = 4 ≥ 4 = u2 (b, (d, f )).
O jogo possui mais um equilı́brio de Nash: o perfil (b, (c, f )).

5.3 Indução retroativa e equilı́brio per-


feito em subjogos
A indução retroativa é um processo que produz um perfil de es-
tratégias com a propriedade de que se cada jogador seguir as reco-
mendações de ações estabelecidas pelo perfil, então suas estratégias
serão ótimas em cada nó de decisão onde o jogador pode atuar.
O algoritmo é simples. Começando pelos nós de decisão finais,
determinamos as melhores ações disponı́veis para os jogadores que
vão atuar nestes nós. Isto é fácil de se fazer, já que não existem
outros nós de decisão que sucedem os nós em questão: basta, em
cada nó de decisão final, escolher a ação que dê ao jogador do nó
o maior payoff possı́vel. Se existe um empate entre duas ações que
levam ao maior payoff, escolhemos uma delas arbitrariamente. Feito
isto, as ações escolhidas são marcadas e, as demais, ignoradas. Este
processo agora é repetido para os penúltimos nós de decisão, para os
antepenúltimos, etc., até que a raiz da árvore seja alcançada.
Por exemplo, no jogo seqüencial da Figura 5.3, os últimos nós de
decisão são β, δ e . Assim, no passo 1 da indução retroativa, o joga-
dor 2 marca a ação d no nó β e o jogador 1 marca as ações l e p nos
nós δ e , respectivamente (Figura 5.7). No passo 2, o jogador 2 marca
a ação e no nó γ (Figura 5.8). Finalmente, no passo 3, o jogador 1
marca a ação b (Figura 5.9). O perfil de estratégias obtido é

((b, l, p), (d, e)).

i i

i i
“tdj”
i i
2017/2/2
page 115
i i

[SEC. 5.3: INDUÇÃO RETROATIVA E EQUILÍBRIO PERFEITO EM SUBJOGOS 115

c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)

Figura 5.7: Indução retroativa: passo 1.

c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)

Figura 5.8: Indução retroativa: passo 2.

i i

i i
“tdj”
i i
2017/2/2
page 116
i i

116 [CAP. 5: JOGOS NA FORMA EXTENSA

c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)

Figura 5.9: Indução retroativa: passo 3.

O processo de indução retroativa dá, portanto, um algoritmo para


encontrar um equilı́brio de Nash em estratégias puras de um jogo
seqüencial com informação perfeita. Note, contudo, que nem todo
equilı́brio de Nash pode ser obtido por indução retroativa. O perfil
de estratégias (b, d) do jogo da Figura 5.10 é um equilı́brio de Nash
que não é obtido por indução retroativa.

c (2, 1)
2
d
a
(0, 0)
1
b

(1, 2)

Figura 5.10: (b, d) é um equilı́brio de Nash que não é obtido por


indução retroativa.

Seja α um dos nós de decisão de um jogo G. O subjogo que


começa em α é o jogo obtido copiando-se todos os nós de decisão,
ramos e payoffs do jogo original que sucedem α. Por exemplo, no
jogo da Figura 5.3, o subjogo que começa nó de decisão γ, é o jogo

i i

i i
“tdj”
i i
2017/2/2
page 117
i i

[SEC. 5.3: INDUÇÃO RETROATIVA E EQUILÍBRIO PERFEITO EM SUBJOGOS 117

da Figura 5.11.

l (2, 3)
1
m
e ±
2 (1, 4)

° f
p (5, 0)
1
q
²
(5, 4)

Figura 5.11: Subjogo que começa no nó γ do jogo da Figura 5.3.

Dizemos que um perfil de estratégias (puras) s∗ é um equilı́brio


perfeito em subjogos de um jogo seqüencial G se os respectivos sub-
perfis de s∗ são equilı́brios de Nash de cada subjogo de G. Como
veremos, este equilı́brio idealizado por Reinhard Selten, tem forte co-
nexão com o processo de indução retroativa. De fato: considere, por
exemplo, o jogo da Figura 5.3. Se
s∗ = ((aα , aδ , a ), (aβ , aγ ))
é um equilı́brio perfeito em subjogos deste jogo, então (aδ ) e (a )
devem ser equilı́brios de Nash dos subjogos que começam nos nós δ
e , respectivamente. Mas, neste caso, aδ e a devem ser ações que
maximizem o ganho do jogador 1 nestes nós. Sendo assim, concluı́mos
que aδ = l e a = p ou a = q. Tomemos a = p. Do mesmo modo,
como (aβ ) deve ser um equilı́brio de Nash do subjogo que começa no
nó β, vemos que o jogador 2 escolherá aβ = d. Então, nesta primeira
iteração, já podemos afirmar que
s∗ = ((aα , l, p), (d, aγ )).
Agora, se aγ = e, o jogador 2 ganhará 3 (já que o jogador 1 escolhe l
neste caso) e, se aγ = f , o jogador 2 ganhará 0 (já que o jogador 1
escolhe p neste caso). Como (aγ , (l, p)) deve ser um equilı́brio de
Nash do subjogo que começa no nó γ, segue-se que, obrigatoriamente,
aγ = e. Assim, após a segunda iteração, vale que
s∗ = ((aα , l, p), (d, e)).

i i

i i
“tdj”
i i
2017/2/2
page 118
i i

118 [CAP. 5: JOGOS NA FORMA EXTENSA

Como as ações nos nós β, γ, δ e  já estão agora todas determinadas,


é fácil de ver que se s∗ = ((aα , l, p), (d, e)) é um equilı́brio de Nash do
jogo original, então aα = b. Assim, o equilı́brio perfeito em subjogos é

s∗ = ((b, l, p), (d, e)).

Note que a imposição de que os respectivos subperfis de s∗ sejam


equilı́brios de Nash de cada subjogo de G induz a mesma seleção de
ações que seria feita no processo de indução retroativa. É por este
motivo que os equilı́brios perfeitos em subjogos coincidem com os
equilı́brios obtidos por indução retroativa.

5.4 O teorema de Kuhn-Zermelo

Teorema 5.1 (Kuhn-Zermelo) Todo jogo seqüencial de in-


formação perfeita possui pelo menos um equilı́brio de Nash em
estratégias puras.

Idéia da prova. A demonstração é feita por indução. Se o jogo possui


apenas um único nó de decisão, então o teorema é verdadeiro: o jo-
gador que age neste nó escolhe uma ação que maximiza o seu payoff.
Os outros jogadores, se existirem, tem espaços de estratégias vazios.
Suponha então que todo jogo com menos do que m > 1 nós de de-
cisão possua pelo menos um equilı́brio de Nash. Escolhendo um nó de
decisão β que sucede imediatamente a raiz α da árvore do jogo, cria-
remos dois jogos. O primeiro é o subjogo Gβ que começa em β. Pela
hipótese de indução, Gβ possui pelo menos um equilı́brio de Nash s∗β .
O segundo jogo, G−β , é construı́do da seguinte maneira: removemos
de G o subjogo Gβ e nó β, que antes era de decisão, criamos uma
folha cujos payoffs são dados pelos payoffs associados ao equilı́brio s∗β
de Gβ . Novamente, pela hipótese de indução, G−β possui pelo me-
nos um equilı́brio de Nash s∗−β . Se a ação em s∗−β não usa o ramo a
que liga α a β em G−β , então s∗−β é um equilı́brio de Nash do jogo
original G. Por outro lado, se s∗−β usa o ramo a, então (a, s∗β ) é um
equilı́brio de Nash do jogo original G.

i i

i i
“tdj”
i i
2017/2/2
page 119
i i

[SEC. 5.5: EXERCÍCIOS 119

5.5 Exercı́cios
[01] (Jogo da centopéia) Use indução retroativa para obter um
equilı́brio de Nash do jogo seqüencial da figura abaixo. O
equilı́brio é Pareto eficiente?
1 Continuar 2 Continuar 1 Continuar 2 Continuar
(64, 16)
Parar

Parar

Parar

Parar
(4, 1) (2, 8) (16, 4) (8, 32) .

Este jogo foi desenvolvido pelo economista Robert W. Rosenthal,


mas o seu nome é devido a Kenneth Binmore.
[02] (Jogo da confiança) Use indução retroativa para obter um
equilı́brio de Nash do jogo seqüencial da figura abaixo. O equi-
lı́brio é Pareto eficiente?

trair ({1, 2)
2
fiar
con honrar ( 1, 1)
1

não
con
fiar
(0, 0) .

i i

i i
“tdj”
i i
2017/2/2
page 120
i i

Capı́tulo 6

Exemplos

6.1 O jogo Le Her simplificado


Nesta seção estudaremos a versão simplificada do jogo Le Her,
como apresentada por Benjamim e Goldman em [05]. Dois jogadores
empregam um pacote de 13 cartas do mesmo naipe (A, 2, . . . , 10,
Q, J e K). Após um sistema de distribuição e troca de cartas que
descreveremos a seguir, o vencedor é aquele com a maior carta (A <
2 < · · · < 10 < Q < J < K).
Inicialmente, o jogador 1 embaralha as 13 cartas e distribui uma
carta X para si, uma carta Y para o jogador 2 e deixa o restante
das cartas em um monte Z, sem que nenhum dos dois jogadores
veja as cartas. Feito isto, cada jogador vê sua carta, mas não as
outras. O jogador 1 deve então decidir se mantém a sua carta ou
a troca com o jogador 2 (que não pode se negar a fazer a troca).
No primeiro caso, é a vez do jogador 2 decidir se ele mantém a sua
carta (a única que ele conhece até o momento) ou se ele faz a troca
com a primeira carta do monte Z. Depois que o jogador 2 faz a sua
escolha, os jogadores mostram as suas cartas e vence aquele com a
maior carta. No segundo caso, os dois jogadores conhecem os valores
das duas cartas X e Y e o jogador 2 não tem escolha alguma: se,
depois da troca, a sua carta for menor do que a carta do jogador 1,
então ele deve obrigatoriamente trocá-la com a carta do monte Z
na esperança de obter uma carta maior para vencer o jogo, caso

120

i i

i i
“tdj”
i i
2017/2/2
page 121
i i

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 121

contrário, ele mantém a sua carta e vence o jogo. O leitor interessado


pode se familiarizar com as regras do jogo atuando como o jogador 2
no applet Java disponı́vel no endereço:

http://www.professores.uff.br/hjbortol/arquivo/2007.1/
applets/leher1_br.html.

Quais são as estratégias puras do jogador 1? Cada estratégia pura


corresponde a uma escolha de um subconjunto formado pelas cartas
que ele irá manter na primeira etapa do jogo. Por exemplo, a escolha
do subconjunto {5, 7, 9} corresponde à estratégia pura do jogador 1
em manter a sua carta se, e somente se, ela for igual a 5, 7 ou 9. Desta
maneira, existem tantas estratégias puras quantos subconjuntos do
conjunto
D = {A, 2, 3, 4, 5, 6, 7, 8, 9, 10, Q, J, K},
isto é, existem um total de 213 = 8192 estratégias puras para o joga-
dor 1. O mesmo vale para o jogador 2: ele tem 213 estratégias puras
que estão em correspondência biunı́voca com os 213 subconjuntos

i i

i i
“tdj”
i i
2017/2/2
page 122
i i

122 [CAP. 6: EXEMPLOS

distintos de D, cada um especificando quais cartas o jogador 2 irá


manter. É importante observar mais uma vez que o jogador 2 só faz
uma escolha (a de manter a sua carta Y ou trocá-la com uma carta
do monte Z) quando o jogador 1 decide por manter a sua carta X.
Se o jogador 1 resolve trocar de cartas, a ação do jogador 2 está com-
pletamente determinada pelos valores das cartas X e Y (supondo,
naturalmente, que o jogador 2 seja racional).
A matriz de payoffs do jogo tem, portanto, dimensão 213 × 213 .
Este tamanho pode ser reduzido consideravelmente observando que
estratégias puras “com saltos” são dominadas por aquelas “sem sal-
tos”. Por exemplo, a estratégia pura

{5, 7, 9}

(manter apenas as cartas 5, 7 e 9) é dominada pela estratégia pura

{5, 6, 7, 8, 9, 10, Q, J, K}

(manter apenas as cartas maiores do que ou iguais a 5). Assim, ao


invés de considerar todos os 213 subconjuntos de D, podemos nos
restringir aos 13 subconjuntos da forma {C ∈ D | C ≥ C},  onde
C ∈ D. No que se segue, usaremos o seguinte abuso de notação

A = {A, 2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},


2 = {2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},
3 = {3, 4, 5, 6, 7, 9, 9, 10, Q, J, K}, . . .

para representar estas estratégias puras dominantes de cada jogador.


O ganho do jogador 1 é sua probabilidade de vitória que, eviden-
temente, depende das estratégias puras (dominantes) escolhidas pelos
dois jogadores. Através de cálculos com probabilidades condicionais
(como em [05]) ou através de uma enumeração direta (veja o ap-
plet Java disponı́vel no endereço http://www.professores.uff.br/
hjbortol/arquivo/2007.1/applets/leher2_br.html), obtemos a
matriz de payoffs apresentada na tabela 6.1, onde as probabilidades
foram calculadas com 3 casas decimais corretas. Como o jogo é de
soma zero (isto é, um jogador vence se, e somente se, o outro perde),
a matriz de payoffs do jogador 2 é a matriz de payofffs do jogador 1
multiplicada por −1.

i i

i i
i
i

i
i

jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
A 0.500 0.462 0.429 0.404 0.385 0.372 0.365 0.365 0.372 0.385 0.404 0.429 0.462
2 0.538 0.500 0.468 0.442 0.423 0.410 0.404 0.404 0.410 0.423 0.442 0.468 0.500
3 0.571 0.538 0.506 0.480 0.460 0.447 0.440 0.439 0.445 0.457 0.476 0.501 0.533
4 0.596 0.569 0.543 0.517 0.496 0.481 0.473 0.471 0.476 0.487 0.505 0.529 0.559
5 0.613 0.592 0.571 0.550 0.529 0.513 0.503 0.499 0.502 0.512 0.527 0.550 0.578
6 0.622 0.606 0.590 0.573 0.557 0.541 0.529 0.523 0.523 0.530 0.544 0.564 0.590
[SEC. 6.1: O JOGO LE HER SIMPLIFICADO

7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593

jogador 1
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
10 0.566 0.563 0.559 0.556 0.552 0.549 0.545 0.542 0.538 0.535 0.533 0.538 0.549
Q 0.526 0.524 0.523 0.521 0.519 0.517 0.516 0.514 0.512 0.510 0.509 0.508 0.514
J 0.474 0.474 0.473 0.473 0.472 0.471 0.471 0.470 0.470 0.469 0.469 0.468 0.468
K 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410

Tabela 6.1: Matriz de payoffs do jogador 1 para o jogo Le Her.


123

i
i
“tdj”

i
i
page 123
2017/2/2
2017/2/2
page 124
i

i
“tdj”
i

i
[CAP. 6: EXEMPLOS

jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
jogador 1

7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
Tabela 6.2: Matriz de payoffs do jogador 1 para o jogo Le Her após mais uma eliminação de estratégias
estritamente dominadas.
124
i

i
i

i
“tdj”
i i
2017/2/2
page 125
i i

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 125

Vamos usar dominância para simplificar ainda mais a matriz do


jogo. Observe que as estratégias 7 e 9 do jogador 1 dominam, respec-
tivamente, as estratégias de A a 6 e de 10 a K (isto é, o jogador 1
deve sempre trocar cartas ≤ 6 e deve sempre manter cartas ≥ 10).
Eliminando-se então as linhas estritamente dominadas, obtemos a
matriz da tabela 6.2. Para esta matriz reduzida, as estratégias 9
e 10 do jogador 2 dominam, respectivamente, as estratégias de A a 8
e de Q a K (isto é, o jogador 2 deve sempre trocar cartas ≤ 8 e deve
sempre manter as cartas Q, J e K. Eliminando-se então as colunas
estritamente dominadas, obtemos a matriz da tabela 6.3.

jogador 2
9 10
jogador 1

7 0.538 0.543
8 0.547 0.548
9 0.549 0.545

Tabela 6.3: Matriz de payoffs do jogador 1 para o jogo Le Her após


mais uma eliminação de estratégias estritamente domi-
nadas.

Finalmente, vemos que para esta matriz reduzida, a estratégia 8 do


jogador 1 domina estritamente a estratégia 7. Eliminando-a, obtemos
a matriz 2 × 2 da tabela 6.4.

jogador 2
9 10
jogador 1

8 0.547 0.548
9 0.549 0.545

Tabela 6.4: Matriz de payoffs do jogador 1 para o jogo Le Her após


mais uma eliminação de estratégias estritamente domi-
nadas.

Usando-se programação linear ou funções de melhor resposta, po-


demos calcular facilmente o equilı́brio de Nash em estratégias mistas

i i

i i
“tdj”
i i
2017/2/2
page 126
i i

126 [CAP. 6: EXEMPLOS

deste jogo 2 × 2:

(p1 , p2 ) = (4/5, 1/5) para o jogador 1

e
(q1 , q2 ) = (3/5, 2/5) para o jogador 2.
Os payoffs médios são, respectivamente, 0.5474 e 0.4526. Vemos,
portanto, que o jogador 1 leva vantagem nesta versão simplificada
do Le Her supondo, é claro, que ele aja racionalmente seguindo o
equilı́brio de Nash.
Observações.
1. No jogo original com 52 cartas, o jogador 2 pode se negar a trocar
de cartas com o jogador 1 se sua carta for K (a de maior valor). No
caso de cartas de mesmo valor (mas naipes diferentes), o jogador 2
vence. Mesmo na versão original, a probabilidade média de ganho
do jogador 1 é maior do que a do jogador 2 no equilı́brio de Nash.
Os detalhes podem ser encontrados nas referências [25] e [37].
2. O jogo Le Her foi investigado por Pierre Rémond de Montmort
(1678–1719) e Nicholas Bernoulli (1687–1759), mas foi James Wal-
degrave (1684–1741) que forneceu uma solução para o jogo usando
o conceito de equilı́brio em estratégias mistas. As referências [90]
e [37] apresentam em detalhes a história deste jogo, incluindo a
troca de correspondência entre Montmort, Bernoulli e Waldegrave
e os erros cometidos na solução apresentada por Bernoulli.
3. Benjamim e Goldman mostram em [05] que, para a versão sim-
plificada do Le Her, a redução da matriz de payoffs para uma
matriz 2 × 2 ocorre para qualquer baralho com um número N ≥ 3
de cartas de um mesmo naipe.

6.2 O modelo de duopólio de Cournot


Sejam q1 e q2 as quantidades de um produto homogêneo fabricado
por duas empresas 1 e 2, respectivamente. Diz-se que dois produtos
fabricados por empresas diferentes são homogêneos quando os con-
sumidores não percebem diferenças na qualidade dos dois produtos

i i

i i
“tdj”
i i
2017/2/2
page 127
i i

[SEC. 6.2: O MODELO DE DUOPÓLIO DE COURNOT 127

e, assim, eles tomam suas decisões sobre qual produto comprar con-
siderando apenas o preço, independentemente do fabricante. Vamos
assumir a situação de market-clearing, isto é, não existe excesso de
demanda ou excesso de oferta no mercado. Assim, a quantidade de-
mandada do produto é igual à quantidade ofertada do mesmo. Para
simplificar, vamos supor que o preço de mercado é uma função linear
da quantidade agregada Q = q1 + q2 do produto no mercado. Mais
precisamente,
 
A − Q, se Q < A, A − (q1 + q2 ), se q1 + q2 < A,
P (Q) = =
0, se Q ≥ A, 0, se q1 + q2 ≥ A.
Aqui, A é o preço máximo aceitável pelo mercado. Os custos to-
tais de produção das empresas 1 e 2 são dados, respectivamente,
por C1 (q1 ) = c · q1 e C2 (q2 ) = c · q2 , com c > 0. Vamos supor que
c < A. As duas empresas devem escolher simultaneamente as quan-
tidades que irão produzir. O ganho de cada empresa é o lucro que
ela obtém.
Temos então um jogo infinito com dois jogadores, g1 = Empresa 1,
g2 = Empresa 2, S1 = [0, +∞), S2 = [0, +∞) e S = S1 × S2 . As fun-
ções de utilidade u1 , u2 : S → R são dadas por
u1 (q1 , q2 ) = q1 · P (q1 + q2 ) − c · q1

q1 · [A − (q1 + q2 ) − c], se q1 + q2 ≤ A,
=
q1 · [−c], se q1 + q2 > A,

q1 · (−q1 + (A − q2 − c)), se q1 + q2 ≤ A,
=
q1 · [−c], se q1 + q2 > A,

u2 (q1 , q2 ) = q2 · P (q1 + q2 ) − c · q2

q2 · [A − (q1 + q2 ) − c], se q1 + q2 ≤ A,
=
q2 · [−c], se q1 + q2 > A,

q2 · (−q2 + (A − q1 − c)), se q1 + q2 ≤ A,
=
q2 · [−c], se q1 + q2 > A.
Desta maneira, as funções de melhor resposta das duas empresas são
dadas por

{(A − c − q2 )/2}, se q2 ≤ A − c,
MR1 (q2 ) =
{0}, se q2 > A − c,

i i

i i
“tdj”
i i
2017/2/2
page 128
i i

128 [CAP. 6: EXEMPLOS


{(A − c − q1 )/2}, se q1 ≤ A − c,
MR2 (q1 ) =
{0}, se q1 > A − c.

Lembrando que (q1∗ , q2∗ ) é um equilı́brio de Nash em estratégias puras


se, e somente se, q2∗ ∈ MR2 (q1∗ ) e q1∗ ∈ MR1 (q2∗ ), vemos que (q1∗ , q2∗ )
deve ser solução do sistema

q2∗ = (A − c − q1∗ )/2 e q1∗ = (A − c − q2∗ )/2.

Sendo assim, vemos que o único equilı́brio de Nash em estratégias


puras do jogo é
 
∗ ∗ A−c A−c
(q1 , q2 ) = , . (6.1)
3 3

Estes valores também podem ser encontrados geometricamente, a-


través dos pontos de interseção das representações gráficas das duas
funções de melhor resposta (Figura 6.1).

q2

A{c

(A { c)/2
(q 1*, q2* )

0 (A { c)/2 A{c q1

Figura 6.1: Calculando o equilı́brio de Nash do modelo de duopólio


de Cournot.

i i

i i
“tdj”
i i
2017/2/2
page 129
i i

[SEC. 6.3: O MODELO DE DUOPÓLIO DE BERTRAND 129

6.3 O modelo de duopólio de Bertrand


Neste modelo, ao invés de decidir o quanto produzir, as empresas
devem escolher o quanto cobrar pelo produto, isto é, elas entram em
uma competição de preços. Como no modelo de Cournot, estamos
assumindo que tudo o que é produzido é consumido. Lembrando
que A é o preço máximo aceitável pelo mercado, vemos que S1 =
S2 = [0, A] e S = S1 × S2 = [0, A] × [0, A]. As funções utilidade são
dadas por

ui (p1 , p2 ) = pi · Qi (p1 , p2 ) − c · Qi (p1 , p2 ) = (pi − c) · Qi (p1 , p2 ),

onde Qi (p1 , p2 ) representa a produção vendida da empresa i com o


perfil de preços (p1 , p2 ). Como o produto é homogêneo, podemos
assumir que os consumidores comprarão o produto mais barato. Se
as duas empresas cobrarem o mesmo preço, vamos assumir que elas
dividem igualmente o mercado. Desta maneira,

⎨A − pi , se pi < pj ,
Qi (p1 , p2 ) = (A − pi )/2, se pi = pj ,

0, se pi > pj ,
e, portanto,

⎨(pi − c) · (A − pi ), se pi < pj ,
ui (p1 , p2 ) = (pi − c) · (A − pi )/2, se pi = pj ,

0, se pi > pj ,

onde j = i = 1, 2.
Quais são os equilı́brios de Nash em estratégias puras deste mo-
delo? Certamente (p∗1 , p∗2 ) = (c, c) é um equilı́brio de Nash pois, neste
caso,

u1 (p∗1 , p∗2 ) = 0 ≥ u1 (p1 , p∗2 ) e u2 (p∗1 , p∗2 ) = 0 ≥ u2 (p∗1 , p2 ),

para todo p1 ∈ S1 e para todo p2 ∈ S2 . Existem outros equilı́brios de


Nash? A resposta é não, como podemos concluir a partir dos casos
descritos a seguir.

(a) Se p∗2 < c e p∗1 ≥ p∗2 , então u2 (p∗1 , p∗2 ) < 0 = u2 (p∗1 , c). Logo, neste
caso, (p∗1 , p∗2 ) não é um equilı́brio de Nash do jogo.

i i

i i
“tdj”
i i
2017/2/2
page 130
i i

130 [CAP. 6: EXEMPLOS

p2

A
Caso (e)

Caso (d)
Caso (c)

(f)
so
Caso (g)

Ca
c Caso (h)
)
(b

Caso (a)
so
Ca

0 c A p1

Figura 6.2: Calculando o equilı́brio de Nash do modelo de duopólio


de Bertrand analisando os vários casos.

(b) Se p∗1 = p∗2 < c, então u1 (p∗1 , p∗2 ) < 0 = u1 (c, p∗2 ). Logo, neste
caso, (p∗1 , p∗2 ) não é um equilı́brio de Nash do jogo.

(c) Se p∗1 < c e p∗2 ≥ p∗1 , então u1 (p∗1 , p∗2 ) < 0 = u1 (c, p∗2 ). Logo, neste
caso, (p∗1 , p∗2 ) não é um equilı́brio de Nash do jogo.

(d) Suponha que p∗1 = c e p∗2 > c. Se p∗2 < A, então u1 (p∗1 , p∗2 ) = 0 <
u1 (p∗2 , p∗2 ). Se p∗2 = A, então

u2 (p∗1 , p∗2 ) = 0 < u2 (p∗1 , (A + c)/2).

Note que (A + c)/2 é ponto de máximo da função quadrática


pi → (pi − c) · (A − pi ) no intervalo [c, A]. Vemos então que, neste
caso, (p∗1 , p∗2 ) também não é um equilı́brio de Nash do jogo.

(e) Suponha que p∗2 > p∗1 > c. Como u2 (p∗1 , p∗2 ) = 0 < u2 (p∗1 , p∗1 ).
segue-se que (p∗1 , p∗2 ) também não é um equilı́brio de Nash do
jogo.

i i

i i
“tdj”
i i
2017/2/2
page 131
i i

[SEC. 6.4: O MODELO DE DUOPÓLIO DE STACKELBERG 131

( f ) Suponha que p∗2 = p∗1 > c. Se p∗1 = p∗2 ∈ ((A + c)/2, A], então
u1 (p∗1 , p∗2 ) < u1 ((A + c)/2, p∗2 ). Se p∗1 = p∗2 ∈ (c, (A + c)/2], seja
p•1 a solução da equação (c − x) · (A − x) = u∗ no intervalo (c, p∗1 ),
onde u∗ = (c − p∗1 ) · (A − p∗1 )/2, isto é, seja
)
A+c c2 + A2 − 2 · p∗1 · A + 2 · p∗1 2 − 2 · c · p∗1

p1 = − .
2 2
Então u1 (p∗1 , p∗2 ) < u1 ((p•1 + p∗1 )/2, p∗2 ). Vemos então que, neste
caso, (p∗1 , p∗2 ) também não é um equilı́brio de Nash do jogo.
(g) Suponha que p∗1 > p∗2 > c. Como u1 (p∗1 , p∗2 ) = 0 < u1 (p∗2 , p∗2 ).
segue-se que (p∗1 , p∗2 ) também não é um equilı́brio de Nash do
jogo.
(h) Suponha que p∗2 = c e p∗1 > c. Se p∗1 < A, então u2 (p∗1 , p∗2 ) = 0 <
u2 (p∗1 , p∗1 ). Se p∗1 = A, então

u1 (p∗1 , p∗2 ) = 0 < u1 ((A + c)/2, p∗2 ).

Vemos então que, neste caso, (p∗1 , p∗2 ) também não é um equilı́brio
de Nash do jogo.

Ao contrário do modelo de duopólio de Cournot, as funções de


melhor resposta não estão definidas. Por exemplo, se p∗1 = (A + c)/2,
então não existe um ponto de máximo da função p2 → u2 (p∗1 , p2 ),
como mostra a Figura 6.3. Isto acontece por que esta função é des-
contı́nua.

6.4 O modelo de duopólio de Stackelberg


O modelo de duopólio de Cournot é um jogo simultâneo, no sen-
tido que cada empresa, ao escolher o seu nı́vel de produção, não sabe
o nı́vel de produção da empresa concorrente. Heinrich von Stackel-
berg, em [88], propôs um modelo de duopólio onde uma das empresas
(a empresa lı́der) escolhe sua produção primeiro e a outra empresa
(a empresa seguidora) faz a sua escolha de produção depois.
A ordem do jogo é a seguinte: (1) a empresa 1 escolhe uma quan-
tidade de produção q1 ≥ 0 e (2) a empresa 2 observa o valor de q1

i i

i i
“tdj”
i i
2017/2/2
page 132
i i

132 [CAP. 6: EXEMPLOS

u2

0 c (A + c)/2 A p2

Figura 6.3: Gráfico da função p2 → u2 ((A + c)/2, p2 ).

e, então, escolhe a sua quantidade de produção q2 ≥ 0. O ganho de


cada empresa é o lucro que ela obtém:

u1 (q1 , q2 ) = q1 · P (q1 + q2 ) − c · q1 ,
u2 (q1 , q2 ) = q2 · P (q1 + q2 ) − c · q2 ,

onde P (Q) = A − Q é o preço de mercado em função da quantidade


agregada Q = q1 + q2 e c > 0 é o custo unitário de produção.
Vamos usar indução retroativa para encontrar um equilı́brio de
Nash deste jogo seqüencial. Primeiro, vamos calcular a ação ótima
A2 (q1 ) da empresa 2 em função da quantidade de produção q1 :

A2 (q1 ) = argmaxq2 ≥0 u2 (q1 , q2 ) = argmaxq2 ≥0 q2 · [A − q1 − q2 − c] .

Pela regra de Fermat, obtemos que

A − q1 − c
q2 = A2 (q1 ) = ,
2

i i

i i
“tdj”
i i
2017/2/2
page 133
i i

[SEC. 6.5: A TRAGÉDIA DOS COMUNS 133

desde que q1 < A − c. Prosseguindo retroativamente, vemos que a


ação ótima A1 da Empresa 1 é dada por
A1 = argmaxq1 ≥0 u1 (q1 , A2 (q1 ))
= argmaxq1 ≥0 q1 · [A − q1 − A2 (q1 ) − c]
= argmaxq1 ≥0 q1 · [A − q1 − c]/2
e, desta maneira,
A−c A−c
q1∗ = A1 = e q2∗ = A2 (q1∗ ) = .
2 4
Se a empresa 1 tivesse escolhido a ação sugerida pelo equilı́brio de
Cournot, q1(C) = (A − c)/3, então a ação ótima da empresa 2 também
seria aquela sugerida pelo equilı́brio de Cournot, q2(C) = (A − c)/3.
Portanto, usando-se as ações sugeridas pelo equilı́brio de Cournot no
modelo Stackelberg, temos que Q(C) = q1(C) + q2(C) = 2 · (A − c)/3,
P (Q(C) ) = (A + 2 · c)/3 e
(A − c)2
u1 (q1(C) , q2(C) ) = u2 (q1(C) , q2(C) ) = .
9
Por outro lado, usando-se as ações obtidas por indução retroativa,
vemos que Q∗ = q1∗ + q2∗ = 3 · (A − c)/4, P (Q∗ ) = (A + 3 · c)/4 e
(A − c)2 (A − c)2
u1 (q1∗ , q2∗ ) = , u2 (q1∗ , q2∗ ) = .
8 16
Estas expressões mostram que a produção agregada (a soma das
produções) é maior no modelo de Stackelberg do que no modelo de
Cournot. Elas também explicam porque, no modelo de Stackelberg,
a empresa 1 não escolhe a ação sugerida pelo modelo de Cournot: se
ela o fizer, vai ganhar menos. Vemos também que o preço de mercado
no modelo de Cournot é maior do que no modelo de Cournot. Assim,
no modelo de Stackelberg, a empresa 1 está ganhando mais porque a
empresa 2 está ganhando bem menos.

6.5 A tragédia dos comuns


O termo “A Tragédia dos Comuns” vem de uma parábola pu-
blicada pelo economista polı́tico William Forster Lloyd em seu livro

i i

i i
“tdj”
i i
2017/2/2
page 134
i i

134 [CAP. 6: EXEMPLOS

Two Lectures on the Checks to Population de 1833, que depois foi po-
pularizada e estendida por Garret Hardin no seu artigo The Tragedy
of the Commons publicado na revista Science em 1968 ([38]).
A palavra “tragédia” tem o significado dado por Alfred North
Whitehead em seu livro Science and The Modern World : “The es-
sence of dramatic tragedy is not unhappiness. It resides in the solem-
nity of the remorseless working of things.”. Já a palavra “comuns”
designa uma área de pastagem coletiva, sem dono e sem qualquer
regulamentação, usada por pastores na Idade Média, que cuidavam
do rebanho de ovelhas para obter a lã que vendiam para a confecção
de roupas.
Com o crescimento do número de famı́lias de camponeses ao longo
do tempo, ocorreu um aumento do número de ovelhas necessárias
para o sustento de cada famı́lia. Como a área de pastagem era de uso
comum, nenhuma famı́lia tinha incentivo para controlar o número de
ovelhas de seu rebanho pois, se o fizesse, outras famı́lias usariam as
pastagens de qualquer forma. Com uma superpopulação de ovelhas, a
terra que antes era fértil, começou a se exaurir. A redução da área de
pastagem afetou tanto o rebanho quanto a indústria local de roupas.
A parábola mostra, então, que a imprudência em administrar um
recurso finito do qual todos se beneficiam pode levar à ruı́na.
Vamos usar teoria dos jogos para modelar uma versão ingênua da
tragédia dos comuns. Considere uma aldeia com n pastores e seja oi
o número de ovelhas do i-ésimo pastor, de modo que o número total
de ovelhas da aldeia é o = o1 + · · · + on . O custo de compra de uma
ovelha é c, independentemente do número de ovelhas que o pastor
já possui. O benefı́cio de um pastor em deixar uma ovelha pastando
é v(o) por ovelha. Como o campo de pastagem é um recurso finito,
existe um número máximo o de ovelhas que ele pode suportar. As-
sim, v(o) > 0 se o < o e v(o) = 0 se o ≥ o. Naturalmente, v é uma
função decrescente, pois quanto mais ovelhas no pasto, menor será a
área útil de pastagem para a próxima ovelha. Mais ainda: se existem
poucas ovelhas pastando, colocar uma a mais para pastar não vai
afetar muito as ovelhas que já estão pastando mas, por outro lado, se
existem muitas ovelhas no pasto, digamos, quase que completando a
cota máxima o, o acréscimo de uma ovelha prejudica mais acentua-
damente a pastagem das demais ovelhas. Admitindo que as ovelhas
sejam infinitamente divisı́veis, estas condições podem ser modeladas

i i

i i
“tdj”
i i
2017/2/2
page 135
i i

[SEC. 6.5: A TRAGÉDIA DOS COMUNS 135

exigindo-se que v  ≤ 0 e v  < 0. Desta maneira, v tem um gráfico tal


como o apresentado na Figura 6.4.

0 o o

Figura 6.4: Gráfico da função v.

Neste jogo, a estratégia do pastor i é a escolha da quantidade de


ovelhas que ele deixará no pasto. Podemos então considerar que o
conjunto de estratégias puras do pastor i é Si = [0, o). Sua função
utilidade é dada por

ui (o1 , . . . , oi , . . . , on ) = oi · v(o1 + · · · + oi + · · · + on ) − c · oi .

Suponha que c < v = v(0). Vamos n caracterizar os equilı́brios de


Nash o∗ = (o∗1 , . . . , o∗n ) tais que j=1 o∗j < o. Para isto, usaremos
n
as seguintes notações: σ ∗ = j=1 o∗j e σ−i ∗
= σ ∗ − o∗i . Note que a
função  
μi
oi −→ ui (oi , o∗−i ) = oi · v oi − σ−i

− c · oi
tem as seguintes propriedades:

(1) μi é contı́nua,

(2) μi tem a mesma classe de diferenciabilidade de v em [0, o − σ−i ),
∗ ∗
(3) μi (0) = 0, μi (o − σ−i ) < 0, μi (oi ) ≤ 0 para oi ≥ o − σ−i ,

(4) μi (0) = v(0) − c > 0, logo μi é crescente e, portanto, positiva, em


um intervalo (0, ) para algum  > 0 e

i i

i i
“tdj”
i i
2017/2/2
page 136
i i

136 [CAP. 6: EXEMPLOS

 ∗
(5) μi é côncava em 0, o − σ−i .
Logo, a função de melhor resposta do pastor i está bem definida:
   
MRi (o∗ ) = argmaxoi ∈(0,o−σ−i ∗
∗ ) oi · v oi − σ−i − c · oi .

Se o∗i ∈ MRi (o∗ ), então, pela regra de Fermat, μi (o∗i ) = 0, isto é,
v(o∗i + σ−i

) + o∗i · v  (o∗i + σ−i

) − c = 0.
Somando-se estas equações para i = 1, . . . , n e, então, dividindo-se
por n, obtemos que σ ∗ deve satisfazer a seguinte equação:
1 ∗  ∗
v(σ ∗ ) + · σ · v (σ ) = 0. (6.2)
n
Por outro lado, se o objetivo é maximizar a utilidade coletiva, isto
é, a soma das funções utilidades individuais, então devemos resolver
o seguinte problema de otimização:
max (o · v(o) − c · o) .
o∈(0,o)

Usando novamente a regra de Fermat, concluı́mos que uma solução σ •


deste problema de otimização deve resolver a seguinte equação:
v(σ • ) + σ • · v  (σ • ) = 0. (6.3)
Observe que σ ∗ > σ • . Com efeito: se, por absurdo, σ ∗ ≤ σ • , então
v(σ ∗ ) ≥ v(σ • ), já que v é decrescente. Mas v  também é decrescente,
já que v  < 0. Desta maneira, 0 > v  (σ ∗ ) ≥ v  (σ • ). Como 0 <
σ ∗ /n < σ ∗ ≤ σ • , segue-se que
σ∗  ∗ σ∗  •
· v (σ ) ≥ · v (σ ) > σ • · v  (σ • )
n n
e, portanto,
σ∗  ∗
0 = v(σ ∗ ) + · v (σ ) > v(σ • ) + σ • · v  (σ • ) = 0,
n
uma contradição. Vemos então que o equilı́brio de Nash o∗ coloca
mais ovelhas no pasto do que o número de ovelhas sugerido pelo
equilı́brio coletivo o• . Isto acontece porque cada pastor considera
apenas o seu próprio benefı́cio e não o efeito de suas ações sobre os
outros pastores.

i i

i i
“tdj”
i i
2017/2/2
page 137
i i

Apêndice A

Convexidade

Neste apêndice apresentaremos as definições e propriedades bá-


sicas de funções convexas necessárias no texto. As demonstrações
omitidas podem ser encontradas em [42].

Definição A.1 (Conjuntos convexos) Dizemos que U ⊂


Rn é um conjunto convexo se, e somente se, para todo p, q ∈ U
tem-se
(1 − t) · p + t · q ∈ U,
para todo t ∈ [0, 1], isto é, se o segmento de reta que une dois
pontos quaisquer de U está sempre contido em U .

Teorema A.1 Seja {Uξ }ξ∈Ξ uma famı́lia de conjuntos conve-


xos em Rn Então 

ξ∈Ξ

também é um conjunto convexo em Rn .

137

i i

i i
“tdj”
i i
2017/2/2
page 138
i i

138 [CAP. A: CONVEXIDADE

(a) (b)

Figura A.1: O conjunto da esquerda é convexo enquanto que o da


direita não o é.

Definição A.2 (Semiplanos e Semiespaços) Seja a um ve-


tor não-nulo em Rn e seja c um número real. Os conjuntos

H+ = {x ∈ Rn | ax ≥ c} e H− = {x ∈ Rn | ax ≤ c}

são denominados, respectivamente, semiespaços fechados cor-


respondentes ao semiplano H = {x ∈ Rn | ax = c}.

Por linearidade, segue-se que semiplanos e semiespaços são con-


juntos convexos.

Definição A.3 (Politopos e Poliedros) Um politopo é um


conjunto que pode ser expresso como a interseção de um número
finito de semiespaços fechados. Um poliedro é um politopo limi-
tado.

Note que politopos e poliedros são conjuntos convexos, como in-


terseção de conjuntos convexos.

Definição A.4 (Combinação convexa) Sejam x1 , . . . , xk ∈


Rn e λ1 , . . . , λk números reais ≥ 0 tais que ni=1 λi = 1. A com-
binação convexa de x1 , . . . , xk com pesos λ1 , . . . , λk é o ponto

λ1 · x1 + · · · + λi · xk .

i i

i i
“tdj”
i i
2017/2/2
page 139
i i

139

(a) (b)

Figura A.2: O conjunto de todas as combinações convexas de (a) dois


pontos distintos é um segmento de reta que liga os dois
pontos e de (b) três pontos não-colineares é um triângulo
(lados e interior) com vértices nos três pontos.

Teorema A.2 Um subconjunto U de Rn é convexo se, e so-


mente se, toda combinação convexa de pontos de U pertence
a U.

Definição A.5 (Funções convexas e côncavas)


(a) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é convexa se, e somente se,

f ((1 − t) · p + t · q) ≤ (1 − t) · f (p) + t · f (q), (A.1)

para todo p, q ∈ U e todo t ∈ [0, 1].


(b) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é côncava se, e somente se,

f ((1 − t) · p + t · q) ≥ (1 − t) · f (p) + t · f (q), (A.2)

para todo p, q ∈ U e todo t ∈ [0, 1].

A interpretação geométrica é a seguinte: para uma função convexa, o


segmento de reta secante que passa pelos pontos (p, f (p)) e (q, f (q))
sempre está acima ou coincide com o gráfico de f para qualquer

i i

i i
“tdj”
i i
2017/2/2
page 140
i i

140 [CAP. A: CONVEXIDADE

f(p)

seg
me
nto
(1{ t) . f(p)+t . f(q) de r
eta
sec
ant
e gráfico de f

f(q)
f ((1{ t) . p +t . q)

0 p (1{ t) . p+t . q q x

Figura A.3: Para uma função convexa, o segmento de reta secante


fica sempre acima ou coincide com o gráfico da função,
para quaisquer escolhas de p e q.

escolha de pontos p e q em U (veja a Figura A.3). Já para uma


função côncava, o segmento de reta secante que passa pelos pontos
(p, f (p)) e (q, f (q)) sempre está abaixo ou coincide com o gráfico
de f para qualquer escolha de pontos p e q em U . Note que f é
côncava se, e somente se, −f é convexa.
O próximo teorema estabelece o motivo de convexidade ser uma pro-
priedade tão desejável em otimização.

Teorema A.3

(a) Se f : U ⊂ Rn → R é convexa, então todo ponto de mı́nimo


local de f em U também é ponto de mı́nimo global de f
em U .
(b) Se f : U ⊂ Rn → R é côncava, então todo ponto de máximo
local de f em U também é ponto de máximo global de f
em U .

i i

i i
“tdj”
i i
2017/2/2
page 141
i i

141

Teorema A.4 Seja f : U ⊂ Rn → R uma função de classe C 1


definida em um subconjunto convexo U de Rn .
(a) f é uma função convexa em U se, e somente se,

f (q) ≥ f (p) + ∇f (p) · (q − p), (A.3)

para todo p, q ∈ U , isto é, se, e somente se, cada hiperplano


tangente ao gráfico de f está sempre abaixo ou coincide com
o gráfico de f .
(b) f é uma função côncava em U se, e somente se,

f (q) ≤ f (p) + ∇f (p) · (q − p), (A.4)

para todo p, q ∈ U , isto é, se, e somente se, cada hiperplano


tangente ao gráfico de f está sempre acima ou coincide com
o gráfico de f .
Aqui ∇f (p) denota o vetor gradiente de f em p.

gráfico de f

0 x

Figura A.4: Para uma função convexa, cada hiperplano tangente ao


gráfico de f está sempre abaixo do gráfico de f .

i i

i i
“tdj”
i i
2017/2/2
page 142
i i

142 [CAP. A: CONVEXIDADE

Definição A.6 (Funções quase-convexas e quase-côn-


cavas)
(a) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é quase-convexa se, e somente
se,
{x ∈ U | f (x) ≤ c}
é um conjunto convexo para todo c ∈ R.
(b) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é quase-côncavo se, e somente
se,
{x ∈ U | f (x) ≥ c}
é um conjunto convexo para todo c ∈ R.

Note que f é quase-côncava se, e somente se, −f é quase-convexa.


Toda função convexa é quase-convexa e toda função côncava é quase-
côncava. Existem funções quase-convexas que não são convexas.
√ Por
3
exemplo, a função f : R → R definida por y = f (x) = x2 é quase-
convexa, mas não é convexa.

0 x


3
Figura A.5: y = f (x) = x2 é quase-convexa, mas não é convexa
em R.

i i

i i
“tdj”
i i
2017/2/2
page 143
i i

143

Toda função f : R → R monótona é quase-convexa e quase-côncava.


A função y = f (x) = x que leva x ∈ R no maior inteiro menor do
que ou igual a x é função quase-convexa que não é contı́nua. A função
da Figura A.6 é um exemplo de função que não é quase-convexa.

Teorema A.5 Seja f : U ⊂ Rn → R uma função definida em


um subconjunto convexo U de Rn .
(a) As seguintes condições são equivalentes:

(1) f é uma função quase-convexa em U .


(2) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1], se f (x1 ) ≤ f (x2 ), então

f (t · x1 + (1 − t) · x2 ) ≤ f (x2 ).

(3) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1],

f (t · x1 + (1 − t) · x2 ) ≤ max{f (x1 ), f (x2 )}.

(b) As seguintes condições são equivalentes:


(1) f é uma função quase-côncava em U .
(2) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1], se f (x1 ) ≥ f (x2 ), então

f (t · x1 + (1 − t) · x2 ) ≥ f (x2 ).

(3) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1],

f (t · x1 + (1 − t) · x2 ) ≥ min{f (x1 ), f (x2 )}.

Teorema A.6 Seja f : U ⊂ Rn → R uma função de classe C 1


definida em um subconjunto convexo U de Rn .

(a) f é quase-convexa em U se, e somente se,

∀x1 , x2 ∈ U, f (x2 ) ≤ f (x1 ) ⇒ ∇f (x1 ) · (x2 − x1 ) ≤ 0.

i i

i i
“tdj”
i i
2017/2/2
page 144
i i

144 [CAP. A: CONVEXIDADE

0 x

Figura A.6: Um exemplo de função que não é quase-convexa.

(b) f é quase-côncava em U se, e somente se,

∀x1 , x2 ∈ U, f (x2 ) ≥ f (x1 ) ⇒ ∇f (x1 ) · (x2 − x1 ) ≥ 0.

i i

i i
“tdj”
i i
2017/2/2
page 145
i i

Apêndice B

Programação Linear

Neste apêndice apresentaremos as definições e propriedades bá-


sicas da teoria de programação linear necessárias no texto. Para
detalhes, demonstrações e extensões, recomendamos os excelentes li-
vros [14, 52].
Um programa linear é um problema de otimização onde a função
que queremos otimizar e as restrições são todas lineares. Por exemplo,

minimizar x1 + x2
x1 ,x2 ∈R
sujeito a 3 x1 + 2 x2 ≥ 8,
x1 + 5 x2 ≥ 7, (B.1)
x1 ≥ 0,
x2 ≥ 0,

é um programa linear. Para resolvê-lo, precisamos encontrar um


ponto (x1 , x2 ) do conjunto admissı́vel

K = {(x1 , x2 ) ∈ R2 | 3 x1 + 2 x2 ≥ 8, x1 + 5 x2 ≥ 7, x1 ≥ 0, x2 ≥ 0}

que torna o valor da função objetivo o(x1 , x2 ) = x1 + x2 o menor


possı́vel. O conjunto K está desenhado na Figura B.1. Por inspeção,
vemos que a solução ótima é dada por (x∗1 , x∗2 ) = (2, 1). Este ponto é
a interseção da curva de nı́vel f (x1 , x2 ) = x1 + x2 = c “mais baixa”
que intercepta o conjunto admissı́vel.

145

i i

i i
“tdj”
i i
2017/2/2
page 146
i i

146 [CAP. B: PROGRAMAÇÃO LINEAR

x2

0 2 3 7 x1

Figura B.1: O conjunto admissı́vel do programa linear B.1.

Dizemos que um programa linear está na forma padrão se todas


as variáveis de decisão são não-negativas e se todas as restrições são
em igualdade:

minimizar ∈ R c1 x1 + · · · + cn xn
x1 ,...,xn
sujeito a a11 x1 + ··· + a1n xn = b1 ,
.. .. .. .. ..
. . . . .
am1 x1 + · · · + amn xn = bm ,
e x1 ≥ 0, . . . , xn ≥ 0.

Todo programa linear pode ser reescrito na forma padrão com o uso
de variáveis de folga. Por exemplo, uma restrição da forma
ai1 x1 + · · · + ain xn ≥ bi
pode ser substituı́da, de maneira equivalente, pelas restrições
ai1 x1 + · · · + ain xn − yi = bi e yi ≥ 0.
Se uma variável de decisão xi pode assumir qualquer valor real, isto é,
se não existe restrição de não-negatividade em xi , então podemos

i i

i i
“tdj”
i i
2017/2/2
page 147
i i

147

substituir xi por ui − vi , a diferença de dois números positivos. Se


colocarmos o programa linear B.1 na forma padrão, obtemos o se-
guinte PL:
minimizar x1 + x2
x1 ,x2 ,y1 ,y2 ∈R
sujeito a 3 x1 + 2 x2 − y1 = 8,
x1 + 5 x2 − y2 = 7,
x1 ≥ 0, (B.2)
x2 ≥ 0,
y1 ≥ 0,
y2 ≥ 0.

Um programa linear pode ser escrito de forma mais compacta


usando-se matrizes e vetores:

minimizar
n
cT x
x∈R (B.3)
sujeito a Ax = b e x ≥ 0,

onde x ∈ Rn , c ∈ Rn , b ∈ Rm e A é uma matriz m × n. Note


que o conjunto admissı́vel K = {x ∈ Rn | Ax = b e x ≥ 0} de um
programa linear, quando não-vazio, é um politopo convexo, e que as
hipersuperfı́cies de nı́vel da função objetivo são hiperplanos.
Problemas de maximização podem ser transformados em proble-
mas de minimização substituindo-se a função objetivo o por −o. Mais
precisamente, x∗ é uma solução ótima de

maximizar
n
cT x
x∈R
sujeito a Ax = b e x ≥ 0,

se, e somente se, x∗ também é solução de

minimizar
n
−cT x
x∈R
sujeito a Ax = b e x ≥ 0.

Na teoria de programação linear, assume-se que m < n (existem


mais incógnitas do que restrições em igualdade) e que o posto da
matriz A é m, isto é, as m linhas de A são linearmente independentes.

i i

i i
“tdj”
i i
2017/2/2
page 148
i i

148 [CAP. B: PROGRAMAÇÃO LINEAR

Da teoria de Álgebra Linear sabemos, então, que existem m colunas


de A que são linearmente independentes. Renomeando-se ı́ndices se
necessário, podemos assumir que estas colunas sejam as m primeiras.
Isto induz uma decomposição de A e de x:
' (
 xB
A= B C , x= ,
xC
onde B é uma matriz m×m inversı́vel. Como o sistema linear Ax = b
é equivalente a BxB + CxC = b, segue-se então que existe uma
solução x de Ax = b na forma
' (
xB
.
0
Esta solução é denominada solução básica do sistema linear Ax =
b associada à base B. As componentes de xB são denominadas
variáveis básicas.

Teorema B.1 (Teorema Fundamental da Programação


Linear) Considere um programa linear na forma padrão B.3,
com A matriz m × n de posto m.
(a) Se o programa linear possui um ponto admissı́vel, então ele
possui um ponto admissı́vel que é uma solução básica do
sistema linear Ax = b.
(b) Se o programa linear possui um ponto ótimo, então ele pos-
sui um ponto ótimo que é uma solução básica do sistema
linear Ax = b.

O próximo teorema dá uma interpretação geométrica para pontos


admissı́veis que são soluções básicas: eles correspondem aos pontos
extremos (vértices) do politopo K = {x ∈ Rn | Ax = b e x ≥ 0}.

Definição B.1 (Ponto Extremo) Dizemos que um ponto x


em um conjunto convexo U é ponto extremo de U se não existem
dois outros pontos distintos x1 e x2 em U tais que x = α x1 +
(1 − α) x2 para algum α no intervalo (0, 1).

i i

i i
“tdj”
i i
2017/2/2
page 149
i i

149

Na Figura B.2, x1 , x2 e x3 são os únicos pontos extremos do


conjunto admissı́vel K do PL B.1. O ponto x4 não é um ponto
extremo de K, pois ele pode ser escrito como uma combinação con-
vexa de x2 ∈ K e x3 ∈ K. Como x6 = α x5 + (1 − α) x7 para
algum α ∈ (0, 1), vemos que o ponto x6 (no interior do conjunto
admissı́vel) também não é um ponto extremo de K.

x2

4 x1 x6 x7

x5
3

x2
1 x4
x3
0
2 3 7 x1

Figura B.2: x1 , x2 e x3 são os únicos pontos extremos do conjunto


admissı́vel do PL B.1.

Teorema B.2 (Equivalência entre Pontos Extremos e


Soluções Básicas) Seja A uma matriz m × n de posto m,
b um vetor em Rm e K = {x ∈ Rn | Ax = b e x ≥ 0} o con-
junto admissı́vel de B.3. Então x é um ponto extremo de K
se, e somente se, x é um ponto admissı́vel que é solução básica
de Ax = b.

Os teoremas B.1 e B.2 dizem que, para se resolver o problema B.3, não
é preciso considerar todos os pontos do conjunto admissı́vel K: basta
procurar pelo ponto ótimo entre os pontos extremos (vértices) de K!
O método simplex explora esta estrutura para construir um algoritmo
muito popular para se resolver B.3. Outra categoria de métodos que

i i

i i
“tdj”
i i
2017/2/2
page 150
i i

150 [CAP. B: PROGRAMAÇÃO LINEAR

recentemente ganhou bastante popularidade é a classe dos métodos


de ponto interior. Não é nosso propósito estudar estes algoritmos
aqui. O leitor interessado poderá consultar os livros [14, 52]. O que é
preciso se ter em mente é que programas lineares podem ser resolvidos
numericamente de maneira muito eficiente nos dias de hoje. A seguir
estabeleceremos resultados sobre dualidade, um conceito fundamental
e muito útil em programação linear.

Definição B.2 (O problema dual) O problema dual de

minimizar
n
cT x
x∈R (B.4)
sujeito a Ax ≥ b e x ≥ 0,

é o programa linear

maximizar
m
λT b
λ∈R (B.5)
sujeito a AT λ ≤ c e λ ≥ 0,
m
onde λT b = i=1 λi bi . B.5 é denominado o problema dual
de B.4. Neste contexto, B.4 é denominado problema primal.

Por exemplo, o problema dual do programa linear B.1 é

minimizar 8 λ1 + 7 λ2
λ1 ,λ2 ∈R
sujeito a 3 λ1 + λ2 ≤ 1,
2 λ1 + 5 λ2 ≤ 1, (B.6)
λ1 ≥ 0,
λ2 ≥ 0.

O problema dual de qualquer programa linear pode ser encontrado


convertendo-o para o formato B.4. Por exemplo, como Ax = b se,
e somente se, Ax ≥ b e −Ax ≥ −b, o programa linear na forma
padrão B.3 pode ser escrito na forma do problema primal B.4 da

i i

i i
“tdj”
i i
2017/2/2
page 151
i i

151

seguinte maneira equivalente

minimizar
n
cT x
x∈R
' ( ' (
A b
sujeito a x≥ e x ≥ 0.
−A −b

Particionando-se agora as variáveis duais na forma (u, v), o problema


dual deste último PL é

minimizar
n
uT b − vT b
x∈R
sujeito a AT u − AT v ≤ c, u ≥ 0 e v ≥ 0.

Fazendo-se λ = u − v, o problema acima pode ser simplificado, o que


nos leva ao seguinte par de problemas duais:

Par Dual B.1


(problema primal) (problema dual)
minimizar
n
T
c x maximizar
m
λT b
x∈R λ∈R
sujeito a Ax = b, sujeito a AT λ ≤ c.
x ≥ 0,

Outros pares de problemas duais de interesse são dados a seguir.

Par Dual B.2


(problema primal) (problema dual)
maximizar
n
T
c x minimizar
m
λT b
x∈R λ∈R
sujeito a Ax = b, sujeito a AT λ ≥ c.
x ≥ 0,

i i

i i
“tdj”
i i
2017/2/2
page 152
i i

152 [CAP. B: PROGRAMAÇÃO LINEAR

Par Dual B.3 (O da Definição B.2)


(problema primal) (problema dual)
minimizar
n
T
c x maximizar
m
λT b
x∈R λ∈R
sujeito a Ax ≥ b, sujeito a AT λ ≤ c,
x ≥ 0, λ ≥ 0.

Par Dual B.4


(problema primal) (problema dual)
T
maximizar
m
b y minimizar cT x
y∈R n
x∈R
sujeito a Ay ≤ c, sujeito a xT A ≥ bT,
y ≥ 0, x ≥ 0.

Teorema B.3 (Teorema fraco de dualidade) Se x e λ são


admissı́veis para os problemas B.3 e B.5, respectivamente, então
cT x ≥ λT b.

Este teorema mostra que um ponto admissı́vel para um dos pro-


blemas fornece uma cota para o valor da função objetivo do outro
problema. Os valores associados com o problema primal são sempre
maiores ou iguais aos valores associados com o problema dual. Como
corolário, vemos que se um par de pontos admissı́veis pode ser encon-
trado para os problemas primal e dual com valores iguais da função
objetivo, então estes pontos são ótimos.

Teorema B.4 (Teorema forte de dualidade) Se um dos


problemas B.3 ou B.5 tem uma solução ótima finita, então o
outro também terá uma solução ótima finita e, neste caso, os
valores das respectivas funções objetivo são iguais. Se a função

i i

i i
“tdj”
i i
2017/2/2
page 153
i i

153

objetivo do problema primal não é limitada inferiormente, então


o conjunto admissı́vel do problema dual é vazio e, se a função
objetivo do problema dual não é limitada superiormente, então
o conjunto admissı́vel do problema primal é vazio.

O conjunto admissı́vel do problema dual B.6 do programa linear B.1


está desenhado na Figura B.3. Por inspeção, vemos que a solução
ótima é dada por (λ∗1 , λ∗2 ) = (4/13, 1/13). Este ponto é a interseção da
curva de nı́vel g(λ1 , λ2 ) = 8 λ1 + 7 λ2 = c “mais alta” que intercepta
o conjunto admissı́vel. Lembrando que (x∗1 , x∗2 ) = (2, 1) é a solução
do problema primal B.1, vemos que
f (x∗1 , x∗2 ) = x∗1 + x∗2 = 3 = 8 λ∗1 + 7 λ∗2 = g(λ∗1 , λ∗2 ),
como afirma o teorema forte da dualidade.
¸2

3/7

1/5

(4/13, 1/13)

3/8
0 1/3 ¸1

Figura B.3: O conjunto admissı́vel do problema dual B.6 do pro-


grama linear B.1.

Por fim, gostarı́amos de observar que se a função objetivo do pro-


grama linear B.3 não é limitada inferiormente no conjunto admissı́vel

i i

i i
“tdj”
i i
2017/2/2
page 154
i i

154 [CAP. B: PROGRAMAÇÃO LINEAR

K = {x ∈ Rn | Ax = b e x ≥ 0} ,
então existem ponto extremo x  e raio extremo r de K tal que o valor
da função objetivo de B.3 em x = x +tr tende a −∞ quando t tende
a +∞. Em particular,
cT 
r < 0.
Dizemos que  r é um raio de K se, e somente se, r = 0 e o conjunto
{p ∈ Rn | p = x + t  r e t ≥ 0} está contido em K para todo x ∈ K.
Um raio  r de K é extremo, se não existem outros dois raios r1 e r2
de K (com r1 = t r2 para todo t > 0) e um escalar s no intervalo (0, 1)
tal que 
r = s r1 + (1 − s) r2 .

x2

r1
r2

r3
K

0 x1

Figura B.4: Os vetores r1 e r2 não são raios extremos de K. O ve-


tor r3 é um raio extremo de K.

i i

i i
“tdj”
i i
2017/2/2
page 155
i i

Apêndice C

Respostas dos exercı́cios

Capı́tulo 2
[01] O processo de dominância estrita iterada reduz o jogo para uma
matriz 1×1 com um único perfil de estratégias puras: (s13 , s22 ).
[02] (a) Não existem estratégias dominantes neste jogo.
(b) (l1 , c1 ) e (l2 , c2 ) são os únicos equilı́brios de Nash em es-
tratégias puras do jogo.
[03] (a) c2 domina estritamente c1 .
(b) (l2 , c2 ) é o único equilı́brio de Nash em estratégias puras do
jogo.
[04] (a) Não existem estratégias dominantes neste jogo.
(b) (desviar, não desviar) e (não desviar, desviar) são os únicos
equilı́brios de Nash em estratégias puras do jogo.
[05] (a) Não existem estratégias dominantes neste jogo.
(b) (brigar, ameaçar) e (ameaçar, brigar) são os únicos equilı́brios
de Nash em estratégias puras do jogo.
[06] Usando o processo de dominância fraca iterada, o jogo se reduz
para uma matriz 3 × 3:

155

i i

i i
“tdj”
i i
2017/2/2
page 156
i i

156 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

Eixo
A B C
1 (+13, −13) (+29, −29) (+ 8, − 8)
Aliados .
3 (+18, −18) (+22, −22) (+31, −31)

6 (+23, −23) (+22, −22) (+19, −19)

[07] O processo de dominância estrita iterada reduz o jogo para


uma matriz 1 × 1 × 1 com um único perfil de estratégias puras:
(x3 , y2 , z4 ).

[08] O processo de dominância estrita iterada reduz o jogo para


uma matriz 1 × 1 × 1 com um único perfil de estratégias puras:
(x2 , y1 , z2 ).

[09] O perfil de estratégias (x2 , y2 , z3 ) é o único equilı́brio de Nash


em estratégias puras do jogo.

[10] (a) Para o jogador 1, a estratégia M é fracamente dominada


pela estratégia T e também fracamente dominada pela es-
tratégia B. Para o jogador 2, a estratégia L é fracamente
dominada pela estratégia R.
(b) O processo de eliminação das estratégias fracamente domi-
nadas conduz a duas reduções 1 × 1: {(B, C)} e {(T, R)}.
(c) Os equilı́brios de Nash em estratégias puras são (T, C),
(T, R) e (B, C). Note que (T, C) não está entre os per-
fis de estratégias encontrados no item anterior.

[11] Suponha, por absurdo, que s∗ = (s∗1 , . . . , s∗n ) não seja um e-


quilı́brio de Nash. Então devem existir ı́ndice i e estratégia
∗ ∗ ∗ ∗
i ∈ Si , com si = si , tais que ui (si , s−i ) < ui (si , s−i ).
pura s[1] [1] [1]

Como, por hipótese, o processo de eliminação reduz o jogo ape-


nas para o perfil s∗ , segue-se que o perfil (s[1] ∗
i , s−i ) foi eliminado
em alguma etapa do processo. Dados que as estratégias puras
em s∗−i não foram eliminadas (se o fossem, o perfil (s∗i , s∗−i )
também seria eliminado), segue-se que a eliminação ocorreu

i i

i i
“tdj”
i i
2017/2/2
page 157
i i

157

porque a estratégia s[1]


i foi fracamente dominada por outra es-
tratégia s[2] i (si , s−i ) ≤ ui (si , s−i ) para todo s−i
[1] [2]
i . Logo, u
que pode ser construı́do com as estratégias que restaram nos
espaços de estratégias puras dos outros jogadores neste estágio
do processo (que inclui s∗−i ) e, mais ainda, pelo menos para
−i , vale a desigualdade estrita: ui (si , s−i ) < ui (si , s−i ).
um s[2] [1] [2] [2] [2]

Das desigualdades

ui (s∗i , s∗−i ) < ui (s[1] ∗ ∗


i , s−i ) ≤ ui (si , s−i )
[2]

e
i , s−i ) < ui (si , s−i )
ui (s[1] [2] [2] [2]


i = si e si = si .
segue-se que s[2] [2] [1]

Agora, por sua vez, o perfil (s[2]i , s−i ) também foi eliminado du-
[2]

rante o processo. Dados que as estratégias puras em s[2] −i não


foram eliminadas nesta etapa (se o fossem, o perfil (s[1] i , s−i )
[2]

também seria eliminado e, portanto, ele não existiria nas eta-


pas seguintes), segue-se que a eliminação correu porque a es-
tratégia s[2]
i foi fracamente dominada por outra estratégia si .
[3]

Logo, ui (si , s−i ) ≤ ui (si , s−i ) para todo s−i que pode ser
[2] [3]

construı́do com as estratégias que restaram nos espaços de es-


tratégias puras dos outros jogadores neste estágio do processo
(que inclui s∗−i e s[2]
−i ) e, mais ainda, pelo menos para um s−i ,
[3]

vale a desigualdade estrita: ui (si , s−i ) < ui (si , s−i ). Das


[2] [3] [3] [3]

desigualdades

ui (s∗i , s∗−i ) < ui (s[1] ∗ [2] ∗ [3] ∗


i , s−i ) ≤ ui (si , s−i ) ≤ ui (si , s−i ),

i , s−i ) < ui (si , s−i ) ≤ ui (si , s−i )


ui (s[1] [2] [2] [2] [3] [2]

e
i , s−i ) < ui (si , s−i )
ui (s[2] [3] [3] [3]


i = si , si = si e si = si .
segue-se que s[3] [3] [1] [3] [2]

Prosseguindo desta maneira, construirı́amos uma sequência in-


finita (s[1] [2] [3] [r]
i , si , si , . . . , si , . . .) de estratégias puras distintas do
jogador gi , o que é impossı́vel, dado que Si é, por hipótese,
finito.

i i

i i
“tdj”
i i
2017/2/2
page 158
i i

158 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

[12] Note que

ui (p∗ ) = ui (p∗i , p∗−i )


m1 mn

= ··· p∗1j1 · · · · p∗njn · ui (s1j1 , . . . , snjn ).
j1 =1 jn =1

Reordenando os somatórios, obtemos que


mi

ui (p∗i , p∗−i ) = p∗iji · vji = p∗i , v
ji =1

onde
m1 mi−1 mi+1 mn
   
vji = ··· ··· cj1 ,...,jn · ui (s1j1 , . . . , snjn ),
j1 =1 ji−1 =1 ji+1 =1 jn =1

com cj1 ,...,jn = p∗1j1 · · · p∗(i−1)ji−1 · p∗(i+1)ji+1 · · · p∗njn . Desta ma-


neira, se x1 , . . . , xr ∈ Δi e λ1 , . . . , λr são escalares não-negativos
r
com k=1 λk = 1, então
r  * r +
 

ui λk · xk , p−i = λk · xk , v
k=1 k=1
r

= λk · xk , v
k=1
r
= λk · ui (xk , p∗−i ).
k=1

Nas igualdades acima rnão usamos que λ1 , . . . , λr são escalares


não-negativos com k=1 λk = 1. De fato, esta exigência é
necessária
r apenas para garantir que se x1 , . . . , xr ∈ Δi , então
λ
k=1 k · x k ∈ Δi .

[13] Suponha que a estratégia pura sik do jogador gi seja estrita-


mente dominada por uma estratégia mista

pi = (pi1 , . . . , pik , . . . , pimi ) ∈ Δmi .

i i

i i
“tdj”
i i
2017/2/2
page 159
i i

159

Vamos mostrar que se pi = (pi1 , . . . , pik , . . . , pimi ) é uma outra


estratégia mista do jogador gi com pik > 0, então pi também
é estritamente dominada. Como sik é estritamente dominada
por pi , segue-se que
ui (pi , s−i ) > ui (sik , s−i ), ∀s−i ∈ S−i .
Assim,
mi

(∗)
ui (pi , s−i ) = pir · ui (sir , s−i )
r=1
mi
= pir · ui (sir , s−i ) + pik · ui (sik , s−i )
r=1
r =k

mi

< pir · ui (sir , s−i ) + pik · ui (pi , s−i ),
r=1
r =k

onde, em (∗), usamos a propriedade 2.4 da página 31. Mas, por


esta mesma propriedade,
mi

ui (pi , s−i ) = pir · ui (sir , s−i ).
r  =1

Conseqüentemente,
ui (pi , s−i )
<
mi
 mi

pir · ui (sir , s−i ) + pik · pir · ui (sir , s−i )
r =1 r  =1
r =k

=
mi

(pir + pik · pir ) · ui (sir , s−i ) + pik · pik · ui (sik , s−i )
r=1
r =k

=
mi

pir · ui (sir , s−i ),
r=1

i i

i i
“tdj”
i i
2017/2/2
page 160
i i

160 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

onde os coeficientes pir são definidos por



pir + pik · pir , se r = k,
pir =
pik · pik , se r = k.
i 
Como pir ≥ 0 para todo r = 1, . . . , mi e m r=1 pir = 1, segue-se
que pi = (pi1 , . . . , pir , . . . , pimi ) é uma distribuição de proba-
bilidades e, sendo assim,
mi

ui (pi , s−i ) < pir · ui (sir , s−i ) = ui (pi , s−i ), ∀s−i ∈ S−i .
r=1

Isto mostra que a estratégia mista pi é estritamente dominada


pela estratégia mista pi .
[14] Para o dilema dos prisioneiros, as funções de melhor resposta
são dadas por:

MRBob (p) = argmaxq∈[0,1] ((4 p + 1) q − (9 p + 1)) = {1},


MRAl (q) = argmaxp∈[0,1] ((4 q + 1) p − (9 q + 1)) = {1}.
A partir das representações gráficas destas funções (Figura C.1),
vemos que o único equilı́brio de Nash em estratégias mistas do
jogo é o perfil (1, 0; 1, 0), que corresponde ao único ponto de
interseção (p∗ , q ∗ ) = (1, 1) das duas representações gráficas.
Para o jogo de comparar moedas, as funções de melhor resposta
são dadas por:

MR2 (p) = argmaxq∈[0,1] (2 (+1 − 2 p) q − 1 + 2 p)



⎨ {1}, se p ∈ [0, 1/2),
= [0, 1], se p = 1/2,

{0}, se p ∈ (1/2, 1],
MR1 (q) = argmaxp∈[0,1] (2 (−1 + 2 q) p + 1 − 2 q)

⎨ {0}, se q ∈ [0, 1/2),
= [0, 1], se q = 1/2,

{1}, se q ∈ (1/2, 1].

A partir das representações gráficas destas funções (Figura C.2),


vemos que o único equilı́brio de Nash em estratégias mistas do

i i

i i
“tdj”
i i
2017/2/2
page 161
i i

161

(Bob) q

(Confessar) 1

(Negar)
0 1 p (Al)

(Negar) (Confessar)

Figura C.1: Calculando os equilı́brios de Nash usando as representa-


ções gráficas das duas funções de melhor resposta.

jogo é o perfil (1/2, 1/2; 1/2, 1/2), que corresponde ao único


ponto de interseção (p∗ , q ∗ ) = (1/2, 1/2) das duas representa-
ções gráficas.

[15] Um equilı́brio de Nash não pode por probabilidade positiva em


uma estratégia pura que é estritamente dominada. De fato:
suponha, por absurdo, que p∗ = (p∗i , p∗−i ) seja um equilı́brio
de Nash com p∗i = (p∗i1 , . . . , p∗ik1 , . . . , p∗ik2 , . . . , p∗imi ) e p∗ik1 > 0,
onde sik1 é uma estratégia pura estritamente dominada por sik2 .
Defina agora p•i = (p∗i1 , . . . , 0, . . . , p∗ik1 + p∗ik2 , . . . , p∗imi ). Note
que p•i ∈ Δ(Si ) e ui (p•i , p∗i ) > ui (p∗i , p∗i ), contradizendo o fato
de p∗ = (p∗i , p∗−i ) ser um equilı́brio de Nash. Um equilı́brio de
Nash pode por probabilidade positiva em uma estratégia pura
fracamente dominada. No jogo abaixo,

g2
s21 s22
s11 (12, 10) (28, 26) ,
g1
s12 (20, 46) (20, 46)

i i

i i
“tdj”
i i
2017/2/2
page 162
i i

162 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

(g2) q

(s21 ) 1

1/2

(s22 )
0 1/2 1 p (g1)

(s12 ) (s11 )

Figura C.2: Calculando os equilı́brios de Nash usando as representa-


ções gráficas das duas funções de melhor resposta.

o perfil de estratégias mistas (0, 1; 1/2, 1/2) é um equilı́brio de


Nash que põe probabilidade p21 = 1/2 > 0 na estratégia s21
e s21 é fracamente dominada pela estratégia s22 .

[16] O perfil de estratégias puras s∗ = (confessar, confessar) não é


Pareto eficiente pois, se s• = (negar, negar) é tal que uAl (s• ) =
−1 > −5 = uAl (s• ) e uBob (s• ) = −1 > −5 = uBob (s• ).

Capı́tulo 3
[01] (a) Considere Δ = [0, 1] e F : Δ → Δ cujo gráfico é dado na
Figura C.3.
(b) Considere Δ = (0, 1) e F : Δ → Δ cujo gráfico é dado na
Figura C.4.
(c) Considere Δ = [0, 1/3] ∪ [2/3, 1] e F : Δ → Δ cujo gráfico é
dado na Figura C.5.

i i

i i
“tdj”
i i
2017/2/2
page 163
i i

163

1/2

0 1/2 1 x

Figura C.3: Gráfico do item (a).

2/3

0 1/3 1 x

Figura C.4: Gráfico do item (b).

i i

i i
“tdj”
i i
2017/2/2
page 164
i i

164 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

2/3

1/3

0 1/3 2/3 1 x

Figura C.5: Gráfico do item (c).

3/4

1/4

0 1/2 1 x

Figura C.6: φ não possui ponto fixo.

i i

i i
“tdj”
i i
2017/2/2
page 165
i i

165

[02] Conforme a Figura C.6 na página 164, um exemplo é obtido


tomando-se X = [0, 1] e

⎨[3/4, 1], se 0 ≤ x < 1/2,
φ(x) = [0, 1/4] ∪ [3/4, 1], se x = 1/2,

[0, 1/4], se 1/2 < x ≤ 1.

[03] O jogo abaixo possui apenas dois equilı́brios de Nash em es-


tratégias mistas.

g2
s21 s22
s11 (1, 1) (0, 0) ,
g1
s12 (0, 0) (0, 0)

Capı́tulo 4
[01] A matriz A tem dois pontos de sela: a13 e a33 .
[02] No jogo de comparar moedas,
' (
+1 −1
A=
−1 +1

Como A tem entradas negativas, vamos substituı́-la por


' ( ' (
A = +1 −1 + 2 1 = +3 +1 .
−1 +1 +1 +3

Assim:

(problema primal)

maximizar y1 + y2
sujeito a 3 y1 + y2 ≤ 1,
y1 + 3 y2 ≤ 1,
y1 ≥ 0,
y2 ≥ 0,

i i

i i
“tdj”
i i
2017/2/2
page 166
i i

166 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

(problema dual)

minimizar x1 + x2
sujeito a 3 x1 + x2 ≥ 1,
x1 + 3 x2 ≥ 1,
x1 ≥ 0,
x2 ≥ 0.

A solução do problema dual é (x∗1 , x∗2 ) = (1/4, 1/4) e a solução


do problema primal é (y1∗ , y2∗ ) = (1/4, 1/4). Se

1
θ = x∗1 + x∗2 = y1∗ + y2∗ = ,
2
segue-se que o único equilı́brio de Nash do jogo de comparar
moedas é dado por (p∗ , q∗ ), onde
   
(x∗ , x∗ ) 1 1 (y ∗ , y ∗ ) 1 1
p∗ = 1 2 = , e q∗ = 1 2 = , .
θ 2 2 θ 2 2

[03] Considere o seguinte jogo matricial geral de ordem 2 × 2:


' (
a b
A= .
d c

Se existe um ponto de sela, basta usarmos os resultados da Sub-


seção 4.3.2 para encontrar um equilı́brio de Nash do jogo. Su-
ponha então que a matriz A não possua pontos de sela. Desta
maneira, o jogo possui apenas equilı́brios de Nash

(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ )

totalmente mistos, isto é, com 0 < p∗ , q ∗ < 1. Se a ≥ b, então


b < c, caso contrário b seria um ponto de sela. Desde que b < c,
devemos ter c > d pois, caso contrário, c seria um ponto de
sela. Prosseguindo desta maneira, vemos que d < a e a > b.
Em outras palavras, se a ≥ b, então a > b, b < c, c > d e d < a.
Por simetria, se a ≤ b, então a < b, b > c, c < d e d > a.
Com isto mostramos que se não existem pontos de sela, então

i i

i i
“tdj”
i i
2017/2/2
page 167
i i

167

ou a > b, b < c, c > d e d < a, ou a < b, b < c, c < d e d > a.


Usando as Equações 4.6, obtemos que

a p∗ + d (1 − p∗ ) = b p∗ + c (1 − p∗ )

Resolvendo para p∗ , encontraremos que

c−d
p∗ =
(a − b) + (c − d)

Como não existem pontos de sela, (a − b) e (c − d) são ambos


positivos ou ambos negativos, e conseqüentemente, 0 < p∗ < 1.
O ganho médio do jogador linha usando esta estratégia é

ac− bd
v ∗ = a p∗ + d (1 − p∗ ) = .
(a − b) + (c − d)

Analogamente, usando as Equações 4.5, obtemos a seguinte ex-


pressão:
c−b
q∗ =
(a − b) + (c − d)
com 0 < q ∗ < 1. A perda média do jogador coluna usando esta
estratégia é

ac − bd
v ∗ = a q ∗ + d(1 − q ∗ ) = .
(a − b) + (c − d)

[04] Como A não possui pontos de sela, o jogo possui apenas equilı́brios
de Nash
(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ )
totalmente mistos, isto é, com 0 < p∗ , q ∗ < 1. Se v ∗ é o valor
do jogo, então usando as desigualdades 4.3 com q = ek ∈ R4
para k = 1, 2, 3, 4, vemos que
⎡ ∗ ⎤
' ( v
 ∗ −1 +5 +1 −2 ⎢ v∗ ⎥
p 1 − p∗ ≥⎢ ⎥
⎣ v∗ ⎦ ,
+1 −3 −2 +5
v∗

i i

i i
“tdj”
i i
2017/2/2
page 168
i i

168 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

v*

5 Coluna 2

3
v*

*{
=

8p
{7

=
p*

v*
+
v* = 5
2 Coluna 3
1 {2p p*
{
*+ =3
1 v*

0 1 p*
{1 Coluna 1

{2 Coluna 4

{3

Figura C.7: Envelope inferior.

isto é, ⎧ ∗

⎪ v ≤ −2 p∗ + 1,
⎨ ∗
v ≤ 8 p∗ − 3,
(C.1)
⎪ v∗
⎪ ≤ 3 p∗ − 2,
⎩ ∗
v ≤ −7 p∗ + 5.
As funções afins v ∗ = −2 p∗ + 1, v ∗ = 8 p∗ − 3, v ∗ = 3 p∗ − 2
e v ∗ = 3 p∗ − 2 representam os ganhos médios do jogador linha
quando ele escolhe a distribuição de probabilidades (p∗ , 1−p∗) e
o jogador coluna escolhe as colunas 1, 2, 3 e 4, respectivamente.
Os gráficos destas funções para 0 ≤ p∗ ≤ 1 estão desenhados na
Figura C.7.
Para um valor fixo de p∗ , o jogador linha está seguro de que seu
ganho médio é pelo menos o mı́nimo destas quatro funções cal-
culadas em p∗ , o envelope inferior destas quatro funções. Como
o jogador linha pretende maximizar os seus ganhos médios,

i i

i i
“tdj”
i i
2017/2/2
page 169
i i

169

então ele precisa encontrar p∗ que atinge o máximo deste en-


velope inferior. De acordo com a Figura C.7, o máximo ocorre
justamente na interseção das retas v ∗ = −2 p∗ +1 e v ∗ = 3 p∗ −2,
as quais representam, respectivamente, as colunas 1 e 3 do jo-
gador coluna. Deste modo, uma solução do jogo 2 × 4 original
pode ser obtida estudando-se o jogo 2 × 2 definido pela matriz
' (
−1 +1
R= .
+1 −2

O valor deste jogo é v ∗ = −1/5 para p∗ = 3/5 e q ∗ = 3/5.


Assim, um equilı́brio de Nash do jogo original é dado por
 
∗ ∗ ∗ ∗ 3 2 3 2
(p , 1 − p ; q , 0, 1 − q , 0) = , ; , 0, , 0 .
5 5 5 5

Naturalmente, a técnica aqui descrita pode ser aplicada para


qualquer jogo de soma zero com matriz A de tamanho 2 × n.

[05] Lembre-se que ul (p, q) = pT Aq e ul (p, q) = −pT Aq. Sejam


ek∗ e el∗ tais que

min ul (p∗ , el ) = ul (p∗ , el∗ )


1≤l≤n

e
max (−uc (ek , q∗ )) = −uc (ek∗ , q∗ ),
1≤k≤m

isto é, p∗T Ael ≥ p∗T Ael∗ para todo l e eTk Aq∗ ≤ eTk∗ Aq∗ para
todo k. Desta maneira,

eTk Aq∗ ≤ eTk∗ Aq∗ = −(−p∗T Ael∗ ) = p∗T Ael∗ ≤ p∗T Ael ,

para todo k = 1, . . . , m e l = 1, . . . , n. Por linearidade, segue-se


que
pT Aq∗ ≤ p∗T Aq,
para todo p ∈ Δm e q ∈ Δn . Em particular, pT Aq∗ ≤ p∗T Aq∗
e p∗T Aq∗ ≤ p∗T Aq, isto é, ul (p, q∗ ) ≤ ul (p∗ , q∗ ) e uc (p∗ , q) ≤
uc (p∗ , q∗ ) para todo p ∈ Δm e q ∈ Δn . Isto mostra que (p∗ , q∗ )
é um equilı́brio de Nash do jogo.

i i

i i
“tdj”
i i
2017/2/2
page 170
i i

170 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

Para a matriz A de tamanho 4 × 5 do enunciado, temos que


121 121 160
ul (p∗ , e1 ) = , ul (p∗ , e2 ) = , ul (p∗ , e3 ) = ,
37 37 37
121 169
ul (p∗ , e4 ) = e ul (p∗ , e5 ) = ,
37 37
e
121 121 120
uc (e1 , q∗ ) = , uc (e2 , q∗ ) = , uc (e3 , q∗ ) = e
37 37 37
∗ 121
uc (e4 , q ) = ,
37
de modo que

min ul (p∗ , el ) = 121/37 = max (−uc (ek , q∗ )) = 121/37.


1≤l≤n 1≤k≤m

Pelo resultado acima, isto mostra que (p∗ , q∗ ) é um equilı́brio


de Nash do jogo.
n n
[06] Seja M = l=1 ail = k=1 akj a constante obtida pela soma
de qualquer linha ou coluna. Defina
 
∗ ∗ 1 1
p =q = ,..., ∈ Δn .
n n

Observe que, para todo k, l ∈ {1, . . . , n}, ul (p∗ , el ) = p∗ Ael =


n ∗ ∗ n ∗ ∗
i=1 pi ail = pi
n ∗
anil = M/n e uc (ek , q ) = −ek Aq =
i=1

− j=1 akj qj = −qj j=1 akj = −M/n. Portanto,

M
min ul (p∗ , el ) = = max (−uc (ek , q∗ )).
1≤l≤n n 1≤k≤m

Pelo resultado do exercı́cio anterior, concluı́mos que (p∗ , q∗ ) é


um equilı́brio de Nash do jogo. Para o caso do quadrado mágico
da gravura Melancolia I de Albrecht Dürer,
 
∗ ∗ 1 1 1 1
p =q = , , ,
4 4 4 4

e o valor do jogo é v ∗ = 34/4 = 17/2.

i i

i i
“tdj”
i i
2017/2/2
page 171
i i

171

[07] Se (p∗ , q∗ ) é um equilı́brio de Nash totalmente misto, então,


pelas relações 4.5,
n

aij qj∗ = v ∗ , ∀i ∈ {1, . . . , n}.
j=1

Estas equações podem ser escritas usando-se matrizes da se-


guinte maneira: Aq∗ = v ∗ ½. Como, por hipótese, A é uma
matriz inversı́vel, segue-se que q∗ = v ∗ A−1 ½. Agora,
n
 1
qj∗ = 1 ⇒ 1 = ½T q∗ = v ∗ ½T A½ ⇒ v∗ = .
j=1
½T A−1 ½
Sendo assim,
A−1 ½
q∗ = .
½T A−1 ½
Do mesmo modo, pelas relações 4.6,
n

p∗i aij = v ∗ , ∀j ∈ {1, . . . , n}.
i=1

Estas equações podem ser escritas usando-se matrizes da se-


guinte maneira: p∗T Aq∗ = v ∗ ½. Como, por hipótese, A é uma
matriz inversı́vel, segue-se que p∗ = v ∗ ½A−1 e, assim,
½A−1
p∗ = .
½T A−1 ½
Capı́tulo 5
[01] O equilı́brio de Nash em estratégias puras obtido por indução
retroativa é
((Parar, Parar), (Parar, Parar)).
Este equilı́brio não é Pareto eficiente pois, em comparação com
o perfil acima,
((Continuar, Continuar), (Continuar, Continuar))
dá um ganho maior para os dois jogadores.

i i

i i
“tdj”
i i
2017/2/2
page 172
i i

172 [CAP. C: RESPOSTAS DOS EXERCÍCIOS

[02] O equilı́brio de Nash em estratégias puras obtido por indução


retroativa é
(Não confiar, Trair).
Este equilı́brio não é Pareto eficiente pois, em comparação com
o perfil acima,
(Confiar, Honrar)
dá um ganho maior para os dois jogadores.

i i

i i
“tdj”
i i
2017/2/2
page 173
i i

Referências
Bibliográficas

[01] K. R. Apt, Uniform Proofs of Order Independence for Various


Strategy Elimination Procedures. Contributions to Theoretical
Economics, vol. 4, no. 1, article 5, 48 páginas, 2004.

[02] R. Aumann, What Is Game Theory Trying to Accomplish?.


Em Frontiers of Economics, K. Arrow, S. Honkapohja e
B. Blackwell (editores), pp. 28-76, 1985.

[03] R. Avenhaus, M. Canty, D. M. Kilgour, B. von Stengel, S. Za-


mir, Inspection Games in Arms Control. European Journal of
Operational Research, vol. 90, no. 3, pp. 383-394, 1996.

[04] G. S. Becker, Crime and Punishment: An Economic Approach.


Journal of Politial Economy, vol 79, pp. 169-217, 1968.

[05] A. T. Benjamin e A. J. Goldman, Analysis of the N-Card


Game Le Her. Journal of Optimization Theory and Applica-
tions, vol. 114, no. 3, pp. 695–704, 2002.

[06] J. Bertrand. Theorie Mathematique de la Richesse Sociale.


Journal des Savants, pp. 499-508, 1883.

[07] E. Borel, The Theory of Play and Integral Equations with Skew
Symmetric Kernels. Econometrica, vol. 21, no. 1, pp. 97-100,
1953. Originalmente publicado em: Comptes Rendus Hebdo-
madaires des Seances de l’Academie des Sciences, 1921.

173

i i

i i
“tdj”
i i
2017/2/2
page 174
i i

174 REFERÊNCIAS BIBLIOGRÁFICAS

[08] E. Borel, On Games that Involve Chance and the Skill of the
Players. Econometrica, vol. 21, no. 1, pp. 101-115, 1953. Origi-
nalmente publicado em: Elements de la Théorie des Probabi-
lités, 1924.

[09] T. Börgers, Pure Strategy Dominance. Econometrica, vol. 61,


no. 1, pp. 423-430, 1993.

[10] S. J. Brams e D. M. Kilgour, Game Theory and National Se-


curity. Basil Blackwell, 1988.

[11] F. Brandt, F. Fischer e Y. Shoham, On Strictly Competitive


Multi-Player Games. Proceedings of the 21st National Confe-
rence on Artificial Intelligence (AAAI), AAAI Press, pp. 605-
612, 2006.

[12] J. N. Brown e R. W. Rosenthal, Testing The Minimax Hy-


pothesis: A Re-Examination of O’Neill’s Game Experiment.
Econometrica, vol 58, no. 5, pp. 1065-1081, 1990.

[13] L. I. de Castro e J. H. Faro, Introdução à Teoria da Escolha.


25o Colóquio Brasileiro de Matemática, IMPA, 2005.

[14] V. Chvátal, Linear Programming. W. H. Freeman and Com-


pany, 1983.

[15] Y. C. Chen, N. Y. Long e X. Luo, Iterated Strict Dominance


in General Games. CIRANO Working Papers, 2007s-03, 2007.

[16] S.-F. Cheng e M. P. Wellman, Iterated Weaker-Than-Weak


Dominance Twentieth International Joint Conference on Ar-
tificial Intelligence, Hyderabad, India, pp. 1233-1238, 2007.

[17] P. A. Chiappori, S. Levitt e T. Groseclose, Testing Mixed-


Strategy Equilibria When Players Are Heterogeneous: The Case
of Penalty Kicks in Soccer. The American Economic Review,
vol. 92, no. 4, pp. 1138-1151, 2002.

[18] V. Conitzer e T. Sandholm, Complexity of (Iterated) Domi-


nance. Proceedings of the 6th ACM Conference on Electronic
Commerce, pp. 88–97, 2005.

i i

i i
“tdj”
i i
2017/2/2
page 175
i i

REFERÊNCIAS BIBLIOGRÁFICAS 175

[19] A. A. Cournot, Recherches sur les Principes Mathématiques de


la Théorie des Richesses, 1838. Traduzido por N. T. Bacon em
Researches into the Mathematical Principles of the Theory of
Wealth, McMillan, New York, 1927.

[20] R. S. Datta, Algebraic Methods in Game Theory. Tese de dou-


torado, Departamento de Matemática, University of California
at Berkeley, 2003.

[21] R. S. Datta, Using Computer Algebra To Find Nash Equilibria.


International Conference on Symbolic and Algebraic Compu-
tation, Proceedings of the 2003 International Symposium on
Symbolic and Algebraic Computation, pp. 74-79, 2003.

[22] R. S. Datta, Finding All Nash Equilibria of a Finite Game


Using Polynomial Algebra. Artigo aceito para publicação, The
Journal of Economic Theory, 2007. Disponı́vel eletronicamente
em: http://arxiv.org/abs/math.AC/0612462.

[23] G. Debreu, A Social Equilibrum Existence Theorem. Proceed-


ings of the National Academy of Sciences of the United States
of America (PNAS), vol. 38, no. 10, pp. 886-893, 1952.

[24] G. Debreu, Existence of Competitive Equilibrium. Em Hand-


book of Mathematical Economics, vol. II, K. J. Arrow e M. D.
Intriligator (editores), North-Holland, pp. 697-743, 1982.

[25] M. Dresher, Games of Strategy: Theory and Applications.


Prentice-Hall, Englewood Cliffs, 1961.

[26] M. Dufwenberg e M. Stegeman, Existence and Uniqueness of


Maximal Reductions Under Iterated Strict Dominance. Econo-
metrica, vol. 70, n. 5, pp. 2007–2023, 2002.

[27] K. Etessami, Algorithmic Game Theory and Aplications. Lec-


ture Notes, School of Informatics, The University of Edinburgh,
Scotland, UK, 2004.

[28] A. Fabrikant, A. Luthra, E. Maneva, C. H. Papadimitriou e


S. Shenker, On a Network Creation Game. Annual ACM Sym-
posium on Principles of Distributed Computing, Proceedings

i i

i i
“tdj”
i i
2017/2/2
page 176
i i

176 REFERÊNCIAS BIBLIOGRÁFICAS

of the Twenty-Second Annual Symposium on Principles of Dis-


tributed Computing, pp. 347–351, 2003.

[29] J. W. Friedman, Game Theory with Aplications to Economics,


Second Edition. Oxford University Press, 1990.

[30] D. Fudenberg e D. K. Levine, The Theory of Learning in


Games. The MIT Press, 1996.

[31] D. Fudenberg e J. Tirole, Game Theory. The MIT Press, 1995.

[32] I. Gilboa, E. Kalai e E. Zemel, On the Order of Elimina-


ting Dominated Strategies. Operations Research Letters, vol. 9,
pp. 85–89, 1990.

[33] I. Gilboa, E. Kalai e E. Zemel, The Complexity of Eliminating


Dominated Strategies, Mathematics of Operations Research,
vol. 18, no. 3, pp. 553–565, 1993.

[34] I. L. Glicksberg, A Further Generalization of the Kakutani


Fixed Point Theorem, with Application to Nash Equilibrium
Points, Proceedings of the American Mathematical Society,
vol. 3, no. 1, pp. 170-174, 1952.

[35] S. Govindan e R. Wilson, Direct Proofs of Generic Finiteness


of Nash Equilibrium Outcomes. Econometrica, vol. 69, no. 3,
pp. 765-769, 2001.

[36] F. Gül, D. Pearce, E. Stacchetti, A Bound on The Proportion


of Pure Strategy Equilibria in Generic Games. Mathematics of
Operations Research, vol. 18, no. 3, pp. 548-552, 1993.

[37] A. Hald, A History of Probability and Statistics and Their Ap-


plications before 1750. John Willey & Sons, New York, 1990.

[38] G. Hardin, The Tragedy of the Commons. Science, vol 162,


pp. 1243-1248, 1968.

[39] J. C. Harsanyi, Games with Randomly Disturbed Payoffs: A


New Rationale for Mixed Strategy. International Journal of
Game Theory, vol. 2, no. 1, pp. 1-23, 1973.

i i

i i
“tdj”
i i
2017/2/2
page 177
i i

REFERÊNCIAS BIBLIOGRÁFICAS 177

[40] J. C. Harsanyi, Oddness of The Number of Equilibrium Points:


A New Proof. International Journal of Game Theory, vol. 2,
no. 1, pp. 235-250, 1973.

[41] S. Hart, Games in Extensive and Strategic Forms. Capı́tulo 2


em Handbook of Game Theory, vol. 1, R. J. Aumann e S. Hart
(editores), Elsevier Science Publishers, 1992.

[42] J. B. Hiriart-Urruty e C. Lemarechal, Convex Analysis and Mi-


nimization Algorithms I: Fundamentals. Springer-Verlag, 1993.

[43] J. Hirshleifer e E. Rasmusen, Are Equilibrium Strategies Unaf-


fected by Incentives?. Journal of Theoretical Politics, vol. 4,
no. 3, pp. 353-367, 1992.

[44] H. Hotelling, The Stability of Competition. The Economic Jour-


nal, vol 39, no. 153, pp. 41-57, 1929.

[45] S. Kakutani, A Generalization of Brouwer’s Fixed Point The-


orem. Duke Mathematical Journal, vol 8, pp. 457-459, 1941.

[46] T. H. Kjeldsen, John von Neumann’s Conception of the Mini-


max Theorem: A Journey Through Different Mathematical
Contexts. Archive for History of Exact Sciences, vol. 56, no. 1,
pp. 39-68, 2001.

[47] D. Knuth, C. Papadimitriou e J. Tsitsiklis, A Note on Strategy


Elimination in Bimatrix Games. Operations Research Letters,
vol. 7, pp. 103–107, 1988.

[48] D. M. Kreps, Game Theory and Economic Modelling. Claren-


don Lectures in Economics, Oxford University Press, 1990.

[49] C. E. Lemke e J. T. Howson Jr., Equilibrium Points of Bima-


trix Games. Journal of the Society for Industrial and Applied
Mathematics, vol. 12, no. 2, pp. 413-423, 1964.

[50] R. J. Leonard, From Parlor Games to Social Science: Von Neu-


mann, Morgenstern, and the Creation of Game Theory 1928-
1944. Journal of Economic Literature, vol. 33, no. 2, pp. 730-
761, 1995.

i i

i i
“tdj”
i i
2017/2/2
page 178
i i

178 REFERÊNCIAS BIBLIOGRÁFICAS

[51] R. J. Lipton e E. Markakis, Nash Equilibria via Polynomial


Equations. Em LATIN 2004: Theoretical Informatics, Lectures
Notes in Computer Science, Springer-Verlag, pp. 413-422, 2004.

[52] D. G. Luenberger, Linear and Nonlinear Programming, Second


Edition. Addision-Wesley Publishing Company, 1989.

[53] W. B. MacLeod, Incentives in Organizations: An Overview of


Some of the Evidence and Theory. Em Trends in Business Or-
ganization, Horst Siebert (editor), The Kiel Institute of World
Economics, 1995.

[54] E. Markakis, Computational Aspects of Game Theory and Mi-


croeconomics. Tese de doutorado, Faculdade de Computação,
Georgia Institute of Technology, 2005.

[55] L. M. Marx e J. M. Swinkels, Order Independence for Iterat-


ed Weak Dominance. Games and Economic Behavior, vol 18,
pp. 219–245, 1997.

[56] J. Maynard Smith e G. R. Price, The Logic of Animal Conflict.


Nature, vol. 246, no. 5427, pp. 15-18, 1973.

[57] K. A. McCabe, A. Mukherji e D. E. Runkle, An Experimental


Study of Information and Mixed-Strategy Play in Three-Person
Matching-Pennies Game. Economic Theory, vol. 15, pp. 421-
462, 2000.

[58] R. D. McKelvey, A Liapunov Function for Nash Equilibria. So-


cial Science Working Paper 953, California Institute of Tech-
nology, 1998.

[59] R. D. McKelvey e A. McLennan, The Maximal Number of Regu-


lar Totally Mixed Nash Equilibria. Journal of Economic Theory,
vol. 72, pp. 411-425, 1997.

[60] A. McLennan, The Maximal Generic Number of Pure Nash


Equilibria. Journal of Economic Theory, vol. 72, no. 2, pp. 408-
410, 1997.

i i

i i
“tdj”
i i
2017/2/2
page 179
i i

REFERÊNCIAS BIBLIOGRÁFICAS 179

[61] I. Milchtaich, Congestion Games with Player-Specific Payoff


Functions. Games and Economic Behavior, vol 13, n. 1,
pp. 111–124, 1996.

[62] P. R. Milgrom e R. J. Weber, A Theory of Auctions and Com-


petitive Bidding. Econometrica, vol. 50, no. 5, pp. 1089-1122,
1982.

[63] J. Milnor, Analytic Proofs of the “Hairy Ball Theorem” and the
Brouwer Fixed Point Theorem. The American Mathematical
Monthly, vol. 85, no. 7, pp. 521-524, 1978.

[64] K. G. Murty, Linear Complementarity, Linear and Nonlinear


Programming. Heldermann-Verlag, 1988.

[65] R. G. Myerson, Nash Equilibrium and the History of Econo-


mic Theory. Journal of Economic Literature, vol. 37, no. 3,
pp. 1067-1082, 1999.

[66] J. F. Nash Jr., Equilibrium Points in n-person Games. Procee-


dings of the National Academy of Sciences of the United States
of America, pp. 48–49, 1950.

[67] J. F. Nash Jr., Non-Cooperative Games. PhD. Thesis. Prince-


ton University Press, 1950.

[68] J. F. Nash Jr., The Bargaining Problem. Econometrica, vol. 18,


no. 2, pp. 155–162, 1950.

[69] J. F. Nash Jr., Non-Cooperative Games. Annals of Mathemat-


ics, vol. 54, pp. 286–295, 1951.

[70] J. F. Nash Jr., Two-person Cooperative Games. Econometrica,


pp. 128–140, 1953.

[71] J. von Neumann. Zur Theorie der Gesellschaftsspiele. Mathe-


matische Annalen, vol. 100, pp. 295-320. Traduzido por S.
Bargmann: On the Theory of Games of Stategy em Contribu-
tions to the Theory of Games, vol. 4, pp. 13-42, A. W. Tucker
e R. D. Luce (editores), Princeton University Press, 1959.

i i

i i
“tdj”
i i
2017/2/2
page 180
i i

180 REFERÊNCIAS BIBLIOGRÁFICAS

[72] J. von Neumann e O. Morgenstern, Theory of Games and Eco-


nomic Behavior. Princeton University Press, 1944.

[73] B. O’Neill, Nonmetric Test of the Minimax Theory of Two-


person Zerosum Games. Proceedings of the National Academy
of Sciences of the United States of America (PNAS), vol. 84,
pp. 2106-2109, 1987.

[74] M. J. Osborne e A. Rubinstein, A Course in Game Theory.


The MIT Press, 1994.

[75] R. Otter e J. Dunne, Games with Equilibrium Points. Proceed-


ings of the National Academy of Sciences of the United States
of America (PNAS), vol. 39, pp. 310-314, 1953.

[76] R. Radner e R. Roshental, Private Information and Pure Strat-


egy Equilibrium. Mathematics of Operations Research, vol. 7,
pp. 401-409, 1982.

[77] A. Rapoport e R. B. Boebel, Mixed Strategies in Strictly Com-


petitive Games: A Further Test of The Minimax Hypothesis.
Games and Economic Behaviour, vol. 4, no. 2, pp. 261-283,
1992.

[78] P. J. Reny, On The Existence of Pure and Mixed Strategy Nash


Equilibria in Discontinuous Games. Econometrica, vol. 67,
no. 5, pp. 1029-1056, 1999.

[79] C. A. Rogers, A Less Strange Version of Milnor’s Proof of


Brouwer’s Fixed-Point Theorem. The American Mathematical
Monthly, vol. 87, no. 7, pp. 525-527, 1980.

[80] R. W. Rosenthal, A Class of Games Possessing Pure-Strategy


Nash Equilibria. International Journal of Game Theory, vol. 2,
n. 1, pp. 65–67, 1973.

[81] A. Rubinstein, Comments On The Interpretation of Game The-


ory. Econometrica, vol. 59, no. 4, pp. 909-924, 1991.

[82] B. W. Russell, Common Sense and Nuclear Warfare. George


Allen & Unwin, 1959.

i i

i i
“tdj”
i i
2017/2/2
page 181
i i

REFERÊNCIAS BIBLIOGRÁFICAS 181

[83] T. L. Saaty, Mathematical Models of Arms Control and Disar-


mament: Application of Mathematical Structures in Politics.
John Wiley & Sons, 1968.

[84] R. Savani e B. von Stengel, Exponentially Many Steps for Find-


ing a Nash Equilibrium in a Bimatrix Game. CDAM Research
Report LSE-CDAM-2004-03, 2004.

[85] T. C. Schelling, The Strategy of Conflict. Oxford University


Press, 1968.

[86] U. Schwalbe e P. Walker, Zermelo and the Early History of


Game Theory. Games and Economic Behavior, vol. 34, no. 1,
pp. 123-137, 2001.

[87] L. S. Shapley, A Note on the Lemke-Howson Algorithm.


Mathematical Programming Study I: Pivoting and Extensions,
pp. 175-189, 1974.

[88] H. von Stackelberg, Marktform und Gleichgewicht. Julius


Springer, 1934.

[89] T. Stuckless, Brouwer’s Fixed Point Theorem: Methods of


Proof and Generalizations. Dissertação de mestrado, Departa-
mento de Matemática, Simon Fraser University, 2003.

[90] I. Todhunter, A History of the Mathematical Theory of Proba-


bility. Chelsea, New York, 1949.

[91] J. P. Torres-Martı́nez, Fixed Points as Nash equilibria. Fixed


Point Theory and Applications, vol. 2006, 4 páginas, 2006.

[92] G. Tsebelis, The Abuse of Probability In Political Analysis: The


Robison Crusoe Fallacy. The American Political Science Re-
view, vol. 83, no. 1, pp. 77-91, 1989.

[93] G. Tsebelis, Are Sanctions Effective? A Game-Theoretic


Analysis. The Journal of Conflict Resolution, vol. 34, no. 1,
pp. 3-28, 1990.

i i

i i
“tdj”
i i
2017/2/2
page 182
i i

182 REFERÊNCIAS BIBLIOGRÁFICAS

[94] A. Vetta, Nash Equilibria in Competitive Societies, with Ap-


plications to Facility Location, Traffic Routing and Auctions.
Proceedings of the 43rd Annual IEEE Symposium on Founda-
tions of Computer Science (FOCS’02), IEEE Computer Society,
pp. 416–425, 2002.
[95] N. N. Vorob’ev, Foundations of Game Theory: Noncooperative
Games. Birkhäuser Verlag, 1994.
[96] P. Walker, A Chronology of Game Theory. http://www.econ.
canterbury.ac.nz/personal pages/paul walker/gt/hist
.htm, 2005.
[97] R. Wilson, Computing Equilibria of N-Person Games. SIAM
Journal on Applied Mathematics, vol. 21, no 1, 1971.
[98] E. Zermelo, Über eine Anwendung der Mengdenlehre auf die
theories des Schachspiels. Atas do Décimo Quinto Congresso
Internacional de Matemáticos, vol. 2, pp. 501–504, 1913.
[99] J. Zhao, The Equivalente Between Four Economic Theorems
and Brouwer’s Fixed Point Theorem. Working paper, Depart-
ment of Economics, Iowa State University, 2002.

i i

i i
“tdj”
i i
2017/2/2
page 183
i i

Índice

Árvore, 109 de estratégia estritamente


dominante, 15, 35
Bernoulli, Nicholas, 5, 126 de estratégia fracamente do-
Bertrand minante, 18
Modelo de duopólio, 129 de Nash, 20, 110
Binmore, Kenneth, 119 em estratégias mistas, 35
Borel, Émile, 6 perfeito em subjogos, 117
Espaço de estratégias
Combinação convexa, 31, 138 mistas, 29
Complementaridade Linear, 102 puras, 11
Conjunto Estratégia
admissı́vel de um PL, 145 de um jogo sequêncial, 109
convexo, 137 mista, 27
Cournot suporte, 80
Augustin, 5 pura, 11
Modelo de duopólio, 126 totalmente mista, 69
Folgas complementares, 102
de Montmort, Pierre Rémond, Folha de uma árvore, 109
126 Forma
Dominância normal, 11
em estratégias mistas, 32 padrão de um PL, 146
em estratégias puras, 14 Função
estrita iterada, 15, 34 côncava, 139
fraca iterada, 18 convexa, 139
Dürer, Albrecht, 107 de melhor reposta, 22
objetivo de um PL, 145
Eficiência de Pareto, 59 quase-côncava, 142
Equilı́brio quase-convexa, 142

183

i i

i i
“tdj”
i i
2017/2/2
page 184
i i

184 ÍNDICE

utilidade, 11 Kalmar, Laszlo, 6


esperada, 30
Le Her, 120
Gambit, 104 Lloyd, William Forster, 133
Ganho, 10
Market-clearing, 127
Hardin, Garret, 134 Matriz de payoffs, 12
Harsanyi, John, 9 Melhor resposta, 22
Método simplex, 149
Indução retroativa, 114 Modelo de Duopólio
Informação perfeita, 108 de Bertrand, 129
de Cournot, 126
Jogo de Stackelberg, 131
a batalha dos sexos, 13 Montmort, Pierre Rémond, 5
bimatricial, 101 Morgenstern, Oskar, 8
Chicken, 52
Nash
comparar moedas, 21
Equilı́brio de
da centopéia, 119
em estratégias mistas, 35
da confiança, 119
em estratégias puras, 20
da inspeção, 42
Nash Jr., John Forbes, 9, 60
de informação perfeita, 108
Nó de uma árvore, 109
de soma zero, 82
2 × 2, 106 Ótimo de Pareto, 59
2 × n, 169
matriz inversı́vel, 107 Pareto, eficiência de, 59
quadrado mágico, 107 Payoff , 10
do covarde, 52 Perfil de estratégias
estratégico, 11 mistas, 29
estritamente competitivo, puras, 11
82 Politopo, 138
hawk-dove, 54 Ponto
Le Her, 120 extremo, 148
na forma extensa, 108 fixo, 60, 65
na forma normal, 11 Problema
não-cooperativo, 11 de complementaridade li-
o dilema do prisioneiro, 11 near, 102
quadrado mágico, 107 dual, 150
sequêncial, 108 dual de um LP, 150

i i

i i
“tdj”
i i
2017/2/2
page 185
i i

ÍNDICE 185

primal de um LP, 150 básica de um PL, 148


Produto homogêneo, 126 de folga de um PL, 146
Proposição da Irrelevância do Payoff, von Neumann, John, 7
47 von Stackelberg, Heinrich, 131

Quadrado mágico, 107 Waldegrave, James, 5, 126


Whitehead, Alfred North, 134
Raiz de uma árvore, 109
Ramo de uma árvore, 109 Zermelo, Ernst, 6
Rosenthal, Robert W., 119
Russell, Bertrand, 52

Selten, Reinhard, 9, 117


Semiespaço, 138
Semiplano, 138
Simplex, 149
Solução
básica de um PL, 148
Solução estratégica, 20
Stackelberg
Modelo de duopólio, 131
Subjogo, 116
Suporte, 80

Teorema
do ponto fixo de Brouwer,
60
do ponto fixo de Kakutani,
65
forte de dualidade, 152
fraco de dualidade, 152
fundamental da programação
linear, 148
Tucker, Albert W., 11

Utilidade, 11
esperada, 30

Variável

i i

i i

Você também pode gostar