Introducao Teoria Economica Dos Jogos Bortolossi PDF

“tdj”
i i
2017/2/2
page 1
i i
UMA INTRODUÇÃO À TEORIA

ECONÔMICA DOS JOGOS
Humberto José Bortolossi

Universidade Federal Fluminense
Gilmar Garbugio
Universidade Federal Fluminense
Brı́gida Sartini
Universidade Federal Rural do Rio de Janeiro
VERSÃO 1.1.2
2 de fevereiro de 2017
Por favor, envie suas sugestões, correções e crı́ticas para

hjbortol@vm.uff.br, gilmarg@id.uff.br e brigida.sartini@gmail.com.
i i
i i
“tdj”
i i
2017/2/2
page 2
i i
À minha esposa Joselı́ e à minha filha Hillary Winry.

H. J. B.
À minha mãe Rita e aos meus irmãos Humberto e Reginaldo.

B. A. S.
Aos meus pais Orlando e Iraci e aos meus irmãos Roseli, Rosinei,
Rosana, Carla, Andréia e Reginaldo.
G. G.
i i
i i
“tdj”
i i
2017/2/2
page 3
i i
i i
i i
“tdj”
i i
2017/2/2
page 1
i i
Sumário
Prefácio 3
1 Alguns marcos históricos 5
2 Jogos na forma estratégica 10

2.1 O que é um jogo? . . . . . . . . . . . . . . . . . . . . . 10
2.2 Soluções de um jogo em estratégias puras . . . . . . . 13
2.2.1 Dominância em estratégias puras . . . . . . . . 14
2.2.2 Equilı́brio de Nash em estratégias puras . . . . 20
2.2.3 Relações entre dominância e equilı́brio de Nash 24
2.3 Estratégias mistas . . . . . . . . . . . . . . . . . . . . 27
2.4 Soluções de um jogo em estratégias mistas . . . . . . . 31
2.4.1 Dominância em estratégias mistas . . . . . . . 32
2.4.2 Equilı́brio de Nash em estratégias mistas . . . . 35
2.4.3 Relações entre dominância e equilı́brio de Nash 45
2.4.4 Como interpretar estratégias mistas? . . . . . . 45
2.5 Jogos infinitos . . . . . . . . . . . . . . . . . . . . . . . 48
2.6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 50
3 O teorema de equilı́brio de Nash 60

3.1 Usando o teorema de Brouwer . . . . . . . . . . . . . . 60
3.2 Usando o teorema de Kakutani . . . . . . . . . . . . . 65
3.3 Algumas propriedades dos equilı́brios de Nash . . . . . 69
3.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 70
i i
i i
“tdj”
i i
2017/2/2
page 2
i i
2 Sumário
4 Calculando equilı́brios de Nash 71

4.1 Equilı́brio de Nash via um problema de otimização . . 71
4.2 Equilı́brio de Nash via equações polinomiais . . . . . . 74
4.3 Jogos de soma zero . . . . . . . . . . . . . . . . . . . . 82
4.3.1 Jogos de soma constante com dois jogadores . . 82
4.3.2 Equilı́brio de Nash em estratégias puras . . . . 86
4.3.3 Equilı́brio de Nash em estratégias mistas . . . . 91
4.3.4 O teorema minimax de von Neumann . . . . . 93
4.4 Equilı́brio de Nash via um problema de complementa-
ridade . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.1 Jogos bimatriciais . . . . . . . . . . . . . . . . 101
4.4.2 O algoritmo de Lemke-Howson . . . . . . . . . 104
4.5 Gambit . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 106
5 Jogos na forma extensa 108

5.1 Definição . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.2 Equilı́brio de Nash . . . . . . . . . . . . . . . . . . . . 110
5.3 Indução retroativa e equilı́brio perfeito em subjogos . . 114
5.4 O teorema de Kuhn-Zermelo . . . . . . . . . . . . . . 118
5.5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . 119
6 Exemplos 120
6.1 O jogo Le Her simplificado . . . . . . . . . . . . . . . . 120
6.2 O modelo de duopólio de Cournot . . . . . . . . . . . 126
6.3 O modelo de duopólio de Bertrand . . . . . . . . . . . 129
6.4 O modelo de duopólio de Stackelberg . . . . . . . . . . 131
6.5 A tragédia dos comuns . . . . . . . . . . . . . . . . . . 133
A Convexidade 137
B Programação Linear 145
C Respostas dos exercı́cios 155
Bibliografia 173
Índice 183
i i
i i
“tdj”
i i
2017/2/2
page 3
i i
Prefácio
A teoria dos jogos é uma teoria matemática criada para se modelar
fenômenos que podem ser observados quando dois ou mais “agentes de
decisão” interagem entre si. Ela fornece a linguagem para a descrição
de processos de decisão conscientes e objetivos envolvendo mais de
um indivı́duo.
Suas aplicações incluem eleições, leilões, balanço de poder, evolu-
ção genética, etc. Ela também é uma teoria matemática pura, que
pode e tem sido estudada como tal, sem a necessidade de relacioná-la
com problemas comportamentais ou jogos per se.
Algumas pessoas acreditam que a teoria dos jogos formará, algum
dia, o alicerce de um conhecimento técnico estrito de como decisões
são feitas e de como a economia funciona. A teoria ainda não atingiu
este patamar e, hoje, é mais estudada em seus aspectos matemáticos
puros e, em aplicações, ela é usada como uma ferramenta ou alegoria
que auxiliam no entendimento de sistemas mais complicados.
Neste texto trataremos da teoria matemática dos jogos não-coope-
rativos estáticos de informação completa e dos jogos dinâmicos de
informação perfeita.
A Teoria Econômica dos Jogos não deve ser confundida com a
Teoria Combinatória dos Jogos, iniciada por Sprague e Grundy na
década de 30. Enquanto que a primeira tem motivações predomi-
nante econômicas e procura estabelecer métodos para se maximizar
o ganho (payoff ), a segunda se concentra nos aspectos combinatórios
de jogos de mesa (por exemplo, a estratégia do jogo de nim) e não
permite “elementos imprevisı́veis” como o lançamento de um dado
ou o embaralhamento de cartas.
Acreditamos que o assunto seja estimulante para o estudante de
matemática: ele terá a oportunidade de ver como conceitos de análise,
i i
i i
“tdj”
i i
2017/2/2
page 4
i i
4 Prefácio
topologia, otimização e probabilidade se integram em uma teoria apli-

cada.
Agradecimentos 1
Gostarı́amos de agradecer a Hilmar Ilton Santana Ferreira, Polya-
ne Alves Santos e Larissa Santana Barreto, que participaram ativa-
mente dos seminários sobre teoria dos jogos realizados no perı́odo
2003-2004, momento no qual uma versão preliminar deste texto foi
escrita. Também gostarı́amos de agradecer a Rita de Cássia Silva
Costa, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, que
leram o texto e fizeram várias sugestões. Finalmente, gostarı́amos de
agradecer a Seção de Referência (SRE) da Divisão de Bibliotecas e
Documentação da PUC-Rio pela agilidade e eficiência na aquisição
de alguns artigos difı́ceis de se encontrar.
Agradecimentos 2
Gostarı́amos de agradecer às várias pessoas que, após a divulgação
da versão Creative Commons deste livro, colaboraram com sugestões:
Doherty Andrade, Carlos Frederico Palmeira.
Humberto José Bortolossi

Brı́gida Alexandre Sartini
Gilmar Garbugio
1 de fevereiro de 2017
i i
i i
“tdj”
i i
2017/2/2
page 5
i i
Capı́tulo 1
Alguns marcos
históricos
Neste capı́tulo apresentaremos alguns marcos históricos da teoria

dos jogos relacionados principalmente com os tópicos que iremos ex-
plorar no texto. Para uma cronologia mais completa, recomendamos
as referências [46, 50, 65, 86, 95, 96].
O conceito de solução de um jogo por estratégia mista1 surgiu pela
primeira vez no estudo do jogo Le Her, realizado por James Walde-
grave e descrito por ele em uma carta a Pierre Rémond de Montmort,
em 13 de novembro de 1713. Em seu estudo, ele procurou encontrar
uma estratégia que maximizasse a probabilidade de vitória do joga-
dor, independentemente da escolha de estratégia de seu oponente.
Este jogo foi discutido por Montmort e por Nicholas Bernoulli em
1713 e os resultados foram publicados nesse ano por Montmort, que
incluiu a solução de Waldegrave em um apêndice.
Em 1838, Augustin Cournot publicou sua obra Recherches sur
les Principes Mathematiques de la Theorie des Richesses, na qual
analisou um caso especial de duopólio. As empresas decidiam as
quantidades a produzir e Cournot definiu o conceito de equilı́brio de
1 Uma estratégia pura é uma das escolhas que o jogador pode fazer. Uma
estratégia mista é uma distribuição de probabilidades sobre o conjunto de es-

tratégias puras. Definições formais serão apresentadas no próximo capı́tulo.
i i
i i
“tdj”
i i
2017/2/2
page 6
i i
6 [CAP. 1: ALGUNS MARCOS HISTÓRICOS
Figura 1.1: Antoine Augustin Cournot (1801–1877).
mercado como sendo a situação em que ambas as empresas reagem

de forma ótima à decisão da empresa concorrente. Este conceito
de solução é uma versão do equilı́brio de Nash aplicado ao caso do
duopólio.
No inı́cio do século XX, apareceram vários artigos sobre teoria dos
jogos. Ernst Zermelo, em 1913, publicou um teorema sobre o jogo
de xadrez no artigo Uber eine Anwendung der Mengenlehre auf die
Theorie des Schachspiels, afirmando que, em cada etapa do jogo, pelo
menos um dos jogadores possui uma estratégia que o levará a vitória
ou ao empate. Contudo, Zermelo não demonstrou o teorema em seu
artigo. A primeira demonstração foi dada por Laszlo Kalmar. Apa-
rentemente, foi Zermelo quem primeiro destacou o uso da semântica
de otimalidade em teoria dos jogos: “Whether one could calculate
with mathematical objectivity, or even give a participant some idea
of, the value of a possible position in the game, as well as of the best
move in this position: information without which the player would
have to eliminate both subjective and psychological guesses and the
opinions of ‘the perfect player’, etc.?” ([95]).
No perı́odo de 1921 a 1927, Émile Borel publicou uma série de
notas sobre jogos simétricos de soma zero com dois jogadores com
um número finito n de estratégias puras para cada jogador. Borel
foi o primeiro a tentar formular matematicamente este jogo. Ele in-
troduziu o conceito de “método de jogada” (o que hoje corresponde
à estratégia pura) e procurou por uma solução em estratégias mis-
tas (o que hoje é conhecido como solução minimax). Em 1921, ele
provou a existência de tal solução para n = 3 ([07]) e, em 1924,
i i
i i
“tdj”
i i
2017/2/2
page 7
i i
Figura 1.2: Ernst Friedrich Ferdinand Zermelo (1871–1953).
para n = 5 ([08]). Borel acreditava que o resultado de existência

não seria válido para um n qualquer, mas como não encontrou um
contra-exemplo, deixou o problema em aberto.
Figura 1.3: Félix Edouard Justin Émile Borel (1871-1956).
No artigo Zur Theorie der Gesellschaftsspiele de 1928, usando

topologia e cálculo funcional ([50]), John von Neumann demonstrou
a existência de solução em estratégias mistas de um jogo finito de
soma zero com dois jogadores e um número arbitrário de estratégias
puras. Este artigo também introduziu a forma extensa de um jogo.
Até a década de 40, os artigos publicados sobre teoria dos jogos
não tinham despertado muito o interesse dos cientistas sociais e de
outras áreas que pesquisavam sobre conflitos de interesses. Talvez
isto se deva ao fato de que os artigos eram escritos por matemáticos
e publicados em revistas matemáticas. Este panorama foi alterado
com a publicação em 1944 do livro Theory of Games and Economic
i i
i i
“tdj”
i i
2017/2/2
page 8
i i
8 [CAP. 1: ALGUNS MARCOS HISTÓRICOS
Behavior, escrito por John von Neumann e pelo economista Oskar

Morgenstern, um marco na teoria dos jogos.
Oskar Morgenstern John von Neumann

(1902-1977) (1903-1957)
Figura 1.4: Oskar Morgenstern e John von Neumann.
Eles detalharam a formulação de problemas econômicos e mostraram

várias possibilidades de aplicação da teoria dos jogos em economia,
procurando apresentar as motivações, os raciocı́nios e as conclusões
da teoria de forma acessı́vel, atraindo assim a atenção de pesquisa-
i i
i i
“tdj”
i i
2017/2/2
page 9
i i
dores de diversas áreas. Na reedição de 1947, tomada como padrão,

os autores estabeleceram os axiomas da teoria da utilidade. O livro
foi republicado em 1953 e sua mais recente edição é de 1980.
Na Universidade de Princeton, John Forbes Nash Jr. escreveu sua
tese de doutorado em 1949, sob o tı́tulo Non-Cooperative Games. Ele
definiu o conceito de ponto de equilı́brio, atualmente conhecido como
equilı́brio de Nash de um jogo e provou sua existência para jogos não-
cooperativos. Os resultados mais importantes de sua tese estão no
artigo Equilibrium Points in N-Person Games de 1950 ([66]) e, mais
detalhadamente, no artigo Non-Cooperative Games de 1951 ([69]).
Ainda em 1950, Nash escreveu sobre o problema da barganha em
The Bargaining Problem ([68]) e, no ano de 1953, sobre jogos coo-
perativos em Two Person Cooperative Games ([70]). Nestes, Nash
definiu o conceito de solução da barganha de Nash em um jogo coo-
perativo com dois jogadores, estabeleceu um sistema de axiomas que
esta solução deveria satisfazer e provou a existência e unicidade desta
solução.
Em 1994, John Harsanyi, John Nash e Reinhard Selten receberam
o Prêmio Nobel de Economia em reconhecimento ao trabalho pioneiro
sobre análise de equilı́brio na teoria de jogos não-cooperativos.
(a) (b) (c)
Figura 1.5: Ganhadores do prêmio Nobel de Economia em 1994:

(a) John Harsanyi (1920-2000), (b) John Forbes Nash Jr.
(1928-2015) e (c) Reinhard Selten (1930-2016).
i i
i i
“tdj”
i i
2017/2/2
page 10
i i
Capı́tulo 2
Jogos na forma
estratégica
2.1 O que é um jogo?

A teoria dos jogos pode ser definida como a teoria dos modelos
matemáticos que estuda a escolha de decisões ótimas sob condições
de conflito. O elemento básico em um jogo é o conjunto de jogadores
que dele participam. Cada jogador tem um conjunto de estratégias.
Quando cada jogador escolhe sua estratégia, temos então uma si-
tuação ou perfil no espaço de todas as situações (perfis) possı́veis.
Cada jogador tem interesse ou preferências para cada situação no
jogo. Em termos matemáticos, cada jogador tem uma função uti-
lidade que atribui um número real (o ganho ou payoff do jogador)
a cada situação do jogo. Mais especificamente, um jogo tem os se-
guintes elementos básicos: existe um conjunto finito de jogadores,
representado por
G = {g1 , g2 , . . . , gn },
e cada jogador gi ∈ G possui um conjunto finito
Si = {si1 , si2 , . . . , simi }
10
i i
i i
“tdj”
i i
2017/2/2
page 11
i i
[SEC. 2.1: O QUE É UM JOGO? 11
de opções, denominadas estratégias puras do jogador gi (mi ≥ 2).

Um vetor
s = (s1j1 , s2j2 , . . . , snjn ),
onde siji é uma estratégia pura para o jogador gi ∈ G, é denomi-
nado um perfil de estratégias puras. O conjunto de todos os perfis de
estratégias puras formam, portanto, o produto cartesiano
n

S= Si = S1 × S2 × · · · × Sn ,
i=1
denominado espaço de estratégias puras do jogo. Para cada joga-

dor gi ∈ G, existe uma função utilidade
ui : S → R
s → ui (s)
que associa o ganho (payoff) ui (s) do jogador gi a cada perfil de
estratégias puras s ∈ S. Esta função utilidade é uma forma de re-
presentar a preferência do jogador gi com relação aos vários perfis de
estratégias do jogo ([13]).
Jogos descritos nesta forma são denominados jogos estratégicos ou
jogos na forma normal . Neles, cada jogador deve fazer a sua escolha
de estratégia sem o conhecimento das escolhas dos demais jogadores.
Admite-se, contudo, que cada jogador conhece toda a estrutura do
jogo. Por este motivo, jogos deste tipo também são denominados
jogos não-cooperativos de informação completa.
Assume-se também que os jogadores sejam racionais, isto é, eles
sempre escolherão ações que maximizem a sua função utilidade. Além
de ser racional, cada jogador (1) sabe que seus adversários também
são racionais, (2) sabe que eles sabem que o jogador sabe que eles são
racionais, ad infinitum.
Exemplo 2.1 (O dilema do prisioneiro) Possivelmente o exem-

plo mais conhecido na teoria dos jogos é o dilema do prisioneiro. Ele
foi formulado por Albert W. Tucker em 1950, em um seminário para
psicólogos na Universidade de Stanford, para ilustrar a dificuldade de
se analisar certos tipos de jogos.
A situação é a seguinte: dois ladrões, Al e Bob, são capturados
e acusados de um mesmo crime. Presos em selas separadas e sem
i i
i i
“tdj”
i i
2017/2/2
page 12
i i
12 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA
poderem se comunicar entre si, o delegado de plantão faz a seguinte

proposta: cada um pode escolher entre confessar ou negar o crime.
Se nenhum deles confessar, ambos serão submetidos a uma pena de
1 ano. Se os dois confessarem, então ambos terão pena de 5 anos. Mas
se um confessar e o outro negar, então o que confessou será libertado
e o outro será condenado a 10 anos de prisão. Neste contexto, temos
G = {Al, Bob},
SAl = {confessar, negar}, SBob = {confessar, negar},
S = SAl × SBob =
{(confessar, confessar), (confessar, negar),
(negar, confessar), (negar, negar)}.
As duas funções utilidade
uAl : S → R e uBob : S → R
são dadas por
uAl (confessar, confessar) = −5, uAl (confessar, negar) = 0,
uAl (negar, confessar) = −10, uAl (negar, negar) = −1,
(que representam os ganhos de Al) e
uBob (confessar, confessar) = −5, uBob (confessar, negar) = −10,
uBob (negar, confessar) = 0, uBob (negar, negar) = −1
(que representam os ganhos de Bob). É uma prática representar os

payoffs dos jogadores através de uma matriz, denominada matriz de
payoffs.
Bob
confessar negar
confessar (−5, −5) (0, −10)
Al
negar (−10, 0) (−1, −1)
Nesta matriz, os números de cada célula representam, respectiva-

mente, os payoffs de Al e Bob para as escolhas de Al e Bob corres-
pondentes a célula.
i i
i i
“tdj”
i i
2017/2/2
page 13
i i
[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 13
Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulher

desejam sair para passear. O homem prefere assistir a um jogo de
futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem
juntos para o futebol, então o homem tem satisfação maior do que a
mulher. Por outro lado, se eles forem juntos ao cinema, então a mu-
lher tem satisfação maior do que o homem. Finalmente, se eles saı́rem
sozinhos, então ambos ficam igualmente insatisfeitos. Esta situação
também pode ser modelada como um jogo estratégico. Temos:
G = {homem, mulher},
Shomem = {futebol, cinema}, Smulher = {futebol, cinema},
S = Shomem × Smulher =
{(futebol, futebol), (futebol, cinema),
(cinema, futebol), (cinema, cinema)}.
As duas funções utilidade uhomem : S → R e umulher : S → R são

descritas pela seguinte matriz de payoffs:
Mulher
futebol cinema
futebol (10, 5) (0, 0) .
Homem
cinema (0, 0) (5, 10)
2.2 Soluções de um jogo em estratégias

puras
Uma solução de um jogo é uma prescrição ou previsão sobre o re-
sultado do jogo. Existem vários conceitos diferentes de solução. Nesta
seção, investigaremos os dois conceitos mais comuns: dominância e
equilı́brio de Nash.
Considere o dilema do prisioneiro. Como encontrar uma solução
para o dilema de Al e Bob, isto é, que estratégias são plausı́veis
i i
i i
“tdj”
i i
2017/2/2
page 14
i i
se os dois prisioneiros querem minimizar1 o tempo de cadeia? Se

analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da
seguinte maneira:
“Duas coisas podem acontecer: Bob pode confessar ou

Bob pode negar. Se Bob confessar, então é melhor para
mim confessar também. Se Bob não confessar, então eu
fico livre se eu confessar. Em qualquer um dos casos, é
melhor para mim confessar. Então, eu confessarei.”
Se analisarmos agora o jogo do ponto de vista de Bob, podemos

aplicar a mesma linha de raciocı́nio e concluir que Bob também irá
confessar. Assim, ambos confessarão e ficarão presos por 5 anos.
Em termos da teoria dos jogos, dizemos que (1) os dois joga-
dores possuem uma estratégia dominante, isto é, todas menos uma
estratégia é estritamente dominada, (2) que o jogo é resolúvel por do-
minância estrita iterada e (3) que o jogo termina em uma solução que
é um equilı́brio de estratégia dominante, conceitos que definiremos a
seguir.
2.2.1 Dominância em estratégias puras

Freqüentemente, iremos discutir perfis de estratégia na qual ape-
nas a estratégia de um único jogador gi ∈ G irá variar, enquanto que
as estratégias de seus oponentes permanecerão fixas. Denote por
s−i = (s1j1 , . . . , s(i−1)ji−1 , s(i+1)ji+1 , . . . , snjn ) ∈

S−i = S1 × · · · × Si−1 × Si+1 × · · · × Sn
uma escolha de estratégia para todos os jogadores, menos o jogador gi .

Desta maneira, um perfil de estratégias pode ser convenientemente
denotado por
s = (siji , s−i ) = (s1j1 , . . . , s(i−1)ji−1 , siji , s(i+1)ji+1 , . . . , snjn ).
1 No Exemplo 2.1, os payoffs foram definidos como números ≤ 0. Desta ma-
neira, minimizar o tempo de cadeia é equivalente a maximizar o payoff.
i i
i i
“tdj”
i i
2017/2/2
page 15
i i
Definição 2.1 (Estratégia Pura Estritamente Domi-

nada) Dizemos que uma estratégia pura sik ∈ Si do joga-
dor gi ∈ G é estritamente dominada pela estratégia sik ∈ Si se,
independentemente das escolhas dos demais jogadores, o joga-
dor gi ganhar mais escolhendo sik do que sik , isto é, se
ui (sik , s−i ) > ui (sik , s−i ),
para todo s−i ∈ S−i .
Definição 2.2 (em estratégias puras)

(a) (Dominância Estrita Iterada) Dominância estrita ite-
rada é o processo no qual, seqüencialmente, se eliminam as
estratégias que são estritamente dominadas.
(b) (Equilı́brio de Estratégia Estritamente Dominan-
te) Quando o processo de dominância estrita iterada reduz
o jogo para um único perfil de estratégias puras s∗ , dizemos
que s∗ é um equilı́brio de estratégia estritamente dominante.
Exemplo 2.3 Considere o jogo determinado pela matriz de payoffs

abaixo.
g2
s21 s22 s23 s24
s11 (5, 2) (2, 6) (1, 4) (0, 4)
s12 (0, 0) (3, 2) (2, 1) (1, 1)

g1
s13 (7, 0) (2, 2) (1, 1) (5, 1)
s14 (9, 5) (1, 3) (0, 2) (4, 8)
i i
i i
“tdj”
i i
2017/2/2
page 16
i i
Neste jogo, para o jogador g2 , a estratégia s21 é estritamente domi-

nada pela estratégia s24 e, assim, a primeira coluna da matriz pode
ser eliminada.
g2
s22 s23 s24
s11 (2, 6) (1, 4) (0, 4)
s12 (3, 2) (2, 1) (1, 1)

g1
s13 (2, 2) (1, 1) (5, 1)
s14 (1, 3) (0, 2) (4, 8)
Agora, nesta matriz reduzida, para o jogador g1 , as estratégias s11

e s14 são estritamente dominadas pelas estratégias s12 e s13 , respec-
tivamente. Portanto, as linhas 1 e 4 podem ser eliminadas. Além
disso, a estratégia s23 do jogador g2 é estritamente dominada pela es-
tratégia s22 . Assim, a coluna 2 também pode ser eliminada. Obtemos
então uma matriz reduzida 2 × 2.
g2
s22 s24
s12 (3, 2) (1, 1)
g1
s13 (2, 2) (5, 1)
Finalmente, a estratégia s24 do jogador g2 é estritamente dominada

pela estratégia s22 e, na matriz 2 × 1 resultante, a estratégia s13 do
jogador g1 é estritamente dominada pela estratégia s12 . Vemos então
que (s12 , s22 ) é o equilı́brio de estratégias estritamente dominantes do
jogo: o jogador g1 escolhe a estratégia s12 (ganhando 3) e o jogador g2
escolhe a estratégia s22 (ganhando 2).
Note que, em cada passo do processo de eliminação das estratégias

estritamente dominadas, o jogo é substituı́do por um outro jogo
i i
i i
“tdj”
i i
2017/2/2
page 17
i i
mais simples, no sentido de que o conjunto de estratégias puras

de um jogador (aquele que tem uma estratégia estritamente domi-
nada) é substituı́do por um subconjunto com menos elementos (ob-
tido removendo-se justamente as estratégias que são estritamente do-
minadas). No exemplo acima, os conjuntos de estratégias puras ini-
ciais dos dois jogadores são dados, respectivamente, por
S1 = {s11 , s12 , s13 , s14 } e S2 = {s21 , s22 , s23 , s24 }.
Como a estratégia pura s21 é estritamente dominada por s24 , o con-

junto S2 é substituı́do por {s22 , s23 , s24 } = S2 − {s21 }. O conjunto S1
permanece o mesmo. Sendo assim, podemos substituir o jogo original
por um mais simples, onde os conjuntos de estratégias puras dos dois
jogadores são dados por
(1) (1)
S1 = {s11 , s12 , s13 , s14 } e S2 = {s22 , s23 , s24 }.
As funções utilidade do novo jogo são as restrições das funções utili-

dade do jogo original aos novos conjuntos de estratégias puras:
u1 |S (1) e u2 |S (1) .
1 2
Para o novo jogo, vemos que as estratégias s11 e s14 são estritamente
dominadas pelas estratégias s12 e s13 , respectivamente. Logo, pode-
mos simplificar o jogo mais uma vez, considerando os conjuntos de
estratégias puras
(2) (2)
S1 = {s12 , s13 } e S2 = {s22 , s23 , s24 }.
Seguindo com as outras eliminações, terminamos com um jogo muito

simples, onde cada conjunto de estratégias puras é unitário:
(5) (5)
S1 = {s12 } e S2 = {s22 }.
Este processo de eliminação gerou, portanto, uma cadeia de espaços

de estratégias puras:
(1) (1) (2) (2)

S = S1 × S2 S (1) = S1 × S2 S (2) = S1 × S2 ···
(5) (5)
S (5) = S1 × S2 = {(s12 , s22 )}.
i i
i i
“tdj”
i i
2017/2/2
page 18
i i
Neste exemplo, a técnica de dominância estrita iterada forneceu um

único perfil de estratégias como solução do jogo, no caso, o perfil
(5) (5)
(s12 , s22 ) ∈ S1 × S2 .
Contudo, pode acontecer da técnica fornecer vários perfis ou, até
mesmo, fornecer todo o espaço de estratégias, como é o caso da bata-
lha dos sexos, onde não existem estratégias estritamente dominadas.
Um outro conceito importante é o de estratégia pura fracamente

dominada.
Definição 2.3 (Estratégia Pura Fracamente Domi-

nada) Dizemos que uma estratégia pura sik ∈ Si do joga-
dor gi ∈ G é fracamente dominada pela estratégia sik ∈ Si
se
ui (sik , s−i ) ≥ ui (sik , s−i ),
para todo s−i ∈ S−i e, pelo menos para algum s•−i ∈ S−i ,
ui (sik , s•−i ) > ui (sik , s•−i ).
Em outras palavras, sik ∈ Si é fracamente dominada por

sik ∈ Si se, independentemente das escolhas dos demais joga-
dores, o jogador gi nada perde se trocar a estratégia sik ∈ Si
pela estratégia sik ∈ Si e, pelo menos para uma escolha dos
demais jogadores, esta troca dá ao jogador gi um ganho maior.
Definição 2.4
(a) (Dominância Fraca Iterada) Dominância fraca iterada
é o processo no qual, seqüencialmente, se eliminam as es-
tratégias que são fracamente dominadas.
(b) (Equilı́brio de Estratégia Fracamente Dominante)
Quando o processo de dominância fraca iterada reduz o jogo
para um único perfil de estratégias puras s∗ , dizemos que
s∗ é um equilı́brio de estratégia fracamente dominante.
i i
i i
“tdj”
i i
2017/2/2
page 19
i i
Exemplo 2.4 Considere o jogo cuja matriz de payoffs é dada por:
g2
s21 s22
s11 (1, 1) (1, 0) .
g1
s12 (1, 0) (0, 1)
A estratégia s12 do jogador g1 é fracamente dominada pela estra-

tégia s11 . Eliminando-a, obtemos a matriz reduzida:
g2
s21 s22
.
g1 s11 (1, 1) (1, 0)
Vemos agora que a estratégia s22 do jogador 2 é estritamente do-

minada pela estratégia s21 . Sendo assim, (s11 , s21 ) é o equilı́brio de
estratégias fracamente dominadas do jogo.
Uma pergunta natural é se o processo de eliminação das estratégias

dominadas depende ou não da ordem em que são realizadas. Para
o caso de estratégias estritamente dominadas, pode-se mostrar que
esta ordem é irrelevante, isto é, independentemente da ordem em
que as estratégias (estritamente dominadas) são eliminadas, obtém-se
sempre a mesma matriz reduzida no final do processo. Por outro lado,
o processo de eliminação das estratégias fracamente dominadas pode
conduzir a resultados diferentes, dependendo da ordem de eliminação.
Considere, por exemplo, o jogo (conforme [32]):
g2
s21 s22 s23
s11 (0, 2) (0, 0) (1, 0) .
g1
s12 (0, 3) (1, 0) (0, 0)
i i
i i
“tdj”
i i
2017/2/2
page 20
i i
Eliminando-se, em sequência, as estratégias s23 (que é estritamente

dominada por s21 ), s11 (que é fracamente dominada por s12 ) e s22
(que é estritamente dominada por s21 ), obtemos (s12 , s21 ) como res-
posta. Agora, eliminando-se, em sequência, as estratégias s22 (que
é estritamente dominada por s21 ), s12 (que é fracamente dominada
por s11 ) e s23 (que é estritamente dominada por s21 ), obtemos outra
resposta: (s11 , s21 ). Para detalhes sobre este assunto, recomendamos
as referências [01, 15, 26, 32, 47, 55].
Com relação à complexidade computacional, os resultados mos-
tram que os problemas relacionados com estratégias estritamente do-
minadas tendem a ser mais fáceis (no sentido que eles podem ser
resolvidos em tempo polinomial), enquanto que questões envolvendo
estratégias fracamente dominadas são mais difı́ceis (no sentido que
eles são NP-completos). Por exemplo, saber se uma dada submatriz
de uma matriz de payoffs pode ser obtida através do processo de
eliminação de estratégias dominadas é um problema polinomial para
o caso de estratégias estritamente dominadas e é um problema NP-
Completo para o caso de estratégias fracamente dominadas. Detalhes
sobre o assunto podem ser encontrados nas referências [18, 33].
2.2.2 Equilı́brio de Nash em estratégias puras

Uma solução estratégica ou equilı́brio de Nash de um jogo é um
perfil de estratégias onde cada jogador não tem incentivo de mudar
sua estratégia se os demais jogadores não o fizerem.
Definição 2.5 (Equilı́brio de Nash) Dizemos que um perfil

de estratégias
s∗ = (s∗1 , . . . , s∗(i−1) , s∗i , s∗(i+1) , . . . , s∗n ) ∈ S
é um equilı́brio de Nash se
ui (s∗i , s∗−i ) ≥ ui (siji , s∗−i )
para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi ≥ 2.
i i
i i
“tdj”
i i
2017/2/2
page 21
i i
Exemplo 2.5
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias
(confessar, confessar) é um equilı́brio de Nash. De fato:
uAl (confessar, confessar) = −5 > −10 = uAl (negar, confessar)
uBob (confessar, confessar) = −5 > −10 = uBob (confessar, negar).
Estas desigualdades mostram que, para o perfil de estratégias

(confessar, confessar), um prisioneiro não se sente motivado a
mudar a sua estratégia se o outro não o fizer (ele não vai ficar
menos tempo na cadeia fazendo isto).
Já o perfil (negar, confessar) não é um equilı́brio de Nash do
jogo pois, neste caso, dado que Bob decide confessar, Al fica
menos tempo na cadeia se mudar a sua estratégia de negar para
confessar. Em outras palavras, para o perfil (negar, confessar),
Al se sente motivado a mudar a sua estratégia se Bob não o fizer.
Os perfis (confessar, negar) e (negar, negar) também não são
equilı́brios de Nash. Em (confessar, negar), Bob se sente moti-
vado a mudar a sua estratégia se Al não o fizer e, em (negar,
negar), cada um dos prisioneiros se sente motivado a mudar a
sua estratégia se o outro não o fizer. Desta maneira, vemos que
o único equilı́brio de Nash do jogo é (confessar, confessar).
(b) Na batalha dos sexos (Exemplo 2.2), os perfis de estratégia (fu-

tebol, futebol) e (cinema, cinema) são os únicos equilı́brios de
Nash do jogo.
(c) No Exemplo 2.3, o único equilı́brio de Nash do jogo é o perfil de

estratégias (s12 , s22 ).
Existem, contudo, jogos que não possuem equilı́brios de Nash em

estratégias puras. Este é o caso, por exemplo, do jogo de comparar
moedas (matching pennies).
i i
i i
“tdj”
i i
2017/2/2
page 22
i i
Exemplo 2.6 (Comparar moedas) Nesse jogo, dois jogadores exi-

bem, ao mesmo tempo, a moeda que cada um esconde em sua mão.
Se ambas as moedas apresentam cara ou coroa, o segundo jogador
dá sua moeda para o primeiro. Se uma das moedas apresenta cara,
enquanto a outra apresenta coroa, é a vez do primeiro jogador dar
sua moeda para o segundo. Esse jogo se encontra representado por
sua matriz de payoffs dada abaixo.
g2
s21 s22
s11 (+1, −1) (−1, +1)
g1
s12 (−1, +1) (+1, −1)
Observe que o perfil de estratégias (s11 , s21 ) não é um equilı́brio de

Nash em estratégias puras, pois se o jogador g1 mantiver a sua es-
tratégia s11 , o jogador g2 terá um ganho maior se mudar sua es-
tratégia de s21 para s22 , isto é, ele se sente motivado a mudar a sua
estratégia se o jogador g1 não mudar a sua escolha. O mesmo com-
portamento ocorre para o perfil de estratégias (s12 , s22 ). Já, para os
perfis (s11 , s22 ) e (s12 , s21 ), é o jogador g1 que se sente motivado a
mudar de estratégia para ganhar mais, se o jogador g2 mantiver a sua
estratégia. Isto mostra que o jogo de comparar moedas não possui
equilı́brios de Nash em estratégias puras.
Existe uma maneira conveniente de se caracterizar equilı́brios de

Nash através das funções de melhor resposta. De maneira informal,
a melhor resposta de um jogador para uma determinada escolha de
estratégias dos demais jogadores é o conjunto de estratégias do jo-
gador que maximizam o seu ganho quando os demais jogadores não
mudam as suas escolhas. Mais precisamente, temos a seguinte
Definição 2.6 (Funções de melhor resposta) A função de

melhor resposta do jogador gi é a aplicação
MRi : S−i → 2Si
i i
i i
“tdj”
i i
2017/2/2
page 23
i i
definida por
MRi (s−i ) = argmaxsi ∈Si ui (si , s−i )

= {s∗i ∈ Si | ∀si ∈ Si , ui (s∗i , s−i ) ≥ ui (si , s−i )},
com s−i ∈ S−i (aqui 2Si representa o conjunto das partes de Si ).

A função de melhor resposta do jogo é a aplicação
MR : S → 2S
definida por
MR(s) = (MR1 (s−1 ), MR2 (s−2 ), . . . , MRn (s−n )),
com s ∈ S. Observação: alguns autores usam as notações

MRi : S−i ⇒ Si e MRi : S−i →→ Si para representar a função
de melhor resposta MRi : S−i → 2Si .
Exemplo 2.7
(a) No dilema do prisioneiro (Exemplo 2.1), temos
MRAl : SBob →→ SAl
confessar → {confessar}
negar → {confessar}
MRBob : SAl →→ SBob

confessar → {confessar}
negar → {confessar}.
(b) Na batalha dos sexos (Exemplo 2.2), temos

MRHomem : SMulher →→ SHomem
futebol → {futebol}
cinema → {cinema}
MRMulher : SHomem →→ SMulher

futebol → {futebol}
cinema → {cinema}.
i i
i i
“tdj”
i i
2017/2/2
page 24
i i
(c) No Exemplo 2.3, temos
MR1 (s21 ) = {s14 }, MR1 (s22 ) = {s12 },

MR1 (s23 ) = {s12 }, MR1 (s24 ) = {s13 },
MR2 (s11 ) = {s22 }, MR2 (s12 ) = {s22 },
MR2 (s13 ) = {s22 }, MR2 (s14 ) = {s24 }.
(d) No jogo de comparar moedas (Exemplo 2.6), temos
MR1 (s21 ) = {s11 }, MR1 (s22 ) = {s12 },

MR2 (s11 ) = {s22 }, MR2 (s12 ) = {s21 }.
A próxima proposição é uma consequência direta das definições

de equilı́brio de Nash e funções de melhor resposta.
Proposição 2.1 s∗ = (s∗1 , . . . , s∗i , . . . , s∗n ) ∈ S é um equilı́brio

de Nash em estratégias puras se, e somente se, s∗i ∈ MRi (s∗−i )
para todo i = 1, . . . , n.
Observação. Como vimos, nem sempre um jogo possui um equi-

lı́brio de Nash em estratégias puras. Contudo, é possı́vel garantir
esta existência para certos tipos de jogos com estruturas especiais.
O leitor interessado pode consultar os jogos descritos nos artigos [28,
61, 80, 94]. Para resultados quantitativos, veja [60].
2.2.3 Relações entre dominância e equilı́brio de

Nash
Proposição 2.2 O processo de dominância estrita iterada não

pode eliminar um equilı́brio de Nash ao simplificar um jogo.
Demonstração: Lembramos que, em cada etapa do processo de eli-

minação de estratégias estritamente dominadas, o conjunto de es-
tratégias puras de algum jogador é substituı́do por um subconjunto
i i
i i
“tdj”
i i
2017/2/2
page 25
i i
com menos elementos, obtido removendo-se as estratégias do jogador

que são estritamente dominadas. Cada eliminação gera um espaço de
estratégias puras com menos elementos o que, sucessivamente, sim-
plifica o jogo original:
(1)
S = S1 × · · · × Sn S (1) = S1 × · · · × Sn(1)
(k)
· · · S (k) = S1 × · · · × Sn(k) .
Com esta notação, o enunciado da proposição pode ser colocado as-

sim: se s∗ ∈ S é um equilı́brio de Nash, então s∗ ∈ S (k) .
A demonstração será feita por contradição: suponha, por absurdo,
que exista s∗ = (s∗1 , . . . , s∗n ) ∈ S tal que s∗ é um equilı́brio de Nash,
mas s∗ ∈ S (k) . Isto significa que existe i tal que s∗i ∈ Si mas
(l)
s∗i ∈ Si
(l+1) (0)
para algum l = 0, . . . , k − 1 (se l = 0, defina Si = Si ).
Sem perda de generalidade, vamos supor que esta propriedade ocorre
pela primeira vez para o ı́ndice i, isto é, s∗i é a primeira estratégia do
perfil de estratégias
s∗ = (s∗1 , . . . , s∗(i−1) , s∗i , s∗(i+1) , . . . , s∗n )
que é eliminada por uma estratégia estritamente dominante. Sendo

assim, existe s•i ∈ Si tal que
(l)
ui (s∗i , s−i ) < ui (s•i , s−i )
para todo s−i ∈ S−i . Como s∗i é a primeira estratégia a ser eliminada,
(l)
isto significa que s∗−i ∈ S−i e, portanto,

(l)
ui (s∗i , s∗−i ) < ui (s•i , s∗−i ).
Mas isto é um absurdo pois, por hipótese, s∗ = (s∗i , s∗−i ) é um

Proposição 2.3 Se o processo de dominância estrita iterada

deixa apenas um único perfil de estratégias puras s∗ , então s∗
é o único equilı́brio de Nash do jogo.
i i
i i
“tdj”
i i
2017/2/2
page 26
i i
Demonstração: Suponha que o processo de dominância estrita iterada

gere uma cadeia de espaços de estratégias puras
(1)
S = S1 × · · · × Sn S (1) = S1 × · · · × Sn(1)
(k)
· · · S (k) = S1 × · · · × Sn(k) ,
onde o último conjunto da cadeia é unitário:
S (k) = S1 × · · · × Sn(k) = {s∗ } = {(s∗1 , . . . , s∗i , . . . , s∗n )}.

(k)
Note que, em particular, s∗1 ∈ S1 , s∗2 ∈ S2 , . . . , s∗n ∈ Sn , para

(l) (l) (l)
todo l = 0, . . . , k. Vamos mostrar que, nesta situação, s∗ é o único

equilı́brio de Nash do jogo. De fato, basta mostrar que s∗ é um
equilı́brio de Nash, pois a unicidade é uma consequência direta da
Proposição 2.2. Suponha então, por absurdo, que s∗ não seja um
equilı́brio de Nash. Neste caso, devem existir ı́ndice i e estratégia
∗
i ∈ Si , com si = si , tais que
pura s[1] [1]
ui (s∗i , s∗−i ) < ui (s[1] ∗

i , s−i ).
∗
e dado que s∗ι ∈ Sι para todo ι = 1, . . . n
(l)
i , s−i ) ∈ S
Dado que (s[1] (k)
e para todo l = 0, . . . , k, segue-se que a estratégia s[1] i é estritamente

dominada por alguma outra estratégia s[2] i ∈ S i . Segue-se então que,
∗ ∗
em particular, ui (s[1]
i , s−i ) < u (s
i i
[2]
, s −i ) e, portanto,
ui (s∗i , s∗−i ) < ui (s[1] ∗ ∗

i , s−i ) < ui (si , s−i ).
[2]
Note que, por causa destas desigualdades, segue-se que s[2] i = si e

[1]
si = s∗i . Como (si , s∗−i ) também não pertence a S (k) , segue-se que a
[2] [2]
i é estritamente dominada por uma outra estratégia si ∈

estratégia s[2] [3]
Si . Sendo assim, ui (si , s∗−i ) < ui (si , s∗−i ) e, portanto,

[2] [3]
ui (s∗i , s∗−i ) < ui (s[1] ∗ [2] ∗ [3] ∗

i , s−i ) < ui (si , s−i ) < ui (si , s−i ).
Como antes, destas desigualdades, segue-se que s[3] i = si , si = si e

[2] [3] [1]
∗
si = si . Prosseguindo desta maneira, construirı́amos uma sequência
[3]
infinita (s[1] [2] [3] [r]

i , si , si , . . . , si , . . .) de estratégias puras distintas do jo-
gador gi satisfazendo as desigualdades
ui (s∗i , s∗−i ) < ui (s[1] ∗ ∗

i , s−i ) < · · · < ui (si , s−i ) < · · · .
[r]
i i
i i
“tdj”
i i
2017/2/2
page 27
i i
[SEC. 2.3: ESTRATÉGIAS MISTAS 27
Mas isto é um absurdo, pois Si é um conjunto finito.
A recı́proca da Proposição 2.3 é falsa, isto é, mesmo que o jogo

tenha um único equilı́brio de Nash, ele não é necessariamente obtido a
partir do processo de dominância estrita iterada. O jogo cuja matriz
de payoffs é
g2
s21 s22 s23
s11 (−1, +1) (+1, −1) (−1, +1)
g1 s12 (+1, −1) (−1, +1) (+1, −1)
s13 (−1, +1) (+1, −1) (+5, +5)
fornece um contra-exemplo: s∗ = (s13 , s23 ) é o único equilı́brio de

Nash do jogo, mas não existem estratégias estritamente dominadas.
A Proposição 2.2 é falsa se trocarmos dominância estrita por do-
minância fraca, isto é, o processo de dominância fraca iterada pode
eliminar um equilı́brio de Nash (veja o exercı́cio [10] na página 58
para um contra-exemplo). Se o processo de dominância fraca iterada
reduz o jogo para apenas um único perfil de estratégias (como na
Proposição 2.3), então este perfil é obrigatoriamente um equilı́brio de
Nash, contudo, ele não é necessariamente o único equilı́brio de Nash
do jogo.
2.3 Estratégias mistas

Como vimos no jogo de comparar moedas do Exemplo 2.6, existem
jogos que não possuem equilı́brios de Nash em estratégias puras. Uma
alternativa para estes casos é a de considerar o jogo do ponto de vista
probabilı́stico, isto é, ao invés de escolher um perfil de estratégias
puras, o jogador deve escolher uma distribuição de probabilidade sobre
suas estratégias puras.
Uma estratégia mista pi para o jogador gi ∈ G é uma distribuição
de probabilidades sobre o conjunto Si de estratégias puras do jogador,
i i
i i
“tdj”
i i
2017/2/2
page 28
i i
isto é, pi é um elemento do conjunto

mi

Δmi = (x1 , . . . , xmi ) ∈ Rmi | x1 ≥ 0, . . . , xmi ≥ 0 e xk = 1 .
k=1
Assim, se pi = (pi1 , pi2 , . . . , pimi ), então

mi

pi1 ≥ 0, pi2 ≥ 0, ..., pimi ≥ 0 e pik = 1.
k=1
Note que cada Δmi é um conjunto compacto e convexo. Nas

Figuras 2.1 e 2.2 temos os desenhos de Δ2 e Δ3 , respectivamente. Os
pontos extremos (vértices) de Δmi , isto é, os pontos da forma
e1 = (1, 0, . . . , 0, 0), e2 = (0, 1, . . . , 0, 0), . . . , emi = (0, 0, . . . , 0, 1)
dão, respectivamente, probabilidade 1 às estratégias puras si1 , si2 ,

. . . , simi . Desta maneira, podemos considerar a distribuição de pro-
babilidade ek como a estratégia mista que representa a estratégia
pura sik do jogador gi .
x2
1
0 1 x1

Figura 2.1: Δ2 = (x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1 .
i i
i i
“tdj”
i i
2017/2/2
page 29
i i
[SEC. 2.3: ESTRATÉGIAS MISTAS 29
x3
0 1 x2
1
x1

Figura 2.2: Δ3 = (x1 , x2 , x3 ) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 +
x2 + x3 = 1}.
O espaço de todos os perfis de estratégia mista é o produto car-

tesiano
Δ = Δm1 × Δm2 × · · · × Δmn ,
denominado espaço de estratégias mistas. Como o produto cartesiano
de conjuntos compactos e convexos é compacto e convexo, vemos que
Δ é compacto e convexo.
Um vetor p ∈ Δ é denominado um perfil de estratégias mistas.
Como no caso de estratégias puras, usaremos a notação p−i para
representar as estratégias mistas de todos os jogadores, excluindo-se
a do jogador gi . Desta maneira, escreveremos
(pi , p−i )
para representar p = (p1 , . . . , pi , . . . , pn ). Como a estratégia pura sik

pode ser identificada com a distribuição de probabilidades que dá
peso 1 a sik e peso 0 às demais estratégias do jogador gi , usaremos
(sik , p−i )
i i
i i
“tdj”
i i
2017/2/2
page 30
i i
como uma notação alternativa para o perfil de estratégias mistas

(ek , p−i ). Do mesmo modo, usaremos
(pi , s−i )
para indicar o perfil de estratégias mistas onde o jogador gi escolhe
a distribuição de probabilidades pi e os demais jogadores escolhem
distribuições que dão peso 1 às estratégias puras em s−i .
Cada perfil de estratégias mistas p = (p1 , . . . , pn ) ∈ Δ determina
um payoff esperado (utilidade esperada), uma média dos payoffs pon-
derada pelas distribuições de probabilidades p1 , . . . , pn . Mais preci-
samente, se
p = (p1 , p2 , . . . , pn )
= (p11 , p12 , . . . , p1m1 ; p21 , p22 , . . . , p2m2 ; . . . ; pn1 , pn2 , . . . , pnmn ),

p1 p2 pn
então
m1
m2 mn

ui (p) = ··· p1j1 · p2j2 · · · pnjn · ui (s1j1 , s2j2 , . . . , snjn ).
j1 =1 j2 =1 jn =1
(2.1)
Cuidado com o abuso de notação: estamos usando ui para representar
a função utilidade tanto em estratégias puras quanto em estratégias
mistas.
Como exemplo, considere o jogo de comparar moedas na pági-
na 22. Se g1 escolhe a distribuição de probabilidade p1 = (1/4, 3/4)
e g2 escolhe a distribuição de probabilidade p2 = (1/3, 2/3), então
os payoffs esperados associados ao perfil de estratégias mistas p =
(p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) são dados por

2
2
u1 (p) = p1j1 · p2j2 · u1 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 · p21 · u1 (s11 , s21 ) + p11 · p22 · u1 (s11 , s22 ) +
p12 · p21 · u1 (s12 , s21 ) + p12 · p22 · u1 (s12 , s22 )
1 1 1 2 3 1 3 2
= · · (+1) + · · (−1) + · · (−1) + · · (+1)
4 3 4 3 4 3 4 3
1
= +
6
i i
i i
“tdj”
i i
2017/2/2
page 31
i i
[SEC. 2.4: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS MISTAS 31
e, analogamente,

2
2
u2 (p) = p1j1 · p2j2 · u2 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 · p21 · u2 (s11 , s21 ) + p11 · p22 · u2 (s11 , s22 ) +
p12 · p21 · u2 (s12 , s21 ) + p12 · p22 · u2 (s12 , s22 )
1 1 1 2 3 1 3 2
= · · (−1) + · · (+1) + · · (+1) + · · (−1)
4 3 4 3 4 3 4 3
1
= − .
6
Observação. Se p∗ = (p∗i , p∗−i ) ∈ Δ, então a função x → ui (x, p∗−i )

preserva combinações convexas. Mais precisamente, se x1 , . . . , xr ∈
Δmi e λ1 , . . . , λr são escalares não-negativos com rk=1 λk = 1, então
r r

∗
ui λk · xk , p−i = λk · ui (xk , p∗−i ). (2.2)
k=1 k=1
Em particular, se
mi

p∗i = (p∗i1 , . . . , p∗imi ) = p∗ik · ek , (2.3)
k=1
com ek o k-ésimo vetor da base canônica de Rmi , então

m mi
i
∗ ∗ ∗ ∗ ∗
ui (p ) = ui (pi , p−i ) = ui pik · ek , p−i = p∗ik · ui (ek , p∗−i ).
k=1 k=1
(2.4)
2.4 Soluções de um jogo em estratégias

mistas
Todos os critérios básicos para soluções de jogos em estratégias
puras podem ser estendidos para estratégias mistas.
i i
i i
“tdj”
i i
2017/2/2
page 32
i i
2.4.1 Dominância em estratégias mistas
Definição 2.7 (Estratégia Mista Estritamente Domi-

nada) Dizemos que uma estratégia mista pi ∈ Δmi do joga-
dor gi ∈ G é estritamente dominada pela estratégia pi ∈ Δmi
se, independentemente das escolhas de distribuições de proba-
bilidade dos demais jogadores, o jogador gi ganha mais esco-
lhendo pi do que pi , isto é, se
ui (pi , p−i ) > ui (pi , p−i ),
para todo p−i ∈ Δ−i = Δm1 ×· · ·×Δmi−1 ×Δmi+1 ×· · ·×Δmn .
Como os payoffs ui (pi , p−i ) e ui (pi , p−i ) são, respectivamente,

combinações convexas dos payoffs ui (pi , s−i ) e ui (pi , s−i ),
segue-se que a condição acima é equivalente a
ui (pi , s−i ) > ui (pi , s−i ),
para todos perfis de estratégias puras s−i ∈ S−i .
Exemplo 2.8 ([30], página 21) Considere o jogo com a seguinte

matriz de payoffs:
g2
s21 s22
s11 (5, 3) (0, 0)
.
g1 s12 (0, 0) (5, 3)
s13 (2, 1) (2, 1)
A estratégia mista p1 = (0, 0, 1) ∈ Δ3 do jogador g1 é estritamente
i i
i i
“tdj”
i i
2017/2/2
page 33
i i
dominada pela estratégia mista p1 = (1/2, 1/2, 0) ∈ Δ3 , pois

1 1 5 5 5
u1 (p1 , p2 ) = u1 , , 0; p21 , p22 = · p21 + · p22 =
2 2 2 2 2

>
u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 2 · p21 + 2 · p22 = 2
para todo p2 = (p21 , p22 ) ∈ Δ2 . Como p1 = (0, 0, 1) representa

a estratégia pura s13 do jogador g1 , este exemplo também mostra
que uma estratégia pura pode não ser dominada por nenhuma outra
estratégia puras mas, ainda sim, ser dominada por uma estratégia
mista.
Exemplo 2.9 ([31], página 7) Uma estratégia mista que atribui

probabilidade positiva para uma estratégia pura estritamente domi-
nada também é estritamente dominada (Exercı́cio [13]). Contudo,
uma estratégia mista pode ser estritamente dominada mesmo que ela
atribua probabilidades positivas apenas para as estratégias puras que
não são nem mesmo fracamente dominadas. Considere, por exemplo,
o jogo com a seguinte matriz de payoffs:
g2
s21 s22
s11 (5, 3) (2, 0)
.
g1 s12 (2, 0) (5, 3)
s13 (4, 1) (4, 1)
As estratégias puras s11 e s12 não são fracamente dominadas, mas

a estratégia mista p1 = (1/2, 1/2, 0) é estritamente dominada pela
estratégia mista p1 = (0, 0, 1) (que corresponde à estratégia pura s13 ),
i i
i i
“tdj”
i i
2017/2/2
page 34
i i
pois

u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 4 · p21 + 4 · p22 = 4
>

1 1 7 7 7
u1 (p1 , p2 ) = u1 , , 0; p21 , p22 = · p21 + · p22 =
2 2 2 2 2
para todo p2 = (p21 , p22 ) ∈ Δ2 .
A definição de dominância estrita iterada para estratégias mistas que

daremos aqui segue a linha proposta pelas referências [26, 31, 74].
Abordagens alternativas podem ser encontradas em [01, 15].
Definição 2.8 (Dominância Estrita Iterada em Estra-

(0) (0)
tégias Mistas) Sejam Si = Si e Δmi = Δmi . Defina, recur-
sivamente,
(n) (n−1)
Si = {s ∈ Si | pi ∈ Δ(n−1)
mi tal que
(n−1)
∀s−i ∈ S−i , ui (pi , s−i ) > ui (s, s−i )}
mi = {pi = (pi1 , . . . , pimi ) ∈ Δmi |

Δ(n)
(n)
∀k = 1, . . . , mi , pik > 0 somente se sik ∈ Si }.
A interseção
∞

Si∞ =
(n)
Si
n=0
é o conjunto de estratégias puras que sobrevivem a remoção

iterada de estratégias estritamente dominadas e
i i
i i
“tdj”
i i
2017/2/2
page 35
i i
Δ∞
mi = {pi ∈ Δmi | pi ∈ Δmi
tal que ∀s−i ∈ S−i , ui (pi , s−i ) > ui (pi , si )}

(∞)
é o conjunto de todas as estratégias mistas do jogador gi que

sobreviveram a técnica de dominância estrita iterada.
Note que Si(n) é o conjunto de estratégias puras em Si(n−1) que não são
estritamente dominadas pelas estratégias mistas em Δ(n−1)mi e que Δ(n)
mi
é o conjunto de estratégias mistas que dá probabilidades positivas
apenas para as estratégias puras em Si(n) .
Definição 2.9 (Equilı́brio de Estratégia Estritamente

Dominante) Se, no processo de dominância estrita iterada, o
conjunto S ∞ = S1∞ × · · · × Sn∞ é unitário, isto é, se
S ∞ = {s∗ },
então dizemos que s∗ é um equilı́brio de estratégia estritamente

dominante.
Como no caso de estratégias puras, é possı́vel mostrar que os con-

juntos S ∞ = S1∞ × · · · × Sn∞ e Δ∞ = Δ∞ ∞
m1 × · · · × Δmn não depen-
dem da ordem em que as estratégias estritamente dominadas são
removidas. Não apresentaremos a demonstração deste fato aqui.
O leitor interessado poderá encontrá-la (bem como as definições e
resultados sobre estratégias mistas fracamente dominadas) nas re-
ferências [01, 15, 26, 55].
2.4.2 Equilı́brio de Nash em estratégias mistas
Definição 2.10 (Equilı́brio de Nash) Dizemos que um per-

fil de estratégias mistas
i i
i i
“tdj”
i i
2017/2/2
page 36
i i
p∗ = (p∗1 , p∗2 , . . . , p∗n ) ∈ Δ = Δm1 × Δm2 × · · · × Δmn

ui (p∗i , p∗−i ) ≥ ui (p, p∗−i )
para todo p ∈ Δmi , isto é, nenhum jogador sente motivação

de trocar a sua estratégia mista se os demais jogadores não o
fizerem.
Exemplo 2.10
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias
mistas
p∗ = (p∗1 , p∗2 ) = (1, 0; 1, 0)
é um equilı́brio de Nash, pois
u1 (p1 , p∗2 ) = u1 (p11 , p12 ; 1, 0) = 5 · p11 − 10 ≤

− 5 = u1 (1, 0; 1, 0) = u1 (p∗1 , p∗2 )
para todo p1 = (p11 , p12 ) ∈ Δ2 e
u2 (p∗1 , p2 ) = u2 (1, 0; p21 , p22 ) = 5 · p21 − 10 ≤

− 5 = u2 (1, 0; 1, 0) = u2 (p∗1 , p∗2 )
para todo p2 = (p21 , p22 ) ∈ Δ2 . Observe que este equilı́brio

corresponde ao equilı́brio em estratégias puras
s∗ = (confessar, confessar).
Mostraremos mais adiante que este é o único equilı́brio de Nash

em estratégias mistas do jogo.
(b) Na batalha dos sexos (Exemplo 2.2), os equilı́brios de Nash em
estratégias mistas são
(1, 0; 1, 0), (0, 1; 0, 1) e (2/3, 1/3; 1/3, 2/3).
i i
i i
“tdj”
i i
2017/2/2
page 37
i i
Os dois primeiros perfis de estratégias mistas correspondem às

estratégias puras (futebol, futebol) e (cinema, cinema), respec-
tivamente. Mostraremos mais adiante que estes são os únicos
equilı́brios de Nash em estratégias mistas do jogo.
(c) No Exemplo 2.3, o único equilı́brio de Nash em estratégia mista
é o ponto
(0, 1, 0, 0; 0, 1, 0, 0)
que corresponde ao equilı́brio de Nash (s12 , s22 ) em estratégias
puras.
(d) No jogo de comparar moedas do Exemplo 2.6, o único equilı́brio
de Nash em estratégias mistas é o ponto
(1/2, 1/2; 1/2, 1/2).
Como no caso de estratégias puras, podemos caracterizar equilı́-

brios de Nash em estratégias mistas através das funções de melhor
resposta. Considere um jogo com espaço de estratégias mistas Δ =
Δm1 × · · · × Δmi × · · · × Δmn . No que se segue, usaremos as seguintes
notações:
Δ(Si ) = Δmi e Δ(S−i ) = Δm1 × · · · × Δmi−1 × Δmi+1 × · · · Δmn .
Definição 2.11 (Funções de melhor resposta em estra-

tégias mistas) A função de melhor resposta do jogador gi é a
aplicação
MRi : Δ(S−i ) → 2Δ(Si )
definida por MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ), isto é,
MRi (p−i )
=
{p∗i ∈ Δ(Si ) | ∀pi ∈ Δ(Si ), ui (p∗i , p−i ) ≥ ui (pi , p−i )},
com p−i ∈ Δ(S−i ). A função de melhor resposta do jogo é a

aplicação
MR : Δ → 2Δ
i i
i i
“tdj”
i i
2017/2/2
page 38
i i
definida por
MR(p) = (MR1 (p−1 ), MR2 (p−2 ), . . . , MRn (p−n )),
com p ∈ Δ.
Note que, como Δ(Si ) é um conjunto compacto não-vazio e a

função pi → ui (pi , p−i ) é contı́nua, podemos usar o teorema de Wei-
erstrass para garantir que MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ) é
um conjunto não-vazio para todo p−i ∈ Δ(S−i ).
A próxima proposição é uma consequência direta das definições
de equilı́brio de Nash e funções de melhor resposta em estratégias
mistas.
Proposição 2.4 p∗ = (p∗1 , . . . , p∗i , . . . , p∗n ) ∈ Δ é um equilı́brio

de Nash em estratégias mistas se, e somente se, p∗i ∈ MRi (p∗−i )
para todo i = 1, . . . , n, isto é, p∗ ∈ MR(p∗ ).
Exemplo 2.11 Suponha que, na batalha dos sexos (Exemplo 2.2),

a mulher escolha a estratégia mista p2 = (1/2, 1/2). Qual é a melhor
resposta do homem a esta estratégia da mulher? Para responder a
esta pergunta, observe inicialmente que
uHomem(p1 , p2 ) = uHomem (p11 , p12 ; p21 , p22 )

= p11 · p21 · uHomem (futebol, futebol) +
p11 · p22 · uHomem (futebol, cinema) +
p12 · p21 · uHomem (cinema, futebol) +
p12 · p22 · uHomem (cinema, cinema)
= 10 · p11 · p21 + 5 · p12 · p22
e, portanto, uHomem (p11 , p12 ; 1/2, 1/2) = 5 · p11 + (5/2) · p12 . Desta
maneira,
MRHomem (1/2, 1/2) = argmax(p11 ,p12 )∈Δ2 (5 · p11 + (5/2) · p12 ).
i i
i i
“tdj”
i i
2017/2/2
page 39
i i
Segue-se que a melhor resposta do homem à estratégia mista p2 =

(1/2, 1/2) da mulher é obtida resolvendo-se o seguinte problema de
otimização:
maximizar 5 · p11 + (5/2) · p12

sujeito a p11 + p12 = 1,
p11 ≥ 0,
p12 ≥ 0,
cuja solução é (p∗11 , p∗12 ) = (1, 0). Sendo assim, MRHomem (1/2, 1/2) =
{(1, 0)}.
No caso de jogos com apenas dois jogadores, cada um com apenas

duas estratégias puras, é possı́vel escrever as estratégias mistas de
uma maneira mais simplificada:
Δ2 = {(p, 1 − p) ∈ R2 | 0 ≤ p ≤ 1},
isto é, cada elemento de Δ2 pode ser identificado com um número real
no intervalo [0, 1]. Com isto, as funções de melhor resposta podem
ser reescritas de forma a depender de apenas de um número real. Por
exemplo, se o homem escolhe uma estratégia mista (p, 1 − p) ∈ Δ2 ,
qual é a melhor resposta da mulher a esta estratégia do homem?
Escrevendo as estratégias mistas da mulher na forma (q, 1 − q) ∈ Δ2 ,
vemos que
uMulher(p, 1 − p; q, 1 − q) = 15 pq + 10 − 10 q − 10 p
= 5 (3 p − 2) q + 10 (1 − p).
Sendo assim,
MRMulher(p) = argmax(q,1−q)∈Δ2 (5 (3 p − 2) q + 10 (1 − p))

= argmaxq∈[0,1] (5 (3 p − 2) q + 10 (1 − p)),
onde, por simplicidade, estamos escrevendo MRMulher(p) no lugar

de MRMulher (p, 1 − p). Assim, dada a escolha de p ∈ [0, 1] do homem,
a mulher quer encontrar os valores de q ∈ [0, 1] que maximizam o valor
de sua utilidade uMulher = 5 (3 p − 2) q + 10 (1 − p). Se p ∈ [0, 2/3),
então 3 p − 2 < 0 e, para maximizar a sua utilidade, a mulher deverá
i i
i i
“tdj”
i i
2017/2/2
page 40
i i
escolher q = 0. Se p = 2/3, então 3 p − 2 = 0 e, portanto, a utilidade

uMulher = 10 (1 − p) da mulher não dependerá de q. Neste caso, a
mulher poderá escolher qualquer valor de q em [0, 1]. Se p ∈ (2/3, 1],
então 3 p − 2 > 0 e, para maximizar a sua utilidade, a mulher deverá
escolher q = 1. Mostramos então que
⎧
⎨ {0}, se p ∈ [0, 2/3),
MRMulher (p) = [0, 1], se p = 2/3,
⎩
{1}, se p ∈ (2/3, 1].
Esta função de melhor resposta pode ser representada graficamente,

como mostra a Figura 2.3.
(Mulher) q
(Futebol) 1
(Cinema)
0 2/3 1 p (Homem)
(Cinema) (Futebol)
Figura 2.3: Representação gráfica da função de melhor resposta da

mulher no jogo da batalha dos sexos.
Do mesmo modo, se a mulher escolhe uma estratégia mista (q, 1−q) ∈

Δ2 , então
uHomem (p, 1 − p; q, 1 − q) = 15 pq + 5 − 5 q − 5 p
= 5 (3 q − 1) p + 5 (1 − q),
de modo que
MRHomem (q) = argmax(p,1−p)∈Δ2 (5 (3 q − 1) p + 5 (1 − q))

= argmaxp∈[0,1] (5 (3 q − 1) p + 5 (1 − q)).
i i
i i
“tdj”
i i
2017/2/2
page 41
i i
Assim, dada a escolha de q ∈ [0, 1] da mulher, o homem quer en-

contrar os valores de p ∈ [0, 1] que maximizam o valor de sua utili-
dade uHomem = 5 (3 q − 1) p + 5 (1 − q). Se q ∈ [0, 1/3), então 3 q −
1 < 0 e, para maximizar a sua utilidade, o homem deverá esco-
lher p = 0. Se q = 1/3, então 3 q − 1 = 0 e, portanto, a utilidade
uHomem = 5 (1 − q) do homem não dependerá de p. Neste caso, o
homem poderá escolher qualquer valor de p em [0, 1]. Se q ∈ (1/3, 1],
então 3 q − 1 > 0 e, para maximizar a sua utilidade, o homem deverá
escolher p = 1. Mostramos então que
⎧
⎨ {0}, se q ∈ [0, 1/3),
MRHomem (q) = [0, 1], se q = 1/3,
⎩
{1}, se q ∈ (1/3, 1].
Esta função de melhor resposta pode ser representada graficamente,

como mostra a Figura 2.4.
(Homem) p
(Futebol) 1
(Cinema)
0 1/3 1 q (Mulher)
(Cinema) (Futebol)
Figura 2.4: Representação gráfica da função de melhor resposta do

homem no jogo da batalha dos sexos.
Agora, pela Proposição 2.4, segue-se que um perfil de estratégias

mistas (p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ ) é um equilı́brio de Nash se, e somente se,
q ∗ ∈ MRMulher (p∗ ) e p∗ ∈ MRHomem (q ∗ ). Desta maneira, os valores
de p∗ e q ∗ que geram equilı́brios de Nash correspondem aos pontos
de interseção entre as representações gráficas das funções de melhor
i i
i i
“tdj”
i i
2017/2/2
page 42
i i
resposta da mulher e do homem, quando representadas em um mesmo

sistema de eixos, como ilustra a Figura 2.5.
(Mulher) q
(Futebol) 1
1/3
(Cinema)
0 2/3 1 p (Homem)
(Cinema) (Futebol)
Figura 2.5: Calculando os equilı́brios de Nash usando as representa-

ções gráficas das duas funções de melhor resposta.
Vemos, portanto, que a batalha dos sexos possui apenas 3 equilı́brios

de Nash em estratégias mistas:
(0, 1; 0, 1), (2/3, 1/3; 1/3, 2/3) e (1, 0; 1, 0),
que correspondem, respectivamente, aos três únicos pontos de inter-

seção (p∗ , q ∗ ) = (0, 0), (p∗ , q ∗ ) = (2/3, 1/3) e (p∗ , q ∗ ) = (1, 1) das
duas representações gráficas.
Exemplo 2.12 ([31], página 17) (O jogo da inspeção) O che-

fe de uma empresa de computação desconfia que seu operador de
computadores está usando o tempo de serviço para “bater papo”
na internet. Se o operador trabalha corretamente, ele gasta g em
esforço e produz um lucro bruto de v unidades para a empresa. O
chefe, por sua vez, pode fiscalizar ou não o trabalho do operador.
Fiscalizar custa h unidades para a empresa. Se o operador for pego
“batendo papo” na internet, ele perde o seu salário de w unidades
(o chefe não pode condicionar o valor do salário w ao valor do lucro
bruto v). Para limitar o número de casos a considerar, vamos assumir
i i
i i
“tdj”
i i
2017/2/2
page 43
i i
que g > h > 0 e que w > g. Os dois jogadores escolhem suas

estratégias simultaneamente (em particular, ao decidir se vai fiscalizar
ou não, o chefe não sabe se o empregado decidiu trabalhar ou decidiu
“bater papo” na internet). Neste contexto, o jogo da inspeção tem a
matriz de payoffs indicada abaixo.
empregado
não trabalhar trabalhar
fiscalizar (−h, 0) (v − w − h, w − g)
chefe
não fiscalizar (−w, w) (v − w, w − g)
Observe que este jogo não possui equilı́brio de Nash em estratégias

puras e, como ele deve se repetir em cada dia útil de trabalho, não é
sensato escolher sempre a mesma estratégia pura para todos os dias.
A solução, neste caso, é escolher entre as estratégias puras a cada dia
seguindo uma distribuição de probabilidades, isto é, através de es-
tratégias mistas. Como as funções de melhor resposta do empregado
e do chefe são dadas, respectivamente, por
MREmpregado (p) = argmaxq∈[0,1] ((−wp + g) q + w − g)

⎧
⎨ {1}, se p ∈ [0, g/w),
= [0, 1], se p = g/w,
⎩
{0}, se p ∈ (g/w, 1],
MRChefe (q) = argmaxp∈[0,1] ((+wq − h) p + v (1 − q) − w)
⎧
⎨ {0}, se q ∈ [0, h/w),
= [0, 1], se q = h/w,
⎩
{1}, se q ∈ (h/w, 1],
segue-se que o (único) equilı́brio de Nash em estratégias mistas é

obtido tomando-se p∗ = g/w e q ∗ = h/w. Se, por exemplo, v = 5,
w = 4, g = 3 e h = 2, então
(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ ) = (3/4, 1/4; 1/2, 1/2).
Isto significa que o chefe deve escolher sua estratégia de acordo com
um gerador de números aleatórios com distribuição de probabili-
dade (3/4, 1/4) e o operador deve escolher sua estratégia de acordo
i i
i i
“tdj”
i i
2017/2/2
page 44
i i
com um gerador de números aleatórios com distribuição de probabili-

dade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas “rodas
da fortuna” da Figura 2.6.
Fiscalizar Trabalhar
Não fiscalizar Não trabalhar
chefe empregado
Figura 2.6: Distribuições de probabilidade que constituem um equilı́-

brio de Nash para o jogo do Exemplo 2.12.
A partir deste resultado, podemos calcular o valor ótimo de contrato

do empregado, isto é, o valor de w que maximiza o payoff esperado
do chefe:

h
uChefe (w) = (+wq ∗ − h) p∗ + v (1 − q ∗ ) − w) = v 1 − − w.
w
√ ∗
√ por exemplo, vh >∗ g, então este valor ótimo é dado por w =
Se,
vh (note que uChefe (w ) = 0 e uChefe (w) ≤ 0 para w > 0).
Jogos deste tipo têm sido usados para se estudar temas como controle
de armas ([03, 10, 83]), prevenção de crimes ([04]) e incentivos no
trabalho ([53]).
Como vimos no jogo de comparar moedas no Exemplo 2.6, existem

jogos que não possuem equilı́brios de Nash em estratégias puras e, até
agora, todos os jogos apresentados em nossos exemplos possuem pelo
menos um equilı́brio de Nash em estratégias mistas. Uma pergunta
natural é se a existência de equilı́brios de Nash em estratégias mistas
é um resultado geral ou não. A resposta é sim! No próximo capı́tulo
apresentaremos e demonstraremos o teorema de equilı́brio de Nash,
i i
i i
“tdj”
i i
2017/2/2
page 45
i i
que garante a existência de equilı́brios em estratégias mistas para

jogos finitos.
2.4.3 Relações entre dominância e equilı́brio de

Nash
As Proposições 2.2 e 2.3 para estratégias puras continuam válidas
para estratégias mistas: (1) o processo de dominância estrita ite-
rada em estratégias mistas não pode eliminar um equilı́brio de Nash
e (2) se o processo de dominância estrita iterada em estratégias mistas
deixa apenas um único perfil de estratégias, então este perfil é um
equilı́brio de Nash do jogo. Não apresentaremos as demonstrações
destes resultados aqui. O leitor interessado poderá encontrá-las nas
referências [15, 26].
2.4.4 Como interpretar estratégias mistas?

Existe muita controvérsia sobre as interpretações e usos de es-
tratégias mistas ([02, 12, 17, 57, 74, 77, 81, 73, 92, 93]). Aumann,
por exemplo, em [02], afirma que
“Mixed strategy equilibria have always been intuitively
problematic because they are not ‘strict’: a player will not
lose if he abandons the randomization and uses instead
any arbitrary one of the pure strategy components of the
randomization.”
(veja as Equações 4.1 na página 81) e, segundo Rardner e Roshen-
tal ([76]),
“One of the reasons why game-theoretic ideas have not
found more widespread application is that randomization,
which plays a major role in game theory, seems to have
limited appeal in many practical situations.”
Ainda, segundo Rubinstein ([81]),
“The reason for the criticism is that the naive interpreta-
tion of a mixed strategy as an action which is conditional
on the outcome of a lottery executed by the player before
i i
i i
“tdj”
i i
2017/2/2
page 46
i i
the game, goes against our intuition. We are reluctant to

believe that our decisions are made at random. We prefer
to be able to point to a reason for each action we take.
Outside of Las Vegas we do not spin roulettes.”
De fato, testes experimentais recentes mostraram que jogadores não
seguem a estratégia mista prevista pela teoria, mesmo quando o jogo
possui um único equilı́brio de Nash em estratégias mistas ([57]).
Existem também certas análises feitas com estratégias mistas que
produzem resultados não-intuitivos. Considere, por exemplo, a se-
guinte situação. Um contribuinte C deve decidir se vai ou não sonegar
imposto, sabendo que existe um fiscal F que pode ou não fiscalizá-lo.
Na matriz de payoffs abaixo, vamos assumir que valem as seguintes
desigualdades
(1) c21 > c11 : o contribuinte C prefere não sonegar se souber que
o fiscal F irá fiscalizar,
(2) c12 > c22 : o contribuinte C prefere sonegar se souber que o fis-
cal F não irá fiscalizar,
(3) f11 > f12 : o fiscal F prefere fiscalizar se souber que o contribuin-
te C irá sonegar e
(4) f22 > f21 : o fiscal F prefere não fiscalizar se souber que o contri-
buinte C não irá sonegar.
Você pode pensar que os cij são números negativos que representam
o quanto será debitado de C pelo pagamento de imposto e que os fij
são números positivos que representam bônus salariais de F .
F
fiscalizar não fiscalizar
sonegar (c11 , f11 ) (c12 , f12 ) .
C
não sonegar (c21 , f21 ) (c22 , f22 )
Usando a técnica descrita no Exemplo 2.11, vemos que o único equi-

lı́brio de Nash do jogo é dado por (p∗C , 1 − p∗C ; p∗F , 1 − p∗F ), onde

∗ ∗ f22 − f21 c22 − c12
(pC , pF ) = , .
f22 − f21 − f12 + f11 c22 − c12 − c21 + c11
i i
i i
“tdj”
i i
2017/2/2
page 47
i i
Aqui, p∗C representa a probabilidade com que C decide sonegar e p∗F

representa a probabilidade com que F decide fiscalizar. Dois resulta-
dos não-intuitivos advêm destas expressões para p∗C e p∗F :
(a) Se a receita federal decide aumentar a multa de sonegação, isto
é, se ela resolve diminuir o valor de c11 , então a freqüência p∗C de
sonegações não muda e a freqüência de fiscalizações p∗F diminui.
(b) Se a receita federal decide aumentar o bônus salarial para os fis-
cais que identificam contribuintes sonegadores, isto é, se ela resol-
ver aumentar o valor de f11 , então a freqüência de fiscalizações p∗F
não muda e a freqüência de sonegações p∗C diminui.
Isto acontece porque alterações introduzidas nos payoffs de um jo-
gador afeta apenas a expressão para o perfil de estratégias mistas
do equilı́brio de Nash do outro jogador (Proposição da Irrelevância
do Payoff [43]).
Existem, contudo, interpretações que são mais robustas. Uma de-
las é imaginar o jogo como uma interação entre n populações nume-
rosas: cada partida ocorre depois que n jogadores são selecionados
de maneira aleatória nestas populações. As probabilidades piji no
perfil de estratégias mistas pi do jogador gi são interpretadas como
as freqüências dos jogadores que escolheram a estratégia pura siji na
i-ésima população. Outra interpretação é devida a Harsanyi. Apre-
sentamos aqui o abstract de seu artigo [39]:
“Equilibrium points in mixed strategies seem to be unsta-
ble, because any player can deviate without penalty from
his equilibrium strategy even if he expects all other players
to stick to theirs. This paper proposes a model under
which most mixed-strategy equilibrium points have full
stability. It is argued that for any game Γ the players’
uncertainty about the other players’ exact payoffs can be
modeled as a disturbed game Γ∗ , i.e., as a game with small
random fluctuations in the payoffs. Any equilibrium point
in Γ, whether it is in pure or in mixed strategies, can ‘al-
most always’ be obtained as a limit of a pure-strategy
equilibrium point in the corresponding disturbed game
Γ∗ when all disturbances go to zero. Accordingly, mixed-
strategy equilibrium points are stable – even though the
i i
i i
“tdj”
i i
2017/2/2
page 48
i i
players may make no deliberate effort to use their pure

strategies with the probability weights prescribed by their
mixed equilibrium strategies – because the random fluc-
tuations in their payoffs will make them use their pure
strategies approximately with the prescribed probabili-
ties.”
Não nos aprofundaremos neste tema polêmico. O leitor interessado

pode consultar as referências citadas no inı́cio desta subseção e, em
especial, [81] e a Seção 3.2 de [74].
2.5 Jogos infinitos

Os jogos que estudamos até agora são finitos, isto é, eles possuem
um número finito de jogadores, cada um com um número finito de es-
tratégias puras. Contudo, existem situações que, para serem modela-
das, necessitam de um número infinito de jogadores ou de um número
infinito de estratégias ([06, 44, 62]). Jogos em estratégias mistas, por
exemplo, podem ser pensados como jogos com um número finito de
jogadores e com um número infinito de estratégias (as infinitas dis-
tribuições de probabilidade que cada jogador pode escolher). Vamos
nos concentrar no caso de jogos com um número finito de jogadores e
um número infinito de estratégias puras (o caso de estratégias mistas
requer como pré-requisito teoria da medida e não será tratado aqui).
As definições de estratégias estritamente dominadas, estratégias fra-
camente dominadas e equilı́brios de Nash são análogas ao caso finito,
com a diferença de que, agora, os conjuntos Si podem ser infinitos.
Definição 2.12 (Estratégia Pura Estritamente Domi-

nada) Dizemos que uma estratégia pura si ∈ Si do jogador gi ∈
G é estritamente dominada pela estratégia si ∈ Si se
ui (si , s−i ) > ui (si , s−i ),
para todo s−i ∈ S−i .
i i
i i
“tdj”
i i
2017/2/2
page 49
i i
[SEC. 2.5: JOGOS INFINITOS 49
Definição 2.13 (Estratégia Pura Fracamente Domi-

nada) Dizemos que uma estratégia pura si ∈ Si do joga-
dor gi ∈ G é fracamente dominada pela estratégia si ∈ Si se
ui (si , s−i ) ≥ ui (si , s−i ),
para todo s−i ∈ S−i e, pelo menos para algum s•−i ∈ S−i ,
ui (siκ , s•−i ) > ui (siκ , s•−i ).
Definição 2.14 (Equilı́brio de Nash)Dizemos que um perfil

de estratégias
s∗ = (s∗1 , . . . , s∗(i−1) , s∗i , s∗(i+1) , . . . , s∗n ) ∈ S
ui (s∗i , s∗−i ) ≥ ui (si , s∗−i )
para todo i = 1, . . . , n e para todo si ∈ Si .
Exemplo 2.13 ([26], página 2009) Considere o seguinte jogo in-

finito: G = {g1 , g2 }, S1 = S2 = [0, 1] e u1 , u2 : S = S1 × S2 → R
definidas por
⎧
⎨ x, se x < 1,
u1 (x, y) = 0, se x = 1 e y < 1,
⎩
1, se x = 1 e y = 1,
e ⎧
⎨ y, se y < 1,
u2 (x, y) = 0, se y = 1 e x < 1,
⎩
1, se y = 1 e x = 1,
Observe que toda estratégia pura x ∈ [0, 1) do jogador g1 é estrita-
mente dominada. De fato, (1 + x)/2 ∈ (x, 1) e
u1 (x, y) = x < (1 + x)/2 = u1 ((1 + x)/2, y), ∀y ∈ [0, 1].
i i
i i
“tdj”
i i
2017/2/2
page 50
i i
Do mesmo modo, toda estratégia pura y ∈ [0, 1) do jogador g2 é

estritamente dominada por (1 + y)/2 ∈ (y, 1). Como
u1 (1, 1) = 1 ≥ u1 (x, 1) e u2 (1, 1) = 1 ≥ u2 (1, y), ∀x, y, ∈ [0, 1],
segue-se que (x∗ , y ∗ ) = (1, 1) é o único equilı́brio de Nash em es-

tratégias puras do jogo. Eliminando-se todas as estratégias em S1 −
{1, t} e S2 − {1, t}, para algum t < 1, obtemos um jogo 2 × 2, que
não pode ser mais reduzido:
g2
1 t
1 (1, 1) (0, t)
g1
t (t, 0) (t, t)
Como t é arbitrário, este exemplo mostra que, em jogos infinitos,

o processo de eliminação de estratégias puras estritamente domina-
das pode produzir reduções que dependem da ordem em que as eli-
minações são realizadas. O exemplo também mostra que, em jogos
infinitos, a melhor resposta de um jogador pode não existir. Por
exemplo, não existe uma melhor resposta (em estratégias puras) do
jogador g1 à uma escolha y ∈ (0, 1) do jogador g2 .
Como no caso de jogos finitos, um jogo infinito nem sempre pos-

sui equilı́brios de Nash em estratégias puras. Contudo, é possı́vel
mostrar que se os espaços de estratégias Si são subconjuntos com-
pactos, convexos e não-vazios de um espaço euclidiano e as funções
utilidade s = (si , s−i ) → ui (s) são contı́nuas em s e quase-côncavas
em si , então o jogo possui pelo menos um equilı́brio de Nash em es-
tratégias puras ([23, 31, 34]). Note que este resultado inclui, como
caso particular, os jogos finitos em estratégias mistas.
2.6 Exercı́cios
[01] Use o processo de dominância estrita iterada para reduzir o jogo
cuja matriz de payoffs é dada abaixo.
i i
i i
“tdj”
i i
2017/2/2
page 51
i i
[SEC. 2.6: EXERCÍCIOS 51
g2
s21 s22 s23 s24
s11 (3, 0) (1, 1) (5, 4) (0, 2)
g1 s12 (1, 1) (3, 2) (6, 0) (2, −1)
s13 (0, 2) (4, 4) (7, 2) (3, 0)
[02] Considere a matriz de payoffs para os jogadores L (linhas) e C

(colunas), a seguir:
C
c1 c2
l1 (3, 3) (0, 1)
L
l2 (1, 1) (2, 3)
Pede-se:
(a) Determinar se existe alguma estratégia estritamente domi-
nante para algum jogador.
(b) Determinar se existe algum equilı́brio de Nash (em estraté-
gias puras). Caso exista mais do que um equilı́brio, quantos
e quais são.
[03] A partir da matriz de payoffs a seguir para os jogadores L (li-
nhas) e C colunas,
C
c1 c2
l1 (3, 2) (4, 4)
L
l2 (1, 1) (9, 2)
determine:
i i
i i
“tdj”
i i
2017/2/2
page 52
i i
(a) Se algum jogador possui alguma estratégia dominante.

(b) Quantos equilı́brios de Nash em estratégias puras existem.
[04] (Jogo do covarde) Neste jogo, dois adolescentes pilotam
carros roubados em direção a um abismo em um teste de co-
ragem: aquele que desviar o carro primeiro será chamado de
covarde (chicken).
Este tipo de jogo ficou popular depois do filme Juventude Trans-

viada (Rebel Without a Cause) de 1955, estrelado por James
Dean, que morreu em decorrência de um acidente de automóvel.
Bertrand Russell, em [82], compara uma variação deste jogo
com a tática de brinkmanship 2 na corrida nuclear:
“Since the nuclear stalemate became apparent, the
Governments of East and West have adopted the
policy which Mr. Dulles calls ‘brinkmanship’. This
is a policy adapted from a sport which, I am told, is
practised by some youthful degenerates. This sport
is called ‘Chicken!’. It is played by choosing a long
straight road with a white line down the middle and
starting two very fast cars towards each other from
opposite ends. Each car is expected to keep the wheels
of one side on the white line. As they approach each
other, mutual destruction becomes more and more
imminent. If one of them swerves from the white
2 Arte ou prática de se levar uma situação perigosa ou confrontação além do
limite do que pode ser considerado seguro, para conseguir determinado desfecho.
i i
i i
“tdj”
i i
2017/2/2
page 53
i i
line before the other, the other, as he passes, shouts

‘Chicken!’, and the one who has swerved becomes
an object of contempt. As played by irresponsible
boys, this game is considered decadent and immoral,
though only the lives of the players are risked. But
when the game is played by eminent statesmen, who
risk not only their own lives but those of many hun-
dreds of millions of human beings, it is thought on
both sides that the statesmen on one side are dis-
playing a high degree of wisdom and courage, and
only the statesmen on the other side are reprehensi-
ble. This, of course, is absurd. Both are to blame
for playing such an incredibly dangerous game. The
game may be played without misfortune a few times,
but sooner or later it will come to be felt that loss
of face is more dreadful than nuclear annihilation.
The moment will come when neither side can face
the derisive cry of ‘Chicken!’ from the other side.
When that moment is come, the statesmen of both
sides will plunge the world into destruction.”
O jogo do covarde pode ser modelado com a seguinte matriz
de payoffs:
g2
desviar não desviar
desviar (2, 2) (1, 3) .
g1
não desviar (3, 1) (0, 0)
Pede-se:
e quais são.
i i
i i
“tdj”
i i
2017/2/2
page 54
i i
[05] (Jogo Hawk-Dove) Dois animais disputam um recurso (uma

presa, por exemplo). Cada animal tem duas opções: (1) brigar
pelo recurso (estratégia hawk ) ou (2) ameaçar o seu oponente
(estratégia dove). Se os dois animais resolverem brigar pelo
recurso, o conflito continuará até que um deles fique ferido e
o vencedor será o outro. Se somente um animal decide ata-
car, então ele vencerá o animal que decidiu apenas ameaçar.
Se os dois escolherem fazer ameaças, então existe um empate
e cada animal recebe um ganho menor do que ganharia na si-
tuação onde um escolhe brigar e o outro ameaçar. Este jogo
foi apresentado pela primeira vez por John Maynard Smith e
George Price no artigo The Logic of Animal Conflict na re-
vista Nature [56]. A forma tradicional da matriz de payoffs é a
seguinte:
g2
brigar ameaçar

V −C V −C
brigar , (V, 0) .
g1 2 2

V V
ameaçar (0, V ) ,
2 2
Aqui, V é o valor do recurso sendo disputado e C é o custo da

briga. Em geral, assume-se que o valor do recurso é menor do
que o custo da briga, isto é, C > V > 0. Pede-se:

e quais são.
[06] No artigo “Nornmandy: Game and Reality”, de W. Draker na

revista “Moves”, no. 6 (1972), é feita uma análise da invasão da
Europa na Normandia na Segunda Guerra Mundial. Seis confi-
gurações possı́veis de ataque (1 a 6) pelos Aliados e seis possı́veis
i i
i i
“tdj”
i i
2017/2/2
page 55
i i
estratégias defensivas (A a F ) pelo Eixo foram simuladas e cal-

culadas, num total de 36 simulações. A matriz da Tabela 2.1
foi estimada pelos Aliados para cada batalha hipotética. Use o
processo de dominância fraca iterada para reduzir ao máximo
possı́vel o tamanho da matriz.
[07] Considere um jogo com três jogadores: A, B e C. As estratégias
do jogador A são {x1 , x2 , x3 }, as estratégias do jogador B são
{y1 , y2 } e as estratégias do jogador C são {z1 , z2 , z3 , z4 }. Se
o jogador B escolhe a estratégia y1 , os payoffs são dados pela
matriz
C
z1 z2 z3 z4
x1 (5, 0, 2) (1, 0, 1) (3, 0, 6) (1, 2, 1)
A x2 (3, 2, 2) (9, 1, 8) (2, 0, 5) (2, 0, 2)
x3 (1, 0, 0) (1, 0, 9) (4, 0, 8) (3, 0, 3)
Por outro lado, se o jogador B escolhe a estratégia y2 , então os

payoffs são dados por
C
z1 z2 z3 z4
x1 (0, 1, 1) (0, 1, 2) (2, 1, 3) (0, 3, 9)
A x2 (0, 3, 2) (1, 2, 3) (2, 1, 8) (2, 1, 0)
x3 (1, 1, 0) (2, 1, 1) (3, 2, 2) (3, 1, 3)
Use a técnica de dominância estrita iterada para reduzir a ma-

triz deste jogo.
i i
i i
2017/2/2
page 56
i
i
“tdj”
i
i
[CAP. 2: JOGOS NA FORMA ESTRATÉGICA
Eixo
A B C D E F
1 (+13, −13) (+29, −29) (+ 8, − 8) (+12, −12) (+16, −16) (+23, −23)
2 (+18, −18) (+22, −22) (+21, −21) (+22, −22) (+29, −29) (+31, −31)
3 (+18, −18) (+22, −22) (+31, −31) (+31, −31) (+27, −27) (+37, −37)
Aliados
4 (+11, −11) (+22, −22) (+12, −12) (+21, −21) (+21, −21) (+26, −26)
5 (+18, −18) (+16, −16) (+19, −19) (+14, −14) (+19, −19) (+28, −28)
6 (+23, −23) (+22, −22) (+19, −19) (+23, −23) (+30, −30) (+34, −34)
Tabela 2.1: Análise da invasão da Europa na Normandia na Segunda Guerra Mundial.
56
i
i
i
i
“tdj”
i i
2017/2/2
page 57
i i
[08] Repita o exercı́cio anterior com a matriz de payoffs
C
z1 z2 z3 z4
x1 (1, 2, 9) (2, 9, 9) (3, 7, 9) (2, 8, 9)
A x2 (3, 8, 3) (4, 5, 4) (4, 1, 3) (3, 9, 3)
x3 (2, 9, 9) (3, 9, 9) (3, 9, 9) (2, 9, 9)
caso o jogador B escolha a estratégia y1 e a matriz de payoffs
C
z1 z2 z3 z4
x1 (2, 1, 9) (3, 9, 9) (2, 9, 9) (1, 9, 9)
A x2 (4, 9, 1) (4, 2, 2) (3, 2, 1) (2, 2, 1)
x3 (1, 9, 9) (2, 9, 9) (2, 9, 9) (1, 9, 9)
caso ele escolha a estratégia y2 .

[09] Considere um jogo com três jogadores: A, B e C. As estratégias
do jogador A são {x1 , x2 , x3 }, as estratégias do jogador B são
{y1 , y2 } e as estratégias do jogador C são {z1 , z2 , z3 , z4 }. Se
o jogador B escolhe a estratégia y1 , os payoffs são dados pela
matriz
C
z1 z2 z3 z4
x1 (1, 2, 1) (2, 3, 1) (1, 0, 2) (1, 4, 1)
A x2 (2, 0, 1) (1, 2, 1) (3, 1, 3) (3, 2, 1)
x3 (1, 0, 1) (1, 1, 1) (2, 5, 1) (1, 3, 1)
i i
i i
“tdj”
i i
2017/2/2
page 58
i i
Por outro lado, se o jogador B escolhe a estratégia y2 , então os

payoffs são dados por
C
z1 z2 z3 z4
x1 (0, 0, 0) (1, 2, 3) (1, 3, 0) (1, 1, 1)
A x2 (2, 1, 0) (1, 5, 1) (2, 2, 3) (1, 5, 2)
x3 (2, 1, 1) (1, 0, 1) (1, 0, 4) (1, 5, 3)
Calcule os equilı́brios de Nash em estratégias puras deste jogo.

[10] Considere o jogo cuja matriz de payoffs é dada por:
Jogador 2
L C R
T (1, 0) (3, 1) (1, 1)
Jogador 1
.
M (1, 1) (3, 0) (0, 1)
B (2, 2) (3, 3) (0, 2)
(a) Identifique, para cada jogador, todos os pares de estratégias

onde uma estratégia é fracamente dominada pela outra.
(b) Usando o processo de eliminação das estratégias fracamente
dominadas, encontre todas as possı́veis de maneiras de re-
duzir o jogo para uma matriz 1 × 1.
(c) Quais são os equilı́brios de Nash em estratégias puras do
jogo?
[11] Suponha que o processo de dominância fraca iterada em es-
tratégias puras reduza um jogo finito para apenas um único
perfil de estratégias s∗ . Mostre que s∗ é um equilı́brio de Nash
em estratégias puras do jogo.
i i
i i
“tdj”
i i
2017/2/2
page 59
i i
[12] Demonstre a propriedade 2.2 da página 31 da função utilidade

esperada definida em 2.1.
[13] Mostre que uma estratégia mista que atribui probabilidade po-
sitiva para uma estratégia pura estritamente dominada também
é estritamente dominada.
[14] Use a técnica descrita no Exemplo 2.11 para calcular as funções
de melhor resposta dos jogadores dos Exemplos 2.1 (o dilema
dos prisioneiros) e 2.6 (comparar moedas). Em seguida, use as
representações gráficas destas funções para calcular os equilı́-
brios de Nash em estratégias mistas de cada jogo.
[15] Um equilı́brio de Nash em estratégias mista pode dar probabi-
lidade positiva a uma estratégia pura que é estritamente domi-
nada? E em uma estratégia pura que é fracamente dominada?
[16] (Eficiência de Pareto) Um perfil de estratégias puras é Pa-
reto eficiente (também denominado ponto ótimo de Pareto) se
nenhum outro perfil de estratégias puras oferece a todos os joga-
dores um ganho maior, isto é, nenhum jogador pode aumentar o
seu ganho sem que algum outro jogador tenha uma perda. Mais
precisamente, s∗ ∈ S é Pareto eficiente se, não existe s• ∈ S
tal que
ui (s• ) > ui (s∗ ), para todo i = 1, . . . , n.
O equilı́brio de Nash s∗ = (confessar, confessar) do jogo do

dilema dos prisioneiros é Pareto eficiente?
i i
i i
“tdj”
i i
2017/2/2
page 60
i i
Capı́tulo 3
O teorema de equilı́brio
de Nash
O teorema de equilı́brio de Nash estabelece que todo jogo finito

possui pelo menos um equilı́brio de Nash em estratégias mistas. Este
resultado foi provado por John Forbes Nash Jr. em sua tese de dou-
torado em 1949 na Universidade de Princeton. Neste capı́tulo apre-
sentaremos duas demonstrações do teorema, obtidas através de dois
teoremas de ponto fixo: o de Brouwer e o de Kakutani.
3.1 Usando o teorema de Brouwer
Teorema 3.1 (do ponto fixo de Brouwer) Se Δ é um

subconjunto compacto, convexo e não-vazio de um espaço eucli-
diano de dimensão finita e se F : Δ → Δ é uma função contı́nua,
então F possui um ponto fixo em Δ, isto é, existe p∗ ∈ Δ tal
que
F(p∗ ) = p∗ .
A demonstração deste teorema pode ser encontrada, por exemplo,

em [63, 79]. A dissertação de mestrado [89] oferece um excelente
60
i i
i i
“tdj”
i i
2017/2/2
page 61
i i
[SEC. 3.1: USANDO O TEOREMA DE BROUWER 61
survey sobre o assunto: ela inclui dados históricos, generalizações e

aplicações do teorema do ponto fixo de Brouwer.
Com as notações dadas na Seção 2.3, estabeleceremos uma se-
qüência de teoremas que fornecem caracterizações alternativas para
um equilı́brio de Nash.
Teorema 3.2 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as

funções
zij : Δ → R
p → zij (p) = ui (sij , p−i ) − ui (pi , p−i )
(isto é, zij mede o ganho ou perda do jogador gi quando ele troca
a distribuição de probabilidade pi pela estratégia pura sij ). Te-
mos que p∗ é um equilı́brio de Nash se, e somente se,
zij (p∗ ) ≤ 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
Demonstração:
(⇒) Se p∗ = (p∗i , p∗−i ) é um equilı́brio de Nash, então ui (p∗i , p∗−i )
≥ ui (sij , p∗−i ) para cada i = 1, . . . , n e j = 1, . . . , mi . Conseqüente-
mente,
zij (p∗ ) = ui (sij , p∗−i ) − ui (p∗i , p∗−i ) ≤ 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
(⇐) Se
zij (p∗ ) = ui (sij , p∗−i ) − ui (p∗i , p∗−i ) ≤ 0
para cada i = 1, . . . , n e j = 1, . . . , mi , então
ui (sij , p∗−i ) = ui (ej , p∗−i ) ≤ ui (p∗i , p∗−i )
para cada i = 1, . . . , n e j = 1, . . . , mi , onde ej é o vetor em Rmi que

tem 1 na j-ésima coordenada e zero nas demais. Devemos mostrar
que para todo pi = (pi1 , . . . , pimi ) ∈ Δmi
ui (pi , p∗−i ) ≤ ui (p∗i , p∗−i ).
i i
i i
“tdj”
i i
2017/2/2
page 62
i i
62 [CAP. 3: O TEOREMA DE EQUILÍBRIO DE NASH
Mas, como x → ui (x, p∗i ) preserva combinações convexas, temos que

m mi
i
∗ ∗
ui (pi , p−i ) = ui pik · ek , p−i = pik · ui ek , p∗−i
k=1 k=1
≤
mi
mi

pik · ui p∗i , p∗−i = ui p∗i , p∗−i · pik = ui p∗i , p∗−i ,
k=1 k=1
mi
onde, na última igualdade, usamos o fato de que k=1 pik = 1, dado
que pi ∈ Δmi .
Teorema 3.3 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as

funções
gij : Δ → R
.
p → gij (p) = max{0, zij (p)}
Temos que p é um equilı́brio de Nash se, e somente se,
gij (p) = 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
Demonstração: A prova segue imediatamente do teorema anterior.
Teorema 3.4 Defina a aplicação
F : Δ = Δm1 × · · · × Δmn → Δ = Δm1 × · · · × Δmn

,
p = (p1 , . . . , pn ) → F(p) = (y1 (p), . . . , yn (p))
onde
yi (p) = (yi1 (p), . . . , yimi (p)), pi = (pi1 , . . . , pimi )
i i
i i
“tdj”
i i
2017/2/2
page 63
i i
[SEC. 3.1: USANDO O TEOREMA DE BROUWER 63
pij + gij (p)

yij (p) = mi .

1+ gik (p)
k=1
Temos que p∗ é um equilı́brio de Nash se, e somente se,
F(p∗ ) = p∗ ,
isto é, se, e somente se, p∗ é um ponto fixo da aplicação F.
Demonstração: Observe que, de fato, F(Δ) ⊆ Δ, pois claramente

yij ≥ 0 e
⎛ ⎞ mi mi

mi ⎜ ⎟
mi
pik + gik (p)
⎜ pik + gik (p) ⎟
yik (p) = ⎜ ⎟= k=1 k=1
⎜ mi ⎟ mi

k=1 k=1 ⎝ ⎠
1+ gik (p) 1+ gik (p)
k=1 k=1
mi

1+ gik (p)
k=1
= mi = 1,

1+ gik (p)
k=1
isto é, cada yi (p) ∈ Δmi .

(⇒) Se p∗ é um equilı́brio de Nash, então gij (p∗ ) = 0 para cada
i = 1, . . . , n e j = 1, . . . , mi . Desta maneira, yij (p∗ ) = p∗ij para cada
i = 1, . . . , n e j = 1, . . . , mi , isto é, yi (p∗ ) = p∗i para cada i = 1, . . . , n
ou, ainda, F(p∗ ) = p∗ .
(⇐) Suponha que p∗ = (p∗1 , p∗2 , . . . , p∗n ) ∈ Δ = Δm1 × · · · × Δmn
seja um ponto fixo da aplicação F : Δ → Δ, isto é, suponha que
p∗ij + gij (p∗ )

p∗ij = mi

1+ gik (p∗ )
k=1
i i
i i
“tdj”
i i
2017/2/2
page 64
i i
para todo j = 1, . . . , mi e i = 1, . . . , n. Segue-se então que

mi

p∗ij · gik (p∗ ) = gij (p∗ ),
k=1
para todo j = 1, . . . , mi e i = 1, . . . , n. Afirmamos agora que α =

mi ∗ ∗
k=1 gik (p ) = 0, de modo que gik (p ) = 0 para todo k = 1, . . . , mi
e i = 1, . . . , n. De fato: se, por absurdo, α > 0, vemos a partir da
relação acima que
gij (p∗ ) > 0 se, e somente se, p∗ij > 0.
Sem perda de generalidade, suponha que p∗i1 > 0, p∗i2 > 0, . . . , p∗il > 0
e p∗i(l+1) = p∗i(l+2) = · · · = p∗imi = 0. Observe que
mi

p∗i = p∗ik ek ,
k=1
onde ei é o i-ésimo vetor da base canônica de Rmi . Dado que

gik (p∗ ) > 0 para todo k = 1, . . . , l, temos que
ui (ek , p∗−i ) > ui (p∗i , p∗−i ),
para todo k = 1, . . . , l. Desta maneira,
m mi
i
∗ ∗ ∗ ∗
ui (pi , p−i ) = ui pik ek , p−i = p∗ik · ui ek , p∗−i
k=1 k=1
=
l

p∗ik · ui ek , p∗−i
k=1
>
l
l

p∗ik · ui p∗i , p∗−i = ui p∗i , p∗−i · p∗ik = ui p∗i , p∗−i ,
k=1 k=1
∗
um absurdo. Isto demonstra que gij (p ) = 0 para todo j = 1, . . . , mi
e j = 1, . . . , m e, assim, p∗ é um equilı́brio de Nash em estratégias
mistas.
i i
i i
“tdj”
i i
2017/2/2
page 65
i i
[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 65
Teorema 3.5 (do equilı́brio de Nash) Todo jogo definido

por matrizes de payoffs possui um equilı́brio de Nash.
Demonstração: A aplicação F : Δ → Δ definida no teorema anterior

é contı́nua e Δ é um conjunto compacto e convexo. Pelo teorema
do ponto fixo de Brouwer, F possui um ponto fixo p∗ . Pelo teorema
anterior, p∗ é um equilı́brio de Nash.
3.2 Usando o teorema de Kakutani

Seja X um subconjunto de Rn . Dizemos que p∗ ∈ X é um ponto
fixo de uma função φ : X → 2X se p∗ ∈ φ(p∗ ). O teorema do ponto
fixo de Kakutani estabelece condições suficientes para que φ possua
pelo menos um ponto fixo.
Teorema 3.6 (do ponto fixo de Kakutani) Seja X um

subconjunto compacto, convexo e não-vazio de Rn . Se
φ : X → 2X
é semicontı́nua superiormente e φ(x) é não-vazio e convexo para

todo x ∈ X, então φ possui pelo menos um ponto fixo, isto é,
existe p∗ ∈ X tal que
p∗ ∈ φ(p∗ ).
Suponha que exista um subconjunto compacto K de Rn tal que

φ(x) ⊆ K para todo x ∈ X e suponha que φ(x) é um subconjunto
fechado de Rn para todo x ∈ X. Dizemos que φ : X → 2X é contı́nua
superiormente se, e somente se, y0 ∈ φ(x0 ) sempre que (a) x0 ∈ X,
(b) xk ∈ X para k = 1, 2, . . ., (c) limk→+∞ xk = x0 , (d) yk ∈ φ(xk )
e (e) limk→+∞ yk = y0 . Neste contexto, φ é contı́nua superiormente
se, e somente se, o gráfico de φ,
Gr(φ) = {(x, y) ∈ X × X | y ∈ φ(x)},
i i
i i
“tdj”
i i
2017/2/2
page 66
i i
é um subconjunto fechado de X × X. Por exemplo, se X = [0, 1],

então
{1/2}, se 0 ≤ x < 1/2,
φ(x) =
[1/4, 3/4], se 1/2 ≤ x ≤ 1,
é semicontı́nua superiormente (Figura 3.1), enquanto que

{1/2}, se 0 ≤ x ≤ 1/2,
ϕ(x) =
[1/4, 3/4], se 1/2 < x ≤ 1,
não o é (Figura 3.2).
3/4
1/2
1/4
0 1/2 1 x
Figura 3.1: Gráfico de uma função que é semicontı́nua superiormente.
Usaremos o teorema do ponto fixo de Kakutani para mostrar que

a função de melhor resposta MR : Δ → 2Δ definida por
MR(p) = (MR1 (p−1 ), MR2 (p−2 ), . . . , MRn (p−n )),
com p ∈ Δ e MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ), possui um

ponto fixo p∗ que, em virtude da Proposição 2.4, será um equilı́brio
de Nash.
i i
i i
“tdj”
i i
2017/2/2
page 67
i i
[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 67
3/4
1/2
1/4
0 1/2 1 x
Figura 3.2: Gráfico de uma função que não é semicontı́nua superior-

mente.
Teorema 3.7 (do equilı́brio de Nash) Todo jogo definido

por matrizes de payoffs possui um equilı́brio de Nash.
Demonstração: Basta verificarmos que a função de melhor resposta

satisfaz as hipóteses do teorema do ponto fixo de Kakutani.
(1) O conjunto X = Δ = Δ(S1 ) × · · · × Δ(Sn ) é não-vazio, com-
pacto (como produto cartesiano de conjuntos compactos) e con-
vexo (como produto cartesiano de conjuntos convexos).
(2) Para todo p ∈ Δ, o conjunto MR(p) está contido no compacto
K = Δ.
(3) Para todo p ∈ Δ, o conjunto MR(p) é convexo. De fato: supo-
nha, por absurdo, MR(p) não seja um conjunto convexo. Então
existem q(•) , q(◦) ∈ MR(p) e λ ∈ (0, 1) tais que
(1 − λ) · q(•) + λ · q(◦) ∈ MR(p).
i i
i i
“tdj”
i i
2017/2/2
page 68
i i
Mas, para todo ı́ndice i, vale que
ui ((1 − λ) · q(•)
i + λ · qi , p−i ) =
(◦)
(1 − λ) · ui (q(•)
i , p−i ) + λ · ui (qi , p−i ).
(◦)
Agora,
ui (q(•) (◦)
i , p−i ) = ui (qi , p−i ) = constante = max ui (pi , p−i ).
pi ∈Δ(Si )
Conseqüentemente, ui ((1 − λ) · q(•)

i + λ · qi , p−i ) = constante,
(◦)
isto é, (1 − λ) · qi + λ · qi ∈ MRi (p−i ), para todo i = 1, . . . , n,

(•) (◦)
o que é uma contradição.

(4) Para todo p ∈ Δ, o conjunto MR(p) é fechado. Para ver isto,
basta mostrar que MRi (p−i ) = argmaxpi ∈Δ(Si ) ui (pi , p−i ) é fe-
chado. Seja então p(k) i uma sequência de pontos em MRi (p−i ) que
converge para p(0) i . Desta maneira, ui (p(k)
i , p−i ) = constante =
maxpi ∈Δ(Si ) ui (pi , p−i ) e, como x → ui (x, p−i ) é uma função
contı́nua, concluı́mos que
ui (p(0)
i , p−i ) = constante = max ui (pi , p−i ).
pi ∈Δ(Si )
Sendo assim, p(0)

i ∈ MRi (p−i ).
(5) MR : Δ → 2Δ é semicontı́nua superiormente. Com efeito, mos-

traremos que se (a) p(0) ∈ Δ, (b) p(k) é uma sequência de pontos
em Δ, (c) limk→+∞ p(k) = p(0) , (d) q(k) ∈ MR(p(k) ) e (e) q(k)
converge para q(0) , então q(0) ∈ MR(p(0) ). Se, por absurdo,
q(0) ∈ MR(p(0) ), então existe ı́ndice i tal que q(0)
i ∈ MR(p(0)
−i ).
Portanto, existem > 0 e qi ∈ Δ(Si ) tais que
(•)
i , p−i ) > ui (qi , p−i ) + 3 · .

ui (q(•) (0) (0) (0)
Mas, desde que ui é uma função contı́nua e (q(k) (k)

i , p−i ) converge
(0) (0)
para (qi , p−i ), então para todo k suficientemente grande,
i , p−i ) > ui (qi , p−i ) − >

ui (q(•) (k) (•) (0)
i , p−i ) + 2 · > ui (qi , p−i ) + .

ui (q(0) (0) (k) (k)
i i
i i
“tdj”
i i
2017/2/2
page 69
i i
[SEC. 3.3: ALGUMAS PROPRIEDADES DOS EQUILÍBRIOS DE NASH 69
i ∈ MRi (p−i ), pois ui (qi , p−i ) > ui (qi , p−i ),

Sendo assim, q(k) (k) (•) (k) (k) (k)
o que contradiz (d).
Shizuo Kakutani demonstrou o seu teorema no artigo [45]. Debreu

lista mais de 300 aplicações do teorema do ponto fixo de Kakutani
ao provar a existência de um equilı́brio econômico em [24].
3.3 Algumas propriedades dos equilı́brios

de Nash
Wilson ([97]) mostrou que, a menos de um conjunto fechado e
de medida zero, todo jogo finito possui um número finito e ı́mpar
de equilı́brios de Nash em estratégias mistas. Pelo menos para jogos
com dois jogadores, cada um com duas estratégias, este resultado
pode ser antecipado através da análise das funções de melhor resposta
que fizemos na Subseção 2.4.2 (veja, por exemplo, a Figura 2.5 na
página 42). Harsanyi, em [40], apresentou uma prova alternativa para
este resultado. Também tratam do assunto as referências [35, 36, 59].
Por outro lado, os casos degenerados podem ter topologias diver-
sificadas. De fato, Datta provou que toda variedade algébrica real
(soluções reais de um sistema de equações polinomiais) é isomorfa
ao conjunto de equilı́brios de Nash em estratégias totalmente mistas
de algum jogo com 3 jogadores e, também, de algum jogo com n
jogadores, cada um com apenas 2 estratégias puras ([20]). Um per-
fil de estratégias totalmente mistas é um perfil que dá probabilidade
positiva a cada estratégia pura.
Existem jogos cujos payoffs são todos números racionais, mas to-
dos os equilı́brios de Nash em estratégias mistas possuem coordenadas
irracionais ([69]). Contudo, Markakis mostrou que, neste contexto,
existe sempre pelo menos um equilı́brio de Nash em estratégias mistas
com coordenadas algébricas ([51, 54]).
Torres-Martı́nez ([91]) e Zhao ([99]) demonstram que é possı́vel
deduzir os teoremas de ponto fixo de Brouwer e Kakutani a partir de
um teorema de existência de equilı́brios de Nash.
i i
i i
“tdj”
i i
2017/2/2
page 70
i i
3.4 Exercı́cios
[01] O objetivo deste exercı́cio é mostrar que as hipóteses do teorema
do ponto fixo de Brouwer não podem ser removidas.
(a) Exiba uma função F : Δ → Δ descontı́nua, definida em um
subconjunto Δ compacto, convexo e não-vazio de Rn , que
não possui ponto fixo.
(b) Exiba uma função F : Δ → Δ contı́nua, definida em um
subconjunto Δ não-compacto, convexo e não-vazio de Rn ,
que não possui ponto fixo.
(c) Exiba uma função F : Δ → Δ contı́nua, definida em um
subconjunto Δ compacto, não-convexo e não-vazio de Rn ,
que não possui ponto fixo.
[02] Exiba um exemplo de função φ : X → 2X definida em um
subconjunto X compacto, convexo e não-vazio de Rn , que é
semicontı́nua superiormente, mas não possui ponto fixo. Isto
mostra que a hipótese de φ(x) ser um conjunto convexo para
todo x ∈ X não pode ser removida do enunciado do teorema
do ponto fixo de Kakutani.
[03] Dê um exemplo de jogo com um número par de equilı́brios de
Nash em estratégias mistas.
i i
i i
“tdj”
i i
2017/2/2
page 71
i i
Capı́tulo 4
Calculando equilı́brios
de Nash
4.1 Equilı́brio de Nash via um problema

de otimização
O Teorema 3.3 sugere uma maneira de se calcular os equilı́brios
de Nash de um jogo. Eles são soluções do seguinte problema de
otimização não-linear:
mi
n
2
minimizar (gij (p))
i=1 j=1
sujeito a p ∈ Δ.
Com efeito: a soma de quadrados é zero se, e somente se, cada parcela
é igual a zero. McKelvey demonstrou em [58] que a função objetivo
mi
n
2
p → (gij (p))
i=1 j=1
é uma função de classe C 1 . Assim, algoritmos numéricos de oti-

mização que usam derivadas (Newton, Davidon-Fletcher-Powell) po-
dem ser usados.
71
i i
i i
“tdj”
i i
2017/2/2
page 72
i i
72 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH
Exemplo 4.1 Para o dilema do prisioneiro (Exemplo 2.1, página 11),

(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2
é um equilı́brio de Nash se, e somente se, (p, q) é solução do seguinte
problema de otimização
minimizar G(p, q) = (max {0, − (−1 + p) (4 q + 1)})2 +

(max {0, −p (4 q + 1)})2 +
2
(max {0, − (4 p + 1) (−1 + q)}) +
2
(max {0, −q (4 p + 1)})
sujeito a 0 ≤ p ≤ 1,
0 ≤ q ≤ 1.
Como vemos pela Figura 4.1, que mostra o gráfico e o mapa de con-
torno de G, o ponto
(p∗ , q∗ ) = (1, 0; 1, 0)
Exemplo 4.2 Para a batalha dos sexos (Exemplo 2.2, página 13),
(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2
minimizar G(p, q) = (max {0, −5 (−1 + p) (3 q − 1)})2 +

2
(max {0, −5 p (3 q − 1)}) +
2
(max {0, −5 (3 p − 2) (−1 + q))) +
2
(max {0, −5 q (3 p − 2)})
0 ≤ q ≤ 1.
torno de G, os pontos
(p∗ , q∗ ) = (1, 0; 1, 0), (p∗ , q∗ ) = (0, 1; 0, 1) e
∗ ∗
(p , q ) = (2/3, 1/3; 1/3, 2/3)
i i
i i
“tdj”
i i
2017/2/2
page 73
i i
[SEC. 4.1: EQUILÍBRIO DE NASH VIA UM PROBLEMA DE OTIMIZAÇÃO 73
são os únicos equilı́brios de Nash do jogo.
Exemplo 4.3 Para o jogo do Exemplo 2.6 da página 22,
(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2

2
minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)}) +
2
(max {0, −2 p (2 q − 1)}) +
2
(max {0, 2 (2 p − 1) (−1 + q)}) +
2
(max {0, 2 (2 p − 1) q})
0 ≤ q ≤ 1.
torno de G, o ponto
(p∗ , q∗ ) = (1/2, 1/2; 1/2, 1/2)
Exemplo 4.4 Para o jogo do exemplo 2.12 da página 42,
(p, q) = (p, 1 − p; q, 1 − q) ∈ Δ2 × Δ2

minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)})2 +

2
(max {0, −2 p (2 q − 1)}) +
2
(max {0, (−3 + 4 p) (−1 + q)}) +
2
(max {0, q (−3 + 4 p)})
0 ≤ q ≤ 1.
i i
i i
“tdj”
i i
2017/2/2
page 74
i i
torno de G, o ponto
(p∗ , q∗ ) = (3/4, 1/4; 1/2, 1/2)
4.2 Equilı́brio de Nash via equações poli-

nomiais
A próxima proposição estabelece que a maior utilidade esperada
que o jogador gi pode obter contra qualquer escolha de estratégias
mistas dos demais jogadores não depende se o jogador gi está usando
estratégias mistas ou somente estratégias puras. Mais ainda, as es-
tratégias mistas ótimas para o jogador gi são justamente aquelas que
atribuem probabilidade positiva somente para as estratégias puras
ótimas.
Proposição 4.1 Para todo i = 1, . . . , n e para todo p =

(p1 , . . . , pi , . . . , pn ) ∈ Δ = Δ(S1 ) × · · · × Δ(Si ) × · · · Δ(Sn ),
max ui (siji , p−i ) = pi , p−i ).

max ui (
siji ∈Si
pi ∈Δ(Si )
Mais ainda,
p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ) ∈ argmaxpi ∈Δ(Si ) ui (

pi , p−i )

p∗ik = 0 para todo k tal que sik ∈ argmaxsiji ∈Si ui (siji , p−i ).
Demonstração: Pela Propriedade 2.4, sabemos que

mi

pi , p−i ) =
ui ( piji · ui (siji , p−i ).
ji =1
i i
i i
“tdj”
i i
2017/2/2
page 75
i i
[SEC. 4.2: EQUILÍBRIO DE NASH VIA EQUAÇÕES POLINOMIAIS 75
25
20
15
10
5 1
0.5 q
0
0 0.2 0.4 0.6 0
0.8 1
p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
Figura 4.1: Encontrando os equilı́brios de Nash para o dilema do pri-

sioneiro via um problema de otimização.
i i
i i
“tdj”
i i
2017/2/2
page 76
i i
2.5
1.5
1
0.5 0.8
0.6
0.4 q
0 0.2
0 0.2 0.4 0.6 0
0.8 1
p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
Figura 4.2: Encontrando os equilı́brios de Nash para a batalha dos

sexos via um problema de otimização.
i i
i i
“tdj”
i i
2017/2/2
page 77
i i
0.8
0.6
q
0.4
0.2
0.8 1
0 0.4 0.6
0 0.2 p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
Figura 4.3: Encontrando os equilı́brios de Nash do jogo de comparar

moedas via um problema de otimização.
i i
i i
“tdj”
i i
2017/2/2
page 78
i i
0.8
0.6
q
0.4
0.2
0.8 1
0 0.4 0.6
0 0.2 p
p
0 0.2 0.4 0.6 0.8 1
1
0.8
0.6
0.4
0.2
Figura 4.4: Encontrando os equilı́brios de Nash do jogo do Exem-

plo 2.12 via um problema de otimização.
i i
i i
“tdj”
i i
2017/2/2
page 79
i i
pi , p−i ) é a média ponderada dos valores ui (siji , p−i ), onde

Assim, ui (
os pesos piji são não-negativos e somam 1. Esta média ponderada
não pode ser maior do que o maior dos valores que participam no
cálculo da média. Assim,
pi , p−i ) ≤ max ui (siji , p−i )
ui (
siji ∈Si
i ∈ Δ(Si ) e, portanto,
para todo p
pi , p−i ) ≤ max ui (siji , p−i ).
max ui (

pi ∈Δ(Si ) siji ∈Si
Por outro lado, ui (siji , p−i ) = ui (eji , p−i ), onde eji é a distribuição
de probabilidades em Δ(Si ) que dá peso 1 à estratégia pura siji .
Assim,
ui (siji , p−i ) = ui (eji , p−i ) ≤ pi , p−i )
max ui (

pi ∈Δ(Si )
para todo siji ∈ Si e, portanto,

max ui (siji , p−i ) ≤ pi , p−i ).
max ui (
siji ∈Si
pi ∈Δ(Si )
Para a segunda parte da proposição, suponha por absurdo que exista

p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ) ∈ argmaxpi ∈Δ(Si ) ui (
pi , p−i )
onde, para algum ı́ndice k, ocorre que
p∗ik > 0 e sik ∈ argmaxsiji ∈Si ui (siji , p−i ).
Isto implica que ui (sik , p−i ) < maxsiji ∈Si ui (siji , p−i ). Uma vez que
ui (siji , p−i ) ≤ maxsiji ∈Si ui (siji , p−i ) para todo ji = k, segue-se que
mi

ui (p∗i , p−i ) = p∗iji · ui (siji , p−i )
ji =1
mi
< p∗iji · max ui (siji , p−i ) = max ui (siji , p−i )
siji ∈Si siji ∈Si
ji =1
= pi , p−i ).
max ui (

pi ∈Δ(Si )
i i
i i
“tdj”
i i
2017/2/2
page 80
i i
Masisto contradiz o fato de p∗i pertencer a argmaxpi ∈Δ(Si ) ui (

pi , p−i ).
Reciprocamente, se p∗i satisfaz a condição p∗ik = 0 para todo k tal que
sik ∈ argmaxsij ∈Si ui (siji , p−i ), então
i
ui (sik , p−i ) = max ui (siji , p−i )

siji ∈Si
sempre que p∗ik > 0. Assim

mi

ui (p∗i , p−i ) = p∗ik · ui (sik , p−i ) = p∗ik · ui (sik , p−i )
k=1 p∗
ik >0

= p∗ik · max ui (siji , p−i ) = max ui (siji , p−i )
siji ∈Si siji ∈Si
p∗
ik >0
= pi , p−i ).
max ui (

pi ∈Δ(Si )
Isto mostra que p∗i pertence a a argmaxpi ∈Δ(Si ) ui (

pi , p−i ).
Corolário 4.1 p∗ = (p∗1 , . . . , p∗i , . . . , p∗n ) ∈ Δ é um equilı́brio

de Nash em estratégias mistas se, e somente se, para todo i =
1, . . . , n,
p∗ik > 0 ⇒ sik ∈ argmaxsiji ∈Si ui (siji , p∗−i ),
onde p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ).
O suporte de um perfil p∗i = (p∗i1 , . . . , p∗ik , . . . , p∗imi ) de estratégias

mistas é o conjunto de estratégias puras do jogador gi que recebe
probabilidade positiva por p∗i . Mais precisamente,
supp(p∗i ) = {sik ∈ Si | p∗ik > 0}.
Assim, o Corolário 4.1 diz que p∗ = (p∗1 , . . . , p∗i , . . . , p∗n ) é um equilı́-

brio de Nash se, e somente se, para todo i = 1, . . . , n,
supp(p∗i ) ⊆ argmaxsiji ∈Si ui (siji , p∗−i ).
i i
i i
“tdj”
i i
2017/2/2
page 81
i i
A Proposição 4.1 pode ser usada para calcular equilı́brios de Nash

em estratégias mistas. O ponto chave é observar que, pela Pro-
posição 4.1, se p∗ ∈ Δ é um equilı́brio de Nash em estratégias mistas,
então, para todo i = 1, . . . , n,
ui (sik , p∗−i ) = constante = max ui (siji , p∗−i ) (4.1)

siji ∈Si
sempre que p∗ik > 0, isto é, em um equilı́brio de Nash, o jogador gi

tem o mesmo ganho se trocar sua estratégia p∗i por qualquer outra
estratégia pura que recebeu probabilidade positiva de p∗i .
Exemplo 4.5 No Exemplo 2.11, vimos que as funções utilidade dois

jogadores da batalha dos sexos são dadas por
uHomem (p11 , p12 ; p21 , p22 ) = 10 · p11 · p21 + 5 · p12 · p22 ,

uMulher(p11 , p12 ; p21 , p22 ) = 5 · p11 · p21 + 10 · p12 · p22 .
Vamos usar as relações 4.1 para calcular o equilı́brio de Nash em

estratégias mistas que não é um equilı́brio em estratégias puras,
isto é, o equilı́brio de Nash cujas estratégias mistas tem suporte
nas duas estratégias puras de cada jogador. Para isto, considere
p∗ = (p∗11 , p∗12 ; p∗21 , p∗22 ) ∈ Δ2 × Δ2 , com 0 < p∗11 , p∗12 , p∗21 , p∗22 < 1.
Pelas relações 4.1, se p∗ é um equilı́brio de Nash, então
uHomem ( 1 , 0 ; p∗21 , p∗22 ) = uHomem( 0 , 1 ; p∗21 , p∗22 ),

uMulher(p∗11 , p∗12 ; 1 , 0 ) = uMulher(p∗11 , p∗12 ; 0 , 1 ),
isto é,
10 · p∗21 = 5 · p∗22 e 5p∗11 = 10 · p∗12 .
Como p∗21 + p∗22 = 1 e p∗11 + p∗12 = 1, obtemos então um sistema linear
com 4 equações e 4 incógnitas. A solução deste sistema dá o equilı́brio
de Nash
(p∗11 , p∗12 ; p∗21 , p∗22 ) = (2/3, 1/3; 1/3, 2/3).
A técnica descrita no exemplo acima pode ser usada para o cálculo

dos equilı́brios de Nash que não são estratégias puras para jogos com
i i
i i
“tdj”
i i
2017/2/2
page 82
i i
mais do que dois jogadores e com mais do que duas estratégias puras
por jogador. Neste caso, é preciso (1) considerar os vários casos que
resultam das diferentes escolhas das estratégias puras que farão parte
do suporte de cada perfil em estratégias mistas e (2) resolver o sistema
não-linear resultante. Mais precisamente, para cada jogador gi e para
cada subconjunto não-vazio Ti = {sik1 , . . . , sikti } de Si (que especifica
quais estratégias puras farão parte do suporte), devemos resolver o
sistema descrito na Figura 4.5 (neste sistema, wi representa o ganho
constante que o jogador gi obtém escolhendo qualquer uma de suas
estratégias puras que recebeu probabilidade positiva de p∗i ).
Para jogos com muitos jogadores e muitas estratégias, o sistema
da Figura 4.5 não é prático para o cálculo a mão dos equilı́brios de
Nash. Contudo, métodos numéricos para a solução de um sistema
de equações polinomiais podem ser aplicados: o método de Newton
com uma estratégia de subdivisão espacial, bases de Gröbner e conti-
nuação homotópica poliedral. O leitor interessado pode consultar as
referências [21, 22, 51]
4.3 Jogos de soma zero

Nesta seção estudaremos os jogos de soma zero com dois jogado-
res, uma classe especial de jogos onde a soma dos payoffs dos dois
jogadores é sempre zero: o que um jogador ganha, o outro perde1 .
Veremos que, para este tipo de jogo, os equilı́brios de Nash em es-
tratégias mistas podem ser facilmente calculados resolvendo-se um
problema de otimização linear.
4.3.1 Jogos de soma constante com dois jogadores
Definição 4.1 (Jogos de soma constante com dois jo-

gadores) Um jogo de soma constante com dois jogadores é um
jogo com dois jogadores, comumente denominados jogador linha
e jogador coluna, com estratégias
1 Por este motivo, jogos de soma zero também são denominados jogos estrita-
mente competitivos.
i i
i i
i
i
i
i
m1 mi−1 mi+1 mn

··· ··· p∗1j1 · · · p∗(i−1)ji−1 · p∗(i+1)ji+1 · · · p∗njn · ui (s1j1 , . . . , sij−i , sikτ , siji+1 , snjn ) = wi ,
j1 =1 ji−1 =1 ji+1 =1 jn =1
[SEC. 4.3: JOGOS DE SOMA ZERO
∀i = 1, . . . , n, ∀sikτ ∈ Ti ,
p∗ikτ = 0, ∀i = 1, . . . , n, ∀τ = 1, . . . , ti ,
ti

p∗ikτ = 1, ∀i = 1, . . . , n.
τ =1
Figura 4.5: Calculando equilı́brios de Nash através de um sistema não-linear.

83
i
i
“tdj”
i
i
page 83
2017/2/2
“tdj”
i i
2017/2/2
page 84
i i
Sjogador linha = {1, 2, . . . , m}

e
Sjogador coluna = {1, 2, . . . , n}
e matriz de payoffs
jogador coluna
1 2 ··· n
1 (a11 , b11 ) (a12 , b12 ) ··· (a1n , b1n )
jogador linha
2 (a21 , b21 ) (a22 , b22 ) ··· (a2n , b2n )

.. .. .. .. ..
. . . . .
m (am1 , bm1 ) (am2 , bm2 ) ··· (amn , bmn )
satisfazendo aij + bij = c = constante, para todo i = 1, . . . , m

e j = 1, . . . , n. No caso particular em que a constante c é zero,
dizemos que o jogo tem soma zero.
Em termos de estratégias mistas, se p = (p1 , . . . , pm ) ∈ Δm é uma

distribuição de probabilidades para as estratégias puras do jogador
linha e q = (q1 , . . . , qn ) ∈ Δn é uma distribuição de probabilidades
para as estratégias puras do jogador coluna, então o payoff esperado
para o jogador linha é
m
n
ul (p, q) = pi qj aij
i=1 j=1 ⎡ ⎤⎡ ⎤
a11 a12 ··· a1n q1
⎢ a21 a22 ··· a2n ⎥⎢ q2 ⎥
⎢ ⎥⎢ ⎥
= p1 p2 · · · pm ⎢ .. .. .. .. ⎥⎢ .. ⎥,
⎣ . . . . ⎦⎣ . ⎦
am1 am2 · · · amn qn
i i
i i
“tdj”
i i
2017/2/2
page 85
i i
[SEC. 4.3: JOGOS DE SOMA ZERO 85
isto é,
⎡ ⎤
a11 a12 ··· a1n
⎢ a21 a22 ··· a2n ⎥
⎢ ⎥
ul (p, q) = pT Aq, com A = ⎢ .. .. .. .. ⎥.
⎣ . . . . ⎦
am1 am2 · · · amn
Analogamente, o payoff esperado para o jogador coluna é dado por

⎡ ⎤
b11 b12 · · · b1n
⎢ b21 b22 · · · b2n ⎥
⎢ ⎥
uc (p, q) = pT Bq, com B = ⎢ . .. .. .. ⎥ .
⎣ .. . . . ⎦
bm1 bm2 · · · bmn
Uma vez que o jogo tem soma constante, vemos que

⎡ ⎤ ⎡ ⎤
a11 a12 · · · a1n b11 b12 ··· b1n
⎢ a21 a22 · · · a2n ⎥ ⎢ b21 b22 ··· b2n ⎥
⎢ ⎥ ⎢ ⎥
A+B = ⎢ . .. .. .. ⎥ + ⎢ .. .. .. .. ⎥
⎣ .. . . . ⎦ ⎣ . . . . ⎦
am1 am2 · · · amn bm1 bm2 · · · bmn
⎡ ⎤
c c ··· c
⎢ c c ··· c ⎥
⎢ ⎥
= ⎢ . . .
. . ... ⎥
,
⎣ .. .. ⎦
c c ··· c
isto é,
⎡ ⎤ ⎡ ⎤
c c ··· c 1 1 ··· 1
⎢ c c ··· c ⎥ ⎢ 1 1 ··· 1 ⎥
⎢ ⎥ ⎢ ⎥
A+B = C = ⎢ .. .. .. .. ⎥ = c ⎢ .. .. .. .. ⎥ = c 1 ,
⎣ . . . . ⎦ ⎣ . . . . ⎦
c c ··· c 1 1 ··· 1
onde 1 denota a matriz m × n formada com 1 em todas as suas

entradas. Sendo assim, é fácil de ver que
uc (p, q) = pT Bq = pT (c 1 − A)q = cpT 1 q − pT Aq = c − ul (p, q)
i i
i i
“tdj”
i i
2017/2/2
page 86
i i
onde, na última igualdade, usamos que pT 1 q = 1, pois p e q são

distribuições de probabilidades e, por isto,
m
n

pi = 1 e qj = 1.
i=1 j=1
Em particular, vale a seguinte propriedade importante:

ul (p∗ , q∗ ) ≥ ul (p, q∗ ) ⇔ uc (p∗ , q∗ ) ≤ uc (p, q∗ ). (4.2)
4.3.2 Equilı́brio de Nash em estratégias puras
Definição 4.2 (Ponto de sela) Dizemos que um elemento

aij de uma matriz A é um ponto de sela da matriz A se ele for
simultaneamente um mı́nimo em sua linha e um máximo em sua
coluna, isto é, se
aij ≤ ail para todo l = 1, . . . , n e

aij ≥ akj para todo k = 1, . . . , m.
O termo ponto de sela vem do fato que se desenharmos o gráfico

dos payoffs do jogador linha, a vizinhança do ponto de sela lembra o
formato de uma sela de cavalo (Figura 4.6).
Teorema 4.1 O elemento aij é um ponto de sela da matriz A

se, e somente se, o par (i, j) é um equilı́brio de Nash em es-
tratégias puras para o jogo.
Demonstração:
(⇒) Seja aij um ponto de sela da matriz A. Como aij é máximo
em sua coluna, vale que
ul (i, j) = aij ≥ akj = ul (k, j)
i i
i i
“tdj”
i i
2017/2/2
page 87
i i
payoff
has
Colunas Lin
Figura 4.6: Ponto de sela.
para todo k = 1, . . . , m, isto é, o jogador linha não pode aumentar o

seu payoff se o jogador coluna mantiver a escolha da coluna j. Por
outro lado, como aij é mı́nimo em sua linha, vale que
uc (i, j) = bij = c − aij ≥ c − ail = bil = uc (i, l)
para todo l = 1, . . . , n, isto é, o jogador coluna não pode aumentar

o seu payoff se o jogador linha mantiver a escolha da linha i. Isto
mostra que o perfil de estratégias puras (i, j) é um equilı́brio de Nash
do jogo.
(⇐) Seja (i, j) é um equilı́brio de Nash do jogo. A partir das
considerações acima, é fácil de ver que aij é máximo em sua coluna
e mı́nimo em sua linha e que, portanto, aij é um ponto de sela da
matriz A.
i i
i i
“tdj”
i i
2017/2/2
page 88
i i
Teorema 4.2 Se aij e ars são dois pontos de sela da matriz A,

então ais e arj também são pontos de sela da matriz A e
aij = ars = ais = arj .
Demonstração: Considere a matriz

⎡ ⎤
.. ..
⎢ . . ⎥
⎢ · · · aij · · · ais ··· ⎥
⎢ ⎥
⎢ .. .. .. ⎥
A=⎢ . . . ⎥.
⎢ ⎥
⎢ · · · arj · · · ars ··· ⎥
⎣ ⎦
.. ..
. .
Como aij e ars são pontos de sela, sabemos que eles são mı́nimos
em suas respectivas linhas e máximos em suas respectivas colunas.
Assim,
aij ≤ ais ≤ ars e aij ≥ arj ≥ ars ,
e, portanto,
aij = ais = arj = ars .
Observe que ais é mı́nimo em sua linha, pois aij = ais é mı́nimo
da mesma linha e que ais é máximo em sua coluna, pois ars = ais
é máximo da mesma coluna. Analogamente, arj é mı́nimo em sua
linha, pois ars = arj é mı́nimo da mesma linha e arj é máximo em
sua coluna, pois arj = aij é máximo da mesma coluna. Concluı́mos
então que ais e arj também são pontos de sela da matriz A.
O payoff mı́nimo do jogador linha, se ele escolher a linha k, é dado

por
ak = min akl .
1≤l≤n
Analogamente, o payoff mı́nimo do jogador coluna, se ele escolher a

coluna l, é dado por c − al , onde
al = max akl .
1≤k≤m
i i
i i
“tdj”
i i
2017/2/2
page 89
i i
Defina
vl (A) = max ak = max min akl
1≤k≤m 1≤k≤m 1≤l≤n
e
vc (A) = min al = min max akl .
1≤l≤n 1≤l≤n 1≤k≤m
Teorema 4.3 Para toda matriz A, tem-se vc (A) ≥ vl (A).
Demonstração: Temos que para todo k = 1, . . . , m e j = 1, . . . , n,

akj ≥ min akl .
1≤l≤n
Assim,
max akj ≥ max min akl = vl (A),
1≤k≤m 1≤k≤m 1≤l≤n
para todo j = 1, . . . , n. Conseqüentemente,
vc (A) = min max akj ≥ max min akl = vl (A).

1≤j≤n 1≤k≤m 1≤k≤m 1≤l≤n
O próximo teorema caracteriza a existência de pontos de sela e,

portanto, a existência de equilı́brios de Nash em estratégias puras,
em termos das funções vl e vc .
Teorema 4.4 Uma matriz A tem um ponto de sela se, e so-

mente se, vl (A) = vc (A).
Demonstração:
(⇒) Se aij é um ponto de sela da matriz A, então vale que
aij = min1≤l≤n ail = ai . Como vl (A) = max1≤k≤m ak , é claro que
vl (A) ≥ ai = aij . Por outro lado, aij = max1≤k≤m akj = aj . Como
vc (A) = min1≤l≤n al , segue-se que vc (A) ≤ aj = aij . Combinando
estas duas desigualdades, concluı́mos que vc (A) ≤ aij ≤ vl (A). Mas,
pelo teorema anterior, vc (A) ≥ vl (A) e, sendo assim, vc (A) = vl (A).
(⇐) Como vl (A) = max1≤r≤m ar , existe uma linha i tal que
vl (A) = ai . Como, por sua vez, ai = min1≤s≤n ais , existe uma co-
luna l tal que ai = ail . Assim, vl (A) = ai = ail . Analogamente, como
i i
i i
“tdj”
i i
2017/2/2
page 90
i i
vc (A) = min1≤s≤n as , existe uma coluna j tal que vc (A) = aj . Como,

por sua vez, aj = max1≤r≤m arj , existe uma linha k tal que aj = akj .
Assim, vc (A) = aj = akj . Uma vez que, por hipótese, vl (A) = vc (A),
temos que
ail = ai = vl (A) = vc (A) = aj = akj .
Afirmamos que aij é um ponto de sela da matriz A. Com efeito, aij ≤
aj = ai ≤ ais , para todo s = 1, . . . , n, isto é, aij é o mı́nimo de sua
linha. Por outro lado, aij ≥ ai = aj ≥ arj , para todo r = 1, . . . , m,
isto é, aij é o máximo de sua coluna. Portanto, aij é um ponto de
sela da matriz A.
Corolário 4.2 Um jogo de dois jogadores com soma constante

definido pela matriz de payoffs A do jogador linha tem um
equilı́brio de Nash em estratégias puras se, e somente se,
vl (A) = vc (A).
Exemplo 4.6 Considere o jogo de soma zero cujos payoffs do jogador

linha são dados pela matriz A abaixo.
mı́nimo das linhas

⎡ ⎤
3 1 1 0 0
⎢0 0⎥
⎢ 1 2 ⎥ 0
A =⎢ ⎥
⎣1 0 2 1⎦ 0
3 1 2 2 1
máximo das colunas 3 1 2 2
Como vl (A) = máximo dos mı́nimos das linhas = 1 = vc (A) = mı́nimo

dos máximos das colunas, segue-se que o jogo possui um equilı́brio
de Nash em estratégias puras. De fato, a42 é um ponto de sela da
matriz A.
i i
i i
“tdj”
i i
2017/2/2
page 91
i i
Exemplo 4.7 Considere o jogo de soma zero cujos payoffs do jogador

linha são dados pela matriz A abaixo.
mı́nimo das linhas

⎡ ⎤
3 2 1 0 0
⎢0 0⎥
⎢ 1 2 ⎥ 0
A =⎢ ⎥
⎣1 0 2 1⎦ 0
3 1 2 2 1
máximo das colunas 3 2 2 2
Como vl (A) = máximo dos mı́nimos das linhas = 1 < 2 = vc (A) =

mı́nimo dos máximos das colunas, segue-se que o jogo não possui um
equilı́brio de Nash em estratégias puras.
4.3.3 Equilı́brio de Nash em estratégias mistas

Defina
vl (A) = max min pT Aq e vc (A) = min max pT Aq.
p∈Δm q∈Δn q∈Δn p∈Δm
Teorema 4.5 Para toda matriz A, tem-se vc (A) ≥ vl (A).
Demonstração: Temos que para todo p ∈ Δm ,

pT Aq ≥ min pT Ay.
y∈Δn
Assim,
max pT Aq ≥ max min pT Ay = vl (A).
p∈Δm p∈Δm y∈Δn
Conseqüentemente,
vc (A) = min max pT Aq ≥ max min pT Ay = vl (A).
q∈Δn p∈Δm p∈Δm y∈Δn
O próximo teorema caracteriza a existência de equilı́brios de Nash

em estratégias mistas em termos das funções vl e vc .
i i
i i
“tdj”
i i
2017/2/2
page 92
i i
Teorema 4.6 Um perfil de estratégias mistas (p∗ , q∗ ) é um

equilı́brio de Nash de um jogo de dois jogadores com soma cons-
tante definido pela matriz de payoffs A do jogador linha se, e
somente se,
vl (A) = vc (A) = p∗T Aq∗ .
Demonstração:
(⇒) Se (p∗ , q∗ ) é um equilı́brio de Nash, então
p∗T Aq∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ ) = pT Aq∗ ,
para todo p ∈ Δm . Em particular,
p∗T Aq∗ = max pT Aq∗ ≥ min max pT Ay = vc (A).

p∈Δm y∈Δn p∈Δm
Vale também que
p∗T Aq∗ = c − uc (p∗ , q∗ ) ≤ c − uc (p∗ , q) = p∗T Aq,
para todo q ∈ Δn . Em particular,
p∗T Aq∗ = min p∗T Aq ≤ max min xT Aq = vl (A).

q∈Δn x∈Δm q∈Δn
Desta maneira, vl (A) ≥ vc (A). Como, pelo teorema anterior, vl (A) ≤

vc (A), concluı́mos que vl (A) = vc (A).
(⇐) Como vl (A) = maxp∈Δm minq∈Δn pT Aq, existe p∗ ∈ Δm tal
que
vl (A) = min p∗T Aq.
q∈Δn
Analogamente, como vc (A) = minq∈Δn maxp∈Δm pT Aq, existe q∗ ∈

Δm tal
vc (A) = max pT Aq∗ .
p∈Δm
Uma vez que, por hipótese, vl (A) = vc (A), temos que
min p∗T Aq = vl (A) = vc (A) = max pT Aq∗ .

q∈Δn p∈Δm
i i
i i
“tdj”
i i
2017/2/2
page 93
i i
Afirmamos que (p∗ , q∗ ) é um equilı́brio de Nash do jogo. Com efeito,
ul (p∗ , q∗ ) = p∗T Aq∗ ≥ min p∗T Aq =

q∈Δn
max pT Aq∗ ≥ xT Aq∗ = ul (x, q∗ ),

p∈Δm
para todo x ∈ Δm . Por outro lado,
uc (p∗ , q∗ ) = c − p∗T Aq∗ ≥ c − max pT Aq∗ =

p∈Δm
c − min p∗T Aq ≥ c − p∗T Ay = uc (p∗ , y),

q∈Δn
para todo y ∈ Δn . Desta maneira, (p∗ , q∗ ) é um equilı́brio de Nash

do jogo.
4.3.4 O teorema minimax de von Neumann

O próximo teorema estabelece que, para jogos de dois jogadores
com soma zero, vl (A) = vc (A) sempre. Sendo assim, pelo teorema 4.6,
segue-se que, para esta classe de jogos, sempre existe pelo menos um
equilı́brio de Nash em estratégias mistas.
Teorema 4.7 (minimax de von Neumann) Para todo jogo

de soma zero com dois jogadores, representado pela matriz
de payoffs A do jogador linha, sempre existe um perfil de es-
tratégias mistas (p∗ , q∗ ) ∈ Δm × Δn satisfazendo
vl (A) = max min pT Aq

p∈Δm q∈Δn
=
p∗T Aq∗
=
min max pT Aq = vc (A).

q∈Δn p∈Δm
Em particular, (p∗ , q∗ ) é um equilı́brio de Nash do jogo.
i i
i i
“tdj”
i i
2017/2/2
page 94
i i
Daremos uma demonstração deste teorema minimax de von Neu-

mann usando o teorema de dualidade da teoria de programação linear.
Lembramos que um problema de programação linear é um problema
de otimização com função objetivo e restrições lineares:
(problema primal)
maximizar bT y
sujeito a Ay ≤ c,
y ≥ 0,
onde as desigualdades devem ser interpretadas componente a com-

ponente. A cada problema de programação linear (problema primal)
podemos associar um outro problema de otimização (problema dual):
(problema dual)
minimizar cT x
sujeito a x A ≥ bT ,
T
x ≥ 0.
Teorema 4.8 (da dualidade em programação linear)

(a) O problema primal possui uma solução se, e somente se, o
problema dual possui uma solução.
(b) Se y∗ é solução do problema primal e x∗ é solução do pro-
blema dual, então cT x∗ = bT y∗ .
Uma demonstração do teorema de dualidade pode ser encontrada

em [14, 52].
Demonstração do teorema minimax: sem perda de generalidade,
podemos assumir que todas as entradas da matriz de payoffs A do jo-
gador linha são positivas. Caso contrário, basta substituir A por A =
A + D e B = −A por B = −D + B, onde D = d 1 , com d >
max1≤i≤m,1≤j≤n |aij |. Observe que A +B = 0 (isto é, o jogo definido

pelas matrizes A e B tem soma zero) e que (p∗ , q∗ ) é um equilı́brio
i i
i i
“tdj”
i i
2017/2/2
page 95
i i
de Nash para o jogo definido pela matriz A se, e somente se, (p∗ , q∗ )
é um equilı́brio de Nash para o jogo definido pela matriz A.
Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os proble-
mas de programação linear:
(problema primal)
maximizar bT y
sujeito a Ay ≤ c,
y ≥ 0,
(problema dual)
minimizar cT x
sujeito a x A ≥ bT ,
T
x ≥ 0.
Passo 1: o problema dual possui uma solução.

Como A > 0, o conjunto admissı́vel
X = {x ∈ Rm | xT A ≥ bT e x ≥ 0}
é não vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a função ob-
jetivo do problema é escrita como x = (x1 , x2 , . . . , xm ) → cT x =
x1 + x2 + · · · + xm . Assim, o problema dual consiste em encontrar o
ponto do conjunto X mais próximo da origem segundo a norma da
soma || · ||1 , um problema que certamente possui uma solução pois,
se p ∈ X, então podemos “compactificar” o conjunto admissı́vel in-
cluindo a restrição ||x||1 ≤ ||p||1 e, com isso, podemos usar o teorema
de Weierstrass para garantir a existência de um mı́nimo.
Passo 2: construção do equilı́brio de Nash.
Dado que o problema dual possui uma solução, pelo teorema de
dualidade, o problema primal também possui. Mais ainda: se x∗ é
solução do problema dual e y∗ é solução do problema primal, então
cT x∗ = (x∗ )T Ay∗ = bT y∗ .
Seja θ = cT x∗ = bT y∗ (que é > 0 pois (0, 0, . . . , 0) não é admissı́vel)

e defina
x∗ y∗
p∗ = e q∗ = .
θ θ
i i
i i
“tdj”
i i
2017/2/2
page 96
i i
Afirmamos que (p∗ , q∗ ) é um equilı́brio de Nash do jogo. Com efeito:

claramente p∗ ∈ Δm e q∗ ∈ Δn , pois p∗ ≥ 0 (já que x∗ ≥ 0 e θ > 0),
q∗ ≥ 0 (já que y∗ ≥ 0 e θ > 0),
m
m
x∗ i cT x∗ θ
pi = = = =1
i=1 i=1
θ θ θ
e
m
n
yj∗ bT y∗ θ
qj = = = = 1.
j=1 j=1
θ θ θ
Agora, como x∗T A ≥ bT , temos que para todo q ∈ Δn , x∗T Aq ≥

T n
b q = j=1 qj = 1. Mas p∗ = x∗ /θ. Desta maneira, p∗T Aq ≥ θ =
p∗T Aq∗ , para todo q ∈ Δn . Conseqüentemente,
uc (p∗ , q∗ ) = −p∗T Aq∗ ≥ −p∗T Aq = uc (p∗ , q)
para todo q ∈ Δn . Mostramos então que o jogador coluna não pode

aumentar o seu payoff esperado trocando q∗ por q, se o jogador linha
mantiver a escolha p∗ . Analogamente, como
m Ay ≤ c, temos ∗que
para todo p ∈ Δm , pT Ay∗ ≤ pT c = i=1 pi = 1. Mas y =
q∗ /θ. Desta maneira, p∗ Aq∗ ≤ θ = p∗T Aq∗ , para todo p ∈ Δm .
Conseqüentemente,
ul (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = ul (p, q∗ ),
para todo p ∈ Δm . Mostramos então que o jogador linha não pode

aumentar o seu payoff esperado trocando p∗ por p, se o jogador co-
luna mantiver a escolha q∗ . Concluı́mos, portanto, que (p∗ , q∗ ) é um
equilı́brio de Nash do jogo.
Além de estabelecer a existência de equilı́brios de Nash, a demons-

tração que demos sugere uma maneira de calculá-los: resolvendo-se
dois problemas de programação linear.
Exemplo 4.8 O governo deseja vacinar seus cidadãos contra um

certo vı́rus da gripe. Este vı́rus possui dois sorotipos, sendo que é
desconhecida a proporção na qual os dois sorotipos ocorrem na po-
pulação do vı́rus. Foram desenvolvidas duas vacinas onde a eficácia
i i
i i
“tdj”
i i
2017/2/2
page 97
i i
da vacina 1 é de 85% contra o sorotipo 1 e de 70% contra o soro-

tipo 2. A eficácia da vacina 2 é de 60% contra o sorotipo 1 e de 90%
contra o sorotipo 2. Qual polı́tica de vacinação deveria ser tomada
pelo governo?
Esta situação pode ser modelada como um jogo de soma zero
com dois jogadores, onde o jogador linha L (o governo) deseja obter
a maior compensação (a fração dos cidadãos resistentes ao vı́rus) o
maior possı́vel e o jogador coluna C (o vı́rus) deseja obter a maior
compensação a menor possı́vel. A matriz de payoffs é a seguinte:
vı́rus
sorotipo 1 sorotipo 2
(85/100, −85/100) (70/100, −70/100)
governo
vacina 1
vacina 2 (60/100, −60/100) (90/100, −90/100)
Para encontrar um equilı́brio de Nash, devemos resolver os seguintes

problemas de programação linear
(problema primal)
maximizar ' y1 +(y'2 ( ' (
85/100 70/100 y1 1
sujeito a ≤ ,
60/100 90/100 ' y2 ( ' 1 (
y1 0
≥ ,
y2 0
(problema dual)
minimizar ' x1 + x2 (
85/100 70/100
sujeito a x1 x2 ≥ 1 1 ,
60/100 90/100
' ( ' (
x1 0
≥ ,
x2 0
isto é,
i i
i i
“tdj”
i i
2017/2/2
page 98
i i
(problema primal)
maximizar y1 + y2
sujeito a 17y1 + 14y2 ≤ 20,
6y1 + 9y2 ≤ 10,
y1 ≥ 0,
y2 ≥ 0,
(problema dual)
minimizar x1 + x2
sujeito a 7x1 + 12x2 ≥ 20,
7x1 + 9x2 ≥ 10,
x1 ≥ 0,
x2 ≥ 0.
A solução do problema dual é x∗ = (20/23, 10/23) (Figura 4.7) e a

solução do problema primal é y∗ = (40/69, 50/69), com
30
θ = x∗1 + x∗2 = y1∗ + y2∗ = .
23
Desta maneira, o único equilı́brio de Nash para o problema é dado
pelo ponto (p∗ , q∗ ), onde

x∗ 2 1 y∗ 4 5
p∗ = = , e q∗ = = , .
θ 3 3 θ 9 9
O teorema minimax de von Neumann garante que, para jogos de

soma zero, existem estratégias mistas p∗ e q∗ tais que:
(a) Se o jogador linha jogar com p∗ , então o seu ganho esperado
nunca é menor do que v ∗ = p∗T Aq∗ , independentemente da es-
colha do jogador coluna.
(b) Se o jogador coluna jogar com q∗ , então a sua perda esperada
nunca é maior do que v ∗ = p∗T Aq∗ , independentemente da esco-
lha do jogador linha.
Como efeito: como (p∗ , q∗ ) é um equilı́brio de Nash em estratégias
mistas, segue-se que v ∗ = uc (p∗ , q∗ ) ≥ uc (p∗ , q), ∀q ∈ Δn , e v ∗ =
i i
i i
“tdj”
i i
2017/2/2
page 99
i i
x2
30/23
10/23
0 20/23 30/23 x1
Figura 4.7: Solução do problema dual.
y1
30/23
50/69
0 40/69 30/23 y1
Figura 4.8: Solução do problema primal.
i i
i i
“tdj”
i i
2017/2/2
page 100
i i
ul (p∗ , q∗ ) ≥ uc (p, q), ∀p ∈ Δm . Mas uc (p, q) = −pT Aq e ul (p, q) =

+pT Aq. Assim,
∀q ∈ Δn , v ∗ = uc (p∗ , q∗ ) ≥ uc (p∗ , q)
⇓
∗T
∀q ∈ Δn , pAq ≥ p∗T Aq∗ = v ∗ (4.3)
⇓
O ganho esperado do jogador linha nunca é menor
do que v ∗ se ele jogar com p∗ , independentemente
da escolha q do jogador coluna.
e, analogamente,
∀p ∈ Δm , v ∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ )
⇓
∀p ∈ Δm , pAq ≤ p∗T Aq∗ = v ∗ ∗
(4.4)
⇓
A perda esperada do jogador coluna nunca é maior
do que v ∗ se ele jogar com q∗ , independentemente
da escolha p do jogador linha.
Mais ainda: se (p∗ , q ∗ ) é um equilı́brio de Nash do jogo, então
n

aij · qj∗ = v ∗ , para todo i tal que p∗i > 0 e (4.5)
j=1
m
p∗i · aij = v ∗ , para todo j tal que qj∗ > 0. (4.6)
i=1
De fato: suponha,
n por absurdo, que exista algum ı́ndice k tal que
p∗k > 0 e a
j=1 kj · qj∗ = v ∗ . Usando as desigualdades 4.4 com
n
p = ei , sabemos que j=1 aij · qj∗ ≤ v ∗ para todo i = 1, . . . , m. Logo,
n
se j=1 akj · qj∗ = v ∗ , então nj=1 akj · qj∗ < v ∗ . Mas, então,
⎛ ⎞
m
n
m

∗
v = p∗i ⎝ aij · qj∗ ⎠ < p∗i v∗ = v∗ ,
i=1 j=1 i=1
i i
i i
“tdj”
i i
2017/2/2
page 101
i i
[SEC. 4.4: EQUILÍBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE 101
o que é uma contradição. Um argumento análogo pode ser usado

para provar 4.6. Note que 4.5 e 4.6 nada mais são do que as condições
estabelecidas no Corolário 4.1 na página 80 para o caso particular de
jogos de soma zero.
4.4 Equilı́brio de Nash via um problema

de complementaridade
4.4.1 Jogos bimatriciais
Sejam u1 (p, q) = pT Aq e u2 (p, q) = pT Bq são, respectivamente,
as funções utilidade dos jogadores 1 e 2. Sem perda de generalidade,
podemos assumir que A > 0 e B > 0 pois, caso contrário, basta
substituir A por A + c 1 e B por B + c 1 para alguma constante
c > 0 suficientemente grande. Observe agora que (p∗ , q∗ ) ∈ Δ =
Δm × Δn é um equilı́brio de Nash em estratégias mistas do jogo se,
e somente se, p∗ e q∗ satisfazem os seguintes programas lineares, um
dependendo do outro:
maximizar (Aq∗ )T p maximizar (B T p∗ )T q

sujeito a ½Tm p = 1, sujeito a ½Tn q = 1,
p ≥ 0, q ≥ 0,
onde ½m e ½n são, respectivamente, matrizes de tamanho m×1 e n×1

com todas as entradas iguais a 1. Os problemas duais destes dois PLs
são dados por:
minimizar λ minimizar μ
sujeito a ½m λ ≥ Aq∗ , sujeito a ½n μ ≥ B T p∗ .
Se λ∗ é a solução ótima do primeiro problema dual, então pelo teo-

rema forte da dualidade, vale que (Aq∗ )T p∗ = λ∗ . Mas (Aq∗ )T p∗ =
q ∗T AT p∗ = p∗T Aq∗ e λ∗ = (p∗ ½m )λ∗ . Assim, p∗T Aq∗ = (p∗ ½m )λ∗
ou, equivalentemente,
p∗T (½m λ∗ − Aq∗ ) = 0. (4.7)
i i
i i
“tdj”
i i
2017/2/2
page 102
i i
Esta condição diz que p∗ e ½m λ∗ −Aq∗ são ortogonais. Dado que estes
vetores são não-negativos, eles têm que ser complementares, no sen-
tido que eles não podem ter componentes positivas na mesma posição.
Esta caracterização de um par primal-dual ótimo é conhecida como
folgas complementares em programação linear. Dado que p∗ é uma
distribuição de probabilidades, pelo menos uma de suas componen-
tes é positiva, de modo que a respectiva componente de ½m λ∗ − Aq∗
é zero e λ∗ é a maior das entradas de Aq∗ . Qualquer estratégia
pura i do jogador 1 é uma melhor resposta a q∗ se, e somente se,
a i-ésima componente de ½m λ∗ − Aq∗ é igual a zero. Desta forma,
a Equação 4.7 obtém o Corolário 4.1 na página 80: uma estratégia
mista p∗ é uma melhor resposta para q∗ se, e somente se, ela dá pro-
babilidade positiva apenas para as estratégias puras que são melhores
respostas para q∗ . Analogamente, se μ∗ é a solução ótima do segundo
problema dual, então
q∗T (½n μ∗ − B T p∗ ) = 0. (4.8)
Teorema 4.9 O perfil de estratégias mistas (p∗ , q∗ ) é um

equilı́brio de Nash se, e somente se, existem números reais λ∗
e μ∗ tais que
½Tm p∗ = 1,
½Tn q∗ = 1,
½m λ∗ − Aq∗ ≥ 0, (4.9)
½n μ∗ − B T p∗ ≥ 0,
p∗, q∗ ≥ 0,
e as Equações 4.7 e 4.7 sejam satisfeitas.
Dado um vetor t ∈ Rn e uma matriz M de tamanho n × n, o

problema de complementaridade linear (PCL) associado ao par (t, M )
consiste em encontrar z, w ∈ Rn tais que
w + M z = t, w ≥ 0, z≥0 e zT w = 0.
Veremos agora como caracterizar os equilı́brios de Nash em estra-
tégias mistas de jogos bimatriciais (jogos finitos com apenas dois
i i
i i
“tdj”
i i
2017/2/2
page 103
i i
[SEC. 4.4: EQUILÍBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE 103
jogadores) através de um problema de complementaridade linear.

Se (p∗ , q∗ ) é um equilı́brio de Nash do jogo, então
u1 (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = u1 (p, q∗ ), ∀p ∈ Δm .
Mas, por linearidade, p∗T Aq∗ ≥ pT Aq∗ para todo p ∈ Δm se, e

somente se, p∗T Aq∗ ≥ eTi Aq∗ , ∀i = 1, . . . , m, onde ei representa
o i-ésimo vetor da base canônica. Mas, então,
(p∗T Aq∗ )½m ≥ (eTi Aq∗ )½m = ½m (eTi Aq∗ ) = (½m eTi )(Aq∗ ) = Aq∗ .
Analogamente, como
u2 (p∗ , q∗ ) = p∗T Bq∗ ≥ p∗T Bq = u2 (p∗ , q), ∀q ∈ Δn ,
segue-se que p∗T Bq∗ ≥ p∗T Bej = eTj B T p∗ , ∀j = 1, . . . , n e, por-

tanto,
(p∗T Bq∗ )½n ≥ (eTj B T p∗ )½m =

½m (eTj B T p∗ ) = (½m eTj )(B T p∗ ) = B T p∗ .
Desta maneira, (p∗ , q∗ ) é um equilı́brio de Nash se, e somente se,
(p∗T Aq∗ )½m ≥ Aq∗ e (p∗T Bq∗ )½n ≥ B T p∗ . (4.10)
Como A e B possuem todas as entradas positivas, segue-se que os

números p∗T Aq∗ e p∗T Bq∗ são positivos. Sejam então
p∗ q∗
x∗ = e y∗ = .
p∗T Bq∗ p∗T Aq∗
Introduzindoas variáveis de folga w∗ = (u∗ , v∗ ), vemos que se (p∗ , q∗ )

é um equilı́brio de Nash, então z∗ = (x∗ , y∗ ) e w∗ constituem uma
solução do problema de complementaridade linear
w + M z = t, w ≥ 0, z≥0 e zT w = 0,
onde ' ( ' (

t=
½m 0 A
e M= .
½n BT 0
i i
i i
“tdj”
i i
2017/2/2
page 104
i i
Reciprocamente, se z∗ = (x∗ , y∗ ) e w∗ = (u∗ , v∗ ) constituem uma

solução do problema de complementaridade linear acima, então
x∗ y∗
p∗ = e q∗ =
½Tm x∗ ½Tn y∗
constituem um equilı́brio de Nash do jogo bimatricial.
Além de programação linear, programação quadrática e teoria dos
jogos, aplicações do problema de complementaridade linear incluem
o estudo de modelos financeiros, a análise não-linear de certas estru-
turas elasto-plásticas e muitas outras áreas ([64]).
4.4.2 O algoritmo de Lemke-Howson

Um dos métodos mais importantes para se encontrar uma solução
de um PCL é o algoritmo de Lemke-Howson. Ele foi apresentado no
artigo [49] em 1964. Muito mais do que um método de cálculo de
equilı́brios de jogos bimatriciais, o algoritmo de Lemke-Howson dá
uma prova algébrica construtiva para a existência de equilı́brios, além
de estabelecer que, genericamente, o número de equilı́brios de Nash é
finito e ı́mpar. Sendo similar ao algoritmo Simplex para programação
linear, sua complexidade é exponencial ([84]). Além do artigo origi-
nal, o leitor interessado em mais detalhes do algoritmo pode consultar
a referência [87].
4.5 Gambit
Desenvolvido por Richard D. McKelvey (California Institute of
Technology), Andrew M. McLennan (University of Minnesota) e The-
odore L. Turocy (Texas A&M University), Gambit é um programa de
computador, gratuito e multiplataforma, orientado para a construção
e análise de jogos finitos. Ele oferece uma interface gráfica intuitiva
para o cálculo de equilı́brios de Nash e a análise das estruturas de
dominância das estratégias do jogo. Para baixá-lo, acesse o endereço:
http://econweb.tamu.edu/gambit.
i i
i i
“tdj”
i i
2017/2/2
page 105
i i
[SEC. 4.5: GAMBIT 105
Figura 4.9: Gambit eliminando as estratégias fracamente domina-

das do Jogo da Segunda Gerra Mundial descrito no
Exercı́cio 6 na página 54.
i i
i i
“tdj”
i i
2017/2/2
page 106
i i
Observação. A equipe do Gambit recentemente desenvolveu uma

versão on-line do software que está disponı́vel no endereço: http:
//gte.csc.liv.ac.uk/gte/builder/ (é preciso habilitar o uso de
janelas pop-up).
4.6 Exercı́cios
[01] Calcule os pontos de sela da matriz
⎡ ⎤
24 23 22 25
⎢ 10 22 20 19 ⎥
A=⎢ ⎣ 27
⎥.
25 22 23 ⎦
20 28 16 15
[02] Como no Exemplo 4.8, escreva os problemas primal e dual do

jogo de comparar moedas (Exemplo 2.6, página 22). Resolva
estes problemas de otimização para encontrar o equilı́brio de
Nash em estratégias mistas do jogo.
[03] Mostre como encontrar pelo menos um equilı́brio de Nash de

um jogo de soma zero 2 × 2 geral.
[04] Encontre pelo menos um equilı́brio de Nash em estratégias mis-

tas do jogo de soma zero definido pela matriz
' (
−1 +5 +1 −2
A= .
+1 −3 −2 +5
[05] Sejam p∗ ∈ Δm e q∗ ∈ Δn duas estratégias mistas de um jogo

de soma zero com dois jogadores. Mostre que se o mı́nimo dos
ganhos médios do jogador linha usando p∗ é igual ao máximo
das perdas médias do jogador coluna usando q∗ , isto é, se
min ul (p∗ , el ) = max (−uc (ek , q∗ )),

1≤l≤n 1≤k≤m
então (p∗ , q∗ ) é um equilı́brio de Nash do jogo. Aqui ek re-

presenta o k-ésimo vetor da base canônica de Rm e el o l-
ésimo vetor da base canônica de Rn . Use este resultado para
i i
i i
“tdj”
i i
2017/2/2
page 107
i i
mostrar que as estratégias mistas p∗ = (6/37, 20/37, 0, 11/37)

e q∗ = (14/37, 4/37, 0, 19/37, 0) constituem um equilı́brio de
Nash do jogo de soma zero definido pela matriz
⎡ ⎤
5 8 3 1 6
⎢ 4 2 6 3 5 ⎥
A=⎢ ⎣ 2 4 6 4 1 ⎦.
⎥
1 3 2 5 3
[06] (Jogos de quadrados mágicos) Um quadrado mágico é uma

matriz quadrada n × n cujas entradas são constituı́das pelos
números 1, 2, . . . , n2 , arranjados de tal forma que a soma das
n entradas em qualquer linha, coluna ou diagonal principal é
sempre o mesmo número. Mostre como encontrar pelo menos
um equilı́brio de Nash em estratégias mistas de um jogo de soma
zero cuja matriz é um quadrado mágico. Aplique a técnica para
a matriz ⎡ ⎤
16 3 2 13
⎢ 5 10 11 8 ⎥
A=⎢ ⎣ 9 6 7 12 ⎦ .
⎥
4 15 14 1
Este quadrado mágico aparece na gravura Melencolia I de Al-
brecht Dürer:
http://en.wikipedia.org/wiki/Melancholia_I.
[07] Considere um jogo de soma zero definido por uma matriz A

inversı́vel que possui um equilı́brio de Nash (p∗ , q∗ ) totalmente
misto (isto é, 0 < p∗i , qj∗ < 1 para todo i, j ∈ {1, . . . , n}). Mostre
que
½T A−1 A−1 ½
p∗ = T −1 e q∗ = T −1 ,
½ A ½ ½ A ½
T
onde ½ = 1 · · · 1 .
i i
i i
“tdj”
i i
2017/2/2
page 108
i i
Capı́tulo 5
Jogos na forma extensa
A forma normal de um jogo é usada em situações onde os jogado-

res escolhem sua estratégia simultaneamente ou o fazem sem conhecer
a estratégia dos outros jogadores. Contudo, existem situações em que
os jogadores tomam suas decisões de forma seqüencial, depois de ob-
servar a ação que um outro jogador realizou. A forma extensa tem
uma estrutura mais adequada para analisar jogos desta natureza, es-
pecificando assim quem se move, quando, com qual informação e o
ganho de cada jogador. Ela contém toda informação sobre um jogo.
Existem várias formas de se representar um jogo da forma extensa, to-
das elas tentando formalizar a ideia de árvore. Entre elas: (1) relações
de ordem, (2) teoria de grafos ([41]) e (3) alfabetos ([27]). Nossa abor-
dagem aqui será mais informal. Trataremos dos jogos seqüencias de
informação perfeita: os ganhos são de conhecimento comum de todos
os jogadores, um único jogador faz um movimento por vez e cada
jogador conhece as escolhas dos jogadores que o antecederam toda
vez que for jogar.
5.1 Definição
Um jogo na forma extensa (também denominado jogo seqüencial)
é aquele em que os jogadores realizam seus movimentos em uma or-
dem predeterminada. Por este motivo, uma maneira muito adequada
108
i i
i i
“tdj”
i i
2017/2/2
page 109
i i
[SEC. 5.1: DEFINIÇÃO 109
de se representar um jogo na forma extensa é através de uma árvore.

Por exemplo, na Figura 5.1, o jogador 1 joga primeiro: ele pode es-
colher entre as ações a e b. Depois, é a vez do jogador 2 jogar. Se 1
jogou a, então 2 pode escolher entre c ou d e, se 1 jogou b, então 2 pode
escolher entre e e f . Depois que todos jogadores realizaram (seqüen-
cialmente) suas ações, cada jogador recebe o seu ganho. A convenção
é que a primeira coordenada do vetor de payoffs represente o ganho
de quem jogou em primeiro lugar, a segunda coordenada represente
o ganho de quem jogou em segundo lugar, e assim por diante.
c (2, 4)
2
d
a
(1, 0)
1
b
e (6, 12)
2
f
(9, {1)
Figura 5.1: Um jogo na forma extensa.
Uma árvore é composta por nós e ramos. Os ramos representam

as ações dos jogadores. No jogo da Figura 5.1 existem 6 ramos: a, b,
c, d, e e f . Alguns são do jogador 1 (a e b), enquanto que outros são
do jogador 2 (c, d, e e f ). Os nós são de dois tipos: existem aqueles
que emanam ramos e existem aqueles que não. Estes últimos são as
folhas da árvore e neles estão os valores dos payoffs dos jogadores.
Um nó que não é uma folha identifica o jogador que deve escolher
uma das ações representadas pelos ramos que saem do nó. Nós que
não são folhas são denominados nós de decisão. Por exemplo, no
primeiro nó (também denominado raiz da árvore) o jogador 1 que
deve fazer a sua escolha entre os ramos (ações) a e b.
Uma estratégia de um jogador é um plano de ação completo que
especifica uma ação factı́vel deste jogador em cada nó de decisão
em que o jogador pode atuar. No jogo da Figura 5.1, o jogador 1
tem apenas um nó de decisão. Por este motivo, suas estratégias se
i i
i i
“tdj”
i i
2017/2/2
page 110
i i
110 [CAP. 5: JOGOS NA FORMA EXTENSA
confundem com suas ações:
S1 = {a, b}.
Por outro lado, o jogador 2 tem dois nós de decisão: um que se segue
depois que o jogador 1 jogou a e o outro depois que o jogador 1 jogou b.
Por este motivo, cada estratégia do jogador 2 deve conter duas ações:
uma para o primeiro nó e a outra para o outro nó. Assim, uma
estratégia possı́vel para o jogador 2 é “jogar c se o jogador 1 jogar a
e jogar f se o jogador 1 jogar b”. Outra é “jogar c se o jogador 1
jogar a e jogar e se o jogador 1 jogar b”. Escrevendo apenas as ações
que o jogador 2 pode tomar em cada nó de decisão, o conjunto de
suas estratégias pode ser então representado da seguinte maneira:
S2 = {(c, e), (c, f ), (d, e), (d, f )}.
É muito importante notar a diferença entre ações e estratégias. Neste

contexto, (c, e) é uma estratégia do jogador 2, enquanto que c e e são
ações (uma para cada nó de decisão do jogador). Uma ação é um
conceito local: ela representa o comportamento do jogador em um
momento particular do jogo, isto é, em um nó de decisão. Uma
estratégia é um conceito global: ela especifica o comportamento do
jogador no jogo inteiro, isto é, em todos os nós de decisão do jogador.
Mais exemplos: no jogo da Figura 5.2,
S1 = {a, b}, S2 = {(c, e), (c, f ), (c, g), (d, e), (d, f ), (d, g)}
e, no jogo da Figura 5.3,
S1 = {(a, l, p), (a, l, q), (a, m, p), (a, m, q),

(b, l, p), (b, l, q), (b, m, p), (b, m, q)}
e
S2 = {(c, e), (c, f ), (d, e), (d, f )}.
5.2 Equilı́brio de Nash

A definição de equilı́brio de Nash para jogos seqüenciais é a mesma
dada para jogos na forma normal: se Si é o conjunto de estratégias
i i
i i
“tdj”
i i
2017/2/2
page 111
i i
[SEC. 5.2: EQUILÍBRIO DE NASH 111
c (2, 4)
2
d
a (1, 0)
1
b (6, 12)
e
2 f
(9, {1)
g
(8, 9)
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
i i
i i
“tdj”
i i
2017/2/2
page 112
i i
do jogador i, 1 ≤ i ≤ n, então um perfil de estratégias
s∗ = (s∗1 , . . . , s∗i , . . . , s∗n ) ∈ S1 × · · · × Si × · · · × Sn
é um equilı́brio de Nash (em estratégias puras) se
ui (s∗i , s∗−i ) ≥ ui (siji , s∗−i )
para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi o número

de estratégias do jogador i. A caracterização via funções de melhor
resposta também pode ser usada: s∗ = (s∗1 , . . . , s∗i , . . . , s∗n ) ∈ S é um
equilı́brio de Nash em estratégias se, e somente se, s∗i ∈ MRi (s∗−i )
para todo i = 1, . . . , n, onde MRi (s−i ) = argmaxsi ∈Si ui (si , s−i ).
No jogo da Figura 5.4, temos que
S1 = {a, b}, S2 = {(c, e), (c, f ), (d, e), (d, f )}
Assim, existem 8 perfis de estratégias:
S = S1 × S2 = {(a, (c, e)), (a, (c, f )), (a, (d, e)), (a, (d, f )),
(b, (c, e)), (b, (c, f )), (b, (d, e)), (b, (d, f ))}.
c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)
Figura 5.4: Calculando equilı́brios de Nash em um jogo seqüencial.
Vamos mostrar que o perfil (a, (c, f )) não é um equilı́brio de Nash

do jogo. Inicialmente, observe que, para calcular o ganho dos joga-
dores associado a um determinado perfil de estratégias, basta seguir
i i
i i
“tdj”
i i
2017/2/2
page 113
i i
[SEC. 5.2: EQUILÍBRIO DE NASH 113
o caminho de execução do jogo. Por exemplo, para o perfil de es-

tratégia (a, (c, f )), a execução do jogo se dá da seguinte maneira:
o jogador 1 escolhe a ação a e, em seguida, o jogador 2 escolhe a
ação c, o que resulta no ganho 2 para o jogador 1 (Figura 5.5). Já,
para o perfil de estratégia (b, (c, f )), o jogador 1 escolhe a ação a
e o jogador 2 escolhe a ação f , dando o ganho 5 para o jogador 1
(Figura 5.6).
c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)
Figura 5.5: Caminho de execução associado ao perfil de estraté-

gias (a, (c, f )).
c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)
Figura 5.6: Caminho de execução associado ao perfil de estraté-

gias (b, (c, f )).
Desta maneira, se o jogador 2 mantiver a sua estratégia (c, f ), o

jogador 1 ganhará mais trocando sua estratégia a pela estratégia b:
u1 (a, (c, f )) = 2 < 5 = u1 (b, (c, f )).
i i
i i
“tdj”
i i
2017/2/2
page 114
i i
Isto mostra que (a, (c, f )) não é um equilı́brio de Nash. O per-

fil (b, (c, f )), por sua vez, é um equilı́brio de Nash, pois
u1 (b, (c, f )) = 5 > 2 = u1 (a, (c, f ))
e
u2 (b, (c, f )) = 4 > 0 = u2 (b, (c, e)),
u2 (b, (c, f )) = 4 > 0 = u2 (b, (d, e)),
u2 (b, (c, f )) = 4 ≥ 4 = u2 (b, (d, f )).
O jogo possui mais um equilı́brio de Nash: o perfil (b, (c, f )).
5.3 Indução retroativa e equilı́brio per-

feito em subjogos
A indução retroativa é um processo que produz um perfil de es-
tratégias com a propriedade de que se cada jogador seguir as reco-
mendações de ações estabelecidas pelo perfil, então suas estratégias
serão ótimas em cada nó de decisão onde o jogador pode atuar.
O algoritmo é simples. Começando pelos nós de decisão finais,
determinamos as melhores ações disponı́veis para os jogadores que
vão atuar nestes nós. Isto é fácil de se fazer, já que não existem
outros nós de decisão que sucedem os nós em questão: basta, em
cada nó de decisão final, escolher a ação que dê ao jogador do nó
o maior payoff possı́vel. Se existe um empate entre duas ações que
levam ao maior payoff, escolhemos uma delas arbitrariamente. Feito
isto, as ações escolhidas são marcadas e, as demais, ignoradas. Este
processo agora é repetido para os penúltimos nós de decisão, para os
antepenúltimos, etc., até que a raiz da árvore seja alcançada.
Por exemplo, no jogo seqüencial da Figura 5.3, os últimos nós de
decisão são β, δ e . Assim, no passo 1 da indução retroativa, o joga-
dor 2 marca a ação d no nó β e o jogador 1 marca as ações l e p nos
nós δ e , respectivamente (Figura 5.7). No passo 2, o jogador 2 marca
a ação e no nó γ (Figura 5.8). Finalmente, no passo 3, o jogador 1
marca a ação b (Figura 5.9). O perfil de estratégias obtido é
((b, l, p), (d, e)).
i i
i i
“tdj”
i i
2017/2/2
page 115
i i
[SEC. 5.3: INDUÇÃO RETROATIVA E EQUILÍBRIO PERFEITO EM SUBJOGOS 115
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
Figura 5.7: Indução retroativa: passo 1.
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
i i
i i
“tdj”
i i
2017/2/2
page 116
i i
c (2, 4)
2
d
¯
a (1, 10)
1
l (2, 3)
® 1
m
e ±
b (1, 4)
2
° f
p (5, 0)
1
q
²
(5, 4)
O processo de indução retroativa dá, portanto, um algoritmo para

encontrar um equilı́brio de Nash em estratégias puras de um jogo
seqüencial com informação perfeita. Note, contudo, que nem todo
equilı́brio de Nash pode ser obtido por indução retroativa. O perfil
de estratégias (b, d) do jogo da Figura 5.10 é um equilı́brio de Nash
que não é obtido por indução retroativa.
c (2, 1)
2
d
a
(0, 0)
1
b
(1, 2)
Figura 5.10: (b, d) é um equilı́brio de Nash que não é obtido por

indução retroativa.
Seja α um dos nós de decisão de um jogo G. O subjogo que

começa em α é o jogo obtido copiando-se todos os nós de decisão,
ramos e payoffs do jogo original que sucedem α. Por exemplo, no
jogo da Figura 5.3, o subjogo que começa nó de decisão γ, é o jogo
i i
i i
“tdj”
i i
2017/2/2
page 117
i i
[SEC. 5.3: INDUÇÃO RETROATIVA E EQUILÍBRIO PERFEITO EM SUBJOGOS 117
da Figura 5.11.
l (2, 3)
1
m
e ±
2 (1, 4)
° f
p (5, 0)
1
q
²
(5, 4)
Figura 5.11: Subjogo que começa no nó γ do jogo da Figura 5.3.
Dizemos que um perfil de estratégias (puras) s∗ é um equilı́brio

perfeito em subjogos de um jogo seqüencial G se os respectivos sub-
perfis de s∗ são equilı́brios de Nash de cada subjogo de G. Como
veremos, este equilı́brio idealizado por Reinhard Selten, tem forte co-
nexão com o processo de indução retroativa. De fato: considere, por
exemplo, o jogo da Figura 5.3. Se
s∗ = ((aα , aδ , a ), (aβ , aγ ))
é um equilı́brio perfeito em subjogos deste jogo, então (aδ ) e (a )
devem ser equilı́brios de Nash dos subjogos que começam nos nós δ
e , respectivamente. Mas, neste caso, aδ e a devem ser ações que
maximizem o ganho do jogador 1 nestes nós. Sendo assim, concluı́mos
que aδ = l e a = p ou a = q. Tomemos a = p. Do mesmo modo,
como (aβ ) deve ser um equilı́brio de Nash do subjogo que começa no
nó β, vemos que o jogador 2 escolherá aβ = d. Então, nesta primeira
iteração, já podemos afirmar que
s∗ = ((aα , l, p), (d, aγ )).
Agora, se aγ = e, o jogador 2 ganhará 3 (já que o jogador 1 escolhe l
neste caso) e, se aγ = f , o jogador 2 ganhará 0 (já que o jogador 1
escolhe p neste caso). Como (aγ , (l, p)) deve ser um equilı́brio de
Nash do subjogo que começa no nó γ, segue-se que, obrigatoriamente,
aγ = e. Assim, após a segunda iteração, vale que
s∗ = ((aα , l, p), (d, e)).
i i
i i
“tdj”
i i
2017/2/2
page 118
i i
Como as ações nos nós β, γ, δ e já estão agora todas determinadas,

é fácil de ver que se s∗ = ((aα , l, p), (d, e)) é um equilı́brio de Nash do
jogo original, então aα = b. Assim, o equilı́brio perfeito em subjogos é
s∗ = ((b, l, p), (d, e)).
Note que a imposição de que os respectivos subperfis de s∗ sejam

equilı́brios de Nash de cada subjogo de G induz a mesma seleção de
ações que seria feita no processo de indução retroativa. É por este
motivo que os equilı́brios perfeitos em subjogos coincidem com os
equilı́brios obtidos por indução retroativa.
5.4 O teorema de Kuhn-Zermelo
Teorema 5.1 (Kuhn-Zermelo) Todo jogo seqüencial de in-

formação perfeita possui pelo menos um equilı́brio de Nash em
estratégias puras.
Idéia da prova. A demonstração é feita por indução. Se o jogo possui

apenas um único nó de decisão, então o teorema é verdadeiro: o jo-
gador que age neste nó escolhe uma ação que maximiza o seu payoff.
Os outros jogadores, se existirem, tem espaços de estratégias vazios.
Suponha então que todo jogo com menos do que m > 1 nós de de-
cisão possua pelo menos um equilı́brio de Nash. Escolhendo um nó de
decisão β que sucede imediatamente a raiz α da árvore do jogo, cria-
remos dois jogos. O primeiro é o subjogo Gβ que começa em β. Pela
hipótese de indução, Gβ possui pelo menos um equilı́brio de Nash s∗β .
O segundo jogo, G−β , é construı́do da seguinte maneira: removemos
de G o subjogo Gβ e nó β, que antes era de decisão, criamos uma
folha cujos payoffs são dados pelos payoffs associados ao equilı́brio s∗β
de Gβ . Novamente, pela hipótese de indução, G−β possui pelo me-
nos um equilı́brio de Nash s∗−β . Se a ação em s∗−β não usa o ramo a
que liga α a β em G−β , então s∗−β é um equilı́brio de Nash do jogo
original G. Por outro lado, se s∗−β usa o ramo a, então (a, s∗β ) é um
equilı́brio de Nash do jogo original G.
i i
i i
“tdj”
i i
2017/2/2
page 119
i i
5.5 Exercı́cios
[01] (Jogo da centopéia) Use indução retroativa para obter um
equilı́brio de Nash do jogo seqüencial da figura abaixo. O
equilı́brio é Pareto eficiente?
1 Continuar 2 Continuar 1 Continuar 2 Continuar
(64, 16)
Parar
Parar
Parar
Parar
(4, 1) (2, 8) (16, 4) (8, 32) .
Este jogo foi desenvolvido pelo economista Robert W. Rosenthal,

mas o seu nome é devido a Kenneth Binmore.
[02] (Jogo da confiança) Use indução retroativa para obter um
equilı́brio de Nash do jogo seqüencial da figura abaixo. O equi-
lı́brio é Pareto eficiente?
trair ({1, 2)
2
fiar
con honrar ( 1, 1)
1
não
con
fiar
(0, 0) .
i i
i i
“tdj”
i i
2017/2/2
page 120
i i
Capı́tulo 6
Exemplos
6.1 O jogo Le Her simplificado

Nesta seção estudaremos a versão simplificada do jogo Le Her,
como apresentada por Benjamim e Goldman em [05]. Dois jogadores
empregam um pacote de 13 cartas do mesmo naipe (A, 2, . . . , 10,
Q, J e K). Após um sistema de distribuição e troca de cartas que
descreveremos a seguir, o vencedor é aquele com a maior carta (A <
2 < · · · < 10 < Q < J < K).
Inicialmente, o jogador 1 embaralha as 13 cartas e distribui uma
carta X para si, uma carta Y para o jogador 2 e deixa o restante
das cartas em um monte Z, sem que nenhum dos dois jogadores
veja as cartas. Feito isto, cada jogador vê sua carta, mas não as
outras. O jogador 1 deve então decidir se mantém a sua carta ou
a troca com o jogador 2 (que não pode se negar a fazer a troca).
No primeiro caso, é a vez do jogador 2 decidir se ele mantém a sua
carta (a única que ele conhece até o momento) ou se ele faz a troca
com a primeira carta do monte Z. Depois que o jogador 2 faz a sua
escolha, os jogadores mostram as suas cartas e vence aquele com a
maior carta. No segundo caso, os dois jogadores conhecem os valores
das duas cartas X e Y e o jogador 2 não tem escolha alguma: se,
depois da troca, a sua carta for menor do que a carta do jogador 1,
então ele deve obrigatoriamente trocá-la com a carta do monte Z
na esperança de obter uma carta maior para vencer o jogo, caso
120
i i
i i
“tdj”
i i
2017/2/2
page 121
i i
[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 121
contrário, ele mantém a sua carta e vence o jogo. O leitor interessado

pode se familiarizar com as regras do jogo atuando como o jogador 2
no applet Java disponı́vel no endereço:
http://www.professores.uff.br/hjbortol/arquivo/2007.1/
applets/leher1_br.html.
Quais são as estratégias puras do jogador 1? Cada estratégia pura

corresponde a uma escolha de um subconjunto formado pelas cartas
que ele irá manter na primeira etapa do jogo. Por exemplo, a escolha
do subconjunto {5, 7, 9} corresponde à estratégia pura do jogador 1
em manter a sua carta se, e somente se, ela for igual a 5, 7 ou 9. Desta
maneira, existem tantas estratégias puras quantos subconjuntos do
conjunto
D = {A, 2, 3, 4, 5, 6, 7, 8, 9, 10, Q, J, K},
isto é, existem um total de 213 = 8192 estratégias puras para o joga-
dor 1. O mesmo vale para o jogador 2: ele tem 213 estratégias puras
que estão em correspondência biunı́voca com os 213 subconjuntos
i i
i i
“tdj”
i i
2017/2/2
page 122
i i
122 [CAP. 6: EXEMPLOS
distintos de D, cada um especificando quais cartas o jogador 2 irá

manter. É importante observar mais uma vez que o jogador 2 só faz
uma escolha (a de manter a sua carta Y ou trocá-la com uma carta
do monte Z) quando o jogador 1 decide por manter a sua carta X.
Se o jogador 1 resolve trocar de cartas, a ação do jogador 2 está com-
pletamente determinada pelos valores das cartas X e Y (supondo,
naturalmente, que o jogador 2 seja racional).
A matriz de payoffs do jogo tem, portanto, dimensão 213 × 213 .
Este tamanho pode ser reduzido consideravelmente observando que
estratégias puras “com saltos” são dominadas por aquelas “sem sal-
tos”. Por exemplo, a estratégia pura
{5, 7, 9}
(manter apenas as cartas 5, 7 e 9) é dominada pela estratégia pura
{5, 6, 7, 8, 9, 10, Q, J, K}
(manter apenas as cartas maiores do que ou iguais a 5). Assim, ao

invés de considerar todos os 213 subconjuntos de D, podemos nos
restringir aos 13 subconjuntos da forma {C ∈ D | C ≥ C}, onde
C ∈ D. No que se segue, usaremos o seguinte abuso de notação
A = {A, 2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},

2 = {2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},
3 = {3, 4, 5, 6, 7, 9, 9, 10, Q, J, K}, . . .
para representar estas estratégias puras dominantes de cada jogador.

O ganho do jogador 1 é sua probabilidade de vitória que, eviden-
temente, depende das estratégias puras (dominantes) escolhidas pelos
dois jogadores. Através de cálculos com probabilidades condicionais
(como em [05]) ou através de uma enumeração direta (veja o ap-
plet Java disponı́vel no endereço http://www.professores.uff.br/
hjbortol/arquivo/2007.1/applets/leher2_br.html), obtemos a
matriz de payoffs apresentada na tabela 6.1, onde as probabilidades
foram calculadas com 3 casas decimais corretas. Como o jogo é de
soma zero (isto é, um jogador vence se, e somente se, o outro perde),
a matriz de payoffs do jogador 2 é a matriz de payofffs do jogador 1
multiplicada por −1.
i i
i i
i
i
i
i
jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
A 0.500 0.462 0.429 0.404 0.385 0.372 0.365 0.365 0.372 0.385 0.404 0.429 0.462
2 0.538 0.500 0.468 0.442 0.423 0.410 0.404 0.404 0.410 0.423 0.442 0.468 0.500
3 0.571 0.538 0.506 0.480 0.460 0.447 0.440 0.439 0.445 0.457 0.476 0.501 0.533
4 0.596 0.569 0.543 0.517 0.496 0.481 0.473 0.471 0.476 0.487 0.505 0.529 0.559
5 0.613 0.592 0.571 0.550 0.529 0.513 0.503 0.499 0.502 0.512 0.527 0.550 0.578
6 0.622 0.606 0.590 0.573 0.557 0.541 0.529 0.523 0.523 0.530 0.544 0.564 0.590
[SEC. 6.1: O JOGO LE HER SIMPLIFICADO
7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593
jogador 1
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
10 0.566 0.563 0.559 0.556 0.552 0.549 0.545 0.542 0.538 0.535 0.533 0.538 0.549
Q 0.526 0.524 0.523 0.521 0.519 0.517 0.516 0.514 0.512 0.510 0.509 0.508 0.514
J 0.474 0.474 0.473 0.473 0.472 0.471 0.471 0.470 0.470 0.469 0.469 0.468 0.468
K 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410
Tabela 6.1: Matriz de payoffs do jogador 1 para o jogo Le Her.

123
i
i
“tdj”
i
i
page 123
2017/2/2
2017/2/2
page 124
i
i
“tdj”
i
i
[CAP. 6: EXEMPLOS
jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
jogador 1
7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
Tabela 6.2: Matriz de payoffs do jogador 1 para o jogo Le Her após mais uma eliminação de estratégias
estritamente dominadas.
124
i
i
i
i
“tdj”
i i
2017/2/2
page 125
i i
[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 125
Vamos usar dominância para simplificar ainda mais a matriz do

jogo. Observe que as estratégias 7 e 9 do jogador 1 dominam, respec-
tivamente, as estratégias de A a 6 e de 10 a K (isto é, o jogador 1
deve sempre trocar cartas ≤ 6 e deve sempre manter cartas ≥ 10).
Eliminando-se então as linhas estritamente dominadas, obtemos a
matriz da tabela 6.2. Para esta matriz reduzida, as estratégias 9
e 10 do jogador 2 dominam, respectivamente, as estratégias de A a 8
e de Q a K (isto é, o jogador 2 deve sempre trocar cartas ≤ 8 e deve
sempre manter as cartas Q, J e K. Eliminando-se então as colunas
estritamente dominadas, obtemos a matriz da tabela 6.3.
jogador 2
9 10
jogador 1
7 0.538 0.543
8 0.547 0.548
9 0.549 0.545
Tabela 6.3: Matriz de payoffs do jogador 1 para o jogo Le Her após

mais uma eliminação de estratégias estritamente domi-
nadas.
Finalmente, vemos que para esta matriz reduzida, a estratégia 8 do

jogador 1 domina estritamente a estratégia 7. Eliminando-a, obtemos
a matriz 2 × 2 da tabela 6.4.
jogador 2
9 10
jogador 1
8 0.547 0.548
9 0.549 0.545
Tabela 6.4: Matriz de payoffs do jogador 1 para o jogo Le Her após

mais uma eliminação de estratégias estritamente domi-
nadas.
Usando-se programação linear ou funções de melhor resposta, po-

demos calcular facilmente o equilı́brio de Nash em estratégias mistas
i i
i i
“tdj”
i i
2017/2/2
page 126
i i
deste jogo 2 × 2:
(p1 , p2 ) = (4/5, 1/5) para o jogador 1
e
(q1 , q2 ) = (3/5, 2/5) para o jogador 2.
Os payoffs médios são, respectivamente, 0.5474 e 0.4526. Vemos,
portanto, que o jogador 1 leva vantagem nesta versão simplificada
do Le Her supondo, é claro, que ele aja racionalmente seguindo o
Observações.
1. No jogo original com 52 cartas, o jogador 2 pode se negar a trocar
de cartas com o jogador 1 se sua carta for K (a de maior valor). No
caso de cartas de mesmo valor (mas naipes diferentes), o jogador 2
vence. Mesmo na versão original, a probabilidade média de ganho
do jogador 1 é maior do que a do jogador 2 no equilı́brio de Nash.
Os detalhes podem ser encontrados nas referências [25] e [37].
2. O jogo Le Her foi investigado por Pierre Rémond de Montmort
(1678–1719) e Nicholas Bernoulli (1687–1759), mas foi James Wal-
degrave (1684–1741) que forneceu uma solução para o jogo usando
o conceito de equilı́brio em estratégias mistas. As referências [90]
e [37] apresentam em detalhes a história deste jogo, incluindo a
troca de correspondência entre Montmort, Bernoulli e Waldegrave
e os erros cometidos na solução apresentada por Bernoulli.
3. Benjamim e Goldman mostram em [05] que, para a versão sim-
plificada do Le Her, a redução da matriz de payoffs para uma
matriz 2 × 2 ocorre para qualquer baralho com um número N ≥ 3
de cartas de um mesmo naipe.
6.2 O modelo de duopólio de Cournot

Sejam q1 e q2 as quantidades de um produto homogêneo fabricado
por duas empresas 1 e 2, respectivamente. Diz-se que dois produtos
fabricados por empresas diferentes são homogêneos quando os con-
sumidores não percebem diferenças na qualidade dos dois produtos
i i
i i
“tdj”
i i
2017/2/2
page 127
i i
[SEC. 6.2: O MODELO DE DUOPÓLIO DE COURNOT 127
e, assim, eles tomam suas decisões sobre qual produto comprar con-
siderando apenas o preço, independentemente do fabricante. Vamos
assumir a situação de market-clearing, isto é, não existe excesso de
demanda ou excesso de oferta no mercado. Assim, a quantidade de-
mandada do produto é igual à quantidade ofertada do mesmo. Para
simplificar, vamos supor que o preço de mercado é uma função linear
da quantidade agregada Q = q1 + q2 do produto no mercado. Mais
precisamente,

A − Q, se Q < A, A − (q1 + q2 ), se q1 + q2 < A,
P (Q) = =
0, se Q ≥ A, 0, se q1 + q2 ≥ A.
Aqui, A é o preço máximo aceitável pelo mercado. Os custos to-
tais de produção das empresas 1 e 2 são dados, respectivamente,
por C1 (q1 ) = c · q1 e C2 (q2 ) = c · q2 , com c > 0. Vamos supor que
c < A. As duas empresas devem escolher simultaneamente as quan-
tidades que irão produzir. O ganho de cada empresa é o lucro que
ela obtém.
Temos então um jogo infinito com dois jogadores, g1 = Empresa 1,
g2 = Empresa 2, S1 = [0, +∞), S2 = [0, +∞) e S = S1 × S2 . As fun-
ções de utilidade u1 , u2 : S → R são dadas por
u1 (q1 , q2 ) = q1 · P (q1 + q2 ) − c · q1

q1 · [A − (q1 + q2 ) − c], se q1 + q2 ≤ A,
=
q1 · [−c], se q1 + q2 > A,

q1 · (−q1 + (A − q2 − c)), se q1 + q2 ≤ A,
=
q1 · [−c], se q1 + q2 > A,
u2 (q1 , q2 ) = q2 · P (q1 + q2 ) − c · q2

q2 · [A − (q1 + q2 ) − c], se q1 + q2 ≤ A,
=
q2 · [−c], se q1 + q2 > A,

q2 · (−q2 + (A − q1 − c)), se q1 + q2 ≤ A,
=
q2 · [−c], se q1 + q2 > A.
Desta maneira, as funções de melhor resposta das duas empresas são
dadas por

{(A − c − q2 )/2}, se q2 ≤ A − c,
MR1 (q2 ) =
{0}, se q2 > A − c,
i i
i i
“tdj”
i i
2017/2/2
page 128
i i

{(A − c − q1 )/2}, se q1 ≤ A − c,
MR2 (q1 ) =
{0}, se q1 > A − c.
Lembrando que (q1∗ , q2∗ ) é um equilı́brio de Nash em estratégias puras

se, e somente se, q2∗ ∈ MR2 (q1∗ ) e q1∗ ∈ MR1 (q2∗ ), vemos que (q1∗ , q2∗ )
deve ser solução do sistema
q2∗ = (A − c − q1∗ )/2 e q1∗ = (A − c − q2∗ )/2.
Sendo assim, vemos que o único equilı́brio de Nash em estratégias

puras do jogo é

∗ ∗ A−c A−c
(q1 , q2 ) = , . (6.1)
3 3
Estes valores também podem ser encontrados geometricamente, a-

través dos pontos de interseção das representações gráficas das duas
funções de melhor resposta (Figura 6.1).
q2
A{c
(A { c)/2
(q 1*, q2* )
0 (A { c)/2 A{c q1
Figura 6.1: Calculando o equilı́brio de Nash do modelo de duopólio

de Cournot.
i i
i i
“tdj”
i i
2017/2/2
page 129
i i
[SEC. 6.3: O MODELO DE DUOPÓLIO DE BERTRAND 129
6.3 O modelo de duopólio de Bertrand

Neste modelo, ao invés de decidir o quanto produzir, as empresas
devem escolher o quanto cobrar pelo produto, isto é, elas entram em
uma competição de preços. Como no modelo de Cournot, estamos
assumindo que tudo o que é produzido é consumido. Lembrando
que A é o preço máximo aceitável pelo mercado, vemos que S1 =
S2 = [0, A] e S = S1 × S2 = [0, A] × [0, A]. As funções utilidade são
dadas por
ui (p1 , p2 ) = pi · Qi (p1 , p2 ) − c · Qi (p1 , p2 ) = (pi − c) · Qi (p1 , p2 ),
onde Qi (p1 , p2 ) representa a produção vendida da empresa i com o

perfil de preços (p1 , p2 ). Como o produto é homogêneo, podemos
assumir que os consumidores comprarão o produto mais barato. Se
as duas empresas cobrarem o mesmo preço, vamos assumir que elas
dividem igualmente o mercado. Desta maneira,
⎧
⎨A − pi , se pi < pj ,
Qi (p1 , p2 ) = (A − pi )/2, se pi = pj ,
⎩
0, se pi > pj ,
e, portanto,
⎧
⎨(pi − c) · (A − pi ), se pi < pj ,
ui (p1 , p2 ) = (pi − c) · (A − pi )/2, se pi = pj ,
⎩
0, se pi > pj ,
onde j = i = 1, 2.
Quais são os equilı́brios de Nash em estratégias puras deste mo-
delo? Certamente (p∗1 , p∗2 ) = (c, c) é um equilı́brio de Nash pois, neste
caso,
u1 (p∗1 , p∗2 ) = 0 ≥ u1 (p1 , p∗2 ) e u2 (p∗1 , p∗2 ) = 0 ≥ u2 (p∗1 , p2 ),
para todo p1 ∈ S1 e para todo p2 ∈ S2 . Existem outros equilı́brios de

Nash? A resposta é não, como podemos concluir a partir dos casos
descritos a seguir.
(a) Se p∗2 < c e p∗1 ≥ p∗2 , então u2 (p∗1 , p∗2 ) < 0 = u2 (p∗1 , c). Logo, neste
caso, (p∗1 , p∗2 ) não é um equilı́brio de Nash do jogo.
i i
i i
“tdj”
i i
2017/2/2
page 130
i i
p2
A
Caso (e)
Caso (d)
Caso (c)
(f)
so
Caso (g)
Ca
c Caso (h)
)
(b
Caso (a)
so
Ca
0 c A p1
Figura 6.2: Calculando o equilı́brio de Nash do modelo de duopólio

de Bertrand analisando os vários casos.
(b) Se p∗1 = p∗2 < c, então u1 (p∗1 , p∗2 ) < 0 = u1 (c, p∗2 ). Logo, neste
(c) Se p∗1 < c e p∗2 ≥ p∗1 , então u1 (p∗1 , p∗2 ) < 0 = u1 (c, p∗2 ). Logo, neste
(d) Suponha que p∗1 = c e p∗2 > c. Se p∗2 < A, então u1 (p∗1 , p∗2 ) = 0 <
u1 (p∗2 , p∗2 ). Se p∗2 = A, então
u2 (p∗1 , p∗2 ) = 0 < u2 (p∗1 , (A + c)/2).
Note que (A + c)/2 é ponto de máximo da função quadrática

pi → (pi − c) · (A − pi ) no intervalo [c, A]. Vemos então que, neste
caso, (p∗1 , p∗2 ) também não é um equilı́brio de Nash do jogo.
(e) Suponha que p∗2 > p∗1 > c. Como u2 (p∗1 , p∗2 ) = 0 < u2 (p∗1 , p∗1 ).
segue-se que (p∗1 , p∗2 ) também não é um equilı́brio de Nash do
jogo.
i i
i i
“tdj”
i i
2017/2/2
page 131
i i
[SEC. 6.4: O MODELO DE DUOPÓLIO DE STACKELBERG 131
( f ) Suponha que p∗2 = p∗1 > c. Se p∗1 = p∗2 ∈ ((A + c)/2, A], então
u1 (p∗1 , p∗2 ) < u1 ((A + c)/2, p∗2 ). Se p∗1 = p∗2 ∈ (c, (A + c)/2], seja
p•1 a solução da equação (c − x) · (A − x) = u∗ no intervalo (c, p∗1 ),
onde u∗ = (c − p∗1 ) · (A − p∗1 )/2, isto é, seja
)
A+c c2 + A2 − 2 · p∗1 · A + 2 · p∗1 2 − 2 · c · p∗1
•
p1 = − .
2 2
Então u1 (p∗1 , p∗2 ) < u1 ((p•1 + p∗1 )/2, p∗2 ). Vemos então que, neste
caso, (p∗1 , p∗2 ) também não é um equilı́brio de Nash do jogo.
(g) Suponha que p∗1 > p∗2 > c. Como u1 (p∗1 , p∗2 ) = 0 < u1 (p∗2 , p∗2 ).
segue-se que (p∗1 , p∗2 ) também não é um equilı́brio de Nash do
jogo.
(h) Suponha que p∗2 = c e p∗1 > c. Se p∗1 < A, então u2 (p∗1 , p∗2 ) = 0 <
u2 (p∗1 , p∗1 ). Se p∗1 = A, então
u1 (p∗1 , p∗2 ) = 0 < u1 ((A + c)/2, p∗2 ).
Vemos então que, neste caso, (p∗1 , p∗2 ) também não é um equilı́brio
de Nash do jogo.
Ao contrário do modelo de duopólio de Cournot, as funções de

melhor resposta não estão definidas. Por exemplo, se p∗1 = (A + c)/2,
então não existe um ponto de máximo da função p2 → u2 (p∗1 , p2 ),
como mostra a Figura 6.3. Isto acontece por que esta função é des-
contı́nua.
6.4 O modelo de duopólio de Stackelberg

O modelo de duopólio de Cournot é um jogo simultâneo, no sen-
tido que cada empresa, ao escolher o seu nı́vel de produção, não sabe
o nı́vel de produção da empresa concorrente. Heinrich von Stackel-
berg, em [88], propôs um modelo de duopólio onde uma das empresas
(a empresa lı́der) escolhe sua produção primeiro e a outra empresa
(a empresa seguidora) faz a sua escolha de produção depois.
A ordem do jogo é a seguinte: (1) a empresa 1 escolhe uma quan-
tidade de produção q1 ≥ 0 e (2) a empresa 2 observa o valor de q1
i i
i i
“tdj”
i i
2017/2/2
page 132
i i
u2
0 c (A + c)/2 A p2
Figura 6.3: Gráfico da função p2 → u2 ((A + c)/2, p2 ).
e, então, escolhe a sua quantidade de produção q2 ≥ 0. O ganho de

cada empresa é o lucro que ela obtém:
u1 (q1 , q2 ) = q1 · P (q1 + q2 ) − c · q1 ,
u2 (q1 , q2 ) = q2 · P (q1 + q2 ) − c · q2 ,
onde P (Q) = A − Q é o preço de mercado em função da quantidade

agregada Q = q1 + q2 e c > 0 é o custo unitário de produção.
Vamos usar indução retroativa para encontrar um equilı́brio de
Nash deste jogo seqüencial. Primeiro, vamos calcular a ação ótima
A2 (q1 ) da empresa 2 em função da quantidade de produção q1 :
A2 (q1 ) = argmaxq2 ≥0 u2 (q1 , q2 ) = argmaxq2 ≥0 q2 · [A − q1 − q2 − c] .
Pela regra de Fermat, obtemos que
A − q1 − c
q2 = A2 (q1 ) = ,
2
i i
i i
“tdj”
i i
2017/2/2
page 133
i i
[SEC. 6.5: A TRAGÉDIA DOS COMUNS 133
desde que q1 < A − c. Prosseguindo retroativamente, vemos que a

ação ótima A1 da Empresa 1 é dada por
A1 = argmaxq1 ≥0 u1 (q1 , A2 (q1 ))
= argmaxq1 ≥0 q1 · [A − q1 − A2 (q1 ) − c]
= argmaxq1 ≥0 q1 · [A − q1 − c]/2
e, desta maneira,
A−c A−c
q1∗ = A1 = e q2∗ = A2 (q1∗ ) = .
2 4
Se a empresa 1 tivesse escolhido a ação sugerida pelo equilı́brio de
Cournot, q1(C) = (A − c)/3, então a ação ótima da empresa 2 também
seria aquela sugerida pelo equilı́brio de Cournot, q2(C) = (A − c)/3.
Portanto, usando-se as ações sugeridas pelo equilı́brio de Cournot no
modelo Stackelberg, temos que Q(C) = q1(C) + q2(C) = 2 · (A − c)/3,
P (Q(C) ) = (A + 2 · c)/3 e
(A − c)2
u1 (q1(C) , q2(C) ) = u2 (q1(C) , q2(C) ) = .
9
Por outro lado, usando-se as ações obtidas por indução retroativa,
vemos que Q∗ = q1∗ + q2∗ = 3 · (A − c)/4, P (Q∗ ) = (A + 3 · c)/4 e
(A − c)2 (A − c)2
u1 (q1∗ , q2∗ ) = , u2 (q1∗ , q2∗ ) = .
8 16
Estas expressões mostram que a produção agregada (a soma das
produções) é maior no modelo de Stackelberg do que no modelo de
Cournot. Elas também explicam porque, no modelo de Stackelberg,
a empresa 1 não escolhe a ação sugerida pelo modelo de Cournot: se
ela o fizer, vai ganhar menos. Vemos também que o preço de mercado
no modelo de Cournot é maior do que no modelo de Cournot. Assim,
no modelo de Stackelberg, a empresa 1 está ganhando mais porque a
empresa 2 está ganhando bem menos.
6.5 A tragédia dos comuns

O termo “A Tragédia dos Comuns” vem de uma parábola pu-
blicada pelo economista polı́tico William Forster Lloyd em seu livro
i i
i i
“tdj”
i i
2017/2/2
page 134
i i
Two Lectures on the Checks to Population de 1833, que depois foi po-
pularizada e estendida por Garret Hardin no seu artigo The Tragedy
of the Commons publicado na revista Science em 1968 ([38]).
A palavra “tragédia” tem o significado dado por Alfred North
Whitehead em seu livro Science and The Modern World : “The es-
sence of dramatic tragedy is not unhappiness. It resides in the solem-
nity of the remorseless working of things.”. Já a palavra “comuns”
designa uma área de pastagem coletiva, sem dono e sem qualquer
regulamentação, usada por pastores na Idade Média, que cuidavam
do rebanho de ovelhas para obter a lã que vendiam para a confecção
de roupas.
Com o crescimento do número de famı́lias de camponeses ao longo
do tempo, ocorreu um aumento do número de ovelhas necessárias
para o sustento de cada famı́lia. Como a área de pastagem era de uso
comum, nenhuma famı́lia tinha incentivo para controlar o número de
ovelhas de seu rebanho pois, se o fizesse, outras famı́lias usariam as
pastagens de qualquer forma. Com uma superpopulação de ovelhas, a
terra que antes era fértil, começou a se exaurir. A redução da área de
pastagem afetou tanto o rebanho quanto a indústria local de roupas.
A parábola mostra, então, que a imprudência em administrar um
recurso finito do qual todos se beneficiam pode levar à ruı́na.
Vamos usar teoria dos jogos para modelar uma versão ingênua da
tragédia dos comuns. Considere uma aldeia com n pastores e seja oi
o número de ovelhas do i-ésimo pastor, de modo que o número total
de ovelhas da aldeia é o = o1 + · · · + on . O custo de compra de uma
ovelha é c, independentemente do número de ovelhas que o pastor
já possui. O benefı́cio de um pastor em deixar uma ovelha pastando
é v(o) por ovelha. Como o campo de pastagem é um recurso finito,
existe um número máximo o de ovelhas que ele pode suportar. As-
sim, v(o) > 0 se o < o e v(o) = 0 se o ≥ o. Naturalmente, v é uma
função decrescente, pois quanto mais ovelhas no pasto, menor será a
área útil de pastagem para a próxima ovelha. Mais ainda: se existem
poucas ovelhas pastando, colocar uma a mais para pastar não vai
afetar muito as ovelhas que já estão pastando mas, por outro lado, se
existem muitas ovelhas no pasto, digamos, quase que completando a
cota máxima o, o acréscimo de uma ovelha prejudica mais acentua-
damente a pastagem das demais ovelhas. Admitindo que as ovelhas
sejam infinitamente divisı́veis, estas condições podem ser modeladas
i i
i i
“tdj”
i i
2017/2/2
page 135
i i
[SEC. 6.5: A TRAGÉDIA DOS COMUNS 135
exigindo-se que v ≤ 0 e v < 0. Desta maneira, v tem um gráfico tal

como o apresentado na Figura 6.4.
0 o o
Figura 6.4: Gráfico da função v.
Neste jogo, a estratégia do pastor i é a escolha da quantidade de

ovelhas que ele deixará no pasto. Podemos então considerar que o
conjunto de estratégias puras do pastor i é Si = [0, o). Sua função
utilidade é dada por
ui (o1 , . . . , oi , . . . , on ) = oi · v(o1 + · · · + oi + · · · + on ) − c · oi .
Suponha que c < v = v(0). Vamos n caracterizar os equilı́brios de

Nash o∗ = (o∗1 , . . . , o∗n ) tais que j=1 o∗j < o. Para isto, usaremos
n
as seguintes notações: σ ∗ = j=1 o∗j e σ−i ∗
= σ ∗ − o∗i . Note que a
função
μi
oi −→ ui (oi , o∗−i ) = oi · v oi − σ−i
∗
− c · oi
tem as seguintes propriedades:
(1) μi é contı́nua,
∗
(2) μi tem a mesma classe de diferenciabilidade de v em [0, o − σ−i ),
∗ ∗
(3) μi (0) = 0, μi (o − σ−i ) < 0, μi (oi ) ≤ 0 para oi ≥ o − σ−i ,
(4) μi (0) = v(0) − c > 0, logo μi é crescente e, portanto, positiva, em

um intervalo (0, ) para algum > 0 e
i i
i i
“tdj”
i i
2017/2/2
page 136
i i
∗
(5) μi é côncava em 0, o − σ−i .
Logo, a função de melhor resposta do pastor i está bem definida:

MRi (o∗ ) = argmaxoi ∈(0,o−σ−i ∗
∗ ) oi · v oi − σ−i − c · oi .
Se o∗i ∈ MRi (o∗ ), então, pela regra de Fermat, μi (o∗i ) = 0, isto é,
v(o∗i + σ−i
∗
) + o∗i · v (o∗i + σ−i
∗
) − c = 0.
Somando-se estas equações para i = 1, . . . , n e, então, dividindo-se
por n, obtemos que σ ∗ deve satisfazer a seguinte equação:
1 ∗ ∗
v(σ ∗ ) + · σ · v (σ ) = 0. (6.2)
n
Por outro lado, se o objetivo é maximizar a utilidade coletiva, isto
é, a soma das funções utilidades individuais, então devemos resolver
o seguinte problema de otimização:
max (o · v(o) − c · o) .
o∈(0,o)
Usando novamente a regra de Fermat, concluı́mos que uma solução σ •

deste problema de otimização deve resolver a seguinte equação:
v(σ • ) + σ • · v (σ • ) = 0. (6.3)
Observe que σ ∗ > σ • . Com efeito: se, por absurdo, σ ∗ ≤ σ • , então
v(σ ∗ ) ≥ v(σ • ), já que v é decrescente. Mas v também é decrescente,
já que v < 0. Desta maneira, 0 > v (σ ∗ ) ≥ v (σ • ). Como 0 <
σ ∗ /n < σ ∗ ≤ σ • , segue-se que
σ∗ ∗ σ∗ •
· v (σ ) ≥ · v (σ ) > σ • · v (σ • )
n n
e, portanto,
σ∗ ∗
0 = v(σ ∗ ) + · v (σ ) > v(σ • ) + σ • · v (σ • ) = 0,
n
uma contradição. Vemos então que o equilı́brio de Nash o∗ coloca
mais ovelhas no pasto do que o número de ovelhas sugerido pelo
equilı́brio coletivo o• . Isto acontece porque cada pastor considera
apenas o seu próprio benefı́cio e não o efeito de suas ações sobre os
outros pastores.
i i
i i
“tdj”
i i
2017/2/2
page 137
i i
Apêndice A
Convexidade
Neste apêndice apresentaremos as definições e propriedades bá-

sicas de funções convexas necessárias no texto. As demonstrações
omitidas podem ser encontradas em [42].
Definição A.1 (Conjuntos convexos) Dizemos que U ⊂

Rn é um conjunto convexo se, e somente se, para todo p, q ∈ U
tem-se
(1 − t) · p + t · q ∈ U,
para todo t ∈ [0, 1], isto é, se o segmento de reta que une dois
pontos quaisquer de U está sempre contido em U .
Teorema A.1 Seja {Uξ }ξ∈Ξ uma famı́lia de conjuntos conve-

xos em Rn Então
Uξ
ξ∈Ξ
também é um conjunto convexo em Rn .
137
i i
i i
“tdj”
i i
2017/2/2
page 138
i i
138 [CAP. A: CONVEXIDADE
(a) (b)
Figura A.1: O conjunto da esquerda é convexo enquanto que o da

direita não o é.
Definição A.2 (Semiplanos e Semiespaços) Seja a um ve-

tor não-nulo em Rn e seja c um número real. Os conjuntos
H+ = {x ∈ Rn | ax ≥ c} e H− = {x ∈ Rn | ax ≤ c}
são denominados, respectivamente, semiespaços fechados cor-

respondentes ao semiplano H = {x ∈ Rn | ax = c}.
Por linearidade, segue-se que semiplanos e semiespaços são con-

juntos convexos.
Definição A.3 (Politopos e Poliedros) Um politopo é um

conjunto que pode ser expresso como a interseção de um número
finito de semiespaços fechados. Um poliedro é um politopo limi-
tado.
Note que politopos e poliedros são conjuntos convexos, como in-

terseção de conjuntos convexos.
Definição A.4 (Combinação convexa)Sejam x1 , . . . , xk ∈

Rn e λ1 , . . . , λk números reais ≥ 0 tais que ni=1 λi = 1. A com-
binação convexa de x1 , . . . , xk com pesos λ1 , . . . , λk é o ponto
λ1 · x1 + · · · + λi · xk .
i i
i i
“tdj”
i i
2017/2/2
page 139
i i
139
(a) (b)
Figura A.2: O conjunto de todas as combinações convexas de (a) dois

pontos distintos é um segmento de reta que liga os dois
pontos e de (b) três pontos não-colineares é um triângulo
(lados e interior) com vértices nos três pontos.
Teorema A.2 Um subconjunto U de Rn é convexo se, e so-

mente se, toda combinação convexa de pontos de U pertence
a U.
Definição A.5 (Funções convexas e côncavas)

(a) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é convexa se, e somente se,
f ((1 − t) · p + t · q) ≤ (1 − t) · f (p) + t · f (q), (A.1)
para todo p, q ∈ U e todo t ∈ [0, 1].

(b) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é côncava se, e somente se,
f ((1 − t) · p + t · q) ≥ (1 − t) · f (p) + t · f (q), (A.2)
para todo p, q ∈ U e todo t ∈ [0, 1].
A interpretação geométrica é a seguinte: para uma função convexa, o

segmento de reta secante que passa pelos pontos (p, f (p)) e (q, f (q))
sempre está acima ou coincide com o gráfico de f para qualquer
i i
i i
“tdj”
i i
2017/2/2
page 140
i i
f(p)
seg
me
nto
(1{ t) . f(p)+t . f(q) de r
eta
sec
ant
e gráfico de f
f(q)
f ((1{ t) . p +t . q)
0 p (1{ t) . p+t . q q x
Figura A.3: Para uma função convexa, o segmento de reta secante

fica sempre acima ou coincide com o gráfico da função,
para quaisquer escolhas de p e q.
escolha de pontos p e q em U (veja a Figura A.3). Já para uma

função côncava, o segmento de reta secante que passa pelos pontos
(p, f (p)) e (q, f (q)) sempre está abaixo ou coincide com o gráfico
de f para qualquer escolha de pontos p e q em U . Note que f é
côncava se, e somente se, −f é convexa.
O próximo teorema estabelece o motivo de convexidade ser uma pro-
priedade tão desejável em otimização.
Teorema A.3
(a) Se f : U ⊂ Rn → R é convexa, então todo ponto de mı́nimo

local de f em U também é ponto de mı́nimo global de f
em U .
(b) Se f : U ⊂ Rn → R é côncava, então todo ponto de máximo
local de f em U também é ponto de máximo global de f
em U .
i i
i i
“tdj”
i i
2017/2/2
page 141
i i
141
Teorema A.4 Seja f : U ⊂ Rn → R uma função de classe C 1

definida em um subconjunto convexo U de Rn .
(a) f é uma função convexa em U se, e somente se,
f (q) ≥ f (p) + ∇f (p) · (q − p), (A.3)
para todo p, q ∈ U , isto é, se, e somente se, cada hiperplano

tangente ao gráfico de f está sempre abaixo ou coincide com
o gráfico de f .
(b) f é uma função côncava em U se, e somente se,
f (q) ≤ f (p) + ∇f (p) · (q − p), (A.4)
para todo p, q ∈ U , isto é, se, e somente se, cada hiperplano

tangente ao gráfico de f está sempre acima ou coincide com
o gráfico de f .
Aqui ∇f (p) denota o vetor gradiente de f em p.
gráfico de f
0 x
Figura A.4: Para uma função convexa, cada hiperplano tangente ao

gráfico de f está sempre abaixo do gráfico de f .
i i
i i
“tdj”
i i
2017/2/2
page 142
i i
Definição A.6 (Funções quase-convexas e quase-côn-

cavas)
(a) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é quase-convexa se, e somente
se,
{x ∈ U | f (x) ≤ c}
é um conjunto convexo para todo c ∈ R.
(b) Dizemos que uma função f : U ⊂ Rn → R definida em um
subconjunto convexo U de Rn é quase-côncavo se, e somente
se,
{x ∈ U | f (x) ≥ c}
é um conjunto convexo para todo c ∈ R.
Note que f é quase-côncava se, e somente se, −f é quase-convexa.

Toda função convexa é quase-convexa e toda função côncava é quase-
côncava. Existem funções quase-convexas que não são convexas.
√ Por
3
exemplo, a função f : R → R definida por y = f (x) = x2 é quase-
convexa, mas não é convexa.
0 x
√
3
Figura A.5: y = f (x) = x2 é quase-convexa, mas não é convexa
em R.
i i
i i
“tdj”
i i
2017/2/2
page 143
i i
143
Toda função f : R → R monótona é quase-convexa e quase-côncava.

A função y = f (x) = x que leva x ∈ R no maior inteiro menor do
que ou igual a x é função quase-convexa que não é contı́nua. A função
da Figura A.6 é um exemplo de função que não é quase-convexa.
Teorema A.5 Seja f : U ⊂ Rn → R uma função definida em

um subconjunto convexo U de Rn .
(a) As seguintes condições são equivalentes:
(1) f é uma função quase-convexa em U .

(2) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1], se f (x1 ) ≤ f (x2 ), então
f (t · x1 + (1 − t) · x2 ) ≤ f (x2 ).
(3) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1],
f (t · x1 + (1 − t) · x2 ) ≤ max{f (x1 ), f (x2 )}.
(b) As seguintes condições são equivalentes:

(1) f é uma função quase-côncava em U .
(2) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1], se f (x1 ) ≥ f (x2 ), então
f (t · x1 + (1 − t) · x2 ) ≥ f (x2 ).
(3) ∀x1 , x2 ∈ U, ∀t ∈ [0, 1],
f (t · x1 + (1 − t) · x2 ) ≥ min{f (x1 ), f (x2 )}.
Teorema A.6 Seja f : U ⊂ Rn → R uma função de classe C 1

definida em um subconjunto convexo U de Rn .
(a) f é quase-convexa em U se, e somente se,
∀x1 , x2 ∈ U, f (x2 ) ≤ f (x1 ) ⇒ ∇f (x1 ) · (x2 − x1 ) ≤ 0.
i i
i i
“tdj”
i i
2017/2/2
page 144
i i
0 x
Figura A.6: Um exemplo de função que não é quase-convexa.
(b) f é quase-côncava em U se, e somente se,
∀x1 , x2 ∈ U, f (x2 ) ≥ f (x1 ) ⇒ ∇f (x1 ) · (x2 − x1 ) ≥ 0.
i i
i i
“tdj”
i i
2017/2/2
page 145
i i
Apêndice B
Programação Linear
Neste apêndice apresentaremos as definições e propriedades bá-

sicas da teoria de programação linear necessárias no texto. Para
detalhes, demonstrações e extensões, recomendamos os excelentes li-
vros [14, 52].
Um programa linear é um problema de otimização onde a função
que queremos otimizar e as restrições são todas lineares. Por exemplo,
minimizar x1 + x2
x1 ,x2 ∈R
sujeito a 3 x1 + 2 x2 ≥ 8,
x1 + 5 x2 ≥ 7, (B.1)
x1 ≥ 0,
x2 ≥ 0,
é um programa linear. Para resolvê-lo, precisamos encontrar um

ponto (x1 , x2 ) do conjunto admissı́vel
K = {(x1 , x2 ) ∈ R2 | 3 x1 + 2 x2 ≥ 8, x1 + 5 x2 ≥ 7, x1 ≥ 0, x2 ≥ 0}
que torna o valor da função objetivo o(x1 , x2 ) = x1 + x2 o menor

possı́vel. O conjunto K está desenhado na Figura B.1. Por inspeção,
vemos que a solução ótima é dada por (x∗1 , x∗2 ) = (2, 1). Este ponto é
a interseção da curva de nı́vel f (x1 , x2 ) = x1 + x2 = c “mais baixa”
que intercepta o conjunto admissı́vel.
145
i i
i i
“tdj”
i i
2017/2/2
page 146
i i
146 [CAP. B: PROGRAMAÇÃO LINEAR
x2
0 2 3 7 x1
Figura B.1: O conjunto admissı́vel do programa linear B.1.
Dizemos que um programa linear está na forma padrão se todas

as variáveis de decisão são não-negativas e se todas as restrições são
em igualdade:
minimizar ∈ R c1 x1 + · · · + cn xn
x1 ,...,xn
sujeito a a11 x1 + ··· + a1n xn = b1 ,
.. .. .. .. ..
. . . . .
am1 x1 + · · · + amn xn = bm ,
e x1 ≥ 0, . . . , xn ≥ 0.
Todo programa linear pode ser reescrito na forma padrão com o uso
de variáveis de folga. Por exemplo, uma restrição da forma
ai1 x1 + · · · + ain xn ≥ bi
pode ser substituı́da, de maneira equivalente, pelas restrições
ai1 x1 + · · · + ain xn − yi = bi e yi ≥ 0.
Se uma variável de decisão xi pode assumir qualquer valor real, isto é,
se não existe restrição de não-negatividade em xi , então podemos
i i
i i
“tdj”
i i
2017/2/2
page 147
i i
147
substituir xi por ui − vi , a diferença de dois números positivos. Se

colocarmos o programa linear B.1 na forma padrão, obtemos o se-
guinte PL:
minimizar x1 + x2
x1 ,x2 ,y1 ,y2 ∈R
sujeito a 3 x1 + 2 x2 − y1 = 8,
x1 + 5 x2 − y2 = 7,
x1 ≥ 0, (B.2)
x2 ≥ 0,
y1 ≥ 0,
y2 ≥ 0.
Um programa linear pode ser escrito de forma mais compacta

usando-se matrizes e vetores:
minimizar
n
cT x
x∈R (B.3)
sujeito a Ax = b e x ≥ 0,
onde x ∈ Rn , c ∈ Rn , b ∈ Rm e A é uma matriz m × n. Note

que o conjunto admissı́vel K = {x ∈ Rn | Ax = b e x ≥ 0} de um
programa linear, quando não-vazio, é um politopo convexo, e que as
hipersuperfı́cies de nı́vel da função objetivo são hiperplanos.
Problemas de maximização podem ser transformados em proble-
mas de minimização substituindo-se a função objetivo o por −o. Mais
precisamente, x∗ é uma solução ótima de
maximizar
n
cT x
x∈R
sujeito a Ax = b e x ≥ 0,
se, e somente se, x∗ também é solução de
minimizar
n
−cT x
x∈R
sujeito a Ax = b e x ≥ 0.
Na teoria de programação linear, assume-se que m < n (existem

mais incógnitas do que restrições em igualdade) e que o posto da
matriz A é m, isto é, as m linhas de A são linearmente independentes.
i i
i i
“tdj”
i i
2017/2/2
page 148
i i
Da teoria de Álgebra Linear sabemos, então, que existem m colunas

de A que são linearmente independentes. Renomeando-se ı́ndices se
necessário, podemos assumir que estas colunas sejam as m primeiras.
Isto induz uma decomposição de A e de x:
' (
xB
A= B C , x= ,
xC
onde B é uma matriz m×m inversı́vel. Como o sistema linear Ax = b
é equivalente a BxB + CxC = b, segue-se então que existe uma
solução x de Ax = b na forma
' (
xB
.
0
Esta solução é denominada solução básica do sistema linear Ax =
b associada à base B. As componentes de xB são denominadas
variáveis básicas.
Teorema B.1 (Teorema Fundamental da Programação

Linear) Considere um programa linear na forma padrão B.3,
com A matriz m × n de posto m.
(a) Se o programa linear possui um ponto admissı́vel, então ele
possui um ponto admissı́vel que é uma solução básica do
sistema linear Ax = b.
(b) Se o programa linear possui um ponto ótimo, então ele pos-
sui um ponto ótimo que é uma solução básica do sistema
linear Ax = b.
O próximo teorema dá uma interpretação geométrica para pontos

admissı́veis que são soluções básicas: eles correspondem aos pontos
extremos (vértices) do politopo K = {x ∈ Rn | Ax = b e x ≥ 0}.
Definição B.1 (Ponto Extremo) Dizemos que um ponto x

em um conjunto convexo U é ponto extremo de U se não existem
dois outros pontos distintos x1 e x2 em U tais que x = α x1 +
(1 − α) x2 para algum α no intervalo (0, 1).
i i
i i
“tdj”
i i
2017/2/2
page 149
i i
149
Na Figura B.2, x1 , x2 e x3 são os únicos pontos extremos do

conjunto admissı́vel K do PL B.1. O ponto x4 não é um ponto
extremo de K, pois ele pode ser escrito como uma combinação con-
vexa de x2 ∈ K e x3 ∈ K. Como x6 = α x5 + (1 − α) x7 para
algum α ∈ (0, 1), vemos que o ponto x6 (no interior do conjunto
admissı́vel) também não é um ponto extremo de K.
x2
4 x1 x6 x7
x5
3
x2
1 x4
x3
0
2 3 7 x1
Figura B.2: x1 , x2 e x3 são os únicos pontos extremos do conjunto

admissı́vel do PL B.1.
Teorema B.2 (Equivalência entre Pontos Extremos e

Soluções Básicas) Seja A uma matriz m × n de posto m,
b um vetor em Rm e K = {x ∈ Rn | Ax = b e x ≥ 0} o con-
junto admissı́vel de B.3. Então x é um ponto extremo de K
se, e somente se, x é um ponto admissı́vel que é solução básica
de Ax = b.
Os teoremas B.1 e B.2 dizem que, para se resolver o problema B.3, não
é preciso considerar todos os pontos do conjunto admissı́vel K: basta
procurar pelo ponto ótimo entre os pontos extremos (vértices) de K!
O método simplex explora esta estrutura para construir um algoritmo
muito popular para se resolver B.3. Outra categoria de métodos que
i i
i i
“tdj”
i i
2017/2/2
page 150
i i
recentemente ganhou bastante popularidade é a classe dos métodos

de ponto interior. Não é nosso propósito estudar estes algoritmos
aqui. O leitor interessado poderá consultar os livros [14, 52]. O que é
preciso se ter em mente é que programas lineares podem ser resolvidos
numericamente de maneira muito eficiente nos dias de hoje. A seguir
estabeleceremos resultados sobre dualidade, um conceito fundamental
e muito útil em programação linear.
Definição B.2 (O problema dual) O problema dual de
minimizar
n
cT x
x∈R (B.4)
sujeito a Ax ≥ b e x ≥ 0,
é o programa linear
maximizar
m
λT b
λ∈R (B.5)
sujeito a AT λ ≤ c e λ ≥ 0,
m
onde λT b = i=1 λi bi . B.5 é denominado o problema dual
de B.4. Neste contexto, B.4 é denominado problema primal.
Por exemplo, o problema dual do programa linear B.1 é
minimizar 8 λ1 + 7 λ2
λ1 ,λ2 ∈R
sujeito a 3 λ1 + λ2 ≤ 1,
2 λ1 + 5 λ2 ≤ 1, (B.6)
λ1 ≥ 0,
λ2 ≥ 0.
O problema dual de qualquer programa linear pode ser encontrado

convertendo-o para o formato B.4. Por exemplo, como Ax = b se,
e somente se, Ax ≥ b e −Ax ≥ −b, o programa linear na forma
padrão B.3 pode ser escrito na forma do problema primal B.4 da
i i
i i
“tdj”
i i
2017/2/2
page 151
i i
151
seguinte maneira equivalente
minimizar
n
cT x
x∈R
' ( ' (
A b
sujeito a x≥ e x ≥ 0.
−A −b
Particionando-se agora as variáveis duais na forma (u, v), o problema

dual deste último PL é
minimizar
n
uT b − vT b
x∈R
sujeito a AT u − AT v ≤ c, u ≥ 0 e v ≥ 0.
Fazendo-se λ = u − v, o problema acima pode ser simplificado, o que

nos leva ao seguinte par de problemas duais:
Par Dual B.1

(problema primal) (problema dual)
minimizar
n
T
c x maximizar
m
λT b
x∈R λ∈R
sujeito a Ax = b, sujeito a AT λ ≤ c.
x ≥ 0,
Outros pares de problemas duais de interesse são dados a seguir.
Par Dual B.2

maximizar
n
T
c x minimizar
m
λT b
x∈R λ∈R
sujeito a Ax = b, sujeito a AT λ ≥ c.
x ≥ 0,
i i
i i
“tdj”
i i
2017/2/2
page 152
i i
Par Dual B.3 (O da Definição B.2)

minimizar
n
T
c x maximizar
m
λT b
x∈R λ∈R
sujeito a Ax ≥ b, sujeito a AT λ ≤ c,
x ≥ 0, λ ≥ 0.
Par Dual B.4

T
maximizar
m
b y minimizar cT x
y∈R n
x∈R
sujeito a Ay ≤ c, sujeito a xT A ≥ bT,
y ≥ 0, x ≥ 0.
Teorema B.3 (Teorema fraco de dualidade) Se x e λ são

admissı́veis para os problemas B.3 e B.5, respectivamente, então
cT x ≥ λT b.
Este teorema mostra que um ponto admissı́vel para um dos pro-

blemas fornece uma cota para o valor da função objetivo do outro
problema. Os valores associados com o problema primal são sempre
maiores ou iguais aos valores associados com o problema dual. Como
corolário, vemos que se um par de pontos admissı́veis pode ser encon-
trado para os problemas primal e dual com valores iguais da função
objetivo, então estes pontos são ótimos.
Teorema B.4 (Teorema forte de dualidade) Se um dos

problemas B.3 ou B.5 tem uma solução ótima finita, então o
outro também terá uma solução ótima finita e, neste caso, os
valores das respectivas funções objetivo são iguais. Se a função
i i
i i
“tdj”
i i
2017/2/2
page 153
i i
153
objetivo do problema primal não é limitada inferiormente, então

o conjunto admissı́vel do problema dual é vazio e, se a função
objetivo do problema dual não é limitada superiormente, então
o conjunto admissı́vel do problema primal é vazio.
O conjunto admissı́vel do problema dual B.6 do programa linear B.1

está desenhado na Figura B.3. Por inspeção, vemos que a solução
ótima é dada por (λ∗1 , λ∗2 ) = (4/13, 1/13). Este ponto é a interseção da
curva de nı́vel g(λ1 , λ2 ) = 8 λ1 + 7 λ2 = c “mais alta” que intercepta
o conjunto admissı́vel. Lembrando que (x∗1 , x∗2 ) = (2, 1) é a solução
do problema primal B.1, vemos que
f (x∗1 , x∗2 ) = x∗1 + x∗2 = 3 = 8 λ∗1 + 7 λ∗2 = g(λ∗1 , λ∗2 ),
como afirma o teorema forte da dualidade.
¸2
3/7
1/5
(4/13, 1/13)
3/8
0 1/3 ¸1
Figura B.3: O conjunto admissı́vel do problema dual B.6 do pro-

grama linear B.1.
Por fim, gostarı́amos de observar que se a função objetivo do pro-

grama linear B.3 não é limitada inferiormente no conjunto admissı́vel
i i
i i
“tdj”
i i
2017/2/2
page 154
i i
K = {x ∈ Rn | Ax = b e x ≥ 0} ,
então existem ponto extremo x e raio extremo r de K tal que o valor
da função objetivo de B.3 em x = x +tr tende a −∞ quando t tende
a +∞. Em particular,
cT
r < 0.
Dizemos que r é um raio de K se, e somente se, r = 0 e o conjunto
{p ∈ Rn | p = x + t r e t ≥ 0} está contido em K para todo x ∈ K.
Um raio r de K é extremo, se não existem outros dois raios r1 e r2
de K (com r1 = t r2 para todo t > 0) e um escalar s no intervalo (0, 1)
tal que
r = s r1 + (1 − s) r2 .
x2
r1
r2
r3
K
0 x1
Figura B.4: Os vetores r1 e r2 não são raios extremos de K. O ve-

tor r3 é um raio extremo de K.
i i
i i
“tdj”
i i
2017/2/2
page 155
i i
Apêndice C
Respostas dos exercı́cios
Capı́tulo 2
[01] O processo de dominância estrita iterada reduz o jogo para uma
matriz 1×1 com um único perfil de estratégias puras: (s13 , s22 ).
[02] (a) Não existem estratégias dominantes neste jogo.
(b) (l1 , c1 ) e (l2 , c2 ) são os únicos equilı́brios de Nash em es-
tratégias puras do jogo.
[03] (a) c2 domina estritamente c1 .
(b) (l2 , c2 ) é o único equilı́brio de Nash em estratégias puras do
jogo.
(b) (desviar, não desviar) e (não desviar, desviar) são os únicos
equilı́brios de Nash em estratégias puras do jogo.
(b) (brigar, ameaçar) e (ameaçar, brigar) são os únicos equilı́brios
de Nash em estratégias puras do jogo.
[06] Usando o processo de dominância fraca iterada, o jogo se reduz
para uma matriz 3 × 3:
155
i i
i i
“tdj”
i i
2017/2/2
page 156
i i
156 [CAP. C: RESPOSTAS DOS EXERCÍCIOS
Eixo
A B C
1 (+13, −13) (+29, −29) (+ 8, − 8)
Aliados .
3 (+18, −18) (+22, −22) (+31, −31)
6 (+23, −23) (+22, −22) (+19, −19)
[07] O processo de dominância estrita iterada reduz o jogo para

uma matriz 1 × 1 × 1 com um único perfil de estratégias puras:
(x3 , y2 , z4 ).
[08] O processo de dominância estrita iterada reduz o jogo para

uma matriz 1 × 1 × 1 com um único perfil de estratégias puras:
(x2 , y1 , z2 ).
[09] O perfil de estratégias (x2 , y2 , z3 ) é o único equilı́brio de Nash

em estratégias puras do jogo.
[10] (a) Para o jogador 1, a estratégia M é fracamente dominada

pela estratégia T e também fracamente dominada pela es-
tratégia B. Para o jogador 2, a estratégia L é fracamente
dominada pela estratégia R.
(b) O processo de eliminação das estratégias fracamente domi-
nadas conduz a duas reduções 1 × 1: {(B, C)} e {(T, R)}.
(c) Os equilı́brios de Nash em estratégias puras são (T, C),
(T, R) e (B, C). Note que (T, C) não está entre os per-
fis de estratégias encontrados no item anterior.
[11] Suponha, por absurdo, que s∗ = (s∗1 , . . . , s∗n ) não seja um e-

quilı́brio de Nash. Então devem existir ı́ndice i e estratégia
∗ ∗ ∗ ∗
i ∈ Si , com si = si , tais que ui (si , s−i ) < ui (si , s−i ).
pura s[1] [1] [1]
Como, por hipótese, o processo de eliminação reduz o jogo ape-

nas para o perfil s∗ , segue-se que o perfil (s[1] ∗
i , s−i ) foi eliminado
em alguma etapa do processo. Dados que as estratégias puras
em s∗−i não foram eliminadas (se o fossem, o perfil (s∗i , s∗−i )
também seria eliminado), segue-se que a eliminação ocorreu
i i
i i
“tdj”
i i
2017/2/2
page 157
i i
157
porque a estratégia s[1]

i foi fracamente dominada por outra es-
tratégia s[2] i (si , s−i ) ≤ ui (si , s−i ) para todo s−i
[1] [2]
i . Logo, u
que pode ser construı́do com as estratégias que restaram nos
espaços de estratégias puras dos outros jogadores neste estágio
do processo (que inclui s∗−i ) e, mais ainda, pelo menos para
−i , vale a desigualdade estrita: ui (si , s−i ) < ui (si , s−i ).
um s[2] [1] [2] [2] [2]
Das desigualdades
ui (s∗i , s∗−i ) < ui (s[1] ∗ ∗

i , s−i ) ≤ ui (si , s−i )
[2]
e
i , s−i ) < ui (si , s−i )
ui (s[1] [2] [2] [2]
∗
i = si e si = si .
segue-se que s[2] [2] [1]
Agora, por sua vez, o perfil (s[2]i , s−i ) também foi eliminado du-
[2]
rante o processo. Dados que as estratégias puras em s[2] −i não

foram eliminadas nesta etapa (se o fossem, o perfil (s[1] i , s−i )
[2]
também seria eliminado e, portanto, ele não existiria nas eta-

pas seguintes), segue-se que a eliminação correu porque a es-
tratégia s[2]
i foi fracamente dominada por outra estratégia si .
[3]
Logo, ui (si , s−i ) ≤ ui (si , s−i ) para todo s−i que pode ser
[2] [3]
construı́do com as estratégias que restaram nos espaços de es-

tratégias puras dos outros jogadores neste estágio do processo
(que inclui s∗−i e s[2]
−i ) e, mais ainda, pelo menos para um s−i ,
[3]
vale a desigualdade estrita: ui (si , s−i ) < ui (si , s−i ). Das

[2] [3] [3] [3]
desigualdades
ui (s∗i , s∗−i ) < ui (s[1] ∗ [2] ∗ [3] ∗

i , s−i ) ≤ ui (si , s−i ) ≤ ui (si , s−i ),
i , s−i ) < ui (si , s−i ) ≤ ui (si , s−i )

ui (s[1] [2] [2] [2] [3] [2]
e
i , s−i ) < ui (si , s−i )
ui (s[2] [3] [3] [3]
∗
i = si , si = si e si = si .
segue-se que s[3] [3] [1] [3] [2]
Prosseguindo desta maneira, construirı́amos uma sequência in-

finita (s[1] [2] [3] [r]
i , si , si , . . . , si , . . .) de estratégias puras distintas do
jogador gi , o que é impossı́vel, dado que Si é, por hipótese,
finito.
i i
i i
“tdj”
i i
2017/2/2
page 158
i i
[12] Note que
ui (p∗ ) = ui (p∗i , p∗−i )

m1 mn

= ··· p∗1j1 · · · · p∗njn · ui (s1j1 , . . . , snjn ).
j1 =1 jn =1
Reordenando os somatórios, obtemos que

mi

ui (p∗i , p∗−i ) = p∗iji · vji = p∗i , v
ji =1
onde
m1 mi−1 mi+1 mn

vji = ··· ··· cj1 ,...,jn · ui (s1j1 , . . . , snjn ),
j1 =1 ji−1 =1 ji+1 =1 jn =1
com cj1 ,...,jn = p∗1j1 · · · p∗(i−1)ji−1 · p∗(i+1)ji+1 · · · p∗njn . Desta ma-

neira,se x1 , . . . , xr ∈ Δi e λ1 , . . . , λr são escalares não-negativos
r
com k=1 λk = 1, então
r * r +

∗
ui λk · xk , p−i = λk · xk , v
k=1 k=1
r

= λk · xk , v
k=1
r
= λk · ui (xk , p∗−i ).
k=1
Nas igualdades acima rnão usamos que λ1 , . . . , λr são escalares

não-negativos com k=1 λk = 1. De fato, esta exigência é
necessária
r apenas para garantir que se x1 , . . . , xr ∈ Δi , então
λ
k=1 k · x k ∈ Δi .
[13] Suponha que a estratégia pura sik do jogador gi seja estrita-

mente dominada por uma estratégia mista
pi = (pi1 , . . . , pik , . . . , pimi ) ∈ Δmi .
i i
i i
“tdj”
i i
2017/2/2
page 159
i i
159
Vamos mostrar que se pi = (pi1 , . . . , pik , . . . , pimi ) é uma outra

estratégia mista do jogador gi com pik > 0, então pi também
é estritamente dominada. Como sik é estritamente dominada
por pi , segue-se que
ui (pi , s−i ) > ui (sik , s−i ), ∀s−i ∈ S−i .
Assim,
mi

(∗)
ui (pi , s−i ) = pir · ui (sir , s−i )
r=1
mi
= pir · ui (sir , s−i ) + pik · ui (sik , s−i )
r=1
r =k
mi

< pir · ui (sir , s−i ) + pik · ui (pi , s−i ),
r=1
r =k
onde, em (∗), usamos a propriedade 2.4 da página 31. Mas, por

esta mesma propriedade,
mi

ui (pi , s−i ) = pir · ui (sir , s−i ).
r =1
Conseqüentemente,
ui (pi , s−i )
<
mi
mi

pir · ui (sir , s−i ) + pik · pir · ui (sir , s−i )
r =1 r =1
r =k
=
mi

(pir + pik · pir ) · ui (sir , s−i ) + pik · pik · ui (sik , s−i )
r=1
r =k
=
mi

pir · ui (sir , s−i ),
r=1
i i
i i
“tdj”
i i
2017/2/2
page 160
i i
onde os coeficientes pir são definidos por

pir + pik · pir , se r = k,
pir =
pik · pik , se r = k.
i
Como pir ≥ 0 para todo r = 1, . . . , mi e m r=1 pir = 1, segue-se
que pi = (pi1 , . . . , pir , . . . , pimi ) é uma distribuição de proba-
bilidades e, sendo assim,
mi

ui (pi , s−i ) < pir · ui (sir , s−i ) = ui (pi , s−i ), ∀s−i ∈ S−i .
r=1
Isto mostra que a estratégia mista pi é estritamente dominada

pela estratégia mista pi .
[14] Para o dilema dos prisioneiros, as funções de melhor resposta
são dadas por:
MRBob (p) = argmaxq∈[0,1] ((4 p + 1) q − (9 p + 1)) = {1},

MRAl (q) = argmaxp∈[0,1] ((4 q + 1) p − (9 q + 1)) = {1}.
A partir das representações gráficas destas funções (Figura C.1),
vemos que o único equilı́brio de Nash em estratégias mistas do
jogo é o perfil (1, 0; 1, 0), que corresponde ao único ponto de
interseção (p∗ , q ∗ ) = (1, 1) das duas representações gráficas.
Para o jogo de comparar moedas, as funções de melhor resposta
são dadas por:
MR2 (p) = argmaxq∈[0,1] (2 (+1 − 2 p) q − 1 + 2 p)

⎧
⎨ {1}, se p ∈ [0, 1/2),
= [0, 1], se p = 1/2,
⎩
{0}, se p ∈ (1/2, 1],
MR1 (q) = argmaxp∈[0,1] (2 (−1 + 2 q) p + 1 − 2 q)
⎧
⎨ {0}, se q ∈ [0, 1/2),
= [0, 1], se q = 1/2,
⎩
{1}, se q ∈ (1/2, 1].
A partir das representações gráficas destas funções (Figura C.2),

vemos que o único equilı́brio de Nash em estratégias mistas do
i i
i i
“tdj”
i i
2017/2/2
page 161
i i
161
(Bob) q
(Confessar) 1
(Negar)
0 1 p (Al)
(Negar) (Confessar)
Figura C.1: Calculando os equilı́brios de Nash usando as representa-

jogo é o perfil (1/2, 1/2; 1/2, 1/2), que corresponde ao único

ponto de interseção (p∗ , q ∗ ) = (1/2, 1/2) das duas representa-
ções gráficas.
[15] Um equilı́brio de Nash não pode por probabilidade positiva em

uma estratégia pura que é estritamente dominada. De fato:
suponha, por absurdo, que p∗ = (p∗i , p∗−i ) seja um equilı́brio
de Nash com p∗i = (p∗i1 , . . . , p∗ik1 , . . . , p∗ik2 , . . . , p∗imi ) e p∗ik1 > 0,
onde sik1 é uma estratégia pura estritamente dominada por sik2 .
Defina agora p•i = (p∗i1 , . . . , 0, . . . , p∗ik1 + p∗ik2 , . . . , p∗imi ). Note
que p•i ∈ Δ(Si ) e ui (p•i , p∗i ) > ui (p∗i , p∗i ), contradizendo o fato
de p∗ = (p∗i , p∗−i ) ser um equilı́brio de Nash. Um equilı́brio de
Nash pode por probabilidade positiva em uma estratégia pura
fracamente dominada. No jogo abaixo,
g2
s21 s22
s11 (12, 10) (28, 26) ,
g1
s12 (20, 46) (20, 46)
i i
i i
“tdj”
i i
2017/2/2
page 162
i i
(g2) q
(s21 ) 1
1/2
(s22 )
0 1/2 1 p (g1)
(s12 ) (s11 )
Figura C.2: Calculando os equilı́brios de Nash usando as representa-

o perfil de estratégias mistas (0, 1; 1/2, 1/2) é um equilı́brio de

Nash que põe probabilidade p21 = 1/2 > 0 na estratégia s21
e s21 é fracamente dominada pela estratégia s22 .
[16] O perfil de estratégias puras s∗ = (confessar, confessar) não é

Pareto eficiente pois, se s• = (negar, negar) é tal que uAl (s• ) =
−1 > −5 = uAl (s• ) e uBob (s• ) = −1 > −5 = uBob (s• ).
Capı́tulo 3
[01] (a) Considere Δ = [0, 1] e F : Δ → Δ cujo gráfico é dado na
Figura C.3.
(b) Considere Δ = (0, 1) e F : Δ → Δ cujo gráfico é dado na
Figura C.4.
(c) Considere Δ = [0, 1/3] ∪ [2/3, 1] e F : Δ → Δ cujo gráfico é
dado na Figura C.5.
i i
i i
“tdj”
i i
2017/2/2
page 163
i i
163
1/2
0 1/2 1 x
Figura C.3: Gráfico do item (a).
2/3
0 1/3 1 x
Figura C.4: Gráfico do item (b).
i i
i i
“tdj”
i i
2017/2/2
page 164
i i
2/3
1/3
0 1/3 2/3 1 x
Figura C.5: Gráfico do item (c).
3/4
1/4
0 1/2 1 x
Figura C.6: φ não possui ponto fixo.
i i
i i
“tdj”
i i
2017/2/2
page 165
i i
165
[02] Conforme a Figura C.6 na página 164, um exemplo é obtido

tomando-se X = [0, 1] e
⎧
⎨[3/4, 1], se 0 ≤ x < 1/2,
φ(x) = [0, 1/4] ∪ [3/4, 1], se x = 1/2,
⎩
[0, 1/4], se 1/2 < x ≤ 1.
[03] O jogo abaixo possui apenas dois equilı́brios de Nash em es-

tratégias mistas.
g2
s21 s22
s11 (1, 1) (0, 0) ,
g1
s12 (0, 0) (0, 0)
Capı́tulo 4
[01] A matriz A tem dois pontos de sela: a13 e a33 .
[02] No jogo de comparar moedas,
' (
+1 −1
A=
−1 +1
Como A tem entradas negativas, vamos substituı́-la por

' ( ' (
A = +1 −1 + 2 1 = +3 +1 .
−1 +1 +1 +3
Assim:
(problema primal)
maximizar y1 + y2
sujeito a 3 y1 + y2 ≤ 1,
y1 + 3 y2 ≤ 1,
y1 ≥ 0,
y2 ≥ 0,
i i
i i
“tdj”
i i
2017/2/2
page 166
i i
(problema dual)
minimizar x1 + x2
sujeito a 3 x1 + x2 ≥ 1,
x1 + 3 x2 ≥ 1,
x1 ≥ 0,
x2 ≥ 0.
A solução do problema dual é (x∗1 , x∗2 ) = (1/4, 1/4) e a solução

do problema primal é (y1∗ , y2∗ ) = (1/4, 1/4). Se
1
θ = x∗1 + x∗2 = y1∗ + y2∗ = ,
2
segue-se que o único equilı́brio de Nash do jogo de comparar
moedas é dado por (p∗ , q∗ ), onde

(x∗ , x∗ ) 1 1 (y ∗ , y ∗ ) 1 1
p∗ = 1 2 = , e q∗ = 1 2 = , .
θ 2 2 θ 2 2
[03] Considere o seguinte jogo matricial geral de ordem 2 × 2:

' (
a b
A= .
d c
Se existe um ponto de sela, basta usarmos os resultados da Sub-

seção 4.3.2 para encontrar um equilı́brio de Nash do jogo. Su-
ponha então que a matriz A não possua pontos de sela. Desta
maneira, o jogo possui apenas equilı́brios de Nash
(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ )
totalmente mistos, isto é, com 0 < p∗ , q ∗ < 1. Se a ≥ b, então

b < c, caso contrário b seria um ponto de sela. Desde que b < c,
devemos ter c > d pois, caso contrário, c seria um ponto de
sela. Prosseguindo desta maneira, vemos que d < a e a > b.
Em outras palavras, se a ≥ b, então a > b, b < c, c > d e d < a.
Por simetria, se a ≤ b, então a < b, b > c, c < d e d > a.
Com isto mostramos que se não existem pontos de sela, então
i i
i i
“tdj”
i i
2017/2/2
page 167
i i
167
ou a > b, b < c, c > d e d < a, ou a < b, b < c, c < d e d > a.

Usando as Equações 4.6, obtemos que
a p∗ + d (1 − p∗ ) = b p∗ + c (1 − p∗ )
Resolvendo para p∗ , encontraremos que
c−d
p∗ =
(a − b) + (c − d)
Como não existem pontos de sela, (a − b) e (c − d) são ambos

positivos ou ambos negativos, e conseqüentemente, 0 < p∗ < 1.
O ganho médio do jogador linha usando esta estratégia é
ac− bd
v ∗ = a p∗ + d (1 − p∗ ) = .
(a − b) + (c − d)
Analogamente, usando as Equações 4.5, obtemos a seguinte ex-

pressão:
c−b
q∗ =
(a − b) + (c − d)
com 0 < q ∗ < 1. A perda média do jogador coluna usando esta
estratégia é
ac − bd
v ∗ = a q ∗ + d(1 − q ∗ ) = .
(a − b) + (c − d)
[04] Como A não possui pontos de sela, o jogo possui apenas equilı́brios
de Nash
(p∗ , 1 − p∗ ; q ∗ , 1 − q ∗ )
totalmente mistos, isto é, com 0 < p∗ , q ∗ < 1. Se v ∗ é o valor
do jogo, então usando as desigualdades 4.3 com q = ek ∈ R4
para k = 1, 2, 3, 4, vemos que
⎡ ∗ ⎤
' ( v
∗ −1 +5 +1 −2 ⎢ v∗ ⎥
p 1 − p∗ ≥⎢ ⎥
⎣ v∗ ⎦ ,
+1 −3 −2 +5
v∗
i i
i i
“tdj”
i i
2017/2/2
page 168
i i
v*
5 Coluna 2
3
v*
*{
=
8p
{7
=
p*
v*
+
v* = 5
2 Coluna 3
1 {2p p*
{
*+ =3
1 v*
0 1 p*
{1 Coluna 1
{2 Coluna 4
{3
Figura C.7: Envelope inferior.
isto é, ⎧ ∗
⎪
⎪ v ≤ −2 p∗ + 1,
⎨ ∗
v ≤ 8 p∗ − 3,
(C.1)
⎪ v∗
⎪ ≤ 3 p∗ − 2,
⎩ ∗
v ≤ −7 p∗ + 5.
As funções afins v ∗ = −2 p∗ + 1, v ∗ = 8 p∗ − 3, v ∗ = 3 p∗ − 2
e v ∗ = 3 p∗ − 2 representam os ganhos médios do jogador linha
quando ele escolhe a distribuição de probabilidades (p∗ , 1−p∗) e
o jogador coluna escolhe as colunas 1, 2, 3 e 4, respectivamente.
Os gráficos destas funções para 0 ≤ p∗ ≤ 1 estão desenhados na
Figura C.7.
Para um valor fixo de p∗ , o jogador linha está seguro de que seu
ganho médio é pelo menos o mı́nimo destas quatro funções cal-
culadas em p∗ , o envelope inferior destas quatro funções. Como
o jogador linha pretende maximizar os seus ganhos médios,
i i
i i
“tdj”
i i
2017/2/2
page 169
i i
169
então ele precisa encontrar p∗ que atinge o máximo deste en-

velope inferior. De acordo com a Figura C.7, o máximo ocorre
justamente na interseção das retas v ∗ = −2 p∗ +1 e v ∗ = 3 p∗ −2,
as quais representam, respectivamente, as colunas 1 e 3 do jo-
gador coluna. Deste modo, uma solução do jogo 2 × 4 original
pode ser obtida estudando-se o jogo 2 × 2 definido pela matriz
' (
−1 +1
R= .
+1 −2
O valor deste jogo é v ∗ = −1/5 para p∗ = 3/5 e q ∗ = 3/5.

Assim, um equilı́brio de Nash do jogo original é dado por

∗ ∗ ∗ ∗ 3 2 3 2
(p , 1 − p ; q , 0, 1 − q , 0) = , ; , 0, , 0 .
5 5 5 5
Naturalmente, a técnica aqui descrita pode ser aplicada para

qualquer jogo de soma zero com matriz A de tamanho 2 × n.
[05] Lembre-se que ul (p, q) = pT Aq e ul (p, q) = −pT Aq. Sejam

ek∗ e el∗ tais que
min ul (p∗ , el ) = ul (p∗ , el∗ )

1≤l≤n
e
max (−uc (ek , q∗ )) = −uc (ek∗ , q∗ ),
1≤k≤m
isto é, p∗T Ael ≥ p∗T Ael∗ para todo l e eTk Aq∗ ≤ eTk∗ Aq∗ para
todo k. Desta maneira,
eTk Aq∗ ≤ eTk∗ Aq∗ = −(−p∗T Ael∗ ) = p∗T Ael∗ ≤ p∗T Ael ,
para todo k = 1, . . . , m e l = 1, . . . , n. Por linearidade, segue-se

que
pT Aq∗ ≤ p∗T Aq,
para todo p ∈ Δm e q ∈ Δn . Em particular, pT Aq∗ ≤ p∗T Aq∗
e p∗T Aq∗ ≤ p∗T Aq, isto é, ul (p, q∗ ) ≤ ul (p∗ , q∗ ) e uc (p∗ , q) ≤
uc (p∗ , q∗ ) para todo p ∈ Δm e q ∈ Δn . Isto mostra que (p∗ , q∗ )
é um equilı́brio de Nash do jogo.
i i
i i
“tdj”
i i
2017/2/2
page 170
i i
Para a matriz A de tamanho 4 × 5 do enunciado, temos que

121 121 160
ul (p∗ , e1 ) = , ul (p∗ , e2 ) = , ul (p∗ , e3 ) = ,
37 37 37
121 169
ul (p∗ , e4 ) = e ul (p∗ , e5 ) = ,
37 37
e
121 121 120
uc (e1 , q∗ ) = , uc (e2 , q∗ ) = , uc (e3 , q∗ ) = e
37 37 37
∗ 121
uc (e4 , q ) = ,
37
de modo que
min ul (p∗ , el ) = 121/37 = max (−uc (ek , q∗ )) = 121/37.

1≤l≤n 1≤k≤m
Pelo resultado acima, isto mostra que (p∗ , q∗ ) é um equilı́brio

de Nash do jogo.
n n
[06] Seja M = l=1 ail = k=1 akj a constante obtida pela soma
de qualquer linha ou coluna. Defina

∗ ∗ 1 1
p =q = ,..., ∈ Δn .
n n
Observe que, paratodo k, l ∈ {1, . . . , n}, ul (p∗ , el ) = p∗ Ael =

n ∗ ∗ n ∗ ∗
i=1 pi ail = pi
n ∗
anil = M/n e uc (ek , q ) = −ek Aq =
i=1
∗
− j=1 akj qj = −qj j=1 akj = −M/n. Portanto,
M
min ul (p∗ , el ) = = max (−uc (ek , q∗ )).
1≤l≤n n 1≤k≤m
Pelo resultado do exercı́cio anterior, concluı́mos que (p∗ , q∗ ) é

um equilı́brio de Nash do jogo. Para o caso do quadrado mágico
da gravura Melancolia I de Albrecht Dürer,

∗ ∗ 1 1 1 1
p =q = , , ,
4 4 4 4
e o valor do jogo é v ∗ = 34/4 = 17/2.
i i
i i
“tdj”
i i
2017/2/2
page 171
i i
171
[07] Se (p∗ , q∗ ) é um equilı́brio de Nash totalmente misto, então,

pelas relações 4.5,
n

aij qj∗ = v ∗ , ∀i ∈ {1, . . . , n}.
j=1
Estas equações podem ser escritas usando-se matrizes da se-

guinte maneira: Aq∗ = v ∗ ½. Como, por hipótese, A é uma
matriz inversı́vel, segue-se que q∗ = v ∗ A−1 ½. Agora,
n
1
qj∗ = 1 ⇒ 1 = ½T q∗ = v ∗ ½T A½ ⇒ v∗ = .
j=1
½T A−1 ½
Sendo assim,
A−1 ½
q∗ = .
½T A−1 ½
Do mesmo modo, pelas relações 4.6,
n

p∗i aij = v ∗ , ∀j ∈ {1, . . . , n}.
i=1
Estas equações podem ser escritas usando-se matrizes da se-

guinte maneira: p∗T Aq∗ = v ∗ ½. Como, por hipótese, A é uma
matriz inversı́vel, segue-se que p∗ = v ∗ ½A−1 e, assim,
½A−1
p∗ = .
½T A−1 ½
Capı́tulo 5
[01] O equilı́brio de Nash em estratégias puras obtido por indução
retroativa é
((Parar, Parar), (Parar, Parar)).
Este equilı́brio não é Pareto eficiente pois, em comparação com
o perfil acima,
((Continuar, Continuar), (Continuar, Continuar))
dá um ganho maior para os dois jogadores.
i i
i i
“tdj”
i i
2017/2/2
page 172
i i
[02] O equilı́brio de Nash em estratégias puras obtido por indução

retroativa é
(Não confiar, Trair).
Este equilı́brio não é Pareto eficiente pois, em comparação com
o perfil acima,
(Confiar, Honrar)
dá um ganho maior para os dois jogadores.
i i
i i
“tdj”
i i
2017/2/2
page 173
i i
Referências
Bibliográficas
[01] K. R. Apt, Uniform Proofs of Order Independence for Various

Strategy Elimination Procedures. Contributions to Theoretical
Economics, vol. 4, no. 1, article 5, 48 páginas, 2004.
[02] R. Aumann, What Is Game Theory Trying to Accomplish?.

Em Frontiers of Economics, K. Arrow, S. Honkapohja e
B. Blackwell (editores), pp. 28-76, 1985.
[03] R. Avenhaus, M. Canty, D. M. Kilgour, B. von Stengel, S. Za-

mir, Inspection Games in Arms Control. European Journal of
Operational Research, vol. 90, no. 3, pp. 383-394, 1996.
[04] G. S. Becker, Crime and Punishment: An Economic Approach.

Journal of Politial Economy, vol 79, pp. 169-217, 1968.
[05] A. T. Benjamin e A. J. Goldman, Analysis of the N-Card

Game Le Her. Journal of Optimization Theory and Applica-
tions, vol. 114, no. 3, pp. 695–704, 2002.
[06] J. Bertrand. Theorie Mathematique de la Richesse Sociale.

Journal des Savants, pp. 499-508, 1883.
[07] E. Borel, The Theory of Play and Integral Equations with Skew
Symmetric Kernels. Econometrica, vol. 21, no. 1, pp. 97-100,
1953. Originalmente publicado em: Comptes Rendus Hebdo-
madaires des Seances de l’Academie des Sciences, 1921.
173
i i
i i
“tdj”
i i
2017/2/2
page 174
i i
174 REFERÊNCIAS BIBLIOGRÁFICAS
[08] E. Borel, On Games that Involve Chance and the Skill of the
Players. Econometrica, vol. 21, no. 1, pp. 101-115, 1953. Origi-
nalmente publicado em: Elements de la Théorie des Probabi-
lités, 1924.
[09] T. Börgers, Pure Strategy Dominance. Econometrica, vol. 61,

no. 1, pp. 423-430, 1993.
[10] S. J. Brams e D. M. Kilgour, Game Theory and National Se-

curity. Basil Blackwell, 1988.
[11] F. Brandt, F. Fischer e Y. Shoham, On Strictly Competitive

Multi-Player Games. Proceedings of the 21st National Confe-
rence on Artificial Intelligence (AAAI), AAAI Press, pp. 605-
612, 2006.
[12] J. N. Brown e R. W. Rosenthal, Testing The Minimax Hy-

pothesis: A Re-Examination of O’Neill’s Game Experiment.
Econometrica, vol 58, no. 5, pp. 1065-1081, 1990.
[13] L. I. de Castro e J. H. Faro, Introdução à Teoria da Escolha.

25o Colóquio Brasileiro de Matemática, IMPA, 2005.
[14] V. Chvátal, Linear Programming. W. H. Freeman and Com-

pany, 1983.
[15] Y. C. Chen, N. Y. Long e X. Luo, Iterated Strict Dominance

in General Games. CIRANO Working Papers, 2007s-03, 2007.
[16] S.-F. Cheng e M. P. Wellman, Iterated Weaker-Than-Weak

Dominance Twentieth International Joint Conference on Ar-
tificial Intelligence, Hyderabad, India, pp. 1233-1238, 2007.
[17] P. A. Chiappori, S. Levitt e T. Groseclose, Testing Mixed-

Strategy Equilibria When Players Are Heterogeneous: The Case
of Penalty Kicks in Soccer. The American Economic Review,
vol. 92, no. 4, pp. 1138-1151, 2002.
[18] V. Conitzer e T. Sandholm, Complexity of (Iterated) Domi-

nance. Proceedings of the 6th ACM Conference on Electronic
Commerce, pp. 88–97, 2005.
i i
i i
“tdj”
i i
2017/2/2
page 175
i i
REFERÊNCIAS BIBLIOGRÁFICAS 175
[19] A. A. Cournot, Recherches sur les Principes Mathématiques de

la Théorie des Richesses, 1838. Traduzido por N. T. Bacon em
Researches into the Mathematical Principles of the Theory of
Wealth, McMillan, New York, 1927.
[20] R. S. Datta, Algebraic Methods in Game Theory. Tese de dou-

torado, Departamento de Matemática, University of California
at Berkeley, 2003.
[21] R. S. Datta, Using Computer Algebra To Find Nash Equilibria.

International Conference on Symbolic and Algebraic Compu-
tation, Proceedings of the 2003 International Symposium on
Symbolic and Algebraic Computation, pp. 74-79, 2003.
[22] R. S. Datta, Finding All Nash Equilibria of a Finite Game

Using Polynomial Algebra. Artigo aceito para publicação, The
Journal of Economic Theory, 2007. Disponı́vel eletronicamente
em: http://arxiv.org/abs/math.AC/0612462.
[23] G. Debreu, A Social Equilibrum Existence Theorem. Proceed-

ings of the National Academy of Sciences of the United States
of America (PNAS), vol. 38, no. 10, pp. 886-893, 1952.
[24] G. Debreu, Existence of Competitive Equilibrium. Em Hand-

book of Mathematical Economics, vol. II, K. J. Arrow e M. D.
Intriligator (editores), North-Holland, pp. 697-743, 1982.
[25] M. Dresher, Games of Strategy: Theory and Applications.

Prentice-Hall, Englewood Cliffs, 1961.
[26] M. Dufwenberg e M. Stegeman, Existence and Uniqueness of

Maximal Reductions Under Iterated Strict Dominance. Econo-
metrica, vol. 70, n. 5, pp. 2007–2023, 2002.
[27] K. Etessami, Algorithmic Game Theory and Aplications. Lec-

ture Notes, School of Informatics, The University of Edinburgh,
Scotland, UK, 2004.
[28] A. Fabrikant, A. Luthra, E. Maneva, C. H. Papadimitriou e

S. Shenker, On a Network Creation Game. Annual ACM Sym-
posium on Principles of Distributed Computing, Proceedings
i i
i i
“tdj”
i i
2017/2/2
page 176
i i
of the Twenty-Second Annual Symposium on Principles of Dis-

tributed Computing, pp. 347–351, 2003.
[29] J. W. Friedman, Game Theory with Aplications to Economics,

Second Edition. Oxford University Press, 1990.
[30] D. Fudenberg e D. K. Levine, The Theory of Learning in

Games. The MIT Press, 1996.
[31] D. Fudenberg e J. Tirole, Game Theory. The MIT Press, 1995.
[32] I. Gilboa, E. Kalai e E. Zemel, On the Order of Elimina-

ting Dominated Strategies. Operations Research Letters, vol. 9,
pp. 85–89, 1990.
[33] I. Gilboa, E. Kalai e E. Zemel, The Complexity of Eliminating

Dominated Strategies, Mathematics of Operations Research,
vol. 18, no. 3, pp. 553–565, 1993.
[34] I. L. Glicksberg, A Further Generalization of the Kakutani

Fixed Point Theorem, with Application to Nash Equilibrium
Points, Proceedings of the American Mathematical Society,
vol. 3, no. 1, pp. 170-174, 1952.
[35] S. Govindan e R. Wilson, Direct Proofs of Generic Finiteness

of Nash Equilibrium Outcomes. Econometrica, vol. 69, no. 3,
pp. 765-769, 2001.
[36] F. Gül, D. Pearce, E. Stacchetti, A Bound on The Proportion

of Pure Strategy Equilibria in Generic Games. Mathematics of
Operations Research, vol. 18, no. 3, pp. 548-552, 1993.
[37] A. Hald, A History of Probability and Statistics and Their Ap-

plications before 1750. John Willey & Sons, New York, 1990.
[38] G. Hardin, The Tragedy of the Commons. Science, vol 162,

pp. 1243-1248, 1968.
[39] J. C. Harsanyi, Games with Randomly Disturbed Payoffs: A

New Rationale for Mixed Strategy. International Journal of
Game Theory, vol. 2, no. 1, pp. 1-23, 1973.
i i
i i
“tdj”
i i
2017/2/2
page 177
i i
[40] J. C. Harsanyi, Oddness of The Number of Equilibrium Points:

A New Proof. International Journal of Game Theory, vol. 2,
no. 1, pp. 235-250, 1973.
[41] S. Hart, Games in Extensive and Strategic Forms. Capı́tulo 2

em Handbook of Game Theory, vol. 1, R. J. Aumann e S. Hart
(editores), Elsevier Science Publishers, 1992.
[42] J. B. Hiriart-Urruty e C. Lemarechal, Convex Analysis and Mi-

nimization Algorithms I: Fundamentals. Springer-Verlag, 1993.
[43] J. Hirshleifer e E. Rasmusen, Are Equilibrium Strategies Unaf-

fected by Incentives?. Journal of Theoretical Politics, vol. 4,
no. 3, pp. 353-367, 1992.
[44] H. Hotelling, The Stability of Competition. The Economic Jour-

nal, vol 39, no. 153, pp. 41-57, 1929.
[45] S. Kakutani, A Generalization of Brouwer’s Fixed Point The-

orem. Duke Mathematical Journal, vol 8, pp. 457-459, 1941.
[46] T. H. Kjeldsen, John von Neumann’s Conception of the Mini-

max Theorem: A Journey Through Different Mathematical
Contexts. Archive for History of Exact Sciences, vol. 56, no. 1,
pp. 39-68, 2001.
[47] D. Knuth, C. Papadimitriou e J. Tsitsiklis, A Note on Strategy

Elimination in Bimatrix Games. Operations Research Letters,
vol. 7, pp. 103–107, 1988.
[48] D. M. Kreps, Game Theory and Economic Modelling. Claren-

don Lectures in Economics, Oxford University Press, 1990.
[49] C. E. Lemke e J. T. Howson Jr., Equilibrium Points of Bima-

trix Games. Journal of the Society for Industrial and Applied
Mathematics, vol. 12, no. 2, pp. 413-423, 1964.
[50] R. J. Leonard, From Parlor Games to Social Science: Von Neu-

mann, Morgenstern, and the Creation of Game Theory 1928-
1944. Journal of Economic Literature, vol. 33, no. 2, pp. 730-
761, 1995.
i i
i i
“tdj”
i i
2017/2/2
page 178
i i
[51] R. J. Lipton e E. Markakis, Nash Equilibria via Polynomial

Equations. Em LATIN 2004: Theoretical Informatics, Lectures
Notes in Computer Science, Springer-Verlag, pp. 413-422, 2004.
[52] D. G. Luenberger, Linear and Nonlinear Programming, Second

Edition. Addision-Wesley Publishing Company, 1989.
[53] W. B. MacLeod, Incentives in Organizations: An Overview of

Some of the Evidence and Theory. Em Trends in Business Or-
ganization, Horst Siebert (editor), The Kiel Institute of World
Economics, 1995.
[54] E. Markakis, Computational Aspects of Game Theory and Mi-

croeconomics. Tese de doutorado, Faculdade de Computação,
Georgia Institute of Technology, 2005.
[55] L. M. Marx e J. M. Swinkels, Order Independence for Iterat-

ed Weak Dominance. Games and Economic Behavior, vol 18,
pp. 219–245, 1997.
[56] J. Maynard Smith e G. R. Price, The Logic of Animal Conflict.

Nature, vol. 246, no. 5427, pp. 15-18, 1973.
[57] K. A. McCabe, A. Mukherji e D. E. Runkle, An Experimental

Study of Information and Mixed-Strategy Play in Three-Person
Matching-Pennies Game. Economic Theory, vol. 15, pp. 421-
462, 2000.
[58] R. D. McKelvey, A Liapunov Function for Nash Equilibria. So-

cial Science Working Paper 953, California Institute of Tech-
nology, 1998.
[59] R. D. McKelvey e A. McLennan, The Maximal Number of Regu-

lar Totally Mixed Nash Equilibria. Journal of Economic Theory,
vol. 72, pp. 411-425, 1997.
[60] A. McLennan, The Maximal Generic Number of Pure Nash

Equilibria. Journal of Economic Theory, vol. 72, no. 2, pp. 408-
410, 1997.
i i
i i
“tdj”
i i
2017/2/2
page 179
i i
[61] I. Milchtaich, Congestion Games with Player-Specific Payoff

Functions. Games and Economic Behavior, vol 13, n. 1,
pp. 111–124, 1996.
[62] P. R. Milgrom e R. J. Weber, A Theory of Auctions and Com-

petitive Bidding. Econometrica, vol. 50, no. 5, pp. 1089-1122,
1982.
[63] J. Milnor, Analytic Proofs of the “Hairy Ball Theorem” and the
Brouwer Fixed Point Theorem. The American Mathematical
Monthly, vol. 85, no. 7, pp. 521-524, 1978.
[64] K. G. Murty, Linear Complementarity, Linear and Nonlinear

Programming. Heldermann-Verlag, 1988.
[65] R. G. Myerson, Nash Equilibrium and the History of Econo-

mic Theory. Journal of Economic Literature, vol. 37, no. 3,
pp. 1067-1082, 1999.
[66] J. F. Nash Jr., Equilibrium Points in n-person Games. Procee-

dings of the National Academy of Sciences of the United States
of America, pp. 48–49, 1950.
[67] J. F. Nash Jr., Non-Cooperative Games. PhD. Thesis. Prince-

ton University Press, 1950.
[68] J. F. Nash Jr., The Bargaining Problem. Econometrica, vol. 18,

no. 2, pp. 155–162, 1950.
[69] J. F. Nash Jr., Non-Cooperative Games. Annals of Mathemat-

ics, vol. 54, pp. 286–295, 1951.
[70] J. F. Nash Jr., Two-person Cooperative Games. Econometrica,

pp. 128–140, 1953.
[71] J. von Neumann. Zur Theorie der Gesellschaftsspiele. Mathe-

matische Annalen, vol. 100, pp. 295-320. Traduzido por S.
Bargmann: On the Theory of Games of Stategy em Contribu-
tions to the Theory of Games, vol. 4, pp. 13-42, A. W. Tucker
e R. D. Luce (editores), Princeton University Press, 1959.
i i
i i
“tdj”
i i
2017/2/2
page 180
i i
[72] J. von Neumann e O. Morgenstern, Theory of Games and Eco-

nomic Behavior. Princeton University Press, 1944.
[73] B. O’Neill, Nonmetric Test of the Minimax Theory of Two-

person Zerosum Games. Proceedings of the National Academy
of Sciences of the United States of America (PNAS), vol. 84,
pp. 2106-2109, 1987.
[74] M. J. Osborne e A. Rubinstein, A Course in Game Theory.

The MIT Press, 1994.
[75] R. Otter e J. Dunne, Games with Equilibrium Points. Proceed-

ings of the National Academy of Sciences of the United States
of America (PNAS), vol. 39, pp. 310-314, 1953.
[76] R. Radner e R. Roshental, Private Information and Pure Strat-

egy Equilibrium. Mathematics of Operations Research, vol. 7,
pp. 401-409, 1982.
[77] A. Rapoport e R. B. Boebel, Mixed Strategies in Strictly Com-

petitive Games: A Further Test of The Minimax Hypothesis.
Games and Economic Behaviour, vol. 4, no. 2, pp. 261-283,
1992.
[78] P. J. Reny, On The Existence of Pure and Mixed Strategy Nash

Equilibria in Discontinuous Games. Econometrica, vol. 67,
no. 5, pp. 1029-1056, 1999.
[79] C. A. Rogers, A Less Strange Version of Milnor’s Proof of

Brouwer’s Fixed-Point Theorem. The American Mathematical
Monthly, vol. 87, no. 7, pp. 525-527, 1980.
[80] R. W. Rosenthal, A Class of Games Possessing Pure-Strategy

Nash Equilibria. International Journal of Game Theory, vol. 2,
n. 1, pp. 65–67, 1973.
[81] A. Rubinstein, Comments On The Interpretation of Game The-

ory. Econometrica, vol. 59, no. 4, pp. 909-924, 1991.
[82] B. W. Russell, Common Sense and Nuclear Warfare. George

Allen & Unwin, 1959.
i i
i i
“tdj”
i i
2017/2/2
page 181
i i
[83] T. L. Saaty, Mathematical Models of Arms Control and Disar-

mament: Application of Mathematical Structures in Politics.
John Wiley & Sons, 1968.
[84] R. Savani e B. von Stengel, Exponentially Many Steps for Find-

ing a Nash Equilibrium in a Bimatrix Game. CDAM Research
Report LSE-CDAM-2004-03, 2004.
[85] T. C. Schelling, The Strategy of Conflict. Oxford University

Press, 1968.
[86] U. Schwalbe e P. Walker, Zermelo and the Early History of

Game Theory. Games and Economic Behavior, vol. 34, no. 1,
pp. 123-137, 2001.
[87] L. S. Shapley, A Note on the Lemke-Howson Algorithm.

Mathematical Programming Study I: Pivoting and Extensions,
pp. 175-189, 1974.
[88] H. von Stackelberg, Marktform und Gleichgewicht. Julius

Springer, 1934.
[89] T. Stuckless, Brouwer’s Fixed Point Theorem: Methods of

Proof and Generalizations. Dissertação de mestrado, Departa-
mento de Matemática, Simon Fraser University, 2003.
[90] I. Todhunter, A History of the Mathematical Theory of Proba-

bility. Chelsea, New York, 1949.
[91] J. P. Torres-Martı́nez, Fixed Points as Nash equilibria. Fixed

Point Theory and Applications, vol. 2006, 4 páginas, 2006.
[92] G. Tsebelis, The Abuse of Probability In Political Analysis: The

Robison Crusoe Fallacy. The American Political Science Re-
view, vol. 83, no. 1, pp. 77-91, 1989.
[93] G. Tsebelis, Are Sanctions Effective? A Game-Theoretic

Analysis. The Journal of Conflict Resolution, vol. 34, no. 1,
pp. 3-28, 1990.
i i
i i
“tdj”
i i
2017/2/2
page 182
i i
[94] A. Vetta, Nash Equilibria in Competitive Societies, with Ap-

plications to Facility Location, Traffic Routing and Auctions.
Proceedings of the 43rd Annual IEEE Symposium on Founda-
tions of Computer Science (FOCS’02), IEEE Computer Society,
pp. 416–425, 2002.
[95] N. N. Vorob’ev, Foundations of Game Theory: Noncooperative
Games. Birkhäuser Verlag, 1994.
[96] P. Walker, A Chronology of Game Theory. http://www.econ.
canterbury.ac.nz/personal pages/paul walker/gt/hist
.htm, 2005.
[97] R. Wilson, Computing Equilibria of N-Person Games. SIAM
Journal on Applied Mathematics, vol. 21, no 1, 1971.
[98] E. Zermelo, Über eine Anwendung der Mengdenlehre auf die
theories des Schachspiels. Atas do Décimo Quinto Congresso
Internacional de Matemáticos, vol. 2, pp. 501–504, 1913.
[99] J. Zhao, The Equivalente Between Four Economic Theorems
and Brouwer’s Fixed Point Theorem. Working paper, Depart-
ment of Economics, Iowa State University, 2002.
i i
i i
“tdj”
i i
2017/2/2
page 183
i i
Índice
Árvore, 109 de estratégia estritamente

dominante, 15, 35
Bernoulli, Nicholas, 5, 126 de estratégia fracamente do-
Bertrand minante, 18
Modelo de duopólio, 129 de Nash, 20, 110
Binmore, Kenneth, 119 em estratégias mistas, 35
Borel, Émile, 6 perfeito em subjogos, 117
Espaço de estratégias
Combinação convexa, 31, 138 mistas, 29
Complementaridade Linear, 102 puras, 11
Conjunto Estratégia
admissı́vel de um PL, 145 de um jogo sequêncial, 109
convexo, 137 mista, 27
Cournot suporte, 80
Augustin, 5 pura, 11
Modelo de duopólio, 126 totalmente mista, 69
Folgas complementares, 102
de Montmort, Pierre Rémond, Folha de uma árvore, 109
126 Forma
Dominância normal, 11
em estratégias mistas, 32 padrão de um PL, 146
em estratégias puras, 14 Função
estrita iterada, 15, 34 côncava, 139
fraca iterada, 18 convexa, 139
Dürer, Albrecht, 107 de melhor reposta, 22
objetivo de um PL, 145
Eficiência de Pareto, 59 quase-côncava, 142
Equilı́brio quase-convexa, 142
183
i i
i i
“tdj”
i i
2017/2/2
page 184
i i
184 ÍNDICE
utilidade, 11 Kalmar, Laszlo, 6

esperada, 30
Le Her, 120
Gambit, 104 Lloyd, William Forster, 133
Ganho, 10
Market-clearing, 127
Hardin, Garret, 134 Matriz de payoffs, 12
Harsanyi, John, 9 Melhor resposta, 22
Método simplex, 149
Indução retroativa, 114 Modelo de Duopólio
Informação perfeita, 108 de Bertrand, 129
de Cournot, 126
Jogo de Stackelberg, 131
a batalha dos sexos, 13 Montmort, Pierre Rémond, 5
bimatricial, 101 Morgenstern, Oskar, 8
Chicken, 52
Nash
comparar moedas, 21
Equilı́brio de
da centopéia, 119
em estratégias mistas, 35
da confiança, 119
em estratégias puras, 20
da inspeção, 42
Nash Jr., John Forbes, 9, 60
de informação perfeita, 108
Nó de uma árvore, 109
de soma zero, 82
2 × 2, 106 Ótimo de Pareto, 59
2 × n, 169
matriz inversı́vel, 107 Pareto, eficiência de, 59
quadrado mágico, 107 Payoff , 10
do covarde, 52 Perfil de estratégias
estratégico, 11 mistas, 29
estritamente competitivo, puras, 11
82 Politopo, 138
hawk-dove, 54 Ponto
Le Her, 120 extremo, 148
na forma extensa, 108 fixo, 60, 65
na forma normal, 11 Problema
não-cooperativo, 11 de complementaridade li-
o dilema do prisioneiro, 11 near, 102
quadrado mágico, 107 dual, 150
sequêncial, 108 dual de um LP, 150
i i
i i
“tdj”
i i
2017/2/2
page 185
i i
ÍNDICE 185
primal de um LP, 150 básica de um PL, 148

Produto homogêneo, 126 de folga de um PL, 146
Proposição da Irrelevância do Payoff, von Neumann, John, 7
47 von Stackelberg, Heinrich, 131
Quadrado mágico, 107 Waldegrave, James, 5, 126

Whitehead, Alfred North, 134
Raiz de uma árvore, 109
Ramo de uma árvore, 109 Zermelo, Ernst, 6
Rosenthal, Robert W., 119
Russell, Bertrand, 52
Selten, Reinhard, 9, 117

Semiespaço, 138
Semiplano, 138
Simplex, 149
Solução
básica de um PL, 148
Solução estratégica, 20
Stackelberg
Modelo de duopólio, 131
Subjogo, 116
Suporte, 80
Teorema
do ponto fixo de Brouwer,
60
do ponto fixo de Kakutani,
65
forte de dualidade, 152
fraco de dualidade, 152
fundamental da programação
linear, 148
Tucker, Albert W., 11
Utilidade, 11
esperada, 30
Variável
i i
i i

Introducao Teoria Economica Dos Jogos Bortolossi PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Introducao Teoria Economica Dos Jogos Bortolossi PDF

Enviado por

Direitos autorais:

Formatos disponíveis

“tdj”

UMA INTRODUÇÃO À TEORIA

Humberto José Bortolossi

Por favor, envie suas sugestões, correções e crı́ticas para

À minha esposa Joselı́ e à minha ﬁlha Hillary Winry.

À minha mãe Rita e aos meus irmãos Humberto e Reginaldo.

1 Alguns marcos históricos 5

2 Jogos na forma estratégica 10

3 O teorema de equilı́brio de Nash 60

4 Calculando equilı́brios de Nash 71

5 Jogos na forma extensa 108

B Programação Linear 145

C Respostas dos exercı́cios 155

topologia, otimização e probabilidade se integram em uma teoria apli-

Humberto José Bortolossi

Neste capı́tulo apresentaremos alguns marcos históricos da teoria

estratégia mista é uma distribuição de probabilidades sobre o conjunto de es-

6 [CAP. 1: ALGUNS MARCOS HISTÓRICOS

Figura 1.1: Antoine Augustin Cournot (1801–1877).

mercado como sendo a situação em que ambas as empresas reagem

Figura 1.2: Ernst Friedrich Ferdinand Zermelo (1871–1953).

para n = 5 ([08]). Borel acreditava que o resultado de existência

Figura 1.3: Félix Edouard Justin Émile Borel (1871-1956).

No artigo Zur Theorie der Gesellschaftsspiele de 1928, usando

8 [CAP. 1: ALGUNS MARCOS HISTÓRICOS

Behavior, escrito por John von Neumann e pelo economista Oskar

Oskar Morgenstern John von Neumann

Figura 1.4: Oskar Morgenstern e John von Neumann.

Eles detalharam a formulação de problemas econômicos e mostraram

dores de diversas áreas. Na reedição de 1947, tomada como padrão,

(a) (b) (c)

Figura 1.5: Ganhadores do prêmio Nobel de Economia em 1994:

2.1 O que é um jogo?

e cada jogador gi ∈ G possui um conjunto ﬁnito

Si = {si1 , si2 , . . . , simi }

[SEC. 2.1: O QUE É UM JOGO? 11

de opções, denominadas estratégias puras do jogador gi (mi ≥ 2).

denominado espaço de estratégias puras do jogo. Para cada joga-

Exemplo 2.1 (O dilema do prisioneiro) Possivelmente o exem-

12 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

poderem se comunicar entre si, o delegado de plantão faz a seguinte

(que representam os ganhos de Bob). É uma prática representar os

negar (−10, 0) (−1, −1)

Nesta matriz, os números de cada célula representam, respectiva-

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 13

Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulher

As duas funções utilidade uhomem : S → R e umulher : S → R são

cinema (0, 0) (5, 10)

2.2 Soluções de um jogo em estratégias

14 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA

se os dois prisioneiros querem minimizar1 o tempo de cadeia? Se

“Duas coisas podem acontecer: Bob pode confessar ou

Se analisarmos agora o jogo do ponto de vista de Bob, podemos

2.2.1 Dominância em estratégias puras

s−i = (s1j1 , . . . , s(i−1)ji−1 , s(i+1)ji+1 , . . . , snjn ) ∈

uma escolha de estratégia para todos os jogadores, menos o jogador gi .

s = (siji , s−i ) = (s1j1 , . . . , s(i−1)ji−1 , siji , s(i+1)ji+1 , . . . , snjn ).

1 No Exemplo 2.1, os payoﬀs foram definidos como números ≤ 0. Desta ma-

neira, minimizar o tempo de cadeia é equivalente a maximizar o payoﬀ.

[SEC. 2.2: SOLUÇÕES DE UM JOGO EM ESTRATÉGIAS PURAS 15

Definição 2.1 (Estratégia Pura Estritamente Domi-

ui (sik , s−i ) > ui (sik , s−i ),

para todo s−i ∈ S−i .