Escolar Documentos
Profissional Documentos
Cultura Documentos
Teorema de Nash
Teorema de Nash
x
i
I
i
,
Departamento de Matemtica
em que i representa todos os jogadores, exceto i.
O clebre dilema dos prisioneiros, formulado por Albert W. Tucker em 1950,
oferece uma boa ilustrao deste conceito.
O dilema surge na seguinte situao: dois suspeitos, A e B, so acusados de um
mesmo crime. Presos em celas separadas e sem possibilidade de se comunicarem, uma
proposta lhes feita: cada um deles pode escolher entre confessar ou negar o crime. Se ambos
negarem, sero presos por um ano. Se os dois confessarem, sero presos por trs anos. Mas, se
um deles confessar e o outro negar, o que confessou ser libertado imediatamente enquanto o
que negou ser submetido pena de 10 anos de priso. Temos assim os seguintes resultados:
Prisioneiro B
Confessar Negar
Confessar (-3, -3) (0, -10)
Negar (-10, 0) (-1, -1)
Prisioneiro A
Tabela 1: Matriz de payoffs do Dilema dos Prisioneiros
Vemos na matriz de payoffs acima que, atendida a hiptese de ausncia de um acordo prvio
entre os prisioneiros, tenha o outro confessado ou negado, sempre melhor confessar. Assim,
o ponto (Confessar, Confessar) representa um exemplo de equilbrio de Nash. Isso fica mais
claro analisando a questo do ponto de vista de cada jogador. Eles raciocinam da seguinte
maneira: O outro prisioneiro pode, assim como eu, negar ou confessar. Se ele confessar, o
melhor que posso fazer confessar tambm, j que ficarei preso por trs anos no lugar de 10
anos. Se ele negar, o melhor para mim ainda confessar, pois assim estarei livre em vez de
condenado a um ano. Nos dois casos, o melhor confessar, portanto, eu confessarei. Como
ambos os prisioneiros, se forem racionais, pensaro dessa maneira, ficaro presos por trs
anos.
O resultado do dilema dos prisioneiros nos permite fazer observaes bastante
interessantes. No difcil perceber que o ponto de equilbrio de Nash no eficiente no
sentido de Pareto, isto , existe uma maneira de melhorar a situao de um dos jogadores sem
piorar a situao do outro. De fato, o equilbrio o nico que no timo de Pareto! Na
verdade, nesse jogo existe uma forma de melhorar a situao de ambos os jogadores
concomitantemente. Se ambos cooperarem se deslocando para o ponto (Negar, Negar) tero
dois anos a menos de pena. Mas por que isso no ocorre? A resposta reside no fato de que o
ponto (Negar, Negar) no obedece racionalidade. Estando nesse ponto, os dois tero um
incentivo enorme a confessar o crime: sua liberdade. A desconfiana os leva a confessar o
crime.
Vejamos agora outros exemplos de jogos. H aqueles em que h mais de um equilbrio
de Nash e outros em que eles no existem para estratgias discretas, ou puras.
A batalha dos sexos descreve a seguinte situao: um casal deseja sair. Ele gosta
mais de futebol e ela gosta mais de ir ao cinema. Se eles vo juntos ao futebol, ele tem
satisfao maior que ela. Se forem ao cinema, ela tem satisfao maior que ele. Finalmente, se
ambos sarem sozinhos, ficaro igualmente insatisfeitos. Podemos representar a situao na
matriz de payoffs, em que os nmeros representam uma ordenao de utilidades, a saber, U
ele
:
S e U
ela
: S ..
Departamento de Matemtica
Ela
Futebol Cinema
Futebol (10, 5) (0, 0)
Cinema (0, 0) (5, 10)
Ele
Tabela 2: Matriz de payoffs da Guerra dos Sexos
Observe que, nesse jogo, temos dois equilbrios de Nash. Os pontos (Futebol, Futebol)
e (Cinema, Cinema) satisfazem a definio formal discutida anteriormente. O que mais
importa para este casal estar junto. Se for no programa de sua preferncia, tanto melhor.
Vejamos ainda o jogo combinando moedas. Nesse jogo os competidores exibem,
simultaneamente, as moedas que cada um tem em sua mo. Se ambas as moedas apresentam
cara ou coroa, o jogador 2 d sua moeda para o jogador 1. Se uma moeda apresenta cara e a
outra apresenta coroa, o jogador 1 que deve dar sua moeda para o jogador 2. Temos a
seguinte matriz de payoffs:
Jogador 2
Cara Coroa
Cara (1, -1) (-1, 1)
Coroa (-1, 1) (1, -1)
Jogador 1
Tabela 3: Matriz de payoffs para Combinado Moedas
Note que, nesse jogo, os interesses dos jogadores so completamente opostos. O ganho
de um , sempre e na mesma medida, a perda do outro. Isso dificulta a existncia de um
equilbrio, ao menos em estratgias discretas, como veremos mais adiante. Assim, o
combinando moedas com estratgias puras um jogo em que no h um equilbrio de Nash.
A Demonstrao
Todos os jogos apresentados at agora tm estratgias discretas (Confessar ou Negar),
(Cinema ou Futebol), (Cara ou Coroa). Mais interessante e til para nosso trabalho ter
estratgias contnuas que podem representar preos, decises de produo ou qualquer outra
situao em que os resultados individuais dependam das decises de outros agentes.
Suponha um jogo com dois participantes, 1 e 2, que escolhem estratgias no
intervalo [0,1]. Temos assim
I
1
= [0,1] e I
2
= [0,1]
e o domnio I
1
I
2
ser o quadrado compacto de lado 1. O bem-estar ou utilidade de cada
jogador dado pelas funes
U
1
: I
1
I
2
e U
2
: I
1
I
2
.
Como vimos anteriormente na definio de um jogo, o bem-estar de cada jogador no
depende somente da escolha que ele prprio faz, mas tambm da escolha feita pelo outro
jogador.
Departamento de Matemtica
A partir destas funes-utilidade, definimos agora
1
: I
2
I
1
e
2
: I
1
I
2
como sendo funes tais que, dada a deciso de um dos jogadores,
i
leva o outro a tomar
uma deciso que maximize sua utilidade. Por exemplo:
1
leva x*
2
no nico
x
1
que
maximize a utilidade do jogador 1, ou seja, o ponto (
1
(x*
2
), x*
2
) ser tal que
U
1
(
x
1
, x*
2
) U
1
(x
1
, x*
2
)
x
1
I
1
e, equivalentemente, o ponto (x*
1
,
2
(x*
1
)) ser tal que
U
2
(x*
1
,
x
2
) U
2
(x*
1
, x
2
)
x
2
I
2
.
fcil notar que
x
i
melhor que qualquer outra estratgia disposio do jogador i dado que
o outro jogador escolheu a estratgia x*
j
.
Se considerarmos o produto
1
2
obteremos uma aplicao
: I
1
I
2
I
1
I
2
,
que leva o par (x*
1
, x*
2
) no par (
1
(x*
2
),
2
(x*
1
)); os pontos fixos desta aplicao sero
equilbrios de Nash no jogo. Logo a demonstrao da existncia de um equilbrio de Nash se
resume a obter um ponto fixo da aplicao
1
2
. De fato, o teorema de Nash nos d a
seguinte informao:
Teorema de Nash: Todo jogo finito, isto , com finitos jogadores e um conjunto
compacto e convexo de estratgias, tem uma soluo em estratgias mistas.
A prova deste teorema utiliza conceitos que exigem matemtica relativamente
avanada. Em nossa demonstrao, faremos uma hiptese adicional (a concavidade na prpria
estratgia) que facilitar enormemente a compreenso dos passos da demonstrao, mas
compromete em muito pouco a fora do resultado final, que a prova da existncia do
equilbrio de Nash.
Algumas condies devem ser atendidas para que as
i
sejam realmente funes bem-
definidas. Para garantir a boa-definio de
i
, as funes-utilidade U
1
e U
2
devem ser
contnuas, pois segue ento pelo teorema de Weierstrass que existem pontos que maximizam
U
1
( ,x*
2
) e U
2
(x*
1
, ), j que I
1
e I
2
so compactos. No entanto, por si s a continuidade das
funes-utilidade no o bastante para afirmar que cada
i
funo bem-definida, pois
podem existir vrios pontos que maximizem
i
nos dados intervalos. Queremos, portanto,
uma condio que garanta a unicidade do ponto maximizante de utilidade. Essa condio a
concavidade das funes-utilidade em cada estratgia. Como foi mencionado, a demonstrao
de Nash no tem essa condio como pr-requisito, pois qualquer jogo finito em estratgias
mistas tem soluo. No entanto, para nossos objetivos, ela altamente vlida e simplificadora.
Nos termos formais de um jogo definidos anteriormente, isso quer dizer que, uma vez fixadas
as escolhas de todos os outros jogadores i, a funo U
i
(x
i
,
x
- i
): I
1
que relaciona
unicamente as escolhas do jogador i com sua utilidade deve ser cncava em I
1
. Observe dois
casos extremos:
Departamento de Matemtica
Figura 4: exemplo de infinitos mximos Figura 5: concavidade - um nico mximo
Podemos provar que a concavidade implica na unicidade do ponto mximo
demonstrando que se existissem dois mximos, por exemplo, em dado intervalo, a funo no
poderia ser cncava nesse mesmo intervalo.
Tome x e y
I.
Dado 0 < t < 1, da definio de concavidade estrita afirmamos que
f (t.x + (1 - t).y) > t.f (x) + (1 - t).f (y),
temos por hiptese que f (x) = f (y) e x e y so mximos, um absurdo, j que esta ltima
equao nos informa que uma mdia ponderada qualquer de x e y possui imagem de valor
maior que f (x) = f(y). Tal fato mostra que f s pode ter um mximo em I se f for cncava.
Para garantir a concavidade, bastar para nossos objetivos supor que a segunda
derivada de U
i
seja negativa no intervalo [0, 1], uma vez fixada a escolha do outro jogador.
Utilizaremos o teorema do valor mdio para provar que f(x) < 0 implica em concavidade.
Suponha
f:
[a, b].
Sabemos que f cncava se
f (x)
I
1
e y
I
2
, no caso de
1
, teremos:
1
(y*) =
x
I
1
/ U
1
(
x
, y*) U
1
(x, y*)
I
1
.
Afirmamos que
1
: I
2
I
1
contnua.
Suponha agora que a afirmao falsa, ou seja,
1
: I
2
I
1
no contnua e, portanto,
existe uma seqncia y
n
I
2
tal que
y
n
mas
1
(y
n
)
1
( ).
Tomando uma subseqncia y
k
de y
n
temos
1
(y
k
) em que no maximizante.
Conclumos que
Departamento de Matemtica
U
1
(
1
( ), ) U
1
( ) e tambm que U
1
(
1
( ), y
n
) U
1
(
1
( ), ),
j que U
1
: I
1
I
2
contnua. Logo vemos que, para n grande o suficiente:
U
1
(
1
( ), y
n
) U
1
(
1
( ), ) e U
1
(
1
(y
k
), y
k
) U
1
( , ), com U
1
(
1
( ), ) U
1
( , ),
o que um absurdo j que
1
foi construda como uma funo maximizadora. O mesmo se
pode afirmar a respeito de
2
.
i
so, portanto, funes contnuas.
Uma vez que a existncia e a continuidade de
1
e
2
estejam garantidas, precisamos
de um argumento para garantir a existncia de um ponto fixo de
1
2
, ou seja, de um
equilbrio de Nash. Utilizamos para tanto o seguinte teorema:
Teorema do Ponto Fixo de Brouwer: Seja B conjunto compacto e convexo. Se f: B
B
= id|
B
. A
Figura 7 ilustra essa impossibilidade:
B
Figura 7
Supomos, por contradio, que existe aplicao contnua f: B
B tal que f no
possui nenhum ponto fixo, ou seja, f (x) x para todo x
B. Definimos ento g: B
B da
seguinte maneira: g (x) = interseo com
B
= id|
B
, o que contradiz o fato citado cima.
Departamento de Matemtica
Figura 8: A funo g: B
B
Como no contexto de nosso jogo o domnio I
1
I
2
compacto e convexo e a aplicao
: I
1
I
2
I
1
I
2
contnua, pois o produto de duas funes contnuas
1
e
2
,
podemos, pelo teorema do ponto fixo de Brouwer, afirmar que existe um ponto
x
I
1
I
2
tal que (
x
) =
x