Escolar Documentos
Profissional Documentos
Cultura Documentos
Teoria Dos Jogos 2 PDF
Teoria Dos Jogos 2 PDF
A Teoria dos Jogos devida principalmente aos trabalhos desenvolvidos por von
Neumann e John Nash.
John von Neumann (*1903, Budapeste, Hungria; 1957, John Forbes Nash (*1928, Bluefield, West
Washington, Estados Unidos). Virgina, Estados Unidos).
A Teoria dos Jogos trata com situaes de tomada de deciso em que dois ou mais
oponentes possuem objetivos conflitantes. Exemplos tpicos so:
B1 B2 ... Bn
A1 p11 p12 ... p1m
A2 p21 p22 ... p2m
: : : : :
Am pm1 pm2 ... pmn
A representao matricial acima indica que se A usa uma estratgia i e B usa uma
estratgia j, o payoff para A pij e conseqentemente o payoff para B -pij.
Exemplo 1: A matriz de payoff de um jogo de "par ou impar" para o jogador A que apostou
em "par" dada por:
B1 B2
o o
n par de dedos n impar de dedos
A1 no par de dedos 1 -1
A2 no impar de dedos -1 1
A soluo tima de um Jogo de Soma Zero e Dois Jogadores seleciona uma ou mais
estratgias para cada jogador tal que qualquer mudana em uma estratgia escolhida no
melhora o payoff para o outro jogador. Estas solues podem estar na forma de uma nica
estratgia ou vrias estratgias misturas de acordo com probabilidades pr-determinadas.
B1 B2 B3 B4 Min Linha
A1 8 -2 9 -3 -3
A2 6 5 6 8 5 Maximin
A3 -2 4 -9 5 -9
Max Coluna 8 5 9 8
Minimax
A matriz de payoff abaixo resume o nmero (em milhares) de votos ganhos (valores
positivos) ou perdidos (valores negativos) para o poltico A.
B1 B2 B3 Min Linha
A1 0 -2 2 -2 Maximin
A2 5 4 -3 -3
A3 2 3 -4 -4
Max Coluna 5 4 2
Minimax
vvv (1)
Toda vez que um jogo no possuir uma soluo em um ponto de sela, faz-se
necessrio designar uma distribuio de probabilidade sobre cada conjunto de estratgias.
Matematicamente, fica:
onde:
m e n so os nmeros de estratgias do jogador A e B, respectivamente.
Assim, o jogador A deve especificar seu plano de jogo designando valores para x1,
x2,..., xm e o jogador B designando valores para y1, y2,..., yn. Como xi e yj so medidas de
Os planos (x1, x2, ..., xm) e (y1, y2,..., yn) so denominados Estratgias Mistas.
1 1
B2: y2 = B3: y3 =
B1: y 1 = 0 2 2
A1: x1 =
1 0 -2 2
2
A2: x2 =
1 5 4 -3
2
A3: x3 = 0 2 3 -4
Estes planos significam que o jogador A est dando uma chance igual (com
probabilidade 1 2 ) de escolher a estratgia pura A1 ou A2, porm descartando a estratgia
A3. D mesma forma o jogador B est dando uma chance igual (com probabilidade 1 2 ) de
escolher a estratgia pura B2 ou B3, porm descartando a estratgia B1.
O payoff esperado pode ser determinado como:
m n
payoff para o jogador A = p ij x i y j (4)
i =1 j=1
onde:
pij o payoff se o jogador A utilizar a estratgia i e o jogador B utilizar a estratgia j.
m
Sendo p
i =1
ij x i o payoff esperado do jogador A utilizar as suas m estratgias quando
o jogador B utiliza a sua estratgia j, as probabilidades timas ou planos (x1, x2, ..., xm) do
jogador A podem ser determinadas resolvendo o seguinte problema Maximin:
m m m
max min p i1 x i , p i 2 x i ,..., p in x i
xi i =1 i =1 i =1
Sujeito a (5)
x 1 + x 2 + ... + x m = 1
x i 0, i = 1,2,..., m
No entanto:
m m m (6)
v = min p i1 x i , p i 2 x i ,..., p in x i
i =1 i =1 i =1
De 5) e 6) deduz-se que:
m
p ij x i v, j = 1,2,..., n
(7)
i =1
Maximize z = v
Sujeito a
m
v i=1
p ij x i 0, j = 1,2,..., n
(8)
x 1 + x 2 + ... + x m = 1
x 0, i = 1,2,..., m
i
v livre
A expresso (7) desempenha o papel de minimizar v, uma vez que v ser sempre menor que p
i =1
ij xi .
Assim, a funo-objetivo pode apenas maximizar v, uma vez que a expresso (7) minimiza v, estando de
acordo com o critrio MaxMin.
n n n
min max p 1 j y j , p 2 j y j ,..., p mj y j
yi j=1
j=1 i =1
(9)
Sujeito a
y1 + y 2 + ... + y n = 1
y j 0, j = 1,2,..., n
Minimize z = v
Sujeito a
n
v j =1
p ij y j 0, i = 1,2,..., m
(10)
y 1 + y 2 + ... + y n = 1
y 0, j = 1,2,..., n
j
v livre
B1 B2 B3 B4 Min Linha
A1 8 -2 9 -3 -3
A2 6 5 6 8 5
A3 -2 4 -9 5 -9
Max Coluna 8 5 9 8
Maximize z = v
Sujeito a
(11)
v 8x 1 6 x 2 + 2 x 3 0
v + 2 x 1 5x 2 4 x 3 0
v 9 x 1 6 x 2 + 9 x 3 0
v + 3x 1 8x 2 5x 3 0
x + x + x = 1
1 2 3
x 1 , x 2 , x 3 0
v livre
MAX v
SUBJECT TO
REST1) v - 8 X1 - 6 X2 + 2 X3 <=0
REST2) v + 2 X1 - 5 X2 - 4 X3 <=0
REST3) v - 9 X1 - 6 X2 + 9 X3 <=0
REST4) v + 3 X1 - 8 X2 - 5 X3 <=0
REST5) X1 + X2 + X3 = 1
END
FREE v
Minimize z = v
Sujeito a
v 8 y 1 + 2 y 2 9 y 3 + 3y 4 0
(12)
v 6 y 1 5 y 2 6 y 3 8 y 4 0
v + 2 y 1 4 x 2 + 9 y 3 5 y 4 0
y1 + y 2 + y 3 + y4 = 1
y1 , y 2 , y 3 , y 4 0
v livre
MIN v
SUBJECT TO
REST1) v - 8 Y1 + 2 Y2 - 9 Y3 + 3 Y4 =>0
REST2) v - 6 Y1 - 5 Y2 - 6 Y3 - 8 Y4 =>0
REST3) v + 2 Y1 - 4 Y2 + 9 Y3 - 5 Y4 =>0
REST4) Y1 + Y2 + Y3 + Y4 = 1
END
FREE v
Como era de se esperar, este jogo possui uma soluo de ponto de sela ou estratgia
pura, com isso o plano timo para o jogador A :
(x 1 , x 2 , x 3 ) = (0,1,0) (13)
Maximize z = v
Sujeito a
v 0 x 1 5x 2 2 x 3 0
(15)
v + 2 x 1 4 x 2 3x 3 0
v 2 x 1 + 3x 2 + 4 x 3 0
x 1 + x 2 + x 3 = 1
x 1 , x 2 , x 3 0
v livre
MAX v
SUBJECT TO
REST1) v - 0 X1 - 5 X2 - 2 X3 <=0
REST2) v + 2 X1 - 4 X2 - 3 X3 <=0
REST3) v - 2 X1 + 3 X2 + 4 X3 <=0
REST4) X1 + X2 + X3 = 1
END
FREE v
Minimize z = v
Sujeito a
v 0 y 1 + 2 y 2 2 y 3 0
(16)
v 5 y 1 4 y 2 + 3y 3 0
v 2 y 1 3x 2 + 4 y 3 0
y1 + y 2 + y 3 = 1
y1 , y 2 , y 3 0
v livre
MIN v
SUBJECT TO
REST1) v - 0 Y1 + 2 Y2 - 2 Y3 =>0
REST2) v - 5 Y1 - 4 Y2 + 3 Y3 =>0
REST3) v - 2 Y1 - 3 Y2 + 4 Y3 =>0
REST4) Y1 + Y2 + Y3 = 1
END
FREE v
Como era de se esperar, este jogo no possui uma soluo de ponto de sela ou
estratgia pura, com isso o plano timo para o jogador A :
(17)
(x 1 , x 2 , x 3 ) = 7 ,
4
,0
11 11
(18)
(y1 , y 2 , y 3 ) = 0,
5 6
,
11 11
2
O valor v do jogo .
11
5. Leitura Complementar
Quanto mais gente, melhor
Por Raul Marinho - Colunista Voc S/A
Grandes gurus da administrao como Ram Charam dizem que o melhor lugar para
se aprender a fazer negcios na feira. Concordo, mas acrescentaria que tambm se pode
aprender com o camel, o pipoqueiro e com todo mundo que lida diretamente com o
fregus comprando e vendendo. Estes profissionais podem nos mostrar na prtica como as
teorias do mundo dos negcios funcionam de verdade. Observando o comportamento de
um sorveteiro na praia, pode-se chegar a concluses interessantes sobre estratgia de
localizao com base na Teoria dos Jogos. Mais do que isso, possvel concluir novos
aspectos sobre nossa prpria localizao: por que vantajoso morar e trabalhar em uma
cidade grande como So Paulo?
Imagine uma praia relativamente pequena, com uns 300 metros, onde seus
freqentadores encontram-se espalhados igualmente na areia. Neste cenrio, imagine-se um
sorveteiro que chega praia onde j se encontra um concorrente vendendo o mesmo
produto com o mesmo preo que o seu. Como o outro sorveteiro est sozinho, ele est bem
no meio da praia. Onde voc ir estacionar o seu carrinho de sorvetes e onde voc acha que
seu concorrente o far?
A primeira vista, parece que o mais bvio cada um ficar a uma distncia de 100
metros do fim da praia e deles mesmos. Esta seria uma estratgia de mtua cooperao,
onde cada um dos vendedores teria um tero da praia praticamente exclusiva e um tero
dividido eqitativamente. Eles estariam posicionados da melhor forma para que qualquer
banhista possa chegar at eles andando o mnimo possvel. Mas se voc j teve a
oportunidade de presenciar uma situao parecida com esta na realidade, provavelmente
voc notou os dois sorveteiros juntos no meio da praia. Ser que eles fazem isso para poder
ficar conversando? Ou ser que esta realmente a melhor alternativa?
Na verdade, eles ficam juntos no meio da praia porque este o nico Equilbrio de
Nash possvel no sistema. Em Teoria dos Jogos, o Equilbrio de Nash atingido quando
cada jogador faz o melhor possvel em funo do que seus concorrentes fazem. Voltando a
imaginar-se sorveteiro: se o seu concorrente ficasse a 100 metros do fim direito da praia, o
melhor que voc poderia fazer seria se posicionar logo sua esquerda. Desta forma, voc
abrangeria dois teros da praia contra um tero para ele. Seria a sua desero, vantajosa
frente cooperao dele. No momento seguinte, porm, seu concorrente se moveria mais
para o centro, logo sua esquerda. Dali a pouco, seria voc que iria para a esquerda dele e,
momentos depois, ambos estariam juntos no meio da praia. Em uma sucesso de deseres
de parte a parte, voc e seu concorrente iriam ficar bem no centro da praia, dividindo a
clientela meio a meio. Repare que muito comum encontrar postos de gasolina,
floriculturas e bancos localizados um em frente ao outro. Isto acontece pelo mesmo motivo:
Equilbrio de Nash.
A questo da localizao do carrinho de sorvete tambm pode ser entendida como
uma estratgia de localizao profissional. Recentemente, a revista Voc S.A. publicou
uma pesquisa sobre as melhores cidades para fazer carreira onde So Paulo foi apontada
como a primeira colocada. Coincidentemente, So Paulo tambm a cidade mais prxima
da maior parte do mercado nacional em termos de concentrao de PIB. Pode-se dizer que
So Paulo exatamente o meio da praia, o lugar onde mais vantajoso voc estar se
quiser atingir o maior nmero de pessoas possvel e aumentar sua exposio pessoal.
Mas So Paulo a cidade onde se encontra a maior concorrncia profissional do
Brasil. Mesmo assim, considerada a melhor cidade para fazer carreira, o que uma
aparente contradio. Por que no fazer carreira em uma pequena cidade do interior, para
onde quase ningum vai? Simplesmente porque isto representaria ir para o canto da praia.
Voc conquistaria uma clientela local, sem dvida, mas quem fica no centro divide a quase
totalidade do mercado.
Como o ambiente de negcios brasileiro bem mais complexo que uma praia, este
raciocnio tem que ser entendido levando-se em conta inmeras outras particularidades,
desde o ramo de atividade em que se trabalha at questes de qualidade de vida que cada
cidade oferece. Mas o jogo do sorveteiro , sem dvida, um exerccio interessante para
refletir sobre posicionamento profissional.
B1 B2 B3 B4
A1 5 0 3 1
A2 2 4 3 2
A3 3 2 0 4
a) Este Jogo de Estratgia Pura ou Mista? Por qu?
b) Qual o plano timo para o jogador A e para o jogador B?
Respostas
1.a)
Mista, porque no apresenta ponto de sela.
1.b)
(x 1 , x 2 , x 3 ) = (0.05632 0.736842 0.210526)
(y1 , y 2 , y 3 , y 4 ) = (0.157895 0.0000 0.368421 0.473684)
estratgia tima: sorveteiro A ficar a 150 metros e sorveteiro B ficar a 150 metros
(equilbrio de Nash encontrado em um ponto de sela: jogo de estratgia dominante).