Teoria Dos Jogos 2 PDF

Modelagem e Simulao - Teoria dos Jogos
Teoria dos Jogos

1. Introduo
A Teoria dos Jogos devida principalmente aos trabalhos desenvolvidos por von
Neumann e John Nash.
John von Neumann (*1903, Budapeste, Hungria; 1957, John Forbes Nash (*1928, Bluefield, West
Washington, Estados Unidos). Virgina, Estados Unidos).
A Teoria dos Jogos trata com situaes de tomada de deciso em que dois ou mais
oponentes possuem objetivos conflitantes. Exemplos tpicos so:
1. Campanhas publicitrias para produtos concorrentes.

2. Planejamento de estratgias de guerra para exrcitos inimigos.
Em um jogo, dois oponentes (jogadores) podem ter um nmero finito ou infinito de

alternativas ou estratgias. Associado com cada par de estratgias h um valor de
pagamento (payoff) que um jogador paga para seu oponente. Estes jogos so conhecidos
como Jogos de Soma Zero e Dois Jogadores porque o ganho de um jogador igual
perda do outro.
Com os conceitos citados acima, o jogo pode ser resumido em termos dos payoff
para um nico jogador, uma vez que os payoff podem ser positivos (ganhar e o oponente
perder) e negativos (perder e o oponente ganhar).
Adotando os dois jogadores como A e B com m e n estratgias, respectivamente, o
jogo pode ser representado por uma matriz de payoff para o jogador A como:
Notas de Aula - Fernando Nogueira 1

B1 B2 ... Bn
A1 p11 p12 ... p1m
A2 p21 p22 ... p2m
: : : : :
Am pm1 pm2 ... pmn
A representao matricial acima indica que se A usa uma estratgia i e B usa uma
estratgia j, o payoff para A pij e conseqentemente o payoff para B -pij.
Exemplo 1: A matriz de payoff de um jogo de "par ou impar" para o jogador A que apostou
em "par" dada por:
B1 B2
o o
n par de dedos n impar de dedos
A1 no par de dedos 1 -1
A2 no impar de dedos -1 1
A matriz acima mostra que se o jogador A colocar um nmero par de dedos

(estratgia A1) e o jogador B colocar tambm um nmero par de dedos (estratgia B1), o
jogador A ir ganhar 1, pois o jogador A apostou em par.
Se o jogador A colocar um nmero par de dedos (estratgia A1) e o jogador B
colocar um nmero impar de dedos (estratgia B2), o jogador A ir ganhar -1, ou seja, A ir
perder e B ir ganhar.
2. Soluo tima de Jogos de Soma Zero e Dois Jogadores
A soluo tima de um Jogo de Soma Zero e Dois Jogadores seleciona uma ou mais
estratgias para cada jogador tal que qualquer mudana em uma estratgia escolhida no
melhora o payoff para o outro jogador. Estas solues podem estar na forma de uma nica
estratgia ou vrias estratgias misturas de acordo com probabilidades pr-determinadas.
Exemplo 2: Duas companhias, A e B, vendem duas marcas de vacina para gripe.

Companhia A pode anunciar o seu produto no rdio (estratgia A1), na televiso (estratgia
A2) ou no jornal (estratgia A3). A Companhia B pode anunciar o seu produto no rdio
(estratgia B1), na televiso (estratgia B2), no jornal (estratgia B3) ou mala direta
(estratgia B4). Dependendo da criatividade e da intensidade dos anncios, cada companhia
pode ganhar uma poro do mercado da outra companhia. A matriz de payoff abaixo
resume a porcentagem de mercado ganho ou perdido pela companhia A.
B1 B2 B3 B4 Min Linha
A1 8 -2 9 -3 -3
A2 6 5 6 8 5 Maximin
A3 -2 4 -9 5 -9
Max Coluna 8 5 9 8
Minimax

A soluo do jogo baseada no princpio da "Melhor entre as Piores". Se a

companhia A escolher a estratgia A1, ento, independente da estratgia que B escolha, o
pior que pode acontecer A perder 3% do seu mercado para B. Isto representado pelo
valor mnimo dos elementos da matriz na linha 1. Similarmente, se A escolher a estratgia
A2, o pior que pode acontecer A ganhar 5% do mercado de B, e se A escolher a estratgia
A3, o pior que pode acontecer A perder 9% do seu mercado para B. Estes resultados so
listados na coluna "Min Linha" da matriz. Para obter a "Melhor entre as Piores", a
companhia A escolhe a estratgia A2 por que esta representa o valor mximo entre os
valores mnimos (Maximin).
Uma vez que a matriz de payoff para A, o critrio "Melhor entre as Piores" para as
estratgias da companhia B requer determinar o valor mnimo entre os valores mximos
(Minimax).
A soluo tima do jogo ento seleciona as estratgias A2 e B2, isto , ambas as
companhias devem anunciar seus produtos na televiso. O payoff ser a favor da companhia
A, porque seu mercado ir ganhar 5% do mercado de B. Neste caso, dito que o valor do
jogo 5 (5%) e que A e B esto usando uma Estratgia Pura ou Estratgia Dominante
cuja soluo um ponto de sela.
A soluo de ponto de sela garante que nenhuma companhia est tentando
selecionar uma estratgia melhor. Se B escolher outra estratgia (B1, B3 ou B4), a
companhia A pode ficar com a estratgia A2, a qual garante que B ir perder mais mercado
para A (6% ou 8%). D mesma forma, A no quer usar uma estratgia diferente (A1 ou A3)
uma vez que se A escolher a estratgia A3, B pode escolher a estratgia B3 e ganhar 9% do
mercado de A. O raciocnio anlogo verdadeiro para A escolher a estratgia A1.
Exemplo 3: Dois polticos A e B, esto em campanha concorrendo a uma vaga de senador.

necessrio fazer o planejamento para os dois dias finais da campanha. Os dois polticos
pretendem gastar estes dois dias finais em duas cidades: So Paulo e Rio de Janeiro.
Cada poltico pode gastar um dia em cada cidade ou ento gastar dois dias em So
Paulo ou dois dias no Rio de Janeiro. Resumindo, as estratgias ficam:
A1 = poltico A gastar um dia em So Paulo e um dia no Rio de Janeiro

A2 = poltico A gastar dois dias em So Paulo
A3 = poltico A gastar dois dias no Rio de Janeiro
B1 = poltico B gastar um dia em So Paulo e um dia no Rio de Janeiro
B2 = poltico B gastar dois dias em So Paulo
B3 = poltico B gastar dois dias no Rio de Janeiro
A matriz de payoff abaixo resume o nmero (em milhares) de votos ganhos (valores
positivos) ou perdidos (valores negativos) para o poltico A.
B1 B2 B3 Min Linha
A1 0 -2 2 -2 Maximin
A2 5 4 -3 -3
A3 2 3 -4 -4
Max Coluna 5 4 2
Minimax

Ao contrrio do exemplo anterior, o valor Maximin (-2) diferente do valor

Minimax (2), portanto, no existe uma soluo de Ponto de Sela, conseqentemente no
existe uma Estratgia Dominante. Este fato facilmente verificado: para o poltico A, a
melhor estratgia (a que ele perder menos votos) independente da estratgia utilizada pelo
poltico B a estratgia A1 (gastar um dia em cada cidade) e com isso perder 2 mil votos na
pior das hipteses. No entanto, a melhor estratgia para o poltico B a estratgia B3 (gastar
dois dias no Rio de Janeiro) e com isso perder 2 mil votos na pior das hipteses. Porm, as
estratgias A1 e B3 resultam em um ganho de 2 mil votos para o poltico A e
conseqentemente uma perda de 2 mil votos para o poltico B.
Como o poltico B racional, ele pode antecipar este resultado e mudar sua
estratgia para B2 (A est com estratgia A1) ganhando ento 2 mil votos. Prevendo isto, o
poltico A pode mudar sua estratgia para A2 (B est com estratgia B2) ganhando assim, 4
mil votos. Dando continuidade a anlise, o poltico B ento pode mudar sua estratgia para
B3 (A est com estratgia A2) ganhar 3 mil votos. Ento, A pode mudar sua estratgia
novamente para A1 (B est com estratgia B3) e ento ganhar 2 mil votos. Nota-se neste
instante que a estratgia inicial foi retomada, configurando assim um ciclo.
Para jogos onde o valor Maximin diferente do valor Minimax a soluo dita
Instvel e portanto, no h uma Estratgia Dominante.
De fato, o que acontece com jogos que no possuem Estratgia Dominante que
sempre quando a estratgia de um jogador previsvel, o seu oponente poder tomar
vantagem desta informao para melhorar a sua tomada de deciso. Com isso, uma
caracterstica essencial para um planejamento racional de um jogo deste tipo que nenhum
jogador deveria estar habilitado a deduzir a estratgia que o seu oponente ir usar. Portanto,
neste caso, ao invs de aplicar algum critrio conhecido para determinar uma nica
estratgia que ser definitivamente usada, faz-se necessrio escolher estratgias alternativas
aceitveis geradas sobre algum tipo de base randmica.
Pode-se afirmar ento, que o valor v deste jogo estar entre o valor Maximin v e
Minimax v . Isto :
vvv (1)
3. Jogos com Estratgias Mistas
Toda vez que um jogo no possuir uma soluo em um ponto de sela, faz-se
necessrio designar uma distribuio de probabilidade sobre cada conjunto de estratgias.
Matematicamente, fica:
xi = probabilidade do jogador A usar a estratgia i (i = 1,2,...,m) (2)

yj = probabilidade do jogador B usar a estratgia j (j = 1,2,...,n) (3)
onde:
m e n so os nmeros de estratgias do jogador A e B, respectivamente.
Assim, o jogador A deve especificar seu plano de jogo designando valores para x1,
x2,..., xm e o jogador B designando valores para y1, y2,..., yn. Como xi e yj so medidas de

probabilidade estas variveis devem ser obrigatoriamente no-negativas e as suas

m n
somatrias xi =1 e
i=1
y
j=1
j = 1.
Os planos (x1, x2, ..., xm) e (y1, y2,..., yn) so denominados Estratgias Mistas.
Exemplo 4: A mesma matriz de payoff para o exemplo 3 com estratgias mistas

(x 1 , x 2 , x 3 ) = (1 2 , 1 2 ,0) e (y1 , y 2 , y 3 ) = (0, 1 2 , 1 2 ) .
1 1
B2: y2 = B3: y3 =
B1: y 1 = 0 2 2
A1: x1 =
1 0 -2 2
2
A2: x2 =
1 5 4 -3
2
A3: x3 = 0 2 3 -4
Estes planos significam que o jogador A est dando uma chance igual (com
probabilidade 1 2 ) de escolher a estratgia pura A1 ou A2, porm descartando a estratgia
A3. D mesma forma o jogador B est dando uma chance igual (com probabilidade 1 2 ) de
escolher a estratgia pura B2 ou B3, porm descartando a estratgia B1.
O payoff esperado pode ser determinado como:
m n
payoff para o jogador A = p ij x i y j (4)
i =1 j=1
onde:
pij o payoff se o jogador A utilizar a estratgia i e o jogador B utilizar a estratgia j.
Teorema Minimax: Se estratgias mistas so permitidas, o par de estratgias mistas que

timo de acordo com o critrio Minimax fornece uma soluo estvel com v = v = v , de tal
maneira que nenhum jogador pode melhorar sua situao mudando sua estratgia.
O payoff esperado para o exemplo 4 (calculado atravs de (4)) resulta em v = 1 4 .

Esta medida no revela nada sobre o risco envolvido em jogar o jogo, mas indica o valor
que o payoff mdio ir tender se o jogo for jogado vrias vezes.
Embora o conceito de estratgias mistas torne-se bastante intuitivo se o jogo
repetido vrias vezes, este requer alguma interpretao quando o jogo jogado apenas uma
vez. Neste caso, usando uma estratgia mista ainda envolve selecionar e usar uma nica
estratgia pura (randomicamente selecionada a partir da distribuio de probabilidade
especificada).
O objetivo da Teoria dos Jogos determinar a estratgia tima para cada jogador,
sendo o jogo de estratgia pura ou mista. Este objetivo pode ser alcanado atravs de
Programao Linear.

4. Resoluo por Programao Linear
m
Sendo p
i =1
ij x i o payoff esperado do jogador A utilizar as suas m estratgias quando
o jogador B utiliza a sua estratgia j, as probabilidades timas ou planos (x1, x2, ..., xm) do
jogador A podem ser determinadas resolvendo o seguinte problema Maximin:
m m m
max min p i1 x i , p i 2 x i ,..., p in x i
xi i =1 i =1 i =1
Sujeito a (5)
x 1 + x 2 + ... + x m = 1
x i 0, i = 1,2,..., m
No entanto:
m m m (6)
v = min p i1 x i , p i 2 x i ,..., p in x i
i =1 i =1 i =1
De 5) e 6) deduz-se que:
m
p ij x i v, j = 1,2,..., n
(7)
i =1
Com isso, o problema para o jogador A pode ser escrito como:
Maximize z = v
Sujeito a
m
v i=1
p ij x i 0, j = 1,2,..., n
(8)
x 1 + x 2 + ... + x m = 1
x 0, i = 1,2,..., m
i
v livre
As probabilidades timas ou planos (y1, y2,..., yn) do jogador B podem ser

determinadas resolvendo o seguinte problema Minimax:
A expresso (7) desempenha o papel de minimizar v, uma vez que v ser sempre menor que p
i =1
ij xi .
Assim, a funo-objetivo pode apenas maximizar v, uma vez que a expresso (7) minimiza v, estando de
acordo com o critrio MaxMin.

n n n
min max p 1 j y j , p 2 j y j ,..., p mj y j
yi j=1
j=1 i =1
(9)
Sujeito a
y1 + y 2 + ... + y n = 1
y j 0, j = 1,2,..., n
De maneira anloga ao problema do jogador A, o problema do jogador B pode ser

escrito como:
Minimize z = v
Sujeito a
n
v j =1
p ij y j 0, i = 1,2,..., m
(10)
y 1 + y 2 + ... + y n = 1
y 0, j = 1,2,..., n
j
v livre
Comparando as expresses em (8) e em (10), percebe que o problema do jogador B

o dual do problema do jogador A e vice-versa.
Exemplo 5: A mesma matriz de payoff do exemplo 2.
B1 B2 B3 B4 Min Linha
A1 8 -2 9 -3 -3
A2 6 5 6 8 5
A3 -2 4 -9 5 -9
Max Coluna 8 5 9 8
O problema para o jogador A fica:
Maximize z = v
Sujeito a
(11)

v 8x 1 6 x 2 + 2 x 3 0
v + 2 x 1 5x 2 4 x 3 0
v 9 x 1 6 x 2 + 9 x 3 0
v + 3x 1 8x 2 5x 3 0
x + x + x = 1
1 2 3
x 1 , x 2 , x 3 0
v livre
O cdigo para o Lindo, encontra-se abaixo:
MAX v
SUBJECT TO
REST1) v - 8 X1 - 6 X2 + 2 X3 <=0
REST2) v + 2 X1 - 5 X2 - 4 X3 <=0
REST3) v - 9 X1 - 6 X2 + 9 X3 <=0
REST4) v + 3 X1 - 8 X2 - 5 X3 <=0
REST5) X1 + X2 + X3 = 1
END
FREE v
O problema para o jogador B (dual) fica:
Minimize z = v
Sujeito a
v 8 y 1 + 2 y 2 9 y 3 + 3y 4 0
(12)
v 6 y 1 5 y 2 6 y 3 8 y 4 0
v + 2 y 1 4 x 2 + 9 y 3 5 y 4 0

y1 + y 2 + y 3 + y4 = 1
y1 , y 2 , y 3 , y 4 0

v livre
O cdigo para o Lindo, encontra-se abaixo
MIN v
SUBJECT TO
REST1) v - 8 Y1 + 2 Y2 - 9 Y3 + 3 Y4 =>0
REST2) v - 6 Y1 - 5 Y2 - 6 Y3 - 8 Y4 =>0
REST3) v + 2 Y1 - 4 Y2 + 9 Y3 - 5 Y4 =>0
REST4) Y1 + Y2 + Y3 + Y4 = 1
END
FREE v
Como era de se esperar, este jogo possui uma soluo de ponto de sela ou estratgia
pura, com isso o plano timo para o jogador A :
(x 1 , x 2 , x 3 ) = (0,1,0) (13)

e o plano timo para o jogador B :
(y1 , y 2 , y 3 , y 4 ) = (0,1,0,0) (14)
O valor v do jogo 5 (v = 5%).

Os resultados apresentados em (13) e (14) esto de acordo com resultados obtidos
no exemplo, ou seja, o jogador A deve utilizar somente a sua segunda estratgia (A2) e
desprezar as demais assim como o jogador B, que deve utilizar tambm somente a sua
segunda estratgia (B2) e desprezar as demais.
Exemplo 6: A mesma matriz de payoff do exemplo 3.

B1 B2 B3 Min Linha
A1 0 -2 2 -2
A2 5 4 -3 -3
A3 2 3 -4 -4
Max Coluna 5 4 2
O problema para o jogador A fica:
Maximize z = v
Sujeito a
v 0 x 1 5x 2 2 x 3 0
(15)
v + 2 x 1 4 x 2 3x 3 0
v 2 x 1 + 3x 2 + 4 x 3 0

x 1 + x 2 + x 3 = 1
x 1 , x 2 , x 3 0

v livre
MAX v
SUBJECT TO
REST1) v - 0 X1 - 5 X2 - 2 X3 <=0
REST2) v + 2 X1 - 4 X2 - 3 X3 <=0
REST3) v - 2 X1 + 3 X2 + 4 X3 <=0
REST4) X1 + X2 + X3 = 1
END
FREE v
O problema para o jogador B fica:

Minimize z = v
Sujeito a
v 0 y 1 + 2 y 2 2 y 3 0
(16)
v 5 y 1 4 y 2 + 3y 3 0
v 2 y 1 3x 2 + 4 y 3 0

y1 + y 2 + y 3 = 1
y1 , y 2 , y 3 0

v livre
MIN v
SUBJECT TO
REST1) v - 0 Y1 + 2 Y2 - 2 Y3 =>0
REST2) v - 5 Y1 - 4 Y2 + 3 Y3 =>0
REST3) v - 2 Y1 - 3 Y2 + 4 Y3 =>0
REST4) Y1 + Y2 + Y3 = 1
END
FREE v
Como era de se esperar, este jogo no possui uma soluo de ponto de sela ou
estratgia pura, com isso o plano timo para o jogador A :
(17)
(x 1 , x 2 , x 3 ) = 7 ,
4
,0
11 11
e o plano timo para o jogador B :
(18)
(y1 , y 2 , y 3 ) = 0,
5 6
,
11 11
2
O valor v do jogo .
11
A contribuio fundamental da Teoria dos Jogos que esta fornece uma

metodologia para formulao e anlise dos problemas apresentados em situaes simples.
Entretanto, existe uma grande lacuna entre o que a teoria pode tratar e a complexidade da
maioria das situaes competitivas reais.
5. Leitura Complementar
Quanto mais gente, melhor
Por Raul Marinho - Colunista Voc S/A

Grandes gurus da administrao como Ram Charam dizem que o melhor lugar para
se aprender a fazer negcios na feira. Concordo, mas acrescentaria que tambm se pode
aprender com o camel, o pipoqueiro e com todo mundo que lida diretamente com o
fregus comprando e vendendo. Estes profissionais podem nos mostrar na prtica como as
teorias do mundo dos negcios funcionam de verdade. Observando o comportamento de
um sorveteiro na praia, pode-se chegar a concluses interessantes sobre estratgia de
localizao com base na Teoria dos Jogos. Mais do que isso, possvel concluir novos
aspectos sobre nossa prpria localizao: por que vantajoso morar e trabalhar em uma
cidade grande como So Paulo?
Imagine uma praia relativamente pequena, com uns 300 metros, onde seus
freqentadores encontram-se espalhados igualmente na areia. Neste cenrio, imagine-se um
sorveteiro que chega praia onde j se encontra um concorrente vendendo o mesmo
produto com o mesmo preo que o seu. Como o outro sorveteiro est sozinho, ele est bem
no meio da praia. Onde voc ir estacionar o seu carrinho de sorvetes e onde voc acha que
seu concorrente o far?
A primeira vista, parece que o mais bvio cada um ficar a uma distncia de 100
metros do fim da praia e deles mesmos. Esta seria uma estratgia de mtua cooperao,
onde cada um dos vendedores teria um tero da praia praticamente exclusiva e um tero
dividido eqitativamente. Eles estariam posicionados da melhor forma para que qualquer
banhista possa chegar at eles andando o mnimo possvel. Mas se voc j teve a
oportunidade de presenciar uma situao parecida com esta na realidade, provavelmente
voc notou os dois sorveteiros juntos no meio da praia. Ser que eles fazem isso para poder
ficar conversando? Ou ser que esta realmente a melhor alternativa?
Na verdade, eles ficam juntos no meio da praia porque este o nico Equilbrio de
Nash possvel no sistema. Em Teoria dos Jogos, o Equilbrio de Nash atingido quando
cada jogador faz o melhor possvel em funo do que seus concorrentes fazem. Voltando a
imaginar-se sorveteiro: se o seu concorrente ficasse a 100 metros do fim direito da praia, o
melhor que voc poderia fazer seria se posicionar logo sua esquerda. Desta forma, voc
abrangeria dois teros da praia contra um tero para ele. Seria a sua desero, vantajosa
frente cooperao dele. No momento seguinte, porm, seu concorrente se moveria mais
para o centro, logo sua esquerda. Dali a pouco, seria voc que iria para a esquerda dele e,
momentos depois, ambos estariam juntos no meio da praia. Em uma sucesso de deseres
de parte a parte, voc e seu concorrente iriam ficar bem no centro da praia, dividindo a
clientela meio a meio. Repare que muito comum encontrar postos de gasolina,
floriculturas e bancos localizados um em frente ao outro. Isto acontece pelo mesmo motivo:
Equilbrio de Nash.
A questo da localizao do carrinho de sorvete tambm pode ser entendida como
uma estratgia de localizao profissional. Recentemente, a revista Voc S.A. publicou
uma pesquisa sobre as melhores cidades para fazer carreira onde So Paulo foi apontada
como a primeira colocada. Coincidentemente, So Paulo tambm a cidade mais prxima
da maior parte do mercado nacional em termos de concentrao de PIB. Pode-se dizer que
So Paulo exatamente o meio da praia, o lugar onde mais vantajoso voc estar se
quiser atingir o maior nmero de pessoas possvel e aumentar sua exposio pessoal.
Mas So Paulo a cidade onde se encontra a maior concorrncia profissional do
Brasil. Mesmo assim, considerada a melhor cidade para fazer carreira, o que uma
aparente contradio. Por que no fazer carreira em uma pequena cidade do interior, para
onde quase ningum vai? Simplesmente porque isto representaria ir para o canto da praia.

Voc conquistaria uma clientela local, sem dvida, mas quem fica no centro divide a quase
totalidade do mercado.
Como o ambiente de negcios brasileiro bem mais complexo que uma praia, este
raciocnio tem que ser entendido levando-se em conta inmeras outras particularidades,
desde o ramo de atividade em que se trabalha at questes de qualidade de vida que cada
cidade oferece. Mas o jogo do sorveteiro , sem dvida, um exerccio interessante para
refletir sobre posicionamento profissional.
FONTE: Hiller & Lieberman, CAP. 14 e Taha, CAP. 14.4

Exerccios - Teoria dos Jogos

qualquer erro, favor enviar e-mail para fernog@engprod.ufjf.br
1) Considere o Jogo tendo a seguinte matriz de Payoff.
B1 B2 B3 B4
A1 5 0 3 1
A2 2 4 3 2
A3 3 2 0 4
a) Este Jogo de Estratgia Pura ou Mista? Por qu?
b) Qual o plano timo para o jogador A e para o jogador B?
2) Escreva a matriz de Payoff para o "jogo do sorveteiro" descrito no item 5. Resolva o

problema.
Respostas
1.a)
Mista, porque no apresenta ponto de sela.
1.b)
(x 1 , x 2 , x 3 ) = (0.05632 0.736842 0.210526)
(y1 , y 2 , y 3 , y 4 ) = (0.157895 0.0000 0.368421 0.473684)
2) Matriz de Payoff para o sorveteiro A.

As estratgias so (considerando a origem da praia o canto esquerdo) ficar a 100m, 150m e
200m.
100 150 200 Min Linha

100 -100 -50 0 -100
150 50 0 50 0 Maximin
200 0 -50 100 -50
Max Coluna 50 0 100
Minimax
estratgia tima: sorveteiro A ficar a 150 metros e sorveteiro B ficar a 150 metros
(equilbrio de Nash encontrado em um ponto de sela: jogo de estratgia dominante).

Teoria Dos Jogos 2 PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teoria Dos Jogos 2 PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Modelagem e Simulao - Teoria dos Jogos

Teoria dos Jogos

1. Campanhas publicitrias para produtos concorrentes.

Em um jogo, dois oponentes (jogadores) podem ter um nmero finito ou infinito de

Notas de Aula - Fernando Nogueira 1

A matriz acima mostra que se o jogador A colocar um nmero par de dedos

2. Soluo tima de Jogos de Soma Zero e Dois Jogadores

Exemplo 2: Duas companhias, A e B, vendem duas marcas de vacina para gripe.

Notas de Aula - Fernando Nogueira 2

A soluo do jogo baseada no princpio da "Melhor entre as Piores". Se a

Exemplo 3: Dois polticos A e B, esto em campanha concorrendo a uma vaga de senador.

A1 = poltico A gastar um dia em So Paulo e um dia no Rio de Janeiro

Notas de Aula - Fernando Nogueira 3

Ao contrrio do exemplo anterior, o valor Maximin (-2) diferente do valor

3. Jogos com Estratgias Mistas

xi = probabilidade do jogador A usar a estratgia i (i = 1,2,...,m) (2)

Notas de Aula - Fernando Nogueira 4

probabilidade estas variveis devem ser obrigatoriamente no-negativas e as suas

Exemplo 4: A mesma matriz de payoff para o exemplo 3 com estratgias mistas

Teorema Minimax: Se estratgias mistas so permitidas, o par de estratgias mistas que

O payoff esperado para o exemplo 4 (calculado atravs de (4)) resulta em v = 1 4 .

Notas de Aula - Fernando Nogueira 5

4. Resoluo por Programao Linear

Com isso, o problema para o jogador A pode ser escrito como:

As probabilidades timas ou planos (y1, y2,..., yn) do jogador B podem ser

Notas de Aula - Fernando Nogueira 6

De maneira anloga ao problema do jogador A, o problema do jogador B pode ser

Comparando as expresses em (8) e em (10), percebe que o problema do jogador B

Exemplo 5: A mesma matriz de payoff do exemplo 2.

O problema para o jogador A fica:

Notas de Aula - Fernando Nogueira 7

O cdigo para o Lindo, encontra-se abaixo:

O problema para o jogador B (dual) fica:

O cdigo para o Lindo, encontra-se abaixo

Notas de Aula - Fernando Nogueira 8

e o plano timo para o jogador B :

(y1 , y 2 , y 3 , y 4 ) = (0,1,0,0) (14)

O valor v do jogo 5 (v = 5%).

Exemplo 6: A mesma matriz de payoff do exemplo 3.

O problema para o jogador A fica:

O cdigo para o Lindo, encontra-se abaixo:

O problema para o jogador B fica:

Notas de Aula - Fernando Nogueira 9

O cdigo para o Lindo, encontra-se abaixo:

e o plano timo para o jogador B :

A contribuio fundamental da Teoria dos Jogos que esta fornece uma

Notas de Aula - Fernando Nogueira 10

Notas de Aula - Fernando Nogueira 11

FONTE: Hiller & Lieberman, CAP. 14 e Taha, CAP. 14.4

Notas de Aula - Fernando Nogueira 12

Exerccios - Teoria dos Jogos

1) Considere o Jogo tendo a seguinte matriz de Payoff.

2) Escreva a matriz de Payoff para o "jogo do sorveteiro" descrito no item 5. Resolva o

2) Matriz de Payoff para o sorveteiro A.

100 150 200 Min Linha

Notas de Aula - Fernando Nogueira 13

Você também pode gostar