Você está na página 1de 13

TEORIA DOS JOGOS

MATÉRIA DA 2ª PROVA

O fato dos requisitos do equilíbrio de Nash serem exigentes não significa que ele será sempre único.
Pode acontecer que haja mais do que um equilíbrio de Nash, ou até mesmo que não haja um
equilíbrio de Nash.

Se os jogadores não alternam suas estratégias aleatoriamente (isto é, adotam estratégias puras)
pode muito bem acontecer que não haja um equilíbrio de Nash.

JOGO DE COORDENAÇÃO DO PADRÃO TECNOLÓGICO

“Se eu só tenho 1 equilíbrio de Nash, eu posso argumentar em termos preditivos, ou seja, eu posso
afirmar que, se os jogadores forem racionais, é aquele equilíbrio de Nash que deve prevalecer nas
condições do jogo. Mas quando há mais de 1 equilíbrio de Nash, fica muito difícil fazer uma previsão
do que vai acontecer.”

É exatamente isto que o conceito de equilíbrio de Nash procura captar: situações em que os agentes
não teriam estímulos para mudar suas decisões. (Analogia: inércia)

E muitas vezes há mais de uma situação em que os agentes podem se “acomodar”, sem que
necessariamente seja a melhor situação possível para alguns deles. “Uma vez nele, não há porque
sair”

Não cabe, assim, à teoria dos jogos determinar em que situação específica os agentes irão se
“acomodar”, uma vez que isto provavelmente será determinado por fatores circunstanciais.

O que realmente interessa ao analista, muitas vezes, não é prever o que exatamente irá ocorrer, mas
entender os equilíbrios que os jogadores podem estar buscando (e desenvolver instrumentos para
que eles os alcancem).

Por exemplo, um colunista em uma revista internacional pode servir para “coordenar” as decisões
das duas empresas.

Ele pode servir como ponto focal. (“elemento que se destaca do contexto e permite a “coordenação”
dos jogadores mesmo em um jogo simultâneo, no qual jogadores não se comunicam”)

Inexistência de Equilíbrios de Nash: Jogo de Combinar Moedas (mesma lógica do par ou ímpar)
Podemos entender esse tipo de jogo, onde não se verifica um equilíbrio de Nash de forma imediata,
como representando aquelas situações onde não há possibilidade dos jogadores se conformarem
com uma dada combinação de estratégias.

Assim, não haveria possibilidade dos jogadores terminarem o jogo acomodados com algum tipo de
solução, ainda que intermediária.

Não há como, diretamente, determinar estratégias que sejam reciprocamente as melhores respostas
para cada jogador. Nem sempre esse tipo de jogo, conhecido como jogo estritamente competitivo (o
ganho de um sempre vai ser a perda do outro) ou jogo de soma zero, deixa de apresentar um
equilíbrio de Nash.

Contudo, o método de determinação do equilíbrio de Nash em jogos estritamente competitivos é


diferente e exige um método específico. Esse método é conhecido como minimax.

Mas não são somente os jogos estritamente competitivos que podem não apresentar um equilíbrio
de Nash.

Assim, não existe combinação de estratégias que envolva as melhores respostas para todos os
jogadores ao mesmo tempo. Mas também não se trata de um jogo em que a perda de um jogador é
o ganho do outro e vice-versa.

É muito comum em teoria dos jogos construir “tipos” de jogos que expressam propriedades gerais de
algumas situações de interação estratégica.

Na medida em que um tipo de jogo expressa propriedades gerais, ele permite que se analise com
mais facilidade uma dada situação concreta, na medida em que conseguimos identificar essa
situação como sendo da mesma natureza que um dado tipo de jogo. Isso permite tratar várias
situações particulares da mesma forma, generalizando conclusões.

“BATALHA DOS SEXOS”

Os jogadores ganham coordenando suas decisões, mas não podem se comunicar.


Suponha que um casal está decidindo qual será o programa que farão para passar a noite. Ambos
valorizam mais do que qualquer outra coisa passar juntos a noite. Por algum motivo, eles não podem
se comunicar.

ELA prefere ir ao futebol, enquanto ELE prefere ir a um show de música popular.

No jogo da batalha dos sexos os jogadores obtêm uma recompensa maior caso tomam as mesmas
decisões, ainda que ELA prefira ir ao futebol em relação a ir ao show e ELE prefira ir ao show em
relação ao futebol.

O fato é que nenhum dos dois quer fazer o seu programa predileto sozinho e, assim, ELA ainda
prefere ir ao show com ele a ir ao futebol sozinha; e ELE, da mesma forma, prefere ir ao futebol com
ela a ir ao show sozinho. Mesma estrutura do jogo de coordenação do padrão tecnológico.

O jogo da batalha dos sexos serve como representação geral daquelas situações de interação
estratégica em que os jogadores ganham sempre que coordenam suas decisões, mas tem
preferências distintas sobre que tipo de coordenação deve ser adotado.

DILEMA DOS PRISIONEIROS

Suponha que 2 ladrões foram presos pela polícia, com algumas evidências circunstanciais, mas nada
muito definitivo. A polícia então isola cada suspeito em uma sala separada e faz a cada um dos
suspeitos uma proposta. Se ele confessar o roubo e seu parceiro não confessar, ele será solto em
razão de sua cooperação com a polícia, enquanto seu parceiro – que não confessou – irá amargar 6
meses na cadeia. Se, ao contrário, ele não confessar, mas seu parceiro o fizer, será a vez dele
enfrentar 6 meses na cadeia, enquanto seu parceiro será solto. Caso ambos confessem, a cooperação
individual de cada um deles perde valor como denúncia do comparsa e ambos enfrentariam 3 meses
na cadeia. Essa pena é menor do que a pena de 6 meses em função da cooperação de ambos.

Finalmente, embora a polícia não os informe, eles sabem que se nenhum dos dois confessar, ambos
seriam soltos após um mês de detenção por vadiagem.
Logo, os 2 escolhem confessar o roubo. Se um deles escolhesse não confessar, seria prejudicado pelo
outro, que reduziria sua pena significativamente confessando. É importante perceber que o
resultado obtido no dilema dos prisioneiros é derivado da condição de que os prisioneiros não
podem se comunicar. Se eles pudessem se comunicar, todo o resultado do jogo dependeria de eles
poderem, ou não, estabelecer compromissos que pudessem ser garantidos. Se ambos pudessem
estabelecer compromissos garantidos, provavelmente nenhum dos dois confessaria.

Pode-se perceber que a possibilidade de estabelecer compromissos garantidos é muito importante


para a determinação do resultado do jogo, e nos fornece o critério para distinguir entre jogos não-
cooperativos e jogos cooperativos:

Um jogo é dito não-cooperativo quando os jogadores não podem estabelecer compromissos


garantidos. Caso contrário, se os jogadores podem estabelecer compromissos, e esses compromissos
possuem garantias efetivas, diz-se que o jogo é cooperativo.

O dilema dos prisioneiros é a melhor ilustração de que. Em determinados processos de interação


estratégica, o fato de cada jogador buscar o melhor para si leva a uma situação que não é a melhor
para todos. O equilíbrio de Nash não é Pareto-Eficiente.

O JOGO DO “GALINHA”

Imagine dois adolescentes, James e John, que dirigem seus carros em alta velocidade, um em direção
ao outro. O objetivo do jogo é identificar quem desvia primeiro: este será o covarde a ser apelidado
de “galinha” pelos companheiros. O que não desvia fica com a fama de “durão”.

Se ambos desviam ao mesmo tempo, ninguém perde o jogo. Porém, se ambos são “durões” e
nenhum se desvia, ambos sofrem um acidente gravíssimo, com risco de suas próprias vidas.

As recompensas do jogo do “galinha” procuram apenas ordenar as preferências dos jogadores, uma
vez que é obviamente muito difícil estabelecer valores quando estão envolvidas vidas em risco.

Assim, cada jogador prefere não desviar, se o outro desvia. A opção que é preferível em seguida é
desviar se o outro também desvia. Pior do que essa escolha é desviar se o outro não desvia. Mas a
pior combinação de estratégias de todas é não desviar se o outro também não desvia.

Aplicando o conceito de equilíbrio de Nash, vê-se que há 2 equilíbrios: (Não Desvia, Desvia) e (Desvia,
Não Desvia): se o outro jogador desvia, a melhor resposta é não desviar, e a melhor resposta a não
desviar é desviar. (Situações onde é melhor evitar o enfrentamento)

O JOGO DE CAÇA AO CERVO / JOGO DO TRABALHO EM EQUIPE


Algumas Aplicações de Teoria dos Jogos

Jogos Simultâneas de Estratégias Contínuas

Abordaremos algumas das mais conhecidas aplicações do conceito de equilíbrio de Nash para o
entendimento do comportamento das empresas em mercados concentrados. Embora, aos
discutirmos o problema dos recursos em comum, abordaremos algumas dificuldades que um
mercado excessivamente “aberto” pode causar. Contudo, para isto temos de abandonar uma
limitação importante: até aqui tratamos as escolhas estratégicas dos jogadores como decisões sobre
varáveis discretas.

Por exemplo, frente à ameaça de entrada de um novo competidor no mercado, as empresas


estabelecidas não possuem como escolha somente manter ou reduzir o preço a um dado nível: elas
podem reduzir os preços em um contínuo de valores. Qual seria então o melhor preço para
responder à ameaça de uma nova entrada no mercado? Um jogo baseado em estratégias discretas
não conseguiria responder a essa pergunta.

Como a escolha do preço é a variável estratégica em questão, neste caso, as empresas estabelecidas
dispõem de estratégias contínuas, uma vez que as variáveis de escolha estratégica variam
continuamente.

Em outras palavras, o modelo de jogo mais adequado para tratar deste tipo de situação é um jogo
simultâneo de estratégias contínuas.

Um primeiro exemplo de jogo simultâneo de estratégias contínuas que veremos é o modelo clássico
de Cournot.

Veremos inicialmente o caso clássico com duas empresas (decidindo simultaneamente qual
quantidade produzir).

Neste jogo, temos dois jogadores: Empresa 1 e Empresa 2. As duas empresas fabricam produtos
homogêneos, disputando assim o mesmo mercado.

Diz-se que dois produtos fabricados por empresas diferentes são homogêneos quando os
consumidores não percebem diferenças nas qualidades dos dois produtos. Em outras palavras,
quando os consumidores não distinguem entre fabricantes (ou mesmo apenas entre marcas) no
momento de decidir qual produto adquirir.

Assim, os consumidores baseiam suas decisões sobre qual produto adquirir considerando apenas o
preço dos produtos, independentemente de quem é o fabricante do produto (ou de qual é a marca).
Como hipótese de comportamento, adotaremos o pressuposto de que cada empresa busca
maximizar seu lucro, que, nesse jogo, é sua recompensa. (Nem sempre é assim, pode buscar por
exemplo aumentar Market share).

Dessa forma, temos de definir a receita e os custos de cada empresa, de forma a construir uma
função de recompensa para cada empresa.

A receita de cada empresa é o produto do preço de mercado pela quantidade vendida por cada
empresa. Para simplificar, vamos supor que o preço de mercado é dado por uma função de demanda
linear do tipo:

P(q) é o preço de mercado como função da quantidade, q é a quantidade total produzida e vendida
no mercado; A e b são constantes; q1 é a quantidade produzida e vendida pela Empresa 1 e q2 é a
quantidade produzida e vendida pela Empresa2. Obviamente, q = q1 + q2.

A receita total de uma empresa é o produto do preço de mercado pela quantidade produzida e
vendida pela empresa.

Segue-se então que a receita total da Empresa 1 (RT1) e da Empresa 2 (RT2) são dadas,
respectivamente, por:

Para chegarmos à função de recompensa de cada empresa temos que subtrair das receitas os custos,
de forma a obter os lucros.

Vamos supor, também para simplificar, que a função custo das duas empresas (C1 e C2) são
idênticas, e dadas por:

Onde c é uma constante estritamente maior que zero.

Não é indispensável ao modelo de Cournot supor que as empresas possuem os mesmos custos,
como estamos fazendo.

Mas esta hipótese simplificadora permite obter algumas relações muito interessantes.

Agora podemos escrever a função de recompensa de cada empresa como sendo:

O passo seguinte é tomar a primeira derivada de cada uma das equações acima e igualar a zero, (cpo
para maximização).
Vamos admitir que a condição de segunda ordem para um máximo é satisfeita, sem examiná-la.

Colocando q1 e q2 em evidência, temos então duas novas equações:

(NOTAÇÃO: e = esperado)

As equações descrevem quanto cada uma das empresas irá produzir para maximizar seus lucros,
dada a produção esperada de sua concorrente. Por que a esperada e não a efetiva? Porque cada
empresa toma sua decisão sobre o quanto produzir sem conhecer a decisão da outra empresa (é um
jogo simultâneo!!).

Essas duas equações nos dão as funções de reação das Empresas 1 e 2. Dado esse valor esperado, a
empresa escolhe a quantidade que maximiza seus lucros. Em outras palavras, a quantidade que ela
irá produzir será sua melhor resposta à decisão que ela ESPERA que sua concorrente escolha.
Voltando ao conceito de equilíbrio de Nash: para ser um equilíbrio, as estratégias dos jogadores
devem ser as melhores respostas umas das outras reciprocamente.

Assim, q1 deve ser igual a q1e e q2 deve ser igual a q2e. A estratégica adotada por cada empresa (a
quantidade que decidiu produzir) deve ser igual ao que a outra empresa esperava dela, e vice-versa.

Algebricamente, isso significa resolver as duas equações como um sistema em que q1 = q1e e q2 =
q2e.

O asterisco sobre os valores de q1 e q2 indica que se tratam de valores que correspondem a


equilíbrios de Nash.

Para estes valores, nenhum dos dois jogadores tem qualquer incentivo para alterar suas estratégias,
porque uma é a melhor resposta à outra, e vice-versa.

Assim como chegamos a este resultado algebricamente, também poderíamos chegar a ele
geometricamente, traçando as funções de reação das duas empresas em um gráfico cartesiano.
Devemos nos perguntar se o equilíbrio obtido no modelo de Cournot é Pareto-Eficiente.

A forma de responder a esta pergunta é igual ao que fizemos no caso do Dilema dos Prisioneiros.

Devemos investigar se existe alguma outra possibilidade de interação estratégica em que pelo menos
uma das duas empresas aumente os seus lucros sem que a lucratividade da outra empresa se reduza.

Na verdade, veremos que há uma situação em que a lucratividade das duas empresas aumenta
simultaneamente: o caso em que as empresas formem um cartel.

Diz-se que as empresas formaram uma coalizão quando elas coordenam suas quantidades
produzidas ou seus preços. Um cartel é um grupo de empresas competidoras que fizeram uma
coalizão, de forma a maximizar seus lucros se comportando como se fossem uma empresa
monopolista.

Suponha assim um mercado em que duas empresas atuam: a Empresa 1 e a Empresa 2, ambas
produzindo um produto homogêneo, digamos, cimento. (assim, uma única função de demanda)

Vamos supor que a curva de demanda do mercado de cimento é dada por: p = 100 – q1 – q2

Um cartel se caracteriza pela maximização conjunta dos lucros das empresas envolvidas. Assim, um
primeiro passo é conhecer a receita total do cartel.

Como o cartel visa a maximização dos lucros conjuntos das empresas, a receita total do cartel é
formada pela soma das receitas das duas empresas.

Assim, se chamarmos à receita total do cartel de RTc, a receita da Empresa 1 de RT1 e a receita da
Empresa 2 de RT2, teremos que: RTc = RT1 + RT2

Ou de forma equivalente: RTc = p(q1+q2)q1 + p(q1+q2)q2 = p(q1+q2)*(q1+q2)

Resta agora definir as funções de custos das duas empresas, que irão compor os custos do cartel.
Vamos supor que as duas empresas que formam o cartel possuem as mesmas funções de custo.

C1 = 4q1

C2 = 4q2

Assim, o custo total do cartel que chamaremos de Cc é dado por: Cc = C1 + C2 = 4q1 + 4q2
Você deve notar que não faz diferença em qual das duas empresas o cartel aloca sua produção
(nesse caso). Em qualquer uma delas, a produção de uma unidade a mais significa um acréscimo de
$4 ao custo total do cartel.

Somente pudemos igualar as duas quantidades porque as duas empresas possuem as mesmas
funções de custo. Caso as empresas tivessem custos diferentes, não poderíamos fazer isto.

Como os custos são os mesmos, podemos fazer: qic = q1 = q2

Onde qic representa a produção de qualquer uma das empresas no cartel.

Podemos então escrever a função de custo total deste cartel como sendo: Cc = 4qic + 4qic = 8qic

Também podemos reescrever a função de RT do cartel:

RTc = p(q1+q2)*(q1+q2) = (100 – q1 – q2)*(q1+q2) = (100 – qic – qic)*(qic+qic)

RTc = (100 – 2qic)*(2qic)

A função de lucro do cartel é então dada por:

Derivando e igualando a zero (CPO):

<- quantidade de cada empresa no cartel

O cartel realmente aumentou o lucro das empresas?

<- lucro no cartel


Ou seja, o lucro é maior em cartel.

Assim, do ponto de vista das empresas, o equilíbrio de Nash no modelo de Cournot é Pareto-
ineficiente. É possível por intermédio de uma coalizão, isto é, de um cartel, aumentar os lucros das
duas empresas ao mesmo tempo.

 Todo bem público tem um dilema dos prisioneiros


 Em concorrência perfeita e monopólio não há interação estratégica, logo isso limita análises
utilizando essas teorias.

“A teoria ortodoxa não foi feita para lidar com a mudança de uma situação para outra porque essas
mudanças envolvem considerações estratégicas e ela foi desenvolvida pensando que essas
interações estratégicas não existem porque os agentes são atomizados (no modelo de concorrência
perfeita) ou porque só o monopolista importa (no modelo de monopólio).” “Hicks-Kaldorr é
enrolação, porque não tem considerações estratégicas.”

Tanto em equilíbrio de Nash quanto em equilíbrio de Cournot, cada jogador está dando a melhor
resposta possível dado o que o outro jogador está fazendo (e isso é verdade para os dois jogadores).
No equilíbrio de Nash, cada jogador está dando a melhor resposta possível para o que os demais
estão fazendo. No equilíbrio de Cournot, a empresa está adotando a quantidade que maximiza os
seus lucros, dada a quantidade que a outra está produzindo.

O MODELO DE COURNOT COM MAIS DO QUE DUAS EMPRESAS

O preço de mercado é dado agora por uma função linear do tipo:

A receita total de uma empresa i qualquer é o produto do preço de mercado pela quantidade
produzida e vendida pela empresa.

(somatório é de todas as outras empresas)


Para chegarmos à função de recompensa de cada empresa, temos que subtrair os custos das
receitas.

Vamos supor, para simplificar, que a função custo das duas empresas são novamente dadas por:

C1 = cq1

C2 = cq2

Com c > 0.

A hipótese de que as empresas possuem custos iguais permite estender os resultados diretamente
de uma empresa para outra, o que mais uma vez não é necessário, mas simplifica bastante a
compreensão de algumas relações muito importantes.

Agora podemos escrever a função de recompensa de uma empresa i:

O passo seguinte é tomar a 1ª derivada da equação acima e igualar a zero, de acordo com a cpo para
maximização:

Como todas as empresas possuem os mesmos custos marginais (iguais a c) e produzem bens
homogêneos (o que significa que se defrontam com a mesma curva de demanda) é razoável supor
que dividirão o mercado igualmente entre si.

 A maximização não depende de custos fixos, apenas dos custos variáveis. Afinal, o custo fixo
não afetam as decisões de produção no curto prazo, posto que no cp são custos
irrecuperáveis e não se alteram com quantidades diferentes de produção.

Isso significa que as quantidades produzidas serão iguais e, deste modo, a expressão b*Somatório se
converte simplesmente em b(n-1)qi.
Ou ainda:

Podemos facilmente agora encontrar a quantidade de equilíbrio a ser produzida por uma empresa i
qualquer, qi*, como sendo:

É fácil perceber que, a partir desta fórmula, chegamos à mesma expressão que tínhamos obtido para
o caso de duas empresas, substituindo n por 2.

A fórmula se limita a funções lineares. Ela facilita a compreensão de algumas propriedades do


modelo de Cournot.

Mas é importante entender o procedimento para a construção das funções de reação das empresas,
seja ou não com funções lineares.

Considere a expressão anterior (1)

Como todas as empresas produzem e vendem as mesmas quantidades, para sabermos qual será a
quantidade total ofertada no mercado, q, apenas temos de multiplicar qi* pelo número de empresas,
isto é, n, em (2).

Desdobrando em dois termos a função que nos fornece a quantidade total ofertada em um mercado,
de (1) para (2):

Calculando em (1) o limite do segundo termo entre colchetes, quando n tende a infinito, chegamos a
que esse valor se aproxima muito de 1.

Desse modo, para um número muito grande de empresas, a expressão (1) se resume a (2):
Quando um setor é perfeitamente competitivo, as empresas produzem até que o preço de mercado
se iguale ao custo marginal.

No nosso exemplo, isso significa que p(q) = c.

Como p(q) = A – bq, nós obtemos assim o mesmo resultado que o modelo de Cournot quando o
número de empresas tende ao infinito, ou seja: c = A – bq :::::> q = (A – c)/b

Portanto, como a quantidade produzida pelas empresas no modelo de Cournot com um número
muito grande de empresas tende à mesma quantidade produzida pelas empresas sob a hipótese de
concorrência perfeita, os preços de mercado nos dois modelos também convergem. Em abos os
casos, as empresas tomam sua decisão supondo como dadas as quantidades que as demais empresas
irão produzir. Assim, podemos afirmar que o modelo de Cournot com um número muito grande de
empresas converge para o modelo de concorrência perfeita.

As empresas no modelo de Cournot decidem simultaneamente que quantidade produzir, isto é, sem
observar as quantidades que serão produzidas pelas demais empresas. Portanto, elas são obrigadas a
tomar as quantidades das demais empresas como dadas, exatamente como no modelo de mercado
perfeitamente competitivo.

O MODELO DE BERTRAND (OU DE DETERMINAÇÃO SIMULTÂNEA DE PREÇOS)

Considere novamente duas empresas produzindo bens homogêneos e estabelecendo seus preços
simultaneamente.

Como os consumidores não percebem diferença entre os dois produtos, se uma empresa estabelece
um preço superior ao preço da outra, as vendas da empresa com maior preço se reduzem a zero
(temos aqui a hipótese de perfeita informação). Se os preços forem iguais, as empresas dividem o
mercado igualmente.

Admita que cada empresa possa sozinha atender a todo o mercado, caso seja necessário, desde que
o preço seja igual ou maior do que o custo marginal de produção. Qual será o preço de equilíbrio a
ser fixado pelas empresas?

Para poder compreender melhor as várias opções estratégicas de que as empresas dispõem, vamos
estabelecer as funções de recompensa para um exemplo ilustrativo.

1:19:20 aula 01/02

Você também pode gostar