Você está na página 1de 36

Teoria dos Jogos

Ronaldo Fiani;
Editora Campus, 3ª edição

Capítulo 1: Por que estudar teoria dos jogos?

> O interesse por jogos

A ideia de jogo remete à competição;
Desde crianças a adultos;

Geralmente as pessoas adotam a ideia de “jogo” nas relações sociais, já que
os indivíduos ou organizações tomam decisões em situação de interação
estratégica;

Interação estratégica: situação em que os indivíduos ou organizações
reconhecem a interdependência de suas ações com relação aos demais
agentes;

Situações em que há interação estratégica podem ser caracterizadas como
“jogos”;

> Entendendo a lógica da situação: A batalha do mar de Bismark

Em dezembro de 1942 o comando de guerra japonês decidiu transferir parte
de suas tropas para reforçar uma de suas bases avançadas;
Tinham duas opções: sul, com boa visibilidade, e norte, com
visibilidade ruim;
Precisavam de três dias para completar a transferência das unidades;
Corriam o risco de sofrera ataque por parte das forças aliadas;

Se os aliados encontrassem os japoneses no primeiro dia de buscas
poderiam iniciar os ataques ainda no primeiro dia;
Se encontrassem no sul teriam três dias para atacar, em função da
boa visibilidade;

Se encontrassem no norte teriam dois dias para atacar, por conta da
visibilidade ruim;
Se procurassem no lugar errado perderiam um dia de ataque por
conta das buscas;

Os aliados encontraram os japoneses no norte ainda no primeiro dia de
buscas;
Como? Dada a complexidade da situação são muitos os fatores
envolvidos;
Necessita-se de um modelo simplificador;

Modelo: representação simplificada de um objeto de estudo;
Objeto de estudo: interação estratégica;
Simplificada: Propositalmente alguns elementos são destacados
enquanto outros são omitidos;
Não é uma seleção arbitrária, dependendo da relevância de
cada fator para o entendimento da situação;
Implica na importância da seleção dos elementos, que
podem direcionar à conclusões equivocadas;

Modelo para a batalha de Bismark
Comboio japonês
Forças
aliadas

Sul (1º dia)
Norte (1º
dia)

Sul
3
2

Norte
1
2

Forças aliadas: A melhor estratégia depende da escolha do comboio
japonês;
Comboio japonês: Ir pelo norte é a melhor estratégia;
Se os aliados orem para o sul só haverá um dia de bombardeios;
Se os aliados forem para o norte haverá um ataque de dois dias,
equivalente a decisão de os japoneses irem pelo sul;

Hipóteses observadas no jogo:
H1: Os agentes agem racionalmente;
H2: As informações são conhecidas por todos os jogadores;

O modelo simplificado permite entender a lógica situacional/da situação;

Lógica da situação: Compreender a lógica de uma situação em termos
objetivos, excluindo a subjetividade presente;

Termos objetivos: dados concretos/objetivos;
Termos subjetivos: contextos, pensamentos e emoções dos indivíduos
analisados;

O ponto de partida de qualquer análise de uma situação estratégica será a
aplicação de um modelo;

> As vantagens de estudar teoria dos jogos

Duas vantagens principais:
1 – Entender teoricamente, porque utiliza de abstrações, o processo
de decisão dos agentes interagidos numa situação na qual se aplique
a lógica situacional;
Dependerá: Que as hipóteses iniciais se apliquem ao modelo;
Que cada modelo seja compreendido a partir das
circunstâncias específicas em que é concebido;
2 – Desenvolve a capacidade de raciocinar estrategicamente,
evitando que se fique preso à intuição;
Exemplo: Jogo da votação da diretoria;

Jogo de votação da diretoria: Uma empresa conta com três diretores e
deseja estabelecer seu plano para o ano seguinte, contando com três
decisões possíveis: Investir (nova fábrica), Ampliar (aumentar a fábrica
existente), Aplicar (mercado financeiro);
A votação é realizada em dois turnos, comparando a vencedora entre
duas opções quaisquer com a terceira opção restante;
As preferências dos diretores são:
Diretor 1: Investir, Aplicar, Ampliar;
Diretor 2: Aplicar, Investir, Ampliar;

. 2 – Interações. As decisões/ações de um jogador afetam os demais jogadores. entre Investir e Ampliar. e daí votaria em Aplicar. Mas e se resolvessem agir estrategicamente? Por simplificação consideramos que apenas o Diretor 2 irá agir assim. Aplicar. Hipótese observada no jogo: H1 – Informação perfeita. Votaria em Ampliar no 1º turno. entre Investir (vencedor do primeiro) e Aplicar. opção que sairia vitoriosa. > Quando estamos jogando Caracterização das situações que podem ser consideradas como jogos: situações que envolvam interações estratégicas entre agentes racionais que adotam comportamento estratégico. vence Investir. Investir será o resultado final se cada diretor votar sem considerar as opções do demais. Envolve regras e técnicas para análise de um jogo. prevalecendo o resultado por ele almejado. Indivíduos. Elementos necessários à caracterização de um jogo: 1 – Um jogo é um modelo formal. grupo de indivíduos e organizações com capacidade de decisão para afetar os demais jogadores.Diretor 3: Ampliar. No primeiro turno. vence Investir. 4 – Racionalidade. Investir. no segundo turno ficariam Ampliar e Aplicar. Supõe que os agentes utilizam os melhores meios que dispõem para alcançar seus objetivos. 3 – Agentes. fazendo com que essa opção vencesse no 2º turno. Assim. No segundo turno.

Só interessa à teoria dos jogos as situações em que caiba a aplicação de estratégia. quando enfrenta um lutador que esteja com 7 vitórias e 7 derrotas. 3 – Faz uma leitura neutra.5 – Comportamento estratégico. > A teoria da escolha racional . Agentes consideram ações e reações. estes devem agir com coerência entre seus meios e fins. Não comporta a ocorrência de sorte. Seis campeonatos de 15 lutas cada. 2 – Escolhe as premissas adequadas a partir do seu julgamento. dos fatos empíricos. 8 vitórias e 6 derrotas. Exemplo: Freakonomics: caso dos lutadores de sumô. Saber a intenção dos agentes é fundamental para modelar um jogo. Se os agentes forem racionais a teoria da escolha racional indicará suas decisões durante os jogos. A probabilidade de vitória de um lutador específico com a mesma pontuação de outro na final do campeonato. num caso de 7 vitórias e 7 derrotas para ambos. é diferente (maior) da probabilidade de vitória desse lutador quando tem pontuação superior. Em teoria dos jogos não há qualquer restrição quanto aos objetivos que os jogadores almejam. Implica a consciência do agente sobre a interdependência entre suas ações possíveis e efetivas em relação aos demais agentes. Agente racional: 1 – Aplica lógica à premissas dadas para retirar suas conclusões. Racionalidade: Considerados os objetivos dos agentes. assim como a deles em relação às suas. apenas as decisões estratégicas. não viesada.

Uruguai)}. pela ausência de caracteres adequados para sua representação. (Montevidéu. Chile). Uruguai}. praia e futebol. Para expressar as preferências faz-se necessário o conceito de relação (relação binária: entre dois elementos). Se chamarmos o primeiro elemento de x e o segundo de y. Exemplo: Se o conjunto “capitais” = {Santiago. Dessa indefinição resultam duas possibilidades: 1 – Preferência estrita ( > ) . Exemplificando as preferências: L é um conjunto de opções de lazer de um indivíduo. a e b são dois elementos desse conjunto. 2 – Considera as preferências dos jogadores. Não há como afirmar se uma é preferida ou se há indiferença na escolha entre elas. Assim: R1 = {(Buenos Aires. Se a ≥ b: A opção a é tão boa quanto a opção b. E o conjunto “Países do cone sul” = {Argentina. respectivamente. (Santiago.Teoria da escolha racional: 1 – Hipótese de racionalidade dos agentes. esta última representada por: ≥ que significa “ao menos tão bom quanto” **Observar que os símbolos ≥ e > são utilizados de forma aproximada ao original. A relação que interessa à teoria dos jogos é a relação de preferência. Argentina). Qualquer dúvida basta consultar o livro referenciado ou um manual de microeconomia. Buenos Aires}. Montevidéu. O conceito “relação” expressa um vínculo entre os dois conjuntos. R1 expressa a relação “x é a capital de y”. Chile.

2 – As preferências são transitivas. porque ordenam as preferências dos jogadores.x>y <-> x ≥ y. mas não y ≥ x. Incluída a noção de preferências. . > Jogando com as preferências: O paradoxo de Condorcet Paradoxo de Condorcet: as preferências isoladas dos indivíduos sendo transitivas não implica em transitividade das preferências de um conjunto de indivíduos. x ≥ z. Haverá preferência estrita ou indiferença entre a escolha de duas cestas. consistência/racionalidade na demonstração das x ≥ y e y ≥ z. Essas propriedades são chamadas preferências ordinais. moderado e radical. Quando as decisões são tomadas em grupo. Três propostas: Aumentar (G). Há preferencias. a racionalidade dos jogadores ocorre se suas preferências forem racionais. Os agentes são capazes de definir suas preferências em qualquer relação de escolha que se apresente. Exemplo: Três partidos políticos: conservador. Manter (M) ou Diminuir (D) os gastos com programas sociais. Propriedades de uma relação de preferência racional (hipóteses): 1 – As preferências são completas. 2 – Indiferença ( ~ ) x ~ y <-> x ≥ y e y ≥ x.

2 – Os jogadores aprendem a jogar através da tentativa e erro. preferem diminuir. A ordem das preferências dependerá da ordem de votação. a vida é um jogo? Condições necessárias para um jogo. . Radical: G > D > M Se não for aumentar. Moderado: M > D > G Se não for possível manter. preferem ao menos manter como está. para que no ano seguinte haja redução dos gastos do governo. vota num aumento. Com incentivo há estímulos para que os jogadores se disponham a jogar e adotem decisões racionais. Implica disponibilidade de informações. Conservador: Moderado: Radical: D>G>M M>D>G G>D>M Possíveis resultados: G x M -> 2 x 1 pra G M x D -> 2 x 1 pra M G x D -> 2 x 1 pra D Os resultados implicam: G > M > D > G (Intransitividade das preferências). 3 – Há incentivos adequados para que o jogo aconteça. Implica que os participantes conhecem as regras do jogo e as melhores estratégias cada caso. mas não suficientes: 1 – O jogo é relativamente simples. > Afinal.Preferências: Conservador: D > G > M Se não consegue diminuir.

Exemplo: Setor automobilístico. e poucos fatores a serem 2 – O processo concorrencial é dinâmico ocorre continuamente ao longo do tempo. 1 – Oligopólio: Poucas empresas determinados. . preço e quantidade. 3 – As empresas buscam estratégias para maximizar os lucros.

Se a Inovadora decidir entrar no mercado a Líder terá como opções manter ou reduzir seus preços. Suposições (hipóteses): 1 – Número finito de jogadores em interação estratégica.Capítulo 2: Modelos de jogos: Representando uma situação de interação estratégica > Introdução O objetivo de se modelar os processos em que ocorre interação estratégica é conhecer os possíveis resultados do jogo. A explicação se desenvolve a partir de dois exemplos de jogo: 1 – Uma empresa toma emprestado 5 milhões de reais tanto do banco A como do banco B. totalizando 10 milhões em empréstimos. 2 – Uma montadora está decidindo se irá ou não lançar seu primeiro modelo de van no mercado. cada jogador busca o melhor resultado possível do processo. 2 – Dadas suas preferências. caso consiga renovar os empréstimos. empresa denominada Inovadora. Ação ou movimento: Escolha que um jogador pode fazer num determinado momento do jogo. A Líder só entrará no jogo caso a Inovadora resolva entrar no mercado. e a perspectiva é a de que continue a operar por apenas um ano. Só que já existe um modelo de van sendo comercializado. Líder é a segunda a agir. o da empresa denominada Líder. Após um ano a empresa só dispõe de capitais que somam o valor de 6 milhões de reais. > Representando as ações dos jogadores e suas consequências Jogador: Indivíduo ou organização em situação de interação estratégica que tenha autonomia para tomar decisões. . já conhecendo a ação da Inovadora.

porque nos últimos a cada movimento aumenta a quantidade de informação disponível aos jogadores. Ai = {ai} Onde: ai são as ações disponíveis ao jogador i. 3 da divisão dos 6 que a empresa possui em ativos mais 1 do pagamento dos juros. Porém. Se apenas um banco renovar. totalizando 1 milhão para cada banco. Jogos em que as decisões ocorrem simultaneamente diferem de jogos em que há decisões sucessivas. que renovou o empréstimo. 5 milhões. receber apenas o 1 milhão restante dos ativos. com a perspectiva de falência da empresa. tendo direito ao recebimento do valor emprestado. renovar ou não os empréstimos. retirados dos 6 de ativos da empresa. Se renovam. Se nenhum banco renovar o empréstimo. sequenciais. já que cada jogador age considerando tanto o seu conjunto de ações como os conjuntos de ações dos demais jogadores.Conjunto de ações: Ações disponíveis a um jogador. cada banco receberá um total de 4 milhões. adiantando seu processo de falência. > Empregando a forma estratégica ou normal para representar um jogo simultâneo Utilizando o exemplo dos bancos A e B: Cada banco dispõe de duas opões. Não considerar todas as ações relevantes disponíveis implica irracionalidade. receberá integralmente a quantidade emprestada. cada um ficará com 3 milhões restantes da divisão dos ativos da empresa. Porque a cada movimento um jogador já agiu. e implicando ao outro banco. a empresa poderá continuar pagando os juros dos empréstimos. . A construção de um jogo depende do conhecimento sobre todas as ações relevantes disponíveis aos jogadores. Ai é o conjunto de ações do jogador i.

para fins de ordenamento. preocupando-se apenas com o resultado imediato do processo. AA. 1 e 5. Implica que o resultado x é ao menos tão bom quanto o resultado y para o jogador analisado. sendo impossível ordenar através dela as preferências de jogadores diferentes. desprezando as consequências futuras da decisão. Uma função de recompensa só pode ordenar as preferências de um único jogador. seu conjunto de ações. Enquanto (≥. a preferência de cada jogador por determinado resultado do jogo. Se x é um resultado qualquer e y é outro: F(x) ≥ F(y) . sempre que x for ao menos tão bom quanto y.B = {Renovar o empréstimo. 3 e 3. Jogo em forma estratégica ou normal Banco B Banco A Renova Não renova Renova 4. as preferências dos agentes permitem comparar objetos diferentes.4 5. são os possíveis resultados do jogo. respectivamente. Renova e não renovar são as opões dos jogadores. Função de recompensa: Valor que traduz numericamente.3 Os bancos A e B são os jogadores.5 3. Não busca “medir” essas preferências. e o segundo é a recompensa do jogador na coluna. >) comparam quantidades. não renovar o empréstimo} 4 e 4. ou seja. representam as possíveis recompensas de A e B.Recompensa: É aquilo que cada jogador obtém ao término do jogo. 5 e 1. . Jogos simultâneos: Jogos em que os jogadores ignoram as decisões dos demais. O primeiro número é a recompensa do jogador na linha.1 Não renova 1.

Utiliza o exemplo das montadoras: A empresa Inovadora enfrenta duas opções. cada uma fatura 2 milhões de reais. que irá lucrar 4 milhões se manter o preço. Observa ações e reações. de interações estratégicas com Jogos que impliquem em interação estratégica que se desenvolve em etapas sucessivas. que são compostas por ramos e nós. Se a Inovadora lançar a van e a Líder manter seu preço. . > Empregando a forma estendida para representar um jogo sequencial Método aplicado para avaliação desdobramentos ao longo do tempo. e 3 se reduzir. sequencialmente. dado o processo concorrencial. Se a Inovadora não lançar sua van. e a partir da sua decisão é que a Líder irá tomar a sua. caso a interação estratégica continue ocorrendo ao longo do tempo entre os jogadores. A limitação é que não permite avaliação dos resultados futuros da decisão. A Inovadora é a primeira empresa a jogar.A vantagem é que esse tipo de jogo fornece todas as combinações possíveis das ações dos jogadores e seus possíveis resultados. #Jogo sequencial na forma estendida. lançar ou não sua van no mercado. mantendo-os em 1 milhão. Nó: Etapa do jogo onde um dos jogadores deve tomar uma decisão. qualquer que seja a estratégia da Líder. Jogo “sequencial”. a Inovadora ganhará parcela de mercado e irá lucrar apenas 1 milhão. Se a Inovadora lançar a van e a Líder reduzir seu preço. já que cada jogador atua num momento do tempo. não terá seus lucros influenciados. enquanto a empresa Líder decide entre manter ou reduzir o preço de sua van. Em geral os jogos sequenciais são representados por árvores de jogos.

decidem suas ações Regras da árvore de jogos: 1 – Cada nó terá no máximo um nó predecessor. ou seja. 3 – Todo nó deve ser sucessor de um único e mesmo nó. #Nó com dois predecessores. é aquele que antecede a jogada em questão.Ramo: Uma ação do jogador. não importando a decisão do jogador. . Nó terminal/final: Nó que não possui sucessor. convenientemente moldados em jogos sequenciais. onde não há predecessor. #Nó com dois predecessores. 2 – Nenhuma trajetória pode ligar um nó a ele mesmo. caso seja alcançado no jogo. onde são apresentadas as recompensas de cada jogador. #Nó ligado a ele mesmo. Nó predecessor: Nó que precisa ser alcançado para se chegar ao sucessor. qualquer ação nesses predecessores implicará na escolha do nó analisado. Cada nó torna possível novos consequentemente novos nós: desdobramentos. Nó inicial: Início do jogo. Jogo sequencial: Jogo em que os jogadores sucessivamente numa ordem pré-determinada. e Nó sucessor: Escolha possível no futuro. podendo resultar num looping de escolhas. A forma estendida é uma maneira de representar processos de interação estratégica que ocorram em etapas sucessivas. novos ramos. Se houver mais de um ponto de início não haverá como saber em que ponto inicia o jogo. dentro de um conjunto de ações deste em um dado nó. Se um nó for precedido por dois nós. Se for possível um nó resultar nele mesmo não haverá como saber quem fará o primeiro movimento no jogo.

.. que os jogadores consideram todo o desenvolvimento do processo de interação até sua decisão. num modelo sequencial.> Estratégias e conjuntos de informação A hipótese de racionalidade dos jogadores implica. Essa ideia pode ser formalizada por meio de uma função de recompensa. s2. os jogadores utilizam de estratégias para jogar. . si. e S i é o conjunto de estratégias desse jogador.. Ui = (s1. sn) Onde s1 é a estratégia do primeiro jogador. . já que não há sequência de eventos/decisões. Exemplo: a terceira estratégia corresponde ao terceiro jogador.. Portanto. S = (s1.. Estratégia: Plano de ações de um jogador que direciona suas decisões em todas as jogadas. Si = {sij} Onde sij é a estratégia j do jogador i. assim como seus desdobramentos. . e S é a combinação de estratégias.. Conjunto de estratégias (espaço de estratégias): Conjunto de estratégias de que cada jogador dispõe. . A combinação de estratégias que os jogadores podem adotar é um conjunto ordenado. dada uma combinação específica de estratégias. No jogo simultâneo a estratégia de cada jogador coincide com as ações que lhe são disponíveis. onde a ordenação representa o jogador correspondente. sn) Onde sn é a estratégia do n-ésimo jogador.... e U i é a recompensa que o jogador i recebe. Cada combinação de estratégias produz diferentes recompensas para os jogadores.

o nó em que se encontra quando é a sua vez de jogar. em razão das ações efetuadas. A diferença entre jogos simultâneos e sequenciais reside na característica lógica dos últimos. premeditando suas reações de acordo com cada possível ação dos outros jogadores. . Conjunto de informação unitário ocorre quando o jogador sabe a jogada que o antecedeu. mas que por não permitir maior volume de informações aos jogadores poderia ser representada por um jogo simultâneo. Mesmo nos jogos simultâneos a ideia de decisões ao mesmo tempo é uma simplificação. dentro de um conjunto de informações. já que nos jogos sequenciais aumenta-se a informação disponível dos jogadores a cada rodada. ainda assim seria uma sucessão de eventos no tempo. Por que “acredita”? Porque pode não haver perfeita informação sobre o jogo. portanto tomam suas decisões sem conhecer as circunstâncias do jogo. Conjunto de informação: Conjunto de nós em que o jogador acredita estar quando é a sua vez de jogar. Quanto mais informação tem um jogador. Se um jogo sequencial ocorresse com os jogadores tomando decisões sem saber as ações dos demais. Implica que a Líder sabe. Já no caso das empresas a Líder joga sabendo qual foi a decisão da empresa Inovadora. Pode ser observado quando todos os conjuntos de informação de um jogo são unitários. No exemplo dos bancos nenhum sabe o que o outro escolheu.Já nos jogos sequenciais os jogadores traçam estratégias antecipando as decisões dos demais. conhecendo as circunstâncias de sua decisão. não na cronológica. #Conjunto de informação unitário. maiores as chances dele distinguir as circunstâncias no jogo em que deve agir. nesse conjunto só há um nó. Portanto. Informação perfeita: Os jogadores conhecem todos os movimentos que antecedem sua jogada.

Se não houver diferença entre os nós os jogadores não poderão identifica-los como movimentos distintos. Regras para a definição dos conjuntos de informação: 1 – Um conjunto de informações não pode conter nós de jogadores diferentes. Porém. Conjunto de informação não-unitário ocorre quando o jogador não sabe a jogada que o antecedeu. #Nós sequenciais de um mesmo jogador. o jogador saberá a jogada antecessora. 2 – Um conjunto de informações não pode incluir nós sequenciais Se o conjunto de informações é válido para apenas um jogador. . se cada nó implicar em diferentes conjuntos de ações. apontando que não haveria diferença entre esses nós. portanto de informação imperfeita. a partir das decisões com que se depara. agrega mais de um nó. determinando que o jogador desconhece o movimento que o antecedeu. Portanto. 3 – Diferentes nós num conjunto de informação não podem oferecer diferentes conjuntos de ações. cada movimento distinto deve ser identificável pelo jogador que decide. Diferentes nós num mesmo conjunto implicam que este último é não-unitário. que é o mesmo de ter o nó sucessor no lugar do antecessor.Informação imperfeita: Quando um jogador tem de agir sem conhecer algum dos movimentos realizados anteriormente. B1 em I e II e B2 em III e IV. #Conjunto de informação não-unitário. Pode ser observado pela existência de um conjunto de informações não-unitário. Já que a ordem dos jogadores é pré-determinada #Conjunto de informações com dois jogadores. Nós em sequência de um mesmo jogador implicaria que ele continuaria jogando.

Jogo simultâneo. Depende da melhor maneira para ilustrar a situação. Implica num conjunto de informação não-unitário. tendo duas opções: entrar ou não no mercado. Se a Desafiante entrar no mercado a Dominante terá duas opções: lutar ou se acomodar. . Nesse jogo uma empresa considera a possibilidade de entrar no mercado. Conquanto tenha se apresentado jogos simultâneos de forma estratégica e o sequencial de forma estendida. 1 – Apresentando um jogo simultâneo em forma estendida. O jogador não sabe a jogada que “antecede” a sua. cuja empresa existente é denominada Dominante. Jogadores jogam sem conhecer as decisões dos demais. Utiliza o exemplo de um mercado em monopólio. Conquanto a forma estratégica seja mais intuitiva para representar um jogo simultâneo. Utilizando o exemplo dos bancos. denominada Desafiante. > Forma estratégica versus forma estendida. já que jogos simultâneos podem ser apresentados de forma estendida e jogos sequenciais de forma estratégica. não são necessariamente correspondentes.#Diferentes ações a partir de nós num mesmo conjunto de informação. a forma estendida apresenta vantagem na construção de jogos com mais jogadores. #Jogo dos bancos na forma estendida. 2 – Apresentando um jogo sequencial em forma estendida. Desafiante joga primeiro.

#Jogo da entrada na forma estendida. Aumenta o número de colunas para demonstrar o conjunto de estratégias pré-determinado da empresa Líder. 3 Mantém preço. 1 1. Mantém preço 4. que aguarda a jogada da Inovadora. . os resultados se repetem. A primeira e segunda opções da Líder. Mantém Reduz preço preço 2. como ocorre um jogo sequencial e a empresa Líder é a segunda a jogar. 3 Líder Reduz preço. 2 1. na mesma coluna.Lutar implica guerra de preços. Porém. 4 A forma estratégica implica apontar a estratégia que dispõe cada jogador. Assim. #Jogo da entrada na forma estratégica. o jogo deve compreender e apresentar as ações disponíveis à empresa Líder. 2 4. Mantém preço. e as opções da Líder dependerão das opções da Inovadora. respectivamente. Reduz preço. 1 1. correspondem à primeira e segunda opções da Inovadora. 4 1. enquanto acomodar implica abrir espaço no mercado à Desafiante. Jogo sequencial das montadoras na forma estratégica. na tentativa de controlar o lucro através do nível de preços. nas linhas. já determinados antecipadamente. Tornando a situação mais complexa com o exemplo das montadoras. prejudicando os lucros das empresas no processo. Inovadora Reduz preço Lança van Não lança van 2. depois de adquirir maior volume de informação.

Informação de conhecimento comum: Informação conhecida por todos os jogadores. que sabem ser de conhecimento geral.Capítulo 3: estratégicas Jogos Simultâneos: Encontrando as melhores respostas > Introdução Até o momento apresentou-se como modelar os jogos. Escolham a estratégia que lhes proporciona o melhor resultado de acordo com seu objetivo. para concorrer com a segunda. . A primeira decide se irá ou não lançar seu produto biodegradável. Limpo e Bonito. Estrutura do jogo: Estratégias e respectivas recompensas disponíveis a cada um dos jogadores. Tomando o exemplo das empresas de sabão em pó. O jogo das empresas de sabão em pó apresenta as respectivas recompensas em milhões de reais. e este capítulo é voltado a explicar como eles são jogados. por sua vez. Jogos de informação completa: Quando as recompensas dos jogadores são informação de conhecimento comum. enfrenta o dilema entre aumentar ou não seus gastos com publicidade. > Uma primeira busca da solução do jogo: Eliminando estratégias estritamente dominadas. Esta. Porque todos os jogadores sabem as recompensas almejadas pelos demais. Espera-se que os jogadores sejam racionais.

Um jogador também pode se depara com uma estratégia que seja fracamente dominante. para todo s -i Qualquer que sejam as estratégias adotadas pelos demais jogadores. como pode ser visto a partir de uma modificação nas recompensas do exemplo das empresas de sabão em pó. s -i) > πi (s**i. s -i). Limpo tem {lançar o produto biodegradável} como estratégia dominante. para i s*i será sempre superior a s**i. Algebricamente: πi (s*i. Todas as recompensas de {lançar o produto biodegradável} permitem resultados estritamente maiores que a estratégia {não lançar o produto biodegradável}. para Limpo a melhor estratégia é lançar o produto. 5 7. 7 Independente da ação de Bonito. . {Lançar o produto biodegradável} domina a estratégia {não lançar o produto biodegradável}. 4 2. independentemente das ações de Bonito. 3 2. {Não lançar o produto biodegradável} é uma estratégia dominada por {lançar o produto biodegradável}. Implica que a estratégia {lançar o produto biodegradável} é estritamente dominante em relação a estratégia {não lançar o produto biodegradável}.Jogo das empresas de sabão em pó (exemplo de estratégia estritamente dominante) Bonito Aumenta gasto Não aumenta gasto com publicidade com publicidade Limp o Lança o produto biodegradável Não lança o produto biodegradável 5.

pois para os demais casos pode ser maior ou igual. caso Bonito não aumente seus gastos com publicidade. os lucros de se adotar a estratégia {lançar o produto biodegradável} são superiores. para todo s -i πi (s’’i. Identificadas as estratégias dominantes e dominadas. 7 Nesse exemplo reformulado. mas numa situação específica. faz-se necessário um método para avaliar quais as estratégias os jogadores devem escolher para obterem as melhores recompensas. s -i) > πi (s’i. {Não lançar o produto biodegradável é fracamente dominada pela estratégia {lançar o produto biodegradável}. . Algebricamente: πi (s’’i. {Lançar o produto biodegradável} é fracamente dominante em relação a {não lançar o produto biodegradável} para a empresa Limpo. 5 7. 4 2.Jogo das empresas de sabão em pó (exemplo de estratégia fracamente dominante) Bonito Aumenta gasto Não aumenta gasto com publicidade com publicidade Limp o Lança o produto biodegradável Não lança o produto biodegradável 2. para algum s -i Somente para algum s –i a estratégia s”i será necessariamente mais recompensadora do que s’i. 3 2. quando Bonito não aumenta os gastos com publicidade. s -i) ≥ πi (s’i. Porém. s -i). caso Bonito resolva aumentar os gastos com publicidade. Numa situação a estratégia {não lançar o produto biodegradável} produz recompensas tão boas quanto {lançar o produto biodegradável}. Limpo terá maiores lucros se adotar a estratégia {lançar o produto biodegradável}. os resultados permitidos pelas opções da empresa Limpo são tão bom quanto os outros que ela mesmo dispõe. s -i).

3 1. 0 Comparando as recompensas disponíveis à Carro Novo. Carro Novo já comercializa um modelo utilitário. 2 – Produzir nacionalmente um modelo utilitário. 1 2. 3 – Lança uma nova versão do seu utilitário no mercado.> Eliminação Interativa de estratégias estritamente dominadas. 3 – Continuar fora desse segmento no setor. 1 Mantém preço 4. sem conhecer a escolha do concorrente. Carro Novo poderá responder de três maneiras: 1 – Mantém o preço do seu utilitário. observa-se que não há estratégia dominante. 2 1. Jogo do mercado automobilístico (1ª rodada) Carro Novo Lança nova versão Novo Auto Lança seu modelo Importa o modelo Não entra no segmento 1. Carro Novo e Novo Auto. Dada a escolha de Novo Auto. enquanto Novo Auto depara-se com as seguintes opções: 1 – Importar o modelo utilitário de sua matriz estrangeira. A eliminação iterativa de estratégias estritamente dominadas é o método mais simples para se determinar o resultado de um jogo simultâneo. cada opção que a empresa toma apresenta um resultado melhor de acordo com a decisão da empresa Novo Auto. competem no setor de automóveis. 2 – Diminui o preço do seu utilitário. Suas empresas. 6 Reduz preço 1. . como num plano para o próximo ano. 3 2. Como se trata de um jogo simultâneo. 4 2. supõe-se que cada jogador tome sua decisão isoladamente. O método é explicado através do exemplo do mercado automobilístico. 1 0.

3 Com as opções restantes observa-se que não há estratégia dominante ou dominada para Carro Novo. Comparando {não entra no segmento} com {importa o modelo} percebe-se que a primeira estratégia é estritamente dominada pela segunda.Novo Auto também não apresenta estratégia dominante. porém apresenta uma decisão que contém as piores recompensas para si. 3 2. {Não entra no segmento}. Qualquer estratégia que não fosse estritamente dominada pode passar a sê-lo após a eliminação de alguma das estratégias do jogo. Porém. 1 1. na 2ª rodada elimina-se a opção de manter o preços para a empresa Carro Novo. 3 Após a eliminação de uma estratégia da empresa Novo Auto percebe-se que nenhuma das opções restantes à empresa se sobressai às outras. qualquer que seja a estratégia de Carro Novo. Considerando esses fatores. Assim. modifica-se a situação da Carro Novo. Jogo do mercado automobilístico (resultado da 1ª rodada) Carro Novo Lança nova versão Novo Auto Lança seu modelo Importa o modelo Mantém preço 4. 1 2. 2 1. 4 2. 2 Reduz preço 1. que passa a ter {mantém preço} como estratégia estritamente dominada por qualquer uma das outras opções. Essa é uma característica do método de eliminação iterativa de estratégias estritamente dominadas. 3 2. Jogo do mercado automobilístico (2ª rodada) Carro Novo Novo Auto Lança seu modelo Importa o modelo Lança nova versão Reduz preço 1. Já para Novo Auto a opção de lançar seu modelo . 4 2. pode-se eliminar a estratégia {não entra no segmento} das opções da Novo Auto.

reduz preço}. não há nenhuma razão. constitui um equilíbrio em estratégias > Estratégias racionalizáveis e melhor resposta. mesmo que sejam mais de uma para cada jogador. Implica que o resultado do jogo é dado pela combinação de estratégias {Importa o modelo. 2 2. Jogo do mercado automobilístico (3ª rodada) Carro Novo Novo Auto Lança nova versão Reduz preço 2. Conhecimento comum da racionalidade (CCR): Quando supõe-se que a racionalidade dos jogadores é de conhecimento comum. . implicando sua eliminação na 3ª rodada. independente do que fazem os demais jogadores. Os jogadores sabem que os demais sabem. Implicitamente. Princípio da racionalização: Se a estrutura e a racionalidade dos jogadores são de conhecimento comum. Jogo solucionável por dominância: Jogo que resulta numa única combinação de estratégias pelo método de eliminação iterativa. que justifique o jogador i adotar s**i. na solução de jogos por eliminação iterativa de estratégias estritamente dominadas. está a hipótese de conhecimento comum da racionalidade (CCR). 3 Importa o modelo Dessa rodada tem-se que a empresa Carro Novo passa a ter a estratégia {lança nova versão} como estratégia dominada por {reduz preço}.mostra-se estritamente dominada nessa nova configuração do jogo. Estratégias racionalizáveis: Estratégias que resultam do método de eliminação iterativa... independentemente das possíveis decisões dos demais jogadores. Esse resultado estritamente dominantes. e uma estratégias s**i sempre proporciona o pior resultado para o jogador i.

Essa ideia pode ser descrita através do conceito de melhor resposta: πi (s*i. s**i nunca é a melhor resposta. > Solucionando um jogo simultâneo: O Equilíbrio de Nash O conceito de Equilíbrio de Nash atende para a solução de jogos simultâneos tanto nos casos em que cabe como nos que não cabe o método de eliminação iterativa. para algum s-i e todos os s’i ≠ s*i s*i será a melhor resposta do jogador i. de uma estratégia nunca ser a melhor resposta para um jogador. Para solucionar esse problema faz-se necessário um método mais geral que o de eliminação iterativa. percebe-se que a estratégia que for estritamente dominada para um jogador nunca será a melhor resposta (decisão) para ele. s -i). s -i) < πi (s*i. . Por analogia. s -i). que dependerá do conceito de Equilíbrio de Nash. independente da estratégia adotada pelos demais: πi (s**i. Da mesma forma pode ocorrer o inverso. porque sempre haverá uma estratégia diferente que proporciona uma resposta melhor. dada a combinação s-i de jogadas dos demais jogadores. > A limitação do método de eliminação iterativa de estratégias estritamente dominadas A principal limitação do método de eliminação iterativa é que nem todos os jogos possuem estratégias estritamente dominadas. s -i) ≥ πi (s’i. quando comparada à estratégia s’i. para todo s-i e algum s*i ≠ s**i s**i será a pior estratégia que o jogador i poderá adotar.

2 . nenhuma empresa sabe o que a outra decidiu. 1 Exporta em larga escala Qual é o Equilíbrio de Nash? E as outras recompensas? Por que? Só há um Equilíbrio de Nash. s*-i) ≥ πi (si. 0. 0 2. para algum s-i e todos os s’i ≠ s*i Dada uma combinação de estratégias s-i dos demais jogadores. O que o conceito de Equilíbrio de Nash implica é que todos os jogadores adotem as melhores respostas em relação as estratégias dos demais: πi (s*i. s*-i). 0 Potencial Exporta em pequena escala 1. Outra empresa. Como o jogo é simultâneo. O asterisco indica que a estratégia faz parte de um equilíbrio de Nash. Como exemplo disso tem-se o jogo de prevenção na concorrência pelo comércio nacional. -1 -1. para algum s-i e todo i. 1 1.Equilíbrio de Nash: Combinação de estratégias que proporciona o melhor resultado individual para cada um dos jogadores. s -i). denominada Dominante. Anteriormente foi especificado que: πi (s*i. estrangeira. Jogo de prevenção na concorrência pelo comércio nacional Não exporta Dominan te Investe Não investe 2. Jogo em que há uma empresa brasileira atendendo o mercado nacional. não há estratégia ao jogador i que lhe proporcione maior recompensa que s*i. s -i) ≥ πi (s’i. denominada Potencial. está avaliando os benefícios de exportar seus produtos ao Brasil.

0 (D) 2. porque dada a melhor escolha de um jogador. s*-i) > πi (si. Um método conveniente é observar qual a melhor estratégia. não exporta}. de cada jogador para cada uma das opções do outro jogador. Mas o equilíbrio de Nash não implica necessariamente recompensas estritamente superiores. s*-i). a que proporciona a maior recompensa. s*-i) ≥ πi (si. 1 (P) 1. 1 Exporta em larga escala (D) 0. para todo s-i e todo i. Formalmente: πi (s*i. assinalando-as para conferir quais os pontos de convergência. 2 (P) A combinação da melhor estratégia para Dominante (D) quando a Potencial adota sua melhor estratégia (P). > O Equilíbrio de Nash estrito O equilíbrio do jogo apresentado anteriormente consiste num equilíbrio de Nash estrito. 0 Potencial Exporta em pequena escala 1. e vice-versa.Mesmo numa interação estratégica pequena como a anterior pode levar tempo a identificação do Equilíbrio de Nash apenas olhando para o jogo. . aponta para o Equilíbrio de Nash: {investe. Formalmente: πi (s*i. Jogo de prevenção na concorrência pelo comércio nacional Não exporta Dominan te Investe Não investe (D) 2. não há outra estratégia para o outro jogador em seu conjunto de estratégias que proporcione recompensa ao menos tão boa quanto aquela que permite o Equilíbrio de Nash estrito. podendo indicar que há outros resultados ao menos tão bons quanto. s*-i). -1 -1. para todo s-i e todo i.

-1 -1. 1 (P) (D) 2. mas nunca ocorrerá uma melhor que s*i. Dois países. este será um Equilíbrio de Nash? Para responder a esta questão utiliza-se o jogo do comércio internacional. num mesmo montante de receita. diz-se que não há equilíbrio de Nash estrito. 0 Potencial Exporta em pequena escala 1. se houver equilíbrio em estratégias estritamente dominantes. caso a Potencial adote a estratégia {não exporta}. Como as recompensas da empresa Dominante são iguais para diferentes estratégias. Mas. 0 (D) 2. Jogo do comércio internacional País B Tarifa alta Tarifa baixa . Reformulando as recompensas do jogo apresentado anteriormente: Jogo de prevenção na concorrência pelo comércio nacional Não exporta Dominan te Investe Não investe (D) 2. 1 Exporta em larga escala (D) 0. Cada um deles têm como opções adotar uma tarifa alta ou baixa sobre os produtos importados. 2 (P) {Investe. A e B. e as receitas possíveis de serem proporcionadas após a aplicação das tarifas são as recompensas do jogo. > Equilíbrio em estratégias estritamente dominantes e Equilíbrio de Nash estrito Até aqui tem-se que mesmo não existindo equilíbrio em estratégias estritamente dominantes pode haver Equilíbrio de Nash. transacionam seus produtos entre si. não exporta} continua sendo a combinação de estratégias que dá o Equilíbrio de Nash no jogo.Implica que alguma estratégia si poderá ser tão boa quanto s*i.

Essa conclusão também pode ser obtida formal/algébrica de cada um dos equilíbrios: pela representação 1. Nesse caso específico ocorre Equilíbrio de Nash estrito.700.300 Pelo método de eliminação iterativa das estratégias dominadas vê-se que o resultado será que os dois países adotam tarifas altas. > Equilíbrio de Nash e Ótimo de Pareto. Todo equilíbrio em estratégias estritamente dominantes é um equilíbrio de Nash estrito. Equilíbrio em estratégias estritamente dominantes: πi (s*i. Dado s*-i. para todo s-i e todo i. Esse resultado é uma regra geral: sempre que houver um equilíbrio em estratégias estritamente dominantes esse equilíbrio será um Equilíbrio de Nash estrito. todo si e todo i. 2. Equilíbrio de Nash estrito: πi (s*i.700 800. s*-i) > πi (si. 1. 700 1.300. s*-i). 800 700. porque impõe o mesmo resultado para o jogador i para quaisquer que sejam as estratégias dos outros jogadores.País A Tarifa alta Tarifa baixa 2. *-i) > πi (si. s*i será a melhor estratégia de i. Pelo método de avaliação da melhor estratégia para cada jogador também tem-se {tarifa alta. o Equilíbrio em estratégias estritamente dominantes é ainda mais restrito (difícil de ocorrer). resultado que s-i possa ser s*-i. Dado s-i. para todo s-i. s*i será a melhor estratégia de i. s-i). . 2. Ótimo de Pareto: Situação em que não é possível melhorar a situação de um agente sem piorar a de outro. tarifa alta} como combinação em que ocorre Equilíbrio de Nash. Enquanto o Equilíbrio de Nash estrito indica uma melhor estratégia para i quando os demais jogadores adotam suas melhores estratégias. Ocorre que s-i pode combinar as melhores estratégias dos demais jogadores.

700. enquanto a AntiVírus. O exemplo de dois equilíbrios pode ser visto no jogo de coordenação do padrão tecnológico. 2.Se há possibilidade de melhoria sem afetar negativamente outro agente então ocorre uma ineficiência no sentido de Pareto. 1. Mas é uma situação ineficiente no sentido de Pareto. Situação que permite uma melhoria no sentido de Pareto. Ocorre que o Equilíbrio de Nash não está direcionado a uma eficiência conjunta. Dois jogadores.700 {Tarifa alta. decide se irá ou não atualizar seu produto para esse possível modificação no software da SysOp. 800 700. A combinação estratégica {tarifa baixa. Nesse caso específico há possibilidade de melhoria no sentido de Pareto para os dois jogadores. tarifa baixa} é um ótimo de Pareto. a SysOp e a AntiVírus. > Um caso de mais do que um Equilíbrio de Nash Um jogo pode der um. Jogo do comércio internacional País B País A Tarifa alta Tarifa baixa Tarifa alta Tarifa baixa 800. já eu permite melhoria na recompensa de um jogador sem prejudicar a recompensa do outro. A diferença possível entre o Equilíbrio de Nash e o ótimo de Pareto pode ser observada nas recompensas do jogo de comércio internacional.300. observa apenas a escolha individual. A primeira enfrenta a decisão de desenvolver ou não uma nova ferramenta para seu software. mais de um ou nenhum Equilíbrio de Nash.300 2. Jogo de coordenação de padrão tecnológica . simultaneamente. tarifa alta} é a combinação de estratégias que resulta no Equilíbrio de Nash. 700 1.

Quando há conhecimento comum ou uma experiência compartilhada pelos agentes que indique e/ou influencie a decisão dos jogadores para uma determinada combinação de estratégias.AntiVírus SysOp Desenvolver Não desenvolver Atualizar Não atualizar 2. 1 0. atualizar} quanto {desenvolver. tanto {desenvolver. O resultado será dado por fatores circunstanciais. -2 1. sendo as duas Equilíbrios de Nash. 2 As estratégias convergentes são interessantes a ambas. que permite aos jogadores convergirem para um Equilíbrio de Nash específico num jogo que possua mais de um desses equilíbrios. não atualizar}. 1 0. -1 -1. Conquanto possam existir mais de uma dessas situações. 2 . não há como predizer o resultado do jogo com as informações disponíveis. > Selecionando entre vários Equilíbrios de Nash: O conceito de ponto focal Ponto focal: Elemento de destaque em determinado contexto. Então qual a utilidade do Equilíbrio de Nash? Busca situações em que os agentes não tenham estímulos para modificar suas decisões. Assim. Jogo de coordenação de padrão tecnológica AntiVírus SysOp Desenvolver Não desenvolver Atualizar Não atualizar 2. -1 -1. -2 1. os agentes podem se acomodar numa situação que lhes seja a melhor disponível no jogo.

Jogo de combinar moedas Jogador 2 Jogador 1 Cara Coroa Cara 1. > Alguns jogos importantes A seguir são apresentados jogos famosos que identificam diferentes situações de interação entre os jogadores. -1 Nesse jogo não há estratégia dominante ou dominada. mostram uma moeda ao outro ao mesmo tempo. . que sempre apresentam um Equilíbrio de Nash. A ausência de um Equilíbrio de Nash ocorre porque não são admitidas estratégias mistas. nem Equilíbrio de Nash. o jogador 1 fica com as duas moedas. 1 1. Cada um escolhe a face da moeda que irá mostra. Não há acomodação. cara ou coroa.Um exemplo de ponto focal poderia ser um famoso colunista de tecnologia. Jogo conhecido como estritamente competitivo ou de soma zero. Thomas Schelling ganhou o Nobel de economia em 2005. o jogador 2 fica com as duas. como será visto no quinto Capítulo. sobre o ponto focal. Se ambas forem iguais. > Um caso em que não há Equilíbrio de Nash Um exemplo de jogo que não possui Equilíbrio de Nash é o jogo de combinar moedas. 1 Coroa -1. Por essa contribuição. que comente sob o advento ou não de uma nova tecnologia em desenvolvimento. conhecido o bastante para ser lido por representantes/funcionários das duas empresas. Dois jogadores. -1 -1. 1 e 2. Se diferirem.

A batalha dos sexos: O problema da coordenação com várias opções Um casal fez planos para se encontrar a noite. -1 2. Colocadas em celas separadas. ambos irão dividir a pena máxima. Ambos valorizam o encontro mais do que o desencontro. 2. O dilema do prisioneiro: Cooperação versus interesse próprio Dois suspeitos são detidos após o acontecimento de um crime. conquanto cada um tenha uma preferência específica quanto ao local do encontro. Ocorrem dois Equilíbrios de Nash. por estarem rondando nas proximidades. Eles não tem como se comunicar. -1 -1. 0 0. 2 -1. Se os dois confessarem. 1 Situação em que sempre há ganho quando existe coordenação entre os jogadores. recebem as seguintes instruções da polícia: Se um confessar e o outro não. mas a programação não ficou definida. Jogo da batalha dos sexos Ele Ela Futebol Show Futebol Show 1. 4 -1. ambos serão detidos por um tempo mínimo pelo crime de vadiagem. Se nenhum confessar. -2 -4. de forma que não possam se comunicar. Jogo do dilema do prisioneiro Ladrão 2 Ladrão 1 Confessa Não confessa Confessa Não confessa -2. quem confessa é o beneficiado pela cooperação e apenas o outro recebe punição.1. -1 .

O Equilíbrio de Nash implica no pior resultado conjunto. Isso decorre dos jogadores não poderem se comunicar. cada um em seu carro acelerando em direção ao outro. 4. O resultado será circunstancial. 3. 0 Não desvia Desvia O jogo apresenta dois Equilíbrios de Nash. Como ambos os jogadores maximizam seus interesses. . Jogo da galinha Jovem 1 Jovem 2 Não desvia Desvia -2. 2 2. O jogo da caça ao cervo: O dilema do contrato social O jogo exemplifica o dilema do contrato social de Rousseau. -1 0. não há possibilidade de coordenação. sobre o instinto incontrolável do homem mesmo quando trabalha em grupo mediante o benefício do todo. -2 -1. {confessa. O jogo da “galinha”: Quando a competição é destrutiva Dois adolescentes disputam o jogo da galinha. tem-se que o indivíduo tentará trabalhar pela sociedade. mas não tardará em buscar o benefício particular se a oportunidade surgir. Quando isso não ocorre há um jogo não-cooperativo. confessa}. O primeiro a desviar é apelidado de galinha enquanto o outro leva a fama de durão. Implica num jogo não-cooperativo. Pelo exposto. Jogo cooperativo: Quando os jogadores podem estabelecer compromissos entre si com garantias efetivas.

O jogo derivado do exemplo apresenta dois caçadores. cervo} e {lebre. Ocorre que se passar por ali uma lebre qualquer um dos dois estará disposto a persegui-la para seu ganho pessoal em detrimento à caça ao cervo. Jogo da caça ao cervo Caçador B Caçador A Cervo Lebre Cervo Lebre 3. . A e B. 1 1. 3 1. 1 Há dois equilíbrios de Nash {cervo. 0 0. Um deles é um Ótimo de Pareto. lebre}. O jogo exemplifica situações em que manter o compromisso original é a melhor estratégia para o indivíduo e para o grupo. que estão buscando um cervo para alimentar o grupo.