Microeconomia 2, José Guilherme UNB 2019

Microeconomia 2 Nota de Aula 1
MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 1 – Graduação
Prof. José Guilherme de Lara Resende
1 Equilı́brio Geral com Trocas

1.1 Introdução
Na teoria de equilı́brio parcial, estudamos o funcionamento do mercado de um bem isoladamente.

Agora vamos estudar o funcionamento de uma economia como um todo. De modo geral, a demanda
e a oferta de um bem dependem não somente do preço deste bem, mas também dos preços de outros
bens da economia. Essa relação de dependência entre os mercados torna o estudo de uma economia
mais complicado. Esse estudo é chamado equilı́brio geral.
A ideia da mão invisı́vel de Adam Smith pode ser interpretada como uma sociedade formada
por indivı́duos com interesses próprios interagindo por meio de trocas de bens e serviços leva a uma
situação de equilı́brio eficiente:
“Every individual...generally, indeed, neither intends to promote the public interest, nor
knows how much he is promoting it. By preferring the support of domestic to that of
foreign industry he intends only his own security; and by directing that industry in such
a manner as its produce may be of the greatest value, he intends only his own gain, and
he is in this, as in many other cases, led by an invisible hand to promote an end which
was no part of his intention” (Adam Smith, A riqueza das Nações, Livro IV, Capı́tulo
II, p. 477).
Veremos que essa ideia está relacionada ao conceito de eficiência de Pareto e ao Primeiro Teorema
do Bem-estar.
Outras questões importantes com relação a este tópico são:
• Definição: o que é um equilı́brio.
• Existência: sob que condições podemos garantir que um equilı́brio existe.
• Unicidade: sob que condições o equilı́brio será único.
• Estabilidade: desvios do equilı́brio tendem ao equilı́brio ou não.
Walras no final do século XIX argumentou a existência de equilı́brio nos moldes de demanda
igual à oferta. Porém há um erro na argumentação de Walras. Esse erro foi apontado e corrigido por
Wald em 1935, que provou a existência de equilı́brio sob condições bastante restritivas (utilidades
separáveis, utilidade marginal decrescente para todos os bens, etc). Debreu e Arrow (1954) e
McKenzie (1954) provaram a existência de equilı́brio em um mercado competitivo, sob condições
bem mais gerais do que as de Wald.
José Guilherme de Lara Resende 1 Equilı́brio Geral e Bem-Estar

A hipótese fundamental no estudo de equilı́brio geral é a de mercados competitivos. Isso implica

que os agentes da economia (consumidores e firmas) são tomadores de preços.
Hipóteses Comportamentais. A hipótese de mercados competitivos pode ser posta como:
1. Para cada bem, existe um grande número de firmas e consumidores atuando no seu mercado;
2. Consumidores maximizam a utilidade, sujeita à restrição orçamentária, onde tomam os preços

dos bens como dados;
3. Firmas maximizam lucros, dada a sua tecnologia e tomando os preços dos insumos e dos bens
produzidos como dados.
Outras hipóteses importantes são referentes a ausências de:
1. Custos de transação,
2. Externalidades,
3. Bens públicos,
4. Problemas de informação.
Vamos supor nesta seção que não exista um mercado formal (ou seja, que não exista um sistema
de preços). Logo, todas as interações entre os diversos agentes da economia são realizadas por meio
de trocas voluntárias (“barter economy”).
Também não lidaremos neste momento com a questão de produção. Cada indivı́duo da economia
recebe uma dotação inicial de bens. Vamos representar pelo vetor ei ∈ Rn+ a dotação inicial dos n
bens do consumidor i, i = 1, . . . , I.
O caso de dois indivı́duos e dois bens, I = 2 (nesse caso vamos representar os dois consumidores
por A e B, para facilitar a notação) e n = 2, pode ser analisado graficamente por meio da caixa de
Edgeworth.
A dotação total de uma economia, eT , é a soma das dotações iniciais dos indivı́duos da economia.
No caso de dois consumidores e dois bens, temos que eT = eA + eB , onde ei = (ei1 , ei2 ), i = A, B.
Definição: Caixa de Edgeworth. A caixa de Edgeworth é uma representação gráfica dessa

economia, onde cada ponto da caixa possui quatro coordenadas, duas referentes ao indivı́duo A e
duas referentes ao indivı́duo B.
A dimensão (o tamanho) da caixa é definida pela dotação total de bens na economia. Um ponto
na caixa representa uma possı́vel distribuição de dotação entre os participantes da economia, sem
desperdı́cios. Todas as possı́veis distribuições de bens na economia estão representadas na caixa.

eB
1
0B
s
Bem 2
?
eA s s s eB
2 2
e = (eA , eB )
6
s
0A -
eA Bem 1
1
Para completarmos a caracterização dessa economia, temos que especificar as preferências in-
dividuais. Representamos estas preferências por meio de funções de utilidade. Supondo que todas
as preferências sejam bem comportadas, obtemos um mapa de curvas de indiferença que preenche
a caixa de Edgeworth, para cada indivı́duo.
eB
1
0B
s
eA s s s eB
2 2
e= (eA , eB )
6
s
0A -
eA
1
Suponha que existam I indivı́duos e n bens. Cada indivı́duo é representado por uma relação de
preferência i (ou, equivalentemente, por uma utilidade ui ) e uma dotação inicial ei . Vamos denotar
por I o conjunto dos consumidores, I = {1, . . . , I}. A coleção E = (ui , ei )Ii=1 representa uma
economia de trocas (ou economia de trocas puras ou economia de trocas simples, sem produção).
Definição: Alocação. Vamos denotar por e = (e1 , . . . , eI ) a distribuição de dotações na economia

e por x = (x1 , . . . , xI ) uma alocação dessa economia. Portanto, uma alocação para a economia E
atribui uma cesta de bens para cada consumidor dessa economia.

Definição: Alocação Factı́vel. Dizemos que a alocação x = (x1 , . . . , xI ) é factı́vel se ela exaure
a dotação total de cada bem na economia. Logo, para cada bem, a quantidade consumida é igual
ao total disponı́vel. O conjunto das alocações factı́veis, denotado por F (e), é dado por:
( I I
)
X X
i i
F (e) = x | x = e
i=1 i=1
Para o caso de dois consumidores, A e B, a alocação x = (xA , xB ), com xA = (xA A

1 , x2 ) e
xB = (xB B
1 , x2 ), será factı́vel se:
Bem 1: xA B A B
1 + x1 = e1 + e1
Bem 2: xA B A B
2 + x2 = e2 + e2
1.2 Eficiência de Pareto
Dizemos que uma alocação factı́vel é Pareto-eficiente se não for possı́vel melhorar (estritamente)
pelo menos um indivı́duo sem piorar ninguém.
Definição: Alocação Pareto-Eficiente. A alocação factı́vel x ∈ F (e) é Pareto-eficiente (ou

Pareto-ótima ou eficiente de Pareto) se não existir nenhuma outra alocação factı́vel y ∈ F (e) tal
que yi i xi , para todo i ∈ I, e yj j xj , para pelo menos um j ∈ I (em termos de utilidade:
ui (yi ) ≥ ui (xi ), para todo i ∈ I, e uj (yj ) > uj (xj ), para pelo menos um j ∈ I).
Dado que as trocas na economia são feitas de forma voluntária, se a economia se encontra
em uma alocação Pareto-eficiente, não será possı́vel mudar essa alocação. Portanto, as alocações
Pareto-eficientes são candidatas naturais ao equilı́brio da economia.
Observações sobre o Critério de Pareto:
• Uma outra maneira de interpretar: alocações de recursos em que não é possı́vel fazer com
que todos melhorem ou que não é possı́vel fazer com que alguém melhore sem que pelo menos
uma outra pessoa piore são alocações Pareto ótimas.
• Alocações eficientes de Pareto são alocações em que todos os ganhos de troca se exauriram.
Logo não existem mais trocas mutualmente vantajosas para serem feitas.
• Em geral há um conjunto grande de pontos Pareto ótimos em uma economia. Dizer que a
economia deve estar em um ponto Pareto ótimo é um juı́zo de valor, mas o mais fraco juı́zo
de valor que se pode fazer a respeito da situação da economia.
• O critério de Pareto apenas diz que não deve haver perdas ou desperdı́cios na economia, ele
não diz nada sobre a distribuição de riqueza de uma sociedade. Se a sociedade partir de
uma dotação inicial de recursos muito desigual, é provável que a alocação de equilı́brio seja
também desigual, mesmo sendo eficiente.
Definição: Curva de Contrato. A curva de contrato é o conjunto de todas alocações Pareto

eficientes da economia. Essa curva também é chamada conjunto de Pareto.


0B
?
Curva de
Contrato
s
s
s
e = (eA , eB )
6
0A -
Para o caso de dois consumidores, A e B, uma alocação eficiente de Pareto pode ser vista como
uma alocação onde um dos agentes está tão bem quanto possı́vel, dada a utilidade do outro agente.
Se as utilidades dos dois agentes forem bem comportadas, então as alocações factı́veis no interior
da caixa de Edgeworth em que as TMS dos dois agentes são iguais definem as alocações Pareto
eficientes, ou seja, a curva de contrato.
Portanto, em uma alocação Pareto eficiente, as taxas marginais de substituição entre dois bens
devem ser iguais entre os consumidores (se não fosse o caso, existiria alguma troca que melhoraria
um dos consumidores sem piorar o outro – observe a figura acima). Note que isso vale para utilidades
bem comportadas e alocações no interior da caixa de Edgeworth.
Exemplo: Suponha dois consumidores, A e B, que possuem dotações iniciais representadas por
eA = (exA , eyA ) e eB = (exB , eyB ), e utilidades Cobb-Douglas denotadas por:
uA (xA , yA ) = xαA yA1−α e uB (xB , yB ) = xβB yB1−β
Igualando a TMS dos dois consumidores, obtemos:

αyA βyB
T M SA (xA , yA ) = = = T M SB (xB , yB )
(1 − α)xA (1 − β)xB
Lembrando que toda alocação Pareto eficiente é factı́vel e que as alocações factı́veis satisfazem
xA + xB = eTx e que yA + yB = eTy , obtemos:
αyA β(eTy − yA )
=
(1 − α)xA (1 − β)(eTx − xA )
Resolvendo essa equação, encontramos yA em função de xA , de modo que define a curva de contrato.
Suponha que as utilidades dos dois indivı́duos são iguais (logo, α = β). Então a última expressão
acima se torna: !
αyA α(eTy − yA ) eTy
= ⇒ yA = xA ,
(1 − α)xA (1 − α)(eTx − xA ) eTx
ou seja, a curva de contrato será uma reta, qualquer que seja a utilidade Cobb-Douglas considerada
(isso não ocorrerá se as utilidades dos dois indivı́duos forem distintas).

Definição: Conjunto de Possibilidade de Utilidade. O conjunto de possibilidade de utilidade

(CPU) ilustra combinações de utilidades possı́veis de serem obtidas, dados os recursos da economia.
Na fronteira da CPU são representadas combinações de utilidades geradas por alocações Pareto
eficientes. Mais ainda, toda alocação Pareto eficiente possui uma representação da utilidade gerada
na fronteira de possibilidade de utilidade (FPU).
uB
6
Fronteira de
Possibilidade
de Utilidade
-
uA
Vamos definir um conceito ainda mais forte do que o de alocações Pareto eficientes. Dada uma
alocação factı́vel qualquer, vamos assumir que coalizões (grupos de indivı́duos) que possam obter
uma alocação melhor entre si, então eles realizam trocas para alcançar essa melhora. Esta ideia é
formalizada nos conceitos a seguir.
Definição: Bloqueio. Seja S ⊂ I uma coalizão de consumidores. Dizemos que S bloqueia a

alocação factı́vel x ∈ F (e) caso exista uma alocação y tal que:
i i
P P
1. i∈S y = i∈S e , e
2. yi i xi para todo i ∈ S, com pelo menos um j ∈ S tal que yj j xj .
Uma alocação para a qual não existe nenhuma coalizão que a bloqueie, ou seja, em que para
todo S ⊂ I não exista y ∈ F (e) tal que yi i xi para todo i ∈ S, com pelo menos uma preferência
estrita, é chamada alocação não bloqueável.
Note que alocações ineficientes são bloqueadas pela coalizão formada por todos os indivı́duos
da economia (S = I). Logo, toda alocação não-bloqueável é Pareto-eficiente (a volta não é válida
em geral).
Definição: Núcleo. O conjunto das alocações não bloqueáveis, denotado por C(e), é chamado
núcleo da economia E.
As alocações no núcleo de uma determinada economia de trocas puras são as candidatas naturais
para serem alcançadas por meio de uma sequência de trocas voluntárias. Porém para isso ocorrer
há um exigência informacional gigantesca para cada participante da economia.

1.3 Equilı́brio em Economias de Trocas
Vamos supor a partir de agora que as transações são efetuadas em mercados competitivos,
onde cada consumidor maximiza o seu bem-estar, dados os preços que observa. Vamos continuar
assumindo que não exista produção na economia. Logo, cada consumidor recebe uma dotação
inicial de bens, que pode ser vendida e daı́ usada para adquirir outra cesta de bens.
Portanto, o sistema de preços é o instrumento alocativo de uma economia de mercado. Ele
determina o valor de cada dotação inicial e, consequentemente, quais cestas de bens estão dentro
da possibilidade de consumo de cada indivı́duo.
Suponha I consumidores, I = {1, . . . , I} denota o conjunto dos I consumidores. Suponha
também que as preferências i de cada consumidor i ∈ I são representadas por uma função de
utilidade ui bem comportada (contı́nua, estritamente crescente e estritamente quasecôncava).
O problema do consumidor i, no caso de dois bens apenas, é:
max
i i
ui (xi1 , xi2 ) s.a. p1 xi1 + p2 xi2 ≤ p1 ei1 + p2 ei2 ,
x1 ,x2
onde ei = (ei1 , ei2 ) é a dotação inicial do consumidor i.

Resolvendo o problema do consumidor, encontramos a sua demanda xi (p, p · ei ), onde para
o caso de dois bens temos que xi (p, p · ei ) = (xi1 (p, p · ei ), xi2 (p, p · ei )). Note que a renda do
consumidor agora é endógena e depende dos preços vigentes na economia.

0B
@
@
@ ?
@
@ xA
@s
@
@
@s
xB @ @
e = (eA , eB )
@s
@
@
@
6 @
@
@
0A -
obs: xi : demanda bruta de i, i = A, B
Observe que no sistema de preços representado na figura acima, cada um dos dois consumidores
está maximizando a sua utilidade dada a restrição orçamentária que enfrenta, em que essa restrição
é determinada pelo sistema de preços. Porém, a economia não está em equilı́brio: há um excesso
de oferta do bem 1 e um excesso de demanda do bem 2.

Vimos que o nı́vel de preços representado na figura acima não iguala a demanda à oferta, para
nenhum dos dois bens. Nesse caso, dizemos que os mercados não se equilibram ou se exaurem.
Logo, a economia está em desequilı́brio. O equilı́brio será obtido via ajuste de preços, que faz
com que a demanda se iguale à oferta para todos os bens da economia. Essa situação é chamada
equilı́brio de mercado, ou equilı́brio competitivo, ou equilı́brio Walrasiano. Preços que alcançam o
equilı́brio são chamados preços de equilı́brio. A alocação resultante é chamada alocação de equilı́brio
(ou alocação de equilı́brio Walrasiano).
Definição: Excesso de Demanda Agregada. A função de excesso de demanda (ou excedente

de demanda) agregada do bem k é definida como:
I
X I
X
zk (p) = xik (p, p i
·e)− eik .
i=1 i=1
O vetor de excesso de demanda agregada é:
z(p) = (z1 (p), . . . , zn (p)) .
Observe que zk (p) = 0 equivale a:

I
X I
X
xik (p, p ·e)=i
eik
i=1 i=1
Então, aos preços p, se zk (p) = 0, a demanda de mercado pelo bem k iguala a oferta de mercado
desse bem. Se z(p) = 0, onde 0 = (0, . . . , 0) denota o vetor de zeros, então os mercados de todos
os bens estão em equilı́brio.
Definição: Equilı́brio. O vetor de preços p∗ é um equilı́brio Walrasiano se z(p∗ ) = 0.
Propriedades da Função Excesso de Demanda. Se para cada consumidor i ∈ I, ui é bem-

comportada, então, para todo p 0, temos que:
1. (Continuidade) z(·) é contı́nua em p. Se um preço varia em uma quantidade pequena, o
excesso de demanda agregada varia por uma quantidade pequena. O excesso de demanda
será contı́nuo se as demandas individuais forem contı́nuas. Também, se cada consumidor
for tomador de preço e sua demanda for pequena em relação à demanda de mercado, então
mesmo que a demanda individual seja descontı́nua, a demanda agregada poderá ser contı́nua.
2. (Homogeneidade) z(αp) = z(p), para todo α > 0. Apenas preços relativos importam –
podemos normalizar os preços e usar um numerário. Logo, não podemos determinar o valor
dos preços absolutos de equilı́brio da economia. Se existem n preços na economia, apenas
n − 1 preços serão independentes. No caso de dois bens, podemos normalizar um deles em 1
e apenas encontrar o preço relativo de equilı́brio do outro bem.
3. (Lei de Walras) p · z(p) = 0. O valor do excesso de demanda agregada é sempre zero,

quaisquer que sejam os preços de mercado. Consequentemente, se existem n mercados na
economia, e n − 1 mercados estão em equilı́brio, então necessariamente o último mercado
estará em equilı́brio. Portanto, para o caso de dois bens, precisamos verificar o equilı́brio
apenas para um dos mercados (uma vez que se um mercado estiver em equilı́brio, o outro
automaticamente também estará em equilı́brio).

Um vetor de preços é um equilı́brio se a demanda agregada se igualar à oferta agregada em

todos os mercados da economia. A questão fundamental é sobre a existência de equilı́brio, ou seja,
sob quais condições podemos garantir a existência de um vetor de preços tal que os consumidores
maximizem a sua utilidade, dados esses preços, e demanda agregada iguala oferta agregada? O
próximo teorema responde essa questão.
Teorema de Existência de Equilı́brio. Se as utilidades de cada consumidor forem bem-

comportadas e se a dotação total de cada bem for positiva, então existirá (pelo menos) um vetor
de preços p 0 tal que os mercados de todos os bens estejam em equilı́brio.
Definição: Alocação de Equilı́brio Walrasiano. Seja p∗ um equilı́brio Walrasiano para a

economia E = (i , ei ). O vetor x(p∗ ) é chamado uma alocação de equilı́brio Walrasiano, onde
temos que:
1. (Maximização dos Consumidores) x(p∗ ) = (x1 (p∗ , p∗ · e1 ), . . . , xI (p∗ , p∗ · eI )) é o vetor com

as cestas ótimas de cada consumidor, quando os preços são p∗ e a renda do consumidor i,
i = 1, . . . , I, é p∗ · ei ;
2. (Equilı́brio) Os mercados de todos os bens estão em equilı́brio:

X X
xik (p∗ , p∗ · ei ) = eik , ∀k = 1, . . . , n.
i∈I i∈I
xB∗
1
0B
@
@
@
@ ?
@
@
@
@
@
s
@ Alocação de equilı́brio
xA∗
2
@s xB∗
2
@
@
@
@
@
@se
@
6 @
@
s @
0A -
xA∗
1
A caixa de Edgeworht ilustrada na figura acima mostra um vetor de preços de equilı́brio, que
leva os consumidores A e B, a partir de suas dotações iniciais, representadas no ponto e na caixa,
à alocação de equilı́brio x = (xA∗ , xB∗ ), na qual ambos os consumidores estão maximizando o seu
bem-estar e os mercados dos dois bens estão em equilı́brio.

2 Economias com Produção

2.1 Introdução
Vamos introduzir firmas no modelo de equilı́brio geral desenvolvido anteriormente. A produção

e, portanto, a oferta agregada, são consequências do comportamento maximizador de lucros das
firmas. Logo, a quantidade de bens disponı́veis para consumo não será mais fixa e dependerá da
decisão de produção das firmas. O lucro das firmas é distribuı́do aos consumidores, os proprietários
das firmas. Vamos caracterizar firmas por meio da tecnologia de produção que possuem. Na análise
de equilı́brio geral é mais conveniente representar a tecnologia de uma firma usando o conceito de
conjunto de possibilidade de produção, em vez de representá-la usando o conceito de função de
produção.
Suponha que existam J firmas. O conjunto de possibilidade de produção da firma j, denotado
por Y j ⊂ Rn , com n bens, é o conjunto de todas as combinações de insumos e produtos disponı́veis
para a firma. Um vetor yj ∈ Y j é chamado plano de produção. Vamos usar a convenção de que
se o bem k for um insumo lı́quido (a firma usa mais desse bem do que é capaz de produzir), a
coordenada k de yj será negativa (ykj < 0). Se o bem k for um produto lı́quido da firma (a firma
produz mais desse bem do que o consome no processo produtivo), então a coordenada k de yj será
positiva (ykj > 0).
x2
6
Conjunto de
Possibilidade de
* Produção (convexo)

-
x1
Dado o vetor de preços p ≥ 0, a firma j escolhe o plano de produção que maximiza lucros:
max p · yj (1)
yj ∈Y j
Esse problema é similar ao problema de maximização de lucros em termos de funções de produção,

só que agora escrito em termos de conjuntos de possibilidade de produção.
Propriedades da função lucro e oferta ótima. Se o conjunto de possibilidade de produção
(CPP) Y j satisfizer certas condições, então, para todo vetor de preços p 0, a solução do problema
da firma (1) acima será única e contı́nua (denotada por yj (p)). Além disso, a função lucro, Πj (p) =
p · yj (p), será bem-definida e contı́nua.
O vetor yj (p) é chamado função de oferta da firma j, em sentido amplo, já que engloba não
somente os bens que a firma produz, mas também os bens que a firma utiliza como insumos.

2.2 Eficiência Técnica e FPP
Suponha que existam dois produtos, X e Y , produzidos por duas firmas distintas, que usam
dois fatores de produção, capital, K e trabalho, L. Suponha que as quantidades de capital e
trabalho estão fixas. Podemos construir uma caixa de Edgeworth para produção, onde uma firma
é representada no vértice sudoeste da caixa e a outra firma é representada no vértice noroeste
da caixa. Representamos as isoquantas de ambas as firmas na caixa. Pontos de tangência destas
isoquantas representam pontos de eficiência produtiva ou eficiência técnica. Podemos então definir
uma curva de contrato para a produção.

02
Curva de
s Contrato
s para Produção
01 -
Observe que na curva de contrato para a produção, as taxas marginais de substituição entre
os insumos são iguais para ambas as firmas. Logo, em pontos de eficiência técnica, as taxas
marginais de substituição entre dois insumos quaisquer são iguais entre firmas, mesmo que estas
firmas produzam bens diferentes (assumindo funções de produção bem comportadas e alocações
no interior da caixa). Podemos construir o seguinte conceito a partir da curva de contrato para a
produção:
Definição: A fronteira de possibilidade de produção (FPP) mostra a quantidade máxima do bem

Y que a sociedade pode produzir, para qualquer quantidade do bem X produzida.
Pontos na FPP representam a quantidade máxima do bem X que pode ser produzida para certa
quantidade do bem Y . Pontos que estão sobre a FPP, tais como o ponto B na figura abaixo, são os
pontos de eficiência técnica ou eficiência produtiva. Pontos no interior da FPP, tais como o ponto
A na figura abaixo, são ineficientes no sentido técnico. Nos pontos sobre a FPP, a taxa marginal de
substituição técnica entre dois insumos é igual para todas as firmas, quaisquer que sejam os bens
que elas produzam, assumindo que a tecnologia de produção seja “bem-comportada”.
Podem existir pontos de eficiência técnica que não representem alocações Pareto eficientes.
Porém, toda alocação Pareto eficiente está necessariamente associada a um ponto de eficiência
técnica.

Bem Y
6
Fronteira de Possibilidade de Produção

sB
sA
-
Bem X
A FPP tem inclinação negativa devido à escassez de recursos. Se estamos no ponto B na figura
acima e queremos produzir mais do bem X, precisamos abrir mão de um pouco de bem Y (a
sociedade realoca alguns dos recursos usados na produção de Y para a produção de X). Portanto,
a escassez de fatores de produção implica que a FPP é negativamente inclinada.
Definição: O custo marginal do bem X é o custo de produzir uma unidade adicional de X,

expresso em unidades do outro bem que deixa de ser produzido:

dY
CM gX,Y = −
dX F P P
O formato da curva da FPP reflete como o custo marginal de um bem muda com a quantidade do
outro bem sendo produzida. Esse custo de oportunidade marginal da FPP é chamado taxa marginal
de transformação dos bens. Essa taxa mede a taxa pela qual um bem pode ser transformado em
outro, no sentido de que os fatores de produção são realocados da produção de um dos bens para
a produção do outro bem.
Portanto, o custo marginal de produção de um bem em termos de outro bem é dado pela
inclinação da FPP. Uma FPP com inclinação constante (isto é, uma reta) significa que este custo
marginal é constante, independente da quantidade produzida. Uma FPP côncava significa que este
custo marginal aumenta quanto mais desse bem é produzido. Ou seja, quanto maior a produção
de vinho, para produzir mais um litro de vinho, temos que abrir mão de uma quantidade maior de
pão.

2.3 Equilı́brio
Os consumidores são modelados como antes, por meio de uma função de utilidade e de uma
dotação inicial, que inclui bens ou serviços que o consumidor oferece ao mercado, como trabalho,
por exemplo. Com a inclusão de firmas na análise, precisamos descrever a distribuição dos lucros
dessas firmas na economia. Vamos denotar por θij a fração da firma j que o consumidor i detém.
Devemos ter que:
X
0 ≤ θij ≤ 1, ∀i ∈ I, j ∈ J , e θij = 1, ∀j ∈ J .
i∈I
Um consumidor possui duas fontes de renda: a sua dotação de bens e serviços e a quantidade
de ações de firmas que possui. A restrição orçamentária do consumidor i se torna então:
X
p · x i ≤ p · ei + θij Πj (p) = mi (p),
j∈J
onde mi (p) denota a renda do consumidor i. O problema do consumidor i é portanto:
max
i n
ui (xi ) s.a. p · xi ≤ mi (p) (2)
x ∈R+
Resolvendo este problema, encontramos as demandas ótimas dos consumidores, o que permite
calcular a demanda de mercado.
Com a introdução das ações das firmas, completamos a caracterização da economia, que pode
ser denotada por E = (ui , ei , θij , Y j )i∈I,j∈J (chamada economia de propriedade privada).
A função excesso de demanda agregada do bem k é agora dada por:
X X j X
zk (p) = xik (p, mi (p)) − yk (p) − eik ,
i∈I j∈J i∈I
e o vetor de excesso de demandas é denotado por:
z(p) = (z1 (p), . . . , zn (p)) .
O vetor de funções excesso de demanda agregada definido para economias com produção con-
tinua satisfazendo as mesmas três propriedades que eram satisfeitas no caso de uma economia de
trocas puras: 1) continuidade, 2) homogeneidade, e 3) lei de Walras. Essas propriedades possuem
as mesmas interpretações e implicações que vimos anteriormente.
Considere a economia de propriedade privada E = (ui , ei , θij , Y j )i∈I,j∈J . Suponha que cada util-
idade individual satisfaz certas propriedades (por exemplo, é bem-comportada) e que o conjunto de
possibilidade de produção de cada firma satisfaz certas
Phipóteses (por exemplo, apresenta retornos
decrescentes de escala). Suponha também que y + i∈I ei 0 para algum vetor de produção
agregada.
Nesse caso, podemos garantir que existe pelo menos um vetor de preços p∗ 0 tal que o vetor
de excessos de demanda seja igual a zero, z(p∗ ) = 0. A alocação de equilı́brio para uma economia
com produção deve descrever além das cestas de consumo de cada indivı́duo, os planos de produção
ótimos de cada firma.

Definição: Alocação de Equilı́brio. Seja p∗ um equilı́brio para E = (ui , ei , θij , Y j )i∈I,j∈J . O

par de vetores (x(p∗ ), y(p∗ )) é uma alocação de equilı́brio Walrasiano, onde temos que:
1. (Maximização dos Consumidores) x(p∗ ) = (x1 (p∗ ), . . . , xI (p∗ )) é o vetor com as cestas ótimas
de cada consumidor, quando os preços são p∗ e a renda do consumidor i, i = 1, . . . , I, é mi (p∗ );
2. (Maximização das Firmas) y(p∗ ) = (y1 (p∗ ), . . . , yJ (p∗ )) é o vetor com os planos de produção
ótimos de cada firma j, quando os preços são p∗ ;
3. (Equilı́brio) Os mercados de todos os bens estão em equilı́brio:
X X X j
xik (p∗ ) = eik + yk (p∗ ), ∀k = 1, . . . , n.
i∈I i∈I j∈J
A figura abaixo ilustra uma situação de equilı́brio, considerando uma economia com um único
consumidor. Observe que se a condição de tangência não for satisfeita, isso significa que a taxa
na qual o consumidor está disposto a trocar um dos bens pelo outro é diferente da taxa na qual
esse bem pode ser transformado no outro. Então existe a possibilidade de melhorar o bem-estar do
consumidor, ao se rearranjar a produção. Portanto, se a condição de tangência não for satisfeita, a
alocação não será Pareto eficiente.
Bem Y
6
FPP
@
@
@
@
Y∗ @s
@
@
@
@ Curva de Indiferença
@
@
@
@
@ Nı́vel de Preços
de Equilı́brio
-
∗
X Bem X
Observações Importantes:
• A figura acima deixa claro que nem todo ponto de eficiência técnica será Pareto eficiente, mas
todo ponto Pareto eficiente será tecnicamente eficiente.
• Uma alocação Pareto eficiente satisfaz as seguintes três condições:
1. Eficiência nas trocas: As taxas marginais de substituição entre quaisquer dois bens
devem ser iguais.
2. Eficiência técnica ou produtiva: Para todas as firmas, as taxas técnicas de substituição
entre quaisquer dois insumos devem ser iguais.
3. Eficiência no mix de produtos: A taxa técnica de transformação entre dois bens deve
ser igual à taxa marginal de substituição dos consumidores.

Exemplo 1. Suponha uma fronteira de possibilidade de produção para os bens X e Y representada

pela equação cX 2 + dY 2 = e. A função de utilidade do agente representativo desta economia é
uma Cobb-Douglas u(X, Y ) = X α Y β . Então a taxa marginal de substituição (TMS) entre os dois
bens, em valor absoluto, é:
∂u(X, Y )/∂X αY
|T M S| = =
∂u(X, Y )/∂Y βX
Já o valor absoluto da taxa marginal de transformação (TMT) entre os dois bens pode ser encon-
trado usando o Teorema da Função Implı́cita, definindo f (X, Y ) = cX 2 + dY 2 − e:

dY ∂f (X, Y )/∂X cX
dX = ∂f (X, Y )/∂Y = dY

Igualando o valor absoluto da TMS ao da TMT, obtemos:

r !
αY cX βc βc
= ⇒ Y2 = X2 ⇒ Y = X
βX dY αd αd
Note que se α = β e c = d, então a solução ótima consiste em X = Y . Os valores de X e Y podem

ser encontrados substituindo a relação ótima derivada acima entre X e Y na FPP, cX 2 + dY 2 = e:
s
2
βcX αde αde
cX 2 + = e ⇒ X2 = ⇒ X∗ =
αd αcd + βc αcd + βc
A quantidade ótima de Y pode ser obtida usando aprelação ótima entre X e Y acima e o valor
ótimo de X encontrado acima, o que leva a Y ∗ = βce/(αcd + βc). Já os preços de equilı́brio
podem ser encontrados fazendo px /py = |T M S(X ∗ , Y ∗ )| = |T M T (X ∗ , Y ∗ )|, o que resulta em:
αY ∗ cX ∗
r
px px αc
= ∗
= ∗
⇒ =
py βX dY py βd
Voltando ao caso em que α = β e c = d, então px /py = 1.
Exemplo 2: Economia de Robinson Crusoe. Suponha uma economia com dois bens, formada
por apenas um indivı́duo e uma firma. A utilidade do consumidor é:
u(h, y) = h1−β y β ,
com 0 < β < 1. Vamos supor que a dotação inicial do consumidor é eT = (T, 0). A tecnologia da
firma é descrita pela função de produção y = hα , com 0 ≤ h ≤ b, b > T e 0 < α < 1. O problema
da firma é:
max phα − wh,
h≤0
onde p é o preço do bem final e w é o salário. A solução do problema da firma resulta em:
1
αp 1−α α
αp 1−α
hf = e yf =
w w
O lucro ótimo é: 1
1−α αp 1−α
π = π(w, p) = w ≥ 0.
α w

O problema do consumidor é:
max h1−β y β s.a. py + wh = wT + π(w, p).

h,y≥0
A solução do problema do consumidor é:

c wT + π(w, p) c wT + π(w, p)
h = (1 − β) e y =β
w p
Como apenas preços relativos importam, vamos normalizar p∗ = 1. Pela lei de Walras, basta
verificarmos a condição de equilı́brio de um dos mercados para determinar o preço w de equilı́brio.
No mercado h, temos que hf + hc = T resulta em:
1−α
f c ∗ 1 − β(1 − α)
h +h =T ⇒ w =α .
αβT

3 Bem-Estar Social
3.1 Eficiência de Pareto
Vimos que o princı́pio básico de eficiência usado em economia é o critério de Pareto, que
formaliza a ideia de que se na situação social A um indivı́duo fica melhor e nenhum fica pior
comparado à situação B então a situação A é melhor para a sociedade do que a situação B. Ou,
se na situação social A, todos os membros da sociedade estão melhores comparados à situação B,
então, a situação A é melhor para a sociedade que a situação B. O critério ou princı́pio de Pareto
também pode ser formalizado da seguinte maneira.
Definição: Uma alocação social A é Pareto-dominada pela alocação B se a alocação B é factı́vel

e nenhum agente fica pior, e pelo menos um fica melhor, na alocação B que na alocação A.
Definição: Uma alocação factı́vel é Pareto ótima (ou eficiente de Pareto) se não é Pareto-dominada
por nenhuma outra alocação factı́vel.
Uma alocação eficiente de Pareto satisfaz as seguintes três condições (“em situações bem-
comportadas”:
• Eficiência nas trocas: as taxas marginais de substituição entre quaisquer dois bens devem ser
iguais.
• Eficiência produtiva: para todas as firmas, as taxas técnicas de substituição entre os insumos
devem ser iguais.
• Eficiência no mix de produtos: a taxa marginal de transformação entre dois bens deve ser
igual à taxa marginal de substituição dos consumidores.
3.2 Os Dois Teoremas de Bem-Estar
O Primeiro e o Segundo Teoremas do Bem-Estar são resultados cruciais sobre bem-estar em

economias de mercado. Os dois teoremas respondem à pergunta em que sentido e sob quais
condições mercados competitivos levam à eficiência econômica e quando qualquer situação de
eficiência pode ser alcançada por um mercado competitivo.
Primeiro Teorema do Bem-Estar. Toda alocação de equilı́brio Walrasiano é Pareto-ótima.
O Primeiro Teorema do Bem-Estar afirma que todo equilı́brio Walrasiano satisfaz o critério de
Pareto, ou seja, todo equilı́brio em concorrência perfeita é Pareto ótimo. Logo, não existe nenhum
rearranjo de recursos (ou seja, nenhuma mudança na produção ou no consumo) tal que alguém
possa melhorar sua situação sem ao mesmo tempo piorar a situação de outro. Portanto, o mercado
agindo sozinho alcança uma situação de equilı́brio Pareto ótima, mesmo com cada agente econômico
agindo de modo egoı́sta, no sentido de buscar apenas o seu próprio bem-estar. Este resultado está
relacionado com a famosa “mão invisı́vel ” de Adam Smith. Observe que a alocação de equilı́brio
pode ser bastante desigual e ainda assim ser Pareto eficiente.
Segundo Teorema do Bem-Estar. Sob certas hipóteses, se x é Pareto-eficiente, então x é

uma alocação de equilı́brio Walrasiano para algum preço p de equilı́brio, após uma redistribuição
adequada de dotações iniciais.

O Segundo Teorema Fundamental do Bem-Estar diz que, “sob certas condições”, toda alocação
Pareto ótima pode ser obtida pela economia de mercado, por meio de uma redistribuição adequada
das riquezas iniciais dos agentes.
Portanto, o teorema implica que qualquer alocação Pareto-ótima pode ser atingida por meio
do mecanismo de mercado descentralizado, ou seja, não é necessário haver um planejador cen-
tral. O próprio mercado pode alcançar a alocação desejada, sendo necessária somente a correta
redistribuição de recursos na economia. Neste sentido, é possı́vel dizer que o segundo teorema do
bem-estar permite a separação dos problemas de eficiência econômica e de distribuição dos bens na
sociedade.
O segundo teorema do bem-estar supõe uma série de hipóteses para a sua validade. As mais
importantes e restritivas são relacionadas a questões de convexidade. Primeiro, as preferências dos
consumidores devem ser convexas. Segundo, o conjunto de produção de cada firma deve ser convexo
(é possı́vel relaxar esse requerimento, mas devemos ter que o conjunto de possibilidade de produção
agregado da economia seja convexo). Isso elimina a possibilidade de que o teorema seja válido na
presença de retornos crescentes de escala (pelo menos de maneira geral para toda a economia).
Falhas de mercado são situações que invalidam os teoremas de bem-estar. Em particular, se
alguma falha estiver presente, não podemos afirmar que a alocação de recursos e bens alcançada
por uma economia de mercado satisfaça o critério de eficiência de Pareto.
Exemplos de falhas de mercado:
• Bens Públicos;
• Externalidades;
• Poder de mercado;
• Informação Imperfeita.
3.3 Alocações Justas
Seja x = (xA , xB ) uma alocação qualquer. Dizemos que o indivı́duo i inveja a cesta do indivı́duo
j caso ele prefira a cesta de j à sua própria cesta. Por exemplo, dizemos que o indivı́duo A inveja
a cesta de B caso uA (xB B A A A
1 , x2 ) > u (x1 , x2 ).
Definição: Alocação Equitativa. Uma alocação equitativa é uma alocação para a qual nenhum
indivı́duo inveja a cesta de outro indivı́duo.
Definição: Alocação Justa. Uma alocação justa é uma alocação equitativa e eficiente.
Podemos mostrar que sempre existirá pelo menos uma alocação justa: a alocação de equilı́brio
obtida de uma divisão igualitária de recursos será uma alocação justa.

Leitura Recomendada
• Varian, caps. 31 - “Trocas” e 32 - “A Produção”.
• Pindick e Rubinfeld, cap. 16 - “Equilı́brio Geral e Eficiência Econômica”.
• Nicholson e Snyder, cap. 13 - “General Equilibrium and Welfare”.
Exercı́cios
1. Desenhe a caixa de Edgeworth para as economias descritas abaixo, ilustrando as dotações

iniciais, as curvas de indiferença que passam por essas dotações e as alocações descritas nos
itens.
(a) Economia 1: uA = xA A B B B A B
1 x2 , u = x1 x2 , e = (3, 7), e = (7, 3). Alocações: (x , x ) =
A B
A B A B
((2, 5), (8, 5), (x̃ , x̃ ) = ((0, 3), (10, 7), (x̂ , x̂ ) = ((6, 6), (6, 6).
(b) Economia 2: uA = xA A
1 x2 , u
B
= min{xB B
1 , x2 }, e
A
= (4, 5), eB = (11, 5). Alocações:
(xA , xB ) = ((12, 3), (3, 7), (x̃A , x̃B ) = ((10, 5), (5, 5), (x̂A , x̂B ) = ((3, 6), (2, 7).
(c) Economia 3: uA = xA A B B B A B
1 + x2 , u = min{x1 , x2 }, e = (4, 5), e = (6, 15). Alocações:
(xA , xB ) = ((5, 8), (5, 12), (x̃A , x̃B ) = ((10, 5), (0, 15), (x̂A , x̂B ) = ((3, 13), (7, 7).
2. Para as economias descritas nos itens da questão anterior, responda:
(a) Quais alocações são factı́veis?
(b) Descreva a curva de contrato para cada uma dessas economias. Ilustre graficamente a
curva de contrato na caixa de Edgeworth.
(c) Descreva as alocações no núcleo de cada uma dessas economias. Ilustre graficamente o
núcleo na caixa de Edgeworth.
3. Suponha uma economia com dois consumidores, A e B, com utilidades definidas sobre cestas
1/2 1/2
de dois bens, x e y, denotadas por uA (xA , yA ) = xA yA e uB (xB , yB ) = xB yB . As dotações
iniciais de A e B são eA = (6, 4) e eB = (4, 6).
a) Desenhe a caixa de Edgeworth para essa economia, ilustrando as dotações iniciais.
b) Descreva os conjuntos das alocações factı́veis e das alocações Pareto eficientes. Descreva
as alocações que estão no núcleo desta economia.
c) Determine os preços de equilı́brio para esta economia.
d) Normalize o preço do bem y em 1. Mostre que para os preços de equilı́brio encontrados
no item anterior, temos que de fato demanda iguala oferta no mercado dos dois bens.
4. (NS) Suponha que existam apenas três bens, denotados por x1 , x2 e x3 , em uma economia
sem produção. As funções de excesso de demanda agregada pelos bens 2 e 3 são:
3p2 2p3
z2 (p) = − + − 1,
p1 p1
4p2 2p3
z3 (p) = − − 2.
p1 p1
(a) Mostre que essas funções são homogêneas de grau zero nos preços.
(b) Use a Lei de Walras para mostrar que se z2 (p) = z3 (p) = 0, então z1 (p) também deve
ser igual a zero. Você consegue calcular z1 (p) usando a lei de Walras?
(c) Resolva esse sistema de equações para encontrar os preços relativos de equilı́brio p2 /p1
e p3 /p1 . Qual é o valor de equilı́brio de p3 /p2 ?

5. (P1-2/18) Suponha uma economia com dois consumidores, A e B, com utilidades definidas
sobre cestas de dois bens, x e y, denotadas por uA (xA , yA ) = x2A yA2 e uB (xB , yB ) = xB yB . As
dotações iniciais de A e B são eA = (12, 8) e eB = (8, 12).

c) Determine os preços de equilı́brio para esta economia.
d) Normalize o preço do bem y em 1. Mostre que para os preços de equilı́brio encontrados
no item anterior, temos que de fato a demanda é igual à oferta no mercado dos dois
bens.
e) Calcule a alocação de equilı́brio Walrasiano. Ela é uma alocação justa? Explique intu-
itivamente a razão da sua resposta.
6. (PS-2/18) Considere uma economia sem produção com dois bens, x e y. Suponha que existam
apenas dois indivı́duos, A e B, com funções de utilidade dadas por uA (x, y) = xy 2 e uB (x, y) =
min{x, y} e dotações eA = (10, 20) e eB = (20, 10).
a) Descreva o conjunto de alocações factı́veis, o conjunto de alocações Pareto-ótimas e o

núcleo dessa economia.
b) Determine as funções de demanda dos dois consumidores.
c) Determine a relação de preços de equilı́brio.
d) Normalizando o preço do bem y em 1, verifique que de fato os dois mercados se equilibram
aos preços encontrados no item c).
e) Determine a alocação de equilı́brio e verifique se ela é justa.
7. (P1-1/19) Suponha uma economia com dois consumidores, A e B, com utilidades definidas
sobre cestas de dois bens, x e y, denotadas por uA (xA , yA ) = x2A yA2 e uB (xB , yB ) = xB + yB .
As dotações iniciais de A e B são eA = (6, 4) e eB = (4, 6).

c) Determine os preços de equilı́brio para esta economia (dica: lembre-se que no equilı́brio,
os preços relativos serão iguais às taxas marginais de substituição em valor absoluto para
os dois consumidores).
d) Calcule a alocação de equilı́brio Walrasiano. Ela é uma alocação justa? Explique intu-
itivamente a razão da sua resposta.

Microeconomia 2 Notas de Aula
MICROECONOMIA 2 – GRADUAÇÃO
Notas de Aula 2 – Teoria da Escolha Social
1 Escolha Social
1.1 Introdução
A teoria da Escolha Social lida com o problema de agregar preferências individuais em uma
preferência social. Ela analisa a questão de como um grupo ou uma sociedade decide coletivamente.
Normalmente essa decisão é por meio de uma regra de agregação das preferências ou escolhas
individuais. É desejável que essa regra satisfaça certos critérios de caráter normativo. Por exemplo,
podemos exigir que a regra de escolha social seja tal que se todos em uma sociedade preferem a
alternativa x à alternativa y, então a regra social resulte sempre em x preferı́vel a y (critério de
unanimidade de Pareto). O principal resultado deste tópico é o Teorema de Impossibilidade de
Arrow. Varian (2012), capı́tulo 33 (“O Bem-Estar ”), constitui uma referência para essa seção.
Definições:
• Alternativa: descrição completa de um estado social;
• X: conjunto finito de alternativas, todas excludentes;
• I: tamanho do grupo ou sociedade (número de indivı́duos);
• Preferências individuais i completas e transitivas sobre as alternativas;
• Grupo de preferências: lista das preferências de todos os indivı́duos do grupo.
Definição: Preferência Social. Uma relação de preferência social S é uma relação binária
sobre X. Representamos por S e ∼S as relações de preferência estrita e indiferença derivadas de
S , respectivamente.
Relembrando a notação de preferências, temos que:
• x S y: (a alternativa) x é socialmente tão boa quanto a y;
• x S y: (a alternativa) x é socialmente melhor que y;
• x ∼S y: (a alternativa) x é socialmente indiferente a y.
Sabemos que axiomas sobre preferências consistem em hipóteses sobre o comportamento in-
divı́dual e cada axioma tem um significado preciso. Vamos supor que a preferência i de todo
indivı́duo i satisfaz os dois axiomas abaixo:
• Axioma de Completeza: Para quaisquer alternativas x e y em X, ou x i y ou y i x (ou
ambos).
• Axioma de Transitividade. Para quaisquer alternativas x, y e z em X, se x i y e y i z
então x i z.
José Guilherme de Lara Resende 1 NA 2 – Escolha Social

O axioma de “completeza” diz que o indivı́duo é sempre capaz de comparar duas alternativas
quaisquer do conjunto X. Portanto, se ele tiver que escolher entre x e y, ele dirá qual alternativa
prefere (ou se é indiferente entre elas). O axioma de transitividade é crucial para a escolha do
indivı́duo ser logicamente coerente. Se esse axioma não for satisfeito, pode não ser possivel dizer
qual é a alternativa preferida pelo indivı́duo. Por exemplo, suponha um indivı́duo que ordene as
alternativas x, y, e z da seguinte maneira não-transitiva: x y, y z e z x. Neste caso não é
possı́vel determinar a alternativa preferida do indivı́duo.
Definição: Regra de Escolha Social (RES). Uma regra de escolha social (ou mecanismo de
decisão social ) f é uma função que associa cada grupo de preferências individuais a uma preferência
social. Logo:
( , , · · · , I ) 7→S
| 1 2{z } f
I indivı́duos
Então f associa a cada conjunto particular de preferências individuais uma ordenação social,
de acordo com o que a regra estabelecer.
1.2 Caso de Duas Alternativas: Teorema de May
Suponha apenas duas alternativas a serem escolhidas, representadas por x e y. Para cada
indivı́duo i, podem existir apenas três casos: 1) x i y, 2) x ∼i y, e 3) y i x. Então, a preferência
de cada indivı́duo pode ser descrita pela função Di definida como:
Di = 1 se x i y
Di = 0 se y ∼i x
i
D = −1 se y i x
Uma regra de escolha social para o caso de duas alternativas pode então ser vista como um mapa
que leva cada vetor com as preferências de todos os indivı́duos sobre x e y (sendo que é possı́vel se
declarar indiferente às duas alternativas), denotado por (D1 , D2 , . . . , DI ), a uma preferência social
DS . Seja o conjunto U = {−1, 0, 1}. No caso de apenas duas alternativas, a regra de escolha social
f pode ser definida como uma função com domı́nio no produto cartesiano U I e contradomı́nio U
(f : U I → U ), de modo a associar cada grupo de preferências individuais (D1 , D2 , . . . , DI ) à escolha
social DS , de acordo com o que a regra f especificar:
{z× · · · × U} 7→
|U × U × U f
U
I indivı́duos)
Exemplo: Votação Majoritária. Seja αi ≥ 0, para todo i = 1, . . . , I, um sistema de pesos.

Definimos f como: !
I
X
f (D1 , . . . , DI ) = sign αi Di ,
i=1
onde sign : R → R é a função definida por sign(a) = 1 se a > 0, sign(a) = 0 se a = 0 e
sign(a) = −1 se a < 0. Se αi = 1 para todo i, f representa a regra de votação majoritária:
I
!
X
f (D1 , . . . , DI ) = sign Di .
i=1

Para a regra de votação majoritária vale que:
f (D1 , . . . , DI ) = 1 ⇔ #(i : x i y) > #(i : y i x)

1 I
f (D , . . . , D ) = 0 ⇔ #(i : x i y) = #(i : y i x)
f (D1 , . . . , DI ) = −1 ⇔ #(i : x i y) < #(i : y i x) ,
em que #(i : x i y) denota o número de pessoas que preferem estritamente x a y e #(i : y i x)

denota o número de pessoas que preferem estritamente y a x.
Logo, a regra de votação majoritária decide que x é socialmente preferı́vel a y se o número de
pessoas que preferem (estritamente) x a y for maior do que o número de pessoas que preferem
(estritamente) y a x. No caso de o número de pessoas que preferem y a x for maior do que o
número de pessoas que preferem x a y, então y será socialmente preferı́vel a x. Finalmente, se
os dois grupos de pessoas, que preferem x a y e que preferem y a x tiverem o mesmo número
de pessoas, então x e y serão socialmente indiferentes. Na prática, quando isto ocorrer, existirá
alguma regra para a escolha entre x e y. Por exemplo, se houver empate no número de votos para
presidente do Brasil no segundo turno de votação, então será escolhido o candidato mais idoso (ver
artigo 77 da Constituição Federal).
Vamos discutir propriedades que podem ser impostas sobre a função f de bem-estar social. Cada
propriedade tem um significado intuitivo de caráter normativo. Por exemplo, o critério Paretiano
abaixo é simples e é razoável exigir que uma regra de escolha social o satisfaça.
Definição: Critério Paretiano (Unanimidade). f (·) satisfaz o critério Paretiano se f (1, . . . , 1) =

1 e f (−1, . . . , −1) = −1.
O critério Paretiano apenas exige que no caso em que todos na sociedade preferem estritamente
a mesma alternativa, a preferência social também irá preferir estritamente esta alternativa. A regra
ditadorial, definida no exemplo abaixo, satisfaz esse critério.
Exemplo: Defina f por f (D1 , . . . , DI ) = Dh . O indivı́duo h é chamado ditador, pois a sua

preferência determina a escolha social (αi = 0, ∀i 6= h, αh = 1, no exemplo anterior). Observe que
a regra ditadorial satisfaz o critério Paretiano.
May (1952) elaborou 4 condições que uma regra de escolha social f deve satisfazer quando
existem apenas 2 alternativas. Abaixo apresentamos essas condições formalmente. É fundamental
entender o conteúdo econômico de cada condição. A primeira diz que a regra deve ser decisiva,
isto é, que qualquer que seja o grupo de preferências dos indivı́duos considerado, a regra leve
a uma preferência social (que pode ser indiferença entre x e y). A segunda condição, simetria
ou anonimato, estabelece que todos os indivı́duos recebem o mesmo peso na regra. A terceira
condição estabelece que as duas alternativas devem ter o mesmo status quo, nenhuma alternativa
recebe a priori um peso maior na regra. Finalmente, a quarta condição estabelece que se para um
determinado grupo de indivı́duos, a escolha social for a alternativa x ou a indiferença entre as duas
alternativas, e se um indivı́duo mudar de posição em direção à alternativa x (isto é, se antes ele
preferiria y, agora ele é indiferente entre x e y ou passa a preferir x, ou se antes ele era indiferente
entre x e y, ele passa a preferir x estritamente), e todos os outros indivı́duos continuam com as
mesmas preferências de antes, então a regra de escolha social resultará em x estritamente preferı́vel
a y.

Condição 1: Decisiva. A função f de bem-estar social é bem definida e assume um único valor
para todo elemento de U I .
Condição 2: Simetria ou Anonimato. A função f trata todos os indivı́duos de modo igual,

ou seja, temos que f (D1 , . . . , DI ) = f (Dπ(1) , . . . , Dπ(I) ), onde π : {1, . . . , I} → {1, . . . , I} é uma
permutação dos indivı́duos (π é uma bijeção).
Condição 3: Neutralidade entre as alternativas. A função f trata as duas alternativas de

modo igual, ou seja, temos que f (D1 , . . . , DI ) = −f (−D1 , . . . , −DI ).
Condição 4: Resposta Positiva. Se para um certo grupo de preferências individuais, a alter-

nativa y não era escolhida, e se pelo menos um indivı́duo muda a sua preferência na direção de x,
então x passa a ser escolhido. Logo, temos que se D = f (D1 , . . . , DI ) ≥ 0 e D̃i = Di para todo
i 6= i0 , e D̃i0 > Di0 , então f (D̃1 , . . . , D̃I ) = 1.
Teorema de May. A função de bem-estar social f é de votação majoritária se, e somente se, é
decisiva, simétrica, neutra entre as alternativas e de resposta positiva.
O Teorema de May não só garante que a regra de votação majoritária é decisiva, simétrica,
neutra entre as alternativas e de resposta positiva (parte mais fácil de verificar), mas também que
se uma regra de decisão for decisiva, igualitária, neutra entre as alternativas e de resposta positiva,
então ela necessariamente será a regra de votação majoritária (parte mais difı́cil de verificar). Logo,
o Teorema de May constitui uma caracterização completa da regra de votação majoritária.
1.3 Paradoxo de Condorcet (Paradoxo da Votação)
No caso de apenas duas alternativas, o requerimento de a regra social ser transitiva não é
relevante. Se tivermos três ou mais alternativas, transitividade passa a ser importante. O requisito
de transitividade exige uma coerência na escolha social que nem sempre será satisfeita, mesmo que
todas as preferências individuais sejam completas e transitivas.
Vamos estender a regra de votação majoritária vista acima do seguinte modo. A regra de
votação majoritária aos pares estabelece que todos os pares possı́veis de alternativas são postos em
votação, um par por vez. Em cada rodada, o vencedor da votação será a alternativa socialmente
preferı́vel. Logo, se colocarmos em votação as alternativas x vs y, se x tiver mais votos, então
x S y. Se tiverem o mesmo número de votos, x ∼S y. E se y tiver mais votos, y S x.
Definição: Vencedor de Condorcet. Dizemos que uma alternativa é um vencedor de Condorcet

se ela ganhar de todas as outras alternativas na votação majoritária aos pares.
Considere o seguinte exemplo bem simples, com apenas três alternativas, x, y e z, e três in-
divı́duos, 1, 2 e 3. As preferências dos três indivı́duos estão resumidas na tabela abaixo:
Posição Indivı́duo 1 Indivı́duo 2 Indivı́duo 3

Primeira x y z
Segunda y z x
Terceira z x y

Existem três combinações de pares para a votações majoritária, que levam aos resultados abaixo:

x vs y ⇒ x S y 
y vs z ⇒ y S z ⇒ x S y, y S z, z S x
x vs z ⇒ z S x
 | {z }
S não é transitiva!
Ou seja, mesmo que todas as preferências individuais sejam transitivas, pode ocorrer que a regra
de escolha social leve essas preferências individuais a uma preferência social intransitiva. Para o
grupo de preferências acima, não existe um vencedor de Condorcet. Regras de escolha social que
levem a preferências socias não transitivas podem trazer problemas de manipulação de agenda,
como discutiremos a seguir.
Suponha que a regra de escolha social é tal que, no caso de três alternativas x, y e z, se a agenda
de votação for (x, y, z), então primeiro vota-se x vs y, e depois vota-se o vencedor dessa primeira
votação contra z. Podemos ter três agendas de votação diferentes, levando aos resultados abaixo
para o caso das preferências apresentadas na tabela acima:
(x, y, z) : x vs y ⇒ x ganha, x vs z ⇒ z ganha
(y, z, x) : y vs z ⇒ y ganha, y vs x ⇒ x ganha
(z, x, y) : z vs x ⇒ z ganha, z vs y ⇒ y ganha
Logo, para o grupo de preferências descrito acima, quem define a agenda de votações define a
alternativa vencedora.
Observe que o exemplo acima exige que as preferências dos indivı́duos sejam de conhecimento de
todos. Isso possibilita votação estratégica, em que não é mais do interesse de um ou mais eleitores
revelar corretamente as suas verdadeiras preferências, votando na sua alternativa preferida.
Por exemplo, suponha que o indivı́duo 1 define a agenda de votação. Ele decide implementar a
agenda (y, z, x), que leva a escolha de x, sua alternativa preferida. Essa é a pior alternativa para
o indivı́duo 2. Se este decidir na primeira rodada de votação, entre y e z, votar em z, z passa
a ser escolhido em vez de y. Na segunda rodada de votação, a alternativa x será preterida e z
será escolhida. Logo, o indivı́duo 2, ao revelar incorretamente a sua preferência, consegue afetar
o resultado e fazer com que a sua segunda melhor alternativa, z, seja escolhida no lugar da sua
terceira melhor alternativa, x.
Logicamente, a análise se complica: os outros eleitores podem também decidir votar estrategi-
camente, não revelando corretamente suas preferências. Nesse caso, devemos analisar o problema
de votação como um jogo e procurar por equilı́brios de Nash. Observe que a discussão acima mostra
que a situação em que o indivı́duo 1 define a agenda (y, z, x) e todos votam de acordo com suas
preferências verdadeiras não é um equilı́brio de Nash (mais especificamente, vimos que o indivı́duo
2 revelar corretamente sua preferência não é a melhor resposta quando os eleitores 1 e 3 revelam
suas preferências verdadeiras).
Não vamos nos aprofundar mais na questão de comportamento estratégico agora. O ponto prin-
cipal que desejamos enfatizar é o de que, em situações onde existam três ou mais alternativas, a
regra de votação majoritária aos pares pode associar preferências sociais não transitivas a determi-
nados conjuntos de preferências individuais que são todas completas e transitivas. Essas situações
podem gerar problemas como manipulação de agenda e votação estratégica. Vamos investigar se
existe alguma regra de escolha social que não incorra nesses problemas e satisfaça certas propri-
edades, como levar sempre a preferências sociais completas e transitivas. O Teorema de Arrow
responde essa questão.

1.4 Teorema de Arrow
O Teorema de Arrow (Arrow, 1951) verifica a existência de uma regra de escolha social que
agregue as preferências individuais de “modo satisfatório”. As condições do Teorema de Arrow
são exigências de caráter normativo sobre a regra de escolha social f que gera a decisão do grupo
analisado, S = f (1 , . . . , N ). Note que f associa a cada grupo de preferências individuais uma
preferência social, ou seja, (1 , . . . , N ) 7→S . Os pressupostos do Teorema de Arrow são discutidos
f
abaixo.
Domı́nio Irrestrito (ou Universal). O domı́nio de f inclui todas as combinações possı́veis de

preferências sobre o espaço de alternativas X.
Essa condição impõe sobre a regra social f a capacidade de associar qualquer grupo de pre-
ferências individuais a uma preferência social. Portanto, o mecanismo de escolha social é válido
qualquer que seja o grupo de preferências individuais considerado.
Princı́pio Fraco de Pareto. Para qualquer par de alternativas x e y tal que x i y para todo
indivı́duo i, então x S y.
Essa condição impõe um critério de unanimidade no mecanismo de escolha social. Podemos

definir outros criterios de unanimidade (por exemplo, com preferências fracas).
Não-Ditadorial. Não existe indivı́duo h tal que se x h y então x S y, quaisquer que sejam as
preferências dos outros indivı́duos que não h.
Essa condição elimina a possibilidade de um ditador na sociedade. Isso não exclui o fato de que
a escolha social coincida, para um certo grupo de preferências, com a ordenação de algum ou de
alguns indivı́duos.
Independência das Alternativas Irrelevantes (IAI). Sejam dois conjuntos de preferências

˜ 1, . . . ,
individuais (1 , . . . , I ) e ( ˜ I ), que são levados pela regra de escolha social f às preferências
˜
sociais S = f (1 , . . . , I ) e S = f ( ˜ 1, . . . ,
˜ I ) e sejam x e y duas alternativas quaisquer em X.
Se cada indivı́duo ordena x versus y em i do mesmo modo que ordena x versus y em ˜ i então o
ordenamento social de x versus y será o mesmo em S e em S . ˜
A IAI é a mais sutil das condições do Teorema de Arrow. Ela impõe à regra de escolha social a
propriedade de que o ordenamento entre duas alternativas dependa apenas dessas duas alternativas,
e que não seja afetado por nenhuma outra alternativa diferente de x e y. Vamos discutir um exemplo
para deixar essa condição mais clara.
Mecanismo de Escolha de Borda. A regra de escolha social de contagem de Borda pode tomar
diversas formas. O mecanismo de contagem de Borda consiste em cada indivı́duo i reportar a sua
preferência, como numa votação em lista. Daı́ associamos um número ci (x) para a alternativa x
para cada alternativa x ∈ X e para cada indivı́duo i. Calculamos a pontuação de Borda c(x) para
a alternativa x como:
X I
c(x) = ci (x)
i=1
A preferência social é definida comparando as pontuações de Borda de todas as alternativas.

Por exemplo, suponha que ci (x) = n, onde n é a posição de preferência de x para i. Por
exemplo, se c1 (x) = 2, então x é a segunda alternativa preferida do indivı́duo 1. Vamos supor
por enquanto que os indivı́duos ordenam todas as alternativas de modo estrito, para simplificar a
exposição. Neste caso, a regra de escolha da contagem de Borda é definida por:
I
X I
X
x S y ⇔ c(x) = ci (x) ≤ ci (y) = c(y)
i=1 i=1
É possı́vel mostrar que regras de escolha social do tipo contagem de Borda:
• Levam sempre a preferências sociais completas e transitivas;
• São de domı́nio irrestrito (podemos lidar com empates facilmente);
• Satisfazem o princı́pio fraco de Pareto,
• Não são ditadoriais.
Porém, a contagem de Borda não satisfaz o critério de independência das alternativas irrele-
vantes, pois o ordenamento social de duas alternativas pode depender do posicionamento de outras
alternativas, como o exemplo a seguir ilustra.
Exemplo: Suponha dois indivı́duos, 1 e 2, e três alternativas, x, y e z. Considere duas possı́veis

situações para as preferências dos dois indivı́duos:

x 1 z 1 y ⇒ c1 (x) = 1, c1 (y) = 3
Situação A: ⇒ x S y
y 2 x 2 z ⇒ c2 (x) = 2, c2 (y) = 1

x 1 y 1 z ⇒ c1 (x) = 1, c1 (y) = 2
Situação B: ⇒ y S x
y 2 z 2 x ⇒ c2 (x) = 3, c2 (y) = 1
Nas duas situações, os ordenamentos individuais entre x e y são os mesmos. Porém, o

mecanismo de Borda resulta em ordenamentos sociais entre x e y distintos, devido à presença da
alternativa z. Logo, z não é sempre irrelevante quando definimos o ordenamento social de x e y
segundo a regra de escolha social de contagem de Borda. Isso significa que essa regra não satisfaz
a hipótese de independência das alternativas irrelevantes.
Arrow (1951) mostrou que o fato de a contagem de Borda não satisfazer IAI não é por acaso. O
Teorema de Arrow prova que quando existem três ou mais alternativas, não existe nenhuma regra
de escolha social que leve sempre a ordenamentos sociais completos e transitivos e que satisfaça as
condições elencadas acima.
Então, supondo três ou mais alternativas, como é possı́vel mostrar que o mecanismo de Borda
leva sempre a preferências completas e transitivas, é de domı́nio universal, satisfaz o princı́pio fraco
de Pareto e não é ditadorial, o Teorema de Arrow implica que esse mecanismo não pode satisfazer
a condição de independência das alternativas irrelevantes.

Teorema da Impossibilidade de Arrow (versão I). Se existem pelo menos três alternativas
em X, então não existe regra de escolha social f que resulte sempre em uma preferência social
S completa e transitiva e tal que satisfaça as condições de domı́nio universal, princı́pio fraco de
Pareto e independência das alternativas irrelevantes e que seja não-ditadorial.
Teorema da Impossibilidade de Arrow (versão II). Se existem pelo menos três alternativas
em X, então a única regra de escolha social f que resulta sempre em uma preferência social S
completa e transitiva e tal que satisfaça as condições de domı́nio universal, princı́pio fraco de Pareto
e independência das alternativas irrelevantes é a regra de escolha social ditadorial.
O Teorema de Arrow possui uma conclusão negativa: é impossı́vel esperar que uma sociedade
se comporte com a mesma coerência que podemos esperar de um indivı́duo racional (no sentido de
preferências completas e transitivas). Esse problema de coerência mostra que detalhes institucionais
e procedimentos do processo polı́tico são importantes. Ou seja, tomadas de decisões em grupo podem
gerar resultados arbitrários e manipulação. O processo instituticional pode e deve constituir uma
restrição a esses problemas.
Diversos autores da área de ciência polı́tica incorporaram o resultado de Arrow em suas análises
(por exemplo, ver Shepsle and Boncheck (1995); Austen-Smith and Banks (1996)). Além disso,
estes autores passaram a utilizar ferramentas como teoria dos jogos para auxiliar essas análises.

1.5 Função de Bem-Estar Social
Vamos agora proceder de modo diferente com respeito ao problema de escolha social. Suponha
que cada indivı́duo tenha uma utilidade definida sobre o conjunto das alternativas existentes. Vamos
representar a utilidade do indivı́duo i sobre a alternativa x por ui (x).
Definição. Uma função de bem-estar (FBE) W é uma função definida sobre as funções de utilidade
individuais, W = W (u1 , . . . , uI ).
Se W for crescente em cada um dos seus argumentos, então quanto maior o nı́vel de utilidade,
maior o valor de W . Neste caso dizemos que W é uma função de bem-estar social (FBES).
Exemplos:
• FBES utilitarista ou de Bentham:

I
X
W (u1 , . . . , uI ) = ui .
i=1
• FBES da soma ponderada das utilidades:

I
X
W (u1 , . . . , uI ) = ai u i , com ai ≥ 0 ∀ i.
i=1
• FBES Rawlsiana:
W (u1 , . . . , uI ) = min{u1 , . . . , uI }.
• FBES com elasticidade de aversão à desigualdade constante:
W (u1 , . . . , uI ) = (a1 uρ1 + a2 uρ2 · · · + an uρn )1/ρ ,
com ai ≥ 0 ∀ i, e 0 6= ρ < 1.
As FBES dependem da representação usada para a utilidade individual. Sabemos que a uti-
lidade de um indivı́duo não é única: qualquer transformação crescente dela representao a mesma
ordenação, ou seja, a mesma pessoa. Porém, ao utilizarmos determinada forma funcional de uma
FBES, estamos assumindo que é possı́vel fazer comparações entre funções de utilidades de indivı́duos
diferentes.
Suponha que a alternativa x defina uma cesta de consumo para cada indivı́duo, x = (x1 , . . . , xI ).
Suponha também que cada indivı́duo i tenha uma dotação inicial ei . Se a utilidade de cada in-
divı́duo i depende da alocação x para todos os indivı́duos, então existem externalidades de consumo:
o bem-estar de uma pessoa depende não somente do que ela consome, mas também do que os outros
consomem. Vamos supor a partir de agora de que a utilidade de uma pessoa depende apenas da sua
própria cesta: ui (xi ), para todo i = 1, . . . , I. Neste caso dizemos que W (u1 (x1 ), u2 (x2 ), . . . , uI (xI ))
é uma FBES individualista ou de Bergson-Samuelson.

u2
6
sMáximo da FBES W
Conjunto de
Possibilidade
de Utilidade
Curva de Isobem-Estar
-
u1
Considere o seguinte problema de maximização:

X X
max W (u1 (x1 ), u2 (x2 ), . . . , uI (xI )) s.a. xi = ei ,
x
i i
onde W é uma FBES. Como toda FBES é crescente, então a alocação ótima será Pareto eficiente.
As curvas de indiferença de W são chamadas curvas de isobem-estar. A figura acima ilustra esse
problema graficamente.
Mais ainda, qualquer alocação Pareto eficiente pode ser o resultado da maximização de alguma
FBES. Em particular, se maximizarmos a FBES da soma ponderada das utilidades variando os
pesos ai , obtemos qualquer ponto da FPU como solução ótima. Para que este resultado seja válido,
é necessário que o conjunto de possibilidade de utilidades seja convexo.
Observe então que existe uma relação estreita entre FBES e alocações eficientes: toda solução
de um problema de maximização de uma FBES crescente é eficiente e toda alocação
eficiente é solução de um problema de maximização de bem-estar social, para uma
FBES apropriada.
Referências
Arrow, K. (1951). Social choice and individual values. New York: John Wiley.
Austen-Smith, D., & Banks, J. (1996). Positive political theory. Ann Arbor: University of Michigan
Press.
May, K. O. (1952). A set of independent necessary and sufficient conditions for simple majority
decision. Econometrica, 20:4 , 680-684.
Shepsle, K., & Boncheck, M. (1995). Analysing politics. New York: W. W. Norton.
Varian, H. (2012). Microeconomia – uma abordagem moderna (8a edição). Elsevier/Editora
Campus.

Exercı́cios
1. Mostre que a regra de votação majoritária aos pares, conforme definida em sala, satisfaz as
propriedades de anonimato, neutralidade entre as alternativas e resposta positiva.
2. Mostre que uma regra de escolha social que satisfaz as propriedades de resposta positiva e
neutralidade entre as alternativas satisfaz a seguinte propriedade:
Propriedade de Resposta Negativa. Se D = f (D1 , . . . , DI ) ≤ 0 e D̃i = Di

para todo i 6= i0 , e D̃i0 < Di0 , então f (D̃1 , . . . , D̃I ) = −1.
Interprete intuitivamente a propriedade acima.

3. Considere uma eleição com 3 candidatos, A, B e C, e quatro eleitores, onde as preferências
desses eleitores é descrita na seguinte tabela, em ordem decrescente de preferência:
Eleitor 1 Eleitor 2 Eleitor 3 Eleitor 4

A A B C
B B C B
C C A A
Assuma que o método de votação é dado pela contagem de Borda (votação em lista). Suponha
que ninguém vote estrategicamente.
a) Calcule um sistema de pesos para o sistema de Borda onde o candidato A ganha, se tal
sistema de pesos existir.
b) Calcule um sistema de pesos para o sistema de Borda onde o candidato B ganha, se tal
sistema de pesos existir.
c) Considere o sistema de pesos calculado para o item b). Existe algum incentivo para
algum eleitor votar estrategicamente?
4. Considere as seguintes regras de votação:
Regra de Copeland: Fixe uma alternativa, digamos x. Compare essa alternativa

x com toda outra alternativa y. Em cada comparação, agracie 1 se a maioria
prefere x a y, −1 se a maioria prefere y a x e 0 se ocorre empate. Some os pontos
de todas as comparações da alternativa x. Repita esse procedimento para toda
alternativa existente. A alternativa com a maior soma (Copeland score) é o vencedor
de Copeland.
Regra de Simpson: Fixe uma alternativa, digamos x. Para toda outra alternativa
y, calcule o número N (x, y) dos eleitores que preferem (fracamente)
xa
y. O score
de Simpson para a alternativa x é o menor N (x, y) em y minN (x, y) . Repita
y
esse procedimento para toda alternativa existente. A alternativa com o maior score
de Simpson é o vencedor de Simpson.
Regra de Borda Modificada: Cada eleitor ordena as cinco alternativas da mais
preferida à menos preferida (sem empates). A alternativa ordenada por último
recebe 0 pontos, a quarta recebe 1 ponto, a terceira recebe 2 pontos, a segunda
recebe 3 pontos e a primeira recebe 4 pontos. Some os pontos de todos os eleitores.
A alternativa com maior pontuação é o vencedor de Borda.

Considere a seguinte ordenação (estrita) de preferências, entre 9 eleitores e cinco alternativas:
Número de eleitores: 1 4 1 3
a c e e
b d a a
c b d b
d e b d
e a c c
a) Identifique os vencedores de Copeland e de Simpson.

b) Calcule o vencedor de Borda para o critério acima. Compare o vencedor de Borda com
o vencedor de Copeland.
c) Encontre três sistemas de pesos positivos (diferentes de zero) para uma regra do tipo de
Borda tal que o primeiro eleja c, o segundo eleja b e o terceiro eleja d.
5. Verifique quais condições do Teorema de Arrow as regras de escolha social listadas abaixo
satisfazem. Argumente de modo convincente caso a regra satisfaça alguma condição e forneça
um contra-exemplo caso contrário.
a) Votação majoritária aos pares;

b) Votação majoritária normal;
c) Regra ditadorial;
d) Contagem de Borda.
6. Argumente de modo convincente que se existem apenas duas alternativas, a regra de votação
majoritária satisfaz as hipóteses do Teorema de Arrow.
7. Considere uma eleição com quatro candidatos, A, B, C e D e cinco eleitores, onde as pre-
ferências desses eleitores são descritas na seguinte tabela, em ordem decrescente de preferência:
Eleitor 1 Eleitor 2 Eleitor 3 Eleitor 4 Eleitor 5

A A B C D
B D C B B
C C A D C
D B D A A
Assuma que a regra de escolha social é definida pela maioria simples, onde cada eleitor vota
em apenas uma das alternativas e a alternativa mais votada é a escolhida.
a) Suponha que ninguém vote estrategicamente, ou seja, cada eleitor seleciona a sua alter-
nativa preferida. Qual é a alternativa eleita?
b) Mostre que para as preferências exibidas na tabela acima, existe possibilidade de voto
útil, ou seja, algum ou alguns eleitores selecionarem uma alternativa diferente da sua
preferida.
c) Qual ou quais condições do Teorema de Arrow o sistema de votação descrito acima não
satisfaz? Justifique a sua resposta.

8. (P1-1/2019) Existem três indivı́duos na sociedade, {1, 2, 3}, três alternativas, {A, B, C}, e o
domı́nio das preferências é irrestrito. Suponha que a relação de preferência social, S , é dada
por votação majoritária, ou seja, cada indivı́duo escolhe uma das alternativas, coloca em uma
urna, onde contam-se o número de votos e é escolhida a alternativa com maior número de
votos (se ocorrer empate, então o indivı́duo 1 escolhe a alternativa preferida, em um voto de
minerva), ordenando as alternativas seguintes pelo número de votos recebido. Assuma que
cada indivı́duo conhece as preferências de todos os outros eleitores.
(a) Considere o seguinte conjunto de preferências, onde i denota a relação de preferência

estrita de i:
Indivı́duo 1: A 1 B 1 C
Indivı́duo 2: B 2 C 2 A
Indivı́duo 3: C 3 A 3 B
Se todos os três indivı́duos votarem na sua alternativa preferida, qual será escolhida?
(b) Existe algum indivı́duo que tem incentivo para voto útil, ou seja, para votar não na
alternativa preferida, mas sim em outra?
(c) Quais das hipóteses do Teorema de Arrow são satisfeitas pela regra de votação acima?
Quais não são satisfeitas? Argumente de modo claro e sucinto.
9. (JR) Suponha que existam três indivı́duos numa sociedade, {1, 2, 3}, três alternativas, {x, y, z},
e que a regra de escolha social f é a votação majoritária aos pares, com domı́nio irrestrito,
de modo que a qualquer indiferença obtida é resolvida votando x primeiro do que y e depois
z, se a regra resultar em uma preferência social transitiva. Se a regra não resultar numa
preferência social transitiva, então o ordenamento social será x S y S z.
(a) Considere o seguinte grupo de preferências individuais:
Indivı́duo 1: x 1 y 1 z
Indivı́duo 2: y 2 z 2 x
Indivı́duo 3: z 3 x 3 y
Qual é o ordenamento social neste caso?

(b) Qual seria a preferência social se em (a) a preferência de 1 fosse y 1 z 1 x? E se fosse
z 1 y 1 x?
(c) Argumente que f satisfaz o princı́pio fraco de Pareto.
(d) Prove que f não é ditadorial.
(e) Conclua que f não satisfaz IAI usando o Teorema de Arrow.
(f) Mostre diretamente que f não satisfaz IAI criando dois grupos de preferências e obtendo
a preferência social de cada um deles de modo que viole IAI.

Notas de Aula 3 – Externalidades e Bens Públicos
1 Externalidades
1.1 Introdução
Definição: Externalidade. Dizemos que ocorre uma externalidade quando o bem-estar de um

agente econômico (indivı́duo ou firma) é afetado diretamente pelas ações de outro agente econômico,
que não por meio de mercados. A externalidade pode ser negativa (se piora o bem-estar do agente)
ou positiva (se melhora o bem-estar do agente).
Uma externalidade de consumo ocorre quando a ação de um agente afeta a utilidade (ou
utilidades) de outro agente (outros agentes). Uma externalidade de produção ocorre quando
a tecnologia de alguma ou algumas firmas afeta o bem-estar de outros agentes. Assim como a
externalidade de consumo, a externalidade de produção pode ser positiva ou negativa.
O ponto principal da externalidade em termos econômicos é a inexistência do mercado para o
bem ou serviço gerado pela atividade causadora da externalidade. Quando ocorre uma externali-
dade, o custo (se a externalidade for negativa) ou o benefı́cio (se a externalidade for positiva) social
da ação do agente será diferente do custo ou benefı́cio privado. Esta discrepância entre o custo ou
benefı́cio social e o custo ou benefı́cio privado pode tornar a decisão privada distinta da decisão
socialmente ótima, mesmo em um mercado perfeitamente competitivo.
No caso de uma externalidade negativa, o nı́vel de atividade estará acima de seu nı́vel social-
mente ótimo. No caso de uma externalidade positiva, o nı́vel de atividade estará abaixo de seu
nı́vel socialmente ótimo. Isso ocorre porque o custo (ou benefı́cio) associado à externalidade não é
levado em conta pelo agente causador da externalidade.
Nesse caso, o primeiro teorema do bem-estar não é mais válido em geral : na presença de
externalidades, a alocação de mercado pode ser ineficiente no sentido de Pareto.
Exemplos:
• Fumantes e não fumantes: dois colegas de quarto, um fumante e outro não fumante. Ao
fumar, o fumante diminui o bem-estar do seu colega.
• Poluição: uma firma que polui um rio, sem considerar o dano que atinge o rio e a comunidade
ribeirinha presente.
• Trens e faı́scas (Coase): a passagem de trens pelos trilhos gera faı́scas que podem causar
incêndios em plantações.
• Abelhas e polinização: exemplo clássico de externalidade positiva, em que abelhas ajudam a

polinizar plantações.
José Guilherme de Lara Resende 1 NA 3 – Externalidades e Bens Públicos

Para ajudar o entendimento, vamos supor um modelo simples (Varian (2012), capı́tulo 34,
“Externalidades”, e Nicholson and Snyder (2008), capı́tulo 19, “Externalities and Public Goods”)
com duas firmas, A e B, onde a firma A, ao produzir o seu bem na quantidade yA , escolhe uma
quantidade xA de poluição, que afeta os custos de produção da firma B, denotados por cB (yB ; xA ).
As duas firmas estão inseridas em mercados competitivos, logo tomam os preços dos bens que
produzem como dados e procuram maximizar os seus lucros. O problema de maximização de lucro
da firma A é:
max pA yA − cA (yA , xA ) ,
yA ,xA
onde pA denota o preço do bem que a firma A produz e a função custo da firma A satisfaz ∂cA /∂yA >
0, ∂ 2 cA /∂yA2 > 0, ∂cA /∂xA < 0. Note que estamos assumindo que quanto maior o nı́vel de produção
de poluição, menor será o custo de produzir o bem yA pela firma A. Podemos modificar essa hipótese
de diversas formas, como, por exemplo, assumir que a produção de yA gera diretamente um nı́vel
único de poluição xA , de tal modo que a decisão da firma A é relativa apenas à quantidade de yA
que irá produzir, que gera uma quantidade de poluição associada.
As condições de primeira ordem do problema da firma A resultam em:
∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : =0
∂xA
A primeira CPO é a condição usual preço igual a custo marginal, que determina a oferta ótima
de uma firma competitiva. A segunda CPO diz que a firma irá escolher a quantidade ótima de
poluição de modo a igualar o custo marginal de poluir a zero.
Já o problema de maximização de lucros da firma B é dado por:
max pB yB − cB (yB , xA ) ,
yB
que resulta na CPO pB = ∂cB (yB , xA )/∂yB . A quantidade de poluição gerada pela firma A afeta
os custos da firma B, mas a firma A não leva esse efeito em conta. Temos então uma externalidade
negativa gerada na produção do bem yA . Vamos encontrar qual a quantidade de poluição socialmente
ótima, levando em conta os efeitos sobre a firma B. Uma forma de encontrar esse valor é por meio
de uma fusão das duas firmas, que passa então a maximizar o seu lucro produzindo os dois bens
yA e yB :
max pA yA + pB yB − cA (yA , x) − cB (yB , x) ,
yA ,yB ,x
As CPOs desse problema resultam em:
∂cA (yA , x)
(yA ) : = pA
∂yA
∂cB (yB , x)
(yB ) : = pB
∂yB
∂cA (yA , x) ∂cB (yB , x)
(x) : =−
∂x ∂x
As duas primeiras CPOs mostram que a firma integrada continua a decidir a quantidade ótima a
ser produzida de cada bem igualando preço ao custo marginal para cada um desses bens.

A terceira CPO mostra que a quantidade socialmente ótima de x é determinada igualando o

custo marginal em A de emissão de x ao negativo do custo marginal em B com a emissão ocorrida
de x. Vemos então que a firma integrada internalizou o custo da poluição sobre a firma B em
seu processo decisório. Vamos supor que os custos marginais de produção de A e de B em x
são crescentes. Isso leva ao gráfico abaixo, que mostra que a quantidade socialmente ótima de
poluição, denotada por x∗∗ , é menor do que a quantidade privada, denotada por x∗ . Portanto, a
solução privada leva a uma quantidade de poluição superior ao socialmente desejável.
Preço
6
∂cB /∂x
Q

x∗∗ : Ótimo Social
Q
Q
Q
Q
Q
x∗ : Ótimo Privado
Q
s
Q

x∗∗ < x∗
QQ
Q
Q
Q
Q

Q
Q
−∂cA /∂x
Q
Q
Q
Q
Q -
x
x∗∗
Q∗
x
De modo geral, se o mercado operar livremente numa situação de externalidade negativa, a

quantidade produzida pelo mercado será maior que a quantidade ótima do ponto de vista social
(qM > qS , na figura abaixo). Portanto, a existência de uma externalidade leva a uma ineficiência,
pois o benefı́cio marginal total de uma atividade não se iguala ao seu custo marginal total (custo
marginal privado somado ao custo marginal social). Nesses casos, é possı́vel melhorar a alocação
de mercado (isto é, alcançar uma alocação Pareto-ótima). Obviamente, isso não significa que toda
intervenção feita será perfeita ou factı́vel de ser implementada na prática. Diversos problemas,
como assimetrias informacionais, podem dificultar esse processo de intervenção.
Preço
6
Custo social
Oferta (custo privado)
Q

Q
Q
Q
Q s
Ótimo Social Q

QQsEquilı́brio de Mercado

Q
Q
Q
Q
Q
Q
QQ
Demanda
-
qS qM Quantidade

1.2 Soluções
As soluções para o problema de externalidades consistem em:

1. Impostos, subsı́dios, quotas (imposto de Pigou);
2. Alocação de direitos de propriedade (Teorema de Coase);
3. Criação de mercados.
As soluções para o problema de externalidades consistem em “internalizar” a externalidade,

no sentido de que todos os custos (ou benefı́cios, no caso de uma externalidade positiva) sociais
sejam levados em conta na hora de decidir o nı́vel ótimo de externalidade a ser produzido. Três
soluções clássicas são relacionadas a: 1) impostos Pigouvianos, 2) Teorema de Coase, e 3) criação
de mercados.
Impostos de Pigou
Um outro mecanismo de correção da ineficiência gerada por uma externalidade é colocar um

imposto sobre a produção no valor do custo social da externalidade (Pigou, 1920). Neste caso, a
curva de custo marginal privado se desloca para cima, coincidindo com a curva de custo social.
Esse tipo de imposto, chamado imposto de Pigou (ou subsı́dio, no caso de uma externalidade
positiva) tenta corrigir a ineficiência causada pela externalidade. A taxa é escolhida de modo que
o nı́vel socialmente ótimo da atividade geradora da externalidade seja alcançado.
Em ambos os tipos de externalidade, o efeito da taxa (ou subsı́dio) é fazer com que o agente gera-
dor da externalidade incorpore em sua tomada de decisão o custo real de suas ações (“internalizar”
a externalidade).
Voltando ao nosso exemplo acima das firmas A e B, caso o governo institua um imposto no
valor t por unidade de poluição emitida, o problema da firma A se torna:
max pA yA − cA (yA , xA ) − txA ,

yA ,xA

∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : =t
∂xA
Se o governo fixar t∗ = ∂cB (yB∗∗ , x∗∗ )/∂x, então observe que a firma A irá escolher a quantidade
socialmente ótima x∗∗ e não mais a quantidade x∗ . O imposto Pigouviano t∗ fez com que a firma
A internalizasse em seu processo decisório o custo que emitir x gera sobre a firma B.
O governo poderia alternativamente fixar uma quota e limitar a emissão de x da firma A ao
máximo de x∗∗ . Ou poderia dar um subsı́dio s = −t à firma A para cada unidade de x emitida.
Neste caso, o custo de oportunidade para A de emitir x não é mais zero e sim o valor do subsı́dio,
o que faz com que a firma A reduza a sua emissão de x para o nı́vel socialmente ótimo. As três
polı́ticas alcançam o objetivo de alcançar o nı́vel socialmente ótimo de emissão de x, mas possuem
consequências distributivas diferentes.

Observações sobre Solução via Impostos, Subsı́dios, Quotas:
1. O governo deve taxar a atividade geradora da externalidade diretamente (por exemplo, taxar
o lucro não diminuirá o nı́vel de externalidade).
2. O governo pode optar por um esquema de subsı́dio para redução da externalidade, ao invés
de taxar a externalidade.
3. A solução exige que o governo conheça os beneficı́os e custos exatos que envolvem o problema
de externalidade. Se esse é o caso, o governo poderia simplesmente impor quotas de produção
ou exigir diretamente que a firma produzisse a quantidade socialmente ótima do bem.
Alocação de Direitos de Propriedade
O problema de externalidade pode ser visto como um problema de alocação incorreta ou de

inexistência de direitos de propriedade. No nosso exemplo, se firma B fosse dona dos direitos de
propriedade de ambiente limpo, ela passaria levar em consideração a deterioração do rio em sua
decisão de produção. Logo, direitos de propriedade bem definidos podem fazer desaparecer a falha
de mercado gerada pelo problema de externalidade.
Exemplo: Suponha que os direitos de propriedade da atividade geradora da externalidade sejam
alocados ao agente X. Ou seja, o agente Y não pode incorrer na atividade geradora da externalidade
sem a concordância de X. Suponha que o agente Y faz uma oferta ao agente X de pagar T para
poder produzir a externalidade. O agente Y escolherá T de modo que a sua oferta seja aceita. Nesse
caso, pode ser mostrado que o nı́vel socialmente ótimo da externalidade é alcançado com a alocação
do direito de propriedade da atividade geradora da externalidade. Esse resultado é resumido pelo
teorema de Coase.
Teorema de Coase. Se a externalidade puder ser transacionada e se não existirem custos de

transação nem efeito renda (no caso de externalidades de consumo), então o resultado eficiente
será alcançado pelo mercado, independentemente de quem possua os direitos de propriedade da
atividade geradora da externalidade (Coase, 1960).
Do ponto de vista de eficiência, é irrelevante quem ganha os direitos de propriedade. Porém, a

alocação dos direitos influencia a distribuição de renda.
Em geral, a quantidade produzida de uma externalidade de consumo na alocação eficiente
depende da distribuição dos direitos de propriedade entre os consumidores. Porém, se a utilidade
for quaselinear, a quantidade produzida de externalidade independe da distribuição dos direitos de
propriedade e será, portanto, a mesma em toda alocação Pareto ótima.
Utilidades quaselineares resultam em efeito renda nulo, condição necessária para a validade do
Teorema de Coase no caso de externalidades de consumo. Observe também que a distribuição de
riqueza final dependerá da distribuição dos direitos de propriedade.
A solução dada pelo teorema de Coase exige apenas que o governo aloque e garanta direitos
de propriedade. Logo, não é necessário que o governo conheça os benefı́cios e custos associados
à externalidade. Sob esse ponto de vista informacional, a solução de Coase é mais fácil de ser
implementada. A hipótese de ausência de custos (ou custos baixos) de transação é crucial. Altos
custos de transação podem impedir que a solução eficiente seja alcançada.

Criação de Mercado
A presença de externalidade pode ser associada à ausência de mercados competitivos para a

externalidade. Para criar novos mercados, é necessário que os direitos de propriedade estejam
bem definidos e que exista um mercado competitivo para a atividade que gera a externalidade. O
mercado, nesse caso, age como um procedimento de barganha. Nessa solução, um novo mercado é
criado, de modo que a externalidade passa a ser negociada como um bem tradicional.
Exemplo: Mercado de Crédito de Carbono. O mercado de crédito de carbono é uma tentativa

de solução para o problema de poluição do ar por gás carbônico (CO2 ). Créditos de carbono são
certificados concedidos que permitem a emissão de uma tonelada de dióxido de carbono por cada
unidade de crédito de carbono. Esses créditos podem ser negociados no mercado internacional.
O mercado de créditos de carbono limita o nı́vel de poluição, ao limitar o número de créditos
existentes. Além disso, permite que seja alcançada uma alocação eficiente, pois os créditos serão
comprados pelas atividades produtivas que geram maior riqueza.
A solução via “mercado de créditos” exige menos informação do que uma solução via “imposto de
Pigou”, pois o governo deve conhecer apenas o nı́vel agregado socialmente ótimo de externalidade.
A alocação de direitos de propriedade não afeta o resultado de eficiência, porém tem consequências
distributivas. Esse tipo de solução cria incentivos para as firmas adotarem tecnologias que diminuam
a sua produção de externalidade, já que a externalidade passa a ser um custo para a firma.
Voltando ao nosso exemplo inicial das duas firmas A e B, vamos supor que se cria um mercado
para poluição e que x passe a ser transacionado a um preço px . Vamos supor que a firma B possui
os direitos de propriedade sobre poluição, de modo que qualquer poluição emitida, a receita gerada
vai para ela. O problema de maximição de lucros da firma A se torna:
max pA yA − cA (yA , xA ) − px xA ,
yA ,xA

∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : − = px
∂xA
Já o problema de maximição de lucros da firma B se torna:

max pB yB + px xB − cB (yB , xB ) ,
yA ,xA
As condições de primeira ordem do problema acima resultam em:

∂cB (yB , xB )
(yB ) : = pB
∂yB
∂cB (yB , xB )
(xB ) : = px
∂xB
Igualando as CPOs dos problemas das duas firmas em x, por meio de px , obtemos que:
∂cB (yB , xB ) ∂cA (yA , xA )
=− ,
∂xB ∂xA

ou seja, o nı́vel ótimo de x será igual ao nı́vel socialmente ótimo. Por que isso ocorre? A firma A
passa a ter um custo px para emitir x. Ela irá comprar x até que o custo marginal de emissão de
x se iguale ao preço px . A firma B, que recebe a receita dessa venda de x por possuir os direitos
de propriedade de x, irá vender uma quantidade de x até que a receita marginal dessa venda, dado
por px , se iguale ao seu custo marginal de arcar com x na sua atividade produtiva. Portanto, por
meio de um mercado para x, a quantidade socialmente ótima de x é alcançada via negociação entre
as duas firmas.
O que ocorre se mudarmos o direito de propriedade de x para a firma A, de modo que agora
a firma B terá que pagar para A reduzir x? Nada em termos da quantidade de externalidade x
gerada, conforme prevê o Teorema de Coase. Para confirmarmos isso, vamos analisar o problema
da firma A, que agora é dado por:
max pA yA + px xA − cA (yA , xA )
yA ,xA
∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : = px
∂xA
Já o problema de maximição de lucros da firma B se torna:
max pB yB − cB (yB , xB ) − px xB ,
yA ,xA
As condições de primeira ordem do problema acima resultam em:
∂cB (yB , xB )
(yB ) : = pB
∂yB
∂cB (yB , xB )
(xB ) : − = px
∂xB
Igualando as CPOs dos problemas das duas firmas em x, por meio de px , obtemos que:
∂cB (yB , xB ) ∂cA (yA , xA )

=− ,
∂xB ∂xA
ou seja, o nı́vel ótimo de x será igual ao nı́vel socialmente ótimo. Como postulou Coase, é irrelevante
para fins de alcançar a quantidade socialmente ótima de x quem possui os direitos de propriedade
sobre a atividade geradora da externalidade. Logicamente, em termos de bem-estar, essa alocação
dos direitos de propriedade possui consequências: se for para a firma A, ela terá um lucro maior do
que se fosse para firma B, e vice-versa. Além disso, Coase enfatizava que a hipótese de ausência de
custos de transação, implı́cita no nosso modelo, quase nunca seria satisfeita na prática. Isso torna
a solução via criação de mercados e alocação de direitos de propriedade mais complicada de ser
implementada.

1.3 Tragédia dos Comuns
A “tragédia dos comuns” ocorre quando um bem comunitário sofre de um problema do bem
escasso que não tem dono: cada agente tem incentivo a explorá-lo mais que o ótimo social, pois
se ele não o fizer outro agente o fará. Hardin (1968) popularizou esse termo em um artigo para a
revista Science.
Uma solução para este problema é a regulamentação por uma autoridade, usualmente o governo
ou uma associação comunitária. Essa regulamentação pode ser por meio de concessões, limitando
o montante do bem comum disponı́vel para uso por cada indivı́duo. Sistemas de concessão para
atividades econômicas extrativistas tais como mineração, pesca, caça, corte de árvores são exemplos
desta solução. O governo pode também impor limites de danos admissı́veis ao bem comum.
Outra solução que pode ser usada para certos recursos é transformar o bem comum em propri-
edade privada, fazendo com que o dono tenha incentivos para garantir a sustentabilidade do bem,
preservando-o.
Suponha que em uma região foi concedido livre acesso à pastores de ovelhas. Suponha que o
preço do metro cúbico de lã é R$ 1, e que a produção total de lã pode ser expressa pela função
f (n), em que n é o número de ovelhas no pasto. Vamos assumir que todas as ovelhas geram o
mesmo tanto de lã, de tal modo que f (n)/n representa a quantidade de lã gerada por uma ovelha.
Suponha que o custo de cada pastor com uma ovelha seja R$ c.
O número total de ovelhas será determinado pela condição de lucro zero, já que cada pastor
irá introduzir mais uma ovelha no pasto até que a receita obtida com essa ovelha se iguale ao seu
custo:
f (n∗ ) f (n∗ )
π =p× − c = 0 ⇒ p =c
n∗ n∗
A quantidade socialmente ótima de pastores pode ser determinada maximizando o lucro total
da atividade de pastoreio:
max p × f (n) − cn
n
A CPO desse problema resulta em:

pf 0 (n∗∗ ) = c
Portanto, os dois casos levam a soluções diferentes. No primeiro caso, os pastores igualam o valor
do produto médio, p × P M e(n) = pf (n)/n, ao custo marginal c. Já no segundo caso, o valor
do produto marginal, p × P M g(n) = pf 0 (n), é igualado ao custo marginal. Assumindo que mais
uma ovelha diminui a produção total de lã na média, então o produto médio será decrescente. Isso
implica que o produto marginal será sempre menor do que o produto médio. A figura abaixo ilustra
essa situação.

P M e,
P Mg 6
H
@HH
@ HH
@ H
@ HH
H
@ HH
@ H
HH
s Hs
@
c @ HH
@ H
@ HH
H
P Me
@
@
@
P Mg
-
n∗∗ n∗ n
A figura acima mostra que a quantidade socialmente ótima n∗∗ é menor do que a quantidade
determinada na solução do bem de recurso comum, n∗ . Um pastor, ao colocar mais uma ovelha no
pasto, afeta todos os outros pastores, pois uma ovelha a mais diminui a quantidade total de pasto
disponı́vel. Temos um problema de externalidade negativa.
A externalidade negativa neste caso é consequência de o pasto ser um bem de recurso comum,
o que leva a uma sobreutilização dele. Uma forma de resolver o problema seria transformar o pasto
um bem privado. Deste modo, o criador de ovelhas, dono do pasto, irá levar em conta o efeito de
cada ovelha sobre todas as outras e internalizará a externalidade.
Outras soluções são possı́veis. Uma seria estabelecer n∗∗ como o número máximo de ovelhas
permitidas. Pastores podem ter direito a um certo número de ovelhas e transacionar esses direitos
entre si, com o limite de manter o número total de ovelhas igual a n∗∗ .
Elinor Ostrom, ganhadora do prêmio Nobel em Economia em 2009, conjuntamente com Oliver
Williamson, fez importantes contribuições sobre problemas como a tragédia dos comuns e outros
semelhantes. O seu livro Governing the Commons se tornou uma referência clássica sobre o assunto
(Ostrom, 2015).

2 Bens Públicos
2.1 Definições
Samuelson (1954, 1955) definiu bem público (puro) como um bem com duas caracterı́sticas:
1. Não-rival: O consumo do bem por uma pessoa não limita ou diminui a quantidade disponı́vel
para consumo por outras pessoas;
2. Não-excludente: Não é possı́vel (ou é muito custoso) excluir indivı́duos do seu consumo.
Bens públicos podem ser vistos como um problema de externalidade de consumo onde todas
as pessoas são obrigadas a consumir a mesma quantidade do bem. Essa parte da nota de aula
baseia-se em Varian (2012), capı́tulo 36 (“Bens Públicos”) e Nicholson and Snyder (2008), cap. 19
- “Externalities and Public Goods” .
Classificamos os tipos de bens com relação à rivalidade e à possibilidade de exclusão do consumo
do seguinte modo (a tabela abaixo resume a terminologia descrita):
• Os bens privados são bens excludentes e rivais. Exemplos são bens de consumo, tais como
laranja, sorvete, automóvel.
• Os bens públicos são não-excludentes e não-rivais. Exemplos são segurança pública, ilu-
minação pública, defesa nacional, estradas sem pedágio descongestionadas.
• Os bens de recursos comuns são não-excludentes e rivais. Exemplos são peixes no oceano
ou em um rio, meio ambiente, estradas sem pedágio congestionadas.
• Os bens de clube são excludentes, mas não rivais. Exemplos são TV a cabo, estradas com
pedágio não congestionadas, corpo de bombeiro.
Rival Não Rival

Excludentes Bens Privados Bens de Clube
Não excludente Recursos Comuns Bens Públicos
Até agora lidamos sempre com bens privados: bens em que é possı́vel privar o consumo por
alguma pessoa, bastando para isso não vender o bem, e rivais no consumo, ou seja, se o bem for
consumido por alguém, ele não tem como ser consumido por outro pessoa.
2.2 Alocação Eficiente
Suponha que existam apenas dois indivı́duos, que podem consumir dois bens, um bem privado,
denotado por x, e um bem público, denotado por G. Vamos supor que G é perfeitamente divisı́vel
e normalizar o preço do bem privado em um (px = 1). Suponha que c(G) representa o custo de
prover G unidades do bem público.
A utilidade do agente i, i = 1, 2, é ui (xi , G). Vamos representar por wi a riqueza do indivı́duo
i, i = 1, 2. O problema de maximização que determina as alocações Pareto eficientes é:
max u1 (x1 , G) s.a. i) u2 (x2 , G) = ū2 ,
x1 ,x2 ,G
ii) x1 + x2 + c(G) = w1 + w2

O Lagrangeano do problema acima é:
L = u1 (x1 , G) + λ(ū2 − u2 (x2 , G)) + µ(w1 + w2 − x1 − x2 − c(G))
As CPOs resultam em:

∂u1 (x1 , G)
(x1 ) : =µ
∂x1
∂u2 (x2 , G)
(x2 ) : − λ =µ
∂x2
∂u1 (x1 , G) ∂u2 (x2 , G) ∂c(G)
(G) : −λ =µ
∂G ∂G ∂G
Se dividirmos a terceira CPO por µ e substituirmos nela os valores de µ e λ/µ dados pela
primeira e segunda CPOs, obtemos:
∂u1 (x1 ,G) ∂u2 (x2 ,G)
∂G ∂G ∂c(G)
∂u1 (x1 ,G)
+ ∂u2 (x2 ,G)
=
∂G
∂x1 ∂x2
Em termos da TMS entre o bem privado e o bem público, temos que:
|T M S1 (G, x1 )| + |T M S2 (G, x2 )| = CM g(G)
Ou seja, em uma alocação Pareto eficiente, a soma do valor absoluto das taxas marginais de
substituição entre os bens público e privado dos dois consumidores deve ser igual ao custo marginal
de provisão do bem público (a soma da propensão marginal a pagar tem que ser igual ao custo
marginal). Esse resultado se mantém válido para o caso geral de I indivı́duos:
I
X
|T M Si (G, xi )| = CM g(G) (1)
i=1
Vamos supor que a utilidade de cada indivı́duo seja quaselinear na quantidade consumida do
bem público G: ui (G, xi ) = Ui (G) + xi , onde xi representa a quantidade consumida do bem
privado, cujo preço é normalizado
√ em 1, e Ui (G) é uma função estritamente côncava (por exemplo,
U (G) = ln(G) ou U (G) = G). Vamos denotar a renda do indivı́duo i por mi e o custo de provisão
de G unidades do bem público por c(G). Logo, a equação (1), que define a quantidade socialmente
ótima de bem público, encontrada para o caso geral, neste caso se torna:
I
X
Ui0 (G∗ ) = c0 (G∗ )
i=1
A hipótese de quaselinearidade da utilidade permite analisar o mercado do bem público isolada-

mente. Além disso, ela tem como consequência a existência de um único nı́vel eficiente de provisão
do bem público. Logo, agora teremos uma única solução para o nı́vel ótimo do bem público, in-
dependente da distribuição do bem privado entre os consumidores. Esse resultado é consequência
da hipótese de utilidades quaselineares e não necessariamente ocorre no caso geral, em que podem
existir diversos nı́veis ótimos para G, que se relacionam com a divisão considerada do bem privado
entre os consumidores.

2.3 Provisão Privada de um Bem Público
Suponha o mesmo arcabouço descrito na subseção anterior, com utilidades quaselineares, e que
exista agora um mercado privado para a provisão do bem público. Cada indivı́duo i deve escolher a
quantidade gi para comprar ao preço p. O problema do consumidor i é dado por:
!
X
max Ui gi + ḡk + xi s.a. xi + pgi = mi .
gi ,xi
k6=i
onde ḡk denota a quantidade ótima consumida pelo indivı́duo k, ∀k 6= i. Esse problema pode ser
escrito de modo simplificado como:
!
X
max Ui gi + ḡk + (mi − pgi ) ,
gi
k6=i
A CPO do problema do consumidor i resulta em:

!
X X
Ui0 ḡi + ḡk = p ⇒ Ui0 (Ḡ) = p , onde Ḡ = ḡk
k6=i k
Do lado da oferta, suponha uma firma competitiva que toma o preço p do bem público como
dado e possui uma função custo denotada por c(Q), onde Q representa a quantidade de bem
público. A oferta ótima do bem público é encontrada resolvendo o problema de maximização de
lucro abaixo:
max pQ − c(Q)
Q≥0
A CPO do problema acima resulta na conhecida condição preço igual a custo marginal:
p = c0 (Q̄)
No equilı́brio devemos ter que a quantidade demandada de bem público é igual a quantidade
ofertada, ou seja, Ḡ = Q̄. Observe que utilizando os resultados acima, obtemos:
I
X
0
c (Ḡ) = p = Ui0 (Ḡ) < Uk0 (Ḡ) = c0 (G∗ )
k=1
Como o custo marginal de provisão do bem público é crescente (c00 > 0), obtemos:
Ḡ < G∗ ,
ou seja, no caso de provisão privada de um bem público, o nı́vel de produção de mercado é inferior
ao nı́vel socialmente ótimo. O gráfico a seguir ilustra essa situação.

$6
c0 (G)
g 0 (G)
P
i
s
UI0 (G)
∗
-
G
Ḡ G
A caracterı́stica de não ser possı́vel excluir uma pessoa do consumo do bem público, ou seja,
o fato de que o bem público comprado por um consumidor fica disponı́vel para todos os outros
consumidores, torna o mercado ineficiente na provisão de bens públicos. Isto justifica a ação do
Estado para corrigir a alocação de mercado. No caso de provisão privada de um bem público, o
nı́vel de produção de mercado é inferior ao nı́vel socialmente ótimo.
Observe que a ineficiência é resultado da caracterı́stica de não ser possı́vel excluir nenhum
indivı́duo do consumo do bem público. Isso cria a situação onde cada consumidor deseja pegar
carona no consumo do bem público pago pelos outros (free-riding problem). O carona é o agente
econômico que se beneficia do bem sem pagar por ele.
Suponha que U10 (G) < U20 (G) < · · · < UI0 (G), para todo G ≥ 0. Nesse caso, é possı́vel mostrar
que o nı́vel de equilı́brio Ḡ de provisão privada do bem público satisfaz UI0 (Ḡ) = c0 (Ḡ), ou seja,
quem tem o maior benefı́cio marginal com o bem público é quem define a quantidade provida desse
bem.
Essa ineficiência da quantidade privada ótima ser menor do que a quantidade socialmente ótima
pode ser corrigida por meio de um imposto compulsório, que obriga todos a contribuı́rem para o
provimento do bem público. Porém, há um outro problema: cada indivı́duo poderá não revelar
corretamente o benefı́cio que obtém com o bem público, o que impossibilitaria calcular a quantidade
socialmente ótima de bem público que deve ser provida. A questão então é se existe alguma forma
de induzir cada indivı́duo a revelar o seu verdadeiro benefı́cio com o bem público. Este é um
problema tı́pico de desenho de mecanismos.

Referências
Coase, R. H. (1960). The problem of social cost. Journal of Law and Economics, 3 , 1-44.
Hardin, G. (1968). The tragedy of the commons. Science, 162 , 1243-1248.
Nicholson, W., & Snyder, C. (2008). Microeconomic theory - basic principles and extensions (10th
edition). Mason, OH: South-Western Cengage Learning.
Ostrom, E. (2015). Governing the commons. the evolution of institutions for collective action. New
York: Cambridge University Press.
Pigou, A. C. (1920). The economics of welfare. London: Macmillan and Co.
Samuelson, P. A. (1954). The pure theory of public expenditure. The Review of Economics and
Statistics, 36:4 , 387-389.
Samuelson, P. A. (1955). Diagrammatic exposition of a theory of public expenditure. The Review
of Economics and Statistics, 37:4 , 350-356.
Varian, H. (2012). Microeconomia – uma abordagem moderna (8a edição). Elsevier/Editora
Campus.
Exercı́cios
1. (P1-1/19) Suponha um grupo de 5 indivı́duos, que consomem um bem público e um bem

privado. A utilidade do indivı́duo i é:
ui (xi , G) = i × ln G + xi ,
onde xi denota a quantidade do bem privado consumido por i e G a quantidade de bem

público. Suponha que o preço do bem privado é normalizado em 1 e que cada indivı́duo tem
a mesma dotação desse bem privado, eix = 10, para todo i = 1, . . . , 5. O bem público possui
um custo de provimento igual a C(G) = 5G.
(a) Calcule a quantidade socialmente ótima de bem público.

(b) Suponha que cada indivı́duo contribui com o mesmo valor para prover a quantidade
socialmente ótima do bem público. Qual será o valor da contribuição individual e da
total?
(c) Suponha que os indivı́duos 2, 3, 4 e 5 contribuem cada um com 3 u.m. para a provisão
do bem público. Qual será o valor de bem público que o indivı́duo 1 irá adquirir, caso
o bem público seja provido em um mercado privado, em que o seu preço é igual ao seu
custo marginal de provimento? (dica: lembre-se que o consumo de um bem é sempre
maior ou igual a zero).
(d) Interprete intuitivamente o resultado encontrado no item (c) e discuta qual seria a
solução no caso de provisão privada do bem público.

Notas de Aula 4 – Escolha sob Incerteza
1 Comportamento sob Incerteza

1.1 Introdução
Considere o seguinte jogo. Uma moeda é lançada. Se o resultado for cara, você ganha R$ 2.
Se o resultado for coroa, a moeda é lançada novamente. Se o resultado for cara, você ganha R$
22 = R$ 4. Se o resultado for coroa, a moeda é lançada novamente. Continuamos dessa forma ad
infinitum, ou até que o jogo termine com um lançamento da moeda que resulte em cara. Nesse
caso, o participante recebe R$ 2n , onde n é o número de lançamentos feitos até cara sair.
Quanto você estaria disposto a pagar para participar deste jogo? Se você decidir pagar o valor
esperado do jogo, você pagaria qualquer valor para participar do jogo, já que o valor esperado do
jogo diverge para infinito.
Observe que o jogo pode dar prêmios enormes. Por exemplo, se o jogo for até o vigésimo lance
de moeda, você ganharia mais de um milhão de reais. Se o jogo chegar até a trigésima rodada,
você ganharia mais de um bilhão de reais. Porém, a chance desses prêmios é bastante baixa (para o
prêmio de um milhão, a chance é menor do que uma em um milhão). Metade das vezes, o jogo paga
apenas R$ 2, e a chance de um valor maior que que R$ 100 é uma em cento e vinte e oito. Logo,
poucas pessoas pagariam um valor alto por esse jogo, apesar de seu valor esperado ser infinito.
Esse problema é conhecido como o paradoxo de São Petersburgo.
Daniel Bernoulli, em 1738, apresentou uma solução para este paradoxo, baseada na ideia de
utilidade marginal decrescente do dinheiro. Bernoulli afirmou que o valor de algo depende da
utilidade gerada, e que o ganho de utilidade do dinheiro cai quanto mais dinheiro a pessoa tem. O
gráfico abaixo ilustra uma função de utilidade com essa propriedade.
u
6
u(w)
-
riqueza (w)
José Guilherme de Lara Resende 1 NA 4 – Escolha sob Incerteza

A ideia de Bernoulli, apesar de não resolver o paradoxo satisfatoriamente, foi incorporada em

economia, na teoria de incerteza, que vamos analisar agora. A incerteza no problema do consumidor
significa que este não saberá exatamente qual vai ser o seu consumo.
O primeiro passo ao analisarmos problemas com incertezas é definir o que a pessoa escolhe
agora. No exemplo acima, existem duas caracterı́sticas distintas, o valor monetário pago pelo
jogo e a probabilidade de ocorrência desse valor. Então o indivı́duo deve escolher um objeto que
contém resultados e probabilidades. Vamos chamar um objeto desse tipo de loteria. Vamos definir
formalmente esse conceito.
Suponha que A = {a1 , . . . , an } é um conjunto finito de resultados (por exemplo, ai pode ser um
valor monetário para cada i). Uma loteria g = (p1 ◦ a1 , . . . , pn ◦Pan ) assinala a probabilidade pi ao
n
resultado ai , para todo resultado i = 1, 2, . . . , n, onde pi ≥ 0 e i=1 pi = 1. Dado um conjunto de
resultados A qualquer, o conjunto de todas as loterias simples definidas sobre A é denotado por GA
ou simplesmente G. Dizemos que a loteria g é degenerada se pi = 1 para algum i, isto é, g equivale
a um resultado com certeza. Portanto, uma loteria não-degenerada corresponde a uma situação
onde não existe resultado certo. Podemos incluir também no conjunto de escolha G loterias sobre
loterias, chamadas loterias compostas. Vamos supor que o indivı́duo é indiferente entre uma loteria
composta e a loteria simples associada a ela, ou seja, a loteria simples que leva diretamente aos
mesmos resultados com as mesmas probabilidades.
O consumidor decidirá entre loterias, degeneradas ou não degeneradas, simples ou compostas.
Loterias são o objeto de consumo agora. As loterias são planos contingentes de consumo, con-
tingentes na incerteza existente. Note a mudança na estrutura da teoria: não consideramos mais
cestas de bens, mas loterias. Isso exige um grau diferente de capacidade de escolha do indivı́duo.
Se existem n probabilidades possı́veis, então existem n estados da natureza. Por exemplo,
suponha que o indivı́duo considera adquirir um seguro contra incêndios para a sua casa. Os estados
da natureza relevantes nesse caso são dois: “incêndio” e “não-incêndio” (na casa). Logo, o número
de estados da natureza relevantes depende do problema em questão.
Uma vez definido o objeto de escolha do consumidor, loteria, vamos supor que este possui uma
função de utilidade sobre loterias. Vamos considerar utilidades que satisfazem uma propriedade de
linearidade sobre as probabilidades.
Definição: Utilidade Esperada. A utilidade U : G → R possui a propriedade de utilidade

esperada se, para toda loteria g = (p1 ◦ a1 , . . . , pn ◦ an ) ∈ G temos que:
n
X
U (p1 ◦ a1 , . . . , pn ◦ an ) = pi u(ai ).
i=1
Portanto, a utilidade esperada U é linear nas probabilidades e determinada pelos valores que
assume no conjunto dos resultados. Mais adiante, veremos que a função u determina o comporta-
mento em relação ao risco da pessoa. Segundo Bernoulli, a utilidade marginal da riqueza deve ser
decrescente, ou seja, a função u deve ser côncava.
Exemplo: um indivı́duo possui uma riqueza avaliada em R$ 100.000. Parte dessa riqueza consiste
em um carro avaliado em R$ 20.000. A probabilidade de o carro ser roubado é de 20% caso não seja
instalado um alarme anti-furto. O alarme custa R$ 1.000 e, se instalado, reduz a probabilidade de
roubo para 5%. Suponha que a função de utilidade sobre a riqueza desse indivı́duo é u(x) = ln(x).

A utilidade esperada do indivı́duo quando ele instala o sistema anti-furto (opção 1) é, portanto,
igual a:
U (opção 1) = 0,95 × ln(100.000 − 1.000) + 0,05 × ln(100.000 − 20.000 − 1.000) = 11,4915
Caso ele não instale o sistema (opção 2), sua utilidade esperada será igual a:
U (opção 2) = 0,80 × ln(100.000) + 0,20 × ln(100.000 − 20.000) = 11,4683
Portanto, caso não tenha a opção de contratar um seguro, o indivı́duo optará por instalar o alarme.
Nesse exemplo, existem dois estados da natureza relevantes ao problema: o primeiro, “carro não é
roubado”, o segundo, “carro é roubado”.
A utilidade esperada do jogo descrito no paradoxo de São Petersburgo, com u(w) = ln(w), é:
∞ ∞ ∞
X 1 n
X 1 X n
U= n
ln(2 ) = n
n ln(2) = ln(2) = 2 ln(2),
n=0
2 n=0
2 n=0
2n
pois a série ∞ n
P
n=0 2n converge para 2. Portanto, o indivı́duo ficaria indiferente entre participar do
jogo ou receber R$ 4,00 com certeza.
Se o conjunto de resultados for A = R+ , então uma loteria será representada por uma função de
distribuição acumulada F : R → [0, 1] (F (x) = P (g ≤ x)). Se a loteria for absolutamente contı́nua,
com função de densidade de probabilidade f (x), a utilidade de uma loteria pode então ser calculada
como: Z ∞ Z ∞
U (F ) = u(x) dF (x) = u(x)f (x) dx
−∞ −∞
1.2 Construção da Utilidade Esperada
Vimos que agora o consumidor decidirá entre loterias - o objeto de consumo agora. Vamos supor
que o consumidor possui preferências sobre o conjunto G de loterias, onde estas preferências
satisfazem os axiomas abaixo.
Axioma 1 - Completeza e Transitividade. é completa e transitiva.
Axioma 2 - Continuidade. Para quaisquer loterias g, h, k ∈ G, os conjuntos
{α ∈ [0, 1] | αg + (1 − α)h k} ⊂ [0, 1] e {α ∈ [0, 1] | k αg + (1 − α)h} ⊂ [0, 1]
são fechados.
Axioma 3 - Independência. Para quaisquer loterias g, h, k ∈ G e α ∈ (0, 1), vale que:
f g ⇔ αf + (1 − α)h αg + (1 − α)h.
O primeiro axioma exige que todo par de loterias seja comparável em termos de preferência e que
esta preferência satisfaça a propriedade de transitividade. O significado do segundo axioma é similar
ao do axioma de continuidade para preferências em um ambiente sem incerteza, sendo também um
axioma de caráter mais técnico, necessário para obtermos a representação da preferência por uma

função de utilidade. O terceiro axioma assegura que a função de utilidade que representa o sistema
de escolhas do consumidor tenha a forma de utilidade esperada (linear nas probabilidades).
Vimos que a utilidade U : G → R possui a propriedade de utilidade esperada se, para todo
g ∈ G, g = (p1 ◦ a1 , . . . , pn ◦ an ), temos que:
n
X
U (g) = pi u(ai ) .
i=1
Teorema: Existência de Utilidade Esperada. Se as preferências definidas sobre o espaço

de loterias G satisfazem os três axiomas acima, então existe U : G → R que representa e satisfaz
a propriedade de utilidade esperada (é linear nas probabilidades).
A utilidade U é chamada utilidade esperada ou utilidade de Von Neumann e Morgenstern. A

função u é chamada utilidade de Bernoulli (alguns livros não fazem essa distinção e chamam am-
bas as funções U e u utilidade de Von Neumann e Morgenstern). Uma vez garantida a existência
de uma utilidade que represente a preferência, a questão que surge diz respeito à existência de
outras funções de utilidade que representem a mesma preferência. Na teoria do consumidor sem
incerteza vimos que qualquer transformação crescente de uma função de utilidade continua rep-
resentando a mesma preferência. Agora isto não será mais verdade, pois queremos preservar a
propriedade de utilidade esperada. Para que esta propriedade seja mantida, devemos considerar
apenas tranformações lineares crescentes da utilidade esperada. O teorema a seguir enuncia este
resultado.
Teorema: Unicidade da Utilidade Esperada. Suponha que a utilidade esperada U representa

. Então a utilidade esperada Û representa as mesmas preferências se, e somente se, existem
α, β ∈ R, β > 0, tais que Û (g) = α + βU (g), para toda loteria g ∈ G.
Dizemos então que a utilidade esperada que representa um sistema de preferências que satisfaça
os axiomas acima é única a menos de transformações lineares (ou afins) positivas. O teorema
anterior tem como consequência o fato de que diferenças de utilidades têm significado, no caso de
utilidades esperadas.
Portanto, a teoria da utilidade esperada não é mais uma teoria puramente ordinal, já que
diferenças de utilidade têm significado econômico. Porém, esta teoria também não é puramente
cardinal, pois o valor da utilidade de uma determinada loteria não tem conteúdo econômico, já
que uma transformação afim crescente desta utilidade continua representando o mesmo sistema de
escolhas.
Exemplo: Suponha 4 resultados, a1 , a2 , a3 e a4 . A afirmação “a diferença de utilidade entre os

resultados 1 e 2 é maior do que a diferença de utilidade entre os resultados 3 e 4”, u(a1 ) − u(a2 ) >
u(a3 ) − u(a4 ), é equivalente à (1/2)u(a1 ) − (1/2)u(a2 ) > (1/2)u(a3 ) − (1/2)u(a4 ). Logo, a afirmação
resulta na loteria g = ((1/2) ◦ a1 , 0 ◦ a2 , 0 ◦ a3 , (1/2) ◦ a4 ) ser preferı́vel à h = (0 ◦ a1 , (1/2) ◦ a2 , (1/2) ◦
a3 , 0 ◦ a4 ). Esta ordenação de preferências é preservada por qualquer transformação afim positiva
da utilidade esperada.

1.3 Comportamento com relação ao Risco
A curvatura da função u mede a atitude do consumidor com relação ao risco. Por exemplo,
suponha um indivı́duo com R$ 100 de riqueza. Ele pode entrar em uma aposta onde com 50% de
chance ele ganhará R$ 50 e com 50% de chance ele perderá R$ 50. O valor esperado da aposta é 0
(1/2 × 50 + 1/2 × (−50)) e, portanto, o valor esperado da sua riqueza se participar da aposta é R$
100. Já a utilidade esperada da aposta é:

1 1 1 1
U = × u(150) + × u(50) < u × 150 + × 50 = u(100),
2 2 2 2
onde o sinal de desigualdade estrita é válido quando a função u for estritamente côncava. Nesse
caso, dizemos que o indivı́duo é avesso ao risco, já que ele prefere o valor esperado da aposta
a participar dela. O indivı́duo avesso ao risco não participa então de nenhuma aposta cujo valor
esperado seja zero. A figura abaixo ilustra essa situação.
u
6
B
s
u(150) u(w)

D
u(100) s

1
+ 21 u(150) s
2 u(50)
C

A
s
u(50)

-
R$ 50 R$ 100 R$ 150
w
Figura 1: Aversão ao Risco
Na figura acima, os pontos A e B representam as utilidades associadas aos valores R$ 50 e

R$ 150, respectivamente. O ponto C, dado pela combinação linear entre A e B com peso 1/2, diz
a utilidade esperada da aposta com 50% de chance de receber R$ 50 e 50% de chance de perder
R$ 50. A utilidade de R$ 100 com certeza, ou seja, de não participar da aposta, é representada pelo
ponto D e se situa acima do ponto C, pois a função de utilidade é estritamente côncava. Portanto,
um consumidor com função u estritamente côncava prefere receber o valor esperado de uma aposta
a participar da aposta, qualquer que seja a aposta.
Vamos definir o comportamento do consumidor diante do risco em termos da utilidade esperada
U : G → R, onde o conjunto de resultados A = {w1 , . . . , wn } é formado por valores não-negativos
de riqueza (wi ≥ 0, para todo i).

Definição: Comportamento em Relação ao Risco. Considere a loteria g não-degenerada.

Dizemos que o indivı́duo é:
1. Avesso ao risco em g se u(E(g)) > U (g);
2. Neutro ao risco em g se u(E(g)) = U (g);
3. Amante do risco em g se u(E(g)) < U (g).
Se o indivı́duo for avesso (neutro, amante) ao risco para toda loteria não-degenerada g, então
dizemos que esse indivı́duo é avesso (neutro, amante) ao risco.
Exemplo: Seguros. Todo indivı́duo avesso ao risco escolherá assegurar totalmente os seus ativos,
se o preço do seguro for atuarialmente justo, isto é, tal que o seu preço seja igual à perda esperada.
Sejam:
• w0 : riqueza inicial;
• π ∈ (0, 1): probabilidade do indivı́duo sofrer uma perda de X reais;
• c: quantidade de seguro comprada;
• p = π: preço atuarialmente justo de cada real assegurado.
O problema do indivı́duo é escolher a quantidade c de seguro que maximiza a sua utilidade

esperada:
max [πu(w0 − πc − X + c) + (1 − π)u(w0 − πc)]
c
A CPO resulta em:

u0 (w0 − πc − X + c) = u0 (w0 − πc),
o que resulta em c∗ = X se u00 < 0 (garante a validade da CSO para um máximo e garante que
c∗ > 0). Portanto, no caso de um seguro atuarialmente justo, o indivı́duo se assegura totalmente
contra uma perda. A condição u00 < 0 significa que o indivı́duo é avesso ao risco, segundo o teorema
abaixo.
Dois conceitos importantes para a teoria de escolha sob incerteza são os de equivalente de certeza
e prêmio ao risco associados a uma determinada loteria. O equivalente de certeza de uma loteria é
a quantidade de dinheiro dado com certeza ao indivı́duo que o faz indiferente à loteria. O prêmio
ao risco de uma loteria é o montante de dinheiro que retirado do valor esperado da loteria, torna
o indivı́duo indiferente à loteria. Observe que estes dois conceitos estão sempre associados a uma
determinada loteria.
Definição: Equivalente de Certeza e Prêmio ao Risco. O equivalente de certeza (ECg ) da

loteria g é o montante de dinheiro ECg dado com certeza, tal que U (g) = u(ECg ). O prêmio
ao risco associado à loteria g é o montante de dinheiro Pg tal que U (g) = u(E(g) − Pg ) (logo,
Pg = E(g) − ECg ).

Aversão ao risco, conforme definida acima, é equivalente a três outras definições. Primeiro,
um indivı́duo é averso ao risco se, e somente se, a função u é estritamente côncava. Segundo, um
indivı́duo é averso ao risco se, e somente se, o equivalente de certeza de toda loteria não-degenerada
é menor do que o o valor esperado da loteria. Terceiro, um indivı́duo é averso ao risco se, e somente
se, o prêmio ao risco de toda loteria não-degenerada é negativo. O teorema abaixo resume essas
equivalências.
Teorema: Aversão ao Risco, EC e Prêmio ao Risco. As seguintes afirmativas são equiva-

lentes:
1. O indivı́duo é averso ao risco;
2. u(·) é estritamente côncava;
3. ECg < E(g), para toda loteria não-degenerada g;
4. Pg < 0, para toda loteria não-degenerada g.
De modo similar, temos os seguintes resultados para os casos de neutralidade ao risco e de

propensão ao risco:
Teorema: Neutralidade ao Risco, EC e Prêmio ao Risco. As seguintes afirmativas são

equivalentes:
1. O indivı́duo é neutro ao risco;
2. u(·) é linear;
3. ECg = E(g), para toda loteria g;
4. Pg = 0, para toda loteria g.
Teorema: Propensão ao Risco, EC e Prêmio ao Risco. As seguintes afirmativas são equiv-

alentes:
1. O indivı́duo é propenso ao risco;
2. u(·) é estritamente convexa;
3. ECg > E(g), para toda loteria g;
4. Pg < 0, para toda loteria g.
Os teoremas acima mostram que o comportamento do indivı́duo com relação ao risco está
ligado à curvatura da função u. Se a função u for estritamente côncava, o indivı́duo será averso
ao risco. É de se esperar que a concavidade de u, medida pela segunda derivada de u, seja usada
para medir o grau de aversão ao risco de um indivı́duo. Porém, não é adequado utilizar u00 como
medida de aversão ao risco, já que uma transformação linear crescente v = a + bu, com b > 0,
continua representando o mesmo indivı́duo. Neste caso, v 00 = bu00 também seria uma medida do
grau de aversão ao risco deste indivı́duo e, portanto, terı́amos diversos valores possı́veis como grau
de aversão ao risco do indivı́duo.

Os coeficientes de Arrow-Pratt medem o grau de aversão ao risco de um consumidor sem incorrer

neste problema: estes coeficientes são invariantes com respeito à utilidade usada para representar
as escolhas do indivı́duo.
Definição: Coeficiente de Aversão ao Risco Absoluto (CARA). O coeficiente de aversão

absoluta ao risco (CAAR) de Arrow-Pratt da utilidade U no nı́vel de riqueza w é definido como:
u00 (w)
Ra (w) = − .
u0 (w)
Definição: Coeficiente de Aversão ao Risco Relativo. O coeficiente de aversão relativa ao

risco (CARR) de Arrow-Pratt da utilidade U no nı́vel de riqueza w é definido como:
wu00 (w)
Rr (w) = − .
u0 (w)
As duas definições usam a segunda derivada de u para definir o grau de aversão ao risco de
um indivı́duo. Essas medidas são locais, ou seja, calculadas em um ponto do nı́vel de renda.
Observe que essas medidas não se alteram caso representemos o indivı́duo por outra função v tal
que v = a + bu, com b > 0.
Exemplo: CARA constante. Considere a utilidade u(w) = −e−αw . Para essa utilidade,
Ra (w) = α, para todo w.
w1−ρ
Exemplo: CARR constante. Considere a utilidade u(w) = 1−ρ
. Para essa utilidade, Rr (w) =
ρ, para todo w.
Os três resultados a seguir, intuitivamente esperados, podem ser demonstrados formalmente.

O primeiro reforça o uso do coeficiente de aversão absoluta ao risco como uma medida de aversão
ao risco. O segundo relaciona o coeficiente de aversão absoluta ao risco às noções de equivalente
de certeza e prêmio ao risco. O terceiro diz que todo indivı́duo cujo grau de aversão absoluta ao
risco aumenta com a riqueza, então o seu grau de aversão relativa ao risco também aumenta com
a riqueza.
Resultado: Aversão ao Risco. O coeficiente de aversão absoluta ao risco de u é maior do que

o de v, para todo nı́vel de renda, se e somente se a função u for mais côncava do que a função v
(no seguinte sentido: u = h ◦ v, onde h é uma função crescente e côncava).
Resultado: CARA e Prêmio ao Risco. Quanto maior o coeficiente de aversão ao risco absoluto,
maior (menor) o prêmio ao risco (equivalente de certeza) associado a alguma loteria qualquer.
Resultado: CARR e Prêmio ao Risco. Se o CARA for crescente, então CARR será crescente.

Exemplo: Escolha de Portfolio. Considere um investidor com riqueza inicial w0 , que pode
investir o montante β em um ativo com risco, cujo retorno pode ser ri no estado i, i = 1, . . . , n,
que pode ocorrer com probabilidade pi . A riqueza do investidor caso o estado i ocorra será wi =
(w0 − β) + β(1 + ri ) = w + βri . O problema de um investidor é maximizar sua utilidade esperada
da riqueza final:
X n
max pi u(w0 + βri ) (1)
0≤β≤w0
i=1
Vamos analisar primeiro o caso em que β = 0, ou seja, nada é investido no ativo arriscado. A
derivada da função objetivo calculada em β̂ = 0 é:
n
X n
X
fCP O (β̂) = pi u0 (w0 + β̂ri )ri = u0 (w0 ) pi ri = u0 (w0 )Er
i=1 i=1
Para que a solução seja β = 0, a derivada acima tem que ser não-positiva, ou seja, Er ≤ 0, pois
u0 é positivo. Logo, obtivemos o seguinte resultado:
Todo investidor avesso ao risco sempre investirá algum valor positivo em um ativo
arriscado cujo retorno médio seja maior do que o retorno do ativo sem risco, indepen-
dentemente do grau risco do ativo arriscado (Arrow, 1967).

2 Paradoxos e Extensões
2.1 Paradoxo de Allais
Suponha três prêmios, R$ 2.500.000, R$ 500.000 e R$ 0, e considere as quatro loterias abaixo:
Prêmios/Loterias g1 g10 g2 g20

R$ 2.500.000 0 0,10 0 0,10
R$ 500.000 1 0,89 0,11 0
R$ 0 0 0,01 0,89 0,90
Logo, g1 denota a loteria que paga R$ 500.000 com certeza e g10 denota a loteria que paga
R$ 2.500.000 com 10% de probabilidade, R$ 500.000 com 89% de probabilidade e R$ 0 com 1%
de probabilidade. Já g2 denota a loteria que paga R$ 500.000 com 11% de probabilidade e R$ 0
com 89% de probabilidade e g20 denota a loteria que paga R$ 2.500.000 com 10% de probabilidade
e R$ 0 com 90% de probabilidade. As seguintes escolhas são apresentadas:
Escolha 1: g1 vs g10
Escolha 2: g2 vs g20
Um padrão comum observado de escolhas é g1 g10 e g20 g2 . Vamos mostrar que essas
escolhas são inconsistentes com os axiomas da utilidade esperada. Se g1 g10 , então usando o
conceito de utilidade esperada, temos que:
u(500) > 0,10u(2.500) + 0,89u(500) + 0,01u(0),
onde simplificamos a notação cortando três zeros dos prêmios positivos. Agora, se g20 g2 , então
usando o conceito de utilidade esperada, temos que:
0,10u(2.500) + 0,90u(0) > 0,11u(500) + 0,89u(0)
Se adicionarmos 0,89u(500) − 0,89u(0) em ambos os lados da última desigualdade acima, obtemos:
0,10u(2.500) + 0,89u(500) + 0,01u(0) > u(500),
ou seja, que g10 g1 . Isso significa que as escolhas g20 g2 e g1 g10 são inconsistentes para um
indivı́duo maximizador de utilidade esperada. Esse resultado é conhecido como paradoxo de Allais.

2.2 Utilidade Esperada Subjetiva
Existe uma distinção entre risco e ambiguidade (incerteza ou incerteza Knightiana): a maioria
dos eventos incertos não possui (ou não é conhecida) uma distribuição objetiva de probabilidade
caracterizando essa incerteza.
Knight distingue risco de incerteza:
• Risco é uma situação onde a incerteza é mensurável;
• Incerteza refere-se à situação onde nenhuma (ou pouca) inferência estatı́stica pode ser feita
sobre o futuro.
Risco é o conceito de incerteza comumente usado em economia, em que os agentes conhecem a

distribuição estatı́stica dos resultados de suas ações. A estrutura do de utilidade esperada pode ser
alterada para esses casos. Um estado da natureza é uma descrição do mundo, que pode vir a ocorrer
ou não, e que não deixa nenhum aspecto relevante ao problema de fora. Estados da natureza são
portanto exaustivos e mutualmente excludentes.
Vamos agora permitir que a probabilidade seja subjetiva, já que a incerteza não é objetiva
aqui. A probabilidade então está ligada ao grau de confiança que um indivı́duo tem em um
evento/afirmação, com base em evidência (de Finetti e Savage). A principal restrição sobre proba-
bilidades subjetivas é chamada coerência: probabilidades devem somar um:
Se p(A) = p, então p(Ac ) = 1 − p ,
onde A denota um evento qualquer e Ac o evento complementar de A.

O modelo de Savage define um espaço de estados da natureza S e conjunto A de consequências
(resultados). Definimos um ato como uma função que associa a cada estado da natureza s ∈ S a
uma consequência a ∈ A. O conjunto de todos os atos é o conjunto de todas as funções de S em A,
denotado por F = {f : S → A}. O objeto de escolha do consumidor agora são atos: as preferências
do indivı́duo estão definidas para elementos em F .
Suponha que S é finito. Dizemos que as funções π : S → [0, 1] e u : A → R representam a
preferência definida sobre atos, se para f, g ∈ F temos que:
X X
f g ⇔ π(s)u(f (s)) ≥ π(s)u(g(s))
s∈S s∈S
Logo, no modelo de utilidade esperada subjetiva de Savage temos que:
• Tanto gostos (u) como crenças (π) são subjetivos.
• Gostos e crenças são independentes.
• A probabilidade π não depende da ação escolhida e a utilidade de uma consequência não

depende da ação escolhida.

2.3 Paradoxo de Ellsberg
O paradoxo de Ellsberg é consequência de um experimento simples e intuitivo, onde razoável

proporção das escolhas feitas contradiz o modelo de utilidade esperada subjetiva. A grosso modo,
o paradoxo é uma evidência de que incerteza é conceitualmente diferente de risco:
“A number of sets of constraints on choice-behavior under uncertainty (...) having

the implication that - for a “rational” man - all uncertainties can be reduced to risks.
(p.645)”
Vamos descrever o paradoxo de Ellsberg. Considere duas urnas, cada uma com cem bolas, onde
a Urna I contém 50 bolas pretas e 50 bolas brancas e a Urna II contém 100 bolas pretas ou brancas,
sem que se saiba o número de bolas pretas e de bolas brancas.
B B
B
B ~ ~
B
B ~~~
B
B
B B
~ ~ ~
B
B
B ~

~

B
B ?

B
B ~ B
B B
B ~ ~ B
B B
Urna I Urna II
100 Bolas 100 Bolas
50 Bolas Pretas ? Bolas Pretas
50 Bolas Brancas ? Bolas Brancas
Suponha as seguintes apostas:

PI: Ganha R$ 20 se uma bola preta é retirada da urna I;
BI: Ganha R$ 20 se uma bola branca é retirada da urna I;
PII: Ganha R$ 20 se uma bola preta é retirada da urna II;
BII: Ganha R$ 20 se uma bola branca é retirada da urna II.
Considere a escolha entre os seguintes pares de apostas: 1) PI vs PII, e 2) BI vs BII. É comum

observar escolhas onde se prefere PI a PII e BI a BII, o que contraria os postulados da utilidade
esperada subjetiva, já que:
PI PII ⇒ pI (preta) > pII (preta)

BI BII ⇒ pI (branca) > pII (branca)
Logo pII (preta) + pII (branca) < pI (preta) + pI (branca) = 1. Esse comportamento viola a
propriedade de coerência. Os modelos tradicionais de escolha excluem escolhas desse tipo.

2.4 Modelos que “Acomodam” os Paradoxos
Os desvios em escolhas nos modelos de utilidade esperada e utilidade esperada subjetiva levaram
a uma pesquisa com o objetivo de descrever o comportamento de decisão individual usando exper-
imentos. As duas conclusões principais dessa linha de pesquisa são que: 1) o comportamento sob
ambiguidade não necessariamente se reduz ao comportamento sob risco,e 2) incerteza, seja qual for
a forma, não entra de forma linear na função de utilidade.
Se probabilidades não entram linearmente na função de utilidade, então como se dá o processo de
escolha individual sob risco e sob incerteza? Vários estudos sugerem que certeza e impossibilidade
são pontos de referência no processo de escolha individual. Mudanças próximas a esses pontos são
percebidas de forma mais forte do que mudanças em valores intermediários. Essa “sensibilidade
decrescente” a partir desses pontos de referência tem sido amplamente confirmada por diversos
estudos, tanto para escolhas com ganhos como para escolhas com perdas.
Novos modelos de utilidade, tais como Choquet Expected Utility (CEU),Multiple-Priors Ex-
pected Utility (MEU), Cumulative Prospect Theory (CPT), etc, incorporam essas distorções em
probabilidades por meio de uma função de probabilidade.
Nos modelos CEU e CPT, a distorção ocorre na função de distribuição acumulada, e não nas
probabilidades diretamente. Nesse caso, o peso de um resultado depende da ordem desse resultado
no espaço de escolha do indivı́duo. Modelos deste são capazes de descrever comportamentos tı́picos
do paradoxo de Allais e do paradoxo de Ellsberg.
Leitura Recomendada
• Varian, cap. 11, 12 e 13.
• Pindick e Rubinfeld, cap. 5 - “Comportamento do Consumidor e Incerteza”.
• Nicholson e Snyder, cap. 7 - “Uncertainty and Information”.

Exercı́cios
1. Considere as loterias g = (0,50 ◦ 100; 0,50 ◦ 1000) e h = (0,20 ◦ 100; 0,30 ◦ 25; 0,50 ◦ 16). Calcule
a utilidade esperada, o equivalente de certeza, o prêmio de risco dessas duas loterias para os
casos abaixo:
√
a) u(w) = w, w0 = 100.
√
b) u(w) = w, w0 = 50.
c) u(w) = w, w0 = 100.
d) u(w) = w, w0 = 50.
e) u(w) = w2 , w0 = 100.
f) u(w) = w2 , w0 = 50.
2. Considere as loterias g = (0,60 ◦ 10.000; 0,40 ◦ 1.000) e h = (0,50 ◦ 10.000; 0,50 ◦ 2.800). Se um
consumidor está indiferente entre estas duas loterias, então pode-se afirmar que ele é neutro
ao risco. Verdadeiro ou falso? Justifique.
3. Responda os seguintes itens.
a) Suponha duas loterias g = (0,50 ◦ m1 ; 0,50 ◦ m2 ) e h = (0,50 ◦ w1 ; 0,50 ◦ w2 ), tais que

u(m1 ) = 25, u(m2 ) = 65, u(w1 ) = 35, u(w2 ) = 50 e v(m1 ) = 1, v(m2 ) = 9, v(w1 ) = 3,
v(w2 ) = 6. Verifique se u e v representam a mesma utilidade esperada.
b) Suponha que a função de utilidade da riqueza de um indivı́duo seja u(w) = log10 (w)
(logaritmo na base 10). O indivı́duo possui um carro no valor de R$ 100.000,00. Existe
uma probabilidade de 10% de ocorrer um acidente e o carro passar a valer R$ 10.000,00.
Calcule a utilidade esperada deste indivı́duo.
√
c) Suponha que a função de utilidade da riqueza de um indivı́duo seja u(w) = w. Con-
sidere a loteria g = (0,10◦100; 0,60◦60, 0,30◦0). Determine o valor esperado, a utilidade
esperada e o desvio-padrão de g. Calcule o equivalente de certeza e o prêmio ao risco da
loteria g.
4. (A07) Um indivı́duo tem uma riqueza não nula e sua função de utilidade von-Neumann-
Morgenstern é dada por u(x) = K − a/x, em que a e K são constantes positivas e x >
a/K. Este indivı́duo é convidado a participar de uma loteria que triplica sua riqueza com
probabilidade p e a reduz à terça parte com probabilidade 1−p. Qual deve ser o valor mı́nimo
de p para que o indivı́duo aceite participar da loteria?
5. (A96) Quais das funções abaixo têm as propriedades de utilidade esperada? Justifique a sua
resposta.
a) u(p ◦ w1 ; (1 − p) ◦ w2 ) = pw1 + (1 − p)w2 .

b) u(p ◦ w1 ; (1 − p) ◦ w2 ) = a(pw12 + (1 − p)w22 ).
c) u(p ◦ w1 ; (1 − p) ◦ w2 ) = pa ln(w1 ) + (1 − p)b ln(w2 ).
p 1−p
d) u(p ◦ w1 ; (1 − p) ◦ w2 ) = 1−p
ln(w1 ) + p
ln(w2 ).
e) u(p ◦ w1 ; (1 − p) ◦ w2 ) = pα ln(w1 ) + (1 − p)α ln(w2 ).

6. (A09) Um indivı́duo possui uma função de utilidade dada por U = 1 − (1/w), em que w
denota o valor presente lı́quido da sua renda futura. No momento, ele está contemplando
duas opções de carreira profissional. A primeira opção dará a ele uma renda certa de w = 5.
A outra alternativa dará w = 400, com 1% de chance, e w = 4 com 99% de chance. Responda
às seguintes questões:
a) Calcule os coeficientes de aversão absoluta e relativa ao risco de Arrow-Pratt. Esse

indivı́duo é avesso ao risco?
b) Calcule a utilidade esperada das duas opções. Qual deve ser a escolha desse indivı́duo?
c) Calcule o equivalente de certeza da segunda alternativa.
d) Suponha que exista um teste de aptidão que revela com certeza se indivı́duo obterá
w = 400 ou w = 4 se escolher a segunda alternativa. Calcule o maior valor que o
indivı́duo estaria disposto a pagar por esse teste de aptidão.

Notas de Aula 5 – Teoria dos Jogos
1 Introdução
1.1 Interdependência Estratégica
A teoria dos jogos permite modelar comportamentos estratégicos dos agentes econômicos. É
o instrumento adequado quando existe interdependência estratégica entre os agentes do modelo
analisado.
No modelo de consumo usual, o consumidor decide entre possı́veis cestas de bens, dados os
preços e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a
sua tecnologia de produção e dados os preços dos insumos e dos bens que vende. No modelo de
equilı́brio geral competitivo, tanto os consumidores quanto as firmas tomam os preços como dados
e não há interação estratégica entre os agentes econômicos.
Porém, existem situações onde os resultados das ações de um agente dependem diretamente
do comportamento de outros agentes. Nestes casos, assumimos que o payoff (bem-estar) do agente
depende não só da sua ação, mas da ação de outros agentes. Modelos de oligopólio são um exemplo,
em que o lucro de determinada firma depende do que suas rivais fazem.
Um jogo então caracteriza qualquer situação desse tipo, em que cada participante deve levar em
conta a estratégia dos outros jogadores envolvidos antes de escolher o melhor para si. O objetivo
da teoria dos jogos é determinar o resultado de um jogo. Cada método de análise resulta em um
conceito de solução particular, chamado equilı́brio.
A maioria dos conceitos tem sua origem no conceito de equilı́brio de Nash e são, usualmente,
equilı́brios de Nash que satisfazem certas propriedades. Por isso, são chamados refinamentos.
Cada refinamento tenta solucionar alguma deficiência do conceito de equilı́brio de Nash particular
a alguma situação ou modelo.
1.2 Noções Preliminares
Definição (informal): Jogo. Um jogo refere-se a qualquer situação envolvendo dois ou mais
agentes, chamados jogadores, onde exista interdependência estratégica.
Vamos estudar jogos não-cooperativos: analisamos cada agente separadamente e não como um
grupo. Essa definição não implica que um jogador não possa cooperar com o outro, ela é apenas
de cunho metodológico, onde cada agente é visto como uma entidade separada, autônoma, e não
há grupos de agentes se comportando como um único agente.
José Guilherme de Lara Resende 1 NA 5 – Teoria dos Jogos

Para descrevermos um jogo é necessário conhecermos três objetos:
• Os jogadores,
• A regra do jogo,
• O resultado do jogo (payoff dos jogadores).
São feitas duas hipóteses básicas sobre os jogadores:
1. Os jogadores são racionais. As ações de um jogador são consistentes com o objetivo desejado:
maximizar o seu payoff.
2. Os jogadores são inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e con-
seguem fazer as mesmas inferências que realizamos sobre a situação em que se encontram.
A segunda hipótese não é tão inócua quanto parece. Na teoria de equilı́brio geral os indivı́duos
são racionais, mas não é necessário que sejam inteligentes no sentido acima: os agentes econômicos
não precisam conhecer toda a estrutura de teoria de equilı́brio geral ao tomarem suas decisões.
As duas formas mais comuns de se representar um jogo são:
• Forma Estratégica: Representação em forma matricial. Esta forma é adequada para

situações onde os jogadores se “movem” (decidem suas ações) simultaneamente (modelo
estático). Também conhecida como forma normal.
• Forma Extensiva: Representação em forma de árvore. Esta forma é adequada para

situações onde exista uma ordem cronológica dos eventos do jogo (modelo dinâmico). Também
conhecida como forma sequencial.
Existe uma correspondência entre essas duas formas, que veremos mais a frente. Vimos que o
princı́pio básico de eficiência usado em economia é o critério de Pareto. Dizemos que o resultado
A do jogo é Pareto-dominado pelo resultado B se nenhum agente ficar pior e pelo menos um ficar
melhor em B do que em A.
Definição: Um resultado de um jogo é Pareto ótimo (ou eficiente de Pareto) se não é Pareto-
dominado por nenhum outro resultado possı́vel para o jogo.
1.3 Conhecimento Comum
Uma hipótese usada em teoria dos jogos é a de conhecimento comum (“common knowledge”),
que assume que a racionalidade dos jogadores e a estrutura do jogo são de conhecimento comum
de todo jogador.
Se considerarmos dois jogadores, um determinado fato é de conhecimento comum dos jogadores
se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1
sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe
que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo raciocı́nio
valendo para o jogador 2.

Essa hipótese é fundamental para a validade de certos procedimentos, tais como os procedi-
mentos de eliminação de estratégias dominadas. Mais ainda, ela é importante para o conceito de
equilı́brio de Nash (existem artigos que relaxam a hipótese de conhecimento comum, sob certas
condições).
Myerson argumenta que a hipótese de jogadores inteligentes implica supor que a estrutura do
jogo é de conhecimento comum desses jogadores. A formalização matemática dessa hipótese é
complicada. Aqui, vamos apenas assumir a sua validade. Vamos apenas ver um exemplo para
entender a importância dessa hipótese.
Myerson cita uma fábula que ilustra bem as implicações da hipótese. Em uma vila, existem
100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou
se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os
homens da vila, exceto ao seu marido. Essas tradições são de conhecimento comum de todos os
habitantes da vila.
Suponha que todas as esposas foram infiéis. Logo, cada homem sabia da infidelidade de todas
as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum
homem se lamentava. Numa certa noite, um visitante revelou a todos que pelo menos uma esposa
havia sido infiel. Qual foi o resultado dessa revelação?
O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de
número 100, todos se lamentaram. Tente entender porque a hipótese de conhecimento comum leva
a esse resultado. Para isso, é necessário compreender o que a informação do visitante adicionou ao
conhecimento dos homens da vila.
O raciocı́nio fica mais fácil de compreender se considerarmos primeiro o caso em que apenas
uma esposa traiu o marido. A informação nova que o visitante revelou foi informar a todos da vila
que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel
e apenas um homem, exatamente aquele cuja esposa havia sido infiel, não tinha conhecimento de
nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciência de que a sua esposa é que
fora infiel e se lamentaria na primeira noite depois da revelação do visitante, já que os costumes da
vila são de conhecimento comum de todos os seus habitantes.
Caso houvesse duas esposas infiéis, então 98 homens da vila saberiam que havia duas esposas
infiéis e 2 homens teriam conhecimento de apenas um caso de infidelidade, já que não saberiam
que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ninguém se lamentaria
o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda
noite, após observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que
têm conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam
conta de que foram traı́dos e se lamentariam. O raciocı́nio estende-se de modo análogo para o caso
de 100 esposas infiéis: no centésimo dia, todos os maridos se dariam conta de que foram traı́dos e
se lamentariam.

2 Jogos na Forma Estratégica

2.1 Definições e Exemplos de Jogos
Definição: Jogo na Forma Estratégica (ou Forma Normal). Um jogo na forma estratégica
é uma coleção G = (Si , ui )Ii=1 , onde I é o número de jogadores, Si é o conjunto de estratégias
disponı́veis ao jogador i, para todo i ∈ I, e ui : Ik=1 Sk → R é a função de payoff (a utilidade)
Q
do jogador i, que depende das estratégias de todos os jogadores. Dizemos que um jogo na forma
normal é finito se o conjunto das estratégias Si é finito para todo i, i = 1, . . . , I.
Observe que a interdependência estratégica entre os agentes aparece explicitamente na hipótese

de que o payoff de cada jogador é descrita pela função ui : S1 × · · · × Si × · · · × SI → R, ou seja,
ui depende não apenas da estratégia si escolhida por i, mas também das estratégias de todos os
outros jogadores, s1 , . . . , si−1 , si+1 , . . . , sI .
Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de
uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam
simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00
ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve
este jogo.
1↓ / 2 → Cara Coroa
Cara −1, 1 1, −1
Coroa 1, −1 −1, 1
Notação: Vamos usar a seguinte convenção, corriqueira e adotada em diversos livros, para todos
os jogos representados na forma matricial: o primeiro elemento em cada célula da matriz é o payoff
do jogador 1 (“jogador-linha”) e o segundo elemento da célula é o payoff do jogador 2 (“jogador-
coluna”).
Para o jogo do Exemplo 1, temos que:
Jogadores: I = {1, 2};
Estratégias: S1 = S2 = {Cara, Coroa};
Payoffs: u1 (Cara,Coroa) = u1 (Coroa,Cara) = 1;
u1 (Cara,Cara) = u1 (Coroa,Coroa) = −1;
u2 (s1 , s2 ) = −u1 (s1 , s2 ), ∀(s1 , s2 ) ∈ S1 × S2 .
No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo imprevisı́vel. Logo,
quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja
escolher de modo aleatório ou de modo que o seu rival não saiba exatamente qual o lado da moeda
será escolhido.
Observe que esse é um jogo de soma zero: o ganho de um jogador é igual à perda do outro
jogador. Para jogos de soma zero com dois jogadores, os conceitos de solução usados podem envolver
os jogadores randomizarem suas estratégias. Esse tipo de jogo foi extensivamente estudado por von
Neuman e Morgenstern, no livro “theory of games and economic behavior ”, publicado em 1944 e
um marco da teoria dos jogos.

Um tipo de jogo mais geral do que os de soma zero são os jogos de soma fixa (dos payoffs),
também chamados jogos estritamente competitivos. Em um jogo de soma fixa, a soma dos payoffs
para cada resultado do jogo tem sempre o mesmo valor. Se o valor for zero, então o jogo é de soma
zero. Logo, jogos de soma zero são um tipo de jogos de soma fixa.
Em um jogo de soma fixa, um jogador só aumenta o seu payoff se o payoff do outro jogador
se reduzir pelo valor desse aumento. Então qualquer resultado deste jogo é Pareto eficiente, pois
aumentar o payoff de um jogador necessariamente implica diminuir o payoff do outro jogador. Esse
tipo de jogo é adequado para modelar situações em que se tem um “vencedor” e um “perdedor”.
Por exemplo, podemos modelar um jogo de xadrez como um jogo de soma zero: se um jogador
ganhar, ele obtém o payoff +1, enquanto o perdedor obtém o payoff −1. Se o jogo empatar, cada
jogador obtém payoff 0. Evidentemente, muitos dos jogos analisados em economia não são de soma
fixa (ou seja, podemos dizer que são de soma variável ), como é o caso dos Exemplos 2 e 3 a seguir.
Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estão sendo
interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receberão
uma pena de 3 anos na cadeia. Se ambos não confessarem o crime, a pena será de apenas dois
anos, por falta de evidência. Porém, o promotor pode fazer uma acordo com um deles, dando uma
pena de apenas um ano na prisão para quem confessar e, para quem não confessar, de cinco anos
na prisão, por não ter colaborado com a justiça. A matriz abaixo descreve este jogo.
L.A.↓ / Laelio → Confessar Não Confessar

Confessar −3, −3 −1, −5
Não Confessar −5, −1 −2, −2
Exemplo 3: Problema de Coordenação. Suponha que duas pessoas estão viajando separada-
mente para o Rio de Janeiro e combinaram de se encontrar para almoçar no dia seguinte. Porém
esqueceram de marcar o restaurante e não estão conseguindo se comunicar. Eles costumam almoçar
sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almoço no
restaurante da barra é mais agradável do que o almoço no restaurante do centro. Porém, eles se
desencontrarem é a pior situação possı́vel. A matriz abaixo descreve este jogo.
1↓ / 2 → Barra Centro
Barra 3, 3 0, 0
Centro 0, 0 1, 1
Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo à tarde.
Concordaram com duas opções: ir a um jogo de futebol ou fazer compras. Os dois preferem estar
juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir às compras.
A matriz abaixo descreve este jogo.
Nelson↓ / Renata → Futebol Compras

Futebol 2, 1 0, 0
Compras 0, 0 1, 2

Os Exemplos 3 e 4 modelam problemas de coordenação: os dois jogadores devem escolher suas

estratégias de modo que façam o mesmo programa. Veremos mais à frente que cada um desses
dois jogos possui dois equilı́brios de Nash em estratégias puras, em que ambos os jogadores devem
coordenar suas estratégias para alcançar um desses equilı́brios. Além disso, o Exemplo 4 envolve
uma disputa de poder, em que o equilı́brio que o jogador 1, Nelson, prefere, (F, F ) (os dois irem
juntos ao futebol), é diferente do equilı́brio que a jogadora 2, Renata, prefere, (C, C) (os dois irem
juntos às compras). Ambos os jogadores preferem estar em uma situação de equilı́brio do que estar
em uma situação de desequilı́brio, (F, C) ou (C, F ), ou seja, em que um escolhe um programa
diferente do escolhido pelo outro. Temos então uma disputa de poder entre os jogadores, onde cada
um tenta implementar o seu equilı́brio preferido.
2.2 Conceitos de Dominância e Estratégias Racionalizáveis
Nas definições a seguir vamos denotar por si uma estratégia qualquer de um jogador i arbitrário
e por Si o conjunto de todas as estratégias disponı́veis para o jogador i. Além disso, s−i denota
um grupo de estratégias para os outros jogadores que não o jogador i (ou seja, s−i especifica uma
estratégia para cada um dos rivais do jogador i) e S−i denota o conjunto de todas as estratégias
disponı́veis para os outros jogadores que não o jogador i.
Definição: Estratégia Estritamente Dominante. A estratégia ŝi é estritamente (ou forte-

mente) dominante para o jogador i em um dado jogo se para toda estratégia si 6= ŝi , si ∈ Si ,
vale:
ui (ŝi , s−i ) > ui (si , s−i ), para todo s−i ∈ S−i .
Logo, uma estratégia ŝi é estritamente dominante para o jogador i se ela for a única estratégia
que maximiza o payoff desse jogador, quaisquer que sejam as estratégias escolhidas pelos outros
jogadores.
Para o jogo dilema dos prisioneiros, é fácil verificar que Confessar é uma estratégia estritamente
dominante para os dois prisioneiros. Ela é a estratégia que gera o maior payoff para cada prisioneiro,
qualquer que seja a escolha do outro prisioneiro. Dizemos que (C, C) é um equilı́brio em estratégias
estritamamente dominantes.
Observe que o equilı́brio (C, C) é Pareto dominado pelo conjunto de estratégias (N C, N C), ou
seja, cada jogador obtém um payoff maior em (N C, N C) do que em (C, C). Temos, então, um caso
onde o comportamento individual maximizador dos agentes envolvidos resulta em um equilı́brio
Pareto ineficiente. Logo, na presença de interdependência estratégica, a interação de jogadores
cujo objetivo é maximizar o seu próprio bem-estar pode levar a situações Pareto-ineficientes.
Estratégias estritamente dominantes não são comuns. É comum situações onde não existem
estratégias dominantes para nenhum dos jogadores, como o Exemplo 5 a seguir ilustra.
Exemplo 5: Observe que o jogo a seguir não possui nenhuma estratégia estritamente dominante:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
D 4, 3 3, 2 6, 5

Apesar de estratégias estritamente dominantes serem raras, podemos usar um conceito similar,
de estratégia estritamente dominada, para eliminarmos estratégias que nunca devem ser escolhidas
por qualquer jogador.
Definição: Estratégia Estritamente Dominada. Uma estratégia s̄i é estritamente (ou forte-
mente) dominada para o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que:
ui (ŝi , s−i ) > u1 (s̄i , s−i ), para todo s−i ∈ S−i .
Dizemos que ŝi domina estritamente s̄i .
Observe que uma estratégia estritamente dominante domina estritamente todas as outras es-
tratégias do jogador. Logo, todas as outras estratégias são estritamente dominadas pela estratégia
estritamente dominante.
Vamos analisar o jogo descrito no Exemplo 5 acima, dado por:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
D 4, 3 3, 2 6, 5
Para o jogador 1, a estratégia D é estritamente dominada pela estratégia U . Essa é a única

estratégia estritamente dominada no jogo acima para qualquer um dos dois jogadores. Se elimin-
armos essa estratégia do jogo, usando o argumento de que o jogador 1 nunca a escolherá, já que
U traz um payoff sempre maior do que D, para qualquer que seja a escolha do seu rival, obtemos
então o seguinte jogo reduzido:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
Para esse jogo reduzido, a estratégia M domina estritamente R, para o jogador 2. Eliminando
a estratégia R, obtemos:
1↓ / 2 → L M
U 5, 2 4, 3
C 1, 4 3, 2
Já para este novo jogo reduzido, a estratégia U domina estritamente C, para o jogador 1.
Eliminando C, obtemos:
1↓ / 2 → L M
U 5, 2 4, 3

Finalmente, a estratégia L é estritamente dominada por M , para o jogador 2, neste último

subjogo. Por meio desse “procedimento de eliminação de estratégias estritamente dominadas
(PEEED)”, obtivemos (U, M ) (isto é, o jogador 1 escolhe U , o jogador 2 escolhe M ) como solução
do jogo. Dizemos que (U, M ) é um equilı́brio obtido pela eliminação de estratégias estritamente
dominadas (e que U e M são estratégias que sobrevivem ao PEEED).
A ideia do procedimento é, portanto, simples. Ele usa implicitamente a hipótese de conhecimento
comum da racionalidade e da estrutura do jogo para todos os jogadores, pois, para encontrarmos
a solução (U, M ), supomos implicitamente que o jogador 2 sabe que o jogador 1 é racional e nunca
jogará a estratégia D. Como o jogador 1 sabe que o jogador 2 é racional e também que 2 sabe que
ele é racional e nunca jogará D, então o jogador 1 infere que 2 nunca jogará R. A continuação
desse raciocı́nio permite concluir que (U, M ) é a solução do jogo.
O problema com o PEEED é que ele também nem sempre leva a alguma solução. No Exemplo
5 abaixo, não existe nenhuma estratégia estritamente dominada e, portanto, não conseguimos
eliminar nenhuma estratégia do jogo usando o PEEED. Logo, não conseguimos fazer qualquer
predição mais acurada sobre qual deve ser o resultado deste jogo usando este procedimento (ou,
pelo menos, o que não pode ser resultado).
Exemplo 6: Considere o jogo:
1↓ / 2 → L R
U 1, 1 0, 0
D 0, 0 0, 0
Para esse jogo, não existem nem estratégias estritamente dominantes nem estratégias estrita-
mente dominadas.
Podemos enfraquecer as definições de dominância estrita, relaxando a exigência de que o payoff
seja sempre estritamente maior nas definições acima, de modo a obter o seguinte conceito.
Definição: Estratégia Fracamente Dominante. Uma estratégia ŝi ∈ Si é fracamente domi-

nante para o jogador i se para toda estratégia si 6= ŝi , si ∈ Si , valer que:
ui (ŝi , s−i ) ≥ ui (si , s−i ), para todo si ∈ Si ,
com desigualdade estrita para pelo menos um s−i .
Evidentemente, toda estratégia estritamente dominante é fracamente dominante, mas a volta

não vale: no Exemplo 6 acima, as estratégias U de 1 e L de 2 são fracamente dominantes, mas
não estritamente dominantes, já que para o jogador 1, quando 2 escolhe L, escolher U dá payoff
estritamente maior do que escolher D. Porém se 2 escolhe R, então o payoff para 1 ao escolher
U é igual (e não maior) ao payoff que ele obtém se escolher D. Note que raciocı́nio similar vale
para o jogador 2, com relação a sua estratégia L. Dizemos que (U, L) é um equilı́brio formado por
estratégias fracamente dominantes.
Problema similar ao que ocorre com a noção de estratégias estritamente dominantes ocorre com
o conceito de estratégias fracamente dominantes: pode ser que não exista solução para o jogo em
estratégias fracamente dominantes, como o Exemplo 6 ilustra.

Exemplo 7: Considere o seguinte jogo:
E D
C (2, 1) (3, 0)
M (4, 0) (2, 1)
B (4, 4) (3, 4)
É fácil observar que não existe estratégia fracamente dominante para ambos os jogadores (apenas
B é fracamente dominante para o jogador 1). Vamos introduzir o seguinte conceito para analisar
o jogo acima, um relaxamento da noção de estratégia estritamente dominada.
Definição: Estratégia Fracamente Dominada. Uma estratégia s̄i é fracamente dominada para
o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que:
ui (ŝi , s−i ) ≥ ui (s̄i , s−i ), para todo s−i ∈ S−i ,
com desigualdade estrita para pelo menos um s−i . Dizemos então que ŝi domina fracamente s̄i .
Vamos aplicar um procedimento de eliminação de estratégias fracamente dominadas (PEEFD)

ao jogo do exemplo 7 acima. Podemos fazê-lo de três modos distintos:
1. Se eliminarmos C e M simultaneamente para o jogador 1, obtemos que E e D dão o mesmo

payoff para o jogador 2 e não podemos eliminar nenhuma dessas estratégias. Sobram então
(B, E) e (B, D) como possı́veis resultados do jogo.
2. Se eliminarmos primeiro C para o jogador 1, a estratégia E do jogador 2 se torna fracamente

dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo resultante,
obtendo (B, D) (payoff (3,4)) como solução.
3. Se eliminarmos primeiro M para o jogador 1, a estratégia D do jogador 2 se torna fracamente

dominada para o jogo resultante. Eliminando D, podemos eliminar C no jogo resultante,
obtendo (B, E) (payoff (4,4)) como solução.
Portanto, a ordem de eliminação das estratégias fracamente dominadas pode afetar a solução
obtida. Esta é uma caracterı́stica ruim deste procedimento, pois a solução do jogo pode mudar
conforme a ordem de eliminação das estratégias. Este problema não ocorre quando eliminamos
estratégias estritamente dominadas.
O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jo-
gadores e da estrutura do jogo. Porém, esses procedimentos não esgotam toda a força dessa
hipótese. Usando a hipótese de conhecimento comum, podemos eliminar outras estratégias além
das dominadas.
Definição: Melhor Resposta. A estratégia ŝi é a melhor resposta do jogador i à estratégia ŝ−i
dos outros jogadores se:
ui (ŝi , ŝ−i ) ≥ ui (si , ŝ−i ), para todo si ∈ Si .

Portanto, a estratégia ŝi é a melhor resposta do jogador i para a estratégia ŝ−i dos outros jo-
gadores se ela for a ou uma das escolhas ótimas de i quando ele acreditar que os outros jogadores
irão selecionar a estratégia ŝ−i . Um jogador não deve escolher uma estratégia que nunca é uma
melhor resposta, pois neste caso não existe justificativa para o uso dessa estratégia. Observe que
estratégias estritamente dominadas nunca são a melhor resposta. Podemos montar um procedi-
mento de eliminação de estratégias que nunca são a melhor resposta, de modo similar ao PEEED.
Para justificar o uso deste procedimento, devemos mais uma vez supor a validade da hipótese de
conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.
Definição: Estratégias Racionalizáveis. As estratégias em Si do jogador i que sobrevivem

ao procedimento de eliminação de estratégias que nunca são a melhor resposta são chamadas
racionalizáveis.
Uma estratégia racionalizável pode sempre ser “justificada”, ou seja, o jogador pode justificar a
escolha dessa estratégia com uma conjectura razoável sobre o comportamento dos outros jogadores
(nenhum rival escolherá uma estratégia não racionalizável).
É possı́vel mostrar que as seguintes afirmações são verdadeiras:
• A ordem de remoção das estratégias que nunca são a melhor resposta não altera o resultado
obtido;
• Cada jogador tem pelo menos uma estratégia racionalizável, podendo ter mais de uma;
• O conjunto de estratégias racionalizáveis está contido no conjunto de estratégias que sobre-

vivem ao PEEED;
• Para jogos com dois jogadores, o conjunto de estratégias racionalizáveis é igual ao conjunto
de estratégias que sobrevivem ao PEEED.
Porém, o conceito de estratégia racionalizável nem sempre fornece uma solução. Para o Exemplo
3, a batalha dos sexos, todas as estratégias são racionalizáveis e, portanto, o conceito não informa
nada sobre o que esperar como solução deste jogo. Queremos tornar as predições sobre o resultado
de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir
veremos o conceito de equilı́brio de Nash (EN), que, satisfeitas certas condições, sempre aponta pelo
menos uma solução para qualquer jogo na forma estratégica. Esse é o mais importante conceito
em teoria dos jogos.

2.3 Equilı́brio de Nash
O máximo que podemos desenvolver usando apenas a hipótese de conhecimento comum é o

conceito de estratégias racionalizáveis, visto acima. Para obtermos qualquer outro conceito mais
robusto, temos que adicionar alguma hipótese nova.
Definição: Equilı́brio de Nash em Estratégias Puras. Um conjunto de estratégias s∗ =

(s∗1 , . . . , s∗I ) é um equilı́brio de Nash (EN) (em estratégias puras) para um determinado jogo se para
todo jogador i, i = 1, . . . , I, valer que:
ui (s∗i , s∗−i ) ≥ ui (si , s∗−i ), para todo si ∈ Si .
Dizemos que um EN é estrito se as desigualdades acima forem estritas. Logo, em um EN estrito,

não existe, para nenhum dos jogadores, nenhuma outra estratégia diferente da de equilı́brio que
resulte em um payoff igual ao de equilı́brio, dado que os outros jogadores estão selecionando as suas
estratégias de equilı́brio.
Em um equilı́brio de Nash, a estratégia de cada jogador é a melhor resposta para as estratégias
que são de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os jogadores estejam
corretos sobre suas conjecturas a respeito das estratégias escolhidas pelos seus rivais. Dizemos que
os jogadores possuem expectativas mutualmente corretas.
O conceito de EN traz uma predição mais precisa a respeito do resultado de um jogo do que
o conceito de racionabilidade. No Exemplo 3 acima, batalha dos sexos, todas as estratégias são
racionalizáveis, mas apenas (F, F ) e (C, C) são EN em estratégias puras. Vamos mostrar que (F, F )
é um EN estrito. Se 1 escolher F , então 2 maximiza o seu payoff escolhendo F (e se escolhesse C
obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 2 para a escolha
de F feita por 1. De modo similar, se 2 escolher F , então 1 maximiza o seu payoff escolhendo F (e
se escolhesse C obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 1
para a escolha de F feita por 2. Isso mostra que (F, F ) é um EN estrito.
Usando um argumento similar, não é difı́cil observar que o jogo “Cara ou Coroa”, discutido no
Exemplo 1 acima, não possui EN em estratégias puras. De modo geral, não podemos garantir a
existência de EN em estratégias puras. Intuitivamente, qualquer solução do jogo “Cara ou Coroa”
envolve ambos os jogadores escolhendo suas estratégias de modo imprevisı́vel. Para formalizar essa
possibilidade de randomização, vamos introduzir o conceito de estratégias mistas.
Definição: Estratégias Mistas. Seja Si o conjunto de estratégias puras do jogador i. Uma

estratégia mista do jogador i é uma distribuição de probabilidade sobre Si , ou seja, uma função
σi : Si → [0, 1], que atribui uma probabilidade a cada estratégia pura do jogador i. Logo, temos
que: X
0 ≤ σi (si ) ≤ 1 , ∀si e σi (si ) = 1 .
si ∈Si
O simplex de Si , representado por ∆Si , é o conjunto das estratégias mistas do jogador i. Este
conjunto inclui também as estratégias puras do jogador (estratégias mistas degeneradas), já que se
σ(s̄i ) = 1 para alguma estratégia s̄i , então isso significa que s̄i é escolhida com probabilidade 1.

Se os jogadores randomizarem suas estratégias, então o resultado do jogo deixará de ser de-
terminı́stico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja
σ = (σ1 , σ2 ) uma coleção de estratégias mistas para os jogadores 1 e 2. A utilidade esperada
do jogador 1 (similar para 2) para o conjunto de estratégias mistas σ é calculada como:
X
u1 (σ1 , σ2 ) = [σ1 (s1 ) × σ2 (s2 )] × u1 (s1 , s2 )
s1 ∈S1 ,s2 ∈S2
Considere o jogo Cara e Coroa descrito no Exemplo 1 e as estratégias mistas σ1 = (1/4◦Ca, 3/4◦
Co) e σ2 = (2/3 ◦ Ca, 1/3 ◦ Co) para os jogadores 1 e 2, respectivamente. A utilidade esperada do
jogador 1 quando ele escolhe a estratégia σ1 e o jogador 2 escolhe a estratégia σ2 é:
X
u1 (σ1 , σ2 ) = σ1 (s1 ) × σ2 (s2 ) × u1 (s1 , s2 )
s1 ∈S1 ,s2 ∈S2
= σ1 (Ca) × σ2 (Ca) × u1 (Ca, Ca) + σ1 (Ca) × σ2 (Co) × u1 (Ca, Co)+

+ σ1 (Co) × σ2 (Ca) × u1 (Co, Ca) + σ1 (Co) × σ2 (Co) × u1 (Co, Co)
1 2 1 1 3 2 3 1 1
= × × (−1) + × × (+1) + × × (+1) + × × (−1) =
4 3 4 3 4 3 4 3 6
Podemos estender imediatamente os conceitos de estratégias dominantes e dominadas, proced-

imentos de eliminação e estratégias racionalizáveis, ao permitir que os jogadores possam escolher
estratégias mistas, além de estratégias puras.
Definição: Equilı́brio de Nash. Um conjunto de estratégias σ ∗ = (σ1∗ , . . . , σI∗ ) é um equilı́brio

de Nash para um jogo na forma normal se para todo jogador i, i = 1, . . . , I, valer que:
ui (σi∗ , σ−i
∗ ∗
) ≥ u1 (σi , σ−i ), para todo σi ∈ ∆Si .
A definição acima de EN permite que os jogadores randomizem entre as estratégias puras. Logo,
eles podem não somente escolher uma estratégia pura, mas também escolher uma estratégia que
envolva várias estratégias puras, cada uma escolhida com determinada probabilidade. Observe que,
em equilı́brio, a hipótese de expectativas mutualmente corretas implica que cada jogador conhece
o modo em que os outros jogadores estão randomizando (as estratégias mistas escolhidas por seus
rivais).
Pela definição de EN com estratégias mistas, para cada conjunto de estratégias dos jogadores
candidato a equilı́brio, devemos verificar se para cada jogador, a sua estratégia é de fato a melhor
resposta para as estratégias dos outros jogadores que fazem parte do conjunto de estratégias can-
didatas a equilı́brio. Considerando que existem infinitas estratégias mistas, este procedimento de
cerificação para determinar EN é inviável. Como fazemos então para encontrar todos os equilı́brios
de Nash? O teorema abaixo fornece uma resposta.
Teorema: Equivalência de Definições. As seguintes afirmativas são equivalentes:

1. (σ1∗ , σ2∗ ) ∈ ∆(S1 ) × ∆(S2 ) é um equilı́brio de Nash;
2. Para todo jogador i, ui (σ1∗ , σ2∗ ) = ui (si , σ−i
∗
), para todo si jogado com probabilidade positiva;
∗ ∗ ∗
e ui (σ1 , σ2 ) ≥ ui (si , σ−i ), para todo si que não é jogado com probabilidade positiva.

O teorema fornece um algoritmo para encontrar equilı́brios de Nash em estratégias mistas.

Ele diz que em um EN em estratégias mistas, duas estratégias puras de um jogador que podem
ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff
para esse jogador, que será igual ao payoff obtido no equilı́brio. Esse resultado é consequência de
utilizarmos a utilidade esperada para calcularmos o payoff de um conjunto de estratégias mistas.
Caso existissem duas estratégias puras que o jogador escolhesse com probabilidade positiva e em que
uma delas gerasse um payoff maior do que o da outra, o jogador não deveria atribuir probabilidade
positiva à estratégia que lhe dá o payoff mais baixo, pois isso reduziria o seu payoff de equilı́brio.
Ou seja, dadas as estratégias escolhidas em equilı́brio pelos outros jogadores, esse jogador é
indiferente entre qualquer estratégia pura que ele de fato possa vir a escolher (que tem probabilidade
positiva), e estas estratégias puras lhe dão um payoff igual ou maior do que qualquer outra estratégia
que ele não escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador é
fazer (σ1∗ , σ2∗ ) um equilı́brio.
Vamos usar o teorema acima para calcular o EN para o jogo “Cara ou Coroa” descrito no Exem-
plo 1. Suponha que o jogador 1 decida proceder do seguinte modo: escolhe Ca com probabilidade
α e, portanto, escolhe Co com probabilidade 1 − α. Similarmente, o jogador 2 escolhe Ca com
probabilidade β e, portanto, escolhe Co com probabilidade 1 − β. Vamos representar na matriz
abaixo essa situação.
1↓ / 2 → Cara (β) Coroa (1 − β)

Cara (α) −1, 1 1, −1
Coroa (1 − α) 1, −1 −1, 1
Pelo teorema acima, essas randomizações são um EN se, e somente se:
u1 (Ca, σ2 ) = u1 (Co, σ2 ) e u2 (σ1 , Ca) = u2 (σ1 , Co),
onde σ1 e σ2 representam as estratégias mistas dos jogadores 1 e 2, respectivamente. Portanto:
u1 (Ca, σ2 ) = u1 (Co, σ2 ) ⇒ −1 × β + 1 × (1 − β) = 1 × β − 1 × (1 − β) ⇒ β = 0,5

u2 (σ1 , Ca) = u2 (σ1 , Co) ⇒ 1 × α − 1 × (1 − α) = −1 × α + 1 × (1 − α) ⇒ α = 0,5
Logo, σ1 = (1/2 ◦ Ca; 1/2 ◦ Co) e σ2 = (1/2 ◦ Ca; 1/2 ◦ Co) é um EN em estratégias mistas. Observe
que:
u1 (Ca, σ2 ) = u1 (Co, σ2 ) = u1 (σ1 , σ2 ) = 0

u2 (σ1 , Ca) = u2 (σ1 , Co) = u2 (σ1 , σ2 ) = 0 ,
como esperado pelo teorema.

2.4 Teorema de Existência e Outros Resultados
Teorema de Existência de Equilı́brio de Nash. Todo jogo finito na forma normal possui pelo
menos um equilı́brio de Nash, assumindo que os jogadores possam usar estratégias mistas.
O Teorema de Existência garante que para todo jogo na forma estratégica finito existirá pelo
menos um equilı́brio de Nash (EN). Logo o conceito de EN não é problemático no sentido que para
qualquer jogo finito podemos garantir que existirá uma solução para ele, se usarmos o conceito de
EN como solução para o problema de interdenpedência estratégica modelado no jogo.
A relação entre equilı́brio de Nash e os conceitos de equilı́brio com estratégias dominantes é
descrita pelos seguintes resultados:
1. Se existir equilı́brio em estratégias estritamente dominantes, ele será único e será o único EN
do jogo. O mesmo vale para equilı́brios obtidos com o PEEED: se existir, será único e o único
EN do jogo.
2. Se existir equilı́brio em estratégias fracamente dominantes, então ele será um EN. Neste
caso, pode ocorrer que exista outro EN, formado por estratégias fracamente dominadas. O
Exemplo 6 acima ilustra esse caso, em que (D, R) é um EN formado por estratégias fracamente
dominadas.
3. Vimos no Exemplo 5 acima que o PEEFD pode levar a diferentes resultados, dependendo da
ordem de eliminação adotada. De qualquer modo, se o PEEFD levar a algum resultado, ele
será um EN.
Exemplo 6 revisto: Considere novamente o seguinte jogo visto no Exemplo 6:
1↓ / 2 → L R
U 1, 1 0, 0
D 0, 0 0, 0
Esse jogo possui dois EN, dados por (U, L) e (D, R). Não existe equilı́brio em estratégias
estritamente mistas. O EN (U, L) é também equilı́brio em estratégias fracamente dominantes (e
pode ser obtido usando o PEEFD). O EN (D, R) é um equilı́brio formado por estratégias fracamente
dominadas e portanto não pode ser encontrado usando o PEEFD.
O Exemplo 6 acima mostra que podem existir equilı́brios de Nash formados por estratégias
fracamente dominadas. O resultado de um jogo ser desse tipo é algo estranho, pois envolve cada
jogador escolher uma estratégia para a qual existe outra opção que dará sempre um payoff maior
ou igual, independentemente do que os outros jogadores façam. Existe um refinamento do EN para
jogos na forma normal, chamado refinamento da mão-trêmula (Selten, 1975; Myerson, 1978), que
exclui a possibilidade desse tipo de equilı́brio ocorrer. O refinamento da mão-trêmula considera a
possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estratégia a
ser jogada. O EN então será chamado perfeito da mão-trêmula caso satisfaça a condição imposta
pelo refinamento. No exemplo acima, apenas o EN (U, L) é perfeito da mão-trêmula.
Refinamentos do conceito de EN são direcionados para eliminar EN que por algum motivo não
são considerados razoáveis. Nesse caso, existirá algum ou alguns EN que satisfazem o refinamento
e algum ou alguns que não o satisfazem.

3 Jogos na Forma Extensiva

3.1 Introdução
Sabemos que para descrevermos um jogo são necessários três objetos: 1) os jogadores; 2) a regra
do jogo; e 3) o resultado (payoffs) do jogo. Um jogo na forma extensiva é a representação mais
adequada para situações dinâmicas.
Definição Informal de Jogo na Forma Extensiva. Representamos um jogo finito na forma

extensiva (ou forma sequencial ) em forma de árvore, onde em cada conjunto de informação um
jogador escolhe uma ação que desenvolve o jogo. Todo jogo na forma extensiva satisfaz as seguintes
propriedades:
• Se inicia em um único nó de decisão, chamado nó inicial. Logo, todo nó do jogo que não é o
nó inicial é um sucessor deste nó, no sentido que podemos descrever qualquer nó a partir do
nó inicial mais uma série de ações tomadas (a história ocorrida do jogo até aquele nó);
• Todo nó do jogo, com exceção do nó inicial (que não possui nenhum predecessor), tem um
único nó predecessor imediato;
• Nos nós finais do jogo, nenhum jogador faz qualquer escolha (nenhuma ação pode ser tomada)
e nestes nós são especificados os payoffs do jogo para a forma de como o jogo foi jogado,
descrita pela história do jogo narrada pelo nó final considerado.
Definição: Jogo de Informação Perfeita. Um jogo é chamado de informação perfeita se cada

jogador observa perfeitamente todas as ações escolhidas por todos os jogadores que se moveram
antes dele.
Em um jogo de informação perfeita, cada nó de decisão constitui um conjunto de informação

por si só, já que todos os jogadores observam todas as decisões tomadas anteriormente a qualquer
momento que for jogar. Se um jogo não for de informação perfeita, então existe pelo menos um
ponto do jogo em que algum jogador não sabe o que foi escolhido no momento anterior. Neste caso,
unimos os nós que fazem parte de um mesmo conjunto de informação por um retângulo pontilhado,
como ilustra o jogo à direita na figura abaixo, indicando que existe (pelo menos) um conjunto de
informação que contém mais de um nó de decisão de um jogador, o que significa que este jogador
não sabe exatamente em que nó está do conjunto de informação (ou seja, ele não observa a tomada
de decisão feita no nó predessor imediato).
Jogo de Informação Perfeita Jogo de Informação Imperfeita

1t 1t
@ @
E @
@D E @
@D
@ @
2 t @t 2 t 2 @t
A A A A
l AA r l AA r l AA r l AA r
A A A A
t At t At t At t At
1 0 0 3 1 0 0 3
3 0 0 1 3 0 0 1

No jogo à esquerda da figura acima, o jogador 2 observa se 1 escolhe E ou D, ou seja, cada nó
de decisão de 2 forma um conjunto de informação por si só. Já no jogo à direita da figura acima, o
jogador 2 não observa se 1 escolhe E ou D, ou seja, os dois nós de decisão de 2 formam um único
conjunto de informação.
Evidentemente, os nós de decisão que pertencem a um mesmo conjunto de informação devem
ser todos referentes ao mesmo jogador. Além disso, as ações que o jogador pode tomar em nós de
decisão que estão no mesmo conjunto de informação devem ser iguais. Caso isso não ocorresse e
existissem dois nós de decisão no mesmo conjunto de informação, com ações não exatamente iguais,
então o jogador seria capaz de inferir em que nó está, ao realizar que as ações disponı́veis naquele nó
são diferentes das ações do outro nó. Portanto, nós de decisão que pertencem a um mesmo conjunto
de informação pertencem ao mesmo jogador e possuem exatamente as mesmas ações disponı́veis.
Definição: Jogo de Memória Perfeita. Um jogo é de memória perfeita quando nenhum jogador
esquece o que já sabia (inclusive ações que já foram tomadas durante o desenrolar do jogo).
A árvore de jogo ilustrada na figura abaixo não apresenta memória perfeita. Neste exemplo, o
jogador 1, na terceira rodada, após a sua escolha na primeira rodada e após a escolha do jogador
2 na segunda rodada, não se lembra de sua própria escolha feita na primeira rodada.
1
t
HH
HH
E H D
HH
H
HH
t
jt
@ 2 H
@
@ @
a @b a @b
@ @
t Rt
@ t Rt
@
A
@
A 1 A
@
A
A A A A
l A r l A r l A r l A r
A A A A

AA
U
AAU AAU AAU
Finalmente, existe uma outra definição, jogo de informação completa, que se refere a jogos
em que os jogadores conhecem exatamente toda a estrutura do jogo, podendo ocorrer apenas que
não observem alguma tomada de decisão (ou seja, um jogo de informação completa pode ser de
informação imperfeita). Já em um jogo de informação incompleta, os jogadores podem não conhecer
alguma informação relevante sobre o tipo dos seus rivais, tais como as preferências, as estratégias
ou os payoffs dos outros jogadores. Um exemplo clássico de jogos de informação incompleta refere-
se a leilões. Em um leilão, cada participante não sabe qual é a valoração exata que os outros
participantes atribuem ao objeto leiloado.

3.2 Relação entre Forma Extensiva e Forma Normal
Um jogo representado na forma normal pode ser representado na forma extensiva sem am-
biguidades? O contrário também é válido? Da forma extensiva para a forma normal sim, mas
o contrário não é válido. A mesma forma normal pode representar mais de um jogo na forma
extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representação na
forma normal, que se resume a representação de um jogo do tipo “Cara ou Coroa” discutido no
Exemplo 1. Nos dois jogos descritos na figura a seguir, o payoff na primeira linha é do jogador 1 e
na segunda linha, do jogador 2.
Jogador 1 escolhe primeiro Jogador 2 escolhe primeiro

1t 2t
@ @
Ca @ Co
@
Ca @
@ Co
@ @
t 2 @t t 1 @t
A A A A
Ca A
A Co Ca A
A Co Ca A
A Co Ca A
A Co
A A A A
t At t At t At t At
−1 1 1 −1 −1 1 1 −1
1 −1 −1 1 1 −1 −1 1
A forma normal é uma estrutura mais simples do que a forma extensiva. Ela envolve menos
objetos matemáticos do que a forma extensiva, porque a estratégia do jogador pode condensar
uma quantidade enorme de informação sobre a tomada de decisão do jogador. Logo, encontrar a
representação na forma normal do jogo analisado pode tornar mais fácil a determinação dos EN
de um jogo na forma sequencial. Para isso, temos que tornar claro em que consiste uma estratégia
para um jogo na forma extensiva.
A definição de estratégia para jogos simultâneos é simples e direta. No caso de jogos sequenciais,
a definição de estratégia é mais elaborada, já que nesses jogos, um determinado jogador pode ter
vários momentos de escolha de ações ao longo do jogo. Por exemplo, em xadrez, as jogadas dos
dois jogadores se alternam ao longo da partida.
Uma estratégia de um jogador para jogos sequenciais é uma regra que determina a escolha de
ação em todos os conjuntos de informação desse jogador no jogo. Logo, uma estratégia para o
jogador i é um plano contingente completo: uma regra de decisão que especifica como o jogador i
jogará em toda e qualquer circunstância do jogo em que ele possa vir a jogar. Isso significa que uma
estratégia define ações para todos os conjuntos de informação do jogo, mesmo que esses conjuntos
de informação não sejam alcançados durante o jogo.

Exemplo 8. Suponha o seguinte jogo sequencial:
1t
@
@
E @D
@
2 t @t 2
@
A A
A A
l A r f A g
A A
AA
AA

6 10 0 14
4 10 0 8
Como o jogador 1 só possui um conjunto de informação, dado pelo nó de decisão inicial, onde
as ações disponı́veis são E e D, então 1 possui apenas duas estratégias: E e D. Já o jogador 2
possui dois conjuntos de informação distintos: 1) o nó de decisão alcançado quando 1 escolhe E, que
vamos denotar por x1 , e onde 2 pode escolher as ações l ou r; e 2) o nó de decisão alcançado quando
1 escolhe D, que vamos denotar por x2 , e onde 2 pode escolher as ações f ou g. Portanto, uma
estratégia para o jogador 2 pode ser descrita como (l em x1 , g em x2 ), ou de modo mais simples,
(l, g). Essa estratégia significa que o jogador 2 escolhe l em x1 e g em x2 . Fica claro então que
uma estratégia define ações em todos os pontos do jogo. Isto pode parecer desnecessário à primeira
vista, mas para computarmos os EN, é importante que a estratégia seja completa nesse sentido.
Portanto, o conjunto das estratégias do jogador 2 é formado por (l, f ), (l, g), (r, f ), (r, g). Logo,
o jogador 2 possui 22 = 4 estratégias (2 é o número de ações em cada conjunto de informação, e 2
também é o número de conjuntos de informação do jogador 2).
Para determinarmos todos os equilı́brios de Nash em estratégias puras de um jogo na forma
sequencial, o ideal é encontramos a representação do jogo na forma normal. O primeiro passo para
isso é encontrar as estratégias de cada jogador.
No Exemplo 8 acima, vimos que o jogador 2 possui 4 estratégias e o jogador 1 possui 2 es-
tratégias. Obtemos então a seguinte matriz de dimensão 2 por 4 para a representação desse jogo
na forma normal:
1↓ / 2 → (l, f ) (l, g) (r, f ) (r, g)

E 6, 4 6, 4 10, 10 10, 10
D 0, 0 14, 8 0, 0 14, 8
Preenchemos os payoffs na matriz usando a representação em forma de árvore do jogo. Por

exemplo, se 2 escolheu E e 2 escolheu (l, f ), então o payoff resultante será (6, 4). Já se 1 escolher
D e 2 escolher (l, f ), então percebemos que a ação importante definida na estratégia de 2 quando
1 escolhe D é a segunda, no caso, f . Neste caso, obtemos o payoff (0, 0).
Uma vez obtida a representação na forma normal do jogo, é fácil obter os EN em estratégias
puras do jogo, que são três: (E; (r, f )), (D, (l, g)) e (D, (r, g)).

Veremos agora que alguns tipos de jogos possuem uma dinâmica de ações escolhidas em tempos
diferentes de tal modo que representá-los na forma normal e daı́ encontrarmos os EN pode não ser
adequado, no sentido de que alguns destes EN não constituem solução razoável para a interação
estratégica modelada. Mais especificamente, quando derivamos a forma normal associada a um
jogo sequencial e encontrarmos os EN do jogo, alguns destes equilı́brios podem não ser crı́veis, ou
seja, baseados em ameaças de um dos jogadores que não será cumprida caso tivesse que de fato ser
levada a cabo. O exemplo a seguir ilustra esse problema.
Exemplo 9: Monopolista e Firma Entrante. Considere um mercado monopolista. O mo-

nopolista mantém o mercado ameaçando firmas entrantes de uma guerra de preços. Desse modo,
o monopólio mantém seu lucro. Porém, se alguma firma de fato entrar neste mercado, a melhor
estratégia para o monopolista é formar um cartel e dividir o lucro de monopólio, já que a guerra de
preços traria prejuı́zos não somente para a firma entrante, mas também para o incumbente. Essa
situação estratégica é representada pelo seguinte jogo na forma extensiva.
Entrante
t
@
Não Entra @ Entra
@
@
Rt Monopolista
@
@

0 @
@
20 Briga @ Acomoda
@
@R
@

−5 10
−5 10
A representação na forma normal do jogo sequencial acima é:
Entrante/Monopolista Briga, se E entrar Acomoda, se E entrar

Não entra 0,20 0,20
Entra -5,-5 10,10
Existem dois EN em estratégias puras para o jogo:

1. firma entrante (E) Entra; monopolista (M ) Acomoda, se E entrar, e
2. firma entrante Não entra; monopolista Briga se E entrar.
O segundo EN é baseado em uma ameaça vazia, não-crı́vel : M faz uma ameaça, que se for
levada a sério, não precisará ser cumprida, pois nesse caso E terá escolhido não entrar. Porém, se
E decidir entrar no mercado, o melhor para M será se acomodar. O refinamento de perfeição em
subjogos, que veremos a seguir, tenta eliminar EN baseados em ameaças não crı́veis, por não serem
uma solução razoável para a interação estratégica modelada.
A noção de Equilı́brio de Nash Perfeito em Subjogos (ENPS) é desenvolvida tanto para jogos
sequenciais de informação perfeita quanto de informação imperfeita.

3.3 Equilı́brio de Nash Perfeito em Subjogos (ENPS)
Jogos de Informação Perfeita
Vamos analisar jogos de informação perfeita primeiro. O objetivo é desenvolver um conceito de

equilı́brio que elimine equilı́brios baseados em estratégias não-crı́veis, como no Exemplo 8 acima,
onde o ideal seria obter (Entra, Ac se E entrou) como única solução da interação estratégica
descrita. Portanto, queremos refinar o conceito de EN de modo que as soluções do jogo ainda
sejam EN, mas eliminando os EN baseados em estratégias que envolvam ameaças não-crı́veis. O
Princı́pio da Racionalidade Sequencial (PRS), que exige que a estratégia de um jogador
qualquer deve especificar ações que são ótimas em cada ponto do jogo, é fundamental para obtermos
esse refinamento.
Esse princı́pio é implementado em um jogo de informação perfeita pelo seguinte Algoritmo de
Indução Reversa (“backward induction algorithm”):
1. Comece pelos nós de decisão finais da árvore (“nós penúltimos” – nós cujos sucessores são
todos nós terminais);
2. Determine a escolha ótima dos jogadores que jogam nesses nós (problema de maximização
individual, sem interação estratégica);
3. Redesenhe a árvore, substituindo os nós de decisão final por um nó terminal, com payoff
definido pela escolha ótima no passo 2);
4. Repita passos 1), 2) e 3) para esse jogo reduzido, até chegar ao nó inicial do jogo.
A solução de indução reversa para jogos com informação perfeita se resume a que todos os
jogadores façam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na prática,
o jogo é resolvido do fim para o começo. O conjunto de estratégias puras s = (s1 , s2 , . . . , sI ) é um
conjunto de estratégias de indução reversa para um jogo na forma extensiva se tiver sido obtido de
acordo com o algoritmo de indução reversa. É possı́vel mostrar que todo conjunto de estratégias
de indução reversa é um EN do jogo.
Resultado: Existência de Equilı́brio. Todo jogo na forma extensiva finito de informação

perfeita tem um EN em estratégias puras, que pode ser encontrado usando indução reversa. Se os
payoffs de cada jogador forem diferentes nos nós terminais, para todos os jogadores, então existirá
um único EN que pode ser encontrado usando indução reversa.
Corolário. Todo jogo finito de informação perfeita tem (pelo menos) um EN em estratégias puras.
Exemplo 8: Monopolista e Firma Entrante (continuação). No jogo Monopolista/Entrante,

existem dois EN em estratégias puras, mas apenas um EN obtido usando o algoritmo de indução
reversa. O algoritmo elimina exatamente o EN baseado na ameaça não-crı́vel do monopolista abrir
uma guerra de preços caso o entrante decida entrar. Esta ameaça não é crı́vel pois uma vez que
a firma entrante entrar no mercado, se o monopolista fizer uma guerra de preços, ele próprio se
prejudicará sem obter nenhum ganho.
Logo, todo conjunto de estratégias obtido usando o algoritmo de indução reversa acima é um
EN do jogo. Mas nem todo EN do jogo pode ser obtido por indução reversa. Os EN que podem
ser obtidos utilizando o algoritmo são chamados EN perfeitos em subjogos (ENPS), ou EN que
satisfazem o critério de perfeição em subjogos.

Jogos de Informação Imperfeita
O algoritmo de indução reversa acima só se aplica para jogos de informação perfeita. Porém
a ideia de racionalidade sequencial pode ser usada também para jogos de informação incompleta,
por meio de um algoritmo similar de indução reversa.
A ideia central é definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser
visto como um jogo por si só. A propriedade de racionalidade sequencial exige que um EN seja EN
para cada subjogo do jogo original.
Definição: Subjogo. Um subjogo de um jogo Γ na forma extensiva é um subconjunto do jogo tal

que:
(i) Se inicia em um conjunto de informação que contém apenas um único nó de decisão, e contém
todos os nós sucessores desse nó inicial;
(ii) Se o nó de decisão y pertence ao subjogo, então todo nó z que pertence ao conjunto de
informação de y também pertence ao subjogo.
Todo jogo possui pelo menos um único subjogo, que seria o próprio jogo. Este é o caso do
exemplo abaixo. Um subjogo estrito de um jogo é um subjogo que está contido de modo estrito no
jogo, ou seja, é diferente (“menor”) que o jogo inteiro.
1
u
@
@
E @ D
@
u @u
@
A
2 A
A A
l A r l A r
A A
u Au u Au
A A

1 0 0 3
3 0 0 1
Definição: ENPS em Estratégias Puras. O conjunto de estratégias s = (s1 , s2 , . . . , sI ) do jogo

Γ é um equilı́brio de Nash perfeito em subjogos (ENPS) se s = (s1 , s2 , . . . , sI ) induz um equilı́brio
de Nash em todo subjogo de Γ.
ENPS é um refinamento de EN: todo ENPS é um EN, já que o próprio jogo é um subjogo seu.
O contrário não é válido: existem EN que não são perfeitos em subjogos.
Teorema. Para todo jogo na forma extensiva finito de informação perfeita, o conjunto de es-
tratégias de indução reversa é igual ao conjunto de ENPS em estratégias puras.
Logo, em jogos de informação perfeita, o conjunto de ENPS coincide com o conjunto de EN

obtido usando o algoritmo de indução reversa visto acima. Porém, considerando jogos de informação
imperfeita, nem todo jogo possui um ENPS em estratégias puras. O teorema a seguir garante a
existência de ENPS para jogos de memória perfeita.

Teorema: Existência de ENPS (Selten). Todo jogo na forma extensiva finito com memória
perfeita possui um ENPS.
A hipótese de memória perfeita é necessária. Existem exemplos de jogos de memória imperfeita

que não possuem ENPS.
O seguinte algoritmo geral de indução reversa para jogos na forma extensiva, sejam de in-
formação completa ou não, é válido para encontrar os ENPS:
1. Comece pelo término da árvore, determine os EN para todos os subjogos finais (subjogos que
não possuem nenhum subjogo estrito);
2. Substitua cada subjogo pelo payoff de um de seus EN;
3. Repita os passos 1) e 2) para o jogo reduzido, continue até não restar nenhum subjogo;
4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um
EN).
Para jogos de informação perfeita, esse algoritmo é igual ao algoritmo anterior.
3.4 Jogos Repetidos
Em um jogo do tipo dilema dos prisioneiros, seria possı́vel obter cooperação se repetı́ssemos o
jogo diversas vezes? Com a repetição, o número de estratégias de cada jogador aumenta. Nesse
caso, é possı́vel criar estratégias em que um jogador puna o seu rival caso ele não coopere.
Vamos então analisar novamente o Dilema dos Prisioneiros (Exemplo 2):
1↓ / 2 → Confessar Não Confessar

Confessar −3, −3 −1, −5
Não Confessar −5, −1 −2, −2
Suponha que o jogador 1 adote a seguinte estratégia: na primeira interação ele joga N C (co-
operar). Nos perı́odos seguintes, se o outro jogador escolheu N C (cooperar) no perı́odo anterior,
ele coopera hoje. Caso contrário, o jogador 1 escolhe C (não cooperar) até o jogo terminar. Essa
estratégia pode levar a algum tipo de cooperação? Mais especificamente, existe algum equilı́brio
tal que os jogadores venham a adotar estratégias cooperativas? Para jogos do tipo dilema
dos prisioneiros repetidos finitas vezes, a resposta é negativa. Para jogos repetidos
indefinidamente ou sem data certa para terminarem, a resposta pode ser positiva.
A noção de ENPS tem como consequência que se o dilema dos prisioneiros for repetido um
número fixo (finito) de vezes, o único equilı́brio de Nash perfeito em subjogos será formado pelo
EN do jogo em cada perı́odo sendo jogado. Logo, não é possı́vel obter o resultado eficiente com a
repetição finita do jogo. Isso implica que qualquer dependência histórica nas estratégias atuais é
eliminada. Ou seja, tudo o que ocorreu antes é irrelevante para decidir o que fazer hoje. Para jogos
que satisfaçam as condições da proposição, um ENPS não depende da história ocorrida no jogo em
nenhum momento.

Por exemplo, uma consequência desse fato é que se o dilema dos prisioneiros for jogado repeti-
damente, por um perı́odo determinado, continua sempre tendo a mesma solução não cooperativa
entre os jogadores, para cada rodada do jogo. Esse resultado segue da hipótese de racionalidade
sequencial. Por indução reversa, na última rodada, é melhor não cooperar. Resolvendo de traz
para diante, obtemos não-cooperação para todas as rodadas do jogo.
Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de término conhecida
pelos jogadores. Resolvendo o jogo por indução reversa, cada jogador percebe que o seu rival
irá descumprir o acordo de cooperação na última vez que interagirem. Eles se adiantam a isso
e não cooperam na última rodada. Sabendo disso, os jogadores também não irão cooperar na
penúltima rodada do jogo. Usando esse argumento, obtemos que os jogadores não cooperam em
nenhuma rodada do jogo. Esse argumento, consequência da definição de ENPS, leva a resultados
considerados pouco razoáveis, como mostra o Exemplo 9 abaixo, em que o único ENPS consiste
nos dois jogadores escolherem P sempre, o que resulta no payoff (1, 1).
Exemplo 9: Jogo da Centopeia. Considere o seguinte jogo.
Is C II C
s
Is C II II
s C . . . . . . . . . . . . .s C
I
s C II
s C (100 100)
P P P P P P P

1 0 2 1 97 99 98
1 3 2 4 100 99 101
Para o jogo da centopeia, o único ENPS consiste em todo jogador escolher P em todo momento
do jogo. Portanto, o payoff de equilı́brio é 1 para cada jogador, e nenhuma cooperação é obtida.
Porém, se o dilema dos prisioneiros for repetido infinitamente (ou se não tiver uma data fixa
para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido
como equilı́brio, dependendo do quanto os jogadores descontem o futuro.
As estratégias que levam a esse tipo de equilı́brio são chamadas estratégias gatilho (trigger
ou Nash-reversion strategies). Um exemplo é a estratégia “olho-por-olho” (tit-for-tat), onde a
estratégia de hoje do jogador é igual à estratégia usada pelo seu adversário ontem.
Considere a seguinte estratégia para o i, i = 1, 2, chamada grim reaper (ou grim trigger ): na
primeira interação ele joga N C (cooperar). Nos perı́odos seguintes, se o outro jogador escolher
N C (cooperar) no perı́odo anterior, ele coopera hoje. Caso contrário, o jogador i escolhe C (não
cooperar) para sempre (note que a estratégia é extremamente punitiva: um desvio do rival e nunca
mais a cooperação pode ser refeita). Suponha que a taxa de desconto intertemporal é 0 < δ < 1.
Temos que o jogador 2 cooperará se:
∞ ∞
X
t
X −2 −3δ
−2δ ≥ −1 + −3δ t ⇒ ≥ −1 +
t=0 t=1
1−δ 1−δ
Logo, se:
1
= 50% , δ≥
2
então o resultado cooperativo ((N C, N C) todo perı́odo) é obtido como equilı́brio (é um equilı́brio
de Nash perfeito em subjogos).

Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do

equilı́brio cooperativo e seguindo o equilı́brio cooperativo, podem existir equilı́brios em que os
jogadores adotem estratégias que envolvem cooperação. Esse resultado é conhecido como “Folk
Theorem”.
Como a taxa de desconto intertemporal δ é determinada pela taxa de juros r do seguinte modo:
1
δ= ,
1+r
então uma vez determinada a taxa de desconto intertemporal, podemos também encontrar a taxa
de juros associada. Para o exemplo acima, temos que r ≥ 1.
Leitura Sugerida
• Varian, capı́tulos 28 (A Teoria dos Jogos) e 29 (Aplicações da Teoria dos Jogos).
• Nicholson e Snyder, capı́tulo 8 (Strategy and Game Theory).

Exercı́cios
1. Determine, justificando sucintamente, para os Exemplos 1 a 7 desta nota de aula:
a) As estratégias estritamente dominantes e as estratégias estritamente dominadas, quando

existirem.
b) As estratégias fracamente dominantes e as estratégias fracamente dominadas, quando
existirem.
c) As estratégias que nunca são melhor resposta e as estratégias racionalizáveis.
d) Considere todo par de estratégias para cada um desses jogos e verifique quais são
equilı́brios de Nash e quais não são, justificando pelo alguns desses pares para fim de
aprendizagem (se você ainda estiver com dificuldades, continue escrevendo a justifica-
tiva, até entender bem a lógica de se determinar um equilı́brio de Nash em estratégias
puras).
e) Determine os equilı́brios de Nash que possuem de fato uma randomização ocorrendo
para os exemplos 3 (problema de coordenação) e 4 (batalha dos sexos).
f) Procure determinar se existe algum EN com randomização para o jogo dilema dos pri-
sioneiros. Quais são os valores para as probabilidades encontradas? O que isso significa?
2. Argumente, de maneira clara e concisa, porque a ordem de eliminação das estratégias não
afeta o resultado do PEEED mas pode afetar o resultado do PEEFD.
3. Vimos a definição de dominância para estratégias puras. Estratégias mistas podem também
dominar estratégias puras ou mesmo outras estratégias mistas. Considere o seguinte jogo e
responda os itens a seguir.
1/2 L M R
U 3,0 0,-3 0,-4
D 2,4 4,5 -1,8
a) Mostre que as estratégias puras L e R não dominam estritamente a estratégia pura M .

b) Mostre que M é estritamente dominada pela estratégia mista em que 2 escolhe L e R
com probabilidades iguais.
4. Calcule os EN dos seguintes jogos e verifique se existe alguma relação desses equilı́brios com
equilı́brios obtidos por meio de algum argumento de dominância:
a)
1/2 L R
U 1,1 0,0
D 0,0 0,0
b)
1/2 L R
U 1,1 0,1
D 1,0 -1,-1

c)
1/2 L l m M
U 1,1 1,2 0,0 0,0
C 1,1 1,1 10,10 -10,-10
D 1,1 -10,-10 10,-10 1,-10
5. Paulo e Rafael querem dividir cem reais e decidem usar o seguinte jogo para isso. Paulo diz
quanto gostaria que Rafael recebesse. Sem observar a escolha de Paulo, Rafael diz quanto
seria uma oferta aceitável. As escolhas podem ser apenas em incrementos de R$ 25 (ou seja,
R$ 0, R$ 25, R$ 50, R$ 75 e R$ 100). Se a oferta de Paulo é igual ou maior do que o que Rafael
acha aceitável, então eles dividem o dinheiro seguindo a oferta de Paulo. Caso contrário, o
dinheiro é jogado fora. A utilidade de cada jogador é dada pelo tanto de dinheiro que ele
recebe.
a) Represente esse jogo na forma normal (ou seja, escreva esse jogo na forma matricial).
b) Quais são o(s) equilı́brio(s) de Nash em estratégias puras desse jogo?
6. Considere o seguinte jogo do tipo dilema dos prisioneiros representado pela matriz abaixo.
D C
D (R$1, R$1) (R$3, R$0)
C (R$0, R$3) (R$2, R$2)
a) Suponha que cada jogador deseja apenas obter o máximo de dinheiro possı́vel. Quais
são os EN desse jogo?
Suponha agora que os dois jogadores são altruı́stas, ou seja, cada um deles se importa com o
bem-estar do rival. Em particular, se mi (s1 , s2 ) é o payoff que o jogador i ganha e mj (s1 , s2 )
é o payoff do jogador j, quando a estratégia jogada é (s1 , s2 ), então a utilidade do jogador i
é dada por ui (s1 , s2 ) = mi (s1 , s2 ) + αmj (s1 , s2 ), onde α ≥ 0.
b) Escreva o jogo em forma matricial para α = 1. Qual o EN agora? O jogo continua sendo
do tipo dilema dos prisioneiros?
c) Para quais valores de α o jogo permanece como dilema dos prisioneiros? Para os valores
de α para os quais o jogo não é mais um dilema dos prisioneiros, encontre os EN.
d) Existe algum valor de α para o qual qualquer combinação de estratégias puras será um
equilı́brio?
7. Considere o jogo denotado por G(n, k) de adivinhar a média (“guessing the average”, Osborne
e Rubinstein), onde k é a quantidade de participantes que simultanemente escolhe um número
inteiro entre 1 e n (inclusive 1 e n). Um prêmio de R$60 é dividido igualmente entre os
jogadores que escolheram o número mais perto da metade da média de todas as escolhas (ou
seja, se a metade da média foi 3, e os número mais próximos foram 2 e 4, os participantes
que escolheram esses valores dividem o prêmio. Já se a metade da média foi 3,3, todos os
participantes que escolheram 3 levam o prêmio)
a) Escreva a forma normal do jogo G(3, 2) e ache todos os EN.
b) Argumente que para quaisquer n e k, todo mundo escolhendo 1 é um EN.
c) Argumente que em qualquer EN o prêmio é dividido por todos os participantes.
d) Argumente que o conjunto de estratégias descrito no item b) é o único EN.

8. O exército de Patópolis deve decidir se ataca ou não o exército de Gansópolis, que está
ocupando uma ilha que pertencia à Patópolis, situada entre as duas cidades. No caso de
um ataque, o exército de Gansópolis pode lutar ou recuar de volta à sua cidade, por meio
de uma ponte que liga a ilha à cidade. Cada cidade prefere ocupar a ilha a não ocupá-la, e
uma guerra é o pior resultado possı́vel para ambas as cidades. Modele essa situação como
um jogo na forma extensiva e mostre que o exército de Gansópolis pode melhorar seu payoff
se queimar a ponte que liga a ilha à sua cidade, eliminando a opção de recuar. Explique esse
resultado em termos intuitivos e relacione com o que foi visto em aula.
9. Considere o seguinte jogo na forma extensiva:

2 E 1t
2 @
@
M @D
@
t 2 @t
@
A A
A A
l A r l A r
A A
t AAt t AAt

3 1 0 0
1 0 0 1
a) Escreva o conjunto de estratégias desse jogo e encontre a forma estratégica associada.
b) Encontre os EN em estratégias puras.
c) Encontre os ENPS em estratégias puras.
10. (P4-2/18) Considere o jogo abaixo, em que o payoff na parte superior entre parênteses é do
jogador 1 e o payoff na parte inferior é do jogador 2. Reponda aos itens abaixo.
1 S
2

v -
@ 0
@
E @D
@
@
@
v
@Rv
@
@ 2 @
@ @
l m @r l m r
@ @
@
@ @
? @
R ? @
R
1 1 4 4 0 3
3 2 0 0 2 3
a) Descreva os conjuntos de estratégias dos dois jogadores.

b) Qual a representação desse jogo na forma normal?
c) Existe alguma estratégia dominada (estritamente ou fracamente) para algum dos jo-
gadores?
d) Quais são os equilı́brios de Nash (EN) em estratégias puras desse jogo?
e) Quais são os EN perfeitos em subjogos (em estratégias puras)?

11. (P2-1/19) Considere o seguinte jogo na forma extensiva:
I
rH
HH
L
M HR
HH

r
II jr II
H
? H
H
@ 0 @
2
@ @
a b@ c @ d
@ @

@
@
R @Rr I
@
1 −1 −2 @
1 −1 4
@
P @Q
@
@
@
R
−1 −1
3 5
As ações do jogador I estão representadas por letras maiúsculas e as ações do jogador II por
letras minúsculas. O payoff na parte superior em parênteses é do jogador I e o payoff na parte
inferior é do jogador II.
a) Qual o número de estratégias puras do jogador 1? E do jogador 2?
b) Qual a representação desse jogo na forma normal?
c) Existe alguma estratégia dominada (estritamente ou fracamente) para algum dos jo-
gadores?
d) Quais são os equilı́brios de Nash (EN) em estratégias puras desse jogo?
e) Quais são os EN perfeito em subjogos (em estratégias puras)?
12. (P2-2/18) Considere o jogo na forma extensiva abaixo, em que o payoff descrito na parte de
cima do vetor de payoffs é o da firma entrante e o payoff na parte de baixo desse vetor é o da
firma monopolista.
Entrante
s
@
ñE @E
RsMonopolista
@
@
0 @
ñL @L
60
s Entrante @ Rs
@
A A
PE A GE PE A GE
A A

AU AU
8 15 −3 −12
30 15 0 −6
a) Determine os conjuntos de todas as estratégias para os dois jogadores.

b) Encontre os EN em estratégias puras do jogo.
c) Encontre os ENPS do jogo.
d) Considere o jogo acima, mas agora suponha que a firma Entrante observa se o Mo-
nopolista escolheu ñL ou L. Descreva todas as estratégias que a firma Entrante possui
agora.

13. (P4-1/19) Considere o seguinte jogo na forma extensiva:
Jog. 1
v
@
@
A @ B
@
@
@
Jog. 2 v @vJog. 2
@
A A
A A
A A
F A D D A F
A A
A A
AAv v

Jog. 1
A
A
2 A A 0
A A
0 L A R L A R 1
A A
A A
3 0 3 1
10 1 0 1
onde o payoff na parte superior em parênteses é do jogador 1 e o payoff na parte inferior em

parênteses é do jogador 2.
a) Descreva as estratégias dos jogadores.

b) Derive a forma normal do jogo e encontre todos os equilı́brios de Nash (EN) do jogo em
estratégias puras.
c) Encontre todos os equilı́brios de Nash perfeitos em subjogos (ENPS) em estratégias
puras.

MICROECONOMIA 2
Notas de Aula 5 – Monopólio
1 Monopólio
1.1 Definição
Um monopólio caracteriza-se por uma estrutura de mercado onde existe apenas um produtor
e vendedor do bem ou serviço, que não tem substitutos próximos. Logo, a elasticidade-preço da
demanda desse bem deve ser pequena.
Deve haver alguma razão que justifique a não existência (ou entrada) de potenciais competidores.
Caso contrário, o monopólio não se sustentaria. Logo, deve existir algum impedimento à entrada de
novas firmas na indústria. Esses impedimentos são chamados barreiras à entrada. Alguns exemplos
de barreiras à entrada são:
1. Restrições legais (exemplo: EBCT);
2. Patentes;
3. Controle de recursos ou insumos escassos;
4. Barreiras geradas de forma deliberada pelo monopolista;
5. Custos irrecuperáveis altos (sunk costs, custos enterrados)
Tais barreiras podem manter rivais fora da indústria e assegurar que ela seja monopolı́stica.
Todavia, monopólios podem também ocorrer mesmo na ausência destas barreiras, caso uma única
firma possua vantagens de custo sobre as rivais. Dois exemplos disto são:
1. Economias de escala (monopólio natural),
2. Superioridade técnica.
1.2 Decisão de Oferta do Monopólio
Em uma estrutura de mercado monopolista, não se assume a hipótese concorrencial de que o

vendedor toma o preço como dado. O monopolista sabe que pode influenciar o preço do bem no
mercado, já que é o único vendedor deste bem (price-maker ).
Existem duas variáveis que afetam o lucro do monopolista: a quantidade vendida e o preço de
venda. O monopolista não pode escolher qualquer combinação de preço de venda e quantidade
vendida: as suas escolhas de quantidade e preço estão restritas pela demanda agregada do bem.
O monopolista deseja escolher o nı́vel de produção que maximiza o lucro π = Receita −
Despesa = p(q)q − c(q), onde p(q) denota a função de demanda (inversa) de mercado:
max p(q)q − c(q)
q≥0
José Guilherme de Lara Resende 1 Monopólio

p(q ∗ ) + q ∗ p0 (q ∗ ) = c0 (q ∗ ) (1)
| {z } | {z }
RM g CM g
A RM g do monopolista é tal que:
RM g = p(q ∗ ) + q ∗ p0 (q ∗ ) < p(q ∗ ) ,
pois p0 (q ∗ ) é negativo.
Para cada unidade a mais vendida, o monopolista recebe o preço do bem. Mas para vender mais
uma unidade, o monopolista deve baixar o preço de todas as unidades vendidas (termo q ∗ × p0 (q ∗ )).
Essa é a razão da ineficiência do monopólio. A Figura 1 ilustra essa situação, em que o custo
marginal se iguala à receita marginal do monopolita, mas em que esta última é menor do que o
preço cobrado pelo bem. Como a curva de demanda, que define o preço cobrado, mede a valoração
dos indivı́duos pelo bem, é maior do que o custo marginal de produção de uma unidade a mais do
bem, um mercado monopolista apresenta uma ineficiência econômica.
Custos,
Preços 6
c0 (q)
Q
SQ
S Q
S QQ
S Q
S Q
Q s
p(q ∗ ) S Q
S Q
Q
S Q
S Q
Q
S Q
Q
Ss
S
c0 (q ∗ ) Q
Q
S Q
Q
S Q
S QQ
S p(q)
S RM g(q)
S -
q∗ S Qtde
Figura 1 – Decisão Ótima de um Monopolista
A equação (1) pode ser reescrita como:

q dp(q)
p(q) 1 +
p(q) dq
Sabemos que a elasticidade-preço da demanda, ε(q) = (p/q(p)) × (dq(p)/dp), mede como a sen-
sibilidade da demanda de mercado a uma mudança no preço do bem, em termos percentuais. O
Teorema da Função Inversa implica que 1/ε(q) = (q(p)/p)×(dp(q)/dq). Usando isso e o fato de que

na prática a demanda de um bem é negativamente inclinada, obtemos que a CPO do monopolista

pode ser reescrita como:
∗ 1
p(q ) 1 − = c0 (q ∗ ) .
|ε(q ∗ )|
Como o preço p(q) e custo marginal c0 (q ∗ ) são não-negativos, a igualdade acima implica que:
1
1− >0 ⇒ |ε(q ∗ )| > 1 ,
|ε(q ∗ )|
ou seja, o monopolista escolhe produzir uma quantidade do bem na parte elástica da demanda de
mercado.
Podemos reescrever a CPO em termos da elasticidade-preço da demanda do bem como:
c0 (q ∗ )
p(q ∗ ) = h i = M c0 (q ∗ ) ,
1
1− |ε(q ∗ )|
onde M denota o “markup” cobrado sobre o custo marginal de produção,

1
M=h i >1
1
1− |ε(q ∗ )|
Como o monopolista produz apenas na parte elástica da demanda, o markup é maior que 1. Se
a elasticidade-preço da demanda for constante, o valor do markup é constante, qualquer que seja o
nı́vel de produção. Se c0 (q) = c, para todo q, então p = M c > c.
Rearranjando mais uma vez a CPO de um monopolista em termos da elasticidade-preço da
demanda, obtemos:
p(q ∗ ) − c0 (q ∗ ) 1
∗
=
p(q ) |ε(q ∗ )|
A diferença, em termos percentuais, entre o preço cobrado e o custo marginal, chamado “ı́ndice
de Lerner”, é o inverso do valor absoluto da elasticidade da demanda calculada no ponto ótimo
de produção do monopolista. Logo, quanto menos elástica a demanda nesse ponto, maior essa
diferença percentual.
O lucro do monopolista é obtido substituindo a demanda ótima encontrada resolvendo o prob-
lema de maximização de lucro do monopólio. Logo, o lucro do monopólio é calculado como:
π = p (q ∗ ) × q ∗ − c(q ∗ ) ,
onde q ∗ é a quantidade ótima produzida pelo monopólio, p (q ∗ ) é o preço cobrado por unidade da
quantidade q ∗ produzida e c(q ∗ ) é o custo de produção de q ∗ .
A existência de um peso morto (“deadweight loss” – DWL) – um valor econômico que é dissipado
na economia, caracteriza uma situação de ineficiência econômica. Vimos que o preço cobrado pelo
monopolista é maior do que o custo marginal. Isso leva a uma situação de produção sub-ótima
no mercado: a firma produz menos do que o socialmente desejável. Ao fazer isso, o monopolista
cobra um preço maior do que o preço competitivo e aufere um lucro econômico positivo. Isso leva
à perda econômica descrita, ilustrada na Figura 2 abaixo.

Custos,
Preços 6
Q
SQ
S Q
S QQ
S Q c0 (q)
p(q ∗ ) Qs
S Q

S Q
Q
S Q
S DW LQ
S QQ

c0 (q ∗ ) Ss
S

Q
Q
S Q
Q
S Q
QQ
S
S p(q)
S -
0 q∗ S Qtde
Figura 2 - Peso Morto de um Monopólio
O peso morto gerado por um monopólio é calculado como a área do excedente total (a soma
do excedente do consumidor com o excedente do produtor) dissipado na economia, ou seja, a área
com DWL escrito na Figura 3 acima. Em geral, essa área é calculada como:
Z qcp
DW L = (p(q) − c0 (q))dq ,
qm
onde qm é a quantidade produzida em monopólio e qcp é a quantidade produzida em competição

perfeita. Se a demanda de mercado e a curva de custo marginal forem lineares, então basta calcular
a área de um triângulo, ou seja, basta calcular a altura e a base do triângulo representado na figura
acima.
Resumindo, em um monopólio, temos que:
• Quantidade produzida é menor do que a quantidade socialmente ótima,
• O preço cobrado é maior do que o preço socialmente ótimo,
• Existe uma perda econômica dissipada.
Portanto, o monopólio é uma situação indesejável do ponto de vista social. O preço de monopólio
é superior ao custo marginal na quantidade ótima, logo o monopolista poderia obter lucro na
margem ao produzir mais uma unidade do bem caso ele pudesse cobrar um preço especı́fico por
esta unidade, superior ao seu custo marginal, e este item seria consumido por um consumidor
marginal.
O monopolista ao não fazer isso gera uma ineficiência, pois existem consumidores dispostos a
pagar pelo bem um preço maior que o seu custo de produção, mas, mesmo assim, este bem não é
produzido, pois se o monopolista produzir mais essa unidade, terá que baixar o preço de todas as
outras unidades vendidas.

Exemplo: Demanda Linear e RCE. Suponha que a demanda do bem seja dada por p = a − bq
e a função custo do monopolista seja c(q) = cq, onde c é uma constante, com a > c. O problema
do monopolista nesse caso é:
max (a − bq)q − cq
q≥0
Observe que no caso de demanda linear, em que a receita é R(q) = (a − bq)q, a receita marginal é
RM g(q) = a − 2bq, ou seja, a receita marginal também será linear, duas vezes mais inclinada do
que a curva de demanda. A CPO do problema do monopolista resulta na seguinte solução:
a−c a+c
q∗ = e p=
2b 2
O lucro do monopolista, calculado como π = pq − c(q), será:

a+c a−c a−c (a − c)2
π= × −c× =
2 2b 2b 4b
Portanto, uma condição para que este lucro seja positivo é a de que o parâmetro a da demanda seja
maior do que o custo marginal de produção c. Intuitivamente, se o mercado for muito pequeno em
relação ao custo marginal de produção (a < c), não compensará produzir. Já o peso morto para
este exemplo é:
(a − c)2

1 a−c a−c a+c
DW L = − −c =
2 b 2b 2 8b
1.3 Imposto sobre a Quantidade
O que ocorre em um mercado monopolista quando o governo estabele um imposto sobre a

quantidade? O preço cobrado pelo monopolista aumenta de que modo? Os dois casos analisados
abaixo mostram que, em geral, não podemos dizer se o preço de monopólio irá aumentar por um
valor maior ou menor do que o valor do imposto:
• No caso em que o custo marginal e a elasticidade da demanda são constantes, se o governo
estabelecer um imposto sobre a quantidade no valor de t, temos que o novo preço cobrado
pelo monopolista será:
c+t
p(q ∗ ) = h i
1
1 − |ε|
Logo: −1
∂p(q ∗ )

1
= 1− > 1,
∂t |ε|
ou seja, o preço cobrado pelo monopolista aumenta em uma proporção maior do que o valor
do imposto.
• Suponha agora que o custo marginal é constante e a demanda de mercado é linear. Se o
governo estabelecer um imposto sobre a quantidade, temos que o novo preço cobrado pelo
monopolista será:
a+c+t
p(q ∗ ) =
2
Logo:
∂p(q ∗ ) 1
= < 1,
∂t 2
ou seja, o preço cobrado pelo monopolista aumenta em uma proporção menor do que o valor
do imposto (nesse caso, o preço aumenta a metade do aumento do imposto).

1.4 Monopólio Natural
Um monopólio natural é caracterizado por uma curva de custo médio de longo prazo decrescente
para todos os nı́veis relevantes de produção. Ou seja, a tecnologia da firma apresenta retornos
crescentes de escala. Esta é uma importante falha de mercado observada em setores importantes,
tais como serviços de utilidades públicas.
Custos,
Preços 6
Dilema: apenas uma firma no mercado
minimiza o custo, mas nesse caso a firma
pode cobrar preço de monopólio
CM e
CM g
-
Qtde
Figura 3 – Monopólio Natural
Um monopólio natural permanente tem uma curva de custo médio de longo prazo que cai
continuamente à medida que aumenta a quantidade produzida. Mesmo que a demanda aumente,
ela continua cruzando a curva de custo médio em um trecho descendente. Um monopólio natural
temporário tem curva de custo médio descendente em um primeiro trecho, mas, a partir de certa
quantidade, o custo médio passa a ser constante ou crescente. A partir de uma demanda de certo
tamanho (reta D0 , na figura 4 abaixo), pode já ser possı́vel ter mais de uma firma produzindo e,
portanto, alguma competição no mercado.
Custos,
Preços 6
B B
B B
B B
B B
B B
B B
B B
B B
B B
B B CM e
BB BB
D D0 -
Qtde
Figura 4 – Monopólio Natural Temporário

Inovação tecnológica pode alterar o formato da curva de custo médio, deslocando-a para a
esquerda e fazendo com que atinja seu ponto de mı́nimo a quantidades menores. Logo, à escala
ótima de produção (ou escala eficiente), o ponto de mı́nimo da curva de custo médio total diminui
e passa a ser mais fácil haver competição neste setor.
1.5 Discriminação de Preços
Até agora, estamos supondo que o monopolista vende o bem pelo mesmo preço, qualquer que
seja o comprador e a quantidade comprada por ele. Porém, em muitas situações, o preço cobrado
pelo monopolista pode depender de quem compra e da quantidade comprada. Nesse caso, dizemos
que o monopolista está discriminando preços. Exemplos comuns são descontos por quantidade
comprada e cobrança diferenciada, dependendo do perfil do consumidor.
Vamos discutir três tipos de discriminação de preços:
1. Discriminação de primeiro grau ou discriminação perfeita: monopolista vende difer-

entes quantidades do produto a diferentes preços e cujos preços podem diferir de comprador
a comprador.
2. Discriminação de segundo grau: monopolista vende diferentes quantidades do produto a

diferentes preços e os preços não variam com o comprador (preços não-lineares, descontos de
quantidade).
3. Discriminação de terceiro grau: monopolista vende a preços diferentes para diferentes

tipos de pessoas, mas cada unidade do bem tem o mesmo preço para o comprador (descontos
de cinemas, etc).
Discriminação perfeita é rara quando não impossı́vel, devido a restrições legais e ao fato de que
o monopolista teria que ter informação sobre a valoração de cada consumidor, de modo a cobrar de
cada um o preço mais alto que está disposto a pagar. Uma forma de implementar um mecanismo
que tem efeito similar é a tarifa em duas partes (two-part tariff ). Ela consiste em o consumidor
pagar dois preços pelo bem. O primeiro é o preço de acesso ao mercado, que permite o consumidor
comprar o bem. O segundo é o preço por unidade comprada do bem. Se o monopolista cobrar o
primeiro preço igual ao excedente médio consumidor e o segundo igual ao custo marginal do bem,
então ele extrairá todo o excedente do consumidor (supondo que a valoração do bem é igual para
todo consumidor) e o resultado será similar ao obtido com a discriminação de primeiro grau.
Custos,
Preços 6
Q
Q
Q
Q
Q
Q Exemplo de Two-Part Tariff
Firma cobra valor para o acesso A e pcp por unidade consumida
A
Q
Q
Q
Q
Q s
pcp Q CM g
Q
Q
Q
Q
Q
Q
Q
Q
Q
Demanda
s
José Guilherme de Lara
0 Resende qcp7
-
Qtde Monopólio
Na discriminação do segundo grau, os preços diferem dependendo da quantidade comprada,

mas não do perfil do comprador. Nesse caso, a ineficiência do monopólio pode diminuir, mas não
irá desaparecer.
Na discriminação de preços do terceiro grau, os preços diferem pelas caracterı́sticas do consum-
idor, mas não pela quantidade consumida. Nesse caso, a ineficiência do monopólio também pode
diminuir, mas não desaparecerá por completo.
Exemplo – Mercado de Passagens Aéreas. Suponha que existam dois tipos de consumidores,
um chamado “executivo” e outro chamado “estudante”. O executivo viaja apenas durante a sem-
ana, entre segunda a sexta-feira. O estudante pode viajar em qualquer perı́odo da semana. Além
disso, o executivo possui maior poder aquisitivo do que o estudante. Companhias áreas podem
então oferecer descontos maiores para bilhetes que incluam o sábado entre o vôo de partida e vôo
de chegada. Com isso, a companhia tenta discriminar entre os dois tipos de clientes, cobrando mais
caro do cliente que pode e está disposto a pagar mais.
Se discriminação perfeita fosse possı́vel, a ineficiência do monopólio desapareceria. Neste caso,
ocorreria uma redistribuição de riqueza, com todo o excedente do consumidor sendo capturado
pela firma discriminadora de preços, o que pode não ser aceitável para a sociedade. No caso de
discriminação de preços de segundo e terceiro graus, pode ocorrer que a ineficiência diminua, mas
não desapareça, e de modo que parte do excedente do consumidor também seja apropriado pelo
monopolista.
Exemplo: Discriminação de Terceiro Grau. Suponha que existam dois tipos de consumidores,
cada tipo tem uma curva de demanda própria, p1 (q1 ) e p2 (q2 ) (suponha que os consumidores não
consigam revender o bem). O custo de produção da firma é dado por c(q1 + q2 ). O problema da
firma é:
max p1 (q1 )q1 + p2 (q2 )q2 − c(q1 + q2 )
q1 ,q2
As CPOs do problema resultam em:

(q1 ) : p1 (q1∗ ) + q1∗ p01 (q1∗ ) = c0 (q1 + q2 )
| {z }
RM g1 (q1 )
(q2 ) : p2 (q2∗ ) + q2∗ p02 (q2∗ ) = c0 (q1 + q2 )

| {z }
RM g2 (q2 )
ou seja, a receita marginal obtida no mercado de cada grupo deve ser igual ao custo marginal de
produção total. Reescrendo as receitas marginais dos dois mercados em termos de elasticidade-preço
da demanda, obtemos:

1 1
p1 (q1 ) 1 − = CM g(q1 + q2 ) = p2 (q2 ) 1 −
|ε1 (q1 )| |ε2 (q2 )|
Portanto, se p1 > p2 , então para que a igualdade acima entre as receitas marginais de mercados
diferentes seja igual devemos ter que:
1 1
1− <1− ⇒ |ε1 (q1 )| < |ε2 (q2 )|
|ε1 (q1 )| |ε2 (q2 )|
Portanto, o mercado que apresenta maior preço é o mercado com menor elasticidade-preço da
demanda (em valor absoluto).

Exemplo: Monopólios Donwstream e Upstream. Considere um monopolista cujo produto é

usado como fator de produção por outro monopolista. Por exemplo, uma empresa pode ser a única
vendedora de eucaliptos para uma outra empresa, única produtora de papel no mercado (e única
compradora de eucaliptos). A primeira firma é chamada monopolista upstream e a segunda firma,
monopolista downstream. Vamos analisar um modelo simples com essa configuração.
O que ocorre em um mercado com esta configuração? Será que se os dois monopólios se inte-
grarem (integração vertical ), o resultado será benéfico para os consumidores? A resposta é sim.
Varian desenvolve um modelo simples em que o monopólio integrado irá produzir mais (e, por-
tanto, cobrar um preço menor) do que a situação com os dois monopólios, upstream e downstream,
pois nesta situação ocorre um mark-up duplo, feito por cada um dos dois monopolistas, enquanto
com o monopólio integrado, ocorre apenas um único mark-up.
Suponha que o monopolista upstream tenha um custo marginal de produção constante, igual a c,
que vende a sua produção x a um preço k, para ser usado como fator de produção pelo monopolista
downstream, cuja função de produção é q = f (x) = x e cuja curva de demanda para o seu produto
é linear, representada por p(q) = a − bq, com a, b > 0.
O problema do monopolista downstream é:
max p(q) q − kq = [a − bq] q − kq

q≥0

a−k
a − 2bq ∗ = k ⇒ q∗ =
2b
Como q = x, ou seja, para cada unidade de q produzida, o monopolista downstream demanda uma
unidade do insumo, temos que:
a−k
x∗ = q ∗ = .
2b
Tendo conhecimento dessa estrutura de mercado e da decisão ótima do monopolista downstream,

o monopolista upstream sabe que a curva de demanda do seu produto é definida por x∗ = (a−k)/2b,
ou seja, k(x) = a − 2bx. Logo, esse monopolista resolve o seguinte problema:
max k(x)x − c(x) = [a − 2bx]x − cx

x≥0

a−c
k 0 (x)x + k(x) = c ⇒ a − 4bx = c ⇒ x∗ =
4b
Logo o monopolista upstream irá ofertar a quantidade x∗ = (a − c)/4b do insumo. Como a função
de produção do monopolista downstream é q = x, então serão ofertadas q ∗ = (a − c)/4b do produto
final.
Vamos agora analisar o que aconteceria se ocorresse um processo de integração vertical, isto é,
se esses monopolistas se fundissem em uma única firma, constituindo um único monopólio. Nesse
caso, o problema do monopolista integrado é:
max p(q) q − cq = [a − bq] q − cq

q≥0


a−c
a − 2bq ∗ = c ⇒ q∗ =
2b
Ou seja, a produção do bem final é o dobro agora. É possı́vel mostrar que mesmo considerando
funções de demanda, produção e custo mais gerais, o monopólio integrado irá produzir mais (e,
portanto, cobrar um preço menor) do que a situação com os dois monopólios, upstream e down-
stream, pois nesta situação ocorre um mark-up duplo, feito por cada um dos dois monopolistas,
enquanto com o monopólio integrado, ocorre apenas um único mark-up.
1.6 Monopsônio
O monopsônio é a estrutura de mercado onde existe apenas um comprador para um determinado

bem (nesse caso, dizemos que o monopsonista é um fixador de preços). Suponha que esse bem tem
uma curva de oferta inversa w(x) crescente e que a função de produção da firma dependa apenas
desse fator de produção.
O problema do monopsonista é:
max pf (x) − w(x)x

x
A CPO resulta em:

0 0 1
pf (x) = w(x) + w (x)x = w(x) 1 + ,
η(x)
onde η(x) é a elasticidade-preço da oferta do insumo x. Como a curva de oferta é positivamente

inclinada, temos que η(x) > 0. Logo, pf 0 (x) > w(x), e o custo marginal do insumo (w(x) + w0 (x)x)
é maior do que custo médio do insumo (w(x)). Isso implica que o preço do insumo w(x) será menor
do que se o mercado do insumo fosse competitivo.
Observe que a interpretação é análoga a de um monopólio: se o monopsônio aumentar o uso
do insumo em uma unidade, ele pagará pelo valor dessa unidade, w(x), mais um valor dado pelo
aumento do preço do insumo, para todas unidades compradas, w0 (x)x. Temos, então, uma situação
de ineficiência econômica, onde a ineficência origina-se no mercado de fatores.
Finalmente, quanto mais elástica a oferta do insumo, menor a diferença entre o custo marginal
e o custo médio do insumo. Se o mercado de fatores for perfeitamente competitivo, então a curva
de oferta do fator será perfeitamente elástica (η(x) = ∞) e pf 0 (x) = w(x), com o custo marginal
do insumo igualando o seu custo médio.
Leitura Sugerida
• Varian, capı́tulos 24 (Monopólio), 25 (O Comportamento Monopolista) e 26 (O Mercado de

Fatores).
• Nicholson e Snyder: Capı́tulo 14 (Monopoly).

MICROECONOMIA 2
Notas de Aula 6 – Oligopólio
1 Oligopólio
1.1 Introdução
O oligopólio é uma estrutura industrial onde poucos produtores oferecem produtos homogêneos
a muitos compradores. É um tipo de estrutura industrial entre competição perfeita e monopólio.
Em um oligopólio, cada firma deve conhecer a demanda do mercado fazer conjeturas sobre as
ações das outras firmas do mercado, que afetam o seu bem-estar. Além disto, cada firma devm
saber como as suas ações afetam as outras firmas.
Portanto, esse é um problema de interdependência estratégica e, consequentemente, a ferramenta
fundamental que auxilia a análise deste tipo de problema é a teoria dos jogos.
Primeiro iremos analisar o caso de cartel (ou conluio), em que as firmas entram em acordo e
se comportam como um monopólio. Em seguida usaremos o conceito de equilı́brio de Nash para
analisar quatro modelos básicos de oligopólio, Cournot (1838), Bertrand (1883) (jogos simultâneos),
Stackelberg (1934) e liderança no preço.
Os modelos de Cournot e Bertrand tratam do mesmo problema e levam a conclusões bastante
distintas. Os dois modelos são estáticos, sem interação dinâmica. No modelo de Cournot, as firmas
escolhem a quantidade ótima a ser produzida. No modelo de Bertrand, as firmas escolhem o preço
ótimo a ser cobrado.
1.2 Cartel
Um possı́vel arranjo de mercado quando existem poucas firmas atuando é o equilı́brio de colusão.
Nesse equilı́brio, as firmas comportam-se como um único ente, maximizando a receita agregada,
que é repartida de algum modo pré-especificado. Essa é uma situação tı́pica de cartel (ou conluio).
O resultado principal de cartéis é a sua tendência à instabilidade: cada firma tem um incentivo
para burlar a regra de produção definida pelo cartel, de modo similar ao problema analisado no
Dilema dos Prisioneiros.
Exemplo com Duas Firmas. Suponha que existam 2 firmas, onde c1 (q1 ) é a função custo da
firma 1 e c2 (q2 ) é a função custo da firma 2. O problema do cartel é:
max p(q1 + q2 )(q1 + q2 ) − c1 (q1 ) − c2 (q2 )

q1 ,q2
As CPOs desse problema são:
(q1 ) : p(q1∗ + q2∗ ) + (q1∗ + q2∗ )p0 (q1∗ + q2∗ ) = c01 (q1∗ )
(q2 ) : p(q1∗ + q2∗ ) + (q1∗ + q2∗ )p0 (q1∗ + q2∗ ) = c02 (q2∗ )
José Guilherme de Lara Resende 1 Oligopólio

Portanto, na solução ótima temos que os custos marginais de cada firma são iguais, c01 (q1∗ ) =
c02 (q2∗ ). Se uma firma tiver alguma vantagem de custo (se, por exemplo, a curva de custo marginal
de uma das firmas estiver sempre abaixo da curva de custo marginal da concorrente), ela então
produzirá mais no equilı́brio de cartel. Como vale que:
∂π1 (q1∗ , q2∗ )
= p(q1∗ + q2∗ ) + q1∗ p0 (q1∗ + q2∗ ) − c01 (q1∗ ) ,
∂q1
a primeira CPO acima implica que:
∂π1 (q1∗ , q2∗ )
= −q2∗ p0 (q1∗ + q2∗ ) > 0 ,
∂q1
ou seja, em equilı́brio ocorrem incentivos para o desvio da solução de cartel para ambas as firmas
(o caso da firma 2 é análogo, e argumento semelhante vale para um cartel com J firmas).
Se repetirmos a interação entre as firmas em conluio por vários perı́odos, podemos ter dois
resultados:
1. Se a interação for finita e tiver data certa para acabar, o cartel não será estável.
2. Se a interação se repetir indefinidamente (infinitamente ou se não tiver data certa para
acabar), o equilı́brio de cartel poderá ser estável. Normalmente, ele será estável quando
as firmas participantes concordarem em uma punição para quem trair o acordo de cartel.
Suponha que um cartel de duas firmas se reune indefinidamente, onde cada firma produz metade
da quantidade de monopólio todo perı́odo. Suponha que a taxa de desconto intertemporal é deno-
tada por δ, com 0 < δ < 1.
A firma 1 impõe a seguinte regra à firma 2: se você cumprir o acordo do cartel hoje, eu cumprirei
o acordo do cartel amanhã. Porém, se você quebrar o acordo do cartel, eu produzirei para sempre
a quantidade de produção definida pelo equilı́brio de Cournot. Vimos que a estratégia acima,
no contexto da teoria dos jogos, é uma estratégia gatilho (“trigger strategy”), também chamada
estratégia de reversão a um EN (“Nash reversion strategy”), do tipo grim reaper.
Exemplo: Suponha que πc , πec e πd são os lucros da firma no caso de cartel, no caso de Cournot
(que será analisado mais à frente) e no caso de desvio, de modo que πd > πc > πec . Supondo que
as firmas escolham estratégias grim reaper, cada firma cumprirá o acordo do cartel se:
∞ ∞
X X πc δπec
δ t π c ≥ πd + δ t πec ⇒ > πd +
t=0 t=1
1−δ 1−δ
Logo, se
πd − π c
δ> ,
πd − πec
então o equilı́brio de cooperação do cartel será estável. Como a taxa de desconto intertemporal δ
é determinada pela taxa de juros r, do seguinte modo:
1
, δ=
1+r
então, se encontrarmos a taxa de desconto intertemporal, podemos também encontrar a taxa de
juros associada. Para o exemplo acima, obtemos que:
πc − πec
r< .
πd − πc

1.3 Oligopólio de Cournot
Suponha uma indústria com entrada bloqueada onde J firmas produzem um bem homogêneo,
todas com estrutura de custos denotada por cj (qj ). A demanda inversa do mercado é dada por
p = p(Q), onde Q = q1 + · · · + qJ é a produção total.
Encontramos a quantidade ótima produzida pela firma j, q̄j , resolvendo o problema de maxi-
mização de lucro dessa firma, tomando como dados as quantidades de produção ótimas das outras
firmas:
max p(Q)qj − cj (qj )
qj

p(Q) + p0 (Q)qj = c0j (qj )
Rearranjando a equação acima, obtemos:

sj
p(Q) 1 − = c0j (qj ) ,
|εp (Q)|
onde sj = qj/Q é a fração da produção total produzida pela firma j.
Exemplo: Modelo Linear. Suponha uma indústria com entrada bloqueada onde J firmas
produzem um bem homogêneo, todas com estrutura de custos idêntica, dada por:
C(qj ) = cqj , c ≥ 0, j = 1, . . . , J .
Suponha também que a demanda inversa do mercado é linear, dada por:

J
X
p=a−b qj ,
j=1
onde a > 0, b > 0 e a > c. O lucro da firma j quando produz q j e as outras firmas produzem qi ,
i 6= j, é: !
J
X
πj (q1 , . . . , qJ ) = a − b qi qj − cqj
i=1
Queremos encontrar uma alocação q̄ = (q̄1 , . . . , q̄J ) tal que q̄j seja a solução do problema acima,
dado que as outras firma estão escolhendo q̄1 , . . . q̄j−1 , q̄j+1 , . . . q̄J . Chamamos essa alocação de um
equilı́brio de Cournot-Nash do problema de oligopólio caracterizado acima.
Encontramos q̄j resolvendo o problema da firma j, tomando como dados as quantidades de
produção ótimas das outras firmas:
J
! !
X X
max a − b q̄i qj − cqj = max a − bqj − b q̄i qj − cqj
qj qj
i=1 i6=j

a−c 1X
q̄j = − q̄i (1)
2b 2 i6=j

A equação (1) é chamada curva de reação da firma j: ela diz qual o melhor nı́vel de produção a
ser escolhido pela firma j, dado que as outras firmas estão produzindo q̄i , i 6= j.
Dada a simetria do problema (a condição (1) acima vale para toda firma j), vamos procurar
por um equilı́brio simétrico, q̄1 = · · · = q̄J . Nesse caso, a condição (1) resulta em:
a−c
q̄ =
b(J + 1)
Portanto, temos que:
a−c (a − c)2
q̄j = , ∀j, e π̄j =
b(J + 1) b(J + 1)2

a−c a−c
q̄ s = J e p̄ = a − J
b(J + 1) J +1
Se existirem apenas duas firmas, obtemos que:
a−c (a − c)2
q̄j = e π̄j =
3b 9b
a −c a + 2c
q̄ s = 2 e p̄ =
3b 3
Comparando com a situação de monopólio, vemos que a produção total em um oligopólio de

duas firmas com competição na quantidade é maior do que a produção de monopólio.
O desvio do preço p̄ de equilı́brio de oligopólio do preço de equilı́brio em competição perfeita é:
a−c
p̄ − c = >0
J +1
A equação acima mostra que o preço cobrado é maior do que o preço de mercado em competição
perfeita e tende ao preço de competição perfeita quando o número de firmas aumenta. Portanto, o
resultado de competição pode ser visto como o limite do caso de um modelo competição a Cournot,
quando o número de firmas tende a infinito.
Resumo do Modelo de Cournot:
• No modelo de Cournot, as firmas competem na quantidade produzida. Ou seja, cada firma

escolhe a quantidade que vai produzir no mercado, sabendo que a outra firma vai fazer o
mesmo.
• O resultado desse modelo é intermediário entre os resultados de competição perfeita e monopólio:

a produção total do mercado será maior do que no caso de um monopolista, mas menor do
que seria a produção total em um mercado competitivo.
• O modelo de Cournot leva a uma alocação ineficiente, e quanto mais firmas no mercado,
menor a ineficiência e mais o equilı́brio se aproxima do equilı́brio competitivo.

1.4 Oligopólio de Bertrand
No oligopólio de Cournot, a variável estratégica de escolha da firma é a produção. No modelo de

Bertrand, a variável de escolha da firma é o preço a ser cobrado. Vamos então supor um mercado
onde duas firmas competem no preço. O custo marginal de cada firma é igual e constante. A firma
que anunciar o menor preço conquista toda a demanda q D pelo bem. Se as firmas anunciarem preços
iguais, elas dividem o mercado. A demanda da firma 1 é (a demanda da firma 2 é semelhante):

 q(p1 ) se p1 < p2
1
q1 (p1 , p2 ) = q(p1 ) se p1 = p2
 2
0 se p1 > p2
Suponha que o custo marginal é constante, igual nas duas firmas. A função de lucro da firma
1 é:
π1 = (p1 − c) × q1 (p1 , p2 )
Observe que como a função de demanda de cada firma é descontı́nua, a função lucro de cada
firma também é descontı́nua.
Resultado: Equilı́brio de Bertrand. O único equilı́brio de Nash em um modelo de Bertrand é

dado por p1 = p2 = c (onde π1 = π2 = 0).
Logo, em um modelo de Bertrand, o único equilı́brio é as duas firmas cobrarem o preço de

competição perfeita. Nesse caso, o lucro das firmas será zero. Com apenas duas firmas, a competição
via preço leva ao menor preço possı́vel, em contraste com o modelo de Cournot, onde a competição
via quantidade leva a um preço intermediário ao preço de monopólio e ao preço de competição
perfeita.
Resumo do Modelo de Bertrand:

• No modelo de Bertrand as firmas competem no preço. Ou seja, cada firma escolhe o preço
que vai anunciar no mercado, sabendo que a outra firma vai fazer o mesmo.
• O modelo de Bertrand é um modelo que leva a um resultado extremo, mesmo que existam
apenas duas firmas no mercado: elas se comportam como firmas competitivas, sem tentar
manipular o mercado e cobrando preço igual ao custo marginal.
• Nesse caso não há ineficiência e nenhuma firma terá poder de mercado, mesmo que existam
apenas duas firmas no mercado. Por isso, esse modelo é visto com cautela, já que aparente-
mente não traz um resultado razoável.
1.5 Modelo de Stackelberg (Liderança na Quantidade)
No modelo de duopólio de Stackelberg (ou liderança na quantidade), uma das firmas, chamada
lı́der, escolhe a quantidade que vai produzir primeiro. A outra firma, chamada seguidora, observa
a escolha da firma lı́der e então escolhe a sua quantidade de produção.
Este modelo é útil em situações onde existe uma firma grande, que possui maior parcela do
mercado, e outras firmas menores, que gravitam em torno da firma maior e que tomam decisões
após a firma lı́der ditar o rumo da indústria.

Pode-se mostrar analiticamente que é melhor ser lı́der do que seguidora e que a firma lı́der
obtém um lucro maior do que se estivesse em uma situação de Cournot, onde todas as firmas são
iguais no sentido de tomarem suas decisões simultaneamente.
A firma lı́der incorpora no seu problema de maximização a curva de reação da firma seguidora.
Vamos supor que a firma 1 seja a firma lı́der e a firma 2, a seguidora. Logo, no modelo de
Stackelberg, a lı́der escolhe o nı́vel ótimo de produção incorporando a curva de reação da seguidora
em sua decisão de produção. No modelo de Cournot, a mesma firma escolhe o nı́vel ótimo de
produção, dado um ponto qualquer da curva de reação da outra firma. Portanto, o lucro da lı́der
será maior ou igual ao lucro que essa firma obteria em uma situação de competição a Cournot.
Exemplo: Caso Linear. Suponha que existam apenas duas firmas no mercado, onde a demanda
agregada inversa é p = a − bq e o custo de produção de cada firma é ci (qi ) = cqi , i = 1, 2. O nı́vel
ótimo de produção da firma seguidora é encontrado resolvendo-se o problema:
max (a − b(q̄1 + q2 ))q2 − cq2

q2 ≥0
A CPO do problema acima resulta na curva de reação da firma seguidora:

a − c q̄1
q2 = −
2b 2
Vamos resolver o problema da firma lı́der (firma 1), que incorpora a curva de reação da firma
seguidora na sua decisão da quantidade ótima a produzir:

a − c q1
max a − b q1 + − q1 − cq1
q1 ≥0 2b 2
A CPO do problema da firma lı́der resulta na quantidade ótima de produção ql∗ = (a − c)/2b.
Substituindo esse valor na curva de reação da firma seguidora, encontramos a sua quantidade ótima,
qs = (a − c)/4b. Usamos as quantidades ótimas para calcular o preço de equilı́brio, via demanda
de mercado:
∗ a−c a−c a + 3c
p = a − b(ql + qs ) = a − b + =
2b 4b 4
Finalmente, o lucro da firma lı́der e o lucro da firma seguidora são:
(a − c)2 (a − c)2
πl (ql∗ ) = p∗ ql∗ − cql∗ = e πs (qs∗ ) = p∗ qs∗ − cqs∗ = .
8b 16b
Comparação dos Modelos Lineares:
Caso p ql πl qs πs
a+2c a−c (a−c)2 a−c (a−c)2
Cournot 3 3b 9b 3b 9b
a+3c (a−c) (a−c)2 (a−c) (a−c)2
Stackelberg 4 2b 8b 4b 16b
Bertrand c indefinido 0 indefinido 0

1.6 Modelo de Liderança no Preço
O modelo de liderança no preço é similar ao de Stalckelberg, porém a estratégia de cada firma

é o preço. A firma lı́der escolhe o preço, a seguidora toma o preço escolhido da firma lı́der como
dado. Neste caso, a seguidora se comporta como uma firma competitiva.
O problema de maximização de lucro da firma seguidora assumindo que é tomadora de preços
é:
max pqS − cS (qS ) ,
qS ≥0
o que resulta na curva de oferta inversa p = cS (qS ), o que determina a sua curva de oferta, denotada
por q S (p).
A lı́der se defronta então com uma curva de demanda residual, denotada por qR (p), e dada
pela diferença da curva de demanda de mercado (qD (p)) com a oferta da firma seguidora, qR (p) =
qD (p) − qS (p). Portanto, a firma lı́der se comporta como um monopolista onde a demanda com a
qual se defronta é a demanda total de mercado menos a oferta da empresa seguidora:
max pR (qL )qL − cL (qL )

qL ≥0
A CPO deste problema determina a quantidade ofertada pela firma lı́der, qL∗ . Usando a demanda
residual, obtemos o preço de mercado. Finalmente, determinamos a quantidade produzida pela
firma seguidora usando a sua curva de oferta e o preço de mercado.
Leitura Sugerida
• Varian, capı́tulo 27 (O Oligopólio).
• Nicholson e Snyder: capı́tulo 15 (Imperfect Competition).

MICROECONOMIA 2
Notas de Aula 8 – Teoria da Informação
1 Economia da Informação
1.1 Introdução
Os modelos que vimos até agora supõem informação perfeita. Por exemplo, os consumidores
possuem toda informação relevante sobre a qualidade dos produtos adquiridos. Já as firmas con-
hecem exatamente a produtividade de novos empregados.
Isso permite tratar os dois problemas, consumidor e firma, separadamente e depois unificar a
análise via preços que equilibram mercados. Modelos de equilı́brio geral supõem interações entre os
agentes bastante limitadas, que se dão apenas pelo sistema de preços. Isso gera vários problemas,
como, por exemplo, justificar a existência de firmas. Incluir incerteza nos modelos de equilı́brio
geral não resolve o problema, já que nesses modelos a incerteza é modelada de modo simétrico.
Problemas aparecem quando existe assimetria de informação.
Exemplos:
1. Relação empregado/patrão: nı́vel de esforço,
2. Compra de produtos: qualidade do produto,
3. Venda de produtos: disponibilidade a pagar.
Modelos de informação imperfeita quebram essa metodologia: assimetrias de informação podem

gerar comportamentos estratégicos, onde o agente que possui a informação privada tenta tirar
proveito dela. Na maioria dos casos, a assimetria de informação gera uma ineficiência. Logo, o
primeiro teorema do bem-estar deixa de ser válido.
Caracterı́sticas dos Modelos de Informação:
1. Na maior parte, equilı́brio parcial (um bem);
2. Interação de um número pequeno de agentes (dois, usualmente);
3. As restrições geradas pelo modelo são descritas por um contrato, garantido por uma terceira
parte;
4. Modelos de teoria dos jogos com informação assimétrica.
José Guilherme de Lara Resende 1 Teoria da Informação

1.2 Classificação dos Modelos
Os modelos de informação privada podem ser classificados de diversas formas, e algumas dessas
classificações podem ser conflitantes. Vamos adotar a seguinte classificação, que segue Salanie,
quanto:
I) Ao tipo da informação assimétrica:
(a) O que o agente é/suas caracterı́sticas: informação oculta

(b) O que o agente faz/decisão que toma: ação oculta
II) À forma do jogo:
(a) Seleção adversa (ou “Screening”): uma parte é imperfeitamente informada sobre as
caracterı́sticas da outra parte. Parte desinformada move-se primeiro.
(b) Sinalização: uma parte é imperfeitamente informada sobre as caracterı́sticas da outra
parte. Parte informada move-se primeiro.
(c) Perigo Moral : uma parte é imperfeitamente informada sobre as ações da outra parte.
Parte desinformada move-se primeiro.
Os modelos de informação assimétrica assumem barganha simples, sem interação no processo

de barganha, que leva a formulação de um contrato do tipo “pegue ou leve” (“take-it-or-leave-it”).
O cumprimento do contrato é assegurado por uma terceira parte (justiça, por exemplo).
Os participantes da transação são denominados:
• Principal : Parte desinformada.
• Agente: Parte informada.
A terminologia mais usada para classificar os tipos de solução é:
• First-Best: a solução do problema para o caso em que a informação é perfeita. Esse caso serve
de comparação para avaliar a perda de bem-estar causada pela assimetria informacional.
• Second-Best: a solução do problema para o caso em que é considerado a assimetria informa-

cional. Usualmente, essa solução apresentará uma perda de bem-estar, com relação à solução
de First-Best.
• Third-Best: a solução do problema para o caso em que é considerado a assimetria informa-

cional, restringindo os tipos de solução consideradas. Mais comum de ocorrer em casos de
perigo moral (por exemplo, relação patrão-empregado, em que contrato de salário pode ser
apenas do tipo pagamento fixo mais comissão e não qualquer função do salário).
Um resultado pouco intuitivo que pode ocorrer em certas situações de perigo moral é o bem-estar
total associado à solução de Second-Best ser menor do que o bem-estar total associado à solução
de Third-Best (obviamente, considerando apenas o principal, o seu bem-estar no Second-Best será
maior ou igual ao seu bem-estar no Third-Best).

2 Seleção Adversa
2.1 Mercado de Carros Usados (Akerlof )
Vamos assumir um mercado de carros usados, com vários vendedores e compradores (Akerlof,
1970). Os carros podem ser de dois tipos: boa (P, peach) e má (L, lemon) qualidade. O proprietário
do carro (vendedor) sabe a qualidade do seu carro. Porém os compradores não sabem distinguir se
o carro é de boa ou de má qualidade.
Vamos usar a seguinte notação:
• vV (CB) = b (valor de CB para o vendedor) e vC (CB) = B (valor do CB para o comprador),

onde B > b;
• vV (CR) = m (valor de CR para o vendedor) e vC (CR) = M (valor do CR para o comprador),

onde M > m;
• q: proporção de carros bons no mercado.
Se a informação for completa, ou seja, tanto o vendedor como o comprador souberem qual é o
tipo do carro, então CB será vendido por um preço PCB entre b e B e CR será vendido por um
preço pCR entre m e M .
O que ocorre se o vendedor souber a qualidade do carro, porém o comprador não observar a
qualidade? Agora teremos apenas um único preço p, pois não será possı́vel diferenciar os tipos de
carros. Note que os vendedores oferecem CB apenas se p > b. Logo:
• Se p < b: tipo do carro é revelado (CR), compradores adquirem CR se p ≤ M ;
• Se p > b: compradores acharão que carro o valor esperado do carro é qB + (1 − q)M .
Então podem existir dois equilı́brios possı́veis:
1. p = M < b: apenas carros ruins são vendidos; e
2. p = qB + (1 − q)M ≥ b: ambos os carros são vendidos (equilı́brio agregador, sem revelação

do tipo de carro vendido).
No segundo equilı́brio, se M for menor do que b e se q for suficientemente pequeno (poucos

carros bons no mercado), então qB + (1 − q)M < b. Neste caso, os vendedores de carros bons não
estão dispostos a vender. Logo o primeiro caso é o equilı́brio.
Temos então um caso extremo, em que o mercado de um tipo de bem (carro de boa qualidade)
deixa de existir. Porém mercados de carros de boa qualidade existem, o que ocorre? Muitas vezes
o próprio mercado pode criar formas de revelar o tipo do bem transacionado.
No mercado de carros usados, ambos os tipos de carros já existem. Se tivermos um mercado
onde o produtor pode escolher a qualidade do bem a ser vendido, mas onde o comprador não
consegue observar o nı́vel de qualidade desse produto, então pode-se mostrar que a possibilidade de
produção de bens de baixa qualidade pode (dependendo das caracterı́sticas do mercado) destruir
o mercado do bem, tanto o mercado de alta qualidade como o mercado de baixa qualidade.

2.2 Sinalização
Nos modelos de sinalização, o agente (vendedor do carro, no exemplo acima), de alguma maneira
crı́vel, comunica o seu tipo para o principal (o comprador, no exemplo acima).
Por exemplo, os vendedores de carros de boa qualidade podem oferecer uma garantia, de modo
a sinalizar que seu carro é bom. Neste caso, a sinalização serve para que estes vendedores se
diferenciem dos vendedores de carros de má qualidade e com isso o mercado funciona melhor.
Para que o sinal consiga de fato separar os dois tipos de carros, é importante que o custo
de fornecer garantia para carros de má qualidade seja maior do que para carros de boa qualidade
(“single-crossing property”, ou condição de Spence-Mirrless ou condição de separação – “sorting
condition”), de modo que não é viável para vendedores de carros de má qualidade fornecerem a
mesma garantia fornecida pelos vendedores de carros de boa qualidade.
2.3 Modelo de Sinalização de Spence
Suponha que firmas querem contratar empregados, que podem ser de dois tipos: alta produ-
tividade (θH ) ou baixa produtividade (θL ). Vamos assumir que a proporção de tipos de baixa
produtividade na população é α.
Se a firma conseguisse observar o tipo do trabalhador, ela pagaria salários diferentes para tipos
diferentes, de modo que wh = θH e wL = θL . Porém a firma não consegue distinguir o tipo do
trabalhador. O trabalhador pode sinalizar o seu tipo à firma, por meio da quantidade de educação
adquirida. A utilidade do trabalhador do tipo θi , i = L, H, que estudou e anos e recebe salário w
é separável em w e e:
u(w) − c(e, θi )
Vamos supor que:

• u0 > 0 (“mais é melhor”) e u00 < 0 (aversão ao risco);
• ∂c/∂e > 0: adquirir educação é custoso;
• ∂ 2 c/∂e2 > 0: e se torna cada vez mais custoso;
• ∂c(·, θL )/∂e > ∂c(·, θH )/∂e: adquirir educação é mais custoso para o tipo menos produtivo
(condição de Spence-Mirrless).
Note que o modelo acima e suas suposições assumem duas hipóteses importantes em termos
intuitivos:
• Sinal não afeta produtividade (sinal puro),
• Tipos diferentes têm custos diferentes de adquirir o sinal (condição de Spence-Mirrless).
As hipóteses acima implicam que as curvas de indiferença são positivamente inclinadas, já que
educação gera desutilidade, e a curva de inidiferença do indivı́duo de baixa produtividade será
maior do que a do de alta produtividade, já que ∂c(·, θL )/∂e > ∂c(·, θH )/∂e (essa condição também
é chamada de single crossing condition pois implica que dadas duas curvas de indiferença quaisquer
dos dois tipos, elas s podem se cruzar no máximo uma vez). A Figura abaixo ilustra essas curvas
de indiferença.

uL
w
6
Direção na qual
a utilidade aumenta uH
@
I
@
@
-
Educação
Vamos assumir que o tipo θ do indivı́duo não é observável pela firma, mas que o nı́vel de
educação e obtido indivı́duo pode ser observádo pela firma.
Na solução de first-best, no caso em que a firma consegue observar o tipo do candidato, ela
pagaria wL = θL ao tipo de baixa produtividade e wH = θH ao tipo de alta produtividade. Além
disso, nenhum dos tipos adquiriria qualquer nı́vel de educação (educação é um sinal puro neste
modelo!).
uH (w = θH , e = 0)
w
6
θH
uL (w = θL , e = 0)
θL
-
Educação
Porém, caso o principal não consiga identificar os tipos, essa solução não se mantém, pois o tipo
θL tentaria se passar pelo tipo θH , para receber um salário maior. Vamos assumir que os indivı́duos
podem utilizar educação para sinalizar o seu tipo para a firma. Vamos continuar supondo que cada
trabalhador recebe um salário dado pela sua produtividade marginal, caso o seu tipo seja revelado
para a firma corretamente.

Definição: Sistema de Crenças. Denote por µ(e) a crença que a firma atribui a um candidato
com e anos de educação ser do tipo de baixa produtividade. Então a função µ define um sistema
de crenças para a firma, de tal modo que:
w(e) = µ(e)θL + (1 − µ(e))θH
O jogo modelado é de informação incompleta: o principal desconhece uma caracterı́stica im-

portante dos agentes. O principal então forma um sistema de crenças sobre o tipo que cada agente
pode ser, dado o nı́vel de educação adquirido. Portanto, a noção de equilı́brio utilizada nesse tipo
de modelo é mais complicada: ela define não apenas estratégias, mas também as crenças que o prin-
cipal terá a respeito do agente considerado. Existem diversas noções de equilı́brios com crenças.
Dois deles são o equilı́brio sequencial e o equilı́brio intuitivo.
Definição (informal): Equilı́brio Sequencial para o Jogo de Sinalização. Um equilı́brio

seguencial para o jogo de sinalização descrito acima consiste em estratégias (e∗L , e∗H , w∗ ) e crenças
µ∗ tais que:
1. Cada candidato escolhe e já antecipando o salário de equilı́brio, de modo a maximizar o seu
bem-estar:
e∗i ∈ arg max u(w∗ (e)) − c(e, θi ) , para i = L, H .
e≥0
2. A firma define os salários w∗ de modo a maximizar o seu lucro esperado, dada a escolha dos
candidatos.
3. O sistema de crenças µ(e)∗ deve ser consistente com as estratégias e∗ , no seguinte sentido:
• Se e∗L 6= e∗H , então µ(e∗L ) = 1 e µ(e∗H ) = 0.

• Se e∗L = e∗H , então µ(e∗L ) = µ(e∗H ) = α.
A definição de equilı́brio acima garante em 1) que cada candidato escolhe o seu nı́vel de educação
de modo a maximizar a sua utilidade, dada a polı́tica de salários da firma, em 2) que a firma
maximiza o seu lucro esperado, dada a escolha ótima de educação dos agente feitas em 1), e em
3) que o sistema de crençãs da firma é consistente no sentido de que se tipos distintos adquirirem
quantidades de educação distintas, então a firma irá identificar qual o tipo correto que adquiriu
cada nı́vel de educação. Ja se os doi tipos adquirirem o mesmo nı́vel de educação, então a firma
assume que está diante de um candidato de baixa produtividade com probabilidade α, que é a
proporção de candidatos de baixa produtividade na população de candidatos.
A definição acima deixa claro que existem dois tipos de equilı́brios:
• Separador : e∗L 6= e∗H : tipos diferentes de trabalhadores adquirem quantidades distintas de

educação e firmas conseguem corretamente separar os tipos, pagando salários distintos para
tipos diferentes; e
• Agregador : e∗L = e∗H : tipos diferentes de trabalhadores adquirem a mesma quantidade de

educação e firmas pagam um mesmo salário para os dois tipos de trabalhadores (igual à
produtividade média dos tipos, ponderada pela proporção de cada tipo no mercado).

No equilı́brio separador, o tipo θL não obtém qualquer educação e o tipo θH obtém uma quanti-
dade de educação suficiente para garantir que ele se diferencie do tipo θL . Para esse arranjo ser de
fato um equilı́brio, devemos ter que as seguintes restrições de compatibilidade de incentivo (RCI)
sejam satisfeitas:
u(θL ) − c(e∗L , θL ) ≥ u(θH ) − c(e∗H , θL ) (RCIL )

u(θH ) − c(e∗H , θH ) ≥ u(θL ) − c(e∗L , θH ) (RCIH )
A RCIL garante que o contrato ótimo seja desenhado de tal modo que o tipo L vai de fato
adquirir o nı́vel de educação e∗L , e não e∗H , tentando se passar pelo tipo alto para desse modo
receber θH > θL . Raciocı́nio similar vale para RCIH .
No equilı́brio agregador, os dois tipos adquirem a mesma quantidade de educação e∗ . Como a
firma não consegue usar o sinal para distinguir os tipos, a crença dela será dada por µ(e∗ ) = α,
ou seja, ela utiliza a distribuição de tipos na população para calcular o salário de equilı́brio. Deste
modo, o salário pago será o mesmo para os dois tipos e igual à produtividade média da população:
w(e∗ ) = αθL + (1 − α)θH .
Ocorre um problema com a solução encontradas utilizando o conceito de equilı́brio sequencial: é

possı́vel mostrar que existirá um número infinito de equilı́brios dos dois tipos, separador e agregador.
Isto leva a um problema sério no poder preditivo do modelo e impede qualquer análise de estática
comparativa de ser feita. Esse problema é causado pelo fato de que equilı́brios sequenciais) não
disciplinam o sistema de crenças para estratégias fora do equilı́brio.
Vamos impor que a noção de equilı́brio com crenças utilizada acima também discipline as crenças
do principal para nı́veis de educação diferentes dos de equilı́brio.
Definição: Critério Intuitivo. Denote por u∗L e u∗h as utilidades de equilı́brio dos tipos L e H,
respectivamente. O equilı́brio sequencial que define estratégias (e∗L , e∗H , w∗ ) e crenças µ∗ satisfaz o
critério intuitivo se para todo e 6= e∗L , e∗H tivermos que:
• Se u(w(e)) − c(e, θL ) > u∗L e u(w(e)) − c(e, θH ) < u∗H , então µ(e) = 1; e
• Se u(w(e)) − c(e, θL ) < u∗L e u(w(e)) − c(e, θH ) > u∗H , então µ(e) = 0.
Um equilı́brio intuitivo é então um equilı́brio sequencial que satisfaz o critério intuitivo. Esse
critério diz que se um determinado nı́vel de educação e é tal que melhora apenas a utilidade do
tipo L e piora a do tipo H, com relação às utilidade de equilı́brio, então a firma crê que o único
tipo que adquiriria tal sinal seria o tipo L (µ(e) = 1. De modo análogo, se um determinado nı́vel
de educação e é tal que melhora apenas a utilidade do tipo H e piora a do tipo L, com relação às
utilidade de equilı́brio, então a firma crê que o único tipo que adquiriria tal sinal seria o tipo H
(µ(e) = 0).
Quando acrescentamos o critério intuitivo acima e, portanto, utilizamos equilı́brio intuitivo para
analizar o jogo de sinalização, é possı́vel mostrar que:
• Todos os equilı́brios separadores são eliminados,
• Apenas um equilı́brio separador emerge, em que e∗L = 0 e e∗H é o nı́vel de educação mais baixo
possı́vel que permite o principal separar os tipos.

Logo, neste único equilı́brio temos que:
• Apenas uma das restrições de compatibilidade de incentivo está ativa (a que previne o tipo
de baixa produtividade se passar pelo tipo de alto produtividade).
• O tipo de baixa produtividade recebe a alocação eficiente (e∗L = 0 e wL = θL ).
• O tipo de alta produtividade recebe uma alocação ineficiente (e∗H > 0 e wH = θH ).
Com relação à questão de bem-estar dos jogadores, em geral, assumindo a noção de equilı́brio
sequencial, podemos apenas afirmar que o equilı́brio separador é ineficiente do ponto de vista
social. Intuitivamente, isto ocorre porque o sinal é custoso de se adquirir e não traz nenhum
benefı́cio social, apenas benefı́cios privados, pois o modelo assume que educação não tem efeito
sobre a produtividade e serve apenas para distinguir os tipos. O sinal então serve apenas para
separar os tipos e é um desperdı́cio do ponto de vista social.
O trabalhador de produtividade baixa está pior em um equilı́brio separador do que em um
equilı́brio agregador, já que nos dois ele adquire o mesmo nı́vel de educação, mas no segundo ele
recebe um salário maior (dado pela produtividade média.
Já o trabalhador de produtividade alta pode estar pior ou melhor em um equilı́brio separador do
que estaria em um equilı́brio agregador. Ele adquire o sinal porque dado que todos os trabalhadores
de tipo alto estão se educando e recebendo salário mais alto, para ele é melhor também adquirir
educação e se diferenciar do que não se diferenciar e receber o salário destinado a trabalhadores
de produtividade baixa. Mas diferenciar tem um custo, que é adquirir um nı́vel de educação
suficientemente alto para poder se diferenciar do tipo de baixa produtividade.
Quanto maior for a proporção de trabalhadores de produtividade alta, mais provável que este
tipo de trabalhador esteja pior no equilı́brio separador, já que o salário médio estará bem proximo
de θH , não compensado então pagar o custo de adquirir educação.
Já se utilizarmos a noção de equilı́brio intuitivo, existirá um único equilı́brio, o equilı́brio sepa-
rador de menor custo para a sociedade. Ainda assim, teremos uma ineficiência, quando comparada
à solução de first best, já que o candidato de alta produtividada adquire educação, que não possui,
por hipótese, qualquer valor social neste modelo.

2.4 Separação (Screening )
Suponha um monopolista que não observa a disposição a pagar dos consumidores, que depende
da seguinte utilidade:
ui (q, T ) = θi v(q) − T ,
onde v(q) é uma função da quantidade q (q pode ser interpretada também como a qualidade do
bem produzido pelo monopolista), com v 0 > 0, v 00 < 0, T é a tarifa paga pelo consumidor e θi é um
parâmetro associado ao tipo do consumidor, que pode ser:
Tipo “baixo”: θL , com probabilidade 1 − β ,

Tipo “alto”: θH , com probabilidade β ,
onde θL < θH . Logo o tipo alto possui uma disposição a pagar pelo bem maior do que a do tipo
baixo. Cada consumidor possui uma utilidade reserva ūi , que representa o maior nı́vel de utilidade
que o consumidor do tipo i pode obter sem comprar o bem. A taxa marginal de substituição entre
q e T (T M Si (q, T )) para cada tipo é:
∂ui (q, T )/∂q

T M Si (q, T ) = − = θi v 0 (q)
∂ui (q, T )/∂q
Note que como T diminui a utilidade, as curvas de indiferença são positivimante inclinadas, e a
utilidade aumenta a medida que nos afastamos do eixo vertical. Além disso, como θL < θH , a curva
de indiferença do tipo H é mais inclinada do que a do tipo L e elas so se cruzam uma única vez
(por isso a condição de Spence-Mirrless é também chamada “single crossing condition). A figura
abaixo ilustra as curvas de indiferença dos dois tipos.
T
6
uh constante
ul constante
@
@
R
@
Direção na qual
a utilidade aumenta
-
q
O lucro do monopolista é π = T − cq, onde c denota o custo marginal de produzir q. Vamos

analisar primeiro o caso de informação perfeita, para comparar a solução eficiente com o caso no
qual a informação é assimétrica.

Informação Perfeita
Vamos assumir que o monopolista observa o tipo do consumidor. O contrato, denotado por
(q, T ), quantidade e tarifa cobrados, pode então depender do tipo do consumidor. Para simplificar
a notação, vamos assumir que a utilidade reserva dos consumidores é zero. Logo, o problema do
monopolista é:
max T − cq s.a. θi v(q) − T ≥ 0 ,
(q,T )
onde a restrição de participação é satisfeita com igualdade na solução, ou seja, θi v(q) = T . Substi-
tuindo essa restrição na função objetivo do monopolista, obtemos:
max θi v(q) − cq
q
A condição de primeira ordem desse problema resulta em:

θi v 0 (q ∗ ) = c ,
ou seja, o benefı́cio marginal θi v 0 (q ∗ ) é igual ao custo marginal c de produção, para cada tipo de
consumidor. Portanto, temos que qi∗ (θi ). Como θL < θH e V 0 é uma função decrescente (v 00 < 0),
temos que:
c c
v 0 (qL∗ = > = v 0 (qH
∗
⇒ qL∗ < qH
∗
,
θL θH
ou seja, o indivı́duo com maior disposição a pagar obté um q maior. Além disso, Como a taxa
marginal de substituição entre q e T é:
∂ui (q, T )/∂q
T M Si = − = θi v 0 (q) ,
∂ui (q, T )/∂T
temos que a curva de indiferença do consumidor do tipo alto será mais inclinada do que a do tipo
baixo. A Figura a seguir ilustra graficamente a solução para os dois tipos de consumidores.
T
6
UH0

TH∗ s

UL0

TL∗ s

-
qL∗ ∗
qH q
Então a solução de first-best consiste no principal oferecer dois contratos, um desenhado para
∗
o tipo com maior disponibilidade a pagar, denotado por (qH , TH∗ ), com nı́vel de qualidade e preço
mais altos do o contrato desenhado para o tipo com menor disponibilidade a pagar, denotado por
(qL∗ , TL∗ ).

Informação Assimétrica
Vamos supor agora que o monopolista não consegue distinguir os tipos de consumidores, mas
sabe que com probabilidade β o indivı́duo é do tipo alto e com probabilidade 1 − β o indivı́duo é
do tipo baixo.
O contrato de first-best, para o caso em que a informação é perfeita, não funcionará agora:
o tipo alto compraria o pacote desenhado para o tipo baixo, caso o monopolista oferte (qL∗ , TL∗ ) e
∗
(qH , TH∗ ) (ver figura abaixo). Isso ocorre por que o tipo baixo possui uma disposição a pagar menor.
Logo o monopolista deve propor dois contratos, (TL , qL ) e (TH , qH ), desenhado para cada tipo, com
qL < qH e TL < TH e de modo que maximize o seu lucro.
T
6
UH0
UH (TL , qL ) > UH0
TH∗ s
UL0
TL∗ s
-
qL∗ ∗
qH q
Dizemos então que o contrato (TH∗ , qH∗

) não é mais compatı́vel de incentivos para o tipo alto,
já que este tipo não irá adquirir o contrato desenhado para ele, preferindo o contrato desenhado
originalmente para o tipo baixo, (TL∗ , qL∗ ). Uma possibilidade seria o monopolista baixar a tarifa
TH∗ cobrado do tipo alto para T̂H∗ , de modo a tornar esse contrato em que qL∗ e qH ∗
são as qualidades
∗
ofertadas torne novamente vantajoso para o tipo H adquirir o contrato desenhado para ele, (qH , T̂H∗ ).
∗
Porém o menu de contratos (qH , T̂H∗ ) e (qL∗ , TL∗ ), ilustrado na figura abaixo, apesar de ser com-
patı́vel de incentivo, não necessariamente maximiza o lucro do monopolista. Vamos analisar agora
o problema do monopolista de desenhar contratos (TL , qL ) e (TH , qH ) compatı́veis de incentivo que
maximizem o seu lucro esperado, dado por:
β(TH − cqH ) + (1 − β)(TL − cqL ) ,
e de tal modo que os dois contratos induzam os dois tipos de consumidores a comprá-los (ou seja,
devem satisfazer as restrições de participação dos dois tipos) e de modo que um tipo não adquira o
contrato desenhado para o outro (ou seja, compatı́veis de incentivo).

T
6
UH (TL , qL ) > UH0
T̂H∗ s
UL0
TL∗ s
-
qL∗ ∗
qH q
Logo os dois contratos (qH , TH ) e (qL , TL ) devem satisfazer as seguintes restrições de compati-
bilidade de incentivo para cada tipo de consumidor:
RCIL : UL (qL , TL ) ≥ UL (qH , TH ) ⇒ θL v(qL ) − TL ≥ θL v(qH ) − TH
RCIH : UH (qH , TH ) ≥ UH (qL , TL ) ⇒ θH v(qH ) − TH ≥ θH v(qL ) − TL
A primeira restrição, RCIL , garante que o tipo L irá de fato escolher o contrato desenhado para
o seu tipo, (qL , TL ) e não o contrato desenhado para o tipo H, (qH , TH ). De modo similar, RCIH
garante que o tipo H irá de fato escolher o contrato desenhado para o seu tipo, (qH , TH ) e não o
contrato desenhado para o tipo L, (qL , TL ).
O problema do monopolista no caso de assimetria informacional é então dado por:
max β(TH − cqH ) + (1 − β)(TL − cqL )
(TH ,qH ),(TL ,qL )
s.a. θL v(qL ) − TL ≥ 0 , (1)

θH v(qH ) − TH ≥ 0 , (2)
θL v(qL ) − TL ≥ θL v(qH ) − TH , (3)
θH v(qH ) − TH ≥ θH v(qL ) − TL . (4)
O problema acima possui quatro restrições. Podemos mostrar que: 1) RPL e RCIH são satis-
feitas com igualdade no ótimo (dizemos então que essas duas restrições são “binding”), 2) qH ≥ qL
no contrato ótimo, e 3) RPH e RCIL serão sempre satisfeitas, quando as outras duas restrições do
problema do monopolista, RPL e RCIH , forem satisfeitas.
Vamos mostrar o item 3) acima, que RPH e RCIL serão sempre satisfeitas, quando RPL e RCIH
forem satisfeitas:
• RPH é redundante quando assumimos que RPL e RCIH são válidas:
θH v(qH ) − TH ≥ θH v(qL ) − TL > θL v(qL ) − TL ≥ 0 ,
onde a primeira desigualdade é consequência de RCIH , a segunda, de θH > θL e a terceira de
RPL . Logo, sempre que RCIH e RPL forem satisfeitas, valerá que θH v(qH ) − TH ≥ 0, ou seja,
RPH será também satisfeita (é com esse sentido que dizemos que RPH é redundante quando
RPL e RCIH forem satisfeitas).

• RCIL é redundante quando assumimos que RPL e RCIH são válidas: note que RCIH , satis-
feita com igualdade, pode ser reescrita com TH − TL = θH (v(qH ) − v(qL )). É possı́vel mostrar
∗
que no ótimo valerá ainda que qH ≥ qL∗ . Como θH > θL , obtemos que:
TH − TL = θH (v(qH ) − v(qL )) ≥ θL (v(qH ) − v(qL ))
Logo obtivemos que:
TH − TL ≥ θL (v(qH ) − v(qL )) ⇒ θL v(qL ) − TL ≥ θL v(qH ) − TH ,
ou seja, RCIL será válida sempre que RPL e RCIH forem satisfeitas.
Isso implica que o problema de maximização do lucro do monopolista pode ser simplificado
para:
max β(TH − cqH ) + (1 − β)(TL − cqL )

(TH ,qH ),(TL ,qL )
s.a. θH v(qH ) − TH ≥ 0 ,
θL v(qL ) − TL ≥ θL v(qH ) − TH ,
As duas restrições RPH e RCIL serão satisfeitas com igualdade no ótimo. Isso significa que
θL v(qL ) = TL e que TH = θH [v(qH ) − v(qL )] + θL v(qL ). Substituindo RPH e RCIL satisfeitas
com igualdade na função objetivo do monopolista, obtemos que:
max β(θH [v(qH ) − v(qL )] + θL v(qL ) − cqH ) + (1 − β)(θL v(qL ) − cqL )

(qL ,qH )
As condições de primeira ordem para esse problema resultam em:
(qL ) : β (−θH v 0 (qL∗∗ ) + θL v 0 (qL∗∗ )) + (1 − β)(θL v 0 (qL∗∗ ) − c) = 0

(qH ) : β (θH v 0 (qH
∗∗
) − c) = 0
A CPO para (qH ) resulta em:

θH v 0 (qH
∗∗
) = c,
a mesma condição obtida para a quantidade do tipo alto no problema sem assimetria informacional.
∗∗ ∗
Logo, temos que qH = qH , ou seja, o contrato para o consumidor com disposição a pagar mais alta
continua ofertado com o mesmo nı́vel eficiente de q. Já a CPO para qL resulta em:
β(θH − θL )v 0 (qL )
θL v 0 (qL∗∗ ) = c + > c = θL v 0 (qL∗ ) ,
1−β
| {z }
>0
onde o termo indicado como maior do que zero é de fato positivo pois 0 < β < 1, θH > θL e
v 0 (·) > 0. Temos então que v 0 (qL∗∗ ) > v 0 (qL∗ ). Como v 00 < 0, então v 0 é decrescente e obtemos que
qL∗∗ < qL∗ , ou seja, o contrato ótimo de second-best para o consumidor com disposição a pagar mais
baixa oferta um q menor do que era quando não havia assimetria informacional.

Isso significa que para o contrato ótimo que maximiza o lucro esperado do monopolista, assu-
mindo a presença de assimetria informacional, não ocorre distorção no “topo”: o indivı́duo com
maior disposição a pagar obtém a mesma quantidade do que antes (obtida na solução de first-best).
Porém o tipo com menor disposição a pagar recebe um contrato com uma quantidade menor do
que receberia caso não houvesse assimetria informacional.
Além disso, como RPL é satisfeita com igualdade, o indivı́duo com baixa disposição a pagar
tem um contrato ofertado tal que ele fica indiferente em comprar ou não o produto. Já para o tipo
de alta disponibilidade a pagar, como vimos acima, obtém um utilidade maior do que zero (sua
utilidade reserva) no contrato ótimo. Dizemos então que o tipo θH obtém uma renda informacional,
no sentido de que a utilidade de equilı́brio é maior do que zero, que é a utilidade de equilı́brio na
solução de first-best. Ter uma informação privada relevante para a transação analisada gera essa
renda informacional para o tipo θH . Além disso, o tipo θH é indiferente entre o seu contrato ou
o desenhado para o tipo θL (RCIH satisfeita com igualdade no ótimo) e o tipo θL prefere o seu
contrato estritamente ao contrato desenhado para o tipo θH (RCIL satisfeita com folga, ou seja,
com desigualdade estrita). A figura abaixo ilustra o contrato ótimo.
T
6
UH∗ > UH0
TH∗∗ < TH∗ s

UL0
TL∗∗ s
-
qL∗∗ < qL∗ ∗∗
qH ∗
= qH q

3 Perigo Moral
3.1 Introdução
Perigo moral está presente em transações onde uma da partes (principal ) não consegue monitorar
as ações da outra parte, e essas ações são relevantes para a transação negociada.
Exemplo: Seguro de automóveis: motorista pode deixar de tomar cuidado com o carro após
adquirir o seguro. Esse comportamento afeta o resultado do contrato (a probabilidade de o carro
ser roubado pode aumentar, por exemplo) e não é possı́vel (ou é muito custoso) à firma observar
esse comportamento.
Vamos usar a seguinte terminologia em que o termo principal se refere à parte desinformada, no
exemplo que desenvolveremos, à firma, e o termo agente se refere à parte informada, no exemplo
que desenvolveremos, ao trabalhador.
O agente toma uma ação que afeta a sua utilidade e a utilidade do principal. O principal
não observa a ação tomada, apenas o resultado da ação. Quando a ação que o agente escolhe
espontaneamente não é Pareto-ótima (o que o principal gostaria), dizemos que existe um problema
de perigo moral.
O problema do principal-agente refere-se ao problema de como o principal pode desenhar um
esquema de incentivos que induza o agente a tomar a ação desejada pelo principal.
Exemplos:
• Firma e Empregado – esforço vs produção;
• Acionistas e Gerentes;
• Serviços – Médico e Paciente, Advogado e Cliente;
• Fazendeiros e Arrendatários (sharecropping decision);
• Seguros – seguro contra roubo, seguro contra incêndio, seguros em geral de propriedades/bens.
Na solução de “First-Best”, o principal observa a ação do agente, de modo que é possı́vel

implementar a ação ótima diretamente.
Em geral, supõe-se que:
• Principal: neutro ao risco (principal consegue diversificar o risco associado com a sua relação
com o agente);
• Agente: avesso ao risco (“pequeno”, não consegue diversificar o risco).
A Divisão ótima de risco (optimal risk sharing) ocorre quando o principal fornece um seguro
total para o agente (por exemplo, salário fixo para o agente) e com isso assume todo o risco da
atividade produtiva. A divisão ótima de risco nem sempre é possı́vel quando existe problema de
perigo moral, pois o agente pode não escolher a ação desejada pelo principal.
Solução: principal oferece um contrato ao agente. Trade-off entre:
• Divisão de riscos (salário do agente não deve depender do produto);
• Incentivos (principal deve condicionar o salário do agente ao produto).

3.2 Modelo
Vamos desenvolver o modelo padrão de risco moral, na versão discreta com apenas dois nı́veis
de esforço que o indivı́duo possa escolher. Suponha um indivı́duo (agente) e uma firma (principal).
A firma deseja contratar um trabalhador, que pode se esforçar (e = 1) ou não (e = 0) no trabalho.
A probabilidade de obter um bom resultado no trabalho (pode ser que seja o valor de vendas desse
indivı́duo) depende do esforço empregado.
Vamos supor L resultados possı́veis, l ∈ {x1 , x2 , . . . , xL }, onde xl denota o l-ésimo valor de venda
possı́vel, e de modo que esses resultados estão ordenados em ordem crescente: x1 < x2 < · · · < xL .
A probabilidade de ocorrerPa venda xl é πl (e) > 0, para todo l e e, onde e é o nı́vel de esforço do
agente. Temos então que l πl (e) = 1, tanto para e = 0 quanto para e = 1.
Vamos supor também que o agente possui uma utilidade u estritamente crescente e estritamente
côncava sobre riqueza w. Além disso, d(e) denota a desutilidade do nı́vel de esforço e. Logo, a
utilidade é separável: U (w, e) = u(w) − d(e), onde d(0) < d(1): se esforçar (e = 1) causa mais
desutilidade do que não se esforçar (e = 0).
A firma deve desenhar um esquema de incentivos que induza o trabalhador a escolher por
vontade própria o nı́vel de esforço desejado pela firma. Na presença da assimetria informacional, a
firma observa o resultado l ocorrido, mas não o nı́vel de esforço do trabalhador. Logo, o salário pago
pode depender apenas do resultado ocorrido, e não do nı́vel de esforço. Um contrato é representado
então por (w1 , w2 , . . . , wL ), em que wl , para l = 1, 2, . . . , L, denota o salário recebido se o resultado
xl ocorrer.
Hipótese das Taxas de Probabilidade Monótonas (HTPM). A razão
πl (1)
πl (0)
é estritamente crescente em l, l = 1, 2, . . . , L.
A HTPM garante que a razão da probabilidade de ter se esforçado muito sobre a probabilidade
de ter se esforçado pouco é crescente no valor do resultado. Intuitivamente, quanto maior o resultado
observado, mais provável o trabalhador ter se esforçado muito e não pouco.
Vamos descrever os contratos de salário oferecidos pela firma e as propriedades de eficiência
desses contratos. Primeiro, para efeito de comparação, vamos analisar a solução de first-best, em
que o principal consegue observar o nı́vel de esforço do agente.

3.3 Informação Simétrica
Vamos supor que o principal observa o nı́vel de esforço do agente. Logo, o principal pode
implementar diretamente a ação que deseja, no sentido de que o contrato é diretamente condicionado
ao nı́vel de esforço desejado pela firma. Nesse caso, não existe problema informacional – as ações
do trabalhador são observadas sem custo pela firma.
O problema do principal é:
L
X L
X
max πl (e) (xl − wl ) s.a. πl (e)u(wl ) − d(e) ≥ ū ,
e,w1 ,...,wL
l=1 l=1
onde ū denota a utilidade reserva (ou custo de oportunidade em assinar o contrato de seguro) do
consumidor. Essa restrição do problema é chamada restrição de participação.
Vamos separar o problema em dois, um onde e = 0 e o outro onde e = 1. Determinamos o
contrato ótimo em cada caso, e depois encontramos o nı́vel de esforço ótimo para o principal.
O Lagrangeano do problema da firma é:
L
" L
#
X X
L= πl (e) (xl − wl ) + λ πl (e)u(wl ) − d(e) − ū
l=1 l=1
Vamos encontrar a solução resolvendo as CPOs. É possı́vel mostrar que as condições de segunda
ordem (CSOs) serão quando o indivı́duo for averso ao risco u00 (·) < 0. As condições de primeira
ordem (CPOs) resultam em:
∂L
= −πl (e) + λπl (e)u0 (wl ) = 0 , ∀ wl (5)
∂wl
L
∂L X
= πl (e)u(wl ) − d(e) − ū = 0 (se λ 6= 0) (6)
∂λ l=1
Temos um sistema de L + 1 equações com L + 1 variáveis a serem determinadas. As CPOs em

(5) implicam que λ > 0, já que probabilidades são positivas e u0 (w) > 0, para todo w. Logo, temos
que:
1
u0 (wl ) = , ∀ l ≥ 0,
λ
o que por sua vez implica que:
u0 (wl ) = u0 (wl̂ ) , ∀ l, ˆl .
Como u00 (·) < 0, então u0 é decrescente, ou seja, é uma função injetiva. Neste caso, a igualdade
acima só ocorre se os argumentos das duas funções forem iguais, o que resulta em:
wl = wl̂ ∀ l, ˆl .
Portanto, no caso de informação perfeita, o contrato ótimo provê um salário fixo para o agente,
denotado por w̄, qualquer que seja o nı́vel de esforço que o principal deseje implementar (a utilidade
do indivı́duo não varia – permanece constante em todos os estados da natureza). Esse resultado é
esperado: a firma é neutra ao risco e o indivı́duo é avesso ao risco, logo obtemos uma divisão ótima
de risco, em que a firma arca com todo o risco do negócio.

Note que como para qualquer nı́vel de esforço considerado, o contrato ótimo provê um salário
fixo, a utilidade esperada do indivı́duo se torna:
L
X
πl (e)u(w̄) − d(e) = u(w̄) − d(e) ,
l=1
já que as probabilidades somam 1 para qualquer e.

Então a restrição (6) simplifica para:
u(w̄) = d(e) + ū
Essa restrição define o salário pago pela firma: esse salário é o menor valor que a firma consegue
pagar para o trabalhador, que deixa este indiferente entre aceitar o emprego ou não.
Observe que como d(1) > d(0), temos que:
u(w̄(1)) = d(1) + ū > d(0) + ū = u(w̄(0)) ,
onde w̄(1) e w̄(0) denotam os salários ótimos se e = 1 e se e = 0, respectivamente. Como u é

crescente, obtemos que:
w̄(1) > w̄(0) ,
ou seja, o salário pago necessário para o agente se esforçar é maior do que o salário pago caso ele
não se esforçasse. Isso é intuitivo: se esforçar causa uma desutilidade maior do que não se esforçar.
A firma então tem que pagar um salário maior quando deseja que o agente se esforce.
Finalmente, a companhia de seguro escolhe e ∈ {0, 1} que maximiza o seu lucro esperado:
L
X
πl (e)xl − w̄(e)
l=1
Existe um trade-off para o principal na escolha entre e = 0 e e = 1: como d(0) < d(1), exigir
e = 0 permite à firma pagar um salário mais baixo, o que aumenta o lucro esperado (restrição de
participação). Por outro lado, exigir e = 1 aumenta a probabilidade esperada de resultados maiores
(HTPM) e, portanto, também aumenta os lucros.
A ação ótima para o principal depende do caso em questão. Se for a ação menos custosa para
o agente (e = 0 no modelo), e estivermos em uma situação de assimetria informacional, então
não haverá conflito de interesses entre o principal e o agente e, portanto, não ocorrerá perda de
eficiência.
De qualquer modo, em ambos os casos, e = 0 ou e = 1, no caso de informação perfeita, o agente
obtém salário fixo e o resultado é eficiente.

3.4 Informação Assimétrica
Agora vamos supor que a escolha do nı́vel de esforço do indivı́duo não é observada pela firma,
que deve então desenhar um contrato que implicitamente induza o indivı́duo a escolher o nı́vel de
esforço que a firma deseja implementar.
Para isso, uma nova restrição deve ser adicionada ao problema da firma. Essa restrição, chamada
restrição de incentivos (ou restrição de compatibilidade de incentivos), assegura que o indivı́duo
escolherá de fato a ação desejada pela firma.
O problema da firma agora pode ser escrito como:
L
X L
X
max πl (e)(xl − wl ) s.a. (RP) πl (e)u(wl ) − d(e) ≥ ū ,
e,w1 ,...,wL
l=1 l=1
XL L
X
(RCI) πl (e)u(wl ) − d(e) ≥ πl (e0 )u(wl ) − d(e0 ) ,
l=1 l=1
onde e, e0 ∈ {0, 1}, e 6= e0 .

A restrição de incentivos garante que o nı́vel de esforço desejado pela firma seja de fato o nı́vel
de esforço escolhido pelo consumidor no contrato ótimo.
Novamente, vamos resolver o problema da firma para cada nı́vel de esforço e depois encontrar
o nı́vel de esforço ótimo.
Polı́tica Ótima para e = 0
Suponha que a seguradora deseja induzir o agente a escolher o nı́vel baixo de esforço (e = 0).
Entre todas as polı́ticas possı́veis que implementam e = 0, qual a melhor para a firma? Vamos
mostrar que, neste caso, a firma deve apenas pagar um salário que garanta a participação do agente
e que não é necessário se preocupar com a restrição de incentivos.
Vimos que a solução ótima w1 , . . . , wL para o problema com informação perfeita (i.e., sem
considerar a restrição de incentivos) quando e = 0 é pagar um salário fixo, ou seja, wl = w̄(0). A
RCI neste caso em que wl = w̄(0) para todo l se torna:
L
X L
X
πl (0)u(w̄(0)) − d(0) ≥ πl (1)u(w̄(0)) − d(1) ⇒ d(0) ≤ d(1) ,
l=1 l=1
ou seja, a restrição de incentivos, com e = 0, se reduz a d(0) ≤ d(1), que é válido por hipótese. Logo,
para induzir o consumidor a escolher o nı́vel de esforço mı́nimo, a firma não precisa adotar nenhum
esquema de incentivos especial, basta selecionar o mesmo contrato ótimo usado no caso onde não
existe problema de informação. Como esse contrato maximizava o lucro esperado da seguradora na
solução de first-best (sem considerar a restrição de incentivo), então ele continua maximizando o
lucro esperado agora. Portanto, para implementar e = 0, nada muda se consideramos informação
simétrica ou informação assimétrica. Isso é intuitivo, pois o nı́vel de esforço mı́nimo é o que o
agente sempre escolherá no caso em que não sejam dados incentivos para ele escolher nı́veis de
esforço mais altos.

Polı́tica Ótima para e = 1
Suponha agora que a seguradora queira induzir o agente a escolher o nı́vel alto de esforço (e = 1).
Entre todas as polı́ticas possı́veis que implementam e = 1, qual a melhor para a firma?
Primeiro observe que a polı́tica ótima de first-best, que provê salário fixo w̄(1) ao agente, não
satisfaz a restrição de incentivos, já que se wl = w̄(1) para todo l, a restrição de incentivos do
problema se torna:
L
X L
X
πl (1)u(w̄(1)) − d(1) ≥ πl (0)u(w̄(1)) − d(0) ⇒ d(1) ≤ d(0) ,
l=1 l=1
o que não é válido (pois d(0) < d(1)). Intuitivamente, se fosse oferecido um salário fixo, o agente
escolheria o menor nı́vel de esforço. Portanto, para que o principal consiga implementar e = 1, o
contrato não pode fornecer um salário fixo para todos os resultados possı́veis.
Vamos resolver o problema de maximização do principal em que ele deseja implementar o nı́vel
de esforço alto (e = 1). Como a RCI pode ser reescrita do seguinte modo:
L
X
(πl (1) − πl (0)) u(wl ) − d(1) + d(0) ≥ 0 ,
l=1
então o Lagrangeano do problema pode ser escrito como:

L
" L # " L #
X X X
L= πl (1) (xl − wl )+λ πl (1)u(wl ) − d(1) − ū +β (πl (1) − πl (0)) u(wl ) − d(1) + d(0)
l=1 l=1 l=1
As condições de primeira ordem do problema são:

∂L
= −πl (1) + [λπl (1) + β(πl (1) − πl (0))] u0 (wl ) = 0 , ∀ wl
∂wl
L
∂L X
= πl (1)u(wl ) − d(1) − ū ≥ 0
∂λ l=1
L
∂L X
= (πl (1) − πl (0))u(wl ) − d(1) + d(0) ≥ 0
∂β l=1
As CPOs em wl podem ser reescritas do seguinte modo:

1 πl (0)
=λ+β 1− , ∀ wl . (7)
u0 (wl ) πl (1)
Podemos provar que as duas restrições RP e RCI estão ativas no ótimo, ou seja, que β 6= 0 e
λ 6= 0 (mais ainda, que são positivos), e que no ótimo, o indivı́duo obtém um contrato que especifica
salários que gera utilidade igual a sua utilidade reserva e de modo que ele seja indiferente entre se
esforçar muito ou se esforçar pouco.
Como λ e β são positivos, o lado direito da equação (7) é estritamente crescente em l, pela
HTPM. Como u0 é decrescente (o agente é avesso ao risco, u00 (·) < 0), então 1/u0 (wl ) é estritamente
crescente em wl . Isso significa que quanto maior l, maior wl , ou seja, wl é estritamente crescente
no resultado xl .

Portanto, o contrato ótimo é tal que:
wl é estritamente crescente no resultado xl .
O contrato ótimo de salários para e = 1 então não provê mais um salário fixo para o trabalhador.
Pelo contrário, ele especifica que o trabalhador assuma parte do risco, e que o quanto maior o
resultado, maior a parte do risco assumida pelo trabalhador (pode ser que em termos percentuais
seja igual: o trabalhador recebe um salário que possui uma parte fixa e um componente fixo em
termos percentuais do resultado obtido).
O agente deve então arcar com parte do risco, para que ele de fato se esforçe. Note que a
restrição de compatibilidade de incentivos, satisfeita com igualdade no ótimo, pode ser reeescrita
como:
XL
(πl (1) − πl (0))u(wl ) = d(1) − d(0) > 0
l=1
Então:
L
X L
X L
X
(πl (1) − πl (0))u(wl ) > 0 ⇒ πl (1)u(wl ) > πl (0)u(wl )
l=1 l=1 l=1
No contrato ótimo, o indivı́duo possui um ganho de utilidade em se esforçar, igual ao custo em se

esforçar muito, dado por:
d(1) − d(0) > 0 .
Logo, no contrato ótimo, o benefı́cio lı́quido de se esforçar muito se iguala ao custo lı́quido desse
esforço.
Para determinarmos a solução que o principal implementa, verificamos qual o nı́vel de esforço
que maximiza o seu lucro esperado.
Se no caso de informação perfeita o nı́vel de esforço ótimo for baixo, então o contrato ótimo
quando consideramos a assimetria informacional também implementa e = 0. Neste caso não ocor-
rerá, obviamente, perda de eficiência causada pela assimetria informacional.
Porém, se no caso de informação perfeita o nı́vel de esforço ótimo for alto, então pode ocorrer
que para o caso de informação assimétrica a firma decida implementar o nı́vel baixo de esforço.
Isso ocorrerá se for muito dispendioso para a firma induzir o trabalhador, por meio do contrato, a
se esforçar muito.
Nesse caso, temos uma situação claramente ineficiente, em que a utilidade do consumidor con-
tinua igual a sua utilidade reserva, porém a firma obtém lucro menor do que obteria na situação
de informação simétrica, pois implementa o nı́vel de esforço sub-ótimo e = 0.
Finalmente, se no caso de informação perfeita o nı́vel de esforço ótimo for alto, e também para
o caso de informação assimétrica a decisão ótima da firma seja implementar o nı́vel alto de esforço,
temos mais uma vez uma situação claramente ineficiente – a utilidade do trabalhador continua igual
a sua utilidade reserva (porém ele não obtém um salário fixo, ou seja, não ocorre divisão ótima
de riscos), e a firma obtém lucro menor do que obteria na situação de informação simétrica, pois
precisa induzir o agente a se esforçar (implementar e = 1 via a restrição de incentivos).

Leitura Sugerida
• Varian, capı́tulo 37 (Informação Assimétrica).
• Nicholson e Snyder, capı́tulo 18 (Asymmetric Information).
Exercı́cios
1. Suponha uma única revendedora de carros e um único consumidor que deseja comprar apenas
um carro. A empresa pode ser uma revendedora de carros de boa qualidade com probabilidade
α ou uma revendedora de carros de má qualidade. O consumidor é neutro ao risco e não
observa a qualidade do carro. A valoração do consumidor é dada por vH se o carro é bom e
vL se o carro é ruim. Os custos para a firma de um carro são cH , se o carro for bom, ou cL , se
o carro for ruim. Suponha que o preço do carro é regulado em p (ou seja, nenhum carro pode
ser vendido por nenhuma revendedora por um preço diferente de p, seja ele de boa qualidade
ou de má qualidade) e que valem as seguintes desigualdades: vH > p > vL > cH > cL .
a) Que condição deve ser válida para que o consumidor compre o carro?
b) Suponha que a firma decide fazer propaganda, que custa A (a propaganda em si não
contém nenhuma informação relevante para o problema). Para esse exemplo, propaganda
pode servir como um sinal para a existência de um equilı́brio separador? (ou seja,
um equilı́brio onde os consumidores esperam que firmas com carros de diferente nı́veis
de qualidade gastem diferentes valores na propaganda?) Explique a intuição do seu
resultado e a relacione com a condição de Spence-Mirrless.
2. Considere o modelo de sinalização de Spence. Faça uma demonstração gráfica e dê a intuição
de porque pode ocorrer que em um equilı́brio separador, os dois tipos de agentes estarem pior
do que estariam em um equilı́brio agregador. O que pode ser dito em geral sobre o bem-estar
de cada tipo de agente, em cada equilı́brio?
3. (P3-2/18) Considere o mercado de seguro de carros. Suponha que existam quatro grupos
de pessoas nesse mercado, cada grupo diferindo com a probabilidade de sofrer um acidente.
Cada grupo contém um número grande e igual de pessoas, mas as companhias de seguro não
conseguem identificar a qual grupo uma pessoa pertence. Todo indivı́duo corre o risco de gas-
tar R$ 10.000,00 se sofrer um acidente. A tabela abaixo descreve o quanto um indivı́duo está
disposto a pagar por um seguro total no caso de acidente, para cada grupo (linha “WTP”).
Risco 20% 40% 60% 80%

WTP R$2.500 R$5.200,00 R$6.800,00 R$8.200,00
Seguro Justo
Prêmio ao Risco
a) Complete a tabela acima com os preços do seguro justo para cada grupo (linha “Seguro
Justo”), supondo uma companhia grande o suficiente para diversificar os riscos em cada
grupo. Como esses valores se comparam com a WTP de cada indivı́duo?
b) Suponha agora que a informação é assimétrica - as companhias de seguro não observam
o tipo da pessoa. Qual é o risco médio de uma pessoa? Qual é o preço do seguro justo
nesse caso?

c) Todos os agentes vão adquirir seguro ao preço encontrado no item b)? Caso não, qual
será a composição de risco que vai se deparar nesse caso? O preço de seguro justo
encontrado em b) seria suficiente para cobrir o risco que a companhia assegurou?
d) Usando a lógica em c), o que ocorre com o preço justo de equilı́brio? Quem adquire
seguro nesse caso?
e) O resultado encontrado em d) é eficiente? Discuta sucintamente.
4. O dono de uma firma (principal) quer contratar um trabalhador (agente). O trabalhador

pode se esforçar pouco, e = 0, ou muito, e = 1. A receita r obtida pela firma é aleatória, mas
com maior chance de ser alta caso o trabalhador se esforce. Mais especificamente, se e = 0,
então:
0, com probabilidade 2/3
r= .
Já se e = 1, temos que:
r= .
√
A utilidade esperada do agente é u(w, e) = w − e, onde w denota o salário recebido e e
o nı́vel de esforço. O lucro da firma é π = r − w quando as vendas são r e o salário do
agente é w. Um contrato de salário (w0 , w4 ) especifica o salário wr ≥ 0 que o agente receberá
quando r = 0 ou r = 4. O salário não pode ser negativo, no mı́nimo ele pode ser zero. A
utilidade reserva do agente é ū = 0. Determine o contrato ótimo (w0 , w4 ) que maximiza o
lucro esperado da firma em cada uma das situações descritas a seguir.
a) O principal observa o esforço do agente e portanto o contrato pode ser condicionado

diretamente em e. Qual o nı́vel de esforço que será exercido no contrato que maximiza
o lucro esperado da firma?
b) O principal não observa o esforço do agente e portanto o contrato não pode ser condi-
cionado em e. Qual o nı́vel de esforço que será exercido no contrato que maximiza o
lucro esperado da firma?
5. Tony contratou Renata para vender goiabas. Tanto Tony quanto Renata são neutros ao risco.
Renata pode ficar em pé na beira da rua, no sol, se dedicando bastante a venda de goiabas
ou simplesmente sentar na sombra de uma árvore. A demanda por goiabas pode ser baixa,
média ou alta, com a mesma probabilidade. A tabela abaixo descreve o valor de vendas de
goiabas em cada caso de demanda, caso Renata se dedique ou não a tarefa de vender goiabas.
Comportamento de Renata Demanda Baixa Demanda Média Demanda Alta

Em pé no sol R$ 100,00 R$ 150,00 R$ 200,00
Sombra R$ 50,00 R$ 100,00 R$ 150,00
Se Renata trabalhar no sol, a demanda por goiabas é média e Tony paga à Renata R$ 30,00,
o lucro de Tony é R$ 150, 00 − R$ 30, 00 = R$ 120, 00. Tony só se importa com o seu lucro.
Renata, porém, se importa com duas coisas, quanto Tony irá pagar a ela e quão duro será o
trabalho. A utilidade de Renata é dada pelo salário que ela recebe, menos R$ 10,00 se ela
tiver que trabalhar no sol. Logo, se Tony paga a Renata R$ 35,00 e ela trabalhar duro, sua
utilidade será R$ 35, 00 − R$ 10, 00 = R$ 25, 00. Se por outro lado, Renata não trabalhar
duro, sua utilidade será R$ 35, 00 − R$ 0 = R$ 35, 00. Além disso, para que Tony convença
Renata a trabalhar para ele, a utilidade de Renata deve ser de no mı́nimo R$ 30,00 na média.

a) Se Tony pagar à Renata R$ 30,00 fixo, quanto Renata venderá na média?

b) Após muita reflexão, Tony decide estruturar a remuneração de Renata da seguinte forma.
Tony pagará a Renata R$ 120 se a venda de goiabas alcançar R$ 200,00. Se a venda de
goiabas for menor que R$ 200,00, Renata receberá apenas R$ 30,00. Esse esquema de
pagamento é uma boa idéia para Tony?
c) Qual é o menor prêmio que Tony pode instituir que induz Renata a trabalhar no sol,
supondo que se Renata não receber o prêmio, seu salário será R$ 30,00?
d) Sua resposta em c) mudaria caso Renata seja avessa ao risco? Explique sucintamente.
6. Considere o seguinte problema de Perigo Moral, onde o principal é um √ dono de loja e o

agente é um vendedor dessa loja. A utilidade do agente é u(w, e) = w − e, onde w é o
sálario recebido e e a dedicação ou nı́vel de esforço do agente. O vendedor pode escolher
apenas e = 0 (nı́vel zero de esforço) ou e = 5 (nı́vel máximo de esforço). A utilidade reserva
desse agente é 9. Se o agente não se esforçar (e = 0), ele vende:

 0 com probabilidade de 60%
100 com probabilidade de 30%

Caso ele se esforce, ele vende:


 0 com probabilidade de 10%

Suponha que o principal resolve adotar uma polı́tica de salários tal que que induza o agente
a escolher o nı́vel de esforço desejado pelo principal.
a) Qual a receita esperada do principal para cada nı́vel de esforço do agente?

b) Qual deve ser o salário mı́nimo do agente para cada nı́vel de esforço que ele emprega?
c) Qual a polı́tica de salários ótima que resolve o problema de perigo moral que o principal
enfrenta? Explique as restrições do problema e dê a intuição de cada uma delas. Quantas
restrições existem? Por que?
d) O que é melhor para o principal, implementar o nı́vel de esforço alto ou baixo?
e) Suponha que o agente agora possa escolher entre três nı́veis de esforço diferentes. O que
muda no problema do principal?

Microeconomia 2, José Guilherme UNB 2019

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Microeconomia 2, José Guilherme UNB 2019

Enviado por

Direitos autorais:

Formatos disponíveis

Microeconomia 2 Nota de Aula 1

1 Equilı́brio Geral com Trocas

Na teoria de equilı́brio parcial, estudamos o funcionamento do mercado de um bem isoladamente.

• Definição: o que é um equilı́brio.

• Existência: sob que condições podemos garantir que um equilı́brio existe.

• Unicidade: sob que condições o equilı́brio será único.

• Estabilidade: desvios do equilı́brio tendem ao equilı́brio ou não.

José Guilherme de Lara Resende 1 Equilı́brio Geral e Bem-Estar

A hipótese fundamental no estudo de equilı́brio geral é a de mercados competitivos. Isso implica

2. Consumidores maximizam a utilidade, sujeita à restrição orçamentária, onde tomam os preços

Outras hipóteses importantes são referentes a ausências de:

Definição: Caixa de Edgeworth. A caixa de Edgeworth é uma representação gráfica dessa

José Guilherme de Lara Resende 2 Equilı́brio Geral e Bem-Estar

Definição: Alocação. Vamos denotar por e = (e1 , . . . , eI ) a distribuição de dotações na economia

José Guilherme de Lara Resende 3 Equilı́brio Geral e Bem-Estar

Para o caso de dois consumidores, A e B, a alocação x = (xA , xB ), com xA = (xA A

1.2 Eficiência de Pareto

Definição: Alocação Pareto-Eficiente. A alocação factı́vel x ∈ F (e) é Pareto-eficiente (ou

Definição: Curva de Contrato. A curva de contrato é o conjunto de todas alocações Pareto

José Guilherme de Lara Resende 4 Equilı́brio Geral e Bem-Estar

uA (xA , yA ) = xαA yA1−α e uB (xB , yB ) = xβB yB1−β

Igualando a TMS dos dois consumidores, obtemos:

José Guilherme de Lara Resende 5 Equilı́brio Geral e Bem-Estar

Definição: Conjunto de Possibilidade de Utilidade. O conjunto de possibilidade de utilidade

Definição: Bloqueio. Seja S ⊂ I uma coalizão de consumidores. Dizemos que S bloqueia a

2. yi i xi para todo i ∈ S, com pelo menos um j ∈ S tal que yj j xj .

José Guilherme de Lara Resende 6 Equilı́brio Geral e Bem-Estar

1.3 Equilı́brio em Economias de Trocas

onde ei = (ei1 , ei2 ) é a dotação inicial do consumidor i.

José Guilherme de Lara Resende 7 Equilı́brio Geral e Bem-Estar

Definição: Excesso de Demanda Agregada. A função de excesso de demanda (ou excedente

O vetor de excesso de demanda agregada é:

z(p) = (z1 (p), . . . , zn (p)) .

Observe que zk (p) = 0 equivale a:

Definição: Equilı́brio. O vetor de preços p∗ é um equilı́brio Walrasiano se z(p∗ ) = 0.

Propriedades da Função Excesso de Demanda. Se para cada consumidor i ∈ I, ui é bem-

3. (Lei de Walras) p · z(p) = 0. O valor do excesso de demanda agregada é sempre zero,

José Guilherme de Lara Resende 8 Equilı́brio Geral e Bem-Estar

Um vetor de preços é um equilı́brio se a demanda agregada se igualar à oferta agregada em

Teorema de Existência de Equilı́brio. Se as utilidades de cada consumidor forem bem-

Definição: Alocação de Equilı́brio Walrasiano. Seja p∗ um equilı́brio Walrasiano para a

1. (Maximização dos Consumidores) x(p∗ ) = (x1 (p∗ , p∗ · e1 ), . . . , xI (p∗ , p∗ · eI )) é o vetor com

2. (Equilı́brio) Os mercados de todos os bens estão em equilı́brio:

José Guilherme de Lara Resende 9 Equilı́brio Geral e Bem-Estar

2 Economias com Produção

Vamos introduzir firmas no modelo de equilı́brio geral desenvolvido anteriormente. A produção

Esse problema é similar ao problema de maximização de lucros em termos de funções de produção,

José Guilherme de Lara Resende 10 Equilı́brio Geral e Bem-Estar

2.2 Eficiência Técnica e FPP

Definição: A fronteira de possibilidade de produção (FPP) mostra a quantidade máxima do bem

José Guilherme de Lara Resende 11 Equilı́brio Geral e Bem-Estar

Definição: O custo marginal do bem X é o custo de produzir uma unidade adicional de X,

José Guilherme de Lara Resende 12 Equilı́brio Geral e Bem-Estar

onde mi (p) denota a renda do consumidor i. O problema do consumidor i é portanto:

e o vetor de excesso de demandas é denotado por:

z(p) = (z1 (p), . . . , zn (p)) .

José Guilherme de Lara Resende 13 Equilı́brio Geral e Bem-Estar

Definição: Alocação de Equilı́brio. Seja p∗ um equilı́brio para E = (ui , ei , θij , Y j )i∈I,j∈J . O

José Guilherme de Lara Resende 14 Equilı́brio Geral e Bem-Estar

Exemplo 1. Suponha uma fronteira de possibilidade de produção para os bens X e Y representada

Igualando o valor absoluto da TMS ao da TMT, obtemos:

Note que se α = β e c = d, então a solução ótima consiste em X = Y . Os valores de X e Y podem

Voltando ao caso em que α = β e c = d, então px /py = 1.

2. yi i xi para todo i ∈ S, com pelo menos um j ∈ S tal que yj j xj .

f (D1 , . . . , DI ) = 1 ⇔ #(i : x i y) > #(i : y i x)

em que #(i : x i y) denota o número de pessoas que preferem estritamente x a y e #(i : y i x)