Você está na página 1de 132

Microeconomia 2 Nota de Aula 1

MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 1 – Graduação
Prof. José Guilherme de Lara Resende

1 Equilı́brio Geral com Trocas


1.1 Introdução

Na teoria de equilı́brio parcial, estudamos o funcionamento do mercado de um bem isoladamente.


Agora vamos estudar o funcionamento de uma economia como um todo. De modo geral, a demanda
e a oferta de um bem dependem não somente do preço deste bem, mas também dos preços de outros
bens da economia. Essa relação de dependência entre os mercados torna o estudo de uma economia
mais complicado. Esse estudo é chamado equilı́brio geral.
A ideia da mão invisı́vel de Adam Smith pode ser interpretada como uma sociedade formada
por indivı́duos com interesses próprios interagindo por meio de trocas de bens e serviços leva a uma
situação de equilı́brio eficiente:

“Every individual...generally, indeed, neither intends to promote the public interest, nor
knows how much he is promoting it. By preferring the support of domestic to that of
foreign industry he intends only his own security; and by directing that industry in such
a manner as its produce may be of the greatest value, he intends only his own gain, and
he is in this, as in many other cases, led by an invisible hand to promote an end which
was no part of his intention” (Adam Smith, A riqueza das Nações, Livro IV, Capı́tulo
II, p. 477).

Veremos que essa ideia está relacionada ao conceito de eficiência de Pareto e ao Primeiro Teorema
do Bem-estar.
Outras questões importantes com relação a este tópico são:

• Definição: o que é um equilı́brio.

• Existência: sob que condições podemos garantir que um equilı́brio existe.

• Unicidade: sob que condições o equilı́brio será único.

• Estabilidade: desvios do equilı́brio tendem ao equilı́brio ou não.

Walras no final do século XIX argumentou a existência de equilı́brio nos moldes de demanda
igual à oferta. Porém há um erro na argumentação de Walras. Esse erro foi apontado e corrigido por
Wald em 1935, que provou a existência de equilı́brio sob condições bastante restritivas (utilidades
separáveis, utilidade marginal decrescente para todos os bens, etc). Debreu e Arrow (1954) e
McKenzie (1954) provaram a existência de equilı́brio em um mercado competitivo, sob condições
bem mais gerais do que as de Wald.

José Guilherme de Lara Resende 1 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

A hipótese fundamental no estudo de equilı́brio geral é a de mercados competitivos. Isso implica


que os agentes da economia (consumidores e firmas) são tomadores de preços.
Hipóteses Comportamentais. A hipótese de mercados competitivos pode ser posta como:

1. Para cada bem, existe um grande número de firmas e consumidores atuando no seu mercado;

2. Consumidores maximizam a utilidade, sujeita à restrição orçamentária, onde tomam os preços


dos bens como dados;

3. Firmas maximizam lucros, dada a sua tecnologia e tomando os preços dos insumos e dos bens
produzidos como dados.

Outras hipóteses importantes são referentes a ausências de:

1. Custos de transação,

2. Externalidades,

3. Bens públicos,

4. Problemas de informação.

Vamos supor nesta seção que não exista um mercado formal (ou seja, que não exista um sistema
de preços). Logo, todas as interações entre os diversos agentes da economia são realizadas por meio
de trocas voluntárias (“barter economy”).
Também não lidaremos neste momento com a questão de produção. Cada indivı́duo da economia
recebe uma dotação inicial de bens. Vamos representar pelo vetor ei ∈ Rn+ a dotação inicial dos n
bens do consumidor i, i = 1, . . . , I.
O caso de dois indivı́duos e dois bens, I = 2 (nesse caso vamos representar os dois consumidores
por A e B, para facilitar a notação) e n = 2, pode ser analisado graficamente por meio da caixa de
Edgeworth.
A dotação total de uma economia, eT , é a soma das dotações iniciais dos indivı́duos da economia.
No caso de dois consumidores e dois bens, temos que eT = eA + eB , onde ei = (ei1 , ei2 ), i = A, B.

Definição: Caixa de Edgeworth. A caixa de Edgeworth é uma representação gráfica dessa


economia, onde cada ponto da caixa possui quatro coordenadas, duas referentes ao indivı́duo A e
duas referentes ao indivı́duo B.

A dimensão (o tamanho) da caixa é definida pela dotação total de bens na economia. Um ponto
na caixa representa uma possı́vel distribuição de dotação entre os participantes da economia, sem
desperdı́cios. Todas as possı́veis distribuições de bens na economia estão representadas na caixa.

José Guilherme de Lara Resende 2 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

eB
1 
0B
s
Bem 2
?

eA s s s eB
2 2
e = (eA , eB )
6

s
0A -
eA Bem 1
1

Para completarmos a caracterização dessa economia, temos que especificar as preferências in-
dividuais. Representamos estas preferências por meio de funções de utilidade. Supondo que todas
as preferências sejam bem comportadas, obtemos um mapa de curvas de indiferença que preenche
a caixa de Edgeworth, para cada indivı́duo.

eB
1 
0B
s

eA s s s eB
2 2
e= (eA , eB )
6

s
0A -
eA
1

Suponha que existam I indivı́duos e n bens. Cada indivı́duo é representado por uma relação de
preferência i (ou, equivalentemente, por uma utilidade ui ) e uma dotação inicial ei . Vamos denotar
por I o conjunto dos consumidores, I = {1, . . . , I}. A coleção E = (ui , ei )Ii=1 representa uma
economia de trocas (ou economia de trocas puras ou economia de trocas simples, sem produção).

Definição: Alocação. Vamos denotar por e = (e1 , . . . , eI ) a distribuição de dotações na economia


e por x = (x1 , . . . , xI ) uma alocação dessa economia. Portanto, uma alocação para a economia E
atribui uma cesta de bens para cada consumidor dessa economia.

José Guilherme de Lara Resende 3 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Definição: Alocação Factı́vel. Dizemos que a alocação x = (x1 , . . . , xI ) é factı́vel se ela exaure
a dotação total de cada bem na economia. Logo, para cada bem, a quantidade consumida é igual
ao total disponı́vel. O conjunto das alocações factı́veis, denotado por F (e), é dado por:
( I I
)
X X
i i
F (e) = x | x = e
i=1 i=1

Para o caso de dois consumidores, A e B, a alocação x = (xA , xB ), com xA = (xA A


1 , x2 ) e
xB = (xB B
1 , x2 ), será factı́vel se:

Bem 1: xA B A B
1 + x1 = e1 + e1
Bem 2: xA B A B
2 + x2 = e2 + e2

1.2 Eficiência de Pareto

Dizemos que uma alocação factı́vel é Pareto-eficiente se não for possı́vel melhorar (estritamente)
pelo menos um indivı́duo sem piorar ninguém.

Definição: Alocação Pareto-Eficiente. A alocação factı́vel x ∈ F (e) é Pareto-eficiente (ou


Pareto-ótima ou eficiente de Pareto) se não existir nenhuma outra alocação factı́vel y ∈ F (e) tal
que yi i xi , para todo i ∈ I, e yj j xj , para pelo menos um j ∈ I (em termos de utilidade:
ui (yi ) ≥ ui (xi ), para todo i ∈ I, e uj (yj ) > uj (xj ), para pelo menos um j ∈ I).

Dado que as trocas na economia são feitas de forma voluntária, se a economia se encontra
em uma alocação Pareto-eficiente, não será possı́vel mudar essa alocação. Portanto, as alocações
Pareto-eficientes são candidatas naturais ao equilı́brio da economia.
Observações sobre o Critério de Pareto:

• Uma outra maneira de interpretar: alocações de recursos em que não é possı́vel fazer com
que todos melhorem ou que não é possı́vel fazer com que alguém melhore sem que pelo menos
uma outra pessoa piore são alocações Pareto ótimas.

• Alocações eficientes de Pareto são alocações em que todos os ganhos de troca se exauriram.
Logo não existem mais trocas mutualmente vantajosas para serem feitas.

• Em geral há um conjunto grande de pontos Pareto ótimos em uma economia. Dizer que a
economia deve estar em um ponto Pareto ótimo é um juı́zo de valor, mas o mais fraco juı́zo
de valor que se pode fazer a respeito da situação da economia.

• O critério de Pareto apenas diz que não deve haver perdas ou desperdı́cios na economia, ele
não diz nada sobre a distribuição de riqueza de uma sociedade. Se a sociedade partir de
uma dotação inicial de recursos muito desigual, é provável que a alocação de equilı́brio seja
também desigual, mesmo sendo eficiente.

Definição: Curva de Contrato. A curva de contrato é o conjunto de todas alocações Pareto


eficientes da economia. Essa curva também é chamada conjunto de Pareto.

José Guilherme de Lara Resende 4 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1


0B

?
Curva de
Contrato
s
s

s
e = (eA , eB )
6

0A -

Para o caso de dois consumidores, A e B, uma alocação eficiente de Pareto pode ser vista como
uma alocação onde um dos agentes está tão bem quanto possı́vel, dada a utilidade do outro agente.
Se as utilidades dos dois agentes forem bem comportadas, então as alocações factı́veis no interior
da caixa de Edgeworth em que as TMS dos dois agentes são iguais definem as alocações Pareto
eficientes, ou seja, a curva de contrato.
Portanto, em uma alocação Pareto eficiente, as taxas marginais de substituição entre dois bens
devem ser iguais entre os consumidores (se não fosse o caso, existiria alguma troca que melhoraria
um dos consumidores sem piorar o outro – observe a figura acima). Note que isso vale para utilidades
bem comportadas e alocações no interior da caixa de Edgeworth.

Exemplo: Suponha dois consumidores, A e B, que possuem dotações iniciais representadas por
eA = (exA , eyA ) e eB = (exB , eyB ), e utilidades Cobb-Douglas denotadas por:

uA (xA , yA ) = xαA yA1−α e uB (xB , yB ) = xβB yB1−β

Igualando a TMS dos dois consumidores, obtemos:


αyA βyB
T M SA (xA , yA ) = = = T M SB (xB , yB )
(1 − α)xA (1 − β)xB
Lembrando que toda alocação Pareto eficiente é factı́vel e que as alocações factı́veis satisfazem
xA + xB = eTx e que yA + yB = eTy , obtemos:

αyA β(eTy − yA )
=
(1 − α)xA (1 − β)(eTx − xA )
Resolvendo essa equação, encontramos yA em função de xA , de modo que define a curva de contrato.
Suponha que as utilidades dos dois indivı́duos são iguais (logo, α = β). Então a última expressão
acima se torna: !
αyA α(eTy − yA ) eTy
= ⇒ yA = xA ,
(1 − α)xA (1 − α)(eTx − xA ) eTx
ou seja, a curva de contrato será uma reta, qualquer que seja a utilidade Cobb-Douglas considerada
(isso não ocorrerá se as utilidades dos dois indivı́duos forem distintas).

José Guilherme de Lara Resende 5 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Definição: Conjunto de Possibilidade de Utilidade. O conjunto de possibilidade de utilidade


(CPU) ilustra combinações de utilidades possı́veis de serem obtidas, dados os recursos da economia.
Na fronteira da CPU são representadas combinações de utilidades geradas por alocações Pareto
eficientes. Mais ainda, toda alocação Pareto eficiente possui uma representação da utilidade gerada
na fronteira de possibilidade de utilidade (FPU).

uB
6

Fronteira de
 Possibilidade
de Utilidade

-
uA

Vamos definir um conceito ainda mais forte do que o de alocações Pareto eficientes. Dada uma
alocação factı́vel qualquer, vamos assumir que coalizões (grupos de indivı́duos) que possam obter
uma alocação melhor entre si, então eles realizam trocas para alcançar essa melhora. Esta ideia é
formalizada nos conceitos a seguir.

Definição: Bloqueio. Seja S ⊂ I uma coalizão de consumidores. Dizemos que S bloqueia a


alocação factı́vel x ∈ F (e) caso exista uma alocação y tal que:
i i
P P
1. i∈S y = i∈S e , e

2. yi i xi para todo i ∈ S, com pelo menos um j ∈ S tal que yj j xj .

Uma alocação para a qual não existe nenhuma coalizão que a bloqueie, ou seja, em que para
todo S ⊂ I não exista y ∈ F (e) tal que yi i xi para todo i ∈ S, com pelo menos uma preferência
estrita, é chamada alocação não bloqueável.
Note que alocações ineficientes são bloqueadas pela coalizão formada por todos os indivı́duos
da economia (S = I). Logo, toda alocação não-bloqueável é Pareto-eficiente (a volta não é válida
em geral).

Definição: Núcleo. O conjunto das alocações não bloqueáveis, denotado por C(e), é chamado
núcleo da economia E.

As alocações no núcleo de uma determinada economia de trocas puras são as candidatas naturais
para serem alcançadas por meio de uma sequência de trocas voluntárias. Porém para isso ocorrer
há um exigência informacional gigantesca para cada participante da economia.

José Guilherme de Lara Resende 6 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

1.3 Equilı́brio em Economias de Trocas

Vamos supor a partir de agora que as transações são efetuadas em mercados competitivos,
onde cada consumidor maximiza o seu bem-estar, dados os preços que observa. Vamos continuar
assumindo que não exista produção na economia. Logo, cada consumidor recebe uma dotação
inicial de bens, que pode ser vendida e daı́ usada para adquirir outra cesta de bens.
Portanto, o sistema de preços é o instrumento alocativo de uma economia de mercado. Ele
determina o valor de cada dotação inicial e, consequentemente, quais cestas de bens estão dentro
da possibilidade de consumo de cada indivı́duo.
Suponha I consumidores, I = {1, . . . , I} denota o conjunto dos I consumidores. Suponha
também que as preferências i de cada consumidor i ∈ I são representadas por uma função de
utilidade ui bem comportada (contı́nua, estritamente crescente e estritamente quasecôncava).
O problema do consumidor i, no caso de dois bens apenas, é:

max
i i
ui (xi1 , xi2 ) s.a. p1 xi1 + p2 xi2 ≤ p1 ei1 + p2 ei2 ,
x1 ,x2

onde ei = (ei1 , ei2 ) é a dotação inicial do consumidor i.


Resolvendo o problema do consumidor, encontramos a sua demanda xi (p, p · ei ), onde para
o caso de dois bens temos que xi (p, p · ei ) = (xi1 (p, p · ei ), xi2 (p, p · ei )). Note que a renda do
consumidor agora é endógena e depende dos preços vigentes na economia.


0B
@
@
@ ?
@
@ xA
@s
@
@
@s
xB @ @
e = (eA , eB )
@s
@
@
@
6 @
@
@
0A -
obs: xi : demanda bruta de i, i = A, B

Observe que no sistema de preços representado na figura acima, cada um dos dois consumidores
está maximizando a sua utilidade dada a restrição orçamentária que enfrenta, em que essa restrição
é determinada pelo sistema de preços. Porém, a economia não está em equilı́brio: há um excesso
de oferta do bem 1 e um excesso de demanda do bem 2.

José Guilherme de Lara Resende 7 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Vimos que o nı́vel de preços representado na figura acima não iguala a demanda à oferta, para
nenhum dos dois bens. Nesse caso, dizemos que os mercados não se equilibram ou se exaurem.
Logo, a economia está em desequilı́brio. O equilı́brio será obtido via ajuste de preços, que faz
com que a demanda se iguale à oferta para todos os bens da economia. Essa situação é chamada
equilı́brio de mercado, ou equilı́brio competitivo, ou equilı́brio Walrasiano. Preços que alcançam o
equilı́brio são chamados preços de equilı́brio. A alocação resultante é chamada alocação de equilı́brio
(ou alocação de equilı́brio Walrasiano).

Definição: Excesso de Demanda Agregada. A função de excesso de demanda (ou excedente


de demanda) agregada do bem k é definida como:
I
X I
X
zk (p) = xik (p, p i
·e)− eik .
i=1 i=1

O vetor de excesso de demanda agregada é:

z(p) = (z1 (p), . . . , zn (p)) .

Observe que zk (p) = 0 equivale a:


I
X I
X
xik (p, p ·e)=i
eik
i=1 i=1

Então, aos preços p, se zk (p) = 0, a demanda de mercado pelo bem k iguala a oferta de mercado
desse bem. Se z(p) = 0, onde 0 = (0, . . . , 0) denota o vetor de zeros, então os mercados de todos
os bens estão em equilı́brio.

Definição: Equilı́brio. O vetor de preços p∗ é um equilı́brio Walrasiano se z(p∗ ) = 0.

Propriedades da Função Excesso de Demanda. Se para cada consumidor i ∈ I, ui é bem-


comportada, então, para todo p  0, temos que:
1. (Continuidade) z(·) é contı́nua em p. Se um preço varia em uma quantidade pequena, o
excesso de demanda agregada varia por uma quantidade pequena. O excesso de demanda
será contı́nuo se as demandas individuais forem contı́nuas. Também, se cada consumidor
for tomador de preço e sua demanda for pequena em relação à demanda de mercado, então
mesmo que a demanda individual seja descontı́nua, a demanda agregada poderá ser contı́nua.

2. (Homogeneidade) z(αp) = z(p), para todo α > 0. Apenas preços relativos importam –
podemos normalizar os preços e usar um numerário. Logo, não podemos determinar o valor
dos preços absolutos de equilı́brio da economia. Se existem n preços na economia, apenas
n − 1 preços serão independentes. No caso de dois bens, podemos normalizar um deles em 1
e apenas encontrar o preço relativo de equilı́brio do outro bem.

3. (Lei de Walras) p · z(p) = 0. O valor do excesso de demanda agregada é sempre zero,


quaisquer que sejam os preços de mercado. Consequentemente, se existem n mercados na
economia, e n − 1 mercados estão em equilı́brio, então necessariamente o último mercado
estará em equilı́brio. Portanto, para o caso de dois bens, precisamos verificar o equilı́brio
apenas para um dos mercados (uma vez que se um mercado estiver em equilı́brio, o outro
automaticamente também estará em equilı́brio).

José Guilherme de Lara Resende 8 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Um vetor de preços é um equilı́brio se a demanda agregada se igualar à oferta agregada em


todos os mercados da economia. A questão fundamental é sobre a existência de equilı́brio, ou seja,
sob quais condições podemos garantir a existência de um vetor de preços tal que os consumidores
maximizem a sua utilidade, dados esses preços, e demanda agregada iguala oferta agregada? O
próximo teorema responde essa questão.

Teorema de Existência de Equilı́brio. Se as utilidades de cada consumidor forem bem-


comportadas e se a dotação total de cada bem for positiva, então existirá (pelo menos) um vetor
de preços p  0 tal que os mercados de todos os bens estejam em equilı́brio.

Definição: Alocação de Equilı́brio Walrasiano. Seja p∗ um equilı́brio Walrasiano para a


economia E = (i , ei ). O vetor x(p∗ ) é chamado uma alocação de equilı́brio Walrasiano, onde
temos que:

1. (Maximização dos Consumidores) x(p∗ ) = (x1 (p∗ , p∗ · e1 ), . . . , xI (p∗ , p∗ · eI )) é o vetor com


as cestas ótimas de cada consumidor, quando os preços são p∗ e a renda do consumidor i,
i = 1, . . . , I, é p∗ · ei ;

2. (Equilı́brio) Os mercados de todos os bens estão em equilı́brio:


X X
xik (p∗ , p∗ · ei ) = eik , ∀k = 1, . . . , n.
i∈I i∈I

xB∗
1 
0B
@
@
@
@ ?
@
@
@
@
@
s
@ Alocação de equilı́brio
xA∗
2
@s xB∗
2
@
@
@
@
@
@se
@
6 @
@
s @
0A -
xA∗
1

A caixa de Edgeworht ilustrada na figura acima mostra um vetor de preços de equilı́brio, que
leva os consumidores A e B, a partir de suas dotações iniciais, representadas no ponto e na caixa,
à alocação de equilı́brio x = (xA∗ , xB∗ ), na qual ambos os consumidores estão maximizando o seu
bem-estar e os mercados dos dois bens estão em equilı́brio.

José Guilherme de Lara Resende 9 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

2 Economias com Produção


2.1 Introdução

Vamos introduzir firmas no modelo de equilı́brio geral desenvolvido anteriormente. A produção


e, portanto, a oferta agregada, são consequências do comportamento maximizador de lucros das
firmas. Logo, a quantidade de bens disponı́veis para consumo não será mais fixa e dependerá da
decisão de produção das firmas. O lucro das firmas é distribuı́do aos consumidores, os proprietários
das firmas. Vamos caracterizar firmas por meio da tecnologia de produção que possuem. Na análise
de equilı́brio geral é mais conveniente representar a tecnologia de uma firma usando o conceito de
conjunto de possibilidade de produção, em vez de representá-la usando o conceito de função de
produção.
Suponha que existam J firmas. O conjunto de possibilidade de produção da firma j, denotado
por Y j ⊂ Rn , com n bens, é o conjunto de todas as combinações de insumos e produtos disponı́veis
para a firma. Um vetor yj ∈ Y j é chamado plano de produção. Vamos usar a convenção de que
se o bem k for um insumo lı́quido (a firma usa mais desse bem do que é capaz de produzir), a
coordenada k de yj será negativa (ykj < 0). Se o bem k for um produto lı́quido da firma (a firma
produz mais desse bem do que o consome no processo produtivo), então a coordenada k de yj será
positiva (ykj > 0).

x2
6

Conjunto de
Possibilidade de
* Produção (convexo)





 




-
x1

Dado o vetor de preços p ≥ 0, a firma j escolhe o plano de produção que maximiza lucros:
max p · yj (1)
yj ∈Y j

Esse problema é similar ao problema de maximização de lucros em termos de funções de produção,


só que agora escrito em termos de conjuntos de possibilidade de produção.
Propriedades da função lucro e oferta ótima. Se o conjunto de possibilidade de produção
(CPP) Y j satisfizer certas condições, então, para todo vetor de preços p  0, a solução do problema
da firma (1) acima será única e contı́nua (denotada por yj (p)). Além disso, a função lucro, Πj (p) =
p · yj (p), será bem-definida e contı́nua.
O vetor yj (p) é chamado função de oferta da firma j, em sentido amplo, já que engloba não
somente os bens que a firma produz, mas também os bens que a firma utiliza como insumos.

José Guilherme de Lara Resende 10 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

2.2 Eficiência Técnica e FPP

Suponha que existam dois produtos, X e Y , produzidos por duas firmas distintas, que usam
dois fatores de produção, capital, K e trabalho, L. Suponha que as quantidades de capital e
trabalho estão fixas. Podemos construir uma caixa de Edgeworth para produção, onde uma firma
é representada no vértice sudoeste da caixa e a outra firma é representada no vértice noroeste
da caixa. Representamos as isoquantas de ambas as firmas na caixa. Pontos de tangência destas
isoquantas representam pontos de eficiência produtiva ou eficiência técnica. Podemos então definir
uma curva de contrato para a produção.


02

Curva de
s Contrato
s para Produção

01 -

Observe que na curva de contrato para a produção, as taxas marginais de substituição entre
os insumos são iguais para ambas as firmas. Logo, em pontos de eficiência técnica, as taxas
marginais de substituição entre dois insumos quaisquer são iguais entre firmas, mesmo que estas
firmas produzam bens diferentes (assumindo funções de produção bem comportadas e alocações
no interior da caixa). Podemos construir o seguinte conceito a partir da curva de contrato para a
produção:

Definição: A fronteira de possibilidade de produção (FPP) mostra a quantidade máxima do bem


Y que a sociedade pode produzir, para qualquer quantidade do bem X produzida.

Pontos na FPP representam a quantidade máxima do bem X que pode ser produzida para certa
quantidade do bem Y . Pontos que estão sobre a FPP, tais como o ponto B na figura abaixo, são os
pontos de eficiência técnica ou eficiência produtiva. Pontos no interior da FPP, tais como o ponto
A na figura abaixo, são ineficientes no sentido técnico. Nos pontos sobre a FPP, a taxa marginal de
substituição técnica entre dois insumos é igual para todas as firmas, quaisquer que sejam os bens
que elas produzam, assumindo que a tecnologia de produção seja “bem-comportada”.
Podem existir pontos de eficiência técnica que não representem alocações Pareto eficientes.
Porém, toda alocação Pareto eficiente está necessariamente associada a um ponto de eficiência
técnica.

José Guilherme de Lara Resende 11 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Bem Y
6
Fronteira de Possibilidade de Produção




sB

sA

-
Bem X

A FPP tem inclinação negativa devido à escassez de recursos. Se estamos no ponto B na figura
acima e queremos produzir mais do bem X, precisamos abrir mão de um pouco de bem Y (a
sociedade realoca alguns dos recursos usados na produção de Y para a produção de X). Portanto,
a escassez de fatores de produção implica que a FPP é negativamente inclinada.

Definição: O custo marginal do bem X é o custo de produzir uma unidade adicional de X,


expresso em unidades do outro bem que deixa de ser produzido:

dY
CM gX,Y = −
dX F P P

O formato da curva da FPP reflete como o custo marginal de um bem muda com a quantidade do
outro bem sendo produzida. Esse custo de oportunidade marginal da FPP é chamado taxa marginal
de transformação dos bens. Essa taxa mede a taxa pela qual um bem pode ser transformado em
outro, no sentido de que os fatores de produção são realocados da produção de um dos bens para
a produção do outro bem.
Portanto, o custo marginal de produção de um bem em termos de outro bem é dado pela
inclinação da FPP. Uma FPP com inclinação constante (isto é, uma reta) significa que este custo
marginal é constante, independente da quantidade produzida. Uma FPP côncava significa que este
custo marginal aumenta quanto mais desse bem é produzido. Ou seja, quanto maior a produção
de vinho, para produzir mais um litro de vinho, temos que abrir mão de uma quantidade maior de
pão.

José Guilherme de Lara Resende 12 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

2.3 Equilı́brio

Os consumidores são modelados como antes, por meio de uma função de utilidade e de uma
dotação inicial, que inclui bens ou serviços que o consumidor oferece ao mercado, como trabalho,
por exemplo. Com a inclusão de firmas na análise, precisamos descrever a distribuição dos lucros
dessas firmas na economia. Vamos denotar por θij a fração da firma j que o consumidor i detém.
Devemos ter que:
X
0 ≤ θij ≤ 1, ∀i ∈ I, j ∈ J , e θij = 1, ∀j ∈ J .
i∈I

Um consumidor possui duas fontes de renda: a sua dotação de bens e serviços e a quantidade
de ações de firmas que possui. A restrição orçamentária do consumidor i se torna então:
X
p · x i ≤ p · ei + θij Πj (p) = mi (p),
j∈J

onde mi (p) denota a renda do consumidor i. O problema do consumidor i é portanto:

max
i n
ui (xi ) s.a. p · xi ≤ mi (p) (2)
x ∈R+

Resolvendo este problema, encontramos as demandas ótimas dos consumidores, o que permite
calcular a demanda de mercado.
Com a introdução das ações das firmas, completamos a caracterização da economia, que pode
ser denotada por E = (ui , ei , θij , Y j )i∈I,j∈J (chamada economia de propriedade privada).
A função excesso de demanda agregada do bem k é agora dada por:
X X j X
zk (p) = xik (p, mi (p)) − yk (p) − eik ,
i∈I j∈J i∈I

e o vetor de excesso de demandas é denotado por:

z(p) = (z1 (p), . . . , zn (p)) .

O vetor de funções excesso de demanda agregada definido para economias com produção con-
tinua satisfazendo as mesmas três propriedades que eram satisfeitas no caso de uma economia de
trocas puras: 1) continuidade, 2) homogeneidade, e 3) lei de Walras. Essas propriedades possuem
as mesmas interpretações e implicações que vimos anteriormente.
Considere a economia de propriedade privada E = (ui , ei , θij , Y j )i∈I,j∈J . Suponha que cada util-
idade individual satisfaz certas propriedades (por exemplo, é bem-comportada) e que o conjunto de
possibilidade de produção de cada firma satisfaz certas
Phipóteses (por exemplo, apresenta retornos
decrescentes de escala). Suponha também que y + i∈I ei  0 para algum vetor de produção
agregada.
Nesse caso, podemos garantir que existe pelo menos um vetor de preços p∗  0 tal que o vetor
de excessos de demanda seja igual a zero, z(p∗ ) = 0. A alocação de equilı́brio para uma economia
com produção deve descrever além das cestas de consumo de cada indivı́duo, os planos de produção
ótimos de cada firma.

José Guilherme de Lara Resende 13 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Definição: Alocação de Equilı́brio. Seja p∗ um equilı́brio para E = (ui , ei , θij , Y j )i∈I,j∈J . O


par de vetores (x(p∗ ), y(p∗ )) é uma alocação de equilı́brio Walrasiano, onde temos que:
1. (Maximização dos Consumidores) x(p∗ ) = (x1 (p∗ ), . . . , xI (p∗ )) é o vetor com as cestas ótimas
de cada consumidor, quando os preços são p∗ e a renda do consumidor i, i = 1, . . . , I, é mi (p∗ );
2. (Maximização das Firmas) y(p∗ ) = (y1 (p∗ ), . . . , yJ (p∗ )) é o vetor com os planos de produção
ótimos de cada firma j, quando os preços são p∗ ;
3. (Equilı́brio) Os mercados de todos os bens estão em equilı́brio:
X X X j
xik (p∗ ) = eik + yk (p∗ ), ∀k = 1, . . . , n.
i∈I i∈I j∈J

A figura abaixo ilustra uma situação de equilı́brio, considerando uma economia com um único
consumidor. Observe que se a condição de tangência não for satisfeita, isso significa que a taxa
na qual o consumidor está disposto a trocar um dos bens pelo outro é diferente da taxa na qual
esse bem pode ser transformado no outro. Então existe a possibilidade de melhorar o bem-estar do
consumidor, ao se rearranjar a produção. Portanto, se a condição de tangência não for satisfeita, a
alocação não será Pareto eficiente.

Bem Y
6

FPP
@
@
@
@
Y∗ @s
@

@
@
@ Curva de Indiferença
@
@
@
@
@ Nı́vel de Preços
de Equilı́brio
-

X Bem X

Observações Importantes:
• A figura acima deixa claro que nem todo ponto de eficiência técnica será Pareto eficiente, mas
todo ponto Pareto eficiente será tecnicamente eficiente.
• Uma alocação Pareto eficiente satisfaz as seguintes três condições:
1. Eficiência nas trocas: As taxas marginais de substituição entre quaisquer dois bens
devem ser iguais.
2. Eficiência técnica ou produtiva: Para todas as firmas, as taxas técnicas de substituição
entre quaisquer dois insumos devem ser iguais.
3. Eficiência no mix de produtos: A taxa técnica de transformação entre dois bens deve
ser igual à taxa marginal de substituição dos consumidores.

José Guilherme de Lara Resende 14 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Exemplo 1. Suponha uma fronteira de possibilidade de produção para os bens X e Y representada


pela equação cX 2 + dY 2 = e. A função de utilidade do agente representativo desta economia é
uma Cobb-Douglas u(X, Y ) = X α Y β . Então a taxa marginal de substituição (TMS) entre os dois
bens, em valor absoluto, é:
∂u(X, Y )/∂X αY
|T M S| = =
∂u(X, Y )/∂Y βX
Já o valor absoluto da taxa marginal de transformação (TMT) entre os dois bens pode ser encon-
trado usando o Teorema da Função Implı́cita, definindo f (X, Y ) = cX 2 + dY 2 − e:

dY ∂f (X, Y )/∂X cX
dX = ∂f (X, Y )/∂Y = dY

Igualando o valor absoluto da TMS ao da TMT, obtemos:


  r !
αY cX βc βc
= ⇒ Y2 = X2 ⇒ Y = X
βX dY αd αd

Note que se α = β e c = d, então a solução ótima consiste em X = Y . Os valores de X e Y podem


ser encontrados substituindo a relação ótima derivada acima entre X e Y na FPP, cX 2 + dY 2 = e:
s
2
βcX αde αde
cX 2 + = e ⇒ X2 = ⇒ X∗ =
αd αcd + βc αcd + βc

A quantidade ótima de Y pode ser obtida usando aprelação ótima entre X e Y acima e o valor
ótimo de X encontrado acima, o que leva a Y ∗ = βce/(αcd + βc). Já os preços de equilı́brio
podem ser encontrados fazendo px /py = |T M S(X ∗ , Y ∗ )| = |T M T (X ∗ , Y ∗ )|, o que resulta em:

αY ∗ cX ∗
r
px px αc
= ∗
= ∗
⇒ =
py βX dY py βd

Voltando ao caso em que α = β e c = d, então px /py = 1.

Exemplo 2: Economia de Robinson Crusoe. Suponha uma economia com dois bens, formada
por apenas um indivı́duo e uma firma. A utilidade do consumidor é:

u(h, y) = h1−β y β ,

com 0 < β < 1. Vamos supor que a dotação inicial do consumidor é eT = (T, 0). A tecnologia da
firma é descrita pela função de produção y = hα , com 0 ≤ h ≤ b, b > T e 0 < α < 1. O problema
da firma é:
max phα − wh,
h≤0

onde p é o preço do bem final e w é o salário. A solução do problema da firma resulta em:
1
 αp  1−α α
 αp  1−α
hf = e yf =
w w
O lucro ótimo é:   1
1−α  αp  1−α
π = π(w, p) = w ≥ 0.
α w

José Guilherme de Lara Resende 15 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

O problema do consumidor é:

max h1−β y β s.a. py + wh = wT + π(w, p).


h,y≥0

A solução do problema do consumidor é:


   
c wT + π(w, p) c wT + π(w, p)
h = (1 − β) e y =β
w p

Como apenas preços relativos importam, vamos normalizar p∗ = 1. Pela lei de Walras, basta
verificarmos a condição de equilı́brio de um dos mercados para determinar o preço w de equilı́brio.
No mercado h, temos que hf + hc = T resulta em:
 1−α
f c ∗ 1 − β(1 − α)
h +h =T ⇒ w =α .
αβT

José Guilherme de Lara Resende 16 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

3 Bem-Estar Social
3.1 Eficiência de Pareto

Vimos que o princı́pio básico de eficiência usado em economia é o critério de Pareto, que
formaliza a ideia de que se na situação social A um indivı́duo fica melhor e nenhum fica pior
comparado à situação B então a situação A é melhor para a sociedade do que a situação B. Ou,
se na situação social A, todos os membros da sociedade estão melhores comparados à situação B,
então, a situação A é melhor para a sociedade que a situação B. O critério ou princı́pio de Pareto
também pode ser formalizado da seguinte maneira.

Definição: Uma alocação social A é Pareto-dominada pela alocação B se a alocação B é factı́vel


e nenhum agente fica pior, e pelo menos um fica melhor, na alocação B que na alocação A.

Definição: Uma alocação factı́vel é Pareto ótima (ou eficiente de Pareto) se não é Pareto-dominada
por nenhuma outra alocação factı́vel.

Uma alocação eficiente de Pareto satisfaz as seguintes três condições (“em situações bem-
comportadas”:
• Eficiência nas trocas: as taxas marginais de substituição entre quaisquer dois bens devem ser
iguais.
• Eficiência produtiva: para todas as firmas, as taxas técnicas de substituição entre os insumos
devem ser iguais.
• Eficiência no mix de produtos: a taxa marginal de transformação entre dois bens deve ser
igual à taxa marginal de substituição dos consumidores.

3.2 Os Dois Teoremas de Bem-Estar

O Primeiro e o Segundo Teoremas do Bem-Estar são resultados cruciais sobre bem-estar em


economias de mercado. Os dois teoremas respondem à pergunta em que sentido e sob quais
condições mercados competitivos levam à eficiência econômica e quando qualquer situação de
eficiência pode ser alcançada por um mercado competitivo.

Primeiro Teorema do Bem-Estar. Toda alocação de equilı́brio Walrasiano é Pareto-ótima.

O Primeiro Teorema do Bem-Estar afirma que todo equilı́brio Walrasiano satisfaz o critério de
Pareto, ou seja, todo equilı́brio em concorrência perfeita é Pareto ótimo. Logo, não existe nenhum
rearranjo de recursos (ou seja, nenhuma mudança na produção ou no consumo) tal que alguém
possa melhorar sua situação sem ao mesmo tempo piorar a situação de outro. Portanto, o mercado
agindo sozinho alcança uma situação de equilı́brio Pareto ótima, mesmo com cada agente econômico
agindo de modo egoı́sta, no sentido de buscar apenas o seu próprio bem-estar. Este resultado está
relacionado com a famosa “mão invisı́vel ” de Adam Smith. Observe que a alocação de equilı́brio
pode ser bastante desigual e ainda assim ser Pareto eficiente.

Segundo Teorema do Bem-Estar. Sob certas hipóteses, se x é Pareto-eficiente, então x é


uma alocação de equilı́brio Walrasiano para algum preço p de equilı́brio, após uma redistribuição
adequada de dotações iniciais.

José Guilherme de Lara Resende 17 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

O Segundo Teorema Fundamental do Bem-Estar diz que, “sob certas condições”, toda alocação
Pareto ótima pode ser obtida pela economia de mercado, por meio de uma redistribuição adequada
das riquezas iniciais dos agentes.
Portanto, o teorema implica que qualquer alocação Pareto-ótima pode ser atingida por meio
do mecanismo de mercado descentralizado, ou seja, não é necessário haver um planejador cen-
tral. O próprio mercado pode alcançar a alocação desejada, sendo necessária somente a correta
redistribuição de recursos na economia. Neste sentido, é possı́vel dizer que o segundo teorema do
bem-estar permite a separação dos problemas de eficiência econômica e de distribuição dos bens na
sociedade.
O segundo teorema do bem-estar supõe uma série de hipóteses para a sua validade. As mais
importantes e restritivas são relacionadas a questões de convexidade. Primeiro, as preferências dos
consumidores devem ser convexas. Segundo, o conjunto de produção de cada firma deve ser convexo
(é possı́vel relaxar esse requerimento, mas devemos ter que o conjunto de possibilidade de produção
agregado da economia seja convexo). Isso elimina a possibilidade de que o teorema seja válido na
presença de retornos crescentes de escala (pelo menos de maneira geral para toda a economia).
Falhas de mercado são situações que invalidam os teoremas de bem-estar. Em particular, se
alguma falha estiver presente, não podemos afirmar que a alocação de recursos e bens alcançada
por uma economia de mercado satisfaça o critério de eficiência de Pareto.
Exemplos de falhas de mercado:

• Bens Públicos;

• Externalidades;

• Poder de mercado;

• Informação Imperfeita.

3.3 Alocações Justas

Seja x = (xA , xB ) uma alocação qualquer. Dizemos que o indivı́duo i inveja a cesta do indivı́duo
j caso ele prefira a cesta de j à sua própria cesta. Por exemplo, dizemos que o indivı́duo A inveja
a cesta de B caso uA (xB B A A A
1 , x2 ) > u (x1 , x2 ).

Definição: Alocação Equitativa. Uma alocação equitativa é uma alocação para a qual nenhum
indivı́duo inveja a cesta de outro indivı́duo.

Definição: Alocação Justa. Uma alocação justa é uma alocação equitativa e eficiente.

Podemos mostrar que sempre existirá pelo menos uma alocação justa: a alocação de equilı́brio
obtida de uma divisão igualitária de recursos será uma alocação justa.

José Guilherme de Lara Resende 18 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

Leitura Recomendada
• Varian, caps. 31 - “Trocas” e 32 - “A Produção”.
• Pindick e Rubinfeld, cap. 16 - “Equilı́brio Geral e Eficiência Econômica”.
• Nicholson e Snyder, cap. 13 - “General Equilibrium and Welfare”.

Exercı́cios

1. Desenhe a caixa de Edgeworth para as economias descritas abaixo, ilustrando as dotações


iniciais, as curvas de indiferença que passam por essas dotações e as alocações descritas nos
itens.
(a) Economia 1: uA = xA A B B B A B
1 x2 , u = x1 x2 , e = (3, 7), e = (7, 3). Alocações: (x , x ) =
A B
A B A B
((2, 5), (8, 5), (x̃ , x̃ ) = ((0, 3), (10, 7), (x̂ , x̂ ) = ((6, 6), (6, 6).
(b) Economia 2: uA = xA A
1 x2 , u
B
= min{xB B
1 , x2 }, e
A
= (4, 5), eB = (11, 5). Alocações:
(xA , xB ) = ((12, 3), (3, 7), (x̃A , x̃B ) = ((10, 5), (5, 5), (x̂A , x̂B ) = ((3, 6), (2, 7).
(c) Economia 3: uA = xA A B B B A B
1 + x2 , u = min{x1 , x2 }, e = (4, 5), e = (6, 15). Alocações:
(xA , xB ) = ((5, 8), (5, 12), (x̃A , x̃B ) = ((10, 5), (0, 15), (x̂A , x̂B ) = ((3, 13), (7, 7).
2. Para as economias descritas nos itens da questão anterior, responda:
(a) Quais alocações são factı́veis?
(b) Descreva a curva de contrato para cada uma dessas economias. Ilustre graficamente a
curva de contrato na caixa de Edgeworth.
(c) Descreva as alocações no núcleo de cada uma dessas economias. Ilustre graficamente o
núcleo na caixa de Edgeworth.
3. Suponha uma economia com dois consumidores, A e B, com utilidades definidas sobre cestas
1/2 1/2
de dois bens, x e y, denotadas por uA (xA , yA ) = xA yA e uB (xB , yB ) = xB yB . As dotações
iniciais de A e B são eA = (6, 4) e eB = (4, 6).
a) Desenhe a caixa de Edgeworth para essa economia, ilustrando as dotações iniciais.
b) Descreva os conjuntos das alocações factı́veis e das alocações Pareto eficientes. Descreva
as alocações que estão no núcleo desta economia.
c) Determine os preços de equilı́brio para esta economia.
d) Normalize o preço do bem y em 1. Mostre que para os preços de equilı́brio encontrados
no item anterior, temos que de fato demanda iguala oferta no mercado dos dois bens.
4. (NS) Suponha que existam apenas três bens, denotados por x1 , x2 e x3 , em uma economia
sem produção. As funções de excesso de demanda agregada pelos bens 2 e 3 são:
3p2 2p3
z2 (p) = − + − 1,
p1 p1
4p2 2p3
z3 (p) = − − 2.
p1 p1
(a) Mostre que essas funções são homogêneas de grau zero nos preços.
(b) Use a Lei de Walras para mostrar que se z2 (p) = z3 (p) = 0, então z1 (p) também deve
ser igual a zero. Você consegue calcular z1 (p) usando a lei de Walras?
(c) Resolva esse sistema de equações para encontrar os preços relativos de equilı́brio p2 /p1
e p3 /p1 . Qual é o valor de equilı́brio de p3 /p2 ?

José Guilherme de Lara Resende 19 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Nota de Aula 1

5. (P1-2/18) Suponha uma economia com dois consumidores, A e B, com utilidades definidas
sobre cestas de dois bens, x e y, denotadas por uA (xA , yA ) = x2A yA2 e uB (xB , yB ) = xB yB . As
dotações iniciais de A e B são eA = (12, 8) e eB = (8, 12).

a) Desenhe a caixa de Edgeworth para essa economia, ilustrando as dotações iniciais.


b) Descreva os conjuntos das alocações factı́veis e das alocações Pareto eficientes. Descreva
as alocações que estão no núcleo desta economia.
c) Determine os preços de equilı́brio para esta economia.
d) Normalize o preço do bem y em 1. Mostre que para os preços de equilı́brio encontrados
no item anterior, temos que de fato a demanda é igual à oferta no mercado dos dois
bens.
e) Calcule a alocação de equilı́brio Walrasiano. Ela é uma alocação justa? Explique intu-
itivamente a razão da sua resposta.

6. (PS-2/18) Considere uma economia sem produção com dois bens, x e y. Suponha que existam
apenas dois indivı́duos, A e B, com funções de utilidade dadas por uA (x, y) = xy 2 e uB (x, y) =
min{x, y} e dotações eA = (10, 20) e eB = (20, 10).

a) Descreva o conjunto de alocações factı́veis, o conjunto de alocações Pareto-ótimas e o


núcleo dessa economia.
b) Determine as funções de demanda dos dois consumidores.
c) Determine a relação de preços de equilı́brio.
d) Normalizando o preço do bem y em 1, verifique que de fato os dois mercados se equilibram
aos preços encontrados no item c).
e) Determine a alocação de equilı́brio e verifique se ela é justa.

7. (P1-1/19) Suponha uma economia com dois consumidores, A e B, com utilidades definidas
sobre cestas de dois bens, x e y, denotadas por uA (xA , yA ) = x2A yA2 e uB (xB , yB ) = xB + yB .
As dotações iniciais de A e B são eA = (6, 4) e eB = (4, 6).

a) Desenhe a caixa de Edgeworth para essa economia, ilustrando as dotações iniciais.


b) Descreva os conjuntos das alocações factı́veis e das alocações Pareto eficientes. Descreva
as alocações que estão no núcleo desta economia.
c) Determine os preços de equilı́brio para esta economia (dica: lembre-se que no equilı́brio,
os preços relativos serão iguais às taxas marginais de substituição em valor absoluto para
os dois consumidores).
d) Calcule a alocação de equilı́brio Walrasiano. Ela é uma alocação justa? Explique intu-
itivamente a razão da sua resposta.

José Guilherme de Lara Resende 20 Equilı́brio Geral e Bem-Estar


Microeconomia 2 Notas de Aula

MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 2 – Teoria da Escolha Social
Prof. José Guilherme de Lara Resende

1 Escolha Social
1.1 Introdução

A teoria da Escolha Social lida com o problema de agregar preferências individuais em uma
preferência social. Ela analisa a questão de como um grupo ou uma sociedade decide coletivamente.
Normalmente essa decisão é por meio de uma regra de agregação das preferências ou escolhas
individuais. É desejável que essa regra satisfaça certos critérios de caráter normativo. Por exemplo,
podemos exigir que a regra de escolha social seja tal que se todos em uma sociedade preferem a
alternativa x à alternativa y, então a regra social resulte sempre em x preferı́vel a y (critério de
unanimidade de Pareto). O principal resultado deste tópico é o Teorema de Impossibilidade de
Arrow. Varian (2012), capı́tulo 33 (“O Bem-Estar ”), constitui uma referência para essa seção.
Definições:
• Alternativa: descrição completa de um estado social;
• X: conjunto finito de alternativas, todas excludentes;
• I: tamanho do grupo ou sociedade (número de indivı́duos);
• Preferências individuais i completas e transitivas sobre as alternativas;
• Grupo de preferências: lista das preferências de todos os indivı́duos do grupo.

Definição: Preferência Social. Uma relação de preferência social S é uma relação binária
sobre X. Representamos por S e ∼S as relações de preferência estrita e indiferença derivadas de
S , respectivamente.
Relembrando a notação de preferências, temos que:
• x S y: (a alternativa) x é socialmente tão boa quanto a y;
• x S y: (a alternativa) x é socialmente melhor que y;
• x ∼S y: (a alternativa) x é socialmente indiferente a y.

Sabemos que axiomas sobre preferências consistem em hipóteses sobre o comportamento in-
divı́dual e cada axioma tem um significado preciso. Vamos supor que a preferência i de todo
indivı́duo i satisfaz os dois axiomas abaixo:
• Axioma de Completeza: Para quaisquer alternativas x e y em X, ou x i y ou y i x (ou
ambos).
• Axioma de Transitividade. Para quaisquer alternativas x, y e z em X, se x i y e y i z
então x i z.

José Guilherme de Lara Resende 1 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

O axioma de “completeza” diz que o indivı́duo é sempre capaz de comparar duas alternativas
quaisquer do conjunto X. Portanto, se ele tiver que escolher entre x e y, ele dirá qual alternativa
prefere (ou se é indiferente entre elas). O axioma de transitividade é crucial para a escolha do
indivı́duo ser logicamente coerente. Se esse axioma não for satisfeito, pode não ser possivel dizer
qual é a alternativa preferida pelo indivı́duo. Por exemplo, suponha um indivı́duo que ordene as
alternativas x, y, e z da seguinte maneira não-transitiva: x  y, y  z e z  x. Neste caso não é
possı́vel determinar a alternativa preferida do indivı́duo.

Definição: Regra de Escolha Social (RES). Uma regra de escolha social (ou mecanismo de
decisão social ) f é uma função que associa cada grupo de preferências individuais a uma preferência
social. Logo:
( ,  , · · · , I ) 7→S
| 1 2{z } f
I indivı́duos

Então f associa a cada conjunto particular de preferências individuais uma ordenação social,
de acordo com o que a regra estabelecer.

1.2 Caso de Duas Alternativas: Teorema de May

Suponha apenas duas alternativas a serem escolhidas, representadas por x e y. Para cada
indivı́duo i, podem existir apenas três casos: 1) x i y, 2) x ∼i y, e 3) y i x. Então, a preferência
de cada indivı́duo pode ser descrita pela função Di definida como:
Di = 1 se x i y
Di = 0 se y ∼i x
i
D = −1 se y i x

Uma regra de escolha social para o caso de duas alternativas pode então ser vista como um mapa
que leva cada vetor com as preferências de todos os indivı́duos sobre x e y (sendo que é possı́vel se
declarar indiferente às duas alternativas), denotado por (D1 , D2 , . . . , DI ), a uma preferência social
DS . Seja o conjunto U = {−1, 0, 1}. No caso de apenas duas alternativas, a regra de escolha social
f pode ser definida como uma função com domı́nio no produto cartesiano U I e contradomı́nio U
(f : U I → U ), de modo a associar cada grupo de preferências individuais (D1 , D2 , . . . , DI ) à escolha
social DS , de acordo com o que a regra f especificar:

{z× · · · × U} 7→
|U × U × U f
U
I indivı́duos)

Exemplo: Votação Majoritária. Seja αi ≥ 0, para todo i = 1, . . . , I, um sistema de pesos.


Definimos f como: !
I
X
f (D1 , . . . , DI ) = sign αi Di ,
i=1
onde sign : R → R é a função definida por sign(a) = 1 se a > 0, sign(a) = 0 se a = 0 e
sign(a) = −1 se a < 0. Se αi = 1 para todo i, f representa a regra de votação majoritária:
I
!
X
f (D1 , . . . , DI ) = sign Di .
i=1

José Guilherme de Lara Resende 2 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

Para a regra de votação majoritária vale que:

f (D1 , . . . , DI ) = 1 ⇔ #(i : x i y) > #(i : y i x)


1 I
f (D , . . . , D ) = 0 ⇔ #(i : x i y) = #(i : y i x)
f (D1 , . . . , DI ) = −1 ⇔ #(i : x i y) < #(i : y i x) ,

em que #(i : x i y) denota o número de pessoas que preferem estritamente x a y e #(i : y i x)


denota o número de pessoas que preferem estritamente y a x.
Logo, a regra de votação majoritária decide que x é socialmente preferı́vel a y se o número de
pessoas que preferem (estritamente) x a y for maior do que o número de pessoas que preferem
(estritamente) y a x. No caso de o número de pessoas que preferem y a x for maior do que o
número de pessoas que preferem x a y, então y será socialmente preferı́vel a x. Finalmente, se
os dois grupos de pessoas, que preferem x a y e que preferem y a x tiverem o mesmo número
de pessoas, então x e y serão socialmente indiferentes. Na prática, quando isto ocorrer, existirá
alguma regra para a escolha entre x e y. Por exemplo, se houver empate no número de votos para
presidente do Brasil no segundo turno de votação, então será escolhido o candidato mais idoso (ver
artigo 77 da Constituição Federal).
Vamos discutir propriedades que podem ser impostas sobre a função f de bem-estar social. Cada
propriedade tem um significado intuitivo de caráter normativo. Por exemplo, o critério Paretiano
abaixo é simples e é razoável exigir que uma regra de escolha social o satisfaça.

Definição: Critério Paretiano (Unanimidade). f (·) satisfaz o critério Paretiano se f (1, . . . , 1) =


1 e f (−1, . . . , −1) = −1.

O critério Paretiano apenas exige que no caso em que todos na sociedade preferem estritamente
a mesma alternativa, a preferência social também irá preferir estritamente esta alternativa. A regra
ditadorial, definida no exemplo abaixo, satisfaz esse critério.

Exemplo: Defina f por f (D1 , . . . , DI ) = Dh . O indivı́duo h é chamado ditador, pois a sua


preferência determina a escolha social (αi = 0, ∀i 6= h, αh = 1, no exemplo anterior). Observe que
a regra ditadorial satisfaz o critério Paretiano.

May (1952) elaborou 4 condições que uma regra de escolha social f deve satisfazer quando
existem apenas 2 alternativas. Abaixo apresentamos essas condições formalmente. É fundamental
entender o conteúdo econômico de cada condição. A primeira diz que a regra deve ser decisiva,
isto é, que qualquer que seja o grupo de preferências dos indivı́duos considerado, a regra leve
a uma preferência social (que pode ser indiferença entre x e y). A segunda condição, simetria
ou anonimato, estabelece que todos os indivı́duos recebem o mesmo peso na regra. A terceira
condição estabelece que as duas alternativas devem ter o mesmo status quo, nenhuma alternativa
recebe a priori um peso maior na regra. Finalmente, a quarta condição estabelece que se para um
determinado grupo de indivı́duos, a escolha social for a alternativa x ou a indiferença entre as duas
alternativas, e se um indivı́duo mudar de posição em direção à alternativa x (isto é, se antes ele
preferiria y, agora ele é indiferente entre x e y ou passa a preferir x, ou se antes ele era indiferente
entre x e y, ele passa a preferir x estritamente), e todos os outros indivı́duos continuam com as
mesmas preferências de antes, então a regra de escolha social resultará em x estritamente preferı́vel
a y.

José Guilherme de Lara Resende 3 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

Condição 1: Decisiva. A função f de bem-estar social é bem definida e assume um único valor
para todo elemento de U I .

Condição 2: Simetria ou Anonimato. A função f trata todos os indivı́duos de modo igual,


ou seja, temos que f (D1 , . . . , DI ) = f (Dπ(1) , . . . , Dπ(I) ), onde π : {1, . . . , I} → {1, . . . , I} é uma
permutação dos indivı́duos (π é uma bijeção).

Condição 3: Neutralidade entre as alternativas. A função f trata as duas alternativas de


modo igual, ou seja, temos que f (D1 , . . . , DI ) = −f (−D1 , . . . , −DI ).

Condição 4: Resposta Positiva. Se para um certo grupo de preferências individuais, a alter-


nativa y não era escolhida, e se pelo menos um indivı́duo muda a sua preferência na direção de x,
então x passa a ser escolhido. Logo, temos que se D = f (D1 , . . . , DI ) ≥ 0 e D̃i = Di para todo
i 6= i0 , e D̃i0 > Di0 , então f (D̃1 , . . . , D̃I ) = 1.

Teorema de May. A função de bem-estar social f é de votação majoritária se, e somente se, é
decisiva, simétrica, neutra entre as alternativas e de resposta positiva.

O Teorema de May não só garante que a regra de votação majoritária é decisiva, simétrica,
neutra entre as alternativas e de resposta positiva (parte mais fácil de verificar), mas também que
se uma regra de decisão for decisiva, igualitária, neutra entre as alternativas e de resposta positiva,
então ela necessariamente será a regra de votação majoritária (parte mais difı́cil de verificar). Logo,
o Teorema de May constitui uma caracterização completa da regra de votação majoritária.

1.3 Paradoxo de Condorcet (Paradoxo da Votação)

No caso de apenas duas alternativas, o requerimento de a regra social ser transitiva não é
relevante. Se tivermos três ou mais alternativas, transitividade passa a ser importante. O requisito
de transitividade exige uma coerência na escolha social que nem sempre será satisfeita, mesmo que
todas as preferências individuais sejam completas e transitivas.
Vamos estender a regra de votação majoritária vista acima do seguinte modo. A regra de
votação majoritária aos pares estabelece que todos os pares possı́veis de alternativas são postos em
votação, um par por vez. Em cada rodada, o vencedor da votação será a alternativa socialmente
preferı́vel. Logo, se colocarmos em votação as alternativas x vs y, se x tiver mais votos, então
x S y. Se tiverem o mesmo número de votos, x ∼S y. E se y tiver mais votos, y S x.

Definição: Vencedor de Condorcet. Dizemos que uma alternativa é um vencedor de Condorcet


se ela ganhar de todas as outras alternativas na votação majoritária aos pares.

Considere o seguinte exemplo bem simples, com apenas três alternativas, x, y e z, e três in-
divı́duos, 1, 2 e 3. As preferências dos três indivı́duos estão resumidas na tabela abaixo:

Posição Indivı́duo 1 Indivı́duo 2 Indivı́duo 3


Primeira x y z
Segunda y z x
Terceira z x y

José Guilherme de Lara Resende 4 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

Existem três combinações de pares para a votações majoritária, que levam aos resultados abaixo:

x vs y ⇒ x S y 
y vs z ⇒ y S z ⇒ x S y, y S z, z S x
x vs z ⇒ z S x
 | {z }
S não é transitiva!

Ou seja, mesmo que todas as preferências individuais sejam transitivas, pode ocorrer que a regra
de escolha social leve essas preferências individuais a uma preferência social intransitiva. Para o
grupo de preferências acima, não existe um vencedor de Condorcet. Regras de escolha social que
levem a preferências socias não transitivas podem trazer problemas de manipulação de agenda,
como discutiremos a seguir.

Suponha que a regra de escolha social é tal que, no caso de três alternativas x, y e z, se a agenda
de votação for (x, y, z), então primeiro vota-se x vs y, e depois vota-se o vencedor dessa primeira
votação contra z. Podemos ter três agendas de votação diferentes, levando aos resultados abaixo
para o caso das preferências apresentadas na tabela acima:
(x, y, z) : x vs y ⇒ x ganha, x vs z ⇒ z ganha
(y, z, x) : y vs z ⇒ y ganha, y vs x ⇒ x ganha
(z, x, y) : z vs x ⇒ z ganha, z vs y ⇒ y ganha
Logo, para o grupo de preferências descrito acima, quem define a agenda de votações define a
alternativa vencedora.
Observe que o exemplo acima exige que as preferências dos indivı́duos sejam de conhecimento de
todos. Isso possibilita votação estratégica, em que não é mais do interesse de um ou mais eleitores
revelar corretamente as suas verdadeiras preferências, votando na sua alternativa preferida.
Por exemplo, suponha que o indivı́duo 1 define a agenda de votação. Ele decide implementar a
agenda (y, z, x), que leva a escolha de x, sua alternativa preferida. Essa é a pior alternativa para
o indivı́duo 2. Se este decidir na primeira rodada de votação, entre y e z, votar em z, z passa
a ser escolhido em vez de y. Na segunda rodada de votação, a alternativa x será preterida e z
será escolhida. Logo, o indivı́duo 2, ao revelar incorretamente a sua preferência, consegue afetar
o resultado e fazer com que a sua segunda melhor alternativa, z, seja escolhida no lugar da sua
terceira melhor alternativa, x.
Logicamente, a análise se complica: os outros eleitores podem também decidir votar estrategi-
camente, não revelando corretamente suas preferências. Nesse caso, devemos analisar o problema
de votação como um jogo e procurar por equilı́brios de Nash. Observe que a discussão acima mostra
que a situação em que o indivı́duo 1 define a agenda (y, z, x) e todos votam de acordo com suas
preferências verdadeiras não é um equilı́brio de Nash (mais especificamente, vimos que o indivı́duo
2 revelar corretamente sua preferência não é a melhor resposta quando os eleitores 1 e 3 revelam
suas preferências verdadeiras).
Não vamos nos aprofundar mais na questão de comportamento estratégico agora. O ponto prin-
cipal que desejamos enfatizar é o de que, em situações onde existam três ou mais alternativas, a
regra de votação majoritária aos pares pode associar preferências sociais não transitivas a determi-
nados conjuntos de preferências individuais que são todas completas e transitivas. Essas situações
podem gerar problemas como manipulação de agenda e votação estratégica. Vamos investigar se
existe alguma regra de escolha social que não incorra nesses problemas e satisfaça certas propri-
edades, como levar sempre a preferências sociais completas e transitivas. O Teorema de Arrow
responde essa questão.

José Guilherme de Lara Resende 5 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

1.4 Teorema de Arrow

O Teorema de Arrow (Arrow, 1951) verifica a existência de uma regra de escolha social que
agregue as preferências individuais de “modo satisfatório”. As condições do Teorema de Arrow
são exigências de caráter normativo sobre a regra de escolha social f que gera a decisão do grupo
analisado, S = f (1 , . . . , N ). Note que f associa a cada grupo de preferências individuais uma
preferência social, ou seja, (1 , . . . , N ) 7→S . Os pressupostos do Teorema de Arrow são discutidos
f
abaixo.

Domı́nio Irrestrito (ou Universal). O domı́nio de f inclui todas as combinações possı́veis de


preferências sobre o espaço de alternativas X.

Essa condição impõe sobre a regra social f a capacidade de associar qualquer grupo de pre-
ferências individuais a uma preferência social. Portanto, o mecanismo de escolha social é válido
qualquer que seja o grupo de preferências individuais considerado.

Princı́pio Fraco de Pareto. Para qualquer par de alternativas x e y tal que x i y para todo
indivı́duo i, então x S y.

Essa condição impõe um critério de unanimidade no mecanismo de escolha social. Podemos


definir outros criterios de unanimidade (por exemplo, com preferências fracas).

Não-Ditadorial. Não existe indivı́duo h tal que se x h y então x S y, quaisquer que sejam as
preferências dos outros indivı́duos que não h.

Essa condição elimina a possibilidade de um ditador na sociedade. Isso não exclui o fato de que
a escolha social coincida, para um certo grupo de preferências, com a ordenação de algum ou de
alguns indivı́duos.

Independência das Alternativas Irrelevantes (IAI). Sejam dois conjuntos de preferências


˜ 1, . . . , 
individuais (1 , . . . , I ) e ( ˜ I ), que são levados pela regra de escolha social f às preferências
˜
sociais S = f (1 , . . . , I ) e S = f ( ˜ 1, . . . , 
˜ I ) e sejam x e y duas alternativas quaisquer em X.
Se cada indivı́duo ordena x versus y em i do mesmo modo que ordena x versus y em  ˜ i então o
ordenamento social de x versus y será o mesmo em S e em S . ˜

A IAI é a mais sutil das condições do Teorema de Arrow. Ela impõe à regra de escolha social a
propriedade de que o ordenamento entre duas alternativas dependa apenas dessas duas alternativas,
e que não seja afetado por nenhuma outra alternativa diferente de x e y. Vamos discutir um exemplo
para deixar essa condição mais clara.

Mecanismo de Escolha de Borda. A regra de escolha social de contagem de Borda pode tomar
diversas formas. O mecanismo de contagem de Borda consiste em cada indivı́duo i reportar a sua
preferência, como numa votação em lista. Daı́ associamos um número ci (x) para a alternativa x
para cada alternativa x ∈ X e para cada indivı́duo i. Calculamos a pontuação de Borda c(x) para
a alternativa x como:
X I
c(x) = ci (x)
i=1

A preferência social é definida comparando as pontuações de Borda de todas as alternativas.

José Guilherme de Lara Resende 6 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

Por exemplo, suponha que ci (x) = n, onde n é a posição de preferência de x para i. Por
exemplo, se c1 (x) = 2, então x é a segunda alternativa preferida do indivı́duo 1. Vamos supor
por enquanto que os indivı́duos ordenam todas as alternativas de modo estrito, para simplificar a
exposição. Neste caso, a regra de escolha da contagem de Borda é definida por:
I
X I
X
x S y ⇔ c(x) = ci (x) ≤ ci (y) = c(y)
i=1 i=1

É possı́vel mostrar que regras de escolha social do tipo contagem de Borda:

• Levam sempre a preferências sociais completas e transitivas;

• São de domı́nio irrestrito (podemos lidar com empates facilmente);

• Satisfazem o princı́pio fraco de Pareto,

• Não são ditadoriais.

Porém, a contagem de Borda não satisfaz o critério de independência das alternativas irrele-
vantes, pois o ordenamento social de duas alternativas pode depender do posicionamento de outras
alternativas, como o exemplo a seguir ilustra.

Exemplo: Suponha dois indivı́duos, 1 e 2, e três alternativas, x, y e z. Considere duas possı́veis


situações para as preferências dos dois indivı́duos:

x 1 z 1 y ⇒ c1 (x) = 1, c1 (y) = 3
Situação A: ⇒ x S y
y 2 x 2 z ⇒ c2 (x) = 2, c2 (y) = 1

x 1 y 1 z ⇒ c1 (x) = 1, c1 (y) = 2
Situação B: ⇒ y S x
y 2 z 2 x ⇒ c2 (x) = 3, c2 (y) = 1

Nas duas situações, os ordenamentos individuais entre x e y são os mesmos. Porém, o


mecanismo de Borda resulta em ordenamentos sociais entre x e y distintos, devido à presença da
alternativa z. Logo, z não é sempre irrelevante quando definimos o ordenamento social de x e y
segundo a regra de escolha social de contagem de Borda. Isso significa que essa regra não satisfaz
a hipótese de independência das alternativas irrelevantes.

Arrow (1951) mostrou que o fato de a contagem de Borda não satisfazer IAI não é por acaso. O
Teorema de Arrow prova que quando existem três ou mais alternativas, não existe nenhuma regra
de escolha social que leve sempre a ordenamentos sociais completos e transitivos e que satisfaça as
condições elencadas acima.
Então, supondo três ou mais alternativas, como é possı́vel mostrar que o mecanismo de Borda
leva sempre a preferências completas e transitivas, é de domı́nio universal, satisfaz o princı́pio fraco
de Pareto e não é ditadorial, o Teorema de Arrow implica que esse mecanismo não pode satisfazer
a condição de independência das alternativas irrelevantes.

José Guilherme de Lara Resende 7 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

Teorema da Impossibilidade de Arrow (versão I). Se existem pelo menos três alternativas
em X, então não existe regra de escolha social f que resulte sempre em uma preferência social
S completa e transitiva e tal que satisfaça as condições de domı́nio universal, princı́pio fraco de
Pareto e independência das alternativas irrelevantes e que seja não-ditadorial.

Teorema da Impossibilidade de Arrow (versão II). Se existem pelo menos três alternativas
em X, então a única regra de escolha social f que resulta sempre em uma preferência social S
completa e transitiva e tal que satisfaça as condições de domı́nio universal, princı́pio fraco de Pareto
e independência das alternativas irrelevantes é a regra de escolha social ditadorial.

O Teorema de Arrow possui uma conclusão negativa: é impossı́vel esperar que uma sociedade
se comporte com a mesma coerência que podemos esperar de um indivı́duo racional (no sentido de
preferências completas e transitivas). Esse problema de coerência mostra que detalhes institucionais
e procedimentos do processo polı́tico são importantes. Ou seja, tomadas de decisões em grupo podem
gerar resultados arbitrários e manipulação. O processo instituticional pode e deve constituir uma
restrição a esses problemas.
Diversos autores da área de ciência polı́tica incorporaram o resultado de Arrow em suas análises
(por exemplo, ver Shepsle and Boncheck (1995); Austen-Smith and Banks (1996)). Além disso,
estes autores passaram a utilizar ferramentas como teoria dos jogos para auxiliar essas análises.

José Guilherme de Lara Resende 8 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

1.5 Função de Bem-Estar Social

Vamos agora proceder de modo diferente com respeito ao problema de escolha social. Suponha
que cada indivı́duo tenha uma utilidade definida sobre o conjunto das alternativas existentes. Vamos
representar a utilidade do indivı́duo i sobre a alternativa x por ui (x).

Definição. Uma função de bem-estar (FBE) W é uma função definida sobre as funções de utilidade
individuais, W = W (u1 , . . . , uI ).

Se W for crescente em cada um dos seus argumentos, então quanto maior o nı́vel de utilidade,
maior o valor de W . Neste caso dizemos que W é uma função de bem-estar social (FBES).

Exemplos:

• FBES utilitarista ou de Bentham:


I
X
W (u1 , . . . , uI ) = ui .
i=1

• FBES da soma ponderada das utilidades:


I
X
W (u1 , . . . , uI ) = ai u i , com ai ≥ 0 ∀ i.
i=1

• FBES Rawlsiana:
W (u1 , . . . , uI ) = min{u1 , . . . , uI }.

• FBES com elasticidade de aversão à desigualdade constante:

W (u1 , . . . , uI ) = (a1 uρ1 + a2 uρ2 · · · + an uρn )1/ρ ,

com ai ≥ 0 ∀ i, e 0 6= ρ < 1.

As FBES dependem da representação usada para a utilidade individual. Sabemos que a uti-
lidade de um indivı́duo não é única: qualquer transformação crescente dela representao a mesma
ordenação, ou seja, a mesma pessoa. Porém, ao utilizarmos determinada forma funcional de uma
FBES, estamos assumindo que é possı́vel fazer comparações entre funções de utilidades de indivı́duos
diferentes.
Suponha que a alternativa x defina uma cesta de consumo para cada indivı́duo, x = (x1 , . . . , xI ).
Suponha também que cada indivı́duo i tenha uma dotação inicial ei . Se a utilidade de cada in-
divı́duo i depende da alocação x para todos os indivı́duos, então existem externalidades de consumo:
o bem-estar de uma pessoa depende não somente do que ela consome, mas também do que os outros
consomem. Vamos supor a partir de agora de que a utilidade de uma pessoa depende apenas da sua
própria cesta: ui (xi ), para todo i = 1, . . . , I. Neste caso dizemos que W (u1 (x1 ), u2 (x2 ), . . . , uI (xI ))
é uma FBES individualista ou de Bergson-Samuelson.

José Guilherme de Lara Resende 9 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

u2
6

sMáximo da FBES W

Conjunto de
Possibilidade
de Utilidade
Curva de Isobem-Estar
-
u1

Considere o seguinte problema de maximização:


X X
max W (u1 (x1 ), u2 (x2 ), . . . , uI (xI )) s.a. xi = ei ,
x
i i

onde W é uma FBES. Como toda FBES é crescente, então a alocação ótima será Pareto eficiente.
As curvas de indiferença de W são chamadas curvas de isobem-estar. A figura acima ilustra esse
problema graficamente.
Mais ainda, qualquer alocação Pareto eficiente pode ser o resultado da maximização de alguma
FBES. Em particular, se maximizarmos a FBES da soma ponderada das utilidades variando os
pesos ai , obtemos qualquer ponto da FPU como solução ótima. Para que este resultado seja válido,
é necessário que o conjunto de possibilidade de utilidades seja convexo.
Observe então que existe uma relação estreita entre FBES e alocações eficientes: toda solução
de um problema de maximização de uma FBES crescente é eficiente e toda alocação
eficiente é solução de um problema de maximização de bem-estar social, para uma
FBES apropriada.

Referências

Arrow, K. (1951). Social choice and individual values. New York: John Wiley.
Austen-Smith, D., & Banks, J. (1996). Positive political theory. Ann Arbor: University of Michigan
Press.
May, K. O. (1952). A set of independent necessary and sufficient conditions for simple majority
decision. Econometrica, 20:4 , 680-684.
Shepsle, K., & Boncheck, M. (1995). Analysing politics. New York: W. W. Norton.
Varian, H. (2012). Microeconomia – uma abordagem moderna (8a edição). Elsevier/Editora
Campus.

José Guilherme de Lara Resende 10 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

Exercı́cios

1. Mostre que a regra de votação majoritária aos pares, conforme definida em sala, satisfaz as
propriedades de anonimato, neutralidade entre as alternativas e resposta positiva.
2. Mostre que uma regra de escolha social que satisfaz as propriedades de resposta positiva e
neutralidade entre as alternativas satisfaz a seguinte propriedade:

Propriedade de Resposta Negativa. Se D = f (D1 , . . . , DI ) ≤ 0 e D̃i = Di


para todo i 6= i0 , e D̃i0 < Di0 , então f (D̃1 , . . . , D̃I ) = −1.

Interprete intuitivamente a propriedade acima.


3. Considere uma eleição com 3 candidatos, A, B e C, e quatro eleitores, onde as preferências
desses eleitores é descrita na seguinte tabela, em ordem decrescente de preferência:

Eleitor 1 Eleitor 2 Eleitor 3 Eleitor 4


A A B C
B B C B
C C A A

Assuma que o método de votação é dado pela contagem de Borda (votação em lista). Suponha
que ninguém vote estrategicamente.

a) Calcule um sistema de pesos para o sistema de Borda onde o candidato A ganha, se tal
sistema de pesos existir.
b) Calcule um sistema de pesos para o sistema de Borda onde o candidato B ganha, se tal
sistema de pesos existir.
c) Considere o sistema de pesos calculado para o item b). Existe algum incentivo para
algum eleitor votar estrategicamente?

4. Considere as seguintes regras de votação:

Regra de Copeland: Fixe uma alternativa, digamos x. Compare essa alternativa


x com toda outra alternativa y. Em cada comparação, agracie 1 se a maioria
prefere x a y, −1 se a maioria prefere y a x e 0 se ocorre empate. Some os pontos
de todas as comparações da alternativa x. Repita esse procedimento para toda
alternativa existente. A alternativa com a maior soma (Copeland score) é o vencedor
de Copeland.
Regra de Simpson: Fixe uma alternativa, digamos x. Para toda outra alternativa
y, calcule o número N (x, y) dos eleitores que preferem (fracamente)
 xa
y. O score
de Simpson para a alternativa x é o menor N (x, y) em y minN (x, y) . Repita
y
esse procedimento para toda alternativa existente. A alternativa com o maior score
de Simpson é o vencedor de Simpson.
Regra de Borda Modificada: Cada eleitor ordena as cinco alternativas da mais
preferida à menos preferida (sem empates). A alternativa ordenada por último
recebe 0 pontos, a quarta recebe 1 ponto, a terceira recebe 2 pontos, a segunda
recebe 3 pontos e a primeira recebe 4 pontos. Some os pontos de todos os eleitores.
A alternativa com maior pontuação é o vencedor de Borda.

José Guilherme de Lara Resende 11 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

Considere a seguinte ordenação (estrita) de preferências, entre 9 eleitores e cinco alternativas:

Número de eleitores: 1 4 1 3
a c e e
b d a a
c b d b
d e b d
e a c c

a) Identifique os vencedores de Copeland e de Simpson.


b) Calcule o vencedor de Borda para o critério acima. Compare o vencedor de Borda com
o vencedor de Copeland.
c) Encontre três sistemas de pesos positivos (diferentes de zero) para uma regra do tipo de
Borda tal que o primeiro eleja c, o segundo eleja b e o terceiro eleja d.

5. Verifique quais condições do Teorema de Arrow as regras de escolha social listadas abaixo
satisfazem. Argumente de modo convincente caso a regra satisfaça alguma condição e forneça
um contra-exemplo caso contrário.

a) Votação majoritária aos pares;


b) Votação majoritária normal;
c) Regra ditadorial;
d) Contagem de Borda.

6. Argumente de modo convincente que se existem apenas duas alternativas, a regra de votação
majoritária satisfaz as hipóteses do Teorema de Arrow.
7. Considere uma eleição com quatro candidatos, A, B, C e D e cinco eleitores, onde as pre-
ferências desses eleitores são descritas na seguinte tabela, em ordem decrescente de preferência:

Eleitor 1 Eleitor 2 Eleitor 3 Eleitor 4 Eleitor 5


A A B C D
B D C B B
C C A D C
D B D A A

Assuma que a regra de escolha social é definida pela maioria simples, onde cada eleitor vota
em apenas uma das alternativas e a alternativa mais votada é a escolhida.

a) Suponha que ninguém vote estrategicamente, ou seja, cada eleitor seleciona a sua alter-
nativa preferida. Qual é a alternativa eleita?
b) Mostre que para as preferências exibidas na tabela acima, existe possibilidade de voto
útil, ou seja, algum ou alguns eleitores selecionarem uma alternativa diferente da sua
preferida.
c) Qual ou quais condições do Teorema de Arrow o sistema de votação descrito acima não
satisfaz? Justifique a sua resposta.

José Guilherme de Lara Resende 12 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

8. (P1-1/2019) Existem três indivı́duos na sociedade, {1, 2, 3}, três alternativas, {A, B, C}, e o
domı́nio das preferências é irrestrito. Suponha que a relação de preferência social, S , é dada
por votação majoritária, ou seja, cada indivı́duo escolhe uma das alternativas, coloca em uma
urna, onde contam-se o número de votos e é escolhida a alternativa com maior número de
votos (se ocorrer empate, então o indivı́duo 1 escolhe a alternativa preferida, em um voto de
minerva), ordenando as alternativas seguintes pelo número de votos recebido. Assuma que
cada indivı́duo conhece as preferências de todos os outros eleitores.

(a) Considere o seguinte conjunto de preferências, onde i denota a relação de preferência


estrita de i:

Indivı́duo 1: A 1 B 1 C
Indivı́duo 2: B 2 C 2 A
Indivı́duo 3: C 3 A 3 B

Se todos os três indivı́duos votarem na sua alternativa preferida, qual será escolhida?
(b) Existe algum indivı́duo que tem incentivo para voto útil, ou seja, para votar não na
alternativa preferida, mas sim em outra?
(c) Quais das hipóteses do Teorema de Arrow são satisfeitas pela regra de votação acima?
Quais não são satisfeitas? Argumente de modo claro e sucinto.

9. (JR) Suponha que existam três indivı́duos numa sociedade, {1, 2, 3}, três alternativas, {x, y, z},
e que a regra de escolha social f é a votação majoritária aos pares, com domı́nio irrestrito,
de modo que a qualquer indiferença obtida é resolvida votando x primeiro do que y e depois
z, se a regra resultar em uma preferência social transitiva. Se a regra não resultar numa
preferência social transitiva, então o ordenamento social será x S y S z.

(a) Considere o seguinte grupo de preferências individuais:

Indivı́duo 1: x 1 y 1 z
Indivı́duo 2: y 2 z 2 x
Indivı́duo 3: z 3 x 3 y

Qual é o ordenamento social neste caso?


(b) Qual seria a preferência social se em (a) a preferência de 1 fosse y 1 z 1 x? E se fosse
z 1 y 1 x?
(c) Argumente que f satisfaz o princı́pio fraco de Pareto.
(d) Prove que f não é ditadorial.
(e) Conclua que f não satisfaz IAI usando o Teorema de Arrow.
(f) Mostre diretamente que f não satisfaz IAI criando dois grupos de preferências e obtendo
a preferência social de cada um deles de modo que viole IAI.

José Guilherme de Lara Resende 13 NA 2 – Escolha Social


Microeconomia 2 Notas de Aula

MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 3 – Externalidades e Bens Públicos
Prof. José Guilherme de Lara Resende

1 Externalidades
1.1 Introdução

Definição: Externalidade. Dizemos que ocorre uma externalidade quando o bem-estar de um


agente econômico (indivı́duo ou firma) é afetado diretamente pelas ações de outro agente econômico,
que não por meio de mercados. A externalidade pode ser negativa (se piora o bem-estar do agente)
ou positiva (se melhora o bem-estar do agente).

Uma externalidade de consumo ocorre quando a ação de um agente afeta a utilidade (ou
utilidades) de outro agente (outros agentes). Uma externalidade de produção ocorre quando
a tecnologia de alguma ou algumas firmas afeta o bem-estar de outros agentes. Assim como a
externalidade de consumo, a externalidade de produção pode ser positiva ou negativa.
O ponto principal da externalidade em termos econômicos é a inexistência do mercado para o
bem ou serviço gerado pela atividade causadora da externalidade. Quando ocorre uma externali-
dade, o custo (se a externalidade for negativa) ou o benefı́cio (se a externalidade for positiva) social
da ação do agente será diferente do custo ou benefı́cio privado. Esta discrepância entre o custo ou
benefı́cio social e o custo ou benefı́cio privado pode tornar a decisão privada distinta da decisão
socialmente ótima, mesmo em um mercado perfeitamente competitivo.
No caso de uma externalidade negativa, o nı́vel de atividade estará acima de seu nı́vel social-
mente ótimo. No caso de uma externalidade positiva, o nı́vel de atividade estará abaixo de seu
nı́vel socialmente ótimo. Isso ocorre porque o custo (ou benefı́cio) associado à externalidade não é
levado em conta pelo agente causador da externalidade.
Nesse caso, o primeiro teorema do bem-estar não é mais válido em geral : na presença de
externalidades, a alocação de mercado pode ser ineficiente no sentido de Pareto.

Exemplos:

• Fumantes e não fumantes: dois colegas de quarto, um fumante e outro não fumante. Ao
fumar, o fumante diminui o bem-estar do seu colega.

• Poluição: uma firma que polui um rio, sem considerar o dano que atinge o rio e a comunidade
ribeirinha presente.

• Trens e faı́scas (Coase): a passagem de trens pelos trilhos gera faı́scas que podem causar
incêndios em plantações.

• Abelhas e polinização: exemplo clássico de externalidade positiva, em que abelhas ajudam a


polinizar plantações.

José Guilherme de Lara Resende 1 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

Para ajudar o entendimento, vamos supor um modelo simples (Varian (2012), capı́tulo 34,
“Externalidades”, e Nicholson and Snyder (2008), capı́tulo 19, “Externalities and Public Goods”)
com duas firmas, A e B, onde a firma A, ao produzir o seu bem na quantidade yA , escolhe uma
quantidade xA de poluição, que afeta os custos de produção da firma B, denotados por cB (yB ; xA ).
As duas firmas estão inseridas em mercados competitivos, logo tomam os preços dos bens que
produzem como dados e procuram maximizar os seus lucros. O problema de maximização de lucro
da firma A é:
max pA yA − cA (yA , xA ) ,
yA ,xA

onde pA denota o preço do bem que a firma A produz e a função custo da firma A satisfaz ∂cA /∂yA >
0, ∂ 2 cA /∂yA2 > 0, ∂cA /∂xA < 0. Note que estamos assumindo que quanto maior o nı́vel de produção
de poluição, menor será o custo de produzir o bem yA pela firma A. Podemos modificar essa hipótese
de diversas formas, como, por exemplo, assumir que a produção de yA gera diretamente um nı́vel
único de poluição xA , de tal modo que a decisão da firma A é relativa apenas à quantidade de yA
que irá produzir, que gera uma quantidade de poluição associada.
As condições de primeira ordem do problema da firma A resultam em:

∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : =0
∂xA

A primeira CPO é a condição usual preço igual a custo marginal, que determina a oferta ótima
de uma firma competitiva. A segunda CPO diz que a firma irá escolher a quantidade ótima de
poluição de modo a igualar o custo marginal de poluir a zero.
Já o problema de maximização de lucros da firma B é dado por:

max pB yB − cB (yB , xA ) ,
yB

que resulta na CPO pB = ∂cB (yB , xA )/∂yB . A quantidade de poluição gerada pela firma A afeta
os custos da firma B, mas a firma A não leva esse efeito em conta. Temos então uma externalidade
negativa gerada na produção do bem yA . Vamos encontrar qual a quantidade de poluição socialmente
ótima, levando em conta os efeitos sobre a firma B. Uma forma de encontrar esse valor é por meio
de uma fusão das duas firmas, que passa então a maximizar o seu lucro produzindo os dois bens
yA e yB :
max pA yA + pB yB − cA (yA , x) − cB (yB , x) ,
yA ,yB ,x

As CPOs desse problema resultam em:

∂cA (yA , x)
(yA ) : = pA
∂yA
∂cB (yB , x)
(yB ) : = pB
∂yB
∂cA (yA , x) ∂cB (yB , x)
(x) : =−
∂x ∂x
As duas primeiras CPOs mostram que a firma integrada continua a decidir a quantidade ótima a
ser produzida de cada bem igualando preço ao custo marginal para cada um desses bens.

José Guilherme de Lara Resende 2 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

A terceira CPO mostra que a quantidade socialmente ótima de x é determinada igualando o


custo marginal em A de emissão de x ao negativo do custo marginal em B com a emissão ocorrida
de x. Vemos então que a firma integrada internalizou o custo da poluição sobre a firma B em
seu processo decisório. Vamos supor que os custos marginais de produção de A e de B em x
são crescentes. Isso leva ao gráfico abaixo, que mostra que a quantidade socialmente ótima de
poluição, denotada por x∗∗ , é menor do que a quantidade privada, denotada por x∗ . Portanto, a
solução privada leva a uma quantidade de poluição superior ao socialmente desejável.

Preço
6

∂cB /∂x
Q 

x∗∗ : Ótimo Social
Q 
Q 
Q
Q
Q 
 x∗ : Ótimo Privado
Q
s
Q 

x∗∗ < x∗
QQ
 Q
 Q
 Q
 Q

 Q
Q
−∂cA /∂x
 Q
Q 
Q
Q
Q -
x
x∗∗
Q∗
x

De modo geral, se o mercado operar livremente numa situação de externalidade negativa, a


quantidade produzida pelo mercado será maior que a quantidade ótima do ponto de vista social
(qM > qS , na figura abaixo). Portanto, a existência de uma externalidade leva a uma ineficiência,
pois o benefı́cio marginal total de uma atividade não se iguala ao seu custo marginal total (custo
marginal privado somado ao custo marginal social). Nesses casos, é possı́vel melhorar a alocação
de mercado (isto é, alcançar uma alocação Pareto-ótima). Obviamente, isso não significa que toda
intervenção feita será perfeita ou factı́vel de ser implementada na prática. Diversos problemas,
como assimetrias informacionais, podem dificultar esse processo de intervenção.

Preço
6
Custo social
 Oferta (custo privado)
Q  
 
Q  
Q  
Q  
Q s 
Ótimo Social Q
 
 QQsEquilı́brio de Mercado
 
  Q
  Q
  Q
 Q
 Q
 Q
 QQ
Demanda

-
qS qM Quantidade

José Guilherme de Lara Resende 3 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

1.2 Soluções

As soluções para o problema de externalidades consistem em:


1. Impostos, subsı́dios, quotas (imposto de Pigou);

2. Alocação de direitos de propriedade (Teorema de Coase);

3. Criação de mercados.

As soluções para o problema de externalidades consistem em “internalizar” a externalidade,


no sentido de que todos os custos (ou benefı́cios, no caso de uma externalidade positiva) sociais
sejam levados em conta na hora de decidir o nı́vel ótimo de externalidade a ser produzido. Três
soluções clássicas são relacionadas a: 1) impostos Pigouvianos, 2) Teorema de Coase, e 3) criação
de mercados.

Impostos de Pigou

Um outro mecanismo de correção da ineficiência gerada por uma externalidade é colocar um


imposto sobre a produção no valor do custo social da externalidade (Pigou, 1920). Neste caso, a
curva de custo marginal privado se desloca para cima, coincidindo com a curva de custo social.
Esse tipo de imposto, chamado imposto de Pigou (ou subsı́dio, no caso de uma externalidade
positiva) tenta corrigir a ineficiência causada pela externalidade. A taxa é escolhida de modo que
o nı́vel socialmente ótimo da atividade geradora da externalidade seja alcançado.
Em ambos os tipos de externalidade, o efeito da taxa (ou subsı́dio) é fazer com que o agente gera-
dor da externalidade incorpore em sua tomada de decisão o custo real de suas ações (“internalizar”
a externalidade).
Voltando ao nosso exemplo acima das firmas A e B, caso o governo institua um imposto no
valor t por unidade de poluição emitida, o problema da firma A se torna:

max pA yA − cA (yA , xA ) − txA ,


yA ,xA

As condições de primeira ordem do problema da firma A resultam em:


∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : =t
∂xA
Se o governo fixar t∗ = ∂cB (yB∗∗ , x∗∗ )/∂x, então observe que a firma A irá escolher a quantidade
socialmente ótima x∗∗ e não mais a quantidade x∗ . O imposto Pigouviano t∗ fez com que a firma
A internalizasse em seu processo decisório o custo que emitir x gera sobre a firma B.
O governo poderia alternativamente fixar uma quota e limitar a emissão de x da firma A ao
máximo de x∗∗ . Ou poderia dar um subsı́dio s = −t à firma A para cada unidade de x emitida.
Neste caso, o custo de oportunidade para A de emitir x não é mais zero e sim o valor do subsı́dio,
o que faz com que a firma A reduza a sua emissão de x para o nı́vel socialmente ótimo. As três
polı́ticas alcançam o objetivo de alcançar o nı́vel socialmente ótimo de emissão de x, mas possuem
consequências distributivas diferentes.

José Guilherme de Lara Resende 4 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

Observações sobre Solução via Impostos, Subsı́dios, Quotas:

1. O governo deve taxar a atividade geradora da externalidade diretamente (por exemplo, taxar
o lucro não diminuirá o nı́vel de externalidade).

2. O governo pode optar por um esquema de subsı́dio para redução da externalidade, ao invés
de taxar a externalidade.

3. A solução exige que o governo conheça os beneficı́os e custos exatos que envolvem o problema
de externalidade. Se esse é o caso, o governo poderia simplesmente impor quotas de produção
ou exigir diretamente que a firma produzisse a quantidade socialmente ótima do bem.

Alocação de Direitos de Propriedade

O problema de externalidade pode ser visto como um problema de alocação incorreta ou de


inexistência de direitos de propriedade. No nosso exemplo, se firma B fosse dona dos direitos de
propriedade de ambiente limpo, ela passaria levar em consideração a deterioração do rio em sua
decisão de produção. Logo, direitos de propriedade bem definidos podem fazer desaparecer a falha
de mercado gerada pelo problema de externalidade.
Exemplo: Suponha que os direitos de propriedade da atividade geradora da externalidade sejam
alocados ao agente X. Ou seja, o agente Y não pode incorrer na atividade geradora da externalidade
sem a concordância de X. Suponha que o agente Y faz uma oferta ao agente X de pagar T para
poder produzir a externalidade. O agente Y escolherá T de modo que a sua oferta seja aceita. Nesse
caso, pode ser mostrado que o nı́vel socialmente ótimo da externalidade é alcançado com a alocação
do direito de propriedade da atividade geradora da externalidade. Esse resultado é resumido pelo
teorema de Coase.

Teorema de Coase. Se a externalidade puder ser transacionada e se não existirem custos de


transação nem efeito renda (no caso de externalidades de consumo), então o resultado eficiente
será alcançado pelo mercado, independentemente de quem possua os direitos de propriedade da
atividade geradora da externalidade (Coase, 1960).

Do ponto de vista de eficiência, é irrelevante quem ganha os direitos de propriedade. Porém, a


alocação dos direitos influencia a distribuição de renda.
Em geral, a quantidade produzida de uma externalidade de consumo na alocação eficiente
depende da distribuição dos direitos de propriedade entre os consumidores. Porém, se a utilidade
for quaselinear, a quantidade produzida de externalidade independe da distribuição dos direitos de
propriedade e será, portanto, a mesma em toda alocação Pareto ótima.
Utilidades quaselineares resultam em efeito renda nulo, condição necessária para a validade do
Teorema de Coase no caso de externalidades de consumo. Observe também que a distribuição de
riqueza final dependerá da distribuição dos direitos de propriedade.
A solução dada pelo teorema de Coase exige apenas que o governo aloque e garanta direitos
de propriedade. Logo, não é necessário que o governo conheça os benefı́cios e custos associados
à externalidade. Sob esse ponto de vista informacional, a solução de Coase é mais fácil de ser
implementada. A hipótese de ausência de custos (ou custos baixos) de transação é crucial. Altos
custos de transação podem impedir que a solução eficiente seja alcançada.

José Guilherme de Lara Resende 5 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

Criação de Mercado

A presença de externalidade pode ser associada à ausência de mercados competitivos para a


externalidade. Para criar novos mercados, é necessário que os direitos de propriedade estejam
bem definidos e que exista um mercado competitivo para a atividade que gera a externalidade. O
mercado, nesse caso, age como um procedimento de barganha. Nessa solução, um novo mercado é
criado, de modo que a externalidade passa a ser negociada como um bem tradicional.

Exemplo: Mercado de Crédito de Carbono. O mercado de crédito de carbono é uma tentativa


de solução para o problema de poluição do ar por gás carbônico (CO2 ). Créditos de carbono são
certificados concedidos que permitem a emissão de uma tonelada de dióxido de carbono por cada
unidade de crédito de carbono. Esses créditos podem ser negociados no mercado internacional.
O mercado de créditos de carbono limita o nı́vel de poluição, ao limitar o número de créditos
existentes. Além disso, permite que seja alcançada uma alocação eficiente, pois os créditos serão
comprados pelas atividades produtivas que geram maior riqueza.

A solução via “mercado de créditos” exige menos informação do que uma solução via “imposto de
Pigou”, pois o governo deve conhecer apenas o nı́vel agregado socialmente ótimo de externalidade.
A alocação de direitos de propriedade não afeta o resultado de eficiência, porém tem consequências
distributivas. Esse tipo de solução cria incentivos para as firmas adotarem tecnologias que diminuam
a sua produção de externalidade, já que a externalidade passa a ser um custo para a firma.
Voltando ao nosso exemplo inicial das duas firmas A e B, vamos supor que se cria um mercado
para poluição e que x passe a ser transacionado a um preço px . Vamos supor que a firma B possui
os direitos de propriedade sobre poluição, de modo que qualquer poluição emitida, a receita gerada
vai para ela. O problema de maximição de lucros da firma A se torna:
max pA yA − cA (yA , xA ) − px xA ,
yA ,xA

As condições de primeira ordem do problema da firma A resultam em:


∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : − = px
∂xA

Já o problema de maximição de lucros da firma B se torna:


max pB yB + px xB − cB (yB , xB ) ,
yA ,xA

As condições de primeira ordem do problema acima resultam em:


∂cB (yB , xB )
(yB ) : = pB
∂yB
∂cB (yB , xB )
(xB ) : = px
∂xB
Igualando as CPOs dos problemas das duas firmas em x, por meio de px , obtemos que:
∂cB (yB , xB ) ∂cA (yA , xA )
=− ,
∂xB ∂xA

José Guilherme de Lara Resende 6 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

ou seja, o nı́vel ótimo de x será igual ao nı́vel socialmente ótimo. Por que isso ocorre? A firma A
passa a ter um custo px para emitir x. Ela irá comprar x até que o custo marginal de emissão de
x se iguale ao preço px . A firma B, que recebe a receita dessa venda de x por possuir os direitos
de propriedade de x, irá vender uma quantidade de x até que a receita marginal dessa venda, dado
por px , se iguale ao seu custo marginal de arcar com x na sua atividade produtiva. Portanto, por
meio de um mercado para x, a quantidade socialmente ótima de x é alcançada via negociação entre
as duas firmas.
O que ocorre se mudarmos o direito de propriedade de x para a firma A, de modo que agora
a firma B terá que pagar para A reduzir x? Nada em termos da quantidade de externalidade x
gerada, conforme prevê o Teorema de Coase. Para confirmarmos isso, vamos analisar o problema
da firma A, que agora é dado por:

max pA yA + px xA − cA (yA , xA )
yA ,xA

As condições de primeira ordem do problema da firma A resultam em:

∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : = px
∂xA

Já o problema de maximição de lucros da firma B se torna:

max pB yB − cB (yB , xB ) − px xB ,
yA ,xA

As condições de primeira ordem do problema acima resultam em:

∂cB (yB , xB )
(yB ) : = pB
∂yB
∂cB (yB , xB )
(xB ) : − = px
∂xB
Igualando as CPOs dos problemas das duas firmas em x, por meio de px , obtemos que:

∂cB (yB , xB ) ∂cA (yA , xA )


=− ,
∂xB ∂xA
ou seja, o nı́vel ótimo de x será igual ao nı́vel socialmente ótimo. Como postulou Coase, é irrelevante
para fins de alcançar a quantidade socialmente ótima de x quem possui os direitos de propriedade
sobre a atividade geradora da externalidade. Logicamente, em termos de bem-estar, essa alocação
dos direitos de propriedade possui consequências: se for para a firma A, ela terá um lucro maior do
que se fosse para firma B, e vice-versa. Além disso, Coase enfatizava que a hipótese de ausência de
custos de transação, implı́cita no nosso modelo, quase nunca seria satisfeita na prática. Isso torna
a solução via criação de mercados e alocação de direitos de propriedade mais complicada de ser
implementada.

José Guilherme de Lara Resende 7 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

1.3 Tragédia dos Comuns

A “tragédia dos comuns” ocorre quando um bem comunitário sofre de um problema do bem
escasso que não tem dono: cada agente tem incentivo a explorá-lo mais que o ótimo social, pois
se ele não o fizer outro agente o fará. Hardin (1968) popularizou esse termo em um artigo para a
revista Science.
Uma solução para este problema é a regulamentação por uma autoridade, usualmente o governo
ou uma associação comunitária. Essa regulamentação pode ser por meio de concessões, limitando
o montante do bem comum disponı́vel para uso por cada indivı́duo. Sistemas de concessão para
atividades econômicas extrativistas tais como mineração, pesca, caça, corte de árvores são exemplos
desta solução. O governo pode também impor limites de danos admissı́veis ao bem comum.
Outra solução que pode ser usada para certos recursos é transformar o bem comum em propri-
edade privada, fazendo com que o dono tenha incentivos para garantir a sustentabilidade do bem,
preservando-o.
Suponha que em uma região foi concedido livre acesso à pastores de ovelhas. Suponha que o
preço do metro cúbico de lã é R$ 1, e que a produção total de lã pode ser expressa pela função
f (n), em que n é o número de ovelhas no pasto. Vamos assumir que todas as ovelhas geram o
mesmo tanto de lã, de tal modo que f (n)/n representa a quantidade de lã gerada por uma ovelha.
Suponha que o custo de cada pastor com uma ovelha seja R$ c.
O número total de ovelhas será determinado pela condição de lucro zero, já que cada pastor
irá introduzir mais uma ovelha no pasto até que a receita obtida com essa ovelha se iguale ao seu
custo:
f (n∗ ) f (n∗ )
π =p× − c = 0 ⇒ p =c
n∗ n∗

A quantidade socialmente ótima de pastores pode ser determinada maximizando o lucro total
da atividade de pastoreio:
max p × f (n) − cn
n

A CPO desse problema resulta em:


pf 0 (n∗∗ ) = c
Portanto, os dois casos levam a soluções diferentes. No primeiro caso, os pastores igualam o valor
do produto médio, p × P M e(n) = pf (n)/n, ao custo marginal c. Já no segundo caso, o valor
do produto marginal, p × P M g(n) = pf 0 (n), é igualado ao custo marginal. Assumindo que mais
uma ovelha diminui a produção total de lã na média, então o produto médio será decrescente. Isso
implica que o produto marginal será sempre menor do que o produto médio. A figura abaixo ilustra
essa situação.

José Guilherme de Lara Resende 8 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

P M e,
P Mg 6

H
@HH
@ HH
@ H
@ HH
H
@ HH
@ H
HH
s Hs
@
c @ HH
@ H
@ HH
H
P Me
@
@
@
P Mg
-
n∗∗ n∗ n

A figura acima mostra que a quantidade socialmente ótima n∗∗ é menor do que a quantidade
determinada na solução do bem de recurso comum, n∗ . Um pastor, ao colocar mais uma ovelha no
pasto, afeta todos os outros pastores, pois uma ovelha a mais diminui a quantidade total de pasto
disponı́vel. Temos um problema de externalidade negativa.
A externalidade negativa neste caso é consequência de o pasto ser um bem de recurso comum,
o que leva a uma sobreutilização dele. Uma forma de resolver o problema seria transformar o pasto
um bem privado. Deste modo, o criador de ovelhas, dono do pasto, irá levar em conta o efeito de
cada ovelha sobre todas as outras e internalizará a externalidade.
Outras soluções são possı́veis. Uma seria estabelecer n∗∗ como o número máximo de ovelhas
permitidas. Pastores podem ter direito a um certo número de ovelhas e transacionar esses direitos
entre si, com o limite de manter o número total de ovelhas igual a n∗∗ .
Elinor Ostrom, ganhadora do prêmio Nobel em Economia em 2009, conjuntamente com Oliver
Williamson, fez importantes contribuições sobre problemas como a tragédia dos comuns e outros
semelhantes. O seu livro Governing the Commons se tornou uma referência clássica sobre o assunto
(Ostrom, 2015).

José Guilherme de Lara Resende 9 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

2 Bens Públicos
2.1 Definições

Samuelson (1954, 1955) definiu bem público (puro) como um bem com duas caracterı́sticas:
1. Não-rival: O consumo do bem por uma pessoa não limita ou diminui a quantidade disponı́vel
para consumo por outras pessoas;
2. Não-excludente: Não é possı́vel (ou é muito custoso) excluir indivı́duos do seu consumo.

Bens públicos podem ser vistos como um problema de externalidade de consumo onde todas
as pessoas são obrigadas a consumir a mesma quantidade do bem. Essa parte da nota de aula
baseia-se em Varian (2012), capı́tulo 36 (“Bens Públicos”) e Nicholson and Snyder (2008), cap. 19
- “Externalities and Public Goods” .
Classificamos os tipos de bens com relação à rivalidade e à possibilidade de exclusão do consumo
do seguinte modo (a tabela abaixo resume a terminologia descrita):
• Os bens privados são bens excludentes e rivais. Exemplos são bens de consumo, tais como
laranja, sorvete, automóvel.
• Os bens públicos são não-excludentes e não-rivais. Exemplos são segurança pública, ilu-
minação pública, defesa nacional, estradas sem pedágio descongestionadas.
• Os bens de recursos comuns são não-excludentes e rivais. Exemplos são peixes no oceano
ou em um rio, meio ambiente, estradas sem pedágio congestionadas.
• Os bens de clube são excludentes, mas não rivais. Exemplos são TV a cabo, estradas com
pedágio não congestionadas, corpo de bombeiro.

Rival Não Rival


Excludentes Bens Privados Bens de Clube
Não excludente Recursos Comuns Bens Públicos

Até agora lidamos sempre com bens privados: bens em que é possı́vel privar o consumo por
alguma pessoa, bastando para isso não vender o bem, e rivais no consumo, ou seja, se o bem for
consumido por alguém, ele não tem como ser consumido por outro pessoa.

2.2 Alocação Eficiente

Suponha que existam apenas dois indivı́duos, que podem consumir dois bens, um bem privado,
denotado por x, e um bem público, denotado por G. Vamos supor que G é perfeitamente divisı́vel
e normalizar o preço do bem privado em um (px = 1). Suponha que c(G) representa o custo de
prover G unidades do bem público.
A utilidade do agente i, i = 1, 2, é ui (xi , G). Vamos representar por wi a riqueza do indivı́duo
i, i = 1, 2. O problema de maximização que determina as alocações Pareto eficientes é:
max u1 (x1 , G) s.a. i) u2 (x2 , G) = ū2 ,
x1 ,x2 ,G
ii) x1 + x2 + c(G) = w1 + w2

José Guilherme de Lara Resende 10 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

O Lagrangeano do problema acima é:

L = u1 (x1 , G) + λ(ū2 − u2 (x2 , G)) + µ(w1 + w2 − x1 − x2 − c(G))

As CPOs resultam em:


∂u1 (x1 , G)
(x1 ) : =µ
∂x1
∂u2 (x2 , G)
(x2 ) : − λ =µ
∂x2
∂u1 (x1 , G) ∂u2 (x2 , G) ∂c(G)
(G) : −λ =µ
∂G ∂G ∂G

Se dividirmos a terceira CPO por µ e substituirmos nela os valores de µ e λ/µ dados pela
primeira e segunda CPOs, obtemos:
∂u1 (x1 ,G) ∂u2 (x2 ,G)
∂G ∂G ∂c(G)
∂u1 (x1 ,G)
+ ∂u2 (x2 ,G)
=
∂G
∂x1 ∂x2

Em termos da TMS entre o bem privado e o bem público, temos que:

|T M S1 (G, x1 )| + |T M S2 (G, x2 )| = CM g(G)

Ou seja, em uma alocação Pareto eficiente, a soma do valor absoluto das taxas marginais de
substituição entre os bens público e privado dos dois consumidores deve ser igual ao custo marginal
de provisão do bem público (a soma da propensão marginal a pagar tem que ser igual ao custo
marginal). Esse resultado se mantém válido para o caso geral de I indivı́duos:
I
X
|T M Si (G, xi )| = CM g(G) (1)
i=1

Vamos supor que a utilidade de cada indivı́duo seja quaselinear na quantidade consumida do
bem público G: ui (G, xi ) = Ui (G) + xi , onde xi representa a quantidade consumida do bem
privado, cujo preço é normalizado
√ em 1, e Ui (G) é uma função estritamente côncava (por exemplo,
U (G) = ln(G) ou U (G) = G). Vamos denotar a renda do indivı́duo i por mi e o custo de provisão
de G unidades do bem público por c(G). Logo, a equação (1), que define a quantidade socialmente
ótima de bem público, encontrada para o caso geral, neste caso se torna:
I
X
Ui0 (G∗ ) = c0 (G∗ )
i=1

A hipótese de quaselinearidade da utilidade permite analisar o mercado do bem público isolada-


mente. Além disso, ela tem como consequência a existência de um único nı́vel eficiente de provisão
do bem público. Logo, agora teremos uma única solução para o nı́vel ótimo do bem público, in-
dependente da distribuição do bem privado entre os consumidores. Esse resultado é consequência
da hipótese de utilidades quaselineares e não necessariamente ocorre no caso geral, em que podem
existir diversos nı́veis ótimos para G, que se relacionam com a divisão considerada do bem privado
entre os consumidores.

José Guilherme de Lara Resende 11 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

2.3 Provisão Privada de um Bem Público

Suponha o mesmo arcabouço descrito na subseção anterior, com utilidades quaselineares, e que
exista agora um mercado privado para a provisão do bem público. Cada indivı́duo i deve escolher a
quantidade gi para comprar ao preço p. O problema do consumidor i é dado por:
!
X
max Ui gi + ḡk + xi s.a. xi + pgi = mi .
gi ,xi
k6=i

onde ḡk denota a quantidade ótima consumida pelo indivı́duo k, ∀k 6= i. Esse problema pode ser
escrito de modo simplificado como:
!
X
max Ui gi + ḡk + (mi − pgi ) ,
gi
k6=i

A CPO do problema do consumidor i resulta em:


!
X X
Ui0 ḡi + ḡk = p ⇒ Ui0 (Ḡ) = p , onde Ḡ = ḡk
k6=i k

Do lado da oferta, suponha uma firma competitiva que toma o preço p do bem público como
dado e possui uma função custo denotada por c(Q), onde Q representa a quantidade de bem
público. A oferta ótima do bem público é encontrada resolvendo o problema de maximização de
lucro abaixo:
max pQ − c(Q)
Q≥0

A CPO do problema acima resulta na conhecida condição preço igual a custo marginal:

p = c0 (Q̄)

No equilı́brio devemos ter que a quantidade demandada de bem público é igual a quantidade
ofertada, ou seja, Ḡ = Q̄. Observe que utilizando os resultados acima, obtemos:
I
X
0
c (Ḡ) = p = Ui0 (Ḡ) < Uk0 (Ḡ) = c0 (G∗ )
k=1

Como o custo marginal de provisão do bem público é crescente (c00 > 0), obtemos:

Ḡ < G∗ ,

ou seja, no caso de provisão privada de um bem público, o nı́vel de produção de mercado é inferior
ao nı́vel socialmente ótimo. O gráfico a seguir ilustra essa situação.

José Guilherme de Lara Resende 12 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

$6

c0 (G)

g 0 (G)
P
i
s
UI0 (G)

-
G
Ḡ G

A caracterı́stica de não ser possı́vel excluir uma pessoa do consumo do bem público, ou seja,
o fato de que o bem público comprado por um consumidor fica disponı́vel para todos os outros
consumidores, torna o mercado ineficiente na provisão de bens públicos. Isto justifica a ação do
Estado para corrigir a alocação de mercado. No caso de provisão privada de um bem público, o
nı́vel de produção de mercado é inferior ao nı́vel socialmente ótimo.
Observe que a ineficiência é resultado da caracterı́stica de não ser possı́vel excluir nenhum
indivı́duo do consumo do bem público. Isso cria a situação onde cada consumidor deseja pegar
carona no consumo do bem público pago pelos outros (free-riding problem). O carona é o agente
econômico que se beneficia do bem sem pagar por ele.
Suponha que U10 (G) < U20 (G) < · · · < UI0 (G), para todo G ≥ 0. Nesse caso, é possı́vel mostrar
que o nı́vel de equilı́brio Ḡ de provisão privada do bem público satisfaz UI0 (Ḡ) = c0 (Ḡ), ou seja,
quem tem o maior benefı́cio marginal com o bem público é quem define a quantidade provida desse
bem.
Essa ineficiência da quantidade privada ótima ser menor do que a quantidade socialmente ótima
pode ser corrigida por meio de um imposto compulsório, que obriga todos a contribuı́rem para o
provimento do bem público. Porém, há um outro problema: cada indivı́duo poderá não revelar
corretamente o benefı́cio que obtém com o bem público, o que impossibilitaria calcular a quantidade
socialmente ótima de bem público que deve ser provida. A questão então é se existe alguma forma
de induzir cada indivı́duo a revelar o seu verdadeiro benefı́cio com o bem público. Este é um
problema tı́pico de desenho de mecanismos.

José Guilherme de Lara Resende 13 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

Referências

Coase, R. H. (1960). The problem of social cost. Journal of Law and Economics, 3 , 1-44.
Hardin, G. (1968). The tragedy of the commons. Science, 162 , 1243-1248.
Nicholson, W., & Snyder, C. (2008). Microeconomic theory - basic principles and extensions (10th
edition). Mason, OH: South-Western Cengage Learning.
Ostrom, E. (2015). Governing the commons. the evolution of institutions for collective action. New
York: Cambridge University Press.
Pigou, A. C. (1920). The economics of welfare. London: Macmillan and Co.
Samuelson, P. A. (1954). The pure theory of public expenditure. The Review of Economics and
Statistics, 36:4 , 387-389.
Samuelson, P. A. (1955). Diagrammatic exposition of a theory of public expenditure. The Review
of Economics and Statistics, 37:4 , 350-356.
Varian, H. (2012). Microeconomia – uma abordagem moderna (8a edição). Elsevier/Editora
Campus.

Exercı́cios

1. (P1-1/19) Suponha um grupo de 5 indivı́duos, que consomem um bem público e um bem


privado. A utilidade do indivı́duo i é:

ui (xi , G) = i × ln G + xi ,

onde xi denota a quantidade do bem privado consumido por i e G a quantidade de bem


público. Suponha que o preço do bem privado é normalizado em 1 e que cada indivı́duo tem
a mesma dotação desse bem privado, eix = 10, para todo i = 1, . . . , 5. O bem público possui
um custo de provimento igual a C(G) = 5G.

(a) Calcule a quantidade socialmente ótima de bem público.


(b) Suponha que cada indivı́duo contribui com o mesmo valor para prover a quantidade
socialmente ótima do bem público. Qual será o valor da contribuição individual e da
total?
(c) Suponha que os indivı́duos 2, 3, 4 e 5 contribuem cada um com 3 u.m. para a provisão
do bem público. Qual será o valor de bem público que o indivı́duo 1 irá adquirir, caso
o bem público seja provido em um mercado privado, em que o seu preço é igual ao seu
custo marginal de provimento? (dica: lembre-se que o consumo de um bem é sempre
maior ou igual a zero).
(d) Interprete intuitivamente o resultado encontrado no item (c) e discuta qual seria a
solução no caso de provisão privada do bem público.

José Guilherme de Lara Resende 14 NA 3 – Externalidades e Bens Públicos


Microeconomia 2 Notas de Aula

MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 4 – Escolha sob Incerteza
Prof. José Guilherme de Lara Resende

1 Comportamento sob Incerteza


1.1 Introdução

Considere o seguinte jogo. Uma moeda é lançada. Se o resultado for cara, você ganha R$ 2.
Se o resultado for coroa, a moeda é lançada novamente. Se o resultado for cara, você ganha R$
22 = R$ 4. Se o resultado for coroa, a moeda é lançada novamente. Continuamos dessa forma ad
infinitum, ou até que o jogo termine com um lançamento da moeda que resulte em cara. Nesse
caso, o participante recebe R$ 2n , onde n é o número de lançamentos feitos até cara sair.
Quanto você estaria disposto a pagar para participar deste jogo? Se você decidir pagar o valor
esperado do jogo, você pagaria qualquer valor para participar do jogo, já que o valor esperado do
jogo diverge para infinito.
Observe que o jogo pode dar prêmios enormes. Por exemplo, se o jogo for até o vigésimo lance
de moeda, você ganharia mais de um milhão de reais. Se o jogo chegar até a trigésima rodada,
você ganharia mais de um bilhão de reais. Porém, a chance desses prêmios é bastante baixa (para o
prêmio de um milhão, a chance é menor do que uma em um milhão). Metade das vezes, o jogo paga
apenas R$ 2, e a chance de um valor maior que que R$ 100 é uma em cento e vinte e oito. Logo,
poucas pessoas pagariam um valor alto por esse jogo, apesar de seu valor esperado ser infinito.
Esse problema é conhecido como o paradoxo de São Petersburgo.
Daniel Bernoulli, em 1738, apresentou uma solução para este paradoxo, baseada na ideia de
utilidade marginal decrescente do dinheiro. Bernoulli afirmou que o valor de algo depende da
utilidade gerada, e que o ganho de utilidade do dinheiro cai quanto mais dinheiro a pessoa tem. O
gráfico abaixo ilustra uma função de utilidade com essa propriedade.
u
6

u(w)

-
riqueza (w)

José Guilherme de Lara Resende 1 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

A ideia de Bernoulli, apesar de não resolver o paradoxo satisfatoriamente, foi incorporada em


economia, na teoria de incerteza, que vamos analisar agora. A incerteza no problema do consumidor
significa que este não saberá exatamente qual vai ser o seu consumo.
O primeiro passo ao analisarmos problemas com incertezas é definir o que a pessoa escolhe
agora. No exemplo acima, existem duas caracterı́sticas distintas, o valor monetário pago pelo
jogo e a probabilidade de ocorrência desse valor. Então o indivı́duo deve escolher um objeto que
contém resultados e probabilidades. Vamos chamar um objeto desse tipo de loteria. Vamos definir
formalmente esse conceito.
Suponha que A = {a1 , . . . , an } é um conjunto finito de resultados (por exemplo, ai pode ser um
valor monetário para cada i). Uma loteria g = (p1 ◦ a1 , . . . , pn ◦Pan ) assinala a probabilidade pi ao
n
resultado ai , para todo resultado i = 1, 2, . . . , n, onde pi ≥ 0 e i=1 pi = 1. Dado um conjunto de
resultados A qualquer, o conjunto de todas as loterias simples definidas sobre A é denotado por GA
ou simplesmente G. Dizemos que a loteria g é degenerada se pi = 1 para algum i, isto é, g equivale
a um resultado com certeza. Portanto, uma loteria não-degenerada corresponde a uma situação
onde não existe resultado certo. Podemos incluir também no conjunto de escolha G loterias sobre
loterias, chamadas loterias compostas. Vamos supor que o indivı́duo é indiferente entre uma loteria
composta e a loteria simples associada a ela, ou seja, a loteria simples que leva diretamente aos
mesmos resultados com as mesmas probabilidades.
O consumidor decidirá entre loterias, degeneradas ou não degeneradas, simples ou compostas.
Loterias são o objeto de consumo agora. As loterias são planos contingentes de consumo, con-
tingentes na incerteza existente. Note a mudança na estrutura da teoria: não consideramos mais
cestas de bens, mas loterias. Isso exige um grau diferente de capacidade de escolha do indivı́duo.
Se existem n probabilidades possı́veis, então existem n estados da natureza. Por exemplo,
suponha que o indivı́duo considera adquirir um seguro contra incêndios para a sua casa. Os estados
da natureza relevantes nesse caso são dois: “incêndio” e “não-incêndio” (na casa). Logo, o número
de estados da natureza relevantes depende do problema em questão.
Uma vez definido o objeto de escolha do consumidor, loteria, vamos supor que este possui uma
função de utilidade sobre loterias. Vamos considerar utilidades que satisfazem uma propriedade de
linearidade sobre as probabilidades.

Definição: Utilidade Esperada. A utilidade U : G → R possui a propriedade de utilidade


esperada se, para toda loteria g = (p1 ◦ a1 , . . . , pn ◦ an ) ∈ G temos que:
n
X
U (p1 ◦ a1 , . . . , pn ◦ an ) = pi u(ai ).
i=1

Portanto, a utilidade esperada U é linear nas probabilidades e determinada pelos valores que
assume no conjunto dos resultados. Mais adiante, veremos que a função u determina o comporta-
mento em relação ao risco da pessoa. Segundo Bernoulli, a utilidade marginal da riqueza deve ser
decrescente, ou seja, a função u deve ser côncava.

Exemplo: um indivı́duo possui uma riqueza avaliada em R$ 100.000. Parte dessa riqueza consiste
em um carro avaliado em R$ 20.000. A probabilidade de o carro ser roubado é de 20% caso não seja
instalado um alarme anti-furto. O alarme custa R$ 1.000 e, se instalado, reduz a probabilidade de
roubo para 5%. Suponha que a função de utilidade sobre a riqueza desse indivı́duo é u(x) = ln(x).

José Guilherme de Lara Resende 2 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

A utilidade esperada do indivı́duo quando ele instala o sistema anti-furto (opção 1) é, portanto,
igual a:

U (opção 1) = 0,95 × ln(100.000 − 1.000) + 0,05 × ln(100.000 − 20.000 − 1.000) = 11,4915

Caso ele não instale o sistema (opção 2), sua utilidade esperada será igual a:

U (opção 2) = 0,80 × ln(100.000) + 0,20 × ln(100.000 − 20.000) = 11,4683

Portanto, caso não tenha a opção de contratar um seguro, o indivı́duo optará por instalar o alarme.
Nesse exemplo, existem dois estados da natureza relevantes ao problema: o primeiro, “carro não é
roubado”, o segundo, “carro é roubado”.

A utilidade esperada do jogo descrito no paradoxo de São Petersburgo, com u(w) = ln(w), é:
∞ ∞ ∞
X 1 n
X 1 X n
U= n
ln(2 ) = n
n ln(2) = ln(2) = 2 ln(2),
n=0
2 n=0
2 n=0
2n

pois a série ∞ n
P
n=0 2n converge para 2. Portanto, o indivı́duo ficaria indiferente entre participar do
jogo ou receber R$ 4,00 com certeza.
Se o conjunto de resultados for A = R+ , então uma loteria será representada por uma função de
distribuição acumulada F : R → [0, 1] (F (x) = P (g ≤ x)). Se a loteria for absolutamente contı́nua,
com função de densidade de probabilidade f (x), a utilidade de uma loteria pode então ser calculada
como: Z ∞ Z ∞
U (F ) = u(x) dF (x) = u(x)f (x) dx
−∞ −∞

1.2 Construção da Utilidade Esperada

Vimos que agora o consumidor decidirá entre loterias - o objeto de consumo agora. Vamos supor
que o consumidor possui preferências  sobre o conjunto G de loterias, onde estas preferências
satisfazem os axiomas abaixo.

Axioma 1 - Completeza e Transitividade.  é completa e transitiva.

Axioma 2 - Continuidade. Para quaisquer loterias g, h, k ∈ G, os conjuntos

{α ∈ [0, 1] | αg + (1 − α)h  k} ⊂ [0, 1] e {α ∈ [0, 1] | k  αg + (1 − α)h} ⊂ [0, 1]

são fechados.

Axioma 3 - Independência. Para quaisquer loterias g, h, k ∈ G e α ∈ (0, 1), vale que:

f  g ⇔ αf + (1 − α)h  αg + (1 − α)h.

O primeiro axioma exige que todo par de loterias seja comparável em termos de preferência e que
esta preferência satisfaça a propriedade de transitividade. O significado do segundo axioma é similar
ao do axioma de continuidade para preferências em um ambiente sem incerteza, sendo também um
axioma de caráter mais técnico, necessário para obtermos a representação da preferência por uma

José Guilherme de Lara Resende 3 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

função de utilidade. O terceiro axioma assegura que a função de utilidade que representa o sistema
de escolhas do consumidor tenha a forma de utilidade esperada (linear nas probabilidades).
Vimos que a utilidade U : G → R possui a propriedade de utilidade esperada se, para todo
g ∈ G, g = (p1 ◦ a1 , . . . , pn ◦ an ), temos que:
n
X
U (g) = pi u(ai ) .
i=1

Teorema: Existência de Utilidade Esperada. Se as preferências  definidas sobre o espaço


de loterias G satisfazem os três axiomas acima, então existe U : G → R que representa  e satisfaz
a propriedade de utilidade esperada (é linear nas probabilidades).

A utilidade U é chamada utilidade esperada ou utilidade de Von Neumann e Morgenstern. A


função u é chamada utilidade de Bernoulli (alguns livros não fazem essa distinção e chamam am-
bas as funções U e u utilidade de Von Neumann e Morgenstern). Uma vez garantida a existência
de uma utilidade que represente a preferência, a questão que surge diz respeito à existência de
outras funções de utilidade que representem a mesma preferência. Na teoria do consumidor sem
incerteza vimos que qualquer transformação crescente de uma função de utilidade continua rep-
resentando a mesma preferência. Agora isto não será mais verdade, pois queremos preservar a
propriedade de utilidade esperada. Para que esta propriedade seja mantida, devemos considerar
apenas tranformações lineares crescentes da utilidade esperada. O teorema a seguir enuncia este
resultado.

Teorema: Unicidade da Utilidade Esperada. Suponha que a utilidade esperada U representa


. Então a utilidade esperada Û representa as mesmas preferências  se, e somente se, existem
α, β ∈ R, β > 0, tais que Û (g) = α + βU (g), para toda loteria g ∈ G.

Dizemos então que a utilidade esperada que representa um sistema de preferências que satisfaça
os axiomas acima é única a menos de transformações lineares (ou afins) positivas. O teorema
anterior tem como consequência o fato de que diferenças de utilidades têm significado, no caso de
utilidades esperadas.
Portanto, a teoria da utilidade esperada não é mais uma teoria puramente ordinal, já que
diferenças de utilidade têm significado econômico. Porém, esta teoria também não é puramente
cardinal, pois o valor da utilidade de uma determinada loteria não tem conteúdo econômico, já
que uma transformação afim crescente desta utilidade continua representando o mesmo sistema de
escolhas.

Exemplo: Suponha 4 resultados, a1 , a2 , a3 e a4 . A afirmação “a diferença de utilidade entre os


resultados 1 e 2 é maior do que a diferença de utilidade entre os resultados 3 e 4”, u(a1 ) − u(a2 ) >
u(a3 ) − u(a4 ), é equivalente à (1/2)u(a1 ) − (1/2)u(a2 ) > (1/2)u(a3 ) − (1/2)u(a4 ). Logo, a afirmação
resulta na loteria g = ((1/2) ◦ a1 , 0 ◦ a2 , 0 ◦ a3 , (1/2) ◦ a4 ) ser preferı́vel à h = (0 ◦ a1 , (1/2) ◦ a2 , (1/2) ◦
a3 , 0 ◦ a4 ). Esta ordenação de preferências é preservada por qualquer transformação afim positiva
da utilidade esperada.

José Guilherme de Lara Resende 4 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

1.3 Comportamento com relação ao Risco

A curvatura da função u mede a atitude do consumidor com relação ao risco. Por exemplo,
suponha um indivı́duo com R$ 100 de riqueza. Ele pode entrar em uma aposta onde com 50% de
chance ele ganhará R$ 50 e com 50% de chance ele perderá R$ 50. O valor esperado da aposta é 0
(1/2 × 50 + 1/2 × (−50)) e, portanto, o valor esperado da sua riqueza se participar da aposta é R$
100. Já a utilidade esperada da aposta é:
 
1 1 1 1
U = × u(150) + × u(50) < u × 150 + × 50 = u(100),
2 2 2 2

onde o sinal de desigualdade estrita é válido quando a função u for estritamente côncava. Nesse
caso, dizemos que o indivı́duo é avesso ao risco, já que ele prefere o valor esperado da aposta
a participar dela. O indivı́duo avesso ao risco não participa então de nenhuma aposta cujo valor
esperado seja zero. A figura abaixo ilustra essa situação.

u
6

B
s
u(150) u(w)

D 
u(100) s 


1
+ 21 u(150) s
2 u(50) 
 C



A 
s
u(50)


-
R$ 50 R$ 100 R$ 150
w

Figura 1: Aversão ao Risco

Na figura acima, os pontos A e B representam as utilidades associadas aos valores R$ 50 e


R$ 150, respectivamente. O ponto C, dado pela combinação linear entre A e B com peso 1/2, diz
a utilidade esperada da aposta com 50% de chance de receber R$ 50 e 50% de chance de perder
R$ 50. A utilidade de R$ 100 com certeza, ou seja, de não participar da aposta, é representada pelo
ponto D e se situa acima do ponto C, pois a função de utilidade é estritamente côncava. Portanto,
um consumidor com função u estritamente côncava prefere receber o valor esperado de uma aposta
a participar da aposta, qualquer que seja a aposta.
Vamos definir o comportamento do consumidor diante do risco em termos da utilidade esperada
U : G → R, onde o conjunto de resultados A = {w1 , . . . , wn } é formado por valores não-negativos
de riqueza (wi ≥ 0, para todo i).

José Guilherme de Lara Resende 5 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

Definição: Comportamento em Relação ao Risco. Considere a loteria g não-degenerada.


Dizemos que o indivı́duo é:

1. Avesso ao risco em g se u(E(g)) > U (g);

2. Neutro ao risco em g se u(E(g)) = U (g);

3. Amante do risco em g se u(E(g)) < U (g).

Se o indivı́duo for avesso (neutro, amante) ao risco para toda loteria não-degenerada g, então
dizemos que esse indivı́duo é avesso (neutro, amante) ao risco.

Exemplo: Seguros. Todo indivı́duo avesso ao risco escolherá assegurar totalmente os seus ativos,
se o preço do seguro for atuarialmente justo, isto é, tal que o seu preço seja igual à perda esperada.
Sejam:

• w0 : riqueza inicial;

• π ∈ (0, 1): probabilidade do indivı́duo sofrer uma perda de X reais;

• c: quantidade de seguro comprada;

• p = π: preço atuarialmente justo de cada real assegurado.

O problema do indivı́duo é escolher a quantidade c de seguro que maximiza a sua utilidade


esperada:
max [πu(w0 − πc − X + c) + (1 − π)u(w0 − πc)]
c

A CPO resulta em:


u0 (w0 − πc − X + c) = u0 (w0 − πc),
o que resulta em c∗ = X se u00 < 0 (garante a validade da CSO para um máximo e garante que
c∗ > 0). Portanto, no caso de um seguro atuarialmente justo, o indivı́duo se assegura totalmente
contra uma perda. A condição u00 < 0 significa que o indivı́duo é avesso ao risco, segundo o teorema
abaixo.

Dois conceitos importantes para a teoria de escolha sob incerteza são os de equivalente de certeza
e prêmio ao risco associados a uma determinada loteria. O equivalente de certeza de uma loteria é
a quantidade de dinheiro dado com certeza ao indivı́duo que o faz indiferente à loteria. O prêmio
ao risco de uma loteria é o montante de dinheiro que retirado do valor esperado da loteria, torna
o indivı́duo indiferente à loteria. Observe que estes dois conceitos estão sempre associados a uma
determinada loteria.

Definição: Equivalente de Certeza e Prêmio ao Risco. O equivalente de certeza (ECg ) da


loteria g é o montante de dinheiro ECg dado com certeza, tal que U (g) = u(ECg ). O prêmio
ao risco associado à loteria g é o montante de dinheiro Pg tal que U (g) = u(E(g) − Pg ) (logo,
Pg = E(g) − ECg ).

José Guilherme de Lara Resende 6 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

Aversão ao risco, conforme definida acima, é equivalente a três outras definições. Primeiro,
um indivı́duo é averso ao risco se, e somente se, a função u é estritamente côncava. Segundo, um
indivı́duo é averso ao risco se, e somente se, o equivalente de certeza de toda loteria não-degenerada
é menor do que o o valor esperado da loteria. Terceiro, um indivı́duo é averso ao risco se, e somente
se, o prêmio ao risco de toda loteria não-degenerada é negativo. O teorema abaixo resume essas
equivalências.

Teorema: Aversão ao Risco, EC e Prêmio ao Risco. As seguintes afirmativas são equiva-


lentes:
1. O indivı́duo é averso ao risco;
2. u(·) é estritamente côncava;
3. ECg < E(g), para toda loteria não-degenerada g;
4. Pg < 0, para toda loteria não-degenerada g.

De modo similar, temos os seguintes resultados para os casos de neutralidade ao risco e de


propensão ao risco:

Teorema: Neutralidade ao Risco, EC e Prêmio ao Risco. As seguintes afirmativas são


equivalentes:
1. O indivı́duo é neutro ao risco;
2. u(·) é linear;
3. ECg = E(g), para toda loteria g;
4. Pg = 0, para toda loteria g.

Teorema: Propensão ao Risco, EC e Prêmio ao Risco. As seguintes afirmativas são equiv-


alentes:
1. O indivı́duo é propenso ao risco;
2. u(·) é estritamente convexa;
3. ECg > E(g), para toda loteria g;
4. Pg < 0, para toda loteria g.

Os teoremas acima mostram que o comportamento do indivı́duo com relação ao risco está
ligado à curvatura da função u. Se a função u for estritamente côncava, o indivı́duo será averso
ao risco. É de se esperar que a concavidade de u, medida pela segunda derivada de u, seja usada
para medir o grau de aversão ao risco de um indivı́duo. Porém, não é adequado utilizar u00 como
medida de aversão ao risco, já que uma transformação linear crescente v = a + bu, com b > 0,
continua representando o mesmo indivı́duo. Neste caso, v 00 = bu00 também seria uma medida do
grau de aversão ao risco deste indivı́duo e, portanto, terı́amos diversos valores possı́veis como grau
de aversão ao risco do indivı́duo.

José Guilherme de Lara Resende 7 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

Os coeficientes de Arrow-Pratt medem o grau de aversão ao risco de um consumidor sem incorrer


neste problema: estes coeficientes são invariantes com respeito à utilidade usada para representar
as escolhas do indivı́duo.

Definição: Coeficiente de Aversão ao Risco Absoluto (CARA). O coeficiente de aversão


absoluta ao risco (CAAR) de Arrow-Pratt da utilidade U no nı́vel de riqueza w é definido como:

u00 (w)
Ra (w) = − .
u0 (w)

Definição: Coeficiente de Aversão ao Risco Relativo. O coeficiente de aversão relativa ao


risco (CARR) de Arrow-Pratt da utilidade U no nı́vel de riqueza w é definido como:

wu00 (w)
Rr (w) = − .
u0 (w)

As duas definições usam a segunda derivada de u para definir o grau de aversão ao risco de
um indivı́duo. Essas medidas são locais, ou seja, calculadas em um ponto do nı́vel de renda.
Observe que essas medidas não se alteram caso representemos o indivı́duo por outra função v tal
que v = a + bu, com b > 0.

Exemplo: CARA constante. Considere a utilidade u(w) = −e−αw . Para essa utilidade,
Ra (w) = α, para todo w.

w1−ρ
Exemplo: CARR constante. Considere a utilidade u(w) = 1−ρ
. Para essa utilidade, Rr (w) =
ρ, para todo w.

Os três resultados a seguir, intuitivamente esperados, podem ser demonstrados formalmente.


O primeiro reforça o uso do coeficiente de aversão absoluta ao risco como uma medida de aversão
ao risco. O segundo relaciona o coeficiente de aversão absoluta ao risco às noções de equivalente
de certeza e prêmio ao risco. O terceiro diz que todo indivı́duo cujo grau de aversão absoluta ao
risco aumenta com a riqueza, então o seu grau de aversão relativa ao risco também aumenta com
a riqueza.

Resultado: Aversão ao Risco. O coeficiente de aversão absoluta ao risco de u é maior do que


o de v, para todo nı́vel de renda, se e somente se a função u for mais côncava do que a função v
(no seguinte sentido: u = h ◦ v, onde h é uma função crescente e côncava).

Resultado: CARA e Prêmio ao Risco. Quanto maior o coeficiente de aversão ao risco absoluto,
maior (menor) o prêmio ao risco (equivalente de certeza) associado a alguma loteria qualquer.

Resultado: CARR e Prêmio ao Risco. Se o CARA for crescente, então CARR será crescente.

José Guilherme de Lara Resende 8 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

Exemplo: Escolha de Portfolio. Considere um investidor com riqueza inicial w0 , que pode
investir o montante β em um ativo com risco, cujo retorno pode ser ri no estado i, i = 1, . . . , n,
que pode ocorrer com probabilidade pi . A riqueza do investidor caso o estado i ocorra será wi =
(w0 − β) + β(1 + ri ) = w + βri . O problema de um investidor é maximizar sua utilidade esperada
da riqueza final:
X n
max pi u(w0 + βri ) (1)
0≤β≤w0
i=1

Vamos analisar primeiro o caso em que β = 0, ou seja, nada é investido no ativo arriscado. A
derivada da função objetivo calculada em β̂ = 0 é:
n
X n
X
fCP O (β̂) = pi u0 (w0 + β̂ri )ri = u0 (w0 ) pi ri = u0 (w0 )Er
i=1 i=1

Para que a solução seja β = 0, a derivada acima tem que ser não-positiva, ou seja, Er ≤ 0, pois
u0 é positivo. Logo, obtivemos o seguinte resultado:

Todo investidor avesso ao risco sempre investirá algum valor positivo em um ativo
arriscado cujo retorno médio seja maior do que o retorno do ativo sem risco, indepen-
dentemente do grau risco do ativo arriscado (Arrow, 1967).

José Guilherme de Lara Resende 9 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

2 Paradoxos e Extensões
2.1 Paradoxo de Allais

Suponha três prêmios, R$ 2.500.000, R$ 500.000 e R$ 0, e considere as quatro loterias abaixo:

Prêmios/Loterias g1 g10 g2 g20


R$ 2.500.000 0 0,10 0 0,10
R$ 500.000 1 0,89 0,11 0
R$ 0 0 0,01 0,89 0,90

Logo, g1 denota a loteria que paga R$ 500.000 com certeza e g10 denota a loteria que paga
R$ 2.500.000 com 10% de probabilidade, R$ 500.000 com 89% de probabilidade e R$ 0 com 1%
de probabilidade. Já g2 denota a loteria que paga R$ 500.000 com 11% de probabilidade e R$ 0
com 89% de probabilidade e g20 denota a loteria que paga R$ 2.500.000 com 10% de probabilidade
e R$ 0 com 90% de probabilidade. As seguintes escolhas são apresentadas:

Escolha 1: g1 vs g10

Escolha 2: g2 vs g20

Um padrão comum observado de escolhas é g1  g10 e g20  g2 . Vamos mostrar que essas
escolhas são inconsistentes com os axiomas da utilidade esperada. Se g1  g10 , então usando o
conceito de utilidade esperada, temos que:

u(500) > 0,10u(2.500) + 0,89u(500) + 0,01u(0),

onde simplificamos a notação cortando três zeros dos prêmios positivos. Agora, se g20  g2 , então
usando o conceito de utilidade esperada, temos que:

0,10u(2.500) + 0,90u(0) > 0,11u(500) + 0,89u(0)

Se adicionarmos 0,89u(500) − 0,89u(0) em ambos os lados da última desigualdade acima, obtemos:

0,10u(2.500) + 0,89u(500) + 0,01u(0) > u(500),

ou seja, que g10  g1 . Isso significa que as escolhas g20  g2 e g1  g10 são inconsistentes para um
indivı́duo maximizador de utilidade esperada. Esse resultado é conhecido como paradoxo de Allais.

José Guilherme de Lara Resende 10 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

2.2 Utilidade Esperada Subjetiva

Existe uma distinção entre risco e ambiguidade (incerteza ou incerteza Knightiana): a maioria
dos eventos incertos não possui (ou não é conhecida) uma distribuição objetiva de probabilidade
caracterizando essa incerteza.
Knight distingue risco de incerteza:

• Risco é uma situação onde a incerteza é mensurável;

• Incerteza refere-se à situação onde nenhuma (ou pouca) inferência estatı́stica pode ser feita
sobre o futuro.

Risco é o conceito de incerteza comumente usado em economia, em que os agentes conhecem a


distribuição estatı́stica dos resultados de suas ações. A estrutura do de utilidade esperada pode ser
alterada para esses casos. Um estado da natureza é uma descrição do mundo, que pode vir a ocorrer
ou não, e que não deixa nenhum aspecto relevante ao problema de fora. Estados da natureza são
portanto exaustivos e mutualmente excludentes.
Vamos agora permitir que a probabilidade seja subjetiva, já que a incerteza não é objetiva
aqui. A probabilidade então está ligada ao grau de confiança que um indivı́duo tem em um
evento/afirmação, com base em evidência (de Finetti e Savage). A principal restrição sobre proba-
bilidades subjetivas é chamada coerência: probabilidades devem somar um:

Se p(A) = p, então p(Ac ) = 1 − p ,

onde A denota um evento qualquer e Ac o evento complementar de A.


O modelo de Savage define um espaço de estados da natureza S e conjunto A de consequências
(resultados). Definimos um ato como uma função que associa a cada estado da natureza s ∈ S a
uma consequência a ∈ A. O conjunto de todos os atos é o conjunto de todas as funções de S em A,
denotado por F = {f : S → A}. O objeto de escolha do consumidor agora são atos: as preferências
do indivı́duo estão definidas para elementos em F .
Suponha que S é finito. Dizemos que as funções π : S → [0, 1] e u : A → R representam a
preferência  definida sobre atos, se para f, g ∈ F temos que:
X X
f g ⇔ π(s)u(f (s)) ≥ π(s)u(g(s))
s∈S s∈S

Logo, no modelo de utilidade esperada subjetiva de Savage temos que:

• Tanto gostos (u) como crenças (π) são subjetivos.

• Gostos e crenças são independentes.

• A probabilidade π não depende da ação escolhida e a utilidade de uma consequência não


depende da ação escolhida.

José Guilherme de Lara Resende 11 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

2.3 Paradoxo de Ellsberg

O paradoxo de Ellsberg é consequência de um experimento simples e intuitivo, onde razoável


proporção das escolhas feitas contradiz o modelo de utilidade esperada subjetiva. A grosso modo,
o paradoxo é uma evidência de que incerteza é conceitualmente diferente de risco:

“A number of sets of constraints on choice-behavior under uncertainty (...) having


the implication that - for a “rational” man - all uncertainties can be reduced to risks.
(p.645)”

Vamos descrever o paradoxo de Ellsberg. Considere duas urnas, cada uma com cem bolas, onde
a Urna I contém 50 bolas pretas e 50 bolas brancas e a Urna II contém 100 bolas pretas ou brancas,
sem que se saiba o número de bolas pretas e de bolas brancas.

B  B 
B   
B  ~ ~
 B 
B ~ ~ ~
 B 
B 
B      B  
~ ~ ~ 
B
B 
B ~
  
~ 

B
B  ? 
 
 
B 
B ~  B 
B     B 
B ~ ~ B 
B   B 

Urna I Urna II
100 Bolas 100 Bolas
50 Bolas Pretas ? Bolas Pretas
50 Bolas Brancas ? Bolas Brancas

Suponha as seguintes apostas:


PI: Ganha R$ 20 se uma bola preta é retirada da urna I;
BI: Ganha R$ 20 se uma bola branca é retirada da urna I;
PII: Ganha R$ 20 se uma bola preta é retirada da urna II;
BII: Ganha R$ 20 se uma bola branca é retirada da urna II.

Considere a escolha entre os seguintes pares de apostas: 1) PI vs PII, e 2) BI vs BII. É comum


observar escolhas onde se prefere PI a PII e BI a BII, o que contraria os postulados da utilidade
esperada subjetiva, já que:

PI  PII ⇒ pI (preta) > pII (preta)


BI  BII ⇒ pI (branca) > pII (branca)

Logo pII (preta) + pII (branca) < pI (preta) + pI (branca) = 1. Esse comportamento viola a
propriedade de coerência. Os modelos tradicionais de escolha excluem escolhas desse tipo.

José Guilherme de Lara Resende 12 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

2.4 Modelos que “Acomodam” os Paradoxos

Os desvios em escolhas nos modelos de utilidade esperada e utilidade esperada subjetiva levaram
a uma pesquisa com o objetivo de descrever o comportamento de decisão individual usando exper-
imentos. As duas conclusões principais dessa linha de pesquisa são que: 1) o comportamento sob
ambiguidade não necessariamente se reduz ao comportamento sob risco,e 2) incerteza, seja qual for
a forma, não entra de forma linear na função de utilidade.
Se probabilidades não entram linearmente na função de utilidade, então como se dá o processo de
escolha individual sob risco e sob incerteza? Vários estudos sugerem que certeza e impossibilidade
são pontos de referência no processo de escolha individual. Mudanças próximas a esses pontos são
percebidas de forma mais forte do que mudanças em valores intermediários. Essa “sensibilidade
decrescente” a partir desses pontos de referência tem sido amplamente confirmada por diversos
estudos, tanto para escolhas com ganhos como para escolhas com perdas.
Novos modelos de utilidade, tais como Choquet Expected Utility (CEU),Multiple-Priors Ex-
pected Utility (MEU), Cumulative Prospect Theory (CPT), etc, incorporam essas distorções em
probabilidades por meio de uma função de probabilidade.
Nos modelos CEU e CPT, a distorção ocorre na função de distribuição acumulada, e não nas
probabilidades diretamente. Nesse caso, o peso de um resultado depende da ordem desse resultado
no espaço de escolha do indivı́duo. Modelos deste são capazes de descrever comportamentos tı́picos
do paradoxo de Allais e do paradoxo de Ellsberg.

Leitura Recomendada

• Varian, cap. 11, 12 e 13.

• Pindick e Rubinfeld, cap. 5 - “Comportamento do Consumidor e Incerteza”.

• Nicholson e Snyder, cap. 7 - “Uncertainty and Information”.

José Guilherme de Lara Resende 13 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

Exercı́cios

1. Considere as loterias g = (0,50 ◦ 100; 0,50 ◦ 1000) e h = (0,20 ◦ 100; 0,30 ◦ 25; 0,50 ◦ 16). Calcule
a utilidade esperada, o equivalente de certeza, o prêmio de risco dessas duas loterias para os
casos abaixo:

a) u(w) = w, w0 = 100.

b) u(w) = w, w0 = 50.
c) u(w) = w, w0 = 100.
d) u(w) = w, w0 = 50.
e) u(w) = w2 , w0 = 100.
f) u(w) = w2 , w0 = 50.

2. Considere as loterias g = (0,60 ◦ 10.000; 0,40 ◦ 1.000) e h = (0,50 ◦ 10.000; 0,50 ◦ 2.800). Se um
consumidor está indiferente entre estas duas loterias, então pode-se afirmar que ele é neutro
ao risco. Verdadeiro ou falso? Justifique.

3. Responda os seguintes itens.

a) Suponha duas loterias g = (0,50 ◦ m1 ; 0,50 ◦ m2 ) e h = (0,50 ◦ w1 ; 0,50 ◦ w2 ), tais que


u(m1 ) = 25, u(m2 ) = 65, u(w1 ) = 35, u(w2 ) = 50 e v(m1 ) = 1, v(m2 ) = 9, v(w1 ) = 3,
v(w2 ) = 6. Verifique se u e v representam a mesma utilidade esperada.
b) Suponha que a função de utilidade da riqueza de um indivı́duo seja u(w) = log10 (w)
(logaritmo na base 10). O indivı́duo possui um carro no valor de R$ 100.000,00. Existe
uma probabilidade de 10% de ocorrer um acidente e o carro passar a valer R$ 10.000,00.
Calcule a utilidade esperada deste indivı́duo.

c) Suponha que a função de utilidade da riqueza de um indivı́duo seja u(w) = w. Con-
sidere a loteria g = (0,10◦100; 0,60◦60, 0,30◦0). Determine o valor esperado, a utilidade
esperada e o desvio-padrão de g. Calcule o equivalente de certeza e o prêmio ao risco da
loteria g.

4. (A07) Um indivı́duo tem uma riqueza não nula e sua função de utilidade von-Neumann-
Morgenstern é dada por u(x) = K − a/x, em que a e K são constantes positivas e x >
a/K. Este indivı́duo é convidado a participar de uma loteria que triplica sua riqueza com
probabilidade p e a reduz à terça parte com probabilidade 1−p. Qual deve ser o valor mı́nimo
de p para que o indivı́duo aceite participar da loteria?

5. (A96) Quais das funções abaixo têm as propriedades de utilidade esperada? Justifique a sua
resposta.

a) u(p ◦ w1 ; (1 − p) ◦ w2 ) = pw1 + (1 − p)w2 .


b) u(p ◦ w1 ; (1 − p) ◦ w2 ) = a(pw12 + (1 − p)w22 ).
c) u(p ◦ w1 ; (1 − p) ◦ w2 ) = pa ln(w1 ) + (1 − p)b ln(w2 ).
p 1−p
d) u(p ◦ w1 ; (1 − p) ◦ w2 ) = 1−p
ln(w1 ) + p
ln(w2 ).
e) u(p ◦ w1 ; (1 − p) ◦ w2 ) = pα ln(w1 ) + (1 − p)α ln(w2 ).

José Guilherme de Lara Resende 14 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

6. (A09) Um indivı́duo possui uma função de utilidade dada por U = 1 − (1/w), em que w
denota o valor presente lı́quido da sua renda futura. No momento, ele está contemplando
duas opções de carreira profissional. A primeira opção dará a ele uma renda certa de w = 5.
A outra alternativa dará w = 400, com 1% de chance, e w = 4 com 99% de chance. Responda
às seguintes questões:

a) Calcule os coeficientes de aversão absoluta e relativa ao risco de Arrow-Pratt. Esse


indivı́duo é avesso ao risco?
b) Calcule a utilidade esperada das duas opções. Qual deve ser a escolha desse indivı́duo?
c) Calcule o equivalente de certeza da segunda alternativa.
d) Suponha que exista um teste de aptidão que revela com certeza se indivı́duo obterá
w = 400 ou w = 4 se escolher a segunda alternativa. Calcule o maior valor que o
indivı́duo estaria disposto a pagar por esse teste de aptidão.

José Guilherme de Lara Resende 15 NA 4 – Escolha sob Incerteza


Microeconomia 2 Notas de Aula

MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 5 – Teoria dos Jogos
Prof. José Guilherme de Lara Resende

1 Introdução
1.1 Interdependência Estratégica

A teoria dos jogos permite modelar comportamentos estratégicos dos agentes econômicos. É
o instrumento adequado quando existe interdependência estratégica entre os agentes do modelo
analisado.
No modelo de consumo usual, o consumidor decide entre possı́veis cestas de bens, dados os
preços e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a
sua tecnologia de produção e dados os preços dos insumos e dos bens que vende. No modelo de
equilı́brio geral competitivo, tanto os consumidores quanto as firmas tomam os preços como dados
e não há interação estratégica entre os agentes econômicos.
Porém, existem situações onde os resultados das ações de um agente dependem diretamente
do comportamento de outros agentes. Nestes casos, assumimos que o payoff (bem-estar) do agente
depende não só da sua ação, mas da ação de outros agentes. Modelos de oligopólio são um exemplo,
em que o lucro de determinada firma depende do que suas rivais fazem.
Um jogo então caracteriza qualquer situação desse tipo, em que cada participante deve levar em
conta a estratégia dos outros jogadores envolvidos antes de escolher o melhor para si. O objetivo
da teoria dos jogos é determinar o resultado de um jogo. Cada método de análise resulta em um
conceito de solução particular, chamado equilı́brio.
A maioria dos conceitos tem sua origem no conceito de equilı́brio de Nash e são, usualmente,
equilı́brios de Nash que satisfazem certas propriedades. Por isso, são chamados refinamentos.
Cada refinamento tenta solucionar alguma deficiência do conceito de equilı́brio de Nash particular
a alguma situação ou modelo.

1.2 Noções Preliminares

Definição (informal): Jogo. Um jogo refere-se a qualquer situação envolvendo dois ou mais
agentes, chamados jogadores, onde exista interdependência estratégica.

Vamos estudar jogos não-cooperativos: analisamos cada agente separadamente e não como um
grupo. Essa definição não implica que um jogador não possa cooperar com o outro, ela é apenas
de cunho metodológico, onde cada agente é visto como uma entidade separada, autônoma, e não
há grupos de agentes se comportando como um único agente.

José Guilherme de Lara Resende 1 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Para descrevermos um jogo é necessário conhecermos três objetos:

• Os jogadores,

• A regra do jogo,

• O resultado do jogo (payoff dos jogadores).

São feitas duas hipóteses básicas sobre os jogadores:

1. Os jogadores são racionais. As ações de um jogador são consistentes com o objetivo desejado:
maximizar o seu payoff.

2. Os jogadores são inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e con-
seguem fazer as mesmas inferências que realizamos sobre a situação em que se encontram.

A segunda hipótese não é tão inócua quanto parece. Na teoria de equilı́brio geral os indivı́duos
são racionais, mas não é necessário que sejam inteligentes no sentido acima: os agentes econômicos
não precisam conhecer toda a estrutura de teoria de equilı́brio geral ao tomarem suas decisões.
As duas formas mais comuns de se representar um jogo são:

• Forma Estratégica: Representação em forma matricial. Esta forma é adequada para


situações onde os jogadores se “movem” (decidem suas ações) simultaneamente (modelo
estático). Também conhecida como forma normal.

• Forma Extensiva: Representação em forma de árvore. Esta forma é adequada para


situações onde exista uma ordem cronológica dos eventos do jogo (modelo dinâmico). Também
conhecida como forma sequencial.

Existe uma correspondência entre essas duas formas, que veremos mais a frente. Vimos que o
princı́pio básico de eficiência usado em economia é o critério de Pareto. Dizemos que o resultado
A do jogo é Pareto-dominado pelo resultado B se nenhum agente ficar pior e pelo menos um ficar
melhor em B do que em A.

Definição: Um resultado de um jogo é Pareto ótimo (ou eficiente de Pareto) se não é Pareto-
dominado por nenhum outro resultado possı́vel para o jogo.

1.3 Conhecimento Comum

Uma hipótese usada em teoria dos jogos é a de conhecimento comum (“common knowledge”),
que assume que a racionalidade dos jogadores e a estrutura do jogo são de conhecimento comum
de todo jogador.
Se considerarmos dois jogadores, um determinado fato é de conhecimento comum dos jogadores
se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1
sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe
que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo raciocı́nio
valendo para o jogador 2.

José Guilherme de Lara Resende 2 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Essa hipótese é fundamental para a validade de certos procedimentos, tais como os procedi-
mentos de eliminação de estratégias dominadas. Mais ainda, ela é importante para o conceito de
equilı́brio de Nash (existem artigos que relaxam a hipótese de conhecimento comum, sob certas
condições).
Myerson argumenta que a hipótese de jogadores inteligentes implica supor que a estrutura do
jogo é de conhecimento comum desses jogadores. A formalização matemática dessa hipótese é
complicada. Aqui, vamos apenas assumir a sua validade. Vamos apenas ver um exemplo para
entender a importância dessa hipótese.
Myerson cita uma fábula que ilustra bem as implicações da hipótese. Em uma vila, existem
100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou
se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os
homens da vila, exceto ao seu marido. Essas tradições são de conhecimento comum de todos os
habitantes da vila.
Suponha que todas as esposas foram infiéis. Logo, cada homem sabia da infidelidade de todas
as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum
homem se lamentava. Numa certa noite, um visitante revelou a todos que pelo menos uma esposa
havia sido infiel. Qual foi o resultado dessa revelação?
O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de
número 100, todos se lamentaram. Tente entender porque a hipótese de conhecimento comum leva
a esse resultado. Para isso, é necessário compreender o que a informação do visitante adicionou ao
conhecimento dos homens da vila.
O raciocı́nio fica mais fácil de compreender se considerarmos primeiro o caso em que apenas
uma esposa traiu o marido. A informação nova que o visitante revelou foi informar a todos da vila
que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel
e apenas um homem, exatamente aquele cuja esposa havia sido infiel, não tinha conhecimento de
nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciência de que a sua esposa é que
fora infiel e se lamentaria na primeira noite depois da revelação do visitante, já que os costumes da
vila são de conhecimento comum de todos os seus habitantes.
Caso houvesse duas esposas infiéis, então 98 homens da vila saberiam que havia duas esposas
infiéis e 2 homens teriam conhecimento de apenas um caso de infidelidade, já que não saberiam
que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ninguém se lamentaria
o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda
noite, após observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que
têm conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam
conta de que foram traı́dos e se lamentariam. O raciocı́nio estende-se de modo análogo para o caso
de 100 esposas infiéis: no centésimo dia, todos os maridos se dariam conta de que foram traı́dos e
se lamentariam.

José Guilherme de Lara Resende 3 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

2 Jogos na Forma Estratégica


2.1 Definições e Exemplos de Jogos

Definição: Jogo na Forma Estratégica (ou Forma Normal). Um jogo na forma estratégica
é uma coleção G = (Si , ui )Ii=1 , onde I é o número de jogadores, Si é o conjunto de estratégias
disponı́veis ao jogador i, para todo i ∈ I, e ui : Ik=1 Sk → R é a função de payoff (a utilidade)
Q
do jogador i, que depende das estratégias de todos os jogadores. Dizemos que um jogo na forma
normal é finito se o conjunto das estratégias Si é finito para todo i, i = 1, . . . , I.

Observe que a interdependência estratégica entre os agentes aparece explicitamente na hipótese


de que o payoff de cada jogador é descrita pela função ui : S1 × · · · × Si × · · · × SI → R, ou seja,
ui depende não apenas da estratégia si escolhida por i, mas também das estratégias de todos os
outros jogadores, s1 , . . . , si−1 , si+1 , . . . , sI .

Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de
uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam
simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00
ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve
este jogo.

1↓ / 2 → Cara Coroa
Cara −1, 1 1, −1
Coroa 1, −1 −1, 1

Notação: Vamos usar a seguinte convenção, corriqueira e adotada em diversos livros, para todos
os jogos representados na forma matricial: o primeiro elemento em cada célula da matriz é o payoff
do jogador 1 (“jogador-linha”) e o segundo elemento da célula é o payoff do jogador 2 (“jogador-
coluna”).
Para o jogo do Exemplo 1, temos que:
Jogadores: I = {1, 2};
Estratégias: S1 = S2 = {Cara, Coroa};
Payoffs: u1 (Cara,Coroa) = u1 (Coroa,Cara) = 1;
u1 (Cara,Cara) = u1 (Coroa,Coroa) = −1;
u2 (s1 , s2 ) = −u1 (s1 , s2 ), ∀(s1 , s2 ) ∈ S1 × S2 .

No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo imprevisı́vel. Logo,
quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja
escolher de modo aleatório ou de modo que o seu rival não saiba exatamente qual o lado da moeda
será escolhido.
Observe que esse é um jogo de soma zero: o ganho de um jogador é igual à perda do outro
jogador. Para jogos de soma zero com dois jogadores, os conceitos de solução usados podem envolver
os jogadores randomizarem suas estratégias. Esse tipo de jogo foi extensivamente estudado por von
Neuman e Morgenstern, no livro “theory of games and economic behavior ”, publicado em 1944 e
um marco da teoria dos jogos.

José Guilherme de Lara Resende 4 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Um tipo de jogo mais geral do que os de soma zero são os jogos de soma fixa (dos payoffs),
também chamados jogos estritamente competitivos. Em um jogo de soma fixa, a soma dos payoffs
para cada resultado do jogo tem sempre o mesmo valor. Se o valor for zero, então o jogo é de soma
zero. Logo, jogos de soma zero são um tipo de jogos de soma fixa.
Em um jogo de soma fixa, um jogador só aumenta o seu payoff se o payoff do outro jogador
se reduzir pelo valor desse aumento. Então qualquer resultado deste jogo é Pareto eficiente, pois
aumentar o payoff de um jogador necessariamente implica diminuir o payoff do outro jogador. Esse
tipo de jogo é adequado para modelar situações em que se tem um “vencedor” e um “perdedor”.
Por exemplo, podemos modelar um jogo de xadrez como um jogo de soma zero: se um jogador
ganhar, ele obtém o payoff +1, enquanto o perdedor obtém o payoff −1. Se o jogo empatar, cada
jogador obtém payoff 0. Evidentemente, muitos dos jogos analisados em economia não são de soma
fixa (ou seja, podemos dizer que são de soma variável ), como é o caso dos Exemplos 2 e 3 a seguir.

Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estão sendo
interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receberão
uma pena de 3 anos na cadeia. Se ambos não confessarem o crime, a pena será de apenas dois
anos, por falta de evidência. Porém, o promotor pode fazer uma acordo com um deles, dando uma
pena de apenas um ano na prisão para quem confessar e, para quem não confessar, de cinco anos
na prisão, por não ter colaborado com a justiça. A matriz abaixo descreve este jogo.

L.A.↓ / Laelio → Confessar Não Confessar


Confessar −3, −3 −1, −5
Não Confessar −5, −1 −2, −2

Exemplo 3: Problema de Coordenação. Suponha que duas pessoas estão viajando separada-
mente para o Rio de Janeiro e combinaram de se encontrar para almoçar no dia seguinte. Porém
esqueceram de marcar o restaurante e não estão conseguindo se comunicar. Eles costumam almoçar
sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almoço no
restaurante da barra é mais agradável do que o almoço no restaurante do centro. Porém, eles se
desencontrarem é a pior situação possı́vel. A matriz abaixo descreve este jogo.

1↓ / 2 → Barra Centro
Barra 3, 3 0, 0
Centro 0, 0 1, 1

Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo à tarde.
Concordaram com duas opções: ir a um jogo de futebol ou fazer compras. Os dois preferem estar
juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir às compras.
A matriz abaixo descreve este jogo.

Nelson↓ / Renata → Futebol Compras


Futebol 2, 1 0, 0
Compras 0, 0 1, 2

José Guilherme de Lara Resende 5 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Os Exemplos 3 e 4 modelam problemas de coordenação: os dois jogadores devem escolher suas


estratégias de modo que façam o mesmo programa. Veremos mais à frente que cada um desses
dois jogos possui dois equilı́brios de Nash em estratégias puras, em que ambos os jogadores devem
coordenar suas estratégias para alcançar um desses equilı́brios. Além disso, o Exemplo 4 envolve
uma disputa de poder, em que o equilı́brio que o jogador 1, Nelson, prefere, (F, F ) (os dois irem
juntos ao futebol), é diferente do equilı́brio que a jogadora 2, Renata, prefere, (C, C) (os dois irem
juntos às compras). Ambos os jogadores preferem estar em uma situação de equilı́brio do que estar
em uma situação de desequilı́brio, (F, C) ou (C, F ), ou seja, em que um escolhe um programa
diferente do escolhido pelo outro. Temos então uma disputa de poder entre os jogadores, onde cada
um tenta implementar o seu equilı́brio preferido.

2.2 Conceitos de Dominância e Estratégias Racionalizáveis

Nas definições a seguir vamos denotar por si uma estratégia qualquer de um jogador i arbitrário
e por Si o conjunto de todas as estratégias disponı́veis para o jogador i. Além disso, s−i denota
um grupo de estratégias para os outros jogadores que não o jogador i (ou seja, s−i especifica uma
estratégia para cada um dos rivais do jogador i) e S−i denota o conjunto de todas as estratégias
disponı́veis para os outros jogadores que não o jogador i.

Definição: Estratégia Estritamente Dominante. A estratégia ŝi é estritamente (ou forte-


mente) dominante para o jogador i em um dado jogo se para toda estratégia si 6= ŝi , si ∈ Si ,
vale:
ui (ŝi , s−i ) > ui (si , s−i ), para todo s−i ∈ S−i .

Logo, uma estratégia ŝi é estritamente dominante para o jogador i se ela for a única estratégia
que maximiza o payoff desse jogador, quaisquer que sejam as estratégias escolhidas pelos outros
jogadores.
Para o jogo dilema dos prisioneiros, é fácil verificar que Confessar é uma estratégia estritamente
dominante para os dois prisioneiros. Ela é a estratégia que gera o maior payoff para cada prisioneiro,
qualquer que seja a escolha do outro prisioneiro. Dizemos que (C, C) é um equilı́brio em estratégias
estritamamente dominantes.
Observe que o equilı́brio (C, C) é Pareto dominado pelo conjunto de estratégias (N C, N C), ou
seja, cada jogador obtém um payoff maior em (N C, N C) do que em (C, C). Temos, então, um caso
onde o comportamento individual maximizador dos agentes envolvidos resulta em um equilı́brio
Pareto ineficiente. Logo, na presença de interdependência estratégica, a interação de jogadores
cujo objetivo é maximizar o seu próprio bem-estar pode levar a situações Pareto-ineficientes.
Estratégias estritamente dominantes não são comuns. É comum situações onde não existem
estratégias dominantes para nenhum dos jogadores, como o Exemplo 5 a seguir ilustra.

Exemplo 5: Observe que o jogo a seguir não possui nenhuma estratégia estritamente dominante:

1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
D 4, 3 3, 2 6, 5

José Guilherme de Lara Resende 6 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Apesar de estratégias estritamente dominantes serem raras, podemos usar um conceito similar,
de estratégia estritamente dominada, para eliminarmos estratégias que nunca devem ser escolhidas
por qualquer jogador.

Definição: Estratégia Estritamente Dominada. Uma estratégia s̄i é estritamente (ou forte-
mente) dominada para o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que:

ui (ŝi , s−i ) > u1 (s̄i , s−i ), para todo s−i ∈ S−i .

Dizemos que ŝi domina estritamente s̄i .

Observe que uma estratégia estritamente dominante domina estritamente todas as outras es-
tratégias do jogador. Logo, todas as outras estratégias são estritamente dominadas pela estratégia
estritamente dominante.
Vamos analisar o jogo descrito no Exemplo 5 acima, dado por:

1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
D 4, 3 3, 2 6, 5

Para o jogador 1, a estratégia D é estritamente dominada pela estratégia U . Essa é a única


estratégia estritamente dominada no jogo acima para qualquer um dos dois jogadores. Se elimin-
armos essa estratégia do jogo, usando o argumento de que o jogador 1 nunca a escolherá, já que
U traz um payoff sempre maior do que D, para qualquer que seja a escolha do seu rival, obtemos
então o seguinte jogo reduzido:

1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1

Para esse jogo reduzido, a estratégia M domina estritamente R, para o jogador 2. Eliminando
a estratégia R, obtemos:

1↓ / 2 → L M
U 5, 2 4, 3
C 1, 4 3, 2

Já para este novo jogo reduzido, a estratégia U domina estritamente C, para o jogador 1.
Eliminando C, obtemos:

1↓ / 2 → L M
U 5, 2 4, 3

José Guilherme de Lara Resende 7 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Finalmente, a estratégia L é estritamente dominada por M , para o jogador 2, neste último


subjogo. Por meio desse “procedimento de eliminação de estratégias estritamente dominadas
(PEEED)”, obtivemos (U, M ) (isto é, o jogador 1 escolhe U , o jogador 2 escolhe M ) como solução
do jogo. Dizemos que (U, M ) é um equilı́brio obtido pela eliminação de estratégias estritamente
dominadas (e que U e M são estratégias que sobrevivem ao PEEED).
A ideia do procedimento é, portanto, simples. Ele usa implicitamente a hipótese de conhecimento
comum da racionalidade e da estrutura do jogo para todos os jogadores, pois, para encontrarmos
a solução (U, M ), supomos implicitamente que o jogador 2 sabe que o jogador 1 é racional e nunca
jogará a estratégia D. Como o jogador 1 sabe que o jogador 2 é racional e também que 2 sabe que
ele é racional e nunca jogará D, então o jogador 1 infere que 2 nunca jogará R. A continuação
desse raciocı́nio permite concluir que (U, M ) é a solução do jogo.
O problema com o PEEED é que ele também nem sempre leva a alguma solução. No Exemplo
5 abaixo, não existe nenhuma estratégia estritamente dominada e, portanto, não conseguimos
eliminar nenhuma estratégia do jogo usando o PEEED. Logo, não conseguimos fazer qualquer
predição mais acurada sobre qual deve ser o resultado deste jogo usando este procedimento (ou,
pelo menos, o que não pode ser resultado).
Exemplo 6: Considere o jogo:

1↓ / 2 → L R
U 1, 1 0, 0
D 0, 0 0, 0

Para esse jogo, não existem nem estratégias estritamente dominantes nem estratégias estrita-
mente dominadas.
Podemos enfraquecer as definições de dominância estrita, relaxando a exigência de que o payoff
seja sempre estritamente maior nas definições acima, de modo a obter o seguinte conceito.

Definição: Estratégia Fracamente Dominante. Uma estratégia ŝi ∈ Si é fracamente domi-


nante para o jogador i se para toda estratégia si 6= ŝi , si ∈ Si , valer que:

ui (ŝi , s−i ) ≥ ui (si , s−i ), para todo si ∈ Si ,

com desigualdade estrita para pelo menos um s−i .

Evidentemente, toda estratégia estritamente dominante é fracamente dominante, mas a volta


não vale: no Exemplo 6 acima, as estratégias U de 1 e L de 2 são fracamente dominantes, mas
não estritamente dominantes, já que para o jogador 1, quando 2 escolhe L, escolher U dá payoff
estritamente maior do que escolher D. Porém se 2 escolhe R, então o payoff para 1 ao escolher
U é igual (e não maior) ao payoff que ele obtém se escolher D. Note que raciocı́nio similar vale
para o jogador 2, com relação a sua estratégia L. Dizemos que (U, L) é um equilı́brio formado por
estratégias fracamente dominantes.
Problema similar ao que ocorre com a noção de estratégias estritamente dominantes ocorre com
o conceito de estratégias fracamente dominantes: pode ser que não exista solução para o jogo em
estratégias fracamente dominantes, como o Exemplo 6 ilustra.

José Guilherme de Lara Resende 8 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Exemplo 7: Considere o seguinte jogo:

E D
C (2, 1) (3, 0)
M (4, 0) (2, 1)
B (4, 4) (3, 4)

É fácil observar que não existe estratégia fracamente dominante para ambos os jogadores (apenas
B é fracamente dominante para o jogador 1). Vamos introduzir o seguinte conceito para analisar
o jogo acima, um relaxamento da noção de estratégia estritamente dominada.

Definição: Estratégia Fracamente Dominada. Uma estratégia s̄i é fracamente dominada para
o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que:

ui (ŝi , s−i ) ≥ ui (s̄i , s−i ), para todo s−i ∈ S−i ,

com desigualdade estrita para pelo menos um s−i . Dizemos então que ŝi domina fracamente s̄i .

Vamos aplicar um procedimento de eliminação de estratégias fracamente dominadas (PEEFD)


ao jogo do exemplo 7 acima. Podemos fazê-lo de três modos distintos:

1. Se eliminarmos C e M simultaneamente para o jogador 1, obtemos que E e D dão o mesmo


payoff para o jogador 2 e não podemos eliminar nenhuma dessas estratégias. Sobram então
(B, E) e (B, D) como possı́veis resultados do jogo.

2. Se eliminarmos primeiro C para o jogador 1, a estratégia E do jogador 2 se torna fracamente


dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo resultante,
obtendo (B, D) (payoff (3,4)) como solução.

3. Se eliminarmos primeiro M para o jogador 1, a estratégia D do jogador 2 se torna fracamente


dominada para o jogo resultante. Eliminando D, podemos eliminar C no jogo resultante,
obtendo (B, E) (payoff (4,4)) como solução.

Portanto, a ordem de eliminação das estratégias fracamente dominadas pode afetar a solução
obtida. Esta é uma caracterı́stica ruim deste procedimento, pois a solução do jogo pode mudar
conforme a ordem de eliminação das estratégias. Este problema não ocorre quando eliminamos
estratégias estritamente dominadas.
O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jo-
gadores e da estrutura do jogo. Porém, esses procedimentos não esgotam toda a força dessa
hipótese. Usando a hipótese de conhecimento comum, podemos eliminar outras estratégias além
das dominadas.

Definição: Melhor Resposta. A estratégia ŝi é a melhor resposta do jogador i à estratégia ŝ−i
dos outros jogadores se:

ui (ŝi , ŝ−i ) ≥ ui (si , ŝ−i ), para todo si ∈ Si .

José Guilherme de Lara Resende 9 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Portanto, a estratégia ŝi é a melhor resposta do jogador i para a estratégia ŝ−i dos outros jo-
gadores se ela for a ou uma das escolhas ótimas de i quando ele acreditar que os outros jogadores
irão selecionar a estratégia ŝ−i . Um jogador não deve escolher uma estratégia que nunca é uma
melhor resposta, pois neste caso não existe justificativa para o uso dessa estratégia. Observe que
estratégias estritamente dominadas nunca são a melhor resposta. Podemos montar um procedi-
mento de eliminação de estratégias que nunca são a melhor resposta, de modo similar ao PEEED.
Para justificar o uso deste procedimento, devemos mais uma vez supor a validade da hipótese de
conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.

Definição: Estratégias Racionalizáveis. As estratégias em Si do jogador i que sobrevivem


ao procedimento de eliminação de estratégias que nunca são a melhor resposta são chamadas
racionalizáveis.

Uma estratégia racionalizável pode sempre ser “justificada”, ou seja, o jogador pode justificar a
escolha dessa estratégia com uma conjectura razoável sobre o comportamento dos outros jogadores
(nenhum rival escolherá uma estratégia não racionalizável).
É possı́vel mostrar que as seguintes afirmações são verdadeiras:

• A ordem de remoção das estratégias que nunca são a melhor resposta não altera o resultado
obtido;

• Cada jogador tem pelo menos uma estratégia racionalizável, podendo ter mais de uma;

• O conjunto de estratégias racionalizáveis está contido no conjunto de estratégias que sobre-


vivem ao PEEED;

• Para jogos com dois jogadores, o conjunto de estratégias racionalizáveis é igual ao conjunto
de estratégias que sobrevivem ao PEEED.

Porém, o conceito de estratégia racionalizável nem sempre fornece uma solução. Para o Exemplo
3, a batalha dos sexos, todas as estratégias são racionalizáveis e, portanto, o conceito não informa
nada sobre o que esperar como solução deste jogo. Queremos tornar as predições sobre o resultado
de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir
veremos o conceito de equilı́brio de Nash (EN), que, satisfeitas certas condições, sempre aponta pelo
menos uma solução para qualquer jogo na forma estratégica. Esse é o mais importante conceito
em teoria dos jogos.

José Guilherme de Lara Resende 10 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

2.3 Equilı́brio de Nash

O máximo que podemos desenvolver usando apenas a hipótese de conhecimento comum é o


conceito de estratégias racionalizáveis, visto acima. Para obtermos qualquer outro conceito mais
robusto, temos que adicionar alguma hipótese nova.

Definição: Equilı́brio de Nash em Estratégias Puras. Um conjunto de estratégias s∗ =


(s∗1 , . . . , s∗I ) é um equilı́brio de Nash (EN) (em estratégias puras) para um determinado jogo se para
todo jogador i, i = 1, . . . , I, valer que:

ui (s∗i , s∗−i ) ≥ ui (si , s∗−i ), para todo si ∈ Si .

Dizemos que um EN é estrito se as desigualdades acima forem estritas. Logo, em um EN estrito,


não existe, para nenhum dos jogadores, nenhuma outra estratégia diferente da de equilı́brio que
resulte em um payoff igual ao de equilı́brio, dado que os outros jogadores estão selecionando as suas
estratégias de equilı́brio.
Em um equilı́brio de Nash, a estratégia de cada jogador é a melhor resposta para as estratégias
que são de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os jogadores estejam
corretos sobre suas conjecturas a respeito das estratégias escolhidas pelos seus rivais. Dizemos que
os jogadores possuem expectativas mutualmente corretas.
O conceito de EN traz uma predição mais precisa a respeito do resultado de um jogo do que
o conceito de racionabilidade. No Exemplo 3 acima, batalha dos sexos, todas as estratégias são
racionalizáveis, mas apenas (F, F ) e (C, C) são EN em estratégias puras. Vamos mostrar que (F, F )
é um EN estrito. Se 1 escolher F , então 2 maximiza o seu payoff escolhendo F (e se escolhesse C
obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 2 para a escolha
de F feita por 1. De modo similar, se 2 escolher F , então 1 maximiza o seu payoff escolhendo F (e
se escolhesse C obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 1
para a escolha de F feita por 2. Isso mostra que (F, F ) é um EN estrito.
Usando um argumento similar, não é difı́cil observar que o jogo “Cara ou Coroa”, discutido no
Exemplo 1 acima, não possui EN em estratégias puras. De modo geral, não podemos garantir a
existência de EN em estratégias puras. Intuitivamente, qualquer solução do jogo “Cara ou Coroa”
envolve ambos os jogadores escolhendo suas estratégias de modo imprevisı́vel. Para formalizar essa
possibilidade de randomização, vamos introduzir o conceito de estratégias mistas.

Definição: Estratégias Mistas. Seja Si o conjunto de estratégias puras do jogador i. Uma


estratégia mista do jogador i é uma distribuição de probabilidade sobre Si , ou seja, uma função
σi : Si → [0, 1], que atribui uma probabilidade a cada estratégia pura do jogador i. Logo, temos
que: X
0 ≤ σi (si ) ≤ 1 , ∀si e σi (si ) = 1 .
si ∈Si

O simplex de Si , representado por ∆Si , é o conjunto das estratégias mistas do jogador i. Este
conjunto inclui também as estratégias puras do jogador (estratégias mistas degeneradas), já que se
σ(s̄i ) = 1 para alguma estratégia s̄i , então isso significa que s̄i é escolhida com probabilidade 1.

José Guilherme de Lara Resende 11 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Se os jogadores randomizarem suas estratégias, então o resultado do jogo deixará de ser de-
terminı́stico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja
σ = (σ1 , σ2 ) uma coleção de estratégias mistas para os jogadores 1 e 2. A utilidade esperada
do jogador 1 (similar para 2) para o conjunto de estratégias mistas σ é calculada como:
X
u1 (σ1 , σ2 ) = [σ1 (s1 ) × σ2 (s2 )] × u1 (s1 , s2 )
s1 ∈S1 ,s2 ∈S2

Considere o jogo Cara e Coroa descrito no Exemplo 1 e as estratégias mistas σ1 = (1/4◦Ca, 3/4◦
Co) e σ2 = (2/3 ◦ Ca, 1/3 ◦ Co) para os jogadores 1 e 2, respectivamente. A utilidade esperada do
jogador 1 quando ele escolhe a estratégia σ1 e o jogador 2 escolhe a estratégia σ2 é:
X
u1 (σ1 , σ2 ) = σ1 (s1 ) × σ2 (s2 ) × u1 (s1 , s2 )
s1 ∈S1 ,s2 ∈S2

= σ1 (Ca) × σ2 (Ca) × u1 (Ca, Ca) + σ1 (Ca) × σ2 (Co) × u1 (Ca, Co)+


+ σ1 (Co) × σ2 (Ca) × u1 (Co, Ca) + σ1 (Co) × σ2 (Co) × u1 (Co, Co)
1 2 1 1 3 2 3 1 1
= × × (−1) + × × (+1) + × × (+1) + × × (−1) =
4 3 4 3 4 3 4 3 6

Podemos estender imediatamente os conceitos de estratégias dominantes e dominadas, proced-


imentos de eliminação e estratégias racionalizáveis, ao permitir que os jogadores possam escolher
estratégias mistas, além de estratégias puras.

Definição: Equilı́brio de Nash. Um conjunto de estratégias σ ∗ = (σ1∗ , . . . , σI∗ ) é um equilı́brio


de Nash para um jogo na forma normal se para todo jogador i, i = 1, . . . , I, valer que:
ui (σi∗ , σ−i
∗ ∗
) ≥ u1 (σi , σ−i ), para todo σi ∈ ∆Si .

A definição acima de EN permite que os jogadores randomizem entre as estratégias puras. Logo,
eles podem não somente escolher uma estratégia pura, mas também escolher uma estratégia que
envolva várias estratégias puras, cada uma escolhida com determinada probabilidade. Observe que,
em equilı́brio, a hipótese de expectativas mutualmente corretas implica que cada jogador conhece
o modo em que os outros jogadores estão randomizando (as estratégias mistas escolhidas por seus
rivais).
Pela definição de EN com estratégias mistas, para cada conjunto de estratégias dos jogadores
candidato a equilı́brio, devemos verificar se para cada jogador, a sua estratégia é de fato a melhor
resposta para as estratégias dos outros jogadores que fazem parte do conjunto de estratégias can-
didatas a equilı́brio. Considerando que existem infinitas estratégias mistas, este procedimento de
cerificação para determinar EN é inviável. Como fazemos então para encontrar todos os equilı́brios
de Nash? O teorema abaixo fornece uma resposta.

Teorema: Equivalência de Definições. As seguintes afirmativas são equivalentes:


1. (σ1∗ , σ2∗ ) ∈ ∆(S1 ) × ∆(S2 ) é um equilı́brio de Nash;
2. Para todo jogador i, ui (σ1∗ , σ2∗ ) = ui (si , σ−i

), para todo si jogado com probabilidade positiva;
∗ ∗ ∗
e ui (σ1 , σ2 ) ≥ ui (si , σ−i ), para todo si que não é jogado com probabilidade positiva.

José Guilherme de Lara Resende 12 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

O teorema fornece um algoritmo para encontrar equilı́brios de Nash em estratégias mistas.


Ele diz que em um EN em estratégias mistas, duas estratégias puras de um jogador que podem
ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff
para esse jogador, que será igual ao payoff obtido no equilı́brio. Esse resultado é consequência de
utilizarmos a utilidade esperada para calcularmos o payoff de um conjunto de estratégias mistas.
Caso existissem duas estratégias puras que o jogador escolhesse com probabilidade positiva e em que
uma delas gerasse um payoff maior do que o da outra, o jogador não deveria atribuir probabilidade
positiva à estratégia que lhe dá o payoff mais baixo, pois isso reduziria o seu payoff de equilı́brio.
Ou seja, dadas as estratégias escolhidas em equilı́brio pelos outros jogadores, esse jogador é
indiferente entre qualquer estratégia pura que ele de fato possa vir a escolher (que tem probabilidade
positiva), e estas estratégias puras lhe dão um payoff igual ou maior do que qualquer outra estratégia
que ele não escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador é
fazer (σ1∗ , σ2∗ ) um equilı́brio.
Vamos usar o teorema acima para calcular o EN para o jogo “Cara ou Coroa” descrito no Exem-
plo 1. Suponha que o jogador 1 decida proceder do seguinte modo: escolhe Ca com probabilidade
α e, portanto, escolhe Co com probabilidade 1 − α. Similarmente, o jogador 2 escolhe Ca com
probabilidade β e, portanto, escolhe Co com probabilidade 1 − β. Vamos representar na matriz
abaixo essa situação.

1↓ / 2 → Cara (β) Coroa (1 − β)


Cara (α) −1, 1 1, −1
Coroa (1 − α) 1, −1 −1, 1

Pelo teorema acima, essas randomizações são um EN se, e somente se:

u1 (Ca, σ2 ) = u1 (Co, σ2 ) e u2 (σ1 , Ca) = u2 (σ1 , Co),

onde σ1 e σ2 representam as estratégias mistas dos jogadores 1 e 2, respectivamente. Portanto:

u1 (Ca, σ2 ) = u1 (Co, σ2 ) ⇒ −1 × β + 1 × (1 − β) = 1 × β − 1 × (1 − β) ⇒ β = 0,5


u2 (σ1 , Ca) = u2 (σ1 , Co) ⇒ 1 × α − 1 × (1 − α) = −1 × α + 1 × (1 − α) ⇒ α = 0,5

Logo, σ1 = (1/2 ◦ Ca; 1/2 ◦ Co) e σ2 = (1/2 ◦ Ca; 1/2 ◦ Co) é um EN em estratégias mistas. Observe
que:

u1 (Ca, σ2 ) = u1 (Co, σ2 ) = u1 (σ1 , σ2 ) = 0


u2 (σ1 , Ca) = u2 (σ1 , Co) = u2 (σ1 , σ2 ) = 0 ,

como esperado pelo teorema.

José Guilherme de Lara Resende 13 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

2.4 Teorema de Existência e Outros Resultados

Teorema de Existência de Equilı́brio de Nash. Todo jogo finito na forma normal possui pelo
menos um equilı́brio de Nash, assumindo que os jogadores possam usar estratégias mistas.

O Teorema de Existência garante que para todo jogo na forma estratégica finito existirá pelo
menos um equilı́brio de Nash (EN). Logo o conceito de EN não é problemático no sentido que para
qualquer jogo finito podemos garantir que existirá uma solução para ele, se usarmos o conceito de
EN como solução para o problema de interdenpedência estratégica modelado no jogo.
A relação entre equilı́brio de Nash e os conceitos de equilı́brio com estratégias dominantes é
descrita pelos seguintes resultados:
1. Se existir equilı́brio em estratégias estritamente dominantes, ele será único e será o único EN
do jogo. O mesmo vale para equilı́brios obtidos com o PEEED: se existir, será único e o único
EN do jogo.
2. Se existir equilı́brio em estratégias fracamente dominantes, então ele será um EN. Neste
caso, pode ocorrer que exista outro EN, formado por estratégias fracamente dominadas. O
Exemplo 6 acima ilustra esse caso, em que (D, R) é um EN formado por estratégias fracamente
dominadas.
3. Vimos no Exemplo 5 acima que o PEEFD pode levar a diferentes resultados, dependendo da
ordem de eliminação adotada. De qualquer modo, se o PEEFD levar a algum resultado, ele
será um EN.

Exemplo 6 revisto: Considere novamente o seguinte jogo visto no Exemplo 6:

1↓ / 2 → L R
U 1, 1 0, 0
D 0, 0 0, 0

Esse jogo possui dois EN, dados por (U, L) e (D, R). Não existe equilı́brio em estratégias
estritamente mistas. O EN (U, L) é também equilı́brio em estratégias fracamente dominantes (e
pode ser obtido usando o PEEFD). O EN (D, R) é um equilı́brio formado por estratégias fracamente
dominadas e portanto não pode ser encontrado usando o PEEFD.

O Exemplo 6 acima mostra que podem existir equilı́brios de Nash formados por estratégias
fracamente dominadas. O resultado de um jogo ser desse tipo é algo estranho, pois envolve cada
jogador escolher uma estratégia para a qual existe outra opção que dará sempre um payoff maior
ou igual, independentemente do que os outros jogadores façam. Existe um refinamento do EN para
jogos na forma normal, chamado refinamento da mão-trêmula (Selten, 1975; Myerson, 1978), que
exclui a possibilidade desse tipo de equilı́brio ocorrer. O refinamento da mão-trêmula considera a
possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estratégia a
ser jogada. O EN então será chamado perfeito da mão-trêmula caso satisfaça a condição imposta
pelo refinamento. No exemplo acima, apenas o EN (U, L) é perfeito da mão-trêmula.
Refinamentos do conceito de EN são direcionados para eliminar EN que por algum motivo não
são considerados razoáveis. Nesse caso, existirá algum ou alguns EN que satisfazem o refinamento
e algum ou alguns que não o satisfazem.

José Guilherme de Lara Resende 14 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

3 Jogos na Forma Extensiva


3.1 Introdução

Sabemos que para descrevermos um jogo são necessários três objetos: 1) os jogadores; 2) a regra
do jogo; e 3) o resultado (payoffs) do jogo. Um jogo na forma extensiva é a representação mais
adequada para situações dinâmicas.

Definição Informal de Jogo na Forma Extensiva. Representamos um jogo finito na forma


extensiva (ou forma sequencial ) em forma de árvore, onde em cada conjunto de informação um
jogador escolhe uma ação que desenvolve o jogo. Todo jogo na forma extensiva satisfaz as seguintes
propriedades:
• Se inicia em um único nó de decisão, chamado nó inicial. Logo, todo nó do jogo que não é o
nó inicial é um sucessor deste nó, no sentido que podemos descrever qualquer nó a partir do
nó inicial mais uma série de ações tomadas (a história ocorrida do jogo até aquele nó);
• Todo nó do jogo, com exceção do nó inicial (que não possui nenhum predecessor), tem um
único nó predecessor imediato;
• Nos nós finais do jogo, nenhum jogador faz qualquer escolha (nenhuma ação pode ser tomada)
e nestes nós são especificados os payoffs do jogo para a forma de como o jogo foi jogado,
descrita pela história do jogo narrada pelo nó final considerado.

Definição: Jogo de Informação Perfeita. Um jogo é chamado de informação perfeita se cada


jogador observa perfeitamente todas as ações escolhidas por todos os jogadores que se moveram
antes dele.

Em um jogo de informação perfeita, cada nó de decisão constitui um conjunto de informação


por si só, já que todos os jogadores observam todas as decisões tomadas anteriormente a qualquer
momento que for jogar. Se um jogo não for de informação perfeita, então existe pelo menos um
ponto do jogo em que algum jogador não sabe o que foi escolhido no momento anterior. Neste caso,
unimos os nós que fazem parte de um mesmo conjunto de informação por um retângulo pontilhado,
como ilustra o jogo à direita na figura abaixo, indicando que existe (pelo menos) um conjunto de
informação que contém mais de um nó de decisão de um jogador, o que significa que este jogador
não sabe exatamente em que nó está do conjunto de informação (ou seja, ele não observa a tomada
de decisão feita no nó predessor imediato).

Jogo de Informação Perfeita Jogo de Informação Imperfeita


1t 1t
@ @
E @
@D E @
@D
@ @
2 t @t 2 t 2 @t
A A A A
l  AA r l  AA r l  AA r l  AA r
 A  A  A  A
 t   At   t  At   t   At   t  At 
1 0 0 3 1 0 0 3
3 0 0 1 3 0 0 1

José Guilherme de Lara Resende 15 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

No jogo à esquerda da figura acima, o jogador 2 observa se 1 escolhe E ou D, ou seja, cada nó
de decisão de 2 forma um conjunto de informação por si só. Já no jogo à direita da figura acima, o
jogador 2 não observa se 1 escolhe E ou D, ou seja, os dois nós de decisão de 2 formam um único
conjunto de informação.
Evidentemente, os nós de decisão que pertencem a um mesmo conjunto de informação devem
ser todos referentes ao mesmo jogador. Além disso, as ações que o jogador pode tomar em nós de
decisão que estão no mesmo conjunto de informação devem ser iguais. Caso isso não ocorresse e
existissem dois nós de decisão no mesmo conjunto de informação, com ações não exatamente iguais,
então o jogador seria capaz de inferir em que nó está, ao realizar que as ações disponı́veis naquele nó
são diferentes das ações do outro nó. Portanto, nós de decisão que pertencem a um mesmo conjunto
de informação pertencem ao mesmo jogador e possuem exatamente as mesmas ações disponı́veis.

Definição: Jogo de Memória Perfeita. Um jogo é de memória perfeita quando nenhum jogador
esquece o que já sabia (inclusive ações que já foram tomadas durante o desenrolar do jogo).

A árvore de jogo ilustrada na figura abaixo não apresenta memória perfeita. Neste exemplo, o
jogador 1, na terceira rodada, após a sua escolha na primeira rodada e após a escolha do jogador
2 na segunda rodada, não se lembra de sua própria escolha feita na primeira rodada.

1
t
HH
 HH
E  H D
  HH
 H
 HH
t
 jt
@ 2 H
@
@ @
a @b a @b
@ @
t Rt
@ t Rt
@
A
@
A 1 A
@
A
 A  A  A  A
l A r l A r l A r l A r
 A  A  A  A

 AA
U 
 AAU   AAU   AAU

Finalmente, existe uma outra definição, jogo de informação completa, que se refere a jogos
em que os jogadores conhecem exatamente toda a estrutura do jogo, podendo ocorrer apenas que
não observem alguma tomada de decisão (ou seja, um jogo de informação completa pode ser de
informação imperfeita). Já em um jogo de informação incompleta, os jogadores podem não conhecer
alguma informação relevante sobre o tipo dos seus rivais, tais como as preferências, as estratégias
ou os payoffs dos outros jogadores. Um exemplo clássico de jogos de informação incompleta refere-
se a leilões. Em um leilão, cada participante não sabe qual é a valoração exata que os outros
participantes atribuem ao objeto leiloado.

José Guilherme de Lara Resende 16 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

3.2 Relação entre Forma Extensiva e Forma Normal

Um jogo representado na forma normal pode ser representado na forma extensiva sem am-
biguidades? O contrário também é válido? Da forma extensiva para a forma normal sim, mas
o contrário não é válido. A mesma forma normal pode representar mais de um jogo na forma
extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representação na
forma normal, que se resume a representação de um jogo do tipo “Cara ou Coroa” discutido no
Exemplo 1. Nos dois jogos descritos na figura a seguir, o payoff na primeira linha é do jogador 1 e
na segunda linha, do jogador 2.

Jogador 1 escolhe primeiro Jogador 2 escolhe primeiro


1t 2t
@ @
Ca @ Co
@
Ca @
@ Co
@ @
t 2 @t t 1 @t
A A A A
Ca   A
A Co Ca   A
A Co Ca   A
A Co Ca   A
A Co
 A  A  A  A
 t   At   t  At   t   At   t  At 
−1 1 1 −1 −1 1 1 −1
1 −1 −1 1 1 −1 −1 1

A forma normal é uma estrutura mais simples do que a forma extensiva. Ela envolve menos
objetos matemáticos do que a forma extensiva, porque a estratégia do jogador pode condensar
uma quantidade enorme de informação sobre a tomada de decisão do jogador. Logo, encontrar a
representação na forma normal do jogo analisado pode tornar mais fácil a determinação dos EN
de um jogo na forma sequencial. Para isso, temos que tornar claro em que consiste uma estratégia
para um jogo na forma extensiva.
A definição de estratégia para jogos simultâneos é simples e direta. No caso de jogos sequenciais,
a definição de estratégia é mais elaborada, já que nesses jogos, um determinado jogador pode ter
vários momentos de escolha de ações ao longo do jogo. Por exemplo, em xadrez, as jogadas dos
dois jogadores se alternam ao longo da partida.
Uma estratégia de um jogador para jogos sequenciais é uma regra que determina a escolha de
ação em todos os conjuntos de informação desse jogador no jogo. Logo, uma estratégia para o
jogador i é um plano contingente completo: uma regra de decisão que especifica como o jogador i
jogará em toda e qualquer circunstância do jogo em que ele possa vir a jogar. Isso significa que uma
estratégia define ações para todos os conjuntos de informação do jogo, mesmo que esses conjuntos
de informação não sejam alcançados durante o jogo.

José Guilherme de Lara Resende 17 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Exemplo 8. Suponha o seguinte jogo sequencial:

1t
@
@
E @D
@
2 t @t 2
@
A A
 A  A
l  A r f  A g
 A  A
 AA 
 AA
       
6 10 0 14
4 10 0 8

Como o jogador 1 só possui um conjunto de informação, dado pelo nó de decisão inicial, onde
as ações disponı́veis são E e D, então 1 possui apenas duas estratégias: E e D. Já o jogador 2
possui dois conjuntos de informação distintos: 1) o nó de decisão alcançado quando 1 escolhe E, que
vamos denotar por x1 , e onde 2 pode escolher as ações l ou r; e 2) o nó de decisão alcançado quando
1 escolhe D, que vamos denotar por x2 , e onde 2 pode escolher as ações f ou g. Portanto, uma
estratégia para o jogador 2 pode ser descrita como (l em x1 , g em x2 ), ou de modo mais simples,
(l, g). Essa estratégia significa que o jogador 2 escolhe l em x1 e g em x2 . Fica claro então que
uma estratégia define ações em todos os pontos do jogo. Isto pode parecer desnecessário à primeira
vista, mas para computarmos os EN, é importante que a estratégia seja completa nesse sentido.
Portanto, o conjunto das estratégias do jogador 2 é formado por (l, f ), (l, g), (r, f ), (r, g). Logo,
o jogador 2 possui 22 = 4 estratégias (2 é o número de ações em cada conjunto de informação, e 2
também é o número de conjuntos de informação do jogador 2).
Para determinarmos todos os equilı́brios de Nash em estratégias puras de um jogo na forma
sequencial, o ideal é encontramos a representação do jogo na forma normal. O primeiro passo para
isso é encontrar as estratégias de cada jogador.
No Exemplo 8 acima, vimos que o jogador 2 possui 4 estratégias e o jogador 1 possui 2 es-
tratégias. Obtemos então a seguinte matriz de dimensão 2 por 4 para a representação desse jogo
na forma normal:

1↓ / 2 → (l, f ) (l, g) (r, f ) (r, g)


E 6, 4 6, 4 10, 10 10, 10
D 0, 0 14, 8 0, 0 14, 8

Preenchemos os payoffs na matriz usando a representação em forma de árvore do jogo. Por


exemplo, se 2 escolheu E e 2 escolheu (l, f ), então o payoff resultante será (6, 4). Já se 1 escolher
D e 2 escolher (l, f ), então percebemos que a ação importante definida na estratégia de 2 quando
1 escolhe D é a segunda, no caso, f . Neste caso, obtemos o payoff (0, 0).
Uma vez obtida a representação na forma normal do jogo, é fácil obter os EN em estratégias
puras do jogo, que são três: (E; (r, f )), (D, (l, g)) e (D, (r, g)).

José Guilherme de Lara Resende 18 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Veremos agora que alguns tipos de jogos possuem uma dinâmica de ações escolhidas em tempos
diferentes de tal modo que representá-los na forma normal e daı́ encontrarmos os EN pode não ser
adequado, no sentido de que alguns destes EN não constituem solução razoável para a interação
estratégica modelada. Mais especificamente, quando derivamos a forma normal associada a um
jogo sequencial e encontrarmos os EN do jogo, alguns destes equilı́brios podem não ser crı́veis, ou
seja, baseados em ameaças de um dos jogadores que não será cumprida caso tivesse que de fato ser
levada a cabo. O exemplo a seguir ilustra esse problema.

Exemplo 9: Monopolista e Firma Entrante. Considere um mercado monopolista. O mo-


nopolista mantém o mercado ameaçando firmas entrantes de uma guerra de preços. Desse modo,
o monopólio mantém seu lucro. Porém, se alguma firma de fato entrar neste mercado, a melhor
estratégia para o monopolista é formar um cartel e dividir o lucro de monopólio, já que a guerra de
preços traria prejuı́zos não somente para a firma entrante, mas também para o incumbente. Essa
situação estratégica é representada pelo seguinte jogo na forma extensiva.

Entrante
t
@
Não Entra @ Entra
@
@
Rt Monopolista
@
@
 
0 @
@
20 Briga @ Acomoda
@
@R
@
   
−5 10
−5 10

A representação na forma normal do jogo sequencial acima é:

Entrante/Monopolista Briga, se E entrar Acomoda, se E entrar


Não entra 0,20 0,20
Entra -5,-5 10,10

Existem dois EN em estratégias puras para o jogo:


1. firma entrante (E) Entra; monopolista (M ) Acomoda, se E entrar, e
2. firma entrante Não entra; monopolista Briga se E entrar.

O segundo EN é baseado em uma ameaça vazia, não-crı́vel : M faz uma ameaça, que se for
levada a sério, não precisará ser cumprida, pois nesse caso E terá escolhido não entrar. Porém, se
E decidir entrar no mercado, o melhor para M será se acomodar. O refinamento de perfeição em
subjogos, que veremos a seguir, tenta eliminar EN baseados em ameaças não crı́veis, por não serem
uma solução razoável para a interação estratégica modelada.
A noção de Equilı́brio de Nash Perfeito em Subjogos (ENPS) é desenvolvida tanto para jogos
sequenciais de informação perfeita quanto de informação imperfeita.

José Guilherme de Lara Resende 19 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

3.3 Equilı́brio de Nash Perfeito em Subjogos (ENPS)

Jogos de Informação Perfeita

Vamos analisar jogos de informação perfeita primeiro. O objetivo é desenvolver um conceito de


equilı́brio que elimine equilı́brios baseados em estratégias não-crı́veis, como no Exemplo 8 acima,
onde o ideal seria obter (Entra, Ac se E entrou) como única solução da interação estratégica
descrita. Portanto, queremos refinar o conceito de EN de modo que as soluções do jogo ainda
sejam EN, mas eliminando os EN baseados em estratégias que envolvam ameaças não-crı́veis. O
Princı́pio da Racionalidade Sequencial (PRS), que exige que a estratégia de um jogador
qualquer deve especificar ações que são ótimas em cada ponto do jogo, é fundamental para obtermos
esse refinamento.
Esse princı́pio é implementado em um jogo de informação perfeita pelo seguinte Algoritmo de
Indução Reversa (“backward induction algorithm”):
1. Comece pelos nós de decisão finais da árvore (“nós penúltimos” – nós cujos sucessores são
todos nós terminais);
2. Determine a escolha ótima dos jogadores que jogam nesses nós (problema de maximização
individual, sem interação estratégica);
3. Redesenhe a árvore, substituindo os nós de decisão final por um nó terminal, com payoff
definido pela escolha ótima no passo 2);
4. Repita passos 1), 2) e 3) para esse jogo reduzido, até chegar ao nó inicial do jogo.

A solução de indução reversa para jogos com informação perfeita se resume a que todos os
jogadores façam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na prática,
o jogo é resolvido do fim para o começo. O conjunto de estratégias puras s = (s1 , s2 , . . . , sI ) é um
conjunto de estratégias de indução reversa para um jogo na forma extensiva se tiver sido obtido de
acordo com o algoritmo de indução reversa. É possı́vel mostrar que todo conjunto de estratégias
de indução reversa é um EN do jogo.

Resultado: Existência de Equilı́brio. Todo jogo na forma extensiva finito de informação


perfeita tem um EN em estratégias puras, que pode ser encontrado usando indução reversa. Se os
payoffs de cada jogador forem diferentes nos nós terminais, para todos os jogadores, então existirá
um único EN que pode ser encontrado usando indução reversa.

Corolário. Todo jogo finito de informação perfeita tem (pelo menos) um EN em estratégias puras.

Exemplo 8: Monopolista e Firma Entrante (continuação). No jogo Monopolista/Entrante,


existem dois EN em estratégias puras, mas apenas um EN obtido usando o algoritmo de indução
reversa. O algoritmo elimina exatamente o EN baseado na ameaça não-crı́vel do monopolista abrir
uma guerra de preços caso o entrante decida entrar. Esta ameaça não é crı́vel pois uma vez que
a firma entrante entrar no mercado, se o monopolista fizer uma guerra de preços, ele próprio se
prejudicará sem obter nenhum ganho.
Logo, todo conjunto de estratégias obtido usando o algoritmo de indução reversa acima é um
EN do jogo. Mas nem todo EN do jogo pode ser obtido por indução reversa. Os EN que podem
ser obtidos utilizando o algoritmo são chamados EN perfeitos em subjogos (ENPS), ou EN que
satisfazem o critério de perfeição em subjogos.

José Guilherme de Lara Resende 20 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Jogos de Informação Imperfeita

O algoritmo de indução reversa acima só se aplica para jogos de informação perfeita. Porém
a ideia de racionalidade sequencial pode ser usada também para jogos de informação incompleta,
por meio de um algoritmo similar de indução reversa.
A ideia central é definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser
visto como um jogo por si só. A propriedade de racionalidade sequencial exige que um EN seja EN
para cada subjogo do jogo original.

Definição: Subjogo. Um subjogo de um jogo Γ na forma extensiva é um subconjunto do jogo tal


que:
(i) Se inicia em um conjunto de informação que contém apenas um único nó de decisão, e contém
todos os nós sucessores desse nó inicial;
(ii) Se o nó de decisão y pertence ao subjogo, então todo nó z que pertence ao conjunto de
informação de y também pertence ao subjogo.

Todo jogo possui pelo menos um único subjogo, que seria o próprio jogo. Este é o caso do
exemplo abaixo. Um subjogo estrito de um jogo é um subjogo que está contido de modo estrito no
jogo, ou seja, é diferente (“menor”) que o jogo inteiro.

1
u
@
@
E @ D
@
u @u
@
A
2 A
 A  A
l  A r l  A r
 A  A

 u  Au   u Au 
 A  A
 
1 0 0 3
3 0 0 1

Definição: ENPS em Estratégias Puras. O conjunto de estratégias s = (s1 , s2 , . . . , sI ) do jogo


Γ é um equilı́brio de Nash perfeito em subjogos (ENPS) se s = (s1 , s2 , . . . , sI ) induz um equilı́brio
de Nash em todo subjogo de Γ.

ENPS é um refinamento de EN: todo ENPS é um EN, já que o próprio jogo é um subjogo seu.
O contrário não é válido: existem EN que não são perfeitos em subjogos.
Teorema. Para todo jogo na forma extensiva finito de informação perfeita, o conjunto de es-
tratégias de indução reversa é igual ao conjunto de ENPS em estratégias puras.

Logo, em jogos de informação perfeita, o conjunto de ENPS coincide com o conjunto de EN


obtido usando o algoritmo de indução reversa visto acima. Porém, considerando jogos de informação
imperfeita, nem todo jogo possui um ENPS em estratégias puras. O teorema a seguir garante a
existência de ENPS para jogos de memória perfeita.

José Guilherme de Lara Resende 21 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Teorema: Existência de ENPS (Selten). Todo jogo na forma extensiva finito com memória
perfeita possui um ENPS.

A hipótese de memória perfeita é necessária. Existem exemplos de jogos de memória imperfeita


que não possuem ENPS.

O seguinte algoritmo geral de indução reversa para jogos na forma extensiva, sejam de in-
formação completa ou não, é válido para encontrar os ENPS:

1. Comece pelo término da árvore, determine os EN para todos os subjogos finais (subjogos que
não possuem nenhum subjogo estrito);

2. Substitua cada subjogo pelo payoff de um de seus EN;

3. Repita os passos 1) e 2) para o jogo reduzido, continue até não restar nenhum subjogo;

4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um
EN).

Para jogos de informação perfeita, esse algoritmo é igual ao algoritmo anterior.

3.4 Jogos Repetidos

Em um jogo do tipo dilema dos prisioneiros, seria possı́vel obter cooperação se repetı́ssemos o
jogo diversas vezes? Com a repetição, o número de estratégias de cada jogador aumenta. Nesse
caso, é possı́vel criar estratégias em que um jogador puna o seu rival caso ele não coopere.

Vamos então analisar novamente o Dilema dos Prisioneiros (Exemplo 2):

1↓ / 2 → Confessar Não Confessar


Confessar −3, −3 −1, −5
Não Confessar −5, −1 −2, −2

Suponha que o jogador 1 adote a seguinte estratégia: na primeira interação ele joga N C (co-
operar). Nos perı́odos seguintes, se o outro jogador escolheu N C (cooperar) no perı́odo anterior,
ele coopera hoje. Caso contrário, o jogador 1 escolhe C (não cooperar) até o jogo terminar. Essa
estratégia pode levar a algum tipo de cooperação? Mais especificamente, existe algum equilı́brio
tal que os jogadores venham a adotar estratégias cooperativas? Para jogos do tipo dilema
dos prisioneiros repetidos finitas vezes, a resposta é negativa. Para jogos repetidos
indefinidamente ou sem data certa para terminarem, a resposta pode ser positiva.
A noção de ENPS tem como consequência que se o dilema dos prisioneiros for repetido um
número fixo (finito) de vezes, o único equilı́brio de Nash perfeito em subjogos será formado pelo
EN do jogo em cada perı́odo sendo jogado. Logo, não é possı́vel obter o resultado eficiente com a
repetição finita do jogo. Isso implica que qualquer dependência histórica nas estratégias atuais é
eliminada. Ou seja, tudo o que ocorreu antes é irrelevante para decidir o que fazer hoje. Para jogos
que satisfaçam as condições da proposição, um ENPS não depende da história ocorrida no jogo em
nenhum momento.

José Guilherme de Lara Resende 22 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Por exemplo, uma consequência desse fato é que se o dilema dos prisioneiros for jogado repeti-
damente, por um perı́odo determinado, continua sempre tendo a mesma solução não cooperativa
entre os jogadores, para cada rodada do jogo. Esse resultado segue da hipótese de racionalidade
sequencial. Por indução reversa, na última rodada, é melhor não cooperar. Resolvendo de traz
para diante, obtemos não-cooperação para todas as rodadas do jogo.
Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de término conhecida
pelos jogadores. Resolvendo o jogo por indução reversa, cada jogador percebe que o seu rival
irá descumprir o acordo de cooperação na última vez que interagirem. Eles se adiantam a isso
e não cooperam na última rodada. Sabendo disso, os jogadores também não irão cooperar na
penúltima rodada do jogo. Usando esse argumento, obtemos que os jogadores não cooperam em
nenhuma rodada do jogo. Esse argumento, consequência da definição de ENPS, leva a resultados
considerados pouco razoáveis, como mostra o Exemplo 9 abaixo, em que o único ENPS consiste
nos dois jogadores escolherem P sempre, o que resulta no payoff (1, 1).

Exemplo 9: Jogo da Centopeia. Considere o seguinte jogo.

Is C II C
s
Is C II II
s C . . . . . . . . . . . . .s C
I
s C II
s C (100 100)
P P P P P P P
            
1 0 2 1 97 99 98
1 3 2 4 100 99 101

Para o jogo da centopeia, o único ENPS consiste em todo jogador escolher P em todo momento
do jogo. Portanto, o payoff de equilı́brio é 1 para cada jogador, e nenhuma cooperação é obtida.
Porém, se o dilema dos prisioneiros for repetido infinitamente (ou se não tiver uma data fixa
para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido
como equilı́brio, dependendo do quanto os jogadores descontem o futuro.
As estratégias que levam a esse tipo de equilı́brio são chamadas estratégias gatilho (trigger
ou Nash-reversion strategies). Um exemplo é a estratégia “olho-por-olho” (tit-for-tat), onde a
estratégia de hoje do jogador é igual à estratégia usada pelo seu adversário ontem.
Considere a seguinte estratégia para o i, i = 1, 2, chamada grim reaper (ou grim trigger ): na
primeira interação ele joga N C (cooperar). Nos perı́odos seguintes, se o outro jogador escolher
N C (cooperar) no perı́odo anterior, ele coopera hoje. Caso contrário, o jogador i escolhe C (não
cooperar) para sempre (note que a estratégia é extremamente punitiva: um desvio do rival e nunca
mais a cooperação pode ser refeita). Suponha que a taxa de desconto intertemporal é 0 < δ < 1.
Temos que o jogador 2 cooperará se:
∞ ∞
X
t
X −2 −3δ
−2δ ≥ −1 + −3δ t ⇒ ≥ −1 +
t=0 t=1
1−δ 1−δ

Logo, se:
1
= 50% , δ≥
2
então o resultado cooperativo ((N C, N C) todo perı́odo) é obtido como equilı́brio (é um equilı́brio
de Nash perfeito em subjogos).

José Guilherme de Lara Resende 23 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do


equilı́brio cooperativo e seguindo o equilı́brio cooperativo, podem existir equilı́brios em que os
jogadores adotem estratégias que envolvem cooperação. Esse resultado é conhecido como “Folk
Theorem”.
Como a taxa de desconto intertemporal δ é determinada pela taxa de juros r do seguinte modo:
1
δ= ,
1+r
então uma vez determinada a taxa de desconto intertemporal, podemos também encontrar a taxa
de juros associada. Para o exemplo acima, temos que r ≥ 1.

Leitura Sugerida

• Varian, capı́tulos 28 (A Teoria dos Jogos) e 29 (Aplicações da Teoria dos Jogos).

• Nicholson e Snyder, capı́tulo 8 (Strategy and Game Theory).

José Guilherme de Lara Resende 24 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

Exercı́cios

1. Determine, justificando sucintamente, para os Exemplos 1 a 7 desta nota de aula:

a) As estratégias estritamente dominantes e as estratégias estritamente dominadas, quando


existirem.
b) As estratégias fracamente dominantes e as estratégias fracamente dominadas, quando
existirem.
c) As estratégias que nunca são melhor resposta e as estratégias racionalizáveis.
d) Considere todo par de estratégias para cada um desses jogos e verifique quais são
equilı́brios de Nash e quais não são, justificando pelo alguns desses pares para fim de
aprendizagem (se você ainda estiver com dificuldades, continue escrevendo a justifica-
tiva, até entender bem a lógica de se determinar um equilı́brio de Nash em estratégias
puras).
e) Determine os equilı́brios de Nash que possuem de fato uma randomização ocorrendo
para os exemplos 3 (problema de coordenação) e 4 (batalha dos sexos).
f) Procure determinar se existe algum EN com randomização para o jogo dilema dos pri-
sioneiros. Quais são os valores para as probabilidades encontradas? O que isso significa?

2. Argumente, de maneira clara e concisa, porque a ordem de eliminação das estratégias não
afeta o resultado do PEEED mas pode afetar o resultado do PEEFD.
3. Vimos a definição de dominância para estratégias puras. Estratégias mistas podem também
dominar estratégias puras ou mesmo outras estratégias mistas. Considere o seguinte jogo e
responda os itens a seguir.

1/2 L M R
U 3,0 0,-3 0,-4
D 2,4 4,5 -1,8

a) Mostre que as estratégias puras L e R não dominam estritamente a estratégia pura M .


b) Mostre que M é estritamente dominada pela estratégia mista em que 2 escolhe L e R
com probabilidades iguais.

4. Calcule os EN dos seguintes jogos e verifique se existe alguma relação desses equilı́brios com
equilı́brios obtidos por meio de algum argumento de dominância:

a)

1/2 L R
U 1,1 0,0
D 0,0 0,0

b)

1/2 L R
U 1,1 0,1
D 1,0 -1,-1

José Guilherme de Lara Resende 25 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

c)
1/2 L l m M
U 1,1 1,2 0,0 0,0
C 1,1 1,1 10,10 -10,-10
D 1,1 -10,-10 10,-10 1,-10

5. Paulo e Rafael querem dividir cem reais e decidem usar o seguinte jogo para isso. Paulo diz
quanto gostaria que Rafael recebesse. Sem observar a escolha de Paulo, Rafael diz quanto
seria uma oferta aceitável. As escolhas podem ser apenas em incrementos de R$ 25 (ou seja,
R$ 0, R$ 25, R$ 50, R$ 75 e R$ 100). Se a oferta de Paulo é igual ou maior do que o que Rafael
acha aceitável, então eles dividem o dinheiro seguindo a oferta de Paulo. Caso contrário, o
dinheiro é jogado fora. A utilidade de cada jogador é dada pelo tanto de dinheiro que ele
recebe.
a) Represente esse jogo na forma normal (ou seja, escreva esse jogo na forma matricial).
b) Quais são o(s) equilı́brio(s) de Nash em estratégias puras desse jogo?
6. Considere o seguinte jogo do tipo dilema dos prisioneiros representado pela matriz abaixo.
D C
D (R$1, R$1) (R$3, R$0)
C (R$0, R$3) (R$2, R$2)

a) Suponha que cada jogador deseja apenas obter o máximo de dinheiro possı́vel. Quais
são os EN desse jogo?

Suponha agora que os dois jogadores são altruı́stas, ou seja, cada um deles se importa com o
bem-estar do rival. Em particular, se mi (s1 , s2 ) é o payoff que o jogador i ganha e mj (s1 , s2 )
é o payoff do jogador j, quando a estratégia jogada é (s1 , s2 ), então a utilidade do jogador i
é dada por ui (s1 , s2 ) = mi (s1 , s2 ) + αmj (s1 , s2 ), onde α ≥ 0.

b) Escreva o jogo em forma matricial para α = 1. Qual o EN agora? O jogo continua sendo
do tipo dilema dos prisioneiros?
c) Para quais valores de α o jogo permanece como dilema dos prisioneiros? Para os valores
de α para os quais o jogo não é mais um dilema dos prisioneiros, encontre os EN.
d) Existe algum valor de α para o qual qualquer combinação de estratégias puras será um
equilı́brio?

7. Considere o jogo denotado por G(n, k) de adivinhar a média (“guessing the average”, Osborne
e Rubinstein), onde k é a quantidade de participantes que simultanemente escolhe um número
inteiro entre 1 e n (inclusive 1 e n). Um prêmio de R$60 é dividido igualmente entre os
jogadores que escolheram o número mais perto da metade da média de todas as escolhas (ou
seja, se a metade da média foi 3, e os número mais próximos foram 2 e 4, os participantes
que escolheram esses valores dividem o prêmio. Já se a metade da média foi 3,3, todos os
participantes que escolheram 3 levam o prêmio)
a) Escreva a forma normal do jogo G(3, 2) e ache todos os EN.
b) Argumente que para quaisquer n e k, todo mundo escolhendo 1 é um EN.
c) Argumente que em qualquer EN o prêmio é dividido por todos os participantes.
d) Argumente que o conjunto de estratégias descrito no item b) é o único EN.

José Guilherme de Lara Resende 26 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

8. O exército de Patópolis deve decidir se ataca ou não o exército de Gansópolis, que está
ocupando uma ilha que pertencia à Patópolis, situada entre as duas cidades. No caso de
um ataque, o exército de Gansópolis pode lutar ou recuar de volta à sua cidade, por meio
de uma ponte que liga a ilha à cidade. Cada cidade prefere ocupar a ilha a não ocupá-la, e
uma guerra é o pior resultado possı́vel para ambas as cidades. Modele essa situação como
um jogo na forma extensiva e mostre que o exército de Gansópolis pode melhorar seu payoff
se queimar a ponte que liga a ilha à sua cidade, eliminando a opção de recuar. Explique esse
resultado em termos intuitivos e relacione com o que foi visto em aula.
9. Considere o seguinte jogo na forma extensiva:

 
2 E 1t
2 @
@
M @D
@
t 2 @t
@
A A
 A  A
l  A r l  A r
 A  A
t AAt t AAt
       
3 1 0 0
1 0 0 1
a) Escreva o conjunto de estratégias desse jogo e encontre a forma estratégica associada.
b) Encontre os EN em estratégias puras.
c) Encontre os ENPS em estratégias puras.

10. (P4-2/18) Considere o jogo abaixo, em que o payoff na parte superior entre parênteses é do
jogador 1 e o payoff na parte inferior é do jogador 2. Reponda aos itens abaixo.
1 S 
2

v -
@ 0
@
E @D
@

@
@
v
@Rv
@
@ 2 @
@ @
l m @r l m r
@ @
@
@ @
   ? @
R    ? @
R 
1 1 4 4 0 3
3 2 0 0 2 3

a) Descreva os conjuntos de estratégias dos dois jogadores.


b) Qual a representação desse jogo na forma normal?
c) Existe alguma estratégia dominada (estritamente ou fracamente) para algum dos jo-
gadores?
d) Quais são os equilı́brios de Nash (EN) em estratégias puras desse jogo?
e) Quais são os EN perfeitos em subjogos (em estratégias puras)?

José Guilherme de Lara Resende 27 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

11. (P2-1/19) Considere o seguinte jogo na forma extensiva:

I
rH
 HH
L  
M HR
HH

r
II  jr II
H
  ? H
H
@ 0 @
2
@ @
a b@ c @ d
@ @
 
@
@
R    @Rr I
@
1 −1 −2 @
1 −1 4
@
P @Q
@
 @
  @
R
−1 −1
3 5
As ações do jogador I estão representadas por letras maiúsculas e as ações do jogador II por
letras minúsculas. O payoff na parte superior em parênteses é do jogador I e o payoff na parte
inferior é do jogador II.
a) Qual o número de estratégias puras do jogador 1? E do jogador 2?
b) Qual a representação desse jogo na forma normal?
c) Existe alguma estratégia dominada (estritamente ou fracamente) para algum dos jo-
gadores?
d) Quais são os equilı́brios de Nash (EN) em estratégias puras desse jogo?
e) Quais são os EN perfeito em subjogos (em estratégias puras)?
12. (P2-2/18) Considere o jogo na forma extensiva abaixo, em que o payoff descrito na parte de
cima do vetor de payoffs é o da firma entrante e o payoff na parte de baixo desse vetor é o da
firma monopolista.
Entrante
s
@
ñE @E
RsMonopolista
@
@
0 @
ñL @L
60
s Entrante @ Rs
@
A A
PE  A GE PE  A GE
 A  A

 AU  AU
8 15 −3 −12
30 15 0 −6

a) Determine os conjuntos de todas as estratégias para os dois jogadores.


b) Encontre os EN em estratégias puras do jogo.
c) Encontre os ENPS do jogo.
d) Considere o jogo acima, mas agora suponha que a firma Entrante observa se o Mo-
nopolista escolheu ñL ou L. Descreva todas as estratégias que a firma Entrante possui
agora.

José Guilherme de Lara Resende 28 NA 5 – Teoria dos Jogos


Microeconomia 2 Notas de Aula

13. (P4-1/19) Considere o seguinte jogo na forma extensiva:

Jog. 1
v
@
@
A @ B
@
@
@
Jog. 2 v @vJog. 2
@
A A
 A  A
 A  A
F  A D D  A F
 A  A
 A  A
AAv v
 

 Jog. 1 
 A
A 
2  A  A 0
 A  A
0 L A R L  A R 1
 A  A
    A     A 
3 0 3 1
10 1 0 1

onde o payoff na parte superior em parênteses é do jogador 1 e o payoff na parte inferior em


parênteses é do jogador 2.

a) Descreva as estratégias dos jogadores.


b) Derive a forma normal do jogo e encontre todos os equilı́brios de Nash (EN) do jogo em
estratégias puras.
c) Encontre todos os equilı́brios de Nash perfeitos em subjogos (ENPS) em estratégias
puras.

José Guilherme de Lara Resende 29 NA 5 – Teoria dos Jogos


Microeconomia 2 Nota de Aula 5

MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 5 – Monopólio
Prof. José Guilherme de Lara Resende

1 Monopólio
1.1 Definição

Um monopólio caracteriza-se por uma estrutura de mercado onde existe apenas um produtor
e vendedor do bem ou serviço, que não tem substitutos próximos. Logo, a elasticidade-preço da
demanda desse bem deve ser pequena.
Deve haver alguma razão que justifique a não existência (ou entrada) de potenciais competidores.
Caso contrário, o monopólio não se sustentaria. Logo, deve existir algum impedimento à entrada de
novas firmas na indústria. Esses impedimentos são chamados barreiras à entrada. Alguns exemplos
de barreiras à entrada são:
1. Restrições legais (exemplo: EBCT);
2. Patentes;
3. Controle de recursos ou insumos escassos;
4. Barreiras geradas de forma deliberada pelo monopolista;
5. Custos irrecuperáveis altos (sunk costs, custos enterrados)

Tais barreiras podem manter rivais fora da indústria e assegurar que ela seja monopolı́stica.
Todavia, monopólios podem também ocorrer mesmo na ausência destas barreiras, caso uma única
firma possua vantagens de custo sobre as rivais. Dois exemplos disto são:
1. Economias de escala (monopólio natural),
2. Superioridade técnica.

1.2 Decisão de Oferta do Monopólio

Em uma estrutura de mercado monopolista, não se assume a hipótese concorrencial de que o


vendedor toma o preço como dado. O monopolista sabe que pode influenciar o preço do bem no
mercado, já que é o único vendedor deste bem (price-maker ).
Existem duas variáveis que afetam o lucro do monopolista: a quantidade vendida e o preço de
venda. O monopolista não pode escolher qualquer combinação de preço de venda e quantidade
vendida: as suas escolhas de quantidade e preço estão restritas pela demanda agregada do bem.
O monopolista deseja escolher o nı́vel de produção que maximiza o lucro π = Receita −
Despesa = p(q)q − c(q), onde p(q) denota a função de demanda (inversa) de mercado:
max p(q)q − c(q)
q≥0

José Guilherme de Lara Resende 1 Monopólio


Microeconomia 2 Nota de Aula 5

A CPO desse problema resulta em:

p(q ∗ ) + q ∗ p0 (q ∗ ) = c0 (q ∗ ) (1)
| {z } | {z }
RM g CM g

A RM g do monopolista é tal que:

RM g = p(q ∗ ) + q ∗ p0 (q ∗ ) < p(q ∗ ) ,

pois p0 (q ∗ ) é negativo.
Para cada unidade a mais vendida, o monopolista recebe o preço do bem. Mas para vender mais
uma unidade, o monopolista deve baixar o preço de todas as unidades vendidas (termo q ∗ × p0 (q ∗ )).
Essa é a razão da ineficiência do monopólio. A Figura 1 ilustra essa situação, em que o custo
marginal se iguala à receita marginal do monopolita, mas em que esta última é menor do que o
preço cobrado pelo bem. Como a curva de demanda, que define o preço cobrado, mede a valoração
dos indivı́duos pelo bem, é maior do que o custo marginal de produção de uma unidade a mais do
bem, um mercado monopolista apresenta uma ineficiência econômica.

Custos,
Preços 6
c0 (q)
Q
SQ
S Q
S QQ
S Q
S Q
Q s
p(q ∗ ) S Q
S Q
Q
S Q
S Q
Q
S Q
Q
Ss
S
c0 (q ∗ ) Q
Q
S Q
Q
S Q
S QQ
S p(q)
S RM g(q)
S -
q∗ S Qtde

Figura 1 – Decisão Ótima de um Monopolista

A equação (1) pode ser reescrita como:


 
q dp(q)
p(q) 1 +
p(q) dq

Sabemos que a elasticidade-preço da demanda, ε(q) = (p/q(p)) × (dq(p)/dp), mede como a sen-
sibilidade da demanda de mercado a uma mudança no preço do bem, em termos percentuais. O
Teorema da Função Inversa implica que 1/ε(q) = (q(p)/p)×(dp(q)/dq). Usando isso e o fato de que

José Guilherme de Lara Resende 2 Monopólio


Microeconomia 2 Nota de Aula 5

na prática a demanda de um bem é negativamente inclinada, obtemos que a CPO do monopolista


pode ser reescrita como:  
∗ 1
p(q ) 1 − = c0 (q ∗ ) .
|ε(q ∗ )|
Como o preço p(q) e custo marginal c0 (q ∗ ) são não-negativos, a igualdade acima implica que:
1
1− >0 ⇒ |ε(q ∗ )| > 1 ,
|ε(q ∗ )|

ou seja, o monopolista escolhe produzir uma quantidade do bem na parte elástica da demanda de
mercado.
Podemos reescrever a CPO em termos da elasticidade-preço da demanda do bem como:

c0 (q ∗ )
p(q ∗ ) = h i = M c0 (q ∗ ) ,
1
1− |ε(q ∗ )|

onde M denota o “markup” cobrado sobre o custo marginal de produção,


1
M=h i >1
1
1− |ε(q ∗ )|

Como o monopolista produz apenas na parte elástica da demanda, o markup é maior que 1. Se
a elasticidade-preço da demanda for constante, o valor do markup é constante, qualquer que seja o
nı́vel de produção. Se c0 (q) = c, para todo q, então p = M c > c.
Rearranjando mais uma vez a CPO de um monopolista em termos da elasticidade-preço da
demanda, obtemos:
p(q ∗ ) − c0 (q ∗ ) 1

=
p(q ) |ε(q ∗ )|

A diferença, em termos percentuais, entre o preço cobrado e o custo marginal, chamado “ı́ndice
de Lerner”, é o inverso do valor absoluto da elasticidade da demanda calculada no ponto ótimo
de produção do monopolista. Logo, quanto menos elástica a demanda nesse ponto, maior essa
diferença percentual.
O lucro do monopolista é obtido substituindo a demanda ótima encontrada resolvendo o prob-
lema de maximização de lucro do monopólio. Logo, o lucro do monopólio é calculado como:

π = p (q ∗ ) × q ∗ − c(q ∗ ) ,

onde q ∗ é a quantidade ótima produzida pelo monopólio, p (q ∗ ) é o preço cobrado por unidade da
quantidade q ∗ produzida e c(q ∗ ) é o custo de produção de q ∗ .
A existência de um peso morto (“deadweight loss” – DWL) – um valor econômico que é dissipado
na economia, caracteriza uma situação de ineficiência econômica. Vimos que o preço cobrado pelo
monopolista é maior do que o custo marginal. Isso leva a uma situação de produção sub-ótima
no mercado: a firma produz menos do que o socialmente desejável. Ao fazer isso, o monopolista
cobra um preço maior do que o preço competitivo e aufere um lucro econômico positivo. Isso leva
à perda econômica descrita, ilustrada na Figura 2 abaixo.

José Guilherme de Lara Resende 3 Monopólio


Microeconomia 2 Nota de Aula 5

Custos,
Preços 6
Q
SQ
S Q
S QQ
S Q c0 (q)
p(q ∗ ) Qs
S Q 

S Q 
Q 
S Q 
S DW LQ 
S  QQ

c0 (q ∗ ) Ss
S 

Q
Q
 S Q
 Q
 S Q
 QQ
S
S p(q)
S -
0 q∗ S Qtde

Figura 2 - Peso Morto de um Monopólio

O peso morto gerado por um monopólio é calculado como a área do excedente total (a soma
do excedente do consumidor com o excedente do produtor) dissipado na economia, ou seja, a área
com DWL escrito na Figura 3 acima. Em geral, essa área é calculada como:
Z qcp
DW L = (p(q) − c0 (q))dq ,
qm

onde qm é a quantidade produzida em monopólio e qcp é a quantidade produzida em competição


perfeita. Se a demanda de mercado e a curva de custo marginal forem lineares, então basta calcular
a área de um triângulo, ou seja, basta calcular a altura e a base do triângulo representado na figura
acima.
Resumindo, em um monopólio, temos que:

• Quantidade produzida é menor do que a quantidade socialmente ótima,

• O preço cobrado é maior do que o preço socialmente ótimo,

• Existe uma perda econômica dissipada.

Portanto, o monopólio é uma situação indesejável do ponto de vista social. O preço de monopólio
é superior ao custo marginal na quantidade ótima, logo o monopolista poderia obter lucro na
margem ao produzir mais uma unidade do bem caso ele pudesse cobrar um preço especı́fico por
esta unidade, superior ao seu custo marginal, e este item seria consumido por um consumidor
marginal.
O monopolista ao não fazer isso gera uma ineficiência, pois existem consumidores dispostos a
pagar pelo bem um preço maior que o seu custo de produção, mas, mesmo assim, este bem não é
produzido, pois se o monopolista produzir mais essa unidade, terá que baixar o preço de todas as
outras unidades vendidas.

José Guilherme de Lara Resende 4 Monopólio


Microeconomia 2 Nota de Aula 5

Exemplo: Demanda Linear e RCE. Suponha que a demanda do bem seja dada por p = a − bq
e a função custo do monopolista seja c(q) = cq, onde c é uma constante, com a > c. O problema
do monopolista nesse caso é:
max (a − bq)q − cq
q≥0

Observe que no caso de demanda linear, em que a receita é R(q) = (a − bq)q, a receita marginal é
RM g(q) = a − 2bq, ou seja, a receita marginal também será linear, duas vezes mais inclinada do
que a curva de demanda. A CPO do problema do monopolista resulta na seguinte solução:
a−c a+c
q∗ = e p=
2b 2

O lucro do monopolista, calculado como π = pq − c(q), será:


a+c a−c a−c (a − c)2
π= × −c× =
2 2b 2b 4b
Portanto, uma condição para que este lucro seja positivo é a de que o parâmetro a da demanda seja
maior do que o custo marginal de produção c. Intuitivamente, se o mercado for muito pequeno em
relação ao custo marginal de produção (a < c), não compensará produzir. Já o peso morto para
este exemplo é:
(a − c)2
  
1 a−c a−c a+c
DW L = − −c =
2 b 2b 2 8b

1.3 Imposto sobre a Quantidade

O que ocorre em um mercado monopolista quando o governo estabele um imposto sobre a


quantidade? O preço cobrado pelo monopolista aumenta de que modo? Os dois casos analisados
abaixo mostram que, em geral, não podemos dizer se o preço de monopólio irá aumentar por um
valor maior ou menor do que o valor do imposto:
• No caso em que o custo marginal e a elasticidade da demanda são constantes, se o governo
estabelecer um imposto sobre a quantidade no valor de t, temos que o novo preço cobrado
pelo monopolista será:
c+t
p(q ∗ ) = h i
1
1 − |ε|

Logo: −1
∂p(q ∗ )

1
= 1− > 1,
∂t |ε|
ou seja, o preço cobrado pelo monopolista aumenta em uma proporção maior do que o valor
do imposto.
• Suponha agora que o custo marginal é constante e a demanda de mercado é linear. Se o
governo estabelecer um imposto sobre a quantidade, temos que o novo preço cobrado pelo
monopolista será:
a+c+t
p(q ∗ ) =
2
Logo:
∂p(q ∗ ) 1
= < 1,
∂t 2
ou seja, o preço cobrado pelo monopolista aumenta em uma proporção menor do que o valor
do imposto (nesse caso, o preço aumenta a metade do aumento do imposto).

José Guilherme de Lara Resende 5 Monopólio


Microeconomia 2 Nota de Aula 5

1.4 Monopólio Natural

Um monopólio natural é caracterizado por uma curva de custo médio de longo prazo decrescente
para todos os nı́veis relevantes de produção. Ou seja, a tecnologia da firma apresenta retornos
crescentes de escala. Esta é uma importante falha de mercado observada em setores importantes,
tais como serviços de utilidades públicas.

Custos,
Preços 6
Dilema: apenas uma firma no mercado
minimiza o custo, mas nesse caso a firma
pode cobrar preço de monopólio

CM e
CM g
-
Qtde

Figura 3 – Monopólio Natural

Um monopólio natural permanente tem uma curva de custo médio de longo prazo que cai
continuamente à medida que aumenta a quantidade produzida. Mesmo que a demanda aumente,
ela continua cruzando a curva de custo médio em um trecho descendente. Um monopólio natural
temporário tem curva de custo médio descendente em um primeiro trecho, mas, a partir de certa
quantidade, o custo médio passa a ser constante ou crescente. A partir de uma demanda de certo
tamanho (reta D0 , na figura 4 abaixo), pode já ser possı́vel ter mais de uma firma produzindo e,
portanto, alguma competição no mercado.

Custos,
Preços 6

B B
B B
B B
B B
B B
B B
B B
B B
B B
B B CM e
BB BB
D D0 -
Qtde

Figura 4 – Monopólio Natural Temporário

José Guilherme de Lara Resende 6 Monopólio


Microeconomia 2 Nota de Aula 5

Inovação tecnológica pode alterar o formato da curva de custo médio, deslocando-a para a
esquerda e fazendo com que atinja seu ponto de mı́nimo a quantidades menores. Logo, à escala
ótima de produção (ou escala eficiente), o ponto de mı́nimo da curva de custo médio total diminui
e passa a ser mais fácil haver competição neste setor.

1.5 Discriminação de Preços

Até agora, estamos supondo que o monopolista vende o bem pelo mesmo preço, qualquer que
seja o comprador e a quantidade comprada por ele. Porém, em muitas situações, o preço cobrado
pelo monopolista pode depender de quem compra e da quantidade comprada. Nesse caso, dizemos
que o monopolista está discriminando preços. Exemplos comuns são descontos por quantidade
comprada e cobrança diferenciada, dependendo do perfil do consumidor.
Vamos discutir três tipos de discriminação de preços:

1. Discriminação de primeiro grau ou discriminação perfeita: monopolista vende difer-


entes quantidades do produto a diferentes preços e cujos preços podem diferir de comprador
a comprador.

2. Discriminação de segundo grau: monopolista vende diferentes quantidades do produto a


diferentes preços e os preços não variam com o comprador (preços não-lineares, descontos de
quantidade).

3. Discriminação de terceiro grau: monopolista vende a preços diferentes para diferentes


tipos de pessoas, mas cada unidade do bem tem o mesmo preço para o comprador (descontos
de cinemas, etc).

Discriminação perfeita é rara quando não impossı́vel, devido a restrições legais e ao fato de que
o monopolista teria que ter informação sobre a valoração de cada consumidor, de modo a cobrar de
cada um o preço mais alto que está disposto a pagar. Uma forma de implementar um mecanismo
que tem efeito similar é a tarifa em duas partes (two-part tariff ). Ela consiste em o consumidor
pagar dois preços pelo bem. O primeiro é o preço de acesso ao mercado, que permite o consumidor
comprar o bem. O segundo é o preço por unidade comprada do bem. Se o monopolista cobrar o
primeiro preço igual ao excedente médio consumidor e o segundo igual ao custo marginal do bem,
então ele extrairá todo o excedente do consumidor (supondo que a valoração do bem é igual para
todo consumidor) e o resultado será similar ao obtido com a discriminação de primeiro grau.

Custos,
Preços 6
Q
Q
Q
Q
Q
Q Exemplo de Two-Part Tariff
Firma cobra valor para o acesso A e pcp por unidade consumida
A
Q
Q
Q
Q
Q s
pcp Q CM g
Q
Q
Q
Q
Q
Q
Q
Q
Q
Demanda
s
José Guilherme de Lara
0 Resende qcp7
-
Qtde Monopólio
Microeconomia 2 Nota de Aula 5

Na discriminação do segundo grau, os preços diferem dependendo da quantidade comprada,


mas não do perfil do comprador. Nesse caso, a ineficiência do monopólio pode diminuir, mas não
irá desaparecer.
Na discriminação de preços do terceiro grau, os preços diferem pelas caracterı́sticas do consum-
idor, mas não pela quantidade consumida. Nesse caso, a ineficiência do monopólio também pode
diminuir, mas não desaparecerá por completo.

Exemplo – Mercado de Passagens Aéreas. Suponha que existam dois tipos de consumidores,
um chamado “executivo” e outro chamado “estudante”. O executivo viaja apenas durante a sem-
ana, entre segunda a sexta-feira. O estudante pode viajar em qualquer perı́odo da semana. Além
disso, o executivo possui maior poder aquisitivo do que o estudante. Companhias áreas podem
então oferecer descontos maiores para bilhetes que incluam o sábado entre o vôo de partida e vôo
de chegada. Com isso, a companhia tenta discriminar entre os dois tipos de clientes, cobrando mais
caro do cliente que pode e está disposto a pagar mais.
Se discriminação perfeita fosse possı́vel, a ineficiência do monopólio desapareceria. Neste caso,
ocorreria uma redistribuição de riqueza, com todo o excedente do consumidor sendo capturado
pela firma discriminadora de preços, o que pode não ser aceitável para a sociedade. No caso de
discriminação de preços de segundo e terceiro graus, pode ocorrer que a ineficiência diminua, mas
não desapareça, e de modo que parte do excedente do consumidor também seja apropriado pelo
monopolista.

Exemplo: Discriminação de Terceiro Grau. Suponha que existam dois tipos de consumidores,
cada tipo tem uma curva de demanda própria, p1 (q1 ) e p2 (q2 ) (suponha que os consumidores não
consigam revender o bem). O custo de produção da firma é dado por c(q1 + q2 ). O problema da
firma é:
max p1 (q1 )q1 + p2 (q2 )q2 − c(q1 + q2 )
q1 ,q2

As CPOs do problema resultam em:


(q1 ) : p1 (q1∗ ) + q1∗ p01 (q1∗ ) = c0 (q1 + q2 )
| {z }
RM g1 (q1 )

(q2 ) : p2 (q2∗ ) + q2∗ p02 (q2∗ ) = c0 (q1 + q2 )


| {z }
RM g2 (q2 )

ou seja, a receita marginal obtida no mercado de cada grupo deve ser igual ao custo marginal de
produção total. Reescrendo as receitas marginais dos dois mercados em termos de elasticidade-preço
da demanda, obtemos:
   
1 1
p1 (q1 ) 1 − = CM g(q1 + q2 ) = p2 (q2 ) 1 −
|ε1 (q1 )| |ε2 (q2 )|

Portanto, se p1 > p2 , então para que a igualdade acima entre as receitas marginais de mercados
diferentes seja igual devemos ter que:
1 1
1− <1− ⇒ |ε1 (q1 )| < |ε2 (q2 )|
|ε1 (q1 )| |ε2 (q2 )|

Portanto, o mercado que apresenta maior preço é o mercado com menor elasticidade-preço da
demanda (em valor absoluto).

José Guilherme de Lara Resende 8 Monopólio


Microeconomia 2 Nota de Aula 5

Exemplo: Monopólios Donwstream e Upstream. Considere um monopolista cujo produto é


usado como fator de produção por outro monopolista. Por exemplo, uma empresa pode ser a única
vendedora de eucaliptos para uma outra empresa, única produtora de papel no mercado (e única
compradora de eucaliptos). A primeira firma é chamada monopolista upstream e a segunda firma,
monopolista downstream. Vamos analisar um modelo simples com essa configuração.
O que ocorre em um mercado com esta configuração? Será que se os dois monopólios se inte-
grarem (integração vertical ), o resultado será benéfico para os consumidores? A resposta é sim.
Varian desenvolve um modelo simples em que o monopólio integrado irá produzir mais (e, por-
tanto, cobrar um preço menor) do que a situação com os dois monopólios, upstream e downstream,
pois nesta situação ocorre um mark-up duplo, feito por cada um dos dois monopolistas, enquanto
com o monopólio integrado, ocorre apenas um único mark-up.
Suponha que o monopolista upstream tenha um custo marginal de produção constante, igual a c,
que vende a sua produção x a um preço k, para ser usado como fator de produção pelo monopolista
downstream, cuja função de produção é q = f (x) = x e cuja curva de demanda para o seu produto
é linear, representada por p(q) = a − bq, com a, b > 0.
O problema do monopolista downstream é:

max p(q) q − kq = [a − bq] q − kq


q≥0

A CPO desse problema resulta em:


a−k
a − 2bq ∗ = k ⇒ q∗ =
2b
Como q = x, ou seja, para cada unidade de q produzida, o monopolista downstream demanda uma
unidade do insumo, temos que:
a−k
x∗ = q ∗ = .
2b

Tendo conhecimento dessa estrutura de mercado e da decisão ótima do monopolista downstream,


o monopolista upstream sabe que a curva de demanda do seu produto é definida por x∗ = (a−k)/2b,
ou seja, k(x) = a − 2bx. Logo, esse monopolista resolve o seguinte problema:

max k(x)x − c(x) = [a − 2bx]x − cx


x≥0

A CPO desse problema resulta em:


a−c
k 0 (x)x + k(x) = c ⇒ a − 4bx = c ⇒ x∗ =
4b
Logo o monopolista upstream irá ofertar a quantidade x∗ = (a − c)/4b do insumo. Como a função
de produção do monopolista downstream é q = x, então serão ofertadas q ∗ = (a − c)/4b do produto
final.
Vamos agora analisar o que aconteceria se ocorresse um processo de integração vertical, isto é,
se esses monopolistas se fundissem em uma única firma, constituindo um único monopólio. Nesse
caso, o problema do monopolista integrado é:

max p(q) q − cq = [a − bq] q − cq


q≥0

José Guilherme de Lara Resende 9 Monopólio


Microeconomia 2 Nota de Aula 5

A CPO desse problema resulta em:


a−c
a − 2bq ∗ = c ⇒ q∗ =
2b

Ou seja, a produção do bem final é o dobro agora. É possı́vel mostrar que mesmo considerando
funções de demanda, produção e custo mais gerais, o monopólio integrado irá produzir mais (e,
portanto, cobrar um preço menor) do que a situação com os dois monopólios, upstream e down-
stream, pois nesta situação ocorre um mark-up duplo, feito por cada um dos dois monopolistas,
enquanto com o monopólio integrado, ocorre apenas um único mark-up.

1.6 Monopsônio

O monopsônio é a estrutura de mercado onde existe apenas um comprador para um determinado


bem (nesse caso, dizemos que o monopsonista é um fixador de preços). Suponha que esse bem tem
uma curva de oferta inversa w(x) crescente e que a função de produção da firma dependa apenas
desse fator de produção.
O problema do monopsonista é:

max pf (x) − w(x)x


x

A CPO resulta em:


 
0 0 1
pf (x) = w(x) + w (x)x = w(x) 1 + ,
η(x)

onde η(x) é a elasticidade-preço da oferta do insumo x. Como a curva de oferta é positivamente


inclinada, temos que η(x) > 0. Logo, pf 0 (x) > w(x), e o custo marginal do insumo (w(x) + w0 (x)x)
é maior do que custo médio do insumo (w(x)). Isso implica que o preço do insumo w(x) será menor
do que se o mercado do insumo fosse competitivo.
Observe que a interpretação é análoga a de um monopólio: se o monopsônio aumentar o uso
do insumo em uma unidade, ele pagará pelo valor dessa unidade, w(x), mais um valor dado pelo
aumento do preço do insumo, para todas unidades compradas, w0 (x)x. Temos, então, uma situação
de ineficiência econômica, onde a ineficência origina-se no mercado de fatores.
Finalmente, quanto mais elástica a oferta do insumo, menor a diferença entre o custo marginal
e o custo médio do insumo. Se o mercado de fatores for perfeitamente competitivo, então a curva
de oferta do fator será perfeitamente elástica (η(x) = ∞) e pf 0 (x) = w(x), com o custo marginal
do insumo igualando o seu custo médio.

Leitura Sugerida

• Varian, capı́tulos 24 (Monopólio), 25 (O Comportamento Monopolista) e 26 (O Mercado de


Fatores).

• Nicholson e Snyder: Capı́tulo 14 (Monopoly).

José Guilherme de Lara Resende 10 Monopólio


Microeconomia 2 Nota de Aula 6

MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 6 – Oligopólio
Prof. José Guilherme de Lara Resende

1 Oligopólio
1.1 Introdução

O oligopólio é uma estrutura industrial onde poucos produtores oferecem produtos homogêneos
a muitos compradores. É um tipo de estrutura industrial entre competição perfeita e monopólio.
Em um oligopólio, cada firma deve conhecer a demanda do mercado fazer conjeturas sobre as
ações das outras firmas do mercado, que afetam o seu bem-estar. Além disto, cada firma devm
saber como as suas ações afetam as outras firmas.
Portanto, esse é um problema de interdependência estratégica e, consequentemente, a ferramenta
fundamental que auxilia a análise deste tipo de problema é a teoria dos jogos.
Primeiro iremos analisar o caso de cartel (ou conluio), em que as firmas entram em acordo e
se comportam como um monopólio. Em seguida usaremos o conceito de equilı́brio de Nash para
analisar quatro modelos básicos de oligopólio, Cournot (1838), Bertrand (1883) (jogos simultâneos),
Stackelberg (1934) e liderança no preço.
Os modelos de Cournot e Bertrand tratam do mesmo problema e levam a conclusões bastante
distintas. Os dois modelos são estáticos, sem interação dinâmica. No modelo de Cournot, as firmas
escolhem a quantidade ótima a ser produzida. No modelo de Bertrand, as firmas escolhem o preço
ótimo a ser cobrado.

1.2 Cartel

Um possı́vel arranjo de mercado quando existem poucas firmas atuando é o equilı́brio de colusão.
Nesse equilı́brio, as firmas comportam-se como um único ente, maximizando a receita agregada,
que é repartida de algum modo pré-especificado. Essa é uma situação tı́pica de cartel (ou conluio).
O resultado principal de cartéis é a sua tendência à instabilidade: cada firma tem um incentivo
para burlar a regra de produção definida pelo cartel, de modo similar ao problema analisado no
Dilema dos Prisioneiros.

Exemplo com Duas Firmas. Suponha que existam 2 firmas, onde c1 (q1 ) é a função custo da
firma 1 e c2 (q2 ) é a função custo da firma 2. O problema do cartel é:

max p(q1 + q2 )(q1 + q2 ) − c1 (q1 ) − c2 (q2 )


q1 ,q2

As CPOs desse problema são:

(q1 ) : p(q1∗ + q2∗ ) + (q1∗ + q2∗ )p0 (q1∗ + q2∗ ) = c01 (q1∗ )
(q2 ) : p(q1∗ + q2∗ ) + (q1∗ + q2∗ )p0 (q1∗ + q2∗ ) = c02 (q2∗ )

José Guilherme de Lara Resende 1 Oligopólio


Microeconomia 2 Nota de Aula 6

Portanto, na solução ótima temos que os custos marginais de cada firma são iguais, c01 (q1∗ ) =
c02 (q2∗ ). Se uma firma tiver alguma vantagem de custo (se, por exemplo, a curva de custo marginal
de uma das firmas estiver sempre abaixo da curva de custo marginal da concorrente), ela então
produzirá mais no equilı́brio de cartel. Como vale que:
∂π1 (q1∗ , q2∗ )
= p(q1∗ + q2∗ ) + q1∗ p0 (q1∗ + q2∗ ) − c01 (q1∗ ) ,
∂q1
a primeira CPO acima implica que:
∂π1 (q1∗ , q2∗ )
= −q2∗ p0 (q1∗ + q2∗ ) > 0 ,
∂q1
ou seja, em equilı́brio ocorrem incentivos para o desvio da solução de cartel para ambas as firmas
(o caso da firma 2 é análogo, e argumento semelhante vale para um cartel com J firmas).
Se repetirmos a interação entre as firmas em conluio por vários perı́odos, podemos ter dois
resultados:
1. Se a interação for finita e tiver data certa para acabar, o cartel não será estável.
2. Se a interação se repetir indefinidamente (infinitamente ou se não tiver data certa para
acabar), o equilı́brio de cartel poderá ser estável. Normalmente, ele será estável quando
as firmas participantes concordarem em uma punição para quem trair o acordo de cartel.

Suponha que um cartel de duas firmas se reune indefinidamente, onde cada firma produz metade
da quantidade de monopólio todo perı́odo. Suponha que a taxa de desconto intertemporal é deno-
tada por δ, com 0 < δ < 1.
A firma 1 impõe a seguinte regra à firma 2: se você cumprir o acordo do cartel hoje, eu cumprirei
o acordo do cartel amanhã. Porém, se você quebrar o acordo do cartel, eu produzirei para sempre
a quantidade de produção definida pelo equilı́brio de Cournot. Vimos que a estratégia acima,
no contexto da teoria dos jogos, é uma estratégia gatilho (“trigger strategy”), também chamada
estratégia de reversão a um EN (“Nash reversion strategy”), do tipo grim reaper.

Exemplo: Suponha que πc , πec e πd são os lucros da firma no caso de cartel, no caso de Cournot
(que será analisado mais à frente) e no caso de desvio, de modo que πd > πc > πec . Supondo que
as firmas escolham estratégias grim reaper, cada firma cumprirá o acordo do cartel se:
∞ ∞
X X πc δπec
δ t π c ≥ πd + δ t πec ⇒ > πd +
t=0 t=1
1−δ 1−δ

Logo, se
πd − π c
δ> ,
πd − πec
então o equilı́brio de cooperação do cartel será estável. Como a taxa de desconto intertemporal δ
é determinada pela taxa de juros r, do seguinte modo:
1
, δ=
1+r
então, se encontrarmos a taxa de desconto intertemporal, podemos também encontrar a taxa de
juros associada. Para o exemplo acima, obtemos que:
πc − πec
r< .
πd − πc

José Guilherme de Lara Resende 2 Oligopólio


Microeconomia 2 Nota de Aula 6

1.3 Oligopólio de Cournot

Suponha uma indústria com entrada bloqueada onde J firmas produzem um bem homogêneo,
todas com estrutura de custos denotada por cj (qj ). A demanda inversa do mercado é dada por
p = p(Q), onde Q = q1 + · · · + qJ é a produção total.
Encontramos a quantidade ótima produzida pela firma j, q̄j , resolvendo o problema de maxi-
mização de lucro dessa firma, tomando como dados as quantidades de produção ótimas das outras
firmas:
max p(Q)qj − cj (qj )
qj

A CPO desse problema resulta em:


p(Q) + p0 (Q)qj = c0j (qj )

Rearranjando a equação acima, obtemos:


 
sj
p(Q) 1 − = c0j (qj ) ,
|εp (Q)|
onde sj = qj/Q é a fração da produção total produzida pela firma j.

Exemplo: Modelo Linear. Suponha uma indústria com entrada bloqueada onde J firmas
produzem um bem homogêneo, todas com estrutura de custos idêntica, dada por:
C(qj ) = cqj , c ≥ 0, j = 1, . . . , J .

Suponha também que a demanda inversa do mercado é linear, dada por:


J
X
p=a−b qj ,
j=1

onde a > 0, b > 0 e a > c. O lucro da firma j quando produz q j e as outras firmas produzem qi ,
i 6= j, é: !
J
X
πj (q1 , . . . , qJ ) = a − b qi qj − cqj
i=1

Queremos encontrar uma alocação q̄ = (q̄1 , . . . , q̄J ) tal que q̄j seja a solução do problema acima,
dado que as outras firma estão escolhendo q̄1 , . . . q̄j−1 , q̄j+1 , . . . q̄J . Chamamos essa alocação de um
equilı́brio de Cournot-Nash do problema de oligopólio caracterizado acima.
Encontramos q̄j resolvendo o problema da firma j, tomando como dados as quantidades de
produção ótimas das outras firmas:
J
! !
X X
max a − b q̄i qj − cqj = max a − bqj − b q̄i qj − cqj
qj qj
i=1 i6=j

A CPO desse problema resulta em:


a−c 1X
q̄j = − q̄i (1)
2b 2 i6=j

José Guilherme de Lara Resende 3 Oligopólio


Microeconomia 2 Nota de Aula 6

A equação (1) é chamada curva de reação da firma j: ela diz qual o melhor nı́vel de produção a
ser escolhido pela firma j, dado que as outras firmas estão produzindo q̄i , i 6= j.
Dada a simetria do problema (a condição (1) acima vale para toda firma j), vamos procurar
por um equilı́brio simétrico, q̄1 = · · · = q̄J . Nesse caso, a condição (1) resulta em:
a−c
q̄ =
b(J + 1)

Portanto, temos que:

a−c (a − c)2
q̄j = , ∀j, e π̄j =
b(J + 1) b(J + 1)2
 
a−c a−c
q̄ s = J e p̄ = a − J
b(J + 1) J +1

Se existirem apenas duas firmas, obtemos que:

a−c (a − c)2
q̄j = e π̄j =
3b 9b
a −c a + 2c
q̄ s = 2 e p̄ =
3b 3

Comparando com a situação de monopólio, vemos que a produção total em um oligopólio de


duas firmas com competição na quantidade é maior do que a produção de monopólio.
O desvio do preço p̄ de equilı́brio de oligopólio do preço de equilı́brio em competição perfeita é:
a−c
p̄ − c = >0
J +1

A equação acima mostra que o preço cobrado é maior do que o preço de mercado em competição
perfeita e tende ao preço de competição perfeita quando o número de firmas aumenta. Portanto, o
resultado de competição pode ser visto como o limite do caso de um modelo competição a Cournot,
quando o número de firmas tende a infinito.

Resumo do Modelo de Cournot:

• No modelo de Cournot, as firmas competem na quantidade produzida. Ou seja, cada firma


escolhe a quantidade que vai produzir no mercado, sabendo que a outra firma vai fazer o
mesmo.

• O resultado desse modelo é intermediário entre os resultados de competição perfeita e monopólio:


a produção total do mercado será maior do que no caso de um monopolista, mas menor do
que seria a produção total em um mercado competitivo.

• O modelo de Cournot leva a uma alocação ineficiente, e quanto mais firmas no mercado,
menor a ineficiência e mais o equilı́brio se aproxima do equilı́brio competitivo.

José Guilherme de Lara Resende 4 Oligopólio


Microeconomia 2 Nota de Aula 6

1.4 Oligopólio de Bertrand

No oligopólio de Cournot, a variável estratégica de escolha da firma é a produção. No modelo de


Bertrand, a variável de escolha da firma é o preço a ser cobrado. Vamos então supor um mercado
onde duas firmas competem no preço. O custo marginal de cada firma é igual e constante. A firma
que anunciar o menor preço conquista toda a demanda q D pelo bem. Se as firmas anunciarem preços
iguais, elas dividem o mercado. A demanda da firma 1 é (a demanda da firma 2 é semelhante):

 q(p1 ) se p1 < p2
1
q1 (p1 , p2 ) = q(p1 ) se p1 = p2
 2
0 se p1 > p2

Suponha que o custo marginal é constante, igual nas duas firmas. A função de lucro da firma
1 é:
π1 = (p1 − c) × q1 (p1 , p2 )

Observe que como a função de demanda de cada firma é descontı́nua, a função lucro de cada
firma também é descontı́nua.

Resultado: Equilı́brio de Bertrand. O único equilı́brio de Nash em um modelo de Bertrand é


dado por p1 = p2 = c (onde π1 = π2 = 0).

Logo, em um modelo de Bertrand, o único equilı́brio é as duas firmas cobrarem o preço de


competição perfeita. Nesse caso, o lucro das firmas será zero. Com apenas duas firmas, a competição
via preço leva ao menor preço possı́vel, em contraste com o modelo de Cournot, onde a competição
via quantidade leva a um preço intermediário ao preço de monopólio e ao preço de competição
perfeita.

Resumo do Modelo de Bertrand:


• No modelo de Bertrand as firmas competem no preço. Ou seja, cada firma escolhe o preço
que vai anunciar no mercado, sabendo que a outra firma vai fazer o mesmo.

• O modelo de Bertrand é um modelo que leva a um resultado extremo, mesmo que existam
apenas duas firmas no mercado: elas se comportam como firmas competitivas, sem tentar
manipular o mercado e cobrando preço igual ao custo marginal.

• Nesse caso não há ineficiência e nenhuma firma terá poder de mercado, mesmo que existam
apenas duas firmas no mercado. Por isso, esse modelo é visto com cautela, já que aparente-
mente não traz um resultado razoável.

1.5 Modelo de Stackelberg (Liderança na Quantidade)

No modelo de duopólio de Stackelberg (ou liderança na quantidade), uma das firmas, chamada
lı́der, escolhe a quantidade que vai produzir primeiro. A outra firma, chamada seguidora, observa
a escolha da firma lı́der e então escolhe a sua quantidade de produção.
Este modelo é útil em situações onde existe uma firma grande, que possui maior parcela do
mercado, e outras firmas menores, que gravitam em torno da firma maior e que tomam decisões
após a firma lı́der ditar o rumo da indústria.

José Guilherme de Lara Resende 5 Oligopólio


Microeconomia 2 Nota de Aula 6

Pode-se mostrar analiticamente que é melhor ser lı́der do que seguidora e que a firma lı́der
obtém um lucro maior do que se estivesse em uma situação de Cournot, onde todas as firmas são
iguais no sentido de tomarem suas decisões simultaneamente.
A firma lı́der incorpora no seu problema de maximização a curva de reação da firma seguidora.
Vamos supor que a firma 1 seja a firma lı́der e a firma 2, a seguidora. Logo, no modelo de
Stackelberg, a lı́der escolhe o nı́vel ótimo de produção incorporando a curva de reação da seguidora
em sua decisão de produção. No modelo de Cournot, a mesma firma escolhe o nı́vel ótimo de
produção, dado um ponto qualquer da curva de reação da outra firma. Portanto, o lucro da lı́der
será maior ou igual ao lucro que essa firma obteria em uma situação de competição a Cournot.
Exemplo: Caso Linear. Suponha que existam apenas duas firmas no mercado, onde a demanda
agregada inversa é p = a − bq e o custo de produção de cada firma é ci (qi ) = cqi , i = 1, 2. O nı́vel
ótimo de produção da firma seguidora é encontrado resolvendo-se o problema:

max (a − b(q̄1 + q2 ))q2 − cq2


q2 ≥0

A CPO do problema acima resulta na curva de reação da firma seguidora:


a − c q̄1
q2 = −
2b 2

Vamos resolver o problema da firma lı́der (firma 1), que incorpora a curva de reação da firma
seguidora na sua decisão da quantidade ótima a produzir:
  
a − c q1
max a − b q1 + − q1 − cq1
q1 ≥0 2b 2

A CPO do problema da firma lı́der resulta na quantidade ótima de produção ql∗ = (a − c)/2b.
Substituindo esse valor na curva de reação da firma seguidora, encontramos a sua quantidade ótima,
qs = (a − c)/4b. Usamos as quantidades ótimas para calcular o preço de equilı́brio, via demanda
de mercado:  
∗ a−c a−c a + 3c
p = a − b(ql + qs ) = a − b + =
2b 4b 4

Finalmente, o lucro da firma lı́der e o lucro da firma seguidora são:

(a − c)2 (a − c)2
πl (ql∗ ) = p∗ ql∗ − cql∗ = e πs (qs∗ ) = p∗ qs∗ − cqs∗ = .
8b 16b
Comparação dos Modelos Lineares:

Caso p ql πl qs πs
a+2c a−c (a−c)2 a−c (a−c)2
Cournot 3 3b 9b 3b 9b
a+3c (a−c) (a−c)2 (a−c) (a−c)2
Stackelberg 4 2b 8b 4b 16b
Bertrand c indefinido 0 indefinido 0

José Guilherme de Lara Resende 6 Oligopólio


Microeconomia 2 Nota de Aula 6

1.6 Modelo de Liderança no Preço

O modelo de liderança no preço é similar ao de Stalckelberg, porém a estratégia de cada firma


é o preço. A firma lı́der escolhe o preço, a seguidora toma o preço escolhido da firma lı́der como
dado. Neste caso, a seguidora se comporta como uma firma competitiva.
O problema de maximização de lucro da firma seguidora assumindo que é tomadora de preços
é:
max pqS − cS (qS ) ,
qS ≥0

o que resulta na curva de oferta inversa p = cS (qS ), o que determina a sua curva de oferta, denotada
por q S (p).
A lı́der se defronta então com uma curva de demanda residual, denotada por qR (p), e dada
pela diferença da curva de demanda de mercado (qD (p)) com a oferta da firma seguidora, qR (p) =
qD (p) − qS (p). Portanto, a firma lı́der se comporta como um monopolista onde a demanda com a
qual se defronta é a demanda total de mercado menos a oferta da empresa seguidora:

max pR (qL )qL − cL (qL )


qL ≥0

A CPO deste problema determina a quantidade ofertada pela firma lı́der, qL∗ . Usando a demanda
residual, obtemos o preço de mercado. Finalmente, determinamos a quantidade produzida pela
firma seguidora usando a sua curva de oferta e o preço de mercado.

Leitura Sugerida

• Varian, capı́tulo 27 (O Oligopólio).

• Nicholson e Snyder: capı́tulo 15 (Imperfect Competition).

José Guilherme de Lara Resende 7 Oligopólio


Microeconomia 2 Nota de Aula 8

MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 8 – Teoria da Informação
Prof. José Guilherme de Lara Resende

1 Economia da Informação
1.1 Introdução

Os modelos que vimos até agora supõem informação perfeita. Por exemplo, os consumidores
possuem toda informação relevante sobre a qualidade dos produtos adquiridos. Já as firmas con-
hecem exatamente a produtividade de novos empregados.
Isso permite tratar os dois problemas, consumidor e firma, separadamente e depois unificar a
análise via preços que equilibram mercados. Modelos de equilı́brio geral supõem interações entre os
agentes bastante limitadas, que se dão apenas pelo sistema de preços. Isso gera vários problemas,
como, por exemplo, justificar a existência de firmas. Incluir incerteza nos modelos de equilı́brio
geral não resolve o problema, já que nesses modelos a incerteza é modelada de modo simétrico.
Problemas aparecem quando existe assimetria de informação.
Exemplos:

1. Relação empregado/patrão: nı́vel de esforço,

2. Compra de produtos: qualidade do produto,

3. Venda de produtos: disponibilidade a pagar.

Modelos de informação imperfeita quebram essa metodologia: assimetrias de informação podem


gerar comportamentos estratégicos, onde o agente que possui a informação privada tenta tirar
proveito dela. Na maioria dos casos, a assimetria de informação gera uma ineficiência. Logo, o
primeiro teorema do bem-estar deixa de ser válido.

Caracterı́sticas dos Modelos de Informação:

1. Na maior parte, equilı́brio parcial (um bem);

2. Interação de um número pequeno de agentes (dois, usualmente);

3. As restrições geradas pelo modelo são descritas por um contrato, garantido por uma terceira
parte;

4. Modelos de teoria dos jogos com informação assimétrica.

José Guilherme de Lara Resende 1 Teoria da Informação


Microeconomia 2 Nota de Aula 8

1.2 Classificação dos Modelos

Os modelos de informação privada podem ser classificados de diversas formas, e algumas dessas
classificações podem ser conflitantes. Vamos adotar a seguinte classificação, que segue Salanie,
quanto:

I) Ao tipo da informação assimétrica:

(a) O que o agente é/suas caracterı́sticas: informação oculta


(b) O que o agente faz/decisão que toma: ação oculta

II) À forma do jogo:

(a) Seleção adversa (ou “Screening”): uma parte é imperfeitamente informada sobre as
caracterı́sticas da outra parte. Parte desinformada move-se primeiro.
(b) Sinalização: uma parte é imperfeitamente informada sobre as caracterı́sticas da outra
parte. Parte informada move-se primeiro.
(c) Perigo Moral : uma parte é imperfeitamente informada sobre as ações da outra parte.
Parte desinformada move-se primeiro.

Os modelos de informação assimétrica assumem barganha simples, sem interação no processo


de barganha, que leva a formulação de um contrato do tipo “pegue ou leve” (“take-it-or-leave-it”).
O cumprimento do contrato é assegurado por uma terceira parte (justiça, por exemplo).

Os participantes da transação são denominados:

• Principal : Parte desinformada.

• Agente: Parte informada.

A terminologia mais usada para classificar os tipos de solução é:

• First-Best: a solução do problema para o caso em que a informação é perfeita. Esse caso serve
de comparação para avaliar a perda de bem-estar causada pela assimetria informacional.

• Second-Best: a solução do problema para o caso em que é considerado a assimetria informa-


cional. Usualmente, essa solução apresentará uma perda de bem-estar, com relação à solução
de First-Best.

• Third-Best: a solução do problema para o caso em que é considerado a assimetria informa-


cional, restringindo os tipos de solução consideradas. Mais comum de ocorrer em casos de
perigo moral (por exemplo, relação patrão-empregado, em que contrato de salário pode ser
apenas do tipo pagamento fixo mais comissão e não qualquer função do salário).

Um resultado pouco intuitivo que pode ocorrer em certas situações de perigo moral é o bem-estar
total associado à solução de Second-Best ser menor do que o bem-estar total associado à solução
de Third-Best (obviamente, considerando apenas o principal, o seu bem-estar no Second-Best será
maior ou igual ao seu bem-estar no Third-Best).

José Guilherme de Lara Resende 2 Teoria da Informação


Microeconomia 2 Nota de Aula 8

2 Seleção Adversa
2.1 Mercado de Carros Usados (Akerlof )

Vamos assumir um mercado de carros usados, com vários vendedores e compradores (Akerlof,
1970). Os carros podem ser de dois tipos: boa (P, peach) e má (L, lemon) qualidade. O proprietário
do carro (vendedor) sabe a qualidade do seu carro. Porém os compradores não sabem distinguir se
o carro é de boa ou de má qualidade.
Vamos usar a seguinte notação:

• vV (CB) = b (valor de CB para o vendedor) e vC (CB) = B (valor do CB para o comprador),


onde B > b;

• vV (CR) = m (valor de CR para o vendedor) e vC (CR) = M (valor do CR para o comprador),


onde M > m;

• q: proporção de carros bons no mercado.

Se a informação for completa, ou seja, tanto o vendedor como o comprador souberem qual é o
tipo do carro, então CB será vendido por um preço PCB entre b e B e CR será vendido por um
preço pCR entre m e M .
O que ocorre se o vendedor souber a qualidade do carro, porém o comprador não observar a
qualidade? Agora teremos apenas um único preço p, pois não será possı́vel diferenciar os tipos de
carros. Note que os vendedores oferecem CB apenas se p > b. Logo:

• Se p < b: tipo do carro é revelado (CR), compradores adquirem CR se p ≤ M ;

• Se p > b: compradores acharão que carro o valor esperado do carro é qB + (1 − q)M .

Então podem existir dois equilı́brios possı́veis:

1. p = M < b: apenas carros ruins são vendidos; e

2. p = qB + (1 − q)M ≥ b: ambos os carros são vendidos (equilı́brio agregador, sem revelação


do tipo de carro vendido).

No segundo equilı́brio, se M for menor do que b e se q for suficientemente pequeno (poucos


carros bons no mercado), então qB + (1 − q)M < b. Neste caso, os vendedores de carros bons não
estão dispostos a vender. Logo o primeiro caso é o equilı́brio.
Temos então um caso extremo, em que o mercado de um tipo de bem (carro de boa qualidade)
deixa de existir. Porém mercados de carros de boa qualidade existem, o que ocorre? Muitas vezes
o próprio mercado pode criar formas de revelar o tipo do bem transacionado.
No mercado de carros usados, ambos os tipos de carros já existem. Se tivermos um mercado
onde o produtor pode escolher a qualidade do bem a ser vendido, mas onde o comprador não
consegue observar o nı́vel de qualidade desse produto, então pode-se mostrar que a possibilidade de
produção de bens de baixa qualidade pode (dependendo das caracterı́sticas do mercado) destruir
o mercado do bem, tanto o mercado de alta qualidade como o mercado de baixa qualidade.

José Guilherme de Lara Resende 3 Teoria da Informação


Microeconomia 2 Nota de Aula 8

2.2 Sinalização

Nos modelos de sinalização, o agente (vendedor do carro, no exemplo acima), de alguma maneira
crı́vel, comunica o seu tipo para o principal (o comprador, no exemplo acima).
Por exemplo, os vendedores de carros de boa qualidade podem oferecer uma garantia, de modo
a sinalizar que seu carro é bom. Neste caso, a sinalização serve para que estes vendedores se
diferenciem dos vendedores de carros de má qualidade e com isso o mercado funciona melhor.
Para que o sinal consiga de fato separar os dois tipos de carros, é importante que o custo
de fornecer garantia para carros de má qualidade seja maior do que para carros de boa qualidade
(“single-crossing property”, ou condição de Spence-Mirrless ou condição de separação – “sorting
condition”), de modo que não é viável para vendedores de carros de má qualidade fornecerem a
mesma garantia fornecida pelos vendedores de carros de boa qualidade.

2.3 Modelo de Sinalização de Spence

Suponha que firmas querem contratar empregados, que podem ser de dois tipos: alta produ-
tividade (θH ) ou baixa produtividade (θL ). Vamos assumir que a proporção de tipos de baixa
produtividade na população é α.
Se a firma conseguisse observar o tipo do trabalhador, ela pagaria salários diferentes para tipos
diferentes, de modo que wh = θH e wL = θL . Porém a firma não consegue distinguir o tipo do
trabalhador. O trabalhador pode sinalizar o seu tipo à firma, por meio da quantidade de educação
adquirida. A utilidade do trabalhador do tipo θi , i = L, H, que estudou e anos e recebe salário w
é separável em w e e:
u(w) − c(e, θi )

Vamos supor que:


• u0 > 0 (“mais é melhor”) e u00 < 0 (aversão ao risco);
• ∂c/∂e > 0: adquirir educação é custoso;
• ∂ 2 c/∂e2 > 0: e se torna cada vez mais custoso;
• ∂c(·, θL )/∂e > ∂c(·, θH )/∂e: adquirir educação é mais custoso para o tipo menos produtivo
(condição de Spence-Mirrless).

Note que o modelo acima e suas suposições assumem duas hipóteses importantes em termos
intuitivos:
• Sinal não afeta produtividade (sinal puro),
• Tipos diferentes têm custos diferentes de adquirir o sinal (condição de Spence-Mirrless).

As hipóteses acima implicam que as curvas de indiferença são positivamente inclinadas, já que
educação gera desutilidade, e a curva de inidiferença do indivı́duo de baixa produtividade será
maior do que a do de alta produtividade, já que ∂c(·, θL )/∂e > ∂c(·, θH )/∂e (essa condição também
é chamada de single crossing condition pois implica que dadas duas curvas de indiferença quaisquer
dos dois tipos, elas s podem se cruzar no máximo uma vez). A Figura abaixo ilustra essas curvas
de indiferença.

José Guilherme de Lara Resende 4 Teoria da Informação


Microeconomia 2 Nota de Aula 8

uL
w
6
Direção na qual
a utilidade aumenta uH

@
I
@
@

-
Educação

Vamos assumir que o tipo θ do indivı́duo não é observável pela firma, mas que o nı́vel de
educação e obtido indivı́duo pode ser observádo pela firma.
Na solução de first-best, no caso em que a firma consegue observar o tipo do candidato, ela
pagaria wL = θL ao tipo de baixa produtividade e wH = θH ao tipo de alta produtividade. Além
disso, nenhum dos tipos adquiriria qualquer nı́vel de educação (educação é um sinal puro neste
modelo!).

uH (w = θH , e = 0)
w
6

θH
uL (w = θL , e = 0)

θL

-
Educação

Porém, caso o principal não consiga identificar os tipos, essa solução não se mantém, pois o tipo
θL tentaria se passar pelo tipo θH , para receber um salário maior. Vamos assumir que os indivı́duos
podem utilizar educação para sinalizar o seu tipo para a firma. Vamos continuar supondo que cada
trabalhador recebe um salário dado pela sua produtividade marginal, caso o seu tipo seja revelado
para a firma corretamente.

José Guilherme de Lara Resende 5 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Definição: Sistema de Crenças. Denote por µ(e) a crença que a firma atribui a um candidato
com e anos de educação ser do tipo de baixa produtividade. Então a função µ define um sistema
de crenças para a firma, de tal modo que:

w(e) = µ(e)θL + (1 − µ(e))θH

O jogo modelado é de informação incompleta: o principal desconhece uma caracterı́stica im-


portante dos agentes. O principal então forma um sistema de crenças sobre o tipo que cada agente
pode ser, dado o nı́vel de educação adquirido. Portanto, a noção de equilı́brio utilizada nesse tipo
de modelo é mais complicada: ela define não apenas estratégias, mas também as crenças que o prin-
cipal terá a respeito do agente considerado. Existem diversas noções de equilı́brios com crenças.
Dois deles são o equilı́brio sequencial e o equilı́brio intuitivo.

Definição (informal): Equilı́brio Sequencial para o Jogo de Sinalização. Um equilı́brio


seguencial para o jogo de sinalização descrito acima consiste em estratégias (e∗L , e∗H , w∗ ) e crenças
µ∗ tais que:

1. Cada candidato escolhe e já antecipando o salário de equilı́brio, de modo a maximizar o seu
bem-estar:
e∗i ∈ arg max u(w∗ (e)) − c(e, θi ) , para i = L, H .
e≥0

2. A firma define os salários w∗ de modo a maximizar o seu lucro esperado, dada a escolha dos
candidatos.

3. O sistema de crenças µ(e)∗ deve ser consistente com as estratégias e∗ , no seguinte sentido:

• Se e∗L 6= e∗H , então µ(e∗L ) = 1 e µ(e∗H ) = 0.


• Se e∗L = e∗H , então µ(e∗L ) = µ(e∗H ) = α.

A definição de equilı́brio acima garante em 1) que cada candidato escolhe o seu nı́vel de educação
de modo a maximizar a sua utilidade, dada a polı́tica de salários da firma, em 2) que a firma
maximiza o seu lucro esperado, dada a escolha ótima de educação dos agente feitas em 1), e em
3) que o sistema de crençãs da firma é consistente no sentido de que se tipos distintos adquirirem
quantidades de educação distintas, então a firma irá identificar qual o tipo correto que adquiriu
cada nı́vel de educação. Ja se os doi tipos adquirirem o mesmo nı́vel de educação, então a firma
assume que está diante de um candidato de baixa produtividade com probabilidade α, que é a
proporção de candidatos de baixa produtividade na população de candidatos.
A definição acima deixa claro que existem dois tipos de equilı́brios:

• Separador : e∗L 6= e∗H : tipos diferentes de trabalhadores adquirem quantidades distintas de


educação e firmas conseguem corretamente separar os tipos, pagando salários distintos para
tipos diferentes; e

• Agregador : e∗L = e∗H : tipos diferentes de trabalhadores adquirem a mesma quantidade de


educação e firmas pagam um mesmo salário para os dois tipos de trabalhadores (igual à
produtividade média dos tipos, ponderada pela proporção de cada tipo no mercado).

José Guilherme de Lara Resende 6 Teoria da Informação


Microeconomia 2 Nota de Aula 8

No equilı́brio separador, o tipo θL não obtém qualquer educação e o tipo θH obtém uma quanti-
dade de educação suficiente para garantir que ele se diferencie do tipo θL . Para esse arranjo ser de
fato um equilı́brio, devemos ter que as seguintes restrições de compatibilidade de incentivo (RCI)
sejam satisfeitas:

u(θL ) − c(e∗L , θL ) ≥ u(θH ) − c(e∗H , θL ) (RCIL )


u(θH ) − c(e∗H , θH ) ≥ u(θL ) − c(e∗L , θH ) (RCIH )

A RCIL garante que o contrato ótimo seja desenhado de tal modo que o tipo L vai de fato
adquirir o nı́vel de educação e∗L , e não e∗H , tentando se passar pelo tipo alto para desse modo
receber θH > θL . Raciocı́nio similar vale para RCIH .
No equilı́brio agregador, os dois tipos adquirem a mesma quantidade de educação e∗ . Como a
firma não consegue usar o sinal para distinguir os tipos, a crença dela será dada por µ(e∗ ) = α,
ou seja, ela utiliza a distribuição de tipos na população para calcular o salário de equilı́brio. Deste
modo, o salário pago será o mesmo para os dois tipos e igual à produtividade média da população:

w(e∗ ) = αθL + (1 − α)θH .

Ocorre um problema com a solução encontradas utilizando o conceito de equilı́brio sequencial: é


possı́vel mostrar que existirá um número infinito de equilı́brios dos dois tipos, separador e agregador.
Isto leva a um problema sério no poder preditivo do modelo e impede qualquer análise de estática
comparativa de ser feita. Esse problema é causado pelo fato de que equilı́brios sequenciais) não
disciplinam o sistema de crenças para estratégias fora do equilı́brio.
Vamos impor que a noção de equilı́brio com crenças utilizada acima também discipline as crenças
do principal para nı́veis de educação diferentes dos de equilı́brio.
Definição: Critério Intuitivo. Denote por u∗L e u∗h as utilidades de equilı́brio dos tipos L e H,
respectivamente. O equilı́brio sequencial que define estratégias (e∗L , e∗H , w∗ ) e crenças µ∗ satisfaz o
critério intuitivo se para todo e 6= e∗L , e∗H tivermos que:

• Se u(w(e)) − c(e, θL ) > u∗L e u(w(e)) − c(e, θH ) < u∗H , então µ(e) = 1; e

• Se u(w(e)) − c(e, θL ) < u∗L e u(w(e)) − c(e, θH ) > u∗H , então µ(e) = 0.

Um equilı́brio intuitivo é então um equilı́brio sequencial que satisfaz o critério intuitivo. Esse
critério diz que se um determinado nı́vel de educação e é tal que melhora apenas a utilidade do
tipo L e piora a do tipo H, com relação às utilidade de equilı́brio, então a firma crê que o único
tipo que adquiriria tal sinal seria o tipo L (µ(e) = 1. De modo análogo, se um determinado nı́vel
de educação e é tal que melhora apenas a utilidade do tipo H e piora a do tipo L, com relação às
utilidade de equilı́brio, então a firma crê que o único tipo que adquiriria tal sinal seria o tipo H
(µ(e) = 0).
Quando acrescentamos o critério intuitivo acima e, portanto, utilizamos equilı́brio intuitivo para
analizar o jogo de sinalização, é possı́vel mostrar que:

• Todos os equilı́brios separadores são eliminados,

• Apenas um equilı́brio separador emerge, em que e∗L = 0 e e∗H é o nı́vel de educação mais baixo
possı́vel que permite o principal separar os tipos.

José Guilherme de Lara Resende 7 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Logo, neste único equilı́brio temos que:

• Apenas uma das restrições de compatibilidade de incentivo está ativa (a que previne o tipo
de baixa produtividade se passar pelo tipo de alto produtividade).

• O tipo de baixa produtividade recebe a alocação eficiente (e∗L = 0 e wL = θL ).

• O tipo de alta produtividade recebe uma alocação ineficiente (e∗H > 0 e wH = θH ).

Com relação à questão de bem-estar dos jogadores, em geral, assumindo a noção de equilı́brio
sequencial, podemos apenas afirmar que o equilı́brio separador é ineficiente do ponto de vista
social. Intuitivamente, isto ocorre porque o sinal é custoso de se adquirir e não traz nenhum
benefı́cio social, apenas benefı́cios privados, pois o modelo assume que educação não tem efeito
sobre a produtividade e serve apenas para distinguir os tipos. O sinal então serve apenas para
separar os tipos e é um desperdı́cio do ponto de vista social.
O trabalhador de produtividade baixa está pior em um equilı́brio separador do que em um
equilı́brio agregador, já que nos dois ele adquire o mesmo nı́vel de educação, mas no segundo ele
recebe um salário maior (dado pela produtividade média.
Já o trabalhador de produtividade alta pode estar pior ou melhor em um equilı́brio separador do
que estaria em um equilı́brio agregador. Ele adquire o sinal porque dado que todos os trabalhadores
de tipo alto estão se educando e recebendo salário mais alto, para ele é melhor também adquirir
educação e se diferenciar do que não se diferenciar e receber o salário destinado a trabalhadores
de produtividade baixa. Mas diferenciar tem um custo, que é adquirir um nı́vel de educação
suficientemente alto para poder se diferenciar do tipo de baixa produtividade.
Quanto maior for a proporção de trabalhadores de produtividade alta, mais provável que este
tipo de trabalhador esteja pior no equilı́brio separador, já que o salário médio estará bem proximo
de θH , não compensado então pagar o custo de adquirir educação.
Já se utilizarmos a noção de equilı́brio intuitivo, existirá um único equilı́brio, o equilı́brio sepa-
rador de menor custo para a sociedade. Ainda assim, teremos uma ineficiência, quando comparada
à solução de first best, já que o candidato de alta produtividada adquire educação, que não possui,
por hipótese, qualquer valor social neste modelo.

José Guilherme de Lara Resende 8 Teoria da Informação


Microeconomia 2 Nota de Aula 8

2.4 Separação (Screening )

Suponha um monopolista que não observa a disposição a pagar dos consumidores, que depende
da seguinte utilidade:
ui (q, T ) = θi v(q) − T ,
onde v(q) é uma função da quantidade q (q pode ser interpretada também como a qualidade do
bem produzido pelo monopolista), com v 0 > 0, v 00 < 0, T é a tarifa paga pelo consumidor e θi é um
parâmetro associado ao tipo do consumidor, que pode ser:

Tipo “baixo”: θL , com probabilidade 1 − β ,


Tipo “alto”: θH , com probabilidade β ,

onde θL < θH . Logo o tipo alto possui uma disposição a pagar pelo bem maior do que a do tipo
baixo. Cada consumidor possui uma utilidade reserva ūi , que representa o maior nı́vel de utilidade
que o consumidor do tipo i pode obter sem comprar o bem. A taxa marginal de substituição entre
q e T (T M Si (q, T )) para cada tipo é:

∂ui (q, T )/∂q


T M Si (q, T ) = − = θi v 0 (q)
∂ui (q, T )/∂q

Note que como T diminui a utilidade, as curvas de indiferença são positivimante inclinadas, e a
utilidade aumenta a medida que nos afastamos do eixo vertical. Além disso, como θL < θH , a curva
de indiferença do tipo H é mais inclinada do que a do tipo L e elas so se cruzam uma única vez
(por isso a condição de Spence-Mirrless é também chamada “single crossing condition). A figura
abaixo ilustra as curvas de indiferença dos dois tipos.

T
6

uh constante

ul constante

@
@
R
@
Direção na qual
a utilidade aumenta

-
q

O lucro do monopolista é π = T − cq, onde c denota o custo marginal de produzir q. Vamos


analisar primeiro o caso de informação perfeita, para comparar a solução eficiente com o caso no
qual a informação é assimétrica.

José Guilherme de Lara Resende 9 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Informação Perfeita

Vamos assumir que o monopolista observa o tipo do consumidor. O contrato, denotado por
(q, T ), quantidade e tarifa cobrados, pode então depender do tipo do consumidor. Para simplificar
a notação, vamos assumir que a utilidade reserva dos consumidores é zero. Logo, o problema do
monopolista é:
max T − cq s.a. θi v(q) − T ≥ 0 ,
(q,T )

onde a restrição de participação é satisfeita com igualdade na solução, ou seja, θi v(q) = T . Substi-
tuindo essa restrição na função objetivo do monopolista, obtemos:
max θi v(q) − cq
q

A condição de primeira ordem desse problema resulta em:


θi v 0 (q ∗ ) = c ,
ou seja, o benefı́cio marginal θi v 0 (q ∗ ) é igual ao custo marginal c de produção, para cada tipo de
consumidor. Portanto, temos que qi∗ (θi ). Como θL < θH e V 0 é uma função decrescente (v 00 < 0),
temos que:
c c
v 0 (qL∗ = > = v 0 (qH

⇒ qL∗ < qH

,
θL θH
ou seja, o indivı́duo com maior disposição a pagar obté um q maior. Além disso, Como a taxa
marginal de substituição entre q e T é:
∂ui (q, T )/∂q
T M Si = − = θi v 0 (q) ,
∂ui (q, T )/∂T
temos que a curva de indiferença do consumidor do tipo alto será mais inclinada do que a do tipo
baixo. A Figura a seguir ilustra graficamente a solução para os dois tipos de consumidores.

T
6

UH0




TH∗ s



 
  UL0
 

TL∗ s 



 

-
qL∗ ∗
qH q

Então a solução de first-best consiste no principal oferecer dois contratos, um desenhado para

o tipo com maior disponibilidade a pagar, denotado por (qH , TH∗ ), com nı́vel de qualidade e preço
mais altos do o contrato desenhado para o tipo com menor disponibilidade a pagar, denotado por
(qL∗ , TL∗ ).

José Guilherme de Lara Resende 10 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Informação Assimétrica

Vamos supor agora que o monopolista não consegue distinguir os tipos de consumidores, mas
sabe que com probabilidade β o indivı́duo é do tipo alto e com probabilidade 1 − β o indivı́duo é
do tipo baixo.
O contrato de first-best, para o caso em que a informação é perfeita, não funcionará agora:
o tipo alto compraria o pacote desenhado para o tipo baixo, caso o monopolista oferte (qL∗ , TL∗ ) e

(qH , TH∗ ) (ver figura abaixo). Isso ocorre por que o tipo baixo possui uma disposição a pagar menor.
Logo o monopolista deve propor dois contratos, (TL , qL ) e (TH , qH ), desenhado para cada tipo, com
qL < qH e TL < TH e de modo que maximize o seu lucro.

T
6
UH0
UH (TL , qL ) > UH0
TH∗ s

UL0
TL∗ s

-
qL∗ ∗
qH q

Dizemos então que o contrato (TH∗ , qH∗


) não é mais compatı́vel de incentivos para o tipo alto,
já que este tipo não irá adquirir o contrato desenhado para ele, preferindo o contrato desenhado
originalmente para o tipo baixo, (TL∗ , qL∗ ). Uma possibilidade seria o monopolista baixar a tarifa
TH∗ cobrado do tipo alto para T̂H∗ , de modo a tornar esse contrato em que qL∗ e qH ∗
são as qualidades

ofertadas torne novamente vantajoso para o tipo H adquirir o contrato desenhado para ele, (qH , T̂H∗ ).

Porém o menu de contratos (qH , T̂H∗ ) e (qL∗ , TL∗ ), ilustrado na figura abaixo, apesar de ser com-
patı́vel de incentivo, não necessariamente maximiza o lucro do monopolista. Vamos analisar agora
o problema do monopolista de desenhar contratos (TL , qL ) e (TH , qH ) compatı́veis de incentivo que
maximizem o seu lucro esperado, dado por:

β(TH − cqH ) + (1 − β)(TL − cqL ) ,

e de tal modo que os dois contratos induzam os dois tipos de consumidores a comprá-los (ou seja,
devem satisfazer as restrições de participação dos dois tipos) e de modo que um tipo não adquira o
contrato desenhado para o outro (ou seja, compatı́veis de incentivo).

José Guilherme de Lara Resende 11 Teoria da Informação


Microeconomia 2 Nota de Aula 8

T
6

UH (TL , qL ) > UH0

T̂H∗ s
UL0
TL∗ s

-
qL∗ ∗
qH q

Logo os dois contratos (qH , TH ) e (qL , TL ) devem satisfazer as seguintes restrições de compati-
bilidade de incentivo para cada tipo de consumidor:
RCIL : UL (qL , TL ) ≥ UL (qH , TH ) ⇒ θL v(qL ) − TL ≥ θL v(qH ) − TH
RCIH : UH (qH , TH ) ≥ UH (qL , TL ) ⇒ θH v(qH ) − TH ≥ θH v(qL ) − TL
A primeira restrição, RCIL , garante que o tipo L irá de fato escolher o contrato desenhado para
o seu tipo, (qL , TL ) e não o contrato desenhado para o tipo H, (qH , TH ). De modo similar, RCIH
garante que o tipo H irá de fato escolher o contrato desenhado para o seu tipo, (qH , TH ) e não o
contrato desenhado para o tipo L, (qL , TL ).
O problema do monopolista no caso de assimetria informacional é então dado por:
max β(TH − cqH ) + (1 − β)(TL − cqL )
(TH ,qH ),(TL ,qL )

s.a. θL v(qL ) − TL ≥ 0 , (1)


θH v(qH ) − TH ≥ 0 , (2)
θL v(qL ) − TL ≥ θL v(qH ) − TH , (3)
θH v(qH ) − TH ≥ θH v(qL ) − TL . (4)

O problema acima possui quatro restrições. Podemos mostrar que: 1) RPL e RCIH são satis-
feitas com igualdade no ótimo (dizemos então que essas duas restrições são “binding”), 2) qH ≥ qL
no contrato ótimo, e 3) RPH e RCIL serão sempre satisfeitas, quando as outras duas restrições do
problema do monopolista, RPL e RCIH , forem satisfeitas.
Vamos mostrar o item 3) acima, que RPH e RCIL serão sempre satisfeitas, quando RPL e RCIH
forem satisfeitas:
• RPH é redundante quando assumimos que RPL e RCIH são válidas:
θH v(qH ) − TH ≥ θH v(qL ) − TL > θL v(qL ) − TL ≥ 0 ,
onde a primeira desigualdade é consequência de RCIH , a segunda, de θH > θL e a terceira de
RPL . Logo, sempre que RCIH e RPL forem satisfeitas, valerá que θH v(qH ) − TH ≥ 0, ou seja,
RPH será também satisfeita (é com esse sentido que dizemos que RPH é redundante quando
RPL e RCIH forem satisfeitas).

José Guilherme de Lara Resende 12 Teoria da Informação


Microeconomia 2 Nota de Aula 8

• RCIL é redundante quando assumimos que RPL e RCIH são válidas: note que RCIH , satis-
feita com igualdade, pode ser reescrita com TH − TL = θH (v(qH ) − v(qL )). É possı́vel mostrar

que no ótimo valerá ainda que qH ≥ qL∗ . Como θH > θL , obtemos que:

TH − TL = θH (v(qH ) − v(qL )) ≥ θL (v(qH ) − v(qL ))

Logo obtivemos que:

TH − TL ≥ θL (v(qH ) − v(qL )) ⇒ θL v(qL ) − TL ≥ θL v(qH ) − TH ,

ou seja, RCIL será válida sempre que RPL e RCIH forem satisfeitas.

Isso implica que o problema de maximização do lucro do monopolista pode ser simplificado
para:

max β(TH − cqH ) + (1 − β)(TL − cqL )


(TH ,qH ),(TL ,qL )

s.a. θH v(qH ) − TH ≥ 0 ,
θL v(qL ) − TL ≥ θL v(qH ) − TH ,

As duas restrições RPH e RCIL serão satisfeitas com igualdade no ótimo. Isso significa que
θL v(qL ) = TL e que TH = θH [v(qH ) − v(qL )] + θL v(qL ). Substituindo RPH e RCIL satisfeitas
com igualdade na função objetivo do monopolista, obtemos que:

max β(θH [v(qH ) − v(qL )] + θL v(qL ) − cqH ) + (1 − β)(θL v(qL ) − cqL )


(qL ,qH )

As condições de primeira ordem para esse problema resultam em:

(qL ) : β (−θH v 0 (qL∗∗ ) + θL v 0 (qL∗∗ )) + (1 − β)(θL v 0 (qL∗∗ ) − c) = 0


(qH ) : β (θH v 0 (qH
∗∗
) − c) = 0

A CPO para (qH ) resulta em:


θH v 0 (qH
∗∗
) = c,
a mesma condição obtida para a quantidade do tipo alto no problema sem assimetria informacional.
∗∗ ∗
Logo, temos que qH = qH , ou seja, o contrato para o consumidor com disposição a pagar mais alta
continua ofertado com o mesmo nı́vel eficiente de q. Já a CPO para qL resulta em:

β(θH − θL )v 0 (qL )
θL v 0 (qL∗∗ ) = c + > c = θL v 0 (qL∗ ) ,
1−β
| {z }
>0

onde o termo indicado como maior do que zero é de fato positivo pois 0 < β < 1, θH > θL e
v 0 (·) > 0. Temos então que v 0 (qL∗∗ ) > v 0 (qL∗ ). Como v 00 < 0, então v 0 é decrescente e obtemos que
qL∗∗ < qL∗ , ou seja, o contrato ótimo de second-best para o consumidor com disposição a pagar mais
baixa oferta um q menor do que era quando não havia assimetria informacional.

José Guilherme de Lara Resende 13 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Isso significa que para o contrato ótimo que maximiza o lucro esperado do monopolista, assu-
mindo a presença de assimetria informacional, não ocorre distorção no “topo”: o indivı́duo com
maior disposição a pagar obtém a mesma quantidade do que antes (obtida na solução de first-best).
Porém o tipo com menor disposição a pagar recebe um contrato com uma quantidade menor do
que receberia caso não houvesse assimetria informacional.
Além disso, como RPL é satisfeita com igualdade, o indivı́duo com baixa disposição a pagar
tem um contrato ofertado tal que ele fica indiferente em comprar ou não o produto. Já para o tipo
de alta disponibilidade a pagar, como vimos acima, obtém um utilidade maior do que zero (sua
utilidade reserva) no contrato ótimo. Dizemos então que o tipo θH obtém uma renda informacional,
no sentido de que a utilidade de equilı́brio é maior do que zero, que é a utilidade de equilı́brio na
solução de first-best. Ter uma informação privada relevante para a transação analisada gera essa
renda informacional para o tipo θH . Além disso, o tipo θH é indiferente entre o seu contrato ou
o desenhado para o tipo θL (RCIH satisfeita com igualdade no ótimo) e o tipo θL prefere o seu
contrato estritamente ao contrato desenhado para o tipo θH (RCIL satisfeita com folga, ou seja,
com desigualdade estrita). A figura abaixo ilustra o contrato ótimo.

T
6

UH∗ > UH0

TH∗∗ < TH∗ s


UL0

TL∗∗ s

-
qL∗∗ < qL∗ ∗∗
qH ∗
= qH q

José Guilherme de Lara Resende 14 Teoria da Informação


Microeconomia 2 Nota de Aula 8

3 Perigo Moral
3.1 Introdução

Perigo moral está presente em transações onde uma da partes (principal ) não consegue monitorar
as ações da outra parte, e essas ações são relevantes para a transação negociada.
Exemplo: Seguro de automóveis: motorista pode deixar de tomar cuidado com o carro após
adquirir o seguro. Esse comportamento afeta o resultado do contrato (a probabilidade de o carro
ser roubado pode aumentar, por exemplo) e não é possı́vel (ou é muito custoso) à firma observar
esse comportamento.
Vamos usar a seguinte terminologia em que o termo principal se refere à parte desinformada, no
exemplo que desenvolveremos, à firma, e o termo agente se refere à parte informada, no exemplo
que desenvolveremos, ao trabalhador.
O agente toma uma ação que afeta a sua utilidade e a utilidade do principal. O principal
não observa a ação tomada, apenas o resultado da ação. Quando a ação que o agente escolhe
espontaneamente não é Pareto-ótima (o que o principal gostaria), dizemos que existe um problema
de perigo moral.
O problema do principal-agente refere-se ao problema de como o principal pode desenhar um
esquema de incentivos que induza o agente a tomar a ação desejada pelo principal.
Exemplos:
• Firma e Empregado – esforço vs produção;
• Acionistas e Gerentes;
• Serviços – Médico e Paciente, Advogado e Cliente;
• Fazendeiros e Arrendatários (sharecropping decision);
• Seguros – seguro contra roubo, seguro contra incêndio, seguros em geral de propriedades/bens.

Na solução de “First-Best”, o principal observa a ação do agente, de modo que é possı́vel


implementar a ação ótima diretamente.
Em geral, supõe-se que:
• Principal: neutro ao risco (principal consegue diversificar o risco associado com a sua relação
com o agente);
• Agente: avesso ao risco (“pequeno”, não consegue diversificar o risco).

A Divisão ótima de risco (optimal risk sharing) ocorre quando o principal fornece um seguro
total para o agente (por exemplo, salário fixo para o agente) e com isso assume todo o risco da
atividade produtiva. A divisão ótima de risco nem sempre é possı́vel quando existe problema de
perigo moral, pois o agente pode não escolher a ação desejada pelo principal.
Solução: principal oferece um contrato ao agente. Trade-off entre:
• Divisão de riscos (salário do agente não deve depender do produto);
• Incentivos (principal deve condicionar o salário do agente ao produto).

José Guilherme de Lara Resende 15 Teoria da Informação


Microeconomia 2 Nota de Aula 8

3.2 Modelo

Vamos desenvolver o modelo padrão de risco moral, na versão discreta com apenas dois nı́veis
de esforço que o indivı́duo possa escolher. Suponha um indivı́duo (agente) e uma firma (principal).
A firma deseja contratar um trabalhador, que pode se esforçar (e = 1) ou não (e = 0) no trabalho.
A probabilidade de obter um bom resultado no trabalho (pode ser que seja o valor de vendas desse
indivı́duo) depende do esforço empregado.
Vamos supor L resultados possı́veis, l ∈ {x1 , x2 , . . . , xL }, onde xl denota o l-ésimo valor de venda
possı́vel, e de modo que esses resultados estão ordenados em ordem crescente: x1 < x2 < · · · < xL .
A probabilidade de ocorrerPa venda xl é πl (e) > 0, para todo l e e, onde e é o nı́vel de esforço do
agente. Temos então que l πl (e) = 1, tanto para e = 0 quanto para e = 1.
Vamos supor também que o agente possui uma utilidade u estritamente crescente e estritamente
côncava sobre riqueza w. Além disso, d(e) denota a desutilidade do nı́vel de esforço e. Logo, a
utilidade é separável: U (w, e) = u(w) − d(e), onde d(0) < d(1): se esforçar (e = 1) causa mais
desutilidade do que não se esforçar (e = 0).
A firma deve desenhar um esquema de incentivos que induza o trabalhador a escolher por
vontade própria o nı́vel de esforço desejado pela firma. Na presença da assimetria informacional, a
firma observa o resultado l ocorrido, mas não o nı́vel de esforço do trabalhador. Logo, o salário pago
pode depender apenas do resultado ocorrido, e não do nı́vel de esforço. Um contrato é representado
então por (w1 , w2 , . . . , wL ), em que wl , para l = 1, 2, . . . , L, denota o salário recebido se o resultado
xl ocorrer.

Hipótese das Taxas de Probabilidade Monótonas (HTPM). A razão

πl (1)
πl (0)

é estritamente crescente em l, l = 1, 2, . . . , L.

A HTPM garante que a razão da probabilidade de ter se esforçado muito sobre a probabilidade
de ter se esforçado pouco é crescente no valor do resultado. Intuitivamente, quanto maior o resultado
observado, mais provável o trabalhador ter se esforçado muito e não pouco.
Vamos descrever os contratos de salário oferecidos pela firma e as propriedades de eficiência
desses contratos. Primeiro, para efeito de comparação, vamos analisar a solução de first-best, em
que o principal consegue observar o nı́vel de esforço do agente.

José Guilherme de Lara Resende 16 Teoria da Informação


Microeconomia 2 Nota de Aula 8

3.3 Informação Simétrica

Vamos supor que o principal observa o nı́vel de esforço do agente. Logo, o principal pode
implementar diretamente a ação que deseja, no sentido de que o contrato é diretamente condicionado
ao nı́vel de esforço desejado pela firma. Nesse caso, não existe problema informacional – as ações
do trabalhador são observadas sem custo pela firma.
O problema do principal é:
L
X L
X
max πl (e) (xl − wl ) s.a. πl (e)u(wl ) − d(e) ≥ ū ,
e,w1 ,...,wL
l=1 l=1

onde ū denota a utilidade reserva (ou custo de oportunidade em assinar o contrato de seguro) do
consumidor. Essa restrição do problema é chamada restrição de participação.
Vamos separar o problema em dois, um onde e = 0 e o outro onde e = 1. Determinamos o
contrato ótimo em cada caso, e depois encontramos o nı́vel de esforço ótimo para o principal.
O Lagrangeano do problema da firma é:
L
" L
#
X X
L= πl (e) (xl − wl ) + λ πl (e)u(wl ) − d(e) − ū
l=1 l=1

Vamos encontrar a solução resolvendo as CPOs. É possı́vel mostrar que as condições de segunda
ordem (CSOs) serão quando o indivı́duo for averso ao risco u00 (·) < 0. As condições de primeira
ordem (CPOs) resultam em:
∂L
= −πl (e) + λπl (e)u0 (wl ) = 0 , ∀ wl (5)
∂wl
L
∂L X
= πl (e)u(wl ) − d(e) − ū = 0 (se λ 6= 0) (6)
∂λ l=1

Temos um sistema de L + 1 equações com L + 1 variáveis a serem determinadas. As CPOs em


(5) implicam que λ > 0, já que probabilidades são positivas e u0 (w) > 0, para todo w. Logo, temos
que:
1
u0 (wl ) = , ∀ l ≥ 0,
λ
o que por sua vez implica que:
u0 (wl ) = u0 (wl̂ ) , ∀ l, ˆl .
Como u00 (·) < 0, então u0 é decrescente, ou seja, é uma função injetiva. Neste caso, a igualdade
acima só ocorre se os argumentos das duas funções forem iguais, o que resulta em:
wl = wl̂ ∀ l, ˆl .

Portanto, no caso de informação perfeita, o contrato ótimo provê um salário fixo para o agente,
denotado por w̄, qualquer que seja o nı́vel de esforço que o principal deseje implementar (a utilidade
do indivı́duo não varia – permanece constante em todos os estados da natureza). Esse resultado é
esperado: a firma é neutra ao risco e o indivı́duo é avesso ao risco, logo obtemos uma divisão ótima
de risco, em que a firma arca com todo o risco do negócio.

José Guilherme de Lara Resende 17 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Note que como para qualquer nı́vel de esforço considerado, o contrato ótimo provê um salário
fixo, a utilidade esperada do indivı́duo se torna:
L
X
πl (e)u(w̄) − d(e) = u(w̄) − d(e) ,
l=1

já que as probabilidades somam 1 para qualquer e.


Então a restrição (6) simplifica para:

u(w̄) = d(e) + ū

Essa restrição define o salário pago pela firma: esse salário é o menor valor que a firma consegue
pagar para o trabalhador, que deixa este indiferente entre aceitar o emprego ou não.
Observe que como d(1) > d(0), temos que:

u(w̄(1)) = d(1) + ū > d(0) + ū = u(w̄(0)) ,

onde w̄(1) e w̄(0) denotam os salários ótimos se e = 1 e se e = 0, respectivamente. Como u é


crescente, obtemos que:
w̄(1) > w̄(0) ,
ou seja, o salário pago necessário para o agente se esforçar é maior do que o salário pago caso ele
não se esforçasse. Isso é intuitivo: se esforçar causa uma desutilidade maior do que não se esforçar.
A firma então tem que pagar um salário maior quando deseja que o agente se esforce.
Finalmente, a companhia de seguro escolhe e ∈ {0, 1} que maximiza o seu lucro esperado:
L
X
πl (e)xl − w̄(e)
l=1

Existe um trade-off para o principal na escolha entre e = 0 e e = 1: como d(0) < d(1), exigir
e = 0 permite à firma pagar um salário mais baixo, o que aumenta o lucro esperado (restrição de
participação). Por outro lado, exigir e = 1 aumenta a probabilidade esperada de resultados maiores
(HTPM) e, portanto, também aumenta os lucros.
A ação ótima para o principal depende do caso em questão. Se for a ação menos custosa para
o agente (e = 0 no modelo), e estivermos em uma situação de assimetria informacional, então
não haverá conflito de interesses entre o principal e o agente e, portanto, não ocorrerá perda de
eficiência.
De qualquer modo, em ambos os casos, e = 0 ou e = 1, no caso de informação perfeita, o agente
obtém salário fixo e o resultado é eficiente.

José Guilherme de Lara Resende 18 Teoria da Informação


Microeconomia 2 Nota de Aula 8

3.4 Informação Assimétrica

Agora vamos supor que a escolha do nı́vel de esforço do indivı́duo não é observada pela firma,
que deve então desenhar um contrato que implicitamente induza o indivı́duo a escolher o nı́vel de
esforço que a firma deseja implementar.
Para isso, uma nova restrição deve ser adicionada ao problema da firma. Essa restrição, chamada
restrição de incentivos (ou restrição de compatibilidade de incentivos), assegura que o indivı́duo
escolherá de fato a ação desejada pela firma.
O problema da firma agora pode ser escrito como:
L
X L
X
max πl (e)(xl − wl ) s.a. (RP) πl (e)u(wl ) − d(e) ≥ ū ,
e,w1 ,...,wL
l=1 l=1
XL L
X
(RCI) πl (e)u(wl ) − d(e) ≥ πl (e0 )u(wl ) − d(e0 ) ,
l=1 l=1

onde e, e0 ∈ {0, 1}, e 6= e0 .


A restrição de incentivos garante que o nı́vel de esforço desejado pela firma seja de fato o nı́vel
de esforço escolhido pelo consumidor no contrato ótimo.
Novamente, vamos resolver o problema da firma para cada nı́vel de esforço e depois encontrar
o nı́vel de esforço ótimo.

Polı́tica Ótima para e = 0

Suponha que a seguradora deseja induzir o agente a escolher o nı́vel baixo de esforço (e = 0).
Entre todas as polı́ticas possı́veis que implementam e = 0, qual a melhor para a firma? Vamos
mostrar que, neste caso, a firma deve apenas pagar um salário que garanta a participação do agente
e que não é necessário se preocupar com a restrição de incentivos.
Vimos que a solução ótima w1 , . . . , wL para o problema com informação perfeita (i.e., sem
considerar a restrição de incentivos) quando e = 0 é pagar um salário fixo, ou seja, wl = w̄(0). A
RCI neste caso em que wl = w̄(0) para todo l se torna:
L
X L
X
πl (0)u(w̄(0)) − d(0) ≥ πl (1)u(w̄(0)) − d(1) ⇒ d(0) ≤ d(1) ,
l=1 l=1

ou seja, a restrição de incentivos, com e = 0, se reduz a d(0) ≤ d(1), que é válido por hipótese. Logo,
para induzir o consumidor a escolher o nı́vel de esforço mı́nimo, a firma não precisa adotar nenhum
esquema de incentivos especial, basta selecionar o mesmo contrato ótimo usado no caso onde não
existe problema de informação. Como esse contrato maximizava o lucro esperado da seguradora na
solução de first-best (sem considerar a restrição de incentivo), então ele continua maximizando o
lucro esperado agora. Portanto, para implementar e = 0, nada muda se consideramos informação
simétrica ou informação assimétrica. Isso é intuitivo, pois o nı́vel de esforço mı́nimo é o que o
agente sempre escolherá no caso em que não sejam dados incentivos para ele escolher nı́veis de
esforço mais altos.

José Guilherme de Lara Resende 19 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Polı́tica Ótima para e = 1

Suponha agora que a seguradora queira induzir o agente a escolher o nı́vel alto de esforço (e = 1).
Entre todas as polı́ticas possı́veis que implementam e = 1, qual a melhor para a firma?
Primeiro observe que a polı́tica ótima de first-best, que provê salário fixo w̄(1) ao agente, não
satisfaz a restrição de incentivos, já que se wl = w̄(1) para todo l, a restrição de incentivos do
problema se torna:
L
X L
X
πl (1)u(w̄(1)) − d(1) ≥ πl (0)u(w̄(1)) − d(0) ⇒ d(1) ≤ d(0) ,
l=1 l=1

o que não é válido (pois d(0) < d(1)). Intuitivamente, se fosse oferecido um salário fixo, o agente
escolheria o menor nı́vel de esforço. Portanto, para que o principal consiga implementar e = 1, o
contrato não pode fornecer um salário fixo para todos os resultados possı́veis.
Vamos resolver o problema de maximização do principal em que ele deseja implementar o nı́vel
de esforço alto (e = 1). Como a RCI pode ser reescrita do seguinte modo:
L
X
(πl (1) − πl (0)) u(wl ) − d(1) + d(0) ≥ 0 ,
l=1

então o Lagrangeano do problema pode ser escrito como:


L
" L # " L #
X X X
L= πl (1) (xl − wl )+λ πl (1)u(wl ) − d(1) − ū +β (πl (1) − πl (0)) u(wl ) − d(1) + d(0)
l=1 l=1 l=1

As condições de primeira ordem do problema são:


∂L
= −πl (1) + [λπl (1) + β(πl (1) − πl (0))] u0 (wl ) = 0 , ∀ wl
∂wl
L
∂L X
= πl (1)u(wl ) − d(1) − ū ≥ 0
∂λ l=1
L
∂L X
= (πl (1) − πl (0))u(wl ) − d(1) + d(0) ≥ 0
∂β l=1

As CPOs em wl podem ser reescritas do seguinte modo:


 
1 πl (0)
=λ+β 1− , ∀ wl . (7)
u0 (wl ) πl (1)

Podemos provar que as duas restrições RP e RCI estão ativas no ótimo, ou seja, que β 6= 0 e
λ 6= 0 (mais ainda, que são positivos), e que no ótimo, o indivı́duo obtém um contrato que especifica
salários que gera utilidade igual a sua utilidade reserva e de modo que ele seja indiferente entre se
esforçar muito ou se esforçar pouco.
Como λ e β são positivos, o lado direito da equação (7) é estritamente crescente em l, pela
HTPM. Como u0 é decrescente (o agente é avesso ao risco, u00 (·) < 0), então 1/u0 (wl ) é estritamente
crescente em wl . Isso significa que quanto maior l, maior wl , ou seja, wl é estritamente crescente
no resultado xl .

José Guilherme de Lara Resende 20 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Portanto, o contrato ótimo é tal que:

wl é estritamente crescente no resultado xl .

O contrato ótimo de salários para e = 1 então não provê mais um salário fixo para o trabalhador.
Pelo contrário, ele especifica que o trabalhador assuma parte do risco, e que o quanto maior o
resultado, maior a parte do risco assumida pelo trabalhador (pode ser que em termos percentuais
seja igual: o trabalhador recebe um salário que possui uma parte fixa e um componente fixo em
termos percentuais do resultado obtido).
O agente deve então arcar com parte do risco, para que ele de fato se esforçe. Note que a
restrição de compatibilidade de incentivos, satisfeita com igualdade no ótimo, pode ser reeescrita
como:
XL
(πl (1) − πl (0))u(wl ) = d(1) − d(0) > 0
l=1

Então:
L
X L
X L
X
(πl (1) − πl (0))u(wl ) > 0 ⇒ πl (1)u(wl ) > πl (0)u(wl )
l=1 l=1 l=1

No contrato ótimo, o indivı́duo possui um ganho de utilidade em se esforçar, igual ao custo em se


esforçar muito, dado por:
d(1) − d(0) > 0 .
Logo, no contrato ótimo, o benefı́cio lı́quido de se esforçar muito se iguala ao custo lı́quido desse
esforço.
Para determinarmos a solução que o principal implementa, verificamos qual o nı́vel de esforço
que maximiza o seu lucro esperado.
Se no caso de informação perfeita o nı́vel de esforço ótimo for baixo, então o contrato ótimo
quando consideramos a assimetria informacional também implementa e = 0. Neste caso não ocor-
rerá, obviamente, perda de eficiência causada pela assimetria informacional.
Porém, se no caso de informação perfeita o nı́vel de esforço ótimo for alto, então pode ocorrer
que para o caso de informação assimétrica a firma decida implementar o nı́vel baixo de esforço.
Isso ocorrerá se for muito dispendioso para a firma induzir o trabalhador, por meio do contrato, a
se esforçar muito.
Nesse caso, temos uma situação claramente ineficiente, em que a utilidade do consumidor con-
tinua igual a sua utilidade reserva, porém a firma obtém lucro menor do que obteria na situação
de informação simétrica, pois implementa o nı́vel de esforço sub-ótimo e = 0.
Finalmente, se no caso de informação perfeita o nı́vel de esforço ótimo for alto, e também para
o caso de informação assimétrica a decisão ótima da firma seja implementar o nı́vel alto de esforço,
temos mais uma vez uma situação claramente ineficiente – a utilidade do trabalhador continua igual
a sua utilidade reserva (porém ele não obtém um salário fixo, ou seja, não ocorre divisão ótima
de riscos), e a firma obtém lucro menor do que obteria na situação de informação simétrica, pois
precisa induzir o agente a se esforçar (implementar e = 1 via a restrição de incentivos).

José Guilherme de Lara Resende 21 Teoria da Informação


Microeconomia 2 Nota de Aula 8

Leitura Sugerida

• Varian, capı́tulo 37 (Informação Assimétrica).

• Nicholson e Snyder, capı́tulo 18 (Asymmetric Information).

Exercı́cios

1. Suponha uma única revendedora de carros e um único consumidor que deseja comprar apenas
um carro. A empresa pode ser uma revendedora de carros de boa qualidade com probabilidade
α ou uma revendedora de carros de má qualidade. O consumidor é neutro ao risco e não
observa a qualidade do carro. A valoração do consumidor é dada por vH se o carro é bom e
vL se o carro é ruim. Os custos para a firma de um carro são cH , se o carro for bom, ou cL , se
o carro for ruim. Suponha que o preço do carro é regulado em p (ou seja, nenhum carro pode
ser vendido por nenhuma revendedora por um preço diferente de p, seja ele de boa qualidade
ou de má qualidade) e que valem as seguintes desigualdades: vH > p > vL > cH > cL .

a) Que condição deve ser válida para que o consumidor compre o carro?
b) Suponha que a firma decide fazer propaganda, que custa A (a propaganda em si não
contém nenhuma informação relevante para o problema). Para esse exemplo, propaganda
pode servir como um sinal para a existência de um equilı́brio separador? (ou seja,
um equilı́brio onde os consumidores esperam que firmas com carros de diferente nı́veis
de qualidade gastem diferentes valores na propaganda?) Explique a intuição do seu
resultado e a relacione com a condição de Spence-Mirrless.

2. Considere o modelo de sinalização de Spence. Faça uma demonstração gráfica e dê a intuição
de porque pode ocorrer que em um equilı́brio separador, os dois tipos de agentes estarem pior
do que estariam em um equilı́brio agregador. O que pode ser dito em geral sobre o bem-estar
de cada tipo de agente, em cada equilı́brio?

3. (P3-2/18) Considere o mercado de seguro de carros. Suponha que existam quatro grupos
de pessoas nesse mercado, cada grupo diferindo com a probabilidade de sofrer um acidente.
Cada grupo contém um número grande e igual de pessoas, mas as companhias de seguro não
conseguem identificar a qual grupo uma pessoa pertence. Todo indivı́duo corre o risco de gas-
tar R$ 10.000,00 se sofrer um acidente. A tabela abaixo descreve o quanto um indivı́duo está
disposto a pagar por um seguro total no caso de acidente, para cada grupo (linha “WTP”).

Risco 20% 40% 60% 80%


WTP R$2.500 R$5.200,00 R$6.800,00 R$8.200,00
Seguro Justo
Prêmio ao Risco

a) Complete a tabela acima com os preços do seguro justo para cada grupo (linha “Seguro
Justo”), supondo uma companhia grande o suficiente para diversificar os riscos em cada
grupo. Como esses valores se comparam com a WTP de cada indivı́duo?
b) Suponha agora que a informação é assimétrica - as companhias de seguro não observam
o tipo da pessoa. Qual é o risco médio de uma pessoa? Qual é o preço do seguro justo
nesse caso?

José Guilherme de Lara Resende 22 Teoria da Informação


Microeconomia 2 Nota de Aula 8

c) Todos os agentes vão adquirir seguro ao preço encontrado no item b)? Caso não, qual
será a composição de risco que vai se deparar nesse caso? O preço de seguro justo
encontrado em b) seria suficiente para cobrir o risco que a companhia assegurou?
d) Usando a lógica em c), o que ocorre com o preço justo de equilı́brio? Quem adquire
seguro nesse caso?
e) O resultado encontrado em d) é eficiente? Discuta sucintamente.

4. O dono de uma firma (principal) quer contratar um trabalhador (agente). O trabalhador


pode se esforçar pouco, e = 0, ou muito, e = 1. A receita r obtida pela firma é aleatória, mas
com maior chance de ser alta caso o trabalhador se esforce. Mais especificamente, se e = 0,
então: 
0, com probabilidade 2/3
r= .
4, com probabilidade 1/3
Já se e = 1, temos que: 
0, com probabilidade 1/3
r= .
4, com probabilidade 2/3

A utilidade esperada do agente é u(w, e) = w − e, onde w denota o salário recebido e e
o nı́vel de esforço. O lucro da firma é π = r − w quando as vendas são r e o salário do
agente é w. Um contrato de salário (w0 , w4 ) especifica o salário wr ≥ 0 que o agente receberá
quando r = 0 ou r = 4. O salário não pode ser negativo, no mı́nimo ele pode ser zero. A
utilidade reserva do agente é ū = 0. Determine o contrato ótimo (w0 , w4 ) que maximiza o
lucro esperado da firma em cada uma das situações descritas a seguir.

a) O principal observa o esforço do agente e portanto o contrato pode ser condicionado


diretamente em e. Qual o nı́vel de esforço que será exercido no contrato que maximiza
o lucro esperado da firma?
b) O principal não observa o esforço do agente e portanto o contrato não pode ser condi-
cionado em e. Qual o nı́vel de esforço que será exercido no contrato que maximiza o
lucro esperado da firma?

5. Tony contratou Renata para vender goiabas. Tanto Tony quanto Renata são neutros ao risco.
Renata pode ficar em pé na beira da rua, no sol, se dedicando bastante a venda de goiabas
ou simplesmente sentar na sombra de uma árvore. A demanda por goiabas pode ser baixa,
média ou alta, com a mesma probabilidade. A tabela abaixo descreve o valor de vendas de
goiabas em cada caso de demanda, caso Renata se dedique ou não a tarefa de vender goiabas.

Comportamento de Renata Demanda Baixa Demanda Média Demanda Alta


Em pé no sol R$ 100,00 R$ 150,00 R$ 200,00
Sombra R$ 50,00 R$ 100,00 R$ 150,00

Se Renata trabalhar no sol, a demanda por goiabas é média e Tony paga à Renata R$ 30,00,
o lucro de Tony é R$ 150, 00 − R$ 30, 00 = R$ 120, 00. Tony só se importa com o seu lucro.
Renata, porém, se importa com duas coisas, quanto Tony irá pagar a ela e quão duro será o
trabalho. A utilidade de Renata é dada pelo salário que ela recebe, menos R$ 10,00 se ela
tiver que trabalhar no sol. Logo, se Tony paga a Renata R$ 35,00 e ela trabalhar duro, sua
utilidade será R$ 35, 00 − R$ 10, 00 = R$ 25, 00. Se por outro lado, Renata não trabalhar
duro, sua utilidade será R$ 35, 00 − R$ 0 = R$ 35, 00. Além disso, para que Tony convença
Renata a trabalhar para ele, a utilidade de Renata deve ser de no mı́nimo R$ 30,00 na média.

José Guilherme de Lara Resende 23 Teoria da Informação


Microeconomia 2 Nota de Aula 8

a) Se Tony pagar à Renata R$ 30,00 fixo, quanto Renata venderá na média?


b) Após muita reflexão, Tony decide estruturar a remuneração de Renata da seguinte forma.
Tony pagará a Renata R$ 120 se a venda de goiabas alcançar R$ 200,00. Se a venda de
goiabas for menor que R$ 200,00, Renata receberá apenas R$ 30,00. Esse esquema de
pagamento é uma boa idéia para Tony?
c) Qual é o menor prêmio que Tony pode instituir que induz Renata a trabalhar no sol,
supondo que se Renata não receber o prêmio, seu salário será R$ 30,00?
d) Sua resposta em c) mudaria caso Renata seja avessa ao risco? Explique sucintamente.

6. Considere o seguinte problema de Perigo Moral, onde o principal é um √ dono de loja e o


agente é um vendedor dessa loja. A utilidade do agente é u(w, e) = w − e, onde w é o
sálario recebido e e a dedicação ou nı́vel de esforço do agente. O vendedor pode escolher
apenas e = 0 (nı́vel zero de esforço) ou e = 5 (nı́vel máximo de esforço). A utilidade reserva
desse agente é 9. Se o agente não se esforçar (e = 0), ele vende:

 0 com probabilidade de 60%
100 com probabilidade de 30%
400 com probabilidade de 10%

Caso ele se esforce, ele vende:



 0 com probabilidade de 10%
100 com probabilidade de 30%
400 com probabilidade de 60%

Suponha que o principal resolve adotar uma polı́tica de salários tal que que induza o agente
a escolher o nı́vel de esforço desejado pelo principal.

a) Qual a receita esperada do principal para cada nı́vel de esforço do agente?


b) Qual deve ser o salário mı́nimo do agente para cada nı́vel de esforço que ele emprega?
c) Qual a polı́tica de salários ótima que resolve o problema de perigo moral que o principal
enfrenta? Explique as restrições do problema e dê a intuição de cada uma delas. Quantas
restrições existem? Por que?
d) O que é melhor para o principal, implementar o nı́vel de esforço alto ou baixo?
e) Suponha que o agente agora possa escolher entre três nı́veis de esforço diferentes. O que
muda no problema do principal?

José Guilherme de Lara Resende 24 Teoria da Informação

Você também pode gostar