Escolar Documentos
Profissional Documentos
Cultura Documentos
MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 1 – Graduação
Prof. José Guilherme de Lara Resende
“Every individual...generally, indeed, neither intends to promote the public interest, nor
knows how much he is promoting it. By preferring the support of domestic to that of
foreign industry he intends only his own security; and by directing that industry in such
a manner as its produce may be of the greatest value, he intends only his own gain, and
he is in this, as in many other cases, led by an invisible hand to promote an end which
was no part of his intention” (Adam Smith, A riqueza das Nações, Livro IV, Capı́tulo
II, p. 477).
Veremos que essa ideia está relacionada ao conceito de eficiência de Pareto e ao Primeiro Teorema
do Bem-estar.
Outras questões importantes com relação a este tópico são:
Walras no final do século XIX argumentou a existência de equilı́brio nos moldes de demanda
igual à oferta. Porém há um erro na argumentação de Walras. Esse erro foi apontado e corrigido por
Wald em 1935, que provou a existência de equilı́brio sob condições bastante restritivas (utilidades
separáveis, utilidade marginal decrescente para todos os bens, etc). Debreu e Arrow (1954) e
McKenzie (1954) provaram a existência de equilı́brio em um mercado competitivo, sob condições
bem mais gerais do que as de Wald.
1. Para cada bem, existe um grande número de firmas e consumidores atuando no seu mercado;
3. Firmas maximizam lucros, dada a sua tecnologia e tomando os preços dos insumos e dos bens
produzidos como dados.
1. Custos de transação,
2. Externalidades,
3. Bens públicos,
4. Problemas de informação.
Vamos supor nesta seção que não exista um mercado formal (ou seja, que não exista um sistema
de preços). Logo, todas as interações entre os diversos agentes da economia são realizadas por meio
de trocas voluntárias (“barter economy”).
Também não lidaremos neste momento com a questão de produção. Cada indivı́duo da economia
recebe uma dotação inicial de bens. Vamos representar pelo vetor ei ∈ Rn+ a dotação inicial dos n
bens do consumidor i, i = 1, . . . , I.
O caso de dois indivı́duos e dois bens, I = 2 (nesse caso vamos representar os dois consumidores
por A e B, para facilitar a notação) e n = 2, pode ser analisado graficamente por meio da caixa de
Edgeworth.
A dotação total de uma economia, eT , é a soma das dotações iniciais dos indivı́duos da economia.
No caso de dois consumidores e dois bens, temos que eT = eA + eB , onde ei = (ei1 , ei2 ), i = A, B.
A dimensão (o tamanho) da caixa é definida pela dotação total de bens na economia. Um ponto
na caixa representa uma possı́vel distribuição de dotação entre os participantes da economia, sem
desperdı́cios. Todas as possı́veis distribuições de bens na economia estão representadas na caixa.
eB
1
0B
s
Bem 2
?
eA s s s eB
2 2
e = (eA , eB )
6
s
0A -
eA Bem 1
1
Para completarmos a caracterização dessa economia, temos que especificar as preferências in-
dividuais. Representamos estas preferências por meio de funções de utilidade. Supondo que todas
as preferências sejam bem comportadas, obtemos um mapa de curvas de indiferença que preenche
a caixa de Edgeworth, para cada indivı́duo.
eB
1
0B
s
eA s s s eB
2 2
e= (eA , eB )
6
s
0A -
eA
1
Suponha que existam I indivı́duos e n bens. Cada indivı́duo é representado por uma relação de
preferência i (ou, equivalentemente, por uma utilidade ui ) e uma dotação inicial ei . Vamos denotar
por I o conjunto dos consumidores, I = {1, . . . , I}. A coleção E = (ui , ei )Ii=1 representa uma
economia de trocas (ou economia de trocas puras ou economia de trocas simples, sem produção).
Definição: Alocação Factı́vel. Dizemos que a alocação x = (x1 , . . . , xI ) é factı́vel se ela exaure
a dotação total de cada bem na economia. Logo, para cada bem, a quantidade consumida é igual
ao total disponı́vel. O conjunto das alocações factı́veis, denotado por F (e), é dado por:
( I I
)
X X
i i
F (e) = x | x = e
i=1 i=1
Bem 1: xA B A B
1 + x1 = e1 + e1
Bem 2: xA B A B
2 + x2 = e2 + e2
Dizemos que uma alocação factı́vel é Pareto-eficiente se não for possı́vel melhorar (estritamente)
pelo menos um indivı́duo sem piorar ninguém.
Dado que as trocas na economia são feitas de forma voluntária, se a economia se encontra
em uma alocação Pareto-eficiente, não será possı́vel mudar essa alocação. Portanto, as alocações
Pareto-eficientes são candidatas naturais ao equilı́brio da economia.
Observações sobre o Critério de Pareto:
• Uma outra maneira de interpretar: alocações de recursos em que não é possı́vel fazer com
que todos melhorem ou que não é possı́vel fazer com que alguém melhore sem que pelo menos
uma outra pessoa piore são alocações Pareto ótimas.
• Alocações eficientes de Pareto são alocações em que todos os ganhos de troca se exauriram.
Logo não existem mais trocas mutualmente vantajosas para serem feitas.
• Em geral há um conjunto grande de pontos Pareto ótimos em uma economia. Dizer que a
economia deve estar em um ponto Pareto ótimo é um juı́zo de valor, mas o mais fraco juı́zo
de valor que se pode fazer a respeito da situação da economia.
• O critério de Pareto apenas diz que não deve haver perdas ou desperdı́cios na economia, ele
não diz nada sobre a distribuição de riqueza de uma sociedade. Se a sociedade partir de
uma dotação inicial de recursos muito desigual, é provável que a alocação de equilı́brio seja
também desigual, mesmo sendo eficiente.
0B
?
Curva de
Contrato
s
s
s
e = (eA , eB )
6
0A -
Para o caso de dois consumidores, A e B, uma alocação eficiente de Pareto pode ser vista como
uma alocação onde um dos agentes está tão bem quanto possı́vel, dada a utilidade do outro agente.
Se as utilidades dos dois agentes forem bem comportadas, então as alocações factı́veis no interior
da caixa de Edgeworth em que as TMS dos dois agentes são iguais definem as alocações Pareto
eficientes, ou seja, a curva de contrato.
Portanto, em uma alocação Pareto eficiente, as taxas marginais de substituição entre dois bens
devem ser iguais entre os consumidores (se não fosse o caso, existiria alguma troca que melhoraria
um dos consumidores sem piorar o outro – observe a figura acima). Note que isso vale para utilidades
bem comportadas e alocações no interior da caixa de Edgeworth.
Exemplo: Suponha dois consumidores, A e B, que possuem dotações iniciais representadas por
eA = (exA , eyA ) e eB = (exB , eyB ), e utilidades Cobb-Douglas denotadas por:
αyA β(eTy − yA )
=
(1 − α)xA (1 − β)(eTx − xA )
Resolvendo essa equação, encontramos yA em função de xA , de modo que define a curva de contrato.
Suponha que as utilidades dos dois indivı́duos são iguais (logo, α = β). Então a última expressão
acima se torna: !
αyA α(eTy − yA ) eTy
= ⇒ yA = xA ,
(1 − α)xA (1 − α)(eTx − xA ) eTx
ou seja, a curva de contrato será uma reta, qualquer que seja a utilidade Cobb-Douglas considerada
(isso não ocorrerá se as utilidades dos dois indivı́duos forem distintas).
uB
6
Fronteira de
Possibilidade
de Utilidade
-
uA
Vamos definir um conceito ainda mais forte do que o de alocações Pareto eficientes. Dada uma
alocação factı́vel qualquer, vamos assumir que coalizões (grupos de indivı́duos) que possam obter
uma alocação melhor entre si, então eles realizam trocas para alcançar essa melhora. Esta ideia é
formalizada nos conceitos a seguir.
Uma alocação para a qual não existe nenhuma coalizão que a bloqueie, ou seja, em que para
todo S ⊂ I não exista y ∈ F (e) tal que yi i xi para todo i ∈ S, com pelo menos uma preferência
estrita, é chamada alocação não bloqueável.
Note que alocações ineficientes são bloqueadas pela coalizão formada por todos os indivı́duos
da economia (S = I). Logo, toda alocação não-bloqueável é Pareto-eficiente (a volta não é válida
em geral).
Definição: Núcleo. O conjunto das alocações não bloqueáveis, denotado por C(e), é chamado
núcleo da economia E.
As alocações no núcleo de uma determinada economia de trocas puras são as candidatas naturais
para serem alcançadas por meio de uma sequência de trocas voluntárias. Porém para isso ocorrer
há um exigência informacional gigantesca para cada participante da economia.
Vamos supor a partir de agora que as transações são efetuadas em mercados competitivos,
onde cada consumidor maximiza o seu bem-estar, dados os preços que observa. Vamos continuar
assumindo que não exista produção na economia. Logo, cada consumidor recebe uma dotação
inicial de bens, que pode ser vendida e daı́ usada para adquirir outra cesta de bens.
Portanto, o sistema de preços é o instrumento alocativo de uma economia de mercado. Ele
determina o valor de cada dotação inicial e, consequentemente, quais cestas de bens estão dentro
da possibilidade de consumo de cada indivı́duo.
Suponha I consumidores, I = {1, . . . , I} denota o conjunto dos I consumidores. Suponha
também que as preferências i de cada consumidor i ∈ I são representadas por uma função de
utilidade ui bem comportada (contı́nua, estritamente crescente e estritamente quasecôncava).
O problema do consumidor i, no caso de dois bens apenas, é:
max
i i
ui (xi1 , xi2 ) s.a. p1 xi1 + p2 xi2 ≤ p1 ei1 + p2 ei2 ,
x1 ,x2
0B
@
@
@ ?
@
@ xA
@s
@
@
@s
xB @ @
e = (eA , eB )
@s
@
@
@
6 @
@
@
0A -
obs: xi : demanda bruta de i, i = A, B
Observe que no sistema de preços representado na figura acima, cada um dos dois consumidores
está maximizando a sua utilidade dada a restrição orçamentária que enfrenta, em que essa restrição
é determinada pelo sistema de preços. Porém, a economia não está em equilı́brio: há um excesso
de oferta do bem 1 e um excesso de demanda do bem 2.
Vimos que o nı́vel de preços representado na figura acima não iguala a demanda à oferta, para
nenhum dos dois bens. Nesse caso, dizemos que os mercados não se equilibram ou se exaurem.
Logo, a economia está em desequilı́brio. O equilı́brio será obtido via ajuste de preços, que faz
com que a demanda se iguale à oferta para todos os bens da economia. Essa situação é chamada
equilı́brio de mercado, ou equilı́brio competitivo, ou equilı́brio Walrasiano. Preços que alcançam o
equilı́brio são chamados preços de equilı́brio. A alocação resultante é chamada alocação de equilı́brio
(ou alocação de equilı́brio Walrasiano).
Então, aos preços p, se zk (p) = 0, a demanda de mercado pelo bem k iguala a oferta de mercado
desse bem. Se z(p) = 0, onde 0 = (0, . . . , 0) denota o vetor de zeros, então os mercados de todos
os bens estão em equilı́brio.
2. (Homogeneidade) z(αp) = z(p), para todo α > 0. Apenas preços relativos importam –
podemos normalizar os preços e usar um numerário. Logo, não podemos determinar o valor
dos preços absolutos de equilı́brio da economia. Se existem n preços na economia, apenas
n − 1 preços serão independentes. No caso de dois bens, podemos normalizar um deles em 1
e apenas encontrar o preço relativo de equilı́brio do outro bem.
xB∗
1
0B
@
@
@
@ ?
@
@
@
@
@
s
@ Alocação de equilı́brio
xA∗
2
@s xB∗
2
@
@
@
@
@
@se
@
6 @
@
s @
0A -
xA∗
1
A caixa de Edgeworht ilustrada na figura acima mostra um vetor de preços de equilı́brio, que
leva os consumidores A e B, a partir de suas dotações iniciais, representadas no ponto e na caixa,
à alocação de equilı́brio x = (xA∗ , xB∗ ), na qual ambos os consumidores estão maximizando o seu
bem-estar e os mercados dos dois bens estão em equilı́brio.
x2
6
Conjunto de
Possibilidade de
* Produção (convexo)
-
x1
Dado o vetor de preços p ≥ 0, a firma j escolhe o plano de produção que maximiza lucros:
max p · yj (1)
yj ∈Y j
Suponha que existam dois produtos, X e Y , produzidos por duas firmas distintas, que usam
dois fatores de produção, capital, K e trabalho, L. Suponha que as quantidades de capital e
trabalho estão fixas. Podemos construir uma caixa de Edgeworth para produção, onde uma firma
é representada no vértice sudoeste da caixa e a outra firma é representada no vértice noroeste
da caixa. Representamos as isoquantas de ambas as firmas na caixa. Pontos de tangência destas
isoquantas representam pontos de eficiência produtiva ou eficiência técnica. Podemos então definir
uma curva de contrato para a produção.
02
Curva de
s Contrato
s para Produção
01 -
Observe que na curva de contrato para a produção, as taxas marginais de substituição entre
os insumos são iguais para ambas as firmas. Logo, em pontos de eficiência técnica, as taxas
marginais de substituição entre dois insumos quaisquer são iguais entre firmas, mesmo que estas
firmas produzam bens diferentes (assumindo funções de produção bem comportadas e alocações
no interior da caixa). Podemos construir o seguinte conceito a partir da curva de contrato para a
produção:
Pontos na FPP representam a quantidade máxima do bem X que pode ser produzida para certa
quantidade do bem Y . Pontos que estão sobre a FPP, tais como o ponto B na figura abaixo, são os
pontos de eficiência técnica ou eficiência produtiva. Pontos no interior da FPP, tais como o ponto
A na figura abaixo, são ineficientes no sentido técnico. Nos pontos sobre a FPP, a taxa marginal de
substituição técnica entre dois insumos é igual para todas as firmas, quaisquer que sejam os bens
que elas produzam, assumindo que a tecnologia de produção seja “bem-comportada”.
Podem existir pontos de eficiência técnica que não representem alocações Pareto eficientes.
Porém, toda alocação Pareto eficiente está necessariamente associada a um ponto de eficiência
técnica.
Bem Y
6
Fronteira de Possibilidade de Produção
sB
sA
-
Bem X
A FPP tem inclinação negativa devido à escassez de recursos. Se estamos no ponto B na figura
acima e queremos produzir mais do bem X, precisamos abrir mão de um pouco de bem Y (a
sociedade realoca alguns dos recursos usados na produção de Y para a produção de X). Portanto,
a escassez de fatores de produção implica que a FPP é negativamente inclinada.
O formato da curva da FPP reflete como o custo marginal de um bem muda com a quantidade do
outro bem sendo produzida. Esse custo de oportunidade marginal da FPP é chamado taxa marginal
de transformação dos bens. Essa taxa mede a taxa pela qual um bem pode ser transformado em
outro, no sentido de que os fatores de produção são realocados da produção de um dos bens para
a produção do outro bem.
Portanto, o custo marginal de produção de um bem em termos de outro bem é dado pela
inclinação da FPP. Uma FPP com inclinação constante (isto é, uma reta) significa que este custo
marginal é constante, independente da quantidade produzida. Uma FPP côncava significa que este
custo marginal aumenta quanto mais desse bem é produzido. Ou seja, quanto maior a produção
de vinho, para produzir mais um litro de vinho, temos que abrir mão de uma quantidade maior de
pão.
2.3 Equilı́brio
Os consumidores são modelados como antes, por meio de uma função de utilidade e de uma
dotação inicial, que inclui bens ou serviços que o consumidor oferece ao mercado, como trabalho,
por exemplo. Com a inclusão de firmas na análise, precisamos descrever a distribuição dos lucros
dessas firmas na economia. Vamos denotar por θij a fração da firma j que o consumidor i detém.
Devemos ter que:
X
0 ≤ θij ≤ 1, ∀i ∈ I, j ∈ J , e θij = 1, ∀j ∈ J .
i∈I
Um consumidor possui duas fontes de renda: a sua dotação de bens e serviços e a quantidade
de ações de firmas que possui. A restrição orçamentária do consumidor i se torna então:
X
p · x i ≤ p · ei + θij Πj (p) = mi (p),
j∈J
max
i n
ui (xi ) s.a. p · xi ≤ mi (p) (2)
x ∈R+
Resolvendo este problema, encontramos as demandas ótimas dos consumidores, o que permite
calcular a demanda de mercado.
Com a introdução das ações das firmas, completamos a caracterização da economia, que pode
ser denotada por E = (ui , ei , θij , Y j )i∈I,j∈J (chamada economia de propriedade privada).
A função excesso de demanda agregada do bem k é agora dada por:
X X j X
zk (p) = xik (p, mi (p)) − yk (p) − eik ,
i∈I j∈J i∈I
O vetor de funções excesso de demanda agregada definido para economias com produção con-
tinua satisfazendo as mesmas três propriedades que eram satisfeitas no caso de uma economia de
trocas puras: 1) continuidade, 2) homogeneidade, e 3) lei de Walras. Essas propriedades possuem
as mesmas interpretações e implicações que vimos anteriormente.
Considere a economia de propriedade privada E = (ui , ei , θij , Y j )i∈I,j∈J . Suponha que cada util-
idade individual satisfaz certas propriedades (por exemplo, é bem-comportada) e que o conjunto de
possibilidade de produção de cada firma satisfaz certas
Phipóteses (por exemplo, apresenta retornos
decrescentes de escala). Suponha também que y + i∈I ei 0 para algum vetor de produção
agregada.
Nesse caso, podemos garantir que existe pelo menos um vetor de preços p∗ 0 tal que o vetor
de excessos de demanda seja igual a zero, z(p∗ ) = 0. A alocação de equilı́brio para uma economia
com produção deve descrever além das cestas de consumo de cada indivı́duo, os planos de produção
ótimos de cada firma.
A figura abaixo ilustra uma situação de equilı́brio, considerando uma economia com um único
consumidor. Observe que se a condição de tangência não for satisfeita, isso significa que a taxa
na qual o consumidor está disposto a trocar um dos bens pelo outro é diferente da taxa na qual
esse bem pode ser transformado no outro. Então existe a possibilidade de melhorar o bem-estar do
consumidor, ao se rearranjar a produção. Portanto, se a condição de tangência não for satisfeita, a
alocação não será Pareto eficiente.
Bem Y
6
FPP
@
@
@
@
Y∗ @s
@
@
@
@ Curva de Indiferença
@
@
@
@
@ Nı́vel de Preços
de Equilı́brio
-
∗
X Bem X
Observações Importantes:
• A figura acima deixa claro que nem todo ponto de eficiência técnica será Pareto eficiente, mas
todo ponto Pareto eficiente será tecnicamente eficiente.
• Uma alocação Pareto eficiente satisfaz as seguintes três condições:
1. Eficiência nas trocas: As taxas marginais de substituição entre quaisquer dois bens
devem ser iguais.
2. Eficiência técnica ou produtiva: Para todas as firmas, as taxas técnicas de substituição
entre quaisquer dois insumos devem ser iguais.
3. Eficiência no mix de produtos: A taxa técnica de transformação entre dois bens deve
ser igual à taxa marginal de substituição dos consumidores.
A quantidade ótima de Y pode ser obtida usando aprelação ótima entre X e Y acima e o valor
ótimo de X encontrado acima, o que leva a Y ∗ = βce/(αcd + βc). Já os preços de equilı́brio
podem ser encontrados fazendo px /py = |T M S(X ∗ , Y ∗ )| = |T M T (X ∗ , Y ∗ )|, o que resulta em:
αY ∗ cX ∗
r
px px αc
= ∗
= ∗
⇒ =
py βX dY py βd
Exemplo 2: Economia de Robinson Crusoe. Suponha uma economia com dois bens, formada
por apenas um indivı́duo e uma firma. A utilidade do consumidor é:
u(h, y) = h1−β y β ,
com 0 < β < 1. Vamos supor que a dotação inicial do consumidor é eT = (T, 0). A tecnologia da
firma é descrita pela função de produção y = hα , com 0 ≤ h ≤ b, b > T e 0 < α < 1. O problema
da firma é:
max phα − wh,
h≤0
onde p é o preço do bem final e w é o salário. A solução do problema da firma resulta em:
1
αp 1−α α
αp 1−α
hf = e yf =
w w
O lucro ótimo é: 1
1−α αp 1−α
π = π(w, p) = w ≥ 0.
α w
Como apenas preços relativos importam, vamos normalizar p∗ = 1. Pela lei de Walras, basta
verificarmos a condição de equilı́brio de um dos mercados para determinar o preço w de equilı́brio.
No mercado h, temos que hf + hc = T resulta em:
1−α
f c ∗ 1 − β(1 − α)
h +h =T ⇒ w =α .
αβT
3 Bem-Estar Social
3.1 Eficiência de Pareto
Vimos que o princı́pio básico de eficiência usado em economia é o critério de Pareto, que
formaliza a ideia de que se na situação social A um indivı́duo fica melhor e nenhum fica pior
comparado à situação B então a situação A é melhor para a sociedade do que a situação B. Ou,
se na situação social A, todos os membros da sociedade estão melhores comparados à situação B,
então, a situação A é melhor para a sociedade que a situação B. O critério ou princı́pio de Pareto
também pode ser formalizado da seguinte maneira.
Definição: Uma alocação factı́vel é Pareto ótima (ou eficiente de Pareto) se não é Pareto-dominada
por nenhuma outra alocação factı́vel.
Uma alocação eficiente de Pareto satisfaz as seguintes três condições (“em situações bem-
comportadas”:
• Eficiência nas trocas: as taxas marginais de substituição entre quaisquer dois bens devem ser
iguais.
• Eficiência produtiva: para todas as firmas, as taxas técnicas de substituição entre os insumos
devem ser iguais.
• Eficiência no mix de produtos: a taxa marginal de transformação entre dois bens deve ser
igual à taxa marginal de substituição dos consumidores.
O Primeiro Teorema do Bem-Estar afirma que todo equilı́brio Walrasiano satisfaz o critério de
Pareto, ou seja, todo equilı́brio em concorrência perfeita é Pareto ótimo. Logo, não existe nenhum
rearranjo de recursos (ou seja, nenhuma mudança na produção ou no consumo) tal que alguém
possa melhorar sua situação sem ao mesmo tempo piorar a situação de outro. Portanto, o mercado
agindo sozinho alcança uma situação de equilı́brio Pareto ótima, mesmo com cada agente econômico
agindo de modo egoı́sta, no sentido de buscar apenas o seu próprio bem-estar. Este resultado está
relacionado com a famosa “mão invisı́vel ” de Adam Smith. Observe que a alocação de equilı́brio
pode ser bastante desigual e ainda assim ser Pareto eficiente.
O Segundo Teorema Fundamental do Bem-Estar diz que, “sob certas condições”, toda alocação
Pareto ótima pode ser obtida pela economia de mercado, por meio de uma redistribuição adequada
das riquezas iniciais dos agentes.
Portanto, o teorema implica que qualquer alocação Pareto-ótima pode ser atingida por meio
do mecanismo de mercado descentralizado, ou seja, não é necessário haver um planejador cen-
tral. O próprio mercado pode alcançar a alocação desejada, sendo necessária somente a correta
redistribuição de recursos na economia. Neste sentido, é possı́vel dizer que o segundo teorema do
bem-estar permite a separação dos problemas de eficiência econômica e de distribuição dos bens na
sociedade.
O segundo teorema do bem-estar supõe uma série de hipóteses para a sua validade. As mais
importantes e restritivas são relacionadas a questões de convexidade. Primeiro, as preferências dos
consumidores devem ser convexas. Segundo, o conjunto de produção de cada firma deve ser convexo
(é possı́vel relaxar esse requerimento, mas devemos ter que o conjunto de possibilidade de produção
agregado da economia seja convexo). Isso elimina a possibilidade de que o teorema seja válido na
presença de retornos crescentes de escala (pelo menos de maneira geral para toda a economia).
Falhas de mercado são situações que invalidam os teoremas de bem-estar. Em particular, se
alguma falha estiver presente, não podemos afirmar que a alocação de recursos e bens alcançada
por uma economia de mercado satisfaça o critério de eficiência de Pareto.
Exemplos de falhas de mercado:
• Bens Públicos;
• Externalidades;
• Poder de mercado;
• Informação Imperfeita.
Seja x = (xA , xB ) uma alocação qualquer. Dizemos que o indivı́duo i inveja a cesta do indivı́duo
j caso ele prefira a cesta de j à sua própria cesta. Por exemplo, dizemos que o indivı́duo A inveja
a cesta de B caso uA (xB B A A A
1 , x2 ) > u (x1 , x2 ).
Definição: Alocação Equitativa. Uma alocação equitativa é uma alocação para a qual nenhum
indivı́duo inveja a cesta de outro indivı́duo.
Definição: Alocação Justa. Uma alocação justa é uma alocação equitativa e eficiente.
Podemos mostrar que sempre existirá pelo menos uma alocação justa: a alocação de equilı́brio
obtida de uma divisão igualitária de recursos será uma alocação justa.
Leitura Recomendada
• Varian, caps. 31 - “Trocas” e 32 - “A Produção”.
• Pindick e Rubinfeld, cap. 16 - “Equilı́brio Geral e Eficiência Econômica”.
• Nicholson e Snyder, cap. 13 - “General Equilibrium and Welfare”.
Exercı́cios
5. (P1-2/18) Suponha uma economia com dois consumidores, A e B, com utilidades definidas
sobre cestas de dois bens, x e y, denotadas por uA (xA , yA ) = x2A yA2 e uB (xB , yB ) = xB yB . As
dotações iniciais de A e B são eA = (12, 8) e eB = (8, 12).
6. (PS-2/18) Considere uma economia sem produção com dois bens, x e y. Suponha que existam
apenas dois indivı́duos, A e B, com funções de utilidade dadas por uA (x, y) = xy 2 e uB (x, y) =
min{x, y} e dotações eA = (10, 20) e eB = (20, 10).
7. (P1-1/19) Suponha uma economia com dois consumidores, A e B, com utilidades definidas
sobre cestas de dois bens, x e y, denotadas por uA (xA , yA ) = x2A yA2 e uB (xB , yB ) = xB + yB .
As dotações iniciais de A e B são eA = (6, 4) e eB = (4, 6).
MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 2 – Teoria da Escolha Social
Prof. José Guilherme de Lara Resende
1 Escolha Social
1.1 Introdução
A teoria da Escolha Social lida com o problema de agregar preferências individuais em uma
preferência social. Ela analisa a questão de como um grupo ou uma sociedade decide coletivamente.
Normalmente essa decisão é por meio de uma regra de agregação das preferências ou escolhas
individuais. É desejável que essa regra satisfaça certos critérios de caráter normativo. Por exemplo,
podemos exigir que a regra de escolha social seja tal que se todos em uma sociedade preferem a
alternativa x à alternativa y, então a regra social resulte sempre em x preferı́vel a y (critério de
unanimidade de Pareto). O principal resultado deste tópico é o Teorema de Impossibilidade de
Arrow. Varian (2012), capı́tulo 33 (“O Bem-Estar ”), constitui uma referência para essa seção.
Definições:
• Alternativa: descrição completa de um estado social;
• X: conjunto finito de alternativas, todas excludentes;
• I: tamanho do grupo ou sociedade (número de indivı́duos);
• Preferências individuais i completas e transitivas sobre as alternativas;
• Grupo de preferências: lista das preferências de todos os indivı́duos do grupo.
Definição: Preferência Social. Uma relação de preferência social S é uma relação binária
sobre X. Representamos por S e ∼S as relações de preferência estrita e indiferença derivadas de
S , respectivamente.
Relembrando a notação de preferências, temos que:
• x S y: (a alternativa) x é socialmente tão boa quanto a y;
• x S y: (a alternativa) x é socialmente melhor que y;
• x ∼S y: (a alternativa) x é socialmente indiferente a y.
Sabemos que axiomas sobre preferências consistem em hipóteses sobre o comportamento in-
divı́dual e cada axioma tem um significado preciso. Vamos supor que a preferência i de todo
indivı́duo i satisfaz os dois axiomas abaixo:
• Axioma de Completeza: Para quaisquer alternativas x e y em X, ou x i y ou y i x (ou
ambos).
• Axioma de Transitividade. Para quaisquer alternativas x, y e z em X, se x i y e y i z
então x i z.
O axioma de “completeza” diz que o indivı́duo é sempre capaz de comparar duas alternativas
quaisquer do conjunto X. Portanto, se ele tiver que escolher entre x e y, ele dirá qual alternativa
prefere (ou se é indiferente entre elas). O axioma de transitividade é crucial para a escolha do
indivı́duo ser logicamente coerente. Se esse axioma não for satisfeito, pode não ser possivel dizer
qual é a alternativa preferida pelo indivı́duo. Por exemplo, suponha um indivı́duo que ordene as
alternativas x, y, e z da seguinte maneira não-transitiva: x y, y z e z x. Neste caso não é
possı́vel determinar a alternativa preferida do indivı́duo.
Definição: Regra de Escolha Social (RES). Uma regra de escolha social (ou mecanismo de
decisão social ) f é uma função que associa cada grupo de preferências individuais a uma preferência
social. Logo:
( , , · · · , I ) 7→S
| 1 2{z } f
I indivı́duos
Então f associa a cada conjunto particular de preferências individuais uma ordenação social,
de acordo com o que a regra estabelecer.
Suponha apenas duas alternativas a serem escolhidas, representadas por x e y. Para cada
indivı́duo i, podem existir apenas três casos: 1) x i y, 2) x ∼i y, e 3) y i x. Então, a preferência
de cada indivı́duo pode ser descrita pela função Di definida como:
Di = 1 se x i y
Di = 0 se y ∼i x
i
D = −1 se y i x
Uma regra de escolha social para o caso de duas alternativas pode então ser vista como um mapa
que leva cada vetor com as preferências de todos os indivı́duos sobre x e y (sendo que é possı́vel se
declarar indiferente às duas alternativas), denotado por (D1 , D2 , . . . , DI ), a uma preferência social
DS . Seja o conjunto U = {−1, 0, 1}. No caso de apenas duas alternativas, a regra de escolha social
f pode ser definida como uma função com domı́nio no produto cartesiano U I e contradomı́nio U
(f : U I → U ), de modo a associar cada grupo de preferências individuais (D1 , D2 , . . . , DI ) à escolha
social DS , de acordo com o que a regra f especificar:
{z× · · · × U} 7→
|U × U × U f
U
I indivı́duos)
O critério Paretiano apenas exige que no caso em que todos na sociedade preferem estritamente
a mesma alternativa, a preferência social também irá preferir estritamente esta alternativa. A regra
ditadorial, definida no exemplo abaixo, satisfaz esse critério.
May (1952) elaborou 4 condições que uma regra de escolha social f deve satisfazer quando
existem apenas 2 alternativas. Abaixo apresentamos essas condições formalmente. É fundamental
entender o conteúdo econômico de cada condição. A primeira diz que a regra deve ser decisiva,
isto é, que qualquer que seja o grupo de preferências dos indivı́duos considerado, a regra leve
a uma preferência social (que pode ser indiferença entre x e y). A segunda condição, simetria
ou anonimato, estabelece que todos os indivı́duos recebem o mesmo peso na regra. A terceira
condição estabelece que as duas alternativas devem ter o mesmo status quo, nenhuma alternativa
recebe a priori um peso maior na regra. Finalmente, a quarta condição estabelece que se para um
determinado grupo de indivı́duos, a escolha social for a alternativa x ou a indiferença entre as duas
alternativas, e se um indivı́duo mudar de posição em direção à alternativa x (isto é, se antes ele
preferiria y, agora ele é indiferente entre x e y ou passa a preferir x, ou se antes ele era indiferente
entre x e y, ele passa a preferir x estritamente), e todos os outros indivı́duos continuam com as
mesmas preferências de antes, então a regra de escolha social resultará em x estritamente preferı́vel
a y.
Condição 1: Decisiva. A função f de bem-estar social é bem definida e assume um único valor
para todo elemento de U I .
Teorema de May. A função de bem-estar social f é de votação majoritária se, e somente se, é
decisiva, simétrica, neutra entre as alternativas e de resposta positiva.
O Teorema de May não só garante que a regra de votação majoritária é decisiva, simétrica,
neutra entre as alternativas e de resposta positiva (parte mais fácil de verificar), mas também que
se uma regra de decisão for decisiva, igualitária, neutra entre as alternativas e de resposta positiva,
então ela necessariamente será a regra de votação majoritária (parte mais difı́cil de verificar). Logo,
o Teorema de May constitui uma caracterização completa da regra de votação majoritária.
No caso de apenas duas alternativas, o requerimento de a regra social ser transitiva não é
relevante. Se tivermos três ou mais alternativas, transitividade passa a ser importante. O requisito
de transitividade exige uma coerência na escolha social que nem sempre será satisfeita, mesmo que
todas as preferências individuais sejam completas e transitivas.
Vamos estender a regra de votação majoritária vista acima do seguinte modo. A regra de
votação majoritária aos pares estabelece que todos os pares possı́veis de alternativas são postos em
votação, um par por vez. Em cada rodada, o vencedor da votação será a alternativa socialmente
preferı́vel. Logo, se colocarmos em votação as alternativas x vs y, se x tiver mais votos, então
x S y. Se tiverem o mesmo número de votos, x ∼S y. E se y tiver mais votos, y S x.
Considere o seguinte exemplo bem simples, com apenas três alternativas, x, y e z, e três in-
divı́duos, 1, 2 e 3. As preferências dos três indivı́duos estão resumidas na tabela abaixo:
Existem três combinações de pares para a votações majoritária, que levam aos resultados abaixo:
x vs y ⇒ x S y
y vs z ⇒ y S z ⇒ x S y, y S z, z S x
x vs z ⇒ z S x
| {z }
S não é transitiva!
Ou seja, mesmo que todas as preferências individuais sejam transitivas, pode ocorrer que a regra
de escolha social leve essas preferências individuais a uma preferência social intransitiva. Para o
grupo de preferências acima, não existe um vencedor de Condorcet. Regras de escolha social que
levem a preferências socias não transitivas podem trazer problemas de manipulação de agenda,
como discutiremos a seguir.
Suponha que a regra de escolha social é tal que, no caso de três alternativas x, y e z, se a agenda
de votação for (x, y, z), então primeiro vota-se x vs y, e depois vota-se o vencedor dessa primeira
votação contra z. Podemos ter três agendas de votação diferentes, levando aos resultados abaixo
para o caso das preferências apresentadas na tabela acima:
(x, y, z) : x vs y ⇒ x ganha, x vs z ⇒ z ganha
(y, z, x) : y vs z ⇒ y ganha, y vs x ⇒ x ganha
(z, x, y) : z vs x ⇒ z ganha, z vs y ⇒ y ganha
Logo, para o grupo de preferências descrito acima, quem define a agenda de votações define a
alternativa vencedora.
Observe que o exemplo acima exige que as preferências dos indivı́duos sejam de conhecimento de
todos. Isso possibilita votação estratégica, em que não é mais do interesse de um ou mais eleitores
revelar corretamente as suas verdadeiras preferências, votando na sua alternativa preferida.
Por exemplo, suponha que o indivı́duo 1 define a agenda de votação. Ele decide implementar a
agenda (y, z, x), que leva a escolha de x, sua alternativa preferida. Essa é a pior alternativa para
o indivı́duo 2. Se este decidir na primeira rodada de votação, entre y e z, votar em z, z passa
a ser escolhido em vez de y. Na segunda rodada de votação, a alternativa x será preterida e z
será escolhida. Logo, o indivı́duo 2, ao revelar incorretamente a sua preferência, consegue afetar
o resultado e fazer com que a sua segunda melhor alternativa, z, seja escolhida no lugar da sua
terceira melhor alternativa, x.
Logicamente, a análise se complica: os outros eleitores podem também decidir votar estrategi-
camente, não revelando corretamente suas preferências. Nesse caso, devemos analisar o problema
de votação como um jogo e procurar por equilı́brios de Nash. Observe que a discussão acima mostra
que a situação em que o indivı́duo 1 define a agenda (y, z, x) e todos votam de acordo com suas
preferências verdadeiras não é um equilı́brio de Nash (mais especificamente, vimos que o indivı́duo
2 revelar corretamente sua preferência não é a melhor resposta quando os eleitores 1 e 3 revelam
suas preferências verdadeiras).
Não vamos nos aprofundar mais na questão de comportamento estratégico agora. O ponto prin-
cipal que desejamos enfatizar é o de que, em situações onde existam três ou mais alternativas, a
regra de votação majoritária aos pares pode associar preferências sociais não transitivas a determi-
nados conjuntos de preferências individuais que são todas completas e transitivas. Essas situações
podem gerar problemas como manipulação de agenda e votação estratégica. Vamos investigar se
existe alguma regra de escolha social que não incorra nesses problemas e satisfaça certas propri-
edades, como levar sempre a preferências sociais completas e transitivas. O Teorema de Arrow
responde essa questão.
O Teorema de Arrow (Arrow, 1951) verifica a existência de uma regra de escolha social que
agregue as preferências individuais de “modo satisfatório”. As condições do Teorema de Arrow
são exigências de caráter normativo sobre a regra de escolha social f que gera a decisão do grupo
analisado, S = f (1 , . . . , N ). Note que f associa a cada grupo de preferências individuais uma
preferência social, ou seja, (1 , . . . , N ) 7→S . Os pressupostos do Teorema de Arrow são discutidos
f
abaixo.
Essa condição impõe sobre a regra social f a capacidade de associar qualquer grupo de pre-
ferências individuais a uma preferência social. Portanto, o mecanismo de escolha social é válido
qualquer que seja o grupo de preferências individuais considerado.
Princı́pio Fraco de Pareto. Para qualquer par de alternativas x e y tal que x i y para todo
indivı́duo i, então x S y.
Não-Ditadorial. Não existe indivı́duo h tal que se x h y então x S y, quaisquer que sejam as
preferências dos outros indivı́duos que não h.
Essa condição elimina a possibilidade de um ditador na sociedade. Isso não exclui o fato de que
a escolha social coincida, para um certo grupo de preferências, com a ordenação de algum ou de
alguns indivı́duos.
A IAI é a mais sutil das condições do Teorema de Arrow. Ela impõe à regra de escolha social a
propriedade de que o ordenamento entre duas alternativas dependa apenas dessas duas alternativas,
e que não seja afetado por nenhuma outra alternativa diferente de x e y. Vamos discutir um exemplo
para deixar essa condição mais clara.
Mecanismo de Escolha de Borda. A regra de escolha social de contagem de Borda pode tomar
diversas formas. O mecanismo de contagem de Borda consiste em cada indivı́duo i reportar a sua
preferência, como numa votação em lista. Daı́ associamos um número ci (x) para a alternativa x
para cada alternativa x ∈ X e para cada indivı́duo i. Calculamos a pontuação de Borda c(x) para
a alternativa x como:
X I
c(x) = ci (x)
i=1
Por exemplo, suponha que ci (x) = n, onde n é a posição de preferência de x para i. Por
exemplo, se c1 (x) = 2, então x é a segunda alternativa preferida do indivı́duo 1. Vamos supor
por enquanto que os indivı́duos ordenam todas as alternativas de modo estrito, para simplificar a
exposição. Neste caso, a regra de escolha da contagem de Borda é definida por:
I
X I
X
x S y ⇔ c(x) = ci (x) ≤ ci (y) = c(y)
i=1 i=1
Porém, a contagem de Borda não satisfaz o critério de independência das alternativas irrele-
vantes, pois o ordenamento social de duas alternativas pode depender do posicionamento de outras
alternativas, como o exemplo a seguir ilustra.
Arrow (1951) mostrou que o fato de a contagem de Borda não satisfazer IAI não é por acaso. O
Teorema de Arrow prova que quando existem três ou mais alternativas, não existe nenhuma regra
de escolha social que leve sempre a ordenamentos sociais completos e transitivos e que satisfaça as
condições elencadas acima.
Então, supondo três ou mais alternativas, como é possı́vel mostrar que o mecanismo de Borda
leva sempre a preferências completas e transitivas, é de domı́nio universal, satisfaz o princı́pio fraco
de Pareto e não é ditadorial, o Teorema de Arrow implica que esse mecanismo não pode satisfazer
a condição de independência das alternativas irrelevantes.
Teorema da Impossibilidade de Arrow (versão I). Se existem pelo menos três alternativas
em X, então não existe regra de escolha social f que resulte sempre em uma preferência social
S completa e transitiva e tal que satisfaça as condições de domı́nio universal, princı́pio fraco de
Pareto e independência das alternativas irrelevantes e que seja não-ditadorial.
Teorema da Impossibilidade de Arrow (versão II). Se existem pelo menos três alternativas
em X, então a única regra de escolha social f que resulta sempre em uma preferência social S
completa e transitiva e tal que satisfaça as condições de domı́nio universal, princı́pio fraco de Pareto
e independência das alternativas irrelevantes é a regra de escolha social ditadorial.
O Teorema de Arrow possui uma conclusão negativa: é impossı́vel esperar que uma sociedade
se comporte com a mesma coerência que podemos esperar de um indivı́duo racional (no sentido de
preferências completas e transitivas). Esse problema de coerência mostra que detalhes institucionais
e procedimentos do processo polı́tico são importantes. Ou seja, tomadas de decisões em grupo podem
gerar resultados arbitrários e manipulação. O processo instituticional pode e deve constituir uma
restrição a esses problemas.
Diversos autores da área de ciência polı́tica incorporaram o resultado de Arrow em suas análises
(por exemplo, ver Shepsle and Boncheck (1995); Austen-Smith and Banks (1996)). Além disso,
estes autores passaram a utilizar ferramentas como teoria dos jogos para auxiliar essas análises.
Vamos agora proceder de modo diferente com respeito ao problema de escolha social. Suponha
que cada indivı́duo tenha uma utilidade definida sobre o conjunto das alternativas existentes. Vamos
representar a utilidade do indivı́duo i sobre a alternativa x por ui (x).
Definição. Uma função de bem-estar (FBE) W é uma função definida sobre as funções de utilidade
individuais, W = W (u1 , . . . , uI ).
Se W for crescente em cada um dos seus argumentos, então quanto maior o nı́vel de utilidade,
maior o valor de W . Neste caso dizemos que W é uma função de bem-estar social (FBES).
Exemplos:
• FBES Rawlsiana:
W (u1 , . . . , uI ) = min{u1 , . . . , uI }.
com ai ≥ 0 ∀ i, e 0 6= ρ < 1.
As FBES dependem da representação usada para a utilidade individual. Sabemos que a uti-
lidade de um indivı́duo não é única: qualquer transformação crescente dela representao a mesma
ordenação, ou seja, a mesma pessoa. Porém, ao utilizarmos determinada forma funcional de uma
FBES, estamos assumindo que é possı́vel fazer comparações entre funções de utilidades de indivı́duos
diferentes.
Suponha que a alternativa x defina uma cesta de consumo para cada indivı́duo, x = (x1 , . . . , xI ).
Suponha também que cada indivı́duo i tenha uma dotação inicial ei . Se a utilidade de cada in-
divı́duo i depende da alocação x para todos os indivı́duos, então existem externalidades de consumo:
o bem-estar de uma pessoa depende não somente do que ela consome, mas também do que os outros
consomem. Vamos supor a partir de agora de que a utilidade de uma pessoa depende apenas da sua
própria cesta: ui (xi ), para todo i = 1, . . . , I. Neste caso dizemos que W (u1 (x1 ), u2 (x2 ), . . . , uI (xI ))
é uma FBES individualista ou de Bergson-Samuelson.
u2
6
sMáximo da FBES W
Conjunto de
Possibilidade
de Utilidade
Curva de Isobem-Estar
-
u1
onde W é uma FBES. Como toda FBES é crescente, então a alocação ótima será Pareto eficiente.
As curvas de indiferença de W são chamadas curvas de isobem-estar. A figura acima ilustra esse
problema graficamente.
Mais ainda, qualquer alocação Pareto eficiente pode ser o resultado da maximização de alguma
FBES. Em particular, se maximizarmos a FBES da soma ponderada das utilidades variando os
pesos ai , obtemos qualquer ponto da FPU como solução ótima. Para que este resultado seja válido,
é necessário que o conjunto de possibilidade de utilidades seja convexo.
Observe então que existe uma relação estreita entre FBES e alocações eficientes: toda solução
de um problema de maximização de uma FBES crescente é eficiente e toda alocação
eficiente é solução de um problema de maximização de bem-estar social, para uma
FBES apropriada.
Referências
Arrow, K. (1951). Social choice and individual values. New York: John Wiley.
Austen-Smith, D., & Banks, J. (1996). Positive political theory. Ann Arbor: University of Michigan
Press.
May, K. O. (1952). A set of independent necessary and sufficient conditions for simple majority
decision. Econometrica, 20:4 , 680-684.
Shepsle, K., & Boncheck, M. (1995). Analysing politics. New York: W. W. Norton.
Varian, H. (2012). Microeconomia – uma abordagem moderna (8a edição). Elsevier/Editora
Campus.
Exercı́cios
1. Mostre que a regra de votação majoritária aos pares, conforme definida em sala, satisfaz as
propriedades de anonimato, neutralidade entre as alternativas e resposta positiva.
2. Mostre que uma regra de escolha social que satisfaz as propriedades de resposta positiva e
neutralidade entre as alternativas satisfaz a seguinte propriedade:
Assuma que o método de votação é dado pela contagem de Borda (votação em lista). Suponha
que ninguém vote estrategicamente.
a) Calcule um sistema de pesos para o sistema de Borda onde o candidato A ganha, se tal
sistema de pesos existir.
b) Calcule um sistema de pesos para o sistema de Borda onde o candidato B ganha, se tal
sistema de pesos existir.
c) Considere o sistema de pesos calculado para o item b). Existe algum incentivo para
algum eleitor votar estrategicamente?
Número de eleitores: 1 4 1 3
a c e e
b d a a
c b d b
d e b d
e a c c
5. Verifique quais condições do Teorema de Arrow as regras de escolha social listadas abaixo
satisfazem. Argumente de modo convincente caso a regra satisfaça alguma condição e forneça
um contra-exemplo caso contrário.
6. Argumente de modo convincente que se existem apenas duas alternativas, a regra de votação
majoritária satisfaz as hipóteses do Teorema de Arrow.
7. Considere uma eleição com quatro candidatos, A, B, C e D e cinco eleitores, onde as pre-
ferências desses eleitores são descritas na seguinte tabela, em ordem decrescente de preferência:
Assuma que a regra de escolha social é definida pela maioria simples, onde cada eleitor vota
em apenas uma das alternativas e a alternativa mais votada é a escolhida.
a) Suponha que ninguém vote estrategicamente, ou seja, cada eleitor seleciona a sua alter-
nativa preferida. Qual é a alternativa eleita?
b) Mostre que para as preferências exibidas na tabela acima, existe possibilidade de voto
útil, ou seja, algum ou alguns eleitores selecionarem uma alternativa diferente da sua
preferida.
c) Qual ou quais condições do Teorema de Arrow o sistema de votação descrito acima não
satisfaz? Justifique a sua resposta.
8. (P1-1/2019) Existem três indivı́duos na sociedade, {1, 2, 3}, três alternativas, {A, B, C}, e o
domı́nio das preferências é irrestrito. Suponha que a relação de preferência social, S , é dada
por votação majoritária, ou seja, cada indivı́duo escolhe uma das alternativas, coloca em uma
urna, onde contam-se o número de votos e é escolhida a alternativa com maior número de
votos (se ocorrer empate, então o indivı́duo 1 escolhe a alternativa preferida, em um voto de
minerva), ordenando as alternativas seguintes pelo número de votos recebido. Assuma que
cada indivı́duo conhece as preferências de todos os outros eleitores.
Indivı́duo 1: A 1 B 1 C
Indivı́duo 2: B 2 C 2 A
Indivı́duo 3: C 3 A 3 B
Se todos os três indivı́duos votarem na sua alternativa preferida, qual será escolhida?
(b) Existe algum indivı́duo que tem incentivo para voto útil, ou seja, para votar não na
alternativa preferida, mas sim em outra?
(c) Quais das hipóteses do Teorema de Arrow são satisfeitas pela regra de votação acima?
Quais não são satisfeitas? Argumente de modo claro e sucinto.
9. (JR) Suponha que existam três indivı́duos numa sociedade, {1, 2, 3}, três alternativas, {x, y, z},
e que a regra de escolha social f é a votação majoritária aos pares, com domı́nio irrestrito,
de modo que a qualquer indiferença obtida é resolvida votando x primeiro do que y e depois
z, se a regra resultar em uma preferência social transitiva. Se a regra não resultar numa
preferência social transitiva, então o ordenamento social será x S y S z.
Indivı́duo 1: x 1 y 1 z
Indivı́duo 2: y 2 z 2 x
Indivı́duo 3: z 3 x 3 y
MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 3 – Externalidades e Bens Públicos
Prof. José Guilherme de Lara Resende
1 Externalidades
1.1 Introdução
Uma externalidade de consumo ocorre quando a ação de um agente afeta a utilidade (ou
utilidades) de outro agente (outros agentes). Uma externalidade de produção ocorre quando
a tecnologia de alguma ou algumas firmas afeta o bem-estar de outros agentes. Assim como a
externalidade de consumo, a externalidade de produção pode ser positiva ou negativa.
O ponto principal da externalidade em termos econômicos é a inexistência do mercado para o
bem ou serviço gerado pela atividade causadora da externalidade. Quando ocorre uma externali-
dade, o custo (se a externalidade for negativa) ou o benefı́cio (se a externalidade for positiva) social
da ação do agente será diferente do custo ou benefı́cio privado. Esta discrepância entre o custo ou
benefı́cio social e o custo ou benefı́cio privado pode tornar a decisão privada distinta da decisão
socialmente ótima, mesmo em um mercado perfeitamente competitivo.
No caso de uma externalidade negativa, o nı́vel de atividade estará acima de seu nı́vel social-
mente ótimo. No caso de uma externalidade positiva, o nı́vel de atividade estará abaixo de seu
nı́vel socialmente ótimo. Isso ocorre porque o custo (ou benefı́cio) associado à externalidade não é
levado em conta pelo agente causador da externalidade.
Nesse caso, o primeiro teorema do bem-estar não é mais válido em geral : na presença de
externalidades, a alocação de mercado pode ser ineficiente no sentido de Pareto.
Exemplos:
• Fumantes e não fumantes: dois colegas de quarto, um fumante e outro não fumante. Ao
fumar, o fumante diminui o bem-estar do seu colega.
• Poluição: uma firma que polui um rio, sem considerar o dano que atinge o rio e a comunidade
ribeirinha presente.
• Trens e faı́scas (Coase): a passagem de trens pelos trilhos gera faı́scas que podem causar
incêndios em plantações.
Para ajudar o entendimento, vamos supor um modelo simples (Varian (2012), capı́tulo 34,
“Externalidades”, e Nicholson and Snyder (2008), capı́tulo 19, “Externalities and Public Goods”)
com duas firmas, A e B, onde a firma A, ao produzir o seu bem na quantidade yA , escolhe uma
quantidade xA de poluição, que afeta os custos de produção da firma B, denotados por cB (yB ; xA ).
As duas firmas estão inseridas em mercados competitivos, logo tomam os preços dos bens que
produzem como dados e procuram maximizar os seus lucros. O problema de maximização de lucro
da firma A é:
max pA yA − cA (yA , xA ) ,
yA ,xA
onde pA denota o preço do bem que a firma A produz e a função custo da firma A satisfaz ∂cA /∂yA >
0, ∂ 2 cA /∂yA2 > 0, ∂cA /∂xA < 0. Note que estamos assumindo que quanto maior o nı́vel de produção
de poluição, menor será o custo de produzir o bem yA pela firma A. Podemos modificar essa hipótese
de diversas formas, como, por exemplo, assumir que a produção de yA gera diretamente um nı́vel
único de poluição xA , de tal modo que a decisão da firma A é relativa apenas à quantidade de yA
que irá produzir, que gera uma quantidade de poluição associada.
As condições de primeira ordem do problema da firma A resultam em:
∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : =0
∂xA
A primeira CPO é a condição usual preço igual a custo marginal, que determina a oferta ótima
de uma firma competitiva. A segunda CPO diz que a firma irá escolher a quantidade ótima de
poluição de modo a igualar o custo marginal de poluir a zero.
Já o problema de maximização de lucros da firma B é dado por:
max pB yB − cB (yB , xA ) ,
yB
que resulta na CPO pB = ∂cB (yB , xA )/∂yB . A quantidade de poluição gerada pela firma A afeta
os custos da firma B, mas a firma A não leva esse efeito em conta. Temos então uma externalidade
negativa gerada na produção do bem yA . Vamos encontrar qual a quantidade de poluição socialmente
ótima, levando em conta os efeitos sobre a firma B. Uma forma de encontrar esse valor é por meio
de uma fusão das duas firmas, que passa então a maximizar o seu lucro produzindo os dois bens
yA e yB :
max pA yA + pB yB − cA (yA , x) − cB (yB , x) ,
yA ,yB ,x
∂cA (yA , x)
(yA ) : = pA
∂yA
∂cB (yB , x)
(yB ) : = pB
∂yB
∂cA (yA , x) ∂cB (yB , x)
(x) : =−
∂x ∂x
As duas primeiras CPOs mostram que a firma integrada continua a decidir a quantidade ótima a
ser produzida de cada bem igualando preço ao custo marginal para cada um desses bens.
Preço
6
∂cB /∂x
Q
x∗∗ : Ótimo Social
Q
Q
Q
Q
Q
x∗ : Ótimo Privado
Q
s
Q
x∗∗ < x∗
QQ
Q
Q
Q
Q
Q
Q
−∂cA /∂x
Q
Q
Q
Q
Q -
x
x∗∗
Q∗
x
Preço
6
Custo social
Oferta (custo privado)
Q
Q
Q
Q
Q s
Ótimo Social Q
QQsEquilı́brio de Mercado
Q
Q
Q
Q
Q
Q
QQ
Demanda
-
qS qM Quantidade
1.2 Soluções
3. Criação de mercados.
Impostos de Pigou
1. O governo deve taxar a atividade geradora da externalidade diretamente (por exemplo, taxar
o lucro não diminuirá o nı́vel de externalidade).
2. O governo pode optar por um esquema de subsı́dio para redução da externalidade, ao invés
de taxar a externalidade.
3. A solução exige que o governo conheça os beneficı́os e custos exatos que envolvem o problema
de externalidade. Se esse é o caso, o governo poderia simplesmente impor quotas de produção
ou exigir diretamente que a firma produzisse a quantidade socialmente ótima do bem.
Criação de Mercado
A solução via “mercado de créditos” exige menos informação do que uma solução via “imposto de
Pigou”, pois o governo deve conhecer apenas o nı́vel agregado socialmente ótimo de externalidade.
A alocação de direitos de propriedade não afeta o resultado de eficiência, porém tem consequências
distributivas. Esse tipo de solução cria incentivos para as firmas adotarem tecnologias que diminuam
a sua produção de externalidade, já que a externalidade passa a ser um custo para a firma.
Voltando ao nosso exemplo inicial das duas firmas A e B, vamos supor que se cria um mercado
para poluição e que x passe a ser transacionado a um preço px . Vamos supor que a firma B possui
os direitos de propriedade sobre poluição, de modo que qualquer poluição emitida, a receita gerada
vai para ela. O problema de maximição de lucros da firma A se torna:
max pA yA − cA (yA , xA ) − px xA ,
yA ,xA
ou seja, o nı́vel ótimo de x será igual ao nı́vel socialmente ótimo. Por que isso ocorre? A firma A
passa a ter um custo px para emitir x. Ela irá comprar x até que o custo marginal de emissão de
x se iguale ao preço px . A firma B, que recebe a receita dessa venda de x por possuir os direitos
de propriedade de x, irá vender uma quantidade de x até que a receita marginal dessa venda, dado
por px , se iguale ao seu custo marginal de arcar com x na sua atividade produtiva. Portanto, por
meio de um mercado para x, a quantidade socialmente ótima de x é alcançada via negociação entre
as duas firmas.
O que ocorre se mudarmos o direito de propriedade de x para a firma A, de modo que agora
a firma B terá que pagar para A reduzir x? Nada em termos da quantidade de externalidade x
gerada, conforme prevê o Teorema de Coase. Para confirmarmos isso, vamos analisar o problema
da firma A, que agora é dado por:
max pA yA + px xA − cA (yA , xA )
yA ,xA
∂cA (yA , xA )
(yA ) : = pA
∂yA
∂cA (yA , xA )
(xA ) : = px
∂xA
max pB yB − cB (yB , xB ) − px xB ,
yA ,xA
∂cB (yB , xB )
(yB ) : = pB
∂yB
∂cB (yB , xB )
(xB ) : − = px
∂xB
Igualando as CPOs dos problemas das duas firmas em x, por meio de px , obtemos que:
A “tragédia dos comuns” ocorre quando um bem comunitário sofre de um problema do bem
escasso que não tem dono: cada agente tem incentivo a explorá-lo mais que o ótimo social, pois
se ele não o fizer outro agente o fará. Hardin (1968) popularizou esse termo em um artigo para a
revista Science.
Uma solução para este problema é a regulamentação por uma autoridade, usualmente o governo
ou uma associação comunitária. Essa regulamentação pode ser por meio de concessões, limitando
o montante do bem comum disponı́vel para uso por cada indivı́duo. Sistemas de concessão para
atividades econômicas extrativistas tais como mineração, pesca, caça, corte de árvores são exemplos
desta solução. O governo pode também impor limites de danos admissı́veis ao bem comum.
Outra solução que pode ser usada para certos recursos é transformar o bem comum em propri-
edade privada, fazendo com que o dono tenha incentivos para garantir a sustentabilidade do bem,
preservando-o.
Suponha que em uma região foi concedido livre acesso à pastores de ovelhas. Suponha que o
preço do metro cúbico de lã é R$ 1, e que a produção total de lã pode ser expressa pela função
f (n), em que n é o número de ovelhas no pasto. Vamos assumir que todas as ovelhas geram o
mesmo tanto de lã, de tal modo que f (n)/n representa a quantidade de lã gerada por uma ovelha.
Suponha que o custo de cada pastor com uma ovelha seja R$ c.
O número total de ovelhas será determinado pela condição de lucro zero, já que cada pastor
irá introduzir mais uma ovelha no pasto até que a receita obtida com essa ovelha se iguale ao seu
custo:
f (n∗ ) f (n∗ )
π =p× − c = 0 ⇒ p =c
n∗ n∗
A quantidade socialmente ótima de pastores pode ser determinada maximizando o lucro total
da atividade de pastoreio:
max p × f (n) − cn
n
P M e,
P Mg 6
H
@HH
@ HH
@ H
@ HH
H
@ HH
@ H
HH
s Hs
@
c @ HH
@ H
@ HH
H
P Me
@
@
@
P Mg
-
n∗∗ n∗ n
A figura acima mostra que a quantidade socialmente ótima n∗∗ é menor do que a quantidade
determinada na solução do bem de recurso comum, n∗ . Um pastor, ao colocar mais uma ovelha no
pasto, afeta todos os outros pastores, pois uma ovelha a mais diminui a quantidade total de pasto
disponı́vel. Temos um problema de externalidade negativa.
A externalidade negativa neste caso é consequência de o pasto ser um bem de recurso comum,
o que leva a uma sobreutilização dele. Uma forma de resolver o problema seria transformar o pasto
um bem privado. Deste modo, o criador de ovelhas, dono do pasto, irá levar em conta o efeito de
cada ovelha sobre todas as outras e internalizará a externalidade.
Outras soluções são possı́veis. Uma seria estabelecer n∗∗ como o número máximo de ovelhas
permitidas. Pastores podem ter direito a um certo número de ovelhas e transacionar esses direitos
entre si, com o limite de manter o número total de ovelhas igual a n∗∗ .
Elinor Ostrom, ganhadora do prêmio Nobel em Economia em 2009, conjuntamente com Oliver
Williamson, fez importantes contribuições sobre problemas como a tragédia dos comuns e outros
semelhantes. O seu livro Governing the Commons se tornou uma referência clássica sobre o assunto
(Ostrom, 2015).
2 Bens Públicos
2.1 Definições
Samuelson (1954, 1955) definiu bem público (puro) como um bem com duas caracterı́sticas:
1. Não-rival: O consumo do bem por uma pessoa não limita ou diminui a quantidade disponı́vel
para consumo por outras pessoas;
2. Não-excludente: Não é possı́vel (ou é muito custoso) excluir indivı́duos do seu consumo.
Bens públicos podem ser vistos como um problema de externalidade de consumo onde todas
as pessoas são obrigadas a consumir a mesma quantidade do bem. Essa parte da nota de aula
baseia-se em Varian (2012), capı́tulo 36 (“Bens Públicos”) e Nicholson and Snyder (2008), cap. 19
- “Externalities and Public Goods” .
Classificamos os tipos de bens com relação à rivalidade e à possibilidade de exclusão do consumo
do seguinte modo (a tabela abaixo resume a terminologia descrita):
• Os bens privados são bens excludentes e rivais. Exemplos são bens de consumo, tais como
laranja, sorvete, automóvel.
• Os bens públicos são não-excludentes e não-rivais. Exemplos são segurança pública, ilu-
minação pública, defesa nacional, estradas sem pedágio descongestionadas.
• Os bens de recursos comuns são não-excludentes e rivais. Exemplos são peixes no oceano
ou em um rio, meio ambiente, estradas sem pedágio congestionadas.
• Os bens de clube são excludentes, mas não rivais. Exemplos são TV a cabo, estradas com
pedágio não congestionadas, corpo de bombeiro.
Até agora lidamos sempre com bens privados: bens em que é possı́vel privar o consumo por
alguma pessoa, bastando para isso não vender o bem, e rivais no consumo, ou seja, se o bem for
consumido por alguém, ele não tem como ser consumido por outro pessoa.
Suponha que existam apenas dois indivı́duos, que podem consumir dois bens, um bem privado,
denotado por x, e um bem público, denotado por G. Vamos supor que G é perfeitamente divisı́vel
e normalizar o preço do bem privado em um (px = 1). Suponha que c(G) representa o custo de
prover G unidades do bem público.
A utilidade do agente i, i = 1, 2, é ui (xi , G). Vamos representar por wi a riqueza do indivı́duo
i, i = 1, 2. O problema de maximização que determina as alocações Pareto eficientes é:
max u1 (x1 , G) s.a. i) u2 (x2 , G) = ū2 ,
x1 ,x2 ,G
ii) x1 + x2 + c(G) = w1 + w2
Se dividirmos a terceira CPO por µ e substituirmos nela os valores de µ e λ/µ dados pela
primeira e segunda CPOs, obtemos:
∂u1 (x1 ,G) ∂u2 (x2 ,G)
∂G ∂G ∂c(G)
∂u1 (x1 ,G)
+ ∂u2 (x2 ,G)
=
∂G
∂x1 ∂x2
Ou seja, em uma alocação Pareto eficiente, a soma do valor absoluto das taxas marginais de
substituição entre os bens público e privado dos dois consumidores deve ser igual ao custo marginal
de provisão do bem público (a soma da propensão marginal a pagar tem que ser igual ao custo
marginal). Esse resultado se mantém válido para o caso geral de I indivı́duos:
I
X
|T M Si (G, xi )| = CM g(G) (1)
i=1
Vamos supor que a utilidade de cada indivı́duo seja quaselinear na quantidade consumida do
bem público G: ui (G, xi ) = Ui (G) + xi , onde xi representa a quantidade consumida do bem
privado, cujo preço é normalizado
√ em 1, e Ui (G) é uma função estritamente côncava (por exemplo,
U (G) = ln(G) ou U (G) = G). Vamos denotar a renda do indivı́duo i por mi e o custo de provisão
de G unidades do bem público por c(G). Logo, a equação (1), que define a quantidade socialmente
ótima de bem público, encontrada para o caso geral, neste caso se torna:
I
X
Ui0 (G∗ ) = c0 (G∗ )
i=1
Suponha o mesmo arcabouço descrito na subseção anterior, com utilidades quaselineares, e que
exista agora um mercado privado para a provisão do bem público. Cada indivı́duo i deve escolher a
quantidade gi para comprar ao preço p. O problema do consumidor i é dado por:
!
X
max Ui gi + ḡk + xi s.a. xi + pgi = mi .
gi ,xi
k6=i
onde ḡk denota a quantidade ótima consumida pelo indivı́duo k, ∀k 6= i. Esse problema pode ser
escrito de modo simplificado como:
!
X
max Ui gi + ḡk + (mi − pgi ) ,
gi
k6=i
Do lado da oferta, suponha uma firma competitiva que toma o preço p do bem público como
dado e possui uma função custo denotada por c(Q), onde Q representa a quantidade de bem
público. A oferta ótima do bem público é encontrada resolvendo o problema de maximização de
lucro abaixo:
max pQ − c(Q)
Q≥0
A CPO do problema acima resulta na conhecida condição preço igual a custo marginal:
p = c0 (Q̄)
No equilı́brio devemos ter que a quantidade demandada de bem público é igual a quantidade
ofertada, ou seja, Ḡ = Q̄. Observe que utilizando os resultados acima, obtemos:
I
X
0
c (Ḡ) = p = Ui0 (Ḡ) < Uk0 (Ḡ) = c0 (G∗ )
k=1
Como o custo marginal de provisão do bem público é crescente (c00 > 0), obtemos:
Ḡ < G∗ ,
ou seja, no caso de provisão privada de um bem público, o nı́vel de produção de mercado é inferior
ao nı́vel socialmente ótimo. O gráfico a seguir ilustra essa situação.
$6
c0 (G)
g 0 (G)
P
i
s
UI0 (G)
∗
-
G
Ḡ G
A caracterı́stica de não ser possı́vel excluir uma pessoa do consumo do bem público, ou seja,
o fato de que o bem público comprado por um consumidor fica disponı́vel para todos os outros
consumidores, torna o mercado ineficiente na provisão de bens públicos. Isto justifica a ação do
Estado para corrigir a alocação de mercado. No caso de provisão privada de um bem público, o
nı́vel de produção de mercado é inferior ao nı́vel socialmente ótimo.
Observe que a ineficiência é resultado da caracterı́stica de não ser possı́vel excluir nenhum
indivı́duo do consumo do bem público. Isso cria a situação onde cada consumidor deseja pegar
carona no consumo do bem público pago pelos outros (free-riding problem). O carona é o agente
econômico que se beneficia do bem sem pagar por ele.
Suponha que U10 (G) < U20 (G) < · · · < UI0 (G), para todo G ≥ 0. Nesse caso, é possı́vel mostrar
que o nı́vel de equilı́brio Ḡ de provisão privada do bem público satisfaz UI0 (Ḡ) = c0 (Ḡ), ou seja,
quem tem o maior benefı́cio marginal com o bem público é quem define a quantidade provida desse
bem.
Essa ineficiência da quantidade privada ótima ser menor do que a quantidade socialmente ótima
pode ser corrigida por meio de um imposto compulsório, que obriga todos a contribuı́rem para o
provimento do bem público. Porém, há um outro problema: cada indivı́duo poderá não revelar
corretamente o benefı́cio que obtém com o bem público, o que impossibilitaria calcular a quantidade
socialmente ótima de bem público que deve ser provida. A questão então é se existe alguma forma
de induzir cada indivı́duo a revelar o seu verdadeiro benefı́cio com o bem público. Este é um
problema tı́pico de desenho de mecanismos.
Referências
Coase, R. H. (1960). The problem of social cost. Journal of Law and Economics, 3 , 1-44.
Hardin, G. (1968). The tragedy of the commons. Science, 162 , 1243-1248.
Nicholson, W., & Snyder, C. (2008). Microeconomic theory - basic principles and extensions (10th
edition). Mason, OH: South-Western Cengage Learning.
Ostrom, E. (2015). Governing the commons. the evolution of institutions for collective action. New
York: Cambridge University Press.
Pigou, A. C. (1920). The economics of welfare. London: Macmillan and Co.
Samuelson, P. A. (1954). The pure theory of public expenditure. The Review of Economics and
Statistics, 36:4 , 387-389.
Samuelson, P. A. (1955). Diagrammatic exposition of a theory of public expenditure. The Review
of Economics and Statistics, 37:4 , 350-356.
Varian, H. (2012). Microeconomia – uma abordagem moderna (8a edição). Elsevier/Editora
Campus.
Exercı́cios
ui (xi , G) = i × ln G + xi ,
MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 4 – Escolha sob Incerteza
Prof. José Guilherme de Lara Resende
Considere o seguinte jogo. Uma moeda é lançada. Se o resultado for cara, você ganha R$ 2.
Se o resultado for coroa, a moeda é lançada novamente. Se o resultado for cara, você ganha R$
22 = R$ 4. Se o resultado for coroa, a moeda é lançada novamente. Continuamos dessa forma ad
infinitum, ou até que o jogo termine com um lançamento da moeda que resulte em cara. Nesse
caso, o participante recebe R$ 2n , onde n é o número de lançamentos feitos até cara sair.
Quanto você estaria disposto a pagar para participar deste jogo? Se você decidir pagar o valor
esperado do jogo, você pagaria qualquer valor para participar do jogo, já que o valor esperado do
jogo diverge para infinito.
Observe que o jogo pode dar prêmios enormes. Por exemplo, se o jogo for até o vigésimo lance
de moeda, você ganharia mais de um milhão de reais. Se o jogo chegar até a trigésima rodada,
você ganharia mais de um bilhão de reais. Porém, a chance desses prêmios é bastante baixa (para o
prêmio de um milhão, a chance é menor do que uma em um milhão). Metade das vezes, o jogo paga
apenas R$ 2, e a chance de um valor maior que que R$ 100 é uma em cento e vinte e oito. Logo,
poucas pessoas pagariam um valor alto por esse jogo, apesar de seu valor esperado ser infinito.
Esse problema é conhecido como o paradoxo de São Petersburgo.
Daniel Bernoulli, em 1738, apresentou uma solução para este paradoxo, baseada na ideia de
utilidade marginal decrescente do dinheiro. Bernoulli afirmou que o valor de algo depende da
utilidade gerada, e que o ganho de utilidade do dinheiro cai quanto mais dinheiro a pessoa tem. O
gráfico abaixo ilustra uma função de utilidade com essa propriedade.
u
6
u(w)
-
riqueza (w)
Portanto, a utilidade esperada U é linear nas probabilidades e determinada pelos valores que
assume no conjunto dos resultados. Mais adiante, veremos que a função u determina o comporta-
mento em relação ao risco da pessoa. Segundo Bernoulli, a utilidade marginal da riqueza deve ser
decrescente, ou seja, a função u deve ser côncava.
Exemplo: um indivı́duo possui uma riqueza avaliada em R$ 100.000. Parte dessa riqueza consiste
em um carro avaliado em R$ 20.000. A probabilidade de o carro ser roubado é de 20% caso não seja
instalado um alarme anti-furto. O alarme custa R$ 1.000 e, se instalado, reduz a probabilidade de
roubo para 5%. Suponha que a função de utilidade sobre a riqueza desse indivı́duo é u(x) = ln(x).
A utilidade esperada do indivı́duo quando ele instala o sistema anti-furto (opção 1) é, portanto,
igual a:
Caso ele não instale o sistema (opção 2), sua utilidade esperada será igual a:
Portanto, caso não tenha a opção de contratar um seguro, o indivı́duo optará por instalar o alarme.
Nesse exemplo, existem dois estados da natureza relevantes ao problema: o primeiro, “carro não é
roubado”, o segundo, “carro é roubado”.
A utilidade esperada do jogo descrito no paradoxo de São Petersburgo, com u(w) = ln(w), é:
∞ ∞ ∞
X 1 n
X 1 X n
U= n
ln(2 ) = n
n ln(2) = ln(2) = 2 ln(2),
n=0
2 n=0
2 n=0
2n
pois a série ∞ n
P
n=0 2n converge para 2. Portanto, o indivı́duo ficaria indiferente entre participar do
jogo ou receber R$ 4,00 com certeza.
Se o conjunto de resultados for A = R+ , então uma loteria será representada por uma função de
distribuição acumulada F : R → [0, 1] (F (x) = P (g ≤ x)). Se a loteria for absolutamente contı́nua,
com função de densidade de probabilidade f (x), a utilidade de uma loteria pode então ser calculada
como: Z ∞ Z ∞
U (F ) = u(x) dF (x) = u(x)f (x) dx
−∞ −∞
Vimos que agora o consumidor decidirá entre loterias - o objeto de consumo agora. Vamos supor
que o consumidor possui preferências sobre o conjunto G de loterias, onde estas preferências
satisfazem os axiomas abaixo.
são fechados.
f g ⇔ αf + (1 − α)h αg + (1 − α)h.
O primeiro axioma exige que todo par de loterias seja comparável em termos de preferência e que
esta preferência satisfaça a propriedade de transitividade. O significado do segundo axioma é similar
ao do axioma de continuidade para preferências em um ambiente sem incerteza, sendo também um
axioma de caráter mais técnico, necessário para obtermos a representação da preferência por uma
função de utilidade. O terceiro axioma assegura que a função de utilidade que representa o sistema
de escolhas do consumidor tenha a forma de utilidade esperada (linear nas probabilidades).
Vimos que a utilidade U : G → R possui a propriedade de utilidade esperada se, para todo
g ∈ G, g = (p1 ◦ a1 , . . . , pn ◦ an ), temos que:
n
X
U (g) = pi u(ai ) .
i=1
Dizemos então que a utilidade esperada que representa um sistema de preferências que satisfaça
os axiomas acima é única a menos de transformações lineares (ou afins) positivas. O teorema
anterior tem como consequência o fato de que diferenças de utilidades têm significado, no caso de
utilidades esperadas.
Portanto, a teoria da utilidade esperada não é mais uma teoria puramente ordinal, já que
diferenças de utilidade têm significado econômico. Porém, esta teoria também não é puramente
cardinal, pois o valor da utilidade de uma determinada loteria não tem conteúdo econômico, já
que uma transformação afim crescente desta utilidade continua representando o mesmo sistema de
escolhas.
A curvatura da função u mede a atitude do consumidor com relação ao risco. Por exemplo,
suponha um indivı́duo com R$ 100 de riqueza. Ele pode entrar em uma aposta onde com 50% de
chance ele ganhará R$ 50 e com 50% de chance ele perderá R$ 50. O valor esperado da aposta é 0
(1/2 × 50 + 1/2 × (−50)) e, portanto, o valor esperado da sua riqueza se participar da aposta é R$
100. Já a utilidade esperada da aposta é:
1 1 1 1
U = × u(150) + × u(50) < u × 150 + × 50 = u(100),
2 2 2 2
onde o sinal de desigualdade estrita é válido quando a função u for estritamente côncava. Nesse
caso, dizemos que o indivı́duo é avesso ao risco, já que ele prefere o valor esperado da aposta
a participar dela. O indivı́duo avesso ao risco não participa então de nenhuma aposta cujo valor
esperado seja zero. A figura abaixo ilustra essa situação.
u
6
B
s
u(150) u(w)
D
u(100) s
1
+ 21 u(150) s
2 u(50)
C
A
s
u(50)
-
R$ 50 R$ 100 R$ 150
w
Se o indivı́duo for avesso (neutro, amante) ao risco para toda loteria não-degenerada g, então
dizemos que esse indivı́duo é avesso (neutro, amante) ao risco.
Exemplo: Seguros. Todo indivı́duo avesso ao risco escolherá assegurar totalmente os seus ativos,
se o preço do seguro for atuarialmente justo, isto é, tal que o seu preço seja igual à perda esperada.
Sejam:
• w0 : riqueza inicial;
Dois conceitos importantes para a teoria de escolha sob incerteza são os de equivalente de certeza
e prêmio ao risco associados a uma determinada loteria. O equivalente de certeza de uma loteria é
a quantidade de dinheiro dado com certeza ao indivı́duo que o faz indiferente à loteria. O prêmio
ao risco de uma loteria é o montante de dinheiro que retirado do valor esperado da loteria, torna
o indivı́duo indiferente à loteria. Observe que estes dois conceitos estão sempre associados a uma
determinada loteria.
Aversão ao risco, conforme definida acima, é equivalente a três outras definições. Primeiro,
um indivı́duo é averso ao risco se, e somente se, a função u é estritamente côncava. Segundo, um
indivı́duo é averso ao risco se, e somente se, o equivalente de certeza de toda loteria não-degenerada
é menor do que o o valor esperado da loteria. Terceiro, um indivı́duo é averso ao risco se, e somente
se, o prêmio ao risco de toda loteria não-degenerada é negativo. O teorema abaixo resume essas
equivalências.
Os teoremas acima mostram que o comportamento do indivı́duo com relação ao risco está
ligado à curvatura da função u. Se a função u for estritamente côncava, o indivı́duo será averso
ao risco. É de se esperar que a concavidade de u, medida pela segunda derivada de u, seja usada
para medir o grau de aversão ao risco de um indivı́duo. Porém, não é adequado utilizar u00 como
medida de aversão ao risco, já que uma transformação linear crescente v = a + bu, com b > 0,
continua representando o mesmo indivı́duo. Neste caso, v 00 = bu00 também seria uma medida do
grau de aversão ao risco deste indivı́duo e, portanto, terı́amos diversos valores possı́veis como grau
de aversão ao risco do indivı́duo.
u00 (w)
Ra (w) = − .
u0 (w)
wu00 (w)
Rr (w) = − .
u0 (w)
As duas definições usam a segunda derivada de u para definir o grau de aversão ao risco de
um indivı́duo. Essas medidas são locais, ou seja, calculadas em um ponto do nı́vel de renda.
Observe que essas medidas não se alteram caso representemos o indivı́duo por outra função v tal
que v = a + bu, com b > 0.
Exemplo: CARA constante. Considere a utilidade u(w) = −e−αw . Para essa utilidade,
Ra (w) = α, para todo w.
w1−ρ
Exemplo: CARR constante. Considere a utilidade u(w) = 1−ρ
. Para essa utilidade, Rr (w) =
ρ, para todo w.
Resultado: CARA e Prêmio ao Risco. Quanto maior o coeficiente de aversão ao risco absoluto,
maior (menor) o prêmio ao risco (equivalente de certeza) associado a alguma loteria qualquer.
Resultado: CARR e Prêmio ao Risco. Se o CARA for crescente, então CARR será crescente.
Exemplo: Escolha de Portfolio. Considere um investidor com riqueza inicial w0 , que pode
investir o montante β em um ativo com risco, cujo retorno pode ser ri no estado i, i = 1, . . . , n,
que pode ocorrer com probabilidade pi . A riqueza do investidor caso o estado i ocorra será wi =
(w0 − β) + β(1 + ri ) = w + βri . O problema de um investidor é maximizar sua utilidade esperada
da riqueza final:
X n
max pi u(w0 + βri ) (1)
0≤β≤w0
i=1
Vamos analisar primeiro o caso em que β = 0, ou seja, nada é investido no ativo arriscado. A
derivada da função objetivo calculada em β̂ = 0 é:
n
X n
X
fCP O (β̂) = pi u0 (w0 + β̂ri )ri = u0 (w0 ) pi ri = u0 (w0 )Er
i=1 i=1
Para que a solução seja β = 0, a derivada acima tem que ser não-positiva, ou seja, Er ≤ 0, pois
u0 é positivo. Logo, obtivemos o seguinte resultado:
Todo investidor avesso ao risco sempre investirá algum valor positivo em um ativo
arriscado cujo retorno médio seja maior do que o retorno do ativo sem risco, indepen-
dentemente do grau risco do ativo arriscado (Arrow, 1967).
2 Paradoxos e Extensões
2.1 Paradoxo de Allais
Logo, g1 denota a loteria que paga R$ 500.000 com certeza e g10 denota a loteria que paga
R$ 2.500.000 com 10% de probabilidade, R$ 500.000 com 89% de probabilidade e R$ 0 com 1%
de probabilidade. Já g2 denota a loteria que paga R$ 500.000 com 11% de probabilidade e R$ 0
com 89% de probabilidade e g20 denota a loteria que paga R$ 2.500.000 com 10% de probabilidade
e R$ 0 com 90% de probabilidade. As seguintes escolhas são apresentadas:
Escolha 1: g1 vs g10
Escolha 2: g2 vs g20
Um padrão comum observado de escolhas é g1 g10 e g20 g2 . Vamos mostrar que essas
escolhas são inconsistentes com os axiomas da utilidade esperada. Se g1 g10 , então usando o
conceito de utilidade esperada, temos que:
onde simplificamos a notação cortando três zeros dos prêmios positivos. Agora, se g20 g2 , então
usando o conceito de utilidade esperada, temos que:
ou seja, que g10 g1 . Isso significa que as escolhas g20 g2 e g1 g10 são inconsistentes para um
indivı́duo maximizador de utilidade esperada. Esse resultado é conhecido como paradoxo de Allais.
Existe uma distinção entre risco e ambiguidade (incerteza ou incerteza Knightiana): a maioria
dos eventos incertos não possui (ou não é conhecida) uma distribuição objetiva de probabilidade
caracterizando essa incerteza.
Knight distingue risco de incerteza:
• Incerteza refere-se à situação onde nenhuma (ou pouca) inferência estatı́stica pode ser feita
sobre o futuro.
Vamos descrever o paradoxo de Ellsberg. Considere duas urnas, cada uma com cem bolas, onde
a Urna I contém 50 bolas pretas e 50 bolas brancas e a Urna II contém 100 bolas pretas ou brancas,
sem que se saiba o número de bolas pretas e de bolas brancas.
B B
B
B
~
~
B
B ~~~
B
B
B
B
~ ~ ~
B
B
B ~
~
B
B
?
B
B ~ B
B
B
B ~ ~ B
B
B
Urna I Urna II
100 Bolas 100 Bolas
50 Bolas Pretas ? Bolas Pretas
50 Bolas Brancas ? Bolas Brancas
Logo pII (preta) + pII (branca) < pI (preta) + pI (branca) = 1. Esse comportamento viola a
propriedade de coerência. Os modelos tradicionais de escolha excluem escolhas desse tipo.
Os desvios em escolhas nos modelos de utilidade esperada e utilidade esperada subjetiva levaram
a uma pesquisa com o objetivo de descrever o comportamento de decisão individual usando exper-
imentos. As duas conclusões principais dessa linha de pesquisa são que: 1) o comportamento sob
ambiguidade não necessariamente se reduz ao comportamento sob risco,e 2) incerteza, seja qual for
a forma, não entra de forma linear na função de utilidade.
Se probabilidades não entram linearmente na função de utilidade, então como se dá o processo de
escolha individual sob risco e sob incerteza? Vários estudos sugerem que certeza e impossibilidade
são pontos de referência no processo de escolha individual. Mudanças próximas a esses pontos são
percebidas de forma mais forte do que mudanças em valores intermediários. Essa “sensibilidade
decrescente” a partir desses pontos de referência tem sido amplamente confirmada por diversos
estudos, tanto para escolhas com ganhos como para escolhas com perdas.
Novos modelos de utilidade, tais como Choquet Expected Utility (CEU),Multiple-Priors Ex-
pected Utility (MEU), Cumulative Prospect Theory (CPT), etc, incorporam essas distorções em
probabilidades por meio de uma função de probabilidade.
Nos modelos CEU e CPT, a distorção ocorre na função de distribuição acumulada, e não nas
probabilidades diretamente. Nesse caso, o peso de um resultado depende da ordem desse resultado
no espaço de escolha do indivı́duo. Modelos deste são capazes de descrever comportamentos tı́picos
do paradoxo de Allais e do paradoxo de Ellsberg.
Leitura Recomendada
Exercı́cios
1. Considere as loterias g = (0,50 ◦ 100; 0,50 ◦ 1000) e h = (0,20 ◦ 100; 0,30 ◦ 25; 0,50 ◦ 16). Calcule
a utilidade esperada, o equivalente de certeza, o prêmio de risco dessas duas loterias para os
casos abaixo:
√
a) u(w) = w, w0 = 100.
√
b) u(w) = w, w0 = 50.
c) u(w) = w, w0 = 100.
d) u(w) = w, w0 = 50.
e) u(w) = w2 , w0 = 100.
f) u(w) = w2 , w0 = 50.
2. Considere as loterias g = (0,60 ◦ 10.000; 0,40 ◦ 1.000) e h = (0,50 ◦ 10.000; 0,50 ◦ 2.800). Se um
consumidor está indiferente entre estas duas loterias, então pode-se afirmar que ele é neutro
ao risco. Verdadeiro ou falso? Justifique.
4. (A07) Um indivı́duo tem uma riqueza não nula e sua função de utilidade von-Neumann-
Morgenstern é dada por u(x) = K − a/x, em que a e K são constantes positivas e x >
a/K. Este indivı́duo é convidado a participar de uma loteria que triplica sua riqueza com
probabilidade p e a reduz à terça parte com probabilidade 1−p. Qual deve ser o valor mı́nimo
de p para que o indivı́duo aceite participar da loteria?
5. (A96) Quais das funções abaixo têm as propriedades de utilidade esperada? Justifique a sua
resposta.
6. (A09) Um indivı́duo possui uma função de utilidade dada por U = 1 − (1/w), em que w
denota o valor presente lı́quido da sua renda futura. No momento, ele está contemplando
duas opções de carreira profissional. A primeira opção dará a ele uma renda certa de w = 5.
A outra alternativa dará w = 400, com 1% de chance, e w = 4 com 99% de chance. Responda
às seguintes questões:
MICROECONOMIA 2 – GRADUAÇÃO
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 5 – Teoria dos Jogos
Prof. José Guilherme de Lara Resende
1 Introdução
1.1 Interdependência Estratégica
A teoria dos jogos permite modelar comportamentos estratégicos dos agentes econômicos. É
o instrumento adequado quando existe interdependência estratégica entre os agentes do modelo
analisado.
No modelo de consumo usual, o consumidor decide entre possı́veis cestas de bens, dados os
preços e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a
sua tecnologia de produção e dados os preços dos insumos e dos bens que vende. No modelo de
equilı́brio geral competitivo, tanto os consumidores quanto as firmas tomam os preços como dados
e não há interação estratégica entre os agentes econômicos.
Porém, existem situações onde os resultados das ações de um agente dependem diretamente
do comportamento de outros agentes. Nestes casos, assumimos que o payoff (bem-estar) do agente
depende não só da sua ação, mas da ação de outros agentes. Modelos de oligopólio são um exemplo,
em que o lucro de determinada firma depende do que suas rivais fazem.
Um jogo então caracteriza qualquer situação desse tipo, em que cada participante deve levar em
conta a estratégia dos outros jogadores envolvidos antes de escolher o melhor para si. O objetivo
da teoria dos jogos é determinar o resultado de um jogo. Cada método de análise resulta em um
conceito de solução particular, chamado equilı́brio.
A maioria dos conceitos tem sua origem no conceito de equilı́brio de Nash e são, usualmente,
equilı́brios de Nash que satisfazem certas propriedades. Por isso, são chamados refinamentos.
Cada refinamento tenta solucionar alguma deficiência do conceito de equilı́brio de Nash particular
a alguma situação ou modelo.
Definição (informal): Jogo. Um jogo refere-se a qualquer situação envolvendo dois ou mais
agentes, chamados jogadores, onde exista interdependência estratégica.
Vamos estudar jogos não-cooperativos: analisamos cada agente separadamente e não como um
grupo. Essa definição não implica que um jogador não possa cooperar com o outro, ela é apenas
de cunho metodológico, onde cada agente é visto como uma entidade separada, autônoma, e não
há grupos de agentes se comportando como um único agente.
• Os jogadores,
• A regra do jogo,
1. Os jogadores são racionais. As ações de um jogador são consistentes com o objetivo desejado:
maximizar o seu payoff.
2. Os jogadores são inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e con-
seguem fazer as mesmas inferências que realizamos sobre a situação em que se encontram.
A segunda hipótese não é tão inócua quanto parece. Na teoria de equilı́brio geral os indivı́duos
são racionais, mas não é necessário que sejam inteligentes no sentido acima: os agentes econômicos
não precisam conhecer toda a estrutura de teoria de equilı́brio geral ao tomarem suas decisões.
As duas formas mais comuns de se representar um jogo são:
Existe uma correspondência entre essas duas formas, que veremos mais a frente. Vimos que o
princı́pio básico de eficiência usado em economia é o critério de Pareto. Dizemos que o resultado
A do jogo é Pareto-dominado pelo resultado B se nenhum agente ficar pior e pelo menos um ficar
melhor em B do que em A.
Definição: Um resultado de um jogo é Pareto ótimo (ou eficiente de Pareto) se não é Pareto-
dominado por nenhum outro resultado possı́vel para o jogo.
Uma hipótese usada em teoria dos jogos é a de conhecimento comum (“common knowledge”),
que assume que a racionalidade dos jogadores e a estrutura do jogo são de conhecimento comum
de todo jogador.
Se considerarmos dois jogadores, um determinado fato é de conhecimento comum dos jogadores
se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1
sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe
que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo raciocı́nio
valendo para o jogador 2.
Essa hipótese é fundamental para a validade de certos procedimentos, tais como os procedi-
mentos de eliminação de estratégias dominadas. Mais ainda, ela é importante para o conceito de
equilı́brio de Nash (existem artigos que relaxam a hipótese de conhecimento comum, sob certas
condições).
Myerson argumenta que a hipótese de jogadores inteligentes implica supor que a estrutura do
jogo é de conhecimento comum desses jogadores. A formalização matemática dessa hipótese é
complicada. Aqui, vamos apenas assumir a sua validade. Vamos apenas ver um exemplo para
entender a importância dessa hipótese.
Myerson cita uma fábula que ilustra bem as implicações da hipótese. Em uma vila, existem
100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou
se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os
homens da vila, exceto ao seu marido. Essas tradições são de conhecimento comum de todos os
habitantes da vila.
Suponha que todas as esposas foram infiéis. Logo, cada homem sabia da infidelidade de todas
as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum
homem se lamentava. Numa certa noite, um visitante revelou a todos que pelo menos uma esposa
havia sido infiel. Qual foi o resultado dessa revelação?
O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de
número 100, todos se lamentaram. Tente entender porque a hipótese de conhecimento comum leva
a esse resultado. Para isso, é necessário compreender o que a informação do visitante adicionou ao
conhecimento dos homens da vila.
O raciocı́nio fica mais fácil de compreender se considerarmos primeiro o caso em que apenas
uma esposa traiu o marido. A informação nova que o visitante revelou foi informar a todos da vila
que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel
e apenas um homem, exatamente aquele cuja esposa havia sido infiel, não tinha conhecimento de
nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciência de que a sua esposa é que
fora infiel e se lamentaria na primeira noite depois da revelação do visitante, já que os costumes da
vila são de conhecimento comum de todos os seus habitantes.
Caso houvesse duas esposas infiéis, então 98 homens da vila saberiam que havia duas esposas
infiéis e 2 homens teriam conhecimento de apenas um caso de infidelidade, já que não saberiam
que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ninguém se lamentaria
o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda
noite, após observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que
têm conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam
conta de que foram traı́dos e se lamentariam. O raciocı́nio estende-se de modo análogo para o caso
de 100 esposas infiéis: no centésimo dia, todos os maridos se dariam conta de que foram traı́dos e
se lamentariam.
Definição: Jogo na Forma Estratégica (ou Forma Normal). Um jogo na forma estratégica
é uma coleção G = (Si , ui )Ii=1 , onde I é o número de jogadores, Si é o conjunto de estratégias
disponı́veis ao jogador i, para todo i ∈ I, e ui : Ik=1 Sk → R é a função de payoff (a utilidade)
Q
do jogador i, que depende das estratégias de todos os jogadores. Dizemos que um jogo na forma
normal é finito se o conjunto das estratégias Si é finito para todo i, i = 1, . . . , I.
Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de
uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam
simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00
ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve
este jogo.
1↓ / 2 → Cara Coroa
Cara −1, 1 1, −1
Coroa 1, −1 −1, 1
Notação: Vamos usar a seguinte convenção, corriqueira e adotada em diversos livros, para todos
os jogos representados na forma matricial: o primeiro elemento em cada célula da matriz é o payoff
do jogador 1 (“jogador-linha”) e o segundo elemento da célula é o payoff do jogador 2 (“jogador-
coluna”).
Para o jogo do Exemplo 1, temos que:
Jogadores: I = {1, 2};
Estratégias: S1 = S2 = {Cara, Coroa};
Payoffs: u1 (Cara,Coroa) = u1 (Coroa,Cara) = 1;
u1 (Cara,Cara) = u1 (Coroa,Coroa) = −1;
u2 (s1 , s2 ) = −u1 (s1 , s2 ), ∀(s1 , s2 ) ∈ S1 × S2 .
No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo imprevisı́vel. Logo,
quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja
escolher de modo aleatório ou de modo que o seu rival não saiba exatamente qual o lado da moeda
será escolhido.
Observe que esse é um jogo de soma zero: o ganho de um jogador é igual à perda do outro
jogador. Para jogos de soma zero com dois jogadores, os conceitos de solução usados podem envolver
os jogadores randomizarem suas estratégias. Esse tipo de jogo foi extensivamente estudado por von
Neuman e Morgenstern, no livro “theory of games and economic behavior ”, publicado em 1944 e
um marco da teoria dos jogos.
Um tipo de jogo mais geral do que os de soma zero são os jogos de soma fixa (dos payoffs),
também chamados jogos estritamente competitivos. Em um jogo de soma fixa, a soma dos payoffs
para cada resultado do jogo tem sempre o mesmo valor. Se o valor for zero, então o jogo é de soma
zero. Logo, jogos de soma zero são um tipo de jogos de soma fixa.
Em um jogo de soma fixa, um jogador só aumenta o seu payoff se o payoff do outro jogador
se reduzir pelo valor desse aumento. Então qualquer resultado deste jogo é Pareto eficiente, pois
aumentar o payoff de um jogador necessariamente implica diminuir o payoff do outro jogador. Esse
tipo de jogo é adequado para modelar situações em que se tem um “vencedor” e um “perdedor”.
Por exemplo, podemos modelar um jogo de xadrez como um jogo de soma zero: se um jogador
ganhar, ele obtém o payoff +1, enquanto o perdedor obtém o payoff −1. Se o jogo empatar, cada
jogador obtém payoff 0. Evidentemente, muitos dos jogos analisados em economia não são de soma
fixa (ou seja, podemos dizer que são de soma variável ), como é o caso dos Exemplos 2 e 3 a seguir.
Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estão sendo
interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receberão
uma pena de 3 anos na cadeia. Se ambos não confessarem o crime, a pena será de apenas dois
anos, por falta de evidência. Porém, o promotor pode fazer uma acordo com um deles, dando uma
pena de apenas um ano na prisão para quem confessar e, para quem não confessar, de cinco anos
na prisão, por não ter colaborado com a justiça. A matriz abaixo descreve este jogo.
Exemplo 3: Problema de Coordenação. Suponha que duas pessoas estão viajando separada-
mente para o Rio de Janeiro e combinaram de se encontrar para almoçar no dia seguinte. Porém
esqueceram de marcar o restaurante e não estão conseguindo se comunicar. Eles costumam almoçar
sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almoço no
restaurante da barra é mais agradável do que o almoço no restaurante do centro. Porém, eles se
desencontrarem é a pior situação possı́vel. A matriz abaixo descreve este jogo.
1↓ / 2 → Barra Centro
Barra 3, 3 0, 0
Centro 0, 0 1, 1
Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo à tarde.
Concordaram com duas opções: ir a um jogo de futebol ou fazer compras. Os dois preferem estar
juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir às compras.
A matriz abaixo descreve este jogo.
Nas definições a seguir vamos denotar por si uma estratégia qualquer de um jogador i arbitrário
e por Si o conjunto de todas as estratégias disponı́veis para o jogador i. Além disso, s−i denota
um grupo de estratégias para os outros jogadores que não o jogador i (ou seja, s−i especifica uma
estratégia para cada um dos rivais do jogador i) e S−i denota o conjunto de todas as estratégias
disponı́veis para os outros jogadores que não o jogador i.
Logo, uma estratégia ŝi é estritamente dominante para o jogador i se ela for a única estratégia
que maximiza o payoff desse jogador, quaisquer que sejam as estratégias escolhidas pelos outros
jogadores.
Para o jogo dilema dos prisioneiros, é fácil verificar que Confessar é uma estratégia estritamente
dominante para os dois prisioneiros. Ela é a estratégia que gera o maior payoff para cada prisioneiro,
qualquer que seja a escolha do outro prisioneiro. Dizemos que (C, C) é um equilı́brio em estratégias
estritamamente dominantes.
Observe que o equilı́brio (C, C) é Pareto dominado pelo conjunto de estratégias (N C, N C), ou
seja, cada jogador obtém um payoff maior em (N C, N C) do que em (C, C). Temos, então, um caso
onde o comportamento individual maximizador dos agentes envolvidos resulta em um equilı́brio
Pareto ineficiente. Logo, na presença de interdependência estratégica, a interação de jogadores
cujo objetivo é maximizar o seu próprio bem-estar pode levar a situações Pareto-ineficientes.
Estratégias estritamente dominantes não são comuns. É comum situações onde não existem
estratégias dominantes para nenhum dos jogadores, como o Exemplo 5 a seguir ilustra.
Exemplo 5: Observe que o jogo a seguir não possui nenhuma estratégia estritamente dominante:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
D 4, 3 3, 2 6, 5
Apesar de estratégias estritamente dominantes serem raras, podemos usar um conceito similar,
de estratégia estritamente dominada, para eliminarmos estratégias que nunca devem ser escolhidas
por qualquer jogador.
Definição: Estratégia Estritamente Dominada. Uma estratégia s̄i é estritamente (ou forte-
mente) dominada para o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que:
Observe que uma estratégia estritamente dominante domina estritamente todas as outras es-
tratégias do jogador. Logo, todas as outras estratégias são estritamente dominadas pela estratégia
estritamente dominante.
Vamos analisar o jogo descrito no Exemplo 5 acima, dado por:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
D 4, 3 3, 2 6, 5
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2
C 1, 4 3, 2 8, 1
Para esse jogo reduzido, a estratégia M domina estritamente R, para o jogador 2. Eliminando
a estratégia R, obtemos:
1↓ / 2 → L M
U 5, 2 4, 3
C 1, 4 3, 2
Já para este novo jogo reduzido, a estratégia U domina estritamente C, para o jogador 1.
Eliminando C, obtemos:
1↓ / 2 → L M
U 5, 2 4, 3
1↓ / 2 → L R
U 1, 1 0, 0
D 0, 0 0, 0
Para esse jogo, não existem nem estratégias estritamente dominantes nem estratégias estrita-
mente dominadas.
Podemos enfraquecer as definições de dominância estrita, relaxando a exigência de que o payoff
seja sempre estritamente maior nas definições acima, de modo a obter o seguinte conceito.
E D
C (2, 1) (3, 0)
M (4, 0) (2, 1)
B (4, 4) (3, 4)
É fácil observar que não existe estratégia fracamente dominante para ambos os jogadores (apenas
B é fracamente dominante para o jogador 1). Vamos introduzir o seguinte conceito para analisar
o jogo acima, um relaxamento da noção de estratégia estritamente dominada.
Definição: Estratégia Fracamente Dominada. Uma estratégia s̄i é fracamente dominada para
o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que:
com desigualdade estrita para pelo menos um s−i . Dizemos então que ŝi domina fracamente s̄i .
Portanto, a ordem de eliminação das estratégias fracamente dominadas pode afetar a solução
obtida. Esta é uma caracterı́stica ruim deste procedimento, pois a solução do jogo pode mudar
conforme a ordem de eliminação das estratégias. Este problema não ocorre quando eliminamos
estratégias estritamente dominadas.
O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jo-
gadores e da estrutura do jogo. Porém, esses procedimentos não esgotam toda a força dessa
hipótese. Usando a hipótese de conhecimento comum, podemos eliminar outras estratégias além
das dominadas.
Definição: Melhor Resposta. A estratégia ŝi é a melhor resposta do jogador i à estratégia ŝ−i
dos outros jogadores se:
Portanto, a estratégia ŝi é a melhor resposta do jogador i para a estratégia ŝ−i dos outros jo-
gadores se ela for a ou uma das escolhas ótimas de i quando ele acreditar que os outros jogadores
irão selecionar a estratégia ŝ−i . Um jogador não deve escolher uma estratégia que nunca é uma
melhor resposta, pois neste caso não existe justificativa para o uso dessa estratégia. Observe que
estratégias estritamente dominadas nunca são a melhor resposta. Podemos montar um procedi-
mento de eliminação de estratégias que nunca são a melhor resposta, de modo similar ao PEEED.
Para justificar o uso deste procedimento, devemos mais uma vez supor a validade da hipótese de
conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.
Uma estratégia racionalizável pode sempre ser “justificada”, ou seja, o jogador pode justificar a
escolha dessa estratégia com uma conjectura razoável sobre o comportamento dos outros jogadores
(nenhum rival escolherá uma estratégia não racionalizável).
É possı́vel mostrar que as seguintes afirmações são verdadeiras:
• A ordem de remoção das estratégias que nunca são a melhor resposta não altera o resultado
obtido;
• Cada jogador tem pelo menos uma estratégia racionalizável, podendo ter mais de uma;
• Para jogos com dois jogadores, o conjunto de estratégias racionalizáveis é igual ao conjunto
de estratégias que sobrevivem ao PEEED.
Porém, o conceito de estratégia racionalizável nem sempre fornece uma solução. Para o Exemplo
3, a batalha dos sexos, todas as estratégias são racionalizáveis e, portanto, o conceito não informa
nada sobre o que esperar como solução deste jogo. Queremos tornar as predições sobre o resultado
de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir
veremos o conceito de equilı́brio de Nash (EN), que, satisfeitas certas condições, sempre aponta pelo
menos uma solução para qualquer jogo na forma estratégica. Esse é o mais importante conceito
em teoria dos jogos.
O simplex de Si , representado por ∆Si , é o conjunto das estratégias mistas do jogador i. Este
conjunto inclui também as estratégias puras do jogador (estratégias mistas degeneradas), já que se
σ(s̄i ) = 1 para alguma estratégia s̄i , então isso significa que s̄i é escolhida com probabilidade 1.
Se os jogadores randomizarem suas estratégias, então o resultado do jogo deixará de ser de-
terminı́stico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja
σ = (σ1 , σ2 ) uma coleção de estratégias mistas para os jogadores 1 e 2. A utilidade esperada
do jogador 1 (similar para 2) para o conjunto de estratégias mistas σ é calculada como:
X
u1 (σ1 , σ2 ) = [σ1 (s1 ) × σ2 (s2 )] × u1 (s1 , s2 )
s1 ∈S1 ,s2 ∈S2
Considere o jogo Cara e Coroa descrito no Exemplo 1 e as estratégias mistas σ1 = (1/4◦Ca, 3/4◦
Co) e σ2 = (2/3 ◦ Ca, 1/3 ◦ Co) para os jogadores 1 e 2, respectivamente. A utilidade esperada do
jogador 1 quando ele escolhe a estratégia σ1 e o jogador 2 escolhe a estratégia σ2 é:
X
u1 (σ1 , σ2 ) = σ1 (s1 ) × σ2 (s2 ) × u1 (s1 , s2 )
s1 ∈S1 ,s2 ∈S2
A definição acima de EN permite que os jogadores randomizem entre as estratégias puras. Logo,
eles podem não somente escolher uma estratégia pura, mas também escolher uma estratégia que
envolva várias estratégias puras, cada uma escolhida com determinada probabilidade. Observe que,
em equilı́brio, a hipótese de expectativas mutualmente corretas implica que cada jogador conhece
o modo em que os outros jogadores estão randomizando (as estratégias mistas escolhidas por seus
rivais).
Pela definição de EN com estratégias mistas, para cada conjunto de estratégias dos jogadores
candidato a equilı́brio, devemos verificar se para cada jogador, a sua estratégia é de fato a melhor
resposta para as estratégias dos outros jogadores que fazem parte do conjunto de estratégias can-
didatas a equilı́brio. Considerando que existem infinitas estratégias mistas, este procedimento de
cerificação para determinar EN é inviável. Como fazemos então para encontrar todos os equilı́brios
de Nash? O teorema abaixo fornece uma resposta.
Logo, σ1 = (1/2 ◦ Ca; 1/2 ◦ Co) e σ2 = (1/2 ◦ Ca; 1/2 ◦ Co) é um EN em estratégias mistas. Observe
que:
Teorema de Existência de Equilı́brio de Nash. Todo jogo finito na forma normal possui pelo
menos um equilı́brio de Nash, assumindo que os jogadores possam usar estratégias mistas.
O Teorema de Existência garante que para todo jogo na forma estratégica finito existirá pelo
menos um equilı́brio de Nash (EN). Logo o conceito de EN não é problemático no sentido que para
qualquer jogo finito podemos garantir que existirá uma solução para ele, se usarmos o conceito de
EN como solução para o problema de interdenpedência estratégica modelado no jogo.
A relação entre equilı́brio de Nash e os conceitos de equilı́brio com estratégias dominantes é
descrita pelos seguintes resultados:
1. Se existir equilı́brio em estratégias estritamente dominantes, ele será único e será o único EN
do jogo. O mesmo vale para equilı́brios obtidos com o PEEED: se existir, será único e o único
EN do jogo.
2. Se existir equilı́brio em estratégias fracamente dominantes, então ele será um EN. Neste
caso, pode ocorrer que exista outro EN, formado por estratégias fracamente dominadas. O
Exemplo 6 acima ilustra esse caso, em que (D, R) é um EN formado por estratégias fracamente
dominadas.
3. Vimos no Exemplo 5 acima que o PEEFD pode levar a diferentes resultados, dependendo da
ordem de eliminação adotada. De qualquer modo, se o PEEFD levar a algum resultado, ele
será um EN.
1↓ / 2 → L R
U 1, 1 0, 0
D 0, 0 0, 0
Esse jogo possui dois EN, dados por (U, L) e (D, R). Não existe equilı́brio em estratégias
estritamente mistas. O EN (U, L) é também equilı́brio em estratégias fracamente dominantes (e
pode ser obtido usando o PEEFD). O EN (D, R) é um equilı́brio formado por estratégias fracamente
dominadas e portanto não pode ser encontrado usando o PEEFD.
O Exemplo 6 acima mostra que podem existir equilı́brios de Nash formados por estratégias
fracamente dominadas. O resultado de um jogo ser desse tipo é algo estranho, pois envolve cada
jogador escolher uma estratégia para a qual existe outra opção que dará sempre um payoff maior
ou igual, independentemente do que os outros jogadores façam. Existe um refinamento do EN para
jogos na forma normal, chamado refinamento da mão-trêmula (Selten, 1975; Myerson, 1978), que
exclui a possibilidade desse tipo de equilı́brio ocorrer. O refinamento da mão-trêmula considera a
possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estratégia a
ser jogada. O EN então será chamado perfeito da mão-trêmula caso satisfaça a condição imposta
pelo refinamento. No exemplo acima, apenas o EN (U, L) é perfeito da mão-trêmula.
Refinamentos do conceito de EN são direcionados para eliminar EN que por algum motivo não
são considerados razoáveis. Nesse caso, existirá algum ou alguns EN que satisfazem o refinamento
e algum ou alguns que não o satisfazem.
Sabemos que para descrevermos um jogo são necessários três objetos: 1) os jogadores; 2) a regra
do jogo; e 3) o resultado (payoffs) do jogo. Um jogo na forma extensiva é a representação mais
adequada para situações dinâmicas.
No jogo à esquerda da figura acima, o jogador 2 observa se 1 escolhe E ou D, ou seja, cada nó
de decisão de 2 forma um conjunto de informação por si só. Já no jogo à direita da figura acima, o
jogador 2 não observa se 1 escolhe E ou D, ou seja, os dois nós de decisão de 2 formam um único
conjunto de informação.
Evidentemente, os nós de decisão que pertencem a um mesmo conjunto de informação devem
ser todos referentes ao mesmo jogador. Além disso, as ações que o jogador pode tomar em nós de
decisão que estão no mesmo conjunto de informação devem ser iguais. Caso isso não ocorresse e
existissem dois nós de decisão no mesmo conjunto de informação, com ações não exatamente iguais,
então o jogador seria capaz de inferir em que nó está, ao realizar que as ações disponı́veis naquele nó
são diferentes das ações do outro nó. Portanto, nós de decisão que pertencem a um mesmo conjunto
de informação pertencem ao mesmo jogador e possuem exatamente as mesmas ações disponı́veis.
Definição: Jogo de Memória Perfeita. Um jogo é de memória perfeita quando nenhum jogador
esquece o que já sabia (inclusive ações que já foram tomadas durante o desenrolar do jogo).
A árvore de jogo ilustrada na figura abaixo não apresenta memória perfeita. Neste exemplo, o
jogador 1, na terceira rodada, após a sua escolha na primeira rodada e após a escolha do jogador
2 na segunda rodada, não se lembra de sua própria escolha feita na primeira rodada.
1
t
HH
HH
E H D
HH
H
HH
t
jt
@ 2 H
@
@ @
a @b a @b
@ @
t Rt
@ t Rt
@
A
@
A 1 A
@
A
A A A A
l A r l A r l A r l A r
A A A A
AA
U
AAU AAU AAU
Finalmente, existe uma outra definição, jogo de informação completa, que se refere a jogos
em que os jogadores conhecem exatamente toda a estrutura do jogo, podendo ocorrer apenas que
não observem alguma tomada de decisão (ou seja, um jogo de informação completa pode ser de
informação imperfeita). Já em um jogo de informação incompleta, os jogadores podem não conhecer
alguma informação relevante sobre o tipo dos seus rivais, tais como as preferências, as estratégias
ou os payoffs dos outros jogadores. Um exemplo clássico de jogos de informação incompleta refere-
se a leilões. Em um leilão, cada participante não sabe qual é a valoração exata que os outros
participantes atribuem ao objeto leiloado.
Um jogo representado na forma normal pode ser representado na forma extensiva sem am-
biguidades? O contrário também é válido? Da forma extensiva para a forma normal sim, mas
o contrário não é válido. A mesma forma normal pode representar mais de um jogo na forma
extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representação na
forma normal, que se resume a representação de um jogo do tipo “Cara ou Coroa” discutido no
Exemplo 1. Nos dois jogos descritos na figura a seguir, o payoff na primeira linha é do jogador 1 e
na segunda linha, do jogador 2.
A forma normal é uma estrutura mais simples do que a forma extensiva. Ela envolve menos
objetos matemáticos do que a forma extensiva, porque a estratégia do jogador pode condensar
uma quantidade enorme de informação sobre a tomada de decisão do jogador. Logo, encontrar a
representação na forma normal do jogo analisado pode tornar mais fácil a determinação dos EN
de um jogo na forma sequencial. Para isso, temos que tornar claro em que consiste uma estratégia
para um jogo na forma extensiva.
A definição de estratégia para jogos simultâneos é simples e direta. No caso de jogos sequenciais,
a definição de estratégia é mais elaborada, já que nesses jogos, um determinado jogador pode ter
vários momentos de escolha de ações ao longo do jogo. Por exemplo, em xadrez, as jogadas dos
dois jogadores se alternam ao longo da partida.
Uma estratégia de um jogador para jogos sequenciais é uma regra que determina a escolha de
ação em todos os conjuntos de informação desse jogador no jogo. Logo, uma estratégia para o
jogador i é um plano contingente completo: uma regra de decisão que especifica como o jogador i
jogará em toda e qualquer circunstância do jogo em que ele possa vir a jogar. Isso significa que uma
estratégia define ações para todos os conjuntos de informação do jogo, mesmo que esses conjuntos
de informação não sejam alcançados durante o jogo.
1t
@
@
E @D
@
2 t @t 2
@
A A
A A
l A r f A g
A A
AA
AA
6 10 0 14
4 10 0 8
Como o jogador 1 só possui um conjunto de informação, dado pelo nó de decisão inicial, onde
as ações disponı́veis são E e D, então 1 possui apenas duas estratégias: E e D. Já o jogador 2
possui dois conjuntos de informação distintos: 1) o nó de decisão alcançado quando 1 escolhe E, que
vamos denotar por x1 , e onde 2 pode escolher as ações l ou r; e 2) o nó de decisão alcançado quando
1 escolhe D, que vamos denotar por x2 , e onde 2 pode escolher as ações f ou g. Portanto, uma
estratégia para o jogador 2 pode ser descrita como (l em x1 , g em x2 ), ou de modo mais simples,
(l, g). Essa estratégia significa que o jogador 2 escolhe l em x1 e g em x2 . Fica claro então que
uma estratégia define ações em todos os pontos do jogo. Isto pode parecer desnecessário à primeira
vista, mas para computarmos os EN, é importante que a estratégia seja completa nesse sentido.
Portanto, o conjunto das estratégias do jogador 2 é formado por (l, f ), (l, g), (r, f ), (r, g). Logo,
o jogador 2 possui 22 = 4 estratégias (2 é o número de ações em cada conjunto de informação, e 2
também é o número de conjuntos de informação do jogador 2).
Para determinarmos todos os equilı́brios de Nash em estratégias puras de um jogo na forma
sequencial, o ideal é encontramos a representação do jogo na forma normal. O primeiro passo para
isso é encontrar as estratégias de cada jogador.
No Exemplo 8 acima, vimos que o jogador 2 possui 4 estratégias e o jogador 1 possui 2 es-
tratégias. Obtemos então a seguinte matriz de dimensão 2 por 4 para a representação desse jogo
na forma normal:
Veremos agora que alguns tipos de jogos possuem uma dinâmica de ações escolhidas em tempos
diferentes de tal modo que representá-los na forma normal e daı́ encontrarmos os EN pode não ser
adequado, no sentido de que alguns destes EN não constituem solução razoável para a interação
estratégica modelada. Mais especificamente, quando derivamos a forma normal associada a um
jogo sequencial e encontrarmos os EN do jogo, alguns destes equilı́brios podem não ser crı́veis, ou
seja, baseados em ameaças de um dos jogadores que não será cumprida caso tivesse que de fato ser
levada a cabo. O exemplo a seguir ilustra esse problema.
Entrante
t
@
Não Entra @ Entra
@
@
Rt Monopolista
@
@
0 @
@
20 Briga @ Acomoda
@
@R
@
−5 10
−5 10
O segundo EN é baseado em uma ameaça vazia, não-crı́vel : M faz uma ameaça, que se for
levada a sério, não precisará ser cumprida, pois nesse caso E terá escolhido não entrar. Porém, se
E decidir entrar no mercado, o melhor para M será se acomodar. O refinamento de perfeição em
subjogos, que veremos a seguir, tenta eliminar EN baseados em ameaças não crı́veis, por não serem
uma solução razoável para a interação estratégica modelada.
A noção de Equilı́brio de Nash Perfeito em Subjogos (ENPS) é desenvolvida tanto para jogos
sequenciais de informação perfeita quanto de informação imperfeita.
A solução de indução reversa para jogos com informação perfeita se resume a que todos os
jogadores façam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na prática,
o jogo é resolvido do fim para o começo. O conjunto de estratégias puras s = (s1 , s2 , . . . , sI ) é um
conjunto de estratégias de indução reversa para um jogo na forma extensiva se tiver sido obtido de
acordo com o algoritmo de indução reversa. É possı́vel mostrar que todo conjunto de estratégias
de indução reversa é um EN do jogo.
Corolário. Todo jogo finito de informação perfeita tem (pelo menos) um EN em estratégias puras.
O algoritmo de indução reversa acima só se aplica para jogos de informação perfeita. Porém
a ideia de racionalidade sequencial pode ser usada também para jogos de informação incompleta,
por meio de um algoritmo similar de indução reversa.
A ideia central é definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser
visto como um jogo por si só. A propriedade de racionalidade sequencial exige que um EN seja EN
para cada subjogo do jogo original.
Todo jogo possui pelo menos um único subjogo, que seria o próprio jogo. Este é o caso do
exemplo abaixo. Um subjogo estrito de um jogo é um subjogo que está contido de modo estrito no
jogo, ou seja, é diferente (“menor”) que o jogo inteiro.
1
u
@
@
E @ D
@
u @u
@
A
2 A
A A
l A r l A r
A A
u Au u Au
A A
1 0 0 3
3 0 0 1
ENPS é um refinamento de EN: todo ENPS é um EN, já que o próprio jogo é um subjogo seu.
O contrário não é válido: existem EN que não são perfeitos em subjogos.
Teorema. Para todo jogo na forma extensiva finito de informação perfeita, o conjunto de es-
tratégias de indução reversa é igual ao conjunto de ENPS em estratégias puras.
Teorema: Existência de ENPS (Selten). Todo jogo na forma extensiva finito com memória
perfeita possui um ENPS.
O seguinte algoritmo geral de indução reversa para jogos na forma extensiva, sejam de in-
formação completa ou não, é válido para encontrar os ENPS:
1. Comece pelo término da árvore, determine os EN para todos os subjogos finais (subjogos que
não possuem nenhum subjogo estrito);
3. Repita os passos 1) e 2) para o jogo reduzido, continue até não restar nenhum subjogo;
4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um
EN).
Em um jogo do tipo dilema dos prisioneiros, seria possı́vel obter cooperação se repetı́ssemos o
jogo diversas vezes? Com a repetição, o número de estratégias de cada jogador aumenta. Nesse
caso, é possı́vel criar estratégias em que um jogador puna o seu rival caso ele não coopere.
Suponha que o jogador 1 adote a seguinte estratégia: na primeira interação ele joga N C (co-
operar). Nos perı́odos seguintes, se o outro jogador escolheu N C (cooperar) no perı́odo anterior,
ele coopera hoje. Caso contrário, o jogador 1 escolhe C (não cooperar) até o jogo terminar. Essa
estratégia pode levar a algum tipo de cooperação? Mais especificamente, existe algum equilı́brio
tal que os jogadores venham a adotar estratégias cooperativas? Para jogos do tipo dilema
dos prisioneiros repetidos finitas vezes, a resposta é negativa. Para jogos repetidos
indefinidamente ou sem data certa para terminarem, a resposta pode ser positiva.
A noção de ENPS tem como consequência que se o dilema dos prisioneiros for repetido um
número fixo (finito) de vezes, o único equilı́brio de Nash perfeito em subjogos será formado pelo
EN do jogo em cada perı́odo sendo jogado. Logo, não é possı́vel obter o resultado eficiente com a
repetição finita do jogo. Isso implica que qualquer dependência histórica nas estratégias atuais é
eliminada. Ou seja, tudo o que ocorreu antes é irrelevante para decidir o que fazer hoje. Para jogos
que satisfaçam as condições da proposição, um ENPS não depende da história ocorrida no jogo em
nenhum momento.
Por exemplo, uma consequência desse fato é que se o dilema dos prisioneiros for jogado repeti-
damente, por um perı́odo determinado, continua sempre tendo a mesma solução não cooperativa
entre os jogadores, para cada rodada do jogo. Esse resultado segue da hipótese de racionalidade
sequencial. Por indução reversa, na última rodada, é melhor não cooperar. Resolvendo de traz
para diante, obtemos não-cooperação para todas as rodadas do jogo.
Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de término conhecida
pelos jogadores. Resolvendo o jogo por indução reversa, cada jogador percebe que o seu rival
irá descumprir o acordo de cooperação na última vez que interagirem. Eles se adiantam a isso
e não cooperam na última rodada. Sabendo disso, os jogadores também não irão cooperar na
penúltima rodada do jogo. Usando esse argumento, obtemos que os jogadores não cooperam em
nenhuma rodada do jogo. Esse argumento, consequência da definição de ENPS, leva a resultados
considerados pouco razoáveis, como mostra o Exemplo 9 abaixo, em que o único ENPS consiste
nos dois jogadores escolherem P sempre, o que resulta no payoff (1, 1).
Is C II C
s
Is C II II
s C . . . . . . . . . . . . .s C
I
s C II
s C (100 100)
P P P P P P P
1 0 2 1 97 99 98
1 3 2 4 100 99 101
Para o jogo da centopeia, o único ENPS consiste em todo jogador escolher P em todo momento
do jogo. Portanto, o payoff de equilı́brio é 1 para cada jogador, e nenhuma cooperação é obtida.
Porém, se o dilema dos prisioneiros for repetido infinitamente (ou se não tiver uma data fixa
para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido
como equilı́brio, dependendo do quanto os jogadores descontem o futuro.
As estratégias que levam a esse tipo de equilı́brio são chamadas estratégias gatilho (trigger
ou Nash-reversion strategies). Um exemplo é a estratégia “olho-por-olho” (tit-for-tat), onde a
estratégia de hoje do jogador é igual à estratégia usada pelo seu adversário ontem.
Considere a seguinte estratégia para o i, i = 1, 2, chamada grim reaper (ou grim trigger ): na
primeira interação ele joga N C (cooperar). Nos perı́odos seguintes, se o outro jogador escolher
N C (cooperar) no perı́odo anterior, ele coopera hoje. Caso contrário, o jogador i escolhe C (não
cooperar) para sempre (note que a estratégia é extremamente punitiva: um desvio do rival e nunca
mais a cooperação pode ser refeita). Suponha que a taxa de desconto intertemporal é 0 < δ < 1.
Temos que o jogador 2 cooperará se:
∞ ∞
X
t
X −2 −3δ
−2δ ≥ −1 + −3δ t ⇒ ≥ −1 +
t=0 t=1
1−δ 1−δ
Logo, se:
1
= 50% , δ≥
2
então o resultado cooperativo ((N C, N C) todo perı́odo) é obtido como equilı́brio (é um equilı́brio
de Nash perfeito em subjogos).
Leitura Sugerida
Exercı́cios
2. Argumente, de maneira clara e concisa, porque a ordem de eliminação das estratégias não
afeta o resultado do PEEED mas pode afetar o resultado do PEEFD.
3. Vimos a definição de dominância para estratégias puras. Estratégias mistas podem também
dominar estratégias puras ou mesmo outras estratégias mistas. Considere o seguinte jogo e
responda os itens a seguir.
1/2 L M R
U 3,0 0,-3 0,-4
D 2,4 4,5 -1,8
4. Calcule os EN dos seguintes jogos e verifique se existe alguma relação desses equilı́brios com
equilı́brios obtidos por meio de algum argumento de dominância:
a)
1/2 L R
U 1,1 0,0
D 0,0 0,0
b)
1/2 L R
U 1,1 0,1
D 1,0 -1,-1
c)
1/2 L l m M
U 1,1 1,2 0,0 0,0
C 1,1 1,1 10,10 -10,-10
D 1,1 -10,-10 10,-10 1,-10
5. Paulo e Rafael querem dividir cem reais e decidem usar o seguinte jogo para isso. Paulo diz
quanto gostaria que Rafael recebesse. Sem observar a escolha de Paulo, Rafael diz quanto
seria uma oferta aceitável. As escolhas podem ser apenas em incrementos de R$ 25 (ou seja,
R$ 0, R$ 25, R$ 50, R$ 75 e R$ 100). Se a oferta de Paulo é igual ou maior do que o que Rafael
acha aceitável, então eles dividem o dinheiro seguindo a oferta de Paulo. Caso contrário, o
dinheiro é jogado fora. A utilidade de cada jogador é dada pelo tanto de dinheiro que ele
recebe.
a) Represente esse jogo na forma normal (ou seja, escreva esse jogo na forma matricial).
b) Quais são o(s) equilı́brio(s) de Nash em estratégias puras desse jogo?
6. Considere o seguinte jogo do tipo dilema dos prisioneiros representado pela matriz abaixo.
D C
D (R$1, R$1) (R$3, R$0)
C (R$0, R$3) (R$2, R$2)
a) Suponha que cada jogador deseja apenas obter o máximo de dinheiro possı́vel. Quais
são os EN desse jogo?
Suponha agora que os dois jogadores são altruı́stas, ou seja, cada um deles se importa com o
bem-estar do rival. Em particular, se mi (s1 , s2 ) é o payoff que o jogador i ganha e mj (s1 , s2 )
é o payoff do jogador j, quando a estratégia jogada é (s1 , s2 ), então a utilidade do jogador i
é dada por ui (s1 , s2 ) = mi (s1 , s2 ) + αmj (s1 , s2 ), onde α ≥ 0.
b) Escreva o jogo em forma matricial para α = 1. Qual o EN agora? O jogo continua sendo
do tipo dilema dos prisioneiros?
c) Para quais valores de α o jogo permanece como dilema dos prisioneiros? Para os valores
de α para os quais o jogo não é mais um dilema dos prisioneiros, encontre os EN.
d) Existe algum valor de α para o qual qualquer combinação de estratégias puras será um
equilı́brio?
7. Considere o jogo denotado por G(n, k) de adivinhar a média (“guessing the average”, Osborne
e Rubinstein), onde k é a quantidade de participantes que simultanemente escolhe um número
inteiro entre 1 e n (inclusive 1 e n). Um prêmio de R$60 é dividido igualmente entre os
jogadores que escolheram o número mais perto da metade da média de todas as escolhas (ou
seja, se a metade da média foi 3, e os número mais próximos foram 2 e 4, os participantes
que escolheram esses valores dividem o prêmio. Já se a metade da média foi 3,3, todos os
participantes que escolheram 3 levam o prêmio)
a) Escreva a forma normal do jogo G(3, 2) e ache todos os EN.
b) Argumente que para quaisquer n e k, todo mundo escolhendo 1 é um EN.
c) Argumente que em qualquer EN o prêmio é dividido por todos os participantes.
d) Argumente que o conjunto de estratégias descrito no item b) é o único EN.
8. O exército de Patópolis deve decidir se ataca ou não o exército de Gansópolis, que está
ocupando uma ilha que pertencia à Patópolis, situada entre as duas cidades. No caso de
um ataque, o exército de Gansópolis pode lutar ou recuar de volta à sua cidade, por meio
de uma ponte que liga a ilha à cidade. Cada cidade prefere ocupar a ilha a não ocupá-la, e
uma guerra é o pior resultado possı́vel para ambas as cidades. Modele essa situação como
um jogo na forma extensiva e mostre que o exército de Gansópolis pode melhorar seu payoff
se queimar a ponte que liga a ilha à sua cidade, eliminando a opção de recuar. Explique esse
resultado em termos intuitivos e relacione com o que foi visto em aula.
9. Considere o seguinte jogo na forma extensiva:
2 E 1t
2 @
@
M @D
@
t 2 @t
@
A A
A A
l A r l A r
A A
t AAt t AAt
3 1 0 0
1 0 0 1
a) Escreva o conjunto de estratégias desse jogo e encontre a forma estratégica associada.
b) Encontre os EN em estratégias puras.
c) Encontre os ENPS em estratégias puras.
10. (P4-2/18) Considere o jogo abaixo, em que o payoff na parte superior entre parênteses é do
jogador 1 e o payoff na parte inferior é do jogador 2. Reponda aos itens abaixo.
1 S
2
v -
@ 0
@
E @D
@
@
@
v
@Rv
@
@ 2 @
@ @
l m @r l m r
@ @
@
@ @
? @
R ? @
R
1 1 4 4 0 3
3 2 0 0 2 3
I
rH
HH
L
M HR
HH
r
II jr II
H
? H
H
@ 0 @
2
@ @
a b@ c @ d
@ @
@
@
R @Rr I
@
1 −1 −2 @
1 −1 4
@
P @Q
@
@
@
R
−1 −1
3 5
As ações do jogador I estão representadas por letras maiúsculas e as ações do jogador II por
letras minúsculas. O payoff na parte superior em parênteses é do jogador I e o payoff na parte
inferior é do jogador II.
a) Qual o número de estratégias puras do jogador 1? E do jogador 2?
b) Qual a representação desse jogo na forma normal?
c) Existe alguma estratégia dominada (estritamente ou fracamente) para algum dos jo-
gadores?
d) Quais são os equilı́brios de Nash (EN) em estratégias puras desse jogo?
e) Quais são os EN perfeito em subjogos (em estratégias puras)?
12. (P2-2/18) Considere o jogo na forma extensiva abaixo, em que o payoff descrito na parte de
cima do vetor de payoffs é o da firma entrante e o payoff na parte de baixo desse vetor é o da
firma monopolista.
Entrante
s
@
ñE @E
RsMonopolista
@
@
0 @
ñL @L
60
s Entrante @ Rs
@
A A
PE A GE PE A GE
A A
AU AU
8 15 −3 −12
30 15 0 −6
Jog. 1
v
@
@
A @ B
@
@
@
Jog. 2 v @vJog. 2
@
A A
A A
A A
F A D D A F
A A
A A
AAv v
Jog. 1
A
A
2 A A 0
A A
0 L A R L A R 1
A A
A A
3 0 3 1
10 1 0 1
MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 5 – Monopólio
Prof. José Guilherme de Lara Resende
1 Monopólio
1.1 Definição
Um monopólio caracteriza-se por uma estrutura de mercado onde existe apenas um produtor
e vendedor do bem ou serviço, que não tem substitutos próximos. Logo, a elasticidade-preço da
demanda desse bem deve ser pequena.
Deve haver alguma razão que justifique a não existência (ou entrada) de potenciais competidores.
Caso contrário, o monopólio não se sustentaria. Logo, deve existir algum impedimento à entrada de
novas firmas na indústria. Esses impedimentos são chamados barreiras à entrada. Alguns exemplos
de barreiras à entrada são:
1. Restrições legais (exemplo: EBCT);
2. Patentes;
3. Controle de recursos ou insumos escassos;
4. Barreiras geradas de forma deliberada pelo monopolista;
5. Custos irrecuperáveis altos (sunk costs, custos enterrados)
Tais barreiras podem manter rivais fora da indústria e assegurar que ela seja monopolı́stica.
Todavia, monopólios podem também ocorrer mesmo na ausência destas barreiras, caso uma única
firma possua vantagens de custo sobre as rivais. Dois exemplos disto são:
1. Economias de escala (monopólio natural),
2. Superioridade técnica.
p(q ∗ ) + q ∗ p0 (q ∗ ) = c0 (q ∗ ) (1)
| {z } | {z }
RM g CM g
pois p0 (q ∗ ) é negativo.
Para cada unidade a mais vendida, o monopolista recebe o preço do bem. Mas para vender mais
uma unidade, o monopolista deve baixar o preço de todas as unidades vendidas (termo q ∗ × p0 (q ∗ )).
Essa é a razão da ineficiência do monopólio. A Figura 1 ilustra essa situação, em que o custo
marginal se iguala à receita marginal do monopolita, mas em que esta última é menor do que o
preço cobrado pelo bem. Como a curva de demanda, que define o preço cobrado, mede a valoração
dos indivı́duos pelo bem, é maior do que o custo marginal de produção de uma unidade a mais do
bem, um mercado monopolista apresenta uma ineficiência econômica.
Custos,
Preços 6
c0 (q)
Q
SQ
S Q
S QQ
S Q
S Q
Q s
p(q ∗ ) S Q
S Q
Q
S Q
S Q
Q
S Q
Q
Ss
S
c0 (q ∗ ) Q
Q
S Q
Q
S Q
S QQ
S p(q)
S RM g(q)
S -
q∗ S Qtde
Sabemos que a elasticidade-preço da demanda, ε(q) = (p/q(p)) × (dq(p)/dp), mede como a sen-
sibilidade da demanda de mercado a uma mudança no preço do bem, em termos percentuais. O
Teorema da Função Inversa implica que 1/ε(q) = (q(p)/p)×(dp(q)/dq). Usando isso e o fato de que
ou seja, o monopolista escolhe produzir uma quantidade do bem na parte elástica da demanda de
mercado.
Podemos reescrever a CPO em termos da elasticidade-preço da demanda do bem como:
c0 (q ∗ )
p(q ∗ ) = h i = M c0 (q ∗ ) ,
1
1− |ε(q ∗ )|
Como o monopolista produz apenas na parte elástica da demanda, o markup é maior que 1. Se
a elasticidade-preço da demanda for constante, o valor do markup é constante, qualquer que seja o
nı́vel de produção. Se c0 (q) = c, para todo q, então p = M c > c.
Rearranjando mais uma vez a CPO de um monopolista em termos da elasticidade-preço da
demanda, obtemos:
p(q ∗ ) − c0 (q ∗ ) 1
∗
=
p(q ) |ε(q ∗ )|
A diferença, em termos percentuais, entre o preço cobrado e o custo marginal, chamado “ı́ndice
de Lerner”, é o inverso do valor absoluto da elasticidade da demanda calculada no ponto ótimo
de produção do monopolista. Logo, quanto menos elástica a demanda nesse ponto, maior essa
diferença percentual.
O lucro do monopolista é obtido substituindo a demanda ótima encontrada resolvendo o prob-
lema de maximização de lucro do monopólio. Logo, o lucro do monopólio é calculado como:
π = p (q ∗ ) × q ∗ − c(q ∗ ) ,
onde q ∗ é a quantidade ótima produzida pelo monopólio, p (q ∗ ) é o preço cobrado por unidade da
quantidade q ∗ produzida e c(q ∗ ) é o custo de produção de q ∗ .
A existência de um peso morto (“deadweight loss” – DWL) – um valor econômico que é dissipado
na economia, caracteriza uma situação de ineficiência econômica. Vimos que o preço cobrado pelo
monopolista é maior do que o custo marginal. Isso leva a uma situação de produção sub-ótima
no mercado: a firma produz menos do que o socialmente desejável. Ao fazer isso, o monopolista
cobra um preço maior do que o preço competitivo e aufere um lucro econômico positivo. Isso leva
à perda econômica descrita, ilustrada na Figura 2 abaixo.
Custos,
Preços 6
Q
SQ
S Q
S QQ
S Q c0 (q)
p(q ∗ ) Qs
S Q
S Q
Q
S Q
S DW LQ
S QQ
c0 (q ∗ ) Ss
S
Q
Q
S Q
Q
S Q
QQ
S
S p(q)
S -
0 q∗ S Qtde
O peso morto gerado por um monopólio é calculado como a área do excedente total (a soma
do excedente do consumidor com o excedente do produtor) dissipado na economia, ou seja, a área
com DWL escrito na Figura 3 acima. Em geral, essa área é calculada como:
Z qcp
DW L = (p(q) − c0 (q))dq ,
qm
Portanto, o monopólio é uma situação indesejável do ponto de vista social. O preço de monopólio
é superior ao custo marginal na quantidade ótima, logo o monopolista poderia obter lucro na
margem ao produzir mais uma unidade do bem caso ele pudesse cobrar um preço especı́fico por
esta unidade, superior ao seu custo marginal, e este item seria consumido por um consumidor
marginal.
O monopolista ao não fazer isso gera uma ineficiência, pois existem consumidores dispostos a
pagar pelo bem um preço maior que o seu custo de produção, mas, mesmo assim, este bem não é
produzido, pois se o monopolista produzir mais essa unidade, terá que baixar o preço de todas as
outras unidades vendidas.
Exemplo: Demanda Linear e RCE. Suponha que a demanda do bem seja dada por p = a − bq
e a função custo do monopolista seja c(q) = cq, onde c é uma constante, com a > c. O problema
do monopolista nesse caso é:
max (a − bq)q − cq
q≥0
Observe que no caso de demanda linear, em que a receita é R(q) = (a − bq)q, a receita marginal é
RM g(q) = a − 2bq, ou seja, a receita marginal também será linear, duas vezes mais inclinada do
que a curva de demanda. A CPO do problema do monopolista resulta na seguinte solução:
a−c a+c
q∗ = e p=
2b 2
Logo: −1
∂p(q ∗ )
1
= 1− > 1,
∂t |ε|
ou seja, o preço cobrado pelo monopolista aumenta em uma proporção maior do que o valor
do imposto.
• Suponha agora que o custo marginal é constante e a demanda de mercado é linear. Se o
governo estabelecer um imposto sobre a quantidade, temos que o novo preço cobrado pelo
monopolista será:
a+c+t
p(q ∗ ) =
2
Logo:
∂p(q ∗ ) 1
= < 1,
∂t 2
ou seja, o preço cobrado pelo monopolista aumenta em uma proporção menor do que o valor
do imposto (nesse caso, o preço aumenta a metade do aumento do imposto).
Um monopólio natural é caracterizado por uma curva de custo médio de longo prazo decrescente
para todos os nı́veis relevantes de produção. Ou seja, a tecnologia da firma apresenta retornos
crescentes de escala. Esta é uma importante falha de mercado observada em setores importantes,
tais como serviços de utilidades públicas.
Custos,
Preços 6
Dilema: apenas uma firma no mercado
minimiza o custo, mas nesse caso a firma
pode cobrar preço de monopólio
CM e
CM g
-
Qtde
Um monopólio natural permanente tem uma curva de custo médio de longo prazo que cai
continuamente à medida que aumenta a quantidade produzida. Mesmo que a demanda aumente,
ela continua cruzando a curva de custo médio em um trecho descendente. Um monopólio natural
temporário tem curva de custo médio descendente em um primeiro trecho, mas, a partir de certa
quantidade, o custo médio passa a ser constante ou crescente. A partir de uma demanda de certo
tamanho (reta D0 , na figura 4 abaixo), pode já ser possı́vel ter mais de uma firma produzindo e,
portanto, alguma competição no mercado.
Custos,
Preços 6
B B
B B
B B
B B
B B
B B
B B
B B
B B
B B CM e
BB BB
D D0 -
Qtde
Inovação tecnológica pode alterar o formato da curva de custo médio, deslocando-a para a
esquerda e fazendo com que atinja seu ponto de mı́nimo a quantidades menores. Logo, à escala
ótima de produção (ou escala eficiente), o ponto de mı́nimo da curva de custo médio total diminui
e passa a ser mais fácil haver competição neste setor.
Até agora, estamos supondo que o monopolista vende o bem pelo mesmo preço, qualquer que
seja o comprador e a quantidade comprada por ele. Porém, em muitas situações, o preço cobrado
pelo monopolista pode depender de quem compra e da quantidade comprada. Nesse caso, dizemos
que o monopolista está discriminando preços. Exemplos comuns são descontos por quantidade
comprada e cobrança diferenciada, dependendo do perfil do consumidor.
Vamos discutir três tipos de discriminação de preços:
Discriminação perfeita é rara quando não impossı́vel, devido a restrições legais e ao fato de que
o monopolista teria que ter informação sobre a valoração de cada consumidor, de modo a cobrar de
cada um o preço mais alto que está disposto a pagar. Uma forma de implementar um mecanismo
que tem efeito similar é a tarifa em duas partes (two-part tariff ). Ela consiste em o consumidor
pagar dois preços pelo bem. O primeiro é o preço de acesso ao mercado, que permite o consumidor
comprar o bem. O segundo é o preço por unidade comprada do bem. Se o monopolista cobrar o
primeiro preço igual ao excedente médio consumidor e o segundo igual ao custo marginal do bem,
então ele extrairá todo o excedente do consumidor (supondo que a valoração do bem é igual para
todo consumidor) e o resultado será similar ao obtido com a discriminação de primeiro grau.
Custos,
Preços 6
Q
Q
Q
Q
Q
Q Exemplo de Two-Part Tariff
Firma cobra valor para o acesso A e pcp por unidade consumida
A
Q
Q
Q
Q
Q s
pcp Q CM g
Q
Q
Q
Q
Q
Q
Q
Q
Q
Demanda
s
José Guilherme de Lara
0 Resende qcp7
-
Qtde Monopólio
Microeconomia 2 Nota de Aula 5
Exemplo – Mercado de Passagens Aéreas. Suponha que existam dois tipos de consumidores,
um chamado “executivo” e outro chamado “estudante”. O executivo viaja apenas durante a sem-
ana, entre segunda a sexta-feira. O estudante pode viajar em qualquer perı́odo da semana. Além
disso, o executivo possui maior poder aquisitivo do que o estudante. Companhias áreas podem
então oferecer descontos maiores para bilhetes que incluam o sábado entre o vôo de partida e vôo
de chegada. Com isso, a companhia tenta discriminar entre os dois tipos de clientes, cobrando mais
caro do cliente que pode e está disposto a pagar mais.
Se discriminação perfeita fosse possı́vel, a ineficiência do monopólio desapareceria. Neste caso,
ocorreria uma redistribuição de riqueza, com todo o excedente do consumidor sendo capturado
pela firma discriminadora de preços, o que pode não ser aceitável para a sociedade. No caso de
discriminação de preços de segundo e terceiro graus, pode ocorrer que a ineficiência diminua, mas
não desapareça, e de modo que parte do excedente do consumidor também seja apropriado pelo
monopolista.
Exemplo: Discriminação de Terceiro Grau. Suponha que existam dois tipos de consumidores,
cada tipo tem uma curva de demanda própria, p1 (q1 ) e p2 (q2 ) (suponha que os consumidores não
consigam revender o bem). O custo de produção da firma é dado por c(q1 + q2 ). O problema da
firma é:
max p1 (q1 )q1 + p2 (q2 )q2 − c(q1 + q2 )
q1 ,q2
ou seja, a receita marginal obtida no mercado de cada grupo deve ser igual ao custo marginal de
produção total. Reescrendo as receitas marginais dos dois mercados em termos de elasticidade-preço
da demanda, obtemos:
1 1
p1 (q1 ) 1 − = CM g(q1 + q2 ) = p2 (q2 ) 1 −
|ε1 (q1 )| |ε2 (q2 )|
Portanto, se p1 > p2 , então para que a igualdade acima entre as receitas marginais de mercados
diferentes seja igual devemos ter que:
1 1
1− <1− ⇒ |ε1 (q1 )| < |ε2 (q2 )|
|ε1 (q1 )| |ε2 (q2 )|
Portanto, o mercado que apresenta maior preço é o mercado com menor elasticidade-preço da
demanda (em valor absoluto).
Ou seja, a produção do bem final é o dobro agora. É possı́vel mostrar que mesmo considerando
funções de demanda, produção e custo mais gerais, o monopólio integrado irá produzir mais (e,
portanto, cobrar um preço menor) do que a situação com os dois monopólios, upstream e down-
stream, pois nesta situação ocorre um mark-up duplo, feito por cada um dos dois monopolistas,
enquanto com o monopólio integrado, ocorre apenas um único mark-up.
1.6 Monopsônio
Leitura Sugerida
MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 6 – Oligopólio
Prof. José Guilherme de Lara Resende
1 Oligopólio
1.1 Introdução
O oligopólio é uma estrutura industrial onde poucos produtores oferecem produtos homogêneos
a muitos compradores. É um tipo de estrutura industrial entre competição perfeita e monopólio.
Em um oligopólio, cada firma deve conhecer a demanda do mercado fazer conjeturas sobre as
ações das outras firmas do mercado, que afetam o seu bem-estar. Além disto, cada firma devm
saber como as suas ações afetam as outras firmas.
Portanto, esse é um problema de interdependência estratégica e, consequentemente, a ferramenta
fundamental que auxilia a análise deste tipo de problema é a teoria dos jogos.
Primeiro iremos analisar o caso de cartel (ou conluio), em que as firmas entram em acordo e
se comportam como um monopólio. Em seguida usaremos o conceito de equilı́brio de Nash para
analisar quatro modelos básicos de oligopólio, Cournot (1838), Bertrand (1883) (jogos simultâneos),
Stackelberg (1934) e liderança no preço.
Os modelos de Cournot e Bertrand tratam do mesmo problema e levam a conclusões bastante
distintas. Os dois modelos são estáticos, sem interação dinâmica. No modelo de Cournot, as firmas
escolhem a quantidade ótima a ser produzida. No modelo de Bertrand, as firmas escolhem o preço
ótimo a ser cobrado.
1.2 Cartel
Um possı́vel arranjo de mercado quando existem poucas firmas atuando é o equilı́brio de colusão.
Nesse equilı́brio, as firmas comportam-se como um único ente, maximizando a receita agregada,
que é repartida de algum modo pré-especificado. Essa é uma situação tı́pica de cartel (ou conluio).
O resultado principal de cartéis é a sua tendência à instabilidade: cada firma tem um incentivo
para burlar a regra de produção definida pelo cartel, de modo similar ao problema analisado no
Dilema dos Prisioneiros.
Exemplo com Duas Firmas. Suponha que existam 2 firmas, onde c1 (q1 ) é a função custo da
firma 1 e c2 (q2 ) é a função custo da firma 2. O problema do cartel é:
(q1 ) : p(q1∗ + q2∗ ) + (q1∗ + q2∗ )p0 (q1∗ + q2∗ ) = c01 (q1∗ )
(q2 ) : p(q1∗ + q2∗ ) + (q1∗ + q2∗ )p0 (q1∗ + q2∗ ) = c02 (q2∗ )
Portanto, na solução ótima temos que os custos marginais de cada firma são iguais, c01 (q1∗ ) =
c02 (q2∗ ). Se uma firma tiver alguma vantagem de custo (se, por exemplo, a curva de custo marginal
de uma das firmas estiver sempre abaixo da curva de custo marginal da concorrente), ela então
produzirá mais no equilı́brio de cartel. Como vale que:
∂π1 (q1∗ , q2∗ )
= p(q1∗ + q2∗ ) + q1∗ p0 (q1∗ + q2∗ ) − c01 (q1∗ ) ,
∂q1
a primeira CPO acima implica que:
∂π1 (q1∗ , q2∗ )
= −q2∗ p0 (q1∗ + q2∗ ) > 0 ,
∂q1
ou seja, em equilı́brio ocorrem incentivos para o desvio da solução de cartel para ambas as firmas
(o caso da firma 2 é análogo, e argumento semelhante vale para um cartel com J firmas).
Se repetirmos a interação entre as firmas em conluio por vários perı́odos, podemos ter dois
resultados:
1. Se a interação for finita e tiver data certa para acabar, o cartel não será estável.
2. Se a interação se repetir indefinidamente (infinitamente ou se não tiver data certa para
acabar), o equilı́brio de cartel poderá ser estável. Normalmente, ele será estável quando
as firmas participantes concordarem em uma punição para quem trair o acordo de cartel.
Suponha que um cartel de duas firmas se reune indefinidamente, onde cada firma produz metade
da quantidade de monopólio todo perı́odo. Suponha que a taxa de desconto intertemporal é deno-
tada por δ, com 0 < δ < 1.
A firma 1 impõe a seguinte regra à firma 2: se você cumprir o acordo do cartel hoje, eu cumprirei
o acordo do cartel amanhã. Porém, se você quebrar o acordo do cartel, eu produzirei para sempre
a quantidade de produção definida pelo equilı́brio de Cournot. Vimos que a estratégia acima,
no contexto da teoria dos jogos, é uma estratégia gatilho (“trigger strategy”), também chamada
estratégia de reversão a um EN (“Nash reversion strategy”), do tipo grim reaper.
Exemplo: Suponha que πc , πec e πd são os lucros da firma no caso de cartel, no caso de Cournot
(que será analisado mais à frente) e no caso de desvio, de modo que πd > πc > πec . Supondo que
as firmas escolham estratégias grim reaper, cada firma cumprirá o acordo do cartel se:
∞ ∞
X X πc δπec
δ t π c ≥ πd + δ t πec ⇒ > πd +
t=0 t=1
1−δ 1−δ
Logo, se
πd − π c
δ> ,
πd − πec
então o equilı́brio de cooperação do cartel será estável. Como a taxa de desconto intertemporal δ
é determinada pela taxa de juros r, do seguinte modo:
1
, δ=
1+r
então, se encontrarmos a taxa de desconto intertemporal, podemos também encontrar a taxa de
juros associada. Para o exemplo acima, obtemos que:
πc − πec
r< .
πd − πc
Suponha uma indústria com entrada bloqueada onde J firmas produzem um bem homogêneo,
todas com estrutura de custos denotada por cj (qj ). A demanda inversa do mercado é dada por
p = p(Q), onde Q = q1 + · · · + qJ é a produção total.
Encontramos a quantidade ótima produzida pela firma j, q̄j , resolvendo o problema de maxi-
mização de lucro dessa firma, tomando como dados as quantidades de produção ótimas das outras
firmas:
max p(Q)qj − cj (qj )
qj
Exemplo: Modelo Linear. Suponha uma indústria com entrada bloqueada onde J firmas
produzem um bem homogêneo, todas com estrutura de custos idêntica, dada por:
C(qj ) = cqj , c ≥ 0, j = 1, . . . , J .
onde a > 0, b > 0 e a > c. O lucro da firma j quando produz q j e as outras firmas produzem qi ,
i 6= j, é: !
J
X
πj (q1 , . . . , qJ ) = a − b qi qj − cqj
i=1
Queremos encontrar uma alocação q̄ = (q̄1 , . . . , q̄J ) tal que q̄j seja a solução do problema acima,
dado que as outras firma estão escolhendo q̄1 , . . . q̄j−1 , q̄j+1 , . . . q̄J . Chamamos essa alocação de um
equilı́brio de Cournot-Nash do problema de oligopólio caracterizado acima.
Encontramos q̄j resolvendo o problema da firma j, tomando como dados as quantidades de
produção ótimas das outras firmas:
J
! !
X X
max a − b q̄i qj − cqj = max a − bqj − b q̄i qj − cqj
qj qj
i=1 i6=j
A equação (1) é chamada curva de reação da firma j: ela diz qual o melhor nı́vel de produção a
ser escolhido pela firma j, dado que as outras firmas estão produzindo q̄i , i 6= j.
Dada a simetria do problema (a condição (1) acima vale para toda firma j), vamos procurar
por um equilı́brio simétrico, q̄1 = · · · = q̄J . Nesse caso, a condição (1) resulta em:
a−c
q̄ =
b(J + 1)
a−c (a − c)2
q̄j = , ∀j, e π̄j =
b(J + 1) b(J + 1)2
a−c a−c
q̄ s = J e p̄ = a − J
b(J + 1) J +1
a−c (a − c)2
q̄j = e π̄j =
3b 9b
a −c a + 2c
q̄ s = 2 e p̄ =
3b 3
A equação acima mostra que o preço cobrado é maior do que o preço de mercado em competição
perfeita e tende ao preço de competição perfeita quando o número de firmas aumenta. Portanto, o
resultado de competição pode ser visto como o limite do caso de um modelo competição a Cournot,
quando o número de firmas tende a infinito.
• O modelo de Cournot leva a uma alocação ineficiente, e quanto mais firmas no mercado,
menor a ineficiência e mais o equilı́brio se aproxima do equilı́brio competitivo.
Suponha que o custo marginal é constante, igual nas duas firmas. A função de lucro da firma
1 é:
π1 = (p1 − c) × q1 (p1 , p2 )
Observe que como a função de demanda de cada firma é descontı́nua, a função lucro de cada
firma também é descontı́nua.
• O modelo de Bertrand é um modelo que leva a um resultado extremo, mesmo que existam
apenas duas firmas no mercado: elas se comportam como firmas competitivas, sem tentar
manipular o mercado e cobrando preço igual ao custo marginal.
• Nesse caso não há ineficiência e nenhuma firma terá poder de mercado, mesmo que existam
apenas duas firmas no mercado. Por isso, esse modelo é visto com cautela, já que aparente-
mente não traz um resultado razoável.
No modelo de duopólio de Stackelberg (ou liderança na quantidade), uma das firmas, chamada
lı́der, escolhe a quantidade que vai produzir primeiro. A outra firma, chamada seguidora, observa
a escolha da firma lı́der e então escolhe a sua quantidade de produção.
Este modelo é útil em situações onde existe uma firma grande, que possui maior parcela do
mercado, e outras firmas menores, que gravitam em torno da firma maior e que tomam decisões
após a firma lı́der ditar o rumo da indústria.
Pode-se mostrar analiticamente que é melhor ser lı́der do que seguidora e que a firma lı́der
obtém um lucro maior do que se estivesse em uma situação de Cournot, onde todas as firmas são
iguais no sentido de tomarem suas decisões simultaneamente.
A firma lı́der incorpora no seu problema de maximização a curva de reação da firma seguidora.
Vamos supor que a firma 1 seja a firma lı́der e a firma 2, a seguidora. Logo, no modelo de
Stackelberg, a lı́der escolhe o nı́vel ótimo de produção incorporando a curva de reação da seguidora
em sua decisão de produção. No modelo de Cournot, a mesma firma escolhe o nı́vel ótimo de
produção, dado um ponto qualquer da curva de reação da outra firma. Portanto, o lucro da lı́der
será maior ou igual ao lucro que essa firma obteria em uma situação de competição a Cournot.
Exemplo: Caso Linear. Suponha que existam apenas duas firmas no mercado, onde a demanda
agregada inversa é p = a − bq e o custo de produção de cada firma é ci (qi ) = cqi , i = 1, 2. O nı́vel
ótimo de produção da firma seguidora é encontrado resolvendo-se o problema:
Vamos resolver o problema da firma lı́der (firma 1), que incorpora a curva de reação da firma
seguidora na sua decisão da quantidade ótima a produzir:
a − c q1
max a − b q1 + − q1 − cq1
q1 ≥0 2b 2
A CPO do problema da firma lı́der resulta na quantidade ótima de produção ql∗ = (a − c)/2b.
Substituindo esse valor na curva de reação da firma seguidora, encontramos a sua quantidade ótima,
qs = (a − c)/4b. Usamos as quantidades ótimas para calcular o preço de equilı́brio, via demanda
de mercado:
∗ a−c a−c a + 3c
p = a − b(ql + qs ) = a − b + =
2b 4b 4
(a − c)2 (a − c)2
πl (ql∗ ) = p∗ ql∗ − cql∗ = e πs (qs∗ ) = p∗ qs∗ − cqs∗ = .
8b 16b
Comparação dos Modelos Lineares:
Caso p ql πl qs πs
a+2c a−c (a−c)2 a−c (a−c)2
Cournot 3 3b 9b 3b 9b
a+3c (a−c) (a−c)2 (a−c) (a−c)2
Stackelberg 4 2b 8b 4b 16b
Bertrand c indefinido 0 indefinido 0
o que resulta na curva de oferta inversa p = cS (qS ), o que determina a sua curva de oferta, denotada
por q S (p).
A lı́der se defronta então com uma curva de demanda residual, denotada por qR (p), e dada
pela diferença da curva de demanda de mercado (qD (p)) com a oferta da firma seguidora, qR (p) =
qD (p) − qS (p). Portanto, a firma lı́der se comporta como um monopolista onde a demanda com a
qual se defronta é a demanda total de mercado menos a oferta da empresa seguidora:
A CPO deste problema determina a quantidade ofertada pela firma lı́der, qL∗ . Usando a demanda
residual, obtemos o preço de mercado. Finalmente, determinamos a quantidade produzida pela
firma seguidora usando a sua curva de oferta e o preço de mercado.
Leitura Sugerida
MICROECONOMIA 2
Departamento de Economia, Universidade de Brası́lia
Notas de Aula 8 – Teoria da Informação
Prof. José Guilherme de Lara Resende
1 Economia da Informação
1.1 Introdução
Os modelos que vimos até agora supõem informação perfeita. Por exemplo, os consumidores
possuem toda informação relevante sobre a qualidade dos produtos adquiridos. Já as firmas con-
hecem exatamente a produtividade de novos empregados.
Isso permite tratar os dois problemas, consumidor e firma, separadamente e depois unificar a
análise via preços que equilibram mercados. Modelos de equilı́brio geral supõem interações entre os
agentes bastante limitadas, que se dão apenas pelo sistema de preços. Isso gera vários problemas,
como, por exemplo, justificar a existência de firmas. Incluir incerteza nos modelos de equilı́brio
geral não resolve o problema, já que nesses modelos a incerteza é modelada de modo simétrico.
Problemas aparecem quando existe assimetria de informação.
Exemplos:
3. As restrições geradas pelo modelo são descritas por um contrato, garantido por uma terceira
parte;
Os modelos de informação privada podem ser classificados de diversas formas, e algumas dessas
classificações podem ser conflitantes. Vamos adotar a seguinte classificação, que segue Salanie,
quanto:
(a) Seleção adversa (ou “Screening”): uma parte é imperfeitamente informada sobre as
caracterı́sticas da outra parte. Parte desinformada move-se primeiro.
(b) Sinalização: uma parte é imperfeitamente informada sobre as caracterı́sticas da outra
parte. Parte informada move-se primeiro.
(c) Perigo Moral : uma parte é imperfeitamente informada sobre as ações da outra parte.
Parte desinformada move-se primeiro.
• First-Best: a solução do problema para o caso em que a informação é perfeita. Esse caso serve
de comparação para avaliar a perda de bem-estar causada pela assimetria informacional.
Um resultado pouco intuitivo que pode ocorrer em certas situações de perigo moral é o bem-estar
total associado à solução de Second-Best ser menor do que o bem-estar total associado à solução
de Third-Best (obviamente, considerando apenas o principal, o seu bem-estar no Second-Best será
maior ou igual ao seu bem-estar no Third-Best).
2 Seleção Adversa
2.1 Mercado de Carros Usados (Akerlof )
Vamos assumir um mercado de carros usados, com vários vendedores e compradores (Akerlof,
1970). Os carros podem ser de dois tipos: boa (P, peach) e má (L, lemon) qualidade. O proprietário
do carro (vendedor) sabe a qualidade do seu carro. Porém os compradores não sabem distinguir se
o carro é de boa ou de má qualidade.
Vamos usar a seguinte notação:
Se a informação for completa, ou seja, tanto o vendedor como o comprador souberem qual é o
tipo do carro, então CB será vendido por um preço PCB entre b e B e CR será vendido por um
preço pCR entre m e M .
O que ocorre se o vendedor souber a qualidade do carro, porém o comprador não observar a
qualidade? Agora teremos apenas um único preço p, pois não será possı́vel diferenciar os tipos de
carros. Note que os vendedores oferecem CB apenas se p > b. Logo:
2.2 Sinalização
Nos modelos de sinalização, o agente (vendedor do carro, no exemplo acima), de alguma maneira
crı́vel, comunica o seu tipo para o principal (o comprador, no exemplo acima).
Por exemplo, os vendedores de carros de boa qualidade podem oferecer uma garantia, de modo
a sinalizar que seu carro é bom. Neste caso, a sinalização serve para que estes vendedores se
diferenciem dos vendedores de carros de má qualidade e com isso o mercado funciona melhor.
Para que o sinal consiga de fato separar os dois tipos de carros, é importante que o custo
de fornecer garantia para carros de má qualidade seja maior do que para carros de boa qualidade
(“single-crossing property”, ou condição de Spence-Mirrless ou condição de separação – “sorting
condition”), de modo que não é viável para vendedores de carros de má qualidade fornecerem a
mesma garantia fornecida pelos vendedores de carros de boa qualidade.
Suponha que firmas querem contratar empregados, que podem ser de dois tipos: alta produ-
tividade (θH ) ou baixa produtividade (θL ). Vamos assumir que a proporção de tipos de baixa
produtividade na população é α.
Se a firma conseguisse observar o tipo do trabalhador, ela pagaria salários diferentes para tipos
diferentes, de modo que wh = θH e wL = θL . Porém a firma não consegue distinguir o tipo do
trabalhador. O trabalhador pode sinalizar o seu tipo à firma, por meio da quantidade de educação
adquirida. A utilidade do trabalhador do tipo θi , i = L, H, que estudou e anos e recebe salário w
é separável em w e e:
u(w) − c(e, θi )
Note que o modelo acima e suas suposições assumem duas hipóteses importantes em termos
intuitivos:
• Sinal não afeta produtividade (sinal puro),
• Tipos diferentes têm custos diferentes de adquirir o sinal (condição de Spence-Mirrless).
As hipóteses acima implicam que as curvas de indiferença são positivamente inclinadas, já que
educação gera desutilidade, e a curva de inidiferença do indivı́duo de baixa produtividade será
maior do que a do de alta produtividade, já que ∂c(·, θL )/∂e > ∂c(·, θH )/∂e (essa condição também
é chamada de single crossing condition pois implica que dadas duas curvas de indiferença quaisquer
dos dois tipos, elas s podem se cruzar no máximo uma vez). A Figura abaixo ilustra essas curvas
de indiferença.
uL
w
6
Direção na qual
a utilidade aumenta uH
@
I
@
@
-
Educação
Vamos assumir que o tipo θ do indivı́duo não é observável pela firma, mas que o nı́vel de
educação e obtido indivı́duo pode ser observádo pela firma.
Na solução de first-best, no caso em que a firma consegue observar o tipo do candidato, ela
pagaria wL = θL ao tipo de baixa produtividade e wH = θH ao tipo de alta produtividade. Além
disso, nenhum dos tipos adquiriria qualquer nı́vel de educação (educação é um sinal puro neste
modelo!).
uH (w = θH , e = 0)
w
6
θH
uL (w = θL , e = 0)
θL
-
Educação
Porém, caso o principal não consiga identificar os tipos, essa solução não se mantém, pois o tipo
θL tentaria se passar pelo tipo θH , para receber um salário maior. Vamos assumir que os indivı́duos
podem utilizar educação para sinalizar o seu tipo para a firma. Vamos continuar supondo que cada
trabalhador recebe um salário dado pela sua produtividade marginal, caso o seu tipo seja revelado
para a firma corretamente.
Definição: Sistema de Crenças. Denote por µ(e) a crença que a firma atribui a um candidato
com e anos de educação ser do tipo de baixa produtividade. Então a função µ define um sistema
de crenças para a firma, de tal modo que:
1. Cada candidato escolhe e já antecipando o salário de equilı́brio, de modo a maximizar o seu
bem-estar:
e∗i ∈ arg max u(w∗ (e)) − c(e, θi ) , para i = L, H .
e≥0
2. A firma define os salários w∗ de modo a maximizar o seu lucro esperado, dada a escolha dos
candidatos.
3. O sistema de crenças µ(e)∗ deve ser consistente com as estratégias e∗ , no seguinte sentido:
A definição de equilı́brio acima garante em 1) que cada candidato escolhe o seu nı́vel de educação
de modo a maximizar a sua utilidade, dada a polı́tica de salários da firma, em 2) que a firma
maximiza o seu lucro esperado, dada a escolha ótima de educação dos agente feitas em 1), e em
3) que o sistema de crençãs da firma é consistente no sentido de que se tipos distintos adquirirem
quantidades de educação distintas, então a firma irá identificar qual o tipo correto que adquiriu
cada nı́vel de educação. Ja se os doi tipos adquirirem o mesmo nı́vel de educação, então a firma
assume que está diante de um candidato de baixa produtividade com probabilidade α, que é a
proporção de candidatos de baixa produtividade na população de candidatos.
A definição acima deixa claro que existem dois tipos de equilı́brios:
No equilı́brio separador, o tipo θL não obtém qualquer educação e o tipo θH obtém uma quanti-
dade de educação suficiente para garantir que ele se diferencie do tipo θL . Para esse arranjo ser de
fato um equilı́brio, devemos ter que as seguintes restrições de compatibilidade de incentivo (RCI)
sejam satisfeitas:
A RCIL garante que o contrato ótimo seja desenhado de tal modo que o tipo L vai de fato
adquirir o nı́vel de educação e∗L , e não e∗H , tentando se passar pelo tipo alto para desse modo
receber θH > θL . Raciocı́nio similar vale para RCIH .
No equilı́brio agregador, os dois tipos adquirem a mesma quantidade de educação e∗ . Como a
firma não consegue usar o sinal para distinguir os tipos, a crença dela será dada por µ(e∗ ) = α,
ou seja, ela utiliza a distribuição de tipos na população para calcular o salário de equilı́brio. Deste
modo, o salário pago será o mesmo para os dois tipos e igual à produtividade média da população:
• Se u(w(e)) − c(e, θL ) > u∗L e u(w(e)) − c(e, θH ) < u∗H , então µ(e) = 1; e
• Se u(w(e)) − c(e, θL ) < u∗L e u(w(e)) − c(e, θH ) > u∗H , então µ(e) = 0.
Um equilı́brio intuitivo é então um equilı́brio sequencial que satisfaz o critério intuitivo. Esse
critério diz que se um determinado nı́vel de educação e é tal que melhora apenas a utilidade do
tipo L e piora a do tipo H, com relação às utilidade de equilı́brio, então a firma crê que o único
tipo que adquiriria tal sinal seria o tipo L (µ(e) = 1. De modo análogo, se um determinado nı́vel
de educação e é tal que melhora apenas a utilidade do tipo H e piora a do tipo L, com relação às
utilidade de equilı́brio, então a firma crê que o único tipo que adquiriria tal sinal seria o tipo H
(µ(e) = 0).
Quando acrescentamos o critério intuitivo acima e, portanto, utilizamos equilı́brio intuitivo para
analizar o jogo de sinalização, é possı́vel mostrar que:
• Apenas um equilı́brio separador emerge, em que e∗L = 0 e e∗H é o nı́vel de educação mais baixo
possı́vel que permite o principal separar os tipos.
• Apenas uma das restrições de compatibilidade de incentivo está ativa (a que previne o tipo
de baixa produtividade se passar pelo tipo de alto produtividade).
Com relação à questão de bem-estar dos jogadores, em geral, assumindo a noção de equilı́brio
sequencial, podemos apenas afirmar que o equilı́brio separador é ineficiente do ponto de vista
social. Intuitivamente, isto ocorre porque o sinal é custoso de se adquirir e não traz nenhum
benefı́cio social, apenas benefı́cios privados, pois o modelo assume que educação não tem efeito
sobre a produtividade e serve apenas para distinguir os tipos. O sinal então serve apenas para
separar os tipos e é um desperdı́cio do ponto de vista social.
O trabalhador de produtividade baixa está pior em um equilı́brio separador do que em um
equilı́brio agregador, já que nos dois ele adquire o mesmo nı́vel de educação, mas no segundo ele
recebe um salário maior (dado pela produtividade média.
Já o trabalhador de produtividade alta pode estar pior ou melhor em um equilı́brio separador do
que estaria em um equilı́brio agregador. Ele adquire o sinal porque dado que todos os trabalhadores
de tipo alto estão se educando e recebendo salário mais alto, para ele é melhor também adquirir
educação e se diferenciar do que não se diferenciar e receber o salário destinado a trabalhadores
de produtividade baixa. Mas diferenciar tem um custo, que é adquirir um nı́vel de educação
suficientemente alto para poder se diferenciar do tipo de baixa produtividade.
Quanto maior for a proporção de trabalhadores de produtividade alta, mais provável que este
tipo de trabalhador esteja pior no equilı́brio separador, já que o salário médio estará bem proximo
de θH , não compensado então pagar o custo de adquirir educação.
Já se utilizarmos a noção de equilı́brio intuitivo, existirá um único equilı́brio, o equilı́brio sepa-
rador de menor custo para a sociedade. Ainda assim, teremos uma ineficiência, quando comparada
à solução de first best, já que o candidato de alta produtividada adquire educação, que não possui,
por hipótese, qualquer valor social neste modelo.
Suponha um monopolista que não observa a disposição a pagar dos consumidores, que depende
da seguinte utilidade:
ui (q, T ) = θi v(q) − T ,
onde v(q) é uma função da quantidade q (q pode ser interpretada também como a qualidade do
bem produzido pelo monopolista), com v 0 > 0, v 00 < 0, T é a tarifa paga pelo consumidor e θi é um
parâmetro associado ao tipo do consumidor, que pode ser:
onde θL < θH . Logo o tipo alto possui uma disposição a pagar pelo bem maior do que a do tipo
baixo. Cada consumidor possui uma utilidade reserva ūi , que representa o maior nı́vel de utilidade
que o consumidor do tipo i pode obter sem comprar o bem. A taxa marginal de substituição entre
q e T (T M Si (q, T )) para cada tipo é:
Note que como T diminui a utilidade, as curvas de indiferença são positivimante inclinadas, e a
utilidade aumenta a medida que nos afastamos do eixo vertical. Além disso, como θL < θH , a curva
de indiferença do tipo H é mais inclinada do que a do tipo L e elas so se cruzam uma única vez
(por isso a condição de Spence-Mirrless é também chamada “single crossing condition). A figura
abaixo ilustra as curvas de indiferença dos dois tipos.
T
6
uh constante
ul constante
@
@
R
@
Direção na qual
a utilidade aumenta
-
q
Informação Perfeita
Vamos assumir que o monopolista observa o tipo do consumidor. O contrato, denotado por
(q, T ), quantidade e tarifa cobrados, pode então depender do tipo do consumidor. Para simplificar
a notação, vamos assumir que a utilidade reserva dos consumidores é zero. Logo, o problema do
monopolista é:
max T − cq s.a. θi v(q) − T ≥ 0 ,
(q,T )
onde a restrição de participação é satisfeita com igualdade na solução, ou seja, θi v(q) = T . Substi-
tuindo essa restrição na função objetivo do monopolista, obtemos:
max θi v(q) − cq
q
T
6
UH0
TH∗ s
UL0
TL∗ s
-
qL∗ ∗
qH q
Então a solução de first-best consiste no principal oferecer dois contratos, um desenhado para
∗
o tipo com maior disponibilidade a pagar, denotado por (qH , TH∗ ), com nı́vel de qualidade e preço
mais altos do o contrato desenhado para o tipo com menor disponibilidade a pagar, denotado por
(qL∗ , TL∗ ).
Informação Assimétrica
Vamos supor agora que o monopolista não consegue distinguir os tipos de consumidores, mas
sabe que com probabilidade β o indivı́duo é do tipo alto e com probabilidade 1 − β o indivı́duo é
do tipo baixo.
O contrato de first-best, para o caso em que a informação é perfeita, não funcionará agora:
o tipo alto compraria o pacote desenhado para o tipo baixo, caso o monopolista oferte (qL∗ , TL∗ ) e
∗
(qH , TH∗ ) (ver figura abaixo). Isso ocorre por que o tipo baixo possui uma disposição a pagar menor.
Logo o monopolista deve propor dois contratos, (TL , qL ) e (TH , qH ), desenhado para cada tipo, com
qL < qH e TL < TH e de modo que maximize o seu lucro.
T
6
UH0
UH (TL , qL ) > UH0
TH∗ s
UL0
TL∗ s
-
qL∗ ∗
qH q
e de tal modo que os dois contratos induzam os dois tipos de consumidores a comprá-los (ou seja,
devem satisfazer as restrições de participação dos dois tipos) e de modo que um tipo não adquira o
contrato desenhado para o outro (ou seja, compatı́veis de incentivo).
T
6
T̂H∗ s
UL0
TL∗ s
-
qL∗ ∗
qH q
Logo os dois contratos (qH , TH ) e (qL , TL ) devem satisfazer as seguintes restrições de compati-
bilidade de incentivo para cada tipo de consumidor:
RCIL : UL (qL , TL ) ≥ UL (qH , TH ) ⇒ θL v(qL ) − TL ≥ θL v(qH ) − TH
RCIH : UH (qH , TH ) ≥ UH (qL , TL ) ⇒ θH v(qH ) − TH ≥ θH v(qL ) − TL
A primeira restrição, RCIL , garante que o tipo L irá de fato escolher o contrato desenhado para
o seu tipo, (qL , TL ) e não o contrato desenhado para o tipo H, (qH , TH ). De modo similar, RCIH
garante que o tipo H irá de fato escolher o contrato desenhado para o seu tipo, (qH , TH ) e não o
contrato desenhado para o tipo L, (qL , TL ).
O problema do monopolista no caso de assimetria informacional é então dado por:
max β(TH − cqH ) + (1 − β)(TL − cqL )
(TH ,qH ),(TL ,qL )
O problema acima possui quatro restrições. Podemos mostrar que: 1) RPL e RCIH são satis-
feitas com igualdade no ótimo (dizemos então que essas duas restrições são “binding”), 2) qH ≥ qL
no contrato ótimo, e 3) RPH e RCIL serão sempre satisfeitas, quando as outras duas restrições do
problema do monopolista, RPL e RCIH , forem satisfeitas.
Vamos mostrar o item 3) acima, que RPH e RCIL serão sempre satisfeitas, quando RPL e RCIH
forem satisfeitas:
• RPH é redundante quando assumimos que RPL e RCIH são válidas:
θH v(qH ) − TH ≥ θH v(qL ) − TL > θL v(qL ) − TL ≥ 0 ,
onde a primeira desigualdade é consequência de RCIH , a segunda, de θH > θL e a terceira de
RPL . Logo, sempre que RCIH e RPL forem satisfeitas, valerá que θH v(qH ) − TH ≥ 0, ou seja,
RPH será também satisfeita (é com esse sentido que dizemos que RPH é redundante quando
RPL e RCIH forem satisfeitas).
• RCIL é redundante quando assumimos que RPL e RCIH são válidas: note que RCIH , satis-
feita com igualdade, pode ser reescrita com TH − TL = θH (v(qH ) − v(qL )). É possı́vel mostrar
∗
que no ótimo valerá ainda que qH ≥ qL∗ . Como θH > θL , obtemos que:
ou seja, RCIL será válida sempre que RPL e RCIH forem satisfeitas.
Isso implica que o problema de maximização do lucro do monopolista pode ser simplificado
para:
s.a. θH v(qH ) − TH ≥ 0 ,
θL v(qL ) − TL ≥ θL v(qH ) − TH ,
As duas restrições RPH e RCIL serão satisfeitas com igualdade no ótimo. Isso significa que
θL v(qL ) = TL e que TH = θH [v(qH ) − v(qL )] + θL v(qL ). Substituindo RPH e RCIL satisfeitas
com igualdade na função objetivo do monopolista, obtemos que:
β(θH − θL )v 0 (qL )
θL v 0 (qL∗∗ ) = c + > c = θL v 0 (qL∗ ) ,
1−β
| {z }
>0
onde o termo indicado como maior do que zero é de fato positivo pois 0 < β < 1, θH > θL e
v 0 (·) > 0. Temos então que v 0 (qL∗∗ ) > v 0 (qL∗ ). Como v 00 < 0, então v 0 é decrescente e obtemos que
qL∗∗ < qL∗ , ou seja, o contrato ótimo de second-best para o consumidor com disposição a pagar mais
baixa oferta um q menor do que era quando não havia assimetria informacional.
Isso significa que para o contrato ótimo que maximiza o lucro esperado do monopolista, assu-
mindo a presença de assimetria informacional, não ocorre distorção no “topo”: o indivı́duo com
maior disposição a pagar obtém a mesma quantidade do que antes (obtida na solução de first-best).
Porém o tipo com menor disposição a pagar recebe um contrato com uma quantidade menor do
que receberia caso não houvesse assimetria informacional.
Além disso, como RPL é satisfeita com igualdade, o indivı́duo com baixa disposição a pagar
tem um contrato ofertado tal que ele fica indiferente em comprar ou não o produto. Já para o tipo
de alta disponibilidade a pagar, como vimos acima, obtém um utilidade maior do que zero (sua
utilidade reserva) no contrato ótimo. Dizemos então que o tipo θH obtém uma renda informacional,
no sentido de que a utilidade de equilı́brio é maior do que zero, que é a utilidade de equilı́brio na
solução de first-best. Ter uma informação privada relevante para a transação analisada gera essa
renda informacional para o tipo θH . Além disso, o tipo θH é indiferente entre o seu contrato ou
o desenhado para o tipo θL (RCIH satisfeita com igualdade no ótimo) e o tipo θL prefere o seu
contrato estritamente ao contrato desenhado para o tipo θH (RCIL satisfeita com folga, ou seja,
com desigualdade estrita). A figura abaixo ilustra o contrato ótimo.
T
6
TL∗∗ s
-
qL∗∗ < qL∗ ∗∗
qH ∗
= qH q
3 Perigo Moral
3.1 Introdução
Perigo moral está presente em transações onde uma da partes (principal ) não consegue monitorar
as ações da outra parte, e essas ações são relevantes para a transação negociada.
Exemplo: Seguro de automóveis: motorista pode deixar de tomar cuidado com o carro após
adquirir o seguro. Esse comportamento afeta o resultado do contrato (a probabilidade de o carro
ser roubado pode aumentar, por exemplo) e não é possı́vel (ou é muito custoso) à firma observar
esse comportamento.
Vamos usar a seguinte terminologia em que o termo principal se refere à parte desinformada, no
exemplo que desenvolveremos, à firma, e o termo agente se refere à parte informada, no exemplo
que desenvolveremos, ao trabalhador.
O agente toma uma ação que afeta a sua utilidade e a utilidade do principal. O principal
não observa a ação tomada, apenas o resultado da ação. Quando a ação que o agente escolhe
espontaneamente não é Pareto-ótima (o que o principal gostaria), dizemos que existe um problema
de perigo moral.
O problema do principal-agente refere-se ao problema de como o principal pode desenhar um
esquema de incentivos que induza o agente a tomar a ação desejada pelo principal.
Exemplos:
• Firma e Empregado – esforço vs produção;
• Acionistas e Gerentes;
• Serviços – Médico e Paciente, Advogado e Cliente;
• Fazendeiros e Arrendatários (sharecropping decision);
• Seguros – seguro contra roubo, seguro contra incêndio, seguros em geral de propriedades/bens.
A Divisão ótima de risco (optimal risk sharing) ocorre quando o principal fornece um seguro
total para o agente (por exemplo, salário fixo para o agente) e com isso assume todo o risco da
atividade produtiva. A divisão ótima de risco nem sempre é possı́vel quando existe problema de
perigo moral, pois o agente pode não escolher a ação desejada pelo principal.
Solução: principal oferece um contrato ao agente. Trade-off entre:
• Divisão de riscos (salário do agente não deve depender do produto);
• Incentivos (principal deve condicionar o salário do agente ao produto).
3.2 Modelo
Vamos desenvolver o modelo padrão de risco moral, na versão discreta com apenas dois nı́veis
de esforço que o indivı́duo possa escolher. Suponha um indivı́duo (agente) e uma firma (principal).
A firma deseja contratar um trabalhador, que pode se esforçar (e = 1) ou não (e = 0) no trabalho.
A probabilidade de obter um bom resultado no trabalho (pode ser que seja o valor de vendas desse
indivı́duo) depende do esforço empregado.
Vamos supor L resultados possı́veis, l ∈ {x1 , x2 , . . . , xL }, onde xl denota o l-ésimo valor de venda
possı́vel, e de modo que esses resultados estão ordenados em ordem crescente: x1 < x2 < · · · < xL .
A probabilidade de ocorrerPa venda xl é πl (e) > 0, para todo l e e, onde e é o nı́vel de esforço do
agente. Temos então que l πl (e) = 1, tanto para e = 0 quanto para e = 1.
Vamos supor também que o agente possui uma utilidade u estritamente crescente e estritamente
côncava sobre riqueza w. Além disso, d(e) denota a desutilidade do nı́vel de esforço e. Logo, a
utilidade é separável: U (w, e) = u(w) − d(e), onde d(0) < d(1): se esforçar (e = 1) causa mais
desutilidade do que não se esforçar (e = 0).
A firma deve desenhar um esquema de incentivos que induza o trabalhador a escolher por
vontade própria o nı́vel de esforço desejado pela firma. Na presença da assimetria informacional, a
firma observa o resultado l ocorrido, mas não o nı́vel de esforço do trabalhador. Logo, o salário pago
pode depender apenas do resultado ocorrido, e não do nı́vel de esforço. Um contrato é representado
então por (w1 , w2 , . . . , wL ), em que wl , para l = 1, 2, . . . , L, denota o salário recebido se o resultado
xl ocorrer.
πl (1)
πl (0)
é estritamente crescente em l, l = 1, 2, . . . , L.
A HTPM garante que a razão da probabilidade de ter se esforçado muito sobre a probabilidade
de ter se esforçado pouco é crescente no valor do resultado. Intuitivamente, quanto maior o resultado
observado, mais provável o trabalhador ter se esforçado muito e não pouco.
Vamos descrever os contratos de salário oferecidos pela firma e as propriedades de eficiência
desses contratos. Primeiro, para efeito de comparação, vamos analisar a solução de first-best, em
que o principal consegue observar o nı́vel de esforço do agente.
Vamos supor que o principal observa o nı́vel de esforço do agente. Logo, o principal pode
implementar diretamente a ação que deseja, no sentido de que o contrato é diretamente condicionado
ao nı́vel de esforço desejado pela firma. Nesse caso, não existe problema informacional – as ações
do trabalhador são observadas sem custo pela firma.
O problema do principal é:
L
X L
X
max πl (e) (xl − wl ) s.a. πl (e)u(wl ) − d(e) ≥ ū ,
e,w1 ,...,wL
l=1 l=1
onde ū denota a utilidade reserva (ou custo de oportunidade em assinar o contrato de seguro) do
consumidor. Essa restrição do problema é chamada restrição de participação.
Vamos separar o problema em dois, um onde e = 0 e o outro onde e = 1. Determinamos o
contrato ótimo em cada caso, e depois encontramos o nı́vel de esforço ótimo para o principal.
O Lagrangeano do problema da firma é:
L
" L
#
X X
L= πl (e) (xl − wl ) + λ πl (e)u(wl ) − d(e) − ū
l=1 l=1
Vamos encontrar a solução resolvendo as CPOs. É possı́vel mostrar que as condições de segunda
ordem (CSOs) serão quando o indivı́duo for averso ao risco u00 (·) < 0. As condições de primeira
ordem (CPOs) resultam em:
∂L
= −πl (e) + λπl (e)u0 (wl ) = 0 , ∀ wl (5)
∂wl
L
∂L X
= πl (e)u(wl ) − d(e) − ū = 0 (se λ 6= 0) (6)
∂λ l=1
Portanto, no caso de informação perfeita, o contrato ótimo provê um salário fixo para o agente,
denotado por w̄, qualquer que seja o nı́vel de esforço que o principal deseje implementar (a utilidade
do indivı́duo não varia – permanece constante em todos os estados da natureza). Esse resultado é
esperado: a firma é neutra ao risco e o indivı́duo é avesso ao risco, logo obtemos uma divisão ótima
de risco, em que a firma arca com todo o risco do negócio.
Note que como para qualquer nı́vel de esforço considerado, o contrato ótimo provê um salário
fixo, a utilidade esperada do indivı́duo se torna:
L
X
πl (e)u(w̄) − d(e) = u(w̄) − d(e) ,
l=1
u(w̄) = d(e) + ū
Essa restrição define o salário pago pela firma: esse salário é o menor valor que a firma consegue
pagar para o trabalhador, que deixa este indiferente entre aceitar o emprego ou não.
Observe que como d(1) > d(0), temos que:
Existe um trade-off para o principal na escolha entre e = 0 e e = 1: como d(0) < d(1), exigir
e = 0 permite à firma pagar um salário mais baixo, o que aumenta o lucro esperado (restrição de
participação). Por outro lado, exigir e = 1 aumenta a probabilidade esperada de resultados maiores
(HTPM) e, portanto, também aumenta os lucros.
A ação ótima para o principal depende do caso em questão. Se for a ação menos custosa para
o agente (e = 0 no modelo), e estivermos em uma situação de assimetria informacional, então
não haverá conflito de interesses entre o principal e o agente e, portanto, não ocorrerá perda de
eficiência.
De qualquer modo, em ambos os casos, e = 0 ou e = 1, no caso de informação perfeita, o agente
obtém salário fixo e o resultado é eficiente.
Agora vamos supor que a escolha do nı́vel de esforço do indivı́duo não é observada pela firma,
que deve então desenhar um contrato que implicitamente induza o indivı́duo a escolher o nı́vel de
esforço que a firma deseja implementar.
Para isso, uma nova restrição deve ser adicionada ao problema da firma. Essa restrição, chamada
restrição de incentivos (ou restrição de compatibilidade de incentivos), assegura que o indivı́duo
escolherá de fato a ação desejada pela firma.
O problema da firma agora pode ser escrito como:
L
X L
X
max πl (e)(xl − wl ) s.a. (RP) πl (e)u(wl ) − d(e) ≥ ū ,
e,w1 ,...,wL
l=1 l=1
XL L
X
(RCI) πl (e)u(wl ) − d(e) ≥ πl (e0 )u(wl ) − d(e0 ) ,
l=1 l=1
Suponha que a seguradora deseja induzir o agente a escolher o nı́vel baixo de esforço (e = 0).
Entre todas as polı́ticas possı́veis que implementam e = 0, qual a melhor para a firma? Vamos
mostrar que, neste caso, a firma deve apenas pagar um salário que garanta a participação do agente
e que não é necessário se preocupar com a restrição de incentivos.
Vimos que a solução ótima w1 , . . . , wL para o problema com informação perfeita (i.e., sem
considerar a restrição de incentivos) quando e = 0 é pagar um salário fixo, ou seja, wl = w̄(0). A
RCI neste caso em que wl = w̄(0) para todo l se torna:
L
X L
X
πl (0)u(w̄(0)) − d(0) ≥ πl (1)u(w̄(0)) − d(1) ⇒ d(0) ≤ d(1) ,
l=1 l=1
ou seja, a restrição de incentivos, com e = 0, se reduz a d(0) ≤ d(1), que é válido por hipótese. Logo,
para induzir o consumidor a escolher o nı́vel de esforço mı́nimo, a firma não precisa adotar nenhum
esquema de incentivos especial, basta selecionar o mesmo contrato ótimo usado no caso onde não
existe problema de informação. Como esse contrato maximizava o lucro esperado da seguradora na
solução de first-best (sem considerar a restrição de incentivo), então ele continua maximizando o
lucro esperado agora. Portanto, para implementar e = 0, nada muda se consideramos informação
simétrica ou informação assimétrica. Isso é intuitivo, pois o nı́vel de esforço mı́nimo é o que o
agente sempre escolherá no caso em que não sejam dados incentivos para ele escolher nı́veis de
esforço mais altos.
Suponha agora que a seguradora queira induzir o agente a escolher o nı́vel alto de esforço (e = 1).
Entre todas as polı́ticas possı́veis que implementam e = 1, qual a melhor para a firma?
Primeiro observe que a polı́tica ótima de first-best, que provê salário fixo w̄(1) ao agente, não
satisfaz a restrição de incentivos, já que se wl = w̄(1) para todo l, a restrição de incentivos do
problema se torna:
L
X L
X
πl (1)u(w̄(1)) − d(1) ≥ πl (0)u(w̄(1)) − d(0) ⇒ d(1) ≤ d(0) ,
l=1 l=1
o que não é válido (pois d(0) < d(1)). Intuitivamente, se fosse oferecido um salário fixo, o agente
escolheria o menor nı́vel de esforço. Portanto, para que o principal consiga implementar e = 1, o
contrato não pode fornecer um salário fixo para todos os resultados possı́veis.
Vamos resolver o problema de maximização do principal em que ele deseja implementar o nı́vel
de esforço alto (e = 1). Como a RCI pode ser reescrita do seguinte modo:
L
X
(πl (1) − πl (0)) u(wl ) − d(1) + d(0) ≥ 0 ,
l=1
Podemos provar que as duas restrições RP e RCI estão ativas no ótimo, ou seja, que β 6= 0 e
λ 6= 0 (mais ainda, que são positivos), e que no ótimo, o indivı́duo obtém um contrato que especifica
salários que gera utilidade igual a sua utilidade reserva e de modo que ele seja indiferente entre se
esforçar muito ou se esforçar pouco.
Como λ e β são positivos, o lado direito da equação (7) é estritamente crescente em l, pela
HTPM. Como u0 é decrescente (o agente é avesso ao risco, u00 (·) < 0), então 1/u0 (wl ) é estritamente
crescente em wl . Isso significa que quanto maior l, maior wl , ou seja, wl é estritamente crescente
no resultado xl .
O contrato ótimo de salários para e = 1 então não provê mais um salário fixo para o trabalhador.
Pelo contrário, ele especifica que o trabalhador assuma parte do risco, e que o quanto maior o
resultado, maior a parte do risco assumida pelo trabalhador (pode ser que em termos percentuais
seja igual: o trabalhador recebe um salário que possui uma parte fixa e um componente fixo em
termos percentuais do resultado obtido).
O agente deve então arcar com parte do risco, para que ele de fato se esforçe. Note que a
restrição de compatibilidade de incentivos, satisfeita com igualdade no ótimo, pode ser reeescrita
como:
XL
(πl (1) − πl (0))u(wl ) = d(1) − d(0) > 0
l=1
Então:
L
X L
X L
X
(πl (1) − πl (0))u(wl ) > 0 ⇒ πl (1)u(wl ) > πl (0)u(wl )
l=1 l=1 l=1
Leitura Sugerida
Exercı́cios
1. Suponha uma única revendedora de carros e um único consumidor que deseja comprar apenas
um carro. A empresa pode ser uma revendedora de carros de boa qualidade com probabilidade
α ou uma revendedora de carros de má qualidade. O consumidor é neutro ao risco e não
observa a qualidade do carro. A valoração do consumidor é dada por vH se o carro é bom e
vL se o carro é ruim. Os custos para a firma de um carro são cH , se o carro for bom, ou cL , se
o carro for ruim. Suponha que o preço do carro é regulado em p (ou seja, nenhum carro pode
ser vendido por nenhuma revendedora por um preço diferente de p, seja ele de boa qualidade
ou de má qualidade) e que valem as seguintes desigualdades: vH > p > vL > cH > cL .
a) Que condição deve ser válida para que o consumidor compre o carro?
b) Suponha que a firma decide fazer propaganda, que custa A (a propaganda em si não
contém nenhuma informação relevante para o problema). Para esse exemplo, propaganda
pode servir como um sinal para a existência de um equilı́brio separador? (ou seja,
um equilı́brio onde os consumidores esperam que firmas com carros de diferente nı́veis
de qualidade gastem diferentes valores na propaganda?) Explique a intuição do seu
resultado e a relacione com a condição de Spence-Mirrless.
2. Considere o modelo de sinalização de Spence. Faça uma demonstração gráfica e dê a intuição
de porque pode ocorrer que em um equilı́brio separador, os dois tipos de agentes estarem pior
do que estariam em um equilı́brio agregador. O que pode ser dito em geral sobre o bem-estar
de cada tipo de agente, em cada equilı́brio?
3. (P3-2/18) Considere o mercado de seguro de carros. Suponha que existam quatro grupos
de pessoas nesse mercado, cada grupo diferindo com a probabilidade de sofrer um acidente.
Cada grupo contém um número grande e igual de pessoas, mas as companhias de seguro não
conseguem identificar a qual grupo uma pessoa pertence. Todo indivı́duo corre o risco de gas-
tar R$ 10.000,00 se sofrer um acidente. A tabela abaixo descreve o quanto um indivı́duo está
disposto a pagar por um seguro total no caso de acidente, para cada grupo (linha “WTP”).
a) Complete a tabela acima com os preços do seguro justo para cada grupo (linha “Seguro
Justo”), supondo uma companhia grande o suficiente para diversificar os riscos em cada
grupo. Como esses valores se comparam com a WTP de cada indivı́duo?
b) Suponha agora que a informação é assimétrica - as companhias de seguro não observam
o tipo da pessoa. Qual é o risco médio de uma pessoa? Qual é o preço do seguro justo
nesse caso?
c) Todos os agentes vão adquirir seguro ao preço encontrado no item b)? Caso não, qual
será a composição de risco que vai se deparar nesse caso? O preço de seguro justo
encontrado em b) seria suficiente para cobrir o risco que a companhia assegurou?
d) Usando a lógica em c), o que ocorre com o preço justo de equilı́brio? Quem adquire
seguro nesse caso?
e) O resultado encontrado em d) é eficiente? Discuta sucintamente.
5. Tony contratou Renata para vender goiabas. Tanto Tony quanto Renata são neutros ao risco.
Renata pode ficar em pé na beira da rua, no sol, se dedicando bastante a venda de goiabas
ou simplesmente sentar na sombra de uma árvore. A demanda por goiabas pode ser baixa,
média ou alta, com a mesma probabilidade. A tabela abaixo descreve o valor de vendas de
goiabas em cada caso de demanda, caso Renata se dedique ou não a tarefa de vender goiabas.
Se Renata trabalhar no sol, a demanda por goiabas é média e Tony paga à Renata R$ 30,00,
o lucro de Tony é R$ 150, 00 − R$ 30, 00 = R$ 120, 00. Tony só se importa com o seu lucro.
Renata, porém, se importa com duas coisas, quanto Tony irá pagar a ela e quão duro será o
trabalho. A utilidade de Renata é dada pelo salário que ela recebe, menos R$ 10,00 se ela
tiver que trabalhar no sol. Logo, se Tony paga a Renata R$ 35,00 e ela trabalhar duro, sua
utilidade será R$ 35, 00 − R$ 10, 00 = R$ 25, 00. Se por outro lado, Renata não trabalhar
duro, sua utilidade será R$ 35, 00 − R$ 0 = R$ 35, 00. Além disso, para que Tony convença
Renata a trabalhar para ele, a utilidade de Renata deve ser de no mı́nimo R$ 30,00 na média.
Suponha que o principal resolve adotar uma polı́tica de salários tal que que induza o agente
a escolher o nı́vel de esforço desejado pelo principal.