Você está na página 1de 40

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/326541415

Elementos de Estatística Bayesiana da Decisão

Technical Report · January 2005


DOI: 10.13140/RG.2.2.26007.06564

CITATIONS READS
0 184

1 author:

Jose Siqueira
University of São Paulo
92 PUBLICATIONS   388 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Informatics View project

Psychometrics; Judgement, Decision, and Choice; Social Evolution View project

All content following this page was uploaded by Jose Siqueira on 21 July 2018.

The user has requested enhancement of the downloaded file.


Elementos
de
Estatística Bayesiana da Decisão

José de Oliveira Siqueira


FEA-USP
2005
i

Sumário
Referências Bibliográficas .............................................................................................. 1
Prolegômenos .................................................................................................................. 1
Fundamentação Teórica .................................................................................................. 1
Teorema de Bayes ....................................................................................................... 1
Exemplo paradigmático da compra de um carro usado .......................................... 2
Estados informacionais do decisor...................................................................... 2
Os sete elementos básicos para definir um problema decisório ................................. 7
Limitação do axioma da transitividade ..................................................................... 10
Exemplo da contratação de secretária por um decisor "bomba de dinheiro"........ 10
Exemplo da comparação entre temperaturas ........................................................ 11
O conceito geral de opção ......................................................................................... 12
A opção de compra de seguro ............................................................................... 17
A festa de Jane (decisor neutro à incerteza).......................................................... 19
Opções aninhadas.................................................................................................. 21
A festa de Kim (decisor averso à incerteza) ......................................................... 21
Valor da opção como o valor esperado da informação imperfeita (veii) .......... 22
Cálculo do preço da opção de clarividência na decisão de compra de uma
máquina com incerteza sobre a produditividade ................................................... 26
Integral de Lebesgue: esperança e variância ..................................................... 27
Esperança parcial .............................................................................................. 27
Função de perda linear .................................................................................. 28
Nova expressão para o veip .............................................................................. 28
Aplicação ...................................................................................................................... 31
Inferência Estatística ................................................................................................. 31
Relação entre a inferência estatística e a função de perda .................................... 31
Abordagem clássica .......................................................................................... 31
Critério de admissibilidade ........................................................................... 32
Abordagem bayesiana ....................................................................................... 32
Critério de admissibilidade ........................................................................... 33
Desenvolvimento da fórmula do preço racional da opção européia simples ordinária
de Black-Scholes a partir do conceito de clarividência ou do valor esperado da
informação perfeita ................................................................................................... 34
1

Referências Bibliográficas
CLEMEN, R. (1996) Making hard decisions: an introduction to Decision Analysis. 2nd
ed. Belmont, CA: Duxbury.
COSTA NETO, P. L. & BEKMAN, O. R. (1980) Análise estatística da decisão, SP:
Edgard Blücher.
EECKHOUDT, L. & GOLLIER, C. (1995) Risk: evaluation, management and sharing,
NY: Harvester Wheatsheaf.
PRATT, J. W; RAIFFA, H. & SCHLAIFER, R. (1996) Introduction to Statistical
Decision Theory. 2nd reprinting. Cambridge, Massachusetts: MIT.
WONNACOTT, T. H. & WONNACOTT, R. J. (1990) Introductory Statistics for
Business and Economics, 4th ed., NY: Wiley.

Prolegômenos
Howard (1988) define análise da decisão como “um procedimento sistemático para
transformar problemas decisórios opacos em problemas decisórios transparentes por meio
de uma seqüência de passos transparentes. Análise da decisão é uma disciplina normativa
criada para ajudar as pessoas a tomarem melhores decisões”. Para Howard (1996), os
elementos básicos da decisão são: alternativa, informação e preferência.

Fundamentação Teórica
Teorema de Bayes
O Teorema de Bayes gera a distribuição de probabilidade posterior a partir de uma
distribuição de probabilidade prévia e das características do previsor (sensibilidade e
especificidade).
Grosso modo, uma variável estocástica discreta X associada a n eventos mutuamente
excludentes e coletivamente exaustivos (estados da natureza)  = { i }in=1 , que adquire os
valores  = {xi  }in=1 do domínio ou conjunto de apoio e que ocorrem com
probabilidades = { pi }in=1 , respectivamente. será chamada de medida de
probabilidade. A variável aleatória discreta X pode ser representada de forma tabular:
Estado da natureza Probabilidade Valor
i Pr(i ) = pi x (i ) = xi
1 Pr(1 ) = p1 x1
2 Pr(2 ) = p2 x2

n Pr( n ) = pn xn

E ( ) é o operador linear, chamado esperança matemática, que executa o produto


escalar entre as probabilidades e os valores da variável aleatória.
2

n
E ( X ) =  Pr(i ) x ( i )
i =1
n
=  pi xi
i =1

X
X X
Y Pr ( X  Y ) (
Pr  X  Y ) Pr (Y )

( ) Pr ( ) ( )
Y
Y Pr  X  Y X  Y Pr Y
Pr ( X ) Pr  X( ) 1

Exemplo paradigmático da compra de um carro usado


Imagine-se que uma pessoa esteja pensando em adquirir um carro do tipo C da ED's
Honesto. A fim de tomar uma decisão informada, observam-se os dados disponíveis
referentes aos carros C numa revista especializada de automóveis e encontra-se que,
infelizmente, 30% têm defeito de transmissão. Para ter mais informação sobre o carro C
da ED's, contrata-se um mecânico que possa fazer um julgamento técnico depois de uma
rápida volta de quarteirão na direção do carro. Evidentemente, o mecânico embora não
diagnostique sempre corretamente, possui uma excelente folha de serviço: de todos os
carros defeituosos que ele examinou no passado, diagnosticou corretamente 90% das
vezes (afirmou que o carro do tipo C era "defeituoso" quando de fato ele era defeituoso).
Em outras palavras, ele diagnosticou incorretamente somente 10% (afirmou que o carro
do tipo C era "ok" quando de fato era defeituoso). Ele tem também uma boa folha de
serviço de carros em bom estado (sem defeito de transmissão): pronunciou 80% de "ok"
quando o carro era de fato ok.
A expressão "defeituoso", entre aspas, descreve a previsão (opinião) do mecânico e
defeituoso, sem aspas, descreve o estado real do carro C, analogamente para "ok" e ok.

Estados informacionais do decisor


Há quatro estados informacionais do comprador do carro C:
➢ Estado informacional 1: após o conhecimento sobre o defeito de transmissão no carro
C e antes da contratação do mecânico;
➢ Estado informacional 2: após a contratação do mecânico e antes de seu diagnóstico;
➢ Estado informacional 3: após o diagnóstico do mecânico e antes da revelação do
estado real do carro C;
➢ Estado informacional 4: revelação do estado real do carro C.
Os três primeiros estados informacionais são estados de incerteza ou de informação
incompleta sobre o estado do carro C. O estado informacional 4 é o estado informacional
de interesse do comprador do carro C, i.e., é o estado de certeza. Quanto menor a
incerteza sobre o real estado do carro C, melhor para o decisor (comprador do carro C)
pelo princípio da aversão à incerteza.
3

1) Estado informacional 1: após o conhecimento sobre o defeito de transmissão no


carro C e antes da contratação do mecânico
Qual a chance de que o carro C, que se está querendo comprar de ED's, tenha defeito de
transmissão?
A resposta a esta pergunta é a seguinte: do universo de carros C, a chance de selecionar
ao acaso um carro defeituoso é de 0,30. O carro C da ED's é um carro selecionado ao
acaso dentro do universo de carros C, portanto há 30% de chance desse carro ser
defeituoso. Essa é a única informação que se tem sobre o estado do carro C.
Logo, pode-se definir um espaço amostral com dois estados da natureza: ok e defeituoso,
com as seguintes probabilidades:
Evento Probabilidade
Ok P ( ok ) = 0,70
Defeituoso P ( defeituoso ) = 0,30

2) Estado informacional 2: após a contratação do mecânico e antes de seu


diagnóstico
Neste estado informacional, o comprador (decisor responsável) conta com as informações
sobre as características do mecânico (sensibilidade=0,90 e especificidade=0,80 do
previsor imperfeito), além das informações sobre o carro C do estado informacional 1
(probabilidades prévias).
Neste novo estado informacional serão determinadas as probabilidades posteriores
utilizando o teorema de Bayes.
Neste estado informacional, deseja-se saber qual a chance de que o carro C que se está
querendo comprar tenha defeito de transmissão se o mecânico pronunciar: (1)
"defeituoso" ou (2) "ok".
Para responder a estas perguntas e a outras, deve-se empregar o Teorema de Bayes.
Kinney (1997, p. 22-6) e Wonnacott & Wonnacott (1990, cap. 19) representam
graficamente, de forma visual, o Teorema de Bayes. Fica, desta forma, evidente que a
fórmula de inversão da probabilidade condicional é a razão das áreas de dois retângulos
cujos lados são menores ou iguais a um. Em primeiro lugar, já é difícil estimar a área de
um retângulo com lados, em geral, menores que um. Em segundo lugar, é também difícil
estimar a razão de duas áreas originadas pelo cálculo anterior. A interação das
dificuldades dos dois cálculos anteriores torna a estimação da probabilidade posterior um
exercício de difícil solução mental. Entra em cena de forma determinante o teorema
desenvolvido pelo pastor inglês Thomas Bayes (1701-1761) no Ensaio sobre a solução
de um problema da doutrina das chances [Bernstein (1997, p. 128)].
O Teorema de Bayes pode ser entendido como uma forma de obter a árvore de
probabilidades do interessado, invertendo a árvore de probabilidade da natureza [Bekman
& Costa Neto (1980, 15-6)].
Para isso constrói-se a árvore de probabilidades da natureza:
4

0,90

"defeituoso"|defeituoso

"ok"|defeituoso
0,30 0,10
defeituoso

0,20

"defeituoso"|ok
ok
0,70

"ok"|ok

0,80

Figura 1: árvore de probabilidades da natureza


Pelo Teorema de Bayes, uma vez que a probabilidade posterior ou revisada do carro C ser
defeituoso, dado que o mecânico diagnosticou que ele é “defeituoso”, é:
P ("defeituoso" | defeituoso )  P ( defeituoso )
P ( defeituoso | "defeituoso") =
P ("defeituoso")
P ("defeituoso" | defeituoso )  P ( defeituoso )
=
P ("defeituoso" | defeituoso )  P ( defeituoso ) + P ("defeituoso" | ok )  P ( ok )
= 0, 66

Logo, uma vez o carro tenha sido diagnosticado pelo mecânico como "defeituoso", a
chance de que ele seja realmente defeituoso aumenta dos originais 30% para 66%.
Pode-se concluir também que:
P ( ok | "defeituoso") = 1 − P ( defeituoso | "defeituoso")
= 1 − 0, 66
= 0,34
Caso o mecânico diagnostique como “ok”, as seguintes probabilidades posteriores são
calculadas:
P ( defeituoso | "ok") = 0, 05
P ( ok | "ok") = 1 − P ( defeituoso | "ok")
= 1 − 0, 05
= 0,95
Therefore, the probability that the mechanic will state “faulty” will be:
5

P ("faulty") = P ( faulty )  P ("faulty" | faulty ) + P ( OK )  P ("faulty" | OK )


= 0.30  0.90 + 0.70  0.20
= 0.41
Analogously, the probability that the mechanic states “OK” is estimated in the same way
and amounts to:
P ("OK") = 1 − P ("faulty")
= 0.59
Hence, one has " " P " faulty " ; P " OK " .
According to Berger (1985, p. 129), those probabilities give the overall proportions of
positive and negative tests that can be anticipated. These might be useful for logistic
purposes if, say, the positive tests were to be followed up with more elaborate testing;
41% of those initially tested would require the more elaborate testing.
Os resultados da figura 1 podem ser sumariados em uma outra árvore, a árvore reversa ou
do interessado, que é a árvore das probabilidades posteriores. Em outras palavras, trata-se
da árvore que exprime o ponto de vista do interessado sobre a compra do carro C, dado o
julgamento do mecânico. Isso não envolve novos cálculos, mas apenas trata-se uma nova
forma de dispor os cálculos já feitos.
0,66

defeituoso|"defeituoso"

ok|"defeituoso"
0,41 0,34
"defeituoso"

0,05

defeituoso|"ok"
"ok"
0,59

ok|"ok"

0,95

Figura 2: árvore de probabilidades do decisor


Por exemplo, a árvore do decisor dá a resposta à pergunta 1, isto é,
P(defeituoso|"defeituoso")=0,66. Uma vez que o carro C de ED's tenha sido julgado pelo
mecânico como "defeituoso", a chance de que ele seja verdadeiramente defeituoso torna-
se 66%.
No terceiro ramo a partir do topo temos a resposta à pergunta 2, isto é,
P(defeituoso|"ok")=0,05. Uma vez o carro C seja julgado "ok", a chance que ele seja
defeituoso é de apenas 5%.
As probabilidades prévias, a característica do previsor imperfeito e as probabilidades
posteriores relacionam-se pela seguinte expressão:
6

P(defeituoso | "defeituoso") P(''defeituoso" | defeituoso) P(defeituoso)


= 
P(ok | "defeituoso") P("defeituoso" | ok) P(ok)
A razão das probabilidades prévias P(defeituoso)/P(ok) é chamada de vantagem prévia
em favor de defeituoso.
A razão das probabilidades posteriores P(defeituoso|"defeituoso")/P(ok|"defeituoso") é
chamada de vantagem posterior a favor de defeituoso.
Finalmente, a razão entre as probabilidades P("defeituoso"|defeituoso)/P("defeituoso"|ok)
é chamada de fator de Bayes ou verossimilhança.
Outra forma de representar a reversão das probabilidades (apresentação das
probabilidades posteriores) é a de inicialmente apresentar em forma tabular as
probabilidades conjuntas, como se segue:
True condition of car C Marginal
Diagnosis of the faulty OK probability
mechanic " "
“faulty” p11 p12 p1
“OK” p21 p22 p2 .
Marginal probability p1 p2 1
( )

Estado real do carro C Probabilidade


Diagnóstico do defeituoso ok marginal
mecânico
"defeituoso" p11 p12 p1.
"ok" p21 p22 p2.
Probabilidade p.1 p.2 1
marginal

No exemplo dado temos:


True condition of car C Marginal
Diagnosis of the mechanic faulty OK probability
" "
"faulty" 0.27 0.14 0.41
"OK" 0.03 0.56 0.59
Marginal probability ( ) 0.30 0.70 1

Estado real do carro C Probabilidade


Diagnóstico do defeituoso ok marginal
mecânico
"defeituoso" 0,27 0,14 0,41
"ok" 0,03 0,56 0,59
Probabilidade 0,30 0,70 1
marginal
7

Agora é possível apresentar a tabela das probabilidades posteriores:


True condition of car C Marginal
Diagnosis of the faulty OK probability
mechanic

“faulty” ( "faulty"
) 0.27/0.41
=0.66
0.14/0.41
=0.34
1

“OK” ( "OK"
) 0.03/0.59
=0.05
0.56/0.59
=0.95
1

Estado real do carro C


Diagnóstico do defeituoso ok Probabilidades
mecânico marginais
"defeituoso" ( "def" ) 0,27/0,41=0,66 0,14/0,41=0,34 1
"ok" ( "ok" ) 0,03/0,59=0,05 0,56/0,59=0,95 1

A razão g+=P(defeituoso|"defeituoso")/P(defeituoso)=0,66/0,30=2,20 indica que, quando


o julgamento do mecânico é "defeituoso", a probabilidade de o carro ser defeituoso
aumenta 2,20 vezes em relação à probabilidade prévia.
Analogamente, a razão g-=P(defeituoso|"ok")/P(defeituoso)=0,05/0,30=0,17 indica que,
quando o julgamento do mecanico é "ok", a probabilidade de o carro ser defeituoso
diminui para 17% da probabilidade prévia.
Quão útil é um previsor específico ou uma determinada previsão? A resposta é: depende
das probabilidades prévias.
Note-se que numa situação na qual a probabilidade prévia de sucesso é 0,5, qualquer
previsor com sensibilidade e especificidade diferentes de 0,5 proporciona ganho de
informação. Esta situação com probabilidade de sucesso igual a 0,5 é a de máxima
entropia (estado de conhecimento 1 de máxima ignorância ou incerteza), isto é, há muita
quantidade de incerteza para ser eliminada por um previsor.
Já quando a probabilidade de sucesso encontra-se perto dos extremos (0 ou 1), o previsor
necessita ser praticamente um clarividente para proporcionar ganho substancial de
informação. Esta situação é a de baixa entropia, isto é, há pouca quantidade de incerteza
para ser eliminada por um previsor.

Os sete elementos básicos para definir um problema decisório


Conforme Pratt et al. (1996), o decisor pode especificar sete elementos básicos para
definir seu problema decisório:
1. Conjunto de possíveis ações: A = a1 , a2 , , an 
2. Conjunto de possíveis estados da natureza: S = s1 , s2 , , sm 
3. Conjunto de possíveis experimentos: E = e1 , e2 , , eq  sendo que e0 simboliza a
não realização de experimento. Esse elemento faz com que o decisor seja forçado
a incluir opções na representação do problema.
8

4. Conjunto de possíveis resultados de todos os experimentos em E :


Z = z0 , z1 , , z p 
5. Função de perda: l (e, z , a, s )
6. Função de utilidade: u l ( e, z, a, s )
7. Função de densidade ou de massa de probabilidade: f ( s, z | a, e)
O problema geral de decisão pode ser representado como um jogo entre o decisor e um
personagem fictício que será chamado de “acaso”.
O jogo tem quatro movimentos:
1. O decisor escolhe e;
2. O acaso escolhe z;
3. O decisor escolhe a;
4. O acaso escolhe s.
O resultado desta seqüência é o resultado u l ( e, z, a, s ) .
Embora o decisor tenha total controle sobre as escolhas de a e e, ele não tem nenhum
controle e nem perfeito conhecimento sobre as escolhas de s e z que irão ser feitas pelo
acaso. No entanto, assume-se que o decisor pode atribuir distribuições de probabilidade a
estas escolhas. Assume-se também que as probabilidades atribuídas a s não dependem da
escolha de e.
Uma estratégia é um plano de ação condicionado pelas estados da natureza. Do ponto de
vista matemático pode ser reduzido a uma simples variável aleatória.
Logo, a alternativa de realizar a análise de decisão é uma opção que deve ser exercida
quando seu valor exceder seu custo.
O tradicional cálculo do valor da informação imperfeita ou perfeita é o próprio cálculo do
valor da opção com preço de exercício igual a zero.
A clarividência é uma opção que permite tomar todas as decisões após a revelação das
incertezas especificadas. De maneira mais geral, qualquer experimento ou atividade de
obtenção de informações pode ser visto como uma opção [Howard (1996)].
Nos problemas decisórios podem ser encontrados basicamente dois tipos de trade-offs
[adaptado de Malinak (1996, p. 15-6)]:
❖ Incerteza: surge quando há dois ou mais eventos incertos com retornos (payoffs)
não todos iguais. A função utilidade é utilizada para sintetizar os retornos
possíveis pelo equivalente monetário determinístico (payoff) ou equivalente não-
monetário deteminístico (valor da preferência). Nesse caso os pesos dos retornos
são as probabilidades.
❖ Múltiplo objetivo: surge quando há dois ou mais objetivos concomitantes e
concorrentes como, por exemplo, lucro e participação de mercado. A função de
valor determina o valor conjunto dos dois objetivos (atributos) ponderando cada
objetivo (no caso da função ser aditiva). Os pesos nesse caso não são mais
probabilidades, mas agora surge o problema de mensurar a estrutura de
preferência do decisor [Siqueira (2000)]. O valor do dinheiro em tempos distintos
é um caso particular de um problema decisório com múltiplos objetivos [Clemen
(1996)]. O valor presente é uma forma de resolver este trade-off. Conforme
Bekman & Costa Neto (1980, p. 83-5), a taxa mínima de atratividade de retorno r
é o custo de oportunidade do capital para o agente decisor (indivíduo ou firma)
9

utilizada para estabelecer equivalências entre capitais em distintas datas. Assim


como uma loteria pode ser representada pelo equivalente monetário
determinístico (emd), uma cadeia de fluxos de caixa pode ser representado pelo
equivalente monetário caixa determinístico (emcd).
Bierman Jr. et al. (1991, p. 210 e 234) citam os livros intitulados Probability and
Statistics for Business Decisions de 1959 e Introduction to Statistics for Business
Decisions de 1961 de R. Schlaifer. No livro de Schlaifer de 1961 é utilizada uma
abordagem bayesiana para resolver problemas decisórios de controle de qualidade e são
derivadas fórmulas que podem ser consideradas formas primitivas e precursoras da
fórmula tradicional de Black-Scholes. Evidentemente, o enfoque do livro não considera a
condição de não arbitragem para a determinação das fórmulas. Jaynes (1993) em sua
bibliografia elogia o pioneirismo da abordagem bayesiana aplicada de R. Schlaifer. No
livro de Pratt; Raiffa & Schlaifer (1996) a abordagem de Schlaifer é estendida e
generalizada com aplicações na formação de valor de opção não-financeira e em seleção
de carteira ótima.
Conforme Pratt et al. (1996), a estatística bayesiana é uma forma de análise de problemas
que surge quando a conseqüência da ação depende do incerto “estado da natureza” sobre
o qual o decisor obteve ou pode obter informação adicional por amostragem ou
experimentação. As estimativas de probabilidades refletem o estado de espírito humano.
Esta tarefa consiste em pensar coerentemente sobre tais incertezas e decisões sobre
quando agir baseados no que já pensamos, quando acumular mais informações que
podem informar-nos sobre os estados da natureza, e como equilibrar os custos e
benefícios de acumular evidências antes de agir. Para eles a teoria estatística da decisão
lida com problemas decisórios nos quais os dados obtidos por amostragem ou outro
método de observação estruturado pode ser processado para atualizar nosso
conhecimento sobre o parâmetro estabelecido (tal como média populacional). Os autores
alertam para a distinção entre preferência e utilidade. Utilidade tem um sentido estrito
que é demonstrado por eles. Diante da incerteza o decisor é forçado a jogar, a apostar. Ao
apostar ele espera ganhar, porém sabe que pode perder. Resta saber qual a melhor aposta.
Um pessoa que compra um seguro contra incêndio residencial não se auto-censura por
desperdiçar dinheiro se sua residência não pegou fogo até a data de expiração do seguro!
O valor esperado da informação adicional é no mínimo igual a zero, isto é, positivo.
Não há, em geral, uma solução “objetivamente correta” para qualquer problema decisório
real.
As bases da decisão são o julgamento humano das probabilidades e das utilidades e as
evidências objetivas.
Matematicamente a utilidade deriva da probabilidade canônica de indiferença entre um
valor certo e uma loteria entre os dois valores extremos. Logo, a utilidade assemelha-se à
probabilidade neutralizadora do preço da incerteza (risk-neutral probability).
Conforme Lindley (1968, p. 320):
“But the way that we have introduced shows that utility is a probability (specifically a
probability of obtaining the best consequence) and therefore obeys all the rules of the rich
probability calculus. This is the most important point: utility, at least as it has been
derived here, is not just a number measuring the desirability of something in the sense
that the bigger the utility the more desirable it is, it is a number which works according to
the probability rules. [...] The fact that utility is a probability enables the final step in our
coherent decision-making argument to be made. [...] Since loss is simply the negative of
10

utility this rule for decision-making is essentially that described above as a Bayes
solution: it maximizes he expected utility”.
A existência, unicidade e independência entre a utilidade a probabilidade subjetiva não
são suficientes para determinar qual é a melhor solução de um problema decisório em
condição de incerteza. É necessário acrescentar certas regras ou princípios de
razoabilidade, consistência ou coerência do comportamento do decisor responsável (e.g.
transitividade da preferência entre loterias evita a existência do decisor “bomba de
dinheiro”). O decisor responsável pode seguir os princípios de comportamento coerente,
consistente ou razoável para balizar sua decisão.
Conforme Raiffa (1977, cap. 4) e Pratt et al. (1996, cap. 3), cabe ressaltar que o decisor
racional deve seguir os princípios de comportamento consistente, isto é, os princípios da
substituição e da transitividade. O princípio da substituição estabelece que se uma loteria
é modificada substituindo um de seus prêmios por outro, tudo o mais é inalterado e se
ocorre indiferença entre a loteria original e seu substituto, então se deve ficar indiferente
entre a loteria original e a modificada. O princípio da transitividade impõe que se um
decisor (i) assegura ser indiferente entre as loterias A e B e entre B e C, então deveria ser
indiferente entre A e C e (ii) assegura ser indiferente A e B e prefere B a C, então prefere
A a C, e assim por diante [Pratt et al. (1996, p. 18)]. Este último princípio evita que o
decisor se transforme numa bomba de dinheiro [Bekman & Costa Neto (1980, p. 77-9) e
Pratt et al. (1996, p. 18)]. Se um decisor preferir A a B, for indiferente entre B e C ou
preferir B a C e for indiferente entre C e A ou preferir C a A, então se o decisor começar
possuindo a loteria A ele desejaria trocá-la por C, sendo que em seguida desejaria trocar a
loteria C por B. Neste ponto o decisor estaria disposto a pagar um prêmio para tracar a
loteria B pela A. Portanto, o processo de trocas poderia continuar indefinidamente e este
decisor seria chamado de bomba de dinheiro (money pump). Conjuntamente, estes
princípios garantem a existência e unicidade de medida de probabilidade subjetiva
[Pratt et al. (1996, p. 59-60)].

Limitação do axioma da transitividade


Os exemplos a seguir são úteis para mostrar a conveniência e a limitação do axioma da
transitividade.

Exemplo da contratação de secretária por um decisor "bomba de


dinheiro"
O exemplo é uma adaptação de Silva (1990, p. 29).
Uma agência de empregos possui três secretárias. Um contratante que deseja ter apenas
uma delas como secretária em sua empresa após entrevistá-las estabeleceu as seguintes
preferências: Maria é preferível a Rosa, Rosa é preferível a Paula e Paula é preferível a
Maria. Matematicamente, temos:
11

a b
b c
c a
sendo:
a = Maria
b = Rosa
c = Paula
Imagine que entre as entrevistas e a contratação Paula se torne indisponível. A escolha do
decisor responsável (contratante) é entre Maria e Paula. Desta forma, contrata Maria e
paga um certo valor à agência.
Mas a agência de empregos descobre que Paula não está realmente indisponível. A
agência também descobriu que Rosa ficou indisponível, pois ela conseguiu um emprego
por não ter sido escolhida para este. Portanto, a agência está com a secretária Paula
disponível.
O decisor empregou Maria, mas prefere Paula à Maria.
A agência não terá dificuldade em persuadir o decisor a trocar Maria por Paula pagando
um pequeno valor por ter o privilégio da melhor escolha.
Em seguida, a agência descobre que Rosa não havia sido contratada e que Maria não está
mais disponível por estar doente.
Já que o cliente prefere Rosa a Paula pode-se persuadir o decisor a pagar uma pequena
quantia para que a agência troque Paula por Rosa.
No entanto, Maria se recupera milagrosamente e Paula agora fica doente por ter visitado
Maria. Desta forma, a estória continua, iniciando um ciclo.
Imaginando que o decisor ainda mantenha sua estrutura de preferência do início do
problema, a agência consegue arrecadar dinheiro a cada passagem. Caso os ciclos se
repitam indefinidamente, o decisor falirá.
Este é um dos argumentos para que exista a condição de transitividade antes de um
conjunto de preferências ser chamado de racional.

Exemplo da comparação entre temperaturas


Este exemplo foi adaptado de Silva (1990, p. 30).
Inicialmente pode-se acreditar que se o decisor é racional, então quando ele é indiferente
entre os objetos A e B e também é indiferente entre os objetos B e C, então ele deve ser
indiferente entre os objetos A e C. O exemplo a seguir contraria esta forma de estabelecer
esta situação como condição de racionalidade.
Para qualquer temperatura tºC pode-se imaginar que o decisor é indiferente entre estar em
uma sala com tºC, na qual ele se sente muito confortável, ou em uma outra sala com
(t+0,001)ºC. O símbolo ~ significa indiferença entre dois objetos. Isto ocorre porque o
decisor não é capaz de perceber esta pequena diferença de temperatura no ambiente. De
forma semelhante temos:
12

20o C 20, 001o C


20, 001o C 20, 002 o C

99,999o C 100 o C
Desta forma, conclui-se que se as indiferenças do decisor são transitivas, ele sentir-se-á
bem confortável entre 20ºC e 100ºC. No entanto, este resultado é irreal.
O princípio de não-saciedade, isto é, o decisor racional deve preferir mais a menos
riqueza, juntamente com o de transitividade possibilita a existência de arbitragem no
mercado. Arbitragem, grosso modo, é a possibilidade de um decisor lucrar um valor com
certeza sem a necessidade de investimento. No entanto, do ponto de vista econômico, esta
possibilidade deve ser evitada ao formar o preço de um ativo, pois um preço que permite
arbitragem pode ocasionar a existência de um decisor do tipo bomba de dinheiro.
De maneira geral a teoria estatística da decisão, dadas algumas condições, permite a
determinação do preço de venda e compra únicos de uma loteria para um decisor
individual. Por exemplo, o equivalente monetário determinístico - ou o equivalente certo
- é o preço de venda mínimo da loteria assumindo que o decisor responsável possui os
direitos e deveres desta loteria. Além disso, o equivalente monetário determinístico
contém a informação da atitude do decisor diante da incerteza. Isto é, se ele for menor
que o valor esperado da loteria, o decisor é avesso à incerteza.
Pratt et al. (1996, p. 77) suspeitam que a maioria dos decisores da área de negócios é
estritamente avessa à incerteza.

O conceito geral de opção


“The real options approach is a way of thinking.”
Amra & Kulatilaka (1999, p. 5)
Bernstein (1997) dedica o capítulo 18 à história da opção financeira (derivativo).
Segundo ele (p. 315) “os derivativos não são transações envolvendo ações ou taxas de
juros, vidas humanas, casas vulneráveis a incêndios ou hipotecas imobiliárias. O produto
das transações com derivativos é a própria incerteza”.
O conceito de opção é relativamente conhecido e aplicado em Finanças. O
desenvolvimento dos mercados financeiros, a sofisticação dos produtos, a difusão dos
negócios em bolsas de valores e o interesse acadêmico na questão da avaliação tornaram
as opções o centro do grande debate. Contudo, é no campo das ciências da decisão que o
conceito assume seu aspecto mais genérico e, ao constituir um significado mais
abrangente, consegue incluir as definições utilizadas em Finanças e Economia.
Além disso, conforme Nichols (1994, p. 91), para Judy Lewent, CFO da Merck & Co.,
todos os tipos de decisões de negócios são opções.
O termo opção está diretamente ligado à noção de alternativa, embora este não seja seu
significado mais preciso.
Conforme afirma Howard (1996, p. 81), a opção pode ser definida como “uma alternativa
que permite ou pode permitir uma decisão futura após a revelação de informação”.
Note-se que a opção somente faz sentido em virtude da incerteza ou da falta de
informação dos indivíduos. Se os fenômenos analisados pelas ciências da decisão ou
Finanças fossem determinísticos e seus agentes, racionais, as preferências dos indivíduos
13

convergiriam para a alternativa que trouxesse maior satisfação, lucro ou prazer. Nessa
condição, qualquer discussão sobre opção seria redundante.
A árvore de decisão que auxilia no entendimento destas relações é a seguinte:

opção Incer Decisão


Decisão Retorno
teza

Pode-se observar que esta estrutura decisória difere da que representa o problema de
seleção ótima de carteira:

Incer Retorno
Decisão
teza

Torna-se, portanto, natural a utilização do conceito de valor da informação perfeita (valor


de clarividência) e da imperfeita e o custo de implementação da decisão para que seja
estabelecido o valor máximo da decisão de ter o direito de decidir depois da resolução da
incerteza [Howard (1996)].
A própria de decisão de fazer a análise da decisão é uma opção. O problema é de natureza
recorrente.
Temos ainda que toda opção é uma alternativa, mas nem toda alternativa é uma opção.

Alternativa

Opção

Outra idéia importante relacionada à opção é o livre arbítrio.


Em Finanças, a opção pode ser definida como um direito. Conforme explica Hull (1997,
p. 5), a opção é algo que confere ao seu titular o direito de fazer algo. E as pessoas
exercerão este direito se as circunstâncias forem vantajosas. Howard (1996, p. 81) ainda
ressalta que a opção está associada ao exercício da vontade humana em uma decisão
futura.
O aspecto mais interessante sobre a opção é que constitui um elemento que agrega valor à
decisão dos indivíduos. Em uma decisão caracterizada pela incerteza, qualquer
informação que possa conduzir o sujeito a tomar uma decisão (ação) diferente possui
valor [Clemen (1996, p. 438)].
Sobre este aspecto, Howard (1996, p. 82) expõe o conceito de clarividência ou
capacidade de antecipar todas as incertezas enfrentadas por um decisor. A existência de
informações pode diminuir as incertezas, alterar o curso de uma ação e trazer mais
satisfação ao indivíduo. Portanto, é interessante saber identificar situações em que estão
14

presentes as opções. Contudo, a experiência de Howard (1996, p. 82) indica que as


capacidades de reconhecer e de criar opções nos problemas de decisão são
freqüentemente negligenciadas nas etapas de identificação (framing) e estruturação.
De acordo com Howard (1996, p. 83), a discussão sobre opções, na análise da decisão, se
aplica a indivíduos que seguem algumas regras baseadas na idéia de von Neumann-
Morgenstern. Bierman Jr. et al. (1991), Pratt et al. (1996) e Raiffa (1977) expõem
detalhadamente essas regras.
Segundo Howard (1996, p. 84), o valor de uma opção depende da atitude em relação à
incerteza de seu titular ou lançador.
A propensão das pessoas à incerteza pode ser observada pela curvatura da função de
utilidade. Para indivíduos com aversão à incerteza (preço da incerteza positivo) pode-se
atribuir uma função de utilidade exponencial ou logarítmica. A seguir tem-se a expressão
matemática da função de utilidade exponencial:
u ( x) = a − b exp ( − x /  )
b0
 0
A partir da função de utilidade de um decisor, pode-se obter o equivalente monetário
determinístico de uma dada alternativa de decisão que envolva incerteza.
Dada uma função de utilidade u ( X ) , então o equivalente monetário determinístico é
dado por:
emd ( X ) = u −1  E (u ( X ) ) .
A suposição de o decisor ser neutro à incerteza (decisor que considera apenas a
expectativa de retorno, portanto, para ele o preço da incerteza é nulo) ou ter uma função
utilidade exponencial (decisor avesso à incerteza - que considera um preço da incerteza
positivo - e que não considera o valor de sua riqueza inicial) simplifica bastante os
cálculos do equivalente monetário determinístico (emd), pois funciona a propriedade
chamada delta:
emd ( X +  ) = emd ( X ) +  .
Isto é, o equivalente monetário determinístico de uma loteria X (situação com incerteza)
mais uma constante delta é igual ao equivalente monetário determinístico da loteria mais
o valor da constante delta. Em geral, a preocupação está em determinar um delta igual ao
preço da opção. Além disso, decisores do tipo delta gozam da propriedade do preço de
compra da loteria ser igual ao preço de venda da mesma loteria. Portanto, para eles o
preço, num sentido pessoal, é único. Para os decisores com função utilidade exponencial,
o preço da loteria varia em função do coeficiente de tolerância ao risco  , que, mantida a
situação decisória, é constante para cada decisor, mas pode variar de decisor para decisor.
Apenas os decisores neutros ao risco (função de utilidade linear) ou avessos ao risco com
função de utilidade exponencial são do tipo delta. Para um decisor indiferente à incerteza
o emd ( X ) é o valor esperado da loteria. Por exemplo, para o decisor exponencial o
emd ( X ) é:
15

 n  x 
X ~ discreta  emd ( X ) = −  ln   pi exp  − i  
 i =1   
2
X ~ normal (  ; )  emd ( X ) =  −
2

2
Se, por exemplo, o decisor for avesso à incerteza com função utilidade logarítmica, ele
não será do tipo delta. Além disso, a utilidade depende da riqueza inicial do decisor (  ),
o preço de compra da loteria é menor que o preço de venda da mesma loteria e o
coeficiente de aversão à incerteza varia em função dos valores da loteria e da riqueza
inicial, isto é, não é constante [Bekman & Costa Neto (1993, p. 79-80)]. Quando o valor
da riqueza inicial é muito maior que os valores em jogo na loteria, a função utilidade do
decisor é aproximadamente exponencial.
Quando o valor da riqueza inicial é muito maior que os valores em jogo na loteria, a
função de utilidade do decisor é aproximadamente igual a exponencial. O emd ( X ) do
decisor logarítmico para uma loteria discreta é:
n
emd ( X ) +  =  ( xi +  )
pi

i =1
n
emd ( X ) =  ( xi +  ) i − 
p

i =1

Isto é, o emd da loteria mais a riqueza inicial é igual à média geométrica de cada
resultado possível da loteria somado à riqueza inicial.
O lançamento de uma opção pode implicar o pagamento de um valor denominado prêmio
ou preço da opção. Trata-se do custo de aquisição dessa opção, que confere ao seu titular
um determinado direito. O preço dessa opção pode ser avaliado como o preço que torna o
decisor indiferente entre sua aquisição ou não. Em geral, o prêmio costuma crescer de
acordo com a incerteza e com o número de alternativas. Além disso, conforme Howard
(1996, p. 84), a escolha de uma alternativa oferecida pela opção pode exigir o pagamento
de um valor adicional denominado preço de exercício.
Embora os livros didáticos associem as opções a uma modalidade de operação financeira
ou a uma questão na análise estatística da decisão, os decisores costumam comprar ou
vender opções em diversas situações do cotidiano:
Opção Preço da opção Preço de exercício
Compra de um bilhete de loteria preço do bilhete imposto
Seguro de carro contra acidentes prêmio do seguro franquia
Plano de saúde preço ou mensalidade tabela da AMB

Kimura et al. (1999) mostram que há quatro produtos tradicionais no mercado financeiro
- empréstimo com garantia, seguros, debêntures e cheque especial - que, em alguns
aspectos, podem ser analisados como contratos de opções.
Herath (1998) mostra que projetos de investimento com incerteza podem também ser
analisados como opções, utilizando a Teoria Estatística Bayesiana da Decisão.
Para mostrar um exemplo de opção, Howard utiliza uma árvore de decisão com a
seguinte estrutura para um problema discreto:
16

Observe que a opção somente cria valor para o decisor se c assumir valores tais que:
c − b  pe
Caso contrário, a opção não dever ser exercida, pois para qualquer estado da natureza
resultará um valor inferior à alternativa de não exercer.
A questão é saber qual o valor da opção supondo um investidor racional que seja neutro
ou avesso à incerteza dadas as hipóteses de haver ou não o exercício:
a) O investidor não exerce a opção
Nesta situação, podemos dizer que:
b − po  c − pe − po  b  c − pe
Para um investidor neutro à incerteza, o valor da opção é aquele para o qual o investidor
torna-se indiferente às duas alternativas. Devido a sua atitude neutra à incerteza, seu
critério decisória baseia-se na esperança do valor monetário da loteria, isto é,
E ( X ) = emd ( X ) . Portanto:
E ( X1 ) = qb + (1 − q)a
E ( X 2 ) = q(b − po ) + (1 − q)(a − po )
Igualando-se as duas esperanças, o valor da opção é nulo, isto é, p0 = 0 .
Para um investidor com aversão à incerteza que utiliza o critério decisório da esperança
da utilidade da loteria, temos:
u( x1 ) = qu ( b ) + (1 − q)u(a)
u( x2 ) = qu ( b − po ) + (1 − q)u ( a − po )
Igualando-se as duas utilidades, o valor da opção é nulo, isto é, p0 = 0 .
b) O investidor exerce a opção
Nesta condição temos:
b − po  c − pe − po
c − b  pe
17

Para um decisor neutro à incerteza, o valor da opção que torna as duas alternativas iguais
deve obedecer à seguinte condição:
po = q(c − b − pe )
Conforme Howard (1996, p. 86), a opção deve ser comprada se estiver sendo vendida por
um preço inferior ao estabelecido acima.
Para um decisor com aversão à incerteza, deve-se utilizar a função de utilidade para
estabelecer o preço da opção.
Conforme adiciona Howard, a opção deve ser comprada se:
emd ( X1 )  emd ( X 2 )
emd ( X1 ) : equivalente monetário determinístico da alternativa sem opção;
emd ( X 2 ) : equivalente monetário determinístico da alternativa com opção.

A opção de compra de seguro


Um decisor percebe que tem 1% de chance de perder R$1.000,00. Qual o preço máximo
(valor da opção de seguro) que este decisor estaria disposto a pagar pelo seguro contra
perda total em função do valor da franquia (preço de exercício)?
não ocorre sinistro 1000-0
99/100
-10

1/100

sinistro 1000-1000

não faz seguro

exerce 0 po pe

faz seguro
sinistro
1/100

não exerce 1000 po


pe
− − po
100

99/100
não ocorre sinistro po
18

❖ Valor da opção para o decisor neutro ao risco:


p
po = 10 − e
100
po = valor da opção ou prêmio do seguro
pe = preço de exercício ou franquia
O valor da opção pode ser obtido de duas maneiras diferentes. A primeira consiste em
calcular o valor esperado da informação perfeita, isto é:
veip = po
pe
=− − (−10)
100
p
= 10 − e
100
A segunda consiste em determinar o preço da opção que torna o decisor indiferente em
relação às alternativas, isto é:
p
−10 = − e − po
100
p
po = 10 − e
100
Em ambos os casos foi utilizada a propriedade delta.
❖ Valor da opção para o decisor avesso à incerteza com função de utilidade exponencial
com o coeficiente de tolerância à incerteza  = R$1.000,00:
 
99 + exp(1) 
po = 1000 ln 
( )
,
 99 + exp pe 
 1000 

sendo exp(1) = e = 2, 7182...
Figura 1: Efeito do preço de exercício sobre o valor da opção
19

Efeito do preço de exercício sobre o valor da opção

18
17,04

16 15,99

14,83 Neutro ao risco


14
13,54 Avesso ao risco: exponencial

12 12,13
Valor da Opção

10,57
10 10
9 8,85
8 8
7 6,95
6 6
5 4,86
4 4
3
2,55
2 2

Preço de Exercício 1
0 0
0,00
0 100 200 300 400 500 600 700 800 900 1000 1100

Observações:
❖ Quanto maior o preço de exercício, menor o valor da opção independentemente da
atitude diante da incerteza;
❖ Quanto maior o preço de exercício, menor a diferença entre os valores das opções;
❖ O decisor com a atitude de aversão à incerteza está disposto a pagar sempre mais pelo
seguro para qualquer preço de exercício do que o decisor neutro à incerteza;
❖ Para a franquia (preço de exercício) igual a zero, isto é, pe = 0 , temos o valor da
opção de seguro sem custo.

A festa de Jane (decisor neutro à incerteza)


Um exemplo de opção utilizado no artigo de Howard (1996) refere-se à situação
enfrentada por uma personagem chamada Jane. Ao organizar uma festa, Jane está em
dúvida sobre o local onde deveria celebrar devido à incerteza sobre o tempo. A
possibilidade de chuva arruinaria uma festa do lado de fora da casa. Assim como não
seria vantagem ter a festa dentro de casa com um tempo não chuvoso. Jane é neutra à
incerteza e é capaz de atribuir valores monetários aos resultados da festa. A árvore de
decisão a seguir mostra que é melhor realizar a festa na varanda da casa:
20

40%
100
Fora

40
60% 0
40%
90
Varanda

Local 48
da festa 60% 20
40%
40
Dentro

46
60% 50
Clarividência é a capacidade de prever (antecipar) perfeitamente os eventos incertos, mas
não de causá-los. Jane pode também atribuir um valor para a opção de clarividência.
Supondo que um previsor fosse capaz de lhe informar com certeza o tempo antes de
organizar a festa, Jane poderia escolher o local que lhe trouxesse maior retorno qualquer
que fosse o resultado da clarividência:
Fora
100

Varanda
90
40%
Local
da festa Dentro
Sim 40
Fora
0
70
(EC) Varanda
20
60%
Consulta Dentro
clarividente 50
Não
48
O valor da opção é a diferença entre o equivalente monetário determinístico da
alternativa com opção e a melhor alternativa de Jane no estado anterior. Ou seja, o preço
máximo que Jane pagaria pela informação do clarividente seria $22. No exemplo acima,
o preço de exercício para escolha do local é nulo. Contudo, pode-se introduzir um valor
para o preço de exercício, tendo como efeito a redução do preço da opção.
21

Opções aninhadas
Outra situação interessante ilustrada por Howard (1996, p. 89) refere-se ao conceito de
decisões seqüenciais. Supondo que Jane possa observar o tempo pela manhã e decidir
pela realização da festa neste dia em caso de sol ou adiá-la para outro dia em caso de
chuva, observa-se que Jane possui uma série de decisões encadeadas.
Fora Fora
Fora
100 100
100
Varanda
90
40% n=1 40%
n=3 40% n=2 Posterga Dentro
40
Posterga

Posterga Fora
Posterga
70 0
82
89,2
Varanda
20
60% 60% Dentro
60% Dentro 50
Dentro 50
50
Direito de realizar
festa em qualquer
a
dia não 48
Quanto maior o intervalo de tempo para Jane decidir sobre a realização da festa, maior o
valor da opção de postergar. No exemplo acima, a opção de adiar a festa em virtude o
mau tempo vale 41,2, isto é, 89,2-48,0. Conforme observa Howard, à medida que o prazo
aumenta, o preço da opção também aumenta. E quando o número de dias tende ao
infinito, o valor da opção converge para 52, isto é, para 100-48.

Valor da opção

60.00

50.00

40.00

30.00

20.00

10.00

0.00
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

prazo

A festa de Kim (decisor averso à incerteza)


Para ilustrar um caso de indivíduo avesso à incerteza, Howard segue com o exemplo de
Kim. Para a mesma situação de decisão do local de uma festa, Kim toma decisões com
base em uma função de utilidade exponencial:
22

 x
u ( x) = 1 − exp  − 
 
sendo:
 = $50 / ln 2
 $72,1347
É possível perceber que para a mesma situação enfrentada por Jane, Kim tomaria outra
decisão. No seu caso, seria preferível realizar a festa dentro de casa conforme se observa
pelo emd de sua decisão:
40%
100
Fora

25,73
60% 0
40%
90
Varanda

Lugar 40,60
da festa 60%
20
40%
40
Dentro

45,83
60% 50
Para a situação em que é possível consultar um clarividente, o valor da opção da
clarividência para Kim é diferente do de Jane. Visto que sua melhor alternativa sem a
opção é 45,83, a inclusão da opção pela informação da clarividente tem como resultado
um valor correspondente a 66,10. Sendo Kim um decisor do tipo delta, o valor da opção é
20,27, isto é, 66,10-45,83, conforme a figura a seguir:
Fora
100

Varanda
40%
90
Local
da festa
Dentro
Sim 40
Fora
0
66,10
Varanda
20
60%
Consulta Dentro
clarividente 50
Não
45,83

Valor da opção como o valor esperado da informação imperfeita (veii)


23

Suponha que Kim não possa ter acesso a um clarividente. No entanto, ela pode utilizar
gratuitamente a opção de um aparelho detector de chuva que acerta 80% das vezes em
que chove e 80% das vezes em que faz sol. Portanto, o valor da alternativa de utilizar o
detector gratuitamente é $54,65. Logo, o valor da opção do detector gratuito é $8,82.

Opção: informação imperfeita


antes da decisão
72,7%

Fora
Preço da opção: $8,82 56,88
27,3%
“Sol” Varanda
44% 63,35

Dentro
42,59
Sim 14,3%

54,65 Fora
8,17
85,7%
“Chuva” Varanda
56% 26,70
Usa detetor

(opção) Dentro
48,48
Não
45,83

Observe agora que se for dado o direito a Kim de utilizar o detector gratuitamente, o
valor da opção de clarividência diretamente sobre a natureza também gratuita passa a ser
11,45, isto é, 66,10-54,65.
Suponha desta vez que o clarividente passe a cobrar por seu serviço e Kim possa utilizar
o detector gratuitamente, qual seria o valor máximo que Kim estaria disposta a pagar pelo
serviço de clarividência?
O clarividente irá antecipar a incerteza da natureza atualizada pelo detector (previsor
imperfeito) para Kim. Logo, uma nova decisão deverá ser acrescentada à árvore: exercer
ou não o clarividente.
24

Opção de clarividência - Kim


Fora
88
Sim 72,7%
Preço da opção :$ 2,74
Preço de exercício: $ 12,00 - pe Dentro
“Sol” 70,59
27,3%
38

44%
Exerce? Não Varanda
57,39 63,35

Sim
Fora
detetor 14,3%
88
- p0 Sim
- pe Dentro
“Chuva” 43,35
85,7%
38
56%
Opção de Exerce?
Não Varanda
clarividência 48,48
Não 54,65

Preço de exercício do clarividente (pe)


Probabilidade ($)
0 6,87 12 19,27 ou maior
0,44 82,59-pe 82,59-pe 82,59-pe
0,44 63,32
0,56 55,35-pe
0,56 48,48 48,48 48,48
Emd(X) 66,10 59,22 57,39 54,65
Valor da opção de 11,45 4,57 2,74 0
clarividência

É importante frisar que o cálculo do emd é recorrente [Luenberger (1998, cap. 16)]. Por
exemplo, quando o preço de exercício é 6,87 e o detector informa que irá chover, então o
clarividente deverá ser exercido, mas se o detector informar que irá fazer sol, o
clarividente não deve ser exercido. Por exemplo, o emd de 59,22 foi calculado da
seguinte forma:
  ( 82,59 − 6,87 )   48, 48  
emd ( X ) = −72,1347 ln 0, 44 exp  −  + 0,56 exp  − 
  72,1347   72,1347  
= 59, 22
Quando o preço de exercício é nulo, o valor de clarividência sobre a incerteza da natureza
atualizada pelo detector atinge seu máximo valor 66,10 que é o próprio valor da
clarividência na presença apenas da incerteza da natureza, i.e., 61,10.
À medida que o preço de exercício aumenta,o valor da opção diminui até o valor zero.
Para o valor de exercício menor que 6,87 a opção de clarividência deve sempre ser
exercida independentemente da informação do detector. De 6,87 até valor menor que
25

19,27 a opção de clarividência deverá ser exercida se o detector informar que o dia será
ensolarado. De 19,27 em diante a opção de clarividência não deve exercida qualquer que
seja a informação do detector.
Valor da opção ($)

14

12

10
Valor da opção ($)

0
0 2 4 6 8 10 12 14 16 18 20 22
Preço de exercício ($)

Conforme Howard (1996) as opções resultam do reconhecimento ou criação de novas


oportunidades de decisão com antecipação de resolução total ou parcial de incerteza e
elas são importantes porque evitam perdas e criam valor.
Malinak (1996) expõe em sua tese um método para a determinação do valor da opção de
procurar melhores alternativas.
Herath (1998) utiliza a abordagem bayesiana para a determinação do preço da opção
européia simples ordinária na ausência da condição de não-arbitragem. Por outro lado, ela
enfatiza a aplicação do conceito de clarividência (valor esperado da informação perfeita)
e do valor esperado da informação imperfeita na formação do preço do que ela designa de
quase-opção ou de opção real. Os conceitos de oportunidade de replicação e de revisão
seqüencial juntamente com o de valor da informação proporcionam a criação de uma
abordagem bayesiana para a determinação do preço de opção real. A tese deriva a
fórmula de Black-Scholes-Merton a partir da abordagem bayesiana. A tese está
fortemente baseada nas obras de H. Bierman Jr., R. Schlaifer e L. Trigeorgis.
Siqueira (1999) mostra que a determinação do preço único e livre de arbitragem da opção
não depende da função de utilidade do decisor e da distribuição de probabilidade real ou
subjetivo do preço do ativo na data de exercício, isto é, a determinação do preço racional
da opção é livre de preferência.
26

Cálculo do preço da opção de clarividência na decisão de compra de


uma máquina com incerteza sobre a produditividade
Bierman et al. (1991, p. 203-39) relatam um problema de cálculo do preço da opção de
clarividência na decisão de compra de uma máquina.
Uma companhia tem uma oportunidade de comprar uma máquina por R$ 17.200,00. A
máquina, se houver sucesso, irá economizar horas de trabalho humano no processo de
produção que agora utiliza uma grande quantidade de horas de trabalho humano. A vida
física desta máquina é de um ano. O custo adicional de uma hora de trabalho humano
para a companhia é de R$8,00. Então, se a máquina economizar mais do que 2.150 horas
de trabalho humano, isto é, R$17.200,00/(R$8,00 por hora), a companhia irá beneficiar-
se da compra da máquina.
O engenheiro de produção julga que a distribuição dos valores das horas economizadas
tem uma distribuição normal (medida de probabilidade subjetiva ) com média 2.300 e
desvio-padrão 300. Portanto, a função de lucro é dada por:
L = 8 X −17200
sendo que X é o número efetivo de horas economizadas pela máquina.
O valor esperado de L é:
E ( L ) = 8 − 17200
Pela distribuição de probabilidade atribuída pelo engenheiro tem-se que o lucro esperado
é R$ 1.200,00. Esse valor é chamado de lucro esperado em condição de incerteza.
Nessa análise supõe-se que a função de utilidade é linear, isto é, o engenheiro é neutro à
incerteza, e a taxa de desconto é nula.
O coeficiente de variação de 13% indica a boa precisão da média. No entanto, talvez
poderia ser pago um certo valor para obter mais informações antes de agir.
A decisão ótima baseada no valor esperado do lucro é comprar a máquina. Se o número
de horas efetivas economizadas for menor que k = 2150 , de quanto será a perda?
Portanto, a perda (custo) de oportunidade condicionada (supondo a compra do
equipamento) será de máx 8 ( k − X ) ;0 . O valor esperado da informação perfeita
( veip ) é a medida do valor do preditor perfeito (clarividente) ou da informação perfeita.
É a esperança do valor condicionado da informação perfeita.
Se tivéssemos um dispositivo de predição perfeito e ele indicasse que o número de horas
economizadas seria maior que k , então manteríamos a decisão anterior de comprar a
máquina sem esta informação e o preditor seria de nenhum valor. No entanto, se o
preditor indicasse que o número de horas economizadas seria menor que k, então a
decisão seria a de não comprar a máquina e poder-se-ia evitar uma perda. Portanto, o
preditor só tem valor se ocorre mudança de decisão quando dada a nova informação.
O cálculo do valor condicionado da informação perfeita (VCIP) (supondo que sem a
informação o equipamento seria comprado) é:
VCIP(c; k ; X ) = max 8 ( k − X ) ;0
O VCIP é idêntico à perda de oportunidade condicionada da decisão ótima.
O veip é calculado ponderando o VCIP pela distribuição de probabilidade associada.
Deste cálculo resulta a perda de oportunidade esperada da decisão ótima.
27

veip = E (VCIP )
k
=  8 ( k − x ) p( x)dx
−
sendo que p ( x ) é a função densidade de probabilidade normal.
Utilizando as informações do engenheiro temos que:
 k − 2300 
veip = 8  300  N  
 300 
= 475
sendo que N ( ) é a função de distribuição acumulada da normal.
O argumento de N ( ) é a distância em unidades de desvio-padrão do k para a média da
normal. Em estatística esta quantidade é conhecida como effect size. Quanto maior o
valor deste argumento, menor o veip . Logo, menor o veip , menos provável de haver
mudança de decisão (considerando todos os outros parâmetros fixos).
Podemos então calcular o lucro esperado em condição de certeza ( lec ):
lec = E ( L ) + veip
= 1.200 + 475
= 1.675
Portanto, o valor máximo que decisor pode pagar por este projeto (compra da máquina e
obtenção de informação adicional) é R$ 1.675,00.
Note que a expressão acima se assemelha com a soma do valor de um projeto estático
mais o valor de uma opção de compra (put) [Trigeorgis (1998)].

Integral de Lebesgue: esperança e variância


Da integral de Lebesgue  g ( x)dP( x) derivamos o valor esperado, variância etc. tanto de
variáveis aleatórias discretas como de contínuas.
Para esperança de uma variável aleatória discreta temos que g ( x ) = x ,
dP( x) = Pr( X = x) e a integral transforma-se num somatório.
Para uma contínua temos que g ( x ) = x e dP ( x) = f ( x)dx .
Para variância g ( x) =  x − E ( X )  .
2

O valor de uma loteria pode ser exatamente representada pela média ponderada pelas
probabilidades subjetivas das utilidades dos resultados da loteria (Teorema Geral da
Redução). Isto nos leva à representação da utilidade da loteria como uma integral de
Lebesgue de uma função g ( x) =  l ( x) na medida de probabilidade :
 
E  l ( X )     l ( x) dP( x)  valor da loteria

Esperança parcial
O domínio da integração é particionado no ponto k. Portanto, para g ( x ) = x :
28

E
(e)
( k ) =  xdP( x)
−

E
(d )
( k ) =  xdP( x)
k

 E ( X ) , se X for contínua
Temos ainda que: E ( e ) ( k ) + E ( d ) ( k ) = 
 E ( X ) + kf (k ), se X for discreta

Função de perda linear


A função de perda é medida do custo de oportunidade de uma decisão, com informação
adicional perfeita ou imperfeita, em relação à melhor decisão sem a informação adicional.
Ela avalia o quanto deixamos de perder quando informação adicional torna-se disponível.
Conforme Pratt et al. (1996), normalmente, em problemas econômicos, a função de perda
é linear. Desta forma, o seu valor está em valor monetário (real, dólar etc.).
Considere g1 ( x) = max x − k ;0 e g2 ( x) = max k − x;0 .
Temos que g1 ( x) − g2 ( x) = k − x .
Portanto:
L = E max ( k − X ;0 )
(e)

k
=  ( k − x )dP( x)
−

L
(d )
= E max ( X − k ;0 )

=  ( x − k )dP ( x )
k
Integrando os dois lados temos que:
L (k ) = L (k ) + k − E ( X )
(e) (d )

Finalmente, temos que:


L ( k ) = kF ( k ) − E (e) ( k )
(e)

L ( k ) = E ( k ) − kG ( k )
(d ) (e)

Esta duas últimas equações são muito úteis na prática e as fórmulas para E ( e) ( k ) para as
principais distribuições estão desenvolvidas no capítulo 9 de Pratt et al. (1996).

Nova expressão para o veip


De maneira geral veip pode ser expresso como:
veip = c N ( d )
k −
sendo d = .

Imediatamente observa-se que quando maior o desvio-padrão  , maior o veip . O
desvio-padrão é a medida de quão incerto o engenheiro está acerca da do julgamento da
média.
29

A distância entre k e a média  determina quão provavelmente o decisor irá mudar de


decisão por causa da nova evidência.
O valor absoluto da inclinação da reta do VCIP, isto é c , é a medida de quão rapidamente
a perda aumenta quando as horas economizadas são menores que k .
Os resultados de Pratt et al. (1996) permitem escrever o veip da seguinte maneira1:
veip = c  ( z) − (  − k ) N ( z)
k −
sendo que z = ,  ( z ) é a função densidade de probabilidade da normal

padronizada e N ( z ) = Pr( X  k ) é a função de probabilidade acumulada da normal
padronizada.
Note que  − k  0 .
Para uma função de perda max  X − k ;0 (opção de compra ou call) teríamos o seguinte
resultado:
veip = c  ( z ) − ( k −  ) N ( z ) 
k −
sendo z = , N ( z ) = 1 − N ( z ) = Pr( X  k ) e k −   0 .

Note que ck é o preço da máquina.

1
Pela notação de Pratt et al. (1996) temos que:
veip = c N ( z ) = c LN  ( − z ) = c  z + LN  ( − z )  = put

call = c LN  ( z ) = c  ( z ) − ( k −  ) N ( z ) 
30

Não comprar a máquina 0

Comprar c(X-k)
não contratar clarividente

Não comprar 0

contratar clarividente
X>=k

Comprar c(X-k)

Não comprar 0

X<k

Comprar c(X-k)

Em função da estrutura da árvore pode-se escrever o veip como:



veip = Pr ( X  k ) E c ( X − k ) | X  k  − max E c ( X − k )  ;0 
 
Se há a decisão de comprar a máquina, então max E c ( X − k )  ;0 = E c ( X − k )  . Logo:
31

 
veip = Pr ( X  k ) E c ( X − k ) | X  k  − max E c ( X − k )  ;0

= E  max c ( X − k ) ;0 − E c ( X − k ) 


= E  max c ( X − k ) ;0 − c ( X − k ) 
= E  max c ( k − X ) ;0
= cE  max ( k − X ) ;0
Desta forma fica demonstrado que o veip é a esperança do valor condicionado da
informação perfeita (VCIP) ou perda de oportunidade condicionada da decisão ótima.
Note que apenas a parte ruim da incerteza (geradora do perda) foi eliminada pela
clarividência. Evidentemente a parte boa da incerteza (geradora de ganho) deve ser e é
mantida para o cálculo do valor de clarividência.
Desta forma, o veip é comumente chamado de preço da quase-opção ou da opção real
[Herath (1998)].

Aplicação
Inferência Estatística

Relação entre a inferência estatística e a função de perda


Rivera (1997, p. 352-5) e Stuart et al. (1999, p. 454-5) abordam a inferência estatística
(estimação de parâmetro e teste de hipótese) como um problema decisório. A função de
perda é medida do custo de oportunidade de uma decisão com informação adicional
perfeita ou imperfeita em relação à melhor decisão sem a informação adicional. Ela
avalia o quanto deixamos de perder quando informação adicional torna-se disponível. O
seu valor normalmente, em problemas econômicos quando a função perda é linear, é
expresso em valor monetário (e.g. real). Em problemas estatísticos como no de inferência
a função de perda normalmente adotada é quadrática.
Conforme Pratt et al. (1996), normalmente em problemas econômicos a função de perda
é linear. Desta forma, o seu valor está em valor monetário (real, dólar etc.). Logo, entra
em cena o valor do dinheiro do decisor que normalmente é determinado por uma função
de utilidade. A função de utilidade é adimensional.
Conforme Wonnacott & Wonnacott (1990, p. 634-5), a estatística bayesiana
essencialmente difere da clássica pela consideração de função de perda. O princípio da
máxima verossimilhança (maximum likelihood principle) (PMV) surge da estatística
bayesiana quando a função de perda é binária. O PMV deve ser visto como um útil
resumidor dos dados, ao invés de um guia para a tomada de decisão.

Abordagem clássica
Pela abordagem clássica os parâmetros são constantes, i.e., não são variáveis aleatórias.
Temos então que toda incerteza está concentrada na amostra.
32

Estim ador
Função de
Am ostra
perda

O estimador (X ) é uma estatística (função de variáveis aleatórias X) que estima um


parâmetro populacional e que deve ser escolhida pelo decisor. A função de perda deve
assumir o valor zero quando o valor do estimador (estimativa) coincidir com o valor do
parâmetro populacional. A função de perda quadrática é comumente utilizada:
2
L X ; X . Se a variância populacional de uma amostra independente e
identicamente distribuída com distribuição normal f x | de tamanho n for conhecida e
o parâmetro a ser estimado for a média populacional = e o estimador escolhido for a
n
1
média amostral X n Xi , então a perda esperada ou função de risco será dado
i 1
por:
f ; X Ef L X ;

L (x ); f x | dx
2
(x ) f x | dx
2

n
O resultado mostra que a perda esperada é a variância da média amostral. Demonstra-se
que este é o estimador com a mínima perda esperada ou função de risco.

Critério de admissibilidade
Uma regra de decisão X , que especifica uma ação a ser executada quando X é
observado, é admissível se não existe uma regra de decisão X tal que
L X ; L X ; para todo  , com desigualdade estrita para pelo menos algum
.

Abordagem bayesiana
Pela abordagem bayesiana a incerteza também é considerada no parâmetro que passa a
ser variável aleatória. Portanto, pode-se calcular a perda esperada mesmo sem evidência
amostral.

Estim ador
Função de
Parâm etro
perda

Portanto, o risco de Bayes é dada por:


33

Ep f X ; f X ; p d

Ef L X ; p d

L (x ); f x | p dxd
2
(x ) f x | p dxd

L (x ); g |x d f (x )dx
2
(x ) g |x d f (x )dx
= variância prévia
Sendo que p ( ) é a função de densidade de probabilidade prévia do parâmetro
populacional  .

Critério de admissibilidade
Uma regra de decisão X , que especifica uma ação a ser executada quando X é
observado e p ( ) é dada, é admissível se não existe uma regra de decisão X tal que
Ep f X ; Ep f X ; para todo  , com desigualdade estrita para pelo
menos algum  .

Teorema de Wald: Toda regra de decisão admissível é uma regra de decisão de Bayes
para alguma distribuição prévia.
Exemplo: (Regra de decisão de Bayes para função de risco quadrática) Quando a função
de perda é quadrática, o risco de Bayes é minimizado pela escolha da média posterior,
qualquer que seja a distribuição prévia.
Quando uma informação amostral é obtida a distribuição do parâmetro pode ser
atualizada gerando a distribuição posterior g | X . A perda esperada deve ser calculada
da seguinte maneira:
Eg f X ; f X ; g |X d

Ef L X ; g |X d

L (x ); f x | g | x dxd
2
(x ) f x | g | x dxd
variância posterior
Logo, quando a função de perda é quadrática, i.e., a função de utilidade é quadrática, a
utilidade esperada é a variância, o valor esperado da informação imperfeita é a diferença
entre a perda esperada considerando a distribuição prévia e a perda esperada
considerando a distribuição posterior do parâmetro. Logo, o valor esperado da
informação imperfeita é positivo, pois a variância prévia é maior que a posterior.
Estamos diante de uma situação decisória com a presença da opção. A informação
amostral é um redutor de incerteza sobre a estimação do parâmetro e, consequentemente,
um redutor da perda esperada. Existe, portanto, a opção de obter informação adicional
para depois escolher o estimador do parâmetro populacional.
34

Parâme Função
Estimador de perda
tro
Sem
Informação
Amostral

Decisão

Com Parâme Função


Informação X Estimador
tro|X de perda
Amostral
Ao serem estabelecidas probabilidades para as hipóteses nula e alternativa o problema de
teste de hipótese também pode ser tratado como um problema decisório conforme Rivera
(1997).

Desenvolvimento da fórmula do preço racional da opção européia


simples ordinária de Black-Scholes a partir do conceito de
clarividência ou do valor esperado da informação perfeita
Conforme Herath (1998, p. 128-32), quando a distribuição de variável aleatória terminal
é lognormal, o preço da opção possui uma equivalência com o preço gerado pela fórmula
de Black-Scholes-Merton.
Imagine que o preço de mercado de um bem S (numa data futura  a partir de uma de
hoje ( t0 = 0 )) possui distribuição lognormal:

=lognormal (  ;  2 )
d
S
ds
 2 
E ( S ) = exp   +  
 2 
Var ( S ) = exp ( 2  +  2 ) exp ( 2 ) − 1
O valor condicionado da informação perfeita para uma opção de compra européia simples
ordinária sobre uma ação é dado por:
VCIP(c = 1; k ; X = S ) = max S − k ;0 .
Portanto, o valor esperado da informação perfeita ou o valor da opção de compra
européia simples ordinária sob a medida de probabilidade lognormal real ou subjetiva do
preço de uma ação é:
  − ln k    − ln k 
veip ( max S − k ;0) = E ( S )    +    − k    
     
35

sendo  () uma normal padronizada acumulada.


O preço da opção real baseado no conceito de clarividência com a suposição da variável
aleatória terminal S ter distribuição lognormal é equivalente à derivação considerando a
hipótese do mundo com preço da incerteza neutralizado do modelo de Black-Scholes-
Merton quando as seguintes hipóteses são assumidas:
1 O prazo da opção é de um ano, isto é,  = 1 ano e a taxa de juros certa ou livre de
risco composta continuamente rf está definida ao ano. É suposto que há um banco
ideal constante na economia [Luenberger (1998, cap. 1)].
2 O princípio de não-arbitragem é exigido. Isto implica a existência de uma única
medida de probabilidade chamada neutralizadora do preço da incerteza . O mundo
econômico no qual todos os ativos com incerteza - com fluxos de caixa incertos -
S
têm o mesmo retorno total esperado exp ( rf ) , i.e., E   = exp(rf ) , é chamado de
 s0 
mundo com preço da incerteza neutralizado (risk-neutral world). Neste mundo
virtual os investidores podem ter qualquer atitude diante da incerteza.
3 O custo do investimento k permanece constante;
4 O preço inicial da ação s0 é conhecido e único.
Herath (1998, p. 131) utilizou outra hipótese número 2. Ao invés de supor a condição de
não arbitragem, exigiu-se que variável aleatória terminal fosse o resultado de um
movimento browniano geométrico. Pelo princípio da parcimônia esta suposição não é
necessária [Siqueira (1999)].
Pelas hipóteses 1 e 2 temos que:
E (S ) = E (S )
 2 
exp   +  = s0 exp(rf )
 2 
Portanto,
2
 = rf − + ln s0 .
2
Substituindo a equação anterior na equação do veip e utilizando as hipóteses 3 e 4,
temos que:
veip 0 ( max S − k ;0 ) = exp ( −rf ) c
= c0
  s0  2    s0  2 
 ln   + rf +   ln   + rf − 
= s0    k 2 
− k exp(− rf )   k 2 
     
sendo  () uma normal padronizada acumulada.
Note que houve uma mudança de medida de probabilidade real ou subjetiva para uma
medida de probabilidade neutralizadora do preço da incerteza ou martingale . Portanto,
o preço da opção européia simples ordinária é único e livre de arbitragem.
36

A equação anterior indica que o conceito de clarividência pode ser utilizado para formar
preço de opção envolvendo problemas complexos de investimento de capital ou para
formar preço de investimento em pesquisa e desenvolvimento como opções quando
restrições menos exigentes são mais apropriadas.
O conceito de clarividência permite a revisão seqüencial dos valores da opção por meio
da abordagem bayesiana no qual o aprendizado real pode ser incorporado ao modelo
utilizando os conceitos da teoria estatística da decisão relacionados com o valor da
informação.
Herath (1998, p. 132) conclui que a idéia de revisão da opção tem sido desprezada pela
literatura de Finanças.
A própria definição de opção do tipo européia simples ordinária leva ao conceito de
clarividência como componente mínima estrutural. A clarividência não elimina a
incerteza, mas apenas antecipa sua resolução. Desta forma, a incerteza sofre uma
translação temporal do futuro para o momento presente da decisão.
É importante frisar que o decisor ainda enfrenta a incerteza da informação do clarividente
que possui a mesma distribuição de probabilidade do fenômeno.
Portanto, o que ocorre é uma imitação perfeita da natureza por parte do clarividente antes
da natureza realmente atuar.
Note ainda que a clarividência altera os valores do domímio da variável de estado,
mantendo as probabilidades dos eventos. Portanto, a função de utilidade deve ser
empregada, pois a incerteza continua existindo (há ainda variação de valores do
domínio).
A revelação completa (clarividência) ou incompleta de informação difere
substancialmente do conceito de hedging (proteção contra flutuações). A operação de
hedging faz com que os retornos (payoffs) tornem-se todos iguais (seguro) ou possam ser
reproduzidos ao longo do tempo por carteira replicante. O hedging altera o ambiente de
exposição ao risco.
Logo, quando há hedging perfeito ou se supõe a existência do mundo com preço da
incerteza neutralizado, a medida de probabilidade subjetiva e a função de utilidade são
desnecessárias para o cálculo do valor da opção. Além disso, a taxa de desconto nesta
situação para o cálculo de valor presente ou futuro deve ser a taxa de juros certa. O
resultado mostra basicamente que o preço único e livre de arbitragem da opção européia
simples ordinária é composto pelo valor do tempo e valor de clarividência ou veip.
O valor do tempo é resultante da preferência temporal considerando a existência do
mundo com preço da incerteza neutralizado e é o valor presente utilizando a taxa de juros
certa do valor intrínseco da opção.
O valor de clarividência ou valor esperado da informação perfeita sob a medida de
probabilidade neutralizadora do preço da incerteza, i.e. veip , resulta da própria
definição do retorno da opção européia simples ordinária, i.e., da expressão de seu valor
intrínseco.
Herath (1998) segue a abordagem bayesiana de formação do preço da opção européia
simples ordinária sem levar em conta a condição de não-arbitragem. Por outro lado, ela
enfatiza a aplicação do conceito de clarividência (valor esperado da informação perfeita)
e do valor esperado da informação imperfeita na formação do preço do que ela designa de
quase-opção ou de opção real. Os conceitos de oportunidade de replicação e de revisão
seqüencial junto ao valor da informação proporcionam a criação de uma abordagem
37

bayesiana de formação do preço da opção real. A derivação da fórmula de Black-Scholes-


Merton, a partir desta abordagem, encontra-se em sua tese. A tese desta autora está
fortemente baseada nas obras de H. Bierman Jr., R. Schlaifer e L. Trigeorgis.

View publication stats

Você também pode gostar