Você está na página 1de 200

An alise Bayesiana de Decis oes

Aspectos Pr aticos
Helio S. Migon
1
e Hedibert F. Lopes
Universidade Federal do Rio de Janeiro (UFRJ)
1
Endere co para correspondencia: Universidade Federal do Rio de Janeiro
(UFRJ), Caixa Postal 68530, CEP 21945-970, Rio de Janeiro RJ - Brazil,
Fax: 55-21-2290 1095, telefone: 55-21-2562-8290, emails: migon@im.ufrj.br
e hedibert@im.ufrj.br
Prefacio
Esta monograa tem origem em notas de aulas ministradas em cursos
do bacharelado de Estatstica e do mestrado de Pesquisa Operacional da
UFRJ. A motiva c ao para preparar este texto vem de duas fontes alterna-
tivas. A primeira, e mais obvia, e a inexistencia de textos cobrindo esta
sorte de conte udo num nvel adequado. Alem disso, as tentativas de se
escrever sobre esse t opico, c a no Brasil, foram sempre muito limitadas,
n ao passando, em geral, da descri c ao dos elementos b asicos da teoria
de decis ao. A segunda, talvez de maior desao, decorre da inexistencia
dessa disciplina nas nossas gradua c oes de estatstica. Pretendemos que
esta monograa colabore para reverter esta posi c ao paradoxal.
Nossa proposta neste texto e combinar aspectos te oricos e pr aticos.
O termo an alise de decis oes e um reconhecimento de que a disciplina de
tomada de decis oes vai alem da descri c ao dos formalismos matem aticos,
como por exemplo, a axiomatiza c ao da teoria de utilidade e os tecnicis-
mos da inferencia estatstica. Alguns aspectos que merecem destaque s ao
a abordagem de modelos gr acos: diagramas de inuencia e arvores de
decis ao e a introdu c ao ` a programa c ao din amica estoc astica. A discuss ao
de metodos de maximiza c ao da utilidade esperada atraves de tecnicas de
Monte Carlo e outro aspecto de extrema import ancia pr atica. Os meritos
deste trabalho, esperamos, est ao na forma como o material coletado de
diversas fontes de extremo valor aplicado e te orico est a organizado. Den-
tre os textos cl assicos que inuiram na organiza c ao desta monograa,
i
ii
destacamos DeGroot (1970), Lindley (1971), Bunn (1984) e, mais recen-
temente, Clemen (1996) e French and Rios-Insua (2000).
Como j a mencionamos, o nvel do livro e adequado para alunos de
gradua c ao em Estatstica, Atu aria e Pesquisa Operacional, que tenham
um mnimo de conhecimentos de Inferencia Estatstica. Ser a util, tambem,
para alunos de Administra c ao e Economia, em nvel de p os-gradua c ao.
Embora pretendamos que este seja um livro texto em an alise de decis oes,
nessa vers ao n ao inclumos exerccios selecionados ao nal dos captulos.
O material como um todo pode ser aplicado em cursos de um perodo leti-
vo, cerca de 45 horas. Os captulos 1, 2, 3 e 5 s ao essenciais para principi-
antes, pois introduzem no c oes elementares de teoria da decis ao, bem como
mecanismos de solu c ao e avalia c ao de problemas de decis ao ( arvores de de-
cis oes, diagramas de inuencia, an alise de sensibilidade). Os captulos 4,
6 e 7 introduzem metodologia mais avan cada. No captulo 4 introduzem-
se, resumidamente, os fundamentos que tornam cienticamente coerente
a teoria da decis ao vista nos outros cap tulos. Os captulos 6 e 7 tratam,
respectivamente, de problemas de decis oes sequenciais e da aplica c ao de
metodos Monte Carlo para a solu c ao do problema da maximiza c ao da
utilidade esperada. Portanto, acreditamos que essa monograa possa ser
exivelmente utilizada para cursos introdut orios (gradua c ao) bem como
para cursos intermedi arios (mestrado).
V arias pessoas colaboraram, de uma forma ou de outra e em v arios
est agios, para tornar vi avel a elabora c ao desse trabalho. Alguns exem-
plos mencionados neste texto tiveram origem em temas de inicia c oes
cientcas e disserta c oes de mestrado que supervisionamos nos ultimos
anos no IM e na COPPE/UFRJ. Destacamos a colabora c ao de Alcione
Miranda (doutoranda de Pesquisa Operacional) em aplica c oes do pacote
DPL, alem da elabora c ao de v arios gr acos, juntamente com Andre Luiz
Silva e Lilian Migon. Agradecemos a Giovanni Parmigiani e Lurdes In-
oue que, juntamente com o segundo autor (HFL), gentilmente cederam
alguns captulos de seu livro Statistical Decision Theory, com publica c ao
iii
prevista para 2003.
Finalmente agradecemos a Associa c ao Brasileira de Estatstica (ABE)
- pela oportunidade de apresentar este conte udo no XV Simp osio Nacional
de Probabilidade e Estatstica (SINAPE). Certamente muitas omiss oes e
v arios erros ser ao detectados pelos eventuais leitores, aos quais pedimos,
desde j a, desculpas. Todas as crticas e coment arios ser ao seriamente con-
sideradas e contribuir ao para tornar mais completa uma pr oxima edi c ao
revisada e ampliada deste material.
Rio de Janeiro, 25 de mar co de 2002.
HSM e HFL
iv
Sumario
1 Introdu c ao 3
1.1 Uma breve nota hist orica . . . . . . . . . . . . . . . . . . . 3
1.2 Sobrevoando o livro . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Nota c ao b asica . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Organiza c ao do Livro . . . . . . . . . . . . . . . . . . . . . 17
2 Conceitos B asicos 23
2.1 Elementos da an alise de decis oes . . . . . . . . . . . . . . . 24
2.2 Especicando a fun c ao de perda . . . . . . . . . . . . . . . 29
2.3 Fun c ao de perda n ao negativa . . . . . . . . . . . . . . . . 34
2.4 Concavidade do risco de Bayes . . . . . . . . . . . . . . . . 36
2.5 Problema de decis ao com e A nitos . . . . . . . . . . . 38
2.6 Revisitando a regra minimax . . . . . . . . . . . . . . . . . 43
2.7 Problema de decis ao usando dados . . . . . . . . . . . . . 46
2.8 An alise de risco . . . . . . . . . . . . . . . . . . . . . . . . 50
2.9 Domin ancia estoc astica . . . . . . . . . . . . . . . . . . . . 55
3 Modelos Gr acos 61
3.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . 63
3.3 Diagrama de inuencia e arvore de decis ao . . . . . . . . . 68
v
vi SUM

ARIO
3.4 Introdu c ao ao DPL . . . . . . . . . . . . . . . . . . . . . . 78
4 Probabilidade subjetiva e utilidade 89
4.1 Dutch book e regras escore . . . . . . . . . . . . . . . . 92
4.2 Utilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2.1 Paradoxo de Saint Petersburg . . . . . . . . . . . . 98
4.2.2 Teorema de von NeumannMorgernstern . . . . . . 98
4.3 M ultiplos atributos . . . . . . . . . . . . . . . . . . . . . . 103
4.4 Medidas de avers ao ao risco . . . . . . . . . . . . . . . . . 105
5 An alise de Sensibilidade 109
5.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.2 Identica c ao e estrutura . . . . . . . . . . . . . . . . . . . 110
5.3 Exemplo de an alise preliminar de sensibilidade . . . . . . . 113
5.4 Conceitos b asicos de an alise de sensibilidade . . . . . . . . 118
5.5 Sensibilidade da distribui c ao a priori . . . . . . . . . . . . 122
5.6 Sensibilidade conjunta: priori e utilidade . . . . . . . . . . 126
6 Programa c ao Din amica 135
6.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
6.2 Uma classe de problemas de otimiza c ao . . . . . . . . . . . 136
6.3 Programa c ao din amica . . . . . . . . . . . . . . . . . . . . 138
6.3.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . 144
6.4

Arvore de decis ao e programa c ao din amica . . . . . . . . . 149
6.5 Op c oes reais: uma introdu c ao . . . . . . . . . . . . . . . . 152
7 MUE via metodos Monte Carlo 163
7.1 Aproximando U(d) via Monte Carlo . . . . . . . . . . . . . 164
7.2 Ajuste da curva de utilidade . . . . . . . . . . . . . . . . . 166
7.3 Simulando o modelo aumentado . . . . . . . . . . . . . . . 167
7.3.1 Tempera simulada em problemas de decis ao . . . . 168
7.4 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
SUM

ARIO vii
7.4.1 Tamanho amostral da Normal . . . . . . . . . . . . 171
7.4.2 Tamanho amostral da Binomial . . . . . . . . . . . 173
7.4.3 Debrila c ao do cora c ao . . . . . . . . . . . . . . . . 175
viii SUM

ARIO
Lista de Figuras
1.1 Diagrama de inuencia . . . . . . . . . . . . . . . . . . . . 7
1.2

Arvore de decis ao inicial . . . . . . . . . . . . . . . . . . . 8
1.3 Solu c ao via arvore de decis ao . . . . . . . . . . . . . . . . 8
1.4 Valor monet ario esperado. a
1
- linha cheia; a
2
- linha pon-
tilhada; a
3
- linha tracejada. . . . . . . . . . . . . . . . . . 9
1.5 Decis oes sequenciais: diagrama de inuencia . . . . . . . . 11
1.6 Decis oes sequenciais: arvore de decis ao . . . . . . . . . . . 20
1.7 Decis oes sequenciais: solu c ao . . . . . . . . . . . . . . . . . 21
1.8 Diagrama de inuencia para informa c ao imperfeita . . . . 21
2.1 Fun c oes de perda alternativas em problemas de estima c ao:
perda zero-um (linha cheia), perda quadr atica (linha pon-
tilhada) e perda absoluta (linha tracejada). . . . . . . . . . 31
2.2 Concavidade do risco de Bayes: n(/) < (gura da es-
querda); n(/) = (gura da direita). . . . . . . . . . . . 38
2.3 Efeito da imprecis ao sobre : incremento no risco de Bayes 39
2.4 Representa c ao gr aca de G . . . . . . . . . . . . . . . . . . 40
2.5 Poliedro convexo; caso k = 2 e m = 6 . . . . . . . . . . . 43
2.6 Regra minimax - determina c ao gr aca . . . . . . . . . . . 45
2.7 Regra minimax - determina c ao gr aca . . . . . . . . . . . 46
2.8 Admissibilidade da regra de Bayes . . . . . . . . . . . . . . 47
2.9 Risco de Bayes - exemplo com dados . . . . . . . . . . . . 51
ix
x LISTA DE FIGURAS
2.10 F domina G estocasticamente em primeira ordem. . . . . . 57
2.11 G e um espalhamento de F com preserva c ao da media. . . 58
3.1 Rede Bayesiana: cada n o refere-se a uma vari avel aleat oria
dicot omica . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2 Rede Bayesiana para o modelo fatorial. . . . . . . . . . . . 66
3.3 Modelo fatorial est atico no WinBugs. . . . . . . . . . . . . 67
3.4 DI para risco b asico: decis ao prim aria (a), evento incerto
() e consequencias (c) . . . . . . . . . . . . . . . . . . . . 71
3.5 DI para poltica de risco b asico . . . . . . . . . . . . . . . 71
3.6 AD para investimento em ativo de risco: a decis ao prim aria
seria investir ou n ao, o evento incerto caracterizaria o suces-
so ou fracasso do investimento e a consequencia seria o
montante auferido. . . . . . . . . . . . . . . . . . . . . . . 72
3.7 DI e AD para informa c ao imperfeita. . . . . . . . . . . . . 74
3.8 DI para c alculos intermedi arios; uma situa c ao de objetivos
m ultiplos sem decis ao de risco. . . . . . . . . . . . . . . . . 74
3.9 DI agregado sobre o uso de qumico. uso: nvel de uti-
liza c ao do produto qumico, risco: risco de c ancer, valor:
valor econ omico, : potencial cancergeno e : taxa de
exposi c ao ao produto qumico. . . . . . . . . . . . . . . . . 75
3.10 DI para c alculo do risco de c ancer . . . . . . . . . . . . . . 76
3.11 Diagrama de inuencia para decis oes sequenciais . . . . . . 77
3.12 Diagrama de inuencia . . . . . . . . . . . . . . . . . . . . 81
3.13 Resultado nal . . . . . . . . . . . . . . . . . . . . . . . . 82
3.14 Rainbow diagram . . . . . . . . . . . . . . . . . . . . . . . 83
3.15 Valor da informa c ao perfeita . . . . . . . . . . . . . . . . . 84
3.16 Diagrama de inuencia - informa c ao imperfeita . . . . . . 85
3.17 Diagrama de inuencia - informa c ao imperfeita . . . . . . 88
4.1 Fun c ao de utilidade de um agente averso ao risco. . . . . . 106
LISTA DE FIGURAS xi
5.1 Diagrama de inuencia: receita e custo . . . . . . . . . . . 116
5.2 Diagrama de inuencia completo . . . . . . . . . . . . . . 117
5.3 Diagrama tornado . . . . . . . . . . . . . . . . . . . . . . . 119
5.4 Valor esperado da distribui c ao preditiva, segundo duas pri-
oris alternativas, e frequencias observadas no perodo t =
9 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.5 Gr aco de versus com regi ao de sensibilidade de . . 130
5.6 Efeito de
2
na regi ao de indiferen ca. . . . . . . . . . . . . 132
5.7 Efeito de a - coeciente de avers ao ao risco na curva de
indiferen ca. . . . . . . . . . . . . . . . . . . . . . . . . . . 133
6.1 A linha cheia representa o caminho mais curto ligando a a
c e a linha pontilhada um caminho alternativo de b a c, tal
que o trajeto total seja mais longo. . . . . . . . . . . . . . 137
6.2 O grafo acima tem vertices rotulados de 1 a 10 e arcos com
as dist ancias anotadas (d
i,j
) . . . . . . . . . . . . . . . . . 139
6.3 Compara c ao de tres fun c oes de utilidades alternativas: u(a) =
a
1/2
, u(a) = 1 exp(a), a > 0 ou u(a) = 1 1/(1 +a). . 146
6.4

Arvore de decis ao com um n umero nito de est agios. . . . 151
7.1 (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integra c ao Monte Carlo (M=10.000), (c) 10.000 pares (n
i
, u
i
)
e (d) Curva ajustada (loess no S-plus). Valores xados:
(, , , c) = (1.0, 0.0, 1.0, 0.01). . . . . . . . . . . . . . . . 172
7.2 (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integra c ao Monte Carlo (M=10.000), (c) 10.000 pares (n
i
, u
i
)
e (d) Curva ajustada (loess no S-plus). Valores xados:
(, , , c) = (3.0, 0.0, 3.0, 0.01). . . . . . . . . . . . . . . . 173
7.3 U
J
(n) para J = 20 e M = 10.000 simula c oes. . . . . . . . . 174
7.4 As linhas na e grossa representam, respectivamente, os
valores aproximado e verdadeiro de U(n) (M uller and Parmi-
giani, 1995). . . . . . . . . . . . . . . . . . . . . . . . . . . 176
xii LISTA DE FIGURAS
7.5 U(D) para c = 0.02. O planejamento otimo foi d
0
= 9.25 e
a = 0.30, que est ao marcados com um tri angulo no gr aco
(Clyde, M uller and Parmigiani, 1993). . . . . . . . . . . . 179
Lista de Tabelas
1.1 Consequencias (custos) em unidades monet arias (u.m.) . . 6
1.2 Vari aveis de entrada - domnio de varia c ao . . . . . . . . . 12
1.3 Verossimilhan ca - p(x[) . . . . . . . . . . . . . . . . . . . 15
1.4 Distribui c oes ` a posteriori, ([x), e preditiva, p(x). . . . . 15
2.1 Perda associada a cada a c ao e cada estado da natureza. . . 26
2.2 Fun c ao de ganho da livraria (em dezenas) . . . . . . . . . 28
2.3 Perdas monet arias (em milhares) . . . . . . . . . . . . . . 35
2.4 Fun c ao de perda n ao negativa (L
0
(, a) = L(, a)
0
()) . 35
2.5 Fun c ao de perda . . . . . . . . . . . . . . . . . . . . . . . 35
2.6 Fun c ao de perda n ao negativa . . . . . . . . . . . . . . . . 36
2.7 Fun c ao de perda n ao negativa . . . . . . . . . . . . . . . . 41
2.8 Fun c ao de perda . . . . . . . . . . . . . . . . . . . . . . . 44
2.9 Fun c ao de perda n ao negativa . . . . . . . . . . . . . . . . 44
2.10 Fun c ao de perda. . . . . . . . . . . . . . . . . . . . . . . . 49
2.11 Fun c ao de probabilidade, p(x[). . . . . . . . . . . . . . . . 49
2.12 Distribui c ao conjunta de e x. . . . . . . . . . . . . . . . 50
2.13 Retornos mensais de dois ativos de risco . . . . . . . . . . 54
2.14 Retornos e riscos dos ativos a
1
e a
2
. . . . . . . . . . . . . 54
2.15 Matriz de ganhos . . . . . . . . . . . . . . . . . . . . . . . 55
3.1 Probabilidades conjuntas sobre A . . . . . . . . . . . 86
xiii
LISTA DE TABELAS 1
3.2 Consequencias lucro lquido em / . . . . . . . . . . 87
5.1 Vari aveis de entrada - domnio de varia c ao . . . . . . . . . 118
5.2 Dados de n umero de consultas medicas . . . . . . . . . . . 121
5.3 Novos valores associados as vari aveis mais relevantes . . . 125
5.4 Problema de decis ao sem dados. . . . . . . . . . . . . . . . 126
5.5 Alternativas considerando as varia c oes extremas de . . . . 127
5.6 Perdas no mercado de comodities. . . . . . . . . . . . . . . 128
5.7 Valor equivalente certo. . . . . . . . . . . . . . . . . . . . . 131
6.1 Poltica otima (em negrito) . . . . . . . . . . . . . . . . . . 141
6.2 Compara c ao dos ganhos sequenciais com os do Profeta . . 150
2 LISTA DE TABELAS
Captulo 1
Introdu cao
1.1 Uma breve nota hist orica
Teoria de Decis ao e uma area que vem se desenvolvendo aceleradamente
desde o meado do seculo passado. Uma s olida base axiom atica foi intro-
duzida por von Neumann and Morgenstern (1944). Os trabalhos de Wald
(1949) e Savage (1954) s ao absolutamente centrais nos desenvolvimentos
estatsticos da teoria da decis ao, embora esta area envolva muitos outros
aspectos, sendo claramente de natureza interdisciplinar.
O termo teoria da decis ao e utilizado de forma muito generica e in-
terdisciplinar, decorrendo, possvelmente, da natureza ampla do processo
de decis ao. Dentre as areas do conhecimento que consideram aspectos
da tomada de decis ao destacam-se: inteligencia articial, economia, busi-
ness, matem atica, pesquisa operacional e estatstica, e claro. Desta forma
a Teoria da Decis ao e uma disciplina de estatstica envolvendo e explo-
rando a estrutura do processo de tomada de decis ao.
Existe um grande n umero de excelentes livros de an alise, teoria e
suporte ` a decis ao. Embora a escolha de alternativas com base no valor
esperado da utilidade tenha v arios seculos (vale mencionar a contribui c ao
3
4 CAP

ITULO 1. INTRODUC

AO
de Bernoulli, 1738, no famoso paradoxo de St. Petersburg), nos limitare-
mos a listar e comentar parte da literatura p os-guerra. Os desenvolvi-
mentos em teoria dos jogos est ao descritos pelo menos em tres livros
fundamentais: von Neumann and Morgenstern (1944), Wald (1949) e
Savage (1954). von Neumann and Morgenstern (1944) introduzem as
propriedades minimax, o teorema minimax e a extens ao dessas ideias a
v arias classes de jogos. Por sua vez, Savage (1954) estende a axiom-
atiza c ao de von Neumann and Morgenstern para cobrir probabilidades
subjetivas e utilidades. Savage pode ser mencionado como um dos princi-
pais mentores da inferencia Bayesiana. Luce and Raia (1957) resumem
muito da teoria dos jogos e alguns resultados experimentais.
Nos anos 60 destacamos os livros de Raia and Schlaifer (1961) onde
se encontra pela primeira vez a tecnologia simples de se tomar decis oes
concatenadamente. Os resultados de programa c ao din amica obtidos por
Bellman (1957) s ao relacionados com os procedimentos de maximiza c ao
da utilidade esperada num artigo hist orico de Lindley (1961). Surgem,
ainda, nesta decada v arios textos de teoria estatstica da decis ao. Cita-
mos como exemplos marcantes os livros de Ferguson (1967) e o DeGroot
(1970). No que concerne a an alise de decis oes, isto e: aspectos mais apli-
cados da tomada de decis oes sob incerteza, podemos mencionar os livros
de Raia (1996), Lindley (1971) e Lindgren (1971).
Uma retomada na publica c ao de textos nesta area e observada nas
ultimas duas decadas. Uma das caractersticas dessas novas publica c oes
e incorporar, mais e mais, aspectos pr aticos incluindo o uso de softwares
especcos (DPL 4.0 (1998) e BUGS Spiegelhalter, Thomas, Best, and
Gilks (1996)). Novidades em termos de diagramas de inuencia s ao en-
contradas em Smith (1988) e discuss oes sobre decis oes em grupos ampla-
mente discutidos em French (1989). Um cl assico desta decada, com forte
enfase em aspectos estatsticos da teoria da decis ao, e o texto de Berger
(1985). Mais recentemente temos um texto excelente, a nvel introdut orio,
de Clemen (1996). Diversos aspectos operacionais s ao exemplicados uti-
1.2. SOBREVOANDO O LIVRO 5
lizando um software especco - o DPL. Alem disto, aspectos de teoria
da utilidade multi-atributo s ao discutidos a um nvel intermedi ario.
1.2 Sobrevoando o livro
Utilizaremos um exemplo muito simples para promover um sobrev oo da
metodologia apresentada nos pr oximos seis captulos e apendices. Este
exemplo e baseado no famoso artigo The rev counter decision, P.G. Moore
and H. Thomas, (1973), Opl.Res. Q., 24, 337-351.
Parte 1: Coloca cao do problema e analise preliminar
Uma f abrica de componentes de autom ovel - Pethold - esta enfrentando
uma nova demanda por um de seus produtos. Um dos diretores e quatro
executivos se reunem para considerar formas alternativas de lidar com
este eventual aumento da demanda.
Ap os algumas discuss oes concluem por duas a c oes alternativas (mais
o status quo) capazes de atender ` a nova demanda:
a
1
- comprar novos equipamentos (NvEqui)
a
2
- contratar horas extras (HrExt)
a
3
- manter nvel de produ c ao atual (NvAtua)
O Diretor n ao admite subcontratar outro fornecedor por quest oes es-
trategicas. Alem disto, para simplicar, n ao h a expectativas de varia c oes
nos pre cos. Ap os discutirem o que aconteceria sob cada uma das alterna-
tivas e decidirem trabalhar com um horizonte de planejamento de um ano,
o pessoal de marketing julgou que a demanda, a se manter a tendencia
atual, poderia subir uns 15% (Alta), mas n ao exclui a possibilidade de
uma queda de 5% (Baixa) caso o mercado se torne sofrvel. As chances
6 CAP

ITULO 1. INTRODUC

AO
relativas com rela c ao a esses dois estados s ao de 3:2 a favor do crescimento
das vendas, ou seja, a probabilidade de Alta, , e igual a 0.6.
Neste momento solicitaram ao pessoal de contabilidade que levantasse
os custos de cada uma das alternativas. Ap os v arias idas e vindas, envol-
vendo os gerentes produ c ao, de pessoal e nanceiro, respons aveis pelos
custos de material e equipamentos, de sal arios e pelos custos nanceiros,
respectivamente, chegaram aos n umeros da tabela 1.1.
Estados
A c oes Alta Baixa
NvEqui 220 130
HrExtr 210 150
NvAtua 170 150
Tabela 1.1: Consequencias (custos) em unidades monet arias (u.m.)
Essa tabela contem v arios ingredientes que ser ao discutidos estensi-
vamente nos captulos subsequentes. Por exemplo, NvEqui, HrExtr e
NvAtua pertencem ao espa co das a c oes (decis oes), enquanto Alta e Baixa
comp oem os estados da natureza. A tabela 1.1 representa a fun c ao obje-
tivo (custos, perdas, ganhos, utilidades, etc). No captulo 2 esses e outros
elementos b asicos da teoria da decis ao estatstica ser ao introduzidos for-
malmente. Voltando ao problem e dado o grande volume de informa c oes
o gerente de produ c ao sugere a utiliza c ao de um pacote de an alise de de-
cis oes para organizar um diagrama de inuencia (gura 1.1), introduzir
os dados, obter a arvore de decis ao (gura 1.2) e resolver o problema.
O diagrama de inuencia apresenta atraves de grafos o problema de
decis ao a ser resolvido. Nesse grafo as rela c oes entre as incertezas en-
volvidas (vendas e ganhos) e as a c oes disponveis s ao representadas por
setas direcionadas. Existe uma rela c ao biunvuca entre a arvore de de-
cis ao e o diagrama de inuencia em um problema de decis ao, sendo o
1.2. SOBREVOANDO O LIVRO 7
Figura 1.1: Diagrama de inuencia
segundo de mais f acil elabora c ao em problemas relativamente complex-
os. O captulo 3 e inteiramente dedicado ` a introdu c ao e discuss ao acerca
desses mecanismos de decis ao, bem como sua implementa c ao atraves do
DPL. Inicialmente, para manter as coisas bem simples, evitam ate mesmo
a inclus ao de certos custos de investimento em capital e outros.
O gerente de marketing explica para os demais que o desej avel e es-
colher, dentre as alternativas, aquela que produzir o melhor ganho esper-
ado global. Assim o criterio de sele c ao ser a o chamado EMV - Expected
Monetary Value. Utilizando o pacote ele obtem facilmente o resultados
desejados.
Observe que os valores monet arios esperados das tres alternativas
(a c oes a
1
, a
2
e a
3
) s ao, respectivamente, 184, 186 e 162. Como se de-
seja a a c ao de menor custo esperado, a manuten c ao do nvel de produ c ao
atual e a melhor estrategia.
Considerando a arbitrariedade das chances relativas dos eventos in-
8 CAP

ITULO 1. INTRODUC

AO
Figura 1.2:

Arvore de decis ao inicial
Figura 1.3: Solu c ao via arvore de decis ao
1.2. SOBREVOANDO O LIVRO 9
certos o gerente nanceiro sugere uma an alise de sensibilidade, t opico
abordado no captulo 5. O que ocorreria se as chances relativas fossem
modicadas? Se o valor de fosse, por exemplo, 15%, ao inves de 60%,
os valores monet arios esperados para cada uma das a c oes seriam 143.5,
159 e 153. Nesse novo cen ario, a melhor estrategia e a compra de novos
equipamentos. Como fun c ao de os custos s ao
a
1
: 90 + 130
a
2
: 60 + 150
a
3
: 20 + 150
Note que a
3
e dominada por a
2
, uma vez que para todos os valores
de (0, 1) a reta que descreve o valor esperado de a
3
passa por baixo
da reta que descreve o valor esperado de a
2
. Isso pode ser visto na gura
1.4.
Figura 1.4: Valor monet ario esperado. a
1
- linha cheia; a
2
- linha pontil-
hada; a
3
- linha tracejada.
10 CAP

ITULO 1. INTRODUC

AO
O mesmo j a n ao ocorre com respeito a a
1
. Diante disto, n ao contin-
uaremos considerando a a c ao a
3
. Por outro lado, a a c ao a
1
ser a prefervel
a a
2
se e somente se 90 + 130 > 60 + 150 ou seja p > 2/3. A solu c ao
que obtivemos e insensvel a escolha de , desde que se acredite que
seja pelo menos igual a 2/3.
Para nalizar esta primeira parte o diretor intervem alertando que
o problema foi excessivamente simplicado. Os valores monet arios s ao
razo aveis (varia c ao de 5% no m aximo), a solu c ao nal n ao e sensvel ao
valor de , mas deveriam tentar um horizonte de planejamento maior e
discutir se o EMV e adequado para este tipo de tomada de decis ao.
Parte 2: Analise sequencial com maior horizonte de
planejamento
Ao voltarem do lanche j a encontraram preparados, pelos gerentes nan-
ceiro e de marketing, um novo diagrama de inuencia e uma nova arvore
de decis ao (guras 1.5 e 1.6, respectivamente). Esta nova congura c ao in-
clui uma an alise mais realista feita ao longo de dois anos, utiliza somente
a
1
e a
2
e particiona as vendas no segundo ano em tres nveis: alta, m edia
e baixa. Como podemos observar temos duas caixas decis orias, dois n os
aleat orios, denominados vend1 e vend2 e um unico n o de consequencia
(ver gura 1.5.
Esse diagrama resume os valores monet arios lquidos totais sem levar
em conta o valor do dinheiro no tempo. Destacamos que as decis oes s ao
conectadas por arcos, traduzindo a natureza sequencial do problema e que
os n os aleat orios tambem se conectam por arcos, indicando que a segunda
distribui c ao de probabilidae e condicional aos resultados observados no
primeiro n o.
Finalmente, as consequencias dependem destes quatro elementos. Pre-
cisamos portanto acessar 24 consequencias monet arias, as quais est ao ap-
resentados na tabela 1.2.
1.2. SOBREVOANDO O LIVRO 11
Figura 1.5: Decis oes sequenciais: diagrama de inuencia
Na tabela 1.2 s ao apresentados os custos relativos aos dois anos para
cada uma das alternativas. Por exemplo, a
4
corresponde a decidir por
NvEqui no primeiro ano e, tambem, no segundo ano, e assim sucessiva-
mente. Lembre-se que a decis ao a
3
foi eliminada da an alise.
Avalia c ao de Probabilidades
Como recem comentamos as probabilidades do crescimento das ven-
das do segundo ano ser alto, medio ou baixo, depender a do ocorrido no
primeiro. Suponha que
P[A
2
[B
1
] = P[M
2
[B
1
] = 0.4 e P[B
2
[B
1
] = 0.2
P[A
2
[A
1
] = 0.5, P[M
2
[A
1
] = 0.4 e P[B
2
[A
1
] = 0.1
onde A, M e B representam os eventos alta, m edia e baixa, respecti-
vamente. Estas probabilidades foram obtidas com base nas informa c oes
disponveis, subjetivas ou n ao, dos gerentes de marketing e de nan cas.
Na verdade s ao educated guesses. A solu c ao e facilmente obtida atraves
12 CAP

ITULO 1. INTRODUC

AO
A c oes Alto Media Baixa
a
4
410 395 380
a
5
425 408 395
a
6
350 300 280
a
7
345 325 310
a
8
400 350 315
a
9
380 320 370
a
10
280 220 400
a
11
300.25 204 460
Tabela 1.2: Vari aveis de entrada - domnio de varia c ao
do pacote e utiliza um algoritmo que intercala opera c oes de c alculo de
esperan ca para eliminar incertezas e maximiza c ao de consequencias es-
peradas para eliminar as alternativas menos interessantes. O algoritmo
opera de tr as para a frente ou seja backwards. Na gura 1.7 observa-
mos os resultados nais obtidos dessas opera c oes, os quais foram obtidos
quase que instantaneamente (o diretor deixou-os trabalhando, supondo
que demorariam muito!).
Por exemplo os valores 401 e 415.2 no extremo direito superior da
arvore refere-se ` as esperan cas calculadas com a distribui c ao condicional
descritas acima.

E claro que a alternativa HrExtr e prefervel pois tem
maior ganho esperado. Chegamos, assim, a um novo n o aleat orio e ter-
emos de calcular novas esperan cas. Desta vez usaremos a distribui c ao
marginal referente a vari avel aleat oria denominada vendas do primeiro
ano. A melhor decis ao e no primeiro ano ser a contratar HrExtra, o que
difere da solu c ao obtida anteriormente. Quais as raz oes para esta subta
modica c ao? Uma das raz oes e que em um ano a NvAtual e melhor pois
os custos de investimento n ao se cobrem neste curto prazo.
Alternativa ao EMV
1.2. SOBREVOANDO O LIVRO 13
O diretor esta intrigado com o uso do EMV e prop oe a aplica c ao de
um princpio alternativo: maxmin. Este princpio se basea na escolha do
pior que pode acontecer; isto e, seleciona-se a pior consequencia em cada
sequencia de alternativas. Estas variam de 200 a 395. A seguir escolha a
melhor das piores alternativas.

E claro que a sequencia de a c oes levando
a 395 ser a escolhida. Esta inicia-se tambem pela alternativa a
1
. Uma
vez convencido o diretor assumiu a decis ao de comprar de imediato os
equipamentos necess arios e usar no segundo ano horas extras qualquer que
seja o caso. Na verdade ele sugere que ao longo do ano sejam coletados
mais dados sobre o problema, que se continue discutindo os criterios de
sele c ao de alternativas e formas de incorporar essas novas informa coes.
Parte 3: Justicando o questionamento ao uso do
EVM
Alguns meses mais tarde, com a orienta c ao de especialista em an alise de
decis oes, compreenderam a raz ao de estarem duvidosos diante do uso do
EMV. O ponto e que, ainda que de forma inconsciente, percebiam que suas
rea c oes aos resultados monet arios variam de acordo com o capital anteri-
ormente acumulado. O especialista em an alise de decis oes, provavelmente
um academico, didaticamente providenciou um exemplo exclarecedor.
Suponha que voce se ve diante de uma escolha compuls oria entre dois
jogos, assim descritos:
(i) voce perde R$10.000,00 com probabilidade 0.001 ou, ao contr ario,
n ao perde nada com probabilidade 0.999.
(ii) voce perde R$15,00 com probabilidade 1, isto e com certeza.
Embora o valor esperado de (i) seja ligeiramente menor do que o de
(ii) (10 < 15), n ao e um absurdo encontrar tomadores de decis oes que
preram (ii) a (i). Quando uma pessoa segura seu carro, sua casa, ou
14 CAP

ITULO 1. INTRODUC

AO
qualquer outro bem, ela geralmente prefere pagar (perder) R$15,00 do que
correr a remota chance de perder o bem. Portanto, se as consequencias
monet arias s ao pequenas proporcionalmente ao capital, ent ao a ado c ao do
EMV e razo avel. Caso contr ario, e mais prudente (leia-se coerente) lan car
m ao de uma fun c ao de utilidade do dinheiro, a qual considere a forma
conservadora diante do risco, ou qualquer outra maneira de considerar a
avers ao ao risco. Esse problema central da teoria da decis ao, ou seja a
quantica c ao da utilidade do dinheiro (ou da sa ude, do empreendimento,
etc), e extensivamente abordado no captulo 4.
O diretor levanta um outro ponto relevante: o momento em que s ao
feitas as despesas e realizadas as receitas. Isto signica que o dinheiro
tem valor diferente no tempo.

E preciso usar o valor presente dos retornos
lquidos.
Parte 4: Usando um especialista
Ap os v arias discuss oes surgiu uma nova possibilidade: contratar um con-
sultor! Embora esse servi co gere um custo adicional de, digamos 5000
reais, ele produzir a um relat orio detalhado sobre o mercado de auto-pe cas
e far a uma avalia c ao favor avel ou n ao sobre o crescimento do mercado do
pr oximo ano. Como ele e falvel, o gerente de marketing assessou as
informa c oes objetivas sobre o desempenho do consultor baseando, por
exemplo, em informa c oes obtidas junto a outras rmas do ramo. Essa
informa c ao e apresentada na tabela 1.3 abaixo.

E claro que um consultor perfeito (impossvel ou muito caro!) teria


uma tabela com 1s e 0s. Note que tinhamos uma distribui c ao a pri-
ori sobre os estados da natureza, (), e agora temos na tabela 1.3 a
distribui c ao de x (a informa c ao adquirida) dado (estado da natureza),
p(x[), ou seja, a fun c ao de verossimilhan ca. Podemos, ent ao, obter as
distribui c oes a posteriori e preditiva sem maiores diculdades, como ap-
resentadas na tabela 1.4. Assim
1.2. SOBREVOANDO O LIVRO 15
Avalia c ao (x)
Estados () Favor avel Desfavor avel
Alta 0.9 0.1
Baixa 0.2 0.8
Tabela 1.3: Verossimilhan ca - p(x[)
Mercado () x
1
x
2
()
Alta 0.87 0.16 0.6
Baixa 0.13 0.84 0.4
p(x) 0.62 0.38
Tabela 1.4: Distribui c oes ` a posteriori, ([x), e preditiva, p(x).
O diagrama de inuencia e ent ao refeito incluindo um quadrado ref-
erente a alternativa de contrata c ao do consultor.
O resultado nal usando a distribui c ao a posteriori, nos ramos mais
a direita da arvore de decis ao isomorfa ao diagrama de inuencia acima
fornece, por exemplo, os valores esperados: a
1
: 208.3, a
2
: 202.2 e a
3
:
167.4. Assim, a
1
e prefervel dado que o consultor e favor avel (x
1
) e seu
valor esperado e 208.3. Por outro lado se o consultor n ao for favor avel
(x
2
) ent ao a
2
e prefervel e seu valor esperado ser a 159.6. Agora temos
essas duas consequencias e devemos usar novamente o valor esperado.
Como p(x
1
) = .62, ent ao obtemos: 208.3 .62 + 159.6 .38 5 = 184.8.
Este valor compara desfavoravelmente com o obtido anteriormente, 162.
Assim o consultor n ao deve ser contratado.
16 CAP

ITULO 1. INTRODUC

AO
1.3 Nota c ao b asica
Nos pr oximos 6 captulos v arios conceitos novos ser ao introduzidos, trazen-
do consigo uma enormidade de nota c ao matem atica necess aria para facil-
itar a exposi c ao e o desenvolvimento dos mesmos. Abaixo introduzimos
uma lista abreviada com as principais nota c oes. Tambem introduzimos
aqui algumas siglas comumente utilizadas no livro.
/: Espa co das a c oes (decis oes). Elementos s ao denotados por a.
: Espa co dos estados da natureza. Elementos s ao denotados por .
L(, a): Perda associada ao estado da natureza sob a a c ao a.
U(, a): Fun c ao de utilidade. Geralmente, L(, a) = U(, a).
(): Distribui c ao a priori de .
r(, a): Risco ou perda esperada da a c ao a. r(, a) =

L(, a)()d.
a
b
: A c ao (decis ao) de Bayes. a
b
= arg min
a
r(, a).
a
m
: A c ao minimax. a
m
= arg min
a
max

L(, a).
A: Espa co amostral. Elementos s ao x.
p(x[): Modelo probabilstico
(x): Regra de decis ao.
p(x): Distribui c ao preditiva.
([x): Distribui c ao a posteriori de dado x.
AD:

Arvore de Decis ao.
1.4. ORGANIZAC

AO DO LIVRO 17
DI: Diagrama de Inuencia.
DPL: Decision Programming Language - Software para teoria da decis ao
atraves de AD e DI.
DAG: Direct Acyclic Graph.
BUGS: Bayesian Using Gibbs Sampling.
DsR: Downside Risk.
RaM: Retorno Aceit avel Mnimo.
VaR: Value at Risk.
u.m.: unidade monet aria.
MCMC: Monte Carlo via Cadeias de Markov.
1.4 Organiza c ao do Livro
No captulo 2 discutiremos v arios aspectos introdut orios da teoria de de-
cis ao. Especicaremos a tripla que caracteriza um problema de decis ao
e apresentaremosdiversas fun c oes de perda para problemas especcos.
Tambem analisamos a concavidade do risco de Bayes e exploraremos
gracamente v arias propriedades das regras de Bayes e minimax. Prob-
lemas de decis ao com espa co de decis oes e espa co de estados da natureza
nitos, problema de decis ao baseado em dados experimentais, diferentes
conceitos e medidas de risco e domin ancia estoc astica tambem s ao intro-
duzidos nesse captulo.
No captulo 3 apresentaremos v arios instrumentos gr acos disponveis
para facilitar a modelagem de problemas complexos de decis ao. Inicia-
remos pela descri c ao das redes Bayesianas e depois apresentaremos os
18 CAP

ITULO 1. INTRODUC

AO
diagramas de inuencia e as arvores de decis ao. Ser ao tambem apre-
sentados neste captulo os principais aspectos dos pacotes DPL - data
programming language e um exemplo envolvendo o uso do WinBUGS -
Bayesian analysis using Gibbs sampler.
O captulo 4 introduz alguns resultados fundamentais para a teoria
estatstica da decis ao e que servem como s olida base para o uso rotineiro
dos princpios da teoria da decis ao. Introduzimos o princpio da coerencia
atraves do famoso argumento Dutch book para, em seguida, introduzir as
scoring rules (ou regras escores), que induzem o tomador de decis oes a
fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto ao
informar suas probabilidades. O tambem famoso (e curioso) paradoxo de
St. Petersburg que ilustra a diculdade de se dissociar o valor do dinheiro
de sua utilidade tambeme discutido. Ainda nesse captulo introduzimos o
teorema de representa c ao von Neumann-Morgenstern que essencialmente
introduz todos os alicerces necess arios para o tomador de decis oes sobre
incerteza escolher entre duas alternativas de a c ao tendo sem sua frente
somente os possveis estados da natureza, suas utilidades e probabilidades.
Discutiremos alguns aspectos da an alise de sensibilidade no captulo 5.
Esse e problema central na estrutura c ao e solu c ao de modelos de decis ao.
As tecnicas de an alise de decis ao usam como ingrediente fundamental jul-
gamentos do tomador de decis ao atraves de suas preferencias e cren cas.
A distribui c ao a priori, o modelo que descreve os dados disponveis e a
fun c ao de perda ou utilidade impactam a solu c ao nal do problema. A
quest ao e avaliar a sensibilidade dos resultados nais a varia c oes a esses
elementos da an alise. Iniciaremos discutindo alguns aspectos de identi-
ca c ao do problema e de sua estrutura c ao para a seguir atacar quest oes
ligadas ` a robustez das componentes do modelo de decis ao.
Trataremos de problemas de decis ao em m ultiplos est agios ou sequen-
ciais no captulo 6. Esses problemas se caracterizam por poderem ser
separados em um certo n umero de passos sequenciais ou est agios, cada
est agio se conclui com uma decis ao. Em geral, o tempo e usado para
1.4. ORGANIZAC

AO DO LIVRO 19
ordenar a sequencia de problemas decis orios.
No captulo 7 apresentaremos estrategias para a solu c ao do problema
de decis ao baseadas em metodos Monte Carlo. Come camos com a apli-
ca c ao de integra c ao de Monte Carlo para resolver a integral que surge no
c alculo da perda (ou utilidade) esperada. Introduziremos a ideia de se
ajustar uma curva a um conjunto nito de pares decis ao-utilidade e, para
espa cos decis orios de dimens ao relativamente grande, introduziremos
um metodo para resolver o problema de otimiza c ao e integra c ao como
um problema de simula c ao, atraves de metodos Monte Carlo via cadeias
de Markov (MCMC).
20 CAP

ITULO 1. INTRODUC

AO
Figura 1.6: Decis oes sequenciais: arvore de decis ao
1.4. ORGANIZAC

AO DO LIVRO 21
Figura 1.7: Decis oes sequenciais: solu c ao
Figura 1.8: Diagrama de inuencia para informa c ao imperfeita
22 CAP

ITULO 1. INTRODUC

AO
Captulo 2
Conceitos Basicos
Como sugerido nos exemplos do Captulo 1 a an alise de decis oes est a
envolvida com problemas complexos os quais incluem uma ou mais das
seguintes caractersticas:
Incerteza: como escolher um curso de a c ao - estrategia - quando
suas consequencias dependem de eventos incertos.
Objetivos m ultiplos: s ao frequentes as situa c oes onde a escol-
ha de alternativas envolve consequencias de natureza m ultipla, em
geral conitantes. Por exemplo, a localiza c ao de uma usina nu-
clear requer a avalia c ao dos custos envolvidos, da conabilidade do
projeto, de quest oes ambientais etc.
Alternativas m ultiplas: e imprescindvel escrutinar todas as al-
ternativas ou op c oes possveis, eliminando-se aquelas dominadas
mas evitando-se omiss oes ou simplica c oes excessivas.
Sequenciamento: muitas decis oes s ao de natureza sequencial en-
volvendo, portanto m ultiplos est agios de decis ao. As decis oes em
dado est agio do processo s ao selecionadas com base nas decis oes
23
24 CAP

ITULO 2. CONCEITOS B

ASICOS
j a exercidas, nas informa c oes disponveis e no conhecimentos dos
eventos incertos j a ocorridos.
Um modelo de decis ao consiste de dois aspectos b asicos: (i) especi-
ca c ao estrutural e (ii) deni c ao de criterios para compara c ao de alterna-
tivas. A especica c ao estrutural envolve a identica c ao dos elementos do
problema de decis ao, isto e os eventos incertos, as alternativas possveis,
os par ametros desconhecidos e as rela c oes estruturais relacionando estes
elementos. Os criterios para compara c ao das consequencias associadas as
v arias alternativas devem possibilitar ao decisor uma certa racionalidade
ou coerencia no processo decis orio. Uma condi c ao necess aria para o com-
portamento racional dos decisores ser a denominada de coerencia. Devem
ser eliminadas as regras que conduzem ` a ideia da perpetual money making
machine como introduzido por Lindley (1971).
Neste captulo discutiremos v arios aspectos introdut orios da teoria de
decis ao (veja se c ao 2.1). Especicaremos a tripla que caracteriza um prob-
lema de decis ao e apresentaremos, nas se c oes 2.2 e 2.3, diversas fun c oes
de perda para problemas especcos. Na se c ao 2.4, caracterizaremos a
concavidade do risco de Bayes e exploraremos gracamente v arias pro-
priedades das regras de Bayes e minimax. Problemas de decis ao com
espa co de decis oes e espa co de estados da natureza nitos ser ao tratados
na se c ao 2.5. A regra minimax e revisitada na se c ao 2.6. O problema
de decis ao baseado em dados experimentais ser a discutido na se c ao 2.7 e
diferentes conceitos e medidas de risco ser ao apresentados na se c ao 2.8.
Este captulo e concludo com a se c ao 2.9 falando sobre domin ancia es-
toc astica.
2.1 Elementos da an alise de decis oes
Como identicado nos exemplos do Captulo 1, um problema de decis ao
e especicado pela tripla (/, , L), onde / e o espa co das a c oes, e
2.1. ELEMENTOS DA AN

ALISE DE DECIS

OES 25
o conjunto dos estados da natureza e L(, a) representa a perda sofrida
pela escolha da a c ao a / quando ocorre , i.e. L : / '.
Equivalentemente podemos denir a fun c ao de utlidade por U(, a) =
L(, a).
Precisamos, agora, descrever procedimentos para sele c ao da a c ao otima.
Apresentaremos, a seguir, duas alternativas, uma determinstica que n ao
leva em considera c ao a probabilidade de ocorrencia dos estados da na-
tureza, e outra estoc astica que assinala pesos para os diversos (talvez
n ao-enumer aveis) elementos de . No nal do captulo, na se c ao 2.9,
discutiremos o conceito de domin ancia estoc astica.
Deni c ao 2.1 A a c ao a
m
/ e denominada minimax se
a
m
= argmin
a
max

L(, a)
Este criterio e de natureza conservadora pois escolhe dentre as a c oes
de maior perda, aquela a c ao de menor valor. Em outras palavras, escolhe-
se a menos pior dentre as piores. Pode-se dizer, sem muito rigor, que um
tomador de decis oes que adota um algoritmo minimax para tomada de
decis oes e averso ao risco. Veja o seguinte exemplo extrado de Berger
(1985, p agina 6-7)
Exemplo 2.1 Um investidor deve decidir entre investir (a c ao a
1
) ou n ao
investir (a c ao a
2
) 1000 unidades monet arias (u.m.) em um fundo de in-
vestimento arriscado. Esse fundo de investimento e arriscado pois pode
levar o investidor ` a perda total de seu investimento (
2
). Seu atrativo,
entretanto, e a possibilidade de um lucro lquido (
1
), de 500 u.m. Alter-
nativamente, ao n ao investir nesse fundo, ele investiria suas 1000 u.m.
numa poupan ca com rendimento lquido e certo de 30%, ou seja, 300 u.m.
A tabela 2.1 apresenta as perdas (valores negativos s ao ganhos) possveis
em ambas as a c oes.
26 CAP

ITULO 2. CONCEITOS B

ASICOS
Estados
A c oes
1

2
a
1
-500 1000
a
2
-300 -300
Tabela 2.1: Perda associada a cada a c ao e cada estado da natureza.
Mais especicamente,
1
representa um retorno lucrativo para o fundo,
enquanto
2
representa a perda total do dinheiro investido.

E f acil ver que
o investidor dever a aplicar seu dinheiro na poupan ca pois essa a c ao tem
perda menor entre as maiores perdas de cada a c ao: 1000 e -300, para a
1
e a
2
, respectivamente. Em outras palavras,
max

L(, a
1
) = max500, 1000 = 1000
max

L(, a
2
) = max300, 300 = 300
portanto, a
2
e a regra minimax.
O exemplo acima e interessante pois nos remete naturalmente ` a seguinte
pergunta: Existe alguma forma de incorporar as incertezas associadas a

1
e
2
no processo decis orio, de sorte que o investidor (decisor) n ao tenha
que ser totalmente averso ao risco? Mais especicamente, Qual o impacto
que a 90% de grau de cren ca de que
1
ocorrer a teria na hora do investi-
dor tomar sua decis ao? Claro que nenhum impacto se ele decidir por
um procedimento minimax. Nem sempre, felizmente ou infelizmente, de-
cis oes s ao tomada dessa forma e as chances associadas ` as ocorrencias dos
mais diversos tipos de eventos tem import ancia no momento da tomada
de decis oes. Assim, como no exemplo supracitado, seja (), uma
densidade de probabilidade que mede a informa c ao fornecida ao tomador
de decis oes (atraves de introspe c ao ou estudo previo), antes de ter sido
observado. Dene-se o risco de uma a c ao da seguinte forma.
2.1. ELEMENTOS DA AN

ALISE DE DECIS

OES 27
Deni c ao 2.2 O risco ou perda esperada de uma a c ao a / e dado
por
r(, a) =

L(, a)()d
onde () e uma fun c ao de densidade sobre .
Para o exemplo 2.1, onde (
1
) = 1(
2
) = 0.9, e simples se observar
que r(, a
1
) = 350 e r(, a
2
) = 300, ou seja, que a
1
tem valor esperado
de perda menor que a
2
, apesar de a
2
ser, como j a vimos, a regra minimax.
A a c ao que minimiza o valor esperado da perda e comumente conhecida
como a c ao de Bayes com respeito ` a .
Deni c ao 2.3 A a c ao a
b
/ e denominada a c ao de Bayes com respeito
a () se
a
b
= argmin
a

L(, a)()d
= argmin
a
r(, a)
com r(, a) comumente denominada perda esperada a priori e o seu valor
mnimo, r(, a
b
), o risco de Bayes associado.
J a vimos que para o investidor do exemplo 2.1 a a c ao de Bayes e
investir o dinheiro no fundo de investimento e o risco de Bayes vale 350
u.m. O seguinte exemplo corrobora para fundamentar as ideias ate aqui
apresentadas.
Exemplo 2.2 O gerente de uma livraria do campus da UFRJ deseja de-
cidir quantas unidade de um certo livro texto dever a encomendar para o
incio do pr oximo perodo. Seu ganho e de 15 u.m. por exemplar ven-
dido e a editora aceita receber de volta aquelas unidades n ao vendidas
ate a segunda semana ap os o inico das classes. Como esta disciplina
28 CAP

ITULO 2. CONCEITOS B

ASICOS
n ao ser a oferecida novamente durante o presente ano letivo os livros re-
manescentes, n ao vendidos, impor ao uma perda de 5 u.m., por exemplar,
no nal do perodo. Uma quest ao importante ser a , por exemplo, deter-
minar o tamanho ideal da compra a ser realizada pela livraria. A fun c ao
de ganho ou utilidade e obviamente dada por:
U(, a) =

15 5(a ) se < a
15a se a
Supondo, para simplicar, que as ordens (a) e as vendas () sejam
m ultiplos de 10 unidades e limitadas a um m aximo de 70 unidades temos.
A tabela 2.2 mostra os ganhos (perdas s ao ganhos negativos) associados
a cada a c ao e cada possvel estado da natureza (vendas efetuadas).
Vendas Perda
A c oes 0 10 20 30 40 50 60 70 M ax r(, a)
0 0 0 0 0 0 0 0 0 0 0.0
10 -5 15 15 15 15 15 15 15 -5 14.7
20 -10 10 30 30 30 30 30 30 -10 27.6
30 -15 5 25 45 45 45 45 45 -15 35.9
40 -20 0 20 40 60 60 60 60 -20 37.7
50 -25 -5 15 35 55 75 75 75 -25 34.8
60 -30 -10 10 30 50 70 90 90 -30 30.2
70 -35 -15 5 25 45 65 85 105 -35 25.3
100() 1.7 8.7 23.2 32.4 23.2 8.7 1.7 0.4
Tabela 2.2: Fun c ao de ganho da livraria (em dezenas)
Este e um exemplo muito simples onde a fun c ao de ganho ca deter-
minada pelo valor do ganho lquido e do ressarcimento por devolu c ao. A
quantidade demandada (e desconhecida) de livros, , aparece discretizada
em m ultiplos de 10 unidades. Analogamente, para facilitar a exposi c ao,
2.2. ESPECIFICANDO A FUNC

AO DE PERDA 29
as encomendas (a c oes) tambem est ao ordenadas em m ultiplos de 10. Este
e um exemplo onde o n umero de possveis estados da natureza e n() = 8
e existem n(/) = 8 possveis a c oes. Mesmo com estas simplica c oes a
tarefa de escolher a melhor decis ao n ao e muito simples, a menos do ca-
so do decisor utilizar a regra minimax. Curiosamente, nesse exemplo,
a regra minimax e de pouca valia uma vez que sugere que o vendedor
n ao compre nenhum livro (veja a pen ultima coluna da tabela 2.2). Alem
disso, note que um comerciante poderia ordenar 70 unidades e obter um
ganho de 1050 u.m. caso todos os livros sejam vendidos. Todavia, seguin-
do essa mesma alternativa, existe o risco da perda de 350 u.m. caso as
vendas sejam nulas. Intuitivamente, pode ser argumentado, precisaria-se
assessar a distribui c ao de probabilidade da quantidade incerta - quanti-
dade demandada de livros. Para ilustra c ao, suponhamos que () para
= 0, 10, . . . , 70 sejam aqueles apresentados na ultima linha da tabela
2.2. De acordo com essa distribui c ao de probabilidade calculamos a ultima
coluna na mesma tabela. De acordo com esses resultados vemos que a de-
cis ao otima, ou a c ao de Bayes, e a compra de 40 unidades.
Para mais detalhes sobre a regra minimax veja a se c ao 2.6. No captulo
4 mostra-se porque a maximiza c ao (minimiza c ao) da utilidade (perda) es-
perada e a regra de decis ao comumente utilizada em problemas de decis ao
sob incerteza.
2.2 Especicando a fun c ao de perda
Nesta se c ao apresentaremos alguns exemplos de fun c ao de perda que ocor-
rem comumente nas aplica c oes. Iniciaremos com uma classe geral de
fun c oes de perda, discutiremos os problemas da inferencia estatstica no
contexto da teoria da decis ao e introduziremos dois exemplos de natureza
mais aplicada.
30 CAP

ITULO 2. CONCEITOS B

ASICOS
Uma classe geral de perdas
Dena L(, a) = ()[a[

, onde () e uma fun c ao de peso que depende


somente de . Alguns casos especiais ser ao apresentados no contexto da
estima c ao de par ametros.
Estima c ao
Um problema de estima c ao ca caracterizado pelo fato de que / = .
Uma famlia de fun c oes de perda adequada para o problema de estima c ao
e dada por L(, a) = [ a[

. Suponhamos que na famlia de perdas


denidas anteriormente () = 1. Se = 1 temos a perda absoluta e se
= 2 a popular perda quadr atica. Um aspecto importante do problema
de estima c ao e que os espa co do par ametro e das decis oes s ao coinci-
dentes. A minimiza c ao da perda esperada nos casos acima e alcan cada,
respectivamente, pela mediana e pela media da distribui c ao de . Outra
fun c ao de perda comum em problemas de estima c ao de par ametros e a
denominada perda zero-um,
L(, a) =

k se [ a[
0 se [ a[ <
onde > 0 e arbitr ario e k e uma constante, em geral unit aria. A regra
de decis ao de Bayes, neste caso, coincidir a com a moda da distribui c ao
de . A gura 2.1 apresenta as tres fun c oes de perda citadas acima.
Teste de Hip otese
Este e um outro problema tpico da inferencia estatstica. Sua principal
caracterstica e que tanto o espa co das a c oes como o espa co do par ametro
s ao dicot omicos, isto e, / = a
0
, a
1
e =
0

1
. As a c oes a
0
e a
1
correspondem ` as decis oes de aceitar H
0
e H
1
, respectivamente, onde H
i
e a hip otese que arma que o par ametro percente ao sub-espa co
i
, para
2.2. ESPECIFICANDO A FUNC

AO DE PERDA 31
Figura 2.1: Fun c oes de perda alternativas em problemas de estima c ao:
perda zero-um (linha cheia), perda quadr atica (linha pontilhada) e perda
absoluta (linha tracejada).
i = 0, 1. Nesse contexto, a fun c ao de perda ca denida por
L(, a
i
) =

0 se
i
c
i
caso contr ario
onde i = 0, 1. A escolha de c
0
= c
1
permite reconhecer que os erros de
decis ao podem ter impactos diferenciados. Por exemplo, se o problema
consiste em decidir, ` a luz de algumas informa c oes, se a economia est a
num estado de recess ao ou de expans ao, os custos associados ` as decis oes
erradas s ao naturalmente distintos. Os falsos alarmes podem, claramente,
ter custos diferenciados. A solu c ao deste problema, assumindo-se que =
32 CAP

ITULO 2. CONCEITOS B

ASICOS
Pr(
0
), ser a dada pela compara c ao das perdas esperadas, r(, a
0
) =
c
0
(1 ) e r(, a
1
) = c
1
.
Uma pequena generaliza c ao dessa formula c ao, denominada na liter-
atura de problema da decis ao m ultipla, consiste em fazer uma parti c ao do
espa co do par ametro em m classes. Sua solu c ao ser a diretamente obtida
atraves dos conceitos desenvolvidos ao longo desse captulo.
Uma outra fun c ao de perda
Suponha que =
1
,
2
e que / = a
1
, a
2
. Seja a fun c ao de perda
L(, a
i
) =

0 se =
i

2
i
se =
i
,
para i = 1, 2. Ent ao, para qualquer (), a a c ao de Bayes ser a a
1
se
E(
2
1
) < E(
2
2
) e a
2
caso contr ario. Se E(
2
1
) = E(
2
2
), ent ao ambas s ao
a c oes de Bayes sob . Para obter este resultado basta lembrar que,
E[L(, a
1
)] =

2
1

2
(
1
,
2
)d
2

d
1
=

2
1
(
1
)d
1
= E(
2
1
)
Fun c ao de Perda de Esscher
Na literatura de Atu aria aparece com frequencia a fun c ao de perda de
Esscher,
L(, a) = exp()( a)
2
onde a /, R
+
e > 0 e denominado coeciente de avers ao
ao risco.

E claro que esta especica c ao corresponde a um caso particular
de perda geral apresentada no come co dessa se c ao, isto e () = exp()
e = 2. Seja () uma distribui c ao a priori sobre , ent ao o risco de
Bayes ser a,
r(, a) = E[L(, a)] = E[exp()( a)
2
]
2.2. ESPECIFICANDO A FUNC

AO DE PERDA 33
A minimiza c ao da fun c ao de perda satisfar a a condi c ao de primeira
ordem,
d
da
r(, a) = 2

exp()( a)()d = 0
de forma que
a
b
= E[ exp()]/E[exp()]
A condi c ao de segunda ordem pode ser facilmente vericada e ser a
deixada como exerccio. Esta decis ao de Bayes e denominada, no contexto
atuarial, de premio de Esscher.
Sele c ao de um Portf olio
Seja = a

, onde e um vetor representando os retornos de k inves-


timentos e a = (a
1
, . . . , a
k
) o vetor de aloca c ao de uma riqueza unit aria,
tal que a
i
> 0 para todo i = 1, . . . , k e

i
a
i
= 1. A seguinte fun c ao de
perda e adequada para este problema de diversica c ao de risco,
L(, a) = exp() 1
Suponhamos ainda que N(, ). Nestas condi c oes, N[

,
2

],
onde

= a

e
2

= a

a. Alem disto, exp() ter a uma distribui c ao


log-normal. Assim
E[L(, a)] = E[exp()] 1
= exp(

+
2

/2) 1
e, portanto, e f acil vericar que
min
a
r(, a) max
a

/2

A interpreta c ao e clara: deseja-se diversicar obtendo um risco mnimo,


isto e vari ancia mnima, e simultaneamente m aximo retorno esperado.
34 CAP

ITULO 2. CONCEITOS B

ASICOS
Este exemplo e particularmente interessante pois aponta para uma di-
culdade que ocorre com frequencia. Nossas a c oes podem ser julgadas
atraves de consequencias m ultiplas e conitantes. Neste exemplo dese-
jamos claramente maxizar o retorno esperado, todavia restrito a um certo
nvel de risco, avaliado pela vari ancia do retorno do portf olio selecionado.
2.3 Fun c ao de perda n ao negativa
Seja > 0 uma constante dada e () uma fun c ao real tal que

()()d <
Dena a nova fun c ao de perda como sendo
L
0
(, a) = L(, a) (), , a /

E claro que uma a c ao de Bayes, a


b
sob L(, a) tambem ser a Bayes sob
L
0
(, a). Dena agora
0
() = min
a
L(, a) e
L
0
(, a) = L(, a)
0
()

E f acil ver que a nova fun c ao de perda e tal que (i) L


0
(, a) 0 e
(ii) min
a
L
0
(, a) = 0. A seguir apresentamos dois exemplos de situa c oes
com fun c ao de perda n ao negativa.
Exemplo 2.3 Seja um problema de decis ao onde o n umero de elementos
de / seja 2, isto e n(/) = 2 e que o n umero de elementos de tambem
seja 2, isto e n() = 2 e considere a fun c ao de perda com valores reais
apresentados na tabela 2.3. Segue que
0
(
1
) = 10 e
0
(
2
) = 20. A
tabela de perdas pode ent ao ser reescrita como na tabela 2.4.
Supondo, alem disto, que (
1
) = 0.7. Ent ao teremos r(, a
1
) = 64 e
r(, a
2
) = 17. Portanto, a
2
e a a c ao de Bayes. Note que r
0
(, a
1
) = 77
e r
0
(, a
2
) = 30, de sorte que a
2
continua sendo a a c ao de Bayes, como
esperado.
2.3. FUNC

AO DE PERDA N

AO NEGATIVA 35
Estados
A c oes
1

2
a
1
100 -20
a
2
-10 80
Tabela 2.3: Perdas monet arias (em milhares)
Estados
A c oes
1

2
a
1
110 0
a
2
0 100
Tabela 2.4: Fun c ao de perda n ao negativa (L
0
(, a) = L(, a)
0
())
Exemplo 2.4 Considere um problema com cinco a c oes e dois estados
da natureza. Uma tabela envolvendo perdas n ao negativas e a tabela 2.5.
Vale notar que agora temos uma perda nula para cada um dos estados
e com os demais valores extritamente positivos, como ilustrado na tabela
2.6.
A c oes
Estados a
1
a
2
a
3
a
4
a
5
min
a
L(, a)

1
2 4 3 5 3 2

2
3 0 3 2 5 0
Tabela 2.5: Fun c ao de perda
O leitor pode facilmente vericar que a
1
e a
3
s ao minimax para a
tabela 2.5, enquanto a
2
e minimax para a tabela 2.6. Voltaremos a esse
36 CAP

ITULO 2. CONCEITOS B

ASICOS
A c oes
Estados a
1
a
2
a
3
a
4
a
5

1
0 2 1 3 1

2
3 0 3 2 5
Tabela 2.6: Fun c ao de perda n ao negativa
exemplo no se c ao 2.6 quando revisitarmos a regra minimax e daremos
uma justicativa geometria para esse problema.
2.4 Concavidade do risco de Bayes
Nesta se c ao estudaremos a forma da fun c ao que descreve o risco de Bayes.
Mostraremos que esta e uma fun c ao c oncava, o que permitir a entre outras
coisas examinar o efeito da imprecis ao na especica c ao da distribui c ao a
priori. Introduzimos, na se c ao 2.1, o risco de Bayes segundo () (veja
deni c ao 2.3), como sendo r() = r(, a
b
). Este e o valor do risco mnimo
ou da perda espera mnima sob a distribui c ao a priori .
Deni c ao 2.4 Sejam
1
e
2
duas densidades sobre e seja (0, 1)
um escalar. A combina c ao linear =
1
+ (1 )
2
e uma nova
densidade sobre , chamada de mistura das densidade
1
e
2
.
Teorema 2.1 Seja uma mistura das densidades
1
e
2
, sobre , para
(0, 1). Ent ao
r() r(
1
) + (1 )r(
2
)
Prova:
2.4. CONCAVIDADE DO RISCO DE BAYES 37
(i) Mistura de riscos
r(, a) =

L(, a)()d =

L(, a)[
1
() + (1 )
2
()]d
= r(
1
, a) + (1 )r(
2
, a)
(ii) Como r() = min
a
r(, a), ent ao
r() = min
a
[r(
1
, a) + (1 )r(
1
, a)]
Como o mnimo da soma de duas fun c oes n ao pode ser nunca menor que
a soma dos mnimos individuais, segue que:
r() min
a
r(
1
, a) + (1 ) min
a
r(
2
, a)
= r(
1
) + (1 )r(
2
)
.
A partir dos item (i) e (ii) acima pode ser vericado que a fun c ao
c oncava r() e o mnimo da famlia de fun c oes lineares r(, a) gerada
pelas diferentes a c oes em /. Ilustra c oes gr acas s ao possveis no caso em
que =
1
,
2
.

E claro que nestas condi c oes = Pr( =
1
). Assim
r() e fun c ao c oncava de (0, 1) (veja a ilustra c ao na gura 2.2).
Consequencia da Imprecisao de
Suponha, ainda no caso de um espa co de a c oes com dois elementos so-
mente, que a a c ao a
0
seja escolhida a a c ao de Bayes segundo
0
e suponha
que o verdadeiro valor de seja, digamos
1
. Seja = r(
1
, a
0
) r(
0
)
o incremento em risco, como ilustrado na gura 2.3. Se a curva r() for
suave no entorno de
0
, o qual deve conter
1
ent ao ser a pequeno.
38 CAP

ITULO 2. CONCEITOS B

ASICOS
Figura 2.2: Concavidade do risco de Bayes: n(/) < (gura da esquer-
da); n(/) = (gura da direita).
2.5 Problema de decis ao com e A nitos
Supor espa cos de estados da natureza e de par ametros nitos facilitam as
ilustra c oes de algumas propriedades. Poderemos representar gracamente
o conjunto de todas as a c oes mistas e estudar suas propriedades. Sejam
=
1
, ,
k
e / = a
1
, , a
m
.
Deni c ao 2.5 Uma decis ao mista e denida pela combina c ao linear con-
vexa de decis oes em /. Esta classe e denotada por . Obviamente
/ e a fun c ao de perda de uma decis ao mista a ser a dada por:
L
i
(a) = L(
i
, a) =
m

j=1
p
j
L(
i
, a
j
), i = 1, , k
2.5. PROBLEMA DE DECIS

AO COM E A FINITOS 39
Figura 2.3: Efeito da imprecis ao sobre : incremento no risco de Bayes
Alternativamente podemos escrever
L(a) = (L
1
(a), , L
k
(a))

= L
para = (
1
, . . . ,
m
), a = (a
1
, . . . , a
m
) e L(
i
, a
j
) o (i, j) esimo ele-
mento de L.
Denote por G '
k
o conjunto convexo denido por G = L(a)
'
k
, a /, p = (p
1
, , p
m
)

, p
i
0,

p
i
= 1.
Deni c ao 2.6 Domin ancia e Admissibilidade
(a) Uma a c ao a domina a a c ao a

se L
i
(a

) L
i
(a), .
Se a desigualdade for estrita a domin ancia ser a dita estrita.
40 CAP

ITULO 2. CONCEITOS B

ASICOS
(b) Uma decis ao a / e admissvel se nenhuma outra a c ao a domina
estritamente. Isto e, se n ao existe outra decis ao a

/ tal que
L
i
(a

) L
i
(a), i = 1, , k e L
i
(a) < L
i
(a

) para pelo menos um i.


Assim a e admissvel se e somente se pertencer a fronteira
de admissibilidade de G. As a c oes puras, elementos de /, correspon-
dem a distribui c oes de probabilidade sobre / degeneradas, isto e: p =
(0, . . . , 0, 1, 0, . . . , 0). Assim os pontos de G correspondendo as a c oes em
/ s ao vertices de um poliedro convexo.
Exemplo 2.5 Este exemplo envolve um problema de decis ao com m = 6
alternativas e k = 2 estados da natureza (Figura 2.4) e perdas dadas pela
tabela 2.5.
Figura 2.4: Representa c ao gr aca de G
2.5. PROBLEMA DE DECIS

AO COM E A FINITOS 41
Vale interpretar L
i
(a), i = 1, , k como centro de gravidade de um
sistema de massas com pesos p
j
em a
j
, j = 1, , m. Considere agora
uma distribui c ao de probabilidade sobre , () = (
1
, ,
k
)

,
i

0 e

i
= 1. Para qualquer decis ao a / obtemos o risco
r(, a) =

L(a)
onde = (
1
, ,
k
)

.
Deni c ao 2.7 Uma a c ao a
b
e Bayes segundo se e somente se minimiza

L(a), a /

E interessante mostrar que a


b
pertence a fronteira de Bayes de G. Como
a fronteira admissvel de G esta contida na fronteira de Bayes segue que
toda decis ao admissvel em e Bayes para alguma .
Teorema 2.2 Seja a

uma a c ao em . O vetor L(a

) pertence a fron-
teira de Bayes de G se e somente se existe alguma distribui c ao sobre
tal que a

e Bayes segundo .
Exemplo 2.6 Seja um problema com k = 2 estados da natureza, m = 6
alternativas e perdas dadas pelos elementos da tabela abaixo.
A c oes
Estados a
1
a
2
a
3
a
4
a
5
a
6

1
10 8 4 2 0 0

2
0 1 2 5 6 10
Tabela 2.7: Fun c ao de perda n ao negativa
Os pontos L(a
i
), i = 1, , 6 est ao plotados na gura 2.5. A fronteira
admissvel consiste dos segmentos de reta unindo L
1
a L
3
e L
3
a L
5
. Logo
42 CAP

ITULO 2. CONCEITOS B

ASICOS
as a c oes a
1
, a
3
ea
5
/ s ao admissveis. Neste exemplo a fronbteira
de Bayes incluir a tambem o segmento de reta L
5
a L
6
, de forma que a
fronteira de Bayes ser a constituida pelas a c oes a
1
, a
3
, a
5
, a
6
.
Suponha que deseja-se determinar uma decis ao de Bayes segundo a
priori = (1/3, 2/3)

. Considere a equa c ao da reta L


1
/3 + 2L
2
/3 = c,
isto e com inclina c ao 1/2. Verique se esta e uma linha de suporte em
algum ponto da fronteira de Bayes. Neste exemplo somente a
3
satisfaz
esta condi c ao.

E util relembrar que a perda esperada para a c oes em s ao da forma:

L(a) =
k

i=1
(
i
)E
p
[L(
i
, a)]
=
k

i=1
(
i
)
m

j=1
p
j
L(
i
, a
j
)
A decis ao de Bayes e obtida como fun c ao de (p
1
, , p
m
) ou depende
de m 1 vari aveis. Assim o problema de minimizar a perda esperada
equivale a determinar o mnino de uma fun c ao m1 dimensional.
Para xar ideias um outro exemplo faz-se necess ario. A gura abaixo
corresponde ao problema de decis ao com m = 5 alternativas e k = 2
estados da natureza descrito anteriormente (Tabela 2.4). Expressan-
do E[L(, a
i
)] = r(, a
i
) como fun c ao de [0, 1], temos as seguinte
equa c oes:
r(, a
1
) = 3
r(, a
2
) = 4
r(, a
3
) = 3
r(, a
4
) = 3 + 1
r(, a
5
) = 5 2
produzindo a gura 2.5
2.6. REVISITANDO A REGRA MINIMAX 43
Figura 2.5: Poliedro convexo; caso k = 2 e m = 6
2.6 Revisitando a regra minimax
Uma forma alternativa de ordenar as a c oes de um problema de decis ao,
como j a vimos e exatamente o procedimento minimax. O objetivo agora
e mostrar como obter uma a c ao minimax gracamente e discutir algumas
de suas propriedades.
Relembrando, a
m
= arg minmax
a
L(, a). No exemplo 2.4, onde
concorriam m = 5 alternativas para k = 2 estados da natureza, tinhamos
a tabela de perdas com a ultima coluna apresentando o min
a
L(, a) obti-
do para cada estado da natureza (tabela 2.6). Podemos agora obter para
cada a c ao o max

L(, a) (ver a ultima linha da tabela 2.8).


A partir desta coluna e f acil ver que as a c oes a
1
e a
3
s ao ambas min-
44 CAP

ITULO 2. CONCEITOS B

ASICOS
A c oes
Estados a
1
a
2
a
3
a
4
a
5

1
2 4 3 5 3

2
3 0 3 2 5
max

3 4 3 5 5
Tabela 2.8: Fun c ao de perda
imax. Se, alternativamente, tivessemos usado as perdas n ao negativas
teriamos obtido
A c oes
Estados a
1
a
2
a
3
a
4
a
5

1
0 2 1 3 1

2
3 0 3 2 5
max 3 2 3 3 5
Tabela 2.9: Fun c ao de perda n ao negativa
Neste caso somente a a c ao a
2
e minimax. Porque esta diferen ca? Os
gr acos da gura 2.7 apresentam as perdas para as a c oes a
1
a a
5
, no plano
L(a) = (L
1
, L
2
), e servem para esclarecer o que ocorre. Se (L
1
, L
2
) s ao
as perdas em um problema com dois estados da natureza e claro que o
m aximo das perdas ser a L
1
se o par (L
1
, L
2
) cair abaixo do bissetor e, L
2
se o par (L
1
, L
2
) cair acima do bissetor (veja gura 2.6).
A a c ao minimax e obtida gracamente movendo-se para cima um
linha horizontal/vertical ate atingir uma das a c oes, isto para aquelas aci-
ma/abaixo do bissetor do primeiro quadrante. Quando se usa a fun c ao
de perda n ao negativa a solu c ao n ao se mantem pois a origem se desloca
e ent ao a primeira a c ao a ser atingida pelas linhas horizontais/verticais
2.6. REVISITANDO A REGRA MINIMAX 45
Figura 2.6: Regra minimax - determina c ao gr aca
pode mudar.
Para concluir vejamos o que ocorre se tiver diante de a c oes mistas.
Neste caso o bissetor do primeiro quadrante atingir a primeiramente uma
das a c oes mista que expressam atraves da combina c ao linear das a c oes
pura a
1
e a
2
. Mais precisamente a solu c ao corresponde a escolha de
= 3/4.
Um ultimo ponto que merece considera c ao e que toda decis ao de Bayes
e admissvel e toda decis ao minimax e a c ao de Bayes. Alem disso, as
decis oes admissveis s ao a c oes de Bayes para alguma distribui c ao a priori.
Segundo DeGroot (1970), um ponto x = (x
1
, . . . , x
k
) em G, um conjunto
convexo, pertence ao limite de admissibilidade de G se n ao existir nenhum
ponto y tambem em G tal que y
i
x
i
para i = 1, . . . , k e y
i
< x
i
para
46 CAP

ITULO 2. CONCEITOS B

ASICOS
Figura 2.7: Regra minimax - determina c ao gr aca
pelo menos um i. Adicionalmente, um ponto x em G percente ao limite
de Bayes se n ao existir nenhum ponto y em G tal que y
i
< x
i
para
i = 1, . . . , k. A gura 2.8 ajuda a visualizar essas quest oes e deni c oes.
2.7 Problema de decis ao usando dados
Seja X uma quantidade aleat oria relacionada com o estado da natureza
e considere uma regra de decis ao (x) , isto e, uma fun c ao de A, espa co
amostral , com valores em /, espa co do par ametro. Seja p(x[), x A
a fun c ao de densidade de X condicional a .
2.7. PROBLEMA DE DECIS

AO USANDO DADOS 47
Figura 2.8: Admissibilidade da regra de Bayes
Deni c ao 2.8 A fun c ao de risco ou perda esperada ser a denida por
r(, ) = E[L(, (x))]
=

L(, (x))p(x[)()ddx (2.1)


onde estamos assumindo que L(, (x)) e integr avel em A e tambem em
.
Valer destacar que
(i) a /, r(, a) =

L(, a)()d, como denido anteriormente, e


(ii) , r(, (X)) =

X
L(, (x))(x[)dx
48 CAP

ITULO 2. CONCEITOS B

ASICOS
Para qualquer regra de decis ao (x) a fun c ao r(, (x)) ser a denomin-
dada de risco de . Assim sendo

ser a uma decis ao de Bayes se

= arg min
(x)

r(, (x))()d
A fun c ao

(x) ser a determinada pela express ao acima para cada x A.


Continuaremos denotando por r() = r(,

) o risco de Bayes sob .


Construindo a regra de decisao de Bayes
Segunda a express ao 2.1, min

r(, ) pode ser obtido minimizando a in-


tegral interna para cada x A. Assim, x A, obteremos

(x) mini-
mizando em
bfTheta,

L(, (x))p(x[)()d
ou
p(x)

L(, (x))p(x[)()/p(x)d
onde p(x) =

p(x[)()d. Assim,
r(, ) =

X
p(x)

L(, (x)([x)d

dx
Exemplo 2.7 Suponha que =
1
,
2
e / = a
1
, a
2
com perdas
apresentadas na tabela 2.10.
A distribui c ao a posteriori e obtida facilmente levando em consid-
era c ao a fun c ao de verossimilhan ca dada pela tabela 2.11.
Como tem somente dois elementos, a distribui c ao a priori ca com-
pletamente caracterizada por = Pr(
1
) = 1Pr(
2
). Usando o teorema
de Bayes
([x) ()p(x[) = q(, x)
2.7. PROBLEMA DE DECIS

AO USANDO DADOS 49
L(, a) a
1
a
2

1
0 5

2
10 0
Tabela 2.10: Fun c ao de perda.
x
Estados 0 1

1
3/4 1/4

2
1/3 2/3
Tabela 2.11: Fun c ao de probabilidade, p(x[).
obtemos os resultados da tabela 2.12
As probabilidades a posteriori ser ao obtidas da normaliza c ao dos q(, x).
Denotando por (x) = (
1
[x) teremos:
(x) =
q(
1
, x)

q(, x)
Assim, qualquer que seja x, os valores esperados das perdas ser ao
r(, a
1
[x) = 10[1 (x)]
r(, a
2
[x) = 5(x)
Da, a
1
ser a prefervel a a
2
se e somente se r(, a
1
) < r(, a
2
), o que
equivale a dizer que 10[1(x)] < 10[1(x)], ou ainda que (x) > 2/3.
Suponhamos agora que o resultado experimental tenha sido x = 1. A
decis ao de Bayes ser a a
2
se (1) < 2/3, ou seja,
3/4
3/4 + (1 )/3
< 2/3
50 CAP

ITULO 2. CONCEITOS B

ASICOS
x
q(, x) 0 1

1
3/4 /4

2
(1 )/3 2(1 )/3
Tabela 2.12: Distribui c ao conjunta de e x.
logo, a decis ao de Bayes ser a a
2
se < 8/17. Analogamente, se x = 0 a
decis ao a
2
ser a prefervel se < 16/19. De uma forma geral teremos,
r() =

5 se 0 < < 8/17


5/4 + 10(1 ) se 8/17 < < 16/19
10(1 ) se 16/19 < < 1
permitindo se fazer o gr aco do risco de Bayes (Figura 2.9) como fun c ao
de , a probabilidade a priori.
2.8 An alise de risco
Neste captulo discutindo alguns aspectos da an alise de risco. Esta e uma
area da an alise de decis oes que vemganhando import ancia nos dias atuais.
O termo risco e utilizado de uma forma n ao sistem atica com seu sentido
variando expressivamente nos diferentes ramos de aplica c ao. Falamos de
risco nanceiro, risco medico, risco atuarial etc. Apresentaremos alguns
criterios de risco comumente utilizados nessas diferentes areas. Iniciare-
mos por um exemplo.
Exemplo 2.8 Suponha que estejamos diante da escolha de uma de duas
op c oes:
2.8. AN

ALISE DE RISCO 51
Figura 2.9: Risco de Bayes - exemplo com dados
a
1
) Apostar num jogo onde ganha-se 1 u.m. se certo evento ocorrer,
com probabilidade ou perde-se 1 u.m., caso contr ario, com prob-
abilidade 1 .
a
2
) Apostar num jogo onde ganha-se 1000 u.m. se certo evento ocorrer,
com probabilidade ou perde-se 1000 u.m., caso contr ario, com
probabilidade 1 .
Suponha que = 1/2.

E senso comum que a segunda alternativa
e mais arriscada do que a primeira, embora do ponto de vista do valor
esperado da perda monet aria sejam equivalentes. A segunda alternativa
imp oe uma eventual perda de valor expressivo.
52 CAP

ITULO 2. CONCEITOS B

ASICOS
Os criterios apresentados anteriormente aferem risco atraves da perda
esperada ou do criterio minimax n ao levando em considera c ao a ampli-
tude envolvida nos resultados monet arios associados ` as v arias op c oes.
Nas aplica c oes os riscos podem ser avaliados pela probabilidade de certos
eventos indesej aveis ou por alguma medida de dispers ao. Por exemplo,
em risco poltico o evento poderia ser a expropria c ao do capital de um
rma em certo pas estrangeiro, enquanto que na area de seguro o risco
poderia ser mensurado como a quantidade m axima de u.m. que uma
seguradora pode perder em uma certa ap olice.
Nas aplica c oes nanceiras o conceito de risco confunde-se com o de
variabilidade associada a distribui c ao dos ganhos ou perdas monet arias.
Um exemplo cl assico esta presente na an alise de portf olios onde pretende-
se maximizar o retorno esperado sujeito a uma limita c ao de vari ancia
(risco). Uma cl asse de medidas de risco em nan cas e dada por:
r(a
j
) =

(y c)

p
j
(y)dy
onde a
j
representa a j-esima a c ao, y os retornos com densidade p
j
(y), de-
pendendo da a c ao j e c e um valor crtico particular, tambem denominado
de RaM - retorno aceit avel mnimo. Alguns casos especiais s ao,
Variancia
Esta e a medida tradicionalmente usada em decis oes nanceiras. Em
nosso exemplo anterior sobre a constru c ao de um portf olio, nosso criterio
consistia em simultaneamente minimizar a vari ancia e maximizar o re-
torno. Esta medida de risco e obtida a partir de nossa deni c ao geral
fazendo-se c =
j
= E
j
(y) e = 2.
2.8. AN

ALISE DE RISCO 53
Semivariancia ou Downside-risk
Sua principal vantagem e levar em conta somente o domnio de risco
de real interesse, por exemplo os retornos mais baixos. Fica denida
para = 2 e c um valor crtico qualquer. Uma deni c ao alternativa
desta medida de risco, frequentemente encontrada na lituratura recente
de nan cas, denominada downside risk - DsR, e denida por:
DsR(a
j
) =

min(0, y c)
2
p
j
(y)dy
Probabilidade crtica
Semelhante a semivari ancia, mas tendo como medida de risco a probabil-
idade, isto e:
V aR(a
j
) = P
j
[y c] =

p
j
(y)dy
Na literatura recente de nan cas esta quantidade recebe o nome de VaR
- value at risk.
Sobra ainda a quest ao de como comparar as op c oes ap os o c alculo de
uma dessas medidade de risco. Por exemplo, como comparar o par (valor
esperado, risco)? Uma possibilidade e denir uma regra de domin ancia.
Se duas op c oes tem o mesmo valor esperado seleciona-se aquela de menor
risco. Se, por outro lado, duas op c oes tem o mesmo risco, selecione aquela
de maior valor esperado. Observa-se assim que a medida de risco pode
servir como uma mera restri c ao num problema de otimiza c ao.
Exemplo 2.9 As alternativas de investimentos em ativos de risco. Na
tabela abaixo apresentamos os retornos mensais, em percentagem, obser-
vados ao longo de um ano.
Podemos calcular, com base nesses dados, os correspondentes amostrais
das medidas de risco denidas acima, supondo, por exemplo c = 10%.
54 CAP

ITULO 2. CONCEITOS B

ASICOS
Meses
A c oes 1 2 3 4 5 6 7 8 9 10
a
1
12 17 11 18 17 23 20 19 13 10.3
a
2
2.71 4.86 5.28 2.28 2.71 .14 1.42 1.86 4.43 5.58
Tabela 2.13: Retornos mensais de dois ativos de risco
Obtendo-se, ap os alguns c alculos, os resultados da tabela 2.14. Vale no-
tar que como todos os retornos do ativo a
1
superam c, gerando assim
medidas de risco alternativas nulas. Fica tambem f acil ver que o V aR do
ativo a
2
e igual a 1, pois c supera todos seus retornos observados. Por-
tanto, as conclus oes s ao: o ativo a
1
tem risco menor, exceto quando esta
medida for a vari ancia, e retorno medio signicativamente maior. Logo
a
1
ser a prefervel sempre que usarmos umas das medidas alternativas de
risco e um valor de c 10.3%.
Se c = 4% fosse utilizado, teriamos DsR = 2.29 e V aR = .58 para
a
2
. Decrescendo c, obviamente, as medidas de risco, exceto a vari ancia,
diminuir ao. Analogamente, para c = 15% teriamos V aR = 0.33 e DsR =
3.59 para a a c ao a
1
, com os equivalentes de a
2
inalterados. Assim se
c = 15% e se a medida de risco utilizada fosse o DsR, a a c ao a
2
seria
prefervel.
Ativos Media Vari ancia VaR DsR
a
1
16.03 18.05 0 0
a
2
3.13 3.32 1.0 3.32
Tabela 2.14: Retornos e riscos dos ativos a
1
e a
2
2.9. DOMIN

ANCIA ESTOC

ASTICA 55
2.9 Domin ancia estoc astica
Em v arias situa c oes pode ser pouco natural comparar alternativas (de-
cis oes) simplesmente atraves de seus retornos (monet arios) esperados.
Entretanto, existem situa c oes onde se deseja encontrar alternativas que
sejam dominantes de maneiras mais gerais e mais abrangentes. Nessa
se c ao introduziremos o conceito de domin ancia estoc astica de primeira
(relativa aos retornos) e segunda ordem (relativa aos riscos). A intui c ao
b asica e poder encontrar meios para dizer, por exemplo, que a dis-
tribui c ao F produz retornos maiores que a distribui c ao G ou que a
distribui c ao F tem menor risco do que a distribui c ao G. Vejamos um
pequeno exemplo para introduzir essas ideias.
Exemplo 2.10 Suponha que, em um problema de decis ao, existam tres
possveis a c oes, a
1
, a
2
, a
3
, tres possveis estados da natureza,
1
,
2
,
3
,
com ganhos descritos pela tabela 2.15. Pode ser facilmente constatado
que a a c ao a
1
domina a a c ao a
2
pois os retornos sob a
1
s ao maiores que
os retornos sob a
1
para todos os possveis estados da natureza. O mesmo
j a n ao pode ser dito quando se compara a
1
e a
3
ou a
2
e a
3
.
A c oes
Estados a
1
a
2
a
3

1
6 3 8

2
5 4 2

3
7 6 3
Tabela 2.15: Matriz de ganhos
Essa se c ao e essencialmente inspirada em Mas-Colell, Whinston, and
Green (1995), que dedica um captulo inteiro ao problema de decis ao sob
incerteza. Outras referencias sobre domin ancia estoc astica s ao: o captulo
56 CAP

ITULO 2. CONCEITOS B

ASICOS
4 de Bunn (1984), Whitmore and Findlay (1978) e, mais recentemente,
Levy (1998).
Deni c ao 2.9 Domin ancia Estoc astica de Primeira Ordem: A
distribui c ao F domina G estocasticamente em primeira ordem se, para
toda fun c ao n ao-decrescente u : ' ',

u(x)dF(x)

u(x)dG(x)
Pode ser mostrado o seguinte resultado imediato dessa deni c ao.
Teorema 2.3 F domina G estocasticamente em primeira ordem se e
somente se F(x) G(x) para todo x.
A gura 2.10 ilustra a ideia de domin ancia estoc astica de primeira
ordem. Aqui F domina G pois o gr aco da F est a uniformemente abaixo
do gr aco da G indicando que valores maiores tem maiores probabilidades
sob F.
Como pode ser visto, domin ancia estoc astica n ao necessariamente im-
plica que todo possvel retorno em F ser a maior que todo possvel retorno
em G. Domin ancia estoc astica de primeira ordem implica que a media de
X sob F, E
F
(X), e maior que a media de X sob G, E
G
(X). O contr ario
n ao e necessariamente verdadeiro, isto e, E
F
(X) E
G
(X) n ao implica em
F ser estoc asticamente dominante com rela c ao a G. Isso se deve ao fato
de toda a distribui c ao ser relevante quando se fala em domin ancia. Uma
segunda forma de domin ancia pode ser denida se quisermos comparar
os riscos (dispers ao) associados ` as distribui c oes dos retornos. Intuitiva-
mente, dizemos que G(.) e mais arriscada que F(.) quanto todo tomador
de decis oes averso ao risco preferir
Deni c ao 2.10 Domin ancia Estoc astica de Segunda Ordem: Se-
jam F e G, tais que E
F
(X) = E
G
(X). A distribui c ao F domina G
2.9. DOMIN

ANCIA ESTOC

ASTICA 57
Figura 2.10: F domina G estocasticamente em primeira ordem.
estocasticamente em segunda ordem se, para toda fun c ao c oncava n ao-
decrescente u : '
+
',

u(x)dF(x)

u(x)dG(x)
Uma forma alternativa de caracterizar domin ancia de segunda ordem
e atraves do conceito de mean-presearving spread (espalhamento com
preserva c ao da media). Considere a seguinte loteria composta em dois
passos:
1. Um premio intermedi ario x e sorteado a partir da distribui c ao F(.)
2. Ao premio x e acrescido o valor z (que pode ser negativo). Esse
58 CAP

ITULO 2. CONCEITOS B

ASICOS
ultimo e sorteado a partir de uma distribui c ao H
x
(.) com media
nula, de sorte que x +z tambem tenha media x
Denote por G(.) essa loteria composta. Quando uma loteria G puder
ser obtida a partir de uma outra loteria F, para alguma H
x
, diz-se que G
e um espalhamento de F com preserva c ao da media. O exemplo abaixo
ilustra essa nova ideia Mas-Colell, Whinston, and Green (1995).
Exemplo 2.11 Seja F a fun c ao de distribui c ao com massas iguais em
2 e 3. Ent ao a fun c ao de distribui c ao, G, com massas iguais em 1,2,3,4
e um espalhamento de F com preserva c a da media (veja a gura 2.11).
Figura 2.11: G e um espalhamento de F com preserva c ao da media.
2.9. DOMIN

ANCIA ESTOC

ASTICA 59
Se u(.) e c oncava,

u(x)dG(x) =

u(x +z)dH
x
(z)

dF(x)

(x +z)dH
x
(z)

dF(x)
=

u(x)dF(x)
e pode ser mostrado que o seguinte resultado e v alido.
Teorema 2.4 G(.) e um espalhamento de F com preserva c ao da media e
equivalente a dizer que F domina G estocasticamente em segunda ordem
Nos pr oximos captulos formalizaremos o conceito de fun c ao de utili-
dade, probabilidade subjetiva, entre outros. Veremos, por exemplo, que
nem sempre a utilidade do dinheiro, ou de qualquer outro bem, pode ser
medida atraves do valor do dinheiro.
60 CAP

ITULO 2. CONCEITOS B

ASICOS
Captulo 3
Modelos Gracos
3.1 Introdu c ao
Neste captulo iremos apresentar v arios instrumentos gr acos disponveis
para facilitar a modelagem de problemas complexos de decis ao.
Iniciaremos pela descri c ao das redes Bayesianas e depois apresentare-
mos os diagramas de inuencia e as arvores de decis ao. Os diagramas
de inuencia s ao grafos acclicos direcionados (DAG). Incluem como caso
especial as redes Bayesianas de probabilidade, as quais ser ao exempli-
cadas ao longo deste texto. As arvores de decis ao representam igualmente
problemas de decis ao considerando eventuais assimetrias, o que facilita
a sua implementa c ao computacional. Um caso particular de arvore de
decis ao servir a para a simples descri c ao gr aca de distribui c oes conjuntas
de probabilidade.
Ser ao tambem apresentados neste captulo os principais aspectos dos
pacotes DPL - data programming language e um exemplo envolvendo o
uso do WinBUGS - Bayesian analysis using Gibbs sampler. O primeiro
implementa um problema de decis ao estatstica atraves de diagrama de
inuencia (DI) e arvores de decis ao (AD). V arias facilidades de an alise
61
62 CAP

ITULO 3. MODELOS GR

AFICOS
s ao encontradas neste pacote como, por exemplo, an alise de sensibilidade,
interface com planilhas eletr onicas, simula c oes de Monte Carlo, etc. O
BUGS por seu turno descreve modelos probabilsticos complexos a partir
de um DAG, permitindo que as inferencias e previs oes sejam realizadas
por metodos de simula c ao estoc astica. Sua estrutura e t ao ampla que
mereceria ser descrito num captulo pr oprio, o que foge aos prop ositos
deste texto. Finalmente, na area de redes Bayesianas mencionamos o
Hugin e o JavaBayes, os quais permitem a avali c ao de probabilidades
condicionais de forma simples. Atraves deles e possvel calcular proba-
bilidades marginais das vari aveis de interesse, bem como executar an alise
de robustez ou de sensibilidade.
Modelos gr acos constituem uma ferramenta natural para lidar com
problemas que envolvem incerteza e complexidade. Podem, resumida-
mente, ser caracterizados como uma fus ao perfeita entre a teoria de prob-
abilidades e a teoria de grafos. Portanto, modelos gr acos s ao meros
grafos onde os n os s ao vari aveis aleat orias e a ausencia de arcos represen-
ta alguma hip otese de independencia condicional. Existem duas classes
de modelos gr acos: os baseados em grafos n ao direcionados e aque-
les baseados em grafos direcionados. Os primeiros, incluem os modelos
de campos aleat orios Markovianos e os ultimos, as denominadas redes
Bayesianas e os diagramas de inuencia. Um exemplo de grafo n ao dire-
cionados em estatstica ocorre em modelos log-lineares. Nesta monograa
s o utilizaremos modelos baseados em grafos direcionados.
Iniciaremos o captulo com a discuss ao de redes Bayesianas. Ap os
apresentar os principais conceitos envolvidos discutiremos um exemplo
bastante simples. A seguir, os principais modelos de decis ao sob incerteza
ser ao apresentados, incluindo os diagramas de risco simples, informa c ao
imperfeita, decis oes sequenciais, modelos com multi-atributos e diagra-
mas de c alculos intermedi arios. Concluiremos com uma ampla discuss ao
do uso do DPL, incluindo um exemplo razoavelmente complexo. As re-
ferencias mais inuentes neste captulo s ao Clemen (1996) e Golub (1997)
3.2. REDES BAYESIANAS 63
no que se refere aos conceitos de diagramas de inuencias e Murphy (2001)
e Jensen (1998), nos conceitos de modelos gr acos e, em particular, em
redes Bayesianas.
3.2 Redes Bayesianas
Os modelos de redes Bayesianas s ao grafos direcionados nos quais os
n os representam vari aveis aleat orias e a ausencia de arcos, suposi c oes de
independencia condicional (Murphy, 2001). Um arco de A para B pode
informalmente ser interpretado como A causando B. Frequentemente,
n ao se permite a ocorrencia de ciclos. Denomina-se de pais de certo n o a
todos aqueles n os que o inuenciam diretamente ou o antecedem. Assim
dado seus pais um n o, , e independente de todos os demais n os do grafo,
exceto os que s ao seus descendentes. Uma arma c ao de independencia
condicional envolvida na estrutura de uma rede Bayesiana e de que um n o
e independente dos ascendentes de seus pais. Estes s ao conceitos ligados
a uma particular topologia ordenando os n os.
Exemplo 3.1 Consideremos o exemplo da gura 3.1, onde os n os s ao
vari aveis aleat orias bin arias. Denote por M a vari avel aleat oria a grama
esta molhada, por N, o tempo est a nublado, por C, o evento estar
chovendo e por G, o evento girador d agua est a ligado.
O evento M tem duas causas possveis: G ou C. Isto e, a grama estar a
molhada por conta do girador d agua estar ligado ou por estar choven-
do. As probabilidades condicionais P[M[G, C] reetem a for ca dessas
rela c oes. Como o n o N n ao possui pais, suas probabilidades condicionais
ser ao denominadas de probabilidades a priori. Por exemplo, P[N = 1] =
.5, P[G = 1[N = 1] = 0.1, P[M = 1[G = 1, C = 1] = 0.99. Observe que
M N[G, C. Pelas regras b asicas de probabilidade teremos:
P[N, G, C, M] = P[N] P[G[N] P[C[N, G] P[M[N, G, C]
64 CAP

ITULO 3. MODELOS GR

AFICOS
Figura 3.1: Rede Bayesiana: cada n o refere-se a uma vari avel aleat oria
dicot omica
entretanto a topologia do grafo associado a este exemplo permite usar as
independencia condicional para obter-se:
P[N, G, C, M] = P[N] P[G[N] P[C[N] P[M[G, C]
ou seja: C G[N e M N[G, C.
A partir do modelo descrito pelo DAG desejamos fazer inferencias,
isto e, calcular probabilidade de alguns n ao observ aveis com base nos da-
dos observados. Podemos distinguir duas opera c oes complementares: di-
agn ostico e predi c ao. No primeiro, observamos as folhas do grafo e faze-
mos inferencias sobre as causas. No exemplo anterior teriamos P[G =
1[M = 1] representando a probabilidade do girador estar ligado consid-
erando-se que a grama est a molhada e, tambem, P[C = 1[M = 1]. Pode-
riamos decidir qual a causa mais prov avel da grama estar molhada. A
outra situa c ao corresponde a predizer, com base nas causas, o estado -
nal de algumas vari aveis de interesse. Por exemplo: qual a probabilidade
3.2. REDES BAYESIANAS 65
da grama estar molhada dado que o girador est a ligado mas n ao esta
chovendo P[M = 1[G = 1, C = 0].
A complexidade computacional decorre sobretudo da avalia c ao da
constante de normaliza c ao envolvida na aplica c ao do teorema de Bayes.
V arios algortmos s ao apresentados na literatura para lidar com o prob-
lema da elimina c ao de vari aveis.
Para concluir esta se c ao apresentaremos o DAG de um problema es-
tatstico razoavelmente complexo onde os n os envolvemvari aveis aleat orias
contnuas.
Exemplo 3.2 Modelo Fatorial Consideremos a seguinte estrutura.
y
t
[f
t
N(f
t
, )
f
t
N(0, I)
onde y
t
e um vetor m-dimensional, f
t
e um vetor k-dimensional de fa-
tores comuns e e uma matriz de vari ancia-covari ancias de dimens ao
m m, geralmente diagonal. Em geral k e bem menor que m de for-
ma que o modelo trata de explicar um vetor de alta dimens ao a partir
de combina c oes lineares de aspectos de menor dimens ao n ao observ aveis
(da o nome fatores comuns). Note que o modelo acima descreve a es-
trutura de variabilidade marginal de y
t
, a quantidade observ avel, atraves
de

+ . V arias simplica c oes deste modelo s ao possveis. Por ex-


emplo, se =
2
I
m
ent ao, condicionalmente a f
t
as componentes de
y
t
ser ao tambem independentes e possuir ao a mesma vari ancia. A rede
Bayesiana ilustrada na gura 3.2 descreve este modelo. Se
2
0 ent ao
a estima c ao de m axima verossimilhan ca de ser a dada pelos m autove-
tores principais, isto e, correspondente aos maiores autovalores da matriz
de covari ancia amostral.
Na gura 3.3 apresentamos o algoritmo escrito (automaticamente)
pelo WinBugs para o DAG da gura 3.2. Nesse contexto, e diagonal
66 CAP

ITULO 3. MODELOS GR

AFICOS
Figura 3.2: Rede Bayesiana para o modelo fatorial.
com elementos
2
j
=
2
j
, para j = 1, . . . , m, na diagonal principal. A
informa c ao a priori, assim como na gura 3.2, e tal que,

2
j
Gama(v
0j
, v
0
s
2
0j
)

j
N(m
0j
, C
0j
)
para j = 1, . . . , m e hiperpar ametros v
0j
, s
2
0j
, m
0j
e C
0j
xos para j =
1, . . . , m.
3.2. REDES BAYESIANAS 67
model;
{
for( j in 1 : M ) {
for( i in 1 : T ) {
y[i , j] ~ dnorm(m[i , j],tau2[j])
}
}
for( j in 1 : M ) {
for( i in 1 : T ) {
m[i , j] <- beta[j] * f[i]
}
}
for( j in 1 : M ) {
for( i in 1 : T ) {
f[i] ~ dnorm( 0.0, 1.0)
}
}
for( j in 1 : M ) {
tau2[j] ~ dgamma(v0[j],v0s02[j])
}
for( j in 1 : M ) {
beta[j] ~ dnorm(m0[j],C0[j])
}
}
Figura 3.3: Modelo fatorial est atico no WinBugs.
68 CAP

ITULO 3. MODELOS GR

AFICOS
Mais referencias e detalhes a repeito dos modelos fatoriais (est aticos
ou din amicos) podem ser encontrados na tese de doutorado do segundo
autor (Lopes 2000), alem de Lopes, Aguilar, and West (2000) e Lopes
and Migon (2002). Num contexto mais especco, o seguinte exemplo
ilustra uma aplica c ao recente de modelos fatoriais din amicos para dados
de mercados acion arios latino americanos.
Exemplo 3.3 Um tema bastante atual em nan cas e a forma com que
os mercados acion arios se contagiam em perodos de crises. Os anos 90
forem repletos de tais eventos: Efeito Tequila em 1994, Gripe Asi atica em
1997, Resfriado Siberiano em 1998, e a Febre Brasileira de 1999. Num
estudo recente (Lopes and Migon 2002), analisamos dados de quatro mer-
cados latino-americanos, alem dos Estados Unidos. Foram observadas as
taxas de retorno di arias dos ndices IBOVESPA, MEXBOL, MERVAL
e IPSA, alem do Dow Jones, no perodo de agosto de 1994 a fevereiro
de 2001, num total de 1484 observa c oes. Um modelo de an alise fato-
rial com volatilidade estoc astica com par ametros variando no tempo foi
desenvolvido e aplicado.
3.3 Diagrama de inuencia e arvore de de-
cis ao
Nesta se c ao descreveremos os modelos b asicos de decis ao e suas represen-
ta c oes atraves de diagramas de inuencia e arvores de decis ao. Estes dois
diagramas s ao de alguma forma complementares. Os primeiros s ao mais
uteis na etapa de modelagem enquanto que as AD s ao mais adequadas
para se implementar a solu c ao otima atraves do algortmo de indu c ao de
tr as para diante (backward induction). Este, como j a comentamos, inter-
cala opera c oes de esperan ca, para eliminar incertezas, com opera c oes de
maximiza c ao para escolher as a c oes que maximizem a utilidade esperada.
3.3. DIAGRAMA DE INFLU

ENCIA E

ARVORE DE DECIS

AO 69
Alem disto, como os diagramas de inuencia s ao muito mais compactos
na descri c ao da estrutura do problema, ser ao preferveis para a comu-
nica c ao, sobretudo, com pessoas n ao tecnicas envolvidas na an alise de
decis ao de um problema. As solu c oes otimas independem da escolha feita
para representa c ao de nossos problemas posto que os DI e as arvores de
decis ao s ao isomorfos. V arios metodos foram prospostos para a solu c ao
do diagrama de inuencia como, por exemplo, o algoritmo proposto por
Shachter (1986) o qual permite a avalia c ao do diagrama de inuencia sem
ser necess ario transform a-lo em uma arvore de decis ao.
Um smbolo especial ser a utilizado para representar cada uma das
componentes da tripla que caracterisa um problema de decis ao - -espa co
dos estados da natureza, / - espa co das a c oes e L(a, ) - a fun c ao de per-
da. Os eventos incertos ser ao representados por crculos, as decis oes por
ret angulos e os valores assumidos pela fun c ao de perda ou conseq uencias
por ret angulos com as arestas arredondadas.
Dois tipos de arcos os de sequencia e os de relev ancia caracteri-
zam um diagrama de inuencia. Esta nomeclatura e particularmente util
na descri c ao dos algortimos ecientes para a solu c ao de diagramas de
inuencia.
Deni c ao 3.1 Um arco e dito de sequencia se aponta para um n o de-
cis orio e ser a denominado de relev ancia se aponta para um n o de chance
ou de consequencia.
Assim um n o de relev ancia indica que o predecessor e fundamen-
tal para descrever as incertezas referentes aos eventos incertos. Por
seu turno os arcos de sequencia prestam-se para descrever informa c oes
disponveis no momento de se tomar decis oes. Esses conceitos s ao partic-
ularmente importantes para o desenvolvimento de algortmos ecientes
para a solu c ao dos diagramas de inuencia.
Com estes conceitos mnimos ` a m ao, passaremos a descrever alguns
diagramas de inuencia uteis para representar componentes de um prob-
70 CAP

ITULO 3. MODELOS GR

AFICOS
lema de decis ao complexo. Nos limitaremos aos aspectos estatsticos e
de aplica c ao da an alise de decis ao. Muitos desenvolvimentos na area de
modelos gr acos ocorrem na fronteira da estatstica, matem atica aplicada
grafos e em ciencia da computa c ao.
Risco Basico
Este e o modelo mais simples de tomada de decis ao sob incerteza.

E util
para representar decis oes de investimentos e, tambem, na area atuarial,
por exemplo quando temos de decidir se contratamos ou n ao um seguro
para nossos bens.
No problema de decis ao de risco b asico, a satisfa c ao do decisor e fun c ao
da a c ao escolhida e de um evento incerto. Seu diagrama de inuencia e
extremamente simples. As possveis a c oes est ao representadas por um
ret angulo, o evento incerto por um crculo e as consequencias por um
ret angulo com bordas abauladas. Os arcos orientados conectam as a c oes
e os eventos incertos ao ret angulo de bordas abauladas, que representa as
consequencia, descrevendo a rela c ao funcional existente (gura 3.4). Nas
redes Bayesianas de probabilidades n ao apareciam os n os decis orias e de
consequencias caracterizando uma tenue diferen ca entre estes instrumen-
tos.
No exemplo atuarial poderamos ter a decis ao de adquirir um seguro
de vida de certo valor, as incertezas seriam traduzidas pelas taxas de
mortalidade e as consequencias descritas por alguma medida do suporte
nanceiro da famlia.
Uma pequena variante deste modelo mais simples, que denomiremos
de poltica de risco b asico, inclue um arco conectando as a c oes ao
crculo que representa os estados da natureza ou eventos incertos. Em
alguns problemas a a c ao escolhida inuencia as probabilidades sobre os
eventos incertos (gura 3.5). Este fato ser a descrito pela inclus ao de um
arco de relev ancia conectando o n o de decis ao ao n o aleat orio.
3.3. DIAGRAMA DE INFLU

ENCIA E

ARVORE DE DECIS

AO 71
Figura 3.4: DI para risco b asico: decis ao prim aria (a), evento incerto ()
e consequencias (c)
Figura 3.5: DI para poltica de risco b asico
72 CAP

ITULO 3. MODELOS GR

AFICOS
Estes dois modelos poderiam ser representados atraves de uma arvore
de decis ao. Um exemplo de arvore de decis ao mais concreto seria o de
um problema de investimento. Suponha que temos somente duas alter-
nativas: realizar um investimento em ativo de risco ou n ao. Os estados
da natureza representam as possibilidades de um excelente retorno ou
uma derrocada. N ao investindo obteramos o retorno de um ativo livre
de risco, por exemplo a caderneta de poupan ca. Assim teramos:
Figura 3.6: AD para investimento em ativo de risco: a decis ao prim aria
seria investir ou n ao, o evento incerto caracterizaria o sucesso ou fracasso
do investimento e a consequencia seria o montante auferido.
Vale notar que neste exemplo a arvore de decis ao permite facilmente
considerar a assimetria presente no processo de decis ao. Uma das
alternativas promove um ganho pequeno, porem certo. Esta e uma das
vantagens da arvore de decis ao em rela c ao ao diagrama de inuencia, a
qual se torna relevante quando se esta diante de um problema de alta
complexidade.
Uma pequena variante seria uma arvore de decis ao para um modelo
3.3. DIAGRAMA DE INFLU

ENCIA E

ARVORE DE DECIS

AO 73
de risco b asico duplo. Temos, como no exemplo anterior, somente
duas a c oes alternativas. Por exemplo, investir num ativo de risco ou, por
exemplo, numa ativo real. Ambos podem gerar como consequencia um
excelente retorno ou n ao.
Modelo de Informa cao Imperfeita
Em muitas situa c oes desejamos descrever no processo de tomada de de-
cis oes a possibilidade de se obter informa c oes imperfeitas sobre eventos
incertos, os quais afetam, obviamente, as consequencias decorrentes da
escolha das a c oes otimas. A origem dessas informa c oes pode ser de pelo
menos tres naturezas: previs oes, diagn osticos ou estima c ao. Frequente-
mente, provem de um especialista ou de um modelo computacional, em
geral de natureza estatstica. Incluiremos um novo n o aleat orio para rep-
resentar a informa c ao imperfeita o qual receber a um arco com origem no
n o aleat orio e originar a outro com destino ao n o decis orio. O primeiro
ser a um arco de relev ancia e o outro de sequencia.
Diagramas de calculos intermediarios
A principal caracterstica dos diagramas de inuencia para c alculos inter-
medi arios e que n ao envolvem n os aleat orios. Limitam-se a representar
rela c oes estruturais entre n os de constantes ou de c alculo.
Antes de prosseguir seria util apresentarmos um exemplo envolvendo
um diagrama de inuencia com certa complexidade. Este e um exemplo
extrado do livro de Clemen (1996).
Exemplo 3.4 Uso de certo Produto Qumico
Uma agencia de prote c ao ambiental, frequentemente, deve decidir se
autoriza ou n ao o uso de um certo produto qumico, economicamente
vi avel, mas que pode ter efeitos cancergenos. As decis oes ser ao tomadas
com informa c oes imperfeitas sobre os riscos ` a sa ude e os benefcios de
74 CAP

ITULO 3. MODELOS GR

AFICOS
Figura 3.7: DI e AD para informa c ao imperfeita.
Figura 3.8: DI para c alculos intermedi arios; uma situa c ao de objetivos
m ultiplos sem decis ao de risco.
3.3. DIAGRAMA DE INFLU

ENCIA E

ARVORE DE DECIS

AO 75
longo prazo. Os diferentes cursos de a c ao incluem conceder a permiss ao
de uso, autoriz a-lo com restric ao ou n ao autorizar o uso. Do lado es-
tatstico devemos realizar ensaios clnicos para determinar o potencial
cancergeno do produto qumico e levantar, atraves de pesquisa, o grau de
exposi c ao de seus usu arios ao produto qumico. Esses dados s ao muito
importantes pois, por exemplo, se o produto for suavemente t oxico e se a
taxa de exposi c ao for pequena ent ao e razo avel decidir por um uso restrito.
Deseja-se deteminar um nvel de utiliza c ao do produto de forma a atender
os objetivo de maximizar o valor econ omico do uso e, simultaneamente,
minimizar o custo do c ancer.
Figura 3.9: DI agregado sobre o uso de qumico. uso: nvel de utiliza c ao
do produto qumico, risco: risco de c ancer, valor: valor econ omico, :
potencial cancergeno e : taxa de exposi c ao ao produto qumico.
Alem do nvel de utiliza c ao do produto qumico as quantidades incer-
tas, potencial cancergeno e taxa de exposi c ao ao produto afetam o risco
de c ancer, o qual permitir a o c alculo do custo do c ancer. Assim teremos
um segundo diagrama de inuencia para c alculos intermedi arios (gura
76 CAP

ITULO 3. MODELOS GR

AFICOS
3.10).
Figura 3.10: DI para c alculo do risco de c ancer
Falta ainda incorporar as informa c oes imperfeitas provenientes dos
testes de potencial cancergeno e das pesquisas para determina c ao do grau
de exposi c ao ao t oxico. Observe que teremos um arco conectando a quanti-
dade desconhecida - potencial cancergeno - ao n o estoc astico que descreve
o teste de ensaio clnico para sua determina c ao. Assim, denotando-se o
potencial cancergeno por , o teste ter a uma distribui c ao denotada por
T[. Da mesma forma, denotamos a quantidade n ao observ avel, taxa
de exposi c ao, por e por S[, a informa c ao imperfeita decorrente da
pesquisa de exposi c ao ao produto.

E importante observar que tanto
quanto afetam o risco de c ancer. Este exemplo demonstra a efetivi-
dade do uso de diagramas de inuencia na estrutura c ao de um problema
de decis ao. Embora este seja relativamente complexo, seu diagrama de
inencia e compacto e de f acil compreens ao.
3.3. DIAGRAMA DE INFLU

ENCIA E

ARVORE DE DECIS

AO 77
Decis oes sequenciais
Estas surgem em modelos complexos onde as decis oes est ao implicita
ou explicitamente ordenadas temporalmente. As condi c oes decis orias se
modicam dinamicamente, de sorte que e plausvel assumir que alterna-
tivas selecionadas em certo momento poder ao ser revisadas em instantes
futuros. Uma caracterstica b asica dessas estruturas e que as decis oes
se sucedem, umas inuindo nas outras, e as consequencias quando mon-
et arias devem ser resumidas num unico valor obtido da aplica c ao do con-
ceito de valor presente a cada uma das parcelas. Para isto utiliza-se um
fator de desconto, em geral suposto temporalmente invariante e conheci-
do precisamente. Um exemplo, para motivar, poderia ser aquele de um
investidor que antes de se decidir pelo investimento em certo ativo de
risco prefere contratar os servi cos de um consultor que o orientar a. As-
sim antes de mais nada, ele se coloca uma nova quest ao: deve ou n ao
contratar um consultor? Ser a que o custo dessas informa c oes imperfeitas
e aceit avel, face ao conte udo de informa c ao disponibilizado?
Figura 3.11: Diagrama de inuencia para decis oes sequenciais
78 CAP

ITULO 3. MODELOS GR

AFICOS
Para completar esta se c ao destacaremos alguns erros comumente cometi-
dos na elabora c ao dos diagramas de inuencia.

E bom come car distin-
guindo um diagrama de inuencia de um uxograma. Um uxograma
limita-se a descrever sequencialmente atividades e eventos, enquanto que
um DI descreve um instant aneo de um processo decis orio levando em
considera c ao todos os elementos envolvidos nas decis oes imediatas. Um
segundo erro comumente cometido e conectar os n os de chance ao n o
decis orio na tentativa de representar que as decis oes s ao tomadas em am-
biente de incerteza. Como vimos um arco em dire c ao a um n o decis orio
representar a alguma forma de informa c ao disponvel ao tempo de se es-
colher as decis oes. Estes s ao arcos de sequencia, indicando portanto que
o decisor deve aguardar a resolu c ao dessas incertezas antes de decidir.
Finalmente, n ao e permitido incluir ciclos em DI. Estes prestam-se para
representar alguma forma de feedback (retroalimenta c ao). Como nossos
DI representam um instant aneo do processo decis orio n ao haver a oportu-
nidade para se considerar feedback.
3.4 Introdu c ao ao DPL
Como j a amencionamos o DPL - Decision Programing Language e um
dos softwares disponveis para modelar e resolver problemas de an alise
de decis oes atraves de diagramas de inuencia e arvores de decis oes. De-
screveremos nesta se c ao alguns aspectos introdut orios da vers ao de es-
tudante DPL - Student version release 4.01.00, Copyright 1989-1998-
Applied Decision Analysis LLC, Pricewaterhouse Coopers LLP. Este e um
produto Windows based incorporando, portanto, suas facilidades usuais.
O sistema permite denir projetos conjuntos de tarefas que podem
ser salvos a cada sess ao. Alem disto, podemos exportar ou importar com-
ponentes de um projeto, o que pode ser util quando, por exemplo, um
diagrama de inuencia de um projeto deva ser includo em outro. Existe
um m odulo de programa c ao e facilidades de comunica c ao com planil-
3.4. INTRODUC

AO AO DPL 79
has. Um sistema de ajuda e v arias facilidades tpicas do Windows est ao,
tambem, disponveis. Nos limitaremos nesta se c ao, a introduzir os princi-
pais conceitos envolvidos na janela relativa ao interface gr aco do sistema
- DPL draw window, o qual estar a automaticamente disponvel na vers ao
que estaremos utilizando.
Como j a dissemos apresentaremos somente os comandos essencias
para resolver um problema introdut orio de decis oes. Detalhes adicionais
poder ao ser encontrados no pr oprio help do sistema.
Aspectos basicos
Na barra de comandos encontram-se os smbolos gr acos necess arios para
a elabora c ao de um diagrama de inuencia: ret angulo amarelo para
representar o espa co das a c oes, crculo verde para descrever o espa co dos
estados da natureza, ret angulo abaulado azul claro e arco magenta para
indicar rela c oes ou condicionamento entre os elementos.
Ao se clicar com o bot ao da esquerda do mouse sob um elemento
gr aco (n o) se abrir a uma caixa onde podemos atribuir nomes, valores,
coment arios e conec c oes. Na atribui c ao de valores existe uma linha para
a introdu c ao de f ormulas. Esta se utiliza de fun c oes especiais do sistema
(smbolo f, ` a esquerda) e das vari aveis disponveis (idem, ).
Neste momento, o melhor ser a apresentar um pequeno exemplo.
Exemplo 3.5 Em certa manh a de setembro, ao se preparar para sair
em dire c ao ` a universidade voce dever a decidir se leva ou n ao um guarda-
chuva.

E claro que poder a chover ao longo de seu trajeto. Nesta epoca
do ano, voce atribui probabilidade de 0.6 de se ter um dia ensolarado. As
consequencias associadas as estas decis oes e estados da natureza decor-
rem de dois fatos: os incovenientes de se tomar chuva (roupa molhada,
resfriado etc) e o fato de que voce costuma perder seu guarda-chuva sis-
tematicamente, tendo de gastar preciosos reais na compra de outro.
80 CAP

ITULO 3. MODELOS GR

AFICOS
Temos dois objetivos distintos denominados: cat astrofe para represen-
tar o qu ao desagrad avel ser a voce assistir ` as aulas com as roupas molhadas
e conveniencia para descrever o seu desagrado em carregar um guarda-
chuva e eventualmente perde-lo. Suponhamos que os ganhos associados
ao primeiro desses objetivos sejam de 100 unidades, em geral, e 0 quando
chove e voce n ao levou o guarda-chuva. Com rela c ao ao segundo ob-
jetivo o ganho ser a de 100 unidades se voce n ao levar o guarda-chuva
e de 0 se o levar. Note que o n o denominado cat astrofe e fun c ao dos
n os guarda-chuva e chove, denomina c oes escolhidas para o n os que rep-
resentam, respectivamente, o espa co das a c oes e dos estados da natureza.
Finalmente, suponha que Voce julga que a import ancia relativa desses
dois objetivos est a na raz ao de 4 para 1 a favor do n o cat astrofe. Isto
signica que voce considera 4 vezes mais relevante o primeiro objetivo do
que o segundo. Assim, voce dever a construir um n o denominado satis-
fa c ao total poderando os valores dos n os de cat astrofe e conveniencia com
pesos
4
4+1
= 0.8 e 0.2, respectivamente.
O pacote disponibilizar a uma tela com tres janelas. A da esquerda e
o m odulo gr aco. Na parte superior voce poder a descrever seu diagra-
ma de inuencia. No presente exemplo deveremos pegar, na barra de
ferramentas, uma caixa amarela para representar o n o de decis oes, tres
ret angulos com vertices abaulados e de cor azul clara para representar as
consequencias e um crculo verde para o evento incerto. Arcos devem ser
utilizados para conectar os n os convenientemente. Por exemplo, os n os
de chance e decis orio se conectam com o n o cat astrofe, enquanto que so-
mente o n o decis orio se conectar a com o n o conveniencia. Finalmente,
os n os de objetivo se conectam ao n o satisfa c ao total.
Ao se clicar sobre um n o ele assumir a a cor magenta. Clicando duas
vezes seguidas se abrir a uma tela com possibilidades de se atribuir nomes,
os quais s ao sensitivos a letras min usculas e mai usculas, e valores aos n os,
como j a mencionado. Ap os atribuir nome aos n os deveremos introduzir
os valores das consequencias e das probabilidades.
3.4. INTRODUC

AO AO DPL 81
Figura 3.12: Diagrama de inuencia
Neste ponto e importante destacar dois cuidados:
i) na tela de dados do n o cat astrofe temos, inicialmente, de denir que
seus resultados s ao condicionados aos n os chove e guarda-chuva,
para, a seguir, atribuir o valor das consequencias a cada uma das
alternativas possveis.
ii) na tela geral de um n o de chance este, inicialmente aparecer a com
tres alternativas possveis. Devemos, no nosso exemplo, eliminar
uma delas e depois associar as probabilidades desejadas.
Introduzindo os valores mencionados no texto passamos a ter o dia-
grama completo.
Na barra superior de comandos, no ttulo Analysis encontramos o co-
mando run. Clicando nele obtemos o resulatado:
Duas facilidades adicionais, que ser ao retomadas nos pr oximos captu-
los s ao: an alise de sensibilidade e valor esperado da informa c ao perfeita.
82 CAP

ITULO 3. MODELOS GR

AFICOS
Figura 3.13: Resultado nal
An alise de sensibilidade
Para se realizar uma an alise de sensibilidade sobre o valor da probabi-
lidade de chover devemos, inicialmente, criar uma caixa com a vari avel
que representar a a probabilidade do evento, digamos , e trocar no n o
chuva a probabilidade de chover de 0.4 para . A seguir poderemos rodar
o rainbow diagram clicando em Analysis. Este far a o valor de variar no
intervalo desejado, digamos entre (0, 1). Ajustamos o n umero de passos
em 20 para obter o gr aco abaixo referente a: r(a
1
) r(a
2
) se somente
se 80 20 + 100(1 ) ou seja .25.
Valor esperado da informa c ao perfeita
Suponha que alteramos o diagrama de inuencia colocando um arco
com origem em chuva e destino em guarda-chuva. Isto dever a ser inter-
pretado como se a decis ao fosse tomada com conhecimento do estado da
natureza. Se este for chover ent ao o melhor seria levar o guarda-chuva
com um ganho de 80, e se zer sol ent ao n ao levariamos o guarda-chuva,
3.4. INTRODUC

AO AO DPL 83
Figura 3.14: Rainbow diagram
com um ganho de 100. O valor esperado ser a portanto 92, como podemos
observar na arvore de decis ao da gura 3.15.
Para completar este captulo apresentaremos um exemplo bastante in-
teressante e sua implementa c ao em DPL.
Exemplo 3.6 Explora c ao de Petr oleo (Smith, 86) Uma companhia pe-
trolfera tem a op c ao de perfurar po cos de petr oleo em um de dois campos:
A e B. As probabilidades iniciais de que se tenha oleo nesses campos
s ao, respectivamente, 0.1 e 0.2 e esses eventos podem ser considerados
independentes. Se A produzir oleo um ganho lquido de 77 milh oes de
u.m. e esperado na sua fase de opera c ao. No caso de B, teremos um
ganho lquido de 195 milh oes de u.m. .
A companhia encontra-se diante das alternativas:
i) n ao aceitar explorar nos campos A e B,
ii) aceitar explorar em A ou em B imediatamente e
84 CAP

ITULO 3. MODELOS GR

AFICOS
Figura 3.15: Valor da informa c ao perfeita
iii) pagar por uma investiga c ao de somente um dos campos (n ao dos
dois).
O resultado dessa investiga c ao ser a simplesmente aconselhar ou n ao
a perfura c ao. Com base nessas informa c oes a rma escolher a entre as
op c oes (i) e (ii).

E claro que a investiga c ao n ao e livre de incerteza, carac-
terizando um modelo de informa c ao imperfeita. Se o oleo estiver presente
ent ao a investiga c ao aconselhar a a perfura c ao com probabilidade 0.8. Se
n ao estiver presente aconselhar a com probabilidade 0.4. O custo da op c ao
e perfura c ao do campo escolhido e de 31 milh oes de u.m. enquanto que
a investiga c ao custa 6 milh oes de u.m. Um diagrama de inuencia para
este problema e t ao simples quanto apresentado na gura 3.16.
Resumindo temos as seguintes informa c oes probabilsticas disponveis:
P(A) = 0.2 e P(B) = 0.4
P(X = x[) =

0.8 se x = 1
0.2 se x = 0
3.4. INTRODUC

AO AO DPL 85
Figura 3.16: Diagrama de inuencia - informa c ao imperfeita
P(X = x[

) =

0.6 se x = 1
0.4 se x = 0
onde A e B representam os eventos ter petr oleo em A e em B e as prob-
abilidades condicionais acima valem tanto para =
1
como para =
2
.
Alem disto, =
1

2
,
1

2
,

2
,

2
, onde e o indicador
da presen ca de petr oleo, o ndice o n umero do campo petrolfero e a barra
sobre a nega c ao da presen ca de oleo. Logo, os estados da natureza
representam: ter petr oleo em ambos, em exatamente um deles e n ao ter
petr oleo nos dois campos.
O espa co das a c oes ter a cinco elementos, / = a
1
, , a
5
, onde a
1
signica investigar o campo I, a
2
- investigar o campo II, a
3
- perfurar
o campo I sem investigar, a
4
- perfurar o campo II sem investigar e a
5
-
n ao investigar e n ao perfurar.
Com as hip oteses feitas anteriormente e com os dados resumidos aci-
ma podemos facilmente calcular as probabilidades associadas aos estados
da natureza. Necessitaremos tambem, ao longo da solu c ao via arvore de
86 CAP

ITULO 3. MODELOS GR

AFICOS
decis ao, das probabilidades sobre condicionalmente aos resultados das
investiga c oes - X e ainda da marginal de X. Isto e:
P([X = 1) P() P(X = 1[)
P(X = 1) =

P(X = 1, )
A tabela abaixo resume esses c alculos

2

1

2
X
1
= 1 0.064 0.048 0.256 0.192 0.56
= 0 0.016 0.072 0.064 0.288 0.44
X
2
= 1 0.064 0.096 0.128 0.192 0.48
= 0 0.016 0.024 0.192 0.288 0.52
P[] 0.08 0.12 0.32 0.48
Tabela 3.1: Probabilidades conjuntas sobre A
onde, por exemplo:
P[
1

2
] = 0.4 0.2 = 0.08
P[X
1
= 1] = P[X
1
= 1
1
] +P[X
1
= 1

1
]
= 0.4 0.8 + 0.6 0.4 = 0.56
Para nalizar a implementa c ao devemos, ainda, obter a tabela de con-
sequencias, neste exemplo lucros lquidos. Esta envolver a somente as
a c oes terminais: perfurar I, perfurar II e n ao perfurar. Esses lucros
lquidos n ao levaram em considera c ao os custos de experimenta c ao.
Por exemplo, 46 = 77 31, isto e: ganho lquido de opera c ao menos
o custo da perfura c ao.
Podemos agora fazer uso de um pacote como, por exemplo o DPL, para
obter as solu c oes possveis. Para implementa c ao no DPL trabalhamos
3.4. INTRODUC

AO AO DPL 87

2

1

2
a
3
46 -31 46 -31
a
4
164 164 -31 -31
a
5
0 0 0 0
Tabela 3.2: Consequencias lucro lquido em /
com o espa co dos estados da natureza =
1

2
=
1
,
2
,
3
,
4
. A
arvore de decisao abaixo, gerada pelo pacote apresenta a solu c ao otima.
A solu c ao otima consiste em primeiro tomar a a c ao a
2
isto e investigar
no campo II. A seguir, observado o resultado experimental devemos decir
por a
3
, a
4
ou a
5
. Se o experimento resultar em X
2
= 1 ent ao devemos
perfurar no campo II. Todavia, se X
2
= 0 ent ao a a c ao a
5
deve ser
considerada. Este curso de a c ao otimo e denominado regra de decis ao
de Bayes. A recompensa associada a este curso de a c ao ser a de 10.32
milh oes de u.m (gura 3.17).
Outro aspecto interessante neste exemplo e o c alculo do valor esper-
ado da informa c ao perfeita. Isto e, seu ganho esperado sobre o conhec-
imento da existencia ou n ao de petr oleo em cada um dos dois campos
menos sua performance sem experimenta c ao. Assim, temos da tabela 3.2
que os resultados possveis seriam: 164, 164, 46 e 0 com probabilidades
0.08,0.12,0.32 e 0.48 respectivamente, menos 8 milh oes de u.m. corre-
spondentes a solu c ao sem investiga c ao previa. As consequencias acima
correspondem a escolha de maior retorno em cada possvel estado da na-
tureza. Por exemplo, se
1

2
e verdadeiro ent ao escolho a a c ao a
4
e fa co
um ganho de 146 milh oes de u.m.
88 CAP

ITULO 3. MODELOS GR

AFICOS
Figura 3.17: Diagrama de inuencia - informa c ao imperfeita
Captulo 4
Probabilidade subjetiva e
utilidade
Savage (1954) come ca o captulo 3 (sobre probabilidade subjetiva) de
seu celebre livro The Foundations of Statistics da seguinte forma (nossa
tradu c ao):
Eu pessoalmente considero mais prov avel que um presidente
Republicano seja eleito em 1996 do que caia neve em Chicago
em algum dia de maio de 1994. Entretanto, mesmo essa neve
de m de primavera parece-me mais prov avel do que Adolf
Hitler ainda esteja vivo.
Apesar de transmitir a sensa c ao de completa falta de estrutura, essas
arma c oes probabilsticas s ao perfeitamente razo aveis e externam o grau
de cren ca ou grau de incerteza de um observador (tomador de decis oes
em nosso contexto) a respeito de v arios eventos (ainda) n ao-observ aveis.
Adicionalmente, Kyburg and Smokler (1980) editaram um compendio
sobre probabilidade subjetiva intitulado Studies in Subjective Probability
e iniciam sua introdu c ao com um debate sobre a multitude que o conceito
de probabilidade tr as em si (nossa tradu c ao):
89
90 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


Probabilidade e uma palavra constantemente utilizada nas
ciencias empricas, na matem atica, na losoa, e em uma
multitude de situa c oes da vida di aria.

E uma palavra que
se tornou (juntamente com sin onimos tais como verossim-
ilhan ca, chance, etc.) mais e mais difundida na ciencia
desde que as leis simples e determinsticas do seculo dezoito
foram suplementadas, e algumas vezes superpostas, pelas leis
de car ater estatstico ou probabilstico. Tendo em vista seu
uso frequente em uma ampla variedade de contextos, n ao e de
surpreender que a palavra probabilidade tenha adquirido
v arios signicados que s ao dicilmente distinguveis uns dos
outros. Em discurso ordin ario n ao importa que signicado a
palavra tem, desde que o sentido particularmente utilizado se-
ja claro no contexto em que e utilizado. Entretanto probabil-
idade e tambem uma palavra tecnica, aparecendo na ciencia
e na matem atica; quando utilizada de forma tecnica, deve-
ria possuir um signicado claro e denitivo para o contexto
em que e utilizada. O mesmo e verdadeiro para seus usos
los ocos. V arias propostas foram feitas a esse respeito; a
teoria de probabilidade subjetivista e uma delas.
No captulo 2 introduzimos o princpio da teoria estatstica da utili-
dade que diz que um tomador de decis oes deve procurar maximizar sua
utilidade esperada, onde a esperan ca e tomada com rela c ao as probabil-
idades associadas (subjetivamente ou n ao) aos possveis estados da na-
tureza do problema em quest ao. Entretanto, nada foi ainda dito sobre
que probabilidades s ao essas e como s ao elicitadas, a mesma indaga c ao
existindo para as utilidades associadas as consequencias das possveis de-
cis oes.
Nesse captulo introduziremos alguns resultados fundamentais para
a teoria estatstica da decis ao e que servem como base s olida para o
uso rotineiro dos princpios da teoria da decis ao como ela e comumente
91
utilizada por microeconomistas te oricos, tomadores de decis oes medicas,
e em modelagem e decis ao em nan cas (por exemplo, na confec c ao e
monitoramento de carteiras de ativos nanceiros) e tantas outras areas
da ciencia.
Iniciaremos introduzindo o princpio da coerencia na pr oxima se c ao,
atraves do famoso argumento Dutch book. Atraves desse argumento um
tomador de decis oes sempre dever a quanticar as incertezas associadas a
eventos atraves do c alculo das probabilidades; caso contr ario ele (tomador
de decis oes) estar a sendo incoerente e predisposto a participar de uma lo-
teria com probabilidade nula de bonica c ao. Em seguida, ainda na se c ao
4.1, introduziremos as scoring rules que induzem o tomador de decis oes
a fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto
ao informar suas probabilidades. Por exemplo, um previsor do tempo,
pode, por motivos de calibra c ao de suas previs oes, fornecer como proba-
bilidade de chuva para amanh a uma quantidade que n ao necessariamente
represente seu verdadeiro grau de incerteza a respeito do evento.
A se c ao 4.2 come ca com o famoso (e curioso) paradoxo de St. Peters-
burg que ilustra a diculdade de se dissociar o valor do dinheiro de sua
utilidade nos tempos de Bernoulli (Bernoulli 1738). Ainda nessa se c ao
introduzimos um dos resultados mais importantes da teoria da decis ao, o
teorema de representa c ao de von Neumann-Morgenstern. O teorema basi-
camente introduz ferramental necess ario para o tomador de decis oes sobre
incerteza escolher entre duas alternativas de a c ao tendo sem sua frente so-
mente os possveis estados da natureza, suas utilidades e probabilidades.
O resultado vai alem ao mostrar que o tomador de decis oes precisa so-
mente de discernir sobre dois estados extremos, um muito bom e outro
muito ruim cujas utilidades poderiam, arbitrariamente, ser um e zero,
respectivamente; com utilidades para todas as outras consequencias obti-
das a partir dessas duas. A ideia de problemas de decis ao com m ultiplos
atributos ser a breve e supercialmente abordada na se c ao 4.3.
92 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


4.1 Dutch book e regras escore
Em seu famoso livro de 1974 sobre teoria da probabilidade Bruno de
Finetti arma que probabilidade n ao existe. De Finetti e reconhecido at-
ualmente como um dos mais inuentes pensadores e precursores do pensa-
mento bayesiano. O que ele realmente queria dizer com essa armativa era
que probabilidade tem somente uma existencia subjetiva. Em seu mais
celebre trabalho de Finetti (1937) estabelece em termos e sob condi c oes
relativamente simples e matematicamente elegantes que um tomador de
decis oes deve representar interteza atraves do c alculo das probabilidades,
caso contr ario suas decis oes ser ao consideradas incoerentes.
Consideremos, inicialmente, que uma aposta seja feita na ocorrencia
de um certo evento, E. O pre co dessa aposta e S, ou seja, uma fra c ao, ,
do premio S. Em outras palavras, se E ocorrer o apostador contabilizar a
o premio de S S = (1 )S. Caso E n ao ocorra, o apostador perder a
os S inicialmente apostados. A raz ao : (1 ) e conhecida por raz ao
de aposta a favor de E.
Estamos, portanto, em condi c oes de enunciar o teorema do dutch
book ou teorema de Ramsey-de Finetti.
Teorema 4.1 (Ramsey-de Finetti) Se for uma probabilidade, ent ao
ser a coerente e seguir a os axiomas de Kolmogorov:
Axioma 4.1 0
E
1, para todo E;
Axioma 4.2
EE
c = 1;
Axioma 4.3 Se E e F s ao tais que E F = , ent ao
E
+
F
=
EF
.
Prova: Apresentaremos a prova desse resultado devido a sua simplici-
dade matem atica, o que n ao diminui sua import ancia e impacto.
4.1. DUTCH BOOK E REGRAS ESCORE 93
Axioma 4.1: Se, por contradi c ao,
E
> 1 e S > 0, ent ao os ganhos,
relativos a E e E
c
, ser ao negativos e iguais a (1
E
)S e
E
S,
respectivamente, causando assim perda certa para o apostador. O
mesmo ocorre para o caso
E
< 0 e S < 0 tambem implica em
perda certa.
Axioma 4.2: Se o axioma 1 prevalece e 0
EE
c < 1, ent ao o
apostador ter a perda certa quando S
EE
c < 0.
Axioma 4.3: Consideremos apostas nos eventos E, F e E F com
premios de S
E
, S
F
e S
EF
, respectivamente. O ganho lquido ser a
de
G
E
= S
E
+S
EF
(
E
S
E
+
F
S
F
+
EF
S
EF
)
G
F
= S
F
+S
EF
(
E
S
E
+
F
S
F
+
EF
S
EF
)
G
E
c
F
c = (
E
S
E
+
F
S
F
+
EF
S
EF
)
e a unica maneira desse sistema de equa c oes lineares n ao ter solu c ao,
ou seja, de n ao haver perda certa, e a nulidade de seu determinante.

E trivial de se mostrar que isso ocorre quando:

E
+
F

EF
= 0.
Esse resultado pode ser facilmente estendido para a obten c ao de prob-
abilidades condicionais e para demonstrar a validade do teorema de Bayes.
Deixaremos essas demonstra c oes para o leitor que pode encontrar mais
detalhes em de Finetti (1974).
Esse teorema nos leva a conclus ao de que a unica maneira coerente de
se medir incerteza, ou o grau de cren ca, a respeito de eventos e atraves
de probabilidades. Esse resultado e um dos alicerces do pensamento
Bayesiano.
94 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


Como acabamos de ver, o uso de probabilidade para medir incerteza
leva o tomador de decis oes a agir racionalmente (coerentemente). O teo-
rema do Dutch Book de De Finetti guarante que para ser coerente,
ou seja evitar perda certa, o tomador de decis oes deve utilizar o c alculo
das probabilidades para representar incerteza. Entretanto, nada e dito
sobre a rela c ao entre a probabilidade utilizada pelo tomador de decis oes
e seu grau de cren ca a respeito dos eventos em quest ao. Em um artigo de
1996, Robert Winkler diz que os axiomas de de Finetti-Savage acerca da
probabilidade subjetiva remove regras inconsistentes, ou incoerentes, mas
que coerencia n ao e suciente para garantir boas probabilidades e que
n ao cria incentivos para elicita c ao honesta e cuidadosa de probabilidades
a priori.
Esse n ao e um problema novo. Brier (1950) e Good (1952) j a tin-
ham essa preocupa c ao em mente. Brier percebeu essa necessidade em
problemas de previs ao do tempo, onde os previsores est ao diariamente
fornecendo, por exemplo, suas probabilidades de chuva, sejam atraves de
julgamento pessoal puro sejam atraves de modelos estatsticos e meteo-
rol ogicos. A pergunta que Brier se fez foi: Sob que circunst ancias essas
probabilidades representam o verdadeiro grau de cren ca do previsor?.
Nessa se c ao ser a introduzido o conceito de regras escore, que nada
mais s ao do que fun c oes que representam as utilidades de fun c oes de
probabilidades sobre eventos desconhecidos. Good (1952), Savage (1971),
de Finetti (1974), Lindley (1982) e Winkler (1996) s ao referencias essen-
ciais sobre o assunto. O exemplo abaixo ilustra de forma simplicada o
problema em quest ao.
Exemplo 4.1 Suponhamos que um apostador tenha a : (1 a) como
raz ao de chances a favor de um certo evento, digamos E e que seu grau
de cren ca a respeito do evento E seja representado pela probabilidade
. Aqui e a est ao em [0, 1], portanto o apostador e uma tomador de
decis oes coerente. Suponhamos tambem que voce leitor seja o bookmaker,
4.1. DUTCH BOOK E REGRAS ESCORE 95
ou seja, o controlador da mesa de apostas. Voce receber a (1 a)S caso
E se realize, e aS caso contr ario. Seu ganho esperado e de
(1 a)S +aS(1 ) = S(a )
Um outro apostador com grau de cren ca

sobre E ter a um ganho es-


perado de S(

a) e ser a incentivado a apostar um valor positivo em E


sempre que

> a.
Portanto, surge a necessidade de se penalizar previs oes ruins e bonicar
previs oes acuradas. Basicamente, as fun c oes de utilidade utilizadas em
problemas de decis ao onde a a c ao representa a escolha de uma proba-
bilidade (distribui c ao de probabilidade) s ao conhecidas comumente por
regras escore. Mais geralmente, se o vetor a = (a
1
, . . . , a
J
) representa
as probabilidades anunciadas pelo previsor a respeito de eventos mutua-
mente exclusivos, E = (E
1
, . . . , E
J
), e se suas verdadeiras probabilidades
subjetivas forem = (
1
, . . . ,
J
).
Deni c ao 4.1 Regra Escore: Uma regra escores u para a em E e uma
fun c ao real u(E
j
, a) para cada par (E
j
, a).
Deni c ao 4.2 Regra Escore pr opria: Uma regra escore e pr opria se,
e s o se, para cada em E
sup
aA

jJ
u(E
j
, a)
j

jJ
u(E
j
, )
j
(4.1)
onde / e a classe de todas as distribui c oes de probabilidade em E.
Exemplo 4.2 Suponha que a Secretaria de Municipal de Turismo do Rio
de Janeiro esteja planejando um evento cultural na areia da praia de
Copacabana para o pr oximo nal de semana. Para obter mais informa c ao
da possibilidade de chuva naquele nal de semana, o Secret ario Municipal
96 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


de Turismo ligou para o Centro Nacional de Meteorologia. O evento de
interesse e chuva para o nal de semana, E. O verdadeiro grau de cren ca
do Centro sobre esse evento e que e julgado atraves da seguinte regra
escore
u(E, a) = (a 1)
2
u(E
c
, a) = 10(a 0)
2
portanto, a Secretaria escolher a a = /(10 9) que maximize
Eu(E, a) = (a 1)
2
10a
2
(1 )

E f acil perceber que essa regra n ao e pr opria e, consequentemente, a


ser a sempre menor que .
Brier (1950) introduziu uma das regras escore pr opria mais utilizadas,
a regra quadr atica, como uma regra de verica c ao. Outras propriedades
dessa regra podem ser encontradas em Savage (1971). Alem da regra
quadr atica, outras regras comumente presente na literatura s ao a log-
artmica (Good 1952) e as regras esfericas (Savage 1971):
Quadr atica : u(E
j
, a) = 2a
j

i
a
2
i
Logartmica : u(E
j
, a) = loga
j
Esferica : u(E
j
, a) =
a
j
(

i
a
2
i
)
1/2
O resultado abaixo arma que a regra escore quadr atica pode ser uti-
lizada para mostrar que se os graus de cren ca do tomador de decis oes
(previsor) n ao forem coerentes, ent ao uma a c ao (distribui c ao de proba-
bilidade) com escore maior pode ser obtida.
Teorema 4.2 Se a viola uma das seguintes condi c oes,
4.2. UTILIDADE 97
1. 0 a
j
1 para todo j = 1, . . . , k.
2.

k
j=1
a
j
= 1.
ent ao, pode-se encontrar a

que satisfaz 1 e 2 tal que u(E


j
, a) u(E
j
, a

)
para todo j = 1, . . . , k e u(E
j
, a) < u(E
j
, a

) para pelo menos um j.


4.2 Utilidade
DeGroot (1970) come ca o captulo 7 de seu livro, Optimal Statistical
Decision, dizendo:
As probabilidades subjetivas de um estatstico s ao represen-
ta c oes numericas de suas cren cas e informa c oes. Suas utili-
dades s ao representa c oes numericas de suas preferencias.
Essencialmente, a teoria da utilidade que falaremos aqui seleciona
aquela decis ao que maximiza a utilidade esperada, onde a esperan ca e
tomada com respeito ` a probabilidade subjetivamente elicitada a respeito
dos possveis estados da natureza. O tomador de decis oes que seguir es-
sa postura descritiva e dito possuir um comportamento racional. Nessa
se c ao veremos que existe uma estreita rela c ao entre agir racionalmente e
ordenar a c oes segundo suas utilidades esperadas. Assumiremos, inicial-
mente, que todas as probabilidades dos possveis estados da natureza s ao
conhecidas. J a estudamos a rela c ao entre agir racionalmente e medindo
incerteza atraves do c alculo das probabilidades na se c ao anterior. As util-
idades foram consideradas em segundo plano tanto no caso das regras de
escore quanto no desenvolvimento da no c ao de probabilidade subjetiva
coerente.
Nessa se c ao apresentaremos os subsdios acerca da maximiza c ao da
utilidade esperada. Mas antes, introduziremos o paradoxo de Saint Pe-
tersburg para ilustar que, em geral, fun c oes de utilidade quando consid-
eradas fun c oes de retornos monet arios n ao ser ao lineares.
98 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


4.2.1 Paradoxo de Saint Petersburg
O Paradoxo de Saint Petersburg foi primeiramente investigado por Daniel
Bernoulli em 1738 ao tentar analisar o comportamento de indivduos ` a
presen ca de incerteza presente em jogos de azar. Mais especicamente,
Bernoulli tinha dentro de si o seguinte paradoxo a sua frente: Um apos-
tador tinha uma moeda honesta a sua frente para ser jogada ate que cara
fosse observada (n ensaios, digamos), o que daria ao apostador 2
n
reais.
Quantos reais uma pessoa estaria disposta a pagar para entrar nesse jogo?
A resposta e imediata para um tomador de decis oes que tente maximizar
o retorno monet ario esperado: quantidade innita de reais!. Mais especi-
camente, o ganho monet arios esperado e de

n=1
2
n

1
2

n
=
Entretanto, qualquer pessoa, disposta a n ao rasgar ou jogar dinheiro
fora, n ao pagaria mais do que uma quantidade nita, e possivelmente
pequena, de reais para participar desse jogo. O paradoxo desse problema
desaparece quando o tomador de decis oes leva em considera c ao a utilidade
dos reais (dinheiro) ao inves de seu valor monet ario incondicional. Abaixo
apresentamos um dos resultados mais importantes da teoria da decis ao e
que resolve de uma vez por todas o paradoxo de Saint Petersburg.
4.2.2 Teorema de von NeumannMorgernstern
von Neumann and Morgenstern (1944) apresentam um dos resultados
mais importantes da teoria da decis ao que compara duas a c oes atraves
de suas utilidades esperadas. Do ponto de vista pr atico, eles criaram um
dos esquemas mais utilizados para elicita c ao das utilidades associadas a
conseq uencias. Isso e feito atraves da aplica c ao iterativa do famoso teo-
rema da representa c ao de von Neumann e Morgernstern. Esse teorema
4.2. UTILIDADE 99
e fundamentado em tres axiomas, os quais ser ao brevemente apresen-
tados aqui. Considere, inicialmente, que Z represente o conjunto com
n possveis conseq uencias z
1
, z
2
, , z
n
, e / o conjunto de todas as
fun c oes de probabilidade, ou a c oes, em Z. Para xar a nota c ao, imagine
o seguinte exemplo.
Exemplo 4.3 Suponhamos que voce acaba de receber R$5.000,00 e que,
ap os conversar com o gerente do seu banco, tres possveis linhas de in-
vestimento surgiram, a saber:
a Aplicar os R$5.000,00 na poupan ca e receber, no nal do mes, R$50,00
de rendimento;
a

Aplicar os R$5.000,00 num fundo de renda xa e receber, no nal do


mes, R$200,00 de rendimento com probabilidade p ou nada com
probabilidade 1 p
a

Aplicar os R$5.000,00 numa unica a c ao e receber, no nal do mes,


R$1000,00 de rendimento com probabilidade q ou ter um rendimento
negativo de R$200,00 com probabilidade 1 q.
onde p = 0.8 e q = 0.95. Nesse contexto ctcio e simplicado, o conjun-
to Z, de rendimentos lquidos, tem 5 elementos, 200, 0, 50, 200, 1000,
enquanto que as loterias (ou a c oes) a, a

, a

representam as seguintes dis-


tribui c oes de probabilidade em Z:
a = (0.00, 0.00, 1.00, 0.00, 0.00)
a

= (0.00, 0.50, 0.00, 0.50, 0.00)


a

= (0.05, 0.00, 0.00, 0.00, 0.95)


Qual das tres formas de investimento voce preferiria? Como voce or-
denaria (da pior para a melhor), esses tres cen arios? Ou ainda, para que
valor de p voce seria indiferente entre a e a

? Similarmente, para que


valores de q e s voce seria indiferente entre a e a

? Pense um pouco e
veja a continua c ao desse exemplo mais a frente, ainda nessa se c ao.
100 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


De forma geral, as conseq uencias podem ser as mais diversas e com-
plexas, tais como as rea c oes de um grupo de pacientes ` a aplica c ao ou
n ao de um novo medicamento contra certo tipo de c ancer; ou possveis
rendimentos lquidos (negativos ou positivos ou nulos) de aplica c oes em
diversos fundos de investimento, como exemplo 4.3 acima. O teorema
de von Neumann e Morgernstern (vNM) arma que a compara c ao entre
a c oes (loterias) pode ser feita atraves da compara c ao quantitativa dos val-
ores esperados das utilidades das conseq uencias quando ponderadas pelas
distribui c oes de probabilidades das respectivas loterias. No contexto do
exemplo acima, dizer que a e prefervel a a

, signica dizer que a utili-


dade dos R$50,00 de rendimento que a poupan ca garante ao investidor e
maior do que metade da utilidade dos R$200,00 que o investidor poderia
vir a receber se investisse segundo a

. Considerando-se que um investidor


sempre preferir a mais dinheiro e que a utilidade de 0 e nula (veremos
abaixo que essa suposi c ao poder a ser feita sem perda de generalidade).
Denota-se por a a

quando a a c ao a e prefervel ` a a c ao a

. Com essa
deni c ao e os seguintes axiomas apresentaremos, em seguida o teorema
da representa c ao de von Neumann e Morgernstern. Os axiomas da teoria
de utilidade de vNM s ao os seguintes
Axioma 4.4 NM1: Rela c ao de preferencias: e completa e transitiva
/, uma e somente uma das seguintes rela c oes deve ser satisfeita:
a a

, or
a ~ a

, or
nenhuma delas.
Transitividade: Para quaisquer a, a

e a

em /, tais que a ~ a

e
a

, ent ao a a

.
4.2. UTILIDADE 101
Axioma 4.5 NM2: Independencia: Para toda a c ao a, a

e a

em / e
(0, 1]:
a ~ a

implies (1 )a

+a ~ (1 )a

+a

.
Axioma 4.6 NM3: Arquimediana: Para toda a c ao a, a

e a

em / tais
que a ~ a

~ a

podem ser encontrados , (0, 1) tais que


a + (1 )a

~ a

~ a + (1 )a

.
Antes de falarmos mais detalhadamente sobre os axiomas, vamos ap-
resentar um dos principais teoremas da teoria moderna da decis ao.
Teorema 4.3 Representa c ao de Neumann-Morgernstern: Os ax-
iomas 4.4, 4.5 e 4.6 s ao verdadeiros se e somente se existir uma fun c ao
u tal que a, a

a ~ a

U(a)

zZ
a(z)u(z) >

zZ
a

(z)u(z) U(a

) (4.2)
com u unica a menos de transforma c oes lineares.
Adicionalmente, pode ser mostrado o seguinte resultado,
Lema 4.1 Se ~ em Z satisfaz os axiomas 4.4, 4.5 e 4.6, ent ao existem
z
0
e z
0
em Z tais que
z
0 ~ a ~
z
0
para todo a em /.
Nessa nota c ao,
z
e a distribui c ao de probabilidade com massa pontual
em z. No exemplo 4.3, z
0
= 200 e z
0
= 1000. Voltemos ao exemplo 4.3
102 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


Exemplo 4.4 Utilizando os resultados do Teorema 4.3 e do Lema 4.1
podemos assumir que u(200) = 0 e u(1000) = 1. Supondo que o valor
de p = 0.8 torne os investimentos a e a

investimentos com utilidades


iguais, segue-se imediatamente que u(50) = 0.95u(1000) +0.05u(200) =
0.95. Ainda, se o rendimento da poupan ca fosse de apenas R$200 ent ao
q = 0.99 tornaria o investidor indiferente entre os investimentos a e a

seria u(200) = 0.99u(1000) + 0.05u(200) = 0.99 Finalmente, p = 0.8


tornaria a e a

equivalentes, ou seja, u(50) = 0.8u(200) +0.2u(0). Da, a


utilidade do rendimento nulo e, u(0) = 0.79. Note que apesar de R$200,00
representar apenas 20% de R$1.000,00, suas utilidades s ao bem pr oximas,
mostrando uma forte avers ao ao risco por parte do investidor. Na se c ao
4.4 abordaremos a utilidade do dinheiro, muito util para tomadores de
decis oes econ omicas.
Alguma explica c ao sobre os axiomas devem ser feitas. Complitude
requer basicamente que o tomador de decis oes n ao saiba o que fazer
quando questionado a respeito de sua preferencia em rela c ao a pares
de a c oes. A transitividade permitir a que problemas multidimensionais
possam ser quebrados em pequenos problemas unidimensionais. Inde-
pendencia arma que duas a c oes sejam comparadas somente atraves de
seus componentes diferentes. Esse e um dos axiomas mais controver-
tidos e v arios paradoxos foram apresentados ao longo dos anos contra
essa hip otese. Allais (1953) apresenta uma serie de exemplo normativos e
descritivos que mostram a viola c ao do axioma da independencia. Kahne-
man and Tversky (1979) tambem apresentam uma serie de experimentos
empricos. Seidenfeld (1988) apresenta um argumento normativo a favor
do axioma. O axioma archimediano e tambem conhecido como axioma
da continuidade pois diz que uma a c ao pode ser preferida a outra, mas
n ao de forma extrema e que evite que combina c ao de outras a c oes n ao
possam ser preferidas. Para mais detalhes sobre os axiomas de vNM e
suas implica c oes pr aticas e te oricas, veja Jensen (1967), Fishburn (1981),
Fishburn (1982) e Kreps (1988).
4.3. M

ULTIPLOS ATRIBUTOS 103


4.3 M ultiplos atributos
Na maioria dos problemas de decis ao encontrados na pr atica a dimens ao
do espa co de decis oes n ao e unidimensional. Existe, na maioria dos ca-
sos, v arios atributos a serem considerados, por exemplo, ao decidir entre
duas oportunidades de trabalho seria natural esperar que o tomador de
decis oes prera um sal ario maior a um menor, mas tambem se espera que
ele prera uma fun c ao que lhe de algum tipo de satisfa c ao prossional,
uma localiza c ao adequada para sua locomo c ao, colegas de trabalho que
sejam minimamente simp aticos e solcitos, assim como um patr ao que se-
ja mais um amigo.

E claro que maximizar todos esses atributos e tarefa
praticamente impossvel, gerando assim a necessidade de o tomador de
decis oes ponder a-los de alguma forma para encontrar aquela fun c ao que
de uma forma global lhe satisfa ca mais, que tenha a maior utilidade. Por-
tanto, precisamos analisar o problema de decis ao, nesses contextos, sob
uma otica conjunta, multifacetada. Genericamente, U(x
1
, x
2
, . . . , x
n
) rep-
resenta a fun c ao de utilidade caracterizada pelos atributos x
1
, x
2
, . . . , x
n
.
Assim como no caso univariado, a forma mais natural de obten c ao
da utilidade para um ponto x = (x
1
, . . . , x
n
) seria encontrar uma lote-
ria cujo retorno medio (calculado com base nos casos extremos: melhor
caso e pior caso) faria com que o tomador de decis oes fosse indiferente
entre essa loteria e o evento certo x. Entretanto, n ao e difcil perceber
que essa ideia natural tornasse impratic avel quando n cresce e neces-
sariamente muito mais compara c oes (e loterias) s ao necess arias. Nessa
se c ao introduziremos algumas das simplica c oes comumente utilizadas
para tornar os problemas de multiatributos trat aveis. A capacidade de
quebrar uma fun c ao de utilidade multiatributo em partes menores, em
geral univariadas, e conhecida por separabilidade. Abaixo mencionamos
brevemente algumas condi c oes para que tal quebra seja viabilizada.
Consideraremos o caso bivariado para exposi c ao das ideias. Maiores de-
talhes sobre problemas tridimensionals ou gerais podem ser encontrados,
104 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


por exemplo, em Clemen (1996). Dessa forma, consideramos a seguinte
decomposi c ao:
U(x
1
, x
2
) = a
0
+
2

i=1
a
i
U
X
i
(x
i
) +a
4
U
X
1
(x
1
)U
X
2
(x
2
)
Deni c ao 4.3 Independencia preferencial mutua: Um atributo X
1
e considerado preferencialmente independente de X
2
se as preferencias
para resultados especcos de X
2
n ao dependem do n

ivel do atributo X
1
.
Se o mesmo acontece quando as posi c oes de X
1
e X
2
s ao invertidas temos
o conceito de independencia preferencial m utua.

E uma ideia relativa-
mente interessante, principalmente em situa c oes onde tempo e custo
s ao os atributos em quest ao.
Deni c ao 4.4 Utilidade-independente

E um pouco mais forte do que
o conceito de independencia m utua pois involve a no c ao de incerteza,
quase sempre presente nos problemas de decis ao. Um atributo X
1
e con-
siderado utility independent do atributo X
2
se preferencias por escolhas
incertas envolvendo nveis diferenciados de X
1
s ao independentes do val-
or de X
2
. Novamente, se o mesmo vale quando os papeis de X
1
e X
2
s ao
invertidos, dizemos que X
1
e X
2
s ao mutuamente utilidade-independente.
Pode-se mostrar que
U(x
1
, x
2
) = c
X
1
U
X
1
(x
1
) +c
X
2
U
X
2
(x
2
) + (1 c
X
1
c
X
2
)U
X
1
(x
1
)U
X
2
(x
2
)
onde c
X
1
= U(x
+
1
, x

2
) e c
X
2
= U(x

1
, x
+
2
). Tambem, U
X
1
(x
1
)U
X
2
(x
2
)
representa a intera c ao entre os atributos.
Deni c ao 4.5 Independencia aditiva: Quando, na express ao acima,
c
X
1
= U(x
+
1
, x

2
) +c
X
2
= U(x

1
, x
+
2
) = 1
temos que
U(x
1
, x
2
) = c
X
1
U
X
1
(x
1
) + (1 c
X
1
)U
X
2
(x
2
)
O conceito de independencia aditiva e portanto mais forte que aqueles ate
aqui introduzidos.
4.4. MEDIDAS DE AVERS

AO AO RISCO 105
4.4 Medidas de avers ao ao risco
No exemplo 4.3 vimos que o tomador de decis ao parecia averso ao risco,
uma vez que, mesmo tempo uma op c ao de retorno medio de investimento
igual a R$100,00 (0.5(R$200, 00) + 0.5(R$0.00)), a op c ao de deixar o
dinheiro na poupan ca (retorno xo e igual a R$50,00) e preferida, ou
seja, tem maior utilidade. Esse tipo de comportamento e relativamente
comum e algumas de suas propriedades ser ao brevemente estudada nessa
se c ao.
Inicialmente, suponha que x represente a quantidade de dinheiro e F
seja uma fun c ao de distribui c ao que mede probabilidades a respeito de x.
Adicionalmente, T e o espa co de todas as fun c oes de distribui c ao para
quantidades n ao negativas de dinheiro. Estendendo os resultados acer-
ca da utilidade esperada de von Neumann e Morgernstern (se c ao 4.2.2,
diremos que a utilidade da fun c ao F(.) ser a
U(F) =

u(x)dF(x)
ou U(F) =

u(x)f(x)dx se x poder ser visto como uma vari avel aleat oria
contnua com fun c ao densidade de probabilidade f. O seguinte resultado
generaliza a discuss ao do incio dessa se c ao.
Deni c ao 4.6 Um tomador de decis oes e considerado averso ao risco se
,e s o se,

u(x)dF(x) u

xdF(x)

para todoF em T (4.3)


Equivalentemente, um tomador de decis oes e averso ao risco se u(.) for
uma fun c ao c oncava. Em outras palavras, avers ao ao risco implica que,
para dado nvel x de riqueza, a utilidade adicionada por uma unidade
de dinheiro e menor que a utilidade subtrada pela mesma uma unidade
de dinheiro. Esse comportamento est a ilustrado na gura 4.1. Pode ser
106 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


visto que, com riqueza de 2 unidades monet arias a utilidade adicional de
uma unidade monet aria, u(3) u(2), e menor que a utilidade subtrada,
u(2) u(1), mostrando que o investidor e mais propenso a rejeitar a c oes
(investimentos) mais arriscadas. Quando a express ao 4.3 for uma igual-
dade, diz-se que o tomador de decis oes e neutro ao risco. Nesse ultimo
caso a utilidade e linear na quantidade de dinheiro.
Figura 4.1: Fun c ao de utilidade de um agente averso ao risco.
Uma outra quantidade comumente obtida em problemas de decis ao
com retornos monet arios, e a quantidade de dinheiro para a qual o toma-
dor de decis oes se torna indiferente entre F(.) e a quantidade

u(x)dF(x),
chamada de certainty equivalent. Na gura 4.1, o certainty equivalent e o
valor assinalado por CE. O certainty equivalent, em problemas atuariais,
corresponde ` a quantidade m axima que o segurado pagaria para n ao correr
4.4. MEDIDAS DE AVERS

AO AO RISCO 107
os riscos associado a F(.). O seguinte resultado sobre avers ao ao risco
pode ser obtido
Teorema 4.4 O tomador de decis oes e averso ao risco se c(F, u)

xdF(x) para todos F T.

E natural esperar que o grau de avers ao ao risco esteja associado ` a


curvatura de u, possivelmente atraves de u

(x). Uma medida bastante


conhecido e o coeciente de avers ao absoluta ao risco de Arrow-Pratt.
Teorema 4.5 Seja u uma fun c ao de utilidade duplamente diferenci avel.
Ent ao o coeciente de avers ao absoluta ao risco de Arrow-Pratt e dado
por:
r
A
(x) =
u

(x)
u

(x)
Naturalmente, o coeciente vale zero para situa c oes onde o tomador
de decis oes seja neutro ao risco.
108 CAP

ITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE


Captulo 5
Analise de Sensibilidade
5.1 Introdu c ao
Neste captulo discutiremos alguns aspectos da an alise de sensibilidade
a qual e central na estrutura c ao e solu c ao de modelos de decis ao. As
tecnicas de an alise de decis ao usam como ingrediente fundamental jul-
gamentos do tomador de decis ao atraves de suas preferencias e cren cas.
A distribui c ao a priori, o modelo que descreve os dados disponveis e
a fun c ao de perda ou utilidade impactam a solu c ao nal do problema.
A quest ao central deste captulo e avaliar a sensibilidade dos resultados
nais a varia c oes a esses elementos da an alise.
Iniciaremos discutindo alguns aspectos de identica c ao do problema
e de sua estrutura c ao para a seguir atacar quest oes ligadas ` a robustez
das componentes do modelo de decis ao. Este captulo est a inuenciado
fortemente pelos textos de Clemen (1996) e French and Rios-Insua (2000).
109
110 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
5.2 Identica c ao e estrutura
Ao nos depararmos com um problema de decis ao devemos cumprir uma
serie de est agios iterativos ate a implementa c ao de uma das alternativas
escolhidas. Iniciamos, portanto, pela identica c ao do problema de de-
cis ao. Devemos identicar sua estrutura e entender os objetivos almeja-
dos, pois somente assim poderemos enumerar as alternativas disponveis.
Num pr oximo passo deveremos especicar as partes integrantes do mode-
lo. As incertezas e as preferencias devem ser eliciadas de forma a possibil-
itar a escolha do melhor curso de a c ao ou a alternativa otima. O estudo
da sensibilidade dos resultados quando aplicados ` as etapas de identi-
ca c ao e estrutura c ao do problema ser a denominado de an alise preliminar
de sensibilidade.
Com respeito ` a identica c ao do problema devemos ser extremamente
cuidadosos para evitarmos cometer o chamado erro tipo III Clemen (1996),
que consiste em resolver, com esmero, o problema errado. Vejamos um
pequeno exemplo.
Exemplo 5.1 H a alguns anos atr as nos deparamos (um dos autores,
HSM) com um problema desaador. Tratava-se de desenvolver um mod-
elo para decidir da viabilidade da introdu c ao de certo estoque regulador
de pre cos para o mercado internacional do cafe. Ap os gastar um tempo
para compreender a estrutura do mercado internacional do cafe e discutir
estrategias metodol ogicas alternativas nos decidimos pela implementa c ao
de um modelo econometrico que descrevesse os uxos de cafe entre os
mercados produtores e consumidores, alem, e claro, dos pre cos pratica-
dos. Levantamos dados para um perodo de dez anos, em bases trimestrais
e ajustamos um modelo econometrico com v arias equa c oes estoc asticas e
algumas identidades ou equa c oes de balan co. O mercado produtor foi seg-
mentado segundo os tipos de cafe: ar abica, robusta e suaves. Os primeiros
tipicamente produzidos no Brasil, os segundos de origem africana e os
ultimos produzidos na Amercia Central e Col ombia. Pelo lado dos im-
5.2. IDENTIFICAC

AO E ESTRUTURA 111
portadores segmentamos os mercados em Estados Unidos, Europa, Jap ao
e resto do mundo. Assim tnhamos uxos de oferta e demanda de quatro
origens para quatros destinos. Coletados os dados e ajustado os modelos
econometricos implementamos v arias regras de compra e venda a serem
praticadas pelo organismo regulador de forma a manter os pre cos utuan-
do em uma faixa de varia c ao adequada. A solu c ao envolveu simula c ao
estoc astica uma vez que as regras de compra e venda do buer stock eram
extremamente n ao lineares. Concluiu-se que o estoque regulador de pre cos
era vi avel. Onde est a o erro tipo III? A quest ao e que se o mercado inter-
nacional do cafe casse t ao eciente, como proposto pela presen ca do
estoque regulador de pre cos, a produ c ao aumentaria descontroladamente
fazendo com que o mercado casse encharcado de cafe. Obviamente era
preciso considerar algum componente de longo prazo no modelo, que evi-
tasse este tipo de rea c ao dos agentes envolvidos.
Este exemplo ilustrou a import ancia de se caracterizar precisamente
o problema a ser resolvido. Esta etapa e denominada de identica c ao do
problema e envolve v arios agentes: o tomador de decis ao, o analista de
decis oes etc. Vale notar que esta e uma fase comumente praticada na
modelagem estatstica. Identica-se o modelo, ajusta-se os par ametros,
realiza-se testes de diagn osticos e retorna-se a fase de identica c ao ate que
o modelo ajustado seja validado e ent ao aplicado para fazer inferencias e
predi c oes.
Um segundo aspecto de relev ancia e a estrutura do problema.
`
As
vezes, introduzindo-se uma alternativa a mais, a solu c ao pode modicar-
se profundamente. Analogamente, algumas quantidades incertas podem
ser tratadas com maior nvel de detalhe do que outras em raz ao de seu
impacto no resultado nal. Ilustraremos este aspecto com dois exemplos.
Exemplo 5.2 Num certo problema medico a decis ao otima pode ser sen-
svel a estrutura do problema. A inclus ao de mais uma alternativa pode
afetar a maneira como encaramos o problema. Imagine que um amigo
112 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
nosso sofreu um ataque cardaco e que o medico recomenda uma ponte
de safena. A cirurgia pode resolver o problema. Quando perguntado, o
medico revela que existe um certo risco cir urgico. Uns poucos indivduos
morrem durante a cirurgia mas, muitos se recuperam, e a cirurgia e um
completo sucesso. Assim nosso amigo tem muitas raz oes para antecipar
uma longa vida, plena de sa ude. Sem a opera c ao, todavia, teria uma qual-
idade de vida que continuamente se deterioraria e, possivelmente, seria
curta. Suponhamos que o objetivo central de nosso amigo e maximizar a
qualidade de sua vida.

E bastante claro que a cirurgia deva ser consider-
ada seriamente. Entretanto, antes de enfrentar este problema decis orio
ele sai em busca de uma segunda opini ao. Um outro medico discute um
desfecho alternativo: complica c oes decorrentes da cirurgia podem implicar
em longos e penosos tratamentos. Se isto ocorrer, o resultado nal poder a
ser: recupera c ao completa, recupera c ao parcial (uso de cadeira de rodas!)
ou morte dentro de alguns meses. Esta terceira alternativa poder a modi-
car completamente a decis ao nal. Provavelmente a alternativa cir urgica
seja desconsiderada em raz ao deste detalhamento adicional da estrutura
do problema.
O pr oximo exemplo tem por objetivo mostrar que, ` as vezes, a estru-
tura c ao do problema varia com a otica dos agentes envolvidos. Por um
lado poderiamos ter uma situa c ao com um unico decisor e por outro uma
situa c ao envolvendo v arios agentes.
Exemplo 5.3 Este e um exemplo extrado do texto de von Winterfeldt
and Edwards (1986) e envolve o estabelecimento de padr oes para polui c ao
decorrente da extra c ao de petr oleo em alto mar. Uma das formas de
abordar o problema seria do ponto de vista de uma agencia regulado-
ra. As alternativas consistiriam na deni c ao de padr oes aceit aveis de
polui c ao e na deni c ao de polticas de controle. Obviamente, os objetivos
nais seriam minimizar o ndice de polui c ao mantendo a produ c ao e-
ciente. Uma estrutura alternativa decorreria de examinar a quest ao como
5.3. EXEMPLODE AN

ALISEPRELIMINARDE SENSIBILIDADE113
a competi c ao entre tres agentes: a agencia reguladora, a ind ustria de ex-
tra c ao de petr oleo e as eventuais vtimas de possveis cat astrofes. Este e
um exemplo de como uma mesma situa c ao decis oria pode ser tratada de
diferentes formas.
A an alise de sensibilidade pode colaborar na escolha de uma particular
estrutura mais adequada para atacar o problema, e ajudando na identi-
ca c ao de aspectos especcos que devem realmente ser considerados pelo
decisor.
Na pr oxima se c ao examinaremos um problema onde a an alise prelimi-
nar de sensibilidade ser a util para descrever quais das incertezas presentes
merecem ser descritas com maior nvel de detalhamento. O criterio de
identica c ao dessas incertezas ser a basedo no impacto que elas provocam
sobre os resultados nais. An alises de sensibilidade envolvendo o impacto
ao se variar um unico fator por vez ser ao discutidas e, tambem, an alises
de dois fatores ser ao apresentadas.

E sempre uma boa pr atica iniciar-se por an alises simplicadas. Emb-


ora avaliar o impacto de um fator por vez possa ser enganoso dado que os
fatores podem iteragir, e, todavia, ineg avel que simplica imensamente a
compreens ao e an alise dos resultados.
5.3 Exemplo de an alise preliminar de sen-
sibilidade
Para exemplicar alguns aspectos da an alise preliminar de sensibilidade
utilizaremos um excelente exemplo descrito no livro de Clemen (1996).
Certa companhia aerea,

Aguia, est a considerando a possibilidade de
expandir suas opera c oes. Para isto necessita de mais uma aeronave. At-
ualmente opera com tres bimotores, tanto em v oos fretados quanto em
transportes regulares de passageiros. Esta pequena companhia est a satis-
114 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
feita com a combina c ao dessas atividades: fretamento e transportes regu-
lares de passageiros. Estes correspondem a 50% das opera c oes e consistem
em v oos de em media 90 minutos e com dist ancias de 480 kil ometros.
A expans ao de suas atividades se dar a na area de fretamento. Este
e um novo nicho de mercado em franca expans ao. Necessita, portanto,
de um novo avi ao. Coincidentemente surgiu uma oportunidade. Existe
um Piper Seneca a venda por 95000 d olares por uma empresa do Oriente
Medio. Este e um bimotor em boas condi c oes de manuten c ao, isto e,
satisfazendo ` as normas das autoridades aeron auticas. Ap os sua ultima
revis ao geral, seus motores j a operaram 150 horas. Esta aeronave aco-
moda 5 passageiros, alem do piloto e bagagens. Possui os instrumentos
de navega c ao e comunica c ao necess arios para operar nas condi c oes dos
demais equipamentos da

AGUIA, e voa a uma velocidade de 200 milhas
por hora. Seu custo operacional est a estimado em 245 d olares por hora,
incluindo combustvel, manuten c ao e sal ario do piloto, alem de outras
despesas xas, incluindo seguro, encargos nanceiros etc e montando a
20000 d olares anuais.
A receita que espera auferir, com este novo avi ao, proveniente dessas
duas atividades e de 300 a 350 d olares por hora de fretamento e 100
d olares por passageiro hora nos v oos regulares, esperando uma taxa media
de ocupa c ao de cerca de 50% dos assentos. Estima, ainda, voar 1000 horas
por ano, sendo todavia mais realista que voe 800 horas por ano.
Para realizar este neg ocio a

AGUIA necessita de um emprestimo de
aproximadamente 40% do valor da aeronave. A taxa de juros de mercado
e em media 9.5% a.a, mas sujeita a varia c oes. Dentre as condi c oes de
compra destacamos as alternativas:
Compra imediata
Aquisi c ao de uma op c ao de compra com validade de um ano a um
custo anual variando de 2500 a 4000 d olares.
5.3. EXEMPLODE AN

ALISEPRELIMINARDE SENSIBILIDADE115
Investimento de seus atuais recursos, ao inves da compra do avi ao,
no mercado nanceiro a uma taxa media de 8% a.a.
Vale ressaltar, novamente, que muitos dos valores numericos envolvi-
dos na descri c ao desse exemplo s ao meras estimativas, alguns sobre con-
trole da pr opria

AGUIA, outros n ao.
Vamos ajudar a

AGUIA a comparar essas alternativas. Ser a que os
n umeros envolvidos fazem muita diferen ca? A op c ao de compra vale a
pena? Deixamos de considerar algum aspecto essencial? Essas e outras
s ao quest oes que a an alise preliminar de sensibilidade pretende responder.
Iniciemos descrevendo a estrutura do problema acima apresentado
atraves de um diagrama de inuencia para as receitas e outro para os
custos.
Do ponto de vista dos custos temos duas fontes: os custos operacionais
- xos ou vari aveis - e os custos associados ao nanciamento de parte do
valor de compra. Assim as horas voadas (h
voa
) vezes o custo da hora voada
(c
hora
) comp oem com o custo xo, seguro e outras encargos nanceiras,
(c
fixo
) o custo operacional (c
oper
).
c
oper
= c
hora
h
voa
+c
fixo
Por seu turno o custo do nanciamento (c
fina
) depende da taxa de ju-
ros (t
juro
), do percentual a nanciar (
fina
) e, obviamente, do pre co de
compra do avi ao (p
comp
):
c
fina
= t
juro

fina
p
comp
Logo o custo total ser a:
c
tota
= c
oper
+c
fina
Pelo lado da receita devemos considerar as horas voadas (h
voa
), a pro-
por c ao de v oos fretados (
fret
), a taxa de ocupa c ao de v oos de passageiros
(
pass
), o pre co do frete (p
fret
) e o pre co da passagem por assento (p
asse
):
r
tota
= n
pass
[1
fret
]
pass
h
voa
p
pass
+
fret
h
voa
p
fret
116 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
onde o n umero de passageiros (n
pass
) e suposto xo e igual a 5, neste
exemplo.
Os diagramas de inuencia apresentados nas guras 5.1 e 5.2 resumem
os c alculos descritos nas f ormulas acima. Estes s ao tipicamente diagramas
de c alculos intermedi arios. Temos os n os decis orios referentes aos pre cos
do frete e do assento em v oo regular e da percentagem a nanciar. Estas
s ao as vari aveis sob o controle da

AGUIA.
Figura 5.1: Diagrama de inuencia: receita e custo
Note que estes dois diagramas de inuencia podem ser juntados num
unico mais complexo onde ca denido o conceito de lucro (Lucro) e
onde e includo um n o decis orio descrevendo a alternativa de postergar
a compra por um ano, adquirindo, no momento, somente a op c ao de
compra. Teremos agora os seguintes n os: de consequencia - o n o de
lucro, n os de c alculos intermedi arios - custo de nanciamento e total.
Alem disto, temos v arias constantes de entrada: taxa de juros, seguro e
pre cos.
Suponha que tenhamos acessado para cada uma das dez vari aveis en-
5.3. EXEMPLODE AN

ALISEPRELIMINARDE SENSIBILIDADE117
Figura 5.2: Diagrama de inuencia completo
volvidas neste processo decis orio tres valores: o mais prov avel, o extremo
inferior e o extremo superior. Desejamos, variando um por vez, vericar
qual o impacto de cada item no valor nal - lucro - do nosso sistema.
Suponha que estes valores sejam aqueles apresentados na tabela 5.1.
Utilizaremos como fun c ao de inuencia global
S
g
(i) = T( sx
i
) T(sx

i
)
onde T(sx) e o lucro lquido considerando o vetor de dados sx e o
sub-ndice i signica que todas as componentes exceto a i-esima ser ao
xadas no seu valor mais prov avel. Podemos, agora, ordenar descres-
centemente as vari aveis segundo o valor de S
g
(i) e construir o gr aco
da gura 5.3 onde plotamos barras horizontais representando o intervalo
118 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
Vari avel L
inf
Media L
sup
h
voa
500 800 1000
p
fret
300 325 350
p
ass
95 100 108

pass
.40 .50 .60

fret
.45 .50 .70
c
hora
230 245 260
c
fixo
18000 20000 25000

fina
.30 .40 .50
t
juro
.105 .115 .13
p
comp
85000 87500 90000
Tabela 5.1: Vari aveis de entrada - domnio de varia c ao
(T( sx

), T(sx


)). No pacote DPL este gr aco e denominado Tornado e
permite visualizar o efeito de cada vari avel no resultado nal. Aquelas
vari aveis mais inuentes dever ao ser tratadas como estados da natureza
e suas incertezas eliciadas com maior rigor, enquanto que as demais ser ao
mantidas xas em seu valor mais prov avel. Este exemplo ser a recon-
siderado na se c ao 5.5 onde a sensibilidade a escolhas das probabilidades
atribudas ` as vari aveis:
pass
, c
hora
e h
voa
, ser ao avaliadas.
5.4 Conceitos b asicos de an alise de sensi-
bilidade
Vimos nos captulos anteriores que um problema de decis ao depende fun-
damentalmente das preferencias e cren cas do decisor.

E preciso especi-
car os antecedentes distribui c oes a priori, as consequencias a fun c ao
utilidade e o modelo probabilstico, o qual descreve os experimentos
5.4. CONCEITOS B

ASICOS DE AN

ALISE DE SENSIBILIDADE 119


Figura 5.3: Diagrama tornado
realizados com o intuito de reduzir as incertezas. Essas quantidades s ao
de difcil especica c ao, sobretudo no caso de v arios decisores ou m ultiplos
especialistas.
Neste contexto torna-se importante avaliar a sensibilidade dos resulta-
dos obtidos a varia c oes nessas quantidades. Existe uma extensa literatura
estatstica discutindo robustez Bayesiana e an alise de sensibilidade. Nes-
ta se c ao nos limitaremos a introduzir uma nota c ao geral para descrever
o problema e discutir, atraves de exemplos, algumas quest oes relevantes.
O tema e relativamente te orico e exige conhecimentos acima dos assum-
idos neste texto. Recomenda-se, aos interessados, a leitura French and
Rios-Insua (2000).
Exemplo 5.4 Uma companhia de seguro de sa ude disp oe de dados men-
sais sobre o n umero de ocorrencias de sinistros consultas medicas
e, obviamente, o n umero de segurados mes a mes (Migon 2001). No
processo de decidir sobre o premio atuarial a companhia deve modelar a
evolu c ao do n umero de sinistros e, tambem, o valor dos mesmos. Dese-
120 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
jamos exemplicar o efeito da escolha da distribui c ao a priori na previs ao
do n umero futuro de sinistros. Denotemos por N
t
o n umero observado de
sinistros e por
t
a popula c ao segurada, no mes t, t = 1, , T. Suponha
que o n umero de sinistros mensais seja distribudo segundo uma Poisson,
isto e
N
t
[,
t
Po(
t
)
onde
t
e suposto conhecido e e a taxa de sinistros por segurado mes
suposta estacion aria. O par ametro e desconhecido e desejamos eliciar
uma priori para ele. Consultando-se dados internacionais, por exemplo
da Organiza c ao Mundial de Sa ude (OMS), obtemos a informa c ao de que,
em media, cada segurado faz 4 consultas medicas por ano. Assumindo-se
um coeciente de varia c ao de 2 unidades podemos especicar uma priori
na famlia Ga(a, b), a, b > 0 usando as rela c oes:
E[[a, b] = a/b e CoV
2
[[a, b] = 1/a
isto e: a/b = 4 e 1/a = 1/4, ou seja a = 0.25 e b = 0.0625. Vale notar
que alternativamente poderamos ter eliciado os quartis e determinado a
e b atraves de um ajuste. Por exemplo N
0.25
= 0.05, N
0.5
= 0.80 e N
0.75
=
4.0.
Assim a distribui c ao a posteriori ser a:
[sN
T
, s
T
Ga(a
1
, b
1
)
onde sN
t
representa o vetor de observa c oes ate o tempo t, s
t
o vetor da
popula c ao segurada ate o tempo t e
a
1
= 0.25 +
t

t=1

k
e b
1
= 0.0625 +
t

k=1
N
k
A media e a vari ancia da distribui c ao preditiva, a qual ser a uma Binomial
Negativa, seguem facilmente das express oes gerais:
E[N
t+1
] = E[E[N
t+1
[, sN
t
, s
t+1
]]
5.4. CONCEITOS B

ASICOS DE AN

ALISE DE SENSIBILIDADE 121


V [N
t+1
] = E[V [N
t+1
[, sN
t
, s
t+1
]] +E[V [N
t+1
[, sN
t
, s
t+1
]]
Representando a informa c ao disponvel ate o tempo t por D
t
= (sN
t
, s
t
),
teremos no nosso exemplo:
E[N
t+1
[D
t
] = E[E[N
t+1
[D
t
, s
t+1
]]
=
t+1
E[[D
t
]
=
t+1

0.25 +

t
k=1
N
k
0.0625 +

t
k=1

k
t 1 2 3 4 5 6 7 8
n
t
643 796 817 938 958 1056 1363 2115

t
1130 1234 1282 1329 1412 1454 2027 2144
t 9 10 11 12 13 14 15 16
n
t
2046 2543 2901 2368 2442 2613 2935 2965

t
2289 2685 2737 3016 3069 3114 3179 3225
t 17 18 19 20 21 22 23
n
t
2085 2571 3172 3046 2781 3592 3204

t
3260 3304 3334 3405 3474 3578 3645
Tabela 5.2: Dados de n umero de consultas medicas
Para examinar o efeito da distribui c ao a priori sobre as previs oes
podemos fazer um gr aco (gura 5.4) plotando o valor esperado da dis-
tribui c ao preditiva contra o n umero observado de consultas para os perodos,
digamos t = 9 a t = 23.
Duas distribui c oes a priori foram utilizadas, ambas relativamente pre-
cisas mas com medias (4 e 1, respectivamente) afastadas dos valores ob-
servados. Como temos uma quantidade muito grande de observa c oes rapi-
damente o efeito inicial dessas prioris ca diludo. Logo, podemos armar
que os resultados s ao pouco sensveis ` a escolha da priori.
122 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
Figura 5.4: Valor esperado da distribui c ao preditiva, segundo duas prioris
alternativas, e frequencias observadas no perodo t = 9 24.
Esta an alise sofre de v arias crticas. Por um lado, e pouco razo avel que
seja invariante no tempo, por outro, a distribui c ao a priori e arbitr aria
por considerar somente umas poucas informa c oes da Organiza c ao Mundi-
al da Sa ude (OMS) e, tambem, pela escolha de conveniencia a famlia das
distribui c oes gama. Uma classe mais ampla de distribui c oes a priori ser a
investigada e o efeito desta imprecis ao ser a avaliado mais adiante.
5.5 Sensibilidade da distribui c ao a priori
Embora seja bem sabido que considerar isoladamente os efeitos da dis-
tribui c ao a priori e da fun c ao de utilidade e uma grave limita c ao na
an alise de sensibilidade, vamos iniciar pela an alise isolada dos efeitos da
distribui c ao a priori. Alem disto, no que se segue, o modelo ser a consid-
erado como xo, sem perda de generalidade.
Uma nota c ao geral facilitar a a exposi c ao do conceito de sensibilidade
5.5. SENSIBILIDADE DA DISTRIBUIC

AO A PRIORI 123
global. Denote por T(l, p, p
X
, a) um funcional valor esperado a posteri-
ori da perda como fun c ao de l fun c ao de perda, p() distribui c ao a
priori, p(x[) distribui c ao das observa c oes e a uma a cao. Assim teremos:
T(l, p

, p
X
, a) =

l(a, )p(x[)p()
1
p(x)
d
onde p(x) =

p(x[)p()d denota a distribui c ao preditiva.


Denotaremos por a
b
a regra de Bayes, isto e:
a
b
= argmin
a
T(., ., ., a)
Dentre as classes de distribui c oes a priori discutidas na literatura
destacam-se:
Famlias conjugadas - a principal vantagem desta famlia e a possi-
bilidade de se obter c alculos em forma fechada. Alem disto, sao
exveis o suciente para acomodar as cren cas do tomador de de-
cis ao.
Classe de distribui c oes vizinhas - esta famlia e construida a par-
tir de uma distribui c ao base p
0
() e uma dada metrica. Todas as
densidades vizinhas de p
o
() ser ao membros da classe. Um exemplo
seria a classe das distribui c oes -contaminadas, isto e: { = p

=
(1 )p
o
() +p()
Classe dos momentos - e a cole c ao de todas as prioris com momentos
pr oximos aos eliciados pelo decisor.
Classe dos quantis - esta e a classe de distribui c oes satisfazendo cer-
tas restri c oes, estabelecidas subjetivamente pelo decisor, sobre os
quantis.
A sensitividade global examina o range de varia c ao a posteriori (ou
na preditiva) de um funcional para p() {.
124 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
Deni c ao 5.1 Seja { uma classe de prioris. Uma medida de sensi-
bilidade global (S
g
) e dada pela amplitude de varia c ao do funcional de
interesse:
S
g
(p()) = sup
p

P
T(p()) inf
p

P
T(p())
Esta medida e simples de interpretar. A quantidade a posteriori e
robusta a desvios da priori quando esta amplitude for pequena e n ao
e robusta quando a amplitude for grande. Por exemplo, se xamos a
perda quadr atica, l(, a) = ( a)
2
, ent ao T(p()) = E[[sx] e S
g
(p())
a amplitude de varia c ao da media a posteriori quando a distribui c ao a
priori variar em uma particular classe de distribui c oes.
Exemplo 5.5 Compra ou Leasing de Avi ao: ap os a an alise preliminar
de sensibilidade decidimos modelar estocasticamente as quantidades ho-
ras voadas, custo por hora voada e ocupa c ao de assentos. A quanti-
dade pre co do fretamento, embora tambem de grande inuencia nos re-
sultados nais, e de fato uma vari avel de controle da companhia. Es-
tas quantidades incertas foram examinadas como bin arias, representan-
do uma situa c ao pessimista (codicada como 0) ou otimista (codica-
da como 1). Admitiu-se que c
hora
e
pass
s ao distribuidas independente-
mente, mas que h
voa
tem distribui c ao dependendo de
pass
. Assim temos
as probabilidades p = P[C
hora
= 1] e q = P[
pass
= 1], com a letras
mai usculas, como usual, representando vari aveis aleat orias. Finalmente
teremos r = P[H
voa
= 0[
pass
= 0] e s = P[H
voa
= 0[
pass
= 1], com
r > s. Para estudarmos a inuencia dessas quantidades nos resultados
nais assumiremos ainda que s = 0.8r e que p = 0.5. Alem disto iremos
supor que as decis oes disponiveis para a

Aguia s ao somente a
1
comprar
ou a
2
- n ao comprar o avi ao. No segundo caso, obviamente, a

Aguia
investir a seus recursos pr oprios no mercado nanceiro. No limitaremos,
assim a examinar conjuntamente o efeito de q e r. Os valores monet arios
dessas quantidades foram, tambem, revisados. Teremos, respectivamente,
para os casos pessimista e otimistas, as seguintes informa c oes.
5.5. SENSIBILIDADE DA DISTRIBUIC

AO A PRIORI 125
Pessimista Otimista
c
hora
253 237

pass
0.45 0.55
h
voa
650 900
Tabela 5.3: Novos valores associados as vari aveis mais relevantes
As demais quantidades foram mantidas nos seus valores base (tabela
5.1). Ap os algumas simplica c oes chegamos a equa c oes de receita e de-
spesas como fun c ao das quatidade incertas
c
tota
= 24025 +c
hora
h
voa
r
tota
= 250
pass
h
voa
+ 162.5 h
voa
Poderiamos utilizar uma vez mais o DPL para esta an alise. Temos
de calcular o valor esperado do Lucro para cada uma das alternativas
e examinar a reg ao do plano (q, r) que, por exemplo, leva a compra do
avi ao. Esta an alise de sensibilidade servir a para orientar a quantidade de
esfor co necess ario para se modelar as incertezas. Neste exemplo temos:
r(a
1
) = q (3500 r 22500) 1100 r + 25475
Desejamos comprar o avi ao somente se este lucro esperado superar o
investimento nomercado nanceiro, que j a sabemos gera um ganho de
4200 UM. Ap os um pouco de algebra chegamos a desigualdade:
21275 11000 r > q [22500 3500 r]
Escolhas de pares (q, r) pr oximos a curva que dene esta fronteira s ao
mais sensveis do que valores distantes.
126 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
5.6 Sensibilidade conjunta: priori e utili-
dade
Nestas se c ao discutiremos alguns aspectos adicionais sobre sensibilidade.
Iniciaremos discutindo o efeito simult aneo de imprecis oes na distribui c ao
a priori e no valor das consequencias. Como j a mencionamos essas an alises
rapidamente tornam-se computacionalmente complexas e com resultados
de difcil interpreta c ao. Uma boa pr atica e ganhar experiencia atraves
de exemplos simples e variando tanto a priori como as consequencias em
somente um alguns poucos valores. Um exemplo discutido em French
and Rios-Insua (2000) e apresentado a seguir. Ser ao tambem discuti-
das situa c oes mais atraentes e realistas onde analisaremos a inuencia
simult anea da consequencia media de certo investimento de risco e da
probabilidade a priori de um investimento alternativo cujo desfecho e
bin ario. Ressaltamos que quando estamos diante de um problema com-
putacionalmente complexo e boa pr atica iniciar a an alise de sensibilidade
avaliando somente alguns pares de valores da priori e das utilidades.

E
claro que isto pode n ao ser suciente como veremos no exemplo abaixo.
Sensibilidade conjunta
Vejamos um exemplo. Suponha que estamos diante de um problema de
decis ao sem dados dado pela tabela 5.4.

1

2
a
1
c
1
c
2
a
2
c
2
c
3
1
Tabela 5.4: Problema de decis ao sem dados.
5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 127
Suponha que eliciou-se que 0.4 < < 0.6, que 0.5 < c
1
= l(a
1
,
1
) <
0, 0.75 < c
2
= l(a
1
,
2
) < 0.25 e 1.0 < c
3
= l(a
2
,
2
) < 0.5. Temos
assim doze alternativas considerando as varia c oes extremas de e xando
as consequencias, ora no seu valor mnimo, ora no m aximo (ver gura ??).
l(c
1
) l(c
2
) l(c
3
)
0.4 0 -0.25 -0.5
-0.5 -0.75 -1.0
0.6 0 -0.25 -0.5
-0.5 -0.75 -1.0
Tabela 5.5: Alternativas considerando as varia c oes extremas de .
Vale notar que T(l, p

, a
1
) > T(l, p

, a
2
) para todos os quatro casos e,
portanto, alternativa a
2
e sempre prefervel a alternativa a
1
.

E claro que poderemos construir muitas outras combina c oes. Por


exemplo, se xamos c
1
no seu valor mnimo, c
1
= 0.5, e c
2
e c
3
nos seus
valores m aximos, c
2
= 0.25 e c
3
= 0.5 e = .6, ent ao T(l, p

, a
1
) =
0.4 e T(l, p

, a
2
) = 0.35 levantando d uvida sobre a preferencia de a
2
sobre a
1
.
Outra alternativa seria fazer uma an alise com respeito a priori com a
perda xada ou vice-versa, incorrendo nas crticas anterior. Por exemplo,
xando = 0.5 teremos:
T(l, p

, a
1
) T(l, p

, a
2
) = (c
1
+c
2
)/2 (c
2
+c
3
)/2 = (c
1
c
3
)/2
Como c
1
e sempre maior que c
2
ent ao o problema e robusto com
respeito as consequencias. Entretanto, se xarmos c
1
= 0.25, c
2
=
0.5 e c
3
= 0.75 e deixarmos livre, teremos:
T(l, p

, a
1
) T(l, p

, a
2
) = 0.25 0.5(1) +0.5 +0.75(1) = 0.25
128 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
Logo teremos robustez com rela c ao a varia c ao na priori. N ao podemos
entretanto concluir que o problema e robusto como mencionado anterior-
mente.
Efeito do comportamento do decisor diante do risco
Vamos agora discutir um outro exemplo, onde analisamos a sensibil-
idade simult anea a probabilidade a priori e ao valor esperado da perda.
Este exemplo abordar a, inicialmente, o caso de um decisor neutro ao
risco e, posteriormente, o de um decisor averso ao risco. O contexto
deste exemplo envolve a decis ao de investir no mercado de comodities
ou, alternativamente, participar de uma sociedade limitada. O investi-
mento ser a de 2000 u.m. e a expectativa e de que o investimento no
mercado de comodities, embora, de maior risco promete ganhos maiores.
Suponhamos que os ganhos no mercado de comodities sejam descritos por
distribui c ao normal de media e vari ancia
2
. Alem disto, para facitilar
a an alise, iremos supor que neste mercado o pior e melhor ganhos est ao
limitados em -1000 u.m. e 5000 u.m., no sentido de que as probabilidades
nas caudas desta N(,
2
) s ao desprezveis, respectivamente, para val-
ores abaixo e acima destes extremos. Po outro lado, o ganho produzido
pelo investimento na sociedade limitada ser a descrito por uma vari avel
aleat oria bin aria, assumindo os valores de 10000u.m., no caso de suces-
so e de 4000u.m. no caso de fracasso. Resumindo teremos a situa c ao
exposta na tabelatab:neutro.
Fracasso Sucesso
a
1
-1000 5000
a
2
-4000 10000
Tabela 5.6: Perdas no mercado de comodities.
As quantidades relevantes desta aplica c ao s ao: = E[
1
], onde
1
representa o retorno da aplica c ao no mercado de comodities e = Pr[
2
=
5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 129
1], representando sucesso da sociedade.

E claro que:
r(a
1
) = E[u(a
1
,
1
)] =
r(a
2
) = E[u(a
2
,
2
)] = 10000 4000(1 ) = 14000 4000
Note que a op c ao a
1
e prefer ivel ` a op c ao a
2
se e somente se 14000
4000 , onde a igualdade representaria a indiferen ca entre essas op c oes.
A principal conclus ao desta parte do exemplo e que a decis ao, mesmo
n ao se conhecendo exatamente o valor de e de , independe da vari ancia
de
1
no contexto, e claro, de um decisor neutro ao risco.
Para prosseguir com a an alise, fa camos
1
assumir seu valor mnimo,
respectivamente, m aximo. Assim teremos:
14000 4000 = 1000
= 50000
implicando que = 3/14 = 0.21 ou = 9/14 = 0.64. Logo
(0.21, 0.64) quando
1
assume seus valores extremos. Assim as an alises
de sensibilidade com respeito a podem se restringir a este intervalo.
Esses resultados podem ser resumidos num gr aco representando os
pares de valores (, ), onde a diagonal descreve o conjunto de pontos de
indiferen ca entre as a c oes a
1
e a
2
. Os pares acima desta diagonal favore-
cem a escolha da a c ao a
1
e os abaixo, a escolha de a
2
. A caixa central
representa a regi ao de sensibilidade aos valores de como mencionado
anteriormente.
Por exemplo, se perguntamos ao decisor os valores de e e ele
fornece duas alternativas: (i) (0.8, 2000) e (ii) (0.4, 1500), uma fora do
intervalo descrito acima e a outra na regi ao, ent ao teremos muito mais
facilidade em decidir quando no segundo ponto do que no primeiro.Note
que:
E
0.8
[[u(a
1
,
2
)]] = 0.8 10000 0.2 4000 = 7200
enquanto que
E
0.4
[u(a
1
,
2
)] = 0.4 10000 0.6 4000 = 1600
130 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
Figura 5.5: Gr aco de versus com regi ao de sensibilidade de
Estes valores ser ao comparados respectivamente com = 2000, no primeiro
caso e = 1500, no segundo caso. As amplitudes de varia c ao ser ao re-
spectivemente 5200 e 100 u.m., deixando claro que o segundo caso e mais
robusto.
Iremos, nalmente, analisar o problema acima relaxando a suposi c ao
de decisor neutro ao risco. Suponha, agora, que nosso decisor utiliza a
fun c ao de utilidade
u(x) = 1 exp(ax)
para algum valor de a.
Suponha que desejamos iniciar vericando o efeito da escolha de a
coeciente de avers ao ao risco de nosso decisor. Fixemos para iniciar
= 0.5. Assim teremos, respectivamente, para o decisor neutro ao risco
e para o averso ao risco, o valor equivalente certo (c
p
)
c
p
(a
2
) = 0.5 10000 0.5 4000 = 3000
c
p
(a
2
) = log(1 0.5(1 exp(1000a) 0.5(1 exp(4000a))/a
5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 131
Fazendo a variar podemos observar o efeito do coeciente de avers ao
ao risco no equivalente certo. Quanto mais averso ao risco mais negati-
vo ser a o equivalente certo, considerando-se = 0.5. Este efeito pode,
tambem ser observado na gura 5.6.
a c
p
(a
2
)
0 3000
0.00002 2512
0.00020 -829
0.00100 -3325
Tabela 5.7: Valor equivalente certo.
Note que a condi c ao de indiferen ca ser a dada por:
E[u(a
2
)] = E[u(a
1
)] u(10000)+(1)u(4000) = E
N[,
2
]
(u(a
1
)]
Como estamos supondo que
1
e normal distribudo, ent ao exp(
1
) ser a
log-normal distribudo e
E[u(a
1
)] = 1 exp(am+am
2

2
/2)
Logo teremos
= a
2
/2 +u
1
[E(a
2
)]
= a
2
/2 log(1 (1 exp(1000a) (1 )(1 exp(4000a))/a
Destaca-se que cresce com a vari ancia de
1
e, mais ainda, indepen-
dentemente de . Por outro lado, e proporcional ao equivallente certo
de a
2
para
2
xo.
A sensibilidade de a e
2
pode ser vericada nas guras a seguir. Na
gura 5.6 xamos a = 0.00005 e fazemos o gr aco de como fun c ao de
132 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
, para duas situa c oes:
2
= 0 e
2
= 1000
2
. Plotamos ainda a a reta de
indiferen ca para o decisor neutro ao risco. A diferen ca entre as curvas de
indiferen ca s ao relativamente pequenas. Lembre-se que acima da curva
de indiferen ca preferimos a
1
` a a
2
. Assim
2
n ao e um par ametro muito
sensitivo.
Figura 5.6: Efeito de
2
na regi ao de indiferen ca.
Vamos examinar agora a sensibiliddae de a. Na gura 5.7 observamos
as curvas de indiferen ca para a = 0, a = .00005 e a = 0.0002 xando a
vari ancia
2
igual a 1. Note que a medida que a tende a zero (decisor
neutro ao risco) as curvas de indiferen ca se modicam expressivamente.
Isto comprova qu ao sensvel e o par ametro a.

E f acil, por exemplo, veri-
car que para = 0.5 a decis ao a
2
- investir na sociedade - parece mais
atraente para um decisor neutro ao risco, enquanto que para um decisor
com um alto coeciente de avers ao ao risco, por exemplo igual 0.0002,
a op c ao a
1
- investir no mercado de comodities - e prefervel.

E facil
vericar que para valores maiores do coeciente de avers ao ao risco, por
exemplo a = 0.001, o decisor nunca preferir a a op c ao a
2
.
5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 133
Figura 5.7: Efeito de a - coeciente de avers ao ao risco na curva de
indiferen ca.
134 CAP

ITULO 5. AN

ALISE DE SENSIBILIDADE
Captulo 6
Programa cao Dinamica
6.1 Introdu c ao
Trataremos de problemas de decis ao em m ultiplos est agios ou sequenci-
ais. Esses problemas se caracterizam por poderem ser separados em um
certo n umero de passos sequenciais ou est agios, cada est agio se conclui
com uma decis ao. Em geral, o tempo e usado para ordenar a sequencia
de problemas decis orios. Desejamos descrever a sequencia de decis oes
tomadas em cada est agio. As principais referencias s ao: DeGroot (1970),
Berger (1985), French and Rios-Insua (2000) e Bather (2000), alem de
Parmigiani, Inoue, and Lopes (2003). Alem disto, a rela c ao MEU com a
programa c ao din amica pode ser encontrada em Lindley (1961).
O captulo est a estruturado da seguinte forma. Inicialmente apre-
sentamos alguns conceitos b asicos para a seguir discutirmos o problema
geral de aloca c ao e um exemplo de caminho crtico. Na proxima se c ao
ser a introduzida a programa c ao din amica determinstica e exemplos. Fi-
nalmente, a programa c ao din amica estoc astica modelos Markovianos
ser a apresentada.
135
136 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
6.2 Uma classe de problemas de otimiza c ao
Para motivar a tecnica de programa c ao din amica iniciaremos descreven-
do uma classe especial de problemas de otimiza c ao. Sua principal carac-
terstica e a possibilidade de decompor a fun c ao objetivo em um n umero
nito de est agios e, assim, introduzir a ideia central da programa c ao
din amica, ou seja a otimiza c ao de tr as para diante ou backward induc-
tion.
Esta ampla classe de problemas de programa c ao matem atica ca deni-
da por
otimizar f
1
(x
1
) + +f
n
(x
n
)
sujeito a x
1
+ +x
n
b
com x
i
> 0 e x
i
inteiros (6.1)
onde f
i
(x
i
), i = 1, , n s ao fun c oes conhecidas de uma unica vari avel
(lineares ou n ao lineares), b > 0 e uma quantidade conhecida e n e o
n umero de est agios.
Esta classe de problemas e conhecida como processo de decis ao multi-
est agio. No est agio inicial temos a vari avel de decis ao x
1
e sua con-
sequencia ou custo f(x
1
). Um caso especial, denominado problema de
aloca c ao ocorre quando os estados s ao inteiros e b tambem e inteiro.
Algumas caractersticas destes problemas merecem ser destacadas:
o problema pode ser separado em est agios ou passos,
as decis oes caracterizam formas de concluir um est agio,
uma solu c ao do problema ser a denominada uma poltica e consistir a
numa sequencia de decis oes
Exemplo 6.1 Determinar quanto investir em cada oportunidade (ao lon-
go do tempo) de forma a maximizar o retorno total. Suponha que temos
6.2. UMA CLASSE DE PROBLEMAS DE OTIMIZAC

AO 137
tres est agios de investimentos i = 1, 2, 3. O estado do processo no est agio
i e a quantia disponvel para investir naquele instante.

E claro que no
est agio 1 temos todo o capital disponvel para investir. Suponha que temos
ao todo 4 unidades monet arias no est agio 1. Nos est agios 2 e 3 os re-
cursos disponveis poder ao assumir os valores: 0, 1, 2, 3 ou 4, dependendo
das aloca c oes previas. Esta e exatamente a express ao (6.1) para n = 3 e
b = 4.
Um segundo exemplo permitir a xar alguns princpios fundamentais
envolvidos na estrutura (6.1). Suponha que se deseja obter o caminho
mais curto entre dois pontos como exemplicado na 6.1. Existem dois
caminhos de a ate c. Devemos escolher a trajet oria descrita pela linha
cheia, no trecho de b para c, pois esta e menor.
Figura 6.1: A linha cheia representa o caminho mais curto ligando a a c
e a linha pontilhada um caminho alternativo de b a c, tal que o trajeto
total seja mais longo.
138 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
Exemplo 6.2 Seja o grafo, isto e, um conjunto de vertices conectados
atraves de arcos, como introduzido no captulo 3. Suponha que os vertices
sejam denotados por 1, 2, , n. Alguns pares de vertices podem estar
conectados atraves de arcos. A dist ancia entre os vertices i e j ser a
denotada por d
i,j
. Denote por f
i
o comprimento do caminho mais curto
ligando o vertice i ao j. Assim
f
i
= min
j
d
i,j
+f
j

onde j representa um vertice que pode ser alcan cado partindo-se do vertice
i.

E claro tambem que f
n
= 0.
Suponha que deseja-se obter o caminho mais curto entre os vertices 1
e 10 da gura 6.2 abaixo. Nesta gura observamos um grafo com vertices
numerados de 1 a 10 e arcos conectando particulares pares de vertices. A
solu c ao otima ser a obtida resolvendo-se o problema do m para o incio
como veremos mais adiante. Este pode ser visto, tambem, como um prob-
lema de aloca c ao com n = 10.
S ao v arios os problemas cl assicos de otimiza c ao que podem ser de-
scritos como acima. Por exemplo, os problemas de sequenciamento, de
aloca c ao otima, modelos de invent ario e v arios outros.
6.3 Programa c ao din amica
No captulo 3 aprendemos a resolver empiricamente um problema de de-
cis ao usando modelos gr acos tais como arvores de decis ao e diagramas
de inuencia. Nos captulos 2 e 4 usamos sempre um espa co de a c oes
e de estados da natureza discretos e com um n umero nito de alterna-
tivas. Em geral este expediente e uma boa aproxima c ao, complemen-
tada por uma an alise de sensibilidade (captulo 5). Agora e chegado o
momento de formalizar estas ideias e estabelecer um algortimo geral.
Estamos primordialmente interessados em resolver problemas de decis ao
6.3. PROGRAMAC

AO DIN

AMICA 139
Figura 6.2: O grafo acima tem vertices rotulados de 1 a 10 e arcos com
as dist ancias anotadas (d
i,j
)
multi-dimensionais ou mais precisamente que possam ser decompostos em
m ultiplos est agios.
A tecnica de solu c ao de problemas de decis ao em est agios m ultiplos e
denominada programa c ao din amica ou indu c ao para tr as. Lindley (1961)
mostra, claramente, a necessidade de se trabalhar de tr as para adiante
como vimos na solu c ao das arvores de decis ao e diagramas de inuencia.
Esta rela c ao est a bem estabelecida no artigo anteriormente mencionado.
A decis ao no est agio presente e de pouca utilidade pois o otimo presente
envolve o otimo futuro. No exemplo da dist ancia mnima entre os vertices
1 e 10, de nada adianta, no est agio 4, digamos, escolher entre as rotas
4 5 ou 4 7 a de menor custo, pois o otimo deste est agio depender a
dos est agios futuros como veremos. A nota c ao i j representa a decis ao
de se utiliar a rota com incio no vertice i e m no j.
Os problemas que trararemos s ao tipicamente problemas de otimiza c ao.
O termo din amico indica que os est agios se relacionam dinamicamente
140 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
ou, para simplicar, temporalmente (ainda que esta no c ao possa ser ar-
ticial!). Os problemas multi-est agio podem ser convencionalmente for-
mulados como um unico est agio, pagando-se o pre co da complexidade
ou dimensionalidade. Como mencionado por Bellman (1957), se temos
N est agios e M decis oes possveis em cada est agio ent ao teremos um
problema NM-dimensional com um unico est agio.
A solu c ao que descreveremos agora decomp oe o problema original em
N sub-problemas, mais simples, um para cada est agio. Assim a complex-
idade computacional crescer a linearmente com o n umero de est agios ou
sub-problemas e n ao mais exponencialmente com o n umero de vari aveis.
Antes de prosseguirmos e introduzir o algortmo geral ser a ilustrativo
apresentarmos uma solu c ao intuitiva do exemplo 6.2.
Exemplo 6.3 Continua c ao do exemplo 6.2: Vamos reverter a ordem dos
est agios iniciando, portanto, pelo est agio i = 10.

E obvio que f
10
= 0 e,
ent ao, podemos passar imediatamente para o caso i = 9. Para tanto
utilizaremos a rela c ao f
i
= min
j
d
i,j
+ f
j
. Temos que avaliar f
9
=
min
j
d
9,j
, f
10
. Como j s o pode assumir o valor 10 e claro que f
9
= 2
coincidindo com d
9,10
.
O pr oximo caso ser a ligeiramente mais elaborado. Quando i = 8,
j poder a assumir os valores 9 ou 10. Logo temos de determinar f
8
=
mind
8,10
+f
10
, d
8,9
+f
9
. Assim f
8
= 5 e a solu c ao consistir a em escolher
o caminho 8 9, onde i j representa a decis ao de se caminhar do
vertice i para o j.
Fa camos agora i = 7. Como este vertice esta conectado tanto ao
vertice 8 como ao 9 teremos: f
7
= min
j
d
7,9
+f
9
, f
7,8
+f
8
. Substituindo-
se os valores das dist ancias correspondentes chegamos a f
7
= 4 e portanto
a solu c ao ser a 7 9. Assim do vertice 7 devemos seguir para o 9 e
dapara o 10, com uma dist ancia total igual a 4 unidades. Logo a rota
alternativa 8 9 n ao far a parte da poltica otima uma vez que e mais
econ omico seguir diretamente de 7 para 9 e da ao m.
6.3. PROGRAMAC

AO DIN

AMICA 141
Prosseguindo teremos f
5
= min
j
d
5,7
+ f
7
, f
5,8
+ f
8
= min
j
3 +
4, 6 +5. Ent ao f
5
= 7 e, coerentemente com o fato de 8 9 j a ter sido
eliminado da poltica otima, incorporaremos ` a solu c ao otima o trecho
5 7. Continuando de forma an aloga ate o vertice inicial obtemos a
tabela 6.1. A solu c ao otima ter a uma dist ancia total de 14 unidades e
seguir a o caminho:
1 3 5 7 9 10
Vale observar mais uma vez que alguns caminhos foram deletados. Por
exemplo, o vertice 4 conduziria ao 8 o qual j a havia sido preterido pelo
caminho de 7 para 9. Analogamente, o caminho que passa pelo vertice 6
e tambem preterido.
i 10 9 7 8 5 4 3 2 1 6
f
i
0 2 4 5 7 11 12 13 14 16
Tabela 6.1: Poltica otima (em negrito)
Vamos agora descrever, em termos gerais, o algoritmo da progra-
ma c ao din amica. Inicialmente trataremos somente de problemas com um
n umero nito de est agios - T. Nosso problema consiste em determinar de
forma otima uma sequencia de a c oes / = a
1
, , a
T
, condicionalmente
ao estado inicial do sistema. O espa co das a c oes disponveis no t-esimo
est agio ser a denotado por /
t
e o espa co de estados da natureza, em cada
est agio, denotado por
t
, como introduzido no captulo 2.

E claro que ao atingir o est agio t teremos uma hist oria descrita por:
D
t
= a
1
, , a
t
,
1
, ,
t
/
1
/
t
,
1

t

Para completar a descri c ao do problema devemos denir uma fun c ao


que descreva a din amica dos estados da natureza. Seja
G :
t1
/
t

t
142 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
isto e:
t
= G(
t1
, a
t
). Esta fun c ao de evolu c ao dos estados, de na-
tureza Markoviana, induz a distribui c ao de probabilidade sobre
t
, que
ser a denotada por p(
t
[a
t
,
t1
). Esta distribui c ao condicional ser a especi-
cada, na pr atica, por uma fun c ao de probabilidade ou por uma fun c ao
de densidade dependendo de termos um espa co de estados discreto ou
contnuo.
Para cada a c ao a
t
/
t
ca denida a fun c ao de custo esperado
c
t
= E[c(
t
, a
t
)[D
t1
] =

t
c(
t
, a
t
)p(
t
[D
t1
)
onde D
t
representa a informa c ao disponvel ate o instante t. Uma de-
scri c ao gr aca deste processo, atraves de um diagrama de inuencia, foi
apresentado no captulo 3, gura 3.11.
Desejamos minimizar o custo esperado total dado o estado inicial
0
min
A
c
1
+ +c
T

Para xar a nota c ao recem introduzida ser a util apresentarmos um


exemplo.
Exemplo 6.4 Suponha que nosso problema consista em controlar os movi-
mentos de um objeto que partindo de um ponto
0
deva atingir, em T
est agios, certo alvo. As a c oes corresponder ao ` a escolha otima dos movi-
mentos de nosso objeto em dire c ao ao alvo. Existir a um custo nal cor-
respondendo a uma penaliza c ao por n ao atingir o alvo. Consideremos a
fun c ao de din amica
G(
t1
, a
t
) =
t1
+a
t
+
t
onde
t
N[,
2
] e a fun c ao de custo de transi c ao e dada por
c(a
t
,
t
) = ca
2
t
,
6.3. PROGRAMAC

AO DIN

AMICA 143
onde c > 0 e uma constante conhecida. Observa-se que esta fun c ao de
custo n ao depende de
t
sendo, portanto, determinstica. Se na fun c ao
de evolu c ao,
t
= 0, t ent ao teramos um problema de controle otimo
determinstico, onde o custo de desvio do alvo ap os T etapas seria dado
por
f
0
() = m
2
onde m > 0 e, tambem, uma constante conhecida.
A ideia central da programa c ao din amica e que, em qualquer tempo
t, para minimizar a express ao acima necessitamos somente considerar a
minimiza c ao do custo esperado total no futuro:
min
A
c
t
+ +c
T

isto porque a escolha das decis oes presentes e futuras n ao devem, possivel-
mente, inuir no passado. Este problema mais simples envolve n = T t
vari aveis de decis ao, cuja solu c ao ser a obtida sequencialmente desde n = 1
ate n = T, seguindo o princpio de optimalidade de Bellman, descrito
abaixo.
Princpio de Optimalidade de Bellman
Um poltica otima tem a propriedade de que, qualquer que sejam o estado
e a decis ao iniciais, as decis oes remanescentes constituem uma poltica
otima com respeito aos estados remanescentes.
Seja o custo mnimo esperado futuro para qualquer estado
t
e qual-
quer n = T t, n umero de perodos restantes.
f
n
(
t
) = min
{at,,a
T
}
E[c
t
+ +c
T
[
t
]
Esta express ao de recorrencia exibe o valor mnimo do custo esperado
futuro em termos de
t
, em t = T n. Podemos aplicar sucessivamente
a express ao acima obtendo-se:
144 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
n = 1 : f
1
() = max
a
T
c
T

n = 2 : f
2
() = max
{a
T1
,a
T
}
E[c
T1
+f
1
()[
T1
]
Genericamente teremos,
f
n
(
n
) = min
an
c
n
+E[f
n1
(
n
[
n
)]
onde a esperan ca e sobre a distribui c ao de (
n
[
n1
, a
t
) induzida pela
evolu c ao dos estados da natureza.
6.3.1 Exemplos
Apresentaremos nesta se c ao tres exemplos. Come caremos com o prob-
lema do investimento tratado como algo determinstico, continuaremos
com o exemplo de controle e, com o intuito de demonstrar o que se perde
pela abordagem sequencial, mostraremos o exemplo do profeta.
Consumo versus Investimento
Suponha que um indivduo deva decidir a cada instante de tempo t quanto
de sua renda dever a ser utilizada para consumo e quanto destinado a
investimento. Suponha que seu capital inicial seja
0
e que ele decida
consumir, no instante t, a
t
, 0 < a
t
<
t
, investindo o restante a uma taxa
r (0, 1). Assim seu capital um perodo a frente ser a dado por

t+1
= G(
t
, a
t
) = (
t
a
t
), onde = (1 +r)
Estamos supondo que o investimento produz um ganho conhecido e certo,
caracterizando um problema determinstico. Neste exemplo nosso obje-
tivo ser a maximizar a utilidade decorrente do consumo realizado, a qual
ser a dada por
u(
t
, a
t
) = a
1/2
t
6.3. PROGRAMAC

AO DIN

AMICA 145
Para manter a nota c ao introduzida anteriormente fazemos c
t
=
E[u(
t
, a
t
)[
t
]. Assim desejamos maximizar uma fun c ao de T vari aveis,
a
1
, , a
T
sujeito a
t
> 0, t = 1, . . . , T. Resumindo temos:
max
A
u(a
1
) + +u(a
T
)
sujeito a 0 a
t

t
com
t+1
= (
t
a
t
) (6.2)
sendo
1
dado e t = 1 . . . , T. A equa c ao de recorrencia b asica ser a dada
por
f
n
() = max
0a
u(a) +f
n1
(( a)) (6.3)
onde de fato teramos a = a
Tn
e f
n1
(a
Tn+1
) = f
n1
((
Tn
a
Tn
)
usando a fun c ao de evolu c ao. Destacamos ainda que, como a evolu c ao
e determinstica, n ao temos que tomar o valor esperado de f
n1
(). A
solu c ao otima dever a satisfazer:
f
n
() = (1 + +
2
+ +
n1
)
1/2

1/2
a
n
= /(1 + + +
n1
), n 1 e > 0 (6.4)
Para vericar este fato basta usar indu c ao. Por exemplo, f
1
() =
max
0a
a
1/2
=
1/2
pois a fun c ao de utilidade e mon otona para a > 0. Logo,
a
1
= . Usando 6.3, obtemos f
2
() = max
0a
a
1/2
+
1/2
( a)
1/2
e,
portanto, a
2
= /(1 +) e f
2
() = (1 +)
1/2

1/2
. E assim por diante.

E f acil vericar que no caso de um problema sequencial com T est agios


e capital inicial
0
a solu c ao acima satisfaz
a
0
=
0
/(1 + + +
T1
)
a
1
=
2

0
/(1 + + +
T1
)
146 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
.
.
.
a
T
=
2T

0
/(1 + + +
T1
)
Seria interessante resolver este mesmo problema com fun c oes de util-
idade alternativas. Por exemplo: u(a) = 1 exp(a), a > 0 ou u(a) =
1 1/(1 +a). A gura 6.3 mostra a diferen ca entre estas tres fun c oes de
utilidade.
Figura 6.3: Compara c ao de tres fun c oes de utilidades alternativas: u(a) =
a
1/2
, u(a) = 1 exp(a), a > 0 ou u(a) = 1 1/(1 +a).
Controle Estoc astico
Este exemplo e uma continua c ao do exemplo 6.4, onde desejamos contro-
lar os movimentos de um objeto, a partir de
0
, por T est agios, ate chegar
o mais pr oximo possvel de um alvo. Relembrando, temos a fun c ao de
evolu c ao
G(
t1
, a
t
) =
t1
+a
t
+
t
6.3. PROGRAMAC

AO DIN

AMICA 147
onde
t
N[,
2
] e as fun c oes de custo de controle e de custo terminal
por se distanciar do alvo, dadas, respectivamente, por:
c(a
t
,
t
) = ca
2
t
,
f
0
() = m
2
onde m > 0 e, tambem, uma constante conhecida.

E claro que
t
[
t1
, a
t

N[
t1
+a
t
+,
2
]. Logo teremos
f
1
= min
a
c
T1
+E[f
0
(
T
)[
T1
, a
T
]
= min
a
ca
2
+m( +a + +
2
), pois
E[f
0
(
T
)[
T1
, a
T
] = mE[
2
t
[
t1
, a
t
]
= mvar[
t
[
t1
, a
t
] +E[
t
[
t1
, a
t
]
2
= m[
2
+ [ +
t1
+a
t
]
2
]
Logo teremos a solu c ao:
a
1
= m/(c +m)( +) = m
1
( +)
f
1
() = cm/(c +m)( +)
2
+m
2
= cm
1
( +)
2
+m
2
N ao e dicil obter a express ao de recurrencia geral:
f
n
() = min
a
m
n
( +n)
2
+ (m
0
+m
1
+ +m
n1
)
2

O Profeta
Este exemplo envolve a escolha de um dentre T premios de valor mon-
et ario representado por uma vari avel aleat oria n ao negativa. O espa co
dos estados da natureza pode ser descrito pelos reais positivos. O espa co
das a c oes, em cada um dos T est agios, ser a discreto com dois elementos
148 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
somente, correspondendo a: a
0
- aceitar o premio e a
1
- prosseguir no jo-
go. Estaremos assumindo que as vari aveis aleat orias
t
s ao independentes
e com esperan ca
t
.
Analisaremos, inicialmente, dois casos extremos de tomada de decis ao:
sem inspecionar os premios e inspecionando cada um deles. Obviamente,
o segundo caso s o e disponvel para o Profeta. Assim teremos:
a) ganho esperado - W
m
= max
1
, . . . ,
T

b) ganho esperado - W
p
= E[max
1
, . . . ,
T
]
Desejamos comparar esses ganhos m aximos com uma terceira alter-
nativa que corresponde a uma solu c ao sequencial, em T est agios. Intu-
itivamente teremos W
m
W
s
W
p
, onde m refere-se ao procedimento
em media, p ao profeta e s ao procedimento sequencial. Pode-se vericar
que W
s
e W
p
s ao muito maiores que W
m
e, alem disto, que W
p
2W
s
, ou
seja que um decisor usando o procedimento sequencial pode ganhar pelo
menos a metade do que ganharia o Profeta.

E claro que este e um de-
cisor muito especial pois tem o poder da clarevidencia ou da informa c ao
perfeita. Uma demonstra c ao destes fatos e v arias referencias sobre for-
mas alternativas da desigualdade do Profeta podem ser encontradas em
Bather (2000).
No caso sequencial a utilidade de se parar no t-esimo est agio ser a dada
por u
t
(a
0
) =
s
e a de prosseguir ser a denotada por u
t
(a
1
). No est agio
nal -T - a utilidade esperada ser a obviamente
f
1
(
T
) = E[u
T
(a
0
)] =
T
pois necessariamente o jogo terminar a. No est agio anterior, T 1, ou
aceitamos o premio de
T1
ou esperamos para examinar
T
. Assim
f
2
(
T1
) = E[max
T1
, f
1
(
T
= E[max
T1
,
T
]
6.4.

ARVORE DE DECIS

AO E PROGRAMAC

AO DIN

AMICA 149
Em geral, usando a indu c ao para tr as teremos
f
n
(
Tn
) = E[max
Tn
, f
n1
(
Tn
)] (6.5)
para n = 1, . . . , T 1.
Caso Particular: Suponha que
1
, . . . ,
T
s ao vari aveis aleat orias inde-
pendentes e identicamente distribuidas segundo uma uniforme em (0, 1).

E facil obter neste caso que


W
p
= E[max
1
, . . . ,
T
] =


0
[1 F
T
()]d
onde F
T
() = yI
(0,1)
(y). Assim W
p
=
n
(n+1)
.

E claro que W
m
=
1
2
pois
todos os s tem medias iguais. Vericamos neste exemplo que W
p
W
m
,
com a igualdade valendo somente pra n = 1. Falta somente avaliar a
recorrencia estabelecida acima, equa c ao 6.1, para o caso sequencial.

E
f acil vericar que para vari aveis aleat orias n ao negativas de media nita
E[max, w] = w +


w
[1 F()]d
No caso dos s serem uniformemente distribudos e fazendo W
s,n
corre-
sponder a f
n
(
Tn
), n 1, teremos:
W
s,n
= w
s,n1
+


w
s,n1
(1 )d
=
1
2
[1 +w
2
s,n1
], n 2
Supondo w
s,0
= 1/4 e variando n teremos os ganhos da tabela 6.2.
6.4

Arvore de decis ao e programa c ao din amica
Consideremos um problema de decis ao descrito por uma arvore de decis ao
com um n umero limitado e nito de est agios T. Iremos ver agora como
150 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
n 1 2 4 10 20
W
p
0.5 0.667 0.800 0.909 0.952
W
s,n
0.25 0.531 0.705 0.852 0.917
Tabela 6.2: Compara c ao dos ganhos sequenciais com os do Profeta
resolver este problema de decis ao atraves do algoritmo da programa c ao
din amica.
O espa co das a c oes disponveis no t-esimo est agio ser a denotado por
/
t
= a
(t)
0
, . . . , a
(t)
nt
, onde a
(t)
0
representa a decis ao de terminar ou n ao o
problema de decis ao no est agio t (Parmigiani, Inoue, and Lopes 2003). O
espa co de estados da natureza em cada est agio ser a denotado por
(t)
i
=

(t)
i,1
, ,
(t)
i,k
i
, onde k
i
e o n umero de estados associados a i-esima a c ao
do est agio t, a
(t)
i
. Assim
(t)
=
(t)
1

(t)
nt
.

E claro que ao atingir o
est agio t teremos uma hist oria descrita por:
D
t
= a
(1)
i
1
, , a
(t)
it
,
(1)
i
1
,j
1
, ,
(t)
it,jt
/
(1)
/
(t)
,
(1)

(t)

onde, para cada a c ao a


(t)
i
/
(t)
, ca denida a fun c ao de utilidade es-
perada
u
(t)
(a
(t)
i
) = E[u(
(t)
, a
(t)
)[D
t1
] =
kt

j=1
u
(t)
i,j
p(
(t)
i,j
[D
t1
)
Para completar esta nota c ao devemos denir uma fun c ao que descreva
a din amica dos estados da natureza. Seja
G :
(t1)
/
(t1)

t
isto e,
t
= G(
t1
, a
t1
). Esta fun c ao de evolu c ao dos estados, de na-
tureza Markoviana, induz a distribui c ao de probabilidade sobre
(t)
, que
6.4.

ARVORE DE DECIS

AO E PROGRAMAC

AO DIN

AMICA 151
ser a denotada por p(
(t)
[a
t1
,
t1
). Na pr atica esta distribui c ao condi-
cional ser a especicada por uma fun c ao de probabilidade ou por uma
fun c ao de densidade.
Figura 6.4:

Arvore de decis ao com um n umero nito de est agios.
A programa c ao din amica procede da seguinte forma. Iniciamos resol-
vendo o problema de decis ao do ultimo est agio T. Esta etapa corresponde
a maximixar a utilidade esperada. A seguir, condicionalmente ao est agio
T resolveremos o problema do est agio T 1, novamente maximizando
a utilidade esperada. Este procedimento se repetir a ate alcan carmos o
est agio inicial. Resumindo:
Algoritmo
(1) Inicie em T
(a) Calcule u
T
(a
T
i
) =

kt
j=1
u
T
i,j
(
T
i,j
[D
T1
)
(b) Obtenha a decis ao de Bayes, a
,T
= arg maxu
T
(a
T
i
)
152 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
(2) Repita os seguintes passos
(i) No est agio t
0
calcule a utilidade esperada u
t
(a
t
i
) para i 1, . . . , n
t
,
onde n
t
e o n umero de a c oes em t
u
t
(a
t
i
) =
kt

=1
u
t
i,j
(
t
i,j
[D
t1
), para t = 1, . . . , T 1
u
t
i,j
= maxu
t
(a
t
i
), t = 2, . . . , T 1 (6.6)
(ii) Resolver a otimiza c ao do est agio t, ou seja fa ca sua escolha da
a c ao otima:
a
,t
= arg max
i
u
t
(a
t
i
) +u
(t+1)

(iii) V a para o est agio t-1


Ate que t = 1.
Dentre os v arios exemplos interessantes deste tipo de modelo temos o
problema da secret aria ou do casamento, que podem ser encontrados em
DeGroot (1970), Bernardo and Smith (1994) e Bather (2000).
6.5 Op c oes reais: uma introdu c ao
Esta se c ao trata de um tema cl assico em Economia, a aloca c ao de recur-
sos ou investimentos sob incerteza. Da mesma maneira que as op c oes de
compra no mercado nanceiro, as op c oes reais representam direitos, sem
obriga c ao de adquirir ou trocar um ativo por um pre co especicado. A
possibilidade de se considerar deferimento, abandono e contra c ao de um
investimento tem revolucionado a teoria moderna de aloca c ao de recursos.

E bem conhecido, hoje em dia, que o metodo tradicional do uxo de caixa


descontado n ao permite revisar e adaptar decis oes em respostas a desen-
volvimentos inesperados do mercado. Modernamente, todavia, deseja-se
6.5. OPC

OES REAIS: UMA INTRODUC

AO 153
um metodo capaz de considerar as incertezas futuras e incorporar, di-
namicamente, as informa c oes que chegam ao mercado, recalculando os
uxos de caixa descontados.
Alguns conceitos pr oprios da area de op c oes reais ser ao inicialmente
apresentados, visando caracterizar aspectos essenciais de um investimen-
to. A seguir, apresentaremos um exemplo com o objetivo de mostrar que
o metodo convencional do valor presente lquido, t ao ensinado ainda hoje
nas escolas de business, pode levar a conclus oes duvidosas. Este mesmo
exemplo ser a reanalisado atraves das tecnicas de programa c ao din amica,
produzindo solu c oes muito mais coerentes.
Os conceitos centrais na abordagem de op c oes reais s ao: irreversibili-
dade, incerteza sobre retornos futuros e temporalidade.
Deni c ao 6.1 A propriedade de irreversibilidade caracteriza basicamente
uma classe de investimentos cujo valor inicialmente investido e parcial-
mente ou integralmente perdido.
N ao e recuper avel se voce deseja modicar, no futuro, sua decis ao
presente. Um exemplo seria a aplica c ao numa f abrica cujo produto e
extremamente especco e as m aquinas n ao sendo adapt aveis para outras
nalidades.
Outra caracterstica e que os retornos futuros s ao incertos, de sorte
que s o podem ser descritos probabilisticamente, sem perda de general-
idade, atraves de uma distribui c ao discreta. Por exemplo, o compor-
tamento do mercado futuro para os componentes produzidos por nosso
investimento variar a no futuro em fun c ao de v arios fatores de mercado.
Finalmente, a temporalidade diz respeito a caracterstica de que a decis ao
de investir pode ser postergada ate dispor-se de mais informa c oes sobre o
futuro. Estas caractersticas est ao frequentemente presentes em decis oes
sequenciais sobre investimentos e se encaixam naturalmente na forma de
an alise que desenvolvemos nesse captulo.
154 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
Exemplo 6.5 A ttulo de exemplo imaginemos uma rma que deseja de-
cidir sobre investir ou n ao em uma f abrica de componentes mec anicos.
O investimento e irreversvel, pois os equipamentos s ao especcos para a
produ c ao deste particular tipo de componente. Por exemplo, se o merca-
do para este componente mec anico acabar, ser a impossvel recuperar (ou
desinvestir) os gastos realizados.
A rma tem um custo de instala c ao I, instant aneo e a produ c ao e de
uma unidade por ano, para simplicar. O pre co do componente mec anico
e de 200 u.m., no momento, mas certamente se modicar a no pr oximo
ano. Isto e, com probabilidade crescer a para 300 u.m. ou cair a para
100 u.m. Para manter o exemplo simples admitiremos que o pre co car a
constante no restante do horizonte de decis ao. Alem disto, ser a suposto
ainda que a taxa de juros e de 10% e livre de risco.
Assim, se = 0.5 e I = 1600 u.m., ent ao o valor presente lquido do
investimento ser a:
V PL
1
= 1600 +

t=0
200
(1 + 0.10)
t
= 600
Este c alculo, t ao frequentemente usado para se decidir por realizar ou
n ao certo investimentos, esta incorreto pois ignora o custo de oportu-
nidade de investir agora ao inves de esperar ou ate mesmo n ao investir,
caso o pre co caia, por exemplo. Suponha que aguardamos um perodo e
investimos somente se o pre co subir para 300 u.m. O valor presente neste
caso seria
V PL
2
= 0.5

1600
1.1
+

t=1
300
(1 + 0.10)
t

= 773
pois no ano inicial n ao h a despesas nem receitas e com probabilidade 0.5
teremos retorno zero, pois n ao investiremos se o pre co cair.

E claro que
e prefervel esperar um ano, obter mais informa c ao, e investir somente
se o pre co subir para 300, pois o V PL
1
< V PL
2
. Obviamente:
6.5. OPC

OES REAIS: UMA INTRODUC

AO 155
i) se a unica alternativa disponvel para o tomador de decis ao for investir
ou n ao no instante inicial, a escolha seria realizar o investimento.
ii) se, entretanto, a decis ao for sequencial, isto e: existir a op c ao de
aguardar para decidir se investe ou n ao amanh a, ent ao a escol-
ha ser a exercer a op c ao, dado que estamos assumindo que o pre co
subiu.
Para isto e preciso que o investimento seja irreversvel e sequencial. Note
que nem sempre e possvel adiar a decis ao de investir por quest oes de
concorrencia, patentes que est ao por expirar, etc. A pergunta que se
coloca e: Quanto vale a exibilidade de se poder investir no pr oximo ano
ao inves de agora ou nunca?. No exemplo, o custo de oportunidade ou
valor da op c ao exvel foi de 773600 = 173. Em geral, teremos ainda a
quest ao: Qual o valor do investimento I

, no pr oximo perodo, equivalente


a I? A solu c ao ser a determinar o valor de um investimento exvel com
valor presente lquido igual ao da proposta do agora ou nunca. Logo,
V PL

= 0.05

1.1
+

t=1
200
(1 + 0.10)
t

= V PL
1
de sorte que resolvendo-se em I

teremos
I

= 3300 0.5

1
1.1

1
V PL
1
= 1980
Assim a oportunidade de constuir uma f abrica de componentes mec anicos
hoje e somente hoje ao custo de 1600 u.m. e equivalente a ser ter a op c ao
de faze-lo no pr oximo perodo a um custo de 1980 u.m.
Op c oes Reais: analogia com op c oes nanceiras
Inicialmente vale a pena observar a analogia com uma op c ao do tipo call
no mercado de a c oes. A op c ao real d a o direito de exerce-la ou n ao para
156 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
fazer um investimento (pre co da op c ao) e receber um projeto (uma a c ao)
cujo valor e incerto. No exemplo temos uma op c ao in the money isto
e: se exercida gerar a uma receita positiva. Embora seja in the money e
prefervel, no exemplo, esperar do que exerce-la de imediato. Lembre-se
que V PL
1
= 600 enquanto que V PL
2
= 733.
Assim sendo prop oe-se examinar o problema anterior ` a luz da teoria
de op c oes em nan cas. Sejam F
0
o valor do investimento e F
1
o valor da
op c ao de investimento no futuro.

E claro que F
1
e uma vari avel aleat oria,
pois depende do pre co futuro. Se o pre co crescer para 300 u.m. ent ao F
1
=
1700 e se cair para 100 u.m., ent ao F
1
= 0, pois a op c ao de investimento
n ao ser a exercida.
Construiremos um portf olio livre de risco. Isto e, composto de certo
n umero de componentes mec anicos, tal que o valor futuro seja indepen-
dente da varia c ao dos pre cos no mercado. Seja um portf olio onde compra-
se a descoberto n componentes mec anicos e mantem-se a oportunidade
de investimento. Seu valor hoje ser a:

0
= F
0
n p
0
= F
0
200 n
e no futuro

1
= F
1
n p
1
o qual depender a do pre co subir ou n ao

1
= F
1
n p
1
=

1700 300 n se subir


100 n se cair
Escolhe-se n tal que o portf olio seja livre de risco, isto e:
1700 300n = 100n n = 8.5
O retorno de se manter este portf olio ser a:
1

0
que corresponde ao
custo da posi c ao descoberta (short). Como o portf olio esta descoberto em
6.5. OPC

OES REAIS: UMA INTRODUC

AO 157
8.5 unidades dever a pagar a taxa de risco de 1% sobre o valor monet ario
de cada unidade, isto e: 200 0.1 8.5 = 170 u.m. Assim

0
170 =
1
(F
0
np
0
) 170
= 850 F
0
+ 1700 170
= 680 F
0
Porque e risco livre, ent ao 680 F
0
= 0.1 (F
0
1700) ou seja F
0
= 773.
Programa cao dinamica: aplica cao a op c oes reais
Relembrando, na tecnica de programa c ao din amica uma sequencia de
decis oes e particionada em somente duas: a decis ao imediata e uma fun c ao
de valor que contempla as consequencias de todas as decis oes passadas.
Esta e uma propriedade de natureza Markoviana.
O horizonte de planejamento pode ser nito ou n ao. Se nito (n),
ent ao a decis ao no ultimo est agio ser a obtida de uma otimiza c ao est atica,
pois nada seguir a a ela. Esta otimiza c ao fornecer a a consequencia a ser
utilizada - fun c ao de valor - no pen ultimo est agio. Assim o novo problema
de decis ao considera a decis ao do est agio n 1 e a fun c ao de valor do
est agio n. Pode-se progredir assim ate a condi c ao inicial.
Vamos come car examinando o nosso problema somente em dois perodos.
Lembre-se que
p
1
=

(1 +u) p
0
, cp
(1 d) p
0
, cp 1
caracterizando a fun c ao de evolu c ao dos estados da natureza. Suponha,
tambem, que a taxa de juros e r (0, 1) xo. Teremos de considerar duas
situa c oes:
(i) a oportunidade de investimento ocorre somente no perodo inicial,
portanto do tipo agora ou nunca
158 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
(ii) a oportunidade de investimento permanece disponvel no perodo 1.
Note que agora no instante inicial a rma tem de decidir: a
1
investir
agora e a
2
esperar e decidir mais tarde, investindo ou n ao.
No caso (i) teremos o valor presente esperado
E[V
0
[D
0
] = p
0
+ [ (1 +u)p
0
+ (1 ) (1 d)p
0
]

1
1 +r
+
1
(1 +r)
2
+

pois estamos supondo que a partir do perodo 2 os pre cos ser ao est aveis.
Temos, ent ao, a serie de valores futuros medios descontados para o perodo
inicial. A express ao acima se simplica para
E[V
0
[D
0
] = p
0
[1 +r +(u +d) d]/r
Assim, se E[V
0
[D
0
] I > 0 ent ao realizo o investimento. A quanti-
dade maxE[V
0
[D
0
] I, 0 ser a o lucro, tambem denominado de valor de
termino no tempo 0. No caso (ii) temos de calcular:
V
1
= p
1
+p
1

1
(1 +r)
+
1
(1 +r)
2
+

p
1

1 +r
r
A rma decidir a pelo investimento somente se V
1
> I, produzindo um
ganho lquido de F
1
= maxV
1
I, 0. Vale mencionar que, da otica do
perodo zero, p
1
e uma quantidade aleat oria tanto quanto F
1
e V
1
. Assim
E[F
1
[D
0
] = max(1 +u)p
0

1 +r
r
I, 0
+ (1 ) max(1 d)p
0

1 +r
r
I, 0
Esta quantidade ser a denominada de valor esperado de continua c ao ou
simplesmente valor de continua c ao. Voltando ao perodo inicial teremos:
F
0
= max

E[V
0
[D
0
] I,
1
1 +r
E[F
1
[D
0
]

6.5. OPC

OES REAIS: UMA INTRODUC

AO 159
A decis ao otima da rma ser a aquela que maximizar o valor presente
lquido. Note que o exemplo foi desenvolvido no esprito da programa c ao
din amica. O problema foi decomposto em duas etapas: a escolha imediata
e as decis oes remanescentes. A sequencia de solu c oes otimas e obtida cal-
culando de tr as para frente. A diferen ca entre F
0
e maxE[V
0
[D
0
] I, 0,
o qual corresponde a solu c ao do tipo agora ou nunca, ser a denominado
de valor da op c ao de se postergar a decis ao de investir ou o valor que
retrata este grau de liberdade extra. Como veremos abaixo a estrutura
de solu c ao descrita anteriormente estende-se facilmente para o caso de
m ultiplos perodos.
Analise do problema com m ultiplos perodos
No exemplo que acabamos de abordar tinhamos, por conveniencia, so-
mente dois perodos.

E claro que em situa c oes reais m ultiplos perodos e
tempo contnuo s ao, em geral, a regra. Por ora, entretanto, descreveremos
as incertezas atraves de processos markovianos discretos. Vale mencionar
que os processos de difus ao podem ser vistos como caso limite de passeios
ao acaso em tempo discreto.
Embora a teoria da programa c ao din amica estoc astica seja totalmente
geral insistiremos no exemplo do investimento. Denotemos por , escalar
ou n ao, o estado da natureza que descreve o status corrente da rma, o
qual afeta sua opera c ao e oportunidades de expans ao. Assumiremos que

t
=
t1
+
t
ou seja p(
t
[
t1
). No tempo t a rma dever a realizar uma
decis ao que denotamos por a. No nosso exemplo a e uma quantidade
bin aria caracterizando investir ou n ao investir, mas em muitas aplica c oes
poder a ser uma vari avel contnua, ate mesmo vetorial. Por exemplo, a
poderia ser a dupla escolha do investimento e da contrata c ao m ao de obra
tempor aria. A fun c ao de valor c(
t
, a
t
) e a distribui c ao de probabilidade
p(
t+1
[
t
, a
t
) permitem calcular as parcelas necess arias ` a obten c ao da se-
quencia a
t
n ao se esquecendo do fator de desconto (1 +r)
1
, onde r e
160 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
taxa de juros ou taxa de desconto.
Suponha que o processo termine em T, com um ganho nal que de-
pende do estado alcan cado F(
t
). A aplica c ao da programa c ao din amica
divide o processo em dois est agios: o imediato e a continua c ao completa,
ap os este estado. Seja F
t
(
t
) o valor esperado lquido presente do uxo de
receitas da rma e u(
t
, a
t
) o ganho imediato em t pela escolha da a c ao
a
t
.

E claro que F
t
(
t+1
) e uma vari avel aleat oria dada a informa c ao ate t.
Assim teremos E[F
t+1
(
t
)[D
t
] o denominado valor de continua c ao. Agora
devemos trazer todos os valor para o instante inicial, fazendo:
u(
t
, a
t
) +
1
1 +r
E[F
t+1
(
t
)[D
t
]
A equa c ao de Bellman ou equa c ao fundamental de optimalidade ser a dada
por
F
t
(
t
) = max
at

u(
t
, a
t
) +
1
1 +r
E[F
t+1
(
t+1
)[D
t
]

O primeiro termo ` a direita e o ganho imediato e o segundo o valor de


continua c ao e a

t
e a a c ao que maximiza a soma dos ganhos. No exemplo
que vimos discutindo temos um caso particular da express ao acima pois a
assume somente os valores 1 ou 0 representando, respectivamente, investir
no instante inicial e esperar ate o tempo 1. Se o problema de v arios
perodos tem um horizonte nito T podemos operar de tr as para frente.
Assim, no nal do horizonte, teremos: F
T
(
T
) e
F
T1
(
T1
) = max
at

u(
T1
, a
T1
) +
1
1 +r
E[F
T
(
T1
)[D
t
]

Podemos resolver o problema para T 2 obtendo a

T2
e o valor de con-
tinua c ao F
T2
(a
T2
) e continuar desta forma ate atingir o est agio inicial.
Analise considerando o horizonte innito
Como n ao dispomos da fun c ao de valor num ponto nal do horizonte de
planejamento, n ao podemos implementar a indu c ao de tr as para a frente.
6.5. OPC

OES REAIS: UMA INTRODUC

AO 161
Se as fun c oes de valor e as probabilidades de transi c ao forem invariantes
no tempo e, alem disto se r for xo ao longo do tempo poderemos chegar
a uma grande simplica c ao. Estas condi c oes s ao satisfeitas em muitas
aplica c oes econ omicas e tornam o problema vi avel. A equa c ao de Bellman
pode ser reescrita, para todo t, como:
F() = max
a

u(, a) +
1
1 +r
E[F(

)[, a]

onde e

s ao dois pontos no espa co dos estados da natureza e a e


uma a c ao em /. Esta e denominada de equa c ao de Bellman para a
programa c ao din amica recursiva ou com horizonte innito.
Necessitamos, em cada aplica c ao, garantir a existencia da solu c ao e
assegurar um meio de encontr a-la, o que, em geral, n ao e muito difcil.
Esta equa c ao e n ao linear e a escolha otima de a depende de todos
os valores de F() ponderados pelas probabilidades envolvidas no c alculo
da esperan ca. Em geral, n ao sabemos se um funcional n ao linear tem
solu c ao e muito menos se e unica. Felizmente a equa c ao recursiva de
Bellman tem uma estrutura especial que permite provar a existencia e
unicidade de F() sob condi c oes tpicas das aplica c oes econ omicas. Um
esbo co de demonstra c ao pode ser visto em Dixit and Pindyck (1994),
onde outras referencias te oricas s ao mencionadas.
Decorre, desta discus ao mais tecnica, um procedimento iterativo para
determina c ao de F(). Inicie em F
1
(), aplique no lado direito da equa c ao
acima e obtenha a
1
. Sustituindo este valor na equa c ao, obtemos F
2
().
Repetimos o processo ate convergencia para o verdadeiro valor de F().
Este resultado ca garantido pela presen ca do fator
1
1+r
no lado direito da
express ao. Este fator e menor do que um e contrai os erro envolvidos nes-
sas itera c oes. A convergencia pode, eventualmente, ser lenta, sobretudo
quando r e pequeno.
O leitor interessado pode encontrar v arios exemplos de aplica c ao deste
metodo no contexto econ omico no livro de Dixit and Pindyck (1994).
162 CAP

ITULO 6. PROGRAMAC

AO DIN

AMICA
Em muitas dessas aplica c oes, o tempo e contnuo e as incertezas sobre o
espa co dos estados da natureza evoluem segundo um processo de Wierner
ou, mais geralmente, segundo um processo de difus ao.
Captulo 7
MUE via metodos Monte
Carlo
Relembrando os captulos anteriores, o problema de maximiza c ao da util-
idade esperada e o problema central da teoria da utilidade. Do ponto de
vista inferencial, o problema Bayesiano e simples e pode ser genericamente
visto como a busca da decis ao otima,

d, tal que

d = arg max
dD
U(d) (7.1)
para
U(d) =

u(d, , y)p
d
(y,
d
)d
d
dy (7.2)
onde p
d
(y,
d
) = p
d
(y[
d
)p
d
(
d
) e p
d
(y[
d
) e p
d
(
d
) representam, respecti-
vamente, o modelo e a distribui c ao mais recente de
d
quando a decis ao
for d.
Por exemplo, quando o interesse est a em estimar pontualmente o pa-
r ametro e a fun c ao de utilidade e u(d, , y) = (d)
2
, a decis ao otima,

d, se iguala ` a esperan ca de com respeito a p


d
([y) (ver, por exemplo,
DeGroot 1970). Entretanto, somente em problemas triviais e de pouco
163
164 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


interesse pr atico e possvel se obter analiticamente para a integral em
(7.2) e/ou para o problema de maximiza c ao em (7.1).
Nesse captulo apresentaremos estrategias para a solu c ao do prob-
lema de decis ao baseadas em metodos Monte Carlo. Come camos, na
se c ao 7.1, com a aplica c ao de integra c ao de Monte Carlo para resolver
a integral em (7.2). Na se c ao 7.2 introduziremos a ideia de se ajus-
tar uma curva a um conjunto nito de pares decis ao-utilidade. Essa
ideia baseia-se na continuidade da fun c ao de utilidade para pequenas
varia c oes de d. Essa ideia foi introduzida por M uller and Parmigiani
(1995). Entretanto, quando o espa co das decis oes e de dimens ao relativa-
mente grande esse metodo torna-se computacionalmente ineciente, uma
vez que v arios pontos d D dever ao ser selecionados. Clyde, M uller, and
Parmigiani (1995) e Bielza, M uller, and Rios-Insua (1999) propuseram
um metodo para resolver o problema de otimiza c ao que reescreve (7.2)
como um problema de simula c ao, atraves de metodos Monte Carlo via
cadeias de Markov (MCMC), onde o modelo probabilstico e aumentado
para h(d, , y) = u(d, , y)p
d
(y,
d
), ou seja, incorporando a decis ao, d,
no modelo. Esse metodo e apresentado na se c ao 7.3, bem como alguns
de seus problemas implementacionais. Dois exemplos reais, e suas re-
ferencias, ser ao apresentados na se c ao 7.4 juntamente com um exemplo
did atico, onde o problema de decis ao pode ser resolvido analiticamente.
Os metodos apresentados nesse captulo foram essencialmente extrados
de M uller (1999), que faz uma revis ao extensa dos metodos Monte Carlo
aplicados a problemas de planejamento Bayesiano otimo, alem de apre-
sentar v arias referencias com apli c oes diversas.
7.1 Aproximando U(d) via Monte Carlo
Dado d, p
d
(y,
d
) e em geral de f acil simula c ao, possivelmente em dois
passos:
7.1. APROXIMANDO U(D) VIA MONTE CARLO 165
Simulando da priori:
d
p
d
(
d
)
Simulando do modelo:y p
d
(y[
d
)
Dessa forma, para cada d, U(d) pode ser aproximada por

U(d) =
1
M
M

i=1
u(d,
(i)
d
, y
(i)
) (7.3)
onde os pares (
(i)
d
, y
(i)
), para i = 1, . . . , M s ao gerados a partir do proced-
imento em dois passos mencionado acima. Esse procedimento representa
simplesmente a solu c ao de uma integral pelo simples metodo de Monte
Carlo (veja, por exemplo, Geweke (1989)).
Claramente, se no instante da tomada de decis ao x p(x[
d
) e obser-
vado, a express ao em (7.2) e facilmente reescrita por:
U(d) =

u(d, , y)p
d
(y[
d
)p(
d
[x)d
d
dy (7.4)
assumindo que p(y[
d
, x) = p(y[
d
). Dessa forma, o primeiro passo do al-
goritmo apresentado acima seria amostrar
d
de p(
d
[x). Esse passo geral-
mente envolve simula c ao de
d
atraves de metodos MCMC, dependendo
da complexidade de p(
d
[x). Esse tipo de situa c ao e bastante comum, por
exemplo em estudos medicos onde decis oes devem ser tomadas com base
na informa c ao obtida atraves de observa c oes (estudos, pacientes, etc) pre-
existentes. Uma outra situa c ao comumente encontrada por investidores e
a aloca c ao de recursos em uma carteira de a c oes, moedas, taxas de juros,
etc. O investidor inteligente basear a sua aloca c ao em modelos proba-
bilsticos que levem em considera c ao todas as observa c oes dos mercados
(de a c oes, juros, c ambio, etc.), ate o instante da tomada da decis ao (ver
Aguilar and West (2001) e Lopes and Migon (2002), por exemplo).
166 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


7.2 Ajuste da curva de utilidade
Voltando ao problema em (7.1), uma solu c ao imediata seria obter

U(d)
para todas as possveis decis oes em D, e escolher

d que maximizasse a
utilidade esperada aproximada. Entretanto, esse metodo e ineciente pois
desconsidera completamente a possvel continuidade da fun c ao de utili-
dade, U(d), comumente presente na maioria dos casos. Ao se desconsider-
ar tal dependencia, enormes simula c oes (Monte Carlo simples ou MCMC)
ser ao replicados para valores de d

muito pr oximos de d, segundo alguma


metrica razo avel, ignorando que

U(d) e

U(d

) venham provavelmente a
ter valores muito pr oximos.
M uller and Parmigiani (1995) propuseram um esquema numerico de
busca da decis ao otima que explora a continuidade da fun c ao utilidade.
O algoritmo pode ser descrito da seguinte maneira:
Selecione d
j
em D, possivelmente numa grade
Simule (
j
, y
j
) p
d
j
(, y) e calcule u
j
u(d
j
,
j
, y
j
)
Ajuste uma curva aos pontos (d
j
, u
j
)
Encontre, deterministicamente, o m aximo da curva ajustada
A integral em (7.2) pode ser aproximada por um ajuste de curva dos pares
d
j
(eixo das abscissas) e u
j
(eixo das ordenadas). Consequentemente, a
decis ao otima pode ser obtida como o m aximo da curva ajustada. Eles
mostram que sob suposi c oes especcas no espa co das decis oes, na fun c ao
de utilidade e na escolha do metodo de suaviza c ao de curva, a decis ao
otima obtida por esse procedimento e um estimador consistente de

d.
Apesar desse metodo ter um apelo bastante intuitivo, a continuidade
da fun c ao de utilidade, sua implementa c ao tambem sofre de um grande
problema; a medida que o espa cdas decis oes aumenta de dimens ao -
ca mais difcil selecionar d
j
de forma a tornar a aproxima c ao da cur-
va de ajuste minimamente con avel. Na pr oxima se c ao introduziremos
7.3. SIMULANDO O MODELO AUMENTADO 167
o metodo proposto por Clyde, M uller, and Parmigiani (1995) e Bielza,
M uller, and Rios-Insua (1999).
7.3 Simulando o modelo aumentado
Clyde, M uller, and Parmigiani (1995) e Bielza, M uller, and Rios-Insua
(1999) propuseram um metodo aproximado que incorpora o espa co das
decis oes aos espa cos dos par ametros e dos observ aveis e utiliza metodos
Monte Carlo via cadeias de Markov. Esse metodo aproxima a decis ao
otima atraves da moda da distribui c ao marginal de d. Mais especica-
mente, dene-se uma distribui c ao articial
h(d, , y) u(d, , y)p()p
d
(y[) (7.5)
no espa co produto D \, assumindo-se que D e limitado, u e uma
fun c ao n ao-negativa, tambem limitada. Nesse contexto, h(d) ser a exata-
mente U(d), portanto a decis ao otima ser a a moda de h(d). O algoritmo
abaixo descreve um dos possveis esquemas MCMC para amostrar de h,
Algoritmo 1: Cadeias Independentes para d
1. Valor inicial para a decis ao: d
0
2. Simule (, y) a partir de p
d
0 (, y) e compute u
0
= u(d
0
, , y).
3. Valor proposto para a decis ao: gera-se

d a partir da proposta g(

d[d
0
)
4. Simule (

, y) a partir de p

d
(, y) e compute u = u(

d,

, y).
5. Calcule a probabilidade de aceita c ao como sendo = min1, A,
onde
A =
h(

d,

, y)
h(d
0
, , y)
g(d
0
[

d)
g(

d[d
0
)
p
d
0 (, y)
p

d
(

, y)
=
u
u
0
g(d
0
[

d)
g(

d[d
0
)
(7.6)
168 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


6. Fa ca
(d
1
, u
1
) =

d, u) com prob.
(d
0
, u
0
) com prob. 1
7. Repita os passos 3 a 6 ate convergencia da cadeia.
Esse esquema, caso particular dos esquemas apresentados por Tier-
ney (1994), se benecia de todos os resultados a respeito de simula c ao
de cadeias de Markov que tem h como distribui c ao limite (de equilbrio,
posteriori, etc). Portanto, toda a parafern alia dos metodos MCMC po-
dem ser utilizadas para se alcan car o obtjetivo maior, ou seja encontrar
o m aximo de h(d) = U(d). Por exemplo, se o espa co das decis oes for
multidimensional com d = (d
1
, . . . , d
p
) e se h(d
j
[d
1
, . . . , d
j1
, d
j+1
, . . . , d
p
)
for de f acil simula c ao, ent ao teremos um algoritmo similar ao amostrador
de Gibbs que amostra individualmente as p componentes do vetor de de-
cis oes. Caso essas condicionais completas n ao sejam de f acil amostragem,
ent ao cadeias de Markov com passeio aleat orio poderiam ser utilizadas.
Na pr oxima se c ao veremos que nem sempre e possvel se encontrar de
forma pr atica e eciente o m aximo de h(d) baseando-se numa amostra dos
pares (d, u). Para tanto, o algoritmo 1 ser a modicado para deformar a
fun c ao de utilidade de tal forma que seu m aximo que mais evidente. Isso
ser a feito atraves do famoso metodo simulated annealing que resolvemos
traduzir aqui por tempera simulada.
7.3.1 Tempera simulada em problemas de decisao
Apesar de colocado em segundo plano, o problema da obten c ao da mo-
da de h pode ser t ao ou mais complicado do que o procedimento de
amostragem a partir de h. Em muitos casos, como veremos na se c ao
de exemplos, a fun c ao de utilidade esperada n ao possui um m aximo que
possa ser facilmente encontrado pelos metodos tradicionais. A inspe c ao
visual, de histogramas, torna-se impratic avel quando p, a dimens ao do
7.3. SIMULANDO O MODELO AUMENTADO 169
vetor de decis oes, e maior que dois. Em geral, a fun c ao de utilidade e vir-
tualmente a mesma para um conjunto grande de decis oes; decis oes essas
que n ao necessariamente s ao similares. Portanto, e necess ario se pensar
em formas mais ecazes de encontrar o m aximo de uma fun c ao com essas
caractersticas e que est a representada apenas por um conjunto nito,
mas grande, de pares (d, u).
M uller (1999) sugere substituir U(d) por uma transforma c ao do tipo
potencia, U
J
(d), uma vez que para J sucientemente grande a fun c ao se
concentrar a ao redor do m aximo de U(d). Esse efeito pode ser alcan cado
atraves da seguinte modica c ao em h(d, , y)
h
j
(d,
1
, y
1
, . . . ,
J
, y
J
)
J

j=1
u(d,
j
, y
j
)p
d
(
j
, y
j
) (7.7)
de tal sorte que h
J
(d) U
J
(d), como desejado. Com essa modica c ao
para evidenciar as modas em utilidades muito planas, o algoritmo 1 pode
ser reescrito da seguinte forma.
Algoritmo 2: Simulando de U
J
(d)
1. Valor inicial para a decis ao: d
0
2. Simule (
j
, y
j
) a partir de p
d
0 (, y) e compute u
0
=

J
j=1
u(d
0
,
j
, y
j
).
3. Valor proposto para a decis ao: gera-se

d a partir da proposta g(

d[d
0
)
4. Simule (

j
, y
j
) a partir de p

d
(, y) e compute u =

J
j=1
u(

d,

j
, y
j
).
5. Calcule a probabilidade de aceita c ao como sendo = min1, A,
onde
A =
h(

d,

, y)
h(d
0
, , y)
g(d
0
[

d)
g(

d[d
0
)
p
d
0 (, y)
p

d
(

, y)
=
u
u
0
g(d
0
[

d)
g(

d[d
0
)
(7.8)
170 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


6. Fa ca
(d
1
, u
1
) =

d, u) com prob.
(d
0
, u
0
) com prob. 1
7. Repita os passos 3 a 6 ate convergencia da cadeia.
A escolha de J deve ser feita caso a caso, sendo que valores em torno
de 10 ou 20 tem sido utilizados amplamente. Na pr oxima se c ao apre-
sentaremos algumas situa c oes reais em que a aplica c ao dessas tecnicas
aproximadas possibilitou a solu c ao do problema de decis ao latente.
7.4 Exemplos
Nessa se c ao ilustraremos os metodos citados acima com problemas de de-
cis ao encontrados em M uller and Parmigiani (1995), Clyde, M uller, and
Parmigiani (1993), M uller (1999). Aplica c oes interessantes e recentes
podem ser encontradas em Parmigiani, Berry, Iversen Jr., M uller, Schild-
kraut, and Winer (1997), Sans o and M uller (1997), Rios-Insua, Slewicz,
M uller, and Bielza (1996), Bielza, M uller, and Rios-Insua (1999), Parmi-
giani and M uller (1994),Stroud, M uller, and Rosner (1999),M uller and
Palmer (1997), entre outros.
Sans o and M uller (1997) consideram o problema de como reduzir de
80 para 40 o n umero de esta c oes de monitora c ao de chuva no estado de
Guarico na Venezuela. Em seu problema o objetivo e minimizar os cus-
tos e ainda ter um m inimo de controle sobre a quantidade de chuva nas
diversas regi oes do estado. Parmigiani, Berry, Iversen Jr., M uller, Schild-
kraut, and Winer (1997) estudam a propens ao gen atica do c ancer de ma-
ma onde um dos problemas mais importantes e a predi c ao da propens ao
genetica baseando-se na hist oria familiar do paciente e fatores de risco.
J a Stroud, M uller, and Rosner (1999) consideram o problema da escolha
do instantes de tempo para aplica c ao de um certo medicamento contra
7.4. EXEMPLOS 171
um certo tipo de c ancer baseando-se em modelos que descrevem o com-
portamento farmacocinetico e farmacodin amico da droga. Similarmente,
M uller and Palmer (1997) estudam a escolha dos intantes de tempo para
coleta de sangue (celulas tronco) em pacientes com c ancer. A fun c ao ob-
jetivo e a maximiza c ao do n umero de celulas tronco num menor n umero
possvel de coletas.
Iniciaremos com um exemplo onde a solu c ao exata e facilmente obtida.
7.4.1 Tamanho amostral da Normal
Suponhamos que x
1
, . . . , x
n
formem uma amostra da N(,
2
), para
desconhecido e
2
desconhecido, e que o problema de decis ao seja obter
o tamanho amostral otimo para se estimar . Adicionalmente supon-
hamos que N(,
2
), para e conhecidos. Finalmente, a fun c ao
de utilidade da decis ao nal tem a forma quadr atica, u(n, a, , y) =
( a)
2
+ C(n), para C(n) = cn e c conhecido. Esse problema pode
ser resolvido analiticamente. Sabemos que, para n conhecido, E([x) e o
estimador otimo de sob a fun c ao de utilidade especicada. Assim,
U(n) =

2
/n

2
/n +
2
+

2

2
/n +
2
x
de forma que o tamanho amostral otimo e igual a
n

= /

c
2
/
2
Para valores de , , e c iguais a 1.0, 0.0, 1.0 e 0.01, respectivamente,
o tamanho amostral otimo e igual a 9 observa c oes. Isso est a ilustrado
na Figura 7.1(a). A gura 7.1(b) ilustra a utiliza c ao do algoritmo Monte
Carlo (se c ao 7.1), com M=10.000 amostras para n = 1, . . . , 20. A perfor-
mance do metodo proposto por M uller and Parmigiani (1995) (se c ao 7.2) e
apresentada nas guras 7.1(c,d). Nesse caso foram utilizados M = 10000
172 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


Figura 7.1: (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integra c ao Monte Carlo (M=10.000), (c) 10.000 pares (n
i
, u
i
) e (d)
Curva ajustada (loess no S-plus). Valores xados: (, , , c) =
(1.0, 0.0, 1.0, 0.01).
pares (n, u) para o ajuste de curva, que foi feito utilizando a fun c ao loess
do S-plus. Essa aproxima c ao sugere n

= 8 observa c oes.
A gura 7.2 apresenta resultados an alogos para a situa c ao em que
= = 3.0. Note que, contr ario ` a primeira situa c ao, aqui a valor aprox-
imado para n

e superior ao verdadeiro, n

= 29. Esse exemplo ilustra as


potencialidades das tecnicas apresentadas nesse cap

itulo bem como suas


limita c oes, mesmo em problemas relativamente simples e unidimension-
ais.
Finalmente, a gura 7.3 mostra o resultado do algoritmo 2 (se c ao
7.4. EXEMPLOS 173
Figura 7.2: (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integra c ao Monte Carlo (M=10.000), (c) 10.000 pares (n
i
, u
i
) e (d)
Curva ajustada (loess no S-plus). Valores xados: (, , , c) =
(3.0, 0.0, 3.0, 0.01).
7.3.1) para J = 20. A aproxima c ao n ao e t ao boa quando aquelas encon-
tradas aplicando-se os outros metodos. Entretanto, em situa c oes mais
complexas esse metodo certamente ser a a unica alternativa pr atica de
uso.
7.4.2 Tamanho amostral da Binomial
M uller and Parmigiani (1995) ilustram o metodo apresentado na se c ao
7.2 no problema da escolha do tamanho amostral em um experimento
174 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


Figura 7.3: U
J
(n) para J = 20 e M = 10.000 simula c oes.
binomial. Mais especicamente, o problema e a escolha de n tal que
y[ Binomial(n, ), onde a informa c ao a priori a respeito de e tal que
0.5Beta(3, 1) +0.5Beta(3, 3), o que poderia representar uma mistura
de opini oes de especialistas. Se a decis ao terminal e a estima c ao de
utilizando uma fun c ao de perda absoluta, isto e, U(r(y), ) = [r(y) [.
Sabe-se que a mediana a posteriori, m
y
, e a regra de Bayes que maximiza a
utilidade esperada da decis ao terminal. Dessa forma, deseja-se encontrar
n que maximize:
U(n) =

1
0
n

y=0
[[m
y
[ 0.0008n]C
n
y

y
(1 )
(
n y)p()d (7.9)
7.4. EXEMPLOS 175
onde 0.0008 e o custo xo de cada observa c ao adicional. Eles escolhem
N = 200 pontos n
i
numa grande uniforme no intervalo (0, 120). Aos 200
pares (n
i
, u
i
), eles ajustam uma curva de regress ao n ao-linear da forma:

U(n) = 0.0008n 0.2023(1 +bn)


a
de sorte que o tamanho amostral otimo pode ser diretamente calculado
como
n

=
1

0.2023 a

b
0.0008

1
a+1
1

que vale n

= 29. Eles ainda exploram o formato da fun c ao de utilidade e


percebem que ela pode ser parcialmente integrada analiticamente quando
reescrita da seguinte forma
U(n) =
n

y=0

1
0
[[m
y
[ 0.0008n]p([y)dm(y) (7.10)
Nessa nova vers ao, para cada n
i
calcula-se a integral internal ana-
liticamente, u
i
. Ap os esses novos c alculos, n

= 34 foi o valor otimo


encontrado. A gura 7.4 foi extrada de M uller and Parmigiani (1995)
e sumariza a discuss ao acima. Para valores de n no intervalo (20, 40)
eles tambem calculam o valor verdadeiro de U(d), obtido por integra c ao
Monte Carlo (se c ao 7.1), o que mostra que os metodos aproximados s ao
relativamente ecientes em encontrar o tamanho amostral otimo. Note
tambem que a variabilidade dos pontos (n
i
, u
i
) e bem menor que a dos
pontos (n
i
, u
i
), devido exclusivamente ao fato de integrar-se analitica-
mente parte da express ao 7.10
7.4.3 Debrila cao do cora cao
Em Clyde, M uller, and Parmigiani (1993) (CMP) o problema de decis ao
e a escolha da potencia de um debrilador para o cora c ao em pacientes
176 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


Figura 7.4: As linhas na e grossa representam, respectivamente, os val-
ores aproximado e verdadeiro de U(n) (M uller and Parmigiani, 1995).
com problemas cardacos. Esses aparelhos diminuem a mortalidade de-
vida ` a ataques cardacos. Para pacientes com brila c ao, o debrilador
descarrega um pulso especco de energia de forma a fazer o cora c ao do
paciente retomar seu batimento normal.
Em geral, o medico brila o cora c ao do paciente v arias vezes (tipica-
mente de 3 a 12 vezes) com potencias diferentes, x
i
para encontrar aquela
necess aria para debrila c ao. Infelizmente, cada um desses testes aumenta
o risco de serios problemas cardacos, o que torna a escolha do n umero
de testes e seus respectivos nveis de energia uma quest ao de extrema
import ancia.
Uma das estrategias e implantar o aparelho a um nvel de energia que
o fa ca debrilar 95% das vezes que o cora c ao do paciente apresente falha
(ED95). Em CMP, para cada x
i
(nvel de energia), o experimentador
observa uma resposta bin aria, y
i
, onde y
i
= 1 indica que o aparelho
funcionou corretamente e y
i
= 0 indica que debrila c ao n ao ocorreu, ou
7.4. EXEMPLOS 177
seja, o nvel de energia x
i
n ao interrompeu brila c ao. Dessa forma,
p(y
i
= 1[, x
i
) = [1 + exp(x
i
) log(0.95/0.05)]
1
para = (, ) e = (log(), log()). O interesse maior est a em estimar
(ou log()). Eles utilizam a seguinte fun c ao de utilidade
u(, y, D) = log() E[log()[y, D]
2
cn(D)
onde D e planejamento dos teste (mais detalhes abaixo), E[log()[y, D] e
a media a posteriori de log(ED95) e cn e o custo de cada um dos n testes
associados a x. Da a utilidade esperada ser a
U(D) =

V ar(log()[y, D)p(y[D)dy c

n(D, y)p(y[, D)p()ddy


e maximiza c ao de U e complicada, segundo eles, por basicamente dois
motivos: (i) n ao existe forma fechada para V ar(log()) e (ii) a integral
acima n ao pode ser obtida analiticamente. CMP desenvolvem um esque-
ma sequencial para que os testes sejam interrompidos t ao logo ED95 seja
acuradamente estimado. O planejamento, D, e o seguinte:
(i) Comeca-se com uma dose d
0
= x
1
;
(ii) Induz-se brila c ao e observa-se y
1
(iii) Se y
1
= 0 (n ao ocorre debrila c ao) um choque reativador e dado e
a pr oxima dose e aumentada para x
2
= x
1
(1 +a);
(iv) Se y
1
= 1 (debrila c ao bem sucedida) a pr oxima dose e diminuda
para x
2
= x
1
(1 a);
(v) Repete-se (ii) a (iv) ate o mnimo entre r = 3 revers oes (y
i
+1 = 1y
i
)
e s = 10 testes.
178 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


O problema de decis ao aqui e a escolha do par (d
0
, a). O par (r, s)
tambem poderiam ser includos no planejamento, mas isso n ao foi feito
por CMP. CMP utilizam o algoritmo 1 proposto por M uller and Parmi-
giani (1995) para obter D

que maximiza U(D) atraves de um ajuste


n ao-parametrico de curva aos pares (D
i
, u
i
) (se c ao 7.2). A decis ao otima,
para c = 0, e d
0
= 9.77 joules, a = 0.23 e tamanho amostral esperado
de 8.6 observa c oes. O planejamento que minimiza o tamanho amostral e
d
0
= 7.33 e a = 0.58, cujo tamanho amostral medio e de 7.55 observa c oes.
A gura 7.5 mostra U(d) quando c = 0.02. Nesse caso, o planejamento
otimo e d
0
= 9.25 e a = 0.30, cujo tamanho amostral medio e de 8.3
obsrva c oes.
7.4. EXEMPLOS 179
Figura 7.5: U(D) para c = 0.02. O planejamento otimo foi d
0
= 9.25 e
a = 0.30, que est ao marcados com um tri angulo no gr aco (Clyde, M uller
and Parmigiani, 1993).
180 CAP

ITULO 7. MUE VIA M

ETODOS MONTE CARLO


Referencias
Aguilar, O. and M. West (2001). Bayesian dynamic factor models
and variance matrix discounting for portfolio allocation. Journal
of Business and Economic Statistics 18, 338357.
Allais, M. (1953). Le comportement de lhomme rationnel devant le
risque: critique des postulats et axiomes de lecole americaine.
Econometrica 21, 503546.
Bather, J. (2000). Decision Theory-an introduction to dynamic pro-
gramming and sequential decisions. John Wiley, New York.
Bellman, R. (1957). Dynamic Programming. Princeton University
Press.
Berger, J. (1985). Statistical Decision Theory and Bayesian Analysis.
Springer-Verlag.
Bernardo, J. and A. Smith (1994). Bayesian Theory. John Wiley, New
York.
Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis. Com-
mentarii academiae scientiarum imperialis Petropolitanae 5, 175
192.
Bielza, C., P. M uller, and D. Rios-Insua (1999). Decision analysis by
augmented probability simulation. Management Science 45, 995
1007.
181
182 REFER

ENCIAS
Brier, G. (1950). Verication of forecasts expressed in terms of proba-
bility. Monthly Weather Review 78, 13.
Bunn, D. W. (1984). Applied Decision Analysis. McGraw-Hill.
Clemen, R. (1996). Making Hard Decisions: An Introduction to Deci-
sion Analysis. International Thomson Publishing.
Clyde, M., P. M uller, and G. Parmigiani (1993). Optimal design for
heart debrillators. Discussion paper 93-27, Institute of Statistic
and Decision Science.
Clyde, M., P. M uller, and G. Parmigiani (1995). Exploring expected
utility surfaces by markov chains. Discussion paper 95-39, Institute
of Statistic and Decision Science.
de Finetti, B. (1937). Foresight: Its logical laws, its subjective sources.
Wiley.
de Finetti, B. (1974). The Theory of Probability (2 volumes). New York:
John Wiley.
DeGroot, M. H. (1970). Optimal Statistical Decisions. Mc Graw-Hill.
Dixit, A. and R. Pindyck (1994). Investment under uncertainty. Prince-
ton University Press, Princeton, New Jersey.
Ferguson, T. (1967). Mathematical statistics: a decision theoretic ap-
proach. Academic Press, New York.
Fishburn, P. C. (1981). Subjective expected utility: A review of nor-
mative theories. Theory and Decision 13, 139199.
Fishburn, P. C. (1982). The Foundations of Expected Utility. Dordrecht:
Reidel.
French, S. (1989). Readings in Decision Analysis. Chapman Hall.
French, S. and D. Rios-Insua (2000). Statistical Decision Theory. Ed-
ward Arnold: London.
REFER

ENCIAS 183
Geweke, J. (1989). Bayesian inference in econometric models using
Monte Carlo integration. Econometrica 57, 13171340.
Golub, J. (1997). Decision Analysis - an integrated approach. John
Wiley, New York.
Good, I. J. (1952). Rational decisions. Journal of the Royal Statistical
Society, Series B, Methodological 14, 107114.
Jensen, N. E. (1967). An introduction to Bernoullian utility theory: I
Utility functions. Swedish Journal of Economics 69, 163183.
Kahneman, D. and A. Tversky (1979). Prospect theory: An analysis
of decision under risk. Econometrica 47, 263291.
Kreps, D. M. (1988). Notes on the theory of choice. Boulder: Westview
Press.
Kyburg, H. and H. Smokler (1980). Studies in Subjective probability
(Second Edition). Krieger, Garden City.
Levy, H. (1998). Stochastic Dominance. Kluwer Academic Publishers,
Norwell, MA.
Lindgren, B. (1971). Elements of Decision Theory. Macmillan, London.
Lindley, D. (1961). Dynamic programming and decision. Applied Sta-
tistics 10, 3951.
Lindley, D. (1971). Making Decisions. John Wiley, Chichester.
Lindley, D. V. (1982). Scoring rules and the inevitability of probability
(with discussion). International Statistical Review 50, 126.
Lopes, H. (2000). Bayesian Analysis in Latent Factor and Longitudinal
Models. Ph. D. thesis, Duke University.
Lopes, H. F., O. Aguilar, and M. West (2000). Time-varying covariance
structures in currency markets. In Proceedings of the XXII Brazilian
Meeting of Econometrics.
184 REFER

ENCIAS
Lopes, H. F. and H. S. Migon (2002). Comovements and contagion
in emergent markets: Stock indexes volatilities. In C. Gatsonis,
R. Kass, A. Carriquiry, A. Gelman, Verdinelli, D. Pauler, and
D. Higdon (Eds.), Case Studies in Bayesian Statistics, Volume 6,
pp. 287302.
Luce, R. D. and H. Raia (1957). Games and Decision. John Wiley
and Sons, New York.
Mas-Colell, A., M. Whinston, and J. Green (1995). Microeconomic
Theory. Oxford University Press.
Migon, H. (2001). Bayesian analysis of a health insurance model. Re-
lat orio tecnico, PO-COPPE/UFRJ.
M uller, P. (1999). Simulation-based optimal design. In J. Bernardo,
J. Berger, A. Dawid, and A. Smith (Eds.), Bayesian Statistics 6.
M uller, P. and J. Palmer (1997). Optimal design in longitudinal data
models. Discussion paper 97-32, Institute of Statistic and Decision
Science.
M uller, P. and G. Parmigiani (1995). Optimal design via curve tting
of Monte Carlo experiments. Journal of the American Statistical
Association 90, 13221330.
Parmigiani, G., D. Berry, E. Iversen Jr., P. M uller, J. Schildkraut, and
E. Winer (1997). Modeling risk of brest cancer and decisions about
genetic testing. Discussion paper 97-26, Institute of Statistic and
Decision Science.
Parmigiani, G., L. Inoue, and H. F. Lopes (2003). Statistical Decision
Theory. John Wiley, New York.
Parmigiani, G. and P. M uller (1994). Simulation approach to one-stage
and sequential optimal design problems. Discussion paper 94-18,
Institute of Statistic and Decision Science.
REFER

ENCIAS 185
Raia, H. (1996). Decision Analysis Introductory lectures on choices
under uncertainty. Addison Wesley.
Raia, H. and R. Schlaifer (1961). Applied statistical decision theory.
Graduate School of Business Administration, Harvard University.
Rios-Insua, D., K. Slewicz, P. M uller, and C. Bielza (1996). Bayesian
methods in reservoir operations: the zambezi river case. Discussion
paper 96-30, Institute of Statistic and Decision Science.
Sans o, B. and B. M uller (1997). Redesigning a network of rainfall sta-
tions. Discussion paper 97-25, Institute of Statistic and Decision
Science.
Savage, L. (1954). The Foundations of Statistical Inference. New York:
John Wiley.
Savage, L. J. (1971). Elicitation of personal probabilities and expecta-
tions. Journal of the American Statistical Association 66, 783801.
Seidenfeld, T. (1988). Decision theory without independence or with-
out ordering. what is the dierence? Economics and Philoso-
phy 4, 267290.
Shachter, R. (1986). Evaluating inuence diagrams. Operations Re-
search 34, 589604.
Smith, J. (1988). Decision Analysis: A Bayesian Approach. Chapman
and Hall, London.
Spiegelhalter, D., A. Thomas, N. Best, and W. Gilks (1996). BUGS
0.5: Bayesian Inference Using Gibbs Sampling. MRC Biostatistics
Unit, Cambridge.
Stroud, J., P. M uller, and G. Rosner (1999). Simulation-based methods
for optimal sampling times in population PK/PD studies. Discus-
sion paper 99-31, Institute of Statistic and Decision Science.
186 REFER

ENCIAS
Tierney, L. (1994). Markov chain for exploring posterior distributions
(with discussion). Annals of Statistics 22, 17011786.
von Neumann, J. and O. Morgenstern (1944). Theory of Games and
Economic Behavior. New York: Wiley.
von Winterfeldt, D. and W. Edwards (1986). Decision Analysis and
Behavioral Research. Cambridge University Press.
Wald, A. (1949). Statistical Decision Functions. John Wiley, New York.
Whitmore, G. and M. Findlay (1978). Stochastic Dominance. D.C.
Heath, Lexington, Mass.
Winkler, R. L. (1996). Scoring rules and the evaluation of probabilities
(with discussion). Test 5, 160.

Você também pode gostar