Escolar Documentos
Profissional Documentos
Cultura Documentos
Hedibert F. Lopes
Pref
acio
Esta monografia tem origem em notas de aulas ministradas em cursos
do bacharelado de Estatstica e do mestrado de Pesquisa Operacional da
UFRJ. A motivacao para preparar este texto vem de duas fontes alternativas. A primeira, e mais obvia, e a inexistencia de textos cobrindo esta
sorte de conte
udo num nvel adequado. Alem disso, as tentativas de se
escrever sobre esse topico, ca no Brasil, foram sempre muito limitadas,
nao passando, em geral, da descricao dos elementos basicos da teoria
de decisao. A segunda, talvez de maior desafio, decorre da inexistencia
dessa disciplina nas nossas graduacoes de estatstica. Pretendemos que
esta monografia colabore para reverter esta posicao paradoxal.
Nossa proposta neste texto e combinar aspectos teoricos e praticos.
O termo analise de decisoes e um reconhecimento de que a disciplina de
tomada de decisoes vai alem da descricao dos formalismos matematicos,
como por exemplo, a axiomatizacao da teoria de utilidade e os tecnicismos da inferencia estatstica. Alguns aspectos que merecem destaque sao
a abordagem de modelos graficos: diagramas de influencia e a
rvores de
decis
ao e a introducao a` programacao dinamica estocastica. A discussao
de metodos de maximizacao da utilidade esperada atraves de tecnicas de
Monte Carlo e outro aspecto de extrema importancia pratica. Os meritos
deste trabalho, esperamos, estao na forma como o material coletado de
diversas fontes de extremo valor aplicado e teorico esta organizado. Dentre os textos classicos que influiram na organizacao desta monografia,
i
ii
destacamos DeGroot (1970), Lindley (1971), Bunn (1984) e, mais recentemente, Clemen (1996) e French and Rios-Insua (2000).
Como ja mencionamos, o nvel do livro e adequado para alunos de
graduacao em Estatstica, Atuaria e Pesquisa Operacional, que tenham
um mnimo de conhecimentos de Inferencia Estatstica. Sera u
til, tambem,
para alunos de Administracao e Economia, em nvel de pos-graduacao.
Embora pretendamos que este seja um livro texto em analise de decisoes,
nessa versao nao inclumos exerccios selecionados ao final dos captulos.
O material como um todo pode ser aplicado em cursos de um perodo letivo, cerca de 45 horas. Os captulos 1, 2, 3 e 5 sao essenciais para principiantes, pois introduzem nocoes elementares de teoria da decisao, bem como
mecanismos de solucao e avaliacao de problemas de decisao (arvores de decisoes, diagramas de influencia, analise de sensibilidade). Os captulos 4,
6 e 7 introduzem metodologia mais avancada. No captulo 4 introduzemse, resumidamente, os fundamentos que tornam cientificamente coerente
a teoria da decisao vista nos outros cap tulos. Os captulos 6 e 7 tratam,
respectivamente, de problemas de decisoes sequenciais e da aplicacao de
metodos Monte Carlo para a solucao do problema da maximizacao da
utilidade esperada. Portanto, acreditamos que essa monografia possa ser
flexivelmente utilizada para cursos introdutorios (graduacao) bem como
para cursos intermediarios (mestrado).
Varias pessoas colaboraram, de uma forma ou de outra e em varios
estagios, para tornar viavel a elaboracao desse trabalho. Alguns exemplos mencionados neste texto tiveram origem em temas de iniciacoes
cientficas e dissertacoes de mestrado que supervisionamos nos u
ltimos
anos no IM e na COPPE/UFRJ. Destacamos a colaboracao de Alcione
Miranda (doutoranda de Pesquisa Operacional) em aplicacoes do pacote
DPL, alem da elaboracao de varios graficos, juntamente com Andre Luiz
Silva e Lilian Migon. Agradecemos a Giovanni Parmigiani e Lurdes Inoue que, juntamente com o segundo autor (HFL), gentilmente cederam
alguns captulos de seu livro Statistical Decision Theory, com publicacao
iii
prevista para 2003.
Finalmente agradecemos a Associacao Brasileira de Estatstica (ABE)
- pela oportunidade de apresentar este conte
udo no XV Simposio Nacional
de Probabilidade e Estatstica (SINAPE). Certamente muitas omissoes e
varios erros serao detectados pelos eventuais leitores, aos quais pedimos,
desde ja, desculpas. Todas as crticas e comentarios serao seriamente consideradas e contribuirao para tornar mais completa uma proxima edicao
revisada e ampliada deste material.
iv
Sum
ario
1 Introdu
ca
o
1.1 Uma breve nota historica
1.2 Sobrevoando o livro . . .
1.3 Notacao basica . . . . .
1.4 Organizacao do Livro . .
.
.
.
.
3
3
5
16
17
.
.
.
.
.
.
.
.
.
23
24
29
34
36
38
43
46
50
55
3 Modelos Gr
aficos
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . .
3.3 Diagrama de influencia e arvore de decisao . . . . . . . . .
61
61
63
68
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Conceitos B
asicos
2.1 Elementos da analise de decisoes . . . .
2.2 Especificando a funcao de perda . . . .
2.3 Funcao de perda nao negativa . . . . .
2.4 Concavidade do risco de Bayes . . . . .
2.5 Problema de decisao com e A finitos
2.6 Revisitando a regra minimax . . . . . .
2.7 Problema de decisao usando dados . .
2.8 Analise de risco . . . . . . . . . . . . .
2.9 Dominancia estocastica . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
SUMARIO
vi
3.4
Introducao ao DPL . . . . . . . . . . . . . . . . . . . . . . 78
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
89
92
97
98
98
103
105
5 An
alise de Sensibilidade
5.1 Introducao . . . . . . . . . . . . . . . . . . . .
5.2 Identificacao e estrutura . . . . . . . . . . . .
5.3 Exemplo de analise preliminar de sensibilidade
5.4 Conceitos basicos de analise de sensibilidade .
5.5 Sensibilidade da distribuicao a priori . . . . .
5.6 Sensibilidade conjunta: priori e utilidade . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
109
109
110
113
118
122
126
6 Programa
ca
o Din
amica
6.1 Introducao . . . . . . . . . . . . . . . . . .
6.2 Uma classe de problemas de otimizacao . .
6.3 Programacao dinamica . . . . . . . . . . .
6.3.1 Exemplos . . . . . . . . . . . . . .
6.4 Arvore
de decisao e programacao dinamica
6.5 Opcoes reais: uma introducao . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
135
. 135
. 136
. 138
. 144
. 149
. 152
7 MUE via m
etodos Monte Carlo
7.1 Aproximando U (d) via Monte Carlo . . . . . . . . .
7.2 Ajuste da curva de utilidade . . . . . . . . . . . . .
7.3 Simulando o modelo aumentado . . . . . . . . . . .
7.3.1 Tempera simulada em problemas de decisao
7.4 Exemplos . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
163
164
166
167
168
170
SUMARIO
7.4.1
7.4.2
7.4.3
vii
Tamanho amostral da Normal . . . . . . . . . . . . 171
Tamanho amostral da Binomial . . . . . . . . . . . 173
Defibrilacao do coracao . . . . . . . . . . . . . . . . 175
viii
SUMARIO
Lista de Figuras
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
Diagrama de influencia . . . . . . . . . . . . . . . . . . .
Arvore
de decisao inicial . . . . . . . . . . . . . . . . . .
Solucao via arvore de decisao . . . . . . . . . . . . . . .
Valor monetario esperado. a1 - linha cheia; a2 - linha pontilhada; a3 - linha tracejada. . . . . . . . . . . . . . . . .
Decisoes sequenciais: diagrama de influencia . . . . . . .
Decisoes sequenciais: arvore de decisao . . . . . . . . . .
Decisoes sequenciais: solucao . . . . . . . . . . . . . . . .
Diagrama de influencia para informacao imperfeita . . .
.
.
.
7
8
8
.
.
.
.
.
9
11
20
21
21
31
38
39
40
43
45
46
47
51
LISTA DE FIGURAS
2.10 F domina G estocasticamente em primeira ordem. . . . . . 57
2.11 G e um espalhamento de F com preservacao da media. . . 58
3.1
3.10
3.11
3.12
3.13
3.14
3.15
3.16
3.17
4.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
64
66
67
71
71
72
74
74
75
76
77
81
82
83
84
85
88
LISTA DE FIGURAS
5.1
5.2
5.3
5.4
5.5
5.6
5.7
6.1
6.2
6.3
6.4
7.1
7.2
7.3
7.4
xi
. 116
. 117
. 119
. 122
. 130
. 132
. 133
Arvore
de decisao com um n
umero finito de estagios. . . . 151
(a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui )
e (d) Curva ajustada (loess no S-plus). Valores fixados:
(, , , c) = (1.0, 0.0, 1.0, 0.01). . . . . . . . . . . . . . . . 172
(a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui )
e (d) Curva ajustada (loess no S-plus). Valores fixados:
(, , , c) = (3.0, 0.0, 3.0, 0.01). . . . . . . . . . . . . . . . 173
U J (n) para J = 20 e M = 10.000 simulacoes. . . . . . . . . 174
As linhas fina e grossa representam, respectivamente, os
valores aproximado e verdadeiro de U (n) (M
uller and Parmigiani, 1995). . . . . . . . . . . . . . . . . . . . . . . . . . . 176
xii
LISTA DE FIGURAS
7.5
Lista de Tabelas
1.1
1.2
1.3
1.4
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
3.1
.
.
.
.
. 6
. 12
. 15
. 15
26
28
35
35
35
36
41
44
44
49
49
50
54
54
55
LISTA DE TABELAS
3.2
5.1
5.2
5.3
5.4
5.5
5.6
5.7
6.1
6.2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
118
121
125
126
127
128
131
LISTA DE TABELAS
Captulo 1
Introdu
c
ao
1.1
CAPITULO 1. INTRODUC
AO
de Bernoulli, 1738, no famoso paradoxo de St. Petersburg), nos limitaremos a listar e comentar parte da literatura pos-guerra. Os desenvolvimentos em teoria dos jogos estao descritos pelo menos em tres livros
fundamentais: von Neumann and Morgenstern (1944), Wald (1949) e
Savage (1954). von Neumann and Morgenstern (1944) introduzem as
propriedades minimax, o teorema minimax e a extensao dessas ideias a
varias classes de jogos. Por sua vez, Savage (1954) estende a axiomatizacao de von Neumann and Morgenstern para cobrir probabilidades
subjetivas e utilidades. Savage pode ser mencionado como um dos principais mentores da inferencia Bayesiana. Luce and Raiffa (1957) resumem
muito da teoria dos jogos e alguns resultados experimentais.
Nos anos 60 destacamos os livros de Raiffa and Schlaifer (1961) onde
se encontra pela primeira vez a tecnologia simples de se tomar decisoes
concatenadamente. Os resultados de programacao dinamica obtidos por
Bellman (1957) sao relacionados com os procedimentos de maximizacao
da utilidade esperada num artigo historico de Lindley (1961). Surgem,
ainda, nesta decada varios textos de teoria estatstica da decisao. Citamos como exemplos marcantes os livros de Ferguson (1967) e o DeGroot
(1970). No que concerne a analise de decisoes, isto e: aspectos mais aplicados da tomada de decisoes sob incerteza, podemos mencionar os livros
de Raiffa (1996), Lindley (1971) e Lindgren (1971).
Uma retomada na publicacao de textos nesta area e observada nas
u
ltimas duas decadas. Uma das caractersticas dessas novas publicacoes
e incorporar, mais e mais, aspectos praticos incluindo o uso de softwares
especficos (DPL 4.0 (1998) e BUGS Spiegelhalter, Thomas, Best, and
Gilks (1996)). Novidades em termos de diagramas de influencia sao encontradas em Smith (1988) e discussoes sobre decisoes em grupos amplamente discutidos em French (1989). Um classico desta decada, com forte
enfase em aspectos estatsticos da teoria da decisao, e o texto de Berger
(1985). Mais recentemente temos um texto excelente, a nvel introdutorio,
de Clemen (1996). Diversos aspectos operacionais sao exemplificados uti-
1.2
Sobrevoando o livro
Parte 1: Coloca
c
ao do problema e an
alise preliminar
Uma fabrica de componentes de automovel - Pethold - esta enfrentando
uma nova demanda por um de seus produtos. Um dos diretores e quatro
executivos se reunem para considerar formas alternativas de lidar com
este eventual aumento da demanda.
Apos algumas discussoes concluem por duas acoes alternativas (mais
o status quo) capazes de atender a` nova demanda:
a1 - comprar novos equipamentos (NvEqui)
a2 - contratar horas extras (HrExt)
a3 - manter nvel de producao atual (NvAtua)
O Diretor nao admite subcontratar outro fornecedor por questoes estrategicas. Alem disto, para simplificar, nao ha expectativas de variacoes
nos precos. Apos discutirem o que aconteceria sob cada uma das alternativas e decidirem trabalhar com um horizonte de planejamento de um ano,
o pessoal de marketing julgou que a demanda, a se manter a tendencia
atual, poderia subir uns 15% (Alta), mas nao exclui a possibilidade de
uma queda de 5% (Baixa) caso o mercado se torne sofrvel. As chances
CAPITULO 1. INTRODUC
AO
relativas com relacao a esses dois estados sao de 3:2 a favor do crescimento
das vendas, ou seja, a probabilidade de Alta, , e igual a 0.6.
Neste momento solicitaram ao pessoal de contabilidade que levantasse
os custos de cada uma das alternativas. Apos varias idas e vindas, envolvendo os gerentes producao, de pessoal e financeiro, responsaveis pelos
custos de material e equipamentos, de salarios e pelos custos financeiros,
respectivamente, chegaram aos n
umeros da tabela 1.1.
Estados
Acoes
Alta Baixa
NvEqui
220
130
HrExtr
210
150
NvAtua
170
150
Tabela 1.1: Consequencias (custos) em unidades monetarias (u.m.)
Essa tabela contem varios ingredientes que serao discutidos estensivamente nos captulos subsequentes. Por exemplo, NvEqui, HrExtr e
NvAtua pertencem ao espaco das acoes (decisoes), enquanto Alta e Baixa
compoem os estados da natureza. A tabela 1.1 representa a funcao objetivo (custos, perdas, ganhos, utilidades, etc). No captulo 2 esses e outros
elementos basicos da teoria da decisao estatstica serao introduzidos formalmente. Voltando ao problem e dado o grande volume de informacoes
o gerente de producao sugere a utilizacao de um pacote de analise de decisoes para organizar um diagrama de influencia (figura 1.1), introduzir
os dados, obter a arvore de decisao (figura 1.2) e resolver o problema.
O diagrama de influencia apresenta atraves de grafos o problema de
decisao a ser resolvido. Nesse grafo as relacoes entre as incertezas envolvidas (vendas e ganhos) e as acoes disponveis sao representadas por
setas direcionadas. Existe uma relacao biunvuca entre a arvore de decisao e o diagrama de influencia em um problema de decisao, sendo o
CAPITULO 1. INTRODUC
AO
Figura 1.4: Valor monetario esperado. a1 - linha cheia; a2 - linha pontilhada; a3 - linha tracejada.
10
CAPITULO 1. INTRODUC
AO
O mesmo ja nao ocorre com respeito a a1. Diante disto, nao continuaremos considerando a acao a3 . Por outro lado, a acao a1 sera prefervel
a a2 se e somente se 90 + 130 > 60 + 150 ou seja p > 2/3. A solucao
que obtivemos e insensvel a escolha de , desde que se acredite que
seja pelo menos igual a 2/3.
Para finalizar esta primeira parte o diretor intervem alertando que
o problema foi excessivamente simplificado. Os valores monetarios sao
razoaveis (variacao de 5% no maximo), a solucao final nao e sensvel ao
valor de , mas deveriam tentar um horizonte de planejamento maior e
discutir se o EMV e adequado para este tipo de tomada de decisao.
Parte 2: An
alise sequencial com maior horizonte de
planejamento
Ao voltarem do lanche ja encontraram preparados, pelos gerentes financeiro e de marketing, um novo diagrama de influencia e uma nova arvore
de decisao (figuras 1.5 e 1.6, respectivamente). Esta nova configuracao inclui uma analise mais realista feita ao longo de dois anos, utiliza somente
a1 e a2 e particiona as vendas no segundo ano em tres nveis: alta, m
edia
e baixa. Como podemos observar temos duas caixas decisorias, dois nos
aleatorios, denominados vend1 e vend2 e um u
nico no de consequencia
(ver figura 1.5.
Esse diagrama resume os valores monetarios lquidos totais sem levar
em conta o valor do dinheiro no tempo. Destacamos que as decisoes sao
conectadas por arcos, traduzindo a natureza sequencial do problema e que
os nos aleatorios tambem se conectam por arcos, indicando que a segunda
distribuicao de probabilidae e condicional aos resultados observados no
primeiro no.
Finalmente, as consequencias dependem destes quatro elementos. Precisamos portanto acessar 24 consequencias monetarias, as quais estao apresentados na tabela 1.2.
11
CAPITULO 1. INTRODUC
AO
12
Acoes
Alto
a4
410
a5
425
a6
350
a7
345
a8
400
a9
380
a10
280
a11
300.25
Media Baixa
395
380
408
395
300
280
325
310
350
315
320
370
220
400
204
460
13
14
CAPITULO 1. INTRODUC
AO
qualquer outro bem, ela geralmente prefere pagar (perder) R$15,00 do que
correr a remota chance de perder o bem. Portanto, se as consequencias
monetarias sao pequenas proporcionalmente ao capital, entao a adocao do
EMV e razoavel. Caso contrario, e mais prudente (leia-se coerente) lancar
mao de uma funcao de utilidade do dinheiro, a qual considere a forma
conservadora diante do risco, ou qualquer outra maneira de considerar a
aversao ao risco. Esse problema central da teoria da decisao, ou seja a
quantificacao da utilidade do dinheiro (ou da sa
ude, do empreendimento,
etc), e extensivamente abordado no captulo 4.
O diretor levanta um outro ponto relevante: o momento em que sao
feitas as despesas e realizadas as receitas. Isto significa que o dinheiro
preciso usar o valor presente dos retornos
tem valor diferente no tempo. E
lquidos.
Estados ()
Alta
Baixa
15
Avaliacao (x)
Favoravel Desfavoravel
0.9
0.1
0.2
0.8
Mercado ()
Alta
Baixa
p(x)
x1
0.87
0.13
0.62
x2
0.16
0.84
0.38
()
0.6
0.4
O diagrama de influencia e entao refeito incluindo um quadrado referente a alternativa de contratacao do consultor.
O resultado final usando a distribuicao a posteriori, nos ramos mais
a direita da arvore de decisao isomorfa ao diagrama de influencia acima
fornece, por exemplo, os valores esperados: a1 : 208.3, a2 : 202.2 e a3 :
167.4. Assim, a1 e prefervel dado que o consultor e favoravel (x1) e seu
valor esperado e 208.3. Por outro lado se o consultor nao for favoravel
(x2) entao a2 e prefervel e seu valor esperado sera 159.6. Agora temos
essas duas consequencias e devemos usar novamente o valor esperado.
Como p(x1 ) = .62, entao obtemos: 208.3 .62 + 159.6 .38 5 = 184.8.
Este valor compara desfavoravelmente com o obtido anteriormente, 162.
Assim o consultor nao deve ser contratado.
CAPITULO 1. INTRODUC
AO
16
1.3
Nota
ca
o b
asica
Nos proximos 6 captulos varios conceitos novos serao introduzidos, trazendo consigo uma enormidade de notacao matematica necessaria para facilitar a exposicao e o desenvolvimento dos mesmos. Abaixo introduzimos
uma lista abreviada com as principais notacoes. Tambem introduzimos
aqui algumas siglas comumente utilizadas no livro.
A: Espaco das acoes (decisoes). Elementos sao denotados por a.
: Espaco dos estados da natureza. Elementos sao denotados por .
L(, a): Perda associada ao estado da natureza sob a acao a.
U (, a): Funcao de utilidade. Geralmente, L(, a) = U (, a).
(): Distribuicao a priori de .
r(, a): Risco ou perda esperada da acao a. r(, a) =
ab : Acao (decisao) de Bayes. ab = arg mina r(, a).
am : Acao minimax. am = arg mina max L(, a).
X : Espaco amostral. Elementos sao x.
p(x|): Modelo probabilstico
(x): Regra de decisao.
p(x): Distribuicao preditiva.
(|x): Distribuicao a posteriori de dado x.
AD: Arvore
de Decisao.
L(, a)()d.
DO LIVRO
1.4. ORGANIZAC
AO
17
1.4
Organiza
ca
o do Livro
No captulo 2 discutiremos varios aspectos introdutorios da teoria de decisao. Especificaremos a tripla que caracteriza um problema de decisao
e apresentaremosdiversas funcoes de perda para problemas especficos.
Tambem analisamos a concavidade do risco de Bayes e exploraremos
graficamente varias propriedades das regras de Bayes e minimax. Problemas de decisao com espaco de decisoes e espaco de estados da natureza
finitos, problema de decisao baseado em dados experimentais, diferentes
conceitos e medidas de risco e dominancia estocastica tambem sao introduzidos nesse captulo.
No captulo 3 apresentaremos varios instrumentos graficos disponveis
para facilitar a modelagem de problemas complexos de decisao. Iniciaremos pela descricao das redes Bayesianas e depois apresentaremos os
18
CAPITULO 1. INTRODUC
AO
diagramas de influencia e as arvores de decisao. Serao tambem apresentados neste captulo os principais aspectos dos pacotes DPL - data
programming language e um exemplo envolvendo o uso do WinBUGS Bayesian analysis using Gibbs sampler.
O captulo 4 introduz alguns resultados fundamentais para a teoria
estatstica da decisao e que servem como solida base para o uso rotineiro
dos princpios da teoria da decisao. Introduzimos o princpio da coerencia
atraves do famoso argumento Dutch book para, em seguida, introduzir as
scoring rules (ou regras escores), que induzem o tomador de decisoes a
fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto ao
informar suas probabilidades. O tambem famoso (e curioso) paradoxo de
St. Petersburg que ilustra a dificuldade de se dissociar o valor do dinheiro
de sua utilidade tambem e discutido. Ainda nesse captulo introduzimos o
teorema de representacao von Neumann-Morgenstern que essencialmente
introduz todos os alicerces necessarios para o tomador de decisoes sobre
incerteza escolher entre duas alternativas de acao tendo sem sua frente
somente os possveis estados da natureza, suas utilidades e probabilidades.
Discutiremos alguns aspectos da analise de sensibilidade no captulo 5.
Esse e problema central na estruturacao e solucao de modelos de decisao.
As tecnicas de analise de decisao usam como ingrediente fundamental julgamentos do tomador de decisao atraves de suas preferencias e crencas.
A distribuicao a priori, o modelo que descreve os dados disponveis e a
funcao de perda ou utilidade impactam a solucao final do problema. A
questao e avaliar a sensibilidade dos resultados finais a variacoes a esses
elementos da analise. Iniciaremos discutindo alguns aspectos de identificacao do problema e de sua estruturacao para a seguir atacar questoes
ligadas a` robustez das componentes do modelo de decisao.
Trataremos de problemas de decisao em m
ultiplos estagios ou sequenciais no captulo 6. Esses problemas se caracterizam por poderem ser
separados em um certo n
umero de passos sequenciais ou estagios, cada
estagio se conclui com uma decisao. Em geral, o tempo e usado para
DO LIVRO
1.4. ORGANIZAC
AO
19
20
CAPITULO 1. INTRODUC
AO
DO LIVRO
1.4. ORGANIZAC
AO
21
22
CAPITULO 1. INTRODUC
AO
Captulo 2
Conceitos B
asicos
Como sugerido nos exemplos do Captulo 1 a analise de decisoes esta
envolvida com problemas complexos os quais incluem uma ou mais das
seguintes caractersticas:
Incerteza: como escolher um curso de acao - estrategia - quando
suas consequencias dependem de eventos incertos.
Objetivos m
ultiplos: sao frequentes as situacoes onde a escolha de alternativas envolve consequencias de natureza m
ultipla, em
geral conflitantes. Por exemplo, a localizacao de uma usina nuclear requer a avaliacao dos custos envolvidos, da confiabilidade do
projeto, de questoes ambientais etc.
Alternativas m
ultiplas: e imprescindvel escrutinar todas as alternativas ou opcoes possveis, eliminando-se aquelas dominadas
mas evitando-se omissoes ou simplificacoes excessivas.
Sequenciamento: muitas decisoes sao de natureza sequencial envolvendo, portanto m
ultiplos estagios de decisao. As decisoes em
dado estagio do processo sao selecionadas com base nas decisoes
23
24
Um modelo de decisao consiste de dois aspectos basicos: (i) especificacao estrutural e (ii) definicao de criterios para comparacao de alternativas. A especificacao estrutural envolve a identificacao dos elementos do
problema de decisao, isto e os eventos incertos, as alternativas possveis,
os parametros desconhecidos e as relacoes estruturais relacionando estes
elementos. Os criterios para comparacao das consequencias associadas as
varias alternativas devem possibilitar ao decisor uma certa racionalidade
ou coerencia no processo decisorio. Uma condicao necessaria para o comportamento racional dos decisores sera denominada de coerencia. Devem
ser eliminadas as regras que conduzem a` ideia da perpetual money making
machine como introduzido por Lindley (1971).
Neste captulo discutiremos varios aspectos introdutorios da teoria de
decisao (veja secao 2.1). Especificaremos a tripla que caracteriza um problema de decisao e apresentaremos, nas secoes 2.2 e 2.3, diversas funcoes
de perda para problemas especficos. Na secao 2.4, caracterizaremos a
concavidade do risco de Bayes e exploraremos graficamente varias propriedades das regras de Bayes e minimax. Problemas de decisao com
espaco de decisoes e espaco de estados da natureza finitos serao tratados
na secao 2.5. A regra minimax e revisitada na secao 2.6. O problema
de decisao baseado em dados experimentais sera discutido na secao 2.7 e
diferentes conceitos e medidas de risco serao apresentados na secao 2.8.
Este captulo e concludo com a secao 2.9 falando sobre dominancia estocastica.
2.1
Elementos da an
alise de decis
oes
25
CAPITULO 2. CONCEITOS BASICOS
26
Estados
Acoes 1
2
a1 -500 1000
a2 -300 -300
Tabela 2.1: Perda associada a cada acao e cada estado da natureza.
27
Defini
ca
o 2.2 O risco ou perda esperada de uma aca
o a A e dado
por
Z
r(, a) =
L(, a)()d
L(, a)()d
CAPITULO 2. CONCEITOS BASICOS
28
n
ao ser
a oferecida novamente durante o presente ano letivo os livros remanescentes, n
ao vendidos, impor
ao uma perda de 5 u.m., por exemplar,
no final do perodo. Uma quest
ao importante ser
a , por exemplo, determinar o tamanho ideal da compra a ser realizada pela livraria. A funca
o
de ganho ou utilidade e obviamente dada por:
U (, a) =
15 5(a )
15a
se < a
se a
0
0
-5
-10
-15
-20
-25
-30
-35
1.7
10
20
0
0
15
15
10
30
5
25
0
20
-5
15
-10
10
-15
5
8.7 23.2
Vendas
30
40
0
0
15
15
30
30
45
45
40
60
35
55
30
50
25
45
32.4 23.2
50 60
70
0
0
0
15 15
15
30 30
30
45 45
45
60 60
60
75 75
75
70 90
90
65 85 105
8.7 1.7 0.4
Perda
Max r(, a)
0
0.0
-5
14.7
-10
27.6
-15
35.9
-20
37.7
-25
34.8
-30
30.2
-35
25.3
DE PERDA
2.2. ESPECIFICANDO A FUNC
AO
29
as encomendas (aco
es) tambem est
ao ordenadas em m
ultiplos de 10. Este
e um exemplo onde o n
umero de possveis estados da natureza e n() = 8
e existem n(A) = 8 possveis aco
es. Mesmo com estas simplificaco
es a
tarefa de escolher a melhor decis
ao n
ao e muito simples, a menos do caso do decisor utilizar a regra minimax. Curiosamente, nesse exemplo,
a regra minimax e de pouca valia uma vez que sugere que o vendedor
n
ao compre nenhum livro (veja a pen
ultima coluna da tabela 2.2). Alem
disso, note que um comerciante poderia ordenar 70 unidades e obter um
ganho de 1050 u.m. caso todos os livros sejam vendidos. Todavia, seguindo essa mesma alternativa, existe o risco da perda de 350 u.m. caso as
vendas sejam nulas. Intuitivamente, pode ser argumentado, precisaria-se
assessar a distribuica
o de probabilidade da quantidade incerta - quantidade demandada de livros. Para ilustraca
o, suponhamos que () para
= 0, 10, . . . , 70 sejam aqueles apresentados na u
ltima linha da tabela
2.2. De acordo com essa distribuica
o de probabilidade calculamos a u
ltima
coluna na mesma tabela. De acordo com esses resultados vemos que a decis
ao o
tima, ou aca
o de Bayes, e a compra de 40 unidades.
Para mais detalhes sobre a regra minimax veja a secao 2.6. No captulo
4 mostra-se porque a maximizacao (minimizacao) da utilidade (perda) esperada e a regra de decisao comumente utilizada em problemas de decisao
sob incerteza.
2.2
Especificando a fun
ca
o de perda
Nesta secao apresentaremos alguns exemplos de funcao de perda que ocorrem comumente nas aplicacoes. Iniciaremos com uma classe geral de
funcoes de perda, discutiremos os problemas da inferencia estatstica no
contexto da teoria da decisao e introduziremos dois exemplos de natureza
mais aplicada.
CAPITULO 2. CONCEITOS BASICOS
30
k
0
se | a|
se | a| <
DE PERDA
2.2. ESPECIFICANDO A FUNC
AO
31
0
ci
se i
caso contrario
CAPITULO 2. CONCEITOS BASICOS
32
P r( 0), sera dada pela comparacao das perdas esperadas, r(, a0) =
c0 (1 ) e r(, a1) = c1 .
Uma pequena generalizacao dessa formulacao, denominada na literatura de problema da decisao m
ultipla, consiste em fazer uma particao do
espaco do parametro em m classes. Sua solucao sera diretamente obtida
atraves dos conceitos desenvolvidos ao longo desse captulo.
Uma outra fun
ca
o de perda
Suponha que = {1, 2 } e que A = {a1, a2}. Seja a funcao de perda
L(, ai) =
0
i2
se = i
se 6= i ,
12
Z
(1, 2 )d2 d1 =
12 (1)d1 = E(12)
Fun
ca
o de Perda de Esscher
Na literatura de Atuaria aparece com frequencia a funcao de perda de
Esscher,
L(, a) = exp ()( a)2
DE PERDA
2.2. ESPECIFICANDO A FUNC
AO
33
2
/2
min r(, a) max
a
a
CAPITULO 2. CONCEITOS BASICOS
34
Este exemplo e particularmente interessante pois aponta para uma dificuldade que ocorre com frequencia. Nossas acoes podem ser julgadas
atraves de consequencias m
ultiplas e conflitantes. Neste exemplo desejamos claramente maxizar o retorno esperado, todavia restrito a um certo
nvel de risco, avaliado pela variancia do retorno do portfolio selecionado.
2.3
Fun
ca
o de perda n
ao negativa
Seja > 0 uma constante dada e () uma funcao real tal que
Z
()()d <
claro que uma acao de Bayes, ab sob L(, a) tambem sera Bayes sob
E
L0 (, a). Defina agora 0 () = mina L(, a) e
L0 (, a) = L(, a) 0 ()
DE PERDA NAO
NEGATIVA
2.3. FUNC
AO
35
Estados
Acoes 1
2
a1
100 -20
a2
-10 80
Tabela 2.3: Perdas monetarias (em milhares)
Estados
Acoes 1
2
a1
110
0
a2
0 100
Tabela 2.4: Funcao de perda nao negativa (L0 (, a) = L(, a) 0 ())
Exemplo 2.4 Considere um problema com cinco aco
es e dois estados
da natureza. Uma tabela envolvendo perdas n
ao negativas e a tabela 2.5.
Vale notar que agora temos uma perda nula para cada um dos estados
e com os demais valores extritamente positivos, como ilustrado na tabela
2.6.
Estados
1
2
a1
2
3
Acoes
a2 a3 a4
4 3 5
0 3 2
a5
3
5
mina L(, a)
2
0
CAPITULO 2. CONCEITOS BASICOS
36
Estados
1
2
a1
0
3
Acoes
a2 a3 a4
2 1 3
0 3 2
a5
1
5
2.4
37
L(, a)()d =
= r(1 , a) + (1 )r(2 , a)
(ii) Como r() = mina r(, a), entao
r() = mina[r(1, a) + (1 )r(1 , a)]
Como o mnimo da soma de duas funcoes nao pode ser nunca menor que
a soma dos mnimos individuais, segue que:
r() minar(1 , a) + (1 ) minar(2 , a)
= r(1 ) + (1 )r(2 )
t
u
A partir dos item (i) e (ii) acima pode ser verificado que a funcao
concava r() e o mnimo da famlia de funcoes lineares r(, a) gerada
pelas diferentes acoes em A. Ilustracoes graficas sao possveis no caso em
claro que nestas condicoes = P r( = 1). Assim
que = {1, 2}. E
r() e funcao concava de (0, 1) (veja a ilustracao na figura 2.2).
Consequ
encia da Imprecis
ao de
Suponha, ainda no caso de um espaco de acoes com dois elementos somente, que a acao a0 seja escolhida a acao de Bayes segundo 0 e suponha
que o verdadeiro valor de seja, digamos 1 . Seja = r(1, a0 ) r(0 )
o incremento em risco, como ilustrado na figura 2.3. Se a curva r() for
suave no entorno de 0, o qual deve conter 1 entao sera pequeno.
38
Figura 2.2: Concavidade do risco de Bayes: n(A) < (figura da esquerda); n(A) = (figura da direita).
2.5
Problema de decis
ao com e A finitos
m
X
j=1
pj L(i , aj ), i = 1, , k
COM E A FINITOS
2.5. PROBLEMA DE DECISAO
39
Defini
ca
o 2.6 Domin
ancia e Admissibilidade
40
COM E A FINITOS
2.5. PROBLEMA DE DECISAO
41
onde = (1, , k )0 .
Defini
ca
o 2.7 Uma aca
o ab e Bayes segundo se e somente se minimiza
0
L(a), a A
interessante mostrar que ab pertence a fronteira de Bayes de G. Como
E
a fronteira admissvel de G esta contida na fronteira de Bayes segue que
toda decisao admissvel em M e Bayes para alguma .
Teorema 2.2 Seja a uma aca
o em M. O vetor L(a ) pertence a fronteira de Bayes de G se e somente se existe alguma distribuica
o sobre
a1
10
0
a2
8
1
Acoes
a3 a4
4 2
2 5
a5
0
6
a6
0
10
CAPITULO 2. CONCEITOS BASICOS
42
as aco
es a1 , a3 ea5 A s
ao admissveis. Neste exemplo a fronbteira
de Bayes incluir
a tambem o segmento de reta L5 a L6 , de forma que a
fronteira de Bayes ser
a constituida pelas aco
es {a1 , a3, a5, a6}.
Suponha que deseja-se determinar uma decis
ao de Bayes segundo a
0
priori = (1/3, 2/3) . Considere a equaca
o da reta L1 /3 + 2L2 /3 = c,
isto e com inclinaca
o 1/2. Verifique se esta e uma linha de suporte em
algum ponto da fronteira de Bayes. Neste exemplo somente a3 satisfaz
esta condica
o.
u
E
til relembrar que a perda esperada para acoes em M sao da forma:
0 L(a) =
=
k
X
i=1
k
X
i=1
m
X
pj L(i , aj )
j=1
=
=
=
=
=
3
4
3
3 + 1
5 2
43
2.6
CAPITULO 2. CONCEITOS BASICOS
44
Estados
1
2
max
a1
2
3
3
Acoes
a2 a3 a4
4 3 5
0 3 2
4 3 5
a5
3
5
5
a1
0
3
3
a2
2
0
2
Acoes
a3 a4
1 3
3 2
3 3
a5
1
5
5
45
46
2.7
Problema de decis
ao usando dados
USANDO DADOS
2.7. PROBLEMA DE DECISAO
47
Z Z
X
L(, (x))p(x|)()ddx
(2.1)
L(, (x))(x|)dx
CAPITULO 2. CONCEITOS BASICOS
48
Para qualquer regra de decisao (x) a funcao r(, (x)) sera denomindada de risco de . Assim sendo sera uma decisao de Bayes se
= arg min
(x)
r(, (x))()d
ou
Z
p(x)
L(, (x))p(x|)()/p(x)d
R
onde p(x) = p(x|)()d. Assim,
r(, ) =
p(x)
Z
L(, (x)(|x)d dx
USANDO DADOS
2.7. PROBLEMA DE DECISAO
L(, a)
1
2
a1
0
10
49
a2
5
0
0
3/4
1/3
1
1/4
2/3
CAPITULO 2. CONCEITOS BASICOS
50
x
q(, x)
0
1
3/4
2
(1 )/3
1
/4
2(1 )/3
logo, a decis
ao de Bayes ser
a a2 se < 8/17. Analogamente, se x = 0 a
decis
ao a2 ser
a prefervel se < 16/19. De uma forma geral teremos,
5
se 0 < < 8/17
r() = 5/4 + 10(1 ) se 8/17 < < 16/19
10(1 )
se 16/19 < < 1
permitindo se fazer o gr
afico do risco de Bayes (Figura 2.9) como funca
o
de , a probabilidade a priori.
2.8
An
alise de risco
2.8. ANALISE
DE RISCO
51
CAPITULO 2. CONCEITOS BASICOS
52
(y c) pj (y)dy
onde aj representa a j-esima acao, y os retornos com densidade pj (y), dependendo da acao j e c e um valor crtico particular, tambem denominado
de RaM - retorno aceit
avel mnimo. Alguns casos especiais sao,
Vari
ancia
Esta e a medida tradicionalmente usada em decisoes financeiras. Em
nosso exemplo anterior sobre a construcao de um portfolio, nosso criterio
consistia em simultaneamente minimizar a variancia e maximizar o retorno. Esta medida de risco e obtida a partir de nossa definicao geral
fazendo-se c = j = Ej (y) e = 2.
2.8. ANALISE
DE RISCO
53
Semivari
ancia ou Downside-risk
Sua principal vantagem e levar em conta somente o domnio de risco
de real interesse, por exemplo os retornos mais baixos. Fica definida
para = 2 e c um valor crtico qualquer. Uma definicao alternativa
desta medida de risco, frequentemente encontrada na lituratura recente
de financas, denominada downside risk - DsR, e definida por:
DsR(aj ) =
Probabilidade crtica
Semelhante a semivariancia, mas tendo como medida de risco a probabilidade, isto e:
Z
V aR(aj ) = Pj [y c] =
pj (y)dy
CAPITULO 2. CONCEITOS BASICOS
54
Acoes
1
a1
12
a2
2.71
2
17
4.86
3
11
5.28
4
18
2.28
Meses
5
6
7
17 23
20
2.71 .14 1.42
8
9
19
13
1.86 4.43
10
10.3
5.58
Obtendo-se, ap
os alguns c
alculos, os resultados da tabela 2.14. Vale notar que como todos os retornos do ativo a1 superam c, gerando assim
medidas de risco alternativas nulas. Fica tambem f
acil ver que o V aR do
ativo a2 e igual a 1, pois c supera todos seus retornos observados. Portanto, as conclus
oes s
ao: o ativo a1 tem risco menor, exceto quando esta
medida for a vari
ancia, e retorno medio significativamente maior. Logo
a1 ser
a prefervel sempre que usarmos umas das medidas alternativas de
risco e um valor de c 10.3%.
2.9. DOMINANCIA
ESTOCASTICA
2.9
55
Domin
ancia estoc
astica
Em varias situacoes pode ser pouco natural comparar alternativas (decisoes) simplesmente atraves de seus retornos (monetarios) esperados.
Entretanto, existem situacoes onde se deseja encontrar alternativas que
sejam dominantes de maneiras mais gerais e mais abrangentes. Nessa
secao introduziremos o conceito de dominancia estocastica de primeira
(relativa aos retornos) e segunda ordem (relativa aos riscos). A intuicao
basica e poder encontrar meios para dizer, por exemplo, que a distribuicao F produz retornos maiores que a distribuicao G ou que a
distribuicao F tem menor risco do que a distribuicao G. Vejamos um
pequeno exemplo para introduzir essas ideias.
Exemplo 2.10 Suponha que, em um problema de decis
ao, existam tres
possveis aco
es, a1, a2, a3, tres possveis estados da natureza, 1, 2 , 3,
com ganhos descritos pela tabela 2.15. Pode ser facilmente constatado
que a aca
o a1 domina a aca
o a2 pois os retornos sob a1 s
ao maiores que
os retornos sob a1 para todos os possveis estados da natureza. O mesmo
j
a n
ao pode ser dito quando se compara a1 e a3 ou a2 e a3.
Estados
1
2
3
Acoes
a 1 a2 a3
6 3 8
5 4 2
7 6 3
CAPITULO 2. CONCEITOS BASICOS
56
u(x)dF (x)
u(x)dG(x)
2.9. DOMINANCIA
ESTOCASTICA
57
u(x)dF (x)
u(x)dG(x)
58
Denote por G(.) essa loteria composta. Quando uma loteria G puder
ser obtida a partir de uma outra loteria F , para alguma Hx , diz-se que G
e um espalhamento de F com preservacao da media. O exemplo abaixo
ilustra essa nova ideia Mas-Colell, Whinston, and Green (1995).
Exemplo 2.11 Seja F a funca
o de distribuica
o com massas iguais em
2 e 3. Ent
ao a funca
o de distribuica
o, G, com massas iguais em 1,2,3,4
e um espalhamento de F com preservaca
da media (veja a figura 2.11).
2.9. DOMINANCIA
ESTOCASTICA
59
Se u(.) e concava,
Z
u(x)dG(x) =
Z Z
Z
Z
u(x)dF (x)
60
Captulo 3
Modelos Gr
aficos
3.1
Introdu
ca
o
62
63
3.2
Redes Bayesianas
64
65
66
model;
{
for( j in 1 : M ) {
for( i in 1 : T ) {
y[i , j] ~ dnorm(m[i , j],tau2[j])
}
}
for( j in 1 : M ) {
for( i in 1 : T ) {
m[i , j] <- beta[j] * f[i]
}
}
for( j in 1 : M ) {
for( i in 1 : T ) {
f[i] ~ dnorm( 0.0, 1.0)
}
}
for( j in 1 : M ) {
tau2[j] ~ dgamma(v0[j],v0s02[j])
}
for( j in 1 : M ) {
beta[j] ~ dnorm(m0[j],C0[j])
}
}
Figura 3.3: Modelo fatorial estatico no WinBugs.
67
68
3.3
Diagrama de influ
encia e a
rvore de decis
ao
Nesta secao descreveremos os modelos basicos de decisao e suas representacoes atraves de diagramas de influencia e arvores de decisao. Estes dois
diagramas sao de alguma forma complementares. Os primeiros sao mais
u
teis na etapa de modelagem enquanto que as AD sao mais adequadas
para se implementar a solucao otima atraves do algortmo de inducao de
tras para diante (backward induction). Este, como ja comentamos, intercala operacoes de esperanca, para eliminar incertezas, com operacoes de
maximizacao para escolher as acoes que maximizem a utilidade esperada.
69
70
Risco B
asico
u
Este e o modelo mais simples de tomada de decisao sob incerteza. E
til
para representar decisoes de investimentos e, tambem, na area atuarial,
por exemplo quando temos de decidir se contratamos ou nao um seguro
para nossos bens.
No problema de decisao de risco basico, a satisfacao do decisor e funcao
da acao escolhida e de um evento incerto. Seu diagrama de influencia e
extremamente simples. As possveis acoes estao representadas por um
retangulo, o evento incerto por um crculo e as consequencias por um
retangulo com bordas abauladas. Os arcos orientados conectam as acoes
e os eventos incertos ao retangulo de bordas abauladas, que representa as
consequencia, descrevendo a relacao funcional existente (figura 3.4). Nas
redes Bayesianas de probabilidades nao apareciam os nos decisorias e de
consequencias caracterizando uma tenue diferenca entre estes instrumentos.
No exemplo atuarial poderamos ter a decisao de adquirir um seguro
de vida de certo valor, as incertezas seriam traduzidas pelas taxas de
mortalidade e as consequencias descritas por alguma medida do suporte
financeiro da famlia.
Uma pequena variante deste modelo mais simples, que denomiremos
de poltica de risco b
asico, inclue um arco conectando as acoes ao
crculo que representa os estados da natureza ou eventos incertos. Em
alguns problemas a acao escolhida influencia as probabilidades sobre os
eventos incertos (figura 3.5). Este fato sera descrito pela inclusao de um
arco de relev
ancia conectando o no de decisao ao no aleatorio.
71
Figura 3.4: DI para risco basico: decisao primaria (a), evento incerto ()
e consequencias (c)
72
73
de risco b
asico duplo. Temos, como no exemplo anterior, somente
duas acoes alternativas. Por exemplo, investir num ativo de risco ou, por
exemplo, numa ativo real. Ambos podem gerar como consequencia um
excelente retorno ou nao.
Modelo de Informa
c
ao Imperfeita
Em muitas situacoes desejamos descrever no processo de tomada de decisoes a possibilidade de se obter informacoes imperfeitas sobre eventos
incertos, os quais afetam, obviamente, as consequencias decorrentes da
escolha das acoes otimas. A origem dessas informacoes pode ser de pelo
menos tres naturezas: previsoes, diagnosticos ou estimacao. Frequentemente, provem de um especialista ou de um modelo computacional, em
geral de natureza estatstica. Incluiremos um novo no aleatorio para representar a informacao imperfeita o qual recebera um arco com origem no
no aleatorio e originara outro com destino ao no decisorio. O primeiro
sera um arco de relevancia e o outro de sequencia.
Diagramas de c
alculos intermedi
arios
A principal caracterstica dos diagramas de influencia para calculos intermediarios e que nao envolvem nos aleatorios. Limitam-se a representar
relacoes estruturais entre nos de constantes ou de calculo.
Antes de prosseguir seria u
til apresentarmos um exemplo envolvendo
um diagrama de influencia com certa complexidade. Este e um exemplo
extrado do livro de Clemen (1996).
Exemplo 3.4 Uso de certo Produto Qumico
Uma agencia de proteca
o ambiental, frequentemente, deve decidir se
autoriza ou n
ao o uso de um certo produto qumico, economicamente
vi
avel, mas que pode ter efeitos cancergenos. As decis
oes ser
ao tomadas
com informaco
es imperfeitas sobre os riscos a
` sa
ude e os benefcios de
74
75
76
3.10).
77
Decis
oes sequenciais
Estas surgem em modelos complexos onde as decisoes estao implicita
ou explicitamente ordenadas temporalmente. As condicoes decisorias se
modificam dinamicamente, de sorte que e plausvel assumir que alternativas selecionadas em certo momento poderao ser revisadas em instantes
futuros. Uma caracterstica basica dessas estruturas e que as decisoes
se sucedem, umas influindo nas outras, e as consequencias quando monetarias devem ser resumidas num u
nico valor obtido da aplicacao do conceito de valor presente a cada uma das parcelas. Para isto utiliza-se um
fator de desconto, em geral suposto temporalmente invariante e conhecido precisamente. Um exemplo, para motivar, poderia ser aquele de um
investidor que antes de se decidir pelo investimento em certo ativo de
risco prefere contratar os servicos de um consultor que o orientara. Assim antes de mais nada, ele se coloca uma nova questao: deve ou nao
contratar um consultor? Sera que o custo dessas informacoes imperfeitas
e aceitavel, face ao conte
udo de informacao disponibilizado?
78
Para completar esta secao destacaremos alguns erros comumente cometi bom comecar distindos na elaboracao dos diagramas de influencia. E
guindo um diagrama de influencia de um fluxograma. Um fluxograma
limita-se a descrever sequencialmente atividades e eventos, enquanto que
um DI descreve um instantaneo de um processo decisorio levando em
consideracao todos os elementos envolvidos nas decisoes imediatas. Um
segundo erro comumente cometido e conectar os nos de chance ao no
decisorio na tentativa de representar que as decisoes sao tomadas em ambiente de incerteza. Como vimos um arco em direcao a um no decisorio
representara alguma forma de informacao disponvel ao tempo de se escolher as decisoes. Estes sao arcos de sequencia, indicando portanto que
o decisor deve aguardar a resolucao dessas incertezas antes de decidir.
Finalmente, nao e permitido incluir ciclos em DI. Estes prestam-se para
representar alguma forma de feedback (retroalimentacao). Como nossos
DI representam um instantaneo do processo decisorio nao havera oportunidade para se considerar feedback.
3.4
Introdu
ca
o ao DPL
AO DPL
3.4. INTRODUC
AO
79
Aspectos b
asicos
Na barra de comandos encontram-se os smbolos graficos necessarios para
a elaboracao de um diagrama de influencia: ret
angulo amarelo para
representar o espaco das acoes, crculo verde para descrever o espaco dos
estados da natureza, ret
angulo abaulado azul claro e arco magenta para
indicar relacoes ou condicionamento entre os elementos.
Ao se clicar com o botao da esquerda do mouse sob um elemento
grafico (no) se abrira uma caixa onde podemos atribuir nomes, valores,
comentarios e coneccoes. Na atribuicao de valores existe uma linha para
a introducao de formulas. Esta se utiliza de funcoes especiais do sistema
(smbolo f , a` esquerda) e das variaveis disponveis (idem, ).
Neste momento, o melhor sera apresentar um pequeno exemplo.
Exemplo 3.5 Em certa manh
a de setembro, ao se preparar para sair
em direca
o a
` universidade voce dever
a decidir se leva ou n
ao um guarda
chuva. E claro que poder
a chover ao longo de seu trajeto. Nesta epoca
do ano, voce atribui probabilidade de 0.6 de se ter um dia ensolarado. As
consequencias associadas as estas decis
oes e estados da natureza decorrem de dois fatos: os incovenientes de se tomar chuva (roupa molhada,
resfriado etc) e o fato de que voce costuma perder seu guarda-chuva sistematicamente, tendo de gastar preciosos reais na compra de outro.
80
AO DPL
3.4. INTRODUC
AO
81
CAPITULO 3. MODELOS GRAFICOS
82
AO DPL
3.4. INTRODUC
AO
83
84
AO DPL
3.4. INTRODUC
AO
85
0.6 se x = 1
0.4 se x = 0
CAPITULO 3. MODELOS GRAFICOS
86
decis
ao, das probabilidades sobre condicionalmente aos resultados das
investigaco
es - X e ainda da marginal de X. Isto e:
P (|X = 1) P
() P (X = 1|)
X
P (X = 1) =
P (X = 1, )
1 2
0.064
0.016
0.064
0.016
0.08
1 2
0.048
0.072
0.096
0.024
0.12
1 2
0.256
0.064
0.128
0.192
0.32
1 2
0.192
0.288
0.192
0.288
0.48
0.56
0.44
0.48
0.52
AO DPL
3.4. INTRODUC
AO
a3
a4
a5
12 1 2
46 -31
164 164
0
0
87
1 2
46
-31
0
12
-31
-31
0
88
Captulo 4
Probabilidade subjetiva e
utilidade
Savage (1954) comeca o captulo 3 (sobre probabilidade subjetiva) de
seu celebre livro The Foundations of Statistics da seguinte forma (nossa
traducao):
Eu pessoalmente considero mais provavel que um presidente
Republicano seja eleito em 1996 do que caia neve em Chicago
em algum dia de maio de 1994. Entretanto, mesmo essa neve
de fim de primavera parece-me mais provavel do que Adolf
Hitler ainda esteja vivo.
Apesar de transmitir a sensacao de completa falta de estrutura, essas
afirmacoes probabilsticas sao perfeitamente razoaveis e externam o grau
de crenca ou grau de incerteza de um observador (tomador de decisoes
em nosso contexto) a respeito de varios eventos (ainda) nao-observaveis.
Adicionalmente, Kyburg and Smokler (1980) editaram um compendio
sobre probabilidade subjetiva intitulado Studies in Subjective Probability
e iniciam sua introducao com um debate sobre a multitude que o conceito
de probabilidade tras em si (nossa traducao):
89
90
No captulo 2 introduzimos o princpio da teoria estatstica da utilidade que diz que um tomador de decisoes deve procurar maximizar sua
utilidade esperada, onde a esperanca e tomada com relacao as probabilidades associadas (subjetivamente ou nao) aos possveis estados da natureza do problema em questao. Entretanto, nada foi ainda dito sobre
que probabilidades sao essas e como sao elicitadas, a mesma indagacao
existindo para as utilidades associadas as consequencias das possveis decisoes.
Nesse captulo introduziremos alguns resultados fundamentais para
a teoria estatstica da decisao e que servem como base solida para o
uso rotineiro dos princpios da teoria da decisao como ela e comumente
91
utilizada por microeconomistas teoricos, tomadores de decisoes medicas,
e em modelagem e decisao em financas (por exemplo, na confeccao e
monitoramento de carteiras de ativos financeiros) e tantas outras areas
da ciencia.
Iniciaremos introduzindo o princpio da coerencia na proxima secao,
atraves do famoso argumento Dutch book. Atraves desse argumento um
tomador de decisoes sempre devera quantificar as incertezas associadas a
eventos atraves do calculo das probabilidades; caso contrario ele (tomador
de decisoes) estara sendo incoerente e predisposto a participar de uma loteria com probabilidade nula de bonificacao. Em seguida, ainda na secao
4.1, introduziremos as scoring rules que induzem o tomador de decisoes
a fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto
ao informar suas probabilidades. Por exemplo, um previsor do tempo,
pode, por motivos de calibracao de suas previsoes, fornecer como probabilidade de chuva para amanha uma quantidade que nao necessariamente
represente seu verdadeiro grau de incerteza a respeito do evento.
A secao 4.2 comeca com o famoso (e curioso) paradoxo de St. Petersburg que ilustra a dificuldade de se dissociar o valor do dinheiro de sua
utilidade nos tempos de Bernoulli (Bernoulli 1738). Ainda nessa secao
introduzimos um dos resultados mais importantes da teoria da decisao, o
teorema de representacao de von Neumann-Morgenstern. O teorema basicamente introduz ferramental necessario para o tomador de decisoes sobre
incerteza escolher entre duas alternativas de acao tendo sem sua frente somente os possveis estados da natureza, suas utilidades e probabilidades.
O resultado vai alem ao mostrar que o tomador de decisoes precisa somente de discernir sobre dois estados extremos, um muito bom e outro
muito ruim cujas utilidades poderiam, arbitrariamente, ser um e zero,
respectivamente; com utilidades para todas as outras consequencias obtidas a partir dessas duas. A ideia de problemas de decisao com m
ultiplos
atributos sera breve e superficialmente abordada na secao 4.3.
92
4.1
93
94
95
sup
u(Ej , a)j =
u(Ej , )j
aA jJ
jJ
(4.1)
96
a2i
O resultado abaixo afirma que a regra escore quadratica pode ser utilizada para mostrar que se os graus de crenca do tomador de decisoes
(previsor) nao forem coerentes, entao uma acao (distribuicao de probabilidade) com escore maior pode ser obtida.
Teorema 4.2 Se a viola uma das seguintes condico
es,
4.2. UTILIDADE
97
1. 0 aj 1 para todo j = 1, . . . , k.
2.
Pk
j=1
aj = 1.
ent
ao, pode-se encontrar a0 que satisfaz 1 e 2 tal que u(Ej , a) u(Ej , a0 )
para todo j = 1, . . . , k e u(Ej , a) < u(Ej , a0 ) para pelo menos um j.
4.2
Utilidade
98
4.2.1
n=1
2n
n
1
2
4.2.2
4.2. UTILIDADE
99
e fundamentado em tres axiomas, os quais serao brevemente apresentados aqui. Considere, inicialmente, que Z represente o conjunto com
n possveis conseq
uencias {z1 , z2, , zn }, e A o conjunto de todas as
funcoes de probabilidade, ou aco
es, em Z. Para fixar a notacao, imagine
o seguinte exemplo.
Exemplo 4.3 Suponhamos que voce acaba de receber R$5.000,00 e que,
ap
os conversar com o gerente do seu banco, tres possveis linhas de investimento surgiram, a saber:
a Aplicar os R$5.000,00 na poupanca e receber, no final do mes, R$50,00
de rendimento;
a0 Aplicar os R$5.000,00 num fundo de renda fixa e receber, no final do
mes, R$200,00 de rendimento com probabilidade p ou nada com
probabilidade 1 p
a00 Aplicar os R$5.000,00 numa u
nica aca
o e receber, no final do mes,
R$1000,00 de rendimento com probabilidade q ou ter um rendimento
negativo de R$200,00 com probabilidade 1 q.
onde p = 0.8 e q = 0.95. Nesse contexto fictcio e simplificado, o conjunto Z, de rendimentos lquidos, tem 5 elementos, {200, 0, 50, 200, 1000},
enquanto que as loterias (ou aco
es) a, a0, a00 representam as seguintes distribuico
es de probabilidade em Z:
a = (0.00, 0.00, 1.00, 0.00, 0.00)
a0 = (0.00, 0.50, 0.00, 0.50, 0.00)
a00 = (0.05, 0.00, 0.00, 0.00, 0.95)
Qual das tres formas de investimento voce preferiria? Como voce ordenaria (da pior para a melhor), esses tres cen
arios? Ou ainda, para que
0
valor de p voce seria indiferente entre a e a ? Similarmente, para que
valores de q e s voce seria indiferente entre a e a00? Pense um pouco e
veja a continuaca
o desse exemplo mais a frente, ainda nessa seca
o.
100
a a0 , or
nenhuma delas.
Transitividade: Para quaisquer a, a0 e a00 em A, tais que a a0 e
a0 a00, ent
ao a a00.
4.2. UTILIDADE
101
implies
Antes de falarmos mais detalhadamente sobre os axiomas, vamos apresentar um dos principais teoremas da teoria moderna da decisao.
Teorema 4.3 Representa
ca
o de Neumann-Morgernstern: Os axiomas 4.4, 4.5 e 4.6 s
ao verdadeiros se e somente se existir uma funca
o
u tal que a, a0
a a0
U (a)
zZ
a(z)u(z) >
zZ
a0(z)u(z) U (a0 )
(4.2)
com u u
nica a menos de transformaco
es lineares.
Adicionalmente, pode ser mostrado o seguinte resultado,
Lema 4.1 Se em Z satisfaz os axiomas 4.4, 4.5 e 4.6, ent
ao existem
0
z0 e z em Z tais que z0 a z0 para todo a em A.
Nessa notacao, z e a distribuicao de probabilidade com massa pontual
em z. No exemplo 4.3, z0 = 200 e z 0 = 1000. Voltemos ao exemplo 4.3
102
4.3. MULTIPLOS
ATRIBUTOS
4.3
103
M
ultiplos atributos
104
2
X
i=1
Defini
ca
o 4.3 Independ
encia preferencial mutua: Um atributo X1
e considerado preferencialmente independente de X2 se as preferencias
para resultados especficos de X2 n
ao dependem do nivel do atributo X1 .
Se o mesmo acontece quando as posico
es de X1 e X2 s
ao invertidas temos
uma ideia relativao conceito de independencia preferencial m
utua. E
mente interessante, principalmente em situaco
es onde tempo e custo
s
ao os atributos em quest
ao.
um pouco mais forte do que
Defini
ca
o 4.4 Utilidade-independente E
o conceito de independencia m
utua pois involve a noca
o de incerteza,
quase sempre presente nos problemas de decis
ao. Um atributo X 1 e considerado utility independent do atributo X2 se preferencias por escolhas
incertas envolvendo nveis diferenciados de X1 s
ao independentes do valor de X2 . Novamente, se o mesmo vale quando os papeis de X1 e X2 s
ao
invertidos, dizemos que X1 e X2 s
ao mutuamente utilidade-independente.
Pode-se mostrar que
U (x1 , x2) = cX1 UX1 (x1) + cX2 UX2 (x2) + (1 cX1 cX2 )UX1 (x1)UX2 (x2)
+
onde cX1 = U (x+
em, UX1 (x1)UX2 (x2)
1 , x2 ) e cX2 = U (x1 , x2 ). Tamb
representa a interaca
o entre os atributos.
Defini
ca
o 4.5 Independ
encia aditiva: Quando, na express
ao acima,
+
cX1 = U (x+
1 , x2 ) + cX2 = U (x1 , x2 ) = 1
temos que
U (x1 , x2) = cX1 UX1 (x1 ) + (1 cX1 )UX2 (x2)
AO RISCO
4.4. MEDIDAS DE AVERSAO
4.4
105
Medidas de avers
ao ao risco
u(x)dF (x)
u(x)dF (x) u
Z
xdF (x)
para todoF em F
(4.3)
106
AO RISCO
4.4. MEDIDAS DE AVERSAO
107
108
Captulo 5
An
alise de Sensibilidade
5.1
Introdu
ca
o
110
5.2
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Identifica
ca
o e estrutura
E ESTRUTURA
5.2. IDENTIFICAC
AO
111
112
CAPITULO 5. ANALISE
DE SENSIBILIDADE
5.3. EXEMPLO DE ANALISE
PRELIMINAR DE SENSIBILIDADE113
a competica
o entre tres agentes: a agencia reguladora, a ind
ustria de extraca
o de petr
oleo e as eventuais vtimas de possveis cat
astrofes. Este e
um exemplo de como uma mesma situaca
o decis
oria pode ser tratada de
diferentes formas.
A analise de sensibilidade pode colaborar na escolha de uma particular
estrutura mais adequada para atacar o problema, e ajudando na identificacao de aspectos especficos que devem realmente ser considerados pelo
decisor.
Na proxima secao examinaremos um problema onde a analise preliminar de sensibilidade sera u
til para descrever quais das incertezas presentes
merecem ser descritas com maior nvel de detalhamento. O criterio de
identificacao dessas incertezas sera basedo no impacto que elas provocam
sobre os resultados finais. Analises de sensibilidade envolvendo o impacto
ao se variar um u
nico fator por vez serao discutidas e, tambem, analises
de dois fatores serao apresentadas.
sempre uma boa pratica iniciar-se por analises simplificadas. EmbE
ora avaliar o impacto de um fator por vez possa ser enganoso dado que os
fatores podem iteragir, e, todavia, inegavel que simplifica imensamente a
compreensao e analise dos resultados.
5.3
Exemplo de an
alise preliminar de sensibilidade
114
CAPITULO 5. ANALISE
DE SENSIBILIDADE
feita com a combinacao dessas atividades: fretamento e transportes regulares de passageiros. Estes correspondem a 50% das operacoes e consistem
em voos de em media 90 minutos e com distancias de 480 kilometros.
A expansao de suas atividades se dara na area de fretamento. Este
e um novo nicho de mercado em franca expansao. Necessita, portanto,
de um novo aviao. Coincidentemente surgiu uma oportunidade. Existe
um Piper Seneca a venda por 95000 dolares por uma empresa do Oriente
Medio. Este e um bimotor em boas condicoes de manutencao, isto e,
satisfazendo a`s normas das autoridades aeronauticas. Apos sua u
ltima
revisao geral, seus motores ja operaram 150 horas. Esta aeronave acomoda 5 passageiros, alem do piloto e bagagens. Possui os instrumentos
de navegacao e comunicacao necessarios para operar nas condicoes dos
5.3. EXEMPLO DE ANALISE
PRELIMINAR DE SENSIBILIDADE115
Investimento de seus atuais recursos, ao inves da compra do aviao,
no mercado financeiro a uma taxa media de 8% a.a.
Vale ressaltar, novamente, que muitos dos valores numericos envolvidos na descricao desse exemplo sao meras estimativas, alguns sobre con
trole da propria AGUIA,
outros nao.
116
CAPITULO 5. ANALISE
DE SENSIBILIDADE
onde o n
umero de passageiros (npass ) e suposto fixo e igual a 5, neste
exemplo.
Os diagramas de influencia apresentados nas figuras 5.1 e 5.2 resumem
os calculos descritos nas formulas acima. Estes sao tipicamente diagramas
de calculos intermediarios. Temos os nos decisorios referentes aos precos
do frete e do assento em voo regular e da percentagem a financiar. Estas
5.3. EXEMPLO DE ANALISE
PRELIMINAR DE SENSIBILIDADE117
118
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Variavel
Linf
hvoa
500
pf ret
300
pass
95
pass
.40
f ret
.45
chora
230
cf ixo
18000
f ina
.30
tjuro
.105
pcomp
85000
Media
Lsup
800
1000
325
350
100
108
.50
.60
.50
.70
245
260
20000 25000
.40
.50
.115
.13
87500 90000
5.4
Conceitos b
asicos de an
alise de sensibilidade
Vimos nos captulos anteriores que um problema de decisao depende fun preciso especidamentalmente das preferencias e crencas do decisor. E
ficar os antecedentes distribuicoes a priori, as consequencias a funcao
utilidade e o modelo probabilstico, o qual descreve os experimentos
120
CAPITULO 5. ANALISE
DE SENSIBILIDADE
t
X
k e b1 = 0.0625 +
t=1
t
X
Nk
k=1
A media e a vari
ancia da distribuica
o preditiva, a qual ser
a uma Binomial
Negativa, seguem facilmente das express
oes gerais:
E[Nt+1 ] = E[E[Nt+1 |, sNt , st+1 ]]
t
nt
t
t
nt
t
t
nt
t
1
643
1130
9
2046
2289
17
2085
3260
2
796
1234
10
2543
2685
18
2571
3304
3
817
1282
11
2901
2737
19
3172
3334
4
938
1329
12
2368
3016
20
3046
3405
5
958
1412
13
2442
3069
21
2781
3474
6
1056
1454
14
2613
3114
22
3592
3578
7
1363
2027
15
2935
3179
23
3204
3645
8
2115
2144
16
2965
3225
122
CAPITULO 5. ANALISE
DE SENSIBILIDADE
5.5
Sensibilidade da distribui
ca
o a priori
Embora seja bem sabido que considerar isoladamente os efeitos da distribuicao a priori e da funcao de utilidade e uma grave limitacao na
analise de sensibilidade, vamos iniciar pela analise isolada dos efeitos da
distribuicao a priori. Alem disto, no que se segue, o modelo sera considerado como fixo, sem perda de generalidade.
Uma notacao geral facilitara a exposicao do conceito de sensibilidade
A PRIORI
5.5. SENSIBILIDADE DA DISTRIBUIC
AO
123
global. Denote por T (l, p, pX , a) um funcional valor esperado a posteriori da perda como funcao de l funcao de perda, p() distribuicao a
priori, p(x|) distribuicao das observacoes e a uma acao. Assim teremos:
T (l, p , pX , a) =
R
l(a, )p(x|)p()
1
d
p(x)
124
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Defini
ca
o 5.1 Seja P uma classe de prioris. Uma medida de sensibilidade global (Sg ) e dada pela amplitude de variaca
o do funcional de
interesse:
Sg (p()) = supp P T (p()) infp P T (p())
Esta medida e simples de interpretar. A quantidade a posteriori e
robusta a desvios da priori quando esta amplitude for pequena e nao
e robusta quando a amplitude for grande. Por exemplo, se fixamos a
perda quadratica, l(, a) = ( a)2, entao T (p()) = E[|sx] e Sg (p())
a amplitude de variacao da media a posteriori quando a distribuicao a
priori variar em uma particular classe de distribuicoes.
Exemplo 5.5 Compra ou Leasing de Avi
ao: ap
os a an
alise preliminar
de sensibilidade decidimos modelar estocasticamente as quantidades horas voadas, custo por hora voada e ocupaca
o de assentos. A quantidade preco do fretamento, embora tambem de grande influencia nos resultados finais, e de fato uma vari
avel de controle da companhia. Estas quantidades incertas foram examinadas como bin
arias, representando uma situaca
o pessimista (codificada como 0) ou otimista (codificada como 1). Admitiu-se que chora e pass s
ao distribuidas independentemente, mas que hvoa tem distribuica
o dependendo de pass . Assim temos
as probabilidades p = P [Chora = 1] e q = P [pass = 1], com a letras
mai
usculas, como usual, representando vari
aveis aleat
orias. Finalmente
teremos r = P [Hvoa = 0|pass = 0] e s = P [Hvoa = 0|pass = 1], com
r > s. Para estudarmos a influencia dessas quantidades nos resultados
finais assumiremos ainda que s = 0.8r e que p = 0.5. Alem disto iremos
ou a2 - n
ao comprar o avi
ao. No segundo caso, obviamente, a Aguia
investir
a seus recursos pr
oprios no mercado financeiro. No limitaremos,
assim a examinar conjuntamente o efeito de q e r. Os valores monet
arios
dessas quantidades foram, tambem, revisados. Teremos, respectivamente,
para os casos pessimista e otimistas, as seguintes informaco
es.
A PRIORI
5.5. SENSIBILIDADE DA DISTRIBUIC
AO
chora
pass
hvoa
125
Pessimista Otimista
253
237
0.45
0.55
650
900
126
5.6
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Sensibilidade conjunta
Vejamos um exemplo. Suponha que estamos diante de um problema de
decisao sem dados dado pela tabela 5.4.
a1
a2
1
c1
c2
2
c2
c3
1
127
Suponha que eliciou-se que 0.4 < < 0.6, que 0.5 < c1 = l(a1, 1) <
0, 0.75 < c2 = l(a1, 2) < 0.25 e 1.0 < c3 = l(a2, 2 ) < 0.5. Temos
assim doze alternativas considerando as variacoes extremas de e fixando
as consequencias, ora no seu valor mnimo, ora no maximo (ver figura ??).
0.4
0.6
l(c1)
0
-0.5
0
-0.5
l(c2)
-0.25
-0.75
-0.25
-0.75
l(c3)
-0.5
-1.0
-0.5
-1.0
128
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Fracasso
-1000
-4000
Sucesso
5000
10000
129
claro que:
1], representando sucesso da sociedade. E
r(a1 ) = E[u(a1, 1)] =
r(a2 ) = E[u(a2, 2)] = 10000 4000(1 ) = 14000 4000
Note que a opcao a1 e prefer ivel a` opcao a2 se e somente se 14000
4000 , onde a igualdade representaria a indiferenca entre essas opcoes.
A principal conclusao desta parte do exemplo e que a decisao, mesmo
nao se conhecendo exatamente o valor de e de , independe da variancia
de 1 no contexto, e claro, de um decisor neutro ao risco.
Para prosseguir com a analise, facamos 1 assumir seu valor mnimo,
respectivamente, maximo. Assim teremos:
14000 4000 = 1000
= 50000
implicando que = 3/14 = 0.21 ou = 9/14 = 0.64. Logo
(0.21, 0.64) quando 1 assume seus valores extremos. Assim as analises
de sensibilidade com respeito a podem se restringir a este intervalo.
Esses resultados podem ser resumidos num grafico representando os
pares de valores (, ), onde a diagonal descreve o conjunto de pontos de
indiferenca entre as acoes a1 e a2 . Os pares acima desta diagonal favorecem a escolha da acao a1 e os abaixo, a escolha de a2 . A caixa central
representa a regiao de sensibilidade aos valores de como mencionado
anteriormente.
Por exemplo, se perguntamos ao decisor os valores de e e ele
fornece duas alternativas: (i) (0.8, 2000) e (ii) (0.4, 1500), uma fora do
intervalo descrito acima e a outra na regiao, entao teremos muito mais
facilidade em decidir quando no segundo ponto do que no primeiro.Note
que:
E0.8[[u(a1, 2)]] = 0.8 10000 0.2 4000 = 7200
enquanto que
130
CAPITULO 5. ANALISE
DE SENSIBILIDADE
131
132
CAPITULO 5. ANALISE
DE SENSIBILIDADE
133
134
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Captulo 6
Programa
c
ao Din
amica
6.1
Introdu
ca
o
DINAMICA
CAPITULO 6. PROGRAMAC
AO
136
6.2
Para motivar a tecnica de programacao dinamica iniciaremos descrevendo uma classe especial de problemas de otimizacao. Sua principal caracterstica e a possibilidade de decompor a funcao objetivo em um n
umero
finito de estagios e, assim, introduzir a ideia central da programacao
dinamica, ou seja a otimizacao de tras para diante ou backward induction.
Esta ampla classe de problemas de programacao matematica fica definida por
otimizar
sujeito a
com
f1(x1 ) + + fn (xn )
x 1 + + xn b
xi > 0 e xi inteiros
(6.1)
6.2. UMA CLASSE DE PROBLEMAS DE OTIMIZAC
AO
137
tres est
agios de investimentos i = 1, 2, 3. O estado do processo no est
agio
138
DINAMICA
CAPITULO 6. PROGRAMAC
AO
6.3
Programa
ca
o din
amica
No captulo 3 aprendemos a resolver empiricamente um problema de decisao usando modelos graficos tais como arvores de decisao e diagramas
de influencia. Nos captulos 2 e 4 usamos sempre um espaco de acoes
e de estados da natureza discretos e com um n
umero finito de alternativas. Em geral este expediente e uma boa aproximacao, complementada por uma analise de sensibilidade (captulo 5). Agora e chegado o
momento de formalizar estas ideias e estabelecer um algortimo geral.
Estamos primordialmente interessados em resolver problemas de decisao
DINAMICA
6.3. PROGRAMAC
AO
139
140
DINAMICA
CAPITULO 6. PROGRAMAC
AO
ou, para simplificar, temporalmente (ainda que esta nocao possa ser artificial!). Os problemas multi-estagio podem ser convencionalmente formulados como um u
nico estagio, pagando-se o preco da complexidade
ou dimensionalidade. Como mencionado por Bellman (1957), se temos
N estagios e M decisoes possveis em cada estagio entao teremos um
problema N M -dimensional com um u
nico estagio.
A solucao que descreveremos agora decompoe o problema original em
N sub-problemas, mais simples, um para cada estagio. Assim a complexidade computacional crescera linearmente com o n
umero de estagios ou
sub-problemas e nao mais exponencialmente com o n
umero de variaveis.
Antes de prosseguirmos e introduzir o algortmo geral sera ilustrativo
apresentarmos uma solucao intuitiva do exemplo 6.2.
Exemplo 6.3 Continuacao do exemplo 6.2: Vamos reverter a ordem dos
o
est
agios iniciando, portanto, pelo est
agio i = 10. E
bvio que f10 = 0 e,
ent
ao, podemos passar imediatamente para o caso i = 9. Para tanto
utilizaremos a relaca
o fi = minj {di,j + fj }. Temos que avaliar f9 =
minj {d9,j , f10}. Como j s
o pode assumir o valor 10 e claro que f9 = 2
coincidindo com d9,10.
O pr
oximo caso ser
a ligeiramente mais elaborado. Quando i = 8,
j poder
a assumir os valores 9 ou 10. Logo temos de determinar f 8 =
min{d8,10 +f10, d8,9 +f9 }. Assim f8 = 5 e a soluca
o consistir
a em escolher
o caminho 8 9, onde i j representa a decis
ao de se caminhar do
vertice i para o j.
Facamos agora i = 7. Como este vertice esta conectado tanto ao
vertice 8 como ao 9 teremos: f7 = minj {d7,9 +f9 , f7,8 +f8}. Substituindose os valores das dist
ancias correspondentes chegamos a f 7 = 4 e portanto
a soluca
o ser
a 7 9. Assim do vertice 7 devemos seguir para o 9 e
dapara o 10, com uma dist
ancia total igual a 4 unidades. Logo a rota
alternativa 8 9 n
ao far
a parte da poltica o
tima uma vez que e mais
econ
omico seguir diretamente de 7 para 9 e da ao fim.
DINAMICA
6.3. PROGRAMAC
AO
141
10
0
9
2
7
4
8
5
5
7
4
11
3 2
12 13
1
14
6
16
Vamos agora descrever, em termos gerais, o algoritmo da programacao dinamica. Inicialmente trataremos somente de problemas com um
n
umero finito de estagios - T . Nosso problema consiste em determinar de
forma otima uma sequencia de acoes A = {a1, , aT }, condicionalmente
ao estado inicial do sistema. O espaco das acoes disponveis no t-esimo
estagio sera denotado por At e o espaco de estados da natureza, em cada
estagio, denotado por t , como introduzido no captulo 2.
claro que ao atingir o estagio t teremos uma historia descrita por:
E
Dt = {a1, , at , 1, , t } {A1 At, 1 t}
Para completar a descricao do problema devemos definir uma funcao
que descreva a dinamica dos estados da natureza. Seja
G : t1 At t
142
DINAMICA
CAPITULO 6. PROGRAMAC
AO
isto e: t = G(t1 , at). Esta funcao de evolucao dos estados, de natureza Markoviana, induz a distribuicao de probabilidade sobre t, que
sera denotada por p(t |at, t1). Esta distribuicao condicional sera especificada, na pratica, por uma funcao de probabilidade ou por uma funcao
de densidade dependendo de termos um espaco de estados discreto ou
contnuo.
Para cada acao at At fica definida a funcao de custo esperado
ct = E[c(t, at)|Dt1 ] =
onde Dt representa a informacao disponvel ate o instante t. Uma descricao grafica deste processo, atraves de um diagrama de influencia, foi
apresentado no captulo 3, figura 3.11.
Desejamos minimizar o custo esperado total dado o estado inicial 0
min{c1 + + cT }
A
DINAMICA
6.3. PROGRAMAC
AO
143
isto porque a escolha das decisoes presentes e futuras nao devem, possivelmente, influir no passado. Este problema mais simples envolve n = T t
variaveis de decisao, cuja solucao sera obtida sequencialmente desde n = 1
ate n = T , seguindo o princpio de optimalidade de Bellman, descrito
abaixo.
DINAMICA
CAPITULO 6. PROGRAMAC
AO
144
n=1:
f1() = max{cT }
n=2:
f2() =
aT
{aT 1 ,aT }
Genericamente teremos,
fn (n ) = minan {cn + E[fn1 (n |n )]}
onde a esperanca e sobre a distribuicao de (n |n1 , at ) induzida pela
evolucao dos estados da natureza.
6.3.1
Exemplos
Apresentaremos nesta secao tres exemplos. Comecaremos com o problema do investimento tratado como algo determinstico, continuaremos
com o exemplo de controle e, com o intuito de demonstrar o que se perde
pela abordagem sequencial, mostraremos o exemplo do profeta.
Consumo versus Investimento
Suponha que um indivduo deva decidir a cada instante de tempo t quanto
de sua renda devera ser utilizada para consumo e quanto destinado a
investimento. Suponha que seu capital inicial seja 0 e que ele decida
consumir, no instante t, at, 0 < at < t, investindo o restante a uma taxa
r (0, 1). Assim seu capital um perodo a frente sera dado por
t+1 = G(t , at) = (t at ), onde = (1 + r)
Estamos supondo que o investimento produz um ganho conhecido e certo,
caracterizando um problema determinstico. Neste exemplo nosso objetivo sera maximizar a utilidade decorrente do consumo realizado, a qual
sera dada por
1/2
u(t , at) = at
DINAMICA
6.3. PROGRAMAC
AO
145
u(a1) + + u(aT )
0 a t t
t+1 = (t at)
(6.2)
(6.3)
(6.4)
Para verificar este fato basta usar inducao. Por exemplo, f1() =
max0a
a1/2 = 1/2 pois a funcao de utilidade e monotona para a > 0. Logo,
a1 = . Usando 6.3, obtemos f2() = max0a {a1/2 + 1/2( a)1/2} e,
portanto, a2 = /(1 + ) e f2 () = (1 + )1/21/2. E assim por diante.
facil verificar que no caso de um problema sequencial com T estagios
E
e capital inicial 0 a solucao acima satisfaz
a0 = 0 /(1 + + + T 1 )
a1 = 2 0/(1 + + + T 1 )
DINAMICA
CAPITULO 6. PROGRAMAC
AO
146
aT
..
.
= 2T 0 /(1 + + + T 1 )
Seria interessante resolver este mesmo problema com funcoes de utilidade alternativas. Por exemplo: u(a) = 1 exp(a), a > 0 ou u(a) =
1 1/(1 + a). A figura 6.3 mostra a diferenca entre estas tres funcoes de
utilidade.
DINAMICA
6.3. PROGRAMAC
AO
147
pois
148
DINAMICA
CAPITULO 6. PROGRAMAC
AO
somente, correspondendo a: a0 - aceitar o premio e a1 - prosseguir no jogo. Estaremos assumindo que as variaveis aleatorias t sao independentes
e com esperanca t .
Analisaremos, inicialmente, dois casos extremos de tomada de decisao:
sem inspecionar os premios e inspecionando cada um deles. Obviamente,
o segundo caso so e disponvel para o Profeta. Assim teremos:
a) ganho esperado - Wm = max{1, . . . , T }
b) ganho esperado - Wp = E[max{1, . . . , T }]
Desejamos comparar esses ganhos maximos com uma terceira alternativa que corresponde a uma solucao sequencial, em T estagios. Intuitivamente teremos Wm Ws Wp , onde m refere-se ao procedimento
em media, p ao profeta e s ao procedimento sequencial. Pode-se verificar
que Ws e Wp sao muito maiores que Wm e, alem disto, que Wp 2Ws , ou
seja que um decisor usando o procedimento sequencial pode ganhar pelo
claro que este e um demenos a metade do que ganharia o Profeta. E
cisor muito especial pois tem o poder da clarevidencia ou da informacao
perfeita. Uma demonstracao destes fatos e varias referencias sobre formas alternativas da desigualdade do Profeta podem ser encontradas em
Bather (2000).
No caso sequencial a utilidade de se parar no t-esimo estagio sera dada
por ut (a0) = s e a de prosseguir sera denotada por ut(a1 ). No estagio
final -T - a utilidade esperada sera obviamente
f1 (T ) = E[uT (a0 )] = T
pois necessariamente o jogo terminara. No estagio anterior, T 1, ou
aceitamos o premio de T 1 ou esperamos para examinar T . Assim
f2 (T 1) = E[max{T 1, f1 (T } = E[max{T 1, T }]
E PROGRAMAC
DINAMICA
6.4. ARVORE
DE DECISAO
AO
149
(6.5)
para n = 1, . . . , T 1.
Caso Particular: Suponha que 1 , . . . , T sao variaveis aleatorias independentes e identicamente distribuidas segundo uma uniforme em (0, 1).
facil obter neste caso que
E
Wp = E[max{1, . . . , T }] =
[1 F T ()]d
n
claro que Wm = 1 pois
onde F T () = yI(0,1)(y). Assim Wp = (n+1)
. E
2
todos os s tem medias iguais. Verificamos neste exemplo que Wp Wm ,
com a igualdade valendo somente pra n = 1. Falta somente avaliar a
E[max{, w}] = w +
[1 F ()]d
ws,n1
(1 )d
1
2
[1 + ws,n1
], n 2
2
6.4
Arvore
de decis
ao e programa
ca
o din
amica
DINAMICA
CAPITULO 6. PROGRAMAC
AO
150
n
Wp
Ws,n
1
0.5
0.25
2
4
10
0.667 0.800 0.909
0.531 0.705 0.852
20
0.952
0.917
(1)
(t)
(1)
onde, para cada acao ai A(t), fica definida a funcao de utilidade esperada
u
(t)
(t)
(ai )
(t)
(t)
= E[u( , a )|Dt1 ] =
kt
X
j=1
(t)
(t)
Para completar esta notacao devemos definir uma funcao que descreva
a dinamica dos estados da natureza. Seja
G : (t1) A(t1) t
isto e, t = G(t1 , at1). Esta funcao de evolucao dos estados, de natureza Markoviana, induz a distribuicao de probabilidade sobre (t) , que
E PROGRAMAC
DINAMICA
6.4. ARVORE
DE DECISAO
AO
151
sera denotada por p((t) |at1, t1). Na pratica esta distribuicao condicional sera especificada por uma funcao de probabilidade ou por uma
funcao de densidade.
P kt
j=1
T
uTi,j (i,j
|DT 1 )
DINAMICA
CAPITULO 6. PROGRAMAC
AO
152
kt
X
=1
t
uti,j (i,j
|Dt1 ), para t = 1, . . . , T 1
uti,j = max{ut(ati), t = 2, . . . , T 1}
(6.6)
6.5
Op
co
es reais: uma introdu
ca
o
Esta secao trata de um tema classico em Economia, a alocacao de recursos ou investimentos sob incerteza. Da mesma maneira que as opcoes de
compra no mercado financeiro, as opcoes reais representam direitos, sem
obrigacao de adquirir ou trocar um ativo por um preco especificado. A
possibilidade de se considerar deferimento, abandono e contracao de um
investimento tem revolucionado a teoria moderna de alocacao de recursos.
bem conhecido, hoje em dia, que o metodo tradicional do fluxo de caixa
E
descontado nao permite revisar e adaptar decisoes em respostas a desenvolvimentos inesperados do mercado. Modernamente, todavia, deseja-se
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
153
um metodo capaz de considerar as incertezas futuras e incorporar, dinamicamente, as informacoes que chegam ao mercado, recalculando os
fluxos de caixa descontados.
Alguns conceitos proprios da area de opcoes reais serao inicialmente
apresentados, visando caracterizar aspectos essenciais de um investimento. A seguir, apresentaremos um exemplo com o objetivo de mostrar que
o metodo convencional do valor presente lquido, tao ensinado ainda hoje
nas escolas de business, pode levar a conclusoes duvidosas. Este mesmo
exemplo sera reanalisado atraves das tecnicas de programacao dinamica,
produzindo solucoes muito mais coerentes.
Os conceitos centrais na abordagem de opcoes reais sao: irreversibilidade, incerteza sobre retornos futuros e temporalidade.
Defini
ca
o 6.1 A propriedade de irreversibilidade caracteriza basicamente
uma classe de investimentos cujo valor inicialmente investido e parcialmente ou integralmente perdido.
Nao e recuperavel se voce deseja modificar, no futuro, sua decisao
presente. Um exemplo seria a aplicacao numa fabrica cujo produto e
extremamente especfico e as maquinas nao sendo adaptaveis para outras
finalidades.
Outra caracterstica e que os retornos futuros s
ao incertos, de sorte
que so podem ser descritos probabilisticamente, sem perda de generalidade, atraves de uma distribuicao discreta. Por exemplo, o comportamento do mercado futuro para os componentes produzidos por nosso
investimento variara no futuro em funcao de varios fatores de mercado.
Finalmente, a temporalidade diz respeito a caracterstica de que a decisao
de investir pode ser postergada ate dispor-se de mais informacoes sobre o
futuro. Estas caractersticas estao frequentemente presentes em decisoes
sequenciais sobre investimentos e se encaixam naturalmente na forma de
analise que desenvolvemos nesse captulo.
154
DINAMICA
CAPITULO 6. PROGRAMAC
AO
Exemplo 6.5 A ttulo de exemplo imaginemos uma firma que deseja decidir sobre investir ou n
ao em uma f
abrica de componentes mec
anicos.
O investimento e irreversvel, pois os equipamentos s
ao especficos para a
produca
o deste particular tipo de componente. Por exemplo, se o mercado para este componente mec
anico acabar, ser
a impossvel recuperar (ou
desinvestir) os gastos realizados.
A firma tem um custo de instalaca
o I, instant
aneo e a produca
o e de
uma unidade por ano, para simplificar. O preco do componente mec
anico
e de 200 u.m., no momento, mas certamente se modificar
a no pr
oximo
ano. Isto e, com probabilidade crescer
a para 300 u.m. ou cair
a para
100 u.m. Para manter o exemplo simples admitiremos que o preco ficar
a
constante no restante do horizonte de decis
ao. Alem disto, ser
a suposto
ainda que a taxa de juros e de 10% e livre de risco.
Assim, se = 0.5 e I = 1600 u.m., ent
ao o valor presente lquido do
investimento ser
a:
V P L1 = 1600 +
200
= 600
t
t=0 (1 + 0.10)
Este c
alculo, t
ao frequentemente usado para se decidir por realizar ou
n
ao certo investimentos, esta incorreto pois ignora o custo de oportunidade de investir agora ao inves de esperar ou ate mesmo n
ao investir,
caso o preco caia, por exemplo. Suponha que aguardamos um perodo e
investimos somente se o preco subir para 300 u.m. O valor presente neste
caso seria
"
1600 X
300
+
= 773
V P L2 = 0.5
t
1.1
t=1 (1 + 0.10)
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
155
i) se a u
nica alternativa disponvel para o tomador de decis
ao for investir
ou n
ao no instante inicial, a escolha seria realizar o investimento.
ii) se, entretanto, a decis
ao for sequencial, isto e: existir a opca
o de
aguardar para decidir se investe ou n
ao amanh
a, ent
ao a escolha ser
a exercer a opca
o, dado que estamos assumindo que o preco
subiu.
Para isto e preciso que o investimento seja irreversvel e sequencial. Note
que nem sempre e possvel adiar a decis
ao de investir por quest
oes de
concorrencia, patentes que est
ao por expirar, etc. A pergunta que se
coloca e: Quanto vale a flexibilidade de se poder investir no proximo ano
ao inves de agora ou nunca?. No exemplo, o custo de oportunidade ou
valor da opca
o flexvel foi de 773 600 = 173. Em geral, teremos ainda a
quest
ao: Qual o valor do investimento I , no proximo perodo, equivalente
a I? A soluca
o ser
a determinar o valor de um investimento flexvel com
valor presente lquido igual ao da proposta do agora ou nunca. Logo,
"
I X
200
V P L = 0.05
+
= V P L1
t
1.1
t=1 (1 + 0.10)
1
I = 3300 0.5
1.1
1
V P L1 = 1980
Op
co
es Reais: analogia com op
co
es financeiras
Inicialmente vale a pena observar a analogia com uma opcao do tipo call
no mercado de acoes. A opcao real da o direito de exerce-la ou nao para
DINAMICA
CAPITULO 6. PROGRAMAC
AO
156
1 = F 1 n p 1 =
1700 300 n
100 n
se subir
se cair
n = 8.5
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
157
Programa
c
ao din
amica: aplica
c
ao a op
co
es reais
Relembrando, na tecnica de programacao dinamica uma sequencia de
decisoes e particionada em somente duas: a decisao imediata e uma funcao
de valor que contempla as consequencias de todas as decisoes passadas.
Esta e uma propriedade de natureza Markoviana.
O horizonte de planejamento pode ser finito ou nao. Se finito (n),
entao a decisao no u
ltimo estagio sera obtida de uma otimizacao estatica,
pois nada seguira a ela. Esta otimizacao fornecera a consequencia a ser
utilizada - funcao de valor - no pen
ultimo estagio. Assim o novo problema
de decisao considera a decisao do estagio n 1 e a funcao de valor do
estagio n. Pode-se progredir assim ate a condicao inicial.
Vamos comecar examinando o nosso problema somente em dois perodos.
Lembre-se que
p1 =
(1 + u) p0 ,
(1 d) p0 ,
cp
cp 1
158
DINAMICA
CAPITULO 6. PROGRAMAC
AO
+
+
1 + r (1 + r)2
pois estamos supondo que a partir do perodo 2 os precos serao estaveis.
Temos, entao, a serie de valores futuros medios descontados para o perodo
inicial. A expressao acima se simplifica para
E[V0 |D0 ] = p0 [1 + r + (u + d) d]/r
Assim, se E[V0 |D0 ] I > 0 entao realizo o investimento. A quantidade max{E[V0|D0 ] I, 0} sera o lucro, tambem denominado de valor de
termino no tempo 0. No caso (ii) temos de calcular:
"
1
1
1+r
+
+ p1
V1 = p 1 + p 1
2
(1 + r) (1 + r)
r
A firma decidira pelo investimento somente se V1 > I, produzindo um
ganho lquido de F1 = max{V1 I, 0}. Vale mencionar que, da otica do
perodo zero, p1 e uma quantidade aleatoria tanto quanto F1 e V1 . Assim
1+r
I, 0}
r
1+r
+ (1 ) max{(1 d)p0
I, 0}
r
Esta quantidade sera denominada de valor esperado de continuacao ou
simplesmente valor de continuacao. Voltando ao perodo inicial teremos:
E[F1|D0 ] = max{(1 + u)p0
1
E[F1|D0 ]
1+r
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
159
An
alise do problema com m
ultiplos perodos
No exemplo que acabamos de abordar tinhamos, por conveniencia, so claro que em situacoes reais m
mente dois perodos. E
ultiplos perodos e
tempo contnuo sao, em geral, a regra. Por ora, entretanto, descreveremos
as incertezas atraves de processos markovianos discretos. Vale mencionar
que os processos de difusao podem ser vistos como caso limite de passeios
ao acaso em tempo discreto.
Embora a teoria da programacao dinamica estocastica seja totalmente
geral insistiremos no exemplo do investimento. Denotemos por , escalar
ou nao, o estado da natureza que descreve o status corrente da firma, o
qual afeta sua operacao e oportunidades de expansao. Assumiremos que
t = t1 + t ou seja p(t |t1). No tempo t a firma devera realizar uma
decisao que denotamos por a. No nosso exemplo a e uma quantidade
binaria caracterizando investir ou nao investir, mas em muitas aplicacoes
podera ser uma variavel contnua, ate mesmo vetorial. Por exemplo, a
poderia ser a dupla escolha do investimento e da contratacao mao de obra
temporaria. A funcao de valor c(t, at ) e a distribuicao de probabilidade
p(t+1 |t, at) permitem calcular as parcelas necessarias a` obtencao da sequencia {at} nao se esquecendo do fator de desconto (1 + r)1 , onde r e
160
DINAMICA
CAPITULO 6. PROGRAMAC
AO
An
alise considerando o horizonte infinito
Como nao dispomos da funcao de valor num ponto final do horizonte de
planejamento, nao podemos implementar a inducao de tras para a frente.
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
161
1
F () = max u(, a) +
E[F (0)|, a]
a
1+r
162
DINAMICA
CAPITULO 6. PROGRAMAC
AO
Captulo 7
MUE via m
etodos Monte
Carlo
Relembrando os captulos anteriores, o problema de maximizacao da utilidade esperada e o problema central da teoria da utilidade. Do ponto de
vista inferencial, o problema Bayesiano e simples e pode ser genericamente
tal que
visto como a busca da decisao otima, d,
d = arg max U (d)
(7.1)
(7.2)
dD
para
U (d) =
onde pd (y, d) = pd (y|d)pd (d ) e pd (y|d) e pd (d ) representam, respectivamente, o modelo e a distribuicao mais recente de d quando a decisao
for d.
Por exemplo, quando o interesse esta em estimar pontualmente o parametro e a funcao de utilidade e u(d, , y) = ( d)2, a decisao otima,
se iguala a` esperanca de com respeito a pd (|y) (ver, por exemplo,
d,
DeGroot 1970). Entretanto, somente em problemas triviais e de pouco
163
164
7.1
165
Simulando da priori: d pd (d )
Simulando do modelo:y pd (y|d)
Dessa forma, para cada d, U (d) pode ser aproximada por
Ub (d)
M
1 X
(i)
=
u(d, d , y (i))
M i=1
(7.3)
(i)
onde os pares (d , y (i)), para i = 1, . . . , M sao gerados a partir do procedimento em dois passos mencionado acima. Esse procedimento representa
simplesmente a solucao de uma integral pelo simples metodo de Monte
Carlo (veja, por exemplo, Geweke (1989)).
Claramente, se no instante da tomada de decisao x p(x|d ) e observado, a expressao em (7.2) e facilmente reescrita por:
U (d) =
(7.4)
assumindo que p(y|d , x) = p(y|d ). Dessa forma, o primeiro passo do algoritmo apresentado acima seria amostrar d de p(d |x). Esse passo geralmente envolve simulacao de d atraves de metodos MCMC, dependendo
da complexidade de p(d |x). Esse tipo de situacao e bastante comum, por
exemplo em estudos medicos onde decisoes devem ser tomadas com base
na informacao obtida atraves de observacoes (estudos, pacientes, etc) preexistentes. Uma outra situacao comumente encontrada por investidores e
a alocacao de recursos em uma carteira de acoes, moedas, taxas de juros,
etc. O investidor inteligente baseara sua alocacao em modelos probabilsticos que levem em consideracao todas as observacoes dos mercados
(de acoes, juros, cambio, etc.), ate o instante da tomada da decisao (ver
Aguilar and West (2001) e Lopes and Migon (2002), por exemplo).
CAPITULO 7. MUE VIA METODOS
MONTE CARLO
166
7.2
167
7.3
Clyde, M
uller, and Parmigiani (1995) e Bielza, M
uller, and Rios-Insua
(1999) propuseram um metodo aproximado que incorpora o espaco das
decisoes aos espacos dos parametros e dos observaveis e utiliza metodos
Monte Carlo via cadeias de Markov. Esse metodo aproxima a decisao
otima atraves da moda da distribuicao marginal de d. Mais especificamente, define-se uma distribuicao artificial
h(d, , y) u(d, , y)p()pd (y|)
(7.5)
h(d,
u
g(d0 |d)
A=
=
(7.6)
0 ) p (,
y)
0)
h(d0 , , y) g(d|d
u0 g(d|d
d
CAPITULO 7. MUE VIA METODOS
MONTE CARLO
168
6. Faca
(d1 , u1) =
u
(d,
)
com prob.
0
0
(d , u ) com prob. 1
7.3.1
T
empera simulada em problemas de decis
ao
Apesar de colocado em segundo plano, o problema da obtencao da moda de h pode ser tao ou mais complicado do que o procedimento de
amostragem a partir de h. Em muitos casos, como veremos na secao
de exemplos, a funcao de utilidade esperada nao possui um maximo que
possa ser facilmente encontrado pelos metodos tradicionais. A inspecao
visual, de histogramas, torna-se impraticavel quando p, a dimensao do
169
vetor de decisoes, e maior que dois. Em geral, a funcao de utilidade e virtualmente a mesma para um conjunto grande de decisoes; decisoes essas
que nao necessariamente sao similares. Portanto, e necessario se pensar
em formas mais eficazes de encontrar o maximo de uma funcao com essas
caractersticas e que esta representada apenas por um conjunto finito,
mas grande, de pares (d, u).
M
uller (1999) sugere substituir U (d) por uma transformacao do tipo
potencia, U J (d), uma vez que para J suficientemente grande a funcao se
concentrara ao redor do maximo de U (d). Esse efeito pode ser alcancado
atraves da seguinte modificacao em h(d, , y)
hj (d, 1 , y1, . . . , J , yJ )
J
Y
u(d, j , yj )pd (j , yj )
(7.7)
j=1
de tal sorte que hJ (d) U J (d), como desejado. Com essa modificacao
para evidenciar as modas em utilidades muito planas, o algoritmo 1 pode
ser reescrito da seguinte forma.
Algoritmo 2: Simulando de U J (d)
1. Valor inicial para a decisao: d0
2. Simule (j , yj ) a partir de pd0 (, y) e compute u0 =
QJ
j=1
u(d0 , j , yj ).
0)
3. Valor proposto para a decisao: gera-se d a partir da proposta g(d|d
4. Simule (j , yj ) a partir de pd(, y) e compute u
=
QJ
j=1
j , yj ).
u(d,
u
g(d0 |d)
h(d,
=
(7.8)
A=
0 ) p (,
y)
0)
h(d0 , , y) g(d|d
u0 g(d|d
d
CAPITULO 7. MUE VIA METODOS
MONTE CARLO
170
6. Faca
(d , u ) =
u
(d,
)
com prob.
0
0
(d , u ) com prob. 1
7.4
Exemplos
Nessa secao ilustraremos os metodos citados acima com problemas de decisao encontrados em M
uller and Parmigiani (1995), Clyde, M
uller, and
Parmigiani (1993), M
uller (1999). Aplicacoes interessantes e recentes
podem ser encontradas em Parmigiani, Berry, Iversen Jr., M
uller, Schildkraut, and Winer (1997), Sanso and M
uller (1997), Rios-Insua, Slewicz,
M
uller, and Bielza (1996), Bielza, M
uller, and Rios-Insua (1999), Parmigiani and M
uller (1994),Stroud, M
uller, and Rosner (1999),M
uller and
Palmer (1997), entre outros.
Sanso and M
uller (1997) consideram o problema de como reduzir de
80 para 40 o n
umero de estacoes de monitoracao de chuva no estado de
Guarico na Venezuela. Em seu problema o objetivo e minimizar os custos e ainda ter um m inimo de controle sobre a quantidade de chuva nas
diversas regioes do estado. Parmigiani, Berry, Iversen Jr., M
uller, Schildkraut, and Winer (1997) estudam a propensao genatica do cancer de mama onde um dos problemas mais importantes e a predicao da propensao
genetica baseando-se na historia familiar do paciente e fatores de risco.
Ja Stroud, M
uller, and Rosner (1999) consideram o problema da escolha
do instantes de tempo para aplicacao de um certo medicamento contra
7.4. EXEMPLOS
171
um certo tipo de cancer baseando-se em modelos que descrevem o comportamento farmacocinetico e farmacodinamico da droga. Similarmente,
M
uller and Palmer (1997) estudam a escolha dos intantes de tempo para
coleta de sangue (celulas tronco) em pacientes com cancer. A funcao objetivo e a maximizacao do n
umero de celulas tronco num menor n
umero
possvel de coletas.
Iniciaremos com um exemplo onde a solucao exata e facilmente obtida.
7.4.1
2/n
2
+
x
2 /n + 2
2/n + 2
n = / c 2 / 2
Para valores de , , e c iguais a 1.0, 0.0, 1.0 e 0.01, respectivamente,
o tamanho amostral otimo e igual a 9 observacoes. Isso esta ilustrado
na Figura 7.1(a). A figura 7.1(b) ilustra a utilizacao do algoritmo Monte
Carlo (secao 7.1), com M=10.000 amostras para n = 1, . . . , 20. A performance do metodo proposto por M
uller and Parmigiani (1995) (secao 7.2) e
apresentada nas figuras 7.1(c,d). Nesse caso foram utilizados M = 10000
172
Figura 7.1: (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui ) e (d)
Curva ajustada (loess no S-plus). Valores fixados: (, , , c) =
(1.0, 0.0, 1.0, 0.01).
pares (n, u) para o ajuste de curva, que foi feito utilizando a funcao loess
do S-plus. Essa aproximacao sugere n = 8 observacoes.
A figura 7.2 apresenta resultados analogos para a situacao em que
= = 3.0. Note que, contrario a` primeira situacao, aqui a valor aproximado para n e superior ao verdadeiro, n = 29. Esse exemplo ilustra as
potencialidades das tecnicas apresentadas nesse capitulo bem como suas
limitacoes, mesmo em problemas relativamente simples e unidimensionais.
Finalmente, a figura 7.3 mostra o resultado do algoritmo 2 (secao
7.4. EXEMPLOS
173
Figura 7.2: (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui) e (d)
Curva ajustada (loess no S-plus). Valores fixados: (, , , c) =
(3.0, 0.0, 3.0, 0.01).
7.3.1) para J = 20. A aproximacao nao e tao boa quando aquelas encontradas aplicando-se os outros metodos. Entretanto, em situacoes mais
complexas esse metodo certamente sera a u
nica alternativa pratica de
uso.
7.4.2
M
uller and Parmigiani (1995) ilustram o metodo apresentado na secao
7.2 no problema da escolha do tamanho amostral em um experimento
CAPITULO 7. MUE VIA METODOS
MONTE CARLO
174
U (n) =
n
1X
0 y=0
(7.9)
7.4. EXEMPLOS
175
1
! a+1
1
0.2023
a
b
n
=
1
b
0.0008
que vale n
= 29. Eles ainda exploram o formato da funcao de utilidade e
percebem que ela pode ser parcialmente integrada analiticamente quando
reescrita da seguinte forma
U (n) =
n Z
X
y=0 0
[|my | 0.0008n]p(|y)dm(y)
(7.10)
7.4.3
Defibrila
c
ao do cora
c
ao
Em Clyde, M
uller, and Parmigiani (1993) (CMP) o problema de decisao
e a escolha da potencia de um defibrilador para o coracao em pacientes
176
Figura 7.4: As linhas fina e grossa representam, respectivamente, os valores aproximado e verdadeiro de U (n) (M
uller and Parmigiani, 1995).
com problemas cardacos. Esses aparelhos diminuem a mortalidade devida a` ataques cardacos. Para pacientes com fibrilacao, o defibrilador
descarrega um pulso especfico de energia de forma a fazer o coracao do
paciente retomar seu batimento normal.
Em geral, o medico fibrila o coracao do paciente varias vezes (tipicamente de 3 a 12 vezes) com potencias diferentes, xi para encontrar aquela
necessaria para defibrilacao. Infelizmente, cada um desses testes aumenta
o risco de serios problemas cardacos, o que torna a escolha do n
umero
de testes e seus respectivos nveis de energia uma questao de extrema
importancia.
Uma das estrategias e implantar o aparelho a um nvel de energia que
o faca defibrilar 95% das vezes que o coracao do paciente apresente falha
(ED95). Em CMP, para cada xi (nvel de energia), o experimentador
observa uma resposta binaria, yi , onde yi = 1 indica que o aparelho
funcionou corretamente e yi = 0 indica que defibrilacao nao ocorreu, ou
7.4. EXEMPLOS
177
V ar(log()|y, D)p(y|D)dy c
178
7.4. EXEMPLOS
179
180
Refer
encias
Aguilar, O. and M. West (2001). Bayesian dynamic factor models
and variance matrix discounting for portfolio allocation. Journal
of Business and Economic Statistics 18, 338357.
Allais, M. (1953). Le comportement de lhomme rationnel devant le
risque: critique des postulats et axiomes de lecole americaine.
Econometrica 21, 503546.
Bather, J. (2000). Decision Theory-an introduction to dynamic programming and sequential decisions. John Wiley, New York.
Bellman, R. (1957). Dynamic Programming. Princeton University
Press.
Berger, J. (1985). Statistical Decision Theory and Bayesian Analysis.
Springer-Verlag.
Bernardo, J. and A. Smith (1994). Bayesian Theory. John Wiley, New
York.
Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis. Commentarii academiae scientiarum imperialis Petropolitanae 5, 175
192.
Bielza, C., P. M
uller, and D. Rios-Insua (1999). Decision analysis by
augmented probability simulation. Management Science 45, 995
1007.
181
182
REFERENCIAS
Brier, G. (1950). Verification of forecasts expressed in terms of probability. Monthly Weather Review 78, 13.
Bunn, D. W. (1984). Applied Decision Analysis. McGraw-Hill.
Clemen, R. (1996). Making Hard Decisions: An Introduction to Decision Analysis. International Thomson Publishing.
Clyde, M., P. M
uller, and G. Parmigiani (1993). Optimal design for
heart defibrillators. Discussion paper 93-27, Institute of Statistic
and Decision Science.
Clyde, M., P. M
uller, and G. Parmigiani (1995). Exploring expected
utility surfaces by markov chains. Discussion paper 95-39, Institute
of Statistic and Decision Science.
de Finetti, B. (1937). Foresight: Its logical laws, its subjective sources.
Wiley.
de Finetti, B. (1974). The Theory of Probability (2 volumes). New York:
John Wiley.
DeGroot, M. H. (1970). Optimal Statistical Decisions. Mc Graw-Hill.
Dixit, A. and R. Pindyck (1994). Investment under uncertainty. Princeton University Press, Princeton, New Jersey.
Ferguson, T. (1967). Mathematical statistics: a decision theoretic approach. Academic Press, New York.
Fishburn, P. C. (1981). Subjective expected utility: A review of normative theories. Theory and Decision 13, 139199.
Fishburn, P. C. (1982). The Foundations of Expected Utility. Dordrecht:
Reidel.
French, S. (1989). Readings in Decision Analysis. Chapman Hall.
French, S. and D. Rios-Insua (2000). Statistical Decision Theory. Edward Arnold: London.
REFERENCIAS
183
184
REFERENCIAS
REFERENCIAS
185
186
REFERENCIAS