Migonehedibert

An
alise Bayesiana de Decis

oes
Aspectos Pr
aticos
Helio S. Migon1
Hedibert F. Lopes
Universidade Federal do Rio de Janeiro (UFRJ)
Endereco para correspondencia: Universidade Federal do Rio de Janeiro

(UFRJ), Caixa Postal 68530, CEP 21945-970, Rio de Janeiro RJ - Brazil,
Fax: 55-21-2290 1095, telefone: 55-21-2562-8290, emails: migon@im.ufrj.br
e hedibert@im.ufrj.br
Pref
acio
Esta monografia tem origem em notas de aulas ministradas em cursos
do bacharelado de Estatstica e do mestrado de Pesquisa Operacional da
UFRJ. A motivacao para preparar este texto vem de duas fontes alternativas. A primeira, e mais obvia, e a inexistencia de textos cobrindo esta
sorte de conte
udo num nvel adequado. Alem disso, as tentativas de se
escrever sobre esse topico, ca no Brasil, foram sempre muito limitadas,
nao passando, em geral, da descricao dos elementos basicos da teoria
de decisao. A segunda, talvez de maior desafio, decorre da inexistencia
dessa disciplina nas nossas graduacoes de estatstica. Pretendemos que
esta monografia colabore para reverter esta posicao paradoxal.
Nossa proposta neste texto e combinar aspectos teoricos e praticos.
O termo analise de decisoes e um reconhecimento de que a disciplina de
tomada de decisoes vai alem da descricao dos formalismos matematicos,
como por exemplo, a axiomatizacao da teoria de utilidade e os tecnicismos da inferencia estatstica. Alguns aspectos que merecem destaque sao
a abordagem de modelos graficos: diagramas de influencia e a
rvores de
decis
ao e a introducao a` programacao dinamica estocastica. A discussao
de metodos de maximizacao da utilidade esperada atraves de tecnicas de
Monte Carlo e outro aspecto de extrema importancia pratica. Os meritos
deste trabalho, esperamos, estao na forma como o material coletado de
diversas fontes de extremo valor aplicado e teorico esta organizado. Dentre os textos classicos que influiram na organizacao desta monografia,
i
ii
destacamos DeGroot (1970), Lindley (1971), Bunn (1984) e, mais recentemente, Clemen (1996) e French and Rios-Insua (2000).
Como ja mencionamos, o nvel do livro e adequado para alunos de
graduacao em Estatstica, Atuaria e Pesquisa Operacional, que tenham
um mnimo de conhecimentos de Inferencia Estatstica. Sera u
til, tambem,
para alunos de Administracao e Economia, em nvel de pos-graduacao.
Embora pretendamos que este seja um livro texto em analise de decisoes,
nessa versao nao inclumos exerccios selecionados ao final dos captulos.
O material como um todo pode ser aplicado em cursos de um perodo letivo, cerca de 45 horas. Os captulos 1, 2, 3 e 5 sao essenciais para principiantes, pois introduzem nocoes elementares de teoria da decisao, bem como
mecanismos de solucao e avaliacao de problemas de decisao (arvores de decisoes, diagramas de influencia, analise de sensibilidade). Os captulos 4,
6 e 7 introduzem metodologia mais avancada. No captulo 4 introduzemse, resumidamente, os fundamentos que tornam cientificamente coerente
a teoria da decisao vista nos outros cap tulos. Os captulos 6 e 7 tratam,
respectivamente, de problemas de decisoes sequenciais e da aplicacao de
metodos Monte Carlo para a solucao do problema da maximizacao da
utilidade esperada. Portanto, acreditamos que essa monografia possa ser
flexivelmente utilizada para cursos introdutorios (graduacao) bem como
para cursos intermediarios (mestrado).
Varias pessoas colaboraram, de uma forma ou de outra e em varios
estagios, para tornar viavel a elaboracao desse trabalho. Alguns exemplos mencionados neste texto tiveram origem em temas de iniciacoes
cientficas e dissertacoes de mestrado que supervisionamos nos u
ltimos
anos no IM e na COPPE/UFRJ. Destacamos a colaboracao de Alcione
Miranda (doutoranda de Pesquisa Operacional) em aplicacoes do pacote
DPL, alem da elaboracao de varios graficos, juntamente com Andre Luiz
Silva e Lilian Migon. Agradecemos a Giovanni Parmigiani e Lurdes Inoue que, juntamente com o segundo autor (HFL), gentilmente cederam
alguns captulos de seu livro Statistical Decision Theory, com publicacao
iii
prevista para 2003.
Finalmente agradecemos a Associacao Brasileira de Estatstica (ABE)
- pela oportunidade de apresentar este conte
udo no XV Simposio Nacional
de Probabilidade e Estatstica (SINAPE). Certamente muitas omissoes e
varios erros serao detectados pelos eventuais leitores, aos quais pedimos,
desde ja, desculpas. Todas as crticas e comentarios serao seriamente consideradas e contribuirao para tornar mais completa uma proxima edicao
revisada e ampliada deste material.
Rio de Janeiro, 25 de marco de 2002.

HSM e HFL
iv
Sum
ario
1 Introdu
ca
o
1.1 Uma breve nota historica
1.2 Sobrevoando o livro . . .
1.3 Notacao basica . . . . .
1.4 Organizacao do Livro . .
.
.
.
.
3
3
5
16
17
.
.
.
.
.
.
.
.
.
23
24
29
34
36
38
43
46
50
55
3 Modelos Gr
aficos
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . .
3.3 Diagrama de influencia e arvore de decisao . . . . . . . . .
61
61
63
68
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Conceitos B
asicos
2.1 Elementos da analise de decisoes . . . .
2.2 Especificando a funcao de perda . . . .
2.3 Funcao de perda nao negativa . . . . .
2.4 Concavidade do risco de Bayes . . . . .
2.5 Problema de decisao com e A finitos
2.6 Revisitando a regra minimax . . . . . .
2.7 Problema de decisao usando dados . .
2.8 Analise de risco . . . . . . . . . . . . .
2.9 Dominancia estocastica . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

SUMARIO
vi
3.4
Introducao ao DPL . . . . . . . . . . . . . . . . . . . . . . 78
4 Probabilidade subjetiva e utilidade

4.1 Dutch book e regras escore . . . . . . . . . .
4.2 Utilidade . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Paradoxo de Saint Petersburg . . . . . .
4.2.2 Teorema de von NeumannMorgernstern
4.3 M
ultiplos atributos . . . . . . . . . . . . . . . .
4.4 Medidas de aversao ao risco . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
89
92
97
98
98
103
105
5 An
alise de Sensibilidade
5.1 Introducao . . . . . . . . . . . . . . . . . . . .
5.2 Identificacao e estrutura . . . . . . . . . . . .
5.3 Exemplo de analise preliminar de sensibilidade
5.4 Conceitos basicos de analise de sensibilidade .
5.5 Sensibilidade da distribuicao a priori . . . . .
5.6 Sensibilidade conjunta: priori e utilidade . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
109
109
110
113
118
122
126
6 Programa
ca
o Din
amica
6.1 Introducao . . . . . . . . . . . . . . . . . .
6.2 Uma classe de problemas de otimizacao . .
6.3 Programacao dinamica . . . . . . . . . . .
6.3.1 Exemplos . . . . . . . . . . . . . .
6.4 Arvore
de decisao e programacao dinamica
6.5 Opcoes reais: uma introducao . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
135
. 135
. 136
. 138
. 144
. 149
. 152
7 MUE via m
etodos Monte Carlo
7.1 Aproximando U (d) via Monte Carlo . . . . . . . . .
7.2 Ajuste da curva de utilidade . . . . . . . . . . . . .
7.3 Simulando o modelo aumentado . . . . . . . . . . .
7.3.1 Tempera simulada em problemas de decisao
7.4 Exemplos . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
163
164
166
167
168
170

SUMARIO
7.4.1
7.4.2
7.4.3
vii
Tamanho amostral da Normal . . . . . . . . . . . . 171
Tamanho amostral da Binomial . . . . . . . . . . . 173
Defibrilacao do coracao . . . . . . . . . . . . . . . . 175
viii
SUMARIO
Lista de Figuras
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
Diagrama de influencia . . . . . . . . . . . . . . . . . . .
Arvore
de decisao inicial . . . . . . . . . . . . . . . . . .
Solucao via arvore de decisao . . . . . . . . . . . . . . .
Valor monetario esperado. a1 - linha cheia; a2 - linha pontilhada; a3 - linha tracejada. . . . . . . . . . . . . . . . .
Decisoes sequenciais: diagrama de influencia . . . . . . .
Decisoes sequenciais: arvore de decisao . . . . . . . . . .
Decisoes sequenciais: solucao . . . . . . . . . . . . . . . .
Diagrama de influencia para informacao imperfeita . . .
.
.
.
7
8
8
.
.
.
.
.
9
11
20
21
21
Funcoes de perda alternativas em problemas de estimacao:

perda zero-um (linha cheia), perda quadratica (linha pontilhada) e perda absoluta (linha tracejada). . . . . . . . . .
Concavidade do risco de Bayes: n(A) < (figura da esquerda); n(A) = (figura da direita). . . . . . . . . . . .
Efeito da imprecisao sobre : incremento no risco de Bayes
Representacao grafica de G . . . . . . . . . . . . . . . . . .
Poliedro convexo; caso k = 2 e m = 6 . . . . . . . . . . .
Regra minimax - determinacao grafica . . . . . . . . . . .
Regra minimax - determinacao grafica . . . . . . . . . . .
Admissibilidade da regra de Bayes . . . . . . . . . . . . . .
Risco de Bayes - exemplo com dados . . . . . . . . . . . .
ix
31
38
39
40
43
45
46
47
51
LISTA DE FIGURAS
2.10 F domina G estocasticamente em primeira ordem. . . . . . 57
2.11 G e um espalhamento de F com preservacao da media. . . 58
3.1
3.10
3.11
3.12
3.13
3.14
3.15
3.16
3.17
Rede Bayesiana: cada no refere-se a uma variavel aleatoria

dicotomica . . . . . . . . . . . . . . . . . . . . . . . . . . .
Rede Bayesiana para o modelo fatorial. . . . . . . . . . . .
Modelo fatorial estatico no WinBugs. . . . . . . . . . . . .
DI para risco basico: decisao primaria (a), evento incerto
() e consequencias (c) . . . . . . . . . . . . . . . . . . . .
DI para poltica de risco basico . . . . . . . . . . . . . . .
AD para investimento em ativo de risco: a decisao primaria
seria investir ou nao, o evento incerto caracterizaria o sucesso ou fracasso do investimento e a consequencia seria o
montante auferido. . . . . . . . . . . . . . . . . . . . . . .
DI e AD para informacao imperfeita. . . . . . . . . . . . .
DI para calculos intermediarios; uma situacao de objetivos
m
ultiplos sem decisao de risco. . . . . . . . . . . . . . . . .
DI agregado sobre o uso de qumico. uso: nvel de utilizacao do produto qumico, risco: risco de cancer, valor:
valor economico, : potencial cancergeno e : taxa de
exposicao ao produto qumico. . . . . . . . . . . . . . . . .
DI para calculo do risco de cancer . . . . . . . . . . . . . .
Diagrama de influencia para decisoes sequenciais . . . . . .
Diagrama de influencia . . . . . . . . . . . . . . . . . . . .
Resultado final . . . . . . . . . . . . . . . . . . . . . . . .
Rainbow diagram . . . . . . . . . . . . . . . . . . . . . . .
Valor da informacao perfeita . . . . . . . . . . . . . . . . .
Diagrama de influencia - informacao imperfeita . . . . . .
Diagrama de influencia - informacao imperfeita . . . . . .
4.1
Funcao de utilidade de um agente averso ao risco. . . . . . 106
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
64
66
67
71
71
72
74
74
75
76
77
81
82
83
84
85
88
LISTA DE FIGURAS
5.1
5.2
5.3
5.4
5.5
5.6
5.7
6.1
6.2
6.3
6.4
7.1
7.2
7.3
7.4
Diagrama de influencia: receita e custo . . . . . . . . . .

Diagrama de influencia completo . . . . . . . . . . . . .
Diagrama tornado . . . . . . . . . . . . . . . . . . . . . .
Valor esperado da distribuicao preditiva, segundo duas prioris alternativas, e frequencias observadas no perodo t =
9 24. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grafico de versus com regiao de sensibilidade de .
Efeito de 2 na regiao de indiferenca. . . . . . . . . . . .
Efeito de a - coeficiente de aversao ao risco na curva de
indiferenca. . . . . . . . . . . . . . . . . . . . . . . . . .
xi
. 116
. 117
. 119
. 122
. 130
. 132
. 133
A linha cheia representa o caminho mais curto ligando a a

c e a linha pontilhada um caminho alternativo de b a c, tal
que o trajeto total seja mais longo. . . . . . . . . . . . . . 137
O grafo acima tem vertices rotulados de 1 a 10 e arcos com
as distancias anotadas (di,j ) . . . . . . . . . . . . . . . . . 139
Comparacao de tres funcoes de utilidades alternativas: u(a) =
a1/2, u(a) = 1 exp(a), a > 0 ou u(a) = 1 1/(1 + a). . 146
Arvore
de decisao com um n
umero finito de estagios. . . . 151
(a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui )
e (d) Curva ajustada (loess no S-plus). Valores fixados:
(, , , c) = (1.0, 0.0, 1.0, 0.01). . . . . . . . . . . . . . . . 172
(a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui )
e (d) Curva ajustada (loess no S-plus). Valores fixados:
(, , , c) = (3.0, 0.0, 3.0, 0.01). . . . . . . . . . . . . . . . 173
U J (n) para J = 20 e M = 10.000 simulacoes. . . . . . . . . 174
As linhas fina e grossa representam, respectivamente, os
valores aproximado e verdadeiro de U (n) (M
uller and Parmigiani, 1995). . . . . . . . . . . . . . . . . . . . . . . . . . . 176
xii
LISTA DE FIGURAS
7.5
U (D) para c = 0.02. O planejamento otimo foi d0 = 9.25 e

a = 0.30, que estao marcados com um triangulo no grafico
(Clyde, M
uller and Parmigiani, 1993). . . . . . . . . . . . 179
Lista de Tabelas
1.1
1.2
1.3
1.4
Consequencias (custos) em unidades monetarias (u.m.)

Variaveis de entrada - domnio de variacao . . . . . . .
Verossimilhanca - p(x|) . . . . . . . . . . . . . . . . .
Distribuicoes a` posteriori, (|x), e preditiva, p(x). . .
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
Perda associada a cada acao e cada estado da natureza. . .

Funcao de ganho da livraria (em dezenas) . . . . . . . . .
Perdas monetarias (em milhares) . . . . . . . . . . . . . .
Funcao de perda nao negativa (L0 (, a) = L(, a) 0 ()) .
Funcao de perda . . . . . . . . . . . . . . . . . . . . . . .
Funcao de perda nao negativa . . . . . . . . . . . . . . . .
Funcao de perda . . . . . . . . . . . . . . . . . . . . . . .
Funcao de perda. . . . . . . . . . . . . . . . . . . . . . . .
Funcao de probabilidade, p(x|). . . . . . . . . . . . . . . .
Distribuicao conjunta de e x. . . . . . . . . . . . . . . .
Retornos mensais de dois ativos de risco . . . . . . . . . .
Retornos e riscos dos ativos a1 e a2 . . . . . . . . . . . . .
Matriz de ganhos . . . . . . . . . . . . . . . . . . . . . . .
3.1
Probabilidades conjuntas sobre X . . . . . . . . . . . 86

xiii
.
.
.
.
. 6
. 12
. 15
. 15
26
28
35
35
35
36
41
44
44
49
49
50
54
54
55
LISTA DE TABELAS
3.2
Consequencias lucro lquido em A . . . . . . . . . . 87
5.1
5.2
5.3
5.4
5.5
5.6
5.7
Variaveis de entrada - domnio de variacao . . . . . .

Dados de n
umero de consultas medicas . . . . . . . .
Novos valores associados as variaveis mais relevantes
Problema de decisao sem dados. . . . . . . . . . . . .
Alternativas considerando as variacoes extremas de .
Perdas no mercado de comodities. . . . . . . . . . . .
Valor equivalente certo. . . . . . . . . . . . . . . . . .
6.1
6.2
Poltica otima (em negrito) . . . . . . . . . . . . . . . . . . 141

Comparacao dos ganhos sequenciais com os do Profeta . . 150
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
118
121
125
126
127
128
131
LISTA DE TABELAS
Captulo 1
Introdu
c
ao
1.1
Uma breve nota hist

orica
Teoria de Decisao e uma area que vem se desenvolvendo aceleradamente

desde o meado do seculo passado. Uma solida base axiomatica foi introduzida por von Neumann and Morgenstern (1944). Os trabalhos de Wald
(1949) e Savage (1954) sao absolutamente centrais nos desenvolvimentos
estatsticos da teoria da decisao, embora esta area envolva muitos outros
aspectos, sendo claramente de natureza interdisciplinar.
O termo teoria da decisao e utilizado de forma muito generica e interdisciplinar, decorrendo, possvelmente, da natureza ampla do processo
de decisao. Dentre as areas do conhecimento que consideram aspectos
da tomada de decisao destacam-se: inteligencia artificial, economia, business, matematica, pesquisa operacional e estatstica, e claro. Desta forma
a Teoria da Decisao e uma disciplina de estatstica envolvendo e explorando a estrutura do processo de tomada de decisao.
Existe um grande n
umero de excelentes livros de analise, teoria e
suporte a` decisao. Embora a escolha de alternativas com base no valor
esperado da utilidade tenha varios seculos (vale mencionar a contribuicao
3
CAPITULO 1. INTRODUC
AO
de Bernoulli, 1738, no famoso paradoxo de St. Petersburg), nos limitaremos a listar e comentar parte da literatura pos-guerra. Os desenvolvimentos em teoria dos jogos estao descritos pelo menos em tres livros
fundamentais: von Neumann and Morgenstern (1944), Wald (1949) e
Savage (1954). von Neumann and Morgenstern (1944) introduzem as
propriedades minimax, o teorema minimax e a extensao dessas ideias a
varias classes de jogos. Por sua vez, Savage (1954) estende a axiomatizacao de von Neumann and Morgenstern para cobrir probabilidades
subjetivas e utilidades. Savage pode ser mencionado como um dos principais mentores da inferencia Bayesiana. Luce and Raiffa (1957) resumem
muito da teoria dos jogos e alguns resultados experimentais.
Nos anos 60 destacamos os livros de Raiffa and Schlaifer (1961) onde
se encontra pela primeira vez a tecnologia simples de se tomar decisoes
concatenadamente. Os resultados de programacao dinamica obtidos por
Bellman (1957) sao relacionados com os procedimentos de maximizacao
da utilidade esperada num artigo historico de Lindley (1961). Surgem,
ainda, nesta decada varios textos de teoria estatstica da decisao. Citamos como exemplos marcantes os livros de Ferguson (1967) e o DeGroot
(1970). No que concerne a analise de decisoes, isto e: aspectos mais aplicados da tomada de decisoes sob incerteza, podemos mencionar os livros
de Raiffa (1996), Lindley (1971) e Lindgren (1971).
Uma retomada na publicacao de textos nesta area e observada nas
u
ltimas duas decadas. Uma das caractersticas dessas novas publicacoes
e incorporar, mais e mais, aspectos praticos incluindo o uso de softwares
especficos (DPL 4.0 (1998) e BUGS Spiegelhalter, Thomas, Best, and
Gilks (1996)). Novidades em termos de diagramas de influencia sao encontradas em Smith (1988) e discussoes sobre decisoes em grupos amplamente discutidos em French (1989). Um classico desta decada, com forte
enfase em aspectos estatsticos da teoria da decisao, e o texto de Berger
(1985). Mais recentemente temos um texto excelente, a nvel introdutorio,
de Clemen (1996). Diversos aspectos operacionais sao exemplificados uti-
1.2. SOBREVOANDO O LIVRO
lizando um software especfico - o DPL. Alem disto, aspectos de teoria

da utilidade multi-atributo sao discutidos a um nvel intermediario.
1.2
Sobrevoando o livro
Utilizaremos um exemplo muito simples para promover um sobrev

oo da
metodologia apresentada nos proximos seis captulos e apendices. Este
exemplo e baseado no famoso artigo The rev counter decision, P.G. Moore
and H. Thomas, (1973), Opl.Res. Q., 24, 337-351.
Parte 1: Coloca
c
ao do problema e an
alise preliminar
Uma fabrica de componentes de automovel - Pethold - esta enfrentando
uma nova demanda por um de seus produtos. Um dos diretores e quatro
executivos se reunem para considerar formas alternativas de lidar com
este eventual aumento da demanda.
Apos algumas discussoes concluem por duas acoes alternativas (mais
o status quo) capazes de atender a` nova demanda:
a1 - comprar novos equipamentos (NvEqui)
a2 - contratar horas extras (HrExt)
a3 - manter nvel de producao atual (NvAtua)
O Diretor nao admite subcontratar outro fornecedor por questoes estrategicas. Alem disto, para simplificar, nao ha expectativas de variacoes
nos precos. Apos discutirem o que aconteceria sob cada uma das alternativas e decidirem trabalhar com um horizonte de planejamento de um ano,
o pessoal de marketing julgou que a demanda, a se manter a tendencia
atual, poderia subir uns 15% (Alta), mas nao exclui a possibilidade de
uma queda de 5% (Baixa) caso o mercado se torne sofrvel. As chances
AO
relativas com relacao a esses dois estados sao de 3:2 a favor do crescimento
das vendas, ou seja, a probabilidade de Alta, , e igual a 0.6.
Neste momento solicitaram ao pessoal de contabilidade que levantasse
os custos de cada uma das alternativas. Apos varias idas e vindas, envolvendo os gerentes producao, de pessoal e financeiro, responsaveis pelos
custos de material e equipamentos, de salarios e pelos custos financeiros,
respectivamente, chegaram aos n
umeros da tabela 1.1.
Estados
Acoes
Alta Baixa
NvEqui
220
130
HrExtr
210
150
NvAtua
170
150
Tabela 1.1: Consequencias (custos) em unidades monetarias (u.m.)
Essa tabela contem varios ingredientes que serao discutidos estensivamente nos captulos subsequentes. Por exemplo, NvEqui, HrExtr e
NvAtua pertencem ao espaco das acoes (decisoes), enquanto Alta e Baixa
compoem os estados da natureza. A tabela 1.1 representa a funcao objetivo (custos, perdas, ganhos, utilidades, etc). No captulo 2 esses e outros
elementos basicos da teoria da decisao estatstica serao introduzidos formalmente. Voltando ao problem e dado o grande volume de informacoes
o gerente de producao sugere a utilizacao de um pacote de analise de decisoes para organizar um diagrama de influencia (figura 1.1), introduzir
os dados, obter a arvore de decisao (figura 1.2) e resolver o problema.
O diagrama de influencia apresenta atraves de grafos o problema de
decisao a ser resolvido. Nesse grafo as relacoes entre as incertezas envolvidas (vendas e ganhos) e as acoes disponveis sao representadas por
setas direcionadas. Existe uma relacao biunvuca entre a arvore de decisao e o diagrama de influencia em um problema de decisao, sendo o
Figura 1.1: Diagrama de influencia

segundo de mais facil elaboracao em problemas relativamente complexos. O captulo 3 e inteiramente dedicado a` introducao e discussao acerca
desses mecanismos de decisao, bem como sua implementacao atraves do
DPL. Inicialmente, para manter as coisas bem simples, evitam ate mesmo
a inclusao de certos custos de investimento em capital e outros.
O gerente de marketing explica para os demais que o desejavel e escolher, dentre as alternativas, aquela que produzir o melhor ganho esperado global. Assim o criterio de selecao sera o chamado EMV - Expected
Monetary Value. Utilizando o pacote ele obtem facilmente o resultados
desejados.
Observe que os valores monetarios esperados das tres alternativas
(acoes a1, a2 e a3) sao, respectivamente, 184, 186 e 162. Como se deseja a acao de menor custo esperado, a manutencao do nvel de producao
atual e a melhor estrategia.
Considerando a arbitrariedade das chances relativas dos eventos in-
AO
Figura 1.2: Arvore

de decisao inicial
Figura 1.3: Solucao via arvore de decisao
certos o gerente financeiro sugere uma analise de sensibilidade, topico

abordado no captulo 5. O que ocorreria se as chances relativas fossem
modificadas? Se o valor de fosse, por exemplo, 15%, ao inves de 60%,
os valores monetarios esperados para cada uma das acoes seriam 143.5,
159 e 153. Nesse novo cenario, a melhor estrategia e a compra de novos
equipamentos. Como funcao de os custos sao
a1 : 90 + 130
a2 : 60 + 150
a3 : 20 + 150
Note que a3 e dominada por a2, uma vez que para todos os valores
de (0, 1) a reta que descreve o valor esperado de a3 passa por baixo
da reta que descreve o valor esperado de a2. Isso pode ser visto na figura
1.4.
Figura 1.4: Valor monetario esperado. a1 - linha cheia; a2 - linha pontilhada; a3 - linha tracejada.
10
AO
O mesmo ja nao ocorre com respeito a a1. Diante disto, nao continuaremos considerando a acao a3 . Por outro lado, a acao a1 sera prefervel
a a2 se e somente se 90 + 130 > 60 + 150 ou seja p > 2/3. A solucao
que obtivemos e insensvel a escolha de , desde que se acredite que
seja pelo menos igual a 2/3.
Para finalizar esta primeira parte o diretor intervem alertando que
o problema foi excessivamente simplificado. Os valores monetarios sao
razoaveis (variacao de 5% no maximo), a solucao final nao e sensvel ao
valor de , mas deveriam tentar um horizonte de planejamento maior e
discutir se o EMV e adequado para este tipo de tomada de decisao.
Parte 2: An
alise sequencial com maior horizonte de
planejamento
Ao voltarem do lanche ja encontraram preparados, pelos gerentes financeiro e de marketing, um novo diagrama de influencia e uma nova arvore
de decisao (figuras 1.5 e 1.6, respectivamente). Esta nova configuracao inclui uma analise mais realista feita ao longo de dois anos, utiliza somente
a1 e a2 e particiona as vendas no segundo ano em tres nveis: alta, m
edia
e baixa. Como podemos observar temos duas caixas decisorias, dois nos
aleatorios, denominados vend1 e vend2 e um u
nico no de consequencia
(ver figura 1.5.
Esse diagrama resume os valores monetarios lquidos totais sem levar
em conta o valor do dinheiro no tempo. Destacamos que as decisoes sao
conectadas por arcos, traduzindo a natureza sequencial do problema e que
os nos aleatorios tambem se conectam por arcos, indicando que a segunda
distribuicao de probabilidae e condicional aos resultados observados no
primeiro no.
Finalmente, as consequencias dependem destes quatro elementos. Precisamos portanto acessar 24 consequencias monetarias, as quais estao apresentados na tabela 1.2.
11
Figura 1.5: Decisoes sequenciais: diagrama de influencia

Na tabela 1.2 sao apresentados os custos relativos aos dois anos para
cada uma das alternativas. Por exemplo, a4 corresponde a decidir por
NvEqui no primeiro ano e, tambem, no segundo ano, e assim sucessivamente. Lembre-se que a decisao a3 foi eliminada da analise.
Avalia
ca
o de Probabilidades
Como recem comentamos as probabilidades do crescimento das vendas do segundo ano ser alto, medio ou baixo, dependera do ocorrido no
primeiro. Suponha que
P [A2|B1 ] = P [M2 |B1 ] = 0.4 e P [B2|B1 ] = 0.2
P [A2|A1] = 0.5, P [M2 |A1] = 0.4 e P [B2|A1 ] = 0.1
onde A, M e B representam os eventos alta, m
edia e baixa, respectivamente. Estas probabilidades foram obtidas com base nas informacoes
disponveis, subjetivas ou nao, dos gerentes de marketing e de financas.
Na verdade sao educated guesses. A solucao e facilmente obtida atraves

AO
12
Acoes
Alto
a4
410
a5
425
a6
350
a7
345
a8
400
a9
380
a10
280
a11
300.25
Media Baixa
395
380
408
395
300
280
325
310
350
315
320
370
220
400
204
460
Tabela 1.2: Variaveis de entrada - domnio de variacao
do pacote e utiliza um algoritmo que intercala operacoes de calculo de

esperanca para eliminar incertezas e maximizacao de consequencias esperadas para eliminar as alternativas menos interessantes. O algoritmo
opera de tras para a frente ou seja backwards. Na figura 1.7 observamos os resultados finais obtidos dessas operacoes, os quais foram obtidos
quase que instantaneamente (o diretor deixou-os trabalhando, supondo
que demorariam muito!).
Por exemplo os valores 401 e 415.2 no extremo direito superior da
arvore refere-se a`s esperancas calculadas com a distribuicao condicional
claro que a alternativa HrExtr e prefervel pois tem
descritas acima. E
maior ganho esperado. Chegamos, assim, a um novo no aleatorio e teremos de calcular novas esperancas. Desta vez usaremos a distribuicao
marginal referente a variavel aleatoria denominada vendas do primeiro
ano. A melhor decisao e no primeiro ano sera contratar HrExtra, o que
difere da solucao obtida anteriormente. Quais as razoes para esta subta
modificacao? Uma das razoes e que em um ano a NvAtual e melhor pois
os custos de investimento nao se cobrem neste curto prazo.
Alternativa ao EMV
13
O diretor esta intrigado com o uso do EMV e propoe a aplicacao de

um princpio alternativo: maxmin. Este princpio se basea na escolha do
pior que pode acontecer; isto e, seleciona-se a pior consequencia em cada
sequencia de alternativas. Estas variam de 200 a 395. A seguir escolha a
claro que a sequencia de acoes levando
melhor das piores alternativas. E
a 395 sera escolhida. Esta inicia-se tambem pela alternativa a1 . Uma
vez convencido o diretor assumiu a decisao de comprar de imediato os
equipamentos necessarios e usar no segundo ano horas extras qualquer que
seja o caso. Na verdade ele sugere que ao longo do ano sejam coletados
mais dados sobre o problema, que se continue discutindo os criterios de
selecao de alternativas e formas de incorporar essas novas informacoes.
Parte 3: Justificando o questionamento ao uso do

EVM
Alguns meses mais tarde, com a orientacao de especialista em analise de
decisoes, compreenderam a razao de estarem duvidosos diante do uso do
EMV. O ponto e que, ainda que de forma inconsciente, percebiam que suas
reacoes aos resultados monetarios variam de acordo com o capital anteriormente acumulado. O especialista em analise de decisoes, provavelmente
um academico, didaticamente providenciou um exemplo exclarecedor.
Suponha que voce se ve diante de uma escolha compulsoria entre dois
jogos, assim descritos:
(i) voce perde R$10.000,00 com probabilidade 0.001 ou, ao contrario,
nao perde nada com probabilidade 0.999.
(ii) voce perde R$15,00 com probabilidade 1, isto e com certeza.
Embora o valor esperado de (i) seja ligeiramente menor do que o de
(ii) (10 < 15), nao e um absurdo encontrar tomadores de decisoes que
prefiram (ii) a (i). Quando uma pessoa segura seu carro, sua casa, ou
14
AO
qualquer outro bem, ela geralmente prefere pagar (perder) R$15,00 do que
correr a remota chance de perder o bem. Portanto, se as consequencias
monetarias sao pequenas proporcionalmente ao capital, entao a adocao do
EMV e razoavel. Caso contrario, e mais prudente (leia-se coerente) lancar
mao de uma funcao de utilidade do dinheiro, a qual considere a forma
conservadora diante do risco, ou qualquer outra maneira de considerar a
aversao ao risco. Esse problema central da teoria da decisao, ou seja a
quantificacao da utilidade do dinheiro (ou da sa
ude, do empreendimento,
etc), e extensivamente abordado no captulo 4.
O diretor levanta um outro ponto relevante: o momento em que sao
feitas as despesas e realizadas as receitas. Isto significa que o dinheiro
preciso usar o valor presente dos retornos
tem valor diferente no tempo. E
lquidos.
Parte 4: Usando um especialista

Apos varias discussoes surgiu uma nova possibilidade: contratar um consultor! Embora esse servico gere um custo adicional de, digamos 5000
reais, ele produzira um relatorio detalhado sobre o mercado de auto-pecas
e fara uma avaliacao favoravel ou nao sobre o crescimento do mercado do
proximo ano. Como ele e falvel, o gerente de marketing assessou as
informacoes objetivas sobre o desempenho do consultor baseando, por
exemplo, em informacoes obtidas junto a outras firmas do ramo. Essa
informacao e apresentada na tabela 1.3 abaixo.
claro que um consultor perfeito (impossvel ou muito caro!) teria
E
uma tabela com 1s e 0s. Note que tinhamos uma distribuicao a priori sobre os estados da natureza, (), e agora temos na tabela 1.3 a
distribuicao de x (a informacao adquirida) dado (estado da natureza),
p(x|), ou seja, a funcao de verossimilhanca. Podemos, entao, obter as
distribuicoes a posteriori e preditiva sem maiores dificuldades, como apresentadas na tabela 1.4. Assim
Estados ()
Alta
Baixa
15
Avaliacao (x)
Favoravel Desfavoravel
0.9
0.1
0.2
0.8
Tabela 1.3: Verossimilhanca - p(x|)
Mercado ()
Alta
Baixa
p(x)
x1
0.87
0.13
0.62
x2
0.16
0.84
0.38
()
0.6
0.4
Tabela 1.4: Distribuicoes a` posteriori, (|x), e preditiva, p(x).
O diagrama de influencia e entao refeito incluindo um quadrado referente a alternativa de contratacao do consultor.
O resultado final usando a distribuicao a posteriori, nos ramos mais
a direita da arvore de decisao isomorfa ao diagrama de influencia acima
fornece, por exemplo, os valores esperados: a1 : 208.3, a2 : 202.2 e a3 :
167.4. Assim, a1 e prefervel dado que o consultor e favoravel (x1) e seu
valor esperado e 208.3. Por outro lado se o consultor nao for favoravel
(x2) entao a2 e prefervel e seu valor esperado sera 159.6. Agora temos
essas duas consequencias e devemos usar novamente o valor esperado.
Como p(x1 ) = .62, entao obtemos: 208.3 .62 + 159.6 .38 5 = 184.8.
Este valor compara desfavoravelmente com o obtido anteriormente, 162.
Assim o consultor nao deve ser contratado.

AO
16
1.3
Nota
ca
o b
asica
Nos proximos 6 captulos varios conceitos novos serao introduzidos, trazendo consigo uma enormidade de notacao matematica necessaria para facilitar a exposicao e o desenvolvimento dos mesmos. Abaixo introduzimos
uma lista abreviada com as principais notacoes. Tambem introduzimos
aqui algumas siglas comumente utilizadas no livro.
A: Espaco das acoes (decisoes). Elementos sao denotados por a.
: Espaco dos estados da natureza. Elementos sao denotados por .
L(, a): Perda associada ao estado da natureza sob a acao a.
U (, a): Funcao de utilidade. Geralmente, L(, a) = U (, a).
(): Distribuicao a priori de .
r(, a): Risco ou perda esperada da acao a. r(, a) =
ab : Acao (decisao) de Bayes. ab = arg mina r(, a).
am : Acao minimax. am = arg mina max L(, a).
X : Espaco amostral. Elementos sao x.
p(x|): Modelo probabilstico
(x): Regra de decisao.
p(x): Distribuicao preditiva.
(|x): Distribuicao a posteriori de dado x.
AD: Arvore
de Decisao.
L(, a)()d.
DO LIVRO
1.4. ORGANIZAC
AO
17
DI: Diagrama de Influencia.

DPL: Decision Programming Language - Software para teoria da decisao
atraves de AD e DI.
DAG: Direct Acyclic Graph.
BUGS: Bayesian Using Gibbs Sampling.
DsR: Downside Risk.
RaM: Retorno Aceitavel Mnimo.
VaR: Value at Risk.
u.m.: unidade monetaria.
MCMC: Monte Carlo via Cadeias de Markov.
1.4
Organiza
ca
o do Livro
No captulo 2 discutiremos varios aspectos introdutorios da teoria de decisao. Especificaremos a tripla que caracteriza um problema de decisao
e apresentaremosdiversas funcoes de perda para problemas especficos.
Tambem analisamos a concavidade do risco de Bayes e exploraremos
graficamente varias propriedades das regras de Bayes e minimax. Problemas de decisao com espaco de decisoes e espaco de estados da natureza
finitos, problema de decisao baseado em dados experimentais, diferentes
conceitos e medidas de risco e dominancia estocastica tambem sao introduzidos nesse captulo.
No captulo 3 apresentaremos varios instrumentos graficos disponveis
para facilitar a modelagem de problemas complexos de decisao. Iniciaremos pela descricao das redes Bayesianas e depois apresentaremos os
18
AO
diagramas de influencia e as arvores de decisao. Serao tambem apresentados neste captulo os principais aspectos dos pacotes DPL - data
programming language e um exemplo envolvendo o uso do WinBUGS Bayesian analysis using Gibbs sampler.
O captulo 4 introduz alguns resultados fundamentais para a teoria
estatstica da decisao e que servem como solida base para o uso rotineiro
dos princpios da teoria da decisao. Introduzimos o princpio da coerencia
atraves do famoso argumento Dutch book para, em seguida, introduzir as
scoring rules (ou regras escores), que induzem o tomador de decisoes a
fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto ao
informar suas probabilidades. O tambem famoso (e curioso) paradoxo de
St. Petersburg que ilustra a dificuldade de se dissociar o valor do dinheiro
de sua utilidade tambem e discutido. Ainda nesse captulo introduzimos o
teorema de representacao von Neumann-Morgenstern que essencialmente
introduz todos os alicerces necessarios para o tomador de decisoes sobre
incerteza escolher entre duas alternativas de acao tendo sem sua frente
somente os possveis estados da natureza, suas utilidades e probabilidades.
Discutiremos alguns aspectos da analise de sensibilidade no captulo 5.
Esse e problema central na estruturacao e solucao de modelos de decisao.
As tecnicas de analise de decisao usam como ingrediente fundamental julgamentos do tomador de decisao atraves de suas preferencias e crencas.
A distribuicao a priori, o modelo que descreve os dados disponveis e a
funcao de perda ou utilidade impactam a solucao final do problema. A
questao e avaliar a sensibilidade dos resultados finais a variacoes a esses
elementos da analise. Iniciaremos discutindo alguns aspectos de identificacao do problema e de sua estruturacao para a seguir atacar questoes
ligadas a` robustez das componentes do modelo de decisao.
Trataremos de problemas de decisao em m
ultiplos estagios ou sequenciais no captulo 6. Esses problemas se caracterizam por poderem ser
separados em um certo n
umero de passos sequenciais ou estagios, cada
estagio se conclui com uma decisao. Em geral, o tempo e usado para
DO LIVRO
1.4. ORGANIZAC
AO
19
ordenar a sequencia de problemas decisorios.

No captulo 7 apresentaremos estrategias para a solucao do problema
de decisao baseadas em metodos Monte Carlo. Comecamos com a aplicacao de integracao de Monte Carlo para resolver a integral que surge no
calculo da perda (ou utilidade) esperada. Introduziremos a ideia de se
ajustar uma curva a um conjunto finito de pares decisao-utilidade e, para
espacos decis orios de dimensao relativamente grande, introduziremos
um metodo para resolver o problema de otimizacao e integracao como
um problema de simulacao, atraves de metodos Monte Carlo via cadeias
de Markov (MCMC).
20
AO
Figura 1.6: Decisoes sequenciais: arvore de decisao
DO LIVRO
1.4. ORGANIZAC
AO
Figura 1.7: Decisoes sequenciais: solucao
Figura 1.8: Diagrama de influencia para informacao imperfeita
21
22
AO
Captulo 2
Conceitos B
asicos
Como sugerido nos exemplos do Captulo 1 a analise de decisoes esta
envolvida com problemas complexos os quais incluem uma ou mais das
seguintes caractersticas:
Incerteza: como escolher um curso de acao - estrategia - quando
suas consequencias dependem de eventos incertos.
Objetivos m
ultiplos: sao frequentes as situacoes onde a escolha de alternativas envolve consequencias de natureza m
ultipla, em
geral conflitantes. Por exemplo, a localizacao de uma usina nuclear requer a avaliacao dos custos envolvidos, da confiabilidade do
projeto, de questoes ambientais etc.
Alternativas m
ultiplas: e imprescindvel escrutinar todas as alternativas ou opcoes possveis, eliminando-se aquelas dominadas
mas evitando-se omissoes ou simplificacoes excessivas.
Sequenciamento: muitas decisoes sao de natureza sequencial envolvendo, portanto m
ultiplos estagios de decisao. As decisoes em
dado estagio do processo sao selecionadas com base nas decisoes
23
24
CAPITULO 2. CONCEITOS BASICOS

ja exercidas, nas informacoes disponveis e no conhecimentos dos
eventos incertos ja ocorridos.
Um modelo de decisao consiste de dois aspectos basicos: (i) especificacao estrutural e (ii) definicao de criterios para comparacao de alternativas. A especificacao estrutural envolve a identificacao dos elementos do
problema de decisao, isto e os eventos incertos, as alternativas possveis,
os parametros desconhecidos e as relacoes estruturais relacionando estes
elementos. Os criterios para comparacao das consequencias associadas as
varias alternativas devem possibilitar ao decisor uma certa racionalidade
ou coerencia no processo decisorio. Uma condicao necessaria para o comportamento racional dos decisores sera denominada de coerencia. Devem
ser eliminadas as regras que conduzem a` ideia da perpetual money making
machine como introduzido por Lindley (1971).
Neste captulo discutiremos varios aspectos introdutorios da teoria de
decisao (veja secao 2.1). Especificaremos a tripla que caracteriza um problema de decisao e apresentaremos, nas secoes 2.2 e 2.3, diversas funcoes
de perda para problemas especficos. Na secao 2.4, caracterizaremos a
concavidade do risco de Bayes e exploraremos graficamente varias propriedades das regras de Bayes e minimax. Problemas de decisao com
espaco de decisoes e espaco de estados da natureza finitos serao tratados
na secao 2.5. A regra minimax e revisitada na secao 2.6. O problema
de decisao baseado em dados experimentais sera discutido na secao 2.7 e
diferentes conceitos e medidas de risco serao apresentados na secao 2.8.
Este captulo e concludo com a secao 2.9 falando sobre dominancia estocastica.
2.1
Elementos da an
alise de decis
oes
Como identificado nos exemplos do Captulo 1, um problema de decisao

e especificado pela tripla (A, , L), onde A e o espaco das acoes, e
2.1. ELEMENTOS DA ANALISE

DE DECISOES
25
o conjunto dos estados da natureza e L(, a) representa a perda sofrida

pela escolha da acao a A quando ocorre , i.e. L : A <.
Equivalentemente podemos definir a funcao de utlidade por U (, a) =
L(, a).
Precisamos, agora, descrever procedimentos para selecao da acao otima.
Apresentaremos, a seguir, duas alternativas, uma determinstica que nao
leva em consideracao a probabilidade de ocorrencia dos estados da natureza, e outra estocastica que assinala pesos para os diversos (talvez
nao-enumeraveis) elementos de . No final do captulo, na secao 2.9,
discutiremos o conceito de dominancia estocastica.
Defini
ca
o 2.1 A aca
o am A e denominada minimax se
am = arg min max L(, a)
a
Este criterio e de natureza conservadora pois escolhe dentre as acoes

de maior perda, aquela acao de menor valor. Em outras palavras, escolhese a menos pior dentre as piores. Pode-se dizer, sem muito rigor, que um
tomador de decisoes que adota um algoritmo minimax para tomada de
decisoes e averso ao risco. Veja o seguinte exemplo extrado de Berger
(1985, pagina 6-7)
Exemplo 2.1 Um investidor deve decidir entre investir (aca
o a1 ) ou n
ao
investir (aca
o a2 ) 1000 unidades monet
arias (u.m.) em um fundo de investimento arriscado. Esse fundo de investimento e arriscado pois pode
levar o investidor a
` perda total de seu investimento (2). Seu atrativo,
entretanto, e a possibilidade de um lucro lquido (1), de 500 u.m. Alternativamente, ao n
ao investir nesse fundo, ele investiria suas 1000 u.m.
numa poupanca com rendimento lquido e certo de 30%, ou seja, 300 u.m.
A tabela 2.1 apresenta as perdas (valores negativos s
ao ganhos) possveis
em ambas as aco
es.

26
Estados
Acoes 1
2
a1 -500 1000
a2 -300 -300
Tabela 2.1: Perda associada a cada acao e cada estado da natureza.
Mais especificamente, 1 representa um retorno lucrativo para o fundo,

f
enquanto 2 representa a perda total do dinheiro investido. E
acil ver que
o investidor dever
a aplicar seu dinheiro na poupanca pois essa aca
o tem
perda menor entre as maiores perdas de cada aca
o: 1000 e -300, para a 1
e a2, respectivamente. Em outras palavras,
max L(, a1 ) = max{500, 1000} = 1000
max L(, a2 ) = max{300, 300} = 300
portanto, a2 e a regra minimax.

O exemplo acima e interessante pois nos remete naturalmente a` seguinte
pergunta: Existe alguma forma de incorporar as incertezas associadas a
1 e 2 no processo decis
orio, de sorte que o investidor (decisor) n
ao tenha
que ser totalmente averso ao risco? Mais especificamente, Qual o impacto
que a 90% de grau de crenca de que 1 ocorrer
a teria na hora do investidor tomar sua decis
ao? Claro que nenhum impacto se ele decidir por
um procedimento minimax. Nem sempre, felizmente ou infelizmente, decisoes sao tomada dessa forma e as chances associadas a`s ocorrencias dos
mais diversos tipos de eventos tem importancia no momento da tomada
de decisoes. Assim, como no exemplo supracitado, seja (), uma
densidade de probabilidade que mede a informacao fornecida ao tomador
de decisoes (atraves de introspecao ou estudo previo), antes de ter sido
observado. Define-se o risco de uma acao da seguinte forma.
2.1. ELEMENTOS DA ANALISE

DE DECISOES
27
Defini
ca
o 2.2 O risco ou perda esperada de uma aca
o a A e dado
por
Z
r(, a) =
L(, a)()d
onde () e uma funca

o de densidade sobre .
Para o exemplo 2.1, onde (1) = 1(2) = 0.9, e simples se observar
que r(, a1) = 350 e r(, a2) = 300, ou seja, que a1 tem valor esperado
de perda menor que a2 , apesar de a2 ser, como ja vimos, a regra minimax.
A acao que minimiza o valor esperado da perda e comumente conhecida
como acao de Bayes com respeito a` .
Defini
ca
o 2.3 A aca
o ab A e denominada acao de Bayes com respeito
a () se
ab = arg min
a
L(, a)()d
= arg min r(, a)

a
com r(, a) comumente denominada perda esperada a priori e o seu valor

mnimo, r(, ab), o risco de Bayes associado.
Ja vimos que para o investidor do exemplo 2.1 a acao de Bayes e
investir o dinheiro no fundo de investimento e o risco de Bayes vale 350
u.m. O seguinte exemplo corrobora para fundamentar as ideias ate aqui
apresentadas.
Exemplo 2.2 O gerente de uma livraria do campus da UFRJ deseja decidir quantas unidade de um certo livro texto dever
a encomendar para o
incio do pr
oximo perodo. Seu ganho e de 15 u.m. por exemplar vendido e a editora aceita receber de volta aquelas unidades n
ao vendidas
ate a segunda semana ap
os o inico das classes. Como esta disciplina

28
n
ao ser
a oferecida novamente durante o presente ano letivo os livros remanescentes, n
ao vendidos, impor
ao uma perda de 5 u.m., por exemplar,
no final do perodo. Uma quest
ao importante ser
a , por exemplo, determinar o tamanho ideal da compra a ser realizada pela livraria. A funca
o
de ganho ou utilidade e obviamente dada por:
U (, a) =
15 5(a )
15a
se < a
se a
Supondo, para simplificar, que as ordens (a) e as vendas () sejam

m
ultiplos de 10 unidades e limitadas a um m
aximo de 70 unidades temos.
A tabela 2.2 mostra os ganhos (perdas s
ao ganhos negativos) associados
a cada aca
o e cada possvel estado da natureza (vendas efetuadas).
Acoes
0
10
20
30
40
50
60
70
100()
0
0
-5
-10
-15
-20
-25
-30
-35
1.7
10
20
0
0
15
15
10
30
5
25
0
20
-5
15
-10
10
-15
5
8.7 23.2
Vendas
30
40
0
0
15
15
30
30
45
45
40
60
35
55
30
50
25
45
32.4 23.2
50 60
70
0
0
0
15 15
15
30 30
30
45 45
45
60 60
60
75 75
75
70 90
90
65 85 105
8.7 1.7 0.4
Perda
Max r(, a)
0
0.0
-5
14.7
-10
27.6
-15
35.9
-20
37.7
-25
34.8
-30
30.2
-35
25.3
Tabela 2.2: Funcao de ganho da livraria (em dezenas)

Este e um exemplo muito simples onde a funca
o de ganho fica determinada pelo valor do ganho lquido e do ressarcimento por devoluca
o. A
quantidade demandada (e desconhecida) de livros, , aparece discretizada
em m
ultiplos de 10 unidades. Analogamente, para facilitar a exposica
o,
DE PERDA
2.2. ESPECIFICANDO A FUNC
AO
29
as encomendas (aco
es) tambem est
ao ordenadas em m
ultiplos de 10. Este
e um exemplo onde o n
umero de possveis estados da natureza e n() = 8
e existem n(A) = 8 possveis aco
es. Mesmo com estas simplificaco
es a
tarefa de escolher a melhor decis
ao n
ao e muito simples, a menos do caso do decisor utilizar a regra minimax. Curiosamente, nesse exemplo,
a regra minimax e de pouca valia uma vez que sugere que o vendedor
n
ao compre nenhum livro (veja a pen
ultima coluna da tabela 2.2). Alem
disso, note que um comerciante poderia ordenar 70 unidades e obter um
ganho de 1050 u.m. caso todos os livros sejam vendidos. Todavia, seguindo essa mesma alternativa, existe o risco da perda de 350 u.m. caso as
vendas sejam nulas. Intuitivamente, pode ser argumentado, precisaria-se
assessar a distribuica
o de probabilidade da quantidade incerta - quantidade demandada de livros. Para ilustraca
o, suponhamos que () para
= 0, 10, . . . , 70 sejam aqueles apresentados na u
ltima linha da tabela
2.2. De acordo com essa distribuica
o de probabilidade calculamos a u
ltima
coluna na mesma tabela. De acordo com esses resultados vemos que a decis
ao o
tima, ou aca
o de Bayes, e a compra de 40 unidades.
Para mais detalhes sobre a regra minimax veja a secao 2.6. No captulo
4 mostra-se porque a maximizacao (minimizacao) da utilidade (perda) esperada e a regra de decisao comumente utilizada em problemas de decisao
sob incerteza.
2.2
Especificando a fun
ca
o de perda
Nesta secao apresentaremos alguns exemplos de funcao de perda que ocorrem comumente nas aplicacoes. Iniciaremos com uma classe geral de
funcoes de perda, discutiremos os problemas da inferencia estatstica no
contexto da teoria da decisao e introduziremos dois exemplos de natureza
mais aplicada.

30
Uma classe geral de perdas

Defina L(, a) = ()|a|, onde () e uma funcao de peso que depende
somente de . Alguns casos especiais serao apresentados no contexto da
estimacao de parametros.
Estima
ca
o
Um problema de estimacao fica caracterizado pelo fato de que A = .
Uma famlia de funcoes de perda adequada para o problema de estimacao
e dada por L(, a) = | a|. Suponhamos que na famlia de perdas
definidas anteriormente () = 1. Se = 1 temos a perda absoluta e se
= 2 a popular perda quadratica. Um aspecto importante do problema
de estimacao e que os espaco do parametro e das decisoes sao coincidentes. A minimizacao da perda esperada nos casos acima e alcancada,
respectivamente, pela mediana e pela media da distribuicao de . Outra
funcao de perda comum em problemas de estimacao de parametros e a
denominada perda zero-um,
L(, a) =
k
0
se | a|
se | a| <
onde > 0 e arbitrario e k e uma constante, em geral unitaria. A regra

de decisao de Bayes, neste caso, coincidira com a moda da distribuicao
de . A figura 2.1 apresenta as tres funcoes de perda citadas acima.
Teste de Hip
otese
Este e um outro problema tpico da inferencia estatstica. Sua principal
caracterstica e que tanto o espaco das acoes como o espaco do parametro
sao dicotomicos, isto e, A = {a0, a1 } e = 0 1 . As acoes a0 e a1
correspondem a`s decisoes de aceitar H0 e H1 , respectivamente, onde Hi
e a hipotese que afirma que o parametro percente ao sub-espaco i , para
DE PERDA
AO
31
Figura 2.1: Funcoes de perda alternativas em problemas de estimacao:

perda zero-um (linha cheia), perda quadratica (linha pontilhada) e perda
absoluta (linha tracejada).
i = 0, 1. Nesse contexto, a funcao de perda fica definida por
L(, ai) =
0
ci
se i
caso contrario
onde i = 0, 1. A escolha de c0 6= c1 permite reconhecer que os erros de

decisao podem ter impactos diferenciados. Por exemplo, se o problema
consiste em decidir, a` luz de algumas informacoes, se a economia esta
num estado de recessao ou de expansao, os custos associados a`s decisoes
erradas sao naturalmente distintos. Os falsos alarmes podem, claramente,
ter custos diferenciados. A solucao deste problema, assumindo-se que =

32
P r( 0), sera dada pela comparacao das perdas esperadas, r(, a0) =
c0 (1 ) e r(, a1) = c1 .
Uma pequena generalizacao dessa formulacao, denominada na literatura de problema da decisao m
ultipla, consiste em fazer uma particao do
espaco do parametro em m classes. Sua solucao sera diretamente obtida
atraves dos conceitos desenvolvidos ao longo desse captulo.
Uma outra fun
ca
o de perda
Suponha que = {1, 2 } e que A = {a1, a2}. Seja a funcao de perda
L(, ai) =
0
i2
se = i
se 6= i ,
para i = 1, 2. Entao, para qualquer (), a acao de Bayes sera a1 se

E(12 ) < E(22 ) e a2 caso contrario. Se E(12) = E(22 ), entao ambas sao
acoes de Bayes sob . Para obter este resultado basta lembrar que,
E[L(, a1)] =
12
Z
(1, 2 )d2 d1 =
12 (1)d1 = E(12)
Fun
ca
o de Perda de Esscher
Na literatura de Atuaria aparece com frequencia a funcao de perda de
Esscher,
L(, a) = exp ()( a)2
onde a A, R+ e > 0 e denominado coeficiente de aversao

claro que esta especificacao corresponde a um caso particular
ao risco. E
de perda geral apresentada no comeco dessa sec ao, isto e () = exp()
e = 2. Seja () uma distribuicao a priori sobre , entao o risco de
Bayes sera,
r(, a) = E[L(, a)] = E[exp ()( a)2]
DE PERDA
AO
33
A minimizacao da funcao de perda satisfara a condicao de primeira

ordem,
Z
d
r(, a) = 2 exp ()( a)()d = 0
da
de forma que
ab = E[ exp ()]/E[exp ()]
A condicao de segunda ordem pode ser facilmente verificada e sera
deixada como exerccio. Esta decisao de Bayes e denominada, no contexto
atuarial, de premio de Esscher.
Sele
ca
o de um Portf
olio
Seja = a0 , onde e um vetor representando os retornos de k investimentos e a = (a1 , . . . , ak ) o vetor de alocacao de uma riqueza unitaria,
P
tal que ai > 0 para todo i = 1, . . . , k e i ai = 1. A seguinte funcao de
perda e adequada para este problema de diversificacao de risco,
L(, a) = exp() 1
2
Suponhamos ainda que N (, ). Nestas condicoes, N [ ,
],
0
2
0
onde = a e = a a. Alem disto, exp () tera uma distribuicao
log-normal. Assim
E[L(, a)] = E[exp()] 1

2
= exp( + 2
/2) 1
e, portanto, e facil verificar que
n
2
/2
min r(, a) max
a
a
A interpretacao e clara: deseja-se diversificar obtendo um risco mnimo,

isto e variancia mnima, e simultaneamente maximo retorno esperado.

34
Este exemplo e particularmente interessante pois aponta para uma dificuldade que ocorre com frequencia. Nossas acoes podem ser julgadas
atraves de consequencias m
ultiplas e conflitantes. Neste exemplo desejamos claramente maxizar o retorno esperado, todavia restrito a um certo
nvel de risco, avaliado pela variancia do retorno do portfolio selecionado.
2.3
Fun
ca
o de perda n
ao negativa
Seja > 0 uma constante dada e () uma funcao real tal que
Z
()()d <
Defina a nova funcao de perda como sendo

L0 (, a) = L(, a) (), , a A
claro que uma acao de Bayes, ab sob L(, a) tambem sera Bayes sob
E
L0 (, a). Defina agora 0 () = mina L(, a) e
L0 (, a) = L(, a) 0 ()
facil ver que a nova funcao de perda e tal que (i) L0 (, a) 0 e

E
(ii) mina L0(, a) = 0. A seguir apresentamos dois exemplos de situacoes
com funcao de perda nao negativa.
Exemplo 2.3 Seja um problema de decis
ao onde o n
umero de elementos
de A seja 2, isto e n(A) = 2 e que o n
umero de elementos de tambem
seja 2, isto e n() = 2 e considere a funca
o de perda com valores reais
apresentados na tabela 2.3. Segue que 0 (1) = 10 e 0 (2 ) = 20. A
tabela de perdas pode ent
ao ser reescrita como na tabela 2.4.
Supondo, alem disto, que (1) = 0.7. Ent
ao teremos r(, a1) = 64 e
r(, a2) = 17. Portanto, a2 e a aca
o de Bayes. Note que r0 (, a1) = 77
e r0 (, a2) = 30, de sorte que a2 continua sendo a aca
o de Bayes, como
esperado.
DE PERDA NAO
NEGATIVA
2.3. FUNC
AO
35
Estados
Acoes 1
2
a1
100 -20
a2
-10 80
Tabela 2.3: Perdas monetarias (em milhares)
Estados
Acoes 1
2
a1
110
0
a2
0 100
Tabela 2.4: Funcao de perda nao negativa (L0 (, a) = L(, a) 0 ())
Exemplo 2.4 Considere um problema com cinco aco
es e dois estados
da natureza. Uma tabela envolvendo perdas n
ao negativas e a tabela 2.5.
Vale notar que agora temos uma perda nula para cada um dos estados
e com os demais valores extritamente positivos, como ilustrado na tabela
2.6.
Estados
1
2
a1
2
3
Acoes
a2 a3 a4
4 3 5
0 3 2
a5
3
5
mina L(, a)
2
0
Tabela 2.5: Funcao de perda
O leitor pode facilmente verificar que a1 e a3 sao minimax para a

tabela 2.5, enquanto a2 e minimax para a tabela 2.6. Voltaremos a esse

36
Estados
1
2
a1
0
3
Acoes
a2 a3 a4
2 1 3
0 3 2
a5
1
5
Tabela 2.6: Funcao de perda nao negativa
exemplo no secao 2.6 quando revisitarmos a regra minimax e daremos

uma justificativa geometria para esse problema.
2.4
Concavidade do risco de Bayes
Nesta secao estudaremos a forma da funcao que descreve o risco de Bayes.

Mostraremos que esta e uma funcao concava, o que permitira entre outras
coisas examinar o efeito da imprecisao na especificacao da distribuicao a
priori. Introduzimos, na secao 2.1, o risco de Bayes segundo () (veja
definicao 2.3), como sendo r() = r(, ab ). Este e o valor do risco mnimo
ou da perda espera mnima sob a distribuicao a priori .
Defini
ca
o 2.4 Sejam 1 e 2 duas densidades sobre e seja (0, 1)
um escalar. A combinaca
o linear = 1 + (1 )2 e uma nova
densidade sobre , chamada de mistura das densidade 1 e 2 .
Teorema 2.1 Seja uma mistura das densidades 1 e 2 , sobre , para
(0, 1). Ent
ao
r() r(1 ) + (1 )r(2 )
Prova:
2.4. CONCAVIDADE DO RISCO DE BAYES
37
(i) Mistura de riscos

r(, a) =
L(, a)()d =
L(, a)[1() + (1 )2 ()]d
= r(1 , a) + (1 )r(2 , a)
(ii) Como r() = mina r(, a), entao
r() = mina[r(1, a) + (1 )r(1 , a)]
Como o mnimo da soma de duas funcoes nao pode ser nunca menor que
a soma dos mnimos individuais, segue que:
r() minar(1 , a) + (1 ) minar(2 , a)
= r(1 ) + (1 )r(2 )
t
u
A partir dos item (i) e (ii) acima pode ser verificado que a funcao
concava r() e o mnimo da famlia de funcoes lineares r(, a) gerada
pelas diferentes acoes em A. Ilustracoes graficas sao possveis no caso em
claro que nestas condicoes = P r( = 1). Assim
que = {1, 2}. E
r() e funcao concava de (0, 1) (veja a ilustracao na figura 2.2).
Consequ
encia da Imprecis
ao de
Suponha, ainda no caso de um espaco de acoes com dois elementos somente, que a acao a0 seja escolhida a acao de Bayes segundo 0 e suponha
que o verdadeiro valor de seja, digamos 1 . Seja = r(1, a0 ) r(0 )
o incremento em risco, como ilustrado na figura 2.3. Se a curva r() for
suave no entorno de 0, o qual deve conter 1 entao sera pequeno.
38
Figura 2.2: Concavidade do risco de Bayes: n(A) < (figura da esquerda); n(A) = (figura da direita).
2.5
Problema de decis
ao com e A finitos
Supor espacos de estados da natureza e de parametros finitos facilitam as

ilustracoes de algumas propriedades. Poderemos representar graficamente
o conjunto de todas as acoes mistas e estudar suas propriedades. Sejam
= {1, , k } e A = {a1, , am }.
Defini
ca
o 2.5 Uma decis
ao mista e definida pela combinaca
o linear convexa de decis
oes em A. Esta classe e denotada por M. Obviamente
A M e a funca
o de perda de uma decis
ao mista a M ser
a dada por:
Li (a) = L(i , a) =
m
X
j=1
pj L(i , aj ), i = 1, , k
COM E A FINITOS
2.5. PROBLEMA DE DECISAO
39
Figura 2.3: Efeito da imprecisao sobre : incremento no risco de Bayes

Alternativamente podemos escrever
L(a) = (L1 (a), , Lk (a))0 = L
para = (1 , . . . , m ), a = (a1 , . . . , am ) e L(i , aj ) o (i, j) esimo elemento de L.
Denote por G <k o conjunto convexo definido por G = {L(a)
P
<k , a A, p = (p1 , , pm )0 , pi 0, pi = 1}.
Defini
ca
o 2.6 Domin
ancia e Admissibilidade
(a) Uma aca

o a M domina a aca
o a0 M se Li (a0 ) Li (a), .
Se a desigualdade for estrita a domin
ancia ser
a dita estrita.
40
(b) Uma decis

ao a A e admissvel se nenhuma outra aca
o a domina
0
estritamente. Isto e, se n
ao existe outra decis
ao a A tal que
0
0
Li (a ) Li (a), i = 1, , k e Li (a) < Li (a ) para pelo menos um i.
Assim a M e admissvel se e somente se pertencer a fronteira
de admissibilidade de G. As acoes puras, elementos de A, correspondem a distribuicoes de probabilidade sobre A degeneradas, isto e: p =
(0, . . . , 0, 1, 0, . . . , 0). Assim os pontos de G correspondendo as acoes em
A sao vertices de um poliedro convexo.
Exemplo 2.5 Este exemplo envolve um problema de decis
ao com m = 6
alternativas e k = 2 estados da natureza (Figura 2.4) e perdas dadas pela
tabela 2.5.
Figura 2.4: Representacao grafica de G
COM E A FINITOS
41
Vale interpretar Li (a), i = 1, , k como centro de gravidade de um

sistema de massas com pesos pj em aj , j = 1, , m. Considere agora
uma distribuicao de probabilidade sobre , () = (1 , , k )0, i
P
0e
i = 1. Para qualquer decisao a A obtemos o risco
r(, a) = 0 L(a)
onde = (1, , k )0 .
Defini
ca
o 2.7 Uma aca
o ab e Bayes segundo se e somente se minimiza
0
L(a), a A
interessante mostrar que ab pertence a fronteira de Bayes de G. Como
E
a fronteira admissvel de G esta contida na fronteira de Bayes segue que
toda decisao admissvel em M e Bayes para alguma .
Teorema 2.2 Seja a uma aca
o em M. O vetor L(a ) pertence a fronteira de Bayes de G se e somente se existe alguma distribuica
o sobre
tal que a e Bayes segundo .

Exemplo 2.6 Seja um problema com k = 2 estados da natureza, m = 6
alternativas e perdas dadas pelos elementos da tabela abaixo.
Estados
1
2
a1
10
0
a2
8
1
Acoes
a3 a4
4 2
2 5
a5
0
6
a6
0
10

Os pontos L(ai ), i = 1, , 6 est
ao plotados na figura 2.5. A fronteira
admissvel consiste dos segmentos de reta unindo L1 a L3 e L3 a L5 . Logo

42
as aco
es a1 , a3 ea5 A s
ao admissveis. Neste exemplo a fronbteira
de Bayes incluir
a tambem o segmento de reta L5 a L6 , de forma que a
fronteira de Bayes ser
a constituida pelas aco
es {a1 , a3, a5, a6}.
Suponha que deseja-se determinar uma decis
ao de Bayes segundo a
0
priori = (1/3, 2/3) . Considere a equaca
o da reta L1 /3 + 2L2 /3 = c,
isto e com inclinaca
o 1/2. Verifique se esta e uma linha de suporte em
algum ponto da fronteira de Bayes. Neste exemplo somente a3 satisfaz
esta condica
o.
u
E
til relembrar que a perda esperada para acoes em M sao da forma:
0 L(a) =
=
k
X
i=1
k
X
(i)Ep [L(i, a)]

(i)
i=1
m
X
pj L(i , aj )
j=1
A decisao de Bayes e obtida como funcao de (p1 , , pm ) ou depende

de m 1 variaveis. Assim o problema de minimizar a perda esperada
equivale a determinar o mnino de uma funcao m 1 dimensional.
Para fixar ideias um outro exemplo faz-se necessario. A figura abaixo
corresponde ao problema de decisao com m = 5 alternativas e k = 2
estados da natureza descrito anteriormente (Tabela 2.4). Expressando E[L(, ai)] = r(, ai) como funcao de [0, 1], temos as seguinte
equacoes:
r(, a1)
r(, a2)
r(, a3)
r(, a4)
r(, a5)
produzindo a figura 2.5
=
=
=
=
=
3
4
3
3 + 1
5 2
2.6. REVISITANDO A REGRA MINIMAX
43
Figura 2.5: Poliedro convexo; caso k = 2 e m = 6
2.6
Revisitando a regra minimax
Uma forma alternativa de ordenar as acoes de um problema de decisao,

como ja vimos e exatamente o procedimento minimax. O objetivo agora
e mostrar como obter uma acao minimax graficamente e discutir algumas
de suas propriedades.
Relembrando, am = arg min maxa {L(, a)}. No exemplo 2.4, onde
concorriam m = 5 alternativas para k = 2 estados da natureza, tinhamos
a tabela de perdas com a u
ltima coluna apresentando o mina L(, a) obtido para cada estado da natureza (tabela 2.6). Podemos agora obter para
cada acao o max L(, a) (ver a u
ltima linha da tabela 2.8).
A partir desta coluna e facil ver que as acoes a1 e a3 sao ambas min-

44
Estados
1
2
max
a1
2
3
3
Acoes
a2 a3 a4
4 3 5
0 3 2
4 3 5
a5
3
5
5
Tabela 2.8: Funcao de perda
imax. Se, alternativamente, tivessemos usado as perdas nao negativas

teriamos obtido
Estados
1
2
max
a1
0
3
3
a2
2
0
2
Acoes
a3 a4
1 3
3 2
3 3
a5
1
5
5
Neste caso somente a acao a2 e minimax. Porque esta diferenca? Os

graficos da figura 2.7 apresentam as perdas para as acoes a1 a a5, no plano
L(a) = (L1 , L2 ), e servem para esclarecer o que ocorre. Se (L1 , L2) sao
as perdas em um problema com dois estados da natureza e claro que o
maximo das perdas sera L1 se o par (L1 , L2) cair abaixo do bissetor e, L2
se o par (L1, L2 ) cair acima do bissetor (veja figura 2.6).
A acao minimax e obtida graficamente movendo-se para cima um
linha horizontal/vertical ate atingir uma das acoes, isto para aquelas acima/abaixo do bissetor do primeiro quadrante. Quando se usa a funcao
de perda nao negativa a solucao nao se mantem pois a origem se desloca
e entao a primeira acao a ser atingida pelas linhas horizontais/verticais
2.6. REVISITANDO A REGRA MINIMAX
45
Figura 2.6: Regra minimax - determinacao grafica

pode mudar.
Para concluir vejamos o que ocorre se tiver diante de acoes mistas.
Neste caso o bissetor do primeiro quadrante atingira primeiramente uma
das acoes mista que expressam atraves da combinacao linear das acoes
pura a1 e a2 . Mais precisamente a solucao corresponde a escolha de
= 3/4.
Um u
ltimo ponto que merece consideracao e que toda decisao de Bayes
e admissvel e toda decisao minimax e acao de Bayes. Alem disso, as
decisoes admissveis sao acoes de Bayes para alguma distribuicao a priori.
Segundo DeGroot (1970), um ponto x = (x1, . . . , xk ) em G, um conjunto
convexo, pertence ao limite de admissibilidade de G se nao existir nenhum
ponto y tambem em G tal que yi xi para i = 1, . . . , k e yi < xi para
46
Figura 2.7: Regra minimax - determinacao grafica

pelo menos um i. Adicionalmente, um ponto x em G percente ao limite
de Bayes se nao existir nenhum ponto y em G tal que yi < xi para
i = 1, . . . , k. A figura 2.8 ajuda a visualizar essas questoes e definicoes.
2.7
Problema de decis
ao usando dados
Seja X uma quantidade aleatoria relacionada com o estado da natureza

e considere uma regra de decisao (x) , isto e, uma funcao de X , espaco
amostral , com valores em A, espaco do parametro. Seja p(x|), x X
a funcao de densidade de X condicional a .
USANDO DADOS
47
Figura 2.8: Admissibilidade da regra de Bayes

Defini
ca
o 2.8 A funca
o de risco ou perda esperada ser
a definida por
r(, ) = E[L(, (x))]
=
Z Z
X
L(, (x))p(x|)()ddx
(2.1)
onde estamos assumindo que L(, (x)) e integr

avel em X e tambem em
.
Valer destacar que
R
(i) a A, r(, a) = L(, a)()d, como definido anteriormente, e

(ii) , r(, (X)) =
L(, (x))(x|)dx

48
Para qualquer regra de decisao (x) a funcao r(, (x)) sera denomindada de risco de . Assim sendo sera uma decisao de Bayes se
= arg min
(x)
r(, (x))()d
A funcao (x) sera determinada pela expressao acima para cada x X .

Continuaremos denotando por r() = r(, ) o risco de Bayes sob .
Construindo a regra de decis

ao de Bayes
Segunda a expressao 2.1, min r(, ) pode ser obtido minimizando a integral interna para cada x X . Assim, x X , obteremos (x) minimizando em
bf T heta,
Z
L(, (x))p(x|)()d
ou
Z
p(x)
L(, (x))p(x|)()/p(x)d
R
onde p(x) = p(x|)()d. Assim,
r(, ) =
p(x)
Z
L(, (x)(|x)d dx
Exemplo 2.7 Suponha que = {1 , 2} e A = {a1 , a2} com perdas

apresentadas na tabela 2.10.
A distribuica
o a posteriori e obtida facilmente levando em consideraca
o a funca
o de verossimilhanca dada pela tabela 2.11.
Como tem somente dois elementos, a distribuica
o a priori fica completamente caracterizada por = P r(1 ) = 1P r(2 ). Usando o teorema
de Bayes
(|x) ()p(x|) = q(, x)
USANDO DADOS
L(, a)
1
2
a1
0
10
49
a2
5
0
Tabela 2.10: Funcao de perda.

x
Estados
1
2
0
3/4
1/3
1
1/4
2/3
Tabela 2.11: Funcao de probabilidade, p(x|).
obtemos os resultados da tabela 2.12

As probabilidades a posteriori ser
ao obtidas da normalizaca
o dos q(, x).
Denotando por (x) = (1|x) teremos:
q(1, x)
(x) = P
q(, x)
Assim, qualquer que seja x, os valores esperados das perdas ser

ao
r(, a1|x) = 10[1 (x)]
r(, a2|x) = 5(x)
Da, a1 ser
a prefervel a a2 se e somente se r(, a1) < r(, a2), o que
equivale a dizer que 10[1(x)] < 10[1(x)], ou ainda que (x) > 2/3.
Suponhamos agora que o resultado experimental tenha sido x = 1. A
decis
ao de Bayes ser
a a2 se (1) < 2/3, ou seja,
3/4
< 2/3
3/4 + (1 )/3

50
x
q(, x)
0
1
3/4
2
(1 )/3
1
/4
2(1 )/3
Tabela 2.12: Distribuicao conjunta de e x.
logo, a decis
ao de Bayes ser
a a2 se < 8/17. Analogamente, se x = 0 a
decis
ao a2 ser
a prefervel se < 16/19. De uma forma geral teremos,
5
se 0 < < 8/17
r() = 5/4 + 10(1 ) se 8/17 < < 16/19
10(1 )
se 16/19 < < 1
permitindo se fazer o gr
afico do risco de Bayes (Figura 2.9) como funca
o
de , a probabilidade a priori.
2.8
An
alise de risco
Neste captulo discutindo alguns aspectos da analise de risco. Esta e uma

area da analise de decisoes que vem ganhando importancia nos dias atuais.
O termo risco e utilizado de uma forma nao sistematica com seu sentido
variando expressivamente nos diferentes ramos de aplicacao. Falamos de
risco financeiro, risco medico, risco atuarial etc. Apresentaremos alguns
criterios de risco comumente utilizados nessas diferentes areas. Iniciaremos por um exemplo.
Exemplo 2.8 Suponha que estejamos diante da escolha de uma de duas
opco
es:

2.8. ANALISE
DE RISCO
51
Figura 2.9: Risco de Bayes - exemplo com dados

a1) Apostar num jogo onde ganha-se 1 u.m. se certo evento ocorrer,
com probabilidade ou perde-se 1 u.m., caso contr
ario, com probabilidade 1 .
a2) Apostar num jogo onde ganha-se 1000 u.m. se certo evento ocorrer,
com probabilidade ou perde-se 1000 u.m., caso contr
ario, com
probabilidade 1 .
senso comum que a segunda alternativa
Suponha que = 1/2. E
e mais arriscada do que a primeira, embora do ponto de vista do valor
esperado da perda monet
aria sejam equivalentes. A segunda alternativa
imp
oe uma eventual perda de valor expressivo.

52
Os criterios apresentados anteriormente aferem risco atraves da perda

esperada ou do criterio minimax nao levando em consideracao a amplitude envolvida nos resultados monetarios associados a`s varias opcoes.
Nas aplicacoes os riscos podem ser avaliados pela probabilidade de certos
eventos indesejaveis ou por alguma medida de dispersao. Por exemplo,
em risco poltico o evento poderia ser a expropriacao do capital de um
firma em certo pas estrangeiro, enquanto que na area de seguro o risco
poderia ser mensurado como a quantidade maxima de u.m. que uma
seguradora pode perder em uma certa apolice.
Nas aplicacoes financeiras o conceito de risco confunde-se com o de
variabilidade associada a distribuicao dos ganhos ou perdas monetarias.
Um exemplo classico esta presente na analise de portfolios onde pretendese maximizar o retorno esperado sujeito a uma limitacao de variancia
(risco). Uma classe de medidas de risco em financas e dada por:
r(aj ) =
(y c) pj (y)dy
onde aj representa a j-esima acao, y os retornos com densidade pj (y), dependendo da acao j e c e um valor crtico particular, tambem denominado
de RaM - retorno aceit
avel mnimo. Alguns casos especiais sao,
Vari
ancia
Esta e a medida tradicionalmente usada em decisoes financeiras. Em
nosso exemplo anterior sobre a construcao de um portfolio, nosso criterio
consistia em simultaneamente minimizar a variancia e maximizar o retorno. Esta medida de risco e obtida a partir de nossa definicao geral
fazendo-se c = j = Ej (y) e = 2.

2.8. ANALISE
DE RISCO
53
Semivari
ancia ou Downside-risk
Sua principal vantagem e levar em conta somente o domnio de risco
de real interesse, por exemplo os retornos mais baixos. Fica definida
para = 2 e c um valor crtico qualquer. Uma definicao alternativa
desta medida de risco, frequentemente encontrada na lituratura recente
de financas, denominada downside risk - DsR, e definida por:
DsR(aj ) =
min(0, y c)2 pj (y)dy
Probabilidade crtica
Semelhante a semivariancia, mas tendo como medida de risco a probabilidade, isto e:
Z
V aR(aj ) = Pj [y c] =
pj (y)dy
Na literatura recente de financas esta quantidade recebe o nome de VaR

- value at risk.
Sobra ainda a questao de como comparar as opcoes apos o calculo de
uma dessas medidade de risco. Por exemplo, como comparar o par (valor
esperado, risco)? Uma possibilidade e definir uma regra de dominancia.
Se duas opcoes tem o mesmo valor esperado seleciona-se aquela de menor
risco. Se, por outro lado, duas opcoes tem o mesmo risco, selecione aquela
de maior valor esperado. Observa-se assim que a medida de risco pode
servir como uma mera restricao num problema de otimizacao.
Exemplo 2.9 As alternativas de investimentos em ativos de risco. Na
tabela abaixo apresentamos os retornos mensais, em percentagem, observados ao longo de um ano.
Podemos calcular, com base nesses dados, os correspondentes amostrais
das medidas de risco definidas acima, supondo, por exemplo c = 10%.

54
Acoes
1
a1
12
a2
2.71
2
17
4.86
3
11
5.28
4
18
2.28
Meses
5
6
7
17 23
20
2.71 .14 1.42
8
9
19
13
1.86 4.43
10
10.3
5.58
Tabela 2.13: Retornos mensais de dois ativos de risco
Obtendo-se, ap
os alguns c
alculos, os resultados da tabela 2.14. Vale notar que como todos os retornos do ativo a1 superam c, gerando assim
medidas de risco alternativas nulas. Fica tambem f
acil ver que o V aR do
ativo a2 e igual a 1, pois c supera todos seus retornos observados. Portanto, as conclus
oes s
ao: o ativo a1 tem risco menor, exceto quando esta
medida for a vari
ancia, e retorno medio significativamente maior. Logo
a1 ser
a prefervel sempre que usarmos umas das medidas alternativas de
risco e um valor de c 10.3%.
Se c = 4% fosse utilizado, teriamos DsR = 2.29 e V aR = .58 para

a2. Decrescendo c, obviamente, as medidas de risco, exceto a vari
ancia,
diminuir
ao. Analogamente, para c = 15% teriamos V aR = 0.33 e DsR =
3.59 para a aca
o a1, com os equivalentes de a2 inalterados. Assim se
c = 15% e se a medida de risco utilizada fosse o DsR, a aca
o a 2 seria
prefervel.
Ativos Media Variancia VaR DsR
a1
16.03
18.05
0
0
a2
3.13
3.32
1.0 3.32
Tabela 2.14: Retornos e riscos dos ativos a1 e a2
2.9. DOMINANCIA
ESTOCASTICA
2.9
55
Domin
ancia estoc
astica
Em varias situacoes pode ser pouco natural comparar alternativas (decisoes) simplesmente atraves de seus retornos (monetarios) esperados.
Entretanto, existem situacoes onde se deseja encontrar alternativas que
sejam dominantes de maneiras mais gerais e mais abrangentes. Nessa
secao introduziremos o conceito de dominancia estocastica de primeira
(relativa aos retornos) e segunda ordem (relativa aos riscos). A intuicao
basica e poder encontrar meios para dizer, por exemplo, que a distribuicao F produz retornos maiores que a distribuicao G ou que a
distribuicao F tem menor risco do que a distribuicao G. Vejamos um
pequeno exemplo para introduzir essas ideias.
Exemplo 2.10 Suponha que, em um problema de decis
ao, existam tres
possveis aco
es, a1, a2, a3, tres possveis estados da natureza, 1, 2 , 3,
com ganhos descritos pela tabela 2.15. Pode ser facilmente constatado
que a aca
o a1 domina a aca
o a2 pois os retornos sob a1 s
ao maiores que
os retornos sob a1 para todos os possveis estados da natureza. O mesmo
j
a n
ao pode ser dito quando se compara a1 e a3 ou a2 e a3.
Estados
1
2
3
Acoes
a 1 a2 a3
6 3 8
5 4 2
7 6 3
Tabela 2.15: Matriz de ganhos
Essa secao e essencialmente inspirada em Mas-Colell, Whinston, and

Green (1995), que dedica um captulo inteiro ao problema de decisao sob
incerteza. Outras referencias sobre dominancia estocastica sao: o captulo

56
4 de Bunn (1984), Whitmore and Findlay (1978) e, mais recentemente,

Levy (1998).
Defini
ca
o 2.9 Domin
ancia Estoc
astica de Primeira Ordem: A
distribuica
o F domina G estocasticamente em primeira ordem se, para
toda funca
o n
ao-decrescente u : < <,
Z
u(x)dF (x)
u(x)dG(x)
Pode ser mostrado o seguinte resultado imediato dessa definicao.

Teorema 2.3 F domina G estocasticamente em primeira ordem se e
somente se F (x) G(x) para todo x.
A figura 2.10 ilustra a ideia de dominancia estocastica de primeira
ordem. Aqui F domina G pois o grafico da F esta uniformemente abaixo
do grafico da G indicando que valores maiores tem maiores probabilidades
sob F .
Como pode ser visto, dominancia estocastica nao necessariamente implica que todo possvel retorno em F sera maior que todo possvel retorno
em G. Dominancia estocastica de primeira ordem implica que a media de
X sob F , EF (X), e maior que a media de X sob G, EG (X). O contrario
nao e necessariamente verdadeiro, isto e, EF (X) EG (X) nao implica em
F ser estocasticamente dominante com relacao a G. Isso se deve ao fato
de toda a distribuicao ser relevante quando se fala em dominancia. Uma
segunda forma de dominancia pode ser definida se quisermos comparar
os riscos (dispersao) associados a`s distribuicoes dos retornos. Intuitivamente, dizemos que G(.) e mais arriscada que F (.) quanto todo tomador
de decisoes averso ao risco preferir
Defini
ca
o 2.10 Domin
ancia Estoc
astica de Segunda Ordem: Sejam F e G, tais que EF (X) = EG (X). A distribuica
o F domina G
2.9. DOMINANCIA
ESTOCASTICA
57
Figura 2.10: F domina G estocasticamente em primeira ordem.

estocasticamente em segunda ordem se, para toda funca
o c
oncava n
aodecrescente u : <+ <,
Z
u(x)dF (x)
u(x)dG(x)
Uma forma alternativa de caracterizar dominancia de segunda ordem

e atraves do conceito de mean-presearving spread (espalhamento com
preservacao da media). Considere a seguinte loteria composta em dois
passos:
1. Um premio intermediario x e sorteado a partir da distribuicao F (.)
2. Ao premio x e acrescido o valor z (que pode ser negativo). Esse
58

u
ltimo e sorteado a partir de uma distribuicao Hx (.) com media
nula, de sorte que x + z tambem tenha media x
Denote por G(.) essa loteria composta. Quando uma loteria G puder
ser obtida a partir de uma outra loteria F , para alguma Hx , diz-se que G
e um espalhamento de F com preservacao da media. O exemplo abaixo
ilustra essa nova ideia Mas-Colell, Whinston, and Green (1995).
Exemplo 2.11 Seja F a funca
o de distribuica
o com massas iguais em
2 e 3. Ent
ao a funca
o de distribuica
o, G, com massas iguais em 1,2,3,4
e um espalhamento de F com preservaca
da media (veja a figura 2.11).
Figura 2.11: G e um espalhamento de F com preservacao da media.
2.9. DOMINANCIA
ESTOCASTICA
59
Se u(.) e concava,
Z
u(x)dG(x) =
Z Z
Z
u(x + z)dHx (z) dF (x)
Z
(x + z)dHx (z) dF (x)
u(x)dF (x)
e pode ser mostrado que o seguinte resultado e valido.

Teorema 2.4 G(.) e um espalhamento de F com preservaca
o da media e
equivalente a dizer que F domina G estocasticamente em segunda ordem
Nos proximos captulos formalizaremos o conceito de funcao de utilidade, probabilidade subjetiva, entre outros. Veremos, por exemplo, que
nem sempre a utilidade do dinheiro, ou de qualquer outro bem, pode ser
medida atraves do valor do dinheiro.
60
Captulo 3
Modelos Gr
aficos
3.1
Introdu
ca
o
Neste captulo iremos apresentar varios instrumentos graficos disponveis

para facilitar a modelagem de problemas complexos de decisao.
Iniciaremos pela descricao das redes Bayesianas e depois apresentaremos os diagramas de influencia e as arvores de decisao. Os diagramas
de influencia sao grafos acclicos direcionados (DAG). Incluem como caso
especial as redes Bayesianas de probabilidade, as quais serao exemplificadas ao longo deste texto. As arvores de decisao representam igualmente
problemas de decisao considerando eventuais assimetrias, o que facilita
a sua implementacao computacional. Um caso particular de arvore de
decisao servira para a simples descricao grafica de distribuicoes conjuntas
de probabilidade.
Serao tambem apresentados neste captulo os principais aspectos dos
pacotes DPL - data programming language e um exemplo envolvendo o
uso do WinBUGS - Bayesian analysis using Gibbs sampler. O primeiro
implementa um problema de decisao estatstica atraves de diagrama de
influencia (DI) e arvores de decisao (AD). Varias facilidades de analise
61
62
CAPITULO 3. MODELOS GRAFICOS
sao encontradas neste pacote como, por exemplo, analise de sensibilidade,

interface com planilhas eletronicas, simulacoes de Monte Carlo, etc. O
BUGS por seu turno descreve modelos probabilsticos complexos a partir
de um DAG, permitindo que as inferencias e previsoes sejam realizadas
por metodos de simulacao estocastica. Sua estrutura e tao ampla que
mereceria ser descrito num captulo proprio, o que foge aos propositos
deste texto. Finalmente, na area de redes Bayesianas mencionamos o
Hugin e o JavaBayes, os quais permitem a avalicao de probabilidades
condicionais de forma simples. Atraves deles e possvel calcular probabilidades marginais das variaveis de interesse, bem como executar analise
de robustez ou de sensibilidade.
Modelos graficos constituem uma ferramenta natural para lidar com
problemas que envolvem incerteza e complexidade. Podem, resumidamente, ser caracterizados como uma fusao perfeita entre a teoria de probabilidades e a teoria de grafos. Portanto, modelos graficos sao meros
grafos onde os nos sao variaveis aleatorias e a ausencia de arcos representa alguma hipotese de independencia condicional. Existem duas classes
de modelos graficos: os baseados em grafos nao direcionados e aqueles baseados em grafos direcionados. Os primeiros, incluem os modelos
de campos aleatorios Markovianos e os u
ltimos, as denominadas redes
Bayesianas e os diagramas de influencia. Um exemplo de grafo nao direcionados em estatstica ocorre em modelos log-lineares. Nesta monografia
so utilizaremos modelos baseados em grafos direcionados.
Iniciaremos o captulo com a discussao de redes Bayesianas. Apos
apresentar os principais conceitos envolvidos discutiremos um exemplo
bastante simples. A seguir, os principais modelos de decisao sob incerteza
serao apresentados, incluindo os diagramas de risco simples, informacao
imperfeita, decisoes sequenciais, modelos com multi-atributos e diagramas de calculos intermediarios. Concluiremos com uma ampla discussao
do uso do DPL, incluindo um exemplo razoavelmente complexo. As referencias mais influentes neste captulo sao Clemen (1996) e Golub (1997)
3.2. REDES BAYESIANAS
63
no que se refere aos conceitos de diagramas de influencias e Murphy (2001)

e Jensen (1998), nos conceitos de modelos graficos e, em particular, em
redes Bayesianas.
3.2
Redes Bayesianas
Os modelos de redes Bayesianas sao grafos direcionados nos quais os

nos representam variaveis aleatorias e a ausencia de arcos, suposicoes de
independencia condicional (Murphy, 2001). Um arco de A para B pode
informalmente ser interpretado como A causando B. Frequentemente,
nao se permite a ocorrencia de ciclos. Denomina-se de pais de certo no a
todos aqueles nos que o influenciam diretamente ou o antecedem. Assim
dado seus pais um no, , e independente de todos os demais nos do grafo,
exceto os que sao seus descendentes. Uma afirmacao de independencia
condicional envolvida na estrutura de uma rede Bayesiana e de que um no
e independente dos ascendentes de seus pais. Estes sao conceitos ligados
a uma particular topologia ordenando os nos.
Exemplo 3.1 Consideremos o exemplo da figura 3.1, onde os n
os s
ao
vari
aveis aleat
orias bin
arias. Denote por M a vari
avel aleat
oria a grama
esta molhada, por N , o tempo est
a nublado, por C, o evento estar
chovendo e por G, o evento girador d
agua est
a ligado.
O evento M tem duas causas possveis: G ou C. Isto e, a grama estar
a
molhada por conta do girador d
agua estar ligado ou por estar chovendo. As probabilidades condicionais P [M |G, C] refletem a forca dessas
relaco
es. Como o n
o N n
ao possui pais, suas probabilidades condicionais
ser
ao denominadas de probabilidades a priori. Por exemplo, P [N = 1] =
.5, P [G = 1|N = 1] = 0.1, P [M = 1|G = 1, C = 1] = 0.99. Observe que
M N |G, C. Pelas regras b
asicas de probabilidade teremos:
P [N, G, C, M ] = P [N ] P [G|N ] P [C|N, G] P [M |N, G, C]
64
Figura 3.1: Rede Bayesiana: cada no refere-se a uma variavel aleatoria

dicotomica
entretanto a topologia do grafo associado a este exemplo permite usar as
independencia condicional para obter-se:
P [N, G, C, M ] = P [N ] P [G|N ] P [C|N ] P [M |G, C]
ou seja: C G|N e M N |G, C.
A partir do modelo descrito pelo DAG desejamos fazer inferencias,
isto e, calcular probabilidade de alguns n
ao observ
aveis com base nos dados observados. Podemos distinguir duas operaco
es complementares: diagn
ostico e predica
o. No primeiro, observamos as folhas do grafo e fazemos inferencias sobre as causas. No exemplo anterior teriamos P [G =
1|M = 1] representando a probabilidade do girador estar ligado considerando-se que a grama est
a molhada e, tambem, P [C = 1|M = 1]. Poderiamos decidir qual a causa mais prov
avel da grama estar molhada. A
outra situaca
o corresponde a predizer, com base nas causas, o estado final de algumas vari
aveis de interesse. Por exemplo: qual a probabilidade
65
da grama estar molhada dado que o girador est

a ligado mas n
ao esta
chovendo P [M = 1|G = 1, C = 0].
A complexidade computacional decorre sobretudo da avaliacao da
constante de normalizacao envolvida na aplicacao do teorema de Bayes.
Varios algortmos sao apresentados na literatura para lidar com o problema da eliminacao de variaveis.
Para concluir esta secao apresentaremos o DAG de um problema estatstico razoavelmente complexo onde os nos envolvem variaveis aleatorias
contnuas.
Exemplo 3.2 Modelo Fatorial Consideremos a seguinte estrutura.
yt |ft N (ft, )
ft N (0, I )
onde yt e um vetor m-dimensional, ft e um vetor k-dimensional de fatores comuns e e uma matriz de vari
ancia-covari
ancias de dimens
ao
m m, geralmente diagonal. Em geral k e bem menor que m de forma que o modelo trata de explicar um vetor de alta dimens
ao a partir
de combinaco
es lineares de aspectos de menor dimens
ao n
ao observ
aveis
(da o nome fatores comuns). Note que o modelo acima descreve a estrutura de variabilidade marginal de yt , a quantidade observ
avel, atraves
de 0 + . V
arias simplificaco
es deste modelo s
ao possveis. Por exemplo, se = 2I m ent
ao, condicionalmente a ft as componentes de
yt ser
ao tambem independentes e possuir
ao a mesma vari
ancia. A rede
Bayesiana ilustrada na figura 3.2 descreve este modelo. Se 2 0 ent
ao
a estimaca
o de m
axima verossimilhanca de ser
a dada pelos m autovetores principais, isto e, correspondente aos maiores autovalores da matriz
de covari
ancia amostral.
Na figura 3.3 apresentamos o algoritmo escrito (automaticamente)
pelo WinBugs para o DAG da figura 3.2. Nesse contexto, e diagonal
66
Figura 3.2: Rede Bayesiana para o modelo fatorial.

com elementos j2 = j2 , para j = 1, . . . , m, na diagonal principal. A
informaca
o a priori, assim como na figura 3.2, e tal que,
j2 Gama(v0j , v0s20j )
j N (m0j , C0j )
para j = 1, . . . , m e hiperpar
ametros v0j , s20j , m0j e C0j fixos para j =
1, . . . , m.
model;
{
for( j in 1 : M ) {
for( i in 1 : T ) {
y[i , j] ~ dnorm(m[i , j],tau2[j])
}
}
for( j in 1 : M ) {
for( i in 1 : T ) {
m[i , j] <- beta[j] * f[i]
}
}
for( j in 1 : M ) {
for( i in 1 : T ) {
f[i] ~ dnorm( 0.0, 1.0)
}
}
for( j in 1 : M ) {
tau2[j] ~ dgamma(v0[j],v0s02[j])
}
for( j in 1 : M ) {
beta[j] ~ dnorm(m0[j],C0[j])
}
}
Figura 3.3: Modelo fatorial estatico no WinBugs.
67
68
Mais referencias e detalhes a repeito dos modelos fatoriais (estaticos

ou dinamicos) podem ser encontrados na tese de doutorado do segundo
autor (Lopes 2000), alem de Lopes, Aguilar, and West (2000) e Lopes
and Migon (2002). Num contexto mais especfico, o seguinte exemplo
ilustra uma aplicacao recente de modelos fatoriais dinamicos para dados
de mercados acionarios latino americanos.
Exemplo 3.3 Um tema bastante atual em financas e a forma com que
os mercados acion
arios se contagiam em perodos de crises. Os anos 90
forem repletos de tais eventos: Efeito Tequila em 1994, Gripe Asi
atica em
1997, Resfriado Siberiano em 1998, e a Febre Brasileira de 1999. Num
estudo recente (Lopes and Migon 2002), analisamos dados de quatro mercados latino-americanos, alem dos Estados Unidos. Foram observadas as
taxas de retorno di
arias dos ndices IBOVESPA, MEXBOL, MERVAL
e IPSA, alem do Dow Jones, no perodo de agosto de 1994 a fevereiro
de 2001, num total de 1484 observaco
es. Um modelo de an
alise fatorial com volatilidade estoc
astica com par
ametros variando no tempo foi
desenvolvido e aplicado.
3.3
Diagrama de influ
encia e a
rvore de decis
ao
Nesta secao descreveremos os modelos basicos de decisao e suas representacoes atraves de diagramas de influencia e arvores de decisao. Estes dois
diagramas sao de alguma forma complementares. Os primeiros sao mais
u
teis na etapa de modelagem enquanto que as AD sao mais adequadas
para se implementar a solucao otima atraves do algortmo de inducao de
tras para diante (backward induction). Este, como ja comentamos, intercala operacoes de esperanca, para eliminar incertezas, com operacoes de
maximizacao para escolher as acoes que maximizem a utilidade esperada.
3.3. DIAGRAMA DE INFLUENCIA

E ARVORE
DE DECISAO
69
Alem disto, como os diagramas de influencia sao muito mais compactos

na descricao da estrutura do problema, serao preferveis para a comunicacao, sobretudo, com pessoas nao tecnicas envolvidas na analise de
decisao de um problema. As solucoes otimas independem da escolha feita
para representacao de nossos problemas posto que os DI e as arvores de
decisao sao isomorfos. Varios metodos foram prospostos para a solucao
do diagrama de influencia como, por exemplo, o algoritmo proposto por
Shachter (1986) o qual permite a avaliacao do diagrama de influencia sem
ser necessario transforma-lo em uma arvore de decisao.
Um smbolo especial sera utilizado para representar cada uma das
componentes da tripla que caracterisa um problema de decisao - -espaco
dos estados da natureza, A - espaco das acoes e L(a, ) - a funcao de perda. Os eventos incertos serao representados por crculos, as decisoes por
ret
angulos e os valores assumidos pela funcao de perda ou conseq
uencias
por retangulos com as arestas arredondadas.
Dois tipos de arcos os de sequencia e os de relevancia caracterizam um diagrama de influencia. Esta nomeclatura e particularmente u
til
na descricao dos algortimos eficientes para a solucao de diagramas de
influencia.
Defini
ca
o 3.1 Um arco e dito de sequencia se aponta para um n
o decis
orio e ser
a denominado de relev
ancia se aponta para um n
o de chance
ou de consequencia.
Assim um no de relevancia indica que o predecessor e fundamental para descrever as incertezas referentes aos eventos incertos. Por
seu turno os arcos de sequencia prestam-se para descrever informacoes
disponveis no momento de se tomar decisoes. Esses conceitos sao particularmente importantes para o desenvolvimento de algortmos eficientes
para a solucao dos diagramas de influencia.
Com estes conceitos mnimos a` mao, passaremos a descrever alguns
diagramas de influencia u
teis para representar componentes de um prob-
70
lema de decisao complexo. Nos limitaremos aos aspectos estatsticos e

de aplicacao da analise de decisao. Muitos desenvolvimentos na area de
modelos graficos ocorrem na fronteira da estatstica, matematica aplicada
grafos e em ciencia da computacao.
Risco B
asico
u
Este e o modelo mais simples de tomada de decisao sob incerteza. E
til
para representar decisoes de investimentos e, tambem, na area atuarial,
por exemplo quando temos de decidir se contratamos ou nao um seguro
para nossos bens.
No problema de decisao de risco basico, a satisfacao do decisor e funcao
da acao escolhida e de um evento incerto. Seu diagrama de influencia e
extremamente simples. As possveis acoes estao representadas por um
retangulo, o evento incerto por um crculo e as consequencias por um
retangulo com bordas abauladas. Os arcos orientados conectam as acoes
e os eventos incertos ao retangulo de bordas abauladas, que representa as
consequencia, descrevendo a relacao funcional existente (figura 3.4). Nas
redes Bayesianas de probabilidades nao apareciam os nos decisorias e de
consequencias caracterizando uma tenue diferenca entre estes instrumentos.
No exemplo atuarial poderamos ter a decisao de adquirir um seguro
de vida de certo valor, as incertezas seriam traduzidas pelas taxas de
mortalidade e as consequencias descritas por alguma medida do suporte
financeiro da famlia.
Uma pequena variante deste modelo mais simples, que denomiremos
de poltica de risco b
asico, inclue um arco conectando as acoes ao
crculo que representa os estados da natureza ou eventos incertos. Em
alguns problemas a acao escolhida influencia as probabilidades sobre os
eventos incertos (figura 3.5). Este fato sera descrito pela inclusao de um
arco de relev
ancia conectando o no de decisao ao no aleatorio.

E ARVORE
DE DECISAO
71
Figura 3.4: DI para risco basico: decisao primaria (a), evento incerto ()
e consequencias (c)
Figura 3.5: DI para poltica de risco basico
72
Estes dois modelos poderiam ser representados atraves de uma arvore

de decisao. Um exemplo de arvore de decisao mais concreto seria o de
um problema de investimento. Suponha que temos somente duas alternativas: realizar um investimento em ativo de risco ou nao. Os estados
da natureza representam as possibilidades de um excelente retorno ou
uma derrocada. Nao investindo obteramos o retorno de um ativo livre
de risco, por exemplo a caderneta de poupanca. Assim teramos:
Figura 3.6: AD para investimento em ativo de risco: a decisao primaria

seria investir ou nao, o evento incerto caracterizaria o sucesso ou fracasso
do investimento e a consequencia seria o montante auferido.
Vale notar que neste exemplo a arvore de decisao permite facilmente
considerar a assimetria presente no processo de decisao. Uma das
alternativas promove um ganho pequeno, porem certo. Esta e uma das
vantagens da arvore de decisao em relacao ao diagrama de influencia, a
qual se torna relevante quando se esta diante de um problema de alta
complexidade.
Uma pequena variante seria uma arvore de decisao para um modelo

E ARVORE
DE DECISAO
73
de risco b
asico duplo. Temos, como no exemplo anterior, somente
duas acoes alternativas. Por exemplo, investir num ativo de risco ou, por
exemplo, numa ativo real. Ambos podem gerar como consequencia um
excelente retorno ou nao.
Modelo de Informa
c
ao Imperfeita
Em muitas situacoes desejamos descrever no processo de tomada de decisoes a possibilidade de se obter informacoes imperfeitas sobre eventos
incertos, os quais afetam, obviamente, as consequencias decorrentes da
escolha das acoes otimas. A origem dessas informacoes pode ser de pelo
menos tres naturezas: previsoes, diagnosticos ou estimacao. Frequentemente, provem de um especialista ou de um modelo computacional, em
geral de natureza estatstica. Incluiremos um novo no aleatorio para representar a informacao imperfeita o qual recebera um arco com origem no
no aleatorio e originara outro com destino ao no decisorio. O primeiro
sera um arco de relevancia e o outro de sequencia.
Diagramas de c
alculos intermedi
arios
A principal caracterstica dos diagramas de influencia para calculos intermediarios e que nao envolvem nos aleatorios. Limitam-se a representar
relacoes estruturais entre nos de constantes ou de calculo.
Antes de prosseguir seria u
til apresentarmos um exemplo envolvendo
um diagrama de influencia com certa complexidade. Este e um exemplo
extrado do livro de Clemen (1996).
Exemplo 3.4 Uso de certo Produto Qumico
Uma agencia de proteca
o ambiental, frequentemente, deve decidir se
autoriza ou n
ao o uso de um certo produto qumico, economicamente
vi
avel, mas que pode ter efeitos cancergenos. As decis
oes ser
ao tomadas
com informaco
es imperfeitas sobre os riscos a
` sa
ude e os benefcios de
74
Figura 3.7: DI e AD para informacao imperfeita.
Figura 3.8: DI para calculos intermediarios; uma situacao de objetivos

m
ultiplos sem decisao de risco.

E ARVORE
DE DECISAO
75
longo prazo. Os diferentes cursos de aca

o incluem conceder a permiss
ao
de uso, autoriz
a-lo com restric
ao ou n
ao autorizar o uso. Do lado estatstico devemos realizar ensaios clnicos para determinar o potencial
cancergeno do produto qumico e levantar, atraves de pesquisa, o grau de
exposica
o de seus usu
arios ao produto qumico. Esses dados s
ao muito
importantes pois, por exemplo, se o produto for suavemente t
oxico e se a
taxa de exposica
o for pequena ent
ao e razo
avel decidir por um uso restrito.
Deseja-se deteminar um nvel de utilizaca
o do produto de forma a atender
os objetivo de maximizar o valor econ
omico do uso e, simultaneamente,
minimizar o custo do c
ancer.
Figura 3.9: DI agregado sobre o uso de qumico. uso: nvel de utilizacao

do produto qumico, risco: risco de cancer, valor: valor economico, :
potencial cancergeno e : taxa de exposicao ao produto qumico.
Alem do nvel de utilizaca
o do produto qumico as quantidades incertas, potencial cancergeno e taxa de exposica
o ao produto afetam o risco
de c
ancer, o qual permitir
a o c
alculo do custo do c
ancer. Assim teremos
um segundo diagrama de influencia para c
alculos intermedi
arios (figura
76
3.10).
Figura 3.10: DI para calculo do risco de cancer

Falta ainda incorporar as informaco
es imperfeitas provenientes dos
testes de potencial cancergeno e das pesquisas para determinaca
o do grau
de exposica
o ao t
oxico. Observe que teremos um arco conectando a quantidade desconhecida - potencial cancergeno - ao n
o estoc
astico que descreve
o teste de ensaio clnico para sua determinaca
o. Assim, denotando-se o
potencial cancergeno por , o teste ter
a uma distribuica
o denotada por
T |. Da mesma forma, denotamos a quantidade n
ao observ
avel, taxa
de exposica
o, por e por S|, a informaca
o imperfeita decorrente da
importante observar que tanto
pesquisa de exposica
o ao produto. E
quanto afetam o risco de c
ancer. Este exemplo demonstra a efetividade do uso de diagramas de influencia na estruturaca
o de um problema
de decis
ao. Embora este seja relativamente complexo, seu diagrama de
inflencia e compacto e de f
acil compreens
ao.

E ARVORE
DE DECISAO
77
Decis
oes sequenciais
Estas surgem em modelos complexos onde as decisoes estao implicita
ou explicitamente ordenadas temporalmente. As condicoes decisorias se
modificam dinamicamente, de sorte que e plausvel assumir que alternativas selecionadas em certo momento poderao ser revisadas em instantes
futuros. Uma caracterstica basica dessas estruturas e que as decisoes
se sucedem, umas influindo nas outras, e as consequencias quando monetarias devem ser resumidas num u
nico valor obtido da aplicacao do conceito de valor presente a cada uma das parcelas. Para isto utiliza-se um
fator de desconto, em geral suposto temporalmente invariante e conhecido precisamente. Um exemplo, para motivar, poderia ser aquele de um
investidor que antes de se decidir pelo investimento em certo ativo de
risco prefere contratar os servicos de um consultor que o orientara. Assim antes de mais nada, ele se coloca uma nova questao: deve ou nao
contratar um consultor? Sera que o custo dessas informacoes imperfeitas
e aceitavel, face ao conte
udo de informacao disponibilizado?
Figura 3.11: Diagrama de influencia para decisoes sequenciais
78
Para completar esta secao destacaremos alguns erros comumente cometi bom comecar distindos na elaboracao dos diagramas de influencia. E
guindo um diagrama de influencia de um fluxograma. Um fluxograma
limita-se a descrever sequencialmente atividades e eventos, enquanto que
um DI descreve um instantaneo de um processo decisorio levando em
consideracao todos os elementos envolvidos nas decisoes imediatas. Um
segundo erro comumente cometido e conectar os nos de chance ao no
decisorio na tentativa de representar que as decisoes sao tomadas em ambiente de incerteza. Como vimos um arco em direcao a um no decisorio
representara alguma forma de informacao disponvel ao tempo de se escolher as decisoes. Estes sao arcos de sequencia, indicando portanto que
o decisor deve aguardar a resolucao dessas incertezas antes de decidir.
Finalmente, nao e permitido incluir ciclos em DI. Estes prestam-se para
representar alguma forma de feedback (retroalimentacao). Como nossos
DI representam um instantaneo do processo decisorio nao havera oportunidade para se considerar feedback.
3.4
Introdu
ca
o ao DPL
Como ja amencionamos o DPL - Decision Programing Language e um

dos softwares disponveis para modelar e resolver problemas de analise
de decisoes atraves de diagramas de influencia e arvores de decisoes. Descreveremos nesta secao alguns aspectos introdutorios da versao de estudante DPL - Student version release 4.01.00, Copyright 1989-1998Applied Decision Analysis LLC, Pricewaterhouse Coopers LLP. Este e um
produto Windows based incorporando, portanto, suas facilidades usuais.
O sistema permite definir projetos conjuntos de tarefas que podem
ser salvos a cada sessao. Alem disto, podemos exportar ou importar componentes de um projeto, o que pode ser u
til quando, por exemplo, um
diagrama de influencia de um projeto deva ser includo em outro. Existe
um modulo de programacao e facilidades de comunicacao com planil-
AO DPL
3.4. INTRODUC
AO
79
has. Um sistema de ajuda e varias facilidades tpicas do Windows estao,

tambem, disponveis. Nos limitaremos nesta secao, a introduzir os principais conceitos envolvidos na janela relativa ao interface grafico do sistema
- DPL draw window, o qual estara automaticamente disponvel na versao
que estaremos utilizando.
Como ja dissemos apresentaremos somente os comandos essencias
para resolver um problema introdutorio de decisoes. Detalhes adicionais
poderao ser encontrados no proprio help do sistema.
Aspectos b
asicos
Na barra de comandos encontram-se os smbolos graficos necessarios para
a elaboracao de um diagrama de influencia: ret
angulo amarelo para
representar o espaco das acoes, crculo verde para descrever o espaco dos
estados da natureza, ret
angulo abaulado azul claro e arco magenta para
indicar relacoes ou condicionamento entre os elementos.
Ao se clicar com o botao da esquerda do mouse sob um elemento
grafico (no) se abrira uma caixa onde podemos atribuir nomes, valores,
comentarios e coneccoes. Na atribuicao de valores existe uma linha para
a introducao de formulas. Esta se utiliza de funcoes especiais do sistema
(smbolo f , a` esquerda) e das variaveis disponveis (idem, ).
Neste momento, o melhor sera apresentar um pequeno exemplo.
Exemplo 3.5 Em certa manh
a de setembro, ao se preparar para sair
em direca
o a
` universidade voce dever
a decidir se leva ou n
ao um guarda
chuva. E claro que poder
a chover ao longo de seu trajeto. Nesta epoca
do ano, voce atribui probabilidade de 0.6 de se ter um dia ensolarado. As
consequencias associadas as estas decis
oes e estados da natureza decorrem de dois fatos: os incovenientes de se tomar chuva (roupa molhada,
resfriado etc) e o fato de que voce costuma perder seu guarda-chuva sistematicamente, tendo de gastar preciosos reais na compra de outro.
80
Temos dois objetivos distintos denominados: cat

astrofe para representar o qu
ao desagrad
avel ser
a voce assistir a
`s aulas com as roupas molhadas
e conveniencia para descrever o seu desagrado em carregar um guardachuva e eventualmente perde-lo. Suponhamos que os ganhos associados
ao primeiro desses objetivos sejam de 100 unidades, em geral, e 0 quando
chove e voce n
ao levou o guarda-chuva. Com relaca
o ao segundo objetivo o ganho ser
a de 100 unidades se voce n
ao levar o guarda-chuva
e de 0 se o levar. Note que o n
o denominado cat
astrofe e funca
o dos
n
os guarda-chuva e chove, denominaco
es escolhidas para o n
os que representam, respectivamente, o espaco das aco
es e dos estados da natureza.
Finalmente, suponha que Voce julga que a import
ancia relativa desses
dois objetivos est
a na raz
ao de 4 para 1 a favor do n
o cat
astrofe. Isto
significa que voce considera 4 vezes mais relevante o primeiro objetivo do
que o segundo. Assim, voce dever
a construir um n
o denominado satisfaca
o total poderando os valores dos n
os de cat
astrofe e conveniencia com
4
pesos 4+1 = 0.8 e 0.2, respectivamente.
O pacote disponibilizar
a uma tela com tres janelas. A da esquerda e
o m
odulo gr
afico. Na parte superior voce poder
a descrever seu diagrama de influencia. No presente exemplo deveremos pegar, na barra de
ferramentas, uma caixa amarela para representar o n
o de decis
oes, tres
ret
angulos com vertices abaulados e de cor azul clara para representar as
consequencias e um crculo verde para o evento incerto. Arcos devem ser
utilizados para conectar os n
os convenientemente. Por exemplo, os n
os
de chance e decis
orio se conectam com o n
o cat
astrofe, enquanto que somente o n
o decis
orio se conectar
a com o n
o conveniencia. Finalmente,
os n
os de objetivo se conectam ao n
o satisfaca
o total.
Ao se clicar sobre um n
o ele assumir
a a cor magenta. Clicando duas
vezes seguidas se abrir
a uma tela com possibilidades de se atribuir nomes,
os quais s
ao sensitivos a letras min
usculas e mai
usculas, e valores aos n
os,
como j
a mencionado. Ap
os atribuir nome aos n
os deveremos introduzir
os valores das consequencias e das probabilidades.
AO DPL
3.4. INTRODUC
AO
81
Figura 3.12: Diagrama de influencia

Neste ponto e importante destacar dois cuidados:
i) na tela de dados do n
o cat
astrofe temos, inicialmente, de definir que
seus resultados s
ao condicionados aos n
os chove e guarda-chuva,
para, a seguir, atribuir o valor das consequencias a cada uma das
alternativas possveis.
ii) na tela geral de um n
o de chance este, inicialmente aparecer
a com
tres alternativas possveis. Devemos, no nosso exemplo, eliminar
uma delas e depois associar as probabilidades desejadas.
Introduzindo os valores mencionados no texto passamos a ter o diagrama completo.
Na barra superior de comandos, no ttulo Analysis encontramos o comando run. Clicando nele obtemos o resulatado:
Duas facilidades adicionais, que ser
ao retomadas nos pr
oximos captulos s
ao: an
alise de sensibilidade e valor esperado da informaca
o perfeita.

82
Figura 3.13: Resultado final

An
alise de sensibilidade
Para se realizar uma an
alise de sensibilidade sobre o valor da probabilidade de chover devemos, inicialmente, criar uma caixa com a vari
avel
que representar
a a probabilidade do evento, digamos , e trocar no n
o
chuva a probabilidade de chover de 0.4 para . A seguir poderemos rodar
o rainbow diagram clicando em Analysis. Este far
a o valor de variar no
intervalo desejado, digamos entre (0, 1). Ajustamos o n
umero de passos
em 20 para obter o gr
afico abaixo referente a: r(a1 ) r(a2 ) se somente
se 80 20 + 100(1 ) ou seja .25.
Valor esperado da informa
ca
o perfeita
Suponha que alteramos o diagrama de influencia colocando um arco
com origem em chuva e destino em guarda-chuva. Isto dever
a ser interpretado como se a decis
ao fosse tomada com conhecimento do estado da
natureza. Se este for chover ent
ao o melhor seria levar o guarda-chuva
com um ganho de 80, e se fizer sol ent
ao n
ao levariamos o guarda-chuva,
AO DPL
3.4. INTRODUC
AO
83
Figura 3.14: Rainbow diagram

com um ganho de 100. O valor esperado ser
a portanto 92, como podemos
observar na a
rvore de decis
ao da figura 3.15.
Para completar este captulo apresentaremos um exemplo bastante interessante e sua implementaca
o em DPL.
Exemplo 3.6 Exploraca
o de Petr
oleo (Smith, 86) Uma companhia petrolfera tem a opca
o de perfurar pocos de petr
oleo em um de dois campos:
A e B. As probabilidades iniciais de que se tenha o
leo nesses campos
s
ao, respectivamente, 0.1 e 0.2 e esses eventos podem ser considerados
independentes. Se A produzir o
leo um ganho lquido de 77 milh
oes de
u.m. e esperado na sua fase de operaca
o. No caso de B, teremos um
ganho lquido de 195 milh
oes de u.m. .
A companhia encontra-se diante das alternativas:
i) n
ao aceitar explorar nos campos A e B,
ii) aceitar explorar em A ou em B imediatamente e
84
Figura 3.15: Valor da informacao perfeita

iii) pagar por uma investigaca
o de somente um dos campos (n
ao dos
dois).
O resultado dessa investigaca
o ser
a simplesmente aconselhar ou n
ao
a perfuraca
o. Com base nessas informaco
es a firma escolher
a entre as
claro que a investigaca
opco
es (i) e (ii). E
o n
ao e livre de incerteza, caracterizando um modelo de informaca
o imperfeita. Se o o
leo estiver presente
ent
ao a investigaca
o aconselhar
a a perfuraca
o com probabilidade 0.8. Se
n
ao estiver presente aconselhar
a com probabilidade 0.4. O custo da opca
o
e perfuraca
o do campo escolhido e de 31 milh
oes de u.m. enquanto que
a investigaca
o custa 6 milh
oes de u.m. Um diagrama de influencia para
este problema e t
ao simples quanto apresentado na figura 3.16.
Resumindo temos as seguintes informaco
es probabilsticas disponveis:
P (A) = 0.2
e P (B) = 0.4

0.8 se x = 1
P (X = x|) =
0.2 se x = 0
AO DPL
3.4. INTRODUC
AO
85
Figura 3.16: Diagrama de influencia - informacao imperfeita

=
P (X = x|)
0.6 se x = 1
0.4 se x = 0
onde A e B representam os eventos ter petr

oleo em A e em B e as probabilidades condicionais acima valem tanto para = 1 como para = 2 .
Alem disto, = {1 2 , 1 2 , 1 2 , 1 2 }, onde e o indicador
da presenca de petr
oleo, o ndice o n
umero do campo petrolfero e a barra
sobre a negaca
o da presenca de o
leo. Logo, os estados da natureza
representam: ter petr
oleo em ambos, em exatamente um deles e n
ao ter
petr
oleo nos dois campos.
O espaco das aco
es ter
a cinco elementos, A = {a1, , a5}, onde a1
significa investigar o campo I, a2 - investigar o campo II, a3 - perfurar
o campo I sem investigar, a4 - perfurar o campo II sem investigar e a5 n
ao investigar e n
ao perfurar.
Com as hip
oteses feitas anteriormente e com os dados resumidos acima podemos facilmente calcular as probabilidades associadas aos estados
da natureza. Necessitaremos tambem, ao longo da soluca
o via a
rvore de

86
decis
ao, das probabilidades sobre condicionalmente aos resultados das
investigaco
es - X e ainda da marginal de X. Isto e:
P (|X = 1) P
() P (X = 1|)
X
P (X = 1) =
P (X = 1, )
A tabela abaixo resume esses c

alculos
X1 = 1
=0
X2 = 1
=0
P []
1 2
0.064
0.016
0.064
0.016
0.08
1 2
0.048
0.072
0.096
0.024
0.12
1 2
0.256
0.064
0.128
0.192
0.32
1 2
0.192
0.288
0.192
0.288
0.48
0.56
0.44
0.48
0.52
Tabela 3.1: Probabilidades conjuntas sobre X

onde, por exemplo:
P [12 ] = 0.4 0.2 = 0.08
P [X1 = 1] = P [X1 = 1 1 ] + P [X1 = 1 1]
= 0.4 0.8 + 0.6 0.4 = 0.56
Para finalizar a implementaca
o devemos, ainda, obter a tabela de consequencias, neste exemplo lucros lquidos. Esta envolver
a somente as
aco
es terminais: perfurar I, perfurar II e n
ao perfurar. Esses lucros
lquidos n
ao levaram em consideraca
o os custos de experimentaca
o.
Por exemplo, 46 = 77 31, isto e: ganho lquido de operaca
o menos
o custo da perfuraca
o.
Podemos agora fazer uso de um pacote como, por exemplo o DPL, para
obter as soluco
es possveis. Para implementaca
o no DPL trabalhamos
AO DPL
3.4. INTRODUC
AO
a3
a4
a5
12 1 2
46 -31
164 164
0
0
87
1 2
46
-31
0
12
-31
-31
0
Tabela 3.2: Consequencias lucro lquido em A

com o espaco dos estados da natureza = 1 2 = {1 , 2 , 3 , 4 }. A
a
rvore de decisao abaixo, gerada pelo pacote apresenta a soluca
o o
tima.
A soluca
o o
tima consiste em primeiro tomar a aca
o a2 isto e investigar
no campo II. A seguir, observado o resultado experimental devemos decir
por a3, a4 ou a5 . Se o experimento resultar em X2 = 1 ent
ao devemos
perfurar no campo II. Todavia, se X2 = 0 ent
ao a aca
o a5 deve ser
considerada. Este curso de aca
o o
timo e denominado regra de decis
ao
de Bayes. A recompensa associada a este curso de aca
o ser
a de 10.32
milh
oes de u.m (figura 3.17).
Outro aspecto interessante neste exemplo e o c
alculo do valor esperado da informaca
o perfeita. Isto e, seu ganho esperado sobre o conhecimento da existencia ou n
ao de petr
oleo em cada um dos dois campos
menos sua performance sem experimentaca
o. Assim, temos da tabela 3.2
que os resultados possveis seriam: 164, 164, 46 e 0 com probabilidades
0.08,0.12,0.32 e 0.48 respectivamente, menos 8 milh
oes de u.m. correspondentes a soluca
o sem investigaca
o previa. As consequencias acima
correspondem a escolha de maior retorno em cada possvel estado da natureza. Por exemplo, se 1 2 e verdadeiro ent
ao escolho a aca
o a4 e faco
um ganho de 146 milh
oes de u.m.
88
Figura 3.17: Diagrama de influencia - informacao imperfeita
Captulo 4
Probabilidade subjetiva e
utilidade
Savage (1954) comeca o captulo 3 (sobre probabilidade subjetiva) de
seu celebre livro The Foundations of Statistics da seguinte forma (nossa
traducao):
Eu pessoalmente considero mais provavel que um presidente
Republicano seja eleito em 1996 do que caia neve em Chicago
em algum dia de maio de 1994. Entretanto, mesmo essa neve
de fim de primavera parece-me mais provavel do que Adolf
Hitler ainda esteja vivo.
Apesar de transmitir a sensacao de completa falta de estrutura, essas
afirmacoes probabilsticas sao perfeitamente razoaveis e externam o grau
de crenca ou grau de incerteza de um observador (tomador de decisoes
em nosso contexto) a respeito de varios eventos (ainda) nao-observaveis.
Adicionalmente, Kyburg and Smokler (1980) editaram um compendio
sobre probabilidade subjetiva intitulado Studies in Subjective Probability
e iniciam sua introducao com um debate sobre a multitude que o conceito
de probabilidade tras em si (nossa traducao):
89
90
CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

Probabilidade e uma palavra constantemente utilizada nas
ciencias empricas, na matematica, na filosofia, e em uma
uma palavra que
multitude de situacoes da vida diaria. E
se tornou (juntamente com sinonimos tais como verossimilhanca, chance, etc.) mais e mais difundida na ciencia
desde que as leis simples e determinsticas do seculo dezoito
foram suplementadas, e algumas vezes superpostas, pelas leis
de carater estatstico ou probabilstico. Tendo em vista seu
uso frequente em uma ampla variedade de contextos, nao e de
surpreender que a palavra probabilidade tenha adquirido
varios significados que sao dificilmente distinguveis uns dos
outros. Em discurso ordinario nao importa que significado a
palavra tem, desde que o sentido particularmente utilizado seja claro no contexto em que e utilizado. Entretanto probabilidade e tambem uma palavra tecnica, aparecendo na ciencia
e na matematica; quando utilizada de forma tecnica, deveria possuir um significado claro e definitivo para o contexto
em que e utilizada. O mesmo e verdadeiro para seus usos
filosoficos. Varias propostas foram feitas a esse respeito; a
teoria de probabilidade subjetivista e uma delas.
No captulo 2 introduzimos o princpio da teoria estatstica da utilidade que diz que um tomador de decisoes deve procurar maximizar sua
utilidade esperada, onde a esperanca e tomada com relacao as probabilidades associadas (subjetivamente ou nao) aos possveis estados da natureza do problema em questao. Entretanto, nada foi ainda dito sobre
que probabilidades sao essas e como sao elicitadas, a mesma indagacao
existindo para as utilidades associadas as consequencias das possveis decisoes.
Nesse captulo introduziremos alguns resultados fundamentais para
a teoria estatstica da decisao e que servem como base solida para o
uso rotineiro dos princpios da teoria da decisao como ela e comumente
91
utilizada por microeconomistas teoricos, tomadores de decisoes medicas,
e em modelagem e decisao em financas (por exemplo, na confeccao e
monitoramento de carteiras de ativos financeiros) e tantas outras areas
da ciencia.
Iniciaremos introduzindo o princpio da coerencia na proxima secao,
atraves do famoso argumento Dutch book. Atraves desse argumento um
tomador de decisoes sempre devera quantificar as incertezas associadas a
eventos atraves do calculo das probabilidades; caso contrario ele (tomador
de decisoes) estara sendo incoerente e predisposto a participar de uma loteria com probabilidade nula de bonificacao. Em seguida, ainda na secao
4.1, introduziremos as scoring rules que induzem o tomador de decisoes
a fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto
ao informar suas probabilidades. Por exemplo, um previsor do tempo,
pode, por motivos de calibracao de suas previsoes, fornecer como probabilidade de chuva para amanha uma quantidade que nao necessariamente
represente seu verdadeiro grau de incerteza a respeito do evento.
A secao 4.2 comeca com o famoso (e curioso) paradoxo de St. Petersburg que ilustra a dificuldade de se dissociar o valor do dinheiro de sua
utilidade nos tempos de Bernoulli (Bernoulli 1738). Ainda nessa secao
introduzimos um dos resultados mais importantes da teoria da decisao, o
teorema de representacao de von Neumann-Morgenstern. O teorema basicamente introduz ferramental necessario para o tomador de decisoes sobre
incerteza escolher entre duas alternativas de acao tendo sem sua frente somente os possveis estados da natureza, suas utilidades e probabilidades.
O resultado vai alem ao mostrar que o tomador de decisoes precisa somente de discernir sobre dois estados extremos, um muito bom e outro
muito ruim cujas utilidades poderiam, arbitrariamente, ser um e zero,
respectivamente; com utilidades para todas as outras consequencias obtidas a partir dessas duas. A ideia de problemas de decisao com m
ultiplos
atributos sera breve e superficialmente abordada na secao 4.3.
92
4.1
Dutch book e regras escore
Em seu famoso livro de 1974 sobre teoria da probabilidade Bruno de

Finetti afirma que probabilidade n
ao existe. De Finetti e reconhecido atualmente como um dos mais influentes pensadores e precursores do pensamento bayesiano. O que ele realmente queria dizer com essa afirmativa era
que probabilidade tem somente uma existencia subjetiva. Em seu mais
celebre trabalho de Finetti (1937) estabelece em termos e sob condicoes
relativamente simples e matematicamente elegantes que um tomador de
decisoes deve representar interteza atraves do calculo das probabilidades,
caso contrario suas decisoes serao consideradas incoerentes.
Consideremos, inicialmente, que uma aposta seja feita na ocorrencia
de um certo evento, E. O preco dessa aposta e S, ou seja, uma fracao, ,
do premio S. Em outras palavras, se E ocorrer o apostador contabilizara
o premio de S S = (1 )S. Caso E nao ocorra, o apostador perdera
os S inicialmente apostados. A razao : (1 ) e conhecida por razao
de aposta a favor de E.
Estamos, portanto, em condicoes de enunciar o teorema do dutch
book ou teorema de Ramsey-de Finetti.
Teorema 4.1 (Ramsey-de Finetti) Se for uma probabilidade, ent
ao
ser
a coerente e seguir
a os axiomas de Kolmogorov:
Axioma 4.1 0 E 1, para todo E;
Axioma 4.2 EE c = 1;
Axioma 4.3 Se E e F s
ao tais que E F = , ent
ao E + F = EF .
Prova: Apresentaremos a prova desse resultado devido a sua simplicidade matematica, o que nao diminui sua importancia e impacto.
4.1. DUTCH BOOK E REGRAS ESCORE
93
Axioma 4.1: Se, por contradicao, E > 1 e S > 0, entao os ganhos,

relativos a E e E c , serao negativos e iguais a (1 E )S e E S,
respectivamente, causando assim perda certa para o apostador. O
mesmo ocorre para o caso E < 0 e S < 0 tambem implica em
perda certa.
Axioma 4.2: Se o axioma 1 prevalece e 0 EE c < 1, entao o
apostador tera perda certa quando SEE c < 0.
Axioma 4.3: Consideremos apostas nos eventos E, F e E F com
premios de SE , SF e SEF , respectivamente. O ganho lquido sera
de
GE = SE + SEF (E SE + F SF + EF SEF )
GF = SF + SEF (E SE + F SF + EF SEF )
GE c F c = (E SE + F SF + EF SEF )
eau
nica maneira desse sistema de equacoes lineares nao ter solucao,
ou seja, de nao haver perda certa, e a nulidade de seu determinante.
trivial de se mostrar que isso ocorre quando:
E
E + F EF = 0.
Esse resultado pode ser facilmente estendido para a obtencao de probabilidades condicionais e para demonstrar a validade do teorema de Bayes.
Deixaremos essas demonstracoes para o leitor que pode encontrar mais
detalhes em de Finetti (1974).
Esse teorema nos leva a conclusao de que a u
nica maneira coerente de
se medir incerteza, ou o grau de crenca, a respeito de eventos e atraves
de probabilidades. Esse resultado e um dos alicerces do pensamento
Bayesiano.
94
Como acabamos de ver, o uso de probabilidade para medir incerteza

leva o tomador de decisoes a agir racionalmente (coerentemente). O teorema do Dutch Book de De Finetti guarante que para ser coerente,
ou seja evitar perda certa, o tomador de decisoes deve utilizar o calculo
das probabilidades para representar incerteza. Entretanto, nada e dito
sobre a relacao entre a probabilidade utilizada pelo tomador de decisoes
e seu grau de crenca a respeito dos eventos em questao. Em um artigo de
1996, Robert Winkler diz que os axiomas de de Finetti-Savage acerca da
probabilidade subjetiva remove regras inconsistentes, ou incoerentes, mas
que coerencia nao e suficiente para garantir boas probabilidades e que
nao cria incentivos para elicitacao honesta e cuidadosa de probabilidades
a priori.
Esse nao e um problema novo. Brier (1950) e Good (1952) ja tinham essa preocupacao em mente. Brier percebeu essa necessidade em
problemas de previsao do tempo, onde os previsores estao diariamente
fornecendo, por exemplo, suas probabilidades de chuva, sejam atraves de
julgamento pessoal puro sejam atraves de modelos estatsticos e meteorologicos. A pergunta que Brier se fez foi: Sob que circunstancias essas
probabilidades representam o verdadeiro grau de crenca do previsor?.
Nessa secao sera introduzido o conceito de regras escore, que nada
mais sao do que funcoes que representam as utilidades de funcoes de
probabilidades sobre eventos desconhecidos. Good (1952), Savage (1971),
de Finetti (1974), Lindley (1982) e Winkler (1996) sao referencias essenciais sobre o assunto. O exemplo abaixo ilustra de forma simplificada o
problema em questao.
Exemplo 4.1 Suponhamos que um apostador tenha a : (1 a) como
raz
ao de chances a favor de um certo evento, digamos E e que seu grau
de crenca a respeito do evento E seja representado pela probabilidade
. Aqui e a est
ao em [0, 1], portanto o apostador e uma tomador de
decis
oes coerente. Suponhamos tambem que voce leitor seja o bookmaker,
4.1. DUTCH BOOK E REGRAS ESCORE
95
ou seja, o controlador da mesa de apostas. Voce receber

a (1 a)S caso
E se realize, e aS caso contr
ario. Seu ganho esperado e de
(1 a)S + aS(1 ) = S(a )
Um outro apostador com grau de crenca 0 sobre E ter
a um ganho esperado de S( 0 a) e ser
a incentivado a apostar um valor positivo em E
sempre que 0 > a.
Portanto, surge a necessidade de se penalizar previsoes ruins e bonificar
previsoes acuradas. Basicamente, as funcoes de utilidade utilizadas em
problemas de decisao onde a acao representa a escolha de uma probabilidade (distribuicao de probabilidade) sao conhecidas comumente por
regras escore. Mais geralmente, se o vetor a = (a1, . . . , aJ ) representa
as probabilidades anunciadas pelo previsor a respeito de eventos mutuamente exclusivos, E = (E1 , . . . , EJ ), e se suas verdadeiras probabilidades
subjetivas forem = (1, . . . , J ).
Defini
ca
o 4.1 Regra Escore: Uma regra escores u para a em E e uma
funca
o real u(Ej , a) para cada par (Ej , a).
Defini
ca
o 4.2 Regra Escore pr
opria: Uma regra escore e pr
opria se,
e s
o se, para cada em E
sup
u(Ej , a)j =
u(Ej , )j
aA jJ
jJ
(4.1)
onde A e a classe de todas as distribuico

es de probabilidade em E.
Exemplo 4.2 Suponha que a Secretaria de Municipal de Turismo do Rio
de Janeiro esteja planejando um evento cultural na areia da praia de
Copacabana para o pr
oximo final de semana. Para obter mais informaca
o
da possibilidade de chuva naquele final de semana, o Secret
ario Municipal
96
de Turismo ligou para o Centro Nacional de Meteorologia. O evento de

interesse e chuva para o final de semana, E. O verdadeiro grau de crenca
do Centro sobre esse evento e que e julgado atraves da seguinte regra
escore
u(E, a) = (a 1)2
u(E c , a) = 10(a 0)2
portanto, a Secretaria escolher
a a = /(10 9) que maximize
E{u(E, a)} = (a 1)2 10a2 (1 )
f
E
acil perceber que essa regra n
ao e pr
opria e, consequentemente, a
ser
a sempre menor que .
Brier (1950) introduziu uma das regras escore propria mais utilizadas,
a regra quadratica, como uma regra de verificacao. Outras propriedades
dessa regra podem ser encontradas em Savage (1971). Alem da regra
quadratica, outras regras comumente presente na literatura sao a logartmica (Good 1952) e as regras esfericas (Savage 1971):
Quadratica : u(Ej , a) = 2aj
a2i
Logartmica : u(Ej , a) = logaj

aj
Esferica : u(Ej , a) = P
1/2
( i a2i )
O resultado abaixo afirma que a regra escore quadratica pode ser utilizada para mostrar que se os graus de crenca do tomador de decisoes
(previsor) nao forem coerentes, entao uma acao (distribuicao de probabilidade) com escore maior pode ser obtida.
Teorema 4.2 Se a viola uma das seguintes condico
es,
4.2. UTILIDADE
97
1. 0 aj 1 para todo j = 1, . . . , k.
2.
Pk
j=1
aj = 1.
ent
ao, pode-se encontrar a0 que satisfaz 1 e 2 tal que u(Ej , a) u(Ej , a0 )
para todo j = 1, . . . , k e u(Ej , a) < u(Ej , a0 ) para pelo menos um j.
4.2
Utilidade
DeGroot (1970) comeca o captulo 7 de seu livro, Optimal Statistical

Decision, dizendo:
As probabilidades subjetivas de um estatstico sao representacoes numericas de suas crencas e informacoes. Suas utilidades sao representacoes numericas de suas preferencias.
Essencialmente, a teoria da utilidade que falaremos aqui seleciona
aquela decisao que maximiza a utilidade esperada, onde a esperanca e
tomada com respeito a` probabilidade subjetivamente elicitada a respeito
dos possveis estados da natureza. O tomador de decisoes que seguir essa postura descritiva e dito possuir um comportamento racional. Nessa
secao veremos que existe uma estreita relacao entre agir racionalmente e
ordenar aco
es segundo suas utilidades esperadas. Assumiremos, inicialmente, que todas as probabilidades dos possveis estados da natureza sao
conhecidas. Ja estudamos a relacao entre agir racionalmente e medindo
incerteza atraves do c
alculo das probabilidades na secao anterior. As utilidades foram consideradas em segundo plano tanto no caso das regras de
escore quanto no desenvolvimento da nocao de probabilidade subjetiva
coerente.
Nessa secao apresentaremos os subsdios acerca da maximizacao da
utilidade esperada. Mas antes, introduziremos o paradoxo de Saint Petersburg para ilustar que, em geral, funcoes de utilidade quando consideradas funcoes de retornos monetarios nao serao lineares.
98
4.2.1
Paradoxo de Saint Petersburg
O Paradoxo de Saint Petersburg foi primeiramente investigado por Daniel

Bernoulli em 1738 ao tentar analisar o comportamento de indivduos a`
presenca de incerteza presente em jogos de azar. Mais especificamente,
Bernoulli tinha dentro de si o seguinte paradoxo a sua frente: Um apostador tinha uma moeda honesta a sua frente para ser jogada ate que cara
fosse observada (n ensaios, digamos), o que daria ao apostador 2n reais.
Quantos reais uma pessoa estaria disposta a pagar para entrar nesse jogo?
A resposta e imediata para um tomador de decisoes que tente maximizar
o retorno monetario esperado: quantidade infinita de reais!. Mais especificamente, o ganho monetarios esperado e de
n=1
2n
n
1
2
Entretanto, qualquer pessoa, disposta a nao rasgar ou jogar dinheiro

fora, nao pagaria mais do que uma quantidade finita, e possivelmente
pequena, de reais para participar desse jogo. O paradoxo desse problema
desaparece quando o tomador de decisoes leva em consideracao a utilidade
dos reais (dinheiro) ao inves de seu valor monetario incondicional. Abaixo
apresentamos um dos resultados mais importantes da teoria da decisao e
que resolve de uma vez por todas o paradoxo de Saint Petersburg.
4.2.2
Teorema de von NeumannMorgernstern
von Neumann and Morgenstern (1944) apresentam um dos resultados

mais importantes da teoria da decisao que compara duas acoes atraves
de suas utilidades esperadas. Do ponto de vista pratico, eles criaram um
dos esquemas mais utilizados para elicitacao das utilidades associadas a
conseq
uencias. Isso e feito atraves da aplicacao iterativa do famoso teorema da representacao de von Neumann e Morgernstern. Esse teorema
4.2. UTILIDADE
99
e fundamentado em tres axiomas, os quais serao brevemente apresentados aqui. Considere, inicialmente, que Z represente o conjunto com
n possveis conseq
uencias {z1 , z2, , zn }, e A o conjunto de todas as
funcoes de probabilidade, ou aco
es, em Z. Para fixar a notacao, imagine
o seguinte exemplo.
Exemplo 4.3 Suponhamos que voce acaba de receber R$5.000,00 e que,
ap
os conversar com o gerente do seu banco, tres possveis linhas de investimento surgiram, a saber:
a Aplicar os R$5.000,00 na poupanca e receber, no final do mes, R$50,00
de rendimento;
a0 Aplicar os R$5.000,00 num fundo de renda fixa e receber, no final do
mes, R$200,00 de rendimento com probabilidade p ou nada com
probabilidade 1 p
a00 Aplicar os R$5.000,00 numa u
nica aca
o e receber, no final do mes,
R$1000,00 de rendimento com probabilidade q ou ter um rendimento
negativo de R$200,00 com probabilidade 1 q.
onde p = 0.8 e q = 0.95. Nesse contexto fictcio e simplificado, o conjunto Z, de rendimentos lquidos, tem 5 elementos, {200, 0, 50, 200, 1000},
enquanto que as loterias (ou aco
es) a, a0, a00 representam as seguintes distribuico
es de probabilidade em Z:
a = (0.00, 0.00, 1.00, 0.00, 0.00)
a0 = (0.00, 0.50, 0.00, 0.50, 0.00)
a00 = (0.05, 0.00, 0.00, 0.00, 0.95)
Qual das tres formas de investimento voce preferiria? Como voce ordenaria (da pior para a melhor), esses tres cen
arios? Ou ainda, para que
0
valor de p voce seria indiferente entre a e a ? Similarmente, para que
valores de q e s voce seria indiferente entre a e a00? Pense um pouco e
veja a continuaca
o desse exemplo mais a frente, ainda nessa seca
o.
100
De forma geral, as conseq

uencias podem ser as mais diversas e complexas, tais como as reacoes de um grupo de pacientes a` aplicacao ou
nao de um novo medicamento contra certo tipo de cancer; ou possveis
rendimentos lquidos (negativos ou positivos ou nulos) de aplicacoes em
diversos fundos de investimento, como exemplo 4.3 acima. O teorema
de von Neumann e Morgernstern (vNM) afirma que a comparacao entre
acoes (loterias) pode ser feita atraves da comparacao quantitativa dos valores esperados das utilidades das conseq
uencias quando ponderadas pelas
distribuicoes de probabilidades das respectivas loterias. No contexto do
exemplo acima, dizer que a e prefervel a a0, significa dizer que a utilidade dos R$50,00 de rendimento que a poupanca garante ao investidor e
maior do que metade da utilidade dos R$200,00 que o investidor poderia
vir a receber se investisse segundo a0. Considerando-se que um investidor
sempre preferira mais dinheiro e que a utilidade de 0 e nula (veremos
abaixo que essa suposicao podera ser feita sem perda de generalidade).
Denota-se por a a0 quando a acao a e prefervel a` acao a0. Com essa
definicao e os seguintes axiomas apresentaremos, em seguida o teorema
da representacao de von Neumann e Morgernstern. Os axiomas da teoria
de utilidade de vNM sao os seguintes
Axioma 4.4 NM1: Relacao de preferencias: e completa e transitiva
A, uma e somente uma das seguintes relaco
es deve ser satisfeita:
a a0 , or
a a0 , or
nenhuma delas.
Transitividade: Para quaisquer a, a0 e a00 em A, tais que a a0 e
a0 a00, ent
ao a a00.
4.2. UTILIDADE
101
Axioma 4.5 NM2: Independencia: Para toda aca

o a, a0 e a00 em A e
(0, 1]:
a a0
implies
(1 )a00 + a (1 )a00 + a0.
Axioma 4.6 NM3: Arquimediana: Para toda aca

o a, a0 e a00 em A tais
0
00
que a a a podem ser encontrados , (0, 1) tais que
a + (1 )a00 a0 a + (1 )a00.
Antes de falarmos mais detalhadamente sobre os axiomas, vamos apresentar um dos principais teoremas da teoria moderna da decisao.
Teorema 4.3 Representa
ca
o de Neumann-Morgernstern: Os axiomas 4.4, 4.5 e 4.6 s
ao verdadeiros se e somente se existir uma funca
o
u tal que a, a0
a a0
U (a)
zZ
a(z)u(z) >
zZ
a0(z)u(z) U (a0 )
(4.2)
com u u
nica a menos de transformaco
es lineares.
Adicionalmente, pode ser mostrado o seguinte resultado,
Lema 4.1 Se em Z satisfaz os axiomas 4.4, 4.5 e 4.6, ent
ao existem
0
z0 e z em Z tais que z0 a z0 para todo a em A.
Nessa notacao, z e a distribuicao de probabilidade com massa pontual
em z. No exemplo 4.3, z0 = 200 e z 0 = 1000. Voltemos ao exemplo 4.3
102
Exemplo 4.4 Utilizando os resultados do Teorema 4.3 e do Lema 4.1

podemos assumir que u(200) = 0 e u(1000) = 1. Supondo que o valor
de p = 0.8 torne os investimentos a e a00 investimentos com utilidades
iguais, segue-se imediatamente que u(50) = 0.95u(1000) + 0.05u(200) =
0.95. Ainda, se o rendimento da poupanca fosse de apenas R$200 ent
ao
q = 0.99 tornaria o investidor indiferente entre os investimentos a e a00
seria u(200) = 0.99u(1000) + 0.05u(200) = 0.99 Finalmente, p = 0.8
tornaria a e a0 equivalentes, ou seja, u(50) = 0.8u(200) + 0.2u(0). Da, a
utilidade do rendimento nulo e, u(0) = 0.79. Note que apesar de R$200,00
representar apenas 20% de R$1.000,00, suas utilidades s
ao bem pr
oximas,
mostrando uma forte avers
ao ao risco por parte do investidor. Na seca
o
4.4 abordaremos a utilidade do dinheiro, muito u
til para tomadores de
decis
oes econ
omicas.
Alguma explicacao sobre os axiomas devem ser feitas. Complitude
requer basicamente que o tomador de decisoes nao saiba o que fazer
quando questionado a respeito de sua preferencia em relacao a pares
de acoes. A transitividade permitira que problemas multidimensionais
possam ser quebrados em pequenos problemas unidimensionais. Independencia afirma que duas acoes sejam comparadas somente atraves de
seus componentes diferentes. Esse e um dos axiomas mais controvertidos e varios paradoxos foram apresentados ao longo dos anos contra
essa hipotese. Allais (1953) apresenta uma serie de exemplo normativos e
descritivos que mostram a violacao do axioma da independencia. Kahneman and Tversky (1979) tambem apresentam uma serie de experimentos
empricos. Seidenfeld (1988) apresenta um argumento normativo a favor
do axioma. O axioma archimediano e tambem conhecido como axioma
da continuidade pois diz que uma acao pode ser preferida a outra, mas
nao de forma extrema e que evite que combinacao de outras acoes nao
possam ser preferidas. Para mais detalhes sobre os axiomas de vNM e
suas implicacoes praticas e teoricas, veja Jensen (1967), Fishburn (1981),
Fishburn (1982) e Kreps (1988).

4.3. MULTIPLOS
ATRIBUTOS
4.3
103
M
ultiplos atributos
Na maioria dos problemas de decisao encontrados na pratica a dimensao

do espaco de decisoes nao e unidimensional. Existe, na maioria dos casos, varios atributos a serem considerados, por exemplo, ao decidir entre
duas oportunidades de trabalho seria natural esperar que o tomador de
decisoes prefira um salario maior a um menor, mas tambem se espera que
ele prefira uma funcao que lhe de algum tipo de satisfacao profissional,
uma localizacao adequada para sua locomocao, colegas de trabalho que
sejam minimamente simpaticos e solcitos, assim como um patrao que se claro que maximizar todos esses atributos e tarefa
ja mais um amigo. E
praticamente impossvel, gerando assim a necessidade de o tomador de
decisoes pondera-los de alguma forma para encontrar aquela funcao que
de uma forma global lhe satisfaca mais, que tenha a maior utilidade. Portanto, precisamos analisar o problema de decisao, nesses contextos, sob
uma otica conjunta, multifacetada. Genericamente, U (x1, x2 , . . . , xn ) representa a funcao de utilidade caracterizada pelos atributos x1, x2 , . . . , xn .
Assim como no caso univariado, a forma mais natural de obtencao
da utilidade para um ponto x = (x1, . . . , xn ) seria encontrar uma loteria cujo retorno medio (calculado com base nos casos extremos: melhor
caso e pior caso) faria com que o tomador de decisoes fosse indiferente
entre essa loteria e o evento certo x. Entretanto, nao e difcil perceber
que essa ideia natural tornasse impraticavel quando n cresce e necessariamente muito mais comparacoes (e loterias) sao necessarias. Nessa
secao introduziremos algumas das simplificacoes comumente utilizadas
para tornar os problemas de multiatributos trataveis. A capacidade de
quebrar uma funcao de utilidade multiatributo em partes menores, em
geral univariadas, e conhecida por separabilidade. Abaixo mencionamos
brevemente algumas condicoes para que tal quebra seja viabilizada.
Consideraremos o caso bivariado para exposicao das ideias. Maiores detalhes sobre problemas tridimensionals ou gerais podem ser encontrados,
104
por exemplo, em Clemen (1996). Dessa forma, consideramos a seguinte

decomposicao:
U (x1 , x2) = a0 +
2
X
ai UXi (xi ) + a4 UX1 (x1)UX2 (x2)
i=1
Defini
ca
o 4.3 Independ
encia preferencial mutua: Um atributo X1
e considerado preferencialmente independente de X2 se as preferencias
para resultados especficos de X2 n
ao dependem do nivel do atributo X1 .
Se o mesmo acontece quando as posico
es de X1 e X2 s
ao invertidas temos
uma ideia relativao conceito de independencia preferencial m
utua. E
mente interessante, principalmente em situaco
es onde tempo e custo
s
ao os atributos em quest
ao.
um pouco mais forte do que
Defini
ca
o 4.4 Utilidade-independente E
o conceito de independencia m
utua pois involve a noca
o de incerteza,
quase sempre presente nos problemas de decis
ao. Um atributo X 1 e considerado utility independent do atributo X2 se preferencias por escolhas
incertas envolvendo nveis diferenciados de X1 s
ao independentes do valor de X2 . Novamente, se o mesmo vale quando os papeis de X1 e X2 s
ao
invertidos, dizemos que X1 e X2 s
ao mutuamente utilidade-independente.
Pode-se mostrar que
U (x1 , x2) = cX1 UX1 (x1) + cX2 UX2 (x2) + (1 cX1 cX2 )UX1 (x1)UX2 (x2)
+
onde cX1 = U (x+
em, UX1 (x1)UX2 (x2)
1 , x2 ) e cX2 = U (x1 , x2 ). Tamb
representa a interaca
o entre os atributos.
Defini
ca
o 4.5 Independ
encia aditiva: Quando, na express
ao acima,
+
cX1 = U (x+
1 , x2 ) + cX2 = U (x1 , x2 ) = 1
temos que
U (x1 , x2) = cX1 UX1 (x1 ) + (1 cX1 )UX2 (x2)
O conceito de independencia aditiva e portanto mais forte que aqueles ate

aqui introduzidos.
AO RISCO
4.4. MEDIDAS DE AVERSAO
4.4
105
Medidas de avers
ao ao risco
No exemplo 4.3 vimos que o tomador de decisao parecia averso ao risco,

uma vez que, mesmo tempo uma opcao de retorno medio de investimento
igual a R$100,00 (0.5(R$200, 00) + 0.5(R$0.00)), a opcao de deixar o
dinheiro na poupanca (retorno fixo e igual a R$50,00) e preferida, ou
seja, tem maior utilidade. Esse tipo de comportamento e relativamente
comum e algumas de suas propriedades serao brevemente estudada nessa
secao.
Inicialmente, suponha que x represente a quantidade de dinheiro e F
seja uma funcao de distribuicao que mede probabilidades a respeito de x.
Adicionalmente, F e o espaco de todas as funcoes de distribuicao para
quantidades nao negativas de dinheiro. Estendendo os resultados acerca da utilidade esperada de von Neumann e Morgernstern (secao 4.2.2,
diremos que a utilidade da funcao F (.) sera
U (F ) =
R
u(x)dF (x)
ou U (F ) = u(x)f (x)dx se x poder ser visto como uma variavel aleatoria

contnua com funcao densidade de probabilidade f . O seguinte resultado
generaliza a discussao do incio dessa secao.
Defini
ca
o 4.6 Um tomador de decis
oes e considerado averso ao risco se
,e s
o se,
Z
u(x)dF (x) u
Z
xdF (x)
para todoF em F
(4.3)
Equivalentemente, um tomador de decisoes e averso ao risco se u(.) for

uma funcao concava. Em outras palavras, aversao ao risco implica que,
para dado nvel x de riqueza, a utilidade adicionada por uma unidade
de dinheiro e menor que a utilidade subtrada pela mesma uma unidade
de dinheiro. Esse comportamento esta ilustrado na figura 4.1. Pode ser
106
visto que, com riqueza de 2 unidades monetarias a utilidade adicional de

uma unidade monetaria, u(3) u(2), e menor que a utilidade subtrada,
u(2) u(1), mostrando que o investidor e mais propenso a rejeitar acoes
(investimentos) mais arriscadas. Quando a expressao 4.3 for uma igualdade, diz-se que o tomador de decisoes e neutro ao risco. Nesse u
ltimo
caso a utilidade e linear na quantidade de dinheiro.
Figura 4.1: Funcao de utilidade de um agente averso ao risco.

Uma outra quantidade comumente obtida em problemas de decisao
com retornos monetarios, e a quantidade de dinheiro para a qual o tomaR
dor de decisoes se torna indiferente entre F (.) e a quantidade u(x)dF (x),
chamada de certainty equivalent. Na figura 4.1, o certainty equivalent e o
valor assinalado por CE. O certainty equivalent, em problemas atuariais,
corresponde a` quantidade maxima que o segurado pagaria para nao correr
AO RISCO
4.4. MEDIDAS DE AVERSAO
107
os riscos associado a F (.). O seguinte resultado sobre aversao ao risco

pode ser obtido
Teorema 4.4 O tomador de decis
oes e averso ao risco se c(F, u)
R
xdF (x) para todos F F .
natural esperar que o grau de aversao ao risco esteja associado a`

E
curvatura de u, possivelmente atraves de u00(x). Uma medida bastante
conhecido e o coeficiente de aversao absoluta ao risco de Arrow-Pratt.
Teorema 4.5 Seja u uma funca
o de utilidade duplamente diferenci
avel.
Ent
ao o coeficiente de avers
ao absoluta ao risco de Arrow-Pratt e dado
por:
u00(x)
rA (x) = 0
u (x)
Naturalmente, o coeficiente vale zero para situacoes onde o tomador

de decisoes seja neutro ao risco.
108
Captulo 5
An
alise de Sensibilidade
5.1
Introdu
ca
o
Neste captulo discutiremos alguns aspectos da analise de sensibilidade

a qual e central na estruturacao e solucao de modelos de decisao. As
tecnicas de analise de decisao usam como ingrediente fundamental julgamentos do tomador de decisao atraves de suas preferencias e crencas.
A distribuicao a priori, o modelo que descreve os dados disponveis e
a funcao de perda ou utilidade impactam a solucao final do problema.
A questao central deste captulo e avaliar a sensibilidade dos resultados
finais a variacoes a esses elementos da analise.
Iniciaremos discutindo alguns aspectos de identificacao do problema
e de sua estruturacao para a seguir atacar questoes ligadas a` robustez
das componentes do modelo de decisao. Este captulo esta influenciado
fortemente pelos textos de Clemen (1996) e French and Rios-Insua (2000).
109
110
5.2
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Identifica
ca
o e estrutura
Ao nos depararmos com um problema de decisao devemos cumprir uma

serie de estagios iterativos ate a implementacao de uma das alternativas
escolhidas. Iniciamos, portanto, pela identificacao do problema de decisao. Devemos identificar sua estrutura e entender os objetivos almejados, pois somente assim poderemos enumerar as alternativas disponveis.
Num proximo passo deveremos especificar as partes integrantes do modelo. As incertezas e as preferencias devem ser eliciadas de forma a possibilitar a escolha do melhor curso de acao ou a alternativa o
tima. O estudo
da sensibilidade dos resultados quando aplicados a`s etapas de identificacao e estruturacao do problema sera denominado de analise preliminar
de sensibilidade.
Com respeito a` identificacao do problema devemos ser extremamente
cuidadosos para evitarmos cometer o chamado erro tipo III Clemen (1996),
que consiste em resolver, com esmero, o problema errado. Vejamos um
pequeno exemplo.
Exemplo 5.1 H
a alguns anos atr
as nos deparamos (um dos autores,
HSM) com um problema desafiador. Tratava-se de desenvolver um modelo para decidir da viabilidade da introduca
o de certo estoque regulador
de precos para o mercado internacional do cafe. Ap
os gastar um tempo
para compreender a estrutura do mercado internacional do cafe e discutir
estrategias metodol
ogicas alternativas nos decidimos pela implementaca
o
de um modelo econometrico que descrevesse os fluxos de cafe entre os
mercados produtores e consumidores, alem, e claro, dos precos praticados. Levantamos dados para um perodo de dez anos, em bases trimestrais
e ajustamos um modelo econometrico com v
arias equaco
es estoc
asticas e
algumas identidades ou equaco
es de balanco. O mercado produtor foi segmentado segundo os tipos de cafe: ar
abica, robusta e suaves. Os primeiros
tipicamente produzidos no Brasil, os segundos de origem africana e os
u
ltimos produzidos na Amercia Central e Col
ombia. Pelo lado dos im-
E ESTRUTURA
5.2. IDENTIFICAC
AO
111
portadores segmentamos os mercados em Estados Unidos, Europa, Jap

ao
e resto do mundo. Assim tnhamos fluxos de oferta e demanda de quatro
origens para quatros destinos. Coletados os dados e ajustado os modelos
econometricos implementamos v
arias regras de compra e venda a serem
praticadas pelo organismo regulador de forma a manter os precos flutuando em uma faixa de variaca
o adequada. A soluca
o envolveu simulaca
o
estoc
astica uma vez que as regras de compra e venda do buffer stock eram
extremamente n
ao lineares. Concluiu-se que o estoque regulador de precos
era vi
avel. Onde est
a o erro tipo III? A quest
ao e que se o mercado internacional do cafe ficasse t
ao eficiente, como proposto pela presenca do
estoque regulador de precos, a produca
o aumentaria descontroladamente
fazendo com que o mercado ficasse encharcado de cafe. Obviamente era
preciso considerar algum componente de longo prazo no modelo, que evitasse este tipo de reaca
o dos agentes envolvidos.
Este exemplo ilustrou a importancia de se caracterizar precisamente
o problema a ser resolvido. Esta etapa e denominada de identificaca
o do
problema e envolve varios agentes: o tomador de decisao, o analista de
decisoes etc. Vale notar que esta e uma fase comumente praticada na
modelagem estatstica. Identifica-se o modelo, ajusta-se os parametros,
realiza-se testes de diagnosticos e retorna-se a fase de identificacao ate que
o modelo ajustado seja validado e entao aplicado para fazer inferencias e
predicoes.
`
Um segundo aspecto de relevancia e a estrutura do problema. As
vezes, introduzindo-se uma alternativa a mais, a solucao pode modificarse profundamente. Analogamente, algumas quantidades incertas podem
ser tratadas com maior nvel de detalhe do que outras em razao de seu
impacto no resultado final. Ilustraremos este aspecto com dois exemplos.
Exemplo 5.2 Num certo problema medico a decis
ao o
tima pode ser sensvel a estrutura do problema. A inclus
ao de mais uma alternativa pode
afetar a maneira como encaramos o problema. Imagine que um amigo
112
CAPITULO 5. ANALISE
DE SENSIBILIDADE
nosso sofreu um ataque cardaco e que o medico recomenda uma ponte

de safena. A cirurgia pode resolver o problema. Quando perguntado, o
medico revela que existe um certo risco cir
urgico. Uns poucos indivduos
morrem durante a cirurgia mas, muitos se recuperam, e a cirurgia e um
completo sucesso. Assim nosso amigo tem muitas raz
oes para antecipar
uma longa vida, plena de sa
ude. Sem a operaca
o, todavia, teria uma qualidade de vida que continuamente se deterioraria e, possivelmente, seria
curta. Suponhamos que o objetivo central de nosso amigo e maximizar a
bastante claro que a cirurgia deva ser considerqualidade de sua vida. E
ada seriamente. Entretanto, antes de enfrentar este problema decis
orio
ele sai em busca de uma segunda opini
ao. Um outro medico discute um
desfecho alternativo: complicaco
es decorrentes da cirurgia podem implicar
em longos e penosos tratamentos. Se isto ocorrer, o resultado final poder
a
ser: recuperaca
o completa, recuperaca
o parcial (uso de cadeira de rodas!)
ou morte dentro de alguns meses. Esta terceira alternativa poder
a modificar completamente a decis
ao final. Provavelmente a alternativa cir
urgica
seja desconsiderada em raz
ao deste detalhamento adicional da estrutura
do problema.
O proximo exemplo tem por objetivo mostrar que, a`s vezes, a estruturacao do problema varia com a otica dos agentes envolvidos. Por um
lado poderiamos ter uma situacao com um u
nico decisor e por outro uma
situacao envolvendo varios agentes.
Exemplo 5.3 Este e um exemplo extrado do texto de von Winterfeldt
and Edwards (1986) e envolve o estabelecimento de padr
oes para poluica
o
decorrente da extraca
o de petr
oleo em alto mar. Uma das formas de
abordar o problema seria do ponto de vista de uma agencia reguladora. As alternativas consistiriam na definica
o de padr
oes aceit
aveis de
poluica
o e na definica
o de polticas de controle. Obviamente, os objetivos
finais seriam minimizar o ndice de poluica
o mantendo a produca
o eficiente. Uma estrutura alternativa decorreria de examinar a quest
ao como

5.3. EXEMPLO DE ANALISE
PRELIMINAR DE SENSIBILIDADE113
a competica
o entre tres agentes: a agencia reguladora, a ind
ustria de extraca
o de petr
oleo e as eventuais vtimas de possveis cat
astrofes. Este e
um exemplo de como uma mesma situaca
o decis
oria pode ser tratada de
diferentes formas.
A analise de sensibilidade pode colaborar na escolha de uma particular
estrutura mais adequada para atacar o problema, e ajudando na identificacao de aspectos especficos que devem realmente ser considerados pelo
decisor.
Na proxima secao examinaremos um problema onde a analise preliminar de sensibilidade sera u
til para descrever quais das incertezas presentes
merecem ser descritas com maior nvel de detalhamento. O criterio de
identificacao dessas incertezas sera basedo no impacto que elas provocam
sobre os resultados finais. Analises de sensibilidade envolvendo o impacto
ao se variar um u
nico fator por vez serao discutidas e, tambem, analises
de dois fatores serao apresentadas.
sempre uma boa pratica iniciar-se por analises simplificadas. EmbE
ora avaliar o impacto de um fator por vez possa ser enganoso dado que os
fatores podem iteragir, e, todavia, inegavel que simplifica imensamente a
compreensao e analise dos resultados.
5.3
Exemplo de an
alise preliminar de sensibilidade
Para exemplificar alguns aspectos da analise preliminar de sensibilidade

utilizaremos um excelente exemplo descrito no livro de Clemen (1996).
Certa companhia aerea, Aguia,

esta considerando a possibilidade de
expandir suas operacoes. Para isto necessita de mais uma aeronave. Atualmente opera com tres bimotores, tanto em voos fretados quanto em
transportes regulares de passageiros. Esta pequena companhia esta satis-
114
CAPITULO 5. ANALISE
DE SENSIBILIDADE
feita com a combinacao dessas atividades: fretamento e transportes regulares de passageiros. Estes correspondem a 50% das operacoes e consistem
em voos de em media 90 minutos e com distancias de 480 kilometros.
A expansao de suas atividades se dara na area de fretamento. Este
e um novo nicho de mercado em franca expansao. Necessita, portanto,
de um novo aviao. Coincidentemente surgiu uma oportunidade. Existe
um Piper Seneca a venda por 95000 dolares por uma empresa do Oriente
Medio. Este e um bimotor em boas condicoes de manutencao, isto e,
satisfazendo a`s normas das autoridades aeronauticas. Apos sua u
ltima
revisao geral, seus motores ja operaram 150 horas. Esta aeronave acomoda 5 passageiros, alem do piloto e bagagens. Possui os instrumentos
de navegacao e comunicacao necessarios para operar nas condicoes dos
demais equipamentos da AGUIA,

e voa a uma velocidade de 200 milhas
por hora. Seu custo operacional esta estimado em 245 dolares por hora,
incluindo combustvel, manutencao e salario do piloto, alem de outras
despesas fixas, incluindo seguro, encargos financeiros etc e montando a
20000 dolares anuais.
A receita que espera auferir, com este novo aviao, proveniente dessas
duas atividades e de 300 a 350 dolares por hora de fretamento e 100
dolares por passageiro hora nos voos regulares, esperando uma taxa media
de ocupacao de cerca de 50% dos assentos. Estima, ainda, voar 1000 horas
por ano, sendo todavia mais realista que voe 800 horas por ano.
Para realizar este negocio a AGUIA

necessita de um emprestimo de
aproximadamente 40% do valor da aeronave. A taxa de juros de mercado
e em media 9.5% a.a, mas sujeita a variacoes. Dentre as condicoes de
compra destacamos as alternativas:
Compra imediata
Aquisicao de uma opcao de compra com validade de um ano a um
custo anual variando de 2500 a 4000 dolares.

Investimento de seus atuais recursos, ao inves da compra do aviao,
no mercado financeiro a uma taxa media de 8% a.a.
Vale ressaltar, novamente, que muitos dos valores numericos envolvidos na descricao desse exemplo sao meras estimativas, alguns sobre con
trole da propria AGUIA,
outros nao.
Vamos ajudar a AGUIA

a comparar essas alternativas. Sera que os
n
umeros envolvidos fazem muita diferenca? A opcao de compra vale a
pena? Deixamos de considerar algum aspecto essencial? Essas e outras
sao questoes que a analise preliminar de sensibilidade pretende responder.
Iniciemos descrevendo a estrutura do problema acima apresentado
atraves de um diagrama de influencia para as receitas e outro para os
custos.
Do ponto de vista dos custos temos duas fontes: os custos operacionais
- fixos ou variaveis - e os custos associados ao financiamento de parte do
valor de compra. Assim as horas voadas (hvoa ) vezes o custo da hora voada
(chora ) compoem com o custo fixo, seguro e outras encargos financeiras,
(cf ixo) o custo operacional (coper ).
coper = chora hvoa + cf ixo
Por seu turno o custo do financiamento (cf ina ) depende da taxa de juros (tjuro ), do percentual a financiar (f ina) e, obviamente, do preco de
compra do aviao (pcomp ):
cf ina = tjuro f ina pcomp
Logo o custo total sera:
ctota = coper + cf ina
Pelo lado da receita devemos considerar as horas voadas (hvoa ), a proporcao de voos fretados (f ret), a taxa de ocupacao de voos de passageiros
(pass ), o preco do frete (pf ret ) e o preco da passagem por assento (passe ):
rtota = npass [1 f ret] pass hvoa ppass + f ret hvoa pf ret
116
CAPITULO 5. ANALISE
DE SENSIBILIDADE
onde o n
umero de passageiros (npass ) e suposto fixo e igual a 5, neste
exemplo.
Os diagramas de influencia apresentados nas figuras 5.1 e 5.2 resumem
os calculos descritos nas formulas acima. Estes sao tipicamente diagramas
de calculos intermediarios. Temos os nos decisorios referentes aos precos
do frete e do assento em voo regular e da percentagem a financiar. Estas
sao as variaveis sob o controle da AGUIA.
Figura 5.1: Diagrama de influencia: receita e custo

Note que estes dois diagramas de influencia podem ser juntados num
u
nico mais complexo onde fica definido o conceito de lucro (Lucro) e
onde e includo um no decisorio descrevendo a alternativa de postergar
a compra por um ano, adquirindo, no momento, somente a opcao de
compra. Teremos agora os seguintes nos: de consequencia - o no de
lucro, nos de calculos intermediarios - custo de financiamento e total.
Alem disto, temos varias constantes de entrada: taxa de juros, seguro e
precos.
Suponha que tenhamos acessado para cada uma das dez variaveis en-

Figura 5.2: Diagrama de influencia completo

volvidas neste processo decisorio tres valores: o mais provavel, o extremo
inferior e o extremo superior. Desejamos, variando um por vez, verificar
qual o impacto de cada item no valor final - lucro - do nosso sistema.
Suponha que estes valores sejam aqueles apresentados na tabela 5.1.
Utilizaremos como funcao de influencia global
i ) T (sxi )
Sg (i) = T (sx
onde T (sx) e o lucro lquido considerando o vetor de dados sx e o

sub-ndice i significa que todas as componentes exceto a i-esima serao
fixadas no seu valor mais provavel. Podemos, agora, ordenar descrescentemente as variaveis segundo o valor de Sg (i) e construir o grafico
da figura 5.3 onde plotamos barras horizontais representando o intervalo
118
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Variavel
Linf
hvoa
500
pf ret
300
pass
95
pass
.40
f ret
.45
chora
230
cf ixo
18000
f ina
.30
tjuro
.105
pcomp
85000
Media
Lsup
800
1000
325
350
100
108
.50
.60
.50
.70
245
260
20000 25000
.40
.50
.115
.13
87500 90000
Tabela 5.1: Variaveis de entrada - domnio de variacao
), T (sx )). No pacote DPL este grafico e denominado Tornado e

(T (sx
permite visualizar o efeito de cada variavel no resultado final. Aquelas

variaveis mais influentes deverao ser tratadas como estados da natureza
e suas incertezas eliciadas com maior rigor, enquanto que as demais serao
mantidas fixas em seu valor mais provavel. Este exemplo sera reconsiderado na secao 5.5 onde a sensibilidade a escolhas das probabilidades
atribudas a`s variaveis: pass , chora e hvoa , serao avaliadas.
5.4
Conceitos b
asicos de an
alise de sensibilidade
Vimos nos captulos anteriores que um problema de decisao depende fun preciso especidamentalmente das preferencias e crencas do decisor. E
ficar os antecedentes distribuicoes a priori, as consequencias a funcao
utilidade e o modelo probabilstico, o qual descreve os experimentos
5.4. CONCEITOS BASICOS

DE ANALISE
DE SENSIBILIDADE 119
Figura 5.3: Diagrama tornado

realizados com o intuito de reduzir as incertezas. Essas quantidades sao
de difcil especificacao, sobretudo no caso de varios decisores ou m
ultiplos
especialistas.
Neste contexto torna-se importante avaliar a sensibilidade dos resultados obtidos a variacoes nessas quantidades. Existe uma extensa literatura
estatstica discutindo robustez Bayesiana e analise de sensibilidade. Nesta secao nos limitaremos a introduzir uma notacao geral para descrever
o problema e discutir, atraves de exemplos, algumas questoes relevantes.
O tema e relativamente teorico e exige conhecimentos acima dos assumidos neste texto. Recomenda-se, aos interessados, a leitura French and
Rios-Insua (2000).
Exemplo 5.4 Uma companhia de seguro de sa
ude disp
oe de dados mensais sobre o n
umero de ocorrencias de sinistros consultas medicas
e, obviamente, o n
umero de segurados mes a mes (Migon 2001). No
processo de decidir sobre o premio atuarial a companhia deve modelar a
evoluca
o do n
umero de sinistros e, tambem, o valor dos mesmos. Dese-
120
CAPITULO 5. ANALISE
DE SENSIBILIDADE
jamos exemplificar o efeito da escolha da distribuica

o a priori na previs
ao
do n
umero futuro de sinistros. Denotemos por Nt o n
umero observado de
sinistros e por t a populaca
o segurada, no mes t, t = 1, , T . Suponha
que o n
umero de sinistros mensais seja distribudo segundo uma Poisson,
isto e
Nt |, t P o(t )
onde t e suposto conhecido e e a taxa de sinistros por segurado mes

suposta estacion
aria. O par
ametro e desconhecido e desejamos eliciar
uma priori para ele. Consultando-se dados internacionais, por exemplo
da Organizaca
o Mundial de Sa
ude (OMS), obtemos a informaca
o de que,
em media, cada segurado faz 4 consultas medicas por ano. Assumindo-se
um coeficiente de variaca
o de 2 unidades podemos especificar uma priori
na famlia Ga(a, b), a, b > 0 usando as relaco
es:
E[|a, b] = a/b
CoV 2[|a, b] = 1/a
isto e: a/b = 4 e 1/a = 1/4, ou seja a = 0.25 e b = 0.0625. Vale notar

que alternativamente poderamos ter eliciado os quartis e determinado a
e b atraves de um ajuste. Por exemplo N0.25 = 0.05, N0.5 = 0.80 e N0.75 =
4.0.
Assim a distribuica
o a posteriori ser
a:
|sNT , sT Ga(a1, b1 )
onde sNt representa o vetor de observaco
es ate o tempo t, st o vetor da
populaca
o segurada ate o tempo t e
a1 = 0.25 +
t
X
k e b1 = 0.0625 +
t=1
t
X
Nk
k=1
A media e a vari
ancia da distribuica
o preditiva, a qual ser
a uma Binomial
Negativa, seguem facilmente das express
oes gerais:
E[Nt+1 ] = E[E[Nt+1 |, sNt , st+1 ]]
5.4. CONCEITOS BASICOS

DE ANALISE
DE SENSIBILIDADE 121
V [Nt+1] = E[V [Nt+1|, sNt , st+1 ]] + E[V [Nt+1|, sNt , st+1 ]]
Representando a informaca
o disponvel ate o tempo t por D t = {(sNt , st )},
teremos no nosso exemplo:
t
nt
t
t
nt
t
t
nt
t
E[Nt+1 |Dt ] = E[E[Nt+1|Dt , st+1 ]]

= t+1 E[|Dt ]
P
0.25 + tk=1 Nk
= t+1
P
0.0625 + tk=1 k
1
643
1130
9
2046
2289
17
2085
3260
2
796
1234
10
2543
2685
18
2571
3304
3
817
1282
11
2901
2737
19
3172
3334
4
938
1329
12
2368
3016
20
3046
3405
5
958
1412
13
2442
3069
21
2781
3474
6
1056
1454
14
2613
3114
22
3592
3578
7
1363
2027
15
2935
3179
23
3204
3645
8
2115
2144
16
2965
3225
Tabela 5.2: Dados de n

umero de consultas medicas
Para examinar o efeito da distribuica
o a priori sobre as previs
oes
podemos fazer um gr
afico (figura 5.4) plotando o valor esperado da distribuica
o preditiva contra o n
umero observado de consultas para os perodos,
digamos t = 9 a t = 23.
Duas distribuico
es a priori foram utilizadas, ambas relativamente precisas mas com medias (4 e 1, respectivamente) afastadas dos valores observados. Como temos uma quantidade muito grande de observaco
es rapidamente o efeito inicial dessas prioris fica diludo. Logo, podemos afirmar
que os resultados s
ao pouco sensveis a
` escolha da priori.
122
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Figura 5.4: Valor esperado da distribuicao preditiva, segundo duas prioris

alternativas, e frequencias observadas no perodo t = 9 24.
Esta analise sofre de varias crticas. Por um lado, e pouco razoavel que
seja invariante no tempo, por outro, a distribuicao a priori e arbitraria
por considerar somente umas poucas informacoes da Organizacao Mundial da Sa
ude (OMS) e, tambem, pela escolha de conveniencia a famlia das
distribuicoes gama. Uma classe mais ampla de distribuicoes a priori sera
investigada e o efeito desta imprecisao sera avaliado mais adiante.
5.5
Sensibilidade da distribui
ca
o a priori
Embora seja bem sabido que considerar isoladamente os efeitos da distribuicao a priori e da funcao de utilidade e uma grave limitacao na
analise de sensibilidade, vamos iniciar pela analise isolada dos efeitos da
distribuicao a priori. Alem disto, no que se segue, o modelo sera considerado como fixo, sem perda de generalidade.
Uma notacao geral facilitara a exposicao do conceito de sensibilidade
A PRIORI
5.5. SENSIBILIDADE DA DISTRIBUIC
AO
123
global. Denote por T (l, p, pX , a) um funcional valor esperado a posteriori da perda como funcao de l funcao de perda, p() distribuicao a
priori, p(x|) distribuicao das observacoes e a uma acao. Assim teremos:
T (l, p , pX , a) =
R
l(a, )p(x|)p()
1
d
p(x)
onde p(x) = p(x|)p()d denota a distribuicao preditiva.

Denotaremos por ab a regra de Bayes, isto e:
ab = argminaT (., ., ., a)
Dentre as classes de distribuicoes a priori discutidas na literatura
destacam-se:
Famlias conjugadas - a principal vantagem desta famlia e a possibilidade de se obter calculos em forma fechada. Alem disto, sao
flexveis o suficiente para acomodar as crencas do tomador de decisao.
Classe de distribui
co
es vizinhas - esta famlia e construida a partir de uma distribuicao base p0 () e uma dada metrica. Todas as
densidades vizinhas de po () serao membros da classe. Um exemplo
seria a classe das distribuicoes -contaminadas, isto e: P = {p =
(1 )po () + p()}
Classe dos momentos - e a colecao de todas as prioris com momentos
proximos aos eliciados pelo decisor.
Classe dos quantis - esta e a classe de distribuicoes satisfazendo certas restricoes, estabelecidas subjetivamente pelo decisor, sobre os
quantis.
A sensitividade global examina o range de variacao a posteriori (ou
na preditiva) de um funcional para p() P.
124
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Defini
ca
o 5.1 Seja P uma classe de prioris. Uma medida de sensibilidade global (Sg ) e dada pela amplitude de variaca
o do funcional de
interesse:
Sg (p()) = supp P T (p()) infp P T (p())
Esta medida e simples de interpretar. A quantidade a posteriori e
robusta a desvios da priori quando esta amplitude for pequena e nao
e robusta quando a amplitude for grande. Por exemplo, se fixamos a
perda quadratica, l(, a) = ( a)2, entao T (p()) = E[|sx] e Sg (p())
a amplitude de variacao da media a posteriori quando a distribuicao a
priori variar em uma particular classe de distribuicoes.
Exemplo 5.5 Compra ou Leasing de Avi
ao: ap
os a an
alise preliminar
de sensibilidade decidimos modelar estocasticamente as quantidades horas voadas, custo por hora voada e ocupaca
o de assentos. A quantidade preco do fretamento, embora tambem de grande influencia nos resultados finais, e de fato uma vari
avel de controle da companhia. Estas quantidades incertas foram examinadas como bin
arias, representando uma situaca
o pessimista (codificada como 0) ou otimista (codificada como 1). Admitiu-se que chora e pass s
ao distribuidas independentemente, mas que hvoa tem distribuica
o dependendo de pass . Assim temos
as probabilidades p = P [Chora = 1] e q = P [pass = 1], com a letras
mai
usculas, como usual, representando vari
aveis aleat
orias. Finalmente
teremos r = P [Hvoa = 0|pass = 0] e s = P [Hvoa = 0|pass = 1], com
r > s. Para estudarmos a influencia dessas quantidades nos resultados
finais assumiremos ainda que s = 0.8r e que p = 0.5. Alem disto iremos
supor que as decis

oes disponiveis para a Aguia
s
ao somente a1 comprar
ou a2 - n
ao comprar o avi
ao. No segundo caso, obviamente, a Aguia
investir
a seus recursos pr
oprios no mercado financeiro. No limitaremos,
assim a examinar conjuntamente o efeito de q e r. Os valores monet
arios
dessas quantidades foram, tambem, revisados. Teremos, respectivamente,
para os casos pessimista e otimistas, as seguintes informaco
es.
A PRIORI
5.5. SENSIBILIDADE DA DISTRIBUIC
AO
chora
pass
hvoa
125
Pessimista Otimista
253
237
0.45
0.55
650
900
Tabela 5.3: Novos valores associados as variaveis mais relevantes
As demais quantidades foram mantidas nos seus valores base (tabela

5.1). Ap
os algumas simplificaco
es chegamos a equaco
es de receita e despesas como funca
o das quatidade incertas
ctota = 24025 + chora hvoa
rtota = 250 pass hvoa + 162.5 hvoa
Poderiamos utilizar uma vez mais o DPL para esta an
alise. Temos
de calcular o valor esperado do Lucro para cada uma das alternativas
e examinar a reg
ao do plano (q, r) que, por exemplo, leva a compra do
avi
ao. Esta an
alise de sensibilidade servir
a para orientar a quantidade de
esforco necess
ario para se modelar as incertezas. Neste exemplo temos:
r(a1) = q (3500 r 22500) 1100 r + 25475
Desejamos comprar o avi
ao somente se este lucro esperado superar o
investimento nomercado financeiro, que j
a sabemos gera um ganho de
4200 U M . Ap
os um pouco de a
lgebra chegamos a desigualdade:
21275 11000 r > q [22500 3500 r]
Escolhas de pares (q, r) pr
oximos a curva que define esta fronteira s
ao
mais sensveis do que valores distantes.
126
5.6
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Sensibilidade conjunta: priori e utilidade
Nestas secao discutiremos alguns aspectos adicionais sobre sensibilidade.

Iniciaremos discutindo o efeito simultaneo de imprecisoes na distribuicao
a priori e no valor das consequencias. Como ja mencionamos essas analises
rapidamente tornam-se computacionalmente complexas e com resultados
de difcil interpretacao. Uma boa pratica e ganhar experiencia atraves
de exemplos simples e variando tanto a priori como as consequencias em
somente um alguns poucos valores. Um exemplo discutido em French
and Rios-Insua (2000) e apresentado a seguir. Serao tambem discutidas situacoes mais atraentes e realistas onde analisaremos a influencia
simultanea da consequencia media de certo investimento de risco e da
probabilidade a priori de um investimento alternativo cujo desfecho e
binario. Ressaltamos que quando estamos diante de um problema computacionalmente complexo e boa pratica iniciar a analise de sensibilidade
avaliando somente alguns pares de valores da priori e das utilidades. E

claro que isto pode nao ser suficiente como veremos no exemplo abaixo.
Sensibilidade conjunta
Vejamos um exemplo. Suponha que estamos diante de um problema de
decisao sem dados dado pela tabela 5.4.
a1
a2
1
c1
c2
2
c2
c3
1
Tabela 5.4: Problema de decisao sem dados.
5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE
127
Suponha que eliciou-se que 0.4 < < 0.6, que 0.5 < c1 = l(a1, 1) <
0, 0.75 < c2 = l(a1, 2) < 0.25 e 1.0 < c3 = l(a2, 2 ) < 0.5. Temos
assim doze alternativas considerando as variacoes extremas de e fixando
as consequencias, ora no seu valor mnimo, ora no maximo (ver figura ??).
0.4
0.6
l(c1)
0
-0.5
0
-0.5
l(c2)
-0.25
-0.75
-0.25
-0.75
l(c3)
-0.5
-1.0
-0.5
-1.0
Tabela 5.5: Alternativas considerando as variacoes extremas de .

Vale notar que T (l, p , a1) > T (l, p , a2 ) para todos os quatro casos e,
portanto, alternativa a2 e sempre prefervel a alternativa a1.
claro que poderemos construir muitas outras combinacoes. Por
E
exemplo, se fixamos c1 no seu valor mnimo, c1 = 0.5, e c2 e c3 nos seus
valores maximos, c2 = 0.25 e c3 = 0.5 e = .6, entao T (l, p , a1) =
0.4 e T (l, p , a2) = 0.35 levantando d
uvida sobre a preferencia de a2
sobre a1 .
Outra alternativa seria fazer uma analise com respeito a priori com a
perda fixada ou vice-versa, incorrendo nas crticas anterior. Por exemplo,
fixando = 0.5 teremos:
T (l, p , a1 ) T (l, p , a2) = (c1 + c2)/2 (c2 + c3)/2 = (c1 c3 )/2
Como c1 e sempre maior que c2 entao o problema e robusto com
respeito as consequencias. Entretanto, se fixarmos c1 = 0.25, c2 =
0.5 e c3 = 0.75 e deixarmos livre, teremos:
T (l, p , a1 ) T (l, p , a2) = 0.25 0.5(1 ) + 0.5 + 0.75(1 ) = 0.25
128
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Logo teremos robustez com relacao a variacao na priori. Nao podemos

entretanto concluir que o problema e robusto como mencionado anteriormente.
Efeito do comportamento do decisor diante do risco
Vamos agora discutir um outro exemplo, onde analisamos a sensibilidade simultanea a probabilidade a priori e ao valor esperado da perda.
Este exemplo abordara, inicialmente, o caso de um decisor neutro ao
risco e, posteriormente, o de um decisor averso ao risco. O contexto
deste exemplo envolve a decisao de investir no mercado de comodities
ou, alternativamente, participar de uma sociedade limitada. O investimento sera de 2000 u.m. e a expectativa e de que o investimento no
mercado de comodities, embora, de maior risco promete ganhos maiores.
Suponhamos que os ganhos no mercado de comodities sejam descritos por
distribuicao normal de media e variancia 2 . Alem disto, para facitilar
a analise, iremos supor que neste mercado o pior e melhor ganhos estao
limitados em -1000 u.m. e 5000 u.m., no sentido de que as probabilidades
nas caudas desta N (, 2) sao desprezveis, respectivamente, para valores abaixo e acima destes extremos. Po outro lado, o ganho produzido
pelo investimento na sociedade limitada sera descrito por uma variavel
aleatoria binaria, assumindo os valores de 10000u.m., no caso de sucesso e de 4000u.m. no caso de fracasso. Resumindo teremos a situacao
exposta na tabelatab:neutro.
a1
a2
Fracasso
-1000
-4000
Sucesso
5000
10000
Tabela 5.6: Perdas no mercado de comodities.

As quantidades relevantes desta aplicacao sao: = E[1], onde 1
representa o retorno da aplicacao no mercado de comodities e = P r[2 =
129
claro que:
1], representando sucesso da sociedade. E
r(a1 ) = E[u(a1, 1)] =
r(a2 ) = E[u(a2, 2)] = 10000 4000(1 ) = 14000 4000
Note que a opcao a1 e prefer ivel a` opcao a2 se e somente se 14000
4000 , onde a igualdade representaria a indiferenca entre essas opcoes.
A principal conclusao desta parte do exemplo e que a decisao, mesmo
nao se conhecendo exatamente o valor de e de , independe da variancia
de 1 no contexto, e claro, de um decisor neutro ao risco.
Para prosseguir com a analise, facamos 1 assumir seu valor mnimo,
respectivamente, maximo. Assim teremos:
14000 4000 = 1000
= 50000
implicando que = 3/14 = 0.21 ou = 9/14 = 0.64. Logo
(0.21, 0.64) quando 1 assume seus valores extremos. Assim as analises
de sensibilidade com respeito a podem se restringir a este intervalo.
Esses resultados podem ser resumidos num grafico representando os
pares de valores (, ), onde a diagonal descreve o conjunto de pontos de
indiferenca entre as acoes a1 e a2 . Os pares acima desta diagonal favorecem a escolha da acao a1 e os abaixo, a escolha de a2 . A caixa central
representa a regiao de sensibilidade aos valores de como mencionado
anteriormente.
Por exemplo, se perguntamos ao decisor os valores de e e ele
fornece duas alternativas: (i) (0.8, 2000) e (ii) (0.4, 1500), uma fora do
intervalo descrito acima e a outra na regiao, entao teremos muito mais
facilidade em decidir quando no segundo ponto do que no primeiro.Note
que:
E0.8[[u(a1, 2)]] = 0.8 10000 0.2 4000 = 7200
enquanto que
E0.4[u(a1, 2)] = 0.4 10000 0.6 4000 = 1600
130
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Figura 5.5: Grafico de versus com regiao de sensibilidade de

Estes valores serao comparados respectivamente com = 2000, no primeiro
caso e = 1500, no segundo caso. As amplitudes de variacao serao respectivemente 5200 e 100 u.m., deixando claro que o segundo caso e mais
robusto.
Iremos, finalmente, analisar o problema acima relaxando a suposicao
de decisor neutro ao risco. Suponha, agora, que nosso decisor utiliza a
funcao de utilidade
u(x) = 1 exp(ax)
para algum valor de a.
Suponha que desejamos iniciar verificando o efeito da escolha de a
coeficiente de aversao ao risco de nosso decisor. Fixemos para iniciar
= 0.5. Assim teremos, respectivamente, para o decisor neutro ao risco
e para o averso ao risco, o valor equivalente certo (cp )
cp (a2) = 0.5 10000 0.5 4000 = 3000
cp (a2) = log(1 0.5(1 exp(1000a) 0.5(1 exp(4000a))/a
131
Fazendo a variar podemos observar o efeito do coeficiente de aversao

ao risco no equivalente certo. Quanto mais averso ao risco mais negativo sera o equivalente certo, considerando-se = 0.5. Este efeito pode,
tambem ser observado na figura 5.6.
a cp (a2 )
0
3000
0.00002
2512
0.00020
-829
0.00100 -3325
Tabela 5.7: Valor equivalente certo.
Note que a condicao de indiferenca sera dada por:
E[u(a2)] = E[u(a1)] u(10000)+(1)u(4000) = EN [,2 ] (u(a1)]
Como estamos supondo que 1 e normal distribudo, entao exp(1 ) sera
log-normal distribudo e
E[u(a1)] = 1 exp(am + am2 2 /2)
Logo teremos
= a 2/2 + u1 [E(a2)]
= a 2/2 log(1 (1 exp(1000a) (1 )(1 exp(4000a))/a
Destaca-se que cresce com a variancia de 1 e, mais ainda, independentemente de . Por outro lado, e proporcional ao equivallente certo
de a2 para 2 fixo.
A sensibilidade de a e 2 pode ser verificada nas figuras a seguir. Na
figura 5.6 fixamos a = 0.00005 e fazemos o grafico de como funcao de
132
CAPITULO 5. ANALISE
DE SENSIBILIDADE
, para duas situacoes: 2 = 0 e 2 = 10002 . Plotamos ainda a a reta de

indiferenca para o decisor neutro ao risco. A diferenca entre as curvas de
indiferenca sao relativamente pequenas. Lembre-se que acima da curva
de indiferenca preferimos a1 a` a2 . Assim 2 nao e um parametro muito
sensitivo.
Figura 5.6: Efeito de 2 na regiao de indiferenca.

Vamos examinar agora a sensibiliddae de a. Na figura 5.7 observamos
as curvas de indiferenca para a = 0, a = .00005 e a = 0.0002 fixando a
variancia 2 igual a 1. Note que a medida que a tende a zero (decisor
neutro ao risco) as curvas de indiferenca se modificam expressivamente.
facil, por exemplo, veriIsto comprova quao sensvel e o parametro a. E
ficar que para = 0.5 a decisao a2 - investir na sociedade - parece mais
atraente para um decisor neutro ao risco, enquanto que para um decisor
com um alto coeficiente de aversao ao risco, por exemplo igual 0.0002,
facil
a opcao a1 - investir no mercado de comodities - e prefervel. E
verificar que para valores maiores do coeficiente de aversao ao risco, por
exemplo a = 0.001, o decisor nunca preferira a opcao a2 .
133
Figura 5.7: Efeito de a - coeficiente de aversao ao risco na curva de

indiferenca.
134
CAPITULO 5. ANALISE
DE SENSIBILIDADE
Captulo 6
Programa
c
ao Din
amica
6.1
Introdu
ca
o
Trataremos de problemas de decisao em m

ultiplos estagios ou sequenciais. Esses problemas se caracterizam por poderem ser separados em um
certo n
umero de passos sequenciais ou estagios, cada estagio se conclui
com uma decisao. Em geral, o tempo e usado para ordenar a sequencia
de problemas decisorios. Desejamos descrever a sequencia de decisoes
tomadas em cada estagio. As principais referencias sao: DeGroot (1970),
Berger (1985), French and Rios-Insua (2000) e Bather (2000), alem de
Parmigiani, Inoue, and Lopes (2003). Alem disto, a relacao MEU com a
programacao dinamica pode ser encontrada em Lindley (1961).
O captulo esta estruturado da seguinte forma. Inicialmente apresentamos alguns conceitos basicos para a seguir discutirmos o problema
geral de alocacao e um exemplo de caminho crtico. Na proxima secao
sera introduzida a programacao dinamica determinstica e exemplos. Finalmente, a programacao dinamica estocastica modelos Markovianos
sera apresentada.
135
DINAMICA
CAPITULO 6. PROGRAMAC
AO
136
6.2
Uma classe de problemas de otimiza

ca
o
Para motivar a tecnica de programacao dinamica iniciaremos descrevendo uma classe especial de problemas de otimizacao. Sua principal caracterstica e a possibilidade de decompor a funcao objetivo em um n
umero
finito de estagios e, assim, introduzir a ideia central da programacao
dinamica, ou seja a otimizacao de tras para diante ou backward induction.
Esta ampla classe de problemas de programacao matematica fica definida por
otimizar
sujeito a
com
f1(x1 ) + + fn (xn )
x 1 + + xn b
xi > 0 e xi inteiros
(6.1)
onde fi (xi ), i = 1, , n sao funcoes conhecidas de uma u

nica variavel
(lineares ou nao lineares), b > 0 e uma quantidade conhecida e n e o
n
umero de estagios.
Esta classe de problemas e conhecida como processo de decis
ao multiest
agio. No estagio inicial temos a variavel de decisao x1 e sua consequencia ou custo f (x1). Um caso especial, denominado problema de
alocaca
o ocorre quando os estados sao inteiros e b tambem e inteiro.
Algumas caractersticas destes problemas merecem ser destacadas:
o problema pode ser separado em estagios ou passos,
as decisoes caracterizam formas de concluir um estagio,
uma solucao do problema sera denominada uma poltica e consistira
numa sequencia de decisoes
Exemplo 6.1 Determinar quanto investir em cada oportunidade (ao longo do tempo) de forma a maximizar o retorno total. Suponha que temos

6.2. UMA CLASSE DE PROBLEMAS DE OTIMIZAC
AO
137
tres est
agios de investimentos i = 1, 2, 3. O estado do processo no est
agio
i e a quantia disponvel para investir naquele instante. E claro que no

est
agio 1 temos todo o capital disponvel para investir. Suponha que temos
ao todo 4 unidades monet
arias no est
agio 1. Nos est
agios 2 e 3 os recursos disponveis poder
ao assumir os valores: 0, 1, 2, 3 ou 4, dependendo
das alocaco
es previas. Esta e exatamente a express
ao (6.1) para n = 3 e
b = 4.
Um segundo exemplo permitira fixar alguns princpios fundamentais
envolvidos na estrutura (6.1). Suponha que se deseja obter o caminho
mais curto entre dois pontos como exemplificado na 6.1. Existem dois
caminhos de a ate c. Devemos escolher a trajetoria descrita pela linha
cheia, no trecho de b para c, pois esta e menor.
Figura 6.1: A linha cheia representa o caminho mais curto ligando a a c

e a linha pontilhada um caminho alternativo de b a c, tal que o trajeto
total seja mais longo.
138
DINAMICA
AO
Exemplo 6.2 Seja o grafo, isto e, um conjunto de vertices conectados

atraves de arcos, como introduzido no captulo 3. Suponha que os vertices
sejam denotados por {1, 2, , n}. Alguns pares de vertices podem estar
conectados atraves de arcos. A dist
ancia entre os vertices i e j ser
a
denotada por di,j . Denote por fi o comprimento do caminho mais curto
ligando o vertice i ao j. Assim
fi = minj {di,j + fj }
onde j representa um vertice que pode ser alcancado partindo-se do vertice
claro tambem que fn = 0.
i. E
Suponha que deseja-se obter o caminho mais curto entre os vertices 1
e 10 da figura 6.2 abaixo. Nesta figura observamos um grafo com vertices
numerados de 1 a 10 e arcos conectando particulares pares de vertices. A
soluca
o o
tima ser
a obtida resolvendo-se o problema do fim para o incio
como veremos mais adiante. Este pode ser visto, tambem, como um problema de alocaca
o com n = 10.
Sao varios os problemas classicos de otimizacao que podem ser descritos como acima. Por exemplo, os problemas de sequenciamento, de
alocacao otima, modelos de inventario e varios outros.
6.3
Programa
ca
o din
amica
No captulo 3 aprendemos a resolver empiricamente um problema de decisao usando modelos graficos tais como arvores de decisao e diagramas
de influencia. Nos captulos 2 e 4 usamos sempre um espaco de acoes
e de estados da natureza discretos e com um n
umero finito de alternativas. Em geral este expediente e uma boa aproximacao, complementada por uma analise de sensibilidade (captulo 5). Agora e chegado o
momento de formalizar estas ideias e estabelecer um algortimo geral.
Estamos primordialmente interessados em resolver problemas de decisao
DINAMICA
6.3. PROGRAMAC
AO
139
Figura 6.2: O grafo acima tem vertices rotulados de 1 a 10 e arcos com

as distancias anotadas (di,j )
multi-dimensionais ou mais precisamente que possam ser decompostos em
m
ultiplos estagios.
A tecnica de solucao de problemas de decisao em estagios m
ultiplos e
denominada programacao dinamica ou inducao para tras. Lindley (1961)
mostra, claramente, a necessidade de se trabalhar de tras para adiante
como vimos na solucao das arvores de decisao e diagramas de influencia.
Esta relacao esta bem estabelecida no artigo anteriormente mencionado.
A decisao no estagio presente e de pouca utilidade pois o otimo presente
envolve o otimo futuro. No exemplo da distancia mnima entre os vertices
1 e 10, de nada adianta, no estagio 4, digamos, escolher entre as rotas
4 5 ou 4 7 a de menor custo, pois o otimo deste estagio dependera
dos estagios futuros como veremos. A notacao i j representa a decisao
de se utiliar a rota com incio no vertice i e fim no j.
Os problemas que trararemos sao tipicamente problemas de otimizacao.
O termo dinamico indica que os estagios se relacionam dinamicamente
140
DINAMICA
AO
ou, para simplificar, temporalmente (ainda que esta nocao possa ser artificial!). Os problemas multi-estagio podem ser convencionalmente formulados como um u
nico estagio, pagando-se o preco da complexidade
ou dimensionalidade. Como mencionado por Bellman (1957), se temos
N estagios e M decisoes possveis em cada estagio entao teremos um
problema N M -dimensional com um u
nico estagio.
A solucao que descreveremos agora decompoe o problema original em
N sub-problemas, mais simples, um para cada estagio. Assim a complexidade computacional crescera linearmente com o n
umero de estagios ou
sub-problemas e nao mais exponencialmente com o n
umero de variaveis.
Antes de prosseguirmos e introduzir o algortmo geral sera ilustrativo
apresentarmos uma solucao intuitiva do exemplo 6.2.
Exemplo 6.3 Continuacao do exemplo 6.2: Vamos reverter a ordem dos
o
est
agios iniciando, portanto, pelo est
agio i = 10. E
bvio que f10 = 0 e,
ent
ao, podemos passar imediatamente para o caso i = 9. Para tanto
utilizaremos a relaca
o fi = minj {di,j + fj }. Temos que avaliar f9 =
minj {d9,j , f10}. Como j s
o pode assumir o valor 10 e claro que f9 = 2
coincidindo com d9,10.
O pr
oximo caso ser
a ligeiramente mais elaborado. Quando i = 8,
j poder
a assumir os valores 9 ou 10. Logo temos de determinar f 8 =
min{d8,10 +f10, d8,9 +f9 }. Assim f8 = 5 e a soluca
o consistir
a em escolher
o caminho 8 9, onde i j representa a decis
ao de se caminhar do
vertice i para o j.
Facamos agora i = 7. Como este vertice esta conectado tanto ao
vertice 8 como ao 9 teremos: f7 = minj {d7,9 +f9 , f7,8 +f8}. Substituindose os valores das dist
ancias correspondentes chegamos a f 7 = 4 e portanto
a soluca
o ser
a 7 9. Assim do vertice 7 devemos seguir para o 9 e
dapara o 10, com uma dist
ancia total igual a 4 unidades. Logo a rota
alternativa 8 9 n
ao far
a parte da poltica o
tima uma vez que e mais
econ
omico seguir diretamente de 7 para 9 e da ao fim.
DINAMICA
6.3. PROGRAMAC
AO
141
Prosseguindo teremos f5 = minj {d5,7 + f7 , f5,8 + f8 } = minj {3 +

4, 6 + 5}. Ent
ao f5 = 7 e, coerentemente com o fato de 8 9 j
a ter sido
eliminado da poltica o
tima, incorporaremos a
` soluca
o o
tima o trecho
5 7. Continuando de forma an
aloga ate o vertice inicial obtemos a
tabela 6.1. A soluca
o o
tima ter
a uma dist
ancia total de 14 unidades e
seguir
a o caminho:
1 3 5 7 9 10
Vale observar mais uma vez que alguns caminhos foram deletados. Por
exemplo, o vertice 4 conduziria ao 8 o qual j
a havia sido preterido pelo
caminho de 7 para 9. Analogamente, o caminho que passa pelo vertice 6
e tambem preterido.
i
fi
10
0
9
2
7
4
8
5
5
7
4
11
3 2
12 13
1
14
6
16
Tabela 6.1: Poltica otima (em negrito)
Vamos agora descrever, em termos gerais, o algoritmo da programacao dinamica. Inicialmente trataremos somente de problemas com um
n
umero finito de estagios - T . Nosso problema consiste em determinar de
forma otima uma sequencia de acoes A = {a1, , aT }, condicionalmente
ao estado inicial do sistema. O espaco das acoes disponveis no t-esimo
estagio sera denotado por At e o espaco de estados da natureza, em cada
estagio, denotado por t , como introduzido no captulo 2.
claro que ao atingir o estagio t teremos uma historia descrita por:
E
Dt = {a1, , at , 1, , t } {A1 At, 1 t}
Para completar a descricao do problema devemos definir uma funcao
que descreva a dinamica dos estados da natureza. Seja
G : t1 At t
142
DINAMICA
AO
isto e: t = G(t1 , at). Esta funcao de evolucao dos estados, de natureza Markoviana, induz a distribuicao de probabilidade sobre t, que
sera denotada por p(t |at, t1). Esta distribuicao condicional sera especificada, na pratica, por uma funcao de probabilidade ou por uma funcao
de densidade dependendo de termos um espaco de estados discreto ou
contnuo.
Para cada acao at At fica definida a funcao de custo esperado
ct = E[c(t, at)|Dt1 ] =
c(t , at)p(t |Dt1 )
onde Dt representa a informacao disponvel ate o instante t. Uma descricao grafica deste processo, atraves de um diagrama de influencia, foi
apresentado no captulo 3, figura 3.11.
Desejamos minimizar o custo esperado total dado o estado inicial 0
min{c1 + + cT }
A
Para fixar a notacao recem introduzida sera u

til apresentarmos um
exemplo.
Exemplo 6.4 Suponha que nosso problema consista em controlar os movimentos de um objeto que partindo de um ponto 0 deva atingir, em T
est
agios, certo alvo. As aco
es corresponder
ao a
` escolha o
tima dos movimentos de nosso objeto em direca
o ao alvo. Existir
a um custo final correspondendo a uma penalizaca
o por n
ao atingir o alvo. Consideremos a
funca
o de din
amica
G(t1 , at) = t1 + at + t
onde t N [, 2] e a funca
o de custo de transica
o e dada por
c(at, t ) = ca2t ,
DINAMICA
6.3. PROGRAMAC
AO
143
onde c > 0 e uma constante conhecida. Observa-se que esta funca

o de
custo n
ao depende de t sendo, portanto, determinstica. Se na funca
o
de evoluca
o, t = 0, t ent
ao teramos um problema de controle o
timo
determinstico, onde o custo de desvio do alvo ap
os T etapas seria dado
por
f0 () = m2
onde m > 0 e, tambem, uma constante conhecida.
A ideia central da programacao dinamica e que, em qualquer tempo
t, para minimizar a expressao acima necessitamos somente considerar a
minimizacao do custo esperado total no futuro:
min{ct + + cT }
A
isto porque a escolha das decisoes presentes e futuras nao devem, possivelmente, influir no passado. Este problema mais simples envolve n = T t
variaveis de decisao, cuja solucao sera obtida sequencialmente desde n = 1
ate n = T , seguindo o princpio de optimalidade de Bellman, descrito
abaixo.
Princpio de Optimalidade de Bellman

Um poltica otima tem a propriedade de que, qualquer que sejam o estado
e a decisao iniciais, as decisoes remanescentes constituem uma poltica
otima com respeito aos estados remanescentes.
Seja o custo mnimo esperado futuro para qualquer estado t e qualquer n = T t, n
umero de perodos restantes.
fn (t) = min{at,,aT }{E[ct + + cT |t ]}
Esta expressao de recorrencia exibe o valor mnimo do custo esperado
futuro em termos de t, em t = T n. Podemos aplicar sucessivamente
a expressao acima obtendo-se:
DINAMICA
AO
144
n=1:
f1() = max{cT }
n=2:
f2() =
aT
max {E[cT 1 + f1 ()|T 1]}
{aT 1 ,aT }
Genericamente teremos,
fn (n ) = minan {cn + E[fn1 (n |n )]}
onde a esperanca e sobre a distribuicao de (n |n1 , at ) induzida pela
evolucao dos estados da natureza.
6.3.1
Exemplos
Apresentaremos nesta secao tres exemplos. Comecaremos com o problema do investimento tratado como algo determinstico, continuaremos
com o exemplo de controle e, com o intuito de demonstrar o que se perde
pela abordagem sequencial, mostraremos o exemplo do profeta.
Consumo versus Investimento
Suponha que um indivduo deva decidir a cada instante de tempo t quanto
de sua renda devera ser utilizada para consumo e quanto destinado a
investimento. Suponha que seu capital inicial seja 0 e que ele decida
consumir, no instante t, at, 0 < at < t, investindo o restante a uma taxa
r (0, 1). Assim seu capital um perodo a frente sera dado por
t+1 = G(t , at) = (t at ), onde = (1 + r)
Estamos supondo que o investimento produz um ganho conhecido e certo,
caracterizando um problema determinstico. Neste exemplo nosso objetivo sera maximizar a utilidade decorrente do consumo realizado, a qual
sera dada por
1/2
u(t , at) = at
DINAMICA
6.3. PROGRAMAC
AO
145
Para manter a notacao introduzida anteriormente fazemos

ct =
E[u(t, at)|t ]. Assim desejamos maximizar uma funcao de T variaveis,
a1, , aT sujeito a t > 0, t = 1, . . . , T . Resumindo temos:
max
A
sujeito a
com
u(a1) + + u(aT )
0 a t t
t+1 = (t at)
(6.2)
sendo 1 dado e t = 1 . . . , T . A equacao de recorrencia basica sera dada

por
fn () = max {u(a) + fn1 (( a))}
0a
(6.3)
onde de fato teramos a = aT n e fn1 (aT n+1 ) = fn1 ((T n aT n )

usando a funcao de evolucao. Destacamos ainda que, como a evolucao
e determinstica, nao temos que tomar o valor esperado de fn1 (). A
solucao otima devera satisfazer:
fn () = (1 + + 2 + + n1 )1/2 1/2
an = /(1 + + + n1 ), n 1 e > 0
(6.4)
Para verificar este fato basta usar inducao. Por exemplo, f1() =
max0a
a1/2 = 1/2 pois a funcao de utilidade e monotona para a > 0. Logo,
a1 = . Usando 6.3, obtemos f2() = max0a {a1/2 + 1/2( a)1/2} e,
portanto, a2 = /(1 + ) e f2 () = (1 + )1/21/2. E assim por diante.
facil verificar que no caso de um problema sequencial com T estagios
E
e capital inicial 0 a solucao acima satisfaz
a0 = 0 /(1 + + + T 1 )
a1 = 2 0/(1 + + + T 1 )
DINAMICA
AO
146
aT
..
.
= 2T 0 /(1 + + + T 1 )
Seria interessante resolver este mesmo problema com funcoes de utilidade alternativas. Por exemplo: u(a) = 1 exp(a), a > 0 ou u(a) =
1 1/(1 + a). A figura 6.3 mostra a diferenca entre estas tres funcoes de
utilidade.
Figura 6.3: Comparacao de tres funcoes de utilidades alternativas: u(a) =

a1/2, u(a) = 1 exp(a), a > 0 ou u(a) = 1 1/(1 + a).
Controle Estoc
astico
Este exemplo e uma continuacao do exemplo 6.4, onde desejamos controlar os movimentos de um objeto, a partir de 0, por T estagios, ate chegar
o mais proximo possvel de um alvo. Relembrando, temos a funcao de
evolucao
G(t1 , at) = t1 + at + t
DINAMICA
6.3. PROGRAMAC
AO
147
onde t N [, 2] e as funcoes de custo de controle e de custo terminal

por se distanciar do alvo, dadas, respectivamente, por:
c(at, t) = ca2t ,
f0 () = m2
claro que t |t1, at
onde m > 0 e, tambem, uma constante conhecida. E
N [t1 + at + , 2]. Logo teremos
f1 = min
{cT 1 + E[f0 (T )|T 1, aT ]}
a
= min{ca2 + m( + a + + 2)},
a
pois
E[f0 (T )|T 1, aT ] = m E[t2|t1 , at]

= m var[t|t1 , at] + E[t|t1, at ]2
= m [ 2 + [ + t1 + at]2]
Logo teremos a solucao:
a1 = m/(c + m)( + ) = m1( + )
f1 () = cm/(c + m)( + )2 + m 2 = cm1( + )2 + m 2
Nao e dificil obter a expressao de recurrencia geral:
fn () = mina {mn ( + n)2 + (m0 + m1 + + mn1 ) 2 }
O Profeta
Este exemplo envolve a escolha de um dentre T premios de valor monetario representado por uma variavel aleatoria nao negativa. O espaco
dos estados da natureza pode ser descrito pelos reais positivos. O espaco
das acoes, em cada um dos T estagios, sera discreto com dois elementos
148
DINAMICA
AO
somente, correspondendo a: a0 - aceitar o premio e a1 - prosseguir no jogo. Estaremos assumindo que as variaveis aleatorias t sao independentes
e com esperanca t .
Analisaremos, inicialmente, dois casos extremos de tomada de decisao:
sem inspecionar os premios e inspecionando cada um deles. Obviamente,
o segundo caso so e disponvel para o Profeta. Assim teremos:
a) ganho esperado - Wm = max{1, . . . , T }
b) ganho esperado - Wp = E[max{1, . . . , T }]
Desejamos comparar esses ganhos maximos com uma terceira alternativa que corresponde a uma solucao sequencial, em T estagios. Intuitivamente teremos Wm Ws Wp , onde m refere-se ao procedimento
em media, p ao profeta e s ao procedimento sequencial. Pode-se verificar
que Ws e Wp sao muito maiores que Wm e, alem disto, que Wp 2Ws , ou
seja que um decisor usando o procedimento sequencial pode ganhar pelo
claro que este e um demenos a metade do que ganharia o Profeta. E
cisor muito especial pois tem o poder da clarevidencia ou da informacao
perfeita. Uma demonstracao destes fatos e varias referencias sobre formas alternativas da desigualdade do Profeta podem ser encontradas em
Bather (2000).
No caso sequencial a utilidade de se parar no t-esimo estagio sera dada
por ut (a0) = s e a de prosseguir sera denotada por ut(a1 ). No estagio
final -T - a utilidade esperada sera obviamente
f1 (T ) = E[uT (a0 )] = T
pois necessariamente o jogo terminara. No estagio anterior, T 1, ou
aceitamos o premio de T 1 ou esperamos para examinar T . Assim
f2 (T 1) = E[max{T 1, f1 (T } = E[max{T 1, T }]

E PROGRAMAC
DINAMICA
6.4. ARVORE
DE DECISAO
AO
149
Em geral, usando a inducao para tras teremos

fn (T n ) = E[max{T n , fn1 (T n )}]
(6.5)
para n = 1, . . . , T 1.
Caso Particular: Suponha que 1 , . . . , T sao variaveis aleatorias independentes e identicamente distribuidas segundo uma uniforme em (0, 1).
facil obter neste caso que
E
Wp = E[max{1, . . . , T }] =
[1 F T ()]d
n
claro que Wm = 1 pois
onde F T () = yI(0,1)(y). Assim Wp = (n+1)
. E
2
todos os s tem medias iguais. Verificamos neste exemplo que Wp Wm ,
com a igualdade valendo somente pra n = 1. Falta somente avaliar a
recorrencia estabelecida acima, equacao 6.1, para o caso sequencial. E

facil verificar que para variaveis aleatorias nao negativas de media finita
E[max{, w}] = w +
[1 F ()]d
No caso dos s serem uniformemente distribudos e fazendo Ws,n corresponder a fn (T n ), n 1, teremos:

Ws,n = ws,n1 +
=
ws,n1
(1 )d
1
2
[1 + ws,n1
], n 2
2
Supondo ws,0 = 1/4 e variando n teremos os ganhos da tabela 6.2.
6.4
Arvore
de decis
ao e programa
ca
o din
amica
Consideremos um problema de decisao descrito por uma arvore de decisao

com um n
umero limitado e finito de estagios T . Iremos ver agora como
DINAMICA
AO
150
n
Wp
Ws,n
1
0.5
0.25
2
4
10
0.667 0.800 0.909
0.531 0.705 0.852
20
0.952
0.917
Tabela 6.2: Comparacao dos ganhos sequenciais com os do Profeta
resolver este problema de decisao atraves do algoritmo da programacao

dinamica.
O espaco das acoes disponveis no t-esimo estagio sera denotado por
(t)
(t)
At = {a0 , . . . , a(t)
ao de terminar ou nao o
nt }, onde a0 representa a decis
problema de decisao no estagio t (Parmigiani, Inoue, and Lopes 2003). O
(t)
espaco de estados da natureza em cada estagio sera denotado por i =
(t)
(t)
{i,1 , , i,ki }, onde ki e o n
umero de estados associados a i-esima acao
(t)
(t)
(t)
do estagio t, ai . Assim = 1 (t)

nt . E claro que ao atingir o
estagio t teremos uma historia descrita por:
(t)
(1)
(t)
(1)
Dt = {ai1 , , ait , i1 ,j1 , , it ,jt } {A(1) A(t), (1) (t)}

(t)
onde, para cada acao ai A(t), fica definida a funcao de utilidade esperada
u
(t)
(t)
(ai )
(t)
(t)
= E[u( , a )|Dt1 ] =
kt
X
j=1
(t)
(t)
ui,j p(i,j |Dt1 )
Para completar esta notacao devemos definir uma funcao que descreva
a dinamica dos estados da natureza. Seja
G : (t1) A(t1) t
isto e, t = G(t1 , at1). Esta funcao de evolucao dos estados, de natureza Markoviana, induz a distribuicao de probabilidade sobre (t) , que

E PROGRAMAC
DINAMICA
6.4. ARVORE
DE DECISAO
AO
151
sera denotada por p((t) |at1, t1). Na pratica esta distribuicao condicional sera especificada por uma funcao de probabilidade ou por uma
funcao de densidade.
Figura 6.4: Arvore

de decisao com um n
umero finito de estagios.
A programacao dinamica procede da seguinte forma. Iniciamos resolvendo o problema de decisao do u
ltimo estagio T . Esta etapa corresponde
a maximixar a utilidade esperada. A seguir, condicionalmente ao estagio
T resolveremos o problema do estagio T 1, novamente maximizando
a utilidade esperada. Este procedimento se repetira ate alcancarmos o
estagio inicial. Resumindo:
Algoritmo
(1) Inicie em T
(a) Calcule uT (aTi ) =
P kt
j=1
T
uTi,j (i,j
|DT 1 )
(b) Obtenha a decisao de Bayes, a,T = arg max{uT (aTi )}
DINAMICA
AO
152
(2) Repita os seguintes passos

(i) No estagio t0 calcule a utilidade esperada ut (ati) para i 1, . . . , nt ,
onde nt e o n
umero de acoes em t
ut(ati ) =
kt
X
=1
t
uti,j (i,j
|Dt1 ), para t = 1, . . . , T 1
uti,j = max{ut(ati), t = 2, . . . , T 1}
(6.6)
(ii) Resolver a otimizacao do estagio t, ou seja faca sua escolha da

acao otima:
a,t = arg max{ut (ati) + u(t+1)}
i
(iii) Va para o estagio t-1

Ate que t = 1.
Dentre os varios exemplos interessantes deste tipo de modelo temos o
problema da secretaria ou do casamento, que podem ser encontrados em
DeGroot (1970), Bernardo and Smith (1994) e Bather (2000).
6.5
Op
co
es reais: uma introdu
ca
o
Esta secao trata de um tema classico em Economia, a alocacao de recursos ou investimentos sob incerteza. Da mesma maneira que as opcoes de
compra no mercado financeiro, as opcoes reais representam direitos, sem
obrigacao de adquirir ou trocar um ativo por um preco especificado. A
possibilidade de se considerar deferimento, abandono e contracao de um
investimento tem revolucionado a teoria moderna de alocacao de recursos.
bem conhecido, hoje em dia, que o metodo tradicional do fluxo de caixa
E
descontado nao permite revisar e adaptar decisoes em respostas a desenvolvimentos inesperados do mercado. Modernamente, todavia, deseja-se
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
153
um metodo capaz de considerar as incertezas futuras e incorporar, dinamicamente, as informacoes que chegam ao mercado, recalculando os
fluxos de caixa descontados.
Alguns conceitos proprios da area de opcoes reais serao inicialmente
apresentados, visando caracterizar aspectos essenciais de um investimento. A seguir, apresentaremos um exemplo com o objetivo de mostrar que
o metodo convencional do valor presente lquido, tao ensinado ainda hoje
nas escolas de business, pode levar a conclusoes duvidosas. Este mesmo
exemplo sera reanalisado atraves das tecnicas de programacao dinamica,
produzindo solucoes muito mais coerentes.
Os conceitos centrais na abordagem de opcoes reais sao: irreversibilidade, incerteza sobre retornos futuros e temporalidade.
Defini
ca
o 6.1 A propriedade de irreversibilidade caracteriza basicamente
uma classe de investimentos cujo valor inicialmente investido e parcialmente ou integralmente perdido.
Nao e recuperavel se voce deseja modificar, no futuro, sua decisao
presente. Um exemplo seria a aplicacao numa fabrica cujo produto e
extremamente especfico e as maquinas nao sendo adaptaveis para outras
finalidades.
Outra caracterstica e que os retornos futuros s
ao incertos, de sorte
que so podem ser descritos probabilisticamente, sem perda de generalidade, atraves de uma distribuicao discreta. Por exemplo, o comportamento do mercado futuro para os componentes produzidos por nosso
investimento variara no futuro em funcao de varios fatores de mercado.
Finalmente, a temporalidade diz respeito a caracterstica de que a decisao
de investir pode ser postergada ate dispor-se de mais informacoes sobre o
futuro. Estas caractersticas estao frequentemente presentes em decisoes
sequenciais sobre investimentos e se encaixam naturalmente na forma de
analise que desenvolvemos nesse captulo.
154
DINAMICA
AO
Exemplo 6.5 A ttulo de exemplo imaginemos uma firma que deseja decidir sobre investir ou n
ao em uma f
abrica de componentes mec
anicos.
O investimento e irreversvel, pois os equipamentos s
ao especficos para a
produca
o deste particular tipo de componente. Por exemplo, se o mercado para este componente mec
anico acabar, ser
a impossvel recuperar (ou
desinvestir) os gastos realizados.
A firma tem um custo de instalaca
o I, instant
aneo e a produca
o e de
uma unidade por ano, para simplificar. O preco do componente mec
anico
e de 200 u.m., no momento, mas certamente se modificar
a no pr
oximo
ano. Isto e, com probabilidade crescer
a para 300 u.m. ou cair
a para
100 u.m. Para manter o exemplo simples admitiremos que o preco ficar
a
constante no restante do horizonte de decis
ao. Alem disto, ser
a suposto
ainda que a taxa de juros e de 10% e livre de risco.
Assim, se = 0.5 e I = 1600 u.m., ent
ao o valor presente lquido do
investimento ser
a:
V P L1 = 1600 +
200
= 600
t
t=0 (1 + 0.10)
Este c
alculo, t
ao frequentemente usado para se decidir por realizar ou
n
ao certo investimentos, esta incorreto pois ignora o custo de oportunidade de investir agora ao inves de esperar ou ate mesmo n
ao investir,
caso o preco caia, por exemplo. Suponha que aguardamos um perodo e
investimos somente se o preco subir para 300 u.m. O valor presente neste
caso seria
"
1600 X
300
+
= 773
V P L2 = 0.5
t
1.1
t=1 (1 + 0.10)
pois no ano inicial n

ao h
a despesas nem receitas e com probabilidade 0.5
claro que
teremos retorno zero, pois n
ao investiremos se o preco cair. E
e prefervel esperar um ano, obter mais informaca
o, e investir somente
se o preco subir para 300, pois o V P L1 < V P L2 . Obviamente:
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
155
i) se a u
nica alternativa disponvel para o tomador de decis
ao for investir
ou n
ao no instante inicial, a escolha seria realizar o investimento.
ii) se, entretanto, a decis
ao for sequencial, isto e: existir a opca
o de
aguardar para decidir se investe ou n
ao amanh
a, ent
ao a escolha ser
a exercer a opca
o, dado que estamos assumindo que o preco
subiu.
Para isto e preciso que o investimento seja irreversvel e sequencial. Note
que nem sempre e possvel adiar a decis
ao de investir por quest
oes de
concorrencia, patentes que est
ao por expirar, etc. A pergunta que se
coloca e: Quanto vale a flexibilidade de se poder investir no proximo ano
ao inves de agora ou nunca?. No exemplo, o custo de oportunidade ou
valor da opca
o flexvel foi de 773 600 = 173. Em geral, teremos ainda a
quest
ao: Qual o valor do investimento I , no proximo perodo, equivalente
a I? A soluca
o ser
a determinar o valor de um investimento flexvel com
valor presente lquido igual ao da proposta do agora ou nunca. Logo,
"
I X
200
V P L = 0.05
+
= V P L1
t
1.1
t=1 (1 + 0.10)
de sorte que resolvendo-se em I teremos

1
I = 3300 0.5
1.1
1
V P L1 = 1980
Assim a oportunidade de constuir uma f

abrica de componentes mec
anicos
hoje e somente hoje ao custo de 1600 u.m. e equivalente a ser ter a opca
o
de faze-lo no pr
oximo perodo a um custo de 1980 u.m.
Op
co
es Reais: analogia com op
co
es financeiras
Inicialmente vale a pena observar a analogia com uma opcao do tipo call
no mercado de acoes. A opcao real da o direito de exerce-la ou nao para
DINAMICA
AO
156
fazer um investimento (preco da opcao) e receber um projeto (uma acao)

cujo valor e incerto. No exemplo temos uma opcao in the money isto
e: se exercida gerara uma receita positiva. Embora seja in the money e
prefervel, no exemplo, esperar do que exerce-la de imediato. Lembre-se
que V P L1 = 600 enquanto que V P L2 = 733.
Assim sendo propoe-se examinar o problema anterior a` luz da teoria
de opcoes em financas. Sejam F0 o valor do investimento e F1 o valor da
claro que F1 e uma variavel aleatoria,
opcao de investimento no futuro. E
pois depende do preco futuro. Se o preco crescer para 300 u.m. entao F1 =
1700 e se cair para 100 u.m., entao F1 = 0, pois a opcao de investimento
nao sera exercida.
Construiremos um portfolio livre de risco. Isto e, composto de certo
n
umero de componentes mecanicos, tal que o valor futuro seja independente da variacao dos precos no mercado. Seja um portfolio onde comprase a descoberto n componentes mecanicos e mantem-se a oportunidade
de investimento. Seu valor hoje sera:
0 = F0 n p0 = F0 200 n
e no futuro
1 = F 1 n p 1
o qual dependera do preco subir ou nao
1 = F 1 n p 1 =
1700 300 n
100 n
se subir
se cair
Escolhe-se n tal que o portfolio seja livre de risco, isto e:

1700 300n = 100n
n = 8.5
O retorno de se manter este portfolio sera: 1 0 que corresponde ao

custo da posicao descoberta (short). Como o portfolio esta descoberto em
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
157
8.5 unidades devera pagar a taxa de risco de 1% sobre o valor monetario

de cada unidade, isto e: 200 0.1 8.5 = 170 u.m. Assim
1 0 170 = 1 (F0 np0 ) 170
= 850 F0 + 1700 170
= 680 F0
Porque e risco livre, entao 680 F0 = 0.1 (F0 1700) ou seja F0 = 773.
Programa
c
ao din
amica: aplica
c
ao a op
co
es reais
Relembrando, na tecnica de programacao dinamica uma sequencia de
decisoes e particionada em somente duas: a decisao imediata e uma funcao
de valor que contempla as consequencias de todas as decisoes passadas.
Esta e uma propriedade de natureza Markoviana.
O horizonte de planejamento pode ser finito ou nao. Se finito (n),
entao a decisao no u
ltimo estagio sera obtida de uma otimizacao estatica,
pois nada seguira a ela. Esta otimizacao fornecera a consequencia a ser
utilizada - funcao de valor - no pen
ultimo estagio. Assim o novo problema
de decisao considera a decisao do estagio n 1 e a funcao de valor do
estagio n. Pode-se progredir assim ate a condicao inicial.
Vamos comecar examinando o nosso problema somente em dois perodos.
Lembre-se que
p1 =
(1 + u) p0 ,
(1 d) p0 ,
cp
cp 1
caracterizando a funcao de evolucao dos estados da natureza. Suponha,

tambem, que a taxa de juros e r (0, 1) fixo. Teremos de considerar duas
situacoes:
(i) a oportunidade de investimento ocorre somente no perodo inicial,
portanto do tipo agora ou nunca
158
DINAMICA
AO
(ii) a oportunidade de investimento permanece disponvel no perodo 1.

Note que agora no instante inicial a firma tem de decidir: a1 investir
agora e a2 esperar e decidir mais tarde, investindo ou nao.
No caso (i) teremos o valor presente esperado
E[V0 |D0 ] = p"0 + [ (1 + u)p0 + (1# ) (1 d)p0 ]
1
1
+
+
1 + r (1 + r)2
pois estamos supondo que a partir do perodo 2 os precos serao estaveis.
Temos, entao, a serie de valores futuros medios descontados para o perodo
inicial. A expressao acima se simplifica para
E[V0 |D0 ] = p0 [1 + r + (u + d) d]/r
Assim, se E[V0 |D0 ] I > 0 entao realizo o investimento. A quantidade max{E[V0|D0 ] I, 0} sera o lucro, tambem denominado de valor de
termino no tempo 0. No caso (ii) temos de calcular:
"
1
1
1+r
+
+ p1
V1 = p 1 + p 1
2
(1 + r) (1 + r)
r
A firma decidira pelo investimento somente se V1 > I, produzindo um
ganho lquido de F1 = max{V1 I, 0}. Vale mencionar que, da otica do
perodo zero, p1 e uma quantidade aleatoria tanto quanto F1 e V1 . Assim
1+r
I, 0}
r
1+r
+ (1 ) max{(1 d)p0
I, 0}
r
Esta quantidade sera denominada de valor esperado de continuacao ou
simplesmente valor de continuacao. Voltando ao perodo inicial teremos:
E[F1|D0 ] = max{(1 + u)p0
F0 = max E[V0 |D0 ] I,
1
E[F1|D0 ]
1+r
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
159
A decisao otima da firma sera aquela que maximizar o valor presente

lquido. Note que o exemplo foi desenvolvido no esprito da programacao
dinamica. O problema foi decomposto em duas etapas: a escolha imediata
e as decisoes remanescentes. A sequencia de solucoes otimas e obtida calculando de tras para frente. A diferenca entre F0 e max{E[V0|D0 ] I, 0},
o qual corresponde a solucao do tipo agora ou nunca, sera denominado
de valor da opcao de se postergar a decisao de investir ou o valor que
retrata este grau de liberdade extra. Como veremos abaixo a estrutura
de solucao descrita anteriormente estende-se facilmente para o caso de
m
ultiplos perodos.
An
alise do problema com m
ultiplos perodos
No exemplo que acabamos de abordar tinhamos, por conveniencia, so claro que em situacoes reais m
mente dois perodos. E
ultiplos perodos e
tempo contnuo sao, em geral, a regra. Por ora, entretanto, descreveremos
as incertezas atraves de processos markovianos discretos. Vale mencionar
que os processos de difusao podem ser vistos como caso limite de passeios
ao acaso em tempo discreto.
Embora a teoria da programacao dinamica estocastica seja totalmente
geral insistiremos no exemplo do investimento. Denotemos por , escalar
ou nao, o estado da natureza que descreve o status corrente da firma, o
qual afeta sua operacao e oportunidades de expansao. Assumiremos que
t = t1 + t ou seja p(t |t1). No tempo t a firma devera realizar uma
decisao que denotamos por a. No nosso exemplo a e uma quantidade
binaria caracterizando investir ou nao investir, mas em muitas aplicacoes
podera ser uma variavel contnua, ate mesmo vetorial. Por exemplo, a
poderia ser a dupla escolha do investimento e da contratacao mao de obra
temporaria. A funcao de valor c(t, at ) e a distribuicao de probabilidade
p(t+1 |t, at) permitem calcular as parcelas necessarias a` obtencao da sequencia {at} nao se esquecendo do fator de desconto (1 + r)1 , onde r e
160
DINAMICA
AO
taxa de juros ou taxa de desconto.

Suponha que o processo termine em T , com um ganho final que depende do estado alcancado F (t). A aplicacao da programacao dinamica
divide o processo em dois estagios: o imediato e a continuacao completa,
apos este estado. Seja Ft (t) o valor esperado lquido presente do fluxo de
receitas da firma e u(t, at) o ganho imediato em t pela escolha da acao
claro que Ft(t+1 ) e uma variavel aleatoria dada a informacao ate t.
at . E
Assim teremos E[Ft+1(t)|Dt ] o denominado valor de continuacao. Agora
devemos trazer todos os valor para o instante inicial, fazendo:
1
u(t , at) +
E[Ft+1(t)|Dt ]
1+r
A equacao de Bellman ou equacao fundamental de optimalidade sera dada
por

1
Ft (t) = max u(t, at ) +
E[Ft+1(t+1 )|Dt ]
at
1+r
O primeiro termo a` direita e o ganho imediato e o segundo o valor de
continuacao e at e a acao que maximiza a soma dos ganhos. No exemplo
que vimos discutindo temos um caso particular da expressao acima pois a
assume somente os valores 1 ou 0 representando, respectivamente, investir
no instante inicial e esperar ate o tempo 1. Se o problema de varios
perodos tem um horizonte finito T podemos operar de tras para frente.
Assim, no final do horizonte, teremos: FT (T ) e

1
FT 1(T 1) = max u(T 1, aT 1) +
E[FT (T 1)|Dt ]
at
1+r
Podemos resolver o problema para T 2 obtendo aT 2 e o valor de continuacao FT 2(aT 2) e continuar desta forma ate atingir o estagio inicial.
An
alise considerando o horizonte infinito
Como nao dispomos da funcao de valor num ponto final do horizonte de
planejamento, nao podemos implementar a inducao de tras para a frente.
6.5. OPC
OES
REAIS: UMA INTRODUC
AO
161
Se as funcoes de valor e as probabilidades de transicao forem invariantes

no tempo e, alem disto se r for fixo ao longo do tempo poderemos chegar
a uma grande simplificacao. Estas condicoes sao satisfeitas em muitas
aplicacoes economicas e tornam o problema viavel. A equacao de Bellman
pode ser reescrita, para todo t, como:

1
F () = max u(, a) +
E[F (0)|, a]
a
1+r
onde e 0 sao dois pontos no espaco dos estados da natureza e a e

uma acao em A. Esta e denominada de equacao de Bellman para a
programacao dinamica recursiva ou com horizonte infinito.
Necessitamos, em cada aplicacao, garantir a existencia da solucao e
assegurar um meio de encontra-la, o que, em geral, nao e muito difcil.
Esta equacao e nao linear e a escolha otima de a depende de todos
os valores de F () ponderados pelas probabilidades envolvidas no calculo
da esperanca. Em geral, nao sabemos se um funcional nao linear tem
solucao e muito menos se e u
nica. Felizmente a equacao recursiva de
Bellman tem uma estrutura especial que permite provar a existencia e
unicidade de F () sob condicoes tpicas das aplicacoes economicas. Um
esboco de demonstracao pode ser visto em Dixit and Pindyck (1994),
onde outras referencias teoricas sao mencionadas.
Decorre, desta discusao mais tecnica, um procedimento iterativo para
determinacao de F (). Inicie em F 1(), aplique no lado direito da equacao
acima e obtenha a1. Sustituindo este valor na equacao, obtemos F 2().
Repetimos o processo ate convergencia para o verdadeiro valor de F ().
1
Este resultado fica garantido pela presenca do fator 1+r
no lado direito da
expressao. Este fator e menor do que um e contrai os erro envolvidos nessas iteracoes. A convergencia pode, eventualmente, ser lenta, sobretudo
quando r e pequeno.
O leitor interessado pode encontrar varios exemplos de aplicacao deste
metodo no contexto economico no livro de Dixit and Pindyck (1994).
162
DINAMICA
AO
Em muitas dessas aplicacoes, o tempo e contnuo e as incertezas sobre o

espaco dos estados da natureza evoluem segundo um processo de Wierner
ou, mais geralmente, segundo um processo de difusao.
Captulo 7
MUE via m
etodos Monte
Carlo
Relembrando os captulos anteriores, o problema de maximizacao da utilidade esperada e o problema central da teoria da utilidade. Do ponto de
vista inferencial, o problema Bayesiano e simples e pode ser genericamente
tal que
visto como a busca da decisao otima, d,
d = arg max U (d)
(7.1)
(7.2)
dD
para
U (d) =
u(d, , y)pd (y, d)dd dy
onde pd (y, d) = pd (y|d)pd (d ) e pd (y|d) e pd (d ) representam, respectivamente, o modelo e a distribuicao mais recente de d quando a decisao
for d.
Por exemplo, quando o interesse esta em estimar pontualmente o parametro e a funcao de utilidade e u(d, , y) = ( d)2, a decisao otima,
se iguala a` esperanca de com respeito a pd (|y) (ver, por exemplo,
d,
DeGroot 1970). Entretanto, somente em problemas triviais e de pouco
163
164
CAPITULO 7. MUE VIA METODOS

MONTE CARLO
interesse pratico e possvel se obter analiticamente para a integral em

(7.2) e/ou para o problema de maximizacao em (7.1).
Nesse captulo apresentaremos estrategias para a solucao do problema de decisao baseadas em metodos Monte Carlo. Comecamos, na
secao 7.1, com a aplicacao de integracao de Monte Carlo para resolver
a integral em (7.2). Na secao 7.2 introduziremos a ideia de se ajustar uma curva a um conjunto finito de pares decisao-utilidade. Essa
ideia baseia-se na continuidade da funcao de utilidade para pequenas
variacoes de d. Essa ideia foi introduzida por M
uller and Parmigiani
(1995). Entretanto, quando o espaco das decisoes e de dimensao relativamente grande esse metodo torna-se computacionalmente ineficiente, uma
vez que varios pontos d D deverao ser selecionados. Clyde, M
uller, and
Parmigiani (1995) e Bielza, M
uller, and Rios-Insua (1999) propuseram
um metodo para resolver o problema de otimizacao que reescreve (7.2)
como um problema de simulacao, atraves de metodos Monte Carlo via
cadeias de Markov (MCMC), onde o modelo probabilstico e aumentado
para h(d, , y) = u(d, , y)pd (y, d ), ou seja, incorporando a decisao, d,
no modelo. Esse metodo e apresentado na secao 7.3, bem como alguns
de seus problemas implementacionais. Dois exemplos reais, e suas referencias, serao apresentados na secao 7.4 juntamente com um exemplo
didatico, onde o problema de decisao pode ser resolvido analiticamente.
Os metodos apresentados nesse captulo foram essencialmente extrados
de M
uller (1999), que faz uma revisao extensa dos metodos Monte Carlo
aplicados a problemas de planejamento Bayesiano otimo, alem de apresentar varias referencias com aplicoes diversas.
7.1
Aproximando U(d) via Monte Carlo
Dado d, pd (y, d ) e em geral de facil simulacao, possivelmente em dois

passos:
7.1. APROXIMANDO U (D) VIA MONTE CARLO
165
Simulando da priori: d pd (d )
Simulando do modelo:y pd (y|d)
Dessa forma, para cada d, U (d) pode ser aproximada por
Ub (d)
M
1 X
(i)
=
u(d, d , y (i))
M i=1
(7.3)
(i)
onde os pares (d , y (i)), para i = 1, . . . , M sao gerados a partir do procedimento em dois passos mencionado acima. Esse procedimento representa
simplesmente a solucao de uma integral pelo simples metodo de Monte
Carlo (veja, por exemplo, Geweke (1989)).
Claramente, se no instante da tomada de decisao x p(x|d ) e observado, a expressao em (7.2) e facilmente reescrita por:
U (d) =
u(d, , y)pd (y|d)p(d |x)dd dy
(7.4)
assumindo que p(y|d , x) = p(y|d ). Dessa forma, o primeiro passo do algoritmo apresentado acima seria amostrar d de p(d |x). Esse passo geralmente envolve simulacao de d atraves de metodos MCMC, dependendo
da complexidade de p(d |x). Esse tipo de situacao e bastante comum, por
exemplo em estudos medicos onde decisoes devem ser tomadas com base
na informacao obtida atraves de observacoes (estudos, pacientes, etc) preexistentes. Uma outra situacao comumente encontrada por investidores e
a alocacao de recursos em uma carteira de acoes, moedas, taxas de juros,
etc. O investidor inteligente baseara sua alocacao em modelos probabilsticos que levem em consideracao todas as observacoes dos mercados
(de acoes, juros, cambio, etc.), ate o instante da tomada da decisao (ver
Aguilar and West (2001) e Lopes and Migon (2002), por exemplo).

MONTE CARLO
166
7.2
Ajuste da curva de utilidade
Voltando ao problema em (7.1), uma solucao imediata seria obter Ub (d)

para todas as possveis decisoes em D, e escolher d que maximizasse a
utilidade esperada aproximada. Entretanto, esse metodo e ineficiente pois
desconsidera completamente a possvel continuidade da funcao de utilidade, U (d), comumente presente na maioria dos casos. Ao se desconsiderar tal dependencia, enormes simulacoes (Monte Carlo simples ou MCMC)
serao replicados para valores de d0 muito proximos de d, segundo alguma
metrica razoavel, ignorando que Ub (d) e Ub (d0 ) venham provavelmente a
ter valores muito proximos.
M
uller and Parmigiani (1995) propuseram um esquema numerico de
busca da decisao otima que explora a continuidade da funcao utilidade.
O algoritmo pode ser descrito da seguinte maneira:
Selecione dj em D, possivelmente numa grade
Simule (j , yj ) pdj (, y) e calcule uj u(dj , j , yj )
Ajuste uma curva aos pontos (dj , uj )
Encontre, deterministicamente, o maximo da curva ajustada
A integral em (7.2) pode ser aproximada por um ajuste de curva dos pares
dj (eixo das abscissas) e uj (eixo das ordenadas). Consequentemente, a
decisao otima pode ser obtida como o maximo da curva ajustada. Eles
mostram que sob suposicoes especficas no espaco das decisoes, na funcao
de utilidade e na escolha do metodo de suavizacao de curva, a decisao
otima obtida por esse procedimento e um estimador consistente de d.

Apesar desse metodo ter um apelo bastante intuitivo, a continuidade
da funcao de utilidade, sua implementacao tambem sofre de um grande
problema; a medida que o espacdas decisoes aumenta de dimensao fica mais difcil selecionar dj de forma a tornar a aproximacao da curva de ajuste minimamente confiavel. Na proxima secao introduziremos
7.3. SIMULANDO O MODELO AUMENTADO
167
o metodo proposto por Clyde, M

uller, and Parmigiani (1995) e Bielza,
M
uller, and Rios-Insua (1999).
7.3
Simulando o modelo aumentado
Clyde, M
uller, and Parmigiani (1995) e Bielza, M
uller, and Rios-Insua
(1999) propuseram um metodo aproximado que incorpora o espaco das
decisoes aos espacos dos parametros e dos observaveis e utiliza metodos
Monte Carlo via cadeias de Markov. Esse metodo aproxima a decisao
otima atraves da moda da distribuicao marginal de d. Mais especificamente, define-se uma distribuicao artificial
h(d, , y) u(d, , y)p()pd (y|)
(7.5)
no espaco produto D Y, assumindo-se que D e limitado, u e uma

funcao nao-negativa, tambem limitada. Nesse contexto, h(d) sera exatamente U (d), portanto a decisao otima sera a moda de h(d). O algoritmo
abaixo descreve um dos possveis esquemas MCMC para amostrar de h,
Algoritmo 1: Cadeias Independentes para d
1. Valor inicial para a decisao: d0
2. Simule (, y) a partir de pd0 (, y) e compute u0 = u(d0 , , y).
0)
3. Valor proposto para a decisao: gera-se d a partir da proposta g(d|d
y) a partir de p (, y) e compute u
,
y).
4. Simule (,
= u(d,
d
5. Calcule a probabilidade de aceitacao como sendo = min{1, A},
onde
,
y) g(d0 |d)
pd0 (, y)
h(d,
u
g(d0 |d)
A=
=
(7.6)
0 ) p (,
y)
0)
h(d0 , , y) g(d|d
u0 g(d|d
d

MONTE CARLO
168
6. Faca
(d1 , u1) =
u
(d,
)
com prob.
0
0
(d , u ) com prob. 1
7. Repita os passos 3 a 6 ate convergencia da cadeia.

Esse esquema, caso particular dos esquemas apresentados por Tierney (1994), se beneficia de todos os resultados a respeito de simulacao
de cadeias de Markov que tem h como distribuicao limite (de equilbrio,
posteriori, etc). Portanto, toda a parafernalia dos metodos MCMC podem ser utilizadas para se alcancar o obtjetivo maior, ou seja encontrar
o maximo de h(d) = U (d). Por exemplo, se o espaco das decisoes for
multidimensional com d = (d1 , . . . , dp ) e se h(dj |d1 , . . . , dj1 , dj+1 , . . . , dp )
for de facil simulacao, entao teremos um algoritmo similar ao amostrador
de Gibbs que amostra individualmente as p componentes do vetor de decisoes. Caso essas condicionais completas nao sejam de facil amostragem,
entao cadeias de Markov com passeio aleatorio poderiam ser utilizadas.
Na proxima secao veremos que nem sempre e possvel se encontrar de
forma pratica e eficiente o maximo de h(d) baseando-se numa amostra dos
pares (d, u). Para tanto, o algoritmo 1 sera modificado para deformar a
funcao de utilidade de tal forma que seu maximo fique mais evidente. Isso
sera feito atraves do famoso metodo simulated annealing que resolvemos
traduzir aqui por tempera simulada.
7.3.1
T
empera simulada em problemas de decis
ao
Apesar de colocado em segundo plano, o problema da obtencao da moda de h pode ser tao ou mais complicado do que o procedimento de
amostragem a partir de h. Em muitos casos, como veremos na secao
de exemplos, a funcao de utilidade esperada nao possui um maximo que
possa ser facilmente encontrado pelos metodos tradicionais. A inspecao
visual, de histogramas, torna-se impraticavel quando p, a dimensao do
7.3. SIMULANDO O MODELO AUMENTADO
169
vetor de decisoes, e maior que dois. Em geral, a funcao de utilidade e virtualmente a mesma para um conjunto grande de decisoes; decisoes essas
que nao necessariamente sao similares. Portanto, e necessario se pensar
em formas mais eficazes de encontrar o maximo de uma funcao com essas
caractersticas e que esta representada apenas por um conjunto finito,
mas grande, de pares (d, u).
M
uller (1999) sugere substituir U (d) por uma transformacao do tipo
potencia, U J (d), uma vez que para J suficientemente grande a funcao se
concentrara ao redor do maximo de U (d). Esse efeito pode ser alcancado
atraves da seguinte modificacao em h(d, , y)
hj (d, 1 , y1, . . . , J , yJ )
J
Y
u(d, j , yj )pd (j , yj )
(7.7)
j=1
de tal sorte que hJ (d) U J (d), como desejado. Com essa modificacao
para evidenciar as modas em utilidades muito planas, o algoritmo 1 pode
ser reescrito da seguinte forma.
Algoritmo 2: Simulando de U J (d)
1. Valor inicial para a decisao: d0
2. Simule (j , yj ) a partir de pd0 (, y) e compute u0 =
QJ
j=1
u(d0 , j , yj ).
0)
3. Valor proposto para a decisao: gera-se d a partir da proposta g(d|d
4. Simule (j , yj ) a partir de pd(, y) e compute u
=
QJ
j=1
j , yj ).
u(d,
5. Calcule a probabilidade de aceitacao como sendo = min{1, A},

onde
,
y) g(d0 |d)
pd0 (, y)
u
g(d0 |d)
h(d,
=
(7.8)
A=
0 ) p (,
y)
0)
h(d0 , , y) g(d|d
u0 g(d|d
d

MONTE CARLO
170
6. Faca
(d , u ) =
u
(d,
)
com prob.
0
0
(d , u ) com prob. 1
7. Repita os passos 3 a 6 ate convergencia da cadeia.

A escolha de J deve ser feita caso a caso, sendo que valores em torno
de 10 ou 20 tem sido utilizados amplamente. Na proxima secao apresentaremos algumas situacoes reais em que a aplicacao dessas tecnicas
aproximadas possibilitou a solucao do problema de decisao latente.
7.4
Exemplos
Nessa secao ilustraremos os metodos citados acima com problemas de decisao encontrados em M
uller and Parmigiani (1995), Clyde, M
uller, and
Parmigiani (1993), M
uller (1999). Aplicacoes interessantes e recentes
podem ser encontradas em Parmigiani, Berry, Iversen Jr., M
uller, Schildkraut, and Winer (1997), Sanso and M
uller (1997), Rios-Insua, Slewicz,
M
uller, and Bielza (1996), Bielza, M
uller, and Rios-Insua (1999), Parmigiani and M
uller (1994),Stroud, M
uller, and Rosner (1999),M
uller and
Palmer (1997), entre outros.
Sanso and M
uller (1997) consideram o problema de como reduzir de
80 para 40 o n
umero de estacoes de monitoracao de chuva no estado de
Guarico na Venezuela. Em seu problema o objetivo e minimizar os custos e ainda ter um m inimo de controle sobre a quantidade de chuva nas
diversas regioes do estado. Parmigiani, Berry, Iversen Jr., M
uller, Schildkraut, and Winer (1997) estudam a propensao genatica do cancer de mama onde um dos problemas mais importantes e a predicao da propensao
genetica baseando-se na historia familiar do paciente e fatores de risco.
Ja Stroud, M
uller, and Rosner (1999) consideram o problema da escolha
do instantes de tempo para aplicacao de um certo medicamento contra
7.4. EXEMPLOS
171
um certo tipo de cancer baseando-se em modelos que descrevem o comportamento farmacocinetico e farmacodinamico da droga. Similarmente,
M
uller and Palmer (1997) estudam a escolha dos intantes de tempo para
coleta de sangue (celulas tronco) em pacientes com cancer. A funcao objetivo e a maximizacao do n
umero de celulas tronco num menor n
umero
possvel de coletas.
Iniciaremos com um exemplo onde a solucao exata e facilmente obtida.
7.4.1
Tamanho amostral da Normal
Suponhamos que x1 , . . . , xn formem uma amostra da N (, 2), para

desconhecido e 2 desconhecido, e que o problema de decisao seja obter
o tamanho amostral otimo para se estimar . Adicionalmente suponhamos que N (, 2 ), para e conhecidos. Finalmente, a funcao
de utilidade da decisao final tem a forma quadratica, u(n, a, , y) =
( a)2 + C(n), para C(n) = cn e c conhecido. Esse problema pode
ser resolvido analiticamente. Sabemos que, para n conhecido, E(|x) e o
estimador otimo de sob a funcao de utilidade especificada. Assim,
U (n) =
2/n
2
+
x
2 /n + 2
2/n + 2
de forma que o tamanho amostral otimo e igual a
n = / c 2 / 2
Para valores de , , e c iguais a 1.0, 0.0, 1.0 e 0.01, respectivamente,
o tamanho amostral otimo e igual a 9 observacoes. Isso esta ilustrado
na Figura 7.1(a). A figura 7.1(b) ilustra a utilizacao do algoritmo Monte
Carlo (secao 7.1), com M=10.000 amostras para n = 1, . . . , 20. A performance do metodo proposto por M
uller and Parmigiani (1995) (secao 7.2) e
apresentada nas figuras 7.1(c,d). Nesse caso foram utilizados M = 10000
172

MONTE CARLO
Figura 7.1: (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui ) e (d)
Curva ajustada (loess no S-plus). Valores fixados: (, , , c) =
(1.0, 0.0, 1.0, 0.01).
pares (n, u) para o ajuste de curva, que foi feito utilizando a funcao loess
do S-plus. Essa aproximacao sugere n = 8 observacoes.
A figura 7.2 apresenta resultados analogos para a situacao em que
= = 3.0. Note que, contrario a` primeira situacao, aqui a valor aproximado para n e superior ao verdadeiro, n = 29. Esse exemplo ilustra as
potencialidades das tecnicas apresentadas nesse capitulo bem como suas
limitacoes, mesmo em problemas relativamente simples e unidimensionais.
Finalmente, a figura 7.3 mostra o resultado do algoritmo 2 (secao
7.4. EXEMPLOS
173
Figura 7.2: (a) Utilidade esperada, (b) Utilidade esperada obtida por
Integracao Monte Carlo (M=10.000), (c) 10.000 pares (ni , ui) e (d)
Curva ajustada (loess no S-plus). Valores fixados: (, , , c) =
(3.0, 0.0, 3.0, 0.01).
7.3.1) para J = 20. A aproximacao nao e tao boa quando aquelas encontradas aplicando-se os outros metodos. Entretanto, em situacoes mais
complexas esse metodo certamente sera a u
nica alternativa pratica de
uso.
7.4.2
Tamanho amostral da Binomial
M
uller and Parmigiani (1995) ilustram o metodo apresentado na secao
7.2 no problema da escolha do tamanho amostral em um experimento

MONTE CARLO
174
Figura 7.3: U J (n) para J = 20 e M = 10.000 simulacoes.
binomial. Mais especificamente, o problema e a escolha de n tal que

y| Binomial(n, ), onde a informacao a priori a respeito de e tal que
0.5Beta(3, 1) + 0.5Beta(3, 3), o que poderia representar uma mistura
de opinioes de especialistas. Se a decisao terminal e a estimacao de
utilizando uma funcao de perda absoluta, isto e, U (r(y), ) = |r(y) |.
Sabe-se que a mediana a posteriori, my , e a regra de Bayes que maximiza a
utilidade esperada da decisao terminal. Dessa forma, deseja-se encontrar
n que maximize:
U (n) =
n
1X
0 y=0
[|my | 0.0008n]Cyn y (1 )(n y)p()d
(7.9)
7.4. EXEMPLOS
175
onde 0.0008 e o custo fixo de cada observacao adicional. Eles escolhem

N = 200 pontos ni numa grande uniforme no intervalo (0, 120). Aos 200
pares (ni , ui ), eles ajustam uma curva de regressao nao-linear da forma:
Ub (n) = 0.0008n 0.2023(1 + bn)a
de sorte que o tamanho amostral otimo pode ser diretamente calculado

como
1
! a+1
1
0.2023
a
b
n
=
1
b
0.0008
que vale n
= 29. Eles ainda exploram o formato da funcao de utilidade e
percebem que ela pode ser parcialmente integrada analiticamente quando
reescrita da seguinte forma
U (n) =
n Z
X
y=0 0
[|my | 0.0008n]p(|y)dm(y)
(7.10)
Nessa nova versao, para cada ni calcula-se a integral internal analiticamente, u

i . Apos esses novos calculos, n
= 34 foi o valor otimo
encontrado. A figura 7.4 foi extrada de M
uller and Parmigiani (1995)
e sumariza a discussao acima. Para valores de n no intervalo (20, 40)
eles tambem calculam o valor verdadeiro de U (d), obtido por integracao
Monte Carlo (secao 7.1), o que mostra que os metodos aproximados sao
relativamente eficientes em encontrar o tamanho amostral otimo. Note
tambem que a variabilidade dos pontos (ni , u
i) e bem menor que a dos
pontos (ni , ui), devido exclusivamente ao fato de integrar-se analiticamente parte da expressao 7.10
7.4.3
Defibrila
c
ao do cora
c
ao
Em Clyde, M
uller, and Parmigiani (1993) (CMP) o problema de decisao
e a escolha da potencia de um defibrilador para o coracao em pacientes
176

MONTE CARLO
Figura 7.4: As linhas fina e grossa representam, respectivamente, os valores aproximado e verdadeiro de U (n) (M
uller and Parmigiani, 1995).
com problemas cardacos. Esses aparelhos diminuem a mortalidade devida a` ataques cardacos. Para pacientes com fibrilacao, o defibrilador
descarrega um pulso especfico de energia de forma a fazer o coracao do
paciente retomar seu batimento normal.
Em geral, o medico fibrila o coracao do paciente varias vezes (tipicamente de 3 a 12 vezes) com potencias diferentes, xi para encontrar aquela
necessaria para defibrilacao. Infelizmente, cada um desses testes aumenta
o risco de serios problemas cardacos, o que torna a escolha do n
umero
de testes e seus respectivos nveis de energia uma questao de extrema
importancia.
Uma das estrategias e implantar o aparelho a um nvel de energia que
o faca defibrilar 95% das vezes que o coracao do paciente apresente falha
(ED95). Em CMP, para cada xi (nvel de energia), o experimentador
observa uma resposta binaria, yi , onde yi = 1 indica que o aparelho
funcionou corretamente e yi = 0 indica que defibrilacao nao ocorreu, ou
7.4. EXEMPLOS
177
seja, o nvel de energia xi nao interrompeu fibrilacao. Dessa forma,

p(yi = 1|, xi ) = [1 + exp{(xi ) log(0.95/0.05)}]
para = (, ) e = (log(), log()). O interesse maior esta em estimar

(ou log()). Eles utilizam a seguinte funcao de utilidade
u(, y, D) = {log() E[log()|y, D]}2 cn(D)
onde D e planejamento dos teste (mais detalhes abaixo), E[log()|y, D] e
a media a posteriori de log(ED95) e cn e o custo de cada um dos n testes
associados a x. Da a utilidade esperada sera
U (D) =
V ar(log()|y, D)p(y|D)dy c
n(D, y)p(y|, D)p()ddy
e maximizacao de U e complicada, segundo eles, por basicamente dois

motivos: (i) nao existe forma fechada para V ar(log()) e (ii) a integral
acima nao pode ser obtida analiticamente. CMP desenvolvem um esquema sequencial para que os testes sejam interrompidos tao logo ED95 seja
acuradamente estimado. O planejamento, D, e o seguinte:
(i) Comeca-se com uma dose d0 = x1 ;
(ii) Induz-se fibrilacao e observa-se y1
(iii) Se y1 = 0 (nao ocorre defibrilacao) um choque reativador e dado e
a proxima dose e aumentada para x2 = x1(1 + a);
(iv) Se y1 = 1 (defibrilacao bem sucedida) a proxima dose e diminuda
para x2 = x1(1 a);
(v) Repete-se (ii) a (iv) ate o mnimo entre r = 3 reversoes (yi +1 = 1yi )
e s = 10 testes.
178

MONTE CARLO
O problema de decisao aqui e a escolha do par (d0 , a). O par (r, s)

tambem poderiam ser includos no planejamento, mas isso nao foi feito
por CMP. CMP utilizam o algoritmo 1 proposto por M
uller and Parmigiani (1995) para obter D que maximiza U (D) atraves de um ajuste
nao-parametrico de curva aos pares (Di , ui) (secao 7.2). A decisao otima,
para c = 0, e d0 = 9.77 joules, a = 0.23 e tamanho amostral esperado
de 8.6 observacoes. O planejamento que minimiza o tamanho amostral e
d0 = 7.33 e a = 0.58, cujo tamanho amostral medio e de 7.55 observacoes.
A figura 7.5 mostra U (d) quando c = 0.02. Nesse caso, o planejamento
otimo e d0 = 9.25 e a = 0.30, cujo tamanho amostral medio e de 8.3
obsrvacoes.
7.4. EXEMPLOS
179
Figura 7.5: U (D) para c = 0.02. O planejamento otimo foi d0 = 9.25 e

a = 0.30, que estao marcados com um triangulo no grafico (Clyde, M
uller
and Parmigiani, 1993).
180

MONTE CARLO
Refer
encias
Aguilar, O. and M. West (2001). Bayesian dynamic factor models
and variance matrix discounting for portfolio allocation. Journal
of Business and Economic Statistics 18, 338357.
Allais, M. (1953). Le comportement de lhomme rationnel devant le
risque: critique des postulats et axiomes de lecole americaine.
Econometrica 21, 503546.
Bather, J. (2000). Decision Theory-an introduction to dynamic programming and sequential decisions. John Wiley, New York.
Bellman, R. (1957). Dynamic Programming. Princeton University
Press.
Berger, J. (1985). Statistical Decision Theory and Bayesian Analysis.
Springer-Verlag.
Bernardo, J. and A. Smith (1994). Bayesian Theory. John Wiley, New
York.
Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis. Commentarii academiae scientiarum imperialis Petropolitanae 5, 175
192.
Bielza, C., P. M
uller, and D. Rios-Insua (1999). Decision analysis by
augmented probability simulation. Management Science 45, 995
1007.
181
182
REFERENCIAS
Brier, G. (1950). Verification of forecasts expressed in terms of probability. Monthly Weather Review 78, 13.
Bunn, D. W. (1984). Applied Decision Analysis. McGraw-Hill.
Clemen, R. (1996). Making Hard Decisions: An Introduction to Decision Analysis. International Thomson Publishing.
Clyde, M., P. M
uller, and G. Parmigiani (1993). Optimal design for
heart defibrillators. Discussion paper 93-27, Institute of Statistic
and Decision Science.
Clyde, M., P. M
uller, and G. Parmigiani (1995). Exploring expected
utility surfaces by markov chains. Discussion paper 95-39, Institute
of Statistic and Decision Science.
de Finetti, B. (1937). Foresight: Its logical laws, its subjective sources.
Wiley.
de Finetti, B. (1974). The Theory of Probability (2 volumes). New York:
John Wiley.
DeGroot, M. H. (1970). Optimal Statistical Decisions. Mc Graw-Hill.
Dixit, A. and R. Pindyck (1994). Investment under uncertainty. Princeton University Press, Princeton, New Jersey.
Ferguson, T. (1967). Mathematical statistics: a decision theoretic approach. Academic Press, New York.
Fishburn, P. C. (1981). Subjective expected utility: A review of normative theories. Theory and Decision 13, 139199.
Fishburn, P. C. (1982). The Foundations of Expected Utility. Dordrecht:
Reidel.
French, S. (1989). Readings in Decision Analysis. Chapman Hall.
French, S. and D. Rios-Insua (2000). Statistical Decision Theory. Edward Arnold: London.

REFERENCIAS
183
Geweke, J. (1989). Bayesian inference in econometric models using

Monte Carlo integration. Econometrica 57, 13171340.
Golub, J. (1997). Decision Analysis - an integrated approach. John
Wiley, New York.
Good, I. J. (1952). Rational decisions. Journal of the Royal Statistical
Society, Series B, Methodological 14, 107114.
Jensen, N. E. (1967). An introduction to Bernoullian utility theory: I
Utility functions. Swedish Journal of Economics 69, 163183.
Kahneman, D. and A. Tversky (1979). Prospect theory: An analysis
of decision under risk. Econometrica 47, 263291.
Kreps, D. M. (1988). Notes on the theory of choice. Boulder: Westview
Press.
Kyburg, H. and H. Smokler (1980). Studies in Subjective probability
(Second Edition). Krieger, Garden City.
Levy, H. (1998). Stochastic Dominance. Kluwer Academic Publishers,
Norwell, MA.
Lindgren, B. (1971). Elements of Decision Theory. Macmillan, London.
Lindley, D. (1961). Dynamic programming and decision. Applied Statistics 10, 3951.
Lindley, D. (1971). Making Decisions. John Wiley, Chichester.
Lindley, D. V. (1982). Scoring rules and the inevitability of probability
(with discussion). International Statistical Review 50, 126.
Lopes, H. (2000). Bayesian Analysis in Latent Factor and Longitudinal
Models. Ph. D. thesis, Duke University.
Lopes, H. F., O. Aguilar, and M. West (2000). Time-varying covariance
structures in currency markets. In Proceedings of the XXII Brazilian
Meeting of Econometrics.
184
REFERENCIAS
Lopes, H. F. and H. S. Migon (2002). Comovements and contagion

in emergent markets: Stock indexes volatilities. In C. Gatsonis,
R. Kass, A. Carriquiry, A. Gelman, Verdinelli, D. Pauler, and
D. Higdon (Eds.), Case Studies in Bayesian Statistics, Volume 6,
pp. 287302.
Luce, R. D. and H. Raiffa (1957). Games and Decision. John Wiley
and Sons, New York.
Mas-Colell, A., M. Whinston, and J. Green (1995). Microeconomic
Theory. Oxford University Press.
Migon, H. (2001). Bayesian analysis of a health insurance model. Relatorio tecnico, PO-COPPE/UFRJ.
M
uller, P. (1999). Simulation-based optimal design. In J. Bernardo,
J. Berger, A. Dawid, and A. Smith (Eds.), Bayesian Statistics 6.
M
uller, P. and J. Palmer (1997). Optimal design in longitudinal data
models. Discussion paper 97-32, Institute of Statistic and Decision
Science.
M
uller, P. and G. Parmigiani (1995). Optimal design via curve fitting
of Monte Carlo experiments. Journal of the American Statistical
Association 90, 13221330.
Parmigiani, G., D. Berry, E. Iversen Jr., P. M
uller, J. Schildkraut, and
E. Winer (1997). Modeling risk of brest cancer and decisions about
genetic testing. Discussion paper 97-26, Institute of Statistic and
Decision Science.
Parmigiani, G., L. Inoue, and H. F. Lopes (2003). Statistical Decision
Theory. John Wiley, New York.
Parmigiani, G. and P. M
uller (1994). Simulation approach to one-stage
and sequential optimal design problems. Discussion paper 94-18,
Institute of Statistic and Decision Science.

REFERENCIAS
185
Raiffa, H. (1996). Decision Analysis Introductory lectures on choices

under uncertainty. Addison Wesley.
Raiffa, H. and R. Schlaifer (1961). Applied statistical decision theory.
Graduate School of Business Administration, Harvard University.
Rios-Insua, D., K. Slewicz, P. M
uller, and C. Bielza (1996). Bayesian
methods in reservoir operations: the zambezi river case. Discussion
paper 96-30, Institute of Statistic and Decision Science.
Sanso, B. and B. M
uller (1997). Redesigning a network of rainfall stations. Discussion paper 97-25, Institute of Statistic and Decision
Science.
Savage, L. (1954). The Foundations of Statistical Inference. New York:
John Wiley.
Savage, L. J. (1971). Elicitation of personal probabilities and expectations. Journal of the American Statistical Association 66, 783801.
Seidenfeld, T. (1988). Decision theory without independence or without ordering. what is the difference? Economics and Philosophy 4, 267290.
Shachter, R. (1986). Evaluating influence diagrams. Operations Research 34, 589604.
Smith, J. (1988). Decision Analysis: A Bayesian Approach. Chapman
and Hall, London.
Spiegelhalter, D., A. Thomas, N. Best, and W. Gilks (1996). BUGS
0.5: Bayesian Inference Using Gibbs Sampling. MRC Biostatistics
Unit, Cambridge.
Stroud, J., P. M
uller, and G. Rosner (1999). Simulation-based methods
for optimal sampling times in population PK/PD studies. Discussion paper 99-31, Institute of Statistic and Decision Science.
186
REFERENCIAS
Tierney, L. (1994). Markov chain for exploring posterior distributions

(with discussion). Annals of Statistics 22, 17011786.
von Neumann, J. and O. Morgenstern (1944). Theory of Games and
Economic Behavior. New York: Wiley.
von Winterfeldt, D. and W. Edwards (1986). Decision Analysis and
Behavioral Research. Cambridge University Press.
Wald, A. (1949). Statistical Decision Functions. John Wiley, New York.
Whitmore, G. and M. Findlay (1978). Stochastic Dominance. D.C.
Heath, Lexington, Mass.
Winkler, R. L. (1996). Scoring rules and the evaluation of probabilities
(with discussion). Test 5, 160.

Migonehedibert

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Migonehedibert

Enviado por

Direitos autorais:

Formatos disponíveis

An

alise Bayesiana de Decis

Universidade Federal do Rio de Janeiro (UFRJ)

Endereco para correspondencia: Universidade Federal do Rio de Janeiro

Rio de Janeiro, 25 de marco de 2002.

4 Probabilidade subjetiva e utilidade

Funcoes de perda alternativas em problemas de estimacao:

Rede Bayesiana: cada no refere-se a uma variavel aleatoria

Funcao de utilidade de um agente averso ao risco. . . . . . 106

Diagrama de influencia: receita e custo . . . . . . . . . .

A linha cheia representa o caminho mais curto ligando a a

U (D) para c = 0.02. O planejamento otimo foi d0 = 9.25 e

Consequencias (custos) em unidades monetarias (u.m.)

Perda associada a cada acao e cada estado da natureza. . .

Probabilidades conjuntas sobre X . . . . . . . . . . . 86

Consequencias lucro lquido em A . . . . . . . . . . 87

Variaveis de entrada - domnio de variacao . . . . . .

Poltica otima (em negrito) . . . . . . . . . . . . . . . . . . 141

Uma breve nota hist

Teoria de Decisao e uma area que vem se desenvolvendo aceleradamente

1.2. SOBREVOANDO O LIVRO

lizando um software especfico - o DPL. Alem disto, aspectos de teoria

Utilizaremos um exemplo muito simples para promover um sobrev

1.2. SOBREVOANDO O LIVRO

Figura 1.1: Diagrama de influencia

Figura 1.2: Arvore

Figura 1.3: Solucao via arvore de decisao

1.2. SOBREVOANDO O LIVRO

certos o gerente financeiro sugere uma analise de sensibilidade, topico

1.2. SOBREVOANDO O LIVRO

Figura 1.5: Decisoes sequenciais: diagrama de influencia

Tabela 1.2: Variaveis de entrada - domnio de variacao

do pacote e utiliza um algoritmo que intercala operacoes de calculo de

1.2. SOBREVOANDO O LIVRO

O diretor esta intrigado com o uso do EMV e propoe a aplicacao de

Parte 3: Justificando o questionamento ao uso do

Parte 4: Usando um especialista

1.2. SOBREVOANDO O LIVRO

Tabela 1.3: Verossimilhanca - p(x|)

Tabela 1.4: Distribuicoes a` posteriori, (|x), e preditiva, p(x).

DI: Diagrama de Influencia.

ordenar a sequencia de problemas decisorios.

Figura 1.6: Decisoes sequenciais: arvore de decisao

Figura 1.7: Decisoes sequenciais: solucao

Figura 1.8: Diagrama de influencia para informacao imperfeita

CAPITULO 2. CONCEITOS BASICOS

Como identificado nos exemplos do Captulo 1, um problema de decisao

2.1. ELEMENTOS DA ANALISE

o conjunto dos estados da natureza e L(, a) representa a perda sofrida

Este criterio e de natureza conservadora pois escolhe dentre as acoes

Mais especificamente, 1 representa um retorno lucrativo para o fundo,

max L(, a2 ) = max{300, 300} = 300

portanto, a2 e a regra minimax.

2.1. ELEMENTOS DA ANALISE

onde () e uma funca

= arg min r(, a)

com r(, a) comumente denominada perda esperada a priori e o seu valor

Supondo, para simplificar, que as ordens (a) e as vendas () sejam

Tabela 2.2: Funcao de ganho da livraria (em dezenas)

Uma classe geral de perdas

onde  > 0 e arbitrario e k e uma constante, em geral unitaria. A regra

Figura 2.1: Funcoes de perda alternativas em problemas de estimacao:

onde i = 0, 1. A escolha de c0 6= c1 permite reconhecer que os erros de

onde > 0 e arbitrario e k e uma constante, em geral unitaria. A regra