Escolar Documentos
Profissional Documentos
Cultura Documentos
Tese Abordagem Bayesiana
Tese Abordagem Bayesiana
, V
, W
e W
, V
, W
e W
, V
, W
e W
, V
, W
e W
j=1
p
j
f
j
(x), onde
k
j=1
p
j
= 1, (1.1)
e as densidades f
j
s ao de uma mesma famlia, com vetores de par ametros
j
, j = 1, . . . , k.
O avan co de tecnicas Bayesianas de estimacao, como Markov chain Monte Carlo
(MCMC, para detalhes sobre esta tecnica ver Gamerman e Lopes, 2006) foram mo-
tiva coes importantes para o desenvolvimento de tecnicas que consistem em mistura de
distribuic oes. O amostrador de Gibbs para estima cao de mistura de distribuic oes foi
desenvolvido no trabalho de Diebolt e Robert (1994).
1.3 Objetivo
O objetivo deste trabalho e propor uma nova metodologia para analisar dados ex-
tremos, dando um enfoque especial para a cauda da distribuic ao. Baseado na TVE, a
partir de um limiar grande, a cauda deste tipo de dado pode ser modelada por uma
distribuic ao GPD. Para a parte central dos dados, pode-se a princpio supor uma am-
pla classe de distribui coes candidatas para realizar a modelagem. Uma metodologia que
abrange este leque de classes consiste em uma abordagem nao-parametrica, baseado numa
aproxima cao por mistura nita de distribuicoes de uma mesma famlia parametrica.
Este trabalho consiste numa extensao do trabalho de Behrens et al. (2004), que
realizou uma estimativa atraves de uma abordagem Bayesiana para dados extremos no
Abordagem Bayesiana nao-parametrica para analise de valores extremos 4
modelo, considerando uma distribuic ao parametrica conhecida para a parte central da
distribuic ao, e uma distribuic ao GPD acima de um limiar. A func ao de distribuicao do
modelo e dada por
F(x | , ) =
_
_
H(x | ), se x < u
H(u | ) + [1 H(u|)]G(x|), se x u
, (1.2)
onde s ao os par ametros da parte central dos dados, sao os parametros da cauda,
H(.|) e a fun cao de distribuic ao da parte central dos dados, onde Behrens et al. (2004)
considera H sendo Gama, e G(.|) e a funcao de distribuic ao GPD, para as observac oes
acima do limiar, que depende de = (, , u), onde u e o limiar. Um exemplo de mistura
de uma Gama com GPD e dada pela Figura 1.1.
Figura 1.1: Densidade de mistura de uma Gama com GPD.
A linha vertical representa o limiar, a curva `a esquerda e a densidade da Gama e a curva a
direita e a densidade da GPD.
Neste trabalho, ser a realizada uma abordagem Bayesiana nao-parametrica para a
func ao de distribuicao H em (1.2), assumindo que H e uma mistura nita de distribuic oes
de uma mesma famlia como em (1.1). Baseado no trabalho de Wiper et al. (2001), foi
utilizada a famlia Gama para mistura de distribuicoes, que e a mais adequada para dados
que pertencem aos reais positivos. Pela Figura 1.1, percebe-se que h a um salto no limiar.
Este salto pode n ao ocorrer na pratica, mas neste modelo, a estima cao abrange as duas
Abordagem Bayesiana nao-parametrica para analise de valores extremos 5
situac oes, com e sem o salto no limiar, pois aqui o mais importante e determinar o limiar
onde ocorre a mudanca de distribuic ao.
Algumas das modelagens propostas serao aplicadas em dados ambientais, em que o
espaco amostral sao os reais positivos, tais como nveis de chuva e vaz ao de rios, a famlia
da distribuic ao da mistura tambem tem que pertencer aos reais positivos. Assim, a
distribuic ao escolhida para componente da mistura tambem tem que ter suporte em R
+
.
Este trabalho utilizou mistura de distribui coes Gama, baseado no trabalho de Wiper et al.
(2001), que mostrou que a Gama e a famlia mais adequada para realizar uma aproximac ao
n ao-parametrica por misturas. Para dados que tambem assumem valores negativos, pode-
se considerar tambem mistura de distribuic oes Normais, como ja foram desenvolvidos em
trabalhos como em Diebolt e Robert (1994), Roeder e Wasserman (1997), Richardson e
Green (1997) entre outros.
Um outro aspecto importante na mistura de distribuic oes est a em determinar qual o
melhor n umero de componentes a ser utilizado. Neste trabalho, o n umero de componentes
foi escolhido de acordo com criterios de comparac ao de modelos, como o BIC (Bayesian
Information Criterion) e o DIC (Deviance Information Criterion).
1.4 Estrutura do trabalho
O Captulo 2 ir a mostrar o modelo de mistura de distribuic oes Gama, mostrando como
utilizar tecnicas Bayesianas via MCMC para estima cao da distribui cao a posteriori dos
par ametros das componentes da mistura. Tambem serao comentados alguns t opicos im-
portantes na mistura, como imposi cao de uma restric ao nos par ametros das componentes,
para evitar o problema de nao-identicabilidade do modelo.
O Captulo 3 ir a apresentar uma nova metodologia para avaliar dados extremos, con-
siderando uma mistura de distribuic oes Gama para o centro, e distribuic ao GPD para a
cauda. Exemplos de mistura de Gamas com GPD e dada pela Figura 1.2. Embora visual-
mente pare ca haver pouca diferenca entre o modelo proposto e o que utiliza s o mistura,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 6
esta diferenca e notoria no calculo de quantis extremos e maximos da distribui cao, que
s ao as medidas mais importantes quando se analisa valores extremos. Foram analisados
dois conjuntos de dados. O primeiro consiste em dados de vaz ao de rios em Porto Rico.
Os dados est ao disponveis no site http://waterdata.usgs.gov. O segundo conjunto
de dados consiste em nveis de chuvas em Portugal. Os dados podem ser obtidos no site
http://snirh.pt/.
Figura 1.2: Funcoes de densidade do modelo proposto
(a) - = 2 e = 0, 4; (b) - = 2 e = 0, 4; (c) - = 3 e = 0, 4; (d) - = 3 e = 0, 4. A
parte central dos dados e uma mistura de duas Gamas. As linhas tracejadas representam a
continuacao da mistura de Gamas alem do limiar.
O Captulo 4 consiste em realizar uma extens ao do modelo proposto no Captulo 3,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 7
considerando estrutura de modelos de regress ao para os parametros da cauda. Nesta
estrutura, os par ametros da distribui cao GPD estao em funcao de vari aveis explicativas.
Assim, estes par ametros sao escritos como
= g(z, ),
onde z e o vetor das vari aveis explicativas com vetor de par ametros . Esta estrutura
e baseada no trabalho de Cabras et al.(2009), onde e feita uma reparametrizacao dos
par ametros da GPD, encontrado uma distribuic ao a priori de Jereys com distribuic ao
Uniforme para os par ametros da cauda, modelados por uma estrutura de regress ao. Como
Cabras et al. (2009) considera o limiar xo, neste trabalho foi proposta uma modelagem
do limiar utilizando uma estrutura de regress ao linear. Neste captulo, foram analisados
dois conjuntos de dados, o primeiro de temperaturas m aximas nos Estados Unidos. Os
dados podem ser obtidos no site www.engr.udayton.edu/weather. O segundo conjunto
de dados analisado neste captulo foi de temperaturas mnimas no estado do Rio de
Janeiro.
O Captulo 5 trata a variacao dos par ametros da distribuic ao GPD ao longo do tempo,
considerando os par ametros de forma e escala variando no tempo. Foi considerada uma
estrutura de modelos din amicos de primeira ordem, baseado em Lopes et al. (2009), que
consiste na seguinte estrutura
l
t
=
,t
+ v
,t
, v
,t
N(0, 1/V
),
,t
=
,t1
+ w
,t
, w
,t
N(0, 1/W
),
l
t
=
,t
+ v
,t
, v
,t
N(0, 1/V
),
,t
=
,t1
+ w
,t
, w
,t
N(0, 1/W
),
onde
t
= exp(l
t
) 1 e
t
= exp(l
t
). Este modelo foi aplicado em dados do mercado
nanceiro, em retornos absolutos de bolsa de valores do Brasil, no ndice da BOVESPA,
Petrobras e Vale do Rio Doce.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 8
1.5 Distribuic oes
Esta sec ao apresenta algumas das distribui coes que serao descritas neste trabalho e
suas propriedades.
1.5.1 Distribuicao Gama
A func ao densidade da distribuicao Gama e denotada por G(, ), com = / e
dada por
f
G
(x|/, ) =
_
_
(1/())
x
1
exp(x), se x 0
0, se x < 0.
(1.3)
Na distribuic ao Gama, a esperanca e a variancia sao dadas por E(X) = e V (X) =
/
2
.
Neste trabalho, ao inves de trabalhar com a notacao da distribuic ao Gama como em
(1.3), e mais conveniente realizar uma reparametrizac ao mantendo , mas agora con-
siderando = / um par ametro da distribuic ao. Assim, a media da distribuicao Gama
e o parametro . Realizando a reparametrizac ao, a func ao de densidade da distribuic ao
G(, ) sera dada por:
f
G
(x|, ) =
_
_
(1/())(/)
x
1
exp((/)x), se x 0
0, se x < 0.
(1.4)
Na distribuic ao Gama reparametrizada, a esperanca e dada por E(X) = e a vari ancia
e V (X) =
2
/.
1.5.2 Distribuicao Gama inversa
Se X possui distribuicao Gama com parametros e , entao 1/X possui distribuicao
Gama inversa, denotada por IG(, ), com a seguinte func ao de densidade
Abordagem Bayesiana nao-parametrica para analise de valores extremos 9
f
IG
(x|, ) =
_
_
(1/())
x
1
exp(/x), se x 0
0, se x < 0.
(1.5)
Na distribuic ao Gama inversa, a esperanca e dada por E(X) = /( 1) para > 1
e a variancia e dada por V (X) =
2
(1)
2
(2)
para > 2.
1.5.3 Distribuicao Dirichlet
Um vetor de vari aveis X = (X
1
, . . . , X
k
), com
k
i=1
X
i
= 1 possui distribuic ao Dirichlet
com parametros
1
, . . . ,
k
, e e denotada por D
k
(
1
, . . . ,
k
), se possui a seguinte func ao
densidade:
f
D
(x |
1
, . . . ,
k
) =
((
0
))
_
k
j=1
(
j
) 1)
k
j=1
x
j
1
j
, se x
i
0, i = 1, . . . , k,
onde
0
=
k
j=1
j
, j = 1, . . . , k. Na distribuic ao Dirichlet, a esperan ca das marginais sao
E(X
i
) =
i
/
0
, i = 1, . . . , k e vari ancia V (X
i
) =
i
(
0
i
)
2
0
(
0
+1)
, para i = 1, . . . , k.
1.5.4 Distribuicao Multinomial
O vetor de vari aveis (X
1
, . . . , X
k
), com X
j
{0, 1}, j = 1, . . . , k e
k
i=1
X
i
= n, possui
distribuic ao multinomial com par ametros p
1
, . . . , p
k
, com
k
j=1
p
j
= 1 e denotada por
MN
k
(n; p
1
, . . . , p
k
), se possui a seguinte fun cao de probabilidade:
P
MN
(X
1
= x
1
, . . . , X
k
= x
k
| p
1
, . . . , p
k
) =
n!
k
j=1
x
j
!
k
j=1
p
x
j
j
, (1.6)
onde E(X
i
) = np
i
e V (X
i
) = np
i
(1 p
i
), i = 1, . . . , k.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 10
1.5.5 Distribuicao Normal truncada
Denotando por N(a, b) a distribuic ao Normal com E(X) = a e V (X) = b, se
X N(a, b) com fun cao densidade
f
N
(y) =
1
2b
e
(xa)
2
2b
. (1.7)
Se X e a distribuic ao de Y truncada em um intervalo (c, d), X possui distribuic ao Normal
truncada, denotada por N(a, b)I(c, d), e possui a seguinte fun cao de densidade
f
NT
(x|a, b, c, d) =
_
xa
b
_
_
da
b
_
_
ca
b
_
, c x d, (1.8)
onde e s ao respectivamente a fun cao de densidade e de distribuic ao da N(0, 1).
Captulo 2
Estimacao nao-parametrica por
mistura
Neste captulo, ser a feita uma revis ao dos modelos de mistura nita de distribuic oes,
com objetivo de entender melhor este metodo, usado principalmente para estimac ao n ao-
parametrica de curvas. Os resultados obtidos nos exerccios de simulac ao utilizados neste
captulo servem de base para a aplicacao dos modelos de mistura para os modelos pro-
postos neste trabalho, que serao vistos nos captulos seguintes para valores extremos.
Neste captulo, s ao comparados dois diferentes algoritmos para mistura de curvas de
distribuic ao, um primeiro que utiliza diretamente a distribuic ao a posteriori do vetor de
par ametros, e um segundo que insere uma variavel latente que facilita os c alculos da
distribuic ao a posteriori de cada par ametro.
2.1 Introducao
Metodos n ao-parametricos s ao utilizados quando ha incerteza sobre qual e a dis-
tribuic ao de um conjunto de dados, ou quando esta distribuic ao nao possui forma parame-
trica conhecida. Modelos baseados em mistura de distribuic oes fornecem uma interessante
alternativa para modelagem n ao-parametrica. O avanco de tecnicas computacionais tem
11
Abordagem Bayesiana nao-parametrica para analise de valores extremos 12
ajudado para um melhor desenvolvimento nesta area, pois possibilitaram trabalhar com
estimac ao de modelos mais complexos.
Abordagem Bayesiana para a estima cao de mistura n ao havia sido bem desenvolvida
ate o incio da decada de 1990, devido principalmente a obstaculos computacionais.
Diebolt e Robert (1994) propuseram a insercao de vari aveis latentes para poder amostrar
distribuic oes de mistura utilizando o amostrador de Gibbs. Celeux et al. (2000) estu-
daram as diculdades na estimac ao da distribuic ao a posteriori em modelos de mistura
pela tecnica MCMC. Jasra et al. (2005) revisam alguns metodos de estimar mistura
de distribuicoes, citando o amostrador de Gibbs (Diebold e Robert, 1994), Tempering
MCMC (Neal, 1996) e Relabelling Algorithms (Stephens, 1997).
2.2 Inferencia Bayesiana
A abordagem Bayesiana e desenvolvida na presenca de observac oes x cujos valores ini-
cialmente vem de distribuic oes incertas e descritos por uma func ao de densidade f(x | ).
A quantidade representa uma caracterstica de interesse que descreve o processo da
distribuic ao da variavel. A situac ao canonica e aquela na qual uma amostra aleat oria
X = (X
1
, ..., X
n
) segue uma distribuic ao com densidade f(X | ). Neste caso, as ob-
serva coes s ao iid (independentes e identicamente distribuidas), condicional em . A quan-
tidade n ao e somente um ndice, mas o principal interesse de estudo, pois determina a
caracterstica da populac ao.
2.2.1 Distribuicao a priori e a posteriori
E desej avel que o pesquisador tenha algum conhecimento sobre o par ametro de inte-
resse . Este conhecimento pode ser formalmente incorporado na an alise. A abordagem
Bayesiana incorpora esta informa cao na an alise atraves de uma densidade p(), chamada
de distribuic ao a priori, que geralmente e uma informa cao subjetiva.
A inferencia Bayesiana contem dois ingredientes: a distribui cao observacional f(x | )
Abordagem Bayesiana nao-parametrica para analise de valores extremos 13
e a distribuic ao p(). Esta ultima distribuic ao pode tambem ser especicada com ajuda
de outros parametros, chamados de hiperparametros, ou seja, sao os parametros da dis-
tribuic ao dos parametros. A distribuic ao observacional de uma amostra fornece a func ao
de verossimilhanca l() = f(x | ). Com estes dois ingredientes, pode-se encontrar a dis-
tribuic ao de ap os observar x. Esta distribuic ao e chamada de distribuic ao a posteriori,
que e obtida atraves do Teorema de Bayes
( | x) =
f(x | )p()
_
f(x | )p()d
,
onde o denominador e uma constante em relac ao a . Assim, a distribui cao a posteriori
pode ser dada por ( | x), escrita de uma forma mais compacta por
( | x) f(x | )p()
Em uma amostra aleatoria de tamanho n, a func ao de verossimilhanca e dada por
l() =
n
i=1
f(x
i
| ) e assim a distribuic ao a posteriori de dado o vetor (x
1
, ..., x
n
) e
proporcional a
( | x
1
, ..., x
n
) l()p()
2.3 Monte Carlo via cadeias de Markov
A tecnica de Monte Carlo via cadeias de Markov, conhecida como MCMC, que pode
ser vista em referencias como, por exemplo, Gamerman e Lopes (2006), tem uma vasta
area de aplicac ao em modelos Bayesianos. Esta tecnica consiste em simular pontos de uma
distribuic ao multivariada. Antes de mostrar a tecnica, considere a identidade a posteriori:
P( | Y ) =
_
Z
P( | Y, Z)P(Z | Y )dZ,
e a identidade preditiva
P(Z | Y ) =
_
P(Z | Y, )P( | Y )d
Abordagem Bayesiana nao-parametrica para analise de valores extremos 14
uma iterac ao entre os dois, tomando a estimativa corrente da identidade a posteriori,
simulando uma realizacao de Z da identidade preditiva, e usando estas realizac oes para
re-estimar a identidade a posteriori.
Uma abordagem modicada e a chamada chained data algorithm, onde s ao feitas
iterac oes sucessivas de P(Z | , Y ) e P( | Z, Y ) para obter uma sequencia de realizac oes
(Z
(1)
,
(1)
),...,(Z
(n)
,
(n)
), onde em cada caso as simulac oes s ao feitas condicionadas aos
valores correntes das variaveis. Intuitivamente, espera-se que esta cadeia encontre uma
distribuic ao de equilbrio P(, Z | Y ). Alem disso, a partir de um certo perodo de
aquecimento, chamado de burn-in, a sequencia (Z
(k)
,
(k)
),...,(Z
(n)
,
(n)
) s ao realizacoes da
distribuic ao proposta.
2.3.1 Amostrador de Gibbs
O amostrador de Gibbs generaliza o chained data algorithm para a situac ao multivari-
ada. Para obter uma amostra da distribui cao multivariada p(
1
, ...,
d
), o procedimento e
dado por
Algoritmo Gibbs
1. Inicializar = (
(0)
1
, ...,
(0)
d
)
2. Simular
(1)
1
da condicional
1
|
(0)
2
, ...,
(0)
d
3. Simular
(1)
2
da condicional
2
|
(1)
1
,
(0)
3
, ...,
(0)
d
4. ...
5. Simular
(1)
d
da condicional
d
|
(1)
1
, ...,
(0)
d1
6. Iterar o procedimento
Assim, ap os um perodo de burn-in, (
(k)
1
, ...,
(k)
d
),...,(
(n)
1
, ...,
(n)
d
) s ao realizac oes da
distribuic ao de interesse.
Pela forma do Teorema de Bayes, onde a distribuic ao a posteriori e dada por
p( | x) =
p()p(x | )
_
p()p(x | )d
,
o amostrador de Gibbs pode obter amostras diretamente da distribuic ao a posteriori
Abordagem Bayesiana nao-parametrica para analise de valores extremos 15
conjunta utilizando as distribuicoes do algoritmo, conhecidas tambem como distribui coes
condicionais completas, sem ter que se preocupar com a integral do denominador.
2.3.2 Metropolis-Hastings
O algoritmo mais Geral do MCMC e o Metropolis-Hastings. Suponha que o objetivo e
simular pontos de uma distribuicao (multivaridada) (). Seja q(, ) uma probabilidade
de transic ao arbitr aria. O algoritmo de Metropolis-Hastings e dado da seguinte maneira
Algoritmo M-H
1. Dada a posic ao corrente de
n
= gerar um novo candidato
de q(, )
2. Calcular (, ) = min
_
()q(,)
()q(,)
, 1
_
, com =
.
3. Com probabilidade (,
) aceitar
n+1
=
j=1
p
j
f
j
(x|
j
),
onde p
j
e o peso associado ` a componente j, com func ao de densidade f
j
(.|
j
) com vetor de
par ametros
j
, j = 1, . . . , k. A restric ao nos pesos e dada por
k
j=1
p
j
= 1. Neste modelo,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 16
os parametros s ao os pesos p
j
e os par ametros de cada componente
j
, j = 1, . . . , k.
Para a famlia de componentes f
j
, e necess ario escolher a famlia mais adequada para
vari aveis que pertencem aos reais positivos.
2.4.1 Aproximacao nao-parametrica por mistura
Modelos de mistura de Gamas fornecem uma boa aproxima cao a estimac ao nao-
parametrica de curvas nos dados reais positivos. De Vore e Lorenz (1993, p ag 14),
mostraram para qualquer fun cao contnua f(x) em (0, ), com limite zero quando x ,
que lim
u
S
u
(x) = f(x) uniformemente para 0 < x < , onde S
u
(x) e denido por
S
u
(x) = e
ux
k=0
(ux)
k
k!
f
_
k
u
_
, u > 0.
Alem disso, f pode ser aproximada por uma mistura de densidades Gama G(k+1/u, k+1)
com pesos (1/u)f(k/u). Asmussen (1987, pag 76) mostrou que mistura de distribui coes
Erlang convergem fracamente para qualquer medida de probabilidade em (0,).
Em particular, Wiper et al. (2001) propoem utilizar mistura de distribuic oes Gama
para estima cao de densidade n ao- parametrica, pois a famlia Gama e mais ampla que
as citadas previamente, n ao tendo um dos par ametros restrito a um inteiro. Assim, as
consequencias s ao aproximac oes mais parcimoniosas que as citadas previamente.
O modelo de mistura de Gamas com k componentes, com vetor de parametros (, , p),
e denotado por MG
k
(, , p), ou MG
k
, quando nao for necessario explicitar os par ametros.
Este modelo possui a seguinte funcao de densidade:
h(x|, , p) =
k
j=1
p
j
f
G
(x|
j
,
j
).
onde f
G
e a func ao de densidade da distribui cao Gama,
Um exemplo da mistura de Gamas e suas marginais est a na Figura 2.1
2.5 Restricao nos parametros
Um outro aspecto importante quando e feita a modelagem Bayesiana nao-parametrica
Abordagem Bayesiana nao-parametrica para analise de valores extremos 17
Figura 2.1: Densidade de mistura de 3 Gamas.
Linhas tracejadas: componentes da mistura. Linha cheia: mistura das tres componentes.
baseada em mistura de distribui coes esta na identicabilidade das componentes da mis-
tura. Realizando a estima cao sem nenhuma restric ao nos par ametros, pode ocorrer do
metodo utilizado na estimac ao n ao identicar quais s ao cada uma das componentes ou
mistur a-las.
Um exemplo da falta de identicabilidade da distribui cao de mistura pode ser visto
em exemplos com dados simulados. Resultados de simulac oes feitas para distribui cao
Gama e Normal mostram este tipo de comportamento. O gr aco ` a esquerda da Figura
2.2 mostra a serie da distribui cao a posteriori das medias de mistura de quatro Normais.
Pelo gr aco, percebe-se que a vari ancia ao longo de uma serie muda de comportamento, ao
mesmo tempo em que a variancia de uma componente aumenta, a outra diminui, ou seja,
uma componente passa a ter as caractersticas da outra. Fazendo a mistura de Gamas,
a parte ` a direita da Figura 2.2 mostra que este comportamento tambem acontece para o
par ametro de media da distribuic ao Gama.
Um dos primeiros trabalhos a discutir esta restric ao foi Richardson e Green (1997),
onde no caso de mistura de distribuic ao Normais, e sugerido impor a restric ao nas medias
(
1
,
2
, . . . ,
k
), de tal forma que
1
<
2
< . . . <
k
.
Este problema foi amplamente discutido no trabalho de Fr uhwirth-Schnatter (2001),
Abordagem Bayesiana nao-parametrica para analise de valores extremos 18
Figura 2.2: Problemas da n ao-identicabilidade para misturas Normal e Gama.
A serie `a esquerda mostra um exemplo de estimacao para 4 componentes para as medias da
mistura de Normais, e `a direita a media de mistura de Gamas.
onde no caso da mistura de duas distribuicoes Normais, foi necessario impor a condicao
de que a media na primeira componente e sempre menor do que a segunda. Este trabalho
mostrou tambem que a n ao imposicao da condi cao pode levar ao problema da distribuicao
a posteriori possuir dois m aximos locais, e com isso o modelo pode convergir para uma
distribuic ao que n ao e a verdadeira. Fr uhwirth-Schnatter (2001) tambem mostrou que a
imposic ao da restricao na variancia da mistura de Normais n ao e necessaria e pode levar
o algoritmo MCMC a amostrar de uma distribuic ao a posteriori truncada.
Ao impor a restricao na media, utilizar a func ao Gama reparametrizada em (1.4) tem
a vantagem da restric ao de identicabilidade estar imposta somente em um par ametro,
ao contrario do caso da forma da distribuicao Gama em (1.3), que levaria a restric ao
nos dois par ametros da distribuic ao Gama. Assim, e utilizada a forma da distribuic ao
Gama reparametrizada e imposta a restric ao de identicabilidade R = {(
1
, ...,
k
)
(0, );
1
< . . . <
k
}.
Embora a restric ao seja importante para identicar os par ametros de cada componente
Abordagem Bayesiana nao-parametrica para analise de valores extremos 19
da mistura, ela n ao e necessaria para estimar corretamente a curva de densidade da
distribuic ao de mistura. Ao fazer a estimacao sem a restri cao, embora os valores dos
par ametros nao sejam necessariamente os mesmos que os valores corretos, a curva de
densidade sera a mesma curva da estimac ao que imp oe a restri cao nas medias.
2.6 Distribuicao a priori para mistura
Para o parametro
j
, observa-se na densidade da Gama em (1.4) que ele n ao possui
uma distribui cao a priori conjugada conhecida. Como este par ametro s o assume valores
positivos, a priori escolhida foi a Gama.
Para o par ametro
j
, percebe-se, pela fun cao densidade da Gama em (1.4), xando
j
, que uma priori conjugada para esta distribui cao e a Gama inversa. Na priori, tambem
e necess ario impor a restricao nos parametros R, citada na Sec ao 2.5.
Para os pesos, por serem vari aveis que est ao entre 0 e 1 e a soma ser 1, foi atribuda
uma priori com distribuic ao Dirichlet para o vetor de pesos.
A princpio, tem-se que
j
G(a
j
/b
j
, a
j
), j = 1, . . . , k,
j
IG(c
j
, d
j
), j = 1, . . . , k e p D(
1
, . . . ,
k
).
Para o vetor de par ametros (
1
, . . . ,
k
), considerando a restric ao na media dos par ametros,
a priori pode ser escrita da seguinte maneira:
p(
1
, . . . ,
k
) =
k
i=1
f
IG
(
i
| c
i
, d
i
) = W
k
i=1
f
IG
(
i
| c
i
, d
i
)I
R
(),
onde W
1
=
_
I
R
()
k
i=1
p(
i
)d(
1
, . . . ,
k
) e I
R
() e a fun cao indicadora da restric ao nas
medias.
Supondo independencia entre esses grupos de parametros , e p, e denotando o vetor
de todos os parametros do modelo por , tem-se que
= (
1
, . . . ,
k
,
1
, . . . ,
k
, p
1
, . . . , p
k
).
Abordagem Bayesiana nao-parametrica para analise de valores extremos 20
A densidade a priori de e dada por
()
k
i=1
_
a
j
1
j
exp(b
j
j
)
c
j
1
j
exp(d
j
/
j
)p
j
1
j
_
I
R
().
2.7 Distribuicao a posteriori
Considerando a funcao de verossimilhanca de baseada no modelo de mistura, jun-
tamente com a distribui cao a priori de , obtem-se, pelo Teorema de Bayes, a seguinte
forma da distribuicao a posteriori
(|x)
n
i=1
_
_
k
j=1
p
j
f
G
(x
i
|
j
,
j
)
_
_
k
j=1
_
f
G
(
j
|a
j
/b
j
, a
j
)f
IG
(
j
|c
j
, d
j
)p
j1
j
_
I
R
()
i=1
_
_
k
j=1
_
p
j
1
(
j
)
_
j
_
j
x
j
i
e
j
_
xi
_
_
_
k
j=1
_
aj1
j
e
bjj
cj1
j
e
dj/j
p
j1
j
_
I
R
(), (2.1)
onde x = (x
1
, . . . , x
n
) sao as observac oes.
Pode-se notar que a equac ao (2.1) nao tem uma forma conhecida para nenhum par ametro,
devido ao fato da func ao densidade conter uma serie de parcelas que n ao se combinam
analiticamente.
Neste caso, uma primeira alternativa para fazer inferencia seria utilizar MCMC pelo
algoritmo de Gibbs em blocos com passos de Metropolis, para amostrar da distribuic ao
condicional completa em cada vetor de parametros da componente j da mistura, alem
do vetor de pesos. O algoritmo para amostrar pontos da distribui cao a posteriori dos
par ametros e dado no Apendice 2A deste captulo.
Para sintonizar a vari ancia das distribuic oes propostas, foi utilizado o metodo de
Roberts e Rosenthal (2006), que diz que o valor otimo da taxa de aceitac ao do algoritmo
de Metropolis para propostas unidimensionais e aproximadamente 0,44.
Seja V
(l)
a vari ancia da proposta no incio das iterac oes com l = 0. A cada 50 itera coes,
o contador l vai para l +1 e verica-se a taxa de aceitac ao. Se esta e menor do que 0,44,
ent ao log
_
V
(l+1)
_
= log
_
V
(l)
_
+(l +1) caso contrario log
_
V
(l+1)
_
= log
_
V
(l)
_
(l +1),
onde (l + 1) = min(0, 01; (l + 1)
0,5
).
Abordagem Bayesiana nao-parametrica para analise de valores extremos 21
2.8 Insercao de uma variavel latente
Para facilitar os calculos da distribui cao a posteriori, Diebolt e Robert (1994) uti-
lizaram a ideia proposta em Tanner e Wong (1987). Eles abordaram o problema inserindo
uma vari avel aleat oria latente z de dimens ao n k, em que z
i,j
e uma variavel que indica
em qual componente j da mistura est a a observacao i, assumindo valor 1 para a compo-
nente em que ela est a e 0 nas outras componentes. Alem disso, utilizando o algoritmo
MCMC, Diebolt e Robert (1994) mostraram que amostrar da distribuic ao a posteriori
(|z, x) equivale a amostrar da distribuic ao a posteriori (|x). Desta maneira,
f(x | z) =
k
j=1
f
j
(x)
z
j
.
Sendo z MN
k
(1; p
1
, . . . , p
k
), ent ao, f
MN
(z) =
k
j=1
p
z
j
j
e,
f(x) =
k
j=1
f(x, z
j
) =
k
j=1
f(x | z
j
)f
MN
(z
j
) =
k
l=1
_
_
k
j=1
(f
j
(x)p
j
)
z
j,l
_
_
=
k
l=1
p
l
f
l
(x).
Portanto,
h(x | , p, z) =
k
j=1
(p
j
f(x|
j
))
z
j
, (2.2)
onde z = (z
1
, . . . , z
n
) e z
i
= (z
i,1
, . . . , z
i,k
), i = 1, . . . , n.
Como o valor da vari avel z n ao e conhecido, ela tambem e considerada mais um
par ametro no modelo. Utilizando as mesmas distribuicoes a priori da sec ao anterior, para
uma amostra de n observacoes, a distribuic ao a posteriori ter a a seguinte forma
(, z|x)
n
i=1
_
_
k
j=1
(f
G
(x
i
|
j
,
j
))
z
i,j
p
z
i,j
j
_
_
i=1
_
a
j
1
j
exp(b
j
j
)
c
j
1
j
exp(d
j
/
j
)p
j
1
j
_
I
R
()
j=1
_
_
_
1
(
j
)
p
j
_
j
_
j
_
n
i=1
z
i,j
_
n
i=1
x
z
i,j
(
j
1)
i
_
exp
_
i=1
z
i,j
_
j
_
x
i
_
_
_
a
j
1
j
exp(b
j
j
)
c
j
1
j
exp(d
j
/
j
)p
j
1
j
_
I
R
()
j=1
_
p
(
n
i=1
z
i,j
+
j
1)
j
c
j
n
i=1
z
i,j
1
j
exp
_
_
d
j
+
j
n
i=1
z
i,j
x
i
_
/
j
_
a
j
+
j
n
i=1
z
i,j
1
j
(
j
)
n
i=1
z
i,j
_
n
i=1
x
z
i,j
(
j
1)
i
_
exp(b
j
j
)
_
_
_I
R
(). (2.3)
Reescrevendo a posteriori desta maneira, com exce cao de
j
, j = 1, . . . , k, todos os
outros parametros tem distribuic oes condicionais completas conhecidas. Detalhes das
condicionais completas sao dados no Apendice 2B deste captulo.
2.9 Comparacao de modelos
Em uma estimac ao utilizando abordagem n ao-parametrica por mistura de distribuicoes,
e necessario saber qual o n umero de componentes mais adequado em cada caso. Para isso,
h a duas alternativas: considerar k um parametro do modelo e estimar por RJMCMC
(Reversible Jump Markov Chain Monte Carlo, Richardson e Green, 1997), ou comparar
modelos com diferentes valores de k atraves de um criterio de comparac ao de modelos.
Como nos dados que possuem caudas com distribuic ao GPD, problemas de mistura de
distribuic ao de dados reais resultam em modelos com poucas componentes na mistura, o
algoritmo RJMCMC resulta num alto custo computacional, para se alcancar a distribuic ao
de equilbrio. Aplicac oes deste trabalho mostraram que no m aximo tres componentes na
mistura e o suciente para alcancar o melhor modelo. Neste trabalho, foram adotados
tres criterios de compara cao de modelos.
2.9.1 Distribuicao preditiva
Um criterio graco para avaliar o bom ajuste do modelo consiste na curva da func ao
de densidade preditiva do modelo. A func ao distribui cao preditiva e dada por
f
p
(y
n+1
|y) =
_
f
p
(y
n+1
, |y)d =
_
f
p
(y
n+1
|)p(|y)d = E
|y
(f
p
(y
n+1
|)) .
Abordagem Bayesiana nao-parametrica para analise de valores extremos 23
Amostrando I valores de da distribui cao a posteriori e usando o fato de que, como
f
p
(y
n+1
| y) = E
|y
(f
p
(y
n+1
|)), pela tecnica de Monte Carlo, que e um estimador razo avel
para ser utilizado,
f
p
(y
n+1
|y) =
1
I
I
i=1
f
p
(y
n+1
|
(i)
), onde
(i)
e o i-esimo valor amostrado
da distribuic ao a posteriori.
Considerando que neste captulo, f
p
e uma mistura de k distribuic oes Gama com
par ametros (
j
,
j
), j = 1, . . . , k, a func ao de densidade preditiva pode ser aproximada
por
f
p
(y
n+1
|y) =
1
I
I
i=1
k
j=1
p
(i)
j
f
G
(y
n+1
|
(i)
j
,
(i)
j
).
2.9.2 Criterio de Informacao Bayesiano (BIC)
Este criterio foi proposto por Schwarz (1978), e e um dos primeiros e mais utilizados
criterios de comparac ao de modelos. Este metodo penaliza o n umero de parametros de
acordo com o tamanho da amostra.
O BIC e dado por
BIC = 2
I
i=1
log ((f
p
(y |
i
))
I
+ q log(n), (2.4)
onde f
p
(y |
i
) e a fun cao de verossimilhanca,
i
e o vetor de par ametros na itera cao
i, q e o n umero de par ametros do modelo e n e o tamanho da amostra. O primeiro termo
do BIC avalia o ajuste do modelo e o segundo termo e a penalizac ao de acordo com o
n umero de par ametros. Comparando varios modelos, o melhor, segundo o BIC, e aquele
que tiver o menor valor.
Quando e feita a estimac ao via MCMC no modelo com mistura de Gamas, onde
i
= (
i,1
, . . . ,
i,k
,
i,1
, . . . ,
i,k
, p
i,1
, . . . , p
i,k
), tem-se que
log(f
p
(y |
i
)) =
n
l=1
log
_
_
k
j=1
p
(i)
j
f
G
(y
l
|
(i)
j
,
(i)
j
)
_
_
,
onde
i,j
,
i,j
e p
i,j
, j = 1, . . . , k e i = 1, s ao os valores dos par ametros na componente j
da mistura na i-esima itera cao do MCMC, num total de I iterac oes.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 24
2.9.3 Criterio de Informacao dos Desvios (DIC)
O DIC, introduzido por Spiegelhalter et al. (2002), se baseia na func ao de distribui cao
a posteriori da estatstica dos desvios.
Para encontrar o DIC, considere uma medida D( | y), dada por:
D( | y) = 2 log(f
p
(y|)),
onde f
p
(y|) e a funcao de verossimilhanca.
O DIC e calculado por
DIC =
D( | y) + pD( | y),
onde pD e conhecido como n umero efetivo de par ametros, e avalia a complexidade do
modelo, e pode ser calculado por
pD( | y) =
D( | y)
D( | y),
onde
D( | y) = 2 log(f(Y |
)), com
sendo uma estimativa da media a posteriori de
, ou seja, num caso de um vetor = (
1
, . . . ,
m
),
D() = D
_
1
I
I
i=1
(i)
1
, . . . ,
1
I
I
i=1
(i)
m
_
.
No caso da mistura de Gamas com k componentes,
D( | y) = 2 log
_
_
k
j=1
p
j
f
G
(y
i
|
j
,
j
)
_
_
,
onde
j
=
I
i=1
(i)
j
/I,
j
=
I
i=1
(i)
j
/I e p
j
=
I
i=1
p
(i)
j
/I, j = 1, . . . , k e
D( | y) = 2
I
i=1
log
_
_
k
j=1
p
i,j
f
G
(y
i
|
i,j
,
i,j
)
_
_
/I.
Embora este metodo tenha sido utilizado com muita frequencia nos ultimos anos,
recomenda-se ter cuidado com algumas restricoes, como por exemplo o n umero efetivo de
par ametros, que em alguns casos pode ser negativo. O DIC pode apresentar diculdades
Abordagem Bayesiana nao-parametrica para analise de valores extremos 25
nos casos onde nao h a a garantia que a funcao de verossimilhanca seja log-concava, quando
h a mais de uma moda na distribuic ao dos parametros e em alguns casos onde ha uma
forte assimetria na distribuic ao dos par ametros. Estes tens citados estao diretamente
relacionados com este estudo de distribuicao de mistura.
Na discussao do artigo de Spiegelhalter et al.(2002), Richardson cita exemplo de DIC
para mistura de duas distribuic oes Normais, e em um dos casos, fazendo uma simulac ao
para 0, 75N(0; 1) + 0, 25N(1, 5; 0, 5), o menor DIC encontrado foi considerando 4 compo-
nentes na mistura e n ao 2, que seria o modelo correto.
Neste trabalho, foram calculadas as medidas DIC de cada simulac ao para averiguar
mais detalhadamente as limitacoes do DIC em relac ao `a mistura de distribuic oes.
2.10 Simulac oes
Para realizar comparacoes foram aplicados dois algoritmos: o primeiro considerando
apenas o algoritmo de Gibbs com passos de Metropolis (Secao 2.7) e outro que utiliza
a variavel latente (Sec ao 2.8). Em ambos os casos, o algoritmo foi feito impondo a
restric ao na media R = {(
1
, ...,
k
) (0, );
1
< . . . <
k
}. Foram feitas simulac oes
considerando mistura com uma, duas e tres componentes.
Para cada simula cao, foi feita a estimac ao considerando diversos valores de k, com
intuito de vericar se o modelo que obtem os melhores resultados e aquele que tem o
mesmo n umero de componentes da mistura usada na simulacao. Por facilidade de notac ao,
ser a denotado por k
sim
o n umero de componentes na mistura utilizados na simulac ao e
por k
est
o n umero de componentes utilizados na estimac ao.
Para fazer esta comparac ao, foram analisados os resultados da distribuic ao preditiva,
vericando em qual caso a densidade preditiva e mais proxima da verdadeira densidade.
Alem disso, foram utilizados criterios de comparacao de modelos, como BIC e DIC.
Foram realizadas 3 simula coes de 1000 pontos da distribuic ao de mistura com k
sim
=1,
2 e 3. Para cada caso, na estimac ao por MCMC, foram realizadas 50 mil iterac oes, com
Abordagem Bayesiana nao-parametrica para analise de valores extremos 26
burn-in de 10 mil e coletadas uma amostra a cada 10 observac oes. A vericac ao de
convergencia foi feita utilizando duas cadeias comecando de valores iniciais diferentes.
Distribuicao a priori: Para cada simulacao, a distribuic ao a priori sera como em
(2.1), onde
j
IG(2, 1; 5, 5) e
j
G(6; 0, 5), j = 1, . . . , k
est
, e p D
kest
(1, . . . , 1). Estes
par ametros foram escolhidos de modo a se obter uma media a priori pr oxima dos valores
verdadeiros e com variancia alta, numa situac ao onde a distribuic ao a priori fornece pouca
informac ao sobre os par ametros.
Foi usada a linguagem Ox versao 4 (veja Doornik, 1996) para desenvolver os algoritmos
de MCMC em um computador Acer Intel Atom N270, 1,60GHz, 1GB RAM.
2.10.1 Simulacao com uma Gama
Neste primeiro exerccio, foram simulados 1000 pontos de uma distribui cao Gama com
par ametros = 4 e = 4. Supondo que n ao se conhece o n umero de componentes de
mistura, foi feita a modelagem nestes dados considerando k
est
=1, 2 e 3 para os algoritmos
com e sem a vari avel latente.
A Figura 2.3 mostra as densidades preditivas para diversos valores de k
est
, alem da
verdadeira densidade, juntamente com o histograma das simulac oes.
Pela Figura 2.3, nota-se que, independente do valor de k
est
, a estimativa da densi-
dade preditiva e praticamente a mesma, sendo que todas elas est ao sobrepostas e muito
pr oximas da verdadeira fun cao de densidade. Isto mostra que, misturar distribuic oes
(k
est
> 1) ira ter como resultado um modelo t ao eciente quanto no modelo com k
est
= 1.
A Figura 2.4 apresenta as taxas de aceitac ao baseado no metodo de calibrac ao da
vari ancia a posteriori, do trabalho de Roberts e Rosenthal (2006). Pelo graco, verica-se
que o algoritmo que utiliza a vari avel latente chega mais rapidamente a taxa em torno de
0, 44 (graco ` a esquerda da Figura 2.4), enquanto que, ao utilizar o algoritmo de Gibbs com
passos de Metropolis para todos os parametros, a taxa s o ca em torno de 0, 44 apos cerca
de 10000 itera coes, que e o valor utilizado para burn-in. Para estas simula coes, utilizar
a taxa de 0, 44 fornece bons resultados no comportamento das cadeias, nao havendo a
Abordagem Bayesiana nao-parametrica para analise de valores extremos 27
Figura 2.3: Densidade preditiva na simulacao com k
sim
= 1 e k
est
= 1, 2, 3.
necessidade de diminuir a taxa.
Figura 2.4: Taxas de aceitacao a cada 50 iterac oes para k
sim
= 1, k
est
= 1 para a estimac ao
da media da distribuic ao Gama.
A linha vertical representa a taxa de 0,44.
Quando e utilizado o algoritmo com vari aveis latentes, a Figura 2.5 mostra que h a um
problema de identicabilidade nos pesos. Quando k
est
> 1, o peso de uma componente
Abordagem Bayesiana nao-parametrica para analise de valores extremos 28
troca com o peso da outra. Portanto, para este metodo, n ao houve convergencia nas
cadeias quando k
est
> k
sim
. Isto acaba afetando tambem na estimac ao dos par ametros
das componentes de mistura.
Figura 2.5: Serie dos pesos utilizando a vari avel latente com k
sim
= 1, k
est
= 2.
Utilizando o algoritmo de Gibbs com passos de Metropolis, pela Figura 2.6, observa-
se que a serie dos pesos converge para uma distribuic ao em torno de 1 para a primeira
componente e 0 para a segunda, ou seja, o algoritmo praticamente s o usa a primeira com-
ponente para fazer a estimac ao, nao reconhecendo a existencia da segunda componente,
pois a simula cao e feita utilizando k
sim
= 1.
A densidade preditiva de k
est
= 3 apresentou praticamente o mesmo comportamento
do que no caso onde k
est
= 2, assim como a serie dos pesos que o algoritmo de Gibbs com
passos de Metropolis mostra que a terceira componente leva peso 1 e as outras duas 0.
Para comparar todos os resultados das simulac oes com k
sim
= 1, foram calculados o
BIC e o DIC para cada caso estudado. Como quando k
est
> k
sim
o algoritmo com variavel
latente nao atinge a distribui cao de convergencia, as medidas de ajuste que indicam o
modelo com melhores componentes foi feito apenas para o algoritmo que n ao utiliza
vari avel latente.
Pela Tabela 2.1, pode-se concluir que os valores do DIC foram praticamente os mesmos
Abordagem Bayesiana nao-parametrica para analise de valores extremos 29
Figura 2.6: Serie dos pesos sem vari avel latente com k
sim
= 1, k
est
= 2.
Tabela 2.1: Medidas de ajuste de mistura para k
sim
= 1.
k
est
pD DIC BIC
1 2,0 4002,7 4027,6
2 1,9 4002,9 4048,3
3 2,0 4002,8 4069,1
para os diferentes n umeros de componentes na mistura. Para o BIC, os menores valores
das medidas foram para a estimacao com uma componente na mistura.
2.10.2 Simulacao com mistura de duas Gamas
Na segunda simulac ao realizada, foram simulados 1000 pontos de mistura de duas
Gamas, com par ametros = (2; 8), = (4; 8) e p = (0, 66; 0, 33). Foi feita a modelagem
nestes dados considerando k
est
de 1 a 4 para os algoritmos com e sem a variavel latente.
A Figura 2.7 mostra a comparacao entre as densidades verdadeira e preditivas para
diferentes valores de k
est
, com e sem a presenca da variavel latente. A densidade que est a
mais longe da verdadeira e para k
est
= 1. Para k
est
> 1, as funcoes de densidade preditiva
Abordagem Bayesiana nao-parametrica para analise de valores extremos 30
est ao muito pr oximas da verdadeira densidade.
Figura 2.7: Densidade preditiva da simulacao com k
sim
= 2 e k
est
= 1, 2, 3, 4.
A linha tracejada com k
est
= 1 e a unica que ca distante da verdadeira densidade. Para os
outros valores de k
est
, as densidades estao sobrepostas e proximas da verdadeira densidade.
No algoritmo que utiliza o amostrador de Gibbs com passos de Metropolis, quando
k
est
2, apenas dois pesos parecem ser signicativos, ou seja, o modelo so identica o
n umero verdadeiro de componentes utilizados na simulac ao. Pode-se vericar na Figura
2.8 com k
est
= 4, que a primeira e a terceira componentes v ao a 0 e a segunda e quarta
componentes estacionam numa distribuic ao em torno dos valores verdadeiros dos pesos
de 0,66 e 0,33.
Para comparar todos os resultados das simulac oes com k
sim
= 2, foram calculados o
BIC e DIC. Estes resultados est ao na Tabela 2.2.
Pela tabela, percebe-se que o DIC e maior quando k
est
= 1 e h a pouca diferenca
entre os outros valores de k
est
> 1. Isto ocorre porque, para tres ou quatro componentes,
somente dois pesos s ao signicativos e os outros acabam n ao tendo nenhuma relevancia
na estimac ao. Percebe-se tambem que, para k
est
2, o n umero efetivo de parametros se
altera pouco, o que indica que eles estao estimando praticamente o mesmo modelo.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 31
Figura 2.8: Serie dos pesos sem vari avel latente com k
sim
= 2, k
est
= 4.
Tabela 2.2: Medidas de ajuste de mistura para k
sim
= 2.
k
est
pD DIC BIC
1 2,1 4662,9 4688,1
2 5,0 4425,1 4476,6
3 5,2 4424,8 4497,3
4 5,3 4424,5 4518,0
Para o BIC, o menor valor foi exatamente quando k
est
= 2.
2.10.3 Simulacao com mistura de tres Gamas
Na terceira simulac ao, foram simulados 1000 pontos de mistura de tres Gamas, com
par ametros = (1, 33; 4; 12), = (4; 8; 12) e p = (0, 50; 0, 333; 0, 166). Supondo que nao
se conhece o n umero de componentes de mistura, foi feita a modelagem nestes dados
considerando k
est
=1, 2, 3, 4 e 5 para os algoritmos com e sem a variavel latente. A Figura
2.9 mostra a comparacao entre as densidades verdadeira e preditiva para os diferentes
valores de k
est
. Pela Figura, duas componentes na mistura n ao resultam num bom ajuste,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 32
enquanto que para os outros valores de k
est
> 2, as densidades preditivas sao praticamente
as mesmas e pr oximas ` a verdadeira densidade de mistura.
Figura 2.9: Densidade preditiva com simulacao com k
sim
= 3, k
est
= 1, 2, 3, 4.
A linha tracejada com k
est
= 1 e a mais distante da verdadeira densidade. A linha pontilhada
representa k
est
= 2 e ca mais proxima. Para os outros valores de k
est
, as densidades estao
sobrepostas e muito proximas da verdadeira densidade.
Foram utilizados o BIC e o DIC como medidas de ajuste para cada caso. Pela Tabela
2.3, o menor DIC foi para k
est
= 5, enquanto que o menor BIC foi para k
est
= 3. Portanto,
para simulac ao de 3 componentes, a melhor medida de ajuste foi o BIC.
2.10.4 Conclus oes
Baseado nos resultados encontrados nas simulac oes de mistura de distribuicoes, pode-
se tirar as seguintes conclus oes:
para o algoritmo que utiliza vari avel latente, s o foi possvel realizar a estimac ao nos
casos onde k
est
k
sim
. Nas outras situac oes, pode-se notar que a serie dos pesos
n ao convergiu para uma distribuic ao estacionaria;
Abordagem Bayesiana nao-parametrica para analise de valores extremos 33
Tabela 2.3: Medidas de ajuste de mistura para k
sim
= 3.
k
est
pD DIC BIC
1 2,0 4840,3 4865,3
2 5,1 4519,5 4571,4
3 4,8 4475,8 4544,8
4 5,5 4473,8 4565,6
5 6,9 4468,7 4586,2
para o algoritmo que n ao utiliza a variavel latente, para os modelos onde k
est
k
sim
,
n ao houveram diferencas na densidade preditiva, pois o n umero efetivo de pesos
signicantes na estimac ao foi de k
sim
mesmo quando k
est
> k
sim
;
a medida BIC mostrou-se mais eciente para comparar os modelos, pois em todos
os casos o modelo estimado com menor BIC foi o modelo simulado. Em relacao
ao DIC, e necess ario ter um pouco mais de cautela, pois em alguns casos, quando
k
est
k
sim
, h a pouca diferenca entre os valores do DIC e do n umero efetivo de
par ametros. Isto pode indicar que nestes casos, diferentes valores de k
est
podem
estar levando `a mesma estimacao, pois alguns pesos tendem a 0 para modelos com
k
est
> k
sim
.
O algoritmo que n ao utiliza a vari avel latente mostrou-se mais eciente na iden-
ticac ao do n umero de componentes na mistura, pois independente do n umero de
componentes estimados na mistura, a estimacao converge para os par ametros do
modelo verdadeiro, realizando uma estimacao correta n ao s o da curva de densidade,
mas tambem dos par ametros. Alem disso, esta tecnica e mais r apida computacional-
mente do que a tecnica que utiliza a variavel latente.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 34
Apendice 2A - Algoritmo para mistura de Gamas
O algoritmo para amostrar pontos de uma distribuicao de mistura de Gamas sem utilizar
a vari avel latente e dado a seguir:
Algoritmo 1
A partir da iterac ao s do MCMC, os par ametros s ao amostrados por:
a) Na componente j da distribuic ao de mistura, a amostragem e feita da seguinte
maneira.
Amostrando
j
e
j
Como
j
e um valor que so pode ser positivo,
j
foi adotada como distribuic ao proposta
para este par ametro uma Gama dada por
j
|
(s)
j
G(
(s)
j
,
(s)
2
j
/V
j
),
onde
(s)
j
e o valor de
j
na iteracao s da cadeia e V
j
e a variancia da distribuic ao proposta.
Note que, de acordo com essa proposta, E(
j
|
(s)
j
) =
(s)
j
, e V ar(
j
|
(s)
j
) = V
j
,
j = 1, . . . , k.
Como e um valor que s o pode ser positivo, foi adotada como distribuic ao proposta
para este par ametro uma Gama truncada na restric ao das medias, denotada por
j
|
(s)
j
G(
(s)
j
,
(s)
2
j
/V
j
)I
R
(),
onde
(s)
j
e o valor de
j
na itera cao s da cadeia e V
j
e a variancia da distribui cao
proposta.
Os valores
(s+1)
j
=
j
e
(s+1)
j
=
j
s ao aceitos com probabilidade
j
,
j
, onde
j,j
= min
_
1,
(
|x)f
G
(
(s)
j
|
j
,
2
j
/V
j
)f
G
(
(s)
j
|
j
,
2
j
/V
j
)I
R
()
(
|x)f
G
(
j
|
(s)
j
,
(s)2
j
/V
j
)f
G
(
j
|
(s)
j
,
(s)2
j
/V
j
)I
R
()
_
,
= (
(s+1)
<j
,
j
,
(s)
>j
,
(s+1)
<j
,
j
,
(s)
>j
, p
(s)
) e
= (
(s+1)
<j
,
(s)
j
,
(s+1)
<j
,
(s)
j
, p
(s)
).
b) Amostrando p.
Como p e um vetor de dimens ao k com
k
j=1
p
j
= 1, p
com probabilidade
p
= min
_
1,
(
|x)f
D
(p
(s)
|p
)
(
|x)f
D
(p
|p
(s)
)
_
,
onde
= (
(s+1)
,
(s+1)
, p
) e
= (
(s+1)
,
(s+1)
, p
(s)
).
Para a escolha da vari ancia das distribuicoes propostas V
j
e V
j
, j = 1, . . . , k poderia-
se a princpio escolher um valor xo, que poderia resultar numa taxa de aceita cao muito
alta ou baixa no algoritmo de Metropolis. Porem, taxas altas resultam em problemas de
convergencia da cadeia e escolha de valores impr oprios para a distribui cao, enquanto que
taxas muito baixas resultam em poucas amostras para a estimac ao dos par ametros da
distribuic ao a posteriori.
No Algoritmo 1, o metodo de sintonizacao de Roberts e Rosenthal (2006) e feito para
V
j
e V
j
, j = 1, . . . , l. Em simulacoes, este algoritmo nao pareceu ser eciente para
sintonizar V
p
, que foi dado por um valor xo.
Neste trabalho, como as propostas n ao sao unidimensionais, em algumas situa coes foi
necess ario diminuir a taxa de aceita cao calibrada.
Apendice 2B - Condicionais completas no caso com
variavel latente
Considerando a modelagem de mistura de Gamas, com a variavel latente, encontra-se
as seguintes condicionais completas, baseado na distribuicao a posteriori em (2.3):
Observando a equac ao (2.3), percebe-se que, se (
1
< . . . <
k
), a distribuic ao
condicional completa de
j
, j = 1, . . . , k e dada por
(
j
|
j
, , p, z)
c
j
n
i=1
z
i,j
1
j
exp
_
_
d
j
+
j
n
i=1
z
i,j
x
i
_
/
j
_
I
R
(),
onde
j
= (
1
, . . . ,
j1
,
j+1
, . . . ,
k
).
Abordagem Bayesiana nao-parametrica para analise de valores extremos 36
Assim, se (
1
< . . . <
k
),
j
|
j
, , p, z IG
_
c
j
+
j
n
i=1
z
i,j
, d
j
+
j
n
i=1
z
i,j
x
i
_
I
R
(), j = 1, . . . , k.
Pela equa cao (2.3), tem-se que a distribui cao condicional completa em p e dada por
(p|, , z)
k
j=1
p
(
n
i=1
z
i,j
+
j
1)
j
,
e portanto,
p | , , z D
k
__
n
i=1
z
i,1
+
1
_
, . . . ,
_
n
i=1
z
i,k
+
k
__
.
De acordo com a equac ao (2.3), a distribuicao condicional completa em z
i
e dada
por
(z
i
|, , p, z
i
)
k
j=1
(p
j
f
G
(x
i
|
j
,
j
))
z
i,j
,
onde z
i
= (z
1
, . . . , z
i1
, z
i+1
, . . . , z
n
), i = 1, . . . , n.
Assim,
z
i
|, , p, z
i
MN
k
_
1;
p
1
f(x
i
|
1
,
1
)
C
, . . . ,
p
k
f(x
i
|
k
,
k
)
C
_
, (2.5)
onde C =
k
j=1
p
j
f (x
i
|
j
,
j
).
Condicional em
j
Para amostrar
j
, j = 1, . . . , k, por (2.3), como nao e possvel encontrar uma dis-
tribuic ao condicional completa conhecida, e utilizado o mesmo procedimento do Algoritmo
1 (Gibbs com passos de Metropolis), tambem utilizando como proposta uma distribuic ao
Gama.
Captulo 3
Mistura de distribuic oes e TVE
Neste captulo, sera apresentado um novo modelo para dados extremos. Neste modelo,
a cauda da observac ao, ou seja, valores maiores que um determinado limiar, segue uma
distribuic ao GPD. A distribui cao abaixo do limiar e estimada utilizando uma aproximac ao
n ao-parametrica, por uma mistura nita de distribuicoes Gama.
3.1 Teoria de valores extremos
An alise de dados extremos tem sido uma grande ferramenta nas mais diversas areas
do conhecimento nas ultimas decadas, ajudando a prever grandes ganhos e perdas. Duas
areas onde esta an alise se destaca sao nas areas ambientais e econ omicas. Em estudos de
temperatura, o aquecimento global tem sido um assunto em destaque nos ultimos anos de-
vido a rapidas alterac oes climaticas que o planeta vem sofrendo nas ultimas decadas. Estas
mudan cas implicam em altera coes no n umero de eventos extremos de temperatura, seja
esta de m aximos ou mnimos. Eventos de temperaturas extremas s ao mais responsaveis
por mudancas na natureza do que mudancas na media (Parmesan et al., 2000).
Veroes extremamente quentes ou invernos extremamente frios podem inuenciar na
agricultura, no consumo de energia, e em problemas de sa ude para a populac ao. Entender
com qual frequencia eventos extremos ocorrem em um perodo de tempo e importante
37
Abordagem Bayesiana nao-parametrica para analise de valores extremos 38
para amenizar o impacto na sociedade das perdas e danos que estes eventos possam vir a
acarretar.
A TVE pode ajudar a resolver estes problemas, atraves de modelos que ajudam a
entender o comportamento de dados extremos, calculando a probabilidade de quantis
altos e prevenindo a populac ao contra possveis perdas.
Seja x
1
, . . . , x
n
vari aveis aleatorias iid, com func ao distribuicao F. M
n
= max{x
1
, . . . , x
n
}
e o valor m aximo destas observac oes. O resultado cl assico da TVE mostra tres possveis
distribuic oes limite para M
n
, que e enunciado pelo Teorema de Fisher-Tippet (1928).
Teorema 1 Se existem sequencias de constantes a
n
> 0 e b
n
, e alguma fun cao
distribuicao H nao-degenerada tal que
P{(M
n
b
n
)/a
n
x} H(x),
entao H e do mesmo tipo de uma entre 3 distribuicoes:
Gumbel : H
I
(x) = exp{exp(x)}, x
Fr echet : H
II
(x) =
_
_
0, x 0, > 0
exp
_
x
_
, x > 0, > 0
Weibull : H
III
(x) =
_
_
exp
_
_
x
__
, x 0, < 0,
1, x > 0, < 0
onde duas distribuicoes F e F
_
exp
_
_
1 +
_
(y)
__
1/
_
, se = 0
exp
_
exp
_
_
y
___
, se = 0
, (3.1)
denida em {y : 1 (y )/ > 0}.
O conjunto de todas as distribuicoes F de uma mesma classe para as quais os maximos
normalizados tenham a mesma distribuic ao limite e chamado de domnio de atracao dessa
distribuic ao limite. A fun cao distribuic ao F pertence ao domnio de atrac ao de uma funcao
distribuic ao G se existem constantes a
n
> 0 e b
n
tal que a
1
n
(M
n
b
n
)
d
G.
3.1.1 Distribuicao de Pareto generalizada
A distribuic ao de Pareto generalizada foi desenvolvida por Pickands (1975), e se baseia
no seguinte teorema:
Teorema 2 Se X e uma variavel aleatoria com funcao distribuicao F(x), que pertence ao
domnio de atracao de uma distribuicao GEV, entao, quando u , F(x|u) = P(X
u + x|X > u), possui distribuicao GPD, possui a seguinte funcao de distribuicao
G(x|, , u) =
_
_
1
_
1 +
(xu)
_
1/
, se = 0
1 exp{(x u)/}, se = 0
, (3.2)
onde u > 0, > 0, x u 0, se 0, e 0 x u /, se < 0. O caso
= 0 e interpretado como sendo o limite quando 0, e a distribuicao exponencial
de parametro 1. Os parametros sao , e u e representam a forma, escala e limiar da
distribuicao.
A funcao de densidade da distribui cao GPD e dada por
g(x|, , u) =
_
_
1
_
1 +
(xu)
_
(1+)/
, se = 0
1
exp{(x u)/}, se = 0
, (3.3)
Abordagem Bayesiana nao-parametrica para analise de valores extremos 40
onde x u > 0 para 0 e 0 x u < / para < 0.
Pickands (1975) e Davidson e Smith (1990) mostram propriedades que justicam o
uso da GPD e provam tambem que n ao h a nenhuma outra famlia de distribui coes que
satisfaca estas propriedades. Por exemplo, estabilidade do limiar, ou seja, se Y possui
distribuic ao GPD, e se u > 0, ent ao a distribui cao de (Y u|Y > u) tambem possui
distribuic ao GPD.
Em valores extremos, alem de encontrar a estimativa dos par ametros do modelo,
tambem e muito importante encontrar uma forma para determinar os quantis altos, acima
do limiar, de tal forma que se X possui distribuicao GPD, e importante saber com qual
probabilidade ocorre um evento maior ou igual a q, ou seja, P(X > q) = 1 p.
Na distribui cao GPD, um quantil q com probabilidade P(X < q) = p e dado em
func ao dos par ametros, invertendo a funcao de distribuic ao acumulada em (3.2).
Assim, para encontrar o quantil q, basta inverter a func ao p = G(q | , , u) e obtem-se
a seguinte forma para os quantis
q =
((1 p)
1)
.
T ao importante quanto realizar a estimac ao nos par ametros, e obter as estimac oes de
quantis com p pr oximos de 1, sendo de fundamental importancia na analise de eventos
extremos, para demonstrar as vantagens de se utilizar a fun cao GPD para a cauda de
dados extremos.
3.2 Mistura de Gamas com GPD
Baseado na TVE e na distribuic ao de mistura, este captulo se baseia em uma ex-
tens ao do trabalho de Behrens et al. (2004). Neste trabalho, utiliza-se uma aproximac ao
n ao-parametrica para a distribuicao dos dados abaixo do limiar atraves de mistura de
distribuic oes Gama e GPD acima do limiar.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 41
3.2.1 Mistura no domnio de atracao da GEV
Para utilizar a distribuic ao GPD para excessos de um modelo de mistura nita de
distribuic oes Gama, e necessario mostrar que esta distribuic ao de mistura pertence ao
domnio de atra cao da distribuic ao GEV para satisfazer o Teorema de Pickands (1975).
Esta secao mostra como isto e satisfeito.
Segundo Embrechts et al. (1997), se F e uma variavel aleat oria com limite superior
x
F
, ent ao F e uma func ao von Mises se, e somente se,
lim
xx
F
F(x)f
(x)
f(x)
2
= 1, (3.4)
onde x x
F
e o limite quando x vai a x
F
pela esquerda, f
(x) = f(x)
_
1
x
_
Assim, a Equa cao (3.4) para a Gama e dada por
lim
x
(1 F(x))f(x)
_
1
x
_
f(x)
2
= lim
x
(1 F(x))
_
1
x
_
f(x)
.
Na equacao acima, o limite do numerador e do denominador vao a 0. Assim, para
encontrar o limite, aplica-se a regra de LH opital, obtendo o seguinte limite
lim
x
f(x)
_
1
x
_
+ (1 F(x))
_
1
x
2
_
_
1
x
_
f(x)
= 1 + lim
x
(1 F(x))
_
1
x
2
_
f(x)((( 1) x)/x)
= 1 + lim
x
(1 F(x)) [ 1]
f(x)(( 1)x x
2
)
.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 42
Aplicando a regra de LHopital novamente, tem-se
= 1 + lim
x
f(x)[ 1]
f(x)
_
( 1 2x) +
_
1
x
_
(( 1)x x
2
)
_
= 1.
Portanto, a distribui cao Gama e uma funcao von Mises e pertence ao domnio de
atrac ao de uma distribuic ao Gumbel. Consequentemente ela pertence tambem ao domnio
de atrac ao da distribuic ao GEV.
Para mostrar que a mistura nita de Gamas pertence ao domnio de atracao da GEV,
considere agora a seguinte proposic ao:
Proposicao 2 F e G sao equivalentes de cauda se x
F
= x
G
, e
lim
xx
F
F(x)
G(x)
= c. (3.5)
Se F e G sao equivalentes, entao pertencem ao mesmo domnio de atracao.
Seja F =
k
j=1
p
j
f
G
(x |
j
,
j
) e G = f
G
(x | , ). Assim x
F
= x
G
= . Considere
= min
j
j
e =
l
para um l tal que
l
= , ent ao
lim
x
F(x)
G(x)
= lim
x
f(x)
g(x)
= lim
x
k
j=1
p
j
f
G
(x |
j
,
j
)
f
G
(x | , )
=
k
j=1
lim
x
p
j
f
G
(x |
j
,
j
)
f
G
(x | , )
.
A razao entre duas densidades Gama e dada por
f
G
(x |
j
,
j
)
f
G
(x | , )
=
()
j
j
x
j
1
e
j
x
(
j
)
x
1
e
x
= cx
e
(
j
)x
. (3.6)
O limite da raz ao em (3.6) vai para 0 se
j
> . Assim,
k
j=1
lim
x
p
j
f
G
(x |
j
,
j
)
f
G
(x | , )
=
k
j=1
p
j
lim
x
f(x |
j
,
j
)
f(x | , )
= p
k
,
onde k e a componente na mistura onde
k
= min
j
j
Assim, a densidade da mistura de Gamas e equivalente de cauda a uma unica Gama,
que pertence ao domnio de atracao da distribuicao Gumbel. Deste modo, a mistura
nita de distribuic oes Gama pertence ao domnio de atrac ao da distribuic ao GEV, sendo
possvel analisar os valores maiores que um determinado limiar a partir da distribuic ao
GPD, pois satisfaz o Teorema proposto por Pickands (1975).
Abordagem Bayesiana nao-parametrica para analise de valores extremos 43
3.2.2 Modelo
Seja g a func ao densidade da distribuic ao GPD como em (3.2). Portanto, a func ao
densidade do modelo e de mistura de Gamas com cauda GPD e dado por
f(x|, p, ) =
_
k
j=1
p
j
f
G
(x|
j
), se x u
_
1
k
j=1
p
j
F
G
(u|
j
)
_
g(x|), se x > u
(3.7)
onde F
G
(. | ) e a funcao de distribuic ao da Gama, = (, , u), p = (p
1
, . . . , p
k
),
= (
1
, . . . ,
k
),
j
= (
j
,
j
), j = 1, . . . , k, > 0, (x u) / se < 0 e x > u. Os
dados exibem um comportamento de cauda pesada se > 0.
Neste modelo, os par ametros sao = (, p, ) e o modelo de mistura de Gamas com
GPD ser a denotado por MGPD
k
(, p, , , u), ou simplesmente MGPD
k
, quando nao
houver a necessidade de explicitar os parametros.
Uma primeira vantagem do modelo MGPD
k
em rela cao ao metodo totalmente n ao-
parametrico baseado no modelo MG
k
, e tornar possvel encontrar diretamente um quantil
alto da distribuicao. No modelo de distribuic ao de mistura, um quantil q tal que P(X <
q) = p e dado a partir da invers ao da func ao de distribuicao acumulada em q, dada por
p = H(q | , , p) =
k
j=1
p
j
F
G
(q |
j
,
j
). (3.8)
Porem, n ao e possvel encontrar (3.8) em func ao de q diretamente, sendo necess ario
fazer uma grade de valores possveis de q e observando qual deles apresenta uma proba-
bilidade mais pr oxima ao p de (3.8).
No modelo MGPD
k
, para estimar um quantil maior que o limiar, encontra-se q em
func ao dos parametros do modelo, pois, para x > u, baseado na funcao distribuic ao do
modelo MGPD
k
,
F(x | , , p, ) = H(u | , , p) + [1 H(u | , , p)] G(x|),
e possvel isolar o quantil q em func ao dos par ametros e de p, obtendo a seguinte forma
q =
((1 p)
1)
, (3.9)
Abordagem Bayesiana nao-parametrica para analise de valores extremos 44
onde
p =
p H(u | , , p)
1 H(u | , , p)
.
Assim, alem da facilidade dos calculos, pelo fato da distribuic ao GPD ser na teoria a
distribuic ao verdadeira para cauda de dados extremos, espera-se que os quantis estimados
do modelo MGPD
k
sejam mais proximos dos quantis verdadeiros que os do modelo MG
k
.
3.2.3 Distribuicao a priori
Para realizar a abordagem Bayesiana e encontrar a distribui cao a posteriori dos par a-
metros, e necessario elicitar quais sao as distribuic oes a priori para cada parametro. Para
os par ametros dos valores abaixo da cauda (, p), foram escolhidas distribuic oes a priori
da mesma famlia que a do Captulo 2, ou seja, Gama para
j
, Gama Inversa para
j
e
Dirichlet para o vetor de pesos p, com restri cao de identicabilidade para o vetor
j
s.
Para o limiar, foi tomada uma priori Normal, mas sem utilizar a condic ao de trunca-
mento como em Behrens et al.(2004). Porem, n ao e possvel utilizar uma priori completa-
mente vaga para este parametro. Os resultados de simula coes e nas aplicacoes realizadas
neste trabalho ir ao mostrar as diculdades na estimac ao do limiar ao considerar uma
distribuic ao a priori com uma variancia relativamente alta.
Para os parametros da cauda, Coles e Tawn (1996) sugerem expressar a priori em
func ao de quantis conhecidos da distribui cao dos dados. Seguindo outro caminho,
Castellanos e Cabras (2007) utilizaram uma priori de Jereys para estes parametros,
prescindindo de suposi coes iniciais. A priori de Jereys para (, | u) e dada por
(, | u)
1
(1 + )
1
(1 + 2)
1/2
, > 0, 5, > 0. (3.10)
Castellanos e Cabras (2007) mostraram que, para o caso da distribuic ao GPD, a priori
de Jereys ir a resultar numa distribui cao a posteriori que e pr opria.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 45
3.2.4 Distribuicao a posteriori
A funcao de verossimilhanca do modelo MGPD
k
e dada por
L(, p, u, , |x) =
i:x
i
<u
_
_
k
j=1
p
j
f
G
(x
i
|
j
)
_
_
i:x
i
>u
_
_
_
_
1
k
j=1
p
j
F
G
(u|
j
)
_
_
g(x
i
|, , u)
_
_
. (3.11)
Dadas a distribuic ao a priori e a funcao de verossimilhanca, encontra-se a seguinte
forma para o logaritmo da funcao de densidade da distribui cao a posteriori
log (, p, |x) = k +
i:x
i
u
_
_
log
_
_
k
j=1
p
j
f
G
(x
i
|
j
,
j
)
_
_
_
_
+
i:x
i
u
log
_
_
1
k
j=1
p
j
F
G
(u|
j
,
j
)
_
_
i:x
i
u
_
log()
1 +
log
_
1 +
(x
i
u)
__
+
k
j=1
[(a
j
1) log() b
j
j
(c
j
+ 1) log() d
j
/
j
]
1
2
_
u
u
u
_
2
log() log(1 + ) (1/2) log(1 + 2). (3.12)
N ao existe forma fechada da distribui cao a posteriori, e nenhum parametro possui
distribuic ao condicional completa conhecida. Assim, todos os par ametros do modelo
ter ao que ser estimados pelo algoritmo de Gibbs por passos de Metropolis. Ao contrario
de quando ha uma simples mistura de distribuicoes Gama, no caso da mistura do GPD com
limiar desconhecido, n ao e possvel aplicar vari aveis latentes que sejam vantajosas para
a implementac ao do algoritmo, como na Sec ao 2.2, pois mesmo inserindo estas vari aveis,
n ao e possvel encontrar uma forma conhecida para a distribuicao a posteriori de cada
par ametro.
Alem disso, tambem foi imposta a restric ao na media das distribui coes das compo-
nentes de mistura, como no Captulo 2. O algoritmo para o modelo deste captulo e dado
no Apendice 3.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 46
3.3 Caracterizacao de excessos via processos pontu-
ais
Existem diferentes caminhos para caracterizar o comportamento de valores extremos
de um processo, e uma maneira particular de fazer esta caracterizac ao e derivada da teoria
de processos pontuais. Todas as inferencias feitas usando a metodologia de processos
pontuais podem ser igualmente obtidas utilizando o modelo proposto. A principal raz ao
para considerar esta abordagem e que ela fornece uma interpretac ao de valores extremos
que unica todos os modelos introduzidos anteriormente.
3.3.1 Teoria basica de processos pontuais
Um processo pontual em um conjunto A e uma regra estoc astica para a ocorrencia e
posic ao de pontos, onde A representa um perodo de tempo, que pode ser utilizado para
descrever a ocorrencia de furac oes ou terremotos, por exemplo. A probabilidade de um
certo n umero de eventos em um perodo de tempo pode ser calculada, alem do tempo
de espera entre dois eventos. Um conjunto A tambem pode ser multidimensional. Por
exemplo, um processo pontual bi-dimensional pode ser usado para descrever a posic ao de
trincos em um prato de vidro.
Um caminho para caracterizar as propriedades estatsticas de um processo pontual e
denir um conjunto de vari aveis aleat orias inteiras n ao-negativas, N(A), tal que N(A) e
o n umero de pontos em um conjunto A, onde A A. A distribuic ao de probabilidade
de cada N(A) determina as caractersticas do processo pontual, que pode ser chamado
de N. Algumas caractersticas importantes podem ser denidas. Em particular, (A) =
E(N(A)) e o n umero esperado de pontos no conjunto A, e e denido pela medida de
intensidade do processo. Se A = [a
1
, x
1
] . . . [a
k
, x
k
] R
k
, a fun cao derivada
(x) =
d(A)
dx
1
. . . dx
k
e a func ao intensidade do processo. O processo pontual can onico e o processo de Poisson
Abordagem Bayesiana nao-parametrica para analise de valores extremos 47
homogeneo unidimensional. Com > 0, o processo em A R satisfaz
1. para todo A = [t
1
, t
2
] A, N(A) Poisson((t
2
t
1
))
2. para todos os conjuntos disjuntos A e B de A, N(A) e N(B) sao independentes.
O processo de Poisson e o modelo estoc astico apropriado para pontos que ocorrem
sem nenhuma regra especca no tempo. A medida de intensidade correspondente e
([t
1
, t
2
]) = (t
2
t
1
) e a func ao de intensidade e dada por .
Para explicar processos pontuais como uma representac ao para valores extremos, e
necess aria uma ideia de convergencia que e an aloga a convergencia de variaveis aleat orias.
Denicao: Seja N
1
, N
2
, ... uma sequencia de processos pontuais em A. A sequencia e
dita ter convergencia em distribuicao para N, denotada por
N
n
d
N,
se, para todas as escolhas de m e para todos os conjuntos fechados A
1
, ..., A
m
tal que
P(N(dA
j
) = 0) = 1, j = 1, . . . , m, onde dA
j
e a fronteira de A, a distribuicao conjunta
de (N
n
(A
1
), . . . , N
n
(A
m
)) converge em distribuicao para (N(A
1
), . . . , N(A
m
)).
3.3.2 Processo de Poisson para extremos
Seja X
1
, X
2
, ... uma serie de vari aveis aleatorias iid com func ao de distribuic ao F. Seja
M
n
= max{X
1
, . . . , X
n
} sequencias com constantes {a
n
> 0} e {b
n
> 0} tais que
P((M
n
a
n
)/b
n
z) H(z | , , ),
onde H(z | , , ), e a func ao de distribuicao GEV dada em (3.1). Ent ao, dene-se uma
sequencia de processos pontuais N
n
em R
2
por
N
n
= {(i/(n + 1), (X
i
b
n
)/a
n
) : i = 1, . . . , n}.
A escala da primeira coordenada assegura que esta estar a sempre no intervalo (0, 1).
A segunda coordenada estabelece o comportamento dos excessos quanto n . Um
resultado fundamental e dado pelo teorema a seguir, que pode ser visto em Coles (2001).
Abordagem Bayesiana nao-parametrica para analise de valores extremos 48
Teorema 3 Seja X
1
, X
2
, . . . uma sequencia de variaveis aleatorias iid nas quais existem
sequencias {a
n
> 0} e {b
n
} tais que
P((M
n
a
n
)/b
n
z) H(z | , , ),
e seja z
e z
+
os limites superior e inferior de H respectivamente. Entao, a sequencia de
processos pontuais
N
n
= {(i/(n + 1), (X
i
b
n
)/a
n
) : i = 1, . . . , n}
em regioes da forma (0, 1) [u, ), para qualquer u > z
_
1 +
x
_
1/
_
_
_
e entao, pela homogeneidade do processo de Poisson,
(A) =
_
1 +
_
x
__
1/
. (3.13)
3.3.3 Verossimilhanca dos excessos do limiar
Seja X
1
, . . . , X
n
vari aveis aleatorias independentes e identicamente distribudas. A
distribuic ao dos excessos acima de um limiar possui uma distribuic ao GPD. Sem perda
de generalidade, suponha tambem que a serie X
1
, . . . , X
n
corresponde a um ano de ob-
serva coes. Originalmente, a verossimilhanca do modelo de excessos ignora X
i
menores
do que u. Primeiro, pode-se incluir uma informa cao parcial destas observa coes. Seja
= P(X
i
> u), tal que, por Coles (2001), pode ser aproximado por
1
n
_
1 +
_
u
__
,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 49
onde (, , ) s ao os par ametros da distribuic ao dos m aximos anuais que possui dis-
tribuic ao GEV.
A contribuic ao para um X
i
que nao excede u e dada por P(X
i
< u) = 1 .
Para um X
i
que excede u, a contribuicao da verossimilhanca e dada por
P(X
i
= x, X
i
> u) = P(X
i
> u)f(x | X
i
> u) = g(x | ),
onde = (, , u) sao os parametros da distribuic ao GPD, com densidade g.
Assim, a fun cao de verossimilhanca e dada por
(1 )
nnu
nu
i=1
g(x
i
| ),
onde n e o n umero total de pontos e n
u
e o n umero de pontos acima do limiar u
Tancredi et al. (2006) formula um modelo que modica a contribui cao em um X
i
que
n ao excede u, dada por
P(X
i
= x, X
i
< u) = P(X
i
< u)f(x | X
i
< u) = (1 )h
T
(x | ),
onde h
T
(x | ) e uma mistura de densidades Uniformes.
Tancredi et al. (2006) escreve a densidade do modelo da seguinte maneira
f
T
(x|, ) =
_
_
(1 )h
T
(x | ), se x u
g(x|), se x > u.
Assim, a fun cao de verossimilhanca e dada por
x
i
<u
[(1 )h
T
(x
i
| )]
x
i
>u
[g(x
i
| )] .
No modelo MGPD
k
proposto neste trabalho, a densidade em (3.7) pode ser escrita
tambem como
f(x|, p, ) =
_
_
(1 P(x > u))
h(x|,,p)
H(u|,,p)
, se x u
P(x < u)g(x|), se x > u
, (3.14)
onde h e H s ao respectivamente as func oes densidade e acumulada de mistura de Gamas e
g e a densidade da distribuic ao GPD. Note que, pela maneira como e formulado o modelo
MGPD
k
, P(X
i
> u) nao e aproximado por e sim e igual a (1 H(u | )).
Abordagem Bayesiana nao-parametrica para analise de valores extremos 50
Desta maneira, a contribuic ao para um x que n ao excede u e escrita da seguinte
maneira
P(X
i
= x, X
i
< u) = P(X
i
< u)f(x | X
i
< u) = H(u | , p)
h(x | )
H(u | , p)
= h(x | , p),
e, para x que excede u
P(X
i
= x, X
i
> u) = P(X
i
> u)f(x | X
i
> u) = (1 H(u | , p))g(x | ).
Assim, tem-se a mesma forma da func ao de verossimilhanca dada por
x
i
<u
[h(x | , p)]
x
i
>u
[(1 H(u | , p))g(x | )] ,
que e a mesma verossimilhanca em (3.11).
3.4 Simulac oes
Para demonstrar a eciencia do metodo, foram simulados pontos de uma distribuic ao
de mistura. Foram simuladas amostras de tamanho 1000 e 10000 de mistura de duas
Gamas com os mesmos par ametros das simulac oes da Se cao 2.10, ou seja, = (2; 8),
= (4; 8) e p = (0, 66; 0, 33). Apos simular as observac oes, toma-se um percentil dos da-
dos como sendo o valor u do limiar destas distribuic oes. Foram feitas simula coes tomando
o limiar no percentil 90 das simulac oes. Na simulac ao, todas as observacoes que ul-
trapassaram o limiar foram removidas, gerando no lugar dessas observac oes pontos da
distribuic ao GPD com o limiar no percentil 90, e com diversos valores nos par ametros da
cauda, onde = (2; 3; 5) e = (0, 4; 0, 4). Em cada simula cao, foi feita a modelagem
considerando k = 1, 2 ou 3 componentes na mistura para as observac oes antes da cauda.
A variac ao destes par ametros tem os seguintes objetivos:
Variando o tamanho da amostra: vericar como o n umero de observacoes acima da
cauda ir a interferir na estimac ao do limiar e dos parametros acima dele. Poucas
observacoes podem dicultar a estimac ao da cauda, pois como o limiar esta no
quantil 90, cerca de apenas 10% das observa coes fazem parte da cauda.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 51
Variando : vericar se o grau de diculdade da estimac ao muda de acordo com
o peso da cauda( positivo cauda pesada, negativo cauda leve). O valor
0, 4 foi escolhido para vericar como se comporta a estimac ao do parametro
para valores pr oximos do limite onde este parametro possui uma forma regular no
estimador de m axima verossimilhanca ( > 0, 5).
Variando : vericar o quanto o tamanho e dire cao do salto no limiar entre a
distribuic ao de mistura e a GPD interfere na estima cao do limiar e dos par ametros
da cauda.
Variando k: vericar se o n umero de componentes utilizado na mistura ira interferir
na estimac ao do limiar e dos par ametros da cauda.
Alem de comparar o modelo MGPD
k
com diversos valores de k, foi comparado
tambem o modelo MG
k
, para vericar com qual eciencia o modelo MG
k
consegue esti-
mar a densidade de distribui coes na cauda. Para comparar gracamente com os modelos
MGPD
k
, sera apresentado o modelo MG
k
que apresentar o melhor BIC e DIC.
Para aplicar a tecnica MCMC, foram feitas cadeias com 30 mil iterac oes, onde foi
considerado um burn-in de 10 mil e coletadas uma amostra a cada 10.
A distribuicao a priori para as componentes de mistura s ao as mesmas do Captulo
2. Para os par ametros da cauda, e utilizada a priori de Jereys vista em (3.10). Em
relac ao ao limiar, para n = 10000, foi dada como distribuic ao a priori uma N(u
0
, 100),
onde u
0
= u. Para amostras de tamanho n = 1000, houve diculdade na estimac ao do
limiar quando se utilizou a mesma distribui cao a priori.
A Figura 3.1 mostra a diculdade de estima cao do limiar quando a vari ancia e 100,
onde a media a posteriori do limiar foi para o nal dos dados, muito longe do verdadeiro
valor do limiar utilizado na simulac ao. A vari ancia teve que ser diminuda para 1 a m de
obter uma boa estimac ao do limiar. Com esta priori, a probabilidade do limiar ser menor
que 8 ou maior que 12 e de 95%.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 52
Figura 3.1: Densidade preditiva para dados simulados com = 0, 4, k = 2 = 2, n = 1000
e limiar no valor 9,24.
Linha cheia - distribuicao verdadeira; tracejada: estima cao com priori do limiar com variancia
1; pontilhada: estima cao com priori do limiar com variancia 100. As linhas verticais
representam a media a posteriori do limiar.
Simulacao com = 2
=0,4
A Figuras 3.2 e 3.3 mostram a densidade preditiva para amostras de tamanho 1000
e 10000 para o modelo MGPD
k
com k=1, 2 e 3, alem do modelo MG
k
com melhor
BIC e DIC na classe dos modelos s o com mistura, de acordo com a Tabela 3.1. Com
excec ao do modelo MGPD
1
, as densidades preditivas est ao quase sobrepostas `a verdadeira
densidade, n ao tendo praticamente diferenca para a estimacao entre MGPD
2
ou MGPD
3
.
Ampliando as guras das distribui coes preditivas na cauda, percebe-se que tanto para
n = 1000 quanto para n = 10000, os modelos MG
k
tem maiores diculdades em predizer
a densidade nesta regi ao do que para os modelos MGPD
k
, k > 1, principalmente nos
valores pr oximos do limiar. Nos modelos MGPD
2
e MGPD
3
, para n = 10000, a predic ao
Abordagem Bayesiana nao-parametrica para analise de valores extremos 53
foi mais precisa do que para n = 1000, na regiao em torno do limiar.
Figura 3.2: Densidade preditiva para = 2, = 0, 4 e n = 1000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Figura 3.3: Densidade preditiva para = 2, = 0, 4 e n = 10000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
A semelhanca entre os modelos tambem pode ser visto nos parametros da cauda do
modelo MGPD
k
, onde o histograma da distribuicao a posteriori (Figuras 3.4 e 3.5) sao
praticamente os mesmos para k = 1, k = 2 ou k = 3. Isto ocorre pois, para diferentes
n umeros de componentes, os valores no limiar foram proximos. Com relac ao ao tamanho
da amostra, percebe-se que a modelagem com n = 10000 fornece resultados mais precisos
do que n = 1000, com a densidade preditiva proxima da verdadeira densidade, e com
menor variabilidade nos parametros da cauda, como pode ser observado na Figura 3.5.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 54
Figura 3.4: Histograma da posteriori dos par ametros da cauda para = 2, = 0, 4 e
n = 1000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
Assim como no Captulo 2, no modelo MGPD
k
, quando k
est
> k
sim
, os pesos em
excesso v ao para 0 e o n umero de pesos que sao signicativamente diferentes de 0 e igual
a k
sim
, como pode-se ver na Figura 3.6, onde um dos pesos do modelo com k
est
= 3
estaciona em torno de 0 e os outros dois pesos convergem para uma distribui cao igual aos
pesos do modelo com k
est
= 2.
=-0,4
Observando as densidades preditivas (Figuras 3.7 e 3.8), assim como o histograma dos
par ametros da cauda (Figuras 3.9 e 3.10), nos modelos MGPD
k
os valores para k = 2
e k = 3 s ao pr oximos, sendo que a densidade que difere signicativamente da verdadeira
distribuic ao apenas para k = 1. Aqui, mesmo para uma componente, a estimacao do
Abordagem Bayesiana nao-parametrica para analise de valores extremos 55
Figura 3.5: Histograma da posteriori dos par ametros da cauda para = 2, = 0, 4 e
n = 10000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
limiar e muito proxima em relacao ao resultado obtido das outras componentes quando
n = 10000. Observando a parte b das Figuras 3.7 e 3.8, verica-se que o modelo MGPD
2
,
no caso de n = 10000, a estimac ao parece ser mais eciente para a cauda do que os modelos
da classe MG
k
. Alem disso, para n = 10000, percebe-se que a estimacao pelo modelo
MGPD
2
detecta o salto da distribuic ao no limiar.
Foram calculadas as medidas de ajuste BIC e DIC, para os diversos modelos utilizados.
Pela Tabela 3.1, para n = 10000, os menores BIC e DIC foram aqueles do modelo utilizado
na simulacao, ou seja, o modelo MGPD
2
. Para n = 1000, em duas situa coes o melhor
modelo apontado foram os da classe MG
k
, enquanto que nas outras duas congurac oes o
melhor modelo foi o MGPD
2
.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 56
Figura 3.6: Serie dos pesos para = 2, = 0, 4 e n = 10000.
A esquerda o modelo MGPD
2
e `a direita o modelo MGPD
3
.
Figura 3.7: Densidade preditiva para = 2, = 0, 4 e n = 1000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Simulacao com = 3
=0,4
A Figuras 3.11 e 3.12 mostram a densidade preditiva com n = 1000 e n = 10000 para
o modelo MGPD
k
, com k=1, 2 e 3, alem do melhor modelo MG
k
segundo o BIC e DIC
(Tabela 3.2). Com excec ao do modelo MGPD
1
, as densidades apresentam um bom ajuste
Abordagem Bayesiana nao-parametrica para analise de valores extremos 57
Figura 3.8: Densidade preditiva para = 2, = 0, 4 e n = 10000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Figura 3.9: Histograma da posteriori dos parametros da cauda para = 2, = 0, 4 e
n = 1000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 58
Figura 3.10: Histograma da posteriori dos parametros da cauda para = 2, = 0, 4 e
n = 10000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
em rela cao ` a verdadeira densidade na parte central dos dados, como mostra a parte a das
guras.
Pelas Figuras 3.13 e 3.14 do histograma dos par ametros da cauda do modelo MGPD
k
,
o n umero de componentes da mistura parece ter pouca inuencia na estima cao da cauda
para n = 1000. A simulac ao com =3 e a que apresenta o menor salto no limiar, prati-
camente nao tendo descontinuidade. Isto diculta na estimac ao do limiar, que pelo his-
tograma da Figura 3.14 tem uma distribuic ao bimodal, onde a segunda moda est a em
torno do valor verdadeiro do limiar e a primeira um pouco antes.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 59
Tabela 3.1: Medidas de ajuste para =2.
Modelo Pd DIC BIC Pd DIC BIC
n=1000 n=10000
= 0, 4
MGPD
1
0,77 4653,7 4691,5 2,09 46817 46857
MGPD
2
6,79 4468,2 4542,5 7,77 44718 44814
MGPD
3
6,50 4469,1 4563,1 4,61 44727 44842
MG
3
7,70 4466,6 4543,9 7,68 44734 44859
= 0, 4
MGPD
1
2,85 4388,9 4435,3 5,71 45372 45440
MGPD
2
6,77 4345,5 4421,7 8,65 43171 43272
MGPD
3
6,61 4345,8 4442,3 8,57 43172 43300
MG
2
5,18 4366,1 4418,1 8,94 43211 43368
* Modelo MG
k
com menor BIC e DIC.
Figura 3.11: Densidade preditiva para = 3, = 0, 4 e n = 1000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
=-0,4
As Figuras 3.15 e 3.16 da distribuic ao preditiva apresentam um bom ajuste para todos
Abordagem Bayesiana nao-parametrica para analise de valores extremos 60
Figura 3.12: Densidade preditiva para = 3, = 0, 4 e n = 10000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Figura 3.13: Histograma da posteriori dos par ametros da cauda para = 3, = 0, 4 e
n = 1000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 61
Figura 3.14: Histograma da posteriori dos par ametros da cauda em = 3, = 0, 4 e
n = 10000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
os modelos, com excecao do modelo MGPD
1
, como mostra a parte a de ambas as guras.
Percebe-se que a estima cao pelo modelo MGPD
k
e melhor que os modelos MG
k
na cauda
da distribuic ao, como mostra a parte b das guras.
Para cada modelagem de = 3, foram calculadas as medidas de ajuste BIC e DIC.
Pela Tabela 3.2, assim como na tabela de = 2, os menores valores do BIC e DIC
ocorrem exatamente no modelo verdadeiro simulado, o MGPD
2
. A unica exce cao e
quando = 0, 4 e n = 1000, onde o melhor modelo foi o MG
2
.
Simulacao com = 5
Abordagem Bayesiana nao-parametrica para analise de valores extremos 62
Figura 3.15: Densidade preditiva para = 3, = 0, 4 e n = 1000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Figura 3.16: Densidade preditiva para = 3, = 0, 4 e n = 10000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
=0,4
As Figuras 3.17 e 3.18 mostram a distribuic ao preditiva do modelo com diferentes
componentes na mistura para n = 1000 e n = 10000. Percebe-se que, para n = 10000, as
densidades preditivas cam mais pr oximas da verdadeira densidade do que para n = 1000,
com excecao do modelo MGPD
1
, que cou longe da verdadeira densidade em ambos os
casos. A regiao pr oxima do limiar e a unica em que o melhor modelo da classe MG
k
Abordagem Bayesiana nao-parametrica para analise de valores extremos 63
Tabela 3.2: Medidas de ajuste para =3.
Modelo Pd DIC BIC Pd DIC BIC
n=1000 n=10000
= 0, 4
MGPD
1
3,61 4603,9 4648,1 2,04 47610 47665
MGPD
2
7,81 4547,1 4624,6 5,68 45530 45621
MGPD
3
7,83 4547,4 4645,4 4,27 45534 45649
MG
3
7,41 4552,2 4628,4 7,17 45560 45656
= 0, 4
MGPD
1
3,56 4462,7 4510,1 1,79 44416 44467
MGPD
2
6,53 4426,3 4501,9 7,51 43986 44083
MGPD
3
6,76 4425,7 4522,6 4,32 43997 44112
MG
2
5,27 4440,9 4493,1 4,79 44064 44129
* Modelo MG
k
com menor BIC e DIC.
ca distante da verdadeira densidade, como percebe-se na parte b das Figuras 3.17 e
3.18, enquanto que para k > 1, considerando o modelo MGPD
k
, a estimacao parece ser
precisa em toda a cauda. Para n = 10000, o modelo MGPD
2
consegue detectar o salto
da distribuic ao no limiar.
As Figuras 3.19 e 3.20 mostram o histograma da posteriori dos par ametros da cauda.
Observando os histogramas, para n = 10000, as distribuic oes parecem ser similares, in-
dependente do n umero de componentes na mistura, enquanto que, para n = 1000 isto so
acontece entre k = 2 e k = 3, pois para k = 1 a distribuicao antes da cauda e diferente e
isto leva a uma estimac ao de valores diferentes para o limiar, implicando em uma outra
distribuic ao para a cauda.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 64
Figura 3.17: Densidade preditiva para = 5, = 0, 4 e n = 1000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Figura 3.18: Densidade preditiva para = 5, = 0, 4 e n = 10000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
=-0,4
As Figuras 3.21 e 3.22 mostram a diculdade do modelo MG
k
em estimar o incio da
cauda da distribuicao. Com relacao ao modelo MGPD
k
, percebe-se que, para n = 10000
a estimac ao se mostra eciente na cauda, enquanto que, para n = 1000, a densidade
preditiva dos modelos MGPD
k
tem uma maior diculdade de acompanhar a distribuicao
a partir do salto no limiar, como mostra a parte b da Figura 3.21.
Outro fator interessante relacionado ao salto no limiar e que a predic ao nos saltos foi
mais precisa quando o salto e para baixo do que quando e para cima, como se observa nos
Abordagem Bayesiana nao-parametrica para analise de valores extremos 65
Figura 3.19: Histograma da posteriori dos par ametros da cauda para = 5, = 0, 4 e
n = 1000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
gr acos das distribuic oes preditivas quando = 2 (salto para cima) e = 5 (salto para
baixo). O tamanho da amostra tambem interfere da detec cao deste salto. Para n = 1000,
em todos os casos houve diculdade de encontrar o salto no limiar.
A Tabela 3.3 apresenta BIC e DIC para = 5. Pela tabela, percebe-se as mesmas
caractersticas das duas tabelas anteriores. Para amostras de tamanho 1000, o BIC
mostrou ser uma boa medida de comparac ao de modelos, enquanto que para n = 10000,
tanto BIC quanto o DIC mostraram-se boas medidas, pois detectaram como melhor mod-
elo aquele utilizado na simulac ao, ou seja, o MGPD
2
.
3.4.1 Calculo dos quantis
Alem de encontrar as medidas de ajuste, como o interesse principal deste trabalho e
Abordagem Bayesiana nao-parametrica para analise de valores extremos 66
Figura 3.20: Histograma da posteriori dos par ametros da cauda em = 5, = 0, 4 e
n = 10000.
As linhas representam o n umero de componentes k=1, 2 e 3, e as colunas sao os parametros da
cauda u, e , nesta ordem. As linhas verticais sao os valores verdadeiros simulados.
Figura 3.21: Densidade preditiva para = 5, = 0, 4 e n = 1000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 67
Figura 3.22: Densidade preditiva para = 5, = 0, 4 e n = 10000.
No painel ` a esquerda, o unico modelo distante da curva verdadeira e com k
est
= 1.
a) Densidade Preditiva. b) Densidade da cauda.
Tabela 3.3: Medidas de ajuste para =5.
Modelo Pd DIC BIC Pd DIC BIC
n=1000 n=10000
= 0, 4
MGPD
1
-5,89 4741,8 4746,3 6,55 48621 48691
MGPD
2
4,70 4660,6 4728,1 7,20 46548 46644
MGPD
3
4,17 4662,5 4749,3 7,07 46548 46671
MG
3
2,68 4684,8 4742,3 9,98 46594 46753
= 0, 4
MGPD
1
-140,22 5119,9 4694,4 3,06 47215 47275
MGPD
2
8,81 4522,6 4603,8 7,80 45008 45106
MGPD
3
9,03 4522,1 4624,6 7,57 45009 45133
MG
2
5,12 4556,0 4607,9 6,81 45057 45181
* Modelo MG
k
com menor BIC e DIC.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 68
analisar dados extremos, tambem foram calculados os quantis altos dos modelos MG
k
,
MGPD
k
, e do quantil emprico. Estes quantis foram comparados com os verdadeiros.
A Tabela 3.4 mostra os resultados dos quantis para as simulac oes com = 0, 4 dos
modelos MGPD
k
e do MG
k
com melhores medidas de ajuste BIC e DIC. Percebe-se
que quando n = 1000, nenhum metodo parece levar vantagem, pois das 12 situa coes
com este tamanho de amostra, em 5 a estimacao mais pr oximas do quantil verdadeiro
foram obtidos a partir da abordagem emprica, enquanto que em 4 foram obtidos dos
modelos MGPD
k
e 3 dos modelos MG
k
. Para n = 10000, a estimac ao dos quantis pelo
modelo MGPD
k
mostrou-se mais eciente que os outros metodos, cando mais pr oximo
do quantil verdadeiro em 8 das 12 situa coes apresentadas na tabela.
Tabela 3.4: Quantis das simulac oes para = 0, 4.
Prob V E 1 2 3 MG
k
V E 1 2 3 MG
k
n=1000 n=10000
= 2
0,95 10,44 10,49 9,99 10,41 10,41 10,48 10,68 10,70 9,99 10,68 10,67 10,75
0,99 16,41 15,13 15,01 15,98 15,98 15,16 16,64 16,43 15,17 16,39 16,40 16,51
0,999 35,41 33,82 42,80 44,44 46,19 37,25 35,62 32,01 30,37 33,59 33,77 32,48
0,9999 83,09 53,98 5949,99 710,34 516,75 65,23 83,32 59,99 65,49 74,57 75,49 47,73
= 3
0,95 11,24 11,30 12,49 11,04 11,04 11,15 11,48 11,51 10,38 11,41 11,41 11,36
0,99 20,19 18,27 20,01 19,81 19,93 19,04 20,41 20,09 18,01 19,96 19,92 21,37
0,999 48,67 46,30 35,90 54,31 56,77 48,84 48,90 43,47 42,27 47,18 46,71 41,21
0,9999 120,21 76,75 54,85 183,3 209,8 85,00 120,45 85,44 103,65 116,24 113,67 60,35
= 5
0,95 12,84 12,94 13,77 12,45 12,42 12,44 13,07 13,14 11,37 13,02 13,04 12,76
0,99 27,75 24,56 25,99 27,36 27,55 29,03 27,98 27,44 24,22 27,27 27,29 29,67
0,999 75,22 71,27 53,52 92,13 96,11 64,42 75,45 66,41 63,22 70,97 70,80 53,72
0,9999 194,46 121,68 100,76 363,03 402,87 109,57 194,69 136,34 156,98 177,13 176,11 77,47
Prob=P(X q), V V erdadeiro, E Emprico, 1MGPD
1
, 2-MGPD
2
, 3-MGPD
3
,MG
k
-Melhor MG, segundo DIC
Comparando apenas os metodos MG
k
contra os metodos MGPD
k
, para n = 1000
em metade das situacoes o modelo MG
k
esteve mais perto do quantil verdadeiro que
Abordagem Bayesiana nao-parametrica para analise de valores extremos 69
o modelo MGPD
k
. Para n = 10000, em 11 das 12 comparacoes da tabela o modelo
MGPD
k
estimou um quantil mais pr oximo do verdadeiro do que o modelo MG
k
. Estes
resultados mostram que e importante estimar a cauda por uma distribuic ao GPD, pois
ela e mais eciente na detecc ao de altos quantis dos dados do que uma aproximac ao
n ao-parametrica para a cauda por mistura.
3.5 Identicacao dos parametros da cauda
Um problema relacionado a distribuic ao GPDe a correlacao entre o limiar e o parametro
da cauda . Se o limiar e alterado para u
= +(u
|
(s)
N(
(s)
, V
)I(
(s)
(M u
(s)
), ),
onde V
(j+1)
=
com probabilidade
, onde
= min
_
_
_
1,
(
|x)((
(s)
+
(s)
/(M u
(s)
)/
_
V
))
(
|x)((
+
(s)
/(M u
(s)
)/
_
V
))
_
_
_
,
= (
(s)
,
(s)
, p
(s)
, u
(s)
,
(s)
,
) e
= (
(s)
,
(s)
, p
(s)
, u
(s)
,
(s)
,
(s)
).
Abordagem Bayesiana nao-parametrica para analise de valores extremos 88
Amostrando
Se
(s+1)
> 0, entao
), onde V
e amostrado de uma
N(
(s)
, V
)I(
(s+1)
(M u
(s)
), )
Alem disso,
(s+1)
=
com probabilidade
onde, se
(s+1)
< 0
= min
_
1,
(
|x)((
(s)
+
(s+1)
(M u
(s)
)/
))
(
|x)((
+
(s+1)
(M u
(s)
)/
))
_
,
e se
(s+1)
> 0
= min
_
1,
(
|x)f
G
(
(s)
|
(s)
,
(s)
2
/V
)
(
|x)f
G
(
,
2
/V
)
,
_
onde
= (
(s)
,
(s)
, p
(s)
, u
(s)
,
,
(s+1)
) e
= (
(s)
,
(s)
, p
(s)
, u
(s)
,
(s)
,
(s+1)
).
Amostrando u
O valor do limiar u
com probabilidade
u
, onde
u
= min
_
1,
(
|x)((u
(s)
a
(s+1)
)/
V
u
)
(
|x)((u
a
(s+1)
)/
V
u
)
_
,
= (
(s)
,
(s)
, p
(s)
, u
,
(s+1)
,
(s+1)
) e
= (
(s)
,
(s)
, p
(s)
, u
(s)
,
(s+1)
,
(s+1)
).
Amostrando , , p
Para amostrar os vetores , e p, o procedimento e igual ao Algoritmo 1 do Captulo
2. Porem, o que muda no algoritmo deste captulo e a distribuic ao da posteriori
e utiliza-se os valores atualizados
(s+1)
,
(s+1)
, u
(s+1)
dos par ametros da cauda da
distribuic ao. As amostragens s ao feitas da seguinte maneira
Abordagem Bayesiana nao-parametrica para analise de valores extremos 89
a) Amostrando
j
e
j
j
e
j
s ao gerados utilizando as mesmas distribuic oes propostas no Algoritmo 1.
Os valores
(s+1)
j
=
j
e
(s+1)
j
=
j
s ao aceitos com probabilidade
j
,
j
onde
j,j
= min
_
1,
(
|x)f
G
(
(s)
j
|
j
,
j
/V
)f
G
(
(s)
j
|
j
,
j
/V
)I
R
()
(
|x)f
G
(
j
|
(s)
j
,
(s)
j
/V
)f
G
(
j
|
(s)
j
,
(s)
j
/V
)I
R
()
_
,
= (
(s+1)
<j
,
j
,
(s)
>j
,
(s+1)
<j
,
j
,
(s)
>j
, p
(s)
, u
(s+1)
,
(s+1)
,
(s+1)
) e
= (
(s+1)
<j
,
(s)
j
,
(s+1)
<j
,
(s)
j
, p
(s)
, u
(s+1)
,
(s+1)
,
(s+1)
).
b) Amostrando p.
Assim como no Algoritmo 1, amostra-se p
D
k
(V
p
p
(s)
1
, . . . , V
p
p
(s)
k
). Assim, p
(s+1)
=
p
com probabilidade
p
= min
_
1,
(
|x)f
D
(p
(s)
|p
)
(
|x)f
D
(p
|p
(s)
)
_
,
onde
= (
(s+1)
,
(s+1)
, p
, u
(s+1)
,
(s+1)
,
(s+1)
) e
= (
(s+1)
,
(s+1)
, p
(s)
, u
(s+1)
,
(s+1)
,
(s+1)
).
Captulo 4
Extremos com estrutura de modelos
de regressao
O comportamento da distribuicao de vari aveis pode estar ligado tambem ` a presenca
de covariaveis. Em dados de chuva, por exemplo, uma covari avel sazonal, que pode ser
indicadora de meses ou esta coes do ano pode ajudar a explicar o nvel de chuva de uma
regi ao. Cabras et al. (2009) citam um exemplo onde um dos par ametros da vari avel GPD
est a relacionado linearmente com a covari avel binaria onde 1 representa ver ao e 0 inverno.
Em dados de nancas, por exemplo na variavel cotacao de uma moeda, a covari avel taxa
de juros ou ndice da bolsa de valores do pas pode estar diretamente correlacionada com
a cotac ao da moeda.
Um outro fator que pode inuenciar no comportamento da vari avel e a sua localizac ao.
Em dados meteorol ogicos, fatores como latitude, longitude, altitude e dist ancia do mar
podem inuenciar nas condic oes meteorologicas de uma determinada regi ao.
Baseado nesta motivac ao, a pr oxima meta deste trabalho est a em realizar uma mo-
delagem mais abrangente para os parametros da cauda dos dados, onde e utilizada a
distribuic ao GPD. Neste captulo, e considerado que os par ametros da distribuic ao GPD
est ao correlacionados com covari aveis. Uma ideia mais simples seria utilizar uma relac ao
linear nos par ametros.
90
Abordagem Bayesiana nao-parametrica para analise de valores extremos 91
Cabras et al. (2009) desenvolve um trabalho onde e encontrado um modelo em que
a priori de Jereys para o conjunto de par ametros das regress oes do preditor linear e
proporcional a uma constante, propondo uma reparametrizac ao da distribuic ao GPD, de
tal forma que a distribuicao a priori de Jereys dos par ametros da cauda e Uniforme.
Nesta reparametrizac ao, o parametro de escala e substitudo por = (1 + ). Assim,
a func ao de densidade da GPD pode ser reescrita como
g(x
i
|
i
,
i
, u
i
) =
_
1
i
(1 +
i
)(1 + (x
i
u
i
)(
i
+
2
i
)/
i
)
(1+
i
)/
i
, se = 0
1
i
exp((x
i
u
i
)/
i
), se
i
= 0
, (4.1)
onde x
i
u
i
0 para
i
0 e (1 + (x
i
u
i
)(
i
+
2
i
)/
i
) > 0, se 0, 5 <
i
< 0.
4.1 Modelo de regressao para os parametros da GPD
Em rela cao a distribuic ao GPD escrita como em (4.1), cada um dos par ametros da
cauda pode ser escrito em funcao de funcoes de preditores lineares de um conjunto de
covariaveis, de tal forma que
i
= (
1,i
), com
= (
,0
, . . . ,
,k
),
i
= (
2,i
) com
= (
,0
, . . . ,
,k
), e u
i
= u(
u
z
3,i
), com
u
= (
u,0
, . . . ,
u,ku
). Os vetores z
1
, z
2
e
z
3
s ao as covariaveis de , e u respectivamente, que podem ou n ao ter covari aveis em
comum, e
e
u
s ao os seus respectivos vetores de parametros.
Segundo Cabras et al.(2009), aplicando a regra de Jereys, as funcoes de ligac ao
escolhidas para os preditores lineares sao
i
= exp(z
1,i
) 1 e
i
= exp(z
2,i
), onde
= (
0
, ...,
) e
= (
0
, ...,
k
). Com estas func oes, a distribui cao a priori conjunta
para (
).
Para o limiar, tambem e considerada uma estrutura de regressao, dada por u
i
=
Abordagem Bayesiana nao-parametrica para analise de valores extremos 92
u(z
3,i
u
), onde
u
= (
u
0
, ...,
u
ku
). Foi considerada uma estrutura de regress ao linear
simples para o limiar u
i
= z
3,i
u
. Uma alternativa seria utilizar o fato dos dados serem
positivos, denindo u
i
= exp(z
3,i
u
). Neste trabalho, o modelo foi desenvolvido utilizando
a primeira abordagem para u
i
.
4.2 Mistura de Gamas com GPD via modelos de
regressao
Baseado na estrutura de modelos de regress ao dos parametros da distribuic ao GPD,
neste captulo sera proposto um modelo que engloba mistura de Gamas para a parte
central das observac oes e distribuic ao GPD. A diferenca em relac ao ao Captulo 3 est a
na forma de analisar os parametros da cauda, que agora est ao escritos como fun coes de
covariaveis. Dessa maneira, o modelo, denominado por MGPDR
k
, tem densidade similar
a da equa cao (3.7), substituindo g(x|) pela densidade dada em (4.1).
4.2.1 Distribuicao a priori
A distribui cao a priori para os parametros da distribuic ao antes da cauda, ou seja,
da parte modelada por mistura de Gamas, e a mesma distribuic ao a priori do captulo
anterior.
Para os par ametros da Distribui cao GPD, a distribui cao a priori de Jereys para o
vetor de parametros (
|
u
) e dada por uma distribuic ao Uniforme, como mostra
Cabras et al. (2009). Para o vetor de par ametros do limiar
u
, utiliza-se uma priori
com distribui cao Normal
u
0
N(a
0
, V
u
0
) e
u
i
N(0, V
u
i
), i = 1, ..., k
u
, onde k
u
e
o n umero de covariaveis utilizados na estimac ao do limiar. O captulo anterior mostrou
algumas restric oes para a estimac ao do limiar quando o tamanho da amostra e pequeno,
n ao podendo utilizar uma priori vaga. Da mesma maneira, e necess ario tomar cuidado
na escolha de V
u
i
, i = 0, ..., k
u
, onde em alguns casos pode ser necess ario impor uma
Abordagem Bayesiana nao-parametrica para analise de valores extremos 93
vari ancia nao muito alta quando o tamanho da amostra e pequeno.
4.2.2 Distribuicao a posteriori
Dada a distribuic ao a priori e a funcao de densidade da distribuic ao de mistura, encontra-
se a seguinte forma para o logaritmo da densidade a posteriori do modelo com mistura de
Gamas com GPD, considerando estrutura de regress ao para os par ametros da cauda
(|x)
i:x
i
<u
i
log
_
_
k
j=1
p
j
f
G
(x
i
|
j
,
j
)
_
_
+
x
i
u
i
log
_
_
1
k
j=1
p
j
F
G
(u
i
|
j
,
j
)
_
_
+
x
i
u
i
log[g(x
i
|
i
,
i
, u
i
)] +
k
j=1
_
(a
j
1) log(
j
) b
j
j
(c
j
+ 1) log(
j
)
d
j
j
_
(
u
0
a
0
)
2
2V
u
0
ku
i=1
_
2
u
i
2V
u
i
_
,
(4.3)
onde = (
1
, . . . ,
k
,
1
, . . . ,
k
, p
1
, . . . , p
k
,
u
,
_
exp(2z
1,i
) exp(2z
1,i
) > x
1
i
exp(z
2,i
)
z
1,i
> log(2).
(4.4)
A primeira restric ao e imposta para garantir a existencia da func ao de verossimilhanca.
A segunda restric ao e necess aria para a existencia da Informa cao de Fisher (Smith, 1984).
Segundo Cabras et al. (2009), estas restri coes s ao vericadas apenas numericamente.
Para realizar a estimac ao dos parametros, sao utilizadas tecnicas MCMC. Para os valo-
res menores que o limiar, a estimac ao utilizando mistura de distribuicoes e feita da mesma
maneira como no Captulo 3. Para os par ametros da cauda, cada vetor de par ametros
u
,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 94
i
= exp(
0,
+
1,
z
1,i
) 1 e
i
= exp(
0,
+
1,
z
2,i
). As simula coes foram feitas com os
valores
0,u
=6 e 9,
1,u
=0,5 e -0,5,
0,
=0,2,
1,
=0,3 e -0,3,
0,
=3 e
1,
=0,5.
Para n = 1000,
0,u
N(7, 10) e
1,u
N(0, 5). Para n = 10000,
0,u
N(7, 100)
e
1,u
N(0, 100). Como visto no captulo anterior, e necess ario impor uma priori com
maior informac ao quando o tamanho da amostra n ao e muito grande.
4.3.1 Simulac oes para amostra de tamanho 1000
As Figuras 4.1 e 4.2 mostram o histograma da distribui cao a posteriori dos par ametros
da cauda para
1,
= 0, 3 e
1,
= 0, 3, ambas com
1,u
= 0, 5 e
0,u
= 6. Pela Figura 4.1,
observa-se que ha uma diculdade de estimar o efeito da covari avel sobre o limiar, como
mostra o histograma de
1,u
. Para os outros parametros, a estimacao da distribuicao
parece estar proxima aos valores verdadeiros utilizados na simulac ao. Pela Figura 4.2,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 95
todos os par ametros parecem estar bem estimados em relac ao ao verdadeiro valor. Em
ambas as guras, o valor 0 est a dentro da distribuic ao a posteriori com uma probabilidade
n ao muito baixa, ou seja, em algumas situac oes est a havendo diculdade de dizer se
realmente o efeito da covariavel e signicativo ou se existe intercepto.
Figura 4.1: Histograma da cauda para n = 1000,
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
Figura 4.2: Histograma da cauda para n = 1000,
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
As Figuras 4.3 e 4.4 mostram o histograma da distribui cao a posteriori dos par ametros
Abordagem Bayesiana nao-parametrica para analise de valores extremos 96
da cauda para
1,
= 0, 3 e
1,
= 0, 3, agora com ambas as Figuras com
1,u
= 0, 5 e
0,u
= 9. As guras mostram que a estimac ao e eciente para a maioria dos par ametros
da cauda, embora a amplitude da distribui cao parece ser alta, n ao dando uma informa cao
muito precisa sobre os par ametros. Em comparac ao com as guras onde
0,u
= 6, os
histogramas com
0,u
= 9 tem uma amplitude maior para os outros par ametros da cauda,
pois com um limiar num quantil mais alto, h a menos observa coes na cauda, o que aumenta
a incerteza e diminui a precisao na estimac ao dos par ametros da cauda.
A maior diculdade foi na estima cao dos par ametros relacionados ao par ametro de
forma . Em ambas as Figuras 4.3 e 4.4, a probabilidade de
0,
= 0 e alta, ou seja, a
estimac ao indica que pode n ao haver intercepto no preditor linear de . Na Figura 4.4,
o efeito de
1,
tambem nao parece ser signicativo, ou seja, neste caso, o modelo indica
que o parametro poderia ser estimado como sendo xo e igual a 0, quando na verdade
os valores simulados foram de um modelo com = 0.
Figura 4.3: Histograma da cauda para n = 1000,
0,u
= 9,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
A Tabela 4.1 apresenta o intervalo de credibilidade de 95% dos par ametros da cauda
para n = 1000. Observando a tabela, em quase todas as estimac oes, o verdadeiro valor
do par ametro se encontra dentro do intervalo de credibilidade, porem a variabilidade de
Abordagem Bayesiana nao-parametrica para analise de valores extremos 97
Figura 4.4: Histograma da cauda para n = 1000,
0,u
= 9,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
algumas estimac oes e muito alta, dando pouca informac ao sobre a distribui cao a posteriori
dos par ametros. Com excec ao de
0,u
e
0,
, a estimac ao dos par ametros n ao e precisa, em
alguns casos nao dando para concluir se o efeito da covari avel e signicativo, principal-
mente nos parametros que determinam a forma da distribuic ao GPD
0,
e
1,
, onde em
quase todos os casos o valor 0 apareceu dentro do intervalo de credibilidade. Portanto, h a
uma restric ao em apontar efeitos de covariaveis em uma amostra de tamanho n = 1000.
Tabela 4.1: Intervalos de credibilidade para simulac oes com n = 1000,
0,
= 3,
1,
= 0, 5
e
0,
= 0, 2.
1,
= 0.3
1,
= 0.3
0,u
= 6
0,u
= 9
0,u
= 6
0,u
= 9
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
0,u
(5,93;6,75) (5,48;6,27) (8,38;9,14) (8,30;9,17) (5,98;6,45) (5,92;6,32) (8,69;9,20) (8,72;9,61)
1,u
(-0,17;0,58) (-0,71;0,05) (0,41;1,27) (-0,58;-0,01) (0,26;0,56) (-0,71;-0,39) (0,38;0,93) (-0,76;-0,13)
0,
(2,73;3,53) (2,85;3,66) (2,13;3,33) (3,02;4,05) (2,85;3,34) (2,90;3,33) (2,91;3,67) (2,72;3,32)
1,
(0,23;0,58) (0,23;0,58) (0,31;0,89) (0,07;0,50) (0,39;0,61) (0,34;0,52) (0,27;0,63) (0,42;0,66)
0,
(0,03;0,58) (0,17;0,70) (-0,21;0,53) (-0,01;0,63) (-0,05;0,54) (-0,34;0,17) (-0,20;0,46) (-0,07;0,68)
1,
(-0,02;0,49) (-0,06;0,37) (0,12;0,69) (-0,20;0,37) (-0,51;-0,01) (-0,27;0,16) (-0,46;0,18) (-0,64;-0.06)
Abordagem Bayesiana nao-parametrica para analise de valores extremos 98
4.3.2 Simulac oes para amostra de tamanho 10000
As Figuras 4.5 e 4.6 mostram o histograma da distribui cao a posteriori dos par ametros
da cauda para
1,
= 0, 3 e
1,
= 0, 3, ambas as Figuras com
1,u
= 0, 5 e
0,u
= 6.
Pode-se observar que a estimac ao dos parametros e muito mais precisa que as simulac oes
com os mesmos parametros no caso onde n = 1000. Em todas as situac oes, a media a
posteriori e muito pr oxima ao valor verdadeiro simulado. Esta informacao e toda fornecida
pelos dados, pois a distribui cao a priori para todos os parametros da cauda foi dada com
menor informac ao quando n = 10000. Portanto a estimacao e eciente em detectar o
verdadeiro valor do vetor de par ametros para o modelo proposto neste captulo, dando
indcios que ele pode ser bem utilizado em dados reais, como ser a visto na proxima sec ao.
Figura 4.5: Histograma da cauda para n = 10000,
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
As Figuras 4.7 e 4.8 mostram o histograma da distribui cao a posteriori dos par ametros
da cauda para
1,
= 0, 3 e
1,
= 0, 3, considerando
1,u
= 0, 5 e
0,u
= 9. Percebe-se a
eciencia da estimac ao em recuperar os valores verdadeiros.
A Tabela 4.2 apresenta o intervalo de credibilidade de 95% dos par ametros da cauda
para n = 10000. Observa-se que em todas as congurac oes, os valores verdadeiros dos
par ametros est ao dentro do intervalo de credibilidade, sendo que estes intervalos s ao
Abordagem Bayesiana nao-parametrica para analise de valores extremos 99
Figura 4.6: Histograma da cauda para n = 10000,
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
Figura 4.7: Histograma da cauda para n = 10000,
0,u
= 9,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
bem mais precisos do que para n = 1000, podendo-se armar que a estimac ao recupera
o verdadeiro valor utilizado para realizar as simula coes. Portanto, para tamanhos de
amostras maiores, em torno de n = 10000, pode-se utilizar o modelo considerando o
efeito de covari aveis para estimar valores extremos.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 100
Figura 4.8: Histograma da cauda para n = 10000,
0,u
= 9,
1,
= 0, 3 e
1,u
= 0, 5.
As linhas verticais representam os valores verdadeiros.
Tabela 4.2: Intervalos de credibilidade para simulacoes com n = 10000,
0,
= 3,
1,
=
0, 5 e
0,
= 0, 2.
1,
= 0, 3
1,
= 0, 3
0,u
= 6
0,u
= 9
0,u
= 6
0,u
= 9
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
1,u
= 0, 5
0,u
(5,98;6,02) (5,96;6,02) (8,97;9,01) (8,97;9,03) (5,99;6,06) (5,98;6,01) (8,98;9,02) (8,99;9,04)
1,u
(0,48;0,53) (-0,51;-0,45) (0,49;0,53) (-0,51;-0,47) (0,46;0,52) (-0,51;-0,48) (0,49;0,53) (-0,53;-0,48)
0,
(2,93;3,16) (2,93;3,16) (2,93;3,32) (2,93;3,27) (2,92;3,07) (2,90;3,03) (2,89;3,16) (2,89;3,06)
1,
(0,41;0,52) (0,44;0,54) (0,35;0,51) (0,41;0,56) (0,46;0,53) (0,47;0,53) (0,42;0,54) (0,46;0,54)
0,
(0,14;0,31) (0,14;0,31) (0,05;0,26) (0,12;0,34) (0,07;0,23) (0,11;0,27) (0,05;0,28) (0,05;0,31)
1,
(0,18;0,33) (0,22;0,36) (0,25;0,47) (0,15;0,35) (-0,33;-0,20) (-0,35;-0,22) (-0,33;-0,10) (-0,41;-0,19)
4.3.3 Calculo de maximos e quantis altos
Em alguns casos, quando
i
e negativo, a distribuic ao GPD possui um limite superior,
que e dado por u
i
i
/(
i
(1 +
i
)). Em algumas conguracoes de covari aveis, pode-se
calcular a distribuic ao a posteriori do m aximo. Para as simula coes onde n = 1000, h a uma
restric ao em encontrar os maximos, pois a estima cao dos par ametros que determinam
Abordagem Bayesiana nao-parametrica para analise de valores extremos 101
n ao foram boas, e mesmo se a media a posteriori e negativa, alguns valores gerados nas
iterac oes do MCMC s ao positivos, dicultando a estimacao do maximo, pois a distribuicao
GPD e ilimitada para > 0.
A Figura 4.9 mostra a diculdade de estimac ao dos m aximos no par de covari aveis
(z
= 1,z
= 1) e (z
= 2,z
i
/(
i
(1 +
i
)) tende a ir para valores negativos, enquanto que se e muito proximo
de 0 e negativo, a equa cao tende a ir para um valor muito alto. A consequencia disso e
mostrada na Figura 4.9, onde ha valores situados entre 10000 e 10000 na distribuicao
do maximo, que nao fornece nenhuma informac ao sobre esta quantidade.
Figura 4.9: Histograma do m aximo para n = 1000.
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5. Painel `a esquerda: z
= 1, z
= 1. Painel `a direita:
z
= 2, z
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5. Painel `a esquerda: z
= 1, z
= 1. Painel `a direita:
z
= 2, z
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5. Painel `a esquerda: z
= 1, z
= 1. Painel `a direita:
z
= 3, z
1,
z
)/ exp(
0,
+
1,
z
).
A Figura 4.13 mostra o gr aco de dispersao entre os parametros para as simulac oes
com n = 1000. Pela gura, nota-se que que h a pouca correla cao entre os parametros, n ao
sendo possvel visualizar esta correlac ao nos gracos de dispers ao. Alem disso, as linhas
dos valores verdadeiros est ao dentro da maior moda. Portanto, embora nas simulac oes
com n = 1000 a estimac ao dos par ametros n ao tenha sido precisa, isto n ao ocorreu pela
falta de identicabilidade entre os par ametros da cauda.
A Figura 4.14 mostra o gr aco de dispersao entre os parametros para as simulac oes
com n = 10000. Pela gura, nota-se que n ao parece haver correlac ao entre os par ametros,
sendo estes bem estimados proximos aos valores verdadeiros. No caso onde
1,
= 0, 3
e z
0,u
= 6,
1,
= 0, 3 e
1,u
= 0, 5. Painel `a esquerda: z
= 1, z
= 1. Painel `a direita:
z
= 3, z
= 1. Primeira linha:
1,
= 0, 3. Segunda
linha:
1,
= 0, 3. Primeira coluna: z
= 0, 5. Segunda coluna: z
= 1. Primeira linha:
1,
= 0, 3. Segunda
linha:
1,
= 0, 3. Primeira coluna: z
= 0, 5. Segunda coluna: z
.
A Figura 4.15 mostra o mapa dos Estados Unidos com a localizac ao de suas principais
cidades.
Em rela cao aos meses do ano, como a temperatura possui ciclos sazonais, as covariaveis
que representam os meses podem ser dadas em termos de func oes trigonometricas. Por-
tanto, o vetor de covariaveis para este modelo pode ser escrito da seguinte maneira
z
i
= (z
0,i
, z
1,i
, z
2,i
, z
3,i
, z
4,i
),
onde:
z
0,i
= 1 e o intercepto.
z
1,i
= cos
_
2m
i
12
_
e z
2,i
= sin
_
2m
i
12
_
, onde m
i
e o mes da observac ao i,
z
3,i
= (l
i
m
l
)/10, onde l
i
e a latitude da observac ao i e m
l
e o valor medio da
latitude de todas as observac oes.
z
4,i
= z
3,i
z
2,i
representa a interac ao entre o mes do ano e a latitude.
Foi feita a estimacao pelo modelo MGPDR
k
proposto neste trabalho, para diferentes
valores de k, onde cada parametro da cauda e escrito em funcao do vetor de covari aveis
Abordagem Bayesiana nao-parametrica para analise de valores extremos 108
Figura 4.15: Mapa dos Estados Unidos com os estados e as maiores cidades.
z. A distribuic ao a priori para o vetor de par ametros
u
foram prioris vagas Normais com
u,0
N(40, 10000) e
u,i
N(0, 1000), com i = 1, ..., 4.
A Tabela 4.3 mostra os resultados das medidas de ajuste BIC e DIC para os dife-
rentes modelos comparados. Observando a tabela, percebe-se que ao utilizar modelos de
regress ao nos par ametros da cauda h a um ganho signicativo no ajuste, pois o modelo
MGPDR
k
e melhor do que se os par ametros da cauda fossem xos (modelo MGPD
k
),
ou se fosse utilizada uma abordagem totalmente n ao-parametrica via mistura de Gamas
(modelo MG
k
). A Tabela 4.4 apresenta os resultados da estimacao dos par ametros da
cauda para o modelo MGPDR
3
, apontado pela Tabela 4.3 como o melhor modelo.
Em relac ao ao modelo MGPDR
k
, outras reparametrizac oes tambem foram analisadas
para vericar se poderiam ser melhores do que a proposta neste trabalho. A primeira foi
considerar u
i
= exp(z
u
). Com esta parametrizac ao, o melhor BIC e DIC dos modelos
MGPDR
k
foi para k = 3 com respectivos valores 0,9333 10
5
e 0,9309 10
5
. Outra
Abordagem Bayesiana nao-parametrica para analise de valores extremos 109
Tabela 4.3: Medidas de ajuste para as temperaturas dos EUA
Modelo Pd DIC 10
5
BIC 10
5
MGPDR
1
19,30 0,9352 0,9371
MGPDR
2
11,54 0,9169 0,9192
MGPDR
3
5,16 0,9141 0,9163
MGPDR
4
8,55 0,9151 0,9177
MG
3
6,86 1,1321 1,1331
MGPD
2
5,99 1,1325 1,1335
MG
k
e MGPD
k
sao os melhores modelos de cada classe de acordo com o DIC.
reparametrizac ao estudada foi considerar a parametriza cao da distribuic ao GPD usual,
como na equac ao (3.2). A parametriza cao proposta para = exp(z
), considerando
uma distribuic ao Uniforme para o vetor de parametros
0,
1,
2,
3,
4,
-0,54 (-0,55;-0,53) -0,15 (-0,16;-0,13) -0,10 (-0,14;-0,07) 0,10 (0,07;0,14) -0,01 (-0,02;0,01)
0,
1,
2,
3,
4,
1,77 (1,76;1,78) 0,15 (0,14;0,17) 0,18 (0,16;0,20) 0,15 (0,12;0,18) 0,21 (0,20;0,23)
0,u
1,u
2,u
3,u
4,u
63,01 (62,99;63,02) -17,37 (-17,39;-17,35) -16,03 (-16,06;-15,99) -4,10 (-4,14; -4,06) -11,71 (-11,74;-11,69)
par ametros, pode-se fazer uma analise detalhada sobre o comportamento da temperatura
em cada esta cao do ano ou em cada cidade. Por exemplo, como o limiar tambem e
formulado em func ao das covariaveis, cada cidade vai ter um limiar diferente e em rela cao
a uma unica cidade os valores do limiar irao se alterar de acordo com os meses do ano.
As Figuras 4.17 e 4.18 apresentam a evolucao do limiar em relac ao aos meses do ano
para as cidades de Atlanta, Georgia, e Portland, Maine, respectivamente com latitudes
Abordagem Bayesiana nao-parametrica para analise de valores extremos 111
de 33
o
45
e 43
o
39
2
3
.
0
2
2
.
0
2
1
.
0
Longitude
L
a
t
i
t
u
d
e
q
q
Neste conjunto de dados, como s ao utilizadas temperaturas mnimas, a cauda da
distribuic ao est a `a esquerda. Para fazer a an alise segundo o modelo proposto, foi feita a
transformac ao x = 30, 0 y, onde y s ao os dados originais. Como a maior temperatura
das observac oes foi de 25,6, fazendo a transforma cao, ha a garantia que as observac oes s ao
Abordagem Bayesiana nao-parametrica para analise de valores extremos 116
positivas e com cauda ` a direita. Assim, o modelo tambem permite calcular a probabilidade
de observac oes mnimas maiores que 25,6. A Figura 4.24 mostra o histograma dos dados
originais e dos dados transformados.
Figura 4.24: Histograma das observacoes dos dados do Rio de Janeiro.
Painel `a esquerda: Dados originais. Painel `a direita: Dados transformados.
Observando no mapa na Figura 4.23, as diferencas de Latitudes do Estado sao pe-
quenas, entre 20
o
76
e 23
o
36
. Uma covariavel que ira ter mais relev ancia na an alise dos
dados e a altitude. O estado do Rio de Janeiro tem um relevo diversicado, com regioes no
nvel do mar, regioes serranas e planaltos. Assim, uma covari avel escolhida para a an alise
destes dados foi a altitude. Os meses do ano certamente e outra covariavel que interfere
nos nveis de temperatura e ser a analisada por meio de transformac oes trigonometricas.
O vetor de covari aveis para este modelo pode ser escrito da seguinte maneira
z
i
= (z
0,i
z
1,i
z
2,i
z
3,i
z
4,i
),
onde:
z
0,i
= 1 e o intercepto
z
1,i
= cos
_
2m
i
12
_
e z
2,i
= sin
_
2m
i
12
_
, onde m
i
e o mes da observac ao i,
z
3,i
= (l
i
m
l
)/100, onde l
i
e a altitude da observac ao i e m
l
e o valor medio da
altitude de todas as observac oes.
z
4,i
= z
3,i
z
2,i
representa a interac ao entre o mes do ano e a altitude
Abordagem Bayesiana nao-parametrica para analise de valores extremos 117
As distribuic oes a priori dos par ametros do limiar do modelo MGPDR
k
s ao dadas
por
u,0
N(10, 50) e
u,i
N(0, 30), i = 1, ..., 4.
A Tabela 4.5 mostra os resultados das medidas de Ajuste BIC e DIC para os diferentes
modelos comparados.
Tabela 4.5: Medidas de ajuste para as temperaturas do estado do Rio de Janeiro
Modelo Pd DIC 10
5
BIC 10
5
MGPDR
1
6,54 0,4253 0,4249
MGPDR
2
9,78 0,4230 0,4250
MGPDR
3
18,26 0,4222 0,4248
MGPDR
4
11,03 0,4227 0,4253
MG
4
8,13 0,5863 0,5876
MGPD
2
1,70 0,5866 0,5874
MG
k
e MGPD
k
sao os melhores modelos de cada classe de acordo com o DIC.
Assim como nos dados da aplicac ao anterior, os modelos MGPDR
k
tem uma ampla
vantagem na estimac ao em relacao aos outros modelos, ou seja, o modelo e melhor ajustado
quando e considerado o efeito de covariaveis na cauda da distribuic ao.
A Figura 4.25 apresenta os histogramas das distribuicoes a posteriori dos parametros
da cauda para o modelo MGPDR
3
, o melhor segundo a Tabela 4.5.
A Tabela 4.6 mostra a media a posteriori e o intervalo de credibilidade de 95%
par ametros da cauda, onde nota-se que quase todos os par ametros apontam um efeito
signicativo das covariaveis e intera coes nos tres par ametros da distribui cao GPD, com
excec ao do efeito da interac ao entre altitude e estacao do ano para a determinac ao dos
par ametros e .
Assim como na aplicac ao anterior, pode-se tirar medidas importantes que podem aju-
dar a avaliar o comportamento de observacoes extremas na temperatura. Os dados foram
transformados com a nalidade de se ter uma cauda ` a direita, que e como se usualmente
Abordagem Bayesiana nao-parametrica para analise de valores extremos 118
Figura 4.25: Histograma da cauda para o modelo MGPDR
3
dos dados do Rio de Janeiro.
Tabela 4.6: Media a posteriori dos parametros para o modelo MGPDR
3
dos dados do
Rio de Janeiro.
Em parenteses os intervalos de 95% de credibilidade
0,
1,
2,
3,
4,
-0,29 (-0,30;-0,28) 0,01 (0,00;-0,02) -0,02 (-0,02;-0,01) -0,01 (-0,02;-0,01) -0,02 (-0,04;0,01)
0,
1,
2,
3,
4,
0,58 (0,56;0,59) -0,15 (-0,17;-0,13) -0,02 (-0,03;-0,02) -0,008 (-0,014;-0,002) 0,02 (-0,01;0,04)
0,u
1,u
2,u
3,u
4,u
5,752 (5,750;5,753) -2,260 (-2,262;-2,256) 0,705 (0,704;0,706) -0,104 (-0,105; -0,103) -2,083 (-2,085;-2,082)
trabalha na distribuic ao GPD, para coletar medidas de temperaturas ao longo do ano,
para as diferentes esta coes, alem de estatsticas extremas como maximos e quantis. Nesta
aplicac ao, como o interesse principal esta em analisar temperaturas mnimas, e necess ario
fazer a transformac ao inversa para se fazer a an alise baseado nos dados na escala original.
Assim, sao analisados os mnimos e quantis baixos.
As Figuras 4.26 e 4.27 mostram as temperaturas mnimas mensais ao longo do ano
Abordagem Bayesiana nao-parametrica para analise de valores extremos 119
para as cidades de Cabo Frio, ao nvel do mar, e Nova Friburgo, na regi ao serrana do
Estado. Pelas guras, percebe-se que o limiar acompanha bem o comportamento das
observacoes, que ao contr ario dos EUA, cai de temperatura no meio do ano, que e o
inverno no hemisferio sul. Por estar situada na regi ao serrana, a temperatura na cidade
de Nova Friburgo e sempre menor do que Cabo Frio. Pode-se perceber pelas guras que
o limiar escolhido pelas observac oes foi situado num quantil baixo, cando a maioria das
observacoes acima da media a posteriori do limiar.
Figura 4.26: Observac oes ao longo do ano para os dados de Cabo Frio.
A linha cheia representa a media a posteriori do limiar para cada mes.
Pode-se vericar tambem o comportamento do limiar em rela cao as altitudes em difer-
entes meses do ano. As Figuras 4.28 e 4.29 mostram os valores da media a posteriori do
limiar para os meses de Janeiro, no ver ao, e Julho, no inverno. Observando os gr acos
nota-se que, em relacao as altitudes, as temperaturas mnimas s ao menores em regi oes
com altitudes mais altas.
Outra medida que se pode encontrar no modelo MGPDR
k
e a distribui cao dos
m aximos, quando e negativo. Como nos dados do Rio de Janeiro, trabalha-se com
os dados transformados para a cauda da distribuic ao estar `a direita, encontrando a dis-
Abordagem Bayesiana nao-parametrica para analise de valores extremos 120
Figura 4.27: Observac oes ao longo do ano para os dados de Nova Friburgo.
A linha cheia representa a media a posteriori do limiar para cada mes.
Figura 4.28: Observac oes com as latitudes para o mes de Janeiro no Rio de Janeiro .
A linha cheia representa a media a posteriori do limiar para cada cidade.
tribuic ao dos m aximos dos dados transformados e voltando esta distribuicao na escala
original, o resultado ser a a distribui cao do mnimo das temperaturas. A Figura 4.30
mostra a distribuic ao do mnimo em duas cidades do Rio de Janeiro em dois diferentes
Abordagem Bayesiana nao-parametrica para analise de valores extremos 121
Figura 4.29: Observac oes com as latitudes para o mes de Julho no Rio de Janeiro.
A linha cheia representa a media a posteriori do limiar para cada cidade.
meses. Assim, pode-se dizer que a temperatura mnima em Angra dos Reis no mes de
abril esta entre 10, 5
o
C e 12, 5
o
C.
Figura 4.30: Histograma dos mnimos para os dados do Rio de Janeiro.
a) Angra dos Reis, em Abril. b) Ilha Rasa, em Novembro.
Uma outra medida que pode ser encontrada sao os quantis baixos. Ao contr ario de
dados m aximos, quando se analisa observac oes mnimas, o maior interesse e encontrar
a probabilidade de se obter uma observac ao menor do que um determinado valor. Para
encontrar o quantil 0, 1% de alguma cidade em um determinado mes do ano, para os dados
do Rio de Janeiro, encontra-se a distribuic ao do quantil 99, 9% dos dados transformados e
Abordagem Bayesiana nao-parametrica para analise de valores extremos 122
retorna esta distribuic ao para a escala dos dados originais, obtendo assim a distribuic ao do
quantil 0, 1% das temperaturas mnimas. A Figura 4.31 apresenta a distribuicao do quantil
0, 1% para duas cidades diferentes em dois meses do ano. Baseado na media a posteriori
dos quantis, pode-se dizer que a probabilidade da temperatura em Niter oi no mes de
Janeiro ser menor do que 16, 4
o
C e de 0, 1%, enquanto que esta mesma probabilidade se
equivale a temperatura de apenas 5, 3
o
C para a cidade de Teres opolis no mes de Julho.
Figura 4.31: Histograma do quantil 0, 1% para os dados do Rio de Janeiro.
a) Niteroi, em Janeiro. b) Teresopolis, em Julho.
4.4.3 Conclus oes das aplicacoes
Ap os realizar a estimac ao dos parametros nas duas aplicac oes de temperaturas, pode-
se tirar como principais conclus oes:
O modelo MGPDR
k
e superior ao modelo que considera a cauda xa (MGPD
k
)
e o modelo que considera uma abordagem totalmente nao-parametrica (MG
k
),
mostrando que quando h a a presenca de covariaveis que ajudam a explicar a vari avel
resposta, elas tem que ser incorporadas no modelo;
com a distribuic ao a priori do limiar pouco informativa, em ambas as aplicac oes
o valor que os dados escolheram para o limiar situou-se em um quantil baixo das
observacoes, em torno de 15%. Como os dados que foram analisados foram m aximos
Abordagem Bayesiana nao-parametrica para analise de valores extremos 123
mensais para a primeira e mnimos mensais para a segunda aplicacao, a maioria
destes valores ja s ao observac oes extremas, fazendo parte da cauda;
o modelo MGPDR
k
permite o c alculo de medidas importantes para cada con-
gurac ao de covariavel, sendo possvel observar o comportamento do limiar ao longo
do ano para uma particular cidade, alem da mudan ca do limiar de acordo com lati-
tude e altitude. Alem disso, o modelo fornece uma distribuic ao de medidas extremas
importantes, como o maximo e quantis altos, para particulares cidades em determi-
nados meses do ano;
estimar todas as cidades em diferentes meses do ano pelo modelo MGPDR
k
e mais
eciente do que estimar valores de uma unica cidade em um unico mes do ano pelo
modelo MPGD
k
. Na aplicac ao dos Estados Unidos, como as observac oes coletadas
s ao de 13 anos, haveria apenas 13 observacoes por cidade e mes, mesmo agrupando
por estac oes do ano haveria apenas 39 observacoes, o que e insuciente para realizar
a estimac ao pelo modelo MPGD
k
.
Apendice 4 - Algoritmo
O Algoritmo MCMC para a estimac ao dos par ametros do modelo MGPDR
k
e dado por:
Algoritmo 3
Na s-esima iterac ao, as cadeias dos par ametros se movimentam para o passo s +1 da
seguinte maneira:
Amostrando
Para cada
i
, i = 0, . . . , k
, amostra-se
i
da N(
(s)
i
, V
i
). Se o vetor amostrado
,
(s)
u
. Caso nao satisfaca,
amostra-se o vetor
com probabilidade
onde
= min
_
1,
(
|x)
(
|x)
,
= (
(s)
,
(s)
, p
(s)
,
(s)
u
,
(s)
) e
= (
(s)
,
(s)
, p
(s)
,
(s)
u
,
(s)
,
(s)
).
Amostrando
Para cada
i
, i = 0, . . . , k
, amostra-se
i
da N(
(s)
i
, V
i
). Se o vetor amostrado
,
(s)
u
. Caso n ao satisfaca,
amostra-se o vetor
com probabilidade
onde
= min
_
1,
(
|x)
(
|x)
,
= (
(s)
,
(s)
, p
(s)
,
(s)
u
,
,
(s+1)
) e
= (
(s)
,
(s)
, p
(s)
,
(s)
u
,
(s)
,
(s+1)
).
Amostrando
u
Para cada
u
i
, i = 0, . . . , k
u
, amostra-se
u
i
da N(
(s)
u
i
, V
u
i
). Se o vetor amostrado
u
satisfaz a restricao em (4.4) em conjunto com
(s+1)
,
(s+1)
u
novamente ate satisfazer a restri cao.
Atualiza
(s+1)
u
=
u
com probabilidade
u
onde
u
= min
_
1,
(
|x)
(
|x)
,
= (
(s)
,
(s)
, p
(s)
,
u
,
(s+1)
,
(s+1)
) e
= (
(s)
,
(s)
, p
(s)
,
(s)
u
,
(s+1)
,
(s+1)
).
Amostrando , e p
Para aplicar o algoritmo de Metropolis para os parametros das componentes de
mistura da parte central dos dados, o procedimento e igual ao do Algoritmo 1 do
Captulo 2.
Captulo 5
Extremos com estrutura de modelos
dinamicos
Em series temporais e estudado como o comportamento dos dados pode se alterar com
o tempo. Este tipo de altera cao e comum para dados de valores extremos.
Em dados ambientais, por exemplo, em chuva, vento e temperatura, seus nveis podem
estar correlacionados com a sazonalidade, alem de apresentar uma tendencia de aumento
ao longo dos anos, devido mudancas climaticas no planeta.
Em dados de nancas, um perodo de recess ao altera todos os ndices economicos.
Assim, investidores procuram mercados mais solidos para aplicar seus investimentos.
Um trabalho recente, sendo outra extens ao do trabalho do Behrens et al. (2004),
foi desenvolvido por Lopes et al. (2009), onde o modelo utilizado e uma distribuicao
Gama com GPD, levando em considerac ao o fato dos dados serem provenientes de uma
serie temporal, onde os par ametros da parte da cauda do modelo com distribui cao GPD
varia no tempo. Ao contr ario do modelo do captulo anterior, aqui, o modelo e feito
por equacoes de atualizacao de um modelo linear dinamico, ou Dynamic Linear Model
(DLM). Huerta e Sans o (2007) usaram uma ideia similar quando modelaram nveis di arios
de ozonio por uma distribui cao GEV variando no tempo e espa co.
No modelo proposto por Lopes et al. (2009), cada observac ao x
t
, t = 1, . . . , n, que
125
Abordagem Bayesiana nao-parametrica para analise de valores extremos 126
est a abaixo de um limiar u, segue uma distribuic ao Gama, e cada observacao x
t
que esta
acima do limiar possui distribuicao GPD. Neste modelo, dois dos parametros da GPD
muda ao longo do tempo, enquanto os outros par ametros permanecem xos.
Neste modelo, a func ao distribuicao de mistura e dada por
F
t
(x
t
|, , u
t
,
t
,
t
) =
_
_
F
G
(x
t
|, ) se x
t
< u,
F
G
(u, , ) + [1 F
G
(u, , )]G(x
t
|u,
t
,
t
) se x
t
> u
, (5.1)
onde F
G
(.|, ) e a fun cao de distribuicao da Gama e G a func ao de distribuic ao da GPD.
5.1 Dinamica na cauda
O modelo DLM, visto em West e Harrison (1997), e usado aqui para modelar os
par ametros da GPD, que muda ao longo do tempo pela seguinte estrutura
_
_
_
t
_
_
_ = F
t
+ v
t
e
t
= G
t
t1
+ w
t
. (5.2)
Num caso particular da equac ao (5.2), pode considerar que os parametros da cauda
e sigam um modelo din amico de primeira ordem,
t
=
,t
+ v
,t
v
,t
N(0, 1/V
),
,t
=
,t1
+ w
,t
w
,t
N(0, 1/W
),
t
=
,t
+ v
,t
v
,t
N(0, 1/V
),
,t
=
,t1
+ w
,t
w
,t
N(0, 1/W
),
(5.3)
onde
,t
,
,t
, t = 0, . . . , n, V
, W
, V
e W
),
,t
=
,t1
+ w
,t
w
,t
N(0, 1/W
),
l
t
=
,t
+ v
,t
v
,t
N(0, 1/V
),
,t
=
,t1
+ w
,t
w
,t
N(0, 1/W
),
(5.4)
5.2 Mistura de Gamas com GPD usando DLM
Uma outra extens ao que pode ser feita consiste em utilizar um modelo que trabalha
com mistura de k distribuic oes Gama para valores abaixo de um limiar u e uma dis-
tribuic ao GPD com estrutura DLM em
t
para valores acima de um limiar u. A fun cao
de distribuic ao do modelo, denominado por MGPDLM
k
e dada por
F
t
(x
t
|,
t
) =
_
k
j=1
p
j
F
G
(x
t
|
j
,
j
), se x
t
< u
k
j=1
p
j
F
G
(u |
j
,
j
) +
_
1
k
j=1
F
G
(u,
j
,
j
)
_
G(x
t
|
t
,
t
, u), se x
t
> u,
Em relac ao aos par ametros da cauda, ao inves de estimar diretamente
t
e
t
, os
par ametros estimados s ao
t
= exp(l
t
) e
t
= exp(l
t
) 1, considerando a estrutura
din amica como em (5.4). Considerando independencia entre os parametros da mistura
e da cauda, e na cauda considerando apenas a dependencia dos parametros do modelo
din amico em (5.3), a distribuicao a priori pode ser escrita da seguinte maneira:
(, , p, l, l, u,
, V
, V
, W
, W
) = (, , p)(u)(l,
, V
, W
)(l,
, V
, W
),
onde (, , p) e (u) possuem a mesma forma da distribuicao a priori do Captulo 3. A
distribuic ao a priori dos parametros (l,
, V
, W
) e (l,
, V
, W
, V
, W
) =
n
t=1
((l
t
|
,t
, V
)(
,t
|
,t1
, W
)) (
,0
)(V
)(W
)
Abordagem Bayesiana nao-parametrica para analise de valores extremos 128
(l,
, V
, W
) =
n
t=1
((l
t
|
,t
, V
)(
,t
|
,t1
, W
)) (
0,
)(V
)(W
)
onde
t
|
,t
, V
N(
,t
, 1/V
),
,t
|
,t1
, W
N(
,t1
, 1/W
),
,0
N(m
,0
, C
,0
),
V
G(f
/o
, f
), W
G(l
/m
, l
),
t
|
,t
, V
N(
,t
, 1/V
),
,t
|
,t1
, W
N(
,t1
, 1/W
),
,0
N(m
,0
, C
,0
), V
G(f
/o
, f
) e W
G(l
/m
, l
).
A escolha destas distribuic oes a priori, de acordo com a forma dinamica em (5.4),
tem como objetivo facilitar os c alculos das distribui coes a posteriori para os parametros,
sendo possvel encontrar distribuicoes condicionais completas conhecidas para a maioria
dos parametros, e realizar a estimac ao pelo amostrador de Gibbs.
Assim, baseado na fun cao de verossimilhanca e na distribuic ao a priori dos parametros,
a func ao de densidade a posteriori pode ser escrita da seguinte maneira:
(|x)
t:xt<u
_
_
k
j=1
p
j
f
G
(x
t
|
j
,
j
)
_
_
xtu
_
_
_
_
1
k
j=1
p
j
F
G
(u|
j
,
j
)
_
_
g(x
t
|
t
,
t
, u)
_
_
j=1
_
a
j
1
j
e
b
j
(c
j
+1)
j
e
d
j
/
j
_
exp
_
(u
u
)
2
2
2
u
_
V
n/2+f
exp
_
2
n
t=1
(l
t
,t
)
2
o
_
exp
_
1
2C
,0
(
,0
m
,0
)
2
_
W
n/2+l
exp
_
2
n
t=1
(
,t
,t1
)
2
m
_
V
n/2+f1
exp
_
2
n
t=1
(l
t
,t
)
2
o
_
exp
_
1
2C
,0
(
,0
m
,0
)
2
_
W
n/2+l1
exp
_
2
n
t=1
(
,t
,t1
)
2
m
_
. (5.5)
E possvel encontrar uma forma conhecida para a distribui cao condicional completa
para a maioria dos par ametros denidos no modelo linear dinamico em (5.4). A unica
excec ao e para l
t
e l
t
quando x
t
> u. Os c alculos das distribuic oes condicionais com-
pletas e o algoritmo para estimacao dos parametros por MCMC est ao no Apendice 5.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 129
5.3 Simulac oes
Foram realizadas simulac oes do modelo MGPDLM
k
. Para cada simulac ao, foram
gerados n pontos de uma distribuic ao Gama(, /) com par ametros = 5 e = 1. O
limiar foi tomado no quantil 80 dos valores simulados. Para os valores das observac oes
maiores que o limiar, os valores foram substitudos por pontos gerados de uma distribuicao
GPD, cujos parametros foram gerados de acordo com uma estrutura din amica como na
equac ao (5.4), onde
,0
= 0, 2,
,0
= 2. Em relacao as precis oes do modelo din amico, as
simulacoes foram feitas em duas congurac oes. Na Congurac ao 1, V
= 200, W
= 1000,
V
= 200 e W
= 1000. Na Conguracao 2, V
= 2000, W
= 10000, V
= 2000 e
W
= 10000
Os valores das distribuic oes a priori foram dados por m
,0
=
,0
, m
,0
=
,0
, C
,0
=
100, C
,0
= 100. Para V
, V
, W
e W
, V
,
W
e W
para n = 1000 nas duas congurac oes simuladas. Pelas Figuras, a princpio
percebe-se que a distribuic ao a posteriori tem media pr oxima ao verdadeiro valor utilizado
na simulacao. Porem, em ambos os casos a variancia parece ser alta. Na Congura cao 1,
a variancia a priori dos parametros e de 10000, ou seja, o desvio padr ao e de 100 e um
intervalo de credibilidade de 95% na priori esta entre o valor verdadeiro mais ou menos 200.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 131
Pela Figura 5.3, o intervalo de credibilidade da distribuic ao a posteriori parece ter uma
amplitude muito proxima da priori. Portanto, os dados n ao est ao dando muita informac ao
nestes par ametros e quase toda a informac ao sobre estes parametros esta compreendida na
distribuic ao a priori. O mesmo caso acontece na Congurac ao 2, onde a vari ancia a priori
e de 1000000, com desvio padr ao de 1000. Pela Figura 5.4, observa-se que a distribui cao
a posteriori est a compreendida no valor verdadeiro mais ou menos 2000. Portanto, para
n = 1000 os dados nao trazem informa cao a respeito das vari ancias do modelo din amico.
Figura 5.3: Histograma de V
, V
, W
e W
, V
, W
e W
, V
,
W
e W
para n = 2500 nas duas congurac oes simuladas. Pela Figura, s ao observados
resultados muito pr oximos aos obtidos para quando n = 1000, ou seja, a vari ancia a
posteriori do limiar e praticamente a mesma da vari ancia a priori. Assim quase toda a
informac ao sobre estes quatro par ametros e fornecida pela distribui cao a priori, com os
dados praticamente nao dando informac ao alguma sobre estes parametros.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 134
Figura 5.6: Estimac ao de , ,
, V
, W
e W
, V
, W
e W
, V
, W
e W
e W
e W
2
(l
t
,t
)
2
_
.
Logo, l
t
|
lt
N(
,t
, 1/V
)
onde
lt
e o vetor com todos os par ametros do modelo, exceto l
t
.
Amostrando V
(V
,
V
) V
n/2+f
exp
_
V
n
t=1
(l
t
,t
)
2
2
+ o
__
. (5.6)
Logo, V
|
V
G
_
_
n
2
+ f
n
t=1
(lt
,t
)
2
2
+ o
,
n
2
+ f
_
_
,
onde
V
.
Amostrando W
,
W
) V
n/2+l
exp
_
W
n
t=1
(
,t
,t1
)
2
2
+ m
__
.
Logo, W
|
W
G
_
_
n
2
+ l
n
t=1
(
,t
,t1
)
2
2
+ m
,
n
2
+ l
_
_
,
onde
W
.
Amostrando
,0
De acordo com a equacao (5.5), pode-se encontrar a seguinte distribuicao condicional
completa para
,0
(
,0
|
,0
) exp
_
2
(
,1
,0
)
2
1
2C
,0
(
,0
m
,0
)
2
_
exp
_
1
2
_
2
,0
_
W
+
1
C
,0
_
2
,0
_
W
,1
+
m
,0
C
,0
___
= exp
_
1
2
_
W
+
1
C
,0
__
2
,0
2
_
W
,1
+
m
,0
C
,0
_
/
_
W
+
1
C
,0
___
.
Logo,
,0
|
,0
N
__
W
1
+
m
,0
C
,0
_
/
_
W
+
1
C
,0
_
, 1/
_
W
+
1
C
,0
__
,
onde
,0
e o vetor com todos os par ametros, exceto
0
.
Amostrando
,t
, de acordo com a equa cao (5.5), tem-se
Para t = 1, . . . , n 1,
(
,t
|
,t
) exp
_
2
(l
t
,t
)
2
2
(
,t+1
,t
)
2
2
(
,t
,t1
)
2
_
exp
_
1
2
_
2
,t
(V
+ 2W
) 2
,n
(W(
,t+1
+
,t1
) + V
l
t
)
_
_
= exp
_
1
2
(2W
+ V
)
_
2
,t
2 (W
(
,t1
+
,t+1
) + V
l
t
) / (2W
+ V
)
_
_
.
Logo,
,t
|
,t
N ((W
(
,t1
+
,t+1
) + V
l
t
) / (2W
+ V
) , 1/ (2W
+ V
)) ,
onde
,t
e o vetor com todos os par ametros, exceto
,t
, t = 1, . . . , n 1.
Abordagem Bayesiana nao-parametrica para analise de valores extremos 158
Amostrando
,n
De acordo com a equacao (5.5), pode-se encontrar a seguinte distribuicao condicional
completa para
,n
(
,n
|
,n
) exp
_
2
(l
n
,n
)
2
2
(
,n
,n1
)
2
_
exp
_
1
2
_
2
,n
(V
+ W
) 2
,n
(W
,n1
+ V
l
n
)
_
_
= exp
_
1
2
(W
+ V
)
_
2
,n
2 (W
,n1
+ V
l
n
) / (W
+ V
)
_
_
.
Logo,
,n
|
,n
N ((W
,n1
+ V
l
n
) / (W
+ V
) , 1/ (W
+ V
)) ,
onde
,n
e o vetor com todos os par ametros, exceto
,n
.
Para os parametros l
t
, V
, W
e
,t
, t=0,...,n, o calculo das distribuic oes condicionais
completas e an alogo aos par ametros que envolvem .
Para os outros par ametros, nao e possvel encontrar uma forma conhecida para as dis-
tribuic oes condicionais completas das suas distribuic oes a posteriori. O algoritmo MCMC
de estimac ao das distribuic oes a posteriori dos par ametros deste modelo e dado na seguinte
forma:
Algoritmo 4
Dados os valores dos parametros ate a iterac ao s, novos valores da cadeia s ao gerados
da seguinte maneira:
Amostrando {l
t
}
n
t=1
Para um valor t entre 1 e n, se x
t
< u
(s)
, tem-se a forma conhecida da distribuicao
condicional completa, e o par ametro e atualizado por: l
(s+1)
t
N(
(s)
,t
, 1/V
(s)
).
Agora, se x
t
u
(s)
sua condicional completa nao tem forma conhecida, sendo
necess ario amostrar l
t
pelo algoritmo de Metropolis. Um candidato para l
t
e
a Normal truncada N(l
(s)
t
, K
,t
)I(
U
, ), onde
U
= log(
(s)
t
/(x
t
u
(s)
) + 1),
Abordagem Bayesiana nao-parametrica para analise de valores extremos 159
(s)
t
= exp(l
(s)
t
). Assim, l
(s+1)
t
= l
t
com probabilidade
l
, onde
l
= min
_
_
_
1,
(
|x)((l
(s)
t
U
)/
_
K
,t
))
(
|x)((l
t
U
)/
_
K
,t
))
_
_
_
,
= (
(s)
,
(s)
, p
(s)
, u
(s)
, l
(s)
, l
(s+1)
<t
, l
t
, l
(s)
>t
) e
= (
(s)
,
(s)
, p
(s)
, u
(s)
, l
(s)
, l
(s+1)
<t
, l
(s)
t
).
Amostrando {l
t
}
n
t=1
Para um valor t entre 1 e n, se x
t
< u
(s)
, tem-se a forma conhecida da distribuicao
condicional completa, e o parametro e atualizado por: l
(s+1)
t
N(
(s)
,t
, 1/V
(s)
).
Agora, se x
t
u
(s)
sua condicional completa n ao tem forma conhecida e e necess ario
amostrar l
t
pelo algoritmo de Metropolis.
Se
(s+1)
t
= exp(l
(s+1)
t
) 1 > 0, amostra-se l
t
de uma N(l
(s)
t
, K
,t
).
Assim, l
(s+1)
t
= l
t
com probabilidade
l
, onde
l
= min
_
1,
(
|x)
(
|x)
_
.
Se
(s+1)
t
< 0, um candidato para l
t
e a Normal truncada N(l
(s)
t
, K
,t
)I(
U
, ),
onde
U
= log(
(s)
t
) + log(x
t
u
(s)
). Assim, l
(s+1)
t
= l
t
com probabilidade
l
,
com
l
= min
_
_
_
1,
(
|x)((l
(s)
t
U
)/
_
K
,t
))
(
|x)((l
t
U
)/
_
K
,t
))
_
_
_
, onde
= (
(s)
,
(s)
, p
(s)
, u
(s)
, l
(s+1)
<t
, l
t
, l
(s)
>t
, l
(s+1)
) e
= (
(s)
,
(s)
, p
(s)
, u
(s)
, l
(s+1)
<t
, l
(s)
t
, l
(s+1)
).
Amostrando u
O valor do limiar u
com
probabilidade
u
, onde
u
= min
_
_
_
1,
(
|x)((u
(s)
u
(s)
L
)/
V
u
)
(
|x)((u
u
(s)
L
)/
V
u
)
_
_
_
,
= (
(s)
,
(s)
, p
(s)
, u
, l
(s+1)
, l
(s+1)
) e
= (
(s)
,
(s)
, p
(s)
, u
(s)
, l
(s+1)
, l
(s+1)
).
Amostrando , , p
Para amostrar os vetores , e p, o procedimento e igual ao Algoritmo 2.
Amostrando V
, W
,
,t
, V
, W
e
,t
, t=0,...,n.
Pela forma da distribuicao a posteriori em 5.5, pode-se encontrar distribui coes condi-
cionais completas conhecidas para o seguintes parametros
V
(s+1)
G
_
_
f
+
n
2
o
n
t=1
(l
(s+1)
t
(s)
,t
)
2
, f
+
n
2
_
_
,
W
(s+1)
G
_
_
l
+
n
2
m
n
t=1
(
(s)
,t
(s)
,t1
)
2
, l
+
n
2
_
_
,
(s+1)
,0
N
_
_
W
(k+1)
(k)
,1
+ m
,0
/C
,0
W
(k+1)
+ 1/C
,0
,
1
W
(k+1)
+ 1/C
,0
_
_
,
(s+1)
,t
N
_
_
V
(s+1)
l
(s+1)
t
+ W
(s+1)
(
(s)
,t+1
(s+1)
,t1
)
V
(s+1)
+ 2W
(s+1)
,
1
V
(s+1)
+ 2W
(s+1)
_
_
,
t = 1, . . . , n 1,
(s+1)
,n
N
_
_
V
(s+1)
l
(s+1)
n
+ W
(s+1)
(s+1)
,t1
V
(s+1)
+ W
(s+1)
,
1
V
(s+1)
+ W
(s+1)
_
_
,
V
(s+1)
G
_
_
f
+
n
2
o
n
t=1
(l
(s+1)
t
(s)
,t
)
2
, f
+
n
2
_
_
,
W
(s+1)
G
_
_
l
+
n
2
m
n
t=1
(
(s)
,t
(s)
,t1
)
2
, l
+
n
2
_
_
,
(s+1)
,0
N
_
_
W
(k+1)
(k)
,1
+ m
,0
/C
,0
W
(k+1)
+ 1/C
,0
,
1
W
(k+1)
+ 1/C
,0
_
_
,
(s+1)
,t
N
_
_
V
(s+1)
l
(s+1)
t
+ W
(s+1)
(
(s)
,t+1
(s+1)
,t1
)
V
(s+1)
+ 2W
(s+1)
,
1
V
(s+1)
+ 2W
(s+1)
_
_
,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 161
t = 1, . . . , n 1,
(s+1)
,n
N
_
_
V
(s+1)
l
(s+1)
n
+ W
(s+1)
(s+1)
,t1
V
(s+1)
+ W
(s+1)
,
1
V
(s+1)
+ W
(s+1)
_
_
.
Captulo 6
Conclus oes e continuac oes
Baseado no trabalho realizado, pode-se tirar as seguintes conclusoes:
embora a estimativa n ao-parametrica baseada numa aproxima cao por mistura tenha
resultado em boas predic oes para dados extremos, ela nao e tao eciente na es-
timac ao da cauda e dos valores em torno do limiar como o modelo que utiliza a
distribuic ao GPD, que na teoria, pelo Teorema de Pickands (1975), e a indicada
para a cauda;
em alguns casos, como nos apresentados nas aplicac oes, e necess ario predizer a
distribuic ao por uma mistura com mais de uma componente. Embora eciente em
alguns casos, o modelo de Behrens et al. (2004) n ao seria apropriado em alguns casos
onde os dados s ao positivos, mas n ao possuem distribuic ao Gama. Mostrou-se que a
abordagem nao-parametrica por mistura engloba uma ampla classe de distribuic oes,
e que n ao e necessario um grande n umero de componentes na mistura para se fazer
uma boa predicao;
o modelo de mistura com GPD se mostra mais eciente na estimac ao do limiar
quando e maior o tamanho da amostra. Quando este tamanho e menor, e necess ario
impor uma distribuic ao a priori pr oxima do verdadeiro valor do limiar, ou proxima
de um valor que sup oe-se ser o limiar, geralmente um quantil alto dos dados. Com n
162
Abordagem Bayesiana nao-parametrica para analise de valores extremos 163
pequeno, ha poucas observac oes para realizar a estimac ao dos parametros da cauda,
o que torna difcil a estimac ao destes par ametros;
o criterio de comparacao de modelos BIC pareceu ser o mais eciente de acordo com
as simula coes, e mostrou nas aplica coes, que o melhor modelo e exatamente o que
utiliza mistura com mais de uma componente com GPD na cauda. O criterio DIC,
embora com varias restricoes na literatura, pareceu ser um bom criterio de com-
parac ao de acordo com as simulacoes. Na abordagem que utiliza modelos din amicos,
o DIC e a medida mais adequada para vericar o ajuste do modelo;
o modelo que considera estrutura de modelos de regressao na cauda se mostrou muito
eciente, onde as covari aveis, escolhidas de maneira adequada, forneceram uma
informac ao que ajudou a explicar o comportamento da variavel, podendo-se estimar
de maneira mais precisa valores dos parametros em particulares congura coes de
covariavel, ou seja, pode-se encontrar distribuic oes para os parametros da cauda
em uma determinada cidade em um especco mes do ano. Alem disso, a estimac ao
trouxe informa coes importantes como valores de m aximos e quantis elevados, quando
foram estudadas temperaturas maximas, e mnimos e quantis baixos, quando o
objetivo foi analisar temperaturas mnimas;
alem de dados ambientais, este trabalho mostrou em seu ultimo modelo a an alise de
retornos nanceiros. Para estes dados, foi feita uma estrutura de modelos din amicos
para os par ametros da cauda da distribuicao. Este metodo se mostrou eciente,
com o comportamento dos par ametros variando com o tempo, acompanhando nas
observacoes os perodos de crise na economia.
Este trabalho pode ter continuidade em v arias direc oes, entre elas:
Utilizar uma estrutura espaco-temporal para os par ametros da cauda. Em muitas
aplicac oes, o comportamento de uma vari avel pode estar relacionado com o que
Abordagem Bayesiana nao-parametrica para analise de valores extremos 164
ocorre em regi oes vizinhas. Detalhes de modelos espaco-temporais podem ser vistos,
por exemplo em Cressie (1993). Considere uma regiao espacialmente contnua D
R
2
, no qual somente para um conjunto n de posic oes xas (s
1
, . . . , s
n
), s ao conhe-
cidas as medidas de interesse Y = (Y (s
1
), . . . , Y (s
n
))
. O objetivo da estatstica
espacial e fornecer para qualquer s
0
D a melhor estimativa Y (s
0
) a partir de Y.
Uma abordagem usual decomp oe Y nas seguintes componentes:
Y = (media) + (componente espacial) + (erro de medida)
= +Z + ,
onde e a media que pode ser por exemplo uma forma linear = X. A componente
Z e um vetor (n 1) de realiza cao de um campo aleatorio com vetor de medias 0.
Em muitas aplicac oes, Z e assumido ser um processo Gaussiano, ou seja, possui
distribuic ao multivariada com media 0 e matriz de covariancia . No contexto da
teoria espacial cl assica, e utilizada a simplicac ao =
2
, onde e a matriz de
correlac ao e
2
e uma vari ancia constante, igual para todos os Z(s).
Outra simplicac ao ocorre do fato da matriz de correlacao depender apenas de uma
func ao das dist ancias s
i
e s
j
, ou seja,
i,j
= (Z(s
i
), Z(s
j
)) = (| s
i
s
j
|) = (| |),
para todo i = 1, . . . , n e j = 1, . . . , n. Existem v arios tipos de fun cao de correla cao.
Um exemplo e a fun cao de correlacao exponencial, dada por
= exp (| |),
onde e uma func ao que mede como a correlac ao decai com a distancia.
Em rela cao a analise de valores extremos, pode-se propor a adic ao da componente
espacial para os par ametros da cauda de maneira parecida ao do Captulo 4, da
Abordagem Bayesiana nao-parametrica para analise de valores extremos 165
seguinte maneira
u = x
u
u
+Z
u
= exp{x
+Z
} 1
= exp{x
+Z
},
onde u = (u
1
, . . . , u
n
), = (
1
, . . . ,
n
) e = (
1
, . . . ,
n
). Cada par ametro possui
um vetor de componente espacial, e os novos par ametros seriam os par ametros da
func ao de correla cao em Z
u
, Z
e Z
.
Fazer um modelo dinamico mais estruturado, considerando tambem o limiar vari-
ando no tempo. O modelo linear din amico geral, visto, por exemplo em West e
Harrison (1997), e escrito da seguinte forma
y
t
= F
t
+ v
t
v
t
N(0, 1/V )
t
= G
t
t1
+ w
t
w
t
N(0, 1/W).
(6.1)
Note que o modelo do Captulo 5 e um caso particular do modelo acima, onde
y
t
, e um dos parametros da cauda, por exemplo l
t
= log(
t
), F
t
= 1 e G
t
= 1.
Uma primeira extens ao natural seria considerar tambem o modelo din amico para o
limiar, pois o valor da variavel considerada evento extremo pode se alterar ao longo
do tempo, principalmente em dados nanceiros onde nveis de retornos e valores de
ac oes tem uma grande diferen ca ao longo das decadas.
Alem do modelo dinamico de primeira ordem, pode ser sugerido um modelo din amico
de ordem maior, que pode fornecer maior informacao de como os par ametros se
movem com o tempo. Huerta e Sans o (2007) utilizam um modelo linear dinamico de
segunda ordem para o parametro de loca cao da distribuicao GEV, onde F
t
= (1 0),
t
= (
t
,
t
),
G
t
=
_
_
_
1 1
0 1
_
_
_,
Abordagem Bayesiana nao-parametrica para analise de valores extremos 166
v
t
N(0, V ) e w
t
= (w
, w
t
=
t
+ v
t
t
=
t1
+
t1
+ w
t
=
t1
+ w
.
Seguindo esta ideia, pode-se se fazer um modelo linear dinamico de segunda ordem
para cada um dos parametros da cauda.
Unir as ideias dos Captulos 4 e 5, realizando uma regress ao din amica para os
par ametros da cauda. Em aplicacoes de valores extremos, alem das vari aveis de
interesse, os valores das covari aveis tambem podem se alterar ao longo do tempo.
Por isso, e importante propor um modelo que considera este tipo de comportamento
para as covariaveis. A estrutura deste modelo tambem e um caso particular da
equac ao (6.1), onde para um unico parametro da cauda, considerando a presenca de
p covariaveis no modelo, F
t
= (1, x
1,t
, . . . , x
t,p
), G = I
n
,
t
= (
t,0
, . . . ,
t,p
). Assim,
no caso especco de regress ao no par ametro de escala da ditribuic ao GPD denotado
por , o modelo para l
t
= log(
t
) e dado por
l
t
=
t,0
+
t,1
x
t,1
+ . . . +
t,p
x
t,p
+ v
t
t,i
=
t1,i
+ w
i,t
, i = 0, . . . , p.
Note que neste modelo os par ametros tambem variam ao longo do tempo. Um
modelo analogo pode ser construdo para os parametros l
t
= log(1 +
t
) e u
t
.
Em relac ao ao limiar, e necess ario ter cautela em fazer a estima cao devido a dicul-
dade de estima cao deste parametro, principalmente quando o tamanho da amostra
n ao e muito grande, sendo necess ario dar uma informacao com uma precis ao alta,
como pode ser visto na estimac ao dos Captulos 3, 4 e 5.
Referencias
ASMUSSEN, S. (1987). Applied Probability and Queues, New York: Wiley.
BEHRENS, C. , GAMERMAN, D. e LOPES, H. F. (2004). Bayesian analysis of extreme
events with threshold estimation, Statistical Modelling, 4, 227-244.
BERMUDEZ, P. , TURKMAN, M. A. e TURKMAN, K. F. (2001). A predictive approach
to tail probability estimation, Extremes, 4:4, 295-314.
BOX, G. E. P. e TIAO, G. C. (1973). Bayesian Inference in Statistical Analysis, Addison
Wesley, California.
CABRAS, S. , CASTELLANOS, M. A. e GAMERMAN, D. (2009). A default approach
for regression on parameters of generalized Pareto distribution, Relatorios Tecnicos, LES,
UFRJ.
CASTELLANOS, M. A. e CABRAS, S. (2007). A default Bayesian procedure for the
generalized Pareto distribution, Journal of Statistical Planning and Inference, 137, 473-
483.
CELEUX, G., HURN, M. e ROBERT, C. P. (2000). Computational and inferential di-
culties with mixture posterior distributions, Journal of the American Statistician Associ-
ation, 95, 957-970.
CHAVES-DEMOULIN, V. e DAVISON, A. C. (2005). Generalized additive modelling of
sample extremes, Applied Statistics, 54, 207-222.
COLES, S. G. e TAWN, J. A. (1996). A Bayesian analysis of extreme rainfall data,
Applied Statistics, 45, 463-478.
COLES, S. G. (2001). Extreme Value Theory an Applications, Edited by Galambos,
167
Abordagem Bayesiana nao-parametrica para analise de valores extremos 168
J.;Lechner, J.;Mimiu, E.[s.l.]: Kluver Academic Publishers.
CRESSIE, N. (1993). Statistical for Spatial Data, New York: Wiley
DAVISON, A. C. e SMITH, R. L. (1990). Models for exceedances over high thresholds,
Journal of the Royal Statistical Society: Series B, 52, 393-442.
DE VORE R., e LORENTZ, G. (1993). Constructive Approximation, New York: Springer
Verlag
DIEBOLT, J. e ROBERT, C. (1994). Estimation of nite mixture distributions by
Bayesian sampling, Journal of the Royal Statistical Society Series B, 56, 363-375.
DOORNIK, J. A. (1996). Ox: Object Oriented Matrix Programming, 3.1 Console Version.
Nueld College, Oxford University, London.
EMBRECHTS, P., K