Você está na página 1de 12

Estudo da precipitação pluvial máxima em

Presidente Prudente usando Inferência Bayesiana

Marcelo Hartman
Fernando A. Moala

RESUMO

As chuvas intensas causam grande prejuízo, acarretando inundações, danos nas


estradas, erosão no solo e prejuízos à agricultura, dentre outros. O conhecimento do
comportamento das precipitações pluviais máximas é muito importante para o
planejamento de engenharia hidráulica, tais como controle de enchentes e construção
de barragens, e agronômica, tais como época adequada para o plantio e conservação
do solo. Qualquer dessas obras deve ser planejada com base em valores extremos de
quantidade de chuva (Vieira e Carvalho, 2001). Assim, considerando a importância
sócio-econômica da região de Presidente Prudente, este estudo teve como objetivo
estimar a precipitação pluvial máxima esperada para diferentes níveis de
probabilidade e verificar o grau de ajuste dos dados ao modelo Gumbel, com as
estimativas dos parâmetros obtidas pelo método de máxima verossimilhança.

PALAVRAS CHAVES: Precipitação máxima, obras hidráulicas, estimador de


máxima verossimilhança, distribuição Gumbel, intervalo de confiança.

1
1. INTRODUÇÃO

A caracterização da precipitação pluvial constitui um importante elemento de

2
2. MATERIAL E MÉTODO

Os dados de precipitação pluviométrica utilizados na pesquisa foram obtidos


da Estação Meteorológica da Faculdade de Ciências e Tecnologia da Universidade
Estadual Paulista, campus de Presidente Prudente (SP), compreendendo um período
de 57 anos, de janeiro de 1947 a dezembro de 2003. Dessa forma, o conjunto de dados
de precipitação pluvial máxima, representando uma amostra, é composto do maior
valor diário registrado no mês para cada ajuste aos dados de precipitação máxima,
agrupados nas quatro estações do ano, pelo teste de Kolmogorov-Smirnov,
comprovando-se que a distribuição Gumbel é realmente apropriada para valores de
precipitação máxima. Contudo, quando o período de observação foi de um mês,
observou-se um razoável ajustamento da distribuição de Gumbel apenas para os
meses de Fevereiro, Julho e Novembro, havendo um razoável ajustamento para os
demais meses, conforme avaliado pelo teste Kolmogorov-Smirnov.
A distribuição Gumbel, também conhecida como distribuição valor extremo,
surge como distribuição limite para máximos ou mínimos (valores extremos) de uma
amostra de variáveis aletórias independentes, identicamente distribuídas, quando o
tamanho da amostra aumenta. A distribuição Gumbel (para valores máximo) tem a
função densidade de probabilidade dada por:

0 (B l 9ß :) œ :" /B:š B 9
: /B:š : ››,
B 9
(1)

para ∞ B ∞, ∞ 9 ∞, : 0, onde 9 é o parâmetro de locação e : é


o parâmetro de escala.
A probabilidade T de que ocorra uma precipitação pluvial máxima maior que
um certo valor B é dada por,

T œ T Ö\ B× œ 1 /B:š /B:š : ››
B 9
, (2)

em que B é a precipitação máxima do período e 0 B ∞.

3
Figura 1: Gráfico da densidade (1) e função de probabilidade (2) da
distribuição Gumbel para 9 œ 0.

2.1 ESTIMAÇÃO DE MÁXIMA VEROSSIMILHANÇA

Considere a situação onde uma amostra aleatória B" , . . ., B8 é tirada da


distribuição Gumbel em (1). A função de verossimilhança para os parâmetros 9 e : é
então dada por,

:8 /B:š /B:š : ››
8
" 8 _ B3 9
PÐ9ß : | BÑ œ : ÐB 9) (3)
3œ"

O estimador de máxima-verossimilhança é obtido como segue. De (3) a função


log-verossimilhança é dada por

/B:š : ›
8
8 _ B3 9
_ œ 691 P(9ß : | B) œ 8691Ð:) : ÐB 9) (4)
3œ"
e as equações de verossimilhança tornam-se

/B:š : ›
8
`_ 8 " B3 9
`9 œ : : (5)
3œ"

: /B:š : ›.
8
`_ 8 8 _ " B3 9 B3 9
e `: œ : :# ÐB 9) : (6)
3œ"

Os estimadores de máxima verossimilhança 9 s e :s são obtidos resolvendo


`_ `_
`9 œ 0 e ` : œ 0 simultaneamente. Um modo conveniente para fazer isto, é notar que
fazendo (5) igual a zero temos
/9 œ ’ 8" /B:š s ›“
8 :
s
s B3
: . (7)
3œ"

4
`_
e substituindo isto em `: œ 0 obtemos
B3 /B:š :s3 ›
8
B

3œ"
_
:
s B œ 0. (8)
/B:š :s3 ›
8
B

3œ"

se:
Para encontrar 9 s podemos então determinar :
s como solução de (8) e então
s em (7). Uma vez que (8) não pode ser resolvido analiticamente para :
obter 9 s,
deveríamos usar um método numérico, por exemplo Método de Newton-Raphson.
De (2), o estimador de máxima verossimilhança da probabilidade T é dado por

/B:š /B:š s ››
B 9s
s œ"
T . (9)
:

A precipitação pluvial máxima esperada pode ser estimada tambem usando a


função inversa de (2), fixando-se os níveis de probabilidade T . Assim, a precipitação
pluvial máxima provável para uma determinada probabilidade pode ser determinada
pela seguinte expressão:
B: œ 9
s s : s691Š691Š " ‹‹. " T (10)

A estimação pontual não permite julgar qual a possível magnitude do erro que
estamos cometendo, isto é, não nos dá uma idéia acerca da maior ou menor diferença
entre a estimativa do parâmetro que estamos interessado em estimar e seu verdadeiro
valor. Então, a inferência pode ser complementada com a construção de intervalos de
confiança, de forma que valores dentro do intervalo seriam melhores estimadores dos
parâmetros do que valores fora do intervalo.
A estimação com intervalos de confiança para os parâmetros do modelo pode
ser obtida pela aproximação normal assintótica dos estimadores de máxima
verossimilhança, isto é,
Ð9sß : sß :
sÑ µ R# ÒÐ9ß :Ñß M " Ð9 sÑÓ , (11)

para 8 Ä ∞, onde M (9ß :) é a matriz de Informação de Fisher dada por

8 8
M (9ß :) œ –
< (2)Ó —
:2 :2 Ò1+<(1)Ó
8 8 # , (12)
:2 Ò1+<(1)Ó :2 Ò1+<(2)

.
e <(5 ) é a função digama <(5 ) œ .5 >(5 ) (veja Lawless,1982).
Assim as regiões de confiança conjunta aproximadas para 9 e : podem ser
obtidas. Intervalos de confiança individuais aproximados para os parâmetros 9 e :
com coeficiente de confiança 100(1 α)% são dados por

5
s
9 D α# É@+<Ð9
sÑ 9 s
9 D α# É@+<Ð9
sÑ (13)

D α# È@+<Ð: D α# È@+<Ð:
e
:
s sÑ : :
s sÑ (14)

onde – —œM
@+<Ð9sÑ sß :
-9@Ð9 sÑ " sß :
Ð9 s Ñ.
sß :
-9@Ð9 sÑ @+<Ð:sÑ

The Bayesian inference for estimation of parameters is an attractive framework


in practical problems and has grown in popularity in recent years. Besides the
Bayesian framework offers the possibility to incorporate prior knowledge into
inference resulting in improved parameter estimates, as well as offering more reliable
results for smaller samples.

We will employ Markov chain Monte Carlo (MCMC) techniques to draw a


large sample from the posterior distribution of these hyperparameters. Because of the
intractability of the joint density, we use a Metropolis-Hastings sampler.

2.2 ESTIMAÇÃO BAYESIANA

???????????

No presente trabalho, dispomos de uma grande amostra, 8 œ &(, e não temos


informação à priori sobre os parâmetros 9 e :, uma priori não-informativa adequada é
dada por:
1Ð9ß :Ñ α :"5 (9)

é apropriada, onde 5 depende da priori escolhida. Temos 5 œ #, para priori de Jeffreys


(veja Anexo 2), e 5 œ " para Reference, MDIP e Tibishirani (Moala e Rodriguez
2007). De (8) e (9), aplicando o teorema de bayes, temos a posteriori conjunta dos
parâmetros (9ß :) dada por:

/B:œ /B:œ : 
8
" 8 B3 9
:Ð9ß :lBÑ œ :8 5 : ÐB 9Ñ (10)
3œ"

as inferências são tipicamente sobre as distribuições marginais dos parâmetros, 9 e :,


dadas por:

6
:Ð9lBÑ œ - '! 5 /B: œ /B:œ : . :
8
∞ " 8 B3 9
:8 : ÐB 9Ñ (11)
3œ"
e
:Ð:lBÑ œ - ' 5 /B: œ /B:œ : . 9
8
∞ " 8 B3 9
∞ :8 : ÐB 9Ñ (12)
3œ"
sendo
œ '! ' ∞ :8" 5 /B:œ /B:œ : . 9 . :
8
" ∞ ∞ 8 B3 9
- : ÐB 9Ñ
3œ"

Uma vez obtido a posteriori marginal dos parâmetros 9 e : dadas em (11) e


(12) respectivamente, podemos calcular a moda, média e mediana dadas nas equações
abaixo:
Moda À `:Ð9lBÑ œ !ß tal queß 9
`9
s maximiza :Ð9lBÑ

Média : I c9lBd œ '9 9:Ð9lBÑ. 9

s tal que ' 9s :Ð9lBÑ. 9 œ 's∞ :Ð9lBÑ. 9 œ !Þ&


Mediana À Obter um 9 ∞ 9

fazendo, também, de modo análogo para :.


Considerando que as estimações pontuais resumem toda a informação dos
dados, não sabemos o erro acerca dos estimadores acima citados, então, para obter
esta incerteza, calculamos intervalos de credibilidade 95%, sendo necessário obter-se

9" e 9# ß tal que, '9"# :Ð9lBÑ. 9 œ !Þ*&


o seguinte valor:
9

' :# :Ð:lBÑ. :
e
:" e :# ß tal que, :" œ !Þ*&

No entanto, as expressões (11) e (12) não são analiticamente conhecidas, o que


nos leva a utilizar o MCMC para simplificar a obtenção dos resultados. Primeiramente
gerou-se uma amostra de 10000 valores e eliminou-se os 5000 primeiros, com estes
valores, obteve-se estimativas amostrais da moda, média e média, juntamente com os
intervalos de credibilidade.

7
4. RESULTADOS E DISCUSSÃO

Abaixo, as tabelas mostram as estimativas amostrais para todos os meses e


cada priori utilizada.

OS EMV SÃO OBTIDOS NO ARTIGO MOALA&MARCELO (***)

Tabela 1: Estimação pontual do parâmetro 9 de acordo com os meses para as quatro prioris
Mês Jeffreys Reference Uniforme EMV
Janeiro 40.3448 (3.2987) 40.3791 (3.2374) 40.6987 (3.6382) 41.452 (***)
Fevereiro 41.8011 (3.7985) 41.9167 (3.7430) 41.8324 (3.5924) 43.374 (***)
Março 29.5562 (2.1793) 29.7062 (2.0422) 29.7292 (2.1928) 30.241 (***)
Abril 22.3563 (2.1386) 22.2582 (2.1881) 22.5213 (2.1471) 22.461 (***)
Maio 23.4990 (2.4147) 23.8457 (2.5623) 23.7920 (2.6112) 23.952 (***)
Junho 15.7421 (2.2348) 15.7962 (2.3828) 15.9308 (2.2796) 16.467 (***)
Julho 9.8996 ( 2.0990) 10.000 (2.0031) 10.2051 (2.0947) 10.101 (***)
Agosto 8.2888 (1.5225) 8.3464 (1.6535) 8.3603 (1.5415) 8.662 (***)
Setembro 16.8620 ( 1.9260) 17.0958 (1.9906) 17.1347 (1.9829) 16.955 (***)
Outubro 30.7425 (2.5618) 30.8538 (2.6583) 31.1642 (2.5428) 31.085 (***)
Novembro 33.4887 (2.8639) 33.4625 (3.0045) 33.5220 (2.9537) 34.581 (***)
Dezembro 35.7262 (2.6995) 35.8045 (2.8064) 35.8905 (2.8384) 36.694 (***)

Tabela 2: Estimação pontual do parâmetro : de acordo com os meses para as quatro prioris
Mês Jeffreys Reference Uniforme EMV
Janeiro 21.2506 (2.3359) 21.5358 (2.3781) 21.7879 (2.6346) 23.314 (***)
Fevereiro 24.4684 (2.6753) 24.5734 (2.7313) 24.7660 (2.6825) 27.303 (***)
Março 13.6275 (1.5284) 13.7793 (1.6368) 13.9312 (1.5329) 14.342 (***)
Abril 14.2526 (1.5360) 14.3032 (1.6451) 14.6745 (1.6650) 14.115 (***)
Maio 15.9403 (1.8032) 16.1326 (1.8989) 16.3048 (1.8966) 15.798 (***)
Junho 15.1305 (1.7780) 15.1294 (1.7133) 15.3002 (1.6772) 16.058 (***)
Julho 13.4163 (1.8360) 13.7832 (1.7990) 14.0160 ( 1.8431) 12.970 (***)
Agosto 9.8217 (1.2134) 9.9346 (1.2123) 9.9504 (1.2539) 10.241 (***)
Setembro 12.3854 (1.5234) 12.5618 (1.4879) 12.6616 (1.5703) 11.554 (***)
Outubro 16.3029 (1.6921) 16.4024 (1.9783) 16.7171 (2.0489) 16.127 (***)
Novembro 17.8615 (1.9528) 18.0532 (2.0117) 18.3787 (2.1879) 19.446 (***)
Dezembro 17.0839 (1.8229) 17.1414 (1.7479) 17.4788 (1.8851) 18.291 (***)

????????????

8
Tabela 3: Estimação intervalar do parâmetro 9 de acordo com os meses para as
quatro prioris
Mês Jeffreys Reference Uniforme EMV
Janeiro (33.8477;46.8125) (34.1148;46.6131) (34.1206;47.7325) (35,98;46,92)
Fevereiro (34.1749;49.3806) (34.6299;49.7554) (34.8331;49.0666) (37,02;49,72)
Março (25.5655;33.7104) (25.8340;33.9930) (26.0021;34.3115) (26,87;33,60)
Abril (17.9152;26.6853) (17.9758;26.3725) (18.4127;26.6607) (19,15;25,76)
Maio (18.8800;28.3575) (19.2307;28.8409) (18.6033;29.0466) (20,28;27,62)
Junho (11.5508;20.0808) (11.3091;20.2276) (11.2405;20.2117) (12,73;20,20)
Julho (5.6800;13.7461) (6.1397;13.6607) (5.7920;14.3867) (7,06;13,14)
Agosto (5.3239;11.2954) (5.1913;11.2886) (5.3474;11.5658) (6,24;11,09)
Setembro (13.1674;20.5451) (13.2554;21.1165) (13.3702;21.4859) (14,27;19,64)
Outubro (26.0433;35.9277) (26.0140;35.9696) (26.4976;36.5081) (27,30;34,87)
Novembro (27.8625;38.8684) (27.3918;39.2929) (27.1868;39.3335) (29,93;39,23)
Dezembro (30.5434;40.7359) (30.3648;41.2225) (30.7153;41.3824) (32,36;41,02)

Tabela 4: Estimação intervalar do parâmetro : de acordo com os meses para as


quatro prioris
Mês Jeffreys Reference Uniforme EMV
Janeiro (17.3797;26.6866) (17.3987;26.7565) (17.2938;27.7794) (18,99;27,63)
Fevereiro (19.7649;30.1752) (19.8289;30.6419) (20.1611;30.8876) (22,28;32,32)
Março (11.0084;16.8029) (10.9790;17.3195) (11.3293;17.0829) (11,68;17,00)
Abril (11.4698;17.3935) (11.6058;18.1979) (11.5735;18.1862) (11,73;16,95)
Maio (12.7569;19.8138) (13.1456;20.4619) (12.8374;20.2794) (12,89;18,70)
Junho (12.1733;18.9165 (12.4243;19.0761) (12.4867;18.8957) (13,10;19,01)
Julho (10.2825;17.2628) (10.8732;17.7255) (10.8516;18.1260) (10,56;15,37)
Agosto (7.8083;12.4749) (7.9261;12.5067) (7.7104;12.7838) (8,32;12,15)
Setembro (9.9350;15.7045) (10.1141;15.9831) (9.9889;16.3575) (9,43;13,67)
Outubro (13.6208;20.0902) (13.0653;20.7029) (13.2275;21.1139) (13,14;19,12)
Novembro (14.3084;22.0335) (14.6767;22.4140) (14.7892;23.3293) (15,77;23,12)
Dezembro (13.8336;20.9748) (14.1279;20.8333) (14.1565;21.6398) (14,87;21,71)

Pode-se aferir a partir dos resultados, a existência de um bom comportamento


dos dados via MCMC, no entanto, o resultados mostram que a inferência com as
prioris utilizadas pouco diferem entre si, a maioria dos intervalos de credibilidade em
relação as intervalos de confiança são maiores para praticamente todos os meses.
Na estimação pontual dos parâmetros, a moda pouco difere dos estimadores de
máxima-verossimilhança para quase todos os meses no parâmetro de locação 9, no
parâmetro :, existe uma maior discrepância para os meses, no entanto, pouco
significativa.

9
Podemos concluir que devido ao tamanho expressivo da amostra, 57 anos, os
resultados, praticamente, tanto na abordagem Bayesiana, como na abordagem
frequentista, são similares. Muito embora a medida de incerteza acerca dos intervalos
de confiança sejam levemente menor, a interpretação dos resultados é diferente, pois
os intervalos de credibilidade expressam de forma probabilística a pertinência do
parâmetro ou não ao intervalo.
Os gráficos abaixo mostram claramente o comportamento dos dados via
MCMC, nota-se também a grande similaridade das prioris utilizadas para todos os
meses. As taxas de aceitação ficam em torno 35% - 55% para o parâmetro 9 e 15% -
35% para o parâmetro :. Todas a cadeias passaram no teste de convergência de
Geweke (1992)
******

Utilizando-se a distribuição Gumbel com as estimativas dos parâmetros obtidos


pelo método da máxima verossimilhança dadas na Tabela 1, calculou-se a
precipitação pluvial diária máxima provável para períodos de retorno de 2, 4, 10, 20,
40 e 50 anos ou, respectivamente níveis de probabilidade: 50, 75, 90, 95, 97.5 e 98
por cento nos períodos mensais. Os intervalos de confiança 95% associdados aos
períodos de retorno e anos também são avaliados, revelando que os maiores níveis
de retorno registram-se nos meses de Janeiro e Fevereiro. Os resultados são
apresentados na Tabela 2.
As informações contidas na Tabela 2 podem ser interpretadas como, as
estimativas das precipitações diárias máximas no período de um mês e um ano. Por
exemplo, considerando o mês de Janeiro e o nível de probabilidade de 95%, verifica-
se que a precipitação máxima esperada é maior que 38 mm, ou seja, espera-se que em
1 de cada 20 anos, o valor da precipitação diária máxima em Janeiro seja superior a 38
mm.

10
As precipitações diárias máximas prováveis para os tempos de retorno de 2, 5,
10, 25 e 50 anos, que foram calculadas aplicando-se a distribuições em estudo, para os
períodos mensal e anual são apresentados na Tabela 2 ABAIXO.

PREENCHER COM OS DADOS NOSSO ESTIMADOS A TABELA ABAIXO


USAR APENAS UMA DAS PRIORIS

11
5. REFERÊNCIAS

??????

12