Escolar Documentos
Profissional Documentos
Cultura Documentos
o
d
a
s
O
c
o
r
r
n
c
i
a
s
D
e
t
e
r
m
i
n
a
o
d
a
s
Q
u
a
n
t
i
d
a
d
e
s
19
A resoluo de problemas atravs de simulaes a base de um mtodo
conhecido como Mtodo de Monte Carlo. Ele utiliza-se de nmeros pseudo-aleatrios
para construir os diversos cenrios e simular as situaes conseqentes. O termo
pseudo utilizado porque no possvel se ter uma garantia de aleatoriedade
absoluta em um processo de gerao. A prpria existncia de um mtodo (ou algoritmo)
gerador faz com que os nmeros aleatrios tornem-se previsveis. Por esse motivo,
diversos autores reconhecem que o termo nmero aleatrio inconveniente.
A forma mais simples de aplicao do Mtodo de Monte Carlo se d justamente
sobre problemas probabilsticos (Kaviski, 2006, p. 31). Os nmeros pseudo-aleatrios
envolvidos podem seguir diversas distribuies estatsticas, de acordo com o uso ao
que se destinam. Entretanto, o primeiro passo para a obteno de nmeros com
distribuies especficas a gerao de nmeros uniformemente distribudos no
intervalo [0,1). A partir deles so aplicadas funes de transformao para os modelos
probabilsticos desejados.
Kaviski (2006, p. 202-213) traz mtodos de gerao de nmeros pseudo-
aleatrios uniformes, incluindo rotinas computacionais para tais procedimentos e testes
estatsticos para avaliao dos nmeros gerados. Por serem numerosos, optou-se por
no reproduzir nenhum mtodo especfico na presente dissertao; maiores detalhes
podem ser encontrados na citada referncia. As publicaes de Press (1989 e 1992)
tambm so timas referncias para a gerao de nmeros aleatrios aplicados a
linguagens de programao. O primeiro livro (Press, 1989) refere-se tcnicas de
gerao na linguagem Pascal, enquanto o segundo (Press, 1992) refere-se algoritmos
em linguagem Fortran. Alm de explicaes sobre cada um dos mtodos, os livros
trazem cdigos prontos para serem implementados.
Sem exceo, todos os geradores possuem um ponto de partida chamado de
semente. Trata-se de um valor inicial com o qual os diferentes mtodos comearo para
calcular os demais nmeros. Assim, uma mesma semente resultar sempre em uma
mesma sequncia de nmeros pseudo-aleatrios. Esse fato indesejvel,
principalmente na aplicao de mtodos como o de Monte Carlo. Para evit-lo uma
soluo simples empregada, atrelando o clculo do valor inicial (ou semente) com o
sistema data/hora (Anderson, 1990 apud Kaviski, 2006, p. 203):
20
( ) ( ) ( ) [ ] { } { } seg hora dia ms ano 60 min 24 31 1 12 1 10 2000 x
0
+ + + + + = (1.1)
na qual 999 . 079 . 214 . 3 0
0
x .
A gerao de nmeros pseudo-aleatrios com distribuio normal (gaussiana)
possui ampla gama de utilizaes em modelos hidrolgicos que trabalham com sries
temporais. Por ser de grande importncia em estudos diversos, alguns dos mtodos
existentes sero descritos a seguir.
O primeiro e mais simples dos mtodos baseado no teorema do Limite
Central. Seja
n
Z uma varivel aleatria normal padro (mdia zero e varincia
2
unitria), tal que (Kaviski, 2006, p. 214 e 215):
n
n S
Z
n
n
2
=
(1.2)
onde
n
S a soma de n variveis aleatrias independentes e identicamente distribudas,
a mdia da amostra,
2
a varincia da amostra e n o nmero de variveis
aleatrias da amostra. O teorema do Limite Central definido por:
[ ] '
2
'
exp
2
1
lim
2
dz
z
z Z P
z
n
n
|
|
\
|
=
(1.3)
Ao aplic-lo na gerao de variveis aleatrias normais, considera-se
n
S
definida como uma soma de n variveis aleatrias uniformes U. Deste modo, os
parmetros assumem os valores 2 1 = e 12 1
2
= , podendo-se gerar variveis
aleatrias normais:
12
12
n
n S
Z
n
n
=
(1.4)
Adotando-se n=12, no intuito de diminuir o tempo de processamento
computacional (International Business Machines, 1970 apud Kaviski, 2006, p. 215),
obtm-se um gerador simples para variveis aleatrias normais:
21
=
=
12
1
6
i
i n
u Z
(1.5)
onde
i
u so nmeros aleatrios uniformemente distribudos no intervalo [0,1).
Dessa forma, a cada 12 nmeros aleatrios uniformemente distribudos no
intervalo [0,1), gera-se um nmero aleatrio normalmente distribudo com mdia zero
e varincia
2
unitria.
Ross (1997, p. 572-574) apresenta um mtodo para gerao de dois nmeros
aleatrios normalmente distribudos e independentes entre si, conhecido tambm como
Mtodo Box-Mller:
( ) ( )
( ) ( )
=
=
2 1
2 1
2 sin log 2
2 cos log 2
U U Y
U U X
(1.6)
Onde
1
U e
2
U so nmeros aleatrios uniformemente distribudos no intervalo [0,1).
No intuito de gerar nmeros pseudo-aleatrios com distribuies estatsticas
especficas, comum o emprego do chamado Mtodo da Transformao Inversa, ou
Mtodo da Inverso. A aplicao deste mtodo, entretanto, limita-se a variveis
aleatrias que so relacionadas de forma explcita com a respectiva funo de
distribuio acumulada. Sua formulao simples, definida como (Kaviski, 2006, p.
215):
( ) ( )
= =
X
a
X X U
dx x f X F U F X ' ' ) ( ,
1
(1.7)
onde ) (X F
X
a funo de distribuio acumulada para a varivel aleatria X , com
limite inferior a . Assim, gerando-se um nmero pseudo-aleatrio uniforme u limitado
em [0,1), um valor x para a varivel aleatria X determinado.
Este mtodo empregado neste trabalho para a determinao das alturas
precipitadas; a distribuio estatstica em questo a Exponencial (para mais detalhes,
ver seo 2.2). Kaviski (2006, p. 216) traz ainda expresses obtidas pelo Mtodo da
Inverso para diversos modelos clssicos, como Exponencial, Gumbel, Weibull, Kappa,
entre outras.
22
At poucos anos, tcnicas de gerao de nmeros pseudo-aleatrios eram
escolhidas e implementadas manualmente nos compiladores computacionais para a
resoluo de problemas. Atualmente possvel encontrar geradores com grande
confiabilidade e eficincia j embutidos em vrios softwares, o que permite sua
aplicao direta. Ainda assim, a identificao dos mtodos e a validao desses
geradores so de fundamental importncia para uma aplicao adequada. Na presente
dissertao, por exemplo, toda a programao necessria foi desenvolvida em Matlab
(verso 6.0.0.88 R12, 2000, The Mathworks Inc., sob licena), um conhecido software
matemtico com ampla aplicao na comunidade cientfica. Geradores de nmeros
pseudo-aleatrios j esto implementados no software; os mtodos utilizados podem
ser conferidos em Moler (2004).
1.4.2 Determinao das ocorrncias das precipitaes
Na grande maioria dos estudos existentes, a determinao de dias chuvosos ou
secos feita com a utilizao de processos estocsticos. Karlin e Taylor (1975) so
uma tima referncia para o leitor interessado nesse assunto. Segundo os autores, a
teoria incorporada aos processos estocsticos preocupa-se com a investigao da
estrutura formada por famlias de variveis aleatrias em conjunto com um parmetro
de evoluo contnua, associado ao tempo. Em outras palavras, os processos
estocsticos podem ser tratados como funes de argumentos cujos valores so
variveis aleatrias que seguem distribuies probabilsticas. Ainda segundo Karlin e
Taylor (1975, p. 21, traduo do autor), uma realizao de um processo estocstico
{ } T t X
t
, uma atribuio, para cada T t , de um possvel valor de
t
X .
So vrios os tipos de processos estocsticos existentes. Na diferenciao
entre eles, trs elementos so essenciais: o espao amostral (ou estado) S, o
parmetro de tempo T e a relao de dependncia entre as variveis aleatrias. O
primeiro elemento refere-se ao lugar onde as variveis aleatrias esto localizadas. No
caso de { } ... , 2 , 1 , 0 = S , o espao amostral (ou estado) tido como discreto e as variveis
23
aleatrias de
t
X assumem valores inteiros. Se ( ) = , S , o espao amostral (ou
estado) contnuo e as variveis aleatrias de
t
X so encaradas como valores reais.
De forma anloga, o parmetro de tempo pode assumir { } ... , 2 , 1 , 0 = T ou
[ ) = , 0 T , adquirindo a caracterstica de discreto ou contnuo, respectivamente. A
interao entre os estados S e os parmetros temporais T criam diferentes nveis de
dependncia entre as variveis aleatrias. Assim, para uma definio correta e precisa
de um processo estocstico, alguns tipos de dependncia precisam ser detalhados. A
seguir, algumas das relaes mais clssicas entre esses elementos so descritos
(Karlin e Talyor, 1975, p. 27).
Se as variveis aleatrias em { }
1 2 3 1 2
..., , ,
n n
t t t t t t
X X X X X X so
independentes para qualquer escolha de
n
t t ..., ,
1
que satisfaz { }
n
t t t < < ..., ,
2 1
,
t
X um
processo estocstico com incrementos independentes. Ainda, se o parmetro tempo
discreto, ou seja { } ... , 2 , 1 , 0 = T , o processo se reduz a uma sequncia de variveis
aleatrias independentes ( ) ... , 3 , 2 , 1 ,
1 1 0 0
= = =
i X X Z X Z
i i
. Nesse caso, ao conhecer
as distribuies individuais governantes de ... , ,
1 0
Z Z possvel determinar a distribuio
conjunta de qualquer configurao finita de
t
X .
Se a distribuio dos incrementos ( ) ( )
1 1
t X h t X + depende unicamente do
comprimento do intervalo h e nunca do tempo
1
t , o processo possui incrementos
estacionrios. Da mesma forma, um processo estocstico
t
X que possua
( )
h t h t h t
n
X X X
+ +
..., , ,
2 1
e ( )
n
t t t
X X X ..., , ,
2 1
equivalentes (de mesma distribuio conjunta)
para todos 0 > h e selees aleatrias
n
t t t ..., , ,
2 1
, definido como estritamente
estacionrio.
Ao relevar as diferentes combinaes entre os elementos supracitados,
diversos processos estocsticos podem ser construdos. Alguns deles so bastante
conhecidos, como: martingais, processos de Markov, alternncia de eventos com
renovao, processos pontuais, movimentos Brownianos, processos de Poisson, entre
outros. Novamente, cita-se o trabalho de Karlin e Taylor (1975) como referncia para
consulta a esses processos mencionados.
24
Quando aplicados especificamente na determinao das ocorrncias das
precipitaes, estes parmetros so representados da seguinte maneira:
Espao amostral, ou estados: dias secos e midos. Os dias midos ainda
podem ser sub-classificados de acordo com as quantidades precipitadas,
como por exemplo, dias com chuvas normais e dias com chuvas intensas.
Obviamente esta considerao eleva o nmero de estados do processo;
Tempo: encarado como parmetro discreto, ou seja, T= (0, 1, 2, ...);
Relao entre as variveis aleatrias: so tipicamente representadas por
processos de alternncia de eventos ou por Cadeias de Markov.
Por destacarem-se entre os processos estocsticos mais utilizados na
determinao das ocorrncias das precipitaes, os dois tipos de relaes entre
variveis aleatrias acima apontadas sero detalhados nas duas sees subseqentes.
1.4.2.1 Processos de alternncia de eventos com renovao
Um caso particular nos processos estocsticos acontece quando se trabalha
com sistemas que se renovam aps decorrido certo tempo. O que se pretende em um
processo desse tipo justamente o estudo do comportamento do sistema em cada
estgio. Pode-se citar como exemplo a vida til de lmpadas: partindo-se da primeira
instalao, a lmpada ir queimar depois de algum tempo. A troca por uma nova
lmpada marca o processo de renovao, assim como a anlise de todas as trocas
ocorridas em certo tempo exprime a essncia do processo de alternncia de eventos
com renovao.
Por definio, este sistema tido como um processo que registra ocorrncias
sucessivas de um evento ao longo de um intervalo de tempo (0,t]. Os tempos de
durao entre eventos consecutivos so considerados variveis aleatrias positivas,
independentes e identicamente distribudas (Karlin e Taylor, 1975, p. 167). Desta forma,
possvel afirmar que dentro de um evento particular est presente uma funo
especfica.
25
Seja ( )
=1 k k
X , onde
k
X representa o tempo decorrido entre dois eventos
sucessivos. Sua distribuio de probabilidades pode ser escrita como sendo:
( ) ( )
( )
=
= =
0 0
,... 3 , 2 , 1 , Pr
X
k X
F
k x X x F
(1.8)
O tempo de espera at a ocorrncia do evento n pode ser expresso da seguinte
maneira:
=
+ + + =
0
1 , ...
0
2 1
S
n X X X S
n n
(1.9)
Ainda, N(t) representa o nmero de ndices n dentro do intervalo de tempo t S
n
< 0 .
Os processos ( ) { } 0 , t t N e { } 0 , n S
n
, em conjunto, compem o sistema de
renovao. A partir dessas definies, deriva-se uma srie de funes mais especficas,
aplicveis a muitos processos estocsticos. Para mais detalhes, sugere-se consultar
Karlin e Taylor (1975, p. 169-170).
No contexto da gerao de precipitaes dirias, os eventos a serem
considerados no sistema so as sequncias de dias secos ou chuvosos. Autores
interessados em trabalhar com esse tipo de processo estocstico manifestam uma
preocupao relacionada distribuio de probabilidades destes eventos; para eles,
sequncias de dias secos seguem funes diferentes do que sequncias de dias
chuvosos. Small e Morgan (1986) elaboraram um estudo no qual essa preocupao
ficou evidente. Nele, processos markovianos de primeira ordem (assunto da prxima
seo) so questionados por no serem capazes de reproduzir certos fenmenos,
como sequncias (ou clusters) de eventos. Desta forma, os autores atribuem diferentes
distribuies estatsticas para eventos de dias secos (distribuio gama a dois
parmetros) e de dias chuvosos (distribuio exponencial a um parmetro).
importante frisar que a evoluo temporal considerada neste estudo foi
contnua, isto , o resultado do processo visto como uma integral sobre o intervalo de
tempo determinado. Como concluso, Small e Morgan (1986) alegam que a distribuio
gama utilizada foi capaz de reproduzir os clusters, principalmente em regies nas quais
esse fenmeno ocorre com freqncia. Entretanto, cadeias markovianas de ordem
26
superior a um no foram testadas, fazendo com que os autores no conclussem
acerca do modelo mais apropriado. Ao invs disso, foi destacado que o modelo de
alternncia de eventos uma opo para localidades onde outros processos
estocsticos no apresentem bom desempenho.
Foufoula-Georgiou e Lettenmaier (1987) tambm desenvolveram um modelo
utilizando-se de um processo estocstico de alternncia de eventos. Diferentemente do
estudo descrito no pargrafo anterior, contudo, os pesquisadores trabalharam com
evoluo temporal discreta. Segundo eles, a escala diria para modelagem da
precipitao muito grande para uma boa estimao dos parmetros de uma funo
contnua. Duas distribuies geomtricas, cujos parmetros foram obtidos de acordo
com as probabilidades de transio calculadas (ver seo 1.4.2.2), foram aplicadas.
Uma terceira distribuio probabilstica (exponencial mista a trs parmetros) foi
utilizada para caracterizar a renovao do processo. Os resultados obtidos foram
considerados adequados na reproduo das estatsticas das sries originais.
Em outro estudo comparativo entre processos markovianos e de alternncia de
eventos, Roldn e Woolhiser (1982a) ajustaram uma distribuio geomtrica truncada
para sequncias de dias chuvosos e uma distribuio binomial negativa truncada para
sequncia de dias secos. O modelo foi aplicado para quatro estaes Norte americanas
e os resultados confrontados com os tradicionais modelos markovianos. Ambos foram
satisfatrios, contudo a tcnica de alternncia de eventos exigiu mais tempo
computacional para os clculos, tornando-a menos atrativa no aspecto econmico.
1.4.2.2 Processos markovianos
Nos itens anteriores verificou-se que freqentemente possvel representar o
comportamento de um sistema fsico descrevendo todos os estados nos quais esse
sistema poder ocupar, caracterizando as mudanas entre esses estados no tempo. Se
h a possibilidade de expressar o tempo gasto em qualquer desses estados por uma
distribuio exponencial, o sistema como um todo pode ser representado por um
processo de Markov.
27
A propriedade fundamental de um processo estocstico markoviano que a
evoluo futura do sistema depende somente do estado atual e nunca dos estados
passados. Em outras palavras, o sistema no possui memria que lhe possibilite usar
informaes quanto ao seu comportamento atual. Uma particularidade importante
desse tipo de processo se d quando os parmetros de estados e de tempo assumem
intervalos discretos. Nesse caso, o processo markoviano adquire a designao de
cadeia. As variveis aleatrias assumem a representao { }
n
X X X X ..., , , ,
2 1 0
, ou seja,
observaes no estado X referenciadas aos tempos { } n T ..., , 2 , 1 , 0 = , respectivamente.
Clarke e Disney (1979, p. 214 e 215) definem a funo distribuio de
probabilidade condicional para a cadeia de Markov como:
{ } { }
1 1 0 0 2 2 1 1 0 0
| Pr ..., , , | Pr x X x X x X x X x X x X
n n
= = = = = = = (1.10)
O elemento direita da igualdade na equao (1.10) chamado de probabilidade de
transio. So denotados, genericamente, por:
( ) { } ... , 2 , 1 , 0 | Pr
1
= = = =
n i X j X n p
n n ij
(1.11)
O tensor de segunda ordem, ou matriz P formada pelos elementos
ij
p , denominado
matriz de transio, ou matriz cadeia:
( )
(
(
(
= =
nn
ij
p
p p p
p p p
p P
... ... ...
...
...
12 11 10
02 01 00
(1.12)
Cujos elementos respeitam 1 0
ij
p e
=
j
ij
p 1.
As equaes (1.10), (1.11) e (1.12) resumem a estrutura de uma cadeia de
Markov de primeira ordem. Isto significa dizer que um processo governado por esse tipo
de estrutura leva em considerao informaes nos tempos T=n e T=n-1. Existem
tambm cadeias de ordens superiores; um processo de segunda ordem, por exemplo,
considera eventos nos tempos T=n, T=n-1 e T=n-2. Cadeias markovianas de terceira
ordem, por sua vez, utilizam-se dos acontecimentos nos tempos T=n, T=n-1, T=n-2 e
T=n-3. O mecanismo o mesmo para ordens ainda maiores, o que aumenta
consideravelmente a complexidade do processo estocstico em questo.
28
A grande maioria dos pesquisadores que desenvolvem estudos relacionados
gerao estocstica de chuvas dirias faz uso de cadeias de Markov para a
determinao das ocorrncias das precipitaes (Wilks, 1998; Richardson, 1981;
Todorovic e Woolhiser, 1975; Roldn e Woolhiser, 1982a; Azevedo e Leito, 1990;
Grondona et al., 2000; Deni, Jemain e Ibrahim, 2008; Jimoh e Webster, 1996; Chin,
1977; Mehrotra e Sharma, 2007; Katz, 1977; Krger, Kaviski e Mller, 1998; Haan, Allen
e Street, 1976; Gomes et al., 2006; Oliveira, 2003; Andrade Junior, Frizzone e
Sentelhas, 2001; Kottegoda, Natale e Raiteri, 2008; Lima, 2004, Liao, Zhang e Chen,
2004). Como referncia terica sobre esse processo estocstico aplicado
determinao de sries de ocorrncias de precipitaes dirias, cita-se Clarke (1998, p.
41-56). Nela esto contidas definies e consideraes pertinentes ao assunto,
incluindo exemplos numricos.
O emprego de cadeias de Markov ocorrncia das chuvas refere-se aos eventos
de chuva ou no chuva, ocorridos no local k dia t, tal que:
( )
=
k t
k t
k X
t
local no chuvoso, dia para
local no seco, dia para
, 1
; , 0
(1.13)
A construo da cadeia de Markov inicia-se com as probabilidades de transio:
( ) ( ) { } ( )
( ) ( ) { } ( ) k p k X k X
k p k X k X
t t
t t
11 1
10 1
1 | 1 Pr
; 0 | 1 Pr
= = =
= = =
(1.14)
Esta representao interpretada como ( ) k p
01
indicando um dia seco antecedido
por um dia chuvoso e ( ) k p
11
indicando um dia chuvoso antecedido por outro tambm
chuvoso. Continua-se o processo definindo as probabilidades de transio condicionais
complementares:
( ) ( )
( ) ( ) k p k p
k p k p
11 01
10 00
1
; 1
=
=
(1.15)
O processo se completa com a construo da matriz de transio da Cadeia de Markov:
(
= =
11 10
01 00
p p
p p
p P
ij
(1.16)
29
Novamente, o exemplo acima se refere a uma cadeia de Markov de primeira
ordem e dois estados, ou seja, somente os dias atual e anterior so levados em
considerao na anlise, sob as condies de secos ou midos. Essa formulao
questionada por alguns autores que, ao desenvolverem suas pesquisas, perceberam
que modelos markovianos de ordens superiores traziam melhores resultados quando
aplicados em certas regies. Para melhor entendimento das configuraes dos estados
em cadeias de ordens superiores, ver figura 3.
Um dos estudos pioneiros nesse assunto foi desenvolvido por Chin (1977).
Modelos de vrias ordens foram testadas em mais de 100 estaes distribudas pelos
Estados Unidos. Alm de determinar a ordem tima do processo, o autor preocupou-se
em verificar se ela estava relacionada com variaes geogrficas, sazonais e tamanhos
de sries histricas disponveis. Os resultados confirmaram a preocupao inicial da
pesquisa: as ordens dos processos markovianos podem variar, em maior grau, para
diferentes estaes do ano e, em menor, para a localizao geogrfica. O tamanho da
amostra tambm exerce certa influncia, principalmente quando os dados so limitados.
FIGURA 3 CONFIGURAO PARA CADEIAS DE MARKOV DE ORDENS SUPERIORES
Deni, Jemain e Ibrahim (2008), Jimoh e Webster (1996) e Azevedo e Leito
(1990) estudaram modelos markovianos com ordens superiores para determinadas
localidades (respectivamente, Malsia, Nigria e o Estado da Paraba, no nordeste
brasileiro). A concluso de todos os pesquisadores foi a de que modelos markovianos
30
simples (de primeira ordem) no so recomendados para estas regies. Nelas a
formao de perodos maiores e mais definidos de estiagens ou chuvas faz-se
presente, aumentando a dependncia temporal de cada dia. Para o Estado Paraibano,
por exemplo, Azevedo e Leito (1990) concordaram que um modelo de terceira ordem
o mais apropriado, ou seja, o dia atual depende dos trs anteriores para a transio
de estados secos e midos, ou vice-versa.
A determinao da ordem tima de um modelo pode ser feita com o emprego
de alguns mtodos. Os Critrios de Informao Akaike (AIC) (Akaike, 1974) e de Bayes
(BIC) (Schwarz, 1978) so os mais utilizados. As formulaes de tais mtodos podem
ser conferidas em Katz (1981), juntamente com uma discusso sobre qual critrio
apresenta os resultados mais confiveis. Segundo o autor, o critrio AIC inconsistente
e tende a superestimar a ordem dos modelos. O critrio BIC, por outro lado, seria uma
boa opo para esta avaliao (mais detalhes sobre a definio e formulao dos
critrios podem ser conferidos na seo 2.1).
Gregory, Wigley e Jones (1992) discutem, alm da ordem dos modelos, a
quantidade de estados considerada. Em alguns casos, a simples considerao de dois
estados (seco ou mido) no suficiente; Thompson, Thompson e Zheng (2007), por
exemplo, estudaram um modelo de precipitao diria para Nova Zelndia utilizando
trs estados de ocorrncias: seco, pouco mido e muito mido. Os autores reconhecem
que a diviso entre mais de um estado de precipitao traz, intrinsecamente, a
interpretao de diferentes mecanismos fsicos que geram as chuvas. Contudo, neste
estudo no dada importncia ao aspecto fsico do problema, mas sim estatstica
envolvida.
1.4.3 Determinao das quantidades precipitadas
Para os dias chuvosos, so atribudas diferentes distribuies probabilsticas.
Dentre as mais utilizadas pode-se citar: gama a dois parmetros, exponencial simples
(um parmetro), exponencial a dois parmetros, exponencial mista a trs parmetros,
31
entre outras. A tabela 4 traz um breve resumo das distribuies e os autores que as
utilizaram.
TABELA 4 - DISTRIBUIES ESTATSTICAS MAIS EMPREGADAS NA DETERMINAO DAS
QUANTIDADES DE CHUVA PRECIPITADA.
Distribuio Autores
Gama (dois parmetros) Katz (1977), Krger, Kaviski e Mller (1998), Grondona et
al. (2000), Liao, Zhang e Chen (2004), Gomes et al. (2006),
Andrade Junior, Frizzone e Sentelhas (2001).
Exponencial Simples
(um parmetro)
Haan, Allen e Street (1976), Richardson (1981), Todorovic e
Woolhiser (1975).
Exponencial (dois
parmetros)
Nascimento e Kelman (1995).
Exponencial Mista (trs
parmetros)
Wilks (1998), Smith e Schreiber (1974), Foufoula-Georgiou
e Lettenmaier (1987).
Ao analisar a tabela 4 percebe-se que as distribuies probabilsticas mais
utilizadas so a gama e a exponencial com parmetros diversos. Por esse motivo, elas
so detalhadas em separado nas prximas sees. So tambm descritos os principais
mtodos para estimao dos parmetros utilizados pelos pesquisadores.
1.4.3.1 Distribuio Gama
Muitas distribuies estatsticas que representam variveis atmosfricas
(precipitaes, temperaturas, velocidade do vento, entre outras) apresentam um
comportamento significativamente assimtrico (Wilks, 2006, p. 96). Tratando-se de
precipitaes em escala diria, Krger, Kaviski e Mller (1998) dividem o mesmo
argumento ao ressaltar que a distribuio da intensidade da chuva diria geralmente
bastante assimtrica, recomendando-se o uso de distribuies gama.
Existe uma srie de distribuies com essas caractersticas, porm a
distribuio gama uma escolha comum entre os estudiosos da rea (tabela 4). Sua
funo densidade de probabilidades dada por (Wilks, 2006, p. 96):
( )
( ) ( )
( )
0 , , ,
exp
1
>
x
x
x x
x f
X
(1.17)
32
onde x a varivel aleatria, e so os parmetros (chamados tambm de
parmetros de forma e de escala, respectivamente) e a funo gama, definida pela
expresso:
( )
=
0
1
dx x e z
z x
(1.18)
A figura 3 ilustra o comportamento desta distribuio em um caso particular, quando o
parmetro de forma assume valores 1 < . Este caso comum em modelos de
gerao de chuva que trabalham com esta distribuio probabilstica.
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 10 20 30 40
Observes - X
f
X
(
x
)
FIGURA 4 FUNO DENSIDADE DE PROBABILIDADE DISTRIBUIO GAMA COM 1 <
A distribuio gama descrita em maiores detalhes em Clarke (1998, p. 56-75).
Nesta obra, o autor introduz uma dependncia temporal no parmetro de escala da
distribuio. A razo reside no fato de que, diferentemente de outros estudos, o
pesquisador no divide o ano em pocas sazonais distintas, mas o considera como
perodo inteiro. Dessa maneira, a estimao dessa varivel feita atravs do emprego
de uma equao que contm funes harmnicas responsveis pela representao das
diferentes caractersticas climticas observadas ao longo do ano (estaes). A deciso
a ser tomada neste tipo de modelo passa a ser no mais a determinao da quantidade
de perodos sazonais de um ano (ver seo 1.6), mas quantos harmnicos devem ser
33
empregados. Essa abordagem, juntamente com a resoluo de exemplos numricos,
est tambm presente na obra.
Katz (1977) props um modelo probabilstico para a determinao das
quantidades precipitadas em uma sequncia de dias chuvosos. Esse modelo calcula o
acmulo mximo de chuva em um dia a partir de uma distribuio gama. Uma
distribuio normal (gaussiana) tambm utilizada para o clculo do total precipitado.
No exemplo numrico mostrado, o autor consegue uma aproximao muito boa ao
aplicar a distribuio gama em uma amostra de 20 dias. J para a determinao do
total precipitado os resultados no foram bons devido ao tamanho insuficiente da
amostra utilizada.
Liao, Zhang e Chen (2004) aplicaram um modelo de gerao de precipitaes
dirias, com base na distribuio gama, a 672 estaes pluviomtricas chinesas. Por
ser um estudo extenso e com uma quantidade significativa de estaes, foi possvel
identificar respostas das caractersticas climticas de cada regio nos parmetros de
forma e de escala da distribuio. De uma forma geral, os autores obtiveram xito na
utilizao deste modelo, entretanto episdios extremos (chuvas mximas mensais) no
foram bem representados.
Com objetivo de identificar tendncias na precipitao diria no Estado do
Paran, Krger, Kaviski e Mller (1998) ajustaram distribuies gama s sries
histricas de dias chuvosos. importante frisar que, neste estudo, os autores no se
preocuparam com a eficincia dessa distribuio estatstica em representar as
precipitaes, mas sim em estudar as freqncias de dias secos e midos no decorrer
dos anos. A opo pela distribuio gama foi feita com base no sucesso dos diversos
estudos anteriores.
1.4.3.2 Distribuio Exponencial
No desenvolvimento de modelos que reproduzem fenmenos naturais sempre
necessrio fazer simplificaes para tornar a matemtica envolvida menos complexa e
possvel de se executar. Entretanto o nvel das simplificaes deve sempre ser
34
ponderado, pois caso sejam feitas em demasia, as concluses dos modelos podem no
ser teis ao propsito a que se deseja.
Uma simplificao muito adotada por pesquisadores assumir que as variveis
aleatrias envolvidas seguem uma distribuio exponencial. A razo para isso que
essa distribuio relativamente fcil de trabalhar, alm de trazer boas aproximaes
da real distribuio envolvida.
A forma mais geral da distribuio exponencial tem uma funo densidade de
probabilidade expressa por (Johnson e Kotz, 1970, p. 207):
( )
( )
0 ; , exp
1
> >
(
x
x
x f
X
(1.19)
onde x o valor assumido pela varivel aleatria e e so os parmetros. Quando
nulo, a equao se reduz para uma exponencial simples.
Uma propriedade importante da distribuio exponencial simples (um
parmetro) decorre de sua falta de memria. Ross (1997, p. 237) demonstra essa
propriedade ao apresentar o conceito de variveis aleatrias sem memria:
[ ] [ ]
[ ] [ ] [ ]
0 , para
Pr . Pr Pr
Pr | Pr
=
=
K
j
j X
x p w w x f
1
| , , (1.21)
onde K j w
j
..., , 2 , 1 , = so pesos (no-negativos e cuja soma resulta a unidade),
( ) | x f
X
a distribuio probabilstica (de natureza exponencial) e representando o(s)
respectivo(s) parmetro(s).
Sendo assim, as distribuies mistas podem ser associadas a um somatrio de
distribuies, cada um com pesos atrelados s respectivas funes. Esta interpretao
foi adotada por Smith e Schreiber (1974) em estudo relacionado com a distribuio das
alturas de chuvas dirias, em trs postos de amostras selecionados. Aps a elaborao
do grfico da distribuio emprica de probabilidades para os postos em questo, os
autores notaram que ambas as curvas tinham um ponto de inflexo. Assim, o modelo
probabilstico adotado no estudo foi composto pela soma de duas distribuies
exponenciais simples e um parmetro complementar (peso), como mostra sua funo
densidade de probabilidade:
( ) ( ) ( ) ( ) x x x f
X
. exp 1 . exp
2 1
+ = (1.22)
onde x o valor assumido pela varivel aleatria e
1
,
2
e so os parmetros.
A forma da equao (1.22) difundiu-se entre os pesquisadores interessados em
modelar a precipitao em escala diria, como uma boa alternativa a outras
distribuies anteriormente existentes. A figura 5 traz o comportamento grfico da
equao (1.22), novamente com parmetros tpicos de modelos de gerao de chuva
36
(
1
e
2
positivos e diferentes entre si e 1 0 < ). Nota-se que a curva possui aspecto
muito semelhante ao da distribuio gama quando 1 < (figura 4).
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20 25 30 35 40 45
Observaes - X
f
X
(
x
)
FIGURA 5 - FUNO DENSIDADE DE PROBABILIDADE DISTRIBUIO EXPONENCIAL MISTA
Foufoula-Georgiou e Lettenmaier (1987) uniram o modelo de ocorrncias por
processo de alternncia de eventos (descrito na seo 1.4.2.1) a uma distribuio
exponencial mista. Ao aplic-los na regio de Washington, Estados Unidos, os
resultados obtidos foram excelentes. Os dados de mdias e varincias das sries
histricas foram reproduzidos com sucesso pela estrutura probabilstica utilizada. Os
mesmos bons resultados foram tambm obtidos por Wilks (1998), fato que permitiu a
esse pesquisador criar um modelo aplicvel a mltiplas localidades simultaneamente
(assunto especfico da seo 1.5).
As distribuies exponenciais mais simples tambm foram aplicadas na
construo de modelos. Todorovic e Woolhiser (1975) obtiveram boas adequaes para
sequncias de 10 dias utilizando uma distribuio exponencial de um parmetro
(exponencial simples). Entretanto, um estudo mais abrangente permitiu a Richardson
(1981) fazer algumas ressalvas quanto ao uso desta distribuio. Seu artigo objetivou
no somente a simulao de precipitaes dirias, mas tambm a obteno de
temperaturas e dados de radiao solar, todos em um nico modelo. Por isso, a adoo
37
de tal mtodo em seu estudo foi atrelada facilidade de uso da distribuio exponencial
simples. Contudo, ele admite que as distribuies com um maior nmero de parmetros
(especificamente, gama e exponencial mista) resultam em melhores estimativas,
justamente pela flexibilidade proporcionada por eles.
Roldn e Woolhiser (1982b) trazem um importante estudo comparativo de
algumas distribuies. Esse artigo complementar ao comparativo entre cadeias de
Markov e processo de alternncia de eventos, citado na seo 1.4.2.1. Dentre as
distribuies confrontadas, esto a exponencial simples, gama e exponencial mista. O
estudo muito completo, com a presena das funes de mxima verossimilhana para
estimao dos parmetros e anlise do Critrio de Informao Akaike (AIC) (Akaike,
1974) para as cinco estaes Norte americanas estudadas. Baseado nisso, a concluso
dos autores que a distribuio exponencial mista apresentou o melhor desempenho,
seguida pela distribuio gama.
1.4.3.3 Mtodos para estimao dos parmetros
A estimao dos parmetros de uma distribuio probabilstica um passo
fundamental para tornar possvel qualquer modelagem estatstica. No obstante, a
qualidade dos estimadores calculados influi diretamente nos resultados alcanados pelo
pesquisador. Dentre os vrios mtodos disponveis na literatura, essa reviso ir se
concentrar nos dois mais utilizados: Mtodo dos Momentos e Mtodo da Mxima
Verossimilhana, aplicados a distribuies de probabilidades contnuas.
O Mtodo dos Momentos consiste simplesmente em igualar os momentos
populacionais aos correspondentes momentos amostrais. Greenwood et al. (1979)
definem a forma mais geral para a determinao dos momentos populacionais de uma
distribuio estatstica:
( ) [ ] ( )
=
1
0
, ,
1 dF F F F x M
k j l
k j l
(1.23)
38
onde F representa uma distribuio de probabilidades acumulada e l , j e k so
nmeros reais. Os momentos
k j l
M
, ,
determinados atravs da equao (1.21) so
chamados de momentos com pesos probabilsticos (ou PWM - Probabilistic Weighted
Moments). Uma particularidade desta equao acontece quando 0 = = k j e l um
nmero inteiro no negativo. Nesse caso, a equao representa os momentos
populacionais tradicionais, centrados na origem l (
0 , 0 , l
M ). Diz-se, assim, que a equao
expressa o momento de ordem l da distribuio F.
Os momentos amostrais, por sua vez, so obtidos diretamente dos dados da
amostra. Mdia, varincia, coeficiente de curtose e coeficiente de assimetria
representam, respectivamente, os quatro primeiros momentos amostrais. Dessa forma,
a aplicao do Mtodo dos Momentos implica em um sistema de equaes com tantas
equaes quantos parmetros a serem estimados.
A escolha da utilizao de momentos populacionais com pesos probabilsticos
ou momentos populacionais convencionais depende da distribuio probabilstica em
questo. Greenwood et al. (1979) deduzem expresses para ambos os momentos
aplicados a vrias distribuies. A comparao entre as equaes resultantes revela
que, em muitos casos, a relao entre os momentos com pesos probabilsticos e os
parmetros do modelo probabilstico utilizado resulta em estruturas analticas mais
simples de que quando utilizados os momentos convencionais. Os clculos necessrios
estimao dos parmetros ficam, portanto, facilitados.
De uma forma geral, o Mtodo dos Momentos produz equaes de fcil
resoluo. Entretanto sua eficincia contestada por muitos autores, principalmente
por suas propriedades assintticas (Cramr, 1974, p. 498; Foufoula-Georgiou e
Lettenmaier, 1987; Thom, 1958 apud Botelho e Morais, 1999; Grondona et al., 2000).
Assim sendo, o Mtodo dos Momentos comumente empregado quando se trabalha
com amostras pequenas ou em estudos menos rigorosos. , tambm, um mtodo
alternativo para procedimentos iterativos que necessitam de estimativas iniciais para
serem executados.
Grande parte dos autores que trabalham com amostras de tamanho significativo
( 100 > n elementos), como no caso de sries hidrolgicas, emprega o Mtodo da
39
Mxima Verossimilhana para estimar os parmetros da distribuio probabilstica em
uso. A formulao deste mtodo, em contrapartida, mais complexa do que o
anteriormente apresentado. Seja L a funo de verossimilhana de uma amostra de n
valores, de forme que (Cramr, 1974, p. 499):
( ) ( ) ( ) ; ... ; ; ..., ,
1 1 n n
x f x f x x L = (1.24)
O mtodo consiste em buscar valores dos parmetros envolvidos na
distribuio ( na equao 1.24) de forma que a funo L se torne a maior possvel.
Em outras palavras, calcula-se o mximo do logaritmo da funo de verossimilhana,
que corresponde geralmente a:
0
log
=
L
(1.25)
Qualquer soluo que atenda a equao (1.25) considerada uma estimao
de mxima verossimilhana de (Cramr, 1974, p. 499, traduo do autor). A
aplicao do logaritmo somente um artifcio que facilita o clculo das derivadas, no
influindo no resultado final da estimao. Obviamente o mtodo pode ser estendido
para mais parmetros. O caso de uma distribuio de probabilidades com parmetros
e , por exemplo, a formulao seria a seguinte:
( ) ( )
= , , , ; ..., ,
1 i n
x f x x L (1.26)
0
log
0
log
L
L
(1.27)
Em algumas distribuies probabilsticas a aplicao do Mtodo da Mxima
Verossimilhana extremamente trabalhosa. Isso porque algumas funes no podem
ser computadas analiticamente, ou os parmetros so apresentados de forma
intrnseca na equao. A alternativa, nesses casos, a busca de mtodos numricos
para a resoluo das equaes de verossimilhana. Wilks (2006, p. 116-120) traz dois
desses mtodos (Newton-Raphson e Algoritmo EM).
40
As distribuies gama e exponencial mista descritas nas sees 1.4.3.1 e
1.4.3.2 respectivamente, so exemplos de funes cuja estimao dos parmetros no
direta. Esse fato tem se tornado crtico no trabalho de alguns pesquisadores. Botelho
e Morais (1999) elaboram um estudo visando a determinao dos parmetros da
distribuio gama, para aplicao na determinao de volumes precipitados.
Thompson, Thompson e Zheng (2007) e Katz e Zheng (1999), por sua vez, utilizam o
algoritmo EM para o clculo dos parmetros da distribuio exponencial mista, na
inteno de construir um modelo de precipitao para aplicao em mltiplas
localidades na Nova Zelndia (ver prxima seo).
Stedinger, Vogel e Foufoula-Georgiou (1993, p. 18.7 e 18.8) fazem uma
ressalva ao emprego do Mtodo da Mxima Verossimilhana. Segundo eles, em casos
onde a distribuio emprica difere significativamente da distribuio probabilstica que
est em uso, o mtodo produz parmetros inconsistentes. Logo, evidente a
importncia de se escolher uma distribuio apropriada modelagem desejada.
recomendvel que essa escolha esteja calcada na anlise de estudos bem sucedidos
anteriormente desenvolvidos, alm do conhecimento das caractersticas fsicas de onde
os dados provm.
1.5 MODELOS DE GERAO MULTIVARIADOS
Com o grande nmero de modelos pontuais existentes capazes de gerar
precipitaes em escalas dirias, pesquisadores tm se voltado para a tentativa de
generalizar seus modelos para mltiplas localidades simultaneamente. Essa questo
de importncia fundamental para estudos que objetivam a avaliao das mudanas
climticas em determinadas regies ou a relao espacial entre estaes de
monitoramento, por exemplo. No entanto esse no um processo direto; novas
variveis precisam ser levadas em considerao, principalmente as que avaliam as
correlaes entre os dados climticos.
Mesmo tendo clara aplicabilidade na rea hidrolgica e agrcola, poucos so os
estudos que conseguiram gerar chuvas dirias multivariadas de forma satisfatria. O
41
modelo proposto por Wilks (1998) reconhecido por muitos autores como sendo um
dos primeiros e nicos bem sucedidos. O mtodo utilizado por ele parte de modelos
individuais para cada estao considerada. No total, so 25 estaes localizadas no
Estado de Nova York, Estados Unidos, distantes de 10 a 500 km. As chuvas so
geradas para cada uma atravs da j citada forma paramtrica: cadeias de Markov de
primeira ordem e dois estados para ocorrncias, e distribuio exponencial mista para
as quantidades precipitadas.
Com esta coleo de modelos individuais, o prximo passo a associao de
nmeros aleatrios independentes e espacialmente correlacionados. Em outras
palavras, vetores
t
u e
t
v formados por variveis uniformemente distribudas (0,1] so
atrelados a cada um dos modelos individuais, de maneira que seus elementos ( ( ) k u
t
e
( ) k v
t
, respectivamente) so correlacionados da seguinte forma:
( ) ( ) [ ]
( ) ( ) [ ] 0 ,
0 ,
l v k v Corr
e l u k u Corr
t t
t t
(1.28)
Ao mesmo tempo em que so mutuamente independentes, de forma que:
( ) ( ) [ ] ( ) ( ) [ ] ( ) ( ) [ ] 0 , , ,
1 1
= = =
+ +
l v k v Corr l u k u Corr l v k u Corr
t t t t t t
(1.29)
onde l refere-se a um ndice de uma estao qualquer ( K l k ,..., 1 , = ).
Os resultados obtidos foram considerados adequados na reproduo das
estatsticas associadas s sries envolvidas. Por esse motivo, estudos subsequentes
de outros autores se basearam no mtodo desenvolvido por Wilks (1998). Exemplos
podem ser encontrados em Qian et al. (2002), Khalili, Laconte e Brissette (2004) e
Thompson, Thompson e Zheng (2007). Estes ltimos fizeram uma pequena modificao
no modelo, introduzindo o conceito de cadeias de Markov ocultas para o ajuste do
modelo na Nova Zelndia. Tratam-se de cadeias nas quais seus estados no so
conhecidos, mas os resultados produzidos por esses estados sim. Quando aplicados
determinao das ocorrncias das precipitaes, os autores assumem a existncia de
diferentes mecanismos geradores, que resultam em chuvas de diferentes
caractersticas. A relao entre os mecanismos e o tipo de chuva que ele ir gerar,
todavia, no definida diretamente. Exatamente por isso o modelo ganha o adjetivo
42
"oculto". Assim, associa-se a cada estado uma probabilidade de ocorrncia, de acordo
com as observaes presentes nas amostras. A exceo, obviamente, o dia sem
chuva, no qual o estado conhecido (seco).
Brissette, Khalili e Leconte (2007) propuseram uma alterao no algoritmo de
gerao do mtodo original (Wilks, 1998) buscando otimizar o processo computacional
envolvido. Lidando com problemas como rudos presentes nas estruturas de
correlao, os autores obtiveram como resultado um novo algoritmo, mais simples e de
aplicao facilitada.
No campo no paramtrico, outro estudo merece destaque pelos bons
resultados obtidos. Buishand e Brandsma (2001) utilizaram-se do mtodo de
reamostragem e vizinhana, j citados anteriormente. Segundo eles, esse mtodo
aplica-se tanto para sries de escalares (modelos pontuais) quanto para sries de
vetores (modelos multivariados). O principal objetivo dos autores a avaliao das
vazes extremas apresentadas em pontos especficos do Rio Reno. As estaes
consideradas localizam-se a montante, na Alemanha, e distam entre si de 27 a 389 km.
Como j dito, os resultados da reamostragem foram satisfatrios, mas possuem o revs
de no produzirem sries maiores do que as disponveis, pois a tcnica capaz
somente de replicar e rearranjar os dados existentes.
Mehrotra, Srikanthan e Sharma (2006) apresentam uma comparao entre trs
mtodos de gerao de chuvas multivariadas. Dois deles so os j citados mtodos de
Wilks (1998) e Buishand e Brandsma (2001), enquanto um terceiro baseia-se em um
modelo que utiliza a tcnica de cadeias ocultas de Markov, explicada nos pargrafos
anteriores. A rea escolhida foi a cidade de Sydney, Austrlia, com aplicao em 30
estaes de monitoramento. Como resultado, os autores concluram que o modelo de
melhor desempenho foi o de Wilks (1998), seguido pelo no paramtrico modelo de
Buishand e Brandsma (2001).
Mehrotra e Sharma (2007) e Kottegoda, Natale e Raiteri (2008) so autores de
estudos tambm aplicados gerao de chuvas dirias em mltiplas localidades. No
primeiro artigo, a variabilidade dos eventos de baixa freqncia de ocorrncia
avaliada. No segundo, os pesquisadores concentraram-se na periodicidade e
43
tendncias das sries de chuvas geradas. Ambos os trabalhos tm conotao no-
paramtrica.
1.6 CONSIDERAES SOBRE SAZONALIDADE
Na gerao estocstica de chuvas dirias, as consideraes sobre
sazonalidade constituem um dos maiores obstculos ao bom desempenho dos
modelos. Os do tipo no paramtrico levam vantagem sobre os outros ao basear
completamente a construo das sries sintticas nos dados existentes. Dessa
maneira, as variaes sazonais so preservadas e as estaes so bem reproduzidas
(Young, 1994; Lall, Rajagopalan e Tarboton, 1996; Bardossy e Plate, 1992).
Harrold, Sharma e Sheather (2003a, b) marcam uma exceo nos estudos no
paramtricos ao utilizar o mtodo de janelas flutuantes, utilizado inicialmente por
Rajagopalan, Lall e Tarboton (1996), na considerao sobre a sazonalidade. Neste
mtodo, um determinado dia do ano fixado e um intervalo de dias aberto, de forma
que o dia pr-fixado localize-se no centro do intervalo. O comprimento deste intervalo
varivel, dependendo do enfoque em cada estudo. Movendo-se gradualmente o dia
pr-fixado, o intervalo move-se automaticamente, fazendo com que os 365 dias do ano
sejam compreendidos. Dessa forma, as variaes entre as estaes anuais so
preservadas.
Os estudos paramtricos, por terem uma forte conotao estatstica, falham na
representao das diferentes pocas do ano. Chin (1977) demonstrou que a
sazonalidade exerce influncia sobre as ordens das cadeias de Markov. Dada a
importncia desta considerao, alguns artifcios so utilizados como, por exemplo, a
diviso do ano em classes. A forma mais comum desta aplicao a definio de cada
classe com 30 dias, coincidindo com os meses do ano (Wilks, 1998; Haan, Allen e
Street, 1976; Liao, Zheng e Chen, 2004). Foufoula-Georgiou e Lettenmaier (1987),
depois de uma avaliao do comportamento sazonal da rea de estudo, dividiram o ano
em cinco classes. Chang, Kavvas e Delleur (1984), por sua vez, utilizaram quatro
classes, cada uma com 90 dias. Independentemente do nmero de classes escolhidas,
44
todos os estudos tm em comum o fato de que, dentro de cada classe, a srie
considerada estacionria.
Outra tcnica comumente conhecida para representao da sazonalidade a
aplicao de funes matemticas peridicas, como sries de Fourier. Semenov e
Brooks (1999), Semenov et al. (1998), Clarke (1998, p. 56-75), Kottegoda, Natale e
Raiteri (2008) e Richardson (1981) so exemplos de estudos com a aplicao das
citadas sries. Woolhiser e Pengram (1979) e Woolhiser e Roldn (1986) foram alm,
descrevendo tcnicas para estimao dos coeficientes das sries de Fourier e
parmetros regionais.
Grondona et al. (2000) preocuparam-se com o desenvolvimento de um modelo
de gerao que leva em considerao fenmenos naturais extremos, como o El Nio.
Mesmo no sendo um acontecimento de menor freqncia, este fenmeno tambm
uma variao sazonal, que traz importantes consequncias para as regies afetadas. O
resultado foi um modelo regular, que conseguiu representar a persistncia e durao
dos perodos midos (geralmente mais freqentes durante o El Nio), mas ainda no
obteve sucesso na simulao dos eventos mais severos.
1.7 A GERAO DE CHUVAS DIRIAS NO BRASIL
At pouco tempo atrs o Brasil no possua estudos muito detalhados sobre a
gerao de chuvas dirias. A grande aplicabilidade de estudos desse tipo fica evidente,
principalmente para um pas que possui tantos recursos hdricos, variedades de clima e
tradio em culturas agrcolas.
Um dos estudos pioneiros foi desenvolvido por Kelman et al. (1985) na inteno
de se obter chuvas de grande intensidade para aplicao em projetos de vertedouros
de usinas hidreltricas. Segundo os autores, esse estudo provm uma alternativa
determinao da chamada Precipitao Mxima Provvel de uma bacia. Por esse
motivo, no foi dada grande importncia determinao das ocorrncias das
precipitaes. Em contrapartida, o modelo proposto baseia-se em anlise multivariada e
leva em considerao a persistncia temporal e espacial da chuva entre postos
45
pluviomtricos. Como hiptese simplificadora do modelo, variveis normalmente
distribudas foram utilizadas. Os resultados obtidos foram considerados promissores.
Azevedo e Leito (1990) objetivaram a aplicao de processos markovianos
para determinao das ocorrncias das chuvas dirias do Estado da Paraba.
Nascimento e Kelman (1995), por sua vez, desenvolveram um modelo tipicamente
paramtrico, no qual as ocorrncias das precipitaes foram modeladas como sendo
sequncias alternantes de dias secos e midos, com comprimentos variados. As
quantidades foram modeladas com auxlio da distribuio gama. As reas escolhidas
para aplicao do modelo foram quatro sub-bacias do Rio Uruguai, da regio Sul do
Brasil. Sabe-se que nesta regio o ano hidrolgico no definido, no entanto o modelo
obteve resultados muito bons. Outro estudo na mesma regio, mas com resultados
menos satisfatrios, pode ser conferido em Krger, Kaviski e Mller (1998).
Em Clarke (1998, p. 41-75), exemplos numricos so apresentados para a
estao de Reserva Ducke, na cidade de Manaus. A diferena entre esse estudo e os
demais mencionados vem a ser a no diviso do ano em perodos sazonais. Em ambos
os clculos (determinao de ocorrncias e de quantidades precipitadas) tcnicas
especficas so empregadas para incorporar a sazonalidade nas diferentes pocas do
ano.
Demais modelos em regies distintas do territrio nacional foram elaborados
por Keller Filho, Zullo Junior e Lima (2006), aplicado aos Estados do Mato Grosso,
Tocantins, Gois e Distrito Federal, Gomes et al. (2006), aplicado ao Estado do Rio
Grande do Sul e Andrade Junior, Frizzone e Sentelhas (2001), aplicado ao Estado do
Piau. A anlise desses estudos torna-se muito interessante, devido ao fato dos trs
terem utilizado o mesmo mtodo para a construo dos modelos (modelos markovianos
aliados distribuio gama).
Oliveira (2003) e Lima (2004) estudaram o assunto com maiores detalhes. O
primeiro autor preocupou-se em desenvolver um modelo paramtrico que
representasse o perfil de precipitao no Estado do Rio de Janeiro. Dados como
precipitao total, durao dos eventos, intensidade mxima instantnea e o tempo de
sua ocorrncia foram obtidos atravs de sries sintticas de precipitaes dirias. As
ocorrncias, modeladas como processos markovianos, apresentaram bons resultados,
46
enquanto que a representao do perfil da precipitao no foi satisfatria. A
distribuio estatstica utilizada para tal fora a dupla exponencial.
Lima (2004), por sua vez, desenvolveu um trabalho muito abrangente ao
integrar vrias consideraes no intuito de determinar cheias de projetos hidrulicos.
Alm de gerar sries sintticas de precipitaes dirias, a autora as aplicou em um
modelo chuva-vazo e elaborou uma anlise voltada ao objetivo principal de seu
estudo. Em particular, a gerao das precipitaes baseou-se no mtodo de Boughton
(1999), elaborado a partir de cadeias de Markov de primeira ordem, mas multi-estados.
Dessa maneira, foram construdas 12 matrizes de transio (uma para cada ms do
ano, para manter a sazonalidade), com um estado para representar dias secos e n
estados para representar dias de chuva. No caso dos dias midos, a tcnica das
freqncias relativas foi utilizada, dividindo-se os dados em classes. Para cada uma, a
precipitao foi considerada uniformemente distribuda, exceto a ltima classe que, por
no ter limite superior, necessitou tratamento especial. Dessa maneira, foram
escolhidas duas distribuies empricas (Log-Boughton e distribuio generalizada de
Pareto) para a determinao dos eventos referentes classe em questo. O modelo foi
aplicado nas bacias dos rios Par e Alto So Francisco, no Estado de Minas Gerais. Na
comparao com as sries histricas os resultados foram excelentes, mantendo
semelhanas em relao mdias, desvios padres e ao nmero de dias chuvosos.
1.8 COMENTRIOS FINAIS
Apesar do grande nmero de estudos existentes, o mecanismo das
precipitaes no algo que possa ser generalizado. Nesse contexto, podem-se citar
os diferentes comportamentos dos modelos para regies climatologicamente diversas,
com influncias de sazonalidades e eventos de baixa recorrncia. No campo
paramtrico, por exemplo, o uso de processos estocsticos markovianos prevalece
como sendo uma tcnica bem sucedida e quase unnime na simulao de ocorrncias
das chuvas. Mesmo assim, variaes nas ordens e estados dos modelos produzem
resultados diferentes.
47
Felizmente a variedade e quantidade de abordagens so tantas, que se pode
afirmar que modelos de gerao de sries sintticas de precipitao, aplicados
localmente, possuem bibliografia bem desenvolvida. Novos esforos concentram-se na
elaborao de modelos multivariados, com objetivos comuns a vrios pesquisadores: a
avaliao do impacto das atividades antrpicas nas bacias hidrogrficas e o impacto
das constantes alteraes climticas.
48
CAPTULO II - DESCRIO DO MODELO ADOTADO
O presente Captulo tem por objetivo a descrio completa do mtodo
empregado nesta dissertao para a gerao de sries sintticas de precipitao, em
escala diria. O modelo construdo baseia-se em uma tpica forma paramtrica, na qual
ocorrncias so determinadas e os dias chuvosos associados a uma distribuio
estatstica para a obteno das alturas precipitadas. A referncia base utilizada para o
desenvolvimento dessa dissertao foi Wilks (1998) em sua parcela univariada, ou seja,
para um posto pluviomtrico por vez (o artigo original tambm contempla a gerao de
precipitaes para mltiplas localidades, como visto na seo 1.5). Estudos
semelhantes podem tambm ser encontrados em Katz (1977), Todorovic e Woolhiser
(1975).
A determinao de dias chuvosos ou secos feita com a aplicao de um
processo estocstico markoviano. Especificamente, so empregadas cadeias de
Markov de primeira ordem e dois estados. Como descrito na seo 1.4.2.2, trata-se de
uma tcnica amplamente utilizada e que trouxe bons resultados a vrios estudos. So
empregados tambm dois critrios para a escolha da ordem tima da cadeia.
O clculo das alturas precipitadas feito com a aplicao de uma distribuio
exponencial mista a trs parmetros. So utilizados os mtodos dos Momentos e da
Mxima Verossimilhana para a estimao dos mesmos. As alturas finais so
determinadas atravs do Mtodo da Inverso apresentado na seo 1.4.1 e tambm
descrito em Wilks (2006, p. 123). Quatro testes para verificao da aderncia da
distribuio exponencial mista aos dados so tambm efetuados.
Na sequncia, so descritos os mtodos para a validao das sries geradas.
O modelo de gerao de sries sintticas considerado apropriado quando capaz de
manter as caractersticas estatsticas das sries originais. Para essa verificao, vrios
dados estatsticos diferentes so calculados, tanto para a avaliao das ocorrncias
quanto para as quantidades precipitadas. Est includa tambm uma anlise especfica
para eventos extremos, na inteno de avaliar o desempenho do modelo construdo
sob esse aspecto.
49
Ao final, apresentada a estrutura completa do procedimento utilizado, com a
inteno de esclarecer o emprego de todas as tcnicas descritas e suas interaes
para atingir o objetivo almejado.
2.1 DETERMINAO DAS OCORRNCIAS DAS PRECIPITAES
Em um grande nmero de estudos existentes, a determinao de dias chuvosos
ou secos est atrelada sempre com uma probabilidade de ocorrncia. interessante
notar que, de um modo geral, problemas envolvendo probabilidades tambm trazem
consigo o conceito de aleatoriedade. No caso clssico do lanamento de dados, por
exemplo, essa situao fica evidente: a partir de um nmero suficiente de observaes
possvel calcular uma probabilidade de ocorrncia de cada face do dado. Entretanto,
a cada novo lanamento temse um resultado imprevisvel (para um dado honesto). Por
esse motivo, os novos resultados so considerados como sendo aleatrios e
independentes dos anteriores.
No caso de precipitaes em escala diria, mesmo empregando-se conceitos
de probabilidade, dificilmente uma ocorrncia atual ser independente de uma
ocorrncia anterior. Essa constatao vem de tendncias analisadas ao longo dos
anos, para vrias localidades do mundo. No se pode, obviamente, obter uma
generalizao do grau de dependncia entre os eventos devido complexidade das
dinmicas atmosfricas. Mesmo assim a aplicao de processos estocsticos aparece
como sendo uma boa ferramenta para a determinao das ocorrncias desejadas.
No presente trabalho, o processo estocstico adotado para modelar as
ocorrncias das chuvas so cadeias de Markov de primeira ordem (ocorrncias esto
condicionadas ao dia corrente e ao imediatamente anterior) e dois estados (seco ou
chuvoso). Alem de ser o mtodo utilizado por Wilks (1998), a escolha est embasada
nos bons resultados obtidos em vrios estudos existentes (ver seo 1.4.2.2).
No caso da definio dos estados, convencionam-se os dias correntes como X
e os ndices 0 para dias secos e 1 para dias chuvosos. Em cadeias markovianas de
primeira ordem, quatro so as formas de combinao entre esses estados, a saber:
50
Dia atual chuvoso e anterior seco ( ( ) k X
10
);
Dia atual chuvoso e anterior tambm chuvoso ( ( ) k X
11
);
Dia atual seco e anterior chuvoso ( ( ) k X
01
);
Dia atual seco e anterior tambm seco ( ( ) k X
00
).
A determinao das mudanas entre estados de fundamental importncia
para a construo de todo o processo. Insere-se nesse contexto o conceito de
probabilidades de transio, cuja definio est expressa na equao (1.11). O clculo
dessas probabilidades se d atravs da contagem dos elementos presentes nos
registros histricos da localidade desejada (k), como mostra a equao (2.1):
( )
( )
( ) ( )
( )
( )
( )
( )
( ) ( )
( )
( )
( )
( )
( )
( ) ( )
( )
( )
( )
( )
( ) ( )
( )
( )
( )
= =
+
=
=
+
=
= =
+
=
=
+
=
k p
k N
k N
k N k N
k N
k p
k N
k N
k N k N
k N
k p
k p
k N
k N
k N k N
k N
k p
k N
k N
k N k N
k N
k p
11
1
01
11 10
01
01
1
11
11 10
11
11
00
0
10
10 00
10
10
0
00
10 00
00
00
1
1
(2.1)
onde cada elemento N representa o nmero de dias secos ou chuvosos, de acordo com
a conveno apresentada anteriormente. As equaes (1.14), (1.15) e (1.16)
formalizam o processo markoviano empregado.
Seguindo o mtodo de Wilks (1998), a construo das sries sintticas de
ocorrncias se d com a utilizao dos elementos
10
p e
11
p . definida uma
probabilidade de transio crtica (
C
p ) que ser utilizada para a determinao de cada
um dos novos estados da srie. Essa probabilidade crtica assume os prprios valores
de
10
p e
11
p , de acordo com a evoluo do processo. Nmeros aleatrios
uniformemente distribudos no intervalo (0,1] ( w) so utilizados para executar as
comparaes que definiro tanto o estado inicial (correspondente ao primeiro dia)
quanto os demais estados. O processo est mostrado na figura 6.
O esquema ilustrado na figura 6 mostra os quatro passos necessrios para a
gerao de uma srie sinttica de ocorrncias dirias de precipitaes. O primeiro
51
passo executado somente uma vez; os passos dois, trs e quatro so repetidos
tantas vezes quanto se desejar, de acordo com o nmero de elementos da srie a ser
gerada.
FIGURA 6 ESQUEMA PARA GERAO DE OCORRNCIAS DAS CHUVAS
Mesmo tendo por base um estudo que utilizou cadeias de Markov de primeira
ordem, optou-se nesta dissertao por efetuar dois testes no intuito de avaliar a ordem
tima da cadeia a ser aplicada na regio de interesse. Esta deciso foi tomada devido
grande preocupao de alguns autores com essa definio (Chin, 1977; Deni, Jemain e
Ibrahim, 2008; Jimoh e Webster, 1996; Azevedo e Leito, 1990; Gregory, Wigley e
Jones, 1992). Alm disso, para a regio estudada no presente trabalho, no se
encontrou nenhum estudo especfico da ordem tima a ser utilizada neste processo
estocstico.
Passo 4
Passo 3
Passo 2
Passo 1
Estado Inicial
i. se
10
0 p w < - dia chuvoso ( ( ) 1
1
=
k X
t
);
ii. se
11 10
p w p < - dia chuvoso ( ( ) 1
1
=
k X
t
);
iii. se
11
p w > - dia seco ( ( ) 0
1
=
k X
t
)
Determinao da Probabilidade Crtica
( )
( ) ( )
( ) ( )
=
=
=
1 caso ,
0 caso ,
1 11
1 10
k X k p
k X k p
k p
t
t
C
Determinao do Estado Atual
( )
( )
=
contrrio caso , 0
caso , 1 k p w
k X
c t
t
Faz-se
( ) ( ) k X k X
t t 1
=
Definio de um dia da srie
52
Os dois testes aplicados so os mesmos utilizados pelos autores citados no
pargrafo anterior: Critrio de Informao Akaike (AIC) (Akaike, 1974) e Critrio de
Informao de Bayes (BIC) (Schwarz, 1978). Ambas so estatsticas baseadas no
conceito da verossimilhana, aplicadas s probabilidades de transio calculadas. Wilks
(2006, p. 351) define as funes de verossimilhana para Cadeias de Markov de s
estados e ordens zero, um e dois (tensores de primeira, segunda e terceira ordens):
( ) ( ) [ ]
( ) ( ) [ ]
( ) ( ) [ ]
=
=
=
=
1
0
1
0
1
0
2
1
0
1
0
1
1
0
0
ln .
ln .
ln .
s
h
s
i
s
j
hij hij
s
i
s
j
ij ij
s
j
j j
k p k N L
k p k N L
k p k N L
(2.2)
onde N representa o nmero de dias presentes nas sries histricas com as transies
i, j ou h e p representa as probabilidades de transio.
A interpretao fsica das cadeias de outras ordens parte do mesmo princpio j
apresentado. Em uma cadeia de ordem zero, por exemplo, a notao
0
N representa
total de dias secos presentes na srie histrica. Em uma cadeia de segunda ordem, por
sua vez, a notao
011
N representa o total de dias secos precedidos por dois dias
chuvosos. Essa interpretao tem obvia extenso para as demais configuraes.
Para a funo de verossimilhana de ordem um, o clculo das probabilidades
procede de acordo com as equaes (2.1). Para ordem zero, as probabilidades de
transio so simplesmente:
( )
( )
( )
( )
( )
( )
=
=
k N
k N
k p
k N
k N
k p
1
1
0
0
(2.3)
onde N representa o nmero total de dias da srie histrica. J, no caso da ordem dois,
o clculo torna-se mais trabalhoso e pode ser esquematizado de acordo com a tabela 5
e com a equao (2.4):
53
( )
( )
( ) k N
k N
k p
hi
hij
hij
= (2.4)
TABELA 5 ARRANJO PARA CONTAGEM DAS TRANSIES ENTRE ESTADOS EM UMA CADEIA
MARKOVIANA DE SEGUNDA ORDEM
( ) k X
t 2
( ) k X
t 1
( ) 0 = k X
t
( ) 1 = k X
t
Marginais Totais
0 0 ( ) k N
000
( ) k N
001
( ) ( ) ( ) k N k N k N
001 000 00
+ =
0 1 ( ) k N
010
( ) k N
011
( ) ( ) ( ) k N k N k N
011 010 01
+ =
1 0 ( ) k N
100
( ) k N
101
( ) ( ) ( ) k N k N k N
101 100 10
+ =
1 1 ( ) k N
110
( ) k N
111
( ) ( ) ( ) k N k N k N
111 110 11
+ =
FONTE: Adaptado de Wilks (2006, p. 350)
Tanto na tabela 5 quanto na equao 2.4, o smbolo representa a possibilidade de
dia seco ou mido, de acordo com o caso em questo.
Uma vez calculados todos os parmetros, os testes podem ser aplicados. Os
critrios so calcados no princpio da parcimnia. A ordem tima do modelo obtida a
partir de uma equao que releva a aderncia do ajuste (atravs das funes de
verossimilhana) e uma penalidade que aumenta proporcionalmente com o nmero de
parmetros a ser utilizado. Para o Critrio de Akaike (AIC) (Akaike, 1974), a equao
dada por:
( ) ( ) 1 2 2 + = s s L m AIC
m
m
(2.5)
E no caso do Critrio de Bayes (BIC) (Schwarz, 1978):
( ) ( ) n s L m BIC
m
m
ln 2 + = (2.6)
Para ambas as equaes, m representa a ordem da cadeia de Markov a ser testada, s
o nmero de estados e n o tamanho da amostra.
Nota-se que os dois critrios so semelhantes, diferindo apenas no grau de
penalidade considerado. Entretanto, em termos de resultados, os dois estimadores
podem divergir de forma acentuada. Por esse motivo, Katz (1981) elaborou um estudo
mais aprofundado dos dois critrios, analisando suas propriedades estatsticas quando
aplicados a cadeias de Markov. Como resultado, o critrio AIC apresentou uma grande
probabilidade de superestimar as ordens dos modelos, independentemente do nmero
54
de elementos da amostra. Dessa maneira, o autor considera esse critrio inconsistente
e recomenda o uso do estimador BIC.
Ainda assim, estudos posteriores ao de Katz (1981) continuaram estimando a
ordem das cadeias markovianas utilizando ambos os critrios (Deni, Jemain e Ibrahim,
2008; Jimoh e Webster, 1996; Azevedo e Leito, 1990; Gregory, Wigley e Jones, 1992).
Em todos eles, a ordem tima da cadeia foi escolhida aps uma anlise comparativa
entre os dois critrios. Na presente dissertao, o modelo de primeira ordem foi
escolhido mesmo sem a realizao dos testes citados. Por isso sua realizao til
como uma forma de validao do modelo, juntamente com outros fatores a serem
descritos na seo 2.3. Os testes esto limitados a cadeias de segunda ordem.
2.2 DETERMINAO DAS QUANTIDADES PRECIPITADAS
Da mesma forma que em Wilks (1998), a distribuio estatstica utilizada para o
clculo das alturas precipitadas nos dias considerados chuvosos, a exponencial mista
a trs parmetros. Segundo Wilks (2006, p. 109) alguns mecanismos fsicos
apresentam mais de um processo gerador, fazendo com que sua representao por
uma distribuio estatstica simples seja incompleta. Por isso, distribuies mistas
trazem um bom grau de flexibilidade aos modelos, refletindo diretamente nos resultados
a serem obtidos.
No caso da distribuio exponencial mista a trs parmetros utilizada neste
trabalho, a funo densidade de probabilidades dada por:
( ) [ ]
( )
( )
( )
( )
( )
( )
( )
( )
( ) ( ) ( ) 1 0 , 0
exp
1
exp
2 1
2 2 1 1
< >
(
+
(
=
k k k
k
k r
k
k
k
k r
k
k
k r f
R
(2.7)
Por sua vez, a funo de probabilidades acumulada expressa por:
( ) [ ] ( ) [ ] ( )
( )
( )
( )
( )
( ) [ ]
( )
( )
)
`
= =
k
k r
k
k
k r
k k r k r f k r F
k r
R R
2 1 0
exp 1 exp 1 d
(2.8)
55
Onde R representa a varivel aleatria, r representa o valor assumido pela varivel
aleatria (quantidade de chuva propriamente dita) e ,
1
e
2
representam os
parmetros. Todo o conjunto de incgnitas est atrelado a uma localidade especfica k.
Essa distribuio mista pode ser encarada tambm como a soma de duas
funes exponenciais simples (a um parmetro) intermediadas por um fator de
probabilidade. A reduo da equao (2.7) para uma distribuio exponencial simples
pode acontecer quando
2 1
= , 0 = ou 1 = .
Wilks (2006, p. 109) exemplifica a aplicao fsica de uma distribuio mista
para o caso do estudo de temperaturas em uma cidade. Em anos normais a funo
representada pela mdia
1
; j em anos com a influncia do fenmeno El Nio, a
funo representada pela mdia
2
. A probabilidade de ocorrncia de anos normais
ou anos de El Nino representada pelo parmetro . No caso de precipitaes, as
mdias
1
e
2
podem ser associadas menor ou maior quantidade de chuva em um
determinado dia. Por esse motivo, na gerao da quantidade de chuva em um dia
especfico, somente uma das mdias estimadas utilizada.
Da mesma forma que na funo densidade de probabilidade, as propriedades
estatsticas da funo mista tambm dependem do parmetro probabilstico . Assim,
a mdia e a varincia so expressas por:
( )
2 1
1 . + = (2.9)
( ) ( )( )
2
2 1
2
2
2
1
2
. 1 . . 1 . + + = (2.10)
O mtodo para estimao dos parmetros da distribuio probabilstica em
questo foi escolhido com base no grande nmero de estudos existentes. usado o
Mtodo da Mxima Verossimilhana (descrito na seo 1.4.3.3), citado por vrios
autores como sendo o de melhor desempenho assinttico, quando comparado a outros
mtodos (Cramr, 1974, p. 498; Foufoula-Georgiou e Lettenmaier, 1987; Thom, 1958
apud Botelho e Morais, 1999; Grondona et al., 2000). Entretanto, a determinao das
estimativas dos parmetros para a distribuio exponencial mista no se d de forma
direta. A justificativa mostrada a seguir, na montagem das equaes de
verossimilhana:
56
( )
( )
( )
( )
( )
( )
( )
( )
( )
=
)
`
+
(
=
n
i
k
k r
k
k
k
k r
k
k
r L
1 2 2 1 1
2 1
exp
1
exp , , ;
(2.11)
Aplicando os logaritmos:
( )
( )
( )
( )
( )
( )
( )
( )
( )
=
)
`
+
(
=
=
n
i
k
k r
k
k
k
k r
k
k
r L
1 2 2 1 1
2 1
exp
1
exp . ln , , ; ln
(2.12)
A equao (2.12) representa a funo de verossimilhana para a distribuio. Para a
estimao dos parmetros, necessrio encontrar os valores que maximizem a
equao. Nota-se, contudo, que a derivao desta equao n]ao possvel
analiticamente. Por esse motivo necessria a busca por um outro mtodo de
estimao, de preferncia baseado no conceito da Mxima Verossimilhana.
A soluo encontrada est na aplicao da tcnica do algoritmo EM, cujo artigo
original foi escrito por Dempster, Laird e Rubin (1977). Alm de tornar possvel a
estimao dos parmetros necessrios, essa tcnica extremamente conveniente, pois
sua formulao foi escrita de forma que eventuais dados faltantes nas sries no
atrapalhem o resultado final da estimao (Wilks, 2006, p. 117). Esse fato torna
atraente a utilizao do mtodo, pois a regio de interesse do presente estudo possui
sries histricas com a presena de falhas nos registros (ver seo 3.2).
importante dizer que o algoritmo EM no foi desenvolvido exclusivamente
para a estimao de parmetros de distribuies probabilsticas. Wilks (2006, p. 117,
traduo do autor) ressalta tambm que o termo algoritmo no o mais apropriado
para esse mtodo, haja vista que no se trata de um procedimento objetivo, mas de
uma aproximao conceitual que necessita ser moldada a problemas particulares.
Portanto ele pode ser construdo para um problema cujo objetivo seja a estimao de
parmetros atravs do Mtodo da Mxima Verossimilhana.
O algoritmo consiste em um procedimento interativo com duas fases distintas:
Expectncia e Maximizao. A primeira fase, ou Expectncia, calcula as n
probabilidades condicionais atreladas distribuio exponencial mista e a cada uma
das observaes:
57
( )
( ) ( )
( ) ( ) ( ) [ ] ( )
n i
k r f k k r f k
k r f k
k r f P
i i
i
i
..., , 2 , 1 ,
, , . 1 , , .
, , .
, |
2 2 1 1
1 1
2 , 1
=
+
=
(2.13)
As funes
1
f e
2
f referem-se s duas distribuies exponenciais simples da
distribuio mista, cujos parmetros so
1
e
2
, respectivamente. A primeira
atualizao do parmetro de probabilidades ento obtida:
( ) ( )
=
n
i
i
k r f P
n
k
1
2 , 1
, |
1
(2.14)
A segunda fase, ou Maximizao, nada mais do que a aplicao do conceito
da Mxima Verossimilhana, na qual as primeiras atualizaes dos parmetros
1
e
2
so calculadas:
( )
( )
( ) ( )
( )
( ) [ ]
( ) [ ] ( )
=
=
n
i
i i
n
i
i i
k r k r f P
k n
k
k r k r f P
k n
k
1
2 , 1 2
1
2 , 1 1
. , | 1
1 .
1
. , |
.
1
(2.15)
A implementao do algoritmo resume-se na atribuio inicial de valores aos
parmetros ,
1
e
2
. So utilizadas as equaes (2.13) e (2.14) para as primeiras
atualizaes dos parmetros. As equaes (2.15) obtm as atualizaes para as
mdias
1
e
2
. Com os novos valores, o processo volta ao comeo e continua at a
convergncia. A verificao feita calculando-se a equao de log-verossimilhana
(2.12) aps cada atualizao de parmetros. Adotou-se como critrio de parada uma
diferena de 10
-4
entre a penltima e a ltima funes calculadas.
Ainda segundo Wilks (2006, p. 119) a atribuio inicial de valores no necessita
boa preciso, pois o Algoritmo EM busca a converso independentemente do valor
inicial. Entretanto, no intuito de otimizar o desempenho e a utilizao do modelo
construdo nessa dissertao, optou-se por automatizar inclusive os palpites iniciais dos
parmetros. Para isso, utilizado o estudo de Rider (1961), no qual so deduzidas as
equaes para a estimao dos parmetros da distribuio exponencial mista atravs
do Mtodo dos Momentos. De acordo com a definio apresentada na seo 1.4.3.3,
necessrio a resoluo de um sistema de trs equaes:
58
( ) ( ) ( ) [ ] ( )
( ) ( ) ( ) [ ] ( )
( ) ( ) ( ) [ ] ( )
= +
= +
= +
6
. 1
2
. 1 .
. 1 .
3 3
2
3
1
2 2
2
2
1
1 2 1
m
k k k k
m
k k k k
m k k k k
(2.16)
onde
1
m ,
2
m e
3
m representam os respectivos momentos amostrais. Eliminando
entre as equaes (2.16), chega-se a:
( ) ( ) ( ) ( ) 0 . 2 . 3 . . . 3 . 2 . . 2 . 6
3 1 2 2 1 3
2
2
2
1
= + + m m m k m m m k m m
j j
(2.17)
As duas razes da expresso (2.17) se referem a
1
e
2
. O valor de obtido
utilizando-se:
( )
( ) [ ]
( ) ( ) [ ] k k
k m
k
2 1
2 1
= (2.18)
Uma vez estimados os parmetros da distribuio para uma dada localidade, s
resta a gerao da altura de chuva. O objetivo passa a ser a determinao da varivel
aleatria ( ) k R correspondente funo probabilstica em questo. Como o que se
busca a gerao aleatria de valores que sigam a distribuio exponencial para
compor a srie sinttica, o mtodo utilizado o mesmo da gerao de variveis
aleatrias com distribuies especficas, utilizando-se da inverso da funo densidade
de probabilidades acumulada. o Mtodo da Inverso apresentado na seo 1.4.1 e
que Wilks (2006, p. 123) descreve para a distribuio exponencial:
( ) [ ] ( ) [ ] ( )
( )
( )
( )
( )
( )
( )
( )
( )
(
=
(
= =
k r k r
R R
k
k r
k r
k
k r
k
k r k r f k r F
0 0
exp 1 d exp
1
d ; ;
(2.19)
Nota-se que a equao (2.19) envolve somente uma distribuio exponencial
simples. importante frisar que, na gerao da quantidade precipitada em um dia
especfico, somente uma das mdias
1
e
2
estimadas utilizada. Assim, a grosso
modo, pode-se dizer que a distribuio exponencial mista a trs parmetros se reduz a
uma exponencial simples a um parmetro, no clculo final da altura precipitada.
59
Para melhor entendimento do mtodo da inverso aplicado distribuio
exponencial simples, a deduo em (2.19) pode ser visualizada graficamente na figura
7. Assim, para gerar uma varivel aleatria com distribuio especfica (
i
X ),
necessria a gerao de uma varivel aleatria uniformemente distribuda no intervalo
(0,1] (
i
u ) e inverter a funo densidade de probabilidade acumulada (2.19), substituindo
o valor gerado na funo resultante.
Wilks (1998) apresenta o resultado dessa inverso aplicada distribuio
exponencial. As alturas das chuvas so determinadas a partir da equao (2.20):
( ) ( ) ( )
i i
v k r k r ln .
min
= (2.20)
onde
min
r representa a quantidade mnima de precipitao para um dia ser considerado
chuvoso e
i
v um nmero aleatrio uniformemente distribudo no intervalo (0,1]. A
escolha entre as mdias
1
e
2
feita a partir da gerao de outro nmero aleatrio
uniforme (
i
u ). Caso
i
u , a mdia
1
escolhida; se >
i
u , a mdia escolhida a
2
.
FIGURA 7 OBTENO DE VARIVEIS ALEATRIAS COM DISTRIBUIES ESPECFICAS PELO
MTODO DA INVERSO.
Completa-se o modelo de gerao a partir da equao (2.21):
( ) ( ) ( ) k r k X k Y
i i i
. = (2.21)
60
onde ( ) k X
i
assume os valores 0 ou 1, dependendo dos resultados do procedimento de
ocorrncias, explicado na seo 2.1.
Como dito anteriormente, apesar de adotada a distribuio exponencial mista
para a representao das quantidades precipitadas, seu desempenho na regio de
interesse deste trabalho uma incgnita. Por esse motivo, realizada uma anlise de
adequao dos ajustes, independente do resto do estudo. Da mesma forma que na
aplicao dos testes AIC e BIC para determinao das ordens timas da cadeia de
Markov, o resultado das anlises referidas no ir repercutir em uma mudana na
estrutura do modelo proposto.
Em um primeiro momento, a verificao dos ajustes probabilsticos no
realizada com a aplicao de testes, mas simplesmente com a construo de curvas
probabilsticas e anlise visual. A distribuio exponencial mista a trs parmetros
comparada com a distribuio gama a dois parmetros, outra distribuio amplamente
utilizada pelos pesquisadores da rea (ver Captulo I). Os parmetros da distribuio
gama ( e - ver equao 1.17) so determinados de acordo com formulao
encontrada em Botelho e Morais (1999), obtidos atravs do Mtodo da Mxima
Verossimilhana:
=
+ +
=
X
A
A
4
3 4 1 1
(2.22)
onde
=
=
n
j
j
x
n
X A
1
ln
1
ln
(2.23)
e X representa a mdia precipitada no perodo,
j
x a quantidade de chuva no evento e
n o nmero de anos da amostra.
Dois so os grficos construdos: o primeiro uma comparao tradicional
entre a distribuio emprica e seus respectivos ajustes, de acordo com os modelos
61
acima citados. Para os ajustes, os nveis probabilsticos seguem a tradicional equao
de Weibull:
( )
1 +
=
n
i
i F
X
(2.24)
onde i representa a observao corrente e n o nmero total de elementos da amostra.
Ao analisar as duas curvas construdas (exponencial mista e gama), o melhor ajuste
dever ser aquele cuja curva mais se aproxime da distribuio emprica.
O segundo grfico uma comparao direta entre probabilidades. Tambm
conhecido como grfico Probabilidade-Probabilidade, ou ainda P-P plot (Wilks, 2006, p.
114), esta representao computa os nveis probabilsticos tericos (novamente
utilizando-se a equao 2.24) como funo das distribuies que esto sob anlise. O
resultado um grfico com eixos de mesma dimenso ( 1 0 < < i ), cujo melhor ajuste
aquele que se aproxima da linha diagonal 1:1.
Aps as verificaes visuais, as qualidades dos ajustes dos modelos
probabilsticos so avaliadas formalmente, atravs do emprego de dois testes clssicos:
Qui-quadrado (
2
) e Kolmogorov-Smirnov. Ambos so amplamente utilizados na
literatura justamente para verificao do ajuste de uma distribuio probabilstica sobre
determinado grupo de dados. As hipteses em questo, para os dois testes, so as
seguintes:
=
=
grupos os entre diferena uma menos, pelo existe,
grupos os entre diferenas existem no
1
0
H
H
O teste do Qui-quadrado (
2
) baseia-se na separao dos dados em classes e
comparao entre os valores observados e esperados em cada classe. Sua estatstica
calculada de acordo com a equao (2.24) (Kite, 1977):
( )
=
k
j j
j j
calc
E
E O
1
2
2
(2.25)
Diz-se que a equao (2.25) segue uma distribuio qui-quadrado com 1 k graus de
liberdade, onde
j
O o nmero de eventos observados na classe j e
j
E o nmero de
eventos esperados na mesma classe, de acordo com a distribuio probabilstica
62
terica em teste; k o nmero de classes utilizado. O veredicto ser conhecido atravs
da comparao entre o resultado da equao (2.26) e o valor de
2
tabelado (nvel de
confiana e 1 k graus de liberdade). Caso
2 2
calc
a hiptese nula aceita e o
modelo probabilstico considerado adequado. Vale lembrar que o teste qui-quadrado
unilateral, pois a estatstica calculada est limitada a valores positivos pelo numerador
da equao (2.25).
A definio do nmero de classes nas quais os dados sero divididos
subjetiva; Wilks (2006, p. 147) escreve que classes com nmeros de eventos reduzidos
devem ser evitadas. Para a realizao do teste nesta dissertao, o nmero de classes
foi calculado de acordo com formulao de Kite (1977, p. 159):
S X Classes .
2
4
.
2
|
|
\
|
+ =
(2.26)
onde S X, e so, respectivamente, mdia, desvio padro e coeficiente de assimetria
da amostra;
2
o valor do qui-quadrado tabelado para nvel de confiana P e
2
8
graus de liberdade.
De acordo com Kite (1977, p. 160) e Wilks (2006, p 146), a diviso da amostra
em classes, principalmente quando se trabalha com distribuies probabilsticas
contnuas, pode causar uma indesejada perda de informaes. Assim, os autores
recomendam a aplicao de um segundo teste: Kolmogorov-Smirnov. De formulao
simples, ele procura o maior desvio presente entre as distribuies terica e emprica.
Esses desvios, ou diferenas, so calculados para cada elemento da amostra atravs
da equao (2.27):
( ) ( ) x F i F mx D
X X n
= (2.27)
na qual ( ) i F
X
a funo densidade de probabilidades acumulada emprica (calculada
de acordo com a equao 2.24) e ( ) x F
X
a funo densidade de probabilidades
acumulada terica;
n
D a mxima diferena encontrada. Quando comparada a um
valor crtico (
crit
D ) o veredicto de teste conhecido. Existem tabelas para diversos
valores crticos de
crit
D ; como estes dependem do nmero de elementos da amostra
63
(diferentes em cada posto pluviomtrico) optou-se neste trabalho em utilizar uma
equao genrica, proposta por Stephens (1974 apud Wilks, 2006, p. 148):
n n
K
D
crit
. 11 , 0 12 , 0 + +
=
(2.28)
onde
K assume 1,224; 1,358 ou 1,628; para nveis de confiana de 90%, 95% e 99%
respectivamente e n o nmero de elementos da amostra. A hiptese nula aceita se
crit n
D D .
Espera-se que essas quatro anlises, juntamente com a aplicao dos critrios
AIC e BIC, possam fornecer uma melhor noo do desempenho do modelo de gerao
utilizado, quando aplicado a presente rea de estudo.
2.3 VALIDAO DO MODELO
Ao modelar sries temporais relacionadas a fenmenos naturais, assume-se
que o sistema regido por um processo estocstico. Pode-se dizer que diferentes
eventos dentro das sries naturais seguem uma mesma distribuio probabilstica
dentro do mecanismo principal.
Quando se trabalha com gerao de sries sintticas para aplicaes em
diversos estudos, sempre gerado um grande nmero delas, na inteno de se reduzir
o erro amostral. O conjunto das sries geradas deve apresentar a propriedade de
reproduzir as mesmas caractersticas estatsticas da srie original, utilizada para
desenvolver o modelo. desejvel tambm que sejam indistinguveis, para que todas
as sries sejam equiprovveis, ou seja, tenham a mesma probabilidade de ocorrncia.
Portanto ao validar um modelo comum o clculo de diversas propriedades
estatsticas das sries geradas e comparadas com as mesmas propriedades das sries
originais. Todavia, Kelman (1987, p. 363) afirma que quando alguma propriedade
utilizada para a determinao de um parmetro do modelo, esta propriedade
automaticamente preservada, por construo. Assim, ao validar um modelo,
importante a anlise de diversos fatores, preferencialmente relacionados ao que se
64
prope esse modelo. Em muitos casos essa verificao pode ser simplesmente atravs
de uma anlise visual sobre os resultados gerados.
Na presente dissertao, o processo de validao segue uma coletnea de
procedimentos retirados dos vrios estudos citados anteriormente (Richardson, 1981;
Foufoula-Georgiou e Lettenmaier, 1987; Haan, Allen e Street, 1976; Chin, 1977;
Harrold, Sharma e Sheather, 2003; Lima, 2004; Liao, Zhang e Chen, 2004). Esses
estudos so representativos do ponto de vista da validao; as tcnicas utilizadas por
seus respectivos autores so tambm utilizadas em vrios outros estudos existentes.
Em primeiro lugar, so analisados os dados provenientes da construo das
Cadeias de Markov. So anotados todos os parmetros da cadeia (probabilidades de
transio) assim como os resultados dos testes AIC e BIC. A seguir feita uma
comparao do nmero de dias secos e chuvosos presentes nas sries histricas
versus os gerados.
Com relao s quantidades precipitadas, vrios clculos so realizados. A
exemplo do procedimento de ocorrncia so tambm anotados os parmetros da
distribuio exponencial mista obtidos pelos dois mtodos citados. Na sequncia, so
comparados: mdias e desvios padro de longo termo, total precipitado e precipitao
mxima diria. So construdos tambm intervalos de confiana para as mdias e os
desvios padro. Ressalta-se que para todos os clculos referentes s quantidades
precipitadas os dias sem chuva so ignorados.
O ltimo parmetro a ser calculado para a validao foi o coeficiente de
correlao cruzada, entre a srie histrica e a gerada. Como mencionado no incio
desta seo, desejvel que as sries sejam indistinguveis entre si. Portanto o
resultado esperado deste coeficiente de correlao cruzada o mais perto de zero
possvel, caracterizando a independncia entre as sries. Vale lembrar que o clculo
dos coeficientes de autocorrelao (ou correlao em srie) no aplicvel ao caso
das precipitaes dirias. Isso porque o nvel de dependncia entre o dia corrente e os
anteriores no so definidos, fazendo com que no seja possvel a determinao de
uma correlao em srie para os perodos considerados. Em seu estudo, Richardson
(1981) modelou, alm de precipitaes, insolao e temperaturas em escala diria. Na
validao de seu modelo, foram calculados coeficientes de correlao em srie
65
somente para a insolao e temperaturas. No caso das precipitaes, esse clculo foi
ignorado, sendo substitudo por outras formas de validao.
2.4 ANLISES EXTRAS
Com o modelo de gerao devidamente depurado e validado, novas anlises
podem ser realizadas. Na presente dissertao, foi feita a opo de anlises
relacionadas a eventos extremos, ou eventos de baixa freqncia de ocorrncia.
importante salientar que essas ocorrncias no so limitadas a chuvas de grande
intensidade, mas estendem-se tambm a perodos de estiagem mais longos do que o
normal.
Dentre as diversas formas de se fazer uma anlise de eventos extremos,
escolheu-se determinar:
A sequncia mxima de dias secos ou chuvosos consecutivos: sabe-se,
atravs do exposto na seo 2.1, que as ocorrncias das precipitaes so
determinadas com base em comparaes entre probabilidades de transio
e nmeros aleatrios. interessante saber, entretanto, se o modelo capaz
de reproduzir sequncias de dias de mesmo estado condizentes com a
srie original;
Total precipitado por perodo: em muitos casos chuvas intensas distribudas
por perodos superiores a um dia so muito significativas. Por esse motivo
so calculados os totais precipitados mximos acumulados em perodos de
um a dez dias de durao. Vale lembrar que, diferentemente do clculo das
estatsticas bsicas de validao do modelo referentes s quantidades
precipitadas, neste item os dias sem chuva no so ignorados.
Distribuio de probabilidades para as sequncias de dias secos: no intuito
de realizar uma anlise mais aprofundada dos perodos de estiagem, as
distribuies de probabilidades empricas das sequncias de dias secos
entre as sries geradas e as originais so comparadas.
66
Espera-se, atravs dessas anlises, a obteno de uma avaliao mais
criteriosa das sries geradas pelo modelo construdo.
Por fim, tendo sido apresentados todos os mtodos utilizados para a elaborao
do programa de gerao de sries sintticas, pode-se traar um organograma completo
do algoritmo desenvolvido nesta dissertao. Est apresentado na figura 8.
67
FIGURA 8 ALGORITMO DE GERAO DE SRIES SINTTICAS
68
CAPTULO III - DESCRIO DA REA DE ESTUDO
Para a aplicao do modelo proposto, foram escolhidas estaes pluviomtricas
localizadas nas bacias hidrogrficas dos rios Paran e Uruguai. Ambas as bacias
cumprem um importante papel no cenrio de gerao de energia hidreltrica do Brasil.
Somadas, contm aproximadamente 63,6% do potencial hidreltrico brasileiro
instalado, alm do potencial remanescente para futuras instalaes (ANEEL, 2005).
Todo esse potencial um grande fator motivacional para a escolha da rea.
Pode-se tambm citar como fator importante para a aplicao do modelo neste
local a falta de estudos desse tipo na regio. Os dois nicos encontrados foram os
trabalhos de Nascimento e Kelman (1995) e Gomes et al. (2006), ambos aplicados
bacia do rio Uruguai, no Rio Grande do Sul. Nos Estados de Santa Catarina, Paran e
So Paulo, alm do estudo Krger, Kaviski e Mller (1998), poucas referncias existem.
Alm das caractersticas das bacias em estudo, sero descritas tambm as
estaes das quais as sries histricas foram retiradas e seu critrio de escolha. Est
inclusa tambm uma anlise sobre a condio dessas sries, com comentrios sobre a
quantidade de anos disponveis nos registros e os dados faltantes.
3.1 BACIAS HIDROGRFICAS EM ESTUDO
O territrio brasileiro dotado de uma complexa rede hidrogrfica, marcada por
importantes rios. A maioria desses rios do tipo planalto, ou seja, apresentam quebras
de declive e vales devido s configuraes do relevo. Essa a caracterstica que torna
o Brasil um pas com um dos maiores potenciais hidreltricos do mundo. Grande parte
dos rios brasileiros alimentada por guas da chuva, marcando um regime
exclusivamente pluvial. Os cursos so predominantemente exorricos, ou seja,
possuem sentido continente-mar.
Muitas so as divises adotadas entre as grandes bacias hidrogrficas
brasileiras. A figura 9 traz uma delas, adotada pela Agncia Nacional de Energia
Eltrica brasileira (ANEEL, 2005), com destaque s bacias dos rios Paran e Uruguai,
69
utilizadas na presente dissertao. As divisas apresentadas na figura referem-se
diviso territorial dos Estados brasileiros.
FIGURA 9 BACIAS HIDROGRFICAS BRASILEIRAS (1) AMAZONAS (2) ATLNTICO NORTE-
NORDESTE (3) TOCANTINS (4) SO FRANCISCO (5) ATLNTICO LESTE (6) PARAN
(7) URUGUAI (8) ATLNTICO SUL-SUDESTE
FONTE: Adaptado de Economia BR (disponvel em <http://www.economiabr.defesabr.com/
Fotos/Bacias_BR.gif>)
A bacia do rio Paran ocupa uma rea de aproximadamente 1237 mil km,
distribudos entre os Estados de Gois, Minas Gerais, Mato Grosso do Sul, So Paulo,
Paran, Santa Catarina e Rio Grande do Sul, alm do Distrito Federal. Localiza-se entre
os paralelos de 14e 27(Sul) e os meridianos de 43e 60(Oeste), possuindo uma
vazo mdia anual de 15620 m/s e um volume mdio anual de 495 km (ANEEL,
2005). delimitada, ao Norte, pelas bacias Amaznica e Tocantins, a nordeste pela
bacia do rio So Francisco, a Leste pelas bacias Atlntico Leste e Sul-Sudeste e a Sul
pelas bacias do rio Uruguai e Atlntico Sul-Sudeste.
Seus rios secundrios, ao contrrio da maioria dos rios brasileiros, apresentam
a caracterstica de serem endorricos, isto , cursam para o interior do continente, onde
1 2
3
4
5
6
7
8
70
desguam em outros rios. Formam oito sub-bacias de destaque, mostradas na figura
10.
FIGURA 10 SUB-BACIAS DO RIO PARAN (60) RIO PARANABA (61) RIO GRANDE (62) RIOS
PARAN, TIET E OUTROS (63) RIOS PARAN, PARDO E OUTROS (64) RIOS
PARAN, PARANAPANEMA E OUTROS (65) RIOS PARAN, IGUAU E OUTROS (66)
RIOS PARAGUAI, SO LOURENO E OUTROS (67) RIOS PARAGUAI, APA E OUTROS
(68) RIOS PARAN, CORRIENTES E OUTROS
FONTE: ANEEL, 2005
A bacia do rio Paran possui uma importncia significativa dentre as outras
bacias brasileiras por apresentar o maior potencial hidreltrico instalado. Itaipu, Ilha
Solteira, Foz do Areia, Jupi, Marimbondo, Porto Primavera, Salto Santiago, gua
Vermelha, Segredo e outras grandes usinas operam nessa bacia, totalizando uma
potncia de 39262,81 mega-watts instalados, 59,3% de todo o territrio nacional
(Eletrobrs, 2003 apud ANEEL, 2005).
A bacia do rio Uruguai ocupa uma rea de aproximadamente 175 mil km em
territrio brasileiro (385 mil km no total), contendo os Estados de Santa Catarina e Rio
Grande do Sul. Localiza-se entre os paralelos de 27e 32(Sul) e os meridianos de
4930 e 5815 (Oeste), com uma vazo mdia anual de 3600 m/s e um volume mdio
71
anual de 114 km (ANEEL, 2005). Sua poro brasileira delimitada, ao Norte, pela
bacia do rio Paran, a nordeste e a Leste pela bacia do Atlntico Sul-Sudeste, a Oeste
pela Argentina e a Sul pelo Uruguai.
Da mesma forma que a bacia do rio Paran, os rios secundrios da bacia do rio
Uruguai so endorricos e desguam em outros rios cujo destino final o grande rio da
Prata. Formam oito sub-bacias, conforme mostra a figura 11.
FIGURA 11 SUB-BACIAS DO RIO URUGUAI (70) RIO PELOTAS (71) RIO CANOAS (72) RIOS
URUGUAI, DO PEIXE E OUTROS (73) RIOS URUGUAI, CHAPEC E OUTROS (74)
RIOS URUGUAI, DA VRZEA E OUTROS (75) RIOS URUGUAI, IJU E OUTROS (76)
RIOS URUGUAI, IBICU E OUTROS (77) RIOS URUGUAI, QUARA E OUTROS (79)
RIOS URUGUAI, NEGRO E OUTROS
FONTE: ANEEL (2005)
A gerao de hidroeletricidade nesta bacia no comparvel ao da bacia do rio
Paran, entretanto ela tem um potencial a instalar de aproximadamente 40500 mega-
watts, considerando tambm os lados argentinos e uruguaios de sua rea. Isso faz com
que a bacia do rio Uruguai tenha uma das maiores relaes de gerao de energia por
km do mundo. Mesmo assim, podem-se encontrar usinas de grande capacidade de
gerao, como It, Machadinho e Salto Grande (bi-nacional entre Argentina e Uruguai).
72
Para a caracterizao geral do clima no qual as bacias dos rios Paran e
Uruguai esto inseridas, utilizada a forma mais recente da classificao de Kppen-
Geider (Peel, Finlayson e McMahon, 2007). Essa classificao foi elaborada
inicialmente com informaes relacionadas a relevos, vegetaes, regimes
pluviomtricos e temperaturas. A partir de ento, novas atualizaes so propostas,
com informaes adicionais de novas estaes de medio espalhadas pelo mundo. Os
mapas climticos mostrados em Peel, Finlayson e McMahon (2007) limitam-se a uma
escala continental.
Ambas as bacias estudadas possuem clima predominantemente do tipo Cfa.
Algumas regies de So Paulo e Minas Gerais, apresentam tambm climas dos tipos
Cwa e Cwb. A regio noroeste da bacia do rio Paran (partes dos Estados de Gois,
Minas Gerais e Mato Grosso do Sul) possui clima do tipo Aw. Por fim, existem pontos
isolados entre os Estados do Paran e de Santa Catarina que possuem clima do tipo
Cfb. A tabela 7 descreve as siglas utilizadas na caracterizao climtica das bacias
analisadas.
TABELA 6 CLASSIFICAO DE KPPEN-GEIDER ATUALIZADA PARA AS BACIAS DOS RIOS
PARAN E URUGUAI
1 Letra 2 Letra 3 Letra Descrio
A Tropical
f - Floresta Tropical
m - Mones
w - Savana
C Temperado
s - Vero Seco
w - Inverno Seco
f - Sem Estao Seca
a - Vero Quente
b - Vero Ameno
c - Vero Frio
FONTE: Adaptado de Peel, Finlayson e Mcmahon, 2007 (traduo do autor)
Diferentemente da classificao a nvel continental acima descrita, Mendona e
Danni-Oliveira (2007) oferecem uma anlise mais refinada dos tipos climticos
encontrados na regio de interesse. Os domnios climticos encontrados so dois: clima
tropical mido-seco e clima subtropical mido. Na regio formada pelos Estados de
Gois, Minas Gerais, Mato Grosso do Sul e Centro-Norte de So Paulo, predomina o
clima tropical mido-seco, com duas distines: regio sem seca (Oeste) e regio com
73
um a trs meses secos (Leste). Por sua vez, a regio formada pelos Estados do Rio
Grande do Sul, Santa Catarina e Paran, alm das reas remanescentes de So Paulo,
apresenta clima subtropical mido, tambm com duas distines: inverno frio (Leste dos
Estados do Paran e Santa Catarina) e com inverno fresco a frio (demais localidades).
As principais caractersticas encontradas nessas regies so apresentadas na
sequncia.
Nas reas de clima tropical mido-seco pode-se encontrar uma grande
variedade de tipos de tempo durante o ano. A tendncia tempo quente e mido no
vero e quente e seco no inverno. As temperaturas mdias variam entre 20C ao Sul e
26C na poro centro-Norte. As mximas atingem md ias de 36C nos meses mais
quentes, enquanto as mnimas chegam a 8C, no inver no. A precipitao mdia para
estas reas pode superar os 2000 mm e, como dito, grande parte das ocorrncias se d
nos meses mais quentes do ano.
No caso das regies de clima subtropical mido, observa-se uma discrepncia
entre o regime de temperaturas e o pluvial durante o ano. A variabilidade trmica
acentuada, com mdias entre 14C e 22C, podendo ch egar a 10C nas pores de
maior altitude. Em mdia, os registros mximos situam-se entre 26C e 30C, enquanto
que os mnimos chegam prximos aos 0C. Mesmo assim, os registros de neve limitam-
se a poucos pontos serranos (em geral nas serras gachas e catarinenses), fazendo
com que o regime pluviomtrico da bacia inteira possa ser caracterizado somente por
chuvas. Diferentemente desta variabilidade de temperaturas, a distribuio das
precipitaes ao longo do ano regular e as mdias ficam entre 1250 mm e 2000 mm.
Ainda de acordo com Mendona e Danni-Oliveira (2007), o mecanismo gerador
das precipitaes tanto na regio Sul do pas quanto nas pores meridionais dos
Estados de So Paulo e Mato Grosso do Sul fortemente influenciado pela Frente
Polar Atlntica (FPA). Para eles, uma parcela considervel do dinamismo das chuvas e
da circulao atmosfrica dessas reas tem origem nos processos frotogenticos da
FPA. A Massa Polar Atlntica (MPA), formadora dos processos FPA, origina-se do
atrito do ar polar, oriundo do Oceano Pacfico-Sul, com a Cordilheira dos Andes.
74
3.2 ESTAES SELECIONADAS
No intuito de testar o modelo sob as diferentes condies climticas
encontradas dentro da rea de estudo, optou-se por escolher estaes pluviomtricas
bem distribudas dentro de cada bacia. Dessa maneira, o nmero total de estaes
selecionadas ficou fixado em 11. A tabela 8 descreve as estaes selecionadas e suas
principais caractersticas. A figura 12, por sua vez, mostra a localizao das estaes
nas bacias estudadas.
Outro fator importante para a definio das estaes foi o tamanho da srie
histrica disponvel. Optou-se por trabalhar com sries de mesmo comprimento, fato
que exigiu um minucioso trabalho de pesquisa nas vrias estaes de medio
existentes. O maior perodo comum encontrado foi definido pelas estaes de Caracol
(cd. 02257000) e Caiu (cd. 02151035), para os limites inferior e superior,
respectivamente. Assim, as sries utilizadas no modelo compreendem o perodo de
01/12/1969 a 31/12/2003, totalizando 35 anos ou 12760 dias de registros, para cada
estao.
Todas as estaes selecionadas possuem como responsvel a Agncia
Nacional de guas (ANA), com exceo da estao de Caiu (cd. 02151035), cujo
responsvel um convnio entre a Fundao Centro Tecnolgico de Hidrulica e o
Departamento de guas e Energia Eltrica de So Paulo (FCTH/DAEE). Trs delas so
operadas por pluvimetros e pluvigrafos em conjunto (Monte Alegre de Minas, cd.
01848000; Tomazina, cd. 02349033 e Campina da Alegria, cd. 02651001). As
demais estaes registram dados com a ajuda de um pluvimetro simples. Cabe
lembrar que a diferena entre os dois aparelhos reside no fato de que pluvimetros
somente armazenam gua de chuva para uma leitura nica. Pluvigrafos, por sua vez,
registram a variao da chuva no decorrer do tempo, o que o torna mais interessante
do ponto de vista de anlises mais criteriosas (Pinto et al., 1976, p. 9). Contudo, para
estudos como os da presente dissertao, no so necessrios registros em escalas de
tempo inferiores a um dia. Por esse motivo o fato de que a maioria dos dados seja
coletada de pluvimetros no representa um problema.
75
TABELA 7 ESTAES PLUVIOMTRICAS SELECIONADAS
# Estao Cd. ANA Sub-bacia (cd.) Municpio
Latitude
(Oeste)
Longitude
(Sul)
Altitude
(m)
Perodo de
Observao
MAM Monte
Alegre de
Minas
01848000 Rio Parnaba
(60)
Monte
Alegre de
Minas
1852'20" 4852'10" 730,00 jan/41 a
dez/05
UCC Usina
Couro do
Cervo
02145007 Rio Grande (61) Lavras 2120'37" 4510'13" 813,00 fev/41 a
set/06
MM Monte
Mor
02247058 Rio Tiet (62) Monte Mor 2257'39" 4717'45" 560,00 ago/53 a
dez/06
Ca Caiu 02151035 Rios Paran,
Pardo e Outros
(63)
Caiu 2150'00" 5159'00" 350,00 jan/42 a
set/04
To Tomazina 02349033 Rios Paran,
Paranapanema
e Outros (64)
Tomazina 2346'00" 4957'00" 483,00 jul/37 a
jul/07
UV Unio da
Vitria -
396
02651000 Rios Paran,
Iguau e Outros
(65)
Unio da
Vitria
2613'41" 5104'49" 736,00 fev/38 a
dez/06
Ta Taiam 01655003 Rios Paraguai,
So Loureno e
Outros (66)
Santo
Antnio do
Leverger
1643'39" 5531'17" 163,00 jan/64 a
nov/07
Co Caracol 02257000 Rios Paraguai,
Apa e Outros
(67)
Caracol 2201'51" 5701'45" 247,00 jul/68 a
nov/07
PM Passo
Marombas
02750009 Rio Canoas (71) Curitibanos 2719'51" 5045'03" 829,00 jun58 a
ago/08
LC Linha
Cescon
02753004 Rios Uruguai,
da Vrzea e
Outros (74)
Sarandi 2748'42" 5301'40" 350,00 jun/59 a
ago/08
Cq Cacequi 02954001 Rios Uruguai,
Ibicu e Outros
(76)
Cacequi 2952'40" 5449'25" 100,00 abr/43 a
ago/08
76
FIGURA 12 LOCALIZAO DAS ESTAES SELECIONADAS
77
A figura 13 traz um apanhado geral sobre as condies das sries histricas.
Todos os registros foram retirados do Sistema de Informaes Hidrolgicas da Agncia
Nacional de guas, disponveis em verso on-line na pgina Hidroweb
(<http://hidroweb.ana.gov.br/>). Pode-se notar que algumas estaes possuem falhas
nos registros; essas falhas referem-se simplesmente a alguns dias em branco. Pelo
grande volume de dados dirios trabalhados, optou-se por representar a figura 13 em
escala anual, apenas ilustrando os anos que possuem algumas falhas em seus
registros. Esse fato tambm no representa maiores problemas para a aplicao do
modelo em questo, pois tanto as probabilidades de transio quanto as estimativas
dos parmetros necessrios podem ser efetuadas com a presena de dados faltantes
(ver Captulo II). Entretanto, entende-se que os clculos so prejudicados, pois perdem
em preciso. Alm disso, dados faltantes podem representar registros significativos de
precipitao em determinado perodo que no esto documentados. Se existirem casos
como esse, o modelo mais uma vez prejudicado, haja vista que dados significativos
influem diretamente em sua formulao. Mesmo assim, optou-se por no empregar
nenhum mtodo de preenchimento de falhas. Essa deciso foi tomada principalmente
por no se encontrar nenhuma referncia bibliogrfica que trouxesse ou recomendasse
tcnicas de preenchimento de falhas em dados dirios.
Pinto et al. (1976, p 15) mostra um procedimento muito utilizado para o
preenchimento de falhas nas sries. baseada em mdias e registros pontuais de
estaes vizinhas, partindo do pressuposto que a precipitao em uma estao
proporcional de estaes prximas. Entretanto, no caso da escala diria, a
variabilidade da chuva (ocorrncias e quantidades) grande o que torna arriscado
assumir a proporcionalidade entre estaes.
78
FIGURA 13 CONDIES DAS SRIES HISTRICAS A IDENTIFICAO DAS ESTAES SO AS
ADOTADOS NA TABELA 8 (C) DADOS CONSISTIDOS (B) DADOS BRUTOS (F) ANOS
COM ALGUMAS FALHAS NOS REGISTROS
Em relao condio dos dados disponveis, percebe-se que a grande maioria
consistida. Isso significa dizer que os registros passaram por uma anlise, na qual os
possveis erros nas anotaes foram corrigidos. Existem diversos mtodos para a
verificao da homogeneidade e consistncia das sries. O Mtodo da Curva Dupla
Acumulativa, por exemplo, um dos mais simples e ainda assim o mais utilizado (sua
formulao pode ser encontrada em Pinto et al., 1976, p. 15). Porm, no foi possvel
determinar os mtodos adotados pelos responsveis das sries para consistir os dados
pluviomtricos.
79
CAPTULO IV - APLICAO DO MODELO
No presente Captulo so mostrados os resultados obtidos com a aplicao do
modelo univariado descrito nas diversas estaes selecionadas (tabela 8).
Primeiramente so expostas as consideraes adotadas para a obteno das sries
sintticas. A seguir so exibidas as probabilidades de transio calculadas para cada
estao pluviomtrica, bem como os veredictos da aplicao dos critrios AIC e BIC. Os
resultados das estimaes dos parmetros da distribuio exponencial mista, pelos dois
mtodos utilizados, so apresentados na sequncia. Por serem resultados numerosos,
trs postos foram escolhidos para a exposio dos resultados no corpo do texto:
Taiam (cd. 01655003), Unio da Vitria 396 (cd. 02651000) e Cacequi (cd.
02954001). Cada uma dessas estaes pluviomtricas est localizada,
propositalmente, em regies climatologicamente distintas dentro da rea de estudo. Na
continuao, so exibidos os resultados da validao do modelo univariado e as
anlises extras efetuadas, de acordo com os critrios definidos na seo 2.3 e 2.4
respectivamente. As informaes completas sobre as sries sintticas geradas em
todos os demais postos podem ser visualizadas no Apndice 1.
Todos os clculos e rotinas necessrias foram programados em linguagem
Matlab (verso 6.0.0.88 R12, 2000, The Mathworks Inc, sob licena). Os algoritmos
esto transcritos no Apndice 2 desta dissertao.
4.1 CONSIDERAES PARA APLICAO DO MODELO
Para a obteno dos resultados propostos nos objetivos deste trabalho,
algumas consideraes iniciais so adotadas. A primeira refere-se ao tratamento dado
sazonalidade; da mesma forma que em Wilks (1998), Haan, Allen e Street (1976) e
Liao, Zhang e Chen (2004), assume-se que existe uma sazonalidade mensal. Portanto,
cada ano das sries histricas separado ms a ms. As sries utilizadas para
executar o programa so formadas pelos agrupamentos dos meses de mesmo nome.
Assim, cada estao composta por 12 sries de 35 anos cada. Todo o procedimento
80
explicado no Captulo II efetuado 132 vezes no total (12 meses multiplicados pelas 11
estaes consideradas).
importante dizer que, dentro de cada ms, assumiram-se sries histricas
estacionrias. Adotou-se essa considerao pois ela traz consigo um conceito de
equilbrio estatstico. Para processos que lidam com sries temporais, como no caso
do modelo em questo, a estacionariedade aparece como um pr-requisito necessrio
para uma boa reproduo de fenmenos dinmicos naturais atravs de um intervalo
finito de dados. Dentre todos os autores pesquisados para o desenvolvimento dessa
dissertao, pouqussimos foram os que tentaram modelar as precipitaes
considerando o sistema no estacionrio (Rajagopalan, Lall e Tarboton, 1996). Ainda
assim, o modelo desenvolvido tinha conotao no paramtrica. No caso de modelos
paramtricos, a condio de estacionariedade unnime entre os pesquisadores.
Os diversos nmeros aleatrios necessrios para a implementao do mtodo
so gerados diretamente atravs do software Matlab, que possui ferramentas
programadas com esse objetivo. Moler (2004) traz uma boa descrio dos mtodos
utilizados pelo programa para a gerao de tais nmeros. Segundo o autor, o perodo
do gerador aproxima-se de
1492
2 antes de se repetir. Obviamente, nesta dissertao no
sero necessrios tantos nmeros aleatrios assim, entretanto adotou-se como medida
preventiva a renovao da semente do gerador a cada nova execuo do modelo.
De grande importncia para o presente estudo, a definio do limite de chuva
para que um dia seja considerado mido faz-se necessria. Deni, Jemain e Ibrahim
(2008) reforam essa importncia ao notar que diferentes valores limites podem mudar
a ordem tima da cadeia markoviana a ser utilizada. A tabela 9 resume os valores
adotados por diversos autores. O valor limite escolhido para esta dissertao o
mesmo utilizado por Wilks (1998), Brissette, Khalili e Leconte (2007) e Katz (1977): 0,3
mm.
81
TABELA 8 VALORES COMUNS DE LIMITES PARA QUE UM DIA SEJA CONSIDERADO CHUVOSO
Autores Valores Limite (mm)
Azevedo e Leito (1990) 0,5
Brissette, Khalili e Leconte (2007) 0,3
Jimoh e Webster (1996) 0,3; 2,0 e 5,0
Deni, Jemain e Ibrahim (2008) 0,1 e 10,0
Katz (1977) 0,3
Mehrotra e Sharma (2007) 0,3
Srikatan, Harrold e Sharma (2005) 0,3
Oliveira (2003) 2,5
Wilks (1998) 0,3
Os resultados apresentados a seguir se referem aplicao do modelo nos
moldes do fluxograma mostrado na figura 8 (Captulo II). No intuito de dar flexibilidade
utilizao do programa, optou-se pela elaborao de quatro mdulos separados, a
saber:
Mdulo 1 Ordem_Markov.m: faz a anlise da ordem tima da cadeia de
Markov a ser usada no posto em questo, baseada nos critrios AIC e BIC.
Calcula tambm todas as probabilidades de transio necessrias;
Mdulo 2 Gerar.m: a partir das probabilidades de transio calculadas
no mdulo 1, gera as sries;
Mdulo 3 Validacao.m: executa todos os clculos estatsticos pertinentes
validao das sries geradas no mdulo 2.
Mdulo 4 Valores_extremos.m: faz as anlises referentes aos eventos
extremos, conforme exposto no item 2.4.
Desta forma, a integral execuo do procedimento explicado no Captulo II
consiste na aplicao dos quatro mdulos computacionais supracitados.
4.2 DETERMINAO DAS OCORRNCIAS
Para a determinao das ocorrncias das precipitaes, so executados os
mdulos 1 e 2 do programa, em sequncia. As figuras 14 e 15 mostram, de forma
esquemtica, quais so os dados de entrada necessrios e os dados de sada que
cada mdulo produz.
82
FIGURA 14 DADOS DE ENTRADA E SADA PARA O MDULO 1
FIGURA 15 DADOS DE ENTRADA E SADA PARA O MDULO 2
Os algoritmos completos, bem como exemplos de telas do programa, podem
ser visualizados no Apndice 2 desta dissertao. Analisando as figuras 14 e 15, nota-
se que somente o mdulo 1 traz uma anlise direta das cadeias de Markov. O mdulo 2
tambm trabalha com a determinao das ocorrncias, porm simultaneamente com o
clculo das alturas precipitadas. Por esse motivo, esta seo restringe-se anlise das
probabilidades de transio e dos critrios AIC e BIC calculados. A completa anlise do
desempenho das cadeias de Markov, em termos de nmeros de dias chuvosos e secos,
apresentada na seo 4.4.
A aplicao do mdulo 1 s series das estaes em questo resulta,
primeiramente, na determinao das probabilidades de transio entre estados. Os
Valor mnimo para
que um dia seja
considerado mido.
Srie histrica do
posto e ms
considerados.
MDULO 1
Probabilidades de
transio para cadeia
de primeira ordem.
Ordem tima, segundo
AIC e BIC.
Tempo utilizado para o
procedimento.
Valor mnimo para
que um dia seja
considerado mido.
Srie histrica do
posto e ms
considerados.
MDULO 2
Parmetros
resultantes do Mtodo
dos Momentos.
Parmetros
resultantes do Mtodo
da Mxima
Verossimilhana.
Nmero de iteraes
para o algoritmo EM.
Probabilidades de
transio p
10
e p
11
.
Nmero de sries a
serem geradas.
Matriz com as sries
sintticas geradas.
Tempo utilizado para o
procedimento.
83
resultados, para as estaes pluviomtricas de Taiam, Unio da Vitria 396 e
Cacequi, esto expressos na tabela 9. Alm dos parmetros citados da cadeia
markoviana e dos critrios AIC e BIC, a ltima coluna da tabela 9 mostra o tempo de
processamento utilizado pelo computador nos clculos. Para os resultados nos demais
postos pluviomtricos, ver Apndice 1.
Em relao ao clculo das probabilidades h de se fazer uma ressalva. Por
imposio da sazonalidade, a contagem de dias secos ou chuvosos da srie histrica
feita considerando-se os meses individualmente. Isto significa que a correlao entre o
ltimo dia do ms i e o primeiro dia do ms i+1 no preservada. Esse fato agrega um
pequeno erro ao clculo das probabilidades de transio, entretanto, em valores
absolutos, esse erro tem ordem de grandeza de dcimos, valor que no interfere
significativamente nos resultados finais. Alm disso, esses pequenos erros atingem
somente 35 dias (transies entre meses) presentes em cada srie de
aproximadamente 1050 dias.
TABELA 9 RESULTADOS DAS APLICAES DO MDULO 1
Parmetros cadeia de Markov Ordem tima
Estaes Meses
p00 p10 p01 p11 AIC BIC
Tempo
(s)
Janeiro 0,6761 0,3239 0,4936 0,5064 2 1 2,34
Fevereiro 0,6255 0,3745 0,5611 0,4389 2 0 2,16
Maro 0,6952 0,3048 0,5801 0,4199 2 1 2,88
Abril 0,8235 0,1765 0,6882 0,3118 1 1 1,44
Maio 0,9077 0,0923 0,7429 0,2571 1 1 1,55
Junho 0,9605 0,0395 0,7907 0,2093 1 1 1,39
Julho 0,9776 0,0224 0,9091 0,0909 1 0 1,39
Agosto 0,9677 0,0323 0,8788 0,1212 1 0 1,05
Setembro 0,8849 0,1151 0,8230 0,1770 2 0 3,02
Outubro 0,8138 0,1862 0,7462 0,2538 2 0 1,47
Novembro 0,7061 0,2939 0,6689 0,3311 2 0 1,56
Taiam
(Ta)
Dezembro 0,6727 0,3273 0,5534 0,4466 2 1 1,63
continua
84
concluso
Parmetros Cadeia de Markov Ordem tima
Estaes Meses
p00 p10 p01 p11 AIC BIC
Tempo
(s)
Janeiro 0,6684 0,3316 0,4012 0,5988 2 2 5,17
Fevereiro 0,6424 0,3576 0,3590 0,6410 1 1 2,8
Maro 0,6885 0,3115 0,4556 0,5444 2 1 10,64
Abril 0,7712 0,2288 0,5160 0,4840 2 1 1,7
Maio 0,7958 0,2042 0,5100 0,4900 1 1 3,31
Junho 0,7843 0,2157 0,5000 0,5000 1 1 1,83
Julho 0,8032 0,1968 0,4916 0,5084 1 1 1,45
Agosto 0,8273 0,1727 0,4784 0,5216 2 1 1,84
Setembro 0,7601 0,2399 0,4585 0,5415 2 1 2,03
Outubro 0,6984 0,3016 0,4903 0,5097 1 1 2,27
Novembro 0,7231 0,2769 0,4817 0,5183 1 1 1,44
Unio da
Vitria
(UV)
Dezembro 0,6947 0,3053 0,4402 0,5598 1 1 2,66
Janeiro 0,8228 0,1772 0,6107 0,3893 1 1 1,06
Fevereiro 0,7941 0,2059 0,6245 0,3755 1 1 1,38
Maro 0,8312 0,1688 0,6372 0,3628 1 1 1,44
Abril 0,8157 0,1843 0,6419 0,3581 1 1 1,36
Maio 0,8547 0,1453 0,6019 0,3981 1 1 1,59
Junho 0,8162 0,1838 0,6368 0,3632 1 1 1,39
Julho 0,8053 0,1947 0,6364 0,3636 1 1 1,61
Agosto 0,8449 0,1551 0,6538 0,3462 1 1 1,28
Setembro 0,8133 0,1867 0,6398 0,3602 1 1 1,80
Outubro 0,8173 0,1827 0,6710 0,3290 2 1 1,09
Novembro 0,8098 0,1902 0,7383 0,2617 1 0 1,44
Cacequi
(Ca)
Dezembro 0,8430 0,1570 0,7202 0,2798 1 1 1,72
interessante perceber que as prprias probabilidades de transio trazem,
intrinsecamente, informaes relativas aos perodos secos ou chuvosos de cada
estao. possvel tambm prever a magnitude de cada perodo sobre cada posto.
Esta constatao fica clara ao comparar os valores das probabilidades em postos
climatologicamente distintos. o caso das trs estaes meteorolgicas plotadas; as
variaes nas probabilidades de se ter chuvas aps um dia seco so bastante
acentuadas em Taiam, por exemplo, localizada na regio Sudeste brasileira. Nos
meses de inverno, esses valores aproximam-se de zero, indicando uma baixssima
probabilidade desse tipo de transio. Por outro lado, em Unio da Vitria e Cacequi,
localizadas na regio Sul do Brasil, a variao entre as probabilidades mais suave. Os
nmeros confirmam o comportamento meteorolgico indefinido dessa regio do pas.
A fim de melhor visualizar as diferenas citadas, foram elaborados dois grficos
comparativos, nos quais as probabilidades de chover aps um dia seco (
10
p ) e de
85
chover aps um dia mido (
11
p ) so plotadas (figura 16). Ao analis-los, os distintos
comportamentos climticos ficam evidentes. A escolha por somente essas duas
probabilidades vem do fato de que elas so suficientes para definir o processo
markoviano utilizado no modelo.
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
1 2 3 4 5 6 7 8 9 10 11 12
Meses
P
r
o
b
a
b
i
l
i
d
a
d
e
d
e
t
r
a
n
s
i
o
Cq UV Ta
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
J F M A M J J A S O N D
Meses
P
r
o
b
a
b
i
l
i
d
a
d
e
s
d
e
t
r
a
n
s
i
o
Cq UV Ta
FIGURA 16 PROBABILIDADES DE TRANSIO (A) CHUVA APS UM DIA SECO (p
10
) (B) CHUVA
APS UM DIA MIDO (p
11
)
Alm das caractersticas climticas observadas, os grficos da figura 16 podem
fornecer subsdios para uma anlise de tendncias em mltiplas localidades. Esse tipo
(A)
(B)
86
de anlise feita em estudos multivariados, que objetivam gerar sries de precipitao
em vrias estaes de uma vez s. O principal parmetro a ser levado em considerao
a correlao espacial entre os locais; assim sendo, os comportamentos semelhantes
evidenciados na figura 15 so fatores importantes (Wilks, 1998).
A tabela 9 traz tambm os resultados dos critrios AIC e BIC calculados para os
trs casos. Para se ter uma melhor visualizao dos veredictos como um todo,
elaborou-se uma nova tabela com a contabilizao geral, para todas as 11 estaes
pluviomtricas, em termos absolutos e em termos percentuais (Tabela 10):
TABELA 10 RESULTADOS DOS CRITRIOS AIC E BIC
Nmeros absolutos Porcentagem
AIC BIC AIC BIC
Ordem tima 0 0 8 0% 6,%
Ordem tima 1 82 119 62% 90%
Ordem tima 2 50 5 38% 4%
Totais 132 132 100% 100%
Ambos os critrios indicam clara preferncia pela primeira ordem. Percebe-se,
entretanto, que o nmero de indicaes para cada uma das ordens difere entre si.
Esses resultados demonstram o que Katz (1981) escreveu sobre a diferena entre os
dois testes; o critrio AIC tende a superestimar a ordem da cadeia a ser utilizada. O
estimador BIC apresenta resultados mais consistentes, sendo ele o critrio
recomendado pelo autor para a determinao da ordem tima do modelo. Ainda, Wilks
(1998) enfatiza que, em amostras grandes (superiores a 1000 elementos) o critrio mais
recomendado o BIC.
Um caso particular ocorre principalmente na estao de Taiam: o estimador
BIC previu ordem zero em metade dos casos. Esse resultado era previsvel, pois um
posto em uma regio climatologicamente bem definida, onde os invernos so
extremamente secos. Desse modo, o modelo poderia ser estruturado como uma
simples distribuio binomial (ou tentativas de Bernoulli). Entretanto, esse tipo de
considerao demasiado simples para se modelar um fenmeno natural (Chin, 1977).
Com o exposto, podem-se considerar cadeias de Markov de primeira ordem
como sendo adequadas para as estaes em questo.
87
4.3 DETERMINAO DAS QUANTIDADES PRECIPITADAS
Para a determinao das quantidades de chuva precipitadas, executado o
mdulo 2 do programa computacional. Os dados de entrada e sada trabalhados podem
ser visualizados na figura 15, na seo anterior. Da mesma forma que na determinao
das ocorrncias, esta seo destina-se apresentao e comentrios dos parmetros
calculados. O desempenho do modelo como um todo assunto a ser tratado na
prxima seo.
O primeiro procedimento do mdulo 2 relaciona-se com a estimao dos
parmetros da distribuio exponencial mista, atravs do Mtodo dos Momentos. Esse
mtodo foi implementado de acordo com o artigo de Rider (1961), que o adequou
distribuio exponencial mista, resultando como estimador uma equao de segundo
grau (equaes 2.16 e 2.17, na seo 2.2). Segundo o autor, para parmetros
diferentes entre si e diferentes de zero, a equao produz estimadores consistentes
com o propsito da distribuio exponencial mista, ou seja, 0
1
> , 0
2
> e 1 0 .
Todavia, a aplicao do Mtodo dos Momentos, em muitos casos, no produziu
os resultados previstos por Rider (1961). Esse fato no causou nenhuma surpresa, pois
a equao (2.17) utilizada um polinmio de segundo grau e sua resoluo permite
parmetros iguais entre si, negativos e at mesmo imaginrios. O primeiro caso no
representa problema; apenas a distribuio exponencial, antes mista, recai em uma
exponencial simples. Parmetros negativos ou imaginrios no so admissveis, pois
sua interpretao fsica impossvel (no existem precipitaes negativas ou
imaginrias) e a continuao do clculo extremamente prejudicada. Alm disso, em
outros casos, o parmetro estimado foi superior a um, tambm inaceitvel por se
tratar de uma probabilidade.
O fato do Mtodo dos Momentos no ser o mais eficiente para a estimao dos
parmetros de uma distribuio estatstica suficiente para utiliz-lo somente como
aproximao inicial para outro mtodo. Contudo, com ocorrncias como as descritas no
pargrafo anterior, nem mesmo os valores resultantes poderiam ser utilizados. No
intuito de automatizar o programa computacional, alguns artifcios foram adotados para
eliminar os problemas encontrados: quando um parmetro resulta um valor imaginrio,
88
o programa utiliza somente sua parte real; quando valores negativos so produzidos, o
programa troca automaticamente de sinal; finalmente, quando o parmetro calculado
supera a unidade, ele automaticamente invertido, resultando em um valor dentro do
intervalo desejado. Entende-se que so artifcios grosseiros, entretanto os valores
resultantes servem perfeitamente como palpites iniciais para a inicializao do algoritmo
EM, que calcular os parmetros definitivos a serem usados na gerao das sries.
A tabela 11 exibe os resultados dos parmetros calculados pelo Mtodo dos
Momentos (com o uso dos artifcios propostos) e pelo Mtodo da Mxima
Verossimilhana (algoritmo EM), alm do nmero de iteraes utilizado e o tempo total
do processo. Vale lembrar que esse tempo contabiliza a execuo do mdulo 2
completo, no apenas a estimao dos parmetros (mais detalhes na seo 4.6).
Novamente, os resultados completos para todas as estaes pluviomtricas
consideradas so apresentados no Apndice 1 dessa dissertao.
TABELA 11 PARMETROS DA DISTRIBUIO EXPONENCIAL MISTA
Estimativa Inicial
(Momentos)
Estimativa Definitiva (Mxima
Verossimilhana algoritmo EM.)
Estaes Meses
1
2
1
2
Iteraes
Tempo
(s)
Janeiro 0,6261 15,4457 10,2971 0,6551 20,3954 14,9604 34 424,27
Fevereiro 0,8015 16,3589 10,9059 0,7304 20,0071 11,4894 270 407,03
Maro 0,3095 9,0300 6,0200 0,4167 15,8028 15,7048 31 398,06
Abril 0,7890 12,3652 8,2435 0,7868 14,8260 8,4555 34 341,97
Maio 0,3868 10,2522 6,8348 0,4817 15,8225 15,5329 40 458,84
Junho 0,1012 18,9742 12,6495 0,3175 20,4806 8,0682 106 421,24
Julho 0,5807 11,8996 7,9331 0,6359 16,6537 11,4624 25 426,09
Agosto 0,5325 30,1074 20,0716 0,4458 23,8105 7,4249 26 275,09
Setembro 0,5516 9,8076 6,5384 0,6054 13,9985 10,1163 33 407,99
Outubro 0,5531 11,5241 7,6827 0,6022 15,8689 12,7520 40 431,22
Novembro 0,8890 18,6151 12,4100 0,4440 23,8675 13,1849 676 522,31
Taiam
(Ta)
Dezembro 0,6877 16,6852 11,1234 0,7067 20,9375 15,0491 32 532,25
continua
89
concluso
Estimativa Inicial
(Momentos)
Estimativa Definitiva (Mxima
Verossimilhana algoritmo EM.)
Estaes Meses
1
2
1
2
Iteraes
Tempo
(s)
Janeiro 0,8780 19,2202 14,9177 0,7220 14,3633 2,7946 35 484,17
Fevereiro 0,1725 19,2262 12,8175 0,7211 15,0506 3,0992 201 367,20
Maro 0,0755 28,3299 11,6885 0,6710 14,4279 2,3020 140 651,75
Abril 0,1107 44,3132 16,6399 0,5912 20,9941 2,8951 41 530,31
Maio 0,0018 136,6367 16,7489 0,7069 22,7334 1,6738 98 361,84
Junho 0,1259 37,0422 17,8447 0,6542 22,3745 2,4445 79 365,33
Julho 0,3075 30,4399 18,7901 0,7354 19,9383 2,2093 151 358,44
Agosto 0,0427 44,7434 15,4274 0,7006 19,5974 1,5722 91 351,00
Setembro 0,2002 21,2012 14,1341 0,7825 18,9682 3,3158 260 470,53
Outubro 0,7427 16,4942 10,9961 0,8004 18,3960 1,8350 63 402,84
Novembro 0,3203 16,6238 11,0825 0,7728 15,8738 2,6299 138 451,03
Unio da
Vitria
(UV)
Dezembro 0,2313 22,7089 15,1393 0,7321 16,7494 4,2339 350 476,09
Janeiro 0,7184 22,8955 12,8955 0,7111 23,7393 11,0708 23 370,02
Fevereiro 0,7833 22,2782 12,2782 0,7769 22,6942 11,1268 24 333,83
Maro 0,7896 18,085 8,085 0,8642 20,7791 20,5682 47 359,76
Abril 0,538 28,6819 18,6819 0,1402 44,3039 20,762 686 348,39
Maio 0,7946 20,7955 10,7955 0,9016 25,3388 5,4378 85 359,28
Junho 0,5591 24,0198 14,0198 0,1694 32,9451 16,893 980 359,88
Julho 0,7469 16,135 6,135 0,8538 19,5343 19,4621 25 369,66
Agosto 0,1955 24,6995 14,6995 0,8526 19,0027 3,0877 573 366,36
Setembro 0,9847 21,8923 11,8923 0,8864 23,6261 7,0198 138 369,61
Outubro 0,6902 18,0912 8,0912 0,8002 22,602 22,4987 32 479,19
Novembro 0,7591 18,456 8,456 0,8268 21,6673 21,4512 37 389,56
Cacequi
(Cq)
Dezembro 0,9084 18,6868 8,6868 0,9258 19,7232 19,3831 38 341,39
Pode-se notar que os parmetros variam consideravelmente, inclusive dentro
de uma mesma estao. Essas diferenas so influenciadas, no somente pelo regime
mais ou menos chuvoso de um determinado posto como um todo, mas tambm pelas
intensidades das chuvas individuais. Isso porque a aplicao do algoritmo EM envolve
todos os dias chuvosos da srie histrica, fazendo com que a presena de chuvas
fortes, mesmo que pontuais, exeram influncia sobre o clculo dos parmetros. o
caso do ms de novembro na estao pluviomtrica Cacequi, por exemplo; comparado
aos meses anterior e posterior, os parmetros apresentam uma diferena bastante
acentuada (ver Apndice 1). Analisando a srie histrica dessa estao, nota-se que as
mdias precipitadas entre outubro, novembro e dezembro no diferem
significativamente (15,3 mm, 15,4 mm e 14,8 mm, respectivamente), contudo as
varincias apresentam certa discrepncia (262,4 mm, 374,0 mm e 275,2 mm,
respectivamente). Esse fato deixa claro que as sries em novembro so marcadas por
90
chuvas de variadas intensidades, o que reflete diretamente no resultado dos
parmetros estimados.
Mesmo com as variaes comentadas, fica evidente a inter-relao presente
entre os parmetros. A figura 17 mostra sua evoluo ao decorrer dos meses do ano.
Percebe-se que h uma tendncia de compensao entre os parmetros de forma (
1
e
2
), ou seja, a variao de uma das mdias sempre acompanhada pela outra.
Como j havia acontecido na aplicao do Mtodo dos Momentos, houve casos nos
quais a distribuio exponencial mista reduziu-se a uma exponencial simples. Cita-se
como exemplo, os meses de maio em Taiam ou meses de outubro em Cacequi. As
mdias resultaram em valores muito prximos, fazendo com que a escolha entre
1
e
2
a ser determinada pelo parmetro de probabilidade ( ) fosse indiferente.
Em seu artigo Wilks (1998) utilizou razes entre os parmetros de forma
(
2 1
) como indicadores do grau de diferenciao que a distribuio exponencial
mista capaz de fazer com relao intensidade da chuva. Em outras palavras, ao ser
representada por duas mdias, a distribuio probabilstica em questo criteriosa ao
considerar eventos de intensidade diferentes. Em seu estudo, essa razo, calculada
para todos os meses e todos os postos, teve um valor mdio de 4,8; aqui, o valor mdio
obtido nas 11 estaes pluviomtricas modeladas foi de 3,4.
91
7
9
11
13
15
17
19
21
23
25
J F M A M J J A S O N D
Meses
B
e
t
a
1
Ta Cq UV
0
2
4
6
8
10
12
14
16
18
J F M A M J J A S O N D
Meses
B
e
t
a
2
Ta Cq UV
0,20
0,40
0,60
0,80
1,00
J F M A M J J A S O N D
Meses
A
l
f
a
Ta Cq UV
FIGURA 17 PARMETROS DA DISTRIBUIO EXPONENCIAL MISTA (A) 1 () 2 (C)
(A)
(B)
(C)
92
Com relao ao parmetro de probabilidade ( ), Wilks (1998) tambm calculou
algumas estatsticas bsicas, encontrando um valor mdio em torno de 0,60. Nesta
dissertao, o valor mdio encontrado foi de 0,66. Ainda assim, esse parmetro
apresentou uma forte variao entre postos, mesmo entre os meses de mesmo nome.
O pesquisador calculou ainda os desvios padro do parmetro entre estaes
pluviomtricas, sendo dado um ms pr-fixado, e encontrou valores entre 0,1 e 0,2.
Aqui, o mesmo clculo foi realizado, chegando-se a um valor mdio de 0,17.
A semelhana de resultados sugere que algumas caractersticas climticas
relacionadas ao regime pluviomtrico existentes no local onde foi aplicado o modelo
original sejam parecidas com o do presente estudo. O fato do valor menor encontrado
para a razo entre mdias, contudo, pode ser reflexo direto da influncia de estaes
pluviomtricas localizadas em regies climatologicamente mal definidas, como algumas
das estaes selecionadas para esta dissertao.
Para as quantidades precipitadas foram elaboradas outras anlises, cuja
inteno foi verificar a qualidade do ajuste da distribuio exponencial mista aos dados
observados. Por se tratar de anlises relativamente trabalhosas, decidiu-se limitar a
execuo dos testes para as trs estaes utilizadas na apresentao dos resultados
neste Captulo. Dentro de cada posto, buscou-se ainda representatividade em trs
regimes pluviomtricos distintos: pluviosidade acentuada (estao Unio da Vitria, nos
meses de janeiro), um perodo intermedirio (estao Cacequi, nos meses de agosto) e
um perodo de estiagem (estao Taiam, nos meses de julho). Como distribuio
alternativa, adotou-se a gama a dois parmetros.
A primeira verificao provm de anlises visuais atravs da construo de
grficos. Inicialmente feita a comparao dos dois modelos probabilsticos com a
distribuio emprica. Na sequncia, so plotados os grficos Probabilidade-
Probabilidade (P-P plot Wilks, 2006, p. 114). Esto expressos, respectivamente, nas
figuras 18 e 19.
93
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0,00 20,00 40,00 60,00 80,00 100,00 120,00
Observaes (mm)
P
r
o
b
a
b
i
l
i
d
a
d
e
s
Emprica Gama Exponencial Mista
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0,00 15,00 30,00 45,00 60,00 75,00 90,00
Observaes (mm)
P
r
o
b
a
b
i
l
i
d
a
d
e
s
Emprica Gama Exponencial Mista
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0,00 10,00 20,00 30,00 40,00 50,00 60,00
Observaes (mm)
P
r
o
b
a
b
i
l
i
d
a
d
e
s
Emprica Gama Exponencial Mista
FIGURA 18 COMPARAO ENTRE AS DISTRIBUIES EMPRICAS E AJUSTADAS (A) UNIO DA
VITRIA (JANEIROS) (B) CACEQUI (AGOSTOS) (C) TAIAM (JULHOS)
(C)
(B)
(A)
94
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Probabilidades Empricas
P
r
o
b
a
b
i
l
i
d
a
d
e
s
T
e
r
i
c
a
s
Exponencial Mista Gama
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Probabilidades Empricas
P
r
o
b
a
b
i
l
i
d
a
d
e
s
T
e
r
i
c
a
s
Exponencial Mista Gama
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Probabilidades Empricas
P
r
o
b
a
b
i
l
i
d
a
d
e
s
T
e
r
i
c
a
s
Exponencial Mista Gama
FIGURA 19 PLOTAGENS P-P (A) UNIO DA VITRIA (JANEIROS) (B) CACEQUI (AGOSTOS) (C)
TAIAM (JULHOS)
(A)
(B)
(C)
95
Na comparao das distribuies tericas com a emprica (figura 18), nota-se
que o ajuste de ambas as distribuies piora conforme o nmero de dias chuvosos da
amostra diminui. Mesmo assim, comparativamente, as duas distribuies mostram-se
adequadas na representao das quantidades precipitadas para essas regies.
As plotagens Probabilidade-Probabilidade mostradas na figura 19, demonstram
novamente um ajuste semelhante entre as distribuies exponencial mista e gama em
todos os casos. Assim como nos grficos anteriores, a qualidade dos ajustes piora
conforme decresce o nmero de elementos da amostra, ou seja, quanto mais seco o
perodo utilizado, mais dificuldade tem os modelos probabilsticos em reproduzir os
valores observados. interessante notar que essa concluso tem uma ligao direta
com o estudo de Katz (1977), descrito na seo 1.4.3.1.
A segunda seo de verificaes refere-se aplicao dos testes Qui-quadrado
(
2
) e Kolmogorov-Smirnov. No caso do Qui-quadrado, a definio do nmero de
classes seguiu a equao (2.26). O nvel de confiana utilizado na resoluo dessa
equao foi de 95%, obtendo-se um nmero de classes igual a cinco. Adotou-se esse
nmero para as trs estaes meteorolgicas em teste. Dessa maneira, o nmero de
graus de liberdade utilizado foi de quatro ( 1 k graus de liberdade, onde k o nmero
de classes do teste). A tabela 12 exibe os clculos pertinentes e o veredicto do teste.
Para o teste de Kolmogorov-Smirnov, o mesmo nvel de confiana foi utilizado
(95%), fazendo com que o