Você está na página 1de 14

OTIMIZAÇÃO DO MÉTODO DE MUSKINGUM NÃO LINEAR UTILIZANDO

ALGORITMO GENÉTICO

Luiz Rafael Palmier1 e Mauro Naghettini2

Resumo - Os métodos hidráulicos de propagação incorporam as equações da continuidade e


da conservação da quantidade de movimento para simular a passagem de uma onda de cheia
por um trecho de um rio ou de um canal. O sistema completo de equações diferenciais não
permite solução analítica; métodos numéricos, por vezes complexos, são utilizados para sua
solução, com a necessidade de uma quantidade substancial de dados. Alternativamente, e
devido à sua simplicidade, os métodos hidrológicos de propagação têm sido largamente
utilizados na prática da engenharia. Nesses métodos, incluindo o método de Muskingum, são
consideradas apenas a equação da continuidade e uma relação linear entre o armazenamento e
as vazões de entrada e saída em um trecho. Recentemente, técnicas de otimização, como o
algoritmo genético, passaram a ser utilizadas para obtenção de parâmetros de modelos de
propagação, inclusive para aqueles cuja relação entre armazenamento e vazões é não linear.
Nas técnicas de algoritmos genéticos são utilizados esquemas de reprodução similares àqueles
que ocorrem na genética natural para obter soluções de uma variedade de problemas
matemáticos. No presente trabalho, o método de Muskingum não linear, com parâmetros
obtidos com a técnica de algoritmos genéticos, é aplicado a um trecho do rio São Francisco.

Abstract - The so-called hydraulic routing methods incorporate both continuity and
momentum-conservation equations to describe the configuration of a flood wave through a
river reach. These may be very complex numerical schemes requiring, in most cases, a
substantial amount of field data. Alternatively and due to their simplicity, the so-called
hydrologic routing methods have been extensively used by engineers. These, such as the
Muskingum method, employ only the continuity equation and a linear relationship between
river storage and inflow/outflow discharges. Recently, optimization techniques, such as the

1
Escola de Engenharia da UFMG; Avenida Contorno 842/809; 30110-060 Belo Horizonte, MG; fone: (31)
32381003, fax (31) 32381001, e-mail: palmier@ehr.ufmg.br
2
Escola de Engenharia da UFMG; Avenida Contorno 842/807; 30110-060 Belo Horizonte, MG; Brasil; (31)
32381002, fax (31) 32381001e-mail: naghet@dedalus.lcc.ufmg.br
genetic algorithm, have been used in order to identify the parameters of a flow routing model,
which may include a non-linear relationship between river storage and inflow/outflow
discharges, though keeping the general simplicity of the hydrologic routing methods. Genetic
algorithms use reproduction schemes similar to those occurring in natural genetics to find
solutions to a variety of mathematical problems. This flow routing model is applied to the São
Francisco river basin. The case study has been selected to reflect flow conditions which may
be considered appropriate for Muskingum-like routing methods.

Palavras-chave: Modelos hidrológicos de propagação, Método de Muskingum não linear,


Algoritmo genético.

INTRODUÇÃO

Os métodos hidráulicos de propagação incorporam as equações da continuidade e da


conservação da quantidade de movimento para simular a passagem de uma onda de cheia por
um trecho de um rio ou um canal. O sistema completo de equações diferenciais não permite
solução analítica; métodos numéricos, por vezes complexos, são utilizados para sua solução,
com a necessidade de uma quantidade substancial de dados. Alternativamente, e devido à sua
simplicidade, os métodos hidrológicos de propagação têm sido largamente utilizados na
prática da engenharia. Nesses métodos, incluindo o método de Muskingum, são consideradas
apenas a equação da continuidade e uma relação linear entre o armazenamento e as vazões de
entrada e saída em um trecho. Em termos matemáticos, as equações usadas na caracterização
mais comum do método de Muskingum são:

(1)

(2)
onde St, It, and Ot são, respectivamente, o armazenamento, vazão de entrada, vazão de saída,
no tempo t, K é uma constante do armazenamento-tempo para o trecho de rio e x é um fator de
ponderação.
Em função do desempenho insatisfatório da abordagem linear em aplicações do
método em rios e canais nos quais são verificadas uma forte relação não linear entre as vazões
ponderadas e o volume armazenado, métodos de Muskingum não lineares passaram a ser
propostos na literatura, como o descrito abaixo:

(3)

onde m é um parâmetro adicional que fornece à formulação mais graus de liberdade do que a
equação (2). Em geral, espera-se um melhor ajuste das vazões estimadas e calculadas com o
uso do método não linear; por outro lado, o processo de calibração torna-se mais complicado.
A solução simultânea das equações (1) e (3) podem ser obtidas algebricamente
utilizando-se fórmulas de diferença ao invés de fórmulas diferenciais, como a que se verifica
na equação (1). As equações abaixo podem ser obtidas para determinação de Ot:

(4)

ou

(5)

onde

(6)

Notar que na equação (4), o valor de Ot é obtido por meio de um processo iterativo.
Alguns métodos para estimar os parâmetros desse modelo não linear foram propostos
na literatura (Gill, 1978; Tung, 1984; Yoon and Padmanabhan, 1993; Mohan, 1997). Mohan
(1997) propôs o uso de um algoritmo genético, o qual foi demonstrado ser uma ferramenta
promissora em modelos de propagação. Em todas as aplicações relacionadas acima, inclusive
aquelas em que outros métodos de otimização foram utilizados, o exemplo para teste da
metodologia foi o mesmo, i.e., dados propostos por Wilson (1974). Exemplos práticos de
aplicações do método de Muskingum não linear são muito raros na literatura.
Nesse artigo, o modelo não linear baseado na equação (3), com parâmetros estimados
usando a técnica de algoritmo genético, é aplicado a um trecho do rio São Francisco. Um
único hidrograma é usado para calibrar o modelo e o melhor conjunto de parâmetros é
aplicado a outros hidrogramas. Os resultados obtidos mostram a capacidade da metodologia
em reproduzir as vazões de saída observadas no trecho de rio escolhido.

O ALGORITMO GENÉTICO: UMA BREVE DISCUSSÃO

A técnica de algoritmo genético é utilizada para obtenção de soluções ótimas e é


fundamentada na analogia com conceitos de genética e seleção natural; a técnica pode ser
aplicada a diferentes tipos de problema. Quando um problema é formulado por meio de
equações paramétricas, como é o caso das equações já apresentadas nesse trabalho, cada
solução representa um conjunto de parâmetros que pode ser usado para avaliar uma dada
função objetivo. A transição entre dois conjuntos de parâmetros é processada por meio de
probabilidades, ao invés do cálculo de gradiente empregado em métodos convencionais de
busca.
Uma característica fundamental de um algoritmo genético refere-se à representação de
um conjunto de parâmetros por uma cadeia (string) de números binários (zero ou um) de
comprimento específico, o qual é denominado cromossoma. Por exemplo, se um conjunto de
3 parâmetros for representado por uma cadeia de 34 números binários, então um
cromossoma típico teria a seguinte forma:

100101100101

onde os quatro primeiros dígitos corresponderiam ao valor do primeiro parâmetro, os quatro


seguintes ao segundo, e os quatro últimos ao terceiro. Quando transformados em números
decimais, a cadeia de parâmetros corresponderia a um conjunto de valores de parâmetros. O
comprimento do cromossoma é determinado pela precisão desejada dos resultados; a relação
entre o comprimento da cadeia e a precisão é dada por:
(7)

onde  é a precisão desejada, l é o comprimento da cadeia, e ck e dk são, respectivamente, os


limites inferior e superior do késimo parâmetro. Ao longo de todo o desenvolvimento do
trabalho aqui apresentado, foi utilizada uma cadeia de comprimento 12 para representar cada
um dos parâmetros. A transformação dos números binários em decimais é dada pela seguinte
equação:

(8)

Nos algoritmos genéticos, uma população inicial de cromossomas ou soluções é


gerada utilizando-se um gerador de números aleatórios; uma vez que cada solução é
transformada, a função objetivo pode ser avaliada para cada membro da população. Após essa
etapa, a parte iterativa do algoritmo genético é realizada; da geração anterior, dois
cromossomas pais são probabilisticamente selecionados, de tal forma que pais com valores
mais adequados de função objetivo tenham maior probabilidade de serem escolhidos. Na
etapa seguinte, a próxima geração da população é determinada por meio de duas diferentes
operações: cruzamento (crossover) e mutação, com uma dada probabilidade de ocorrência
designada para cada uma. O cruzamento envolve a troca de uma determinada parte de duas
cadeias de binários em uma posição escolhida de forma aleatória; essa operação é chamada de
esquema de cruzamento de ponto único. Um cruzamento típico teria a seguinte forma:

Antes do Cruzamento Após o Cruzamento


101100001|0010001 101100001|0111011
101010111|0111011 101010111|0010001
( | indica o ponto de ocorrência do cruzamento)

A probabilidade de ocorrência do cruzamento determina se essa operação será ou não


aplicada ao selecionado par de cromossomas. Da mesma forma, a operação de mutação ocorre
em função de uma dada probabilidade para certas posições de membros da população obtidos
após o cruzamento; essa operação modifica de forma arbitrária o valor de uma posição
selecionada pelo seu valor oposto (de zero para um e vice-versa). Ambas as operações
ocorrem no algoritmo segundo probabilidades: Pc para cruzamento e Pm para mutação.
Portanto, a escolha de valores de probabilidade de cruzamento ou mutação menores do que 1
significa que certos pais não sofrerão cruzamento ou mutação.
Após da aplicação das etapas de cruzamento e mutação em todos os membros da
população, a nova geração tem as mesma quantidade de cromossomas que a anterior. Os
valores são novamente transformados e os respectivos valores da função objetivo são
recalculados. Se a diferença dos valores da função objetivo obtidos com os melhores
membros pertencentes à nova geração e à anterior for menor do que um certo valor limite
especificado, diz-se que o processo de ajuste pela minimização, ou maximização, da função
objetivo atingiu um platô. Caso contrário, os membros da população corrente tornam-se os
pais de uma nova geração e assim por diante, para que sejam obtidas soluções cada vez mais
próximas ao máximo global. No algoritmo genético usado nesse trabalho, cada candidato a ser
um pai da nova geração é classificado de acordo com o valor da função objetivo e somente a
fração dos candidatos sobreviventes, baseada em um valor de probabilidade de sobrevivência
Ps definido a priori, pode tornar-se pais da nova geração.
Os parâmetros fundamentais de um algoritmo genético são as probabilidades de
cruzamento Pc, de mutação Pm, de sobrevivência Ps, e o tamanho da população. Para que a
robustez do algoritmo seja preservada, é necessário escolher valores iniciais apropriados para
esses parâmetros. Nesse sentido, Goldberg (1989) sugere as seguintes estimativas iniciais para
esses parâmetros: tamanho da população = 30 a 100, Pc=0,6 a 1 e Pm=0,01. Todavia, dada a
dificuldade de se propor uma regra geral, outras estimativas iniciais podem ser usadas. Há
uma vasta literatura abordando os aspectos teóricos, as aplicações e as limitações dos
algoritmos genéticos; detalhes adicionais podem ser obtidos em Goldberg (1989).

APLICAÇÕES

Diversos autores têm investigado o desempenho da aplicação do método de


Muskingum não linear - equação 3 - usando os dados de Wilson (1974), devido à sua forte
não linearidade entre as vazões ponderadas e o volume de armazenamento. A equação
mencionada acima contém três parâmetros, quais sejam, K, x e m. Diferentes técnicas de
estimativa de parâmetros foram consideradas em estudos anteriores:
i) Gill (1978) propôs uma técnica de estimativa de três pontos envolvendo a solução de
um sistema de equações simultâneas não lineares a cada passo de tempo; a seleção
desses três pontos para a estimativa dos parâmetros é arbitrária e o valor do parâmetro
x deve ser estipulado a priori;
ii) Tung (1985) propôs três técnicas, todas baseadas em combinações de uma técnica de
busca direta - aquela desenvolvida por Hooke and Jeeves (HJ) - para identificação do
valor de x e métodos iterativos de busca - regressão linear simples (RL), gradiente
conjugado (GC) e Davidon-Fletcher Powell (DFP) - para estimar os outros dois
parâmetros;
iii) Yoon and Padmanabhan (1993) sugeriram um processo iterativo, o qual envolve uma
regressão não linear por mínimos quadrados, com os parâmetros sendo estimados
inicialmente por meio do algoritmo de Marquardt; e
iv) Mohan (1997) utilizou um algoritmo genético para estimar os três parâmetros. Essa
alternativa não demanda nenhuma estimativa inicial dos valores dos parâmetros, fato
que evita a subjetividade e o tempo computacional associados aos métodos de
estimativa mencionados anteriormente.

As estimativas dos parâmetros e as estatísticas comparativas das aplicações do método


de Muskingum não linear com os dados do exemplo de Wilson (1974), como apresentadas
pelos respectivos autores das metodologias descritas acima, estão na Tabela 1. Pode-se notar
que os sistema de equações (1) e (3) não foi resolvido da mesma forma, i.e., enquanto Tung
(1985) e Mohan (1997) obtiveram os valores das vazões de saída por meio da equação (5),
para a qual uma estimativa inicial do armazenamento é necessária, Gill (1978) e Yoon e
Padmanabhan (1993) usaram uma aproximação diferencial pela qual obtém-se a equação (4).
Tabela 1. Estimativas de parâmetros e estatísticas comparativas das aplicações com dados do
exemplo de Wilson (1974)
Método K X m SQR DVP DTOP
GA 0,1033 0,2813 1,8282 38,23 0,70 0
HJ+LR 0,1700 0,2400 1,7012 132,75 0,60 0
HJ+CG 0,0669 0,2685 1,9291 49,64 0,50 0
HJ+DFP 0,0764 0,2677 1,8978 45,54 0,30 0
Marquardt 0,0568 0,2700 2,3600 43,26 0,70 1
Gill 0,0100 0,2500 2,3470 143,60 1,80 0
Esse artigo 0,0098 0,2794 2,3558 67,63 1,80 0

Nota: SQR (soma dos quadrados dos resíduos de vazões); DVP (desvio das vazões de pico
dos hidrogramas observado e calculado); DTOP (desvios dos tempos de ocorrência dos picos
nos hidrogramas observado e calculado).

Nesse artigo, apresenta-se uma primeira tentativa de avaliar o desempenho do método


de Muskingum não linear, como descrita pela equação (4), tal como aplicado a um problema
prático. Os parâmetros são estimados utilizando-se algoritmos genéticos, resolvendo-se a
equação não linear apresentada por Gill (1978) e Yoon e Padmanabhan (1993). Com o intuito
de conferir o código computacional desenvolvido, a metodologia foi aplicada com os dados
de Wilson (1974), por meio da minimização da soma dos quadrados dos resíduos. Uma cadeia
com comprimento de 12 posições para cada variável é selecionada e dígitos binários
aleatoriamente obtidos. Após diversas simulações com diferentes sementes iniciais de geração
de números aleatórios e diferentes probabilidades de cruzamento, mutação, e sobrevivência,
um valor mínimo de 67,63 - K, x e m iguais a 0,0098, 0,2794 e 2,3558, respectivamente - foi
obtido para a soma dos quadrados dos resíduos, o qual é um pouco superior àquele obtido por
Mohan (1997), apresentado na Tabela 1; apesar desse fato, o valor aqui obtido é considerado
adequado para o problema.

APLICAÇÃO COM DADOS DO RIO SÃO FRANCISCO

O rio São Francisco figura entre os de maior comprimento no mundo. Sua bacia
hidrográfica está inteiramente localizada no Brasil e sua área de drenagem é de 631.000 km 2,
com limites localizados entre as latitudes 7º 00´ e 21º 00´ S e longitudes 35º 00´ e 47º 40’ W.
O rio tem aproximadamente 2.700 km de comprimento, com vazão média de longo termo de
3.360 m3/s na sua foz (Figura 1). De sua nascente, na Serra da Canastra, no estado de Minas
Gerais, até a sua foz no Oceano Atlântico, sua vazão de longo termo por unidade de área
decresce consideravelmente, como resultado da influência do clima semi-árido predominante
no nordeste do Brasil.
O trecho analisado nesse trabalho localiza-se no curso médio do rio, entre as estações
fluviométricas de São Francisco e Manga (Figura 1). A seção de montante, na estação de São
Francisco, tem uma área de drenagem de 185.000 km 2 e Manga, na seção de jusante, drena
uma área de 202.000 km2. Além do fato da área de drenagem incremental entre as duas
estações ser apenas 8,4 % inferior àquela de Manga, sua vazão por unidade de área (m 3/s.km2)
é relativamente muito menor do que os valores de montante. Tais características desse trecho,
cujo comprimento é de 176 km, indicam sua adequabilidade para aplicações de métodos de
propagação baseados na suposição comum de contribuições laterais nulas. Dados de vazão
dessas duas estações - São Francisco e Manga - estão disponíveis desde 1938. As vazões
médias nas duas estações são iguais a, aproximadamente, 2.000 m3/s. Um hidrograma com
duração de 41 dias, com início em janeiro de 1985, é utilizado para calibrar o modelo, e os
parâmetros obtidos são utilizados para verificar o desempenho do modelo para outros
períodos, incluindo o hidrograma contendo a vazão máxima observada em todo o período,
igual a 18.370 m3/s, ocorrida em fevereiro de 1979.
Figura 1 - Bacia do rio São Francisco e o trecho São Francisco-Manga.

RESULTADOS

Como feito na simulação do caso teste, com dados de Wilson (1974), várias
simulações, com diferentes sementes para geração de números aleatórios, e diferentes
probabilidades de cruzamento e mutação, foram consideradas. O menor valor de desvio
padrão encontrado foi de 299,42 m3/s, e embora uma diferença absoluta de grande magnitude
possa ser observada entre as vazões calculada e observada, a maior diferença percentual é
inferior a 3%, com desvio do tempo de ocorrência de picos igual a zero. Pode-se observar na
Figure 2 que a forma do hidrograma da vazão a jusante foi bem reproduzida, especialmente na
recessão.
Figura 2 - Hidrograma para a etapa de calibração

Os parâmetros estimados - 0,0066, 0,1256 and 1,6799 para K, x e m, respectivamente - são


usados para gerar hidrogramas de jusante para outros eventos, com vazões de pico de igual
magnitude e para o hidrograma que contém a vazão máxima observada no histórico, como
mostrado nas Figuras 3, 4 e 5 (desvios padrão de 593,74 m3/s, 302,94 m3/s e 914,31 m3/s,
respectivamente, e desvios do tempo de ocorrência de picos iguais a 1, 1 e 0,
respectivamente).
Figura 3 – Hidrograma para a primeira etapa de verificação

Figura 4 – Hidrograma para a segunda etapa de verificação

Figure 5 – Hidrograma para a terceira etapa de verificação

O ajuste entre os hidrogramas observados e calculados pode ser considerado excelente.


O principal problema está relacionado à deficiente estimativa da vazão de pico, como ocorre
na Figura 5. De uma certa forma, esse resultado poderia ser esperado, uma vez que para esse
hidrograma a atenuação do pico observada relativamente pequena quando comparada com a
de outros eventos. Esse fato pode estar relacionado a dois fatores: (a) a definição inadequada
da curva-chave para descargas de tal magnitude; e (b) o comportamento particular do trecho
de rio para descargas que ocasionem a ocupação de extensas áreas da planície de inundação.
O desempenho do modelo foi também avaliado para simulações de longo prazo. Dois
hidrogramas foram escolhidos (a partir de dezembro de 1961 e a partir de dezembro de 1987),
com vazões de pico em torno de 5.000 m3/s; os períodos de simulação, em ambos os casos,
cobrem a maior parte da estação úmida e a parte inicial da estação seca da região. Nos dois
casos (figuras 6 e 7), os hidrogramas calculados estão razoavelmente precisos em seus ramos
de ascensão e recessão. Todavia, as vazões de pico foram freqüentemente subestimadas por
um pequeno valor.

Figura 6 - Simulação de longo termo: estação úmida 1961

Figura 7 - Simulação de longo termo: estação úmida 1987


CONCLUSÕES

O método de Muskingum não linear apresenta uma vantagem significativa quando


comparado ao modelo linear quando aplicado aos dados de Wilson (1974). Todavia, a tarefa
de estimar parâmetros por meio de um processo de calibração é muito mais trabalhosa. Várias
técnicas para estimativa de parâmetros têm sido propostas, incluindo a aplicação de algoritmo
genético, método que não demanda nenhuma estimativa inicial de valores de parâmetros e,
conforme exemplos na literatura, de grande eficiência em termos de precisão. Poucos
exemplos de aplicação prática dessa metodologia para problemas de propagação são
encontrados na literatura. Nesse artigo, são descritas as etapas de calibração e verificação da
aplicação do método de Muskingum não linear com estimativa de parâmetros por meio do uso
de técnicas de algoritmo genético. A metodologia foi aplicada a um trecho do rio São
Francisco, o qual foi selecionado em função de sua conveniência para métodos hidrológicos
de propagação, face à contribuição lateral desprezível. Resultados satisfatórios foram obtidos
com as simulações, com exceção do hidrograma que contém a maior vazão observada no
histórico, para a qual foi associada uma estimativa preliminar de tempo de retorno de 500
anos. Os resultados obtidos confirmam a eficiência da técnica de algoritmo genético para
estimar parâmetros cujas correspondentes simulações são razoavelmente precisas. Todavia,
recomenda-se cautela para adoção de um único conjunto de parâmetros, cujo erro será
mínimo, para qualquer problema de propagação visto que só se pode afirmar que um mínimo
local foi atingido em qualquer caso.

REFERÊNCIAS BIBLIOGRÁFICAS

Gill, M. A. (1978). “Flood routing by the Muskingum method.” Journal of Hydrology, 36, p.
353-363.
Goldberg, D. E. (1989). Genetic Algorithms in Search, Optimization, and Learning. Addison-
Wesley Publishing Co., Reading, Mass.
Mohan, S. (1997). “Parameter estimation of nonlinear Muskingum models using genetic
algorithm.” Journal of Hydraulic Engineering, ASCE, 123(2), p. 137-142.
Tung, Y. K. (1985). “River flood routing by nonlinear Muskingum method.” Journal of
Hydraulic Engineering, ASCE, 111(12), p. 1447-1460.
Wilson, E. M. (1974). Engineering hydrology. MacMillan Education Ltd., Hampshire, U.K.
Yoon, J. and Padmanabhan, G. (1993). “Parameter estimation of linear and nonlinear
Muskingum models”. Journal of Water Resources Planning and Management, ASCE,
119(5), p. 600-610.

Você também pode gostar