Você está na página 1de 79

INSTITUTO FEDERAL DO ESPÍRITO SANTO

PÓS-GRADUAÇÃO LATO SENSU EM ENGENHARIA ELÉTRICA COM


ÊNFASE EM SISTEMAS INTELIGENTES APLICADOS À AUTOMAÇÃO

RAFAEL COELHO MARINS

PREVISÃO DE CURTO PRAZO DOS PERFIS DE VAZÃO E PRESSÃO NO


PONTO CRÍTICO EM UM SISTEMA DE ABASTECIMENTO PÚBLICO DE
ÁGUA TRATADA UTILIZANDO REDES NEURAIS

Vitória
2017
RAFAEL COELHO MARINS

PREVISÃO DE CURTO PRAZO DOS PERFIS DE VAZÃO E PRESSÃO NO


PONTO CRÍTICO EM UM SISTEMA DE ABASTECIMENTO PÚBLICO DE
ÁGUA TRATADA

Monografia apresentada ao Curso de Pós-


Graduação Lato Sensu em Engenharia Elétrica
com Ênfase em Sistemas Inteligentes Aplicados
à Automação do Instituto Federal do Espírito
Santo como requisito parcial para obtenção do
certificado de Especialista em Sistemas
Inteligentes Aplicados à Automação.

Orientador: Prof. Dr. Hans Rolf Kulitz

Vitória
2017
(Biblioteca Nilo Peçanha do Instituto Federal do Espírito Santo)

M339p Marins, Rafael Coelho.


Previsão de curto prazo dos perfis de vazão e pressão no ponto
crítico em um sistema de abastecimento público de água tratada
utilizando redes neurais. – 2017.
77 f. : il. ; 30 cm

Orientador: Hans Rolf Kulitz.

Monografia (especialização) – Instituto Federal do Espírito Santo,


Coordenadoria de Pós-Graduação em Engenharia Elétrica, Curso
Pós-Graduação Lato Sensu em Engenharia Elétrica com Ênfase em
Sistemas Inteligentes Aplicados à Automação, Vitória, 2017.

1. Redes neurais (computação). 2. Abastecimento de água. 3.


Agua - Distribuição. I. Kulitz, Hans Rolf. II. Instituto Federal do
Espírito Santo. III. Título.
CDD 21 – 006.32
AGRADECIMENTOS

Agradeço aos professores do colegiado do curso de Pós-Graduação Lato


Sensu em Engenharia Elétrica do Instituto Federal do Espírito Santo, Campus
Vitória, pelo empenho e comprometimento com o ensino de qualidade.
RESUMO

Neste trabalho foram utilizadas redes neurais artificiais para realizar a previsão
dos perfis de vazão (ou demanda) e pressão no ponto crítico em um sistema de
abastecimento público de água tratada. O ponto crítico é o local menos
favorecido em relação ao abastecimento, normalmente por se situar na região
de maior altitude ou mais distante do suprimento (reservatório de distribuição
ou booster de água tratada). A previsão não é o objetivo em si, mas sim
disponibilizar uma ferramenta de apoio ao controle operacional na busca pela
eficiência energética e redução de perdas físicas de água tratada. Temas cada
vez mais em voga, não somente pela saúde financeira dos prestadores de
serviço de abastecimento público de água, mas também pela necessidade de
preservação ambiental. O horizonte da previsão foi de 24 horas à frente a cada
posto horário por concentrar a maior parte da rotina do controle operacional por
razões como: A demanda geralmente apresenta ciclos diários; programações
diárias dos horários de funcionamento das estações elevatórias principalmente
pela diferenciação de tarifas de energia nos horário de ponta e fora de ponta;
muitas vezes é possível inferir valores de referência de níveis de reservatórios
e pontos de monitoramento remoto de pressão da rede de distribuição de água
acerca da normalidade do abastecimento para determinadas horas do dia.
Foram realizadas duas abordagens para a previsão, uma utilizando rede neural
do tipo perceptron multicamadas e outra com rede neural não-linear
autorregressiva com elemento exógeno. Para avaliação de desempenho, foi
calculada a média de erro absoluto percentual da previsão de 24 horas para os
valores de vazão e pressão e o erro do volume disponibilizado. Ambos os
modelos de redes neurais desenvolvidos apresentaram as médias de erro
absoluto percentual abaixo de 3% e 11% para os perfis de vazão e pressão,
respectivamente, mostrando-se úteis para detecção antecipada de desvios das
metas operacionais possibilitando que sejam tomadas ações preventivas em
detrimento a ações corretivas.

Palavras chaves: Redes neurais artificiais. Previsão de demanda.


Abastecimento público de água tratada.
ABSTRACT

This work uses artificial neural networks as a tool to perform the forecasting
profiles of the flow (or demand) and pressure at the critical point of a public
treated water supply system. The critical point is the place least favored in
relation to the supply, usually because it is located in the highest or at the most
distant region from the supply (distribution reservoir or treated water booster).
The forecast is not the objective in itself, but a way to provide a tool to support
the operational control to reach the energy efficiency and the reduction of
physical losses of treated water. These themes are currently in vogue, not only
for the financial health of the water supply systems services providers, but also
for the need for environmental preservation. The forecast horizon was 24 hours
ahead because it is the horizon of the most operational control routines for
reasons such as: Daily cycles that normally occurs in the demand; the
schedules of operating hours of the pump stations are daily, mainly due to the
differentiation of electric energy prices in peak and off-peak hours; it is often
possible to infer a thresholds of reservoir levels and remotely monitored points
of pressure from the distribution networks about the normality of water supply at
certain times of the day. Two approaches have been performed, one of them
using multi-layer perceptron-type neural network and another with a nonlinear
autoregressive neural network with exogenous element. In order to evaluate the
performance of the prediction fulfilled by the artificial neural network, it has been
calculated the mean absolute percentage error of the 24 hour forecast for the
flow and pressure values and the error of the total volume delivered in the
period. Both models of developed neural networks showed means absolute
percentage error below 3% and 11% for the 24-hour forecast of the flow and
pressure profiles of the critical point, respectively, proving that they are useful
for early detection of deviations from operational goals, making possible that
preventive actions are taken in detriment to corrective actions.

Keywords: Artificial neural networks. Demand forecast. Public water supply


system.
LISTA DE FIGURAS

Figura 1 - Índice de perdas na distribuição por Capital de Estado. .................. 14


Figura 2 – Evolução do consumo específico de energia no abastecimento de
água. ............................................................................................... 15
Figura 3 - Componentes principais do controle e gerenciamento de perdas. .. 16
Figura 4 - Balanço Hídrico segundo conceito da IWA. ..................................... 20
Figura 5 – Modelo generalizado de um neurônio artificial. ............................... 26
Figura 6 – Funções de ativação. ...................................................................... 27
Figura 7 – Fronteiras de decisão para reconhecimento de classes possíveis
utilizando-se redes feedforward de duas e três camadas. .............. 31
Figura 8 – Rede Perceptron Multicamadas. ..................................................... 32
Figura 9 – Janelamento aplicado a uma série temporal com propósito de
capacitar uma rede MLP a processar sistema dinâmico. ................ 33
Figura 10 – Rede Não Linear Autorregressiva com Elemento Exógeno (NARX).
...................................................................................................... 34
Figura 11 – Rede NARX em modo paralelo e série-paralelo. .......................... 35
Figura 12 – Diagrama unifilar dos principais elementos do setor de
abastecimento estudado. .............................................................. 36
Figura 13 – Perfis de vazão e pressão do ponto crítico normalizados sob
condições normais de operação do setor de abastecimento
estudado........................................................................................ 40
Figura 14 – Influência da VBM-1 no sistema. ................................................... 40
Figura 15 – Manobra de reforço do “Setor A” para o “Setor B”. ....................... 40
Figura 16 – Manobra operacional onde o Setor B estava abastecendo o Setor
A. ................................................................................................... 41
Figura 17 – Falha no sistema de aquisição de dados do PT-3. ....................... 41
Figura 18 – Influência do dia da semana nos valores médios de vazão e
pressão. ........................................................................................ 42
Figura 19 – Influência do mês nos valores médios de vazão e pressão. ......... 42
Figura 20 – Valores médios de vazão por bomba. ........................................... 42
Figura 21 – Valores médios de vazão e pressão por percentual de abertura da
VBM-1. .......................................................................................... 42
Figura 22 – Função de autocorrelação da vazão antes e após o pré-
processamento dos dados. ........................................................... 44
Figura 23 – Função de Auto-Correlação Parcial da vazão antes e após o pré-
processamento dos dados. ........................................................... 45
Figura 24 – Covariância cruzada entre vazão e pressão antes e após o pré-
processamento dos dados. ........................................................... 45
Figura 25 – Solução proposta para previsão um 1 hora à frente...................... 46
Figura 26 – Solução proposta para previsão um 24 hora à frente.................... 47
Figura 27 – Rede MLP definida para previsão 1 hora à frente. ........................ 50
Figura 28 – Rede MLP modelada..................................................................... 52
Figura 29 – Resultado do treinamento da rede MLP. ....................................... 52
Figura 30 – Teste da rede MLP 1 passo a frente para o período de teste. ...... 53
Figura 31 – Rede NARX definida para previsão 1 hora a frente. ..................... 54
Figura 32 – Rede NARX modelada. ................................................................. 56
Figura 33 – Treinamento da rede NARX. ......................................................... 57
Figura 34 – Detalhe da resposta do treinamento da rede NARX treinada. ...... 58
Figura 35 – Período utilizado para teste e avaliação de desempenho da
previsão 24 horas à frente. ............................................................................... 59
Figura 36 – Resposta da rede MLP para previsão de 24 horas. ...................... 61
Figura 37 – Resposta da rede NARX para previsão de 24 horas..................... 63
Figura 38 – Teste efetuado com a rede NARX para previsão de vários passo a
frente. ............................................................................................ 65
Figura 39 – Teste efetuado com a rede NARX para detecção de anomalias no
abastecimento. .............................................................................. 66
Figura 40 – Fluxo treinamento supervisionado................................................. 72
Figura 41 – Retropropagação do erro para um único neurônio. ....................... 73
Figura 42 – Convergência do erro e validação do treinamento. ....................... 77
LISTA DE SIGLAS

CCO - Centro de Controle Operacional

CMB – Conjunto Motor-Bomba

DMC – Distrito de Medição e Controle

FT – Flow Transmistter (Transmissor de vazão)

IBGE – Instituto Brasileiro de Geografia e Estatística

IWA – International Water Association

MAPE – Mean absolute percentage error

MLP – Multi-layer perceptron

MSE – Mean square error

NARX – Non-linear auto-regressive with exogenous input

PMSS – Programa de Modernização do Setor Saneamento

PT – Pressure Transmitter (Transmissor de pressão)

SCADA - Supervisory Control and Data Acquisition

SNIS - Sistema Nacional de Informações sobre Saneamento

VBM - Válvula Borboleta Manual

VD – Volume Disponibilizado
SUMÁRIO

1 INTRODUÇÃO .................................................................................... 12
1.1 CONTEXTUALIZAÇÃO E MOTIVAÇÃO ............................................. 12

1.2 OBJETIVO ........................................................................................... 17

2 REVISÃO DE LITERATURA............................................................... 19
2.1 IMPORTÂNCIA DA PREVISÃO DE DEMANDA NO SANEAMENTO . 19

2.2 TRABALHOS DE PREVISÃO DE DEMANDA ANTERIORES


UTILIZANDO REDES NEURAIS ARTIFICIAIS ................................... 22

3 MATERIAS E MÉTODOS ................................................................... 25


3.1 REDES NEURAIS ARTIFICIAIS .......................................................... 25

3.1.1 Definição e topologias das redes neurais ....................................... 28

3.1.1.1 Perceptron de Multicamadas ............................................................... 31

3.1.1.2 Redes recorrentes ............................................................................... 33

4 ESTUDO DE CASO E METODOLOGIA ............................................. 36


4.1 CARACTERIZAÇÃO DO SISTEMA ESTUDADO ................................ 36

4.2 COLETA E ANÁLISE DOS DADOS .................................................... 38

4.3 DEFINIÇÃO E TREINAMENTO DAS REDES NEURAIS UTILIZADAS


NO ESTUDO DE CASO ...................................................................... 46

4.3.1 Definição das redes neurais ............................................................. 46

4.3.2 Ferramenta utilizada .......................................................................... 49

4.3.3 Critérios de avaliação de desempenho ........................................... 49

4.3.4 Treinamento da rede neural MLP ..................................................... 50

4.3.5 Treinamento da rede neural NARX................................................... 54

5 RESULTADOS PARA PREVISÃO 24 HORAS A FRENTE E


DISCUÇÕES ....................................................................................... 59
5.1 RESULTADOS DA REDE NEURAL MLP............................................ 60

5.2 RESULTADO REDE NEURAL NARX ................................................. 62

5.3 DISCUSSÕES ..................................................................................... 64


6 CONCLUSÃO E SUGESTÕES DE TRABALHOS FUTUROS ........... 67
REFERÊNCIAS ................................................................................... 69
APÊNDICE A - TREINAMENTO DAS REDES NEURAIS ................... 72
12

1 INTRODUÇÃO

1.1 CONTEXTUALIZAÇÃO E MOTIVAÇÃO

O crescimento populacional em progressões geométricas, a concentração


populacional nas grandes metrópoles, a escassez de recursos hídricos, a piora da
qualidade da água dos mananciais e o aumento da exigência da qualidade por parte
da sociedade e agências reguladoras tem desafiado as Companhias de
Abastecimento Público de Água em busca da otimização operacional e redução de
perdas físicas de água.

Nos últimos anos a região Sudeste do Brasil enfrentou a pior crise hídrica da
história.

Em 2014 a Companhia de Saneamento Básico do Estado de São Paulo (Sabesp)


após sucessivos recordes negativos no nível das represas do Sistema Cantareira,
principal captação da Grande São Paulo, iniciou a captação através de bombas
flutuantes do chamado "volume morto", que fica abaixo do nível das comportas e
nunca havia sido utilizado, (G1 SÃO PAULO, 2014).

No Estado do Espírito Santo, em 2016, devido aos níveis críticos de vazão dos dois
principais rios que abastecem a Região da Grande Vitória, o Rio Santa Maria da
Vitória e o Rio Jucú, a Companhia Espírito Santense de Saneamento (Cesan)
executou um plano de rodízio no abastecimento (G1VITÓRIA, 2016).

A melhoria da eficiência operacional e a redução das perdas físicas de água


passaram a ser questão de sustentabilidade do negócio.

Segundo Sjöbom Júnior (2005) a otimização dos recursos aplicados em saneamento


faz um sentido amplo: é justo para sociedade, pois utiliza melhor o que ela
disponibilizou para tal, e uma melhoria social na medida em que otimizando uma
13

atividade da empresa possibilitará se aplicar o que se economizou em expansão do


atendimento de outras necessidades sociais.

Sob uma perspectiva econômica e financeira, as ineficiências no uso de energia


constituem custos evitáveis que são suportados por subsídios à operação dos
serviços e por taxas e tarifas cobradas dos usuários. Já sob uma perspectiva
ambiental, o uso de energia sem considerações de eficiência contribui para a
emissão de gases de efeito estufa desnecessária com impactos nas alterações
climáticas em escala global. Inerente à abordagem da eficiência energética, inclui-se
à temática das perdas físicas de água, uma vez que toda energia utilizada na
produção e transporte desse recurso também é perdida (SNIS, 2015).

As perdas, que se caracterizam como ineficiências técnicas, são inerentes a


qualquer sistema de abastecimento de água, porém, quando são elevadas,
representam desperdício de recursos naturais, operacionais e de receita para o
prestador de serviços (SNIS, 2015).

O Sistema Nacional de Informações sobre Saneamento – SNIS, criado pelo Governo


Federal em 1996 possui uma base de dados que contém informações e indicadores
de caráter operacional, gerencial, financeiro e de qualidade sobre a prestação de
serviços de Água e Esgotos que são fornecidas anualmente pelos próprios
prestadores.

O valor médio do índice de perdas na distribuição para as capitais do país estão em


um patamar próximo a 36,7%, como mostrado na Figura 1 pela linha vermelha. O
índice de perdas na distribuição é calculado pela diferença entre o volume da água
produzido e o volume da água consumido, dividido pelo volume de água produzido
descontado o volume usado para atividades operacionais e especiais e somado ao
volume tratado importado.
14

Figura 1 - Índice de perdas na distribuição por Capital de Estado.

Fonte: SNIS (2015).

Observa-se grande variação nos índices de perdas entre as capitais de Estado,


desde 17,0% em Porto Alegre/RS até 69,1% em Macapá/AP. Os melhores índices
encontram-se nas capitais da região sul e sudeste.

Os gastos com energia elétrica representam 12% das despesas dos prestadores de
serviço de abastecimento de água, podendo variar entre 9% e 24%, dependendo da
região do país. A Figura 2 ilustra a evolução do consumo específico de energia
elétrica (energia gasta por volume de água produzido, kW.h/m³) de acordo com tipo
de prestador de serviço.
15

Figura 2 – Evolução do consumo específico de energia no abastecimento de água.

Fonte: SNIS (2015).

Observa-se pouca melhoria para as empresas de economia mista e privada e


tendência de crescimento (piora) do indicador para os demais tipos de empresas.

Segundo Lambert (2002), a tendência natural do aumento das perdas com o avanço
da idade das redes de um sistema de abastecimento é controlada e gerenciada por
uma combinação de quatro componentes principais:
 Controle de pressões–Telemetria das pressões na rede de distribuição,
utilização de bombas de velocidade variável, utilização de válvulas redutoras
de pressão, controle das pressões mínimas noturnas;
 Rapidez e qualidade no reparo – Investimentos em procedimentos e logísticas
de equipes de manutenção;
 Controle ativo dos vazamentos - Pesquisa de vazamentos não visíveis;
 Gestão da infraestrutura – Substituição de redes e ramais, setorização e
criação de distritos de medição e controle (DMC’s).

Ressalta-se que existe um limite técnico mínimo de perdas físicas de água definido
pelo alcance das tecnologias atuais dos materiais, ferramentas, equipamentos e
logísticos e um limite econômico, a partir do qual se gasta mais para reduzir as
perdas do que o valor intrínseco dos volumes recuperados como mostrado no
diagrama da Figura 3.
16

Figura 3 - Componentes principais do controle e gerenciamento de perdas.

Fonte: Adaptado de Lambert (2002).

Para Falkenberg (2005), a automação dos sistemas de abastecimento de água é,


portanto, indispensável a fim de atingir tais objetivos, reduzindo a pressão na rede
através de inversores de frequência e válvulas redutoras de pressão e permitindo
um completo gerenciamento da rede hidráulica através de Sistemas de Supervisão e
Aquisição de Dados, ou abreviadamente SCADA (do acrônimo em inglês de
Supervisory Control and Data Acquisition).

Segundo Machado (2017) tem-se empregado com muito sucesso os chamados


Centros de Controle Operacional (CCO), centrais para onde migram as informações
de reservatórios, bombeamentos e de elementos estratégicos do sistema de adução
ou de distribuição de água. Os CCO’s permitem que os operadores interajam com
vários parâmetros, tais como vazões, pressões e níveis de reservatórios propiciando
a identificação de problemas antes de eles serem comunicados pela população.

Segundo Jain et al. (2000), um aspecto crítico da otimização operacional e


gerenciamento dos sistemas de abastecimento de água é a precisão de curto prazo
da demanda de água.
Segundo Falkenberg (2005) a correta tomada de decisões operacionais depende do
conhecimento prévio do perfil de demanda ao longo do dia das regiões de consumo
de água. Este tipo de previsão é classificado como previsão a curto prazo.
17

Autores como Silva (2003), listam diversos fatores que influenciam na variação de
demanda, como a temperatura ambiente, umidade, ocorrência de chuva, dias de
feriados, tipo de ocupação do solo, existência ou não de medição, preço da tarifa,
tipo de consumidor (serviço público, residencial, comercial ou industrial) entre outros
fatores.

Normalmente a demanda apresenta ciclos periódicos diários, semanais e sazonais.


Os ciclos diários estão vinculados ao próprio comportamento humano, normalmente
apresentam picos nos horários de almoço e no final do dia, os ciclos semanais do
tipo de consumidor predominante do setor abastecido, enquanto a sazonalidade
mensal está vinculada às mudanças climáticas, férias escolares e turismo.

O crescimento “vegetativo” do setor abastecido, fatores econômicos, incrustações na


rede de distribuição de água, vazamentos não visíveis, ligações clandestinas podem
provocar tendências e distorções nos perfis de vazão e pressão ao longo do tempo.
Pelo exposto a demanda envolve uma enorme quantidade de variáveis
independentes, assim o desenvolvimento de uma ferramenta computacional que
auxilie o operador nas tomadas de decisões é sem dúvida de grande valia, evitando-
se o empirismo ou métodos de tentativa e erro.

O cenário atual motivou o estudo de um modelo de previsão de demanda em curto


prazo utilizando redes neurais artificiais como ferramenta de apoio à busca pela
otimização do controle operacional e redução de perdas físicas de água tratada a
que enfrentam as Companhias de Saneamento.

1.2 OBJETIVO

Esse trabalho tem por objetivo a previsão dos perfis de vazão (ou demanda) e de
pressão no ponto crítico de um sistema de abastecimento público de água tratada
em um horizonte de 24 horas à frente a partir de históricos de dados operacionais.
18

O ponto crítico em geral é o ponto mais alto ou o mais distante da fonte de


suprimento do sistema de abastecimento de água tratada, ou, dependendo das
condições topográficas do local, a combinação dessas duas variáveis.

A pressão no ponto crítico dependerá da pressão no recalque de estações de


bombeamento ou do nível do reservatório de distribuição; diferença entre as cotas
altimétricas e a perda de carga em função da vazão que ocorre na tubulação até o
ponto crítico.

Contudo a previsão não é o objetivo fim em si, mas o meio de se obter informação
útil para tomada de decisões sobre o controle do sistema de abastecimento.

Um modelo de previsão com acurácia adequada pode oportunamente ser


incorporado a um sistema SCADA para geração de alarmes de possíveis desvios
das metas operacionais possibilitando a automatização de ações preventivas.

Para alcance do objetivo foram adotadas as redes neurais artificiais devido a suas já
bem estudadas características de: Capacidade de aprendizagem a partir de
exemplos do meio externo; capacidade de generalização; capacidade de solucionar
problemas não lineares e tolerâncias a erros, pois como visto no item 1.1 a previsão
de demanda envolve uma grande quantidade de variáveis independentes cujas
relações são difíceis ou impossíveis de serem modeladas matematicamente de
forma determinística.
19

2 REVISÃO DE LITERATURA

2.1 IMPORTÂNCIA DA PREVISÃO DE DEMANDA NO SANEAMENTO

De acordo com Ren et al. (2016) a previsão de demanda pode ser classificada em
longo, médio ou de curto prazo. Os diferentes horizontes de previsão correspondem
a diferentes níveis de planejamento, as variáveis comumente utilizadas na previsão
e os problemas de decisão envolvidos são apresentados no Quadro 1.

Quadro 1 - Classificação de previsão de demanda de água


Horizonte da Longo prazo Médio Prazo Curto prazo
previsão (anos) (meses até anos) (horas até semanas)
Nível de Planejamento
Tático Operacional
planejamento Estratégico
Histórico de Demanda consumo
consumo anual; anual/sazonal; Histórico consumo diário mensal,
Fatores Crescimento semanal, diário ou horário;
Variáveis
econômicos vegetativo das Pressões e vazões instantâneas;
utilizadas na
externos; cidades; Níveis de reservatórios;
previsão
Taxas de Tipo de utilização Hora; Dia da semana;
crescimento (residencial, comercial, Chuva; Umidade e Temperatura.
populacional; industrial, etc.
Otimização operacional;
Determinação de parâmetros
operacionais do sistema (horário de
Problemas
Decisões Planos de operação de bombas, níveis de
de decisão
políticas investimentos reservatórios, controle de pressões,
envolvidos
metas de distribuição de água;
Geração de alarmes de ocorrências
operacionais
Fonte: Adaptado de Ren et al. (2016).

Sendo o ponto crítico o local menos favorecido em relação ao abastecimento a


importância do seu monitoramente se dá naturalmente, pois garantindo a pressão
adequada nesse ponto todo o restante do setor também estará abastecido.

Tipicamente o plano de controle operacional é preparado para um período de 24


horas à frente pelas seguintes razões:
 A demanda normalmente apresenta ciclos periódicos diários;
 A estrutura tarifária de energia elétrica possibilita custos diferenciados no
horário de ponta e fora de ponta;
 Existem condições limítrofes de nível de reservatórios e pressão em pontos
da rede de distribuição de água em determinados horários do dia que
20

sinalizam uma condição normal de operação do sistema de abastecimento.


Esses limites muitas vezes são estabelecidos pelo conhecimento tácito do
pessoal de operação e manutenção responsáveis pelo setor de distribuição
de água tratada;
 As metas de redução do Índice de Perdas estabelecidas em nível estratégicos
das Companhias de Saneamento normalmente são desdobradas em metas
de Volume Disponibilizado (VD) diário aos setores após estudo do Balanço
Hídrico, segundo conceitos adotados pela IWA – International Water
Association, conforme apresentado na Figura 4.

Figura 4 - Balanço Hídrico segundo conceito da IWA.

Fonte: PMSS (2015).

O objetivo do controle operacional do sistema de distribuição de água tratada é


atender a demanda ao menor custo possível. Resumidamente, podemos ilustrar a
rotina do controle operacional com as seguintes ações:
 Programação do horário de funcionamento estações elevatórias e boosters de
água tratada levando-se em conta variações no consumo nos ciclos diários e
sazonais, fatores climáticos, capacidade de reservação de água e contratos
de fornecimento de energia elétrica;
 Definição de valores máximos e mínimos de operação de reservatórios;
21

 Definição de setpoints de pressão para o controle regulatório da pressão na


rede de distribuição, através de bombas acionadas por inversores de
frequência ou por válvulas redutoras de pressão;
 Monitorar tendências dos pontos críticos do sistema de distribuição e
reclamações de falta d’água dos consumidores e quando necessário,
executar manobras de contingência, acionar equipes de manutenção de rede,
pesquisa de vazamentos não visíveis entre outras ações.

A operação do sistema também deve garantir as pressões mínimas e máximas para


atendimento dos consumidores e volume suficiente para a proteção contra incêndio.
A norma técnica NBR-12218 Projeto de rede de distribuição de água para
abastecimento público, estabelece que nas redes que abastecem consumidores a
pressão estática (na ausência de fluxo) máxima deva ser de 50mca e a pressão
dinâmica mínima de 10mca, embora valores fora dessa faixa possam ser
considerados desde que justificados técnica e economicamente.

Ren et al. (2016); Falkenberg (2005) e Silva (2003) entre outros autores citam
diversas vantagens que um modelo de previsão com acurácia adequada pode
prover como apresentados nos dois parágrafos seguintes para os sistemas de
distribuição e produção de água, respectivamente.

No sistema de distribuição com a previsão de demanda é possível inferir sobre


possíveis perdas físicas de água; tem-se ganho na qualidade de água, através de
estoques adequados; pode-se otimizar o planejamento da operação de estações
elevatórias para horários de menor custo energético.

Em relação ao sistema de produção de água tratada facilita-se o planejamento da


operação diária da estação de tratamento de água; a estimativa das variáveis de
ajuste e vazão ótimas ao longo do dia, bem como níveis mínimos e máximos dos
reservatórios; a logística de produtos químicos e a determinação do melhor horário
para lavagens de filtros das Estações de Tratamento de Água.
22

Apesar das potenciais vantagens da utilização da previsão de demanda, segundo


Silva (2003) as Companhias de Saneamento ainda não consideram a previsão um
fator importante para o sistema operacional. As decisões na operação são tomadas
de imediato sem um prévio conhecimento das demandas futuras. Em alguns casos,
decisões sobre o aumento ou a redução da produção de água são tomadas de
forma intuitiva com base na avaliação do operador do sistema naquele instante, ou a
produção é realizada a uma taxa constante podendo acarretar no aumento de
perdas com extravasamento de reservatórios.

Observamos que a operação do sistema de distribuição de água depende muito do


conhecimento e experiência do operador. Verificamos também que o sistema de
abastecimento é monitorado e que tanto as ações do operador como os seus
reflexos no sistema são armazenados em banco de dados para futuras avaliações.

O que pretendemos é fazer a ligação entre o conhecimento/habilidade do operador


com o resultado das suas ações facilitando a tomada de decisão. As redes neurais
artificiais são uma ferramenta bastante utilizada nesse tipo de situação, pois podem
aprendem a partir de exemplos do ambiente. Portanto, no item 3 faremos uma breve
abordagem sobre esta ferramenta.

Para mostrar a importância e relevância do tema deste trabalho faremos a seguir


citações de alguns trabalhos relacionados à previsão de demanda, seja na predição
direta da variável de vazão ou indiretamente através do nível de reservatório ou
volume diário que utilizaram redes neurais artificiais. Alguns dos trabalhos ainda
demonstraram a utilização da previsão na otimização energética da programação de
bombeamento.

2.2 TRABALHOS DE PREVISÃO DE DEMANDA ANTERIORES UTILIZANDO


REDES NEURAIS ARTIFICIAIS

Trautwein Júnior (2004) estudou modelos de redes neurais do tipo MLP e rede
neural função de base radial aplicados ao problema de previsão de consumo de
água de curtíssimo prazo (frações de horas). Foram testados modelos considerando
23

como matriz de entrada somente os dados de consumo ou os dados de consumo


acrescidos de dados de temperatura, tempo, dia da semana, pressão recalque (para
áreas bombeadas) e nível (para áreas abastecidas por gravidade) na cidade de
Pinhais-PR. O autor concluiu que os modelos de redes neurais apresentaram
resultados bastante promissores.

Sjöbom Júnior (2005) propôs um modelo de otimização de bombeamento utilizando


a previsão de níveis de água das próximas 24h em reservatórios através de redes
neurais artificiais dentre elas uma do tipo MLP e algoritmos genéticos obtendo uma
redução dos custos de energia elétrica de 9% em um sistema de abastecimento de
Goiânia-GO.

Objetivando a obtenção de possíveis alternativas para a previsão do consumo nas


próximas 24 horas em bairros da cidade de Ponta Grossa, Paraná, Falkenberg
(2005) modelou redes neurais MLP utilizando como entrada da rede valores binárias
indicando o dia da semana e hora, o consumo da hora anterior e diferenças do
consumo com até duas defasagens a saída de rede era a previsão uma hora à
frente. Foram testadas as funções de ativação linear e tangente hiperbólica. Para a
previsão das próximas 24 horas utilizou-se a técnica multi-step, ou previsão com
realimentação. Os resultados foram comparados com a previsão por métodos
clássicos de análise de séries temporais como modelo de regressão linear múltipla e
modelos propostos por Box e Jenkins.

Oliveira (2015) desenvolveu um modelo preditivo de consumo (vazão de saída em


reservatório de água tratada) com redes neurais, cruzando informações de previsão
meteorológica com informações de padrões comportamentais para minimização dos
custos de energia em um problema de otimização da programação dos horários de
funcionamento de bombas, obtendo economia de 13% na simulação realizada.
Neste trabalho foram utilizadas redes feedforward sendo que dos modelos de redes
neurais desenvolvidos,o que apresentou melhor resultado utilizou todas as variáveis
disponíveis (hora, dia da semana, índice pluviométrico, radiância solar e temperatura
ambiente), embora modelos somente com a hora, dia da semana apresentaram
erros próximos.
24

Kofinas et al. (2016) estudaram a aplicação de redes neurais artificiais na predição


da demanda diária (volume) em uma ilha turística. Na construção do modelo da rede
neural foram utilizadas como variáveis da entrada, a temperatura média e máxima
diária; a precipitação pluviométrica; o fluxo de turistas e os níveis de vazamentos.
25

3 MATERIAS E MÉTODOS

3.1 REDES NEURAIS ARTIFICIAIS

Haykin (2001) define uma rede neural como um processador maciçamente


paralelamente distribuído constituído de unidade de processamento simples, que
têm a propensão natural para armazenar conhecimento experimental e torná-lo
disponível para o uso. Ela se assemelha ao cérebro em dois aspectos: O
conhecimento é adquirido a partir do ambiente por um processo de aprendizagem e
a conexão entre neurônios (pesos sinápticos) são utilizadas para armazenar o
conhecimento adquirido.

Segundo Fiorin et al. (2011) as redes neurais artificiais apresentam-se como


ferramentas estatísticas capazes de armazenar conhecimentos a partir de exemplos,
e vem sendo aplicadas em problemas de ajuste de funções, reconhecimento de
padrões, modelos de previsão e outras aplicações em diversas áreas do
conhecimento humano.A principal razão para sua ampla gama de aplicações reside
na capacidade de generalização, auto-organização,e processamento temporal que
possibilita a resolução de diferentes problemas e complexidades.

As redes neurais artificiais são constituídas por neurônios elementares sendo que os
modelos mais utilizados são baseados no trabalho pioneiro do psiquiatra e neuro-
anatomista Warren McCulloch e o jovem matemático Walter Pitts que em 1943
propuseram um modelo artificial de um neurônio biológico.

No modelo de McCulloch e Pitts o nódulo do neurônio recebe sinais de entrada cuja


somatória ponderada por pesos fixos são comparadas a um limiar de ativação da
saída do neurônio, quando a soma ponderada ultrapassa o limiar a saída do
neurônio recebe o valor “1”, caso contrário o valor “0”.

A Figura 5 ilustra um modelo generalizado de um neurônio artificial onde a soma das


entradas (𝑥 , 𝑥 , … , 𝑥 ) multiplicadas pelos respectivos pesos (𝑤 , 𝑤 , … , 𝑤 )
26

juntamente com o bias (𝑏 ) formam o potencial de ativação (𝑣 = ∑ (𝑥 . 𝑤 ))


passado como entrada para a função de ativação (𝜑).

O bias (𝑏 ) representado na Figura 5, por uma entrada de valor fixo igual a “1” e
peso ajustável (𝑤 ) é um elemento que serve para aumentar o grau de liberdade
dos ajustes dos pesos aumentando ou diminuindo o po
potencial
tencial de ativação.

A saída do neurônio é igual à resposta da função de ativação para o potencial de


ativação de entrada,, ou seja, 𝜑(𝑣 ) = 𝑦 .

Figura 5 – Modelo generalizado de um neurônio artificial.

Fonte: Adaptado de Haykin (2001).

As funções de ativação têm o propósito de restringir a amplitude de saída do


neurônio. De acordo com Haykin (2001) geralmente a função de ativação é
monótona não decrescente e apresenta algum tipo de não
não-linearidade
linearidade associado ao
efeito de saturação. A Figura 6 ilustra graficamente algumas funções comumente
utilizadas.
27

Figura 6 – Funções de ativação.

Fonte: Adaptado, Silva (2010).

As funções ilustradas na Figura 6 são expressas matematicamente pelas seguintes


equações:

 Função linear: 𝜑(𝑣 ) = 𝑣 (1)

1, 𝑣 ≥ 0 
 Função degrau: 𝜑(𝑣 ) = (2)
0, 𝑣 < 0

 Função sigmóide logística: 𝜑(𝑣 ) = . (3)

.
 Função sigmóide tangente hiperbólica: 𝜑(𝑣 ) = . (4)

O parâmetro 𝛽 é utilizado para modificar a inclinação no ponto de inflexão das


funções sigmóides, denominadas dessa forma devida ao formato de curva “S”. Esse
tipo de função é definida como crescente, contínua, diferenciável e tidas como tendo
um balanceamento adequado entre a região linear e não linear, assumindo um
28

intervalo de variação entre 0 a 1, como na função logística, ou -1 a 1, como na


função tangente hiperbólica.

As redes perceptron multicamadas (MLP), que serão apresentadas com maiores


detalhes no item 3.1.1.1, são formadas uma camada de entrada (sem
processamento), uma ou mais camadas intermediárias (ou ocultas) de neurônios
elementares e uma camada de saída. As funções sigmóides são as mais usadas
nas camadas ocultas sendo que a não linearidade apresentada por essas funções é
responsável pela extração de características não lineares em problemas como a
aproximação de função e a separação de classes não linearmente separáveis na
classificação de padrões.

Na camada de saída de redes MLP normalmente são utilizadas funções lineares em


problemas de aproximação de funções, enquanto que no reconhecimento de
padrões a função degrau.

3.1.1 Definição e topologias das redes neurais

A definição de uma rede neural consiste na determinação do número de camadas de


neurônios, número de neurônios em cada camada, tipo de função de ativação, tipo
de conexão entre os neurônios e o tipo de treinamento.

Quanto à interconexão dos neurônios, as redes neurais podem ser classificadas em


dois grandes grupos: Alimentadas adiante (feedforward) ou recorrentes.

As redes feedforward não possuem nenhum laço de realimentação, assim os sinais


são sempre propagados no sentido da camada de saída que depende unicamente
dos valores atuais da camada de entrada. As redes feedforward são utilizadas em
problemas estáticos, como exemplos, a aproximação de uma função polinomial ou o
reconhecimento de faces.

Nas redes recorrentes existem laços de realimentação de uma camada à frente para
camadas anteriores e atrasos temporais. As redes recorrentes são úteis para
29

resolver problemas dinâmicos como sistemas de controle e previsão de séries


temporais, pois possuem memória armazenando estados anteriores do sistema.

Estudaremos dois tipos particulares de rede a perceptron multicamadas (MLP) e a


rede não linear auto-alimentada com elemento exógeno (NARX) que são do tipo
feedforward e recorrente, respectivamente.

Quantidade de neurônios na camada de entrada e de saída

A determinação do número de neurônio na camada de entrada de uma rede neural


depende do problema envolvido e da experiência do projetista durante a seleção das
variáveis que devem ser analisadas. A utilização de variáveis de entrada não
correlacionadas com a saída pode conduzir a erros grandes ou a não convergência
do treinamento para um mínimo do erro.

O número de neurônios na camada de saída corresponde à quantidade de variáveis


que se deseja conhecer os valores.

Quantidade de camadas ocultas

Segundo Duda et al. (2001) tem-se observado que redes com três camadas (ou
seja, com uma camada oculta) são suficientes para aproximar praticamente qualquer
função.Somente em condições ou requerimentos especiais de problemas é
recomendada a utilização de mais de três camadas, tais como o reconhecimento um
caractere em uma imagem de forma invariante a operações como translação ou
rotação.

Quantidade de neurônios na camada oculta

A determinação do número de neurônios na camada oculta é empírica, não existe


nenhuma regra geral, porém existem alguns métodos heurísticos que podem ser
utilizados para o teste inicial como proposto por Hecth-Nielson (1989) e Baum e
Haussler (1988).
30

De acordo com Hecht-Nielsen (1989), qualquer função de n variáveis pode ser


representada por 2.n + 1 funções de uma variável. Dessa forma, o limite superior do
número de neurônios ocultos, N , para que a rede neural seja capaz de aproximar
qualquer função é dado por N ≤ 2. N + 1, onde N , é o número de neurônios na
camada de entrada.

Na métrica proposta por Baum e Haussler (1988) o número de neurônios ocultos


.
deve atender a desigualdade 𝑁 ≤ , onde:

- 𝑁 = número de neurônio na camada oculta;


- 𝑁 = número amostras do conjunto de treinamento;
- ε = erro desejado no treinamento;
- 𝑁 = número de neurônios na camada de entrada;
- 𝑁 = número de neurônios na camada de saída.

Um número excessivo de neurônios pode fazer com que a rede extraia


características de ruídos que podem estar presentes nos dados de treinamento
perdendo sua capacidade de generalização enquanto um número insuficiente pode
fazer com que o erro na fase de treinamento seja grande ou não convirja para um
mínimo.

Regras e técnicas para o projeto de redes neurais artificiais podem ser encontradas
em Haykin (2001).

Como um exemplo gráfico, na Figura 7, são mostradas redes feedforward para


classificação de duas classes, w1 e w2, em um espaço bidimensional onde as
fronteiras de decisão são representadas pelas áreas sombreadas. Enquanto uma
rede de duas camadas só pode representar hiperplanos e regiões convexas, uma
rede com três camadas e número adequado de neurônios na camada oculta pode
ajustar quaisquer fronteiras arbitrárias de decisão sem que elas necessitem ser
convexas ou simplesmente conectadas.
31

Figura 7 – Fronteiras de decisão para reconhecimento de classes possíveis


utilizando-se redes feedforward de duas e três camadas.

Fonte: Adaptado de Gonzalez e Woods (2010).

3.1.1.1 Perceptron de Multicamadas

O modelo do neurônio artificial de McCulloch e Pitts não incluía técnicas de


aprendizagem, mais tarde, em 1958, Frank Rosenblatt, apresentou o modelo de
rede perceptron de uma camada descrevendo sua estrutura e um algoritmo de
treinamento do modelo baseado na regra delta, demonstrando que os neurônios de
McCulloch e Pitts dotadas de sinapses ajustáveis conforme saídas desejáveis
poderiam ser treinadas para classificar padrões.

O perceptron só era capaz de resolver problemas linearmente separáveis. Essa


limitação foi ultrapassada com as redes perceptron multicamadas (MLP). Diferindo-
se do neurônio de McCulloch e Pitts que só produz saída binária os neurônios da
rede MLP podem ter como saída qualquer valor restringido pela função de ativação.

A rede MLP é organizada em camadas, a primeira e última são as camadas de


entrada e saída respectivamente, enquanto a(s) intermediárias denominadas de
camadas ocultas.
32

A camada de entrada não possui nenhum processamento, somente recebe os


estímulos do ambiente. Cada nódulo (neurônio) de uma camada é conectado a
todos os nódulos da camada seguinte através de pesos (conexões sinápticas).

Na entrada de cada nódulo das camadas ocultas, a soma ponderada das conexões
pelos pesos sinápticos é processada por uma função de ativação não linear que é
propagada para a camada adiante até a saída.

O arranjo da rede MLP é apresentado na Figura 8. A camada de entrada é


representada pelos quadrados onde são recebidos os sinais do ambiente sem
nenhum processamento, os nódulos em círculos representam os neurônios
elementares nas camadas ocultas e de saída, as setas indicam os pesos das
conexões sinápticas e sentido de propagação dos sinais.

Figura 8 – Rede Perceptron Multicamadas.

Fonte: Adaptado de Padilha et al. (2017).

O ajuste dos pesos na rede MLP é realizado por um treinamento supervisionado, o


algoritmo de retropropagação do erro (error-backpropagation). Os pesos são
ajustados de forma a minimizar uma função objetivo, normalmente o erro médio
quadrático (MSE).O algoritmo de retropropagação do erro requer que a função de
ativação seja contínua e diferenciável, esses requisitos são satisfeitos, por exemplo,
pelas funções sigmóides.
33

Uma solução para capacitar a rede MLP a processar padrões dinâmicos, segundo
Tampelini (2008) é modificar seu processo de treinamento. Um artifício utilizado para
esta adequação envolve o uso de janelas de tempo, em que a entrada da rede utiliza
trechos dos dados temporais, fixando um padrão estático, permitindo a estas redes o
processamento temporal.

A Figura 9 mostra uma janela na série temporal com cinco amostras consecutivas
que são utilizadas como entrada da rede MLP que possui como saída a previsão um
passo à frente da série temporal.

Figura 9 – Janelamento aplicado a uma série temporal com propósito de capacitar


uma rede MLP a processar sistema dinâmico.

Fonte: Tampelini (2008).

3.1.1.2 Redes recorrentes

A rede neural Não Linear Autorregressiva com Elemento Exógeno (NARX) é uma
rede recorrente onde o conjunto de variáveis de entradas é formado por variáveis
exógenas ao sistema, podendo também conter amostras defasadas dessas, e
valores defasados das saídas providos por laços de realimentação (feedback).
34

A Figura 10 ilustra um exemplo de rede neural do tipo NARX, onde:


onde
 u,, representa a variável exógena;
 y, a saída da rede
rede;
 z-1, o operador de atraso unitário
unitário;
 k,, índice da amostra no tempo discreto
discreto;
 b, entrada com valor fixo unitário aplicado aos pesos correspondentes aos
bias.

A fila formada pelas entradas u(k) e y(k) e suas amostras atrasadas


atras são utilizadas
para previsão uma passo a frente da saída, y(k+1).

Figura 10 – Rede Não Linear Autorr


Autorregressiva
egressiva com Elemento Exógeno (NARX).

Fonte: Adaptado de Khan et al. (2015).

Durante o processo de treinamento de uma rede NARX de acordo com Velmir et al.
(2012) e Khan et al. (2015) o laço de realimentação é aberto (modo série-paralelo),
série
pois a rede resultante será do tipo feedforward, assim a entrada tem maior acurácia
já que se trata do valor real ao invés do previsto e pode
pode-se
se utilizar um algoritmo de
treinamento da uma rede feedforward geralmente obtendo-se
se resultados mais
35

rápidos e de melhor desempenho quando comparando aos obtidos no treinamento


com o laço de realimentação fechado (modo paralelo). Após o treinamento, a rede é
convertida para o modo paralelo para previsão de valores à frente. Os modos
paralelo e série-paralelo da rede NARX são mostrados na
Figura 11.

Figura 11 – Rede NARX em modo paralelo e série-paralelo.

Fonte: Adaptado Khan et al. (2015).

O Apêndice A contém uma introdução as técnicas de treinamento de redes neurais


artificiais. No capítulo a seguir será apresentado o setor de abastecimento estudado
e a metodologia empregada neste trabalho.
36

4 ESTUDO DE CASO E METODOLOGIA

4.1 CARACTERIZAÇÃO DO SISTEMA ESTUDADO

O diagrama unifilar hidráulico do sistema estudado é apresentado na Figura 12,


especificamente o “Setor A” que compreende uma população de aproximadamente
35 mil habitantes segundo dados do IBGE.

Figura 12 – Diagrama unifilar dos principais elementos do setor de abastecimento


estudado.

Fonte: Elaborado pelo autor, 2017.

Foi selecionado um setor com tamanho grande o suficiente para que um consumidor
individualmente não pudesse
udesse distorcer o perfil de vazão em relação à demanda
média dos consumidores; caso contrário mudanças aleatórias de apenas um
consumidor poderiam invalidar o resultado da rede neural
neural; porém pequeno o
suficiente para que a demanda dos consumidores consigam modelar um perfil
característico
terístico na pressão do ponto crítico.
37

O sistema compreende dois conjuntos motores-bomba em paralelo com apenas um


operando por vez. A curva característica da altura manométrica versus vazão da
bomba nº 2 oferece maior capacidade de vazão dado uma mesma altura, do que a
bomba nº 1.

O sistema possui um medidor de vazão (FT-1) na tubulação de recalque para a


distribuição e possui o ponto crítico (PT-3), localizado no “Bairro B” que é monitorado
através de telemetria.

A válvula borboleta manual n°2 (VBM-2) é responsável pela separação entre o setor
estudado, “Setor A”, e o “Setor B”, e normalmente opera totalmente fechada. Essa
válvula só é aberta como medida de contingência operacional ou necessidade de
reforço no abastecimento de um setor para outro e vice-versa.

A VBM-1 é utilizada para restrição do volume disponibilizado (VD) e controle da


pressão no ponto crítico de acordo com as variações da demanda.

O plano operacional do setor e metas do Volume Distribuído é elaborado por


especialistas utilizando ferramentas de qualidade como o PDCA (Plan, Do, Check
and Act), Relatório de 3 Gerações, controle estatístico de processos, históricos de
dados do sistema SCADA, sistema de gestão informatizada de atendimento ao
consumidor e manutenção de redes de distribuição, porém,pelo menos em nível de
rotina, não se utiliza nenhum simulador hidráulico como o EPANET1 para a tomada
de decisão.

No período de coleta dos dados, aproximadamente quatro meses, que foram


utilizados para treinamento e testes da rede neural as metas operacionais foram
definidas pela operação a partir das observações históricas com base nos dados de
VD, testes operacionais e conhecimento de especialistas com o intuito de redução
de VD motivado pela crise hídrica e operação mais eficiente.

1
EPANET é um simulador hidráulico e de qualidade de água desenvolvido pela Agência de Proteção
Ambiental dos Estados Unidos (EPA).
38

Durante um mês houve racionamento e o bombeamento era desligado durante 3


horas no período da madrugada em dias alternados.

Como referência de normalidade do abastecimento a pressão no Ponto Crítico


deveria ser mantida com o mínimo de 16,7% do valor máximo nos horários de pico
da demanda aproximadamente entre 11:00h às 14:00h e de 18:00h às 20:00h.

Na maior parte do período a VBM-1 foi deixada em 65% da posição máxima de


abertura e preferencialmente deveria ser utilizada a bomba nº 2.

A meta da vazão média diária durante um mês foi de 64,7% e de 70,6% no restante.

O plano de operação era condicionado ao monitoramento de falta d’água, sendo que


o Centro de Controle Operacional pode alterar os horários de funcionamento em
função da demanda, falta d’água e demais necessidades operacionais.

As ocorrências e não conformidades diárias relacionadas à execução do plano


operacional são reportadas pelo Centro de Controle Operacional e o plano ajustado
no dia subsequente à ocorrência se necessário.

4.2 COLETA E ANÁLISE DOS DADOS

O sistema SCADA existente realiza a varredura cíclica do sistema estudado a uma


taxa média de 15 segundos, sendo que as variáveis de interesse histórico são
armazenadas em um banco de dados.

No processo de aquisição e registros dos dados podem ocorrer erros como: Ruídos
e descalibração dos instrumentos de medição; falta de energia elétrica; falha no
controlador lógico programável; falha no servidor de dados; falha comunicação
sistema de telemetria; interrupção na aquisição para manutenção preventiva dos
instrumentos entre outros.
39

Também ocorrerem distorções nos perfis normais de vazão e pressão por problemas
inerentes do processo de distribuição de água tratada como: Vazamento na rede;
fechamento de válvulas para reparo interligações ou expansões de redes; manobras
operacionais de contingência; parada do conjunto motor-bomba por problema
eletromecânica ou no fornecimento de energia de energia; paradas para
manutenção preventiva.

Os dados corrompidos, seja por falha no processo de aquisição ou devido a


condições aleatórias e atípicas do sistema de distribuição, precisaram ser
expurgados do conjunto de treinamento e validação da rede neural, pois poderiam
invalidar a previsão de curto prazo pretendida.

O trabalho de pré-processamento dos dados recuperados do banco de dados foi


árduo e realizado manualmente, pois os dados inválidos se apresentavam de
diversas formas: Como valores invariantes por tempo prolongado, covariâncias
irreais entre os valores de vazão e pressão para uma condição normal de
abastecimento, taxa de variações de vazão e pressão muito elevadas ou mesmo
fisicamente impossíveis.

A Figura 13 apresenta um período de aproximadamente uma semana dos valores


normalizados no intervalo de 0 a 1 dos valores de vazão (FT-1) e pressão no ponto
crítico (PT-3).
40

Figura 13 – Perfis de vazão e pressão do ponto crítico normalizados sob condições


normais de operação do setor de abastecimento estudado.

Fonte: Elaborado pelo autor, 2017.

A influência da VBM-1 no sistema é ilustrada na Figura 14, no momento indicado


pelo círculo vermelho pontilhado, a VBM-1 tem seu percentual de abertura alterado
de 33% para 66%, percebe-se a queda brusca de vazão e no dia seguinte a média
da pressão no ponto crítico é reduzida.

Figura 15 – Manobra de reforço do “Setor A”


Figura 14 – Influência da VBM-1 no sistema.
para o “Setor B”.

Fonte: Elaborado pelo autor, 2017. Fonte: Elaborado pelo autor, 2017.

A Figura 15, Figura 16 e a Figura 17 ilustram exemplos de períodos que foram


expurgados do conjunto de treinamento seja devido à condição atípica do
abastecimento ou por falha no sistema de aquisição de dados.
41

No período representado pela Figura 15 foi aberta totalmente a VBM-1 e


parcialmente a VBM-2 visando o reforço do abastecimento no “Setor B” através do
“Setor A” devido ao alto consumo no primeiro. Já na Figura 16 o “Setor A” é que
estava sendo totalmente abastecido pelo “Setor B”, evidenciado pela ausência de
vazão, devido a serviços de manutenção programada nas bombas.

A Figura 17 mostra um período onde ocorreu falha no sistema de telemetria do


ponto crítico observável pelo valor constante por aproximadamente 20 horas.

Figura 16 – Manobra operacional onde o Figura 17 – Falha no sistema de aquisição


Setor B estava abastecendo o Setor A. de dados do PT-3.

Fonte: Elaborado pelo autor, 2017. Fonte: Elaborado pelo autor, 2017.

A influência das variáveis cronológicas (hora, dia da semana e mês) pode ser
observada nas Figura 18 e Figura 19, onde se percebe claramente um ciclo diário e
escalonamentos de acordo com o dia da semana nos valores de pressão e vazão.

No período considerado no estudo de caso percebe-se uma tendência de


crescimento do consumo entre os meses avaliados, mas para avaliação clara do
comportamento sazonal do sistema seria necessário recorrer a um período de
alguns anos, porém devido ao esforço necessário no pré-processamento de dados o
trabalho foi limitado somente ao período de quatro meses.

As relações dos valores de vazão e pressão em função da bomba em operação e do


percentual de abertura da VBM-1 são mostradas na Figura 20 e Figura 21.
42

Figura 18 – Influência do dia da semana nos Figura 19 – Influência do mês nos valores
valores médios de vazão e pressão. médios de vazão e pressão.

Obs.: Só foram mostrados do gráfico três dias da Obs.: Os índices 12, 1, 2 e 3 no eixo das
semana para facilitar a visualização. abscissas indicam o mês avaliado.
Fonte: Elaborado pelo autor, 2017. Fonte: Elaborado pelo autor, 2017.

Figura 20 – Valores médios de vazão por Figura 21 – Valores médios de vazão e


bomba. pressão por percentual de abertura da VBM-
1.

Fonte: Elaborado pelo autor, 2017. Obs.: Os valores 0,4 e 0,67 na legenda indicam a
abertura da válvula para o valor normalizado da 0
a 1.
Fonte: Elaborado pelo autor, 2017.

A importância do pré-processamento dos dados pode ser visualizada comparando-


se o antes e o depois das funções de autocorrelação (FAC), função de
autocorrelação parcial (FACP) e covariância cruzada entre as variáveis de vazão e
pressão mostradas nas Figura 22, Figura 23 e Figura 24.

Em uma série temporal a autocorrelação é uma medida de associação entre os


valores atuais e anteriores e indicam quais valores anteriores da série são mais úteis
para prever os valores futuros.

O coeficiente de autocorrelação amostral, 𝑟 , situa-se na faixa de -1 a 1 e é calculado


conforme a equação (11).
43

∑ [( ̅ ).( ̅ )]
𝑟 = ∑ ̅ )]
(5)
([

Onde, 𝐿, é o atraso, 𝑘, é a quantidade de amostras entre as quais se deseja verificar


a existência de autocorrelação e 𝑥̅ é a média do conjunto de amostras.

O valor absoluto de 𝑟 é uma medida da força da associação, com valores absolutos


maiores indicando relacionamentos mais fortes. Um valor positivo indica que
grandes valores atuais correspondem aos valores grandes no atraso especificado, e
um valor negativo indica que grandes valores atuais correspondem aos valores
pequenos no atraso especificado.

Um teste da significância da autocorrelação pode ser realizado calculando-se o


valor, 𝑒 = 2⁄√𝑘, onde o módulo de 𝑟 for maior do que 𝑒, então a autocorrelação é
significativa.

Uma forma gráfica de se visualizar a autocorrelação é através da função de


autocorrelação que traça um gráfico dos valores de 𝑟 para diversos valores de
atraso 𝐿.

De acordo com Gouveia (2011) o fenômeno de autocorrelação é muito comum


especialmente na indústria de processos contínuos como é o caso de produção de
água potável e esgoto tratado e que se observando diversos processos
autocorrelacionados, onde a autocorrelação é presente e inerente do processo, a
função de autocorrelação assume a forma de uma senóide amortecida.

Um exemplo prático de uma série temporal com forte autocorrelação é uma série
que represente o nível de um reservatório de água tratada.

Em um processo naturalmente autocorrelacionado é de se esperar que o valor da


amostra no instante (𝑡), dependa do valor no instante (𝑡 − 1), que por sua vez
depende do valor no instante (𝑡 − 2), e assim sucessivamente. Através da Função
de Autocorrelação Parcial é possível avaliar a dependência de uma amostra no
44

instante (𝑡) e uma amostra atrasada em um instante (𝑡 − 𝐿) qualquer da série


removendo as interdependências de amostras com atrasos intermediários.

A covariância cruzada da sequência de duas variáveis discretas no tempo, “x” e


“y”mede a similaridade entre “x” e amostras “y” em função de atrasos.

Nos gráficos da Figura 22 e Figura 23, as linhas verticais em vermelho mostram os


valores da FAC e FACP, respectivamente, e as linhas horizontais na cor azul
delimitam o intervalo de confiança, 𝑒 = ±2⁄√𝑘, abaixo do qual as funções podem ser
consideradas não significantes.

A FAC da variável vazão após o pré-processamento dos dados, Figura 22(b), possui
a forma citado por Gouveia (2011) para um processo contínuo, os picos a cada 24
atrasos revelam os ciclos diários no perfil de vazão. A FAC de sinais periódicos
apresenta a mesma periodicidade, porém antes da filtragem dos dados, Figura
22(a), não era possível observar a forma periódica da FAC.

Figura 22 – Função de autocorrelação da vazão antes e após o pré-processamento


dos dados.
Função de autocorrelação da vazão antes da filtragem dos dados Função de Autocorrelação dos Valores de Vazão Após Filtragem
1 1

0.8
0.8

0.6
0.6

0.4
0.4
0.2

0.2
0

0
-0.2

-0.2 -0.4
0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80
Atrasos (passos de uma hora) Atrasos (passos de 1 hora)

(a) (b)
Fonte : Elaborado pelo autor, 2017.

Antes do pré-processamento dos dados a FACP apresentava um decaimento rápido


após o primeiro atraso com poucos valores acima do intervalo de confiança, Figura
45

23(a), após o pré-processamento dos dados, Figura 23(b), observam-se correlações


significativas com até 28 atrasos.

Figura 23 – Função de Auto-Correlação Parcial da vazão antes e após o pré-


processamento dos dados.
Sample Partial Autocorrelation Function Sample Partial Autocorrelation Function
1 1

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0 0

-0.2 -0.2
0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80
Lag Lag

(a) (b)
Fonte : Elaborado pelo autor, 2017.

Observa-se na Figura 24 que antes do pré-processamento dos dados a covariância


cruzada da vazão e pressão para atraso igual a 0 possuía valor inferior a -0,1. Após
o pré-processamento revelou-se a covariância maior do que -0,4 para atraso 0,
aumentando-se também as covariâncias em relação aos atrasos ±12.

Figura 24 – Covariância cruzada entre vazão e pressão antes e após o pré-processamento


dos dados.
Covariância cruzada entre vazão e pressão antes da filtragem Covariância cruzada entre vazão e pressão após a filtragem
0.3 0.6

0.2 0.4

0.1 0.2

0 0

-0.1 -0.2

-0.2 -0.4

-0.3 -0.6
-25 -20 -15 -10 -5 0 5 10 15 20 25 -25 -20 -15 -10 -5 0 5 10 15 20 25
Atrasos (passos de 1 hora) Atrasos (passos de 1 hora)

(a) (b)
Elaborado pelo autor, 2017.
46

As observações nos perfis de vazão e pressão ao longo do tempo, as características


estatísticas dessas variáveis e a influência dos elementos do sistema de distribuição
sobre as mesmas foram a base para a escolha das variáveis utilizadas na camada
de entrada das redes neurais definidas no item seguinte.

4.3 DEFINIÇÃO E TREINAMENTO DAS REDES NEURAIS UTILIZADAS NO


ESTUDO DE CASO

4.3.1 Definição das redes neurais

A solução proposta é apresentada na Figura 25.

Figura 25 – Solução proposta para previsão um 1 hora à frente.

Hora atual
Dia da semana
Vazão:
 23 h atrás
 22 h atrás
 ... Vazão:

 1 hora atrás Rede Neural  Daqui a 1 h

 Agora Artificial Pressão no ponto crítico:

Pressão no ponto crítico:  Daqui a 1 h


 23 h atrás
 22 h atrás
 ...
 1 hora atrás
 Agora

Fonte: Elaborado pelo autor, 2017.

A Figura 25 ilustra que a previsão da vazão e pressão do ponto crítico para a


próxima hora é baseada em valores medidos das pressões e vazões das últimas 24
horas, além do dia da semana e da hora atual. O treinamento da rede é realizado
apresentando-se valores históricos (já coletados e armazenados) à rede. Os dados
47

são organizados em blocos de 25 pressões e 25 vazões consecutivas (24 para


entrada e uma para a saída). Por exemplo:
 Entradas:
o Hora atual: 24 h;
o Dia da semana: segunda-feira;
o Vazão no ponto crítico: 24 amostras coletadas em segundas feiras
entre 1 h e 24 h.
o Pressão no ponto crítico: 24 amostras coletadas em segundas feiras
entre 1 h e 24 h.
 Saídas:
o Vazão no ponto crítico: a 1 h da terça-feira.
o Pressão no ponto crítico: a 1 h da terça-feira.

O objetivo é fazer com que a rede aprenda a prever o valor de uma variável daqui a
uma hora baseada em valores conhecidos das últimas 24 horas.

A previsão para as próximas 24 horas é feita interativamente substituindo valores


medidos por valores simulados, como ilustra a Figura 26.

Figura 26 – Solução proposta para previsão um 24 hora à frente.


Hora atual
Dia da semana
Vazão:
 1 h atrás
 Agora
 ... Vazão:

 Previsto para 21 h Rede Neural  Daqui a 23 h

 Previsto para 22 h Artificial Pressão no ponto crítico:

Pressão no ponto crítico:  Daqui a 23 h


 1 hora atrás
 Agora
 ...
 Previsto para 21 h
 Previsto para 22 h

Fonte: Elaborado pelo autor, 2017.


48

A seleção de variáveis utilizadas foi determinada observando-se os perfis de vazão e


pressão, a autocorrelação e a covariância cruzada dessas variáveis.

Na revisão bibliográfica verificou-se que algumas variáveis ambientais,


principalmente a temperatura possuem forte correlação com o consumo, porém
como não existia medição em tempo real e registro no banco de dados do sistema
SCADA, teríamos que recorrer a banco de dados externos, dessa forma essa opção
foi descartada.

Como a rede neural deveria fazer a previsão futura a partir de qualquer instante, a
hora e dia da semana foram selecionadas como variáveis de entrada diante do ciclo
diário e escalonamento com os dias da semana observados na Figura 18.

Para não aumentar demasiadamente o número de neurônios da camada de entrada


com entradas binárias que representassem cada hora e dia da semana, como
realizado em algumas referências bibliográficas, foram utilizados valores analógicos
sendo atribuído os valores de 1 a 7 para o dia da semana.

Percebe-se através da FAC, Figura 22, que os valores atuais da vazão e pressão
dependem de seus próprios valores em instantes anteriores. No gráfico da
covariância cruzada, Figura 24, observa-se que essas variáveis possuem forte
correlação negativa no mesmo instante amostral e correlação positiva em instantes
defasados e adiantados em 12 horas.

A idéia foi implementada através de duas topologias de rede, uma MLP e outra
NARX, nesta última ainda foram acrescentadas como entradas os estados de ligado
ou desligado das bombas e o percentual de abertura da VBM-1 com intuito de
verificar se a rede neural também poderia ser utilizada como um simulador frente às
possíveis manobras operacionais.

Todos as variáveis foram normalizadas para a faixa de 0 a 1 utilizando-se como


base o valor máximo esperado de cada variável. A normalização é feita para que as
49

diferentes amplitudes dos sinais de entrada não dificultem o processo de


treinamento.

As redes neurais recorrentes possuem estados de memória que são responsáveis


pelo aprendizado da dinâmica do sistema, dessa forma a sequência com que os
dados são apresentados no treinamento importa. Com a perda da continuidade
temporal da série de dados devido aos períodos expurgados como visto no item 4.2,
para a rede NARX foi conseguido apenas 1915 amostras no conjunto de
treinamento. Já na rede MLP foi obtido um conjunto maior treinamento, 2175, devido
à organização dos dados explicada no item 4.3.4.

4.3.2 Ferramenta utilizada

Para desenvolvimento das redes neurais foi utilizado o software MATLAB2,


especificamente o toolbox de redes neurais e a interface gráfica iniciada pelo
comando nnstart.

4.3.3 Critérios de avaliação de desempenho

Na fase de treinamento das redes neurais foram utilizados o erro médio quadrático
(Mean Square Error - MSE) e o coeficiente de correlação linear (R2) entre a saída da
rede neural e o valor real como critério de desempenho.

∑ | |
𝑀𝑆𝐸 = (6)

Onde, 𝑘, é o número de amostras, 𝑦 𝑒 𝑦 , o valor previsto pela rede neural e o valor


real, respectivamente, no instante 𝑡.

Ressalta-se que a saída da rede neural é a de apenas um passo a frente das séries
temporais que representam a vazão e pressão do ponto crítico. Assim, o MSE e R2
computados no treinamento dizem respeito apenas à previsão de 1 (uma) hora.

2
O software MATLAB, produzido pela MathWorks, é um ambiente interativo e utiliza uma linguagem de alto nível baseada em
matrizes sendo utilizado mundialmente por milhões de engenheiros e cientistas
50

Como medidas de desempenho da rede neural treinada para previsão de 24 horas à


frente, foram adotados o erro médio absoluto em percentual (Mean Absolute
Percentual Error - MAPE); e o erro no total do Volume Disponibilizado nas 24 horas
de previsão considerando que existe uma meta diária de VD estipulada pela
operação.

.∑
𝑀𝐴𝑃𝐸 = (7)

Para efeito de comparação, os volumes foram calculados com os valores


discretizados de hora em hora da vazão real e da previsão utilizando-se a função
trapz do MATLAB que aproxima a integral pelo método trapezoidal. Caso tivéssemos
tomado o valor do volume disponibilizado diretamente pelo medidor de vazão o erro
seria diferente, pois o intervalo de integração do equipamento é muito menor.

4.3.4 Treinamento da rede neural MLP

A rede MLP definida é ilustrada na apresentada na Figura 27.

Figura 27 – Rede MLP definida para previsão 1 hora à frente.


Hora atual

Dia da Semana
Q(t+1)
...

Q(t-23)
...

Q(t)
...

P(t+1)
P(t-23)
...

P(t)

Fonte: Elaborado pelo autor, 2017.


51

O vetor de entrada é formado pela hora no instante inicial t da previsão, dia da


semana, uma fila com as 24 amostras vazão e uma fila de 24 amostras de pressão
enquanto o vetor de saída com os valores mais recentes das 25 amostras.

Os dados disponíveis para treinamento da rede MLP foram preparados de forma que
cada sequência com no mínimo 25 amostras de vazão e pressão contínuas e
consecutivas foram organizadas como apresentado no Quadro 2Erro! Fonte de
referência não encontrada., onde Q e P representam os valores de vazão e
pressão respectivamente.

Quadro 2 – Exemplo de organização dos dados para treinamento da rede MLP


Entradas Saídas da rede (target)

Hora Dia Vazão Pressão Vazão Pressão

22(t-2) 3(t-1) {Q(t-25),...,Q(t-2)} {P(t-25),...,P(t-2)} Q(t-1) Q(t-1)

23(t-1) 3(t-1) {Q(t-24),...,Q(t-1)} {P(t-24),...,P(t-1)} Q(t) Q(t)

0(t) 4(t) {Q(t-23),...,Q(t)} {P(t-23),...,P(t)} Q(t+1) P(t+1)


Fonte: Elaborado pelo autor, 2017.

Na organização da Erro! Fonte de referência não encontrada., foram removidas


do conjunto de treinamento as linhas onde a amostra mais recente da vazão
utilizada como variável de entrada ou como variável de saída equivaliam ao valor
zero, pois neste caso implicaria que alguma bomba estiva ligada e seria desligada
num instante à frente, ou vice-versa, e como estes eventos são aleatórios
obviamente a rede neural não poderia aprender.

Foi utilizada somente uma camada oculta com 15 neurônios. A topologia da rede
criada no MATLAB é mostrada na Figura 28.

Os parâmetros de treinamento foram:


 N° total de amostras: 2175.
 Divisão das amostras nos subconjuntos de treinamento/validação/teste: 70% /
15% / 15% (divisão randômica).
 Algoritmo de treinamento: Gradiente conjugado escalonado.
 Critério de desempenho do treinamento: Erro médio quadrático.
52

 Condições de parada: Gradiente do erro menor do que 1x10-6 ou máximos de


6 falhas teste de validação cruzado do modelo ou máximo de 1000 épocas de
treinamento.
Figura 28 – Rede MLP modelada

Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

A Figura 29(a) mostra o histograma de erro (valor real menos saída da rede) obtido
no treinamento e a Figura 29(b) o coeficiente de correlação linear entre o valor real e
a saída da rede nos subconjuntos de treinamento, validação e teste.

Figura 29 – Resultado do treinamento da rede MLP.

(a) (b)
Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

Em todos os conjuntos a correlação linear foi maior do que 0,99 mostrando que a
rede conseguiu extrair as características do sistema, mas manteve a capacidade de
generalização.
53

A resposta da rede para previsão 1 passo a frente do período de teste é mostrada


na Figura 30 (a) e Figura 30 (b) para as variáveis de vazão e pressão,
respectivamente. No gráfico superior a previsão (saída da rede) é mostrada na cor
vermelha enquanto o valor real na cor preta. No gráfico inferior é mostrado o erro
absoluto percentual de cada amostra, na cor verde, e a média móvel do erro com 24
amostras na cor vermelha.

Figura 30 – Teste da rede MLP 1 passo a frente para o período de teste.

(a) – Perfil de vazão.

(b) – Perfil de pressão

Fonte: Elaborado pelo autor utilizando MATLAB, 2017


54

4.3.5 Treinamento da rede neural NARX

A rede NARX definida é ilustrada na apresentada na Figura 31.

Figura 31 – Rede NARX definida para previsão 1 hora a frente.


Estado Bomba 1

Estado Bomba 2

Percentual abertura VBM-1

Hora atual

Dia da Semana
Q(t+1)
...
b

Q(t-23)
...

z-1
Q(t)

P(t+1)
...

z-1
P(t-23)
...

z-1
P(t)

z-1

Fonte: Elaborado pelo autor, 2017.

Onde o vetor de entradas exógenas (𝑥 ) é formado pelas variáveis: Dia da semana;


Hora; Percentual de abertura da VBM-1; Estado da Bomba n° 1 e Estado da Bomba
n° 2. A saída da rede (𝑦 ) é o vetor formado pelas variáveis de vazão e pressão. O
laço de realimentação possui 24 operadores de atraso unitário e os números de
camadas e neurônios ocultos foram os mesmos utilizados na rede MLP.

Os dados para treinamento da rede NARX foram organizados conforme exemplo do


Quadro 3. A definição do estado inicial é realizada no MATLAB pela função
preparets, deslocando e dividindo os vetores de entrada e saída conforme a
quantidade de atrasos.
55

Quadro 3 – Exemplo de organização dos dados para treinamento da rede NARX


Saídas da rede
Entradas
(targets)
Percentual de
Estado Estado
Hora Dia abertura da Vazão Pressão
Bomba 1 Bomba 2
VBM-1
22(t-2) 3(t-1) 0(t-2) 1(t-2) 0,67 Q(t-1) Q(t-1)
23(t-1) 3(t-1) 0(t-1) 1(t-1) 0,67 Q(t) Q(t)
0(t) 4(t) 0(t) 1(t) 0,67 Q(t+1) P(t+1)
Fonte: Elaborado pelo autor, 2017.

Os parâmetros de treinamento foram:


 N° total de amostras: 1915.
 Divisão das amostras nos subconjuntos de treinamento/validação/teste: 80% /
10% / 10% (blocos contínuos).
 Algoritmo de treinamento: Gradiente conjugado escalonado.
 Critério de desempenho do treinamento: Erro médio quadrático.
 Condições de parada: Gradiente do erro menor do que 1x10-6 ou máximos de
6 falhas teste de validação cruzado do modelo ou máximo de 1000 épocas de
treinamento.

A rede NARX foi treinada no modo série-paralelo como mostrado na Figura 32(a),
após o treinamento a rede é convertida para o modo paralelo, Figura 32(b), através
da função close loop do MATLAB habilitando-a a fazer previsões a partir de novo
conjunto de entradas exógenas e entradas recursivas das variáveis endógenas.

Através da aplicação da função removedelay do MATLAB na rede convertida para o


modo paralelo é possível remover um atraso das entradas exógenas, Figura 32(c). A
saída de ambas as redes serão iguais, porém a última será adiantada um passo a
frente.
56

Figura 32 – Rede NARX modelada.

(a)

(b)

(c)

Notas: (a) Rede NARX em modo série-paralelo utilizado na


fase de treinamento; (b) Rede NARX em modo paralelo para
previsão no instante t; (b) Rede NARX após a remoção de
um atraso da entrada para previsão no instante t+1.
Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

Observando o histograma de erro Figura 33(a) percebe-se que o erro na rede NARX
foi menor e teve menor dispersão quando comparado a rede MLP possivelmente
devido à utilização do percentual de abertura da VBM-1 e estado das bombas como
variáveis de entrada.
57

Figura 33 – Treinamento da rede NARX.

(a) (b)
Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

Nos gráficos de correlações lineares apresentados na Figura 33(b) observa-se que


onde o valor real (target) correspondia a zero, os pontos no subconjunto de
treinamento e teste ficaram muito distantes da reta de correlação linear perfeita. Isto
é possível de ser explicado, pois se tratam de momentos em que ambas as bombas
estavam paradas por motivos aleatórios não sendo possível que a rede neural
extraia tais características.
58

A Figura 34 mostra a resposta da rede NARX para o valor de vazão um passo a


frente.

Figura 34 – Detalhe da resposta do treinamento da rede NARX treinada.

Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

O ponto de maior erro ocorreu em um momento onde ambas as bombas estavam


desligadas, perceptível pelo valor real de vazão (target) igual a zero.
59

5 RESULTADOS PARA PREVISÃO 24 HORAS A FRENTE E DISCUÇÕES

Para avaliação de desempenho da previsão 24 horas à frente a cada posto horário


dos valores de vazão e pressão do ponto crítico foi utilizado o período mostrado na
Figura 35 como conjunto de teste.

Figura 35 – Período utilizado para teste e avaliação de desempenho da previsão 24


horas à frente.

Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

Uma janela de 24 amostras das variáveis foi sendo deslocada de passo em passo
até o fim do período e passada como nova entrada da rede MLP ou condição inicial
da rede NARX.

Na rede MLP o conjunto dos sinais de entrada possui dimensão 50x1 representando
uma amostra de 50 variáveis e o conjunto de saída dimensão de 2x1. Para realizar a
previsão de 24 horas a própria saída da rede neural é utilizada para formação de um
novo conjunto de entrada substituindo-se os valores mais antigos de vazão e
pressão através de um algoritmo recursivo externo. A cada iteração, as saídas da
rede são concatenadas formando-se ao final uma matriz de dimensões 2x24 que
representa 24 amostras de duas variáveis, ou seja, a previsão de 24 horas do valor
de vazão e pressão no ponto crítico.
60

Já na rede NARX em modo paralelo criada no MATLAB a recorrência é intrínseca,


assim se apresentado o estado inicial dos valores de vazão e pressão e um conjunto
de entradas de dimensão 5x24, representando 24 amostras de 5 variáveis a saída
final da rede neural será uma matriz de dimensão 2x24 contendo a previsão de 24
horas.
É possível fazer previsões em horizontes maiores do que 24 horas, porém o erro
tende a crescer, pois é acumulado a cada iteração. Os resultados para a previsão 24
horas da rede MLP e NARX são apresentados a seguir.

5.1 RESULTADOS DA REDE NEURAL MLP

Os resultados da rede MLP estão resumidos na Tabela 1. Em média o MAPE da


vazão das previsões de 24 horas resulta em 2,92%, enquanto que para a pressão no
ponto crítico o valor de 10,61%. A média do erro do volume total disponibilizado é de
-1,69%. Os desvios padrões em relação a estes valores médios são pequenos.

Tabela 1 – Resumo resultados da previsão 24 horas a frente da rede MLP


Pressão no Ponto Volume
Vazão (FT-1)
Crítico (PT-3) Disponibilizado

Média de erro - - -1.69%

Média do MAPE 2.92% 10.61% -

Desvio padrão da média


1.43% 4.42% 2.12%
de erro ou MAPE

Fonte: Elaborado pelo autor, 2017.

O desempenho da rede neural MLP para previsão de 24 horas é mostrado


graficamente através de alguns trechos apresentados na Figura 36. Onde as linhas
na cor preta e vermelha representam o valor real e previsto, respectivamente. O erro
absoluto percentual de cada amostra é mostrado pelas linhas verticais na cor verde,
também se calcula o MAPE e o erro do Volume Total Disponibilizado no período de
24 horas. Os índices alfanuméricos dos gráficos indicam os perfis de vazão e
pressão que correspondentes ao mesmo período.
61

Figura 36 – Resposta da rede MLP para previsão de 24 horas.

(a1) Perfil de vazão (a2) Perfil de pressão

Resposta da rede para o valor de vazão 24 passos a frente Resposta da rede para o valor de pressão 24 passos a frente
0.8 0.8

0.6
0.75
0.4
0.7
0.2

0.65 0
Wed, 06:00 Wed, 12:00 Wed, 18:00 Thu, 00:00 Thu, 06:00 Wed, 06:00 Wed, 12:00 Wed, 18:00 Thu, 00:00 Thu, 06:00
Jan 25, 2017
Previsão Jan 25, 2017
Previsão
Valor Real Valor Real
4 30
MAPE - Vazão (%): 1.8503, Erro total do volume (%): -0.87853 MAPE - Pressão (%): 7.197
3
20
2
10
1

0 0
Wed, 06:00 Wed, 12:00 Wed, 18:00 Thu, 00:00 Thu, 06:00 Wed, 06:00 Wed, 12:00 Wed, 18:00 Thu, 00:00 Thu, 06:00
Jan da
Erro 25,amostra
2017 Jan da
Erro 25,amostra
2017

(b1) Perfil de vazão (b2) Perfil de pressão

Resposta da rede para o valor de pressão 24 passos a frente


0.8

0.6

0.4

0.2

0
Tue, 12:00 Tue, 18:00 Wed, 00:00 Wed, 06:00
Previsão
Jan 24, 2017
Valor Real
40
MAPE - Pressão (%): 8.0551
30

20

10

0
Tue, 12:00 Tue, 18:00 Wed, 00:00 Wed, 06:00
Jan da
Erro 24,amostra
2017

(c1) Perfil de vazão (c2) Perfil de pressão

Fonte: Elaborado pelo autor utilizando MATLAB, 2017.


62

Como pode ser observado nos gráficos, os perfis previstos pela rede neural
acompanham a tendência sem valores discrepantes dos perfis reais da vazão e
pressão no ponto crítico. No horizonte de 24 horas, o erro não é monotonamente
positivo ou negativo e seu valor absoluto não apresenta tendência de crescimento.
Diante do exposto a previsão mostra-se confiável, podendo ser utilizada no controle
operacional.

5.2 RESULTADO REDE NEURAL NARX

Os resultados da rede NARX estão resumidos na Tabela 2. Em média o MAPE da


vazão das previsões de 24 horas resulta em 2,07%, enquanto que para a pressão no
ponto crítico o valor de 10,41%. A média do erro do volume total disponibilizado é de
-0,66%. Os desvios padrões em relação a estes valores médios são pequenos.

Tabela 2 – Resumo resultados da previsão 24 horas a frente da rede NARX


Vazão Pressão no Ponto Volume
Crítico Disponibilizado

Média de erros - - -0.66%


percentual

Média do MAPE 2.07% 10.41% -

Desvio padrão da 0.71% 3.16% 1.08%


média de erro ou
MAPE

Fonte: Elaborado pelo autor, 2017.

O desempenho da rede neural NARX para previsão de 24 horas é mostrado


graficamente através de alguns trechos apresentados na Figura 37. Onde as linhas
na cor preta e azul representam o valor real e previsto, respectivamente. O erro
absoluto percentual de cada amostra é mostrado pelas linhas verticais na cor verde,
também se calcula o MAPE e o erro do Volume Total Disponibilizado no período de
24 horas. Os índices alfanuméricos dos gráficos indicam os perfis de vazão e
pressão que correspondentes ao mesmo período.
63

Figura 37 – Resposta da rede NARX para previsão de 24 horas.

(a1) Perfil de vazão (a2) Perfil de pressão

(b1) Perfil de vazão (b2) Perfil de pressão

Resposta Rede Neural para vazão - Laço auto-regressivo fechado


Valor vazão normalizado

0.8

0.75

0.7

0.65

0.6
Thu, 06:00 Thu, 12:00 Thu, 18:00 Fri, 00:00 Fri, 06:00 Fri, 12:00
Valor real2017
Jan 12,
Valor simulação
6
Erro absoluto (%)

MAPE - Vazão (%): 2.353, Erro total do volume (%): -1.9906


4

0
Thu, 06:00 Thu, 12:00 Thu, 18:00 Fri, 00:00 Fri, 06:00 Fri, 12:00
Jan da
Erro 12,amostra
2017

(c1) Perfil de vazão (c2) Perfil de pressão

Fonte: Autor (elaborado no MATLAB).


64

Como pode ser observado nos gráficos, os perfis previstos pela rede neural
acompanham a tendência sem valores discrepantes dos perfis reais da vazão e
pressão no ponto crítico. No horizonte de 24 horas, o erro não é monotonamente
positivo ou negativo e seu valor absoluto não apresenta tendência de crescimento.
Diante do exposto a previsão mostra-se confiável, podendo ser utilizada no controle
operacional.

5.3 DISCUSSÕES

As redes apresentaram bons resultados, porém a rede NARX se sobressaiu em


ambos os critérios de desempenho considerados, MAPE e Volume Total
Disponibilizado.

O melhor resultado da rede NARX pode ser explicado pela adição das variáveis do
estado das bombas e percentual de estrangulamento da VBM-1 como entradas.

O erro na previsão de 24 horas do perfil de vazão não é monotonamente positivo ou


negativo, o que possibilitou um baixo erro no volume disponibilizado.

O erro mais acentuado foi na previsão do perfil de pressão, porém, observando-se


os gráficos percebe-seque a maior parcela se deve a uma defasagem entre o valor
previsto e o real, não existindo grandes extrapolações dos valores da envoltória de
máximos e mínimos do perfil real.

Essa observação no comportamento do erro é interessante, pois se a saída da rede


resultasse em valores muito acima ou abaixo dos máximos e mínimos reais poderia
induzir o operador a tomar ações que poderiam provocar sobrepressões e aumento
de perdas físicas de água ou desabastecimento. Ressalta-se que a vazão distribuída
num da instante não representa diretamente o consumo real dos clientes, pois no
Brasil os consumidores devem possuir reservação interna com autonomia para 24
horas, conforme a norma NBR-5626/98 - Instalação predial de água fria, assim a
restrição da vazão provocada por queda de pressão em um dado momento pode ser
65

compensado posteriormente dessa forma uma pequena defasagem no perfil de


pressão não acarretaria em grandes transtornos ao sistema de abastecimento.
Um teste efetuado com a rede NARX em modo paralelo para previsão de vários
passos a frente como mostrado na Figura 38 evidência a defasagem citada no
parágrafo anterior.

Figura 38 – Teste efetuado com a rede NARX para previsão de vários passo a
frente.

Nota: Os erros vão se acumulando na previsão do perfil depressão vários passos à frente, porém
considerando-se uma envoltória entre os valores máximos e mínimos reais a previsão não sofre
grandes desvios.

Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

Avaliação da resposta para detecção de anomalias no abastecimento

O período em que o “Setor A” estava reforçando o abastecimento do “Setor B”, como


mostrado na Figura 15, foi utilizado para simular um vazamento e verificar se o
incremento no erro na rede NARX em modo série-paralelo poderia ser utilizado
como alarme. O modo série-paralelo foi utilizado nesta simulação, pois possuí menor
erro já que trabalha com o valor real e não o previsto na camada de entrada da rede
neural.
66

A resposta da rede neural para a simulação do vazamento é mostrada na Figura 39


onde se observa que o incremento no erro da previsão de vazão ultrapassou 5
vezes o desvio padrão avaliado para a previsão de 24 horas em modo paralelo, ou
seja, probabilidade ínfima de ocorrer, e mais de 2 vezes o desvio padrão para a
pressão, ou seja, probabilidade de ocorrer menor do que 5%. O erro é grande nos
primeiros três dias da manobra operacional, depois, quando o abastecimento se
normalizada o erro é reduzido para a média e desvio padrão esperados na condição
de abastecimento normal.

Figura 39 – Teste efetuado com a rede NARX para detecção de anomalias no


abastecimento.

Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

De acordo com esta simulação podemos inferir que o monitoramento do erro da


previsão pode ser utilizado para geração de alarmes de possíveis vazamentos,
porém mais dados precisariam ser simulados para se ter maior confiança, ficando
para trabalhos futuros como sugerido no capítulo a seguir.
67

6 CONCLUSÃO E SUGESTÕES DE TRABALHOS FUTUROS

Os modelos de redes neurais utilizados apresentaram médias de erro absoluto


percentual abaixo de 3% e 11% para a previsão de 24 horas dos perfis de vazão e
pressão do ponto crítico, respectivamente, mostrando-se úteis para detecção
antecipada de desvios das metas operacionais possibilitando que sejam tomadas
ações preventivas em detrimento a ações corretivas.

Se os modelos forem incorporados ao sistema de supervisão, a previsão de24 horas


poderá ser ajustada continuamente e automaticamente a cada hora, quando se
obtém novos valores reais.

Os erros no horizonte de 24 horas não são tendenciosos, o que é um fato


importante, pois caso contrário o erro acumulado causaria desabastecimento ou
sobrepressão na rede de distribuição de água com consequente aumento das
perdas.

Para o desenvolvimento de sistemas inteligentes a qualidade dos dados históricos é


de suma importância. A integração informatizada entre o sistema SCADA, relatórios
operacionais e sistema de atendimento ao consumidor e manutenção de redes seria
de grande valia no pré-processamento dos dados.

Em primeira análise a rede NARX escolhida poderia ser utilizada como um simulador
hidráulico para tomada de decisão sobre qual é o percentual de abertura necessário
da VBM-1 e qual das bombas se deve ligar, com os propósitos de se atingir as
metas operacionais e verificar se alguma condição de contorno será desrespeitada,
porém mais dados seriam necessário para treinamento da rede e testes.

A saída da rede neural poderia ser utilizada como um “sensor virtual” suprindo o
Centro de Controle Operacional de informação no caso de eventual falha de
comunicação ocorrido no transmissor de pressão PT-3, como mostrado na Figura
17. Vale pontuar que é melhor um valor mesmo com erro de 11%, do que valor
algum.
68

Sugere-se para trabalhos futuros:

 Estudar o monitoramento do valor de erro da previsão para geração de


alarmes de possíveis vazamentos na rede de distribuição.

 Incorporar o modelo de previsão de demanda ao SCADA para monitoramento


contínuo e previsão 24 horas a frente atualizada a cada hora.
69

REFERÊNCIAS

BRAGA, A. de P.; CARVALHO, A. P. de L. F.; LUDEMIR, T. B. Redes Neurais


Artificiais: Teoria e Aplicações. 1. ed. Rio de Janeiro: LTC, 2000.

BAUM, E. B.; HAUSSLER, D. What size net gives valid generalization? Neural
Computation, Massachusetts, v. 1, n. 1, p. 151-160, 1988.

SILVA, I. N. da; SPATTI, D. H.; FLAUZINO, R. A. Redes Neurais Artificiais para


Engenharia e Ciências Aplicadas: Curso Prático. 1. ed. São Paulo: Artliber, 2010.

DUDA, R. O; HART, P. E. STORK, G. D. Patter Classification. 2. ed. New York:


Wiley-Interscience, 2001. ISBN: 978-0-471-05669-0.

FALKENBERG, A. V. Previsão de Consumo Urbano de Água em Curto Prazo.


2005. 89 f. Dissertação (Mestrado em Métodos Numéricos em Engenharia) - Curso
de Pós-Graduação em Métodos Numéricos em Engenharia, Universidade Federal do
Paraná, Curitiba, 2005.

FIORIN, D. V. et al. Aplicações de redes neurais e previsões de disponibilidade de


recursos energéticos solares. Revista Brasileira de Ensino de Física, São Paulo.
v. 33, n. 1, 2011.

G1 VITÓRIA. Confira os bairros que vão passar por racionamento na Grande Vitória.
G1 – Portal de Notícias da Globo, Vitória, 20 set. 2016. Disponível em:
<http://g1.globo.com/espirito-santo/noticia/2016/09/confira-os-bairros-que-vao-
passar-por-racionamento-na-grande-vitoria.html>. Acessado em: 21 jun. 2017.

G1 SÃO PAULO. Entenda o que é o volume morto do Sistema Cantareira. G1 –


Portal de Notícias da Globo, São Paulo, 15 ago. 2017. Disponível em:
<http://g1.globo.com/sao-paulo/noticia/2014/05/entenda-o-que-e-o-volume-morto-do-
sistema-cantareira.html>. Acessado em: 21 jun. 2017.

GONÇALVEZ, R. M. et al. Modelagem preditiva de Linha da Costa Utilizando Redes


Neurais Artificiais. Boletim de Ciências Geodésicas, Curitiba, v. 16, n. 3, p. 420-
444, 2010.

GONZALEZ, R. C.; WOODS, R. C. Processamento digital de imagens. 3. ed. São


Paulo: Pearson Prentice Hall, 2010.

GOUVEIA, A. CEP – Controle Estatístico de Processo. 1. ed. São Paulo: Nelpa,


2011.

HAYKIN, S. Redes Neurais Princípios e Prática. 2. ed. Porto Alegre: Bookman,


2001. ISBN: 978-85-7307-718-6.

HECHT-NIELSEN, R. Theory of the Backpropagation Neural Network. In:


INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORK, 1989,
Washington. Procedings... [S.l. : s.n], 1989, v. 1, p. 593 – 605.
70

HU, Y. H; HWANG, J. N. Handbook of neural network signal processing. 1. ed.


Florida: CRC Press LLC, 2002. ISBN: 0-8493-2359-2.

IYODA, E. M. Inteligência computacional no projeto automático de redes


neurais híbridas e redes neurofuzzy heterogêneas. 2000. Dissertação (Mestrado)
- Faculdade de Engenharia Elétrica e de Computação, Universidade Estadual de
Campinas, Campinas, 2000.

JAIN, A.; JOSHI, C. U.; VARSHNEY, A. K. Short-Term Water Demand Forecasting


Using Artificial Neural Networks: IIT Kanpur Experience. In: INTERNATIONAL
CONFERENCE ON PATTERN RECOGNITION, 15., 2000, Barcelona. Proceedings...
Barcelona: IEEE Computer Society, v. 2, p. 459-462, 2000.

KHAN, E. A. et al. Forecasting the Number of Muslim Pilgrims Using NARX Neural
Networks with a Comparison Study with Other Modern Methods. British Journal of
Mathematics & Computer Science, London, v. 6, n. 5, 2015.

KOFINAS, D. et al. Daily Multivariate Forecasting of Water Demand in a Touristic


Island with the Use of Artificial Neural Network and Adaptive Neuro-Fuzzy Inference
System. In: INTERNATIONAL WORKSHOP ON CYBER-PHYSICAL SYSTEM FOR
SMART WATER NETWORK, 2016, Viena. Disponível em:
<http://ieeexplore.ieee.org/document/7469061/>. Acessado em: 14 mar. 2017.

LAMBERT, A. O. International Report on water loses management techniques.


Water Science and Technology: Water Supply, London, v. 2, n. 4, pg. 1-20, 2002.

MACHADO, R. R. A Crise Hídrica e a Redução dos Índices de Perdas. 2017.


Disponível em: <http://abes-dn.org.br/?p=7631>. Acessado em: 15 abril 2017.

OLIVEIRA, P. F. G. N. D. Gestão energética inteligente de operação em redes de


abastecimento de água. 2015. Dissertação (Mestrado Integrado em Engenharia
Eletrotécnica e de Computadores Major Energia) - Faculdade de Engenharia,
Universidade do Porto, Porto, 2015.

PADILHA, C. E. de A. et al. Recurrent neural network modeling applied to


expanded bed adsorption chromatography of chitosanases produced by
Paenibacilluse Himensis. Chemical engineering research and design, n. 117, p. 24-
33. 2017. Disponível em: <http://www.sciencedirect.com/science/journal/02638762>.
Acessado em: 8 de ago. de 2017.

PMSS - Programa de Modernização do Setor Saneamento. Balanço Hídrico. 2015.


Disponível em: http://www.pmss.gov.br/index.php/projeto-com-agua/balanco-hidrico.
Acessado em: 01 jun. 2017.

RE, M. M. E.; et al. Comparison of artificial neural networks and harmonic


analysis for sea level forecasting (Urías coastal lagoon, Mazatlán, Mexico).
71

Ciencias Marinas, v. 40, n.4, pg. 251–261. 2014. Disponível em:


<http://dx.doi.org/10.7773/cm.v40i4.2463>. Acessado em: 15 abril 2017.

REN Z.; LI, S. Short-term Demand Forecasting for Distributed Water Supply
Networks: A Multi-scale Approach, IEEE 2016.

SHVARTER, L.; SHAMIR, U; FELDMAN, M. Forecasting Hourly Water Demands


by Pattern Recognition Approach. Journal of Water Resources Planning and
Management, v. 119, n. 6, 1993.

SILVA, C. S. Previsão multivariada da demanda horária de água em sistemas


urbanos de abastecimento. 2003. 280 f. Tese (Doutorado em Engenharia Civil) -
Universidade de São Paulo USP, São Paulo, 2003.

SNIS - Sistema Nacional de Informação sobre Saneamento. Diagnóstico dos


Serviços de Água e Esgotos – 2015. Disponível em: <http:\\www.snis.gov.br>.
Acessado em: 01 abr. 2017.

SJÖBOM JÚNIOR, A. A. Previsão de nível de reservatórios e otimização de


bombeamento em sistemas de distribuição de água. 2005. 98 f. Dissertação
(Mestrado em Engenharia Elétrica e da Computação) - Escola de Engenharia
Elétrica e Computação, Universidade Federal de Goiás, Goiânia, 2005.

TAMPELINI, L. G. Uma Aplicação das Redes Neurais Artificiais de Elman e Time


Delay Neural Network na Predição de Séries Temporais. 2008. Monografia
(Bacharel em Informática) - Centro de Ciências Exatas e Tecnológicas, Universidade
Estadual do Oeste do Paraná, Cascavel, 2008.

TRAUTWEIN JÚNIOR, B. Avaliação de métodos para previsão de consumo de


água para curtíssimo prazo: um estudo de caso para a empresa de
saneamento. 2004. 107 f. Dissertação (Mestrado em Engenharia de Produção e
Sistemas) - Pontifícia Universidade Católica do Paraná, Curitiba, 2004.

VELMIR, Ć.; ALEKSENDRIC D.; MLADENOVIC, D. Braking torque control using


reccurent neural networks. Journal of Automobile Engineering, v. 226, p. 755-766,
maio, 2012. Disponível em: <https://doi.org/10.1177/0954407011428720>. Acessado
em: 01 jun. de 2017.
72

APÊNDICE
ÊNDICE A - TREINAMENTO DAS REDES NEURAIS

Treinar uma rede neural artificial significa ajustar os parâmetros livres da rede (pesos
e bias) para que a resposta da rede de um dado conjunto de entrad
entrada se aproxime do
valor real.

Existem treinamentos não supervisionados e supervisionados, neste


nes último um
conjunto de pares de amostras de entrada e saída conhecidos do sistema são
apresentados a rede onde um algoritmo de treinamento realiza os ajustes do
dos pesos
e bias.

Um fluxograma do treinamento supervisionado é ilustrado na


Figura 40.. O ciclo com cálculo do erro e ajustes de pesos pode ser realizado a cada
amostra, o que pode levar a instabilidade do treinamen
treinamento,
to, ou em lote quando o erro
é calculado e os ajustes dos pesos são realizados para todo o conjunto de amostras
de treinamento. Cada iteração com ajuste dos pesos é denominada época de
treinamento.

Figura 40 – Fluxo treinamento supervisionado


pervisionado

Fonte: Elaborado pelo autor, 2017.


73

Depois de treinadas as redes neurais podem fazer interpolações e extrapolações do


que aprenderam. Conforme Braga et al. (2000), neste tipo de aprendizado
conexionista, não se procura obter regras, mas sim determinar a intensidade de
conexões entre neurônios.

Os algoritmos de treinamento existentes diferem-se pela maneira como o ajuste dos


pesos é feito, cada um tem suas características que podem apresentar vantagens e
desvantagens na solução de problemas.

O método básico para treinamento das redes MLP é o algoritmo de retropropagação


do erro, também chamada de regra delta generalizada.

O algoritmo consiste em duas etapas uma forward onde o sinal da entrada é


propagado até a saída com os pesos fixos e outra backward onde o erro é
retropropagado ajustando-se os pesos.

Para facilidade de entendimento será apresentado o algoritmo para um único


neurônio como mostrado na Figura 41.

Figura 41 – Retropropagação do erro para um único neurônio.

Fonte: Adaptado de Hu e Hwang (2002).

Seja 𝑾 = [𝑤 , 𝑤 , . . . , 𝑤 ] a matriz de pesos e 𝑿(𝑘) = [1, 𝑥 , . . . , 𝑥 ] o conjunto de 𝑘


vetores das entradas transpostos, para uma quantidade 𝑘 de saídas conhecidas,
𝑑(𝑘).
74

A função da rede é dada pela combinação linear 𝑣 = ∑ (𝑥 . 𝑤 ) = 𝑊𝑋, e o erro


quadrático médio do conjunto de treinamento pela equação (5).

𝐸= [𝑒(𝑘)] = [𝑑(𝑘) − 𝑦(𝑘)] = 𝑑(𝑘) − 𝜑 𝑣(𝑘)

𝐸=∑ [𝑑(𝑘) − 𝜑(𝑊𝑋(𝑘))] (8)

O objetivo é ajustar a matriz 𝑾 de forma incremental no sentido do gradiente


negativo da função de soma do erro quadrático 𝑬 para minimizá-la. A correção feita
na matriz 𝑾 é expressa pela equação (6).

𝐖(𝑡 + 1) = 𝑾(𝑡) − 𝜂 (9)

𝒅𝑬
Onde, 𝜼, é um escalar que representa a taxa de aprendizagem e a derivada, 𝒅𝑾
,o

vetor gradiente.

Desenvolvendo-se a derivada parcial de 𝑬 cadaum dos pesos, temos:

( ( ))
=∑ 2[𝑑(𝑘) − 𝜑(𝑣(𝑘))] . − , para i=0, 1, ..., n (10)

( ( ))
Para resolver a derivada parcial aplica-se a regra da cadeia obtendo-se a

equação (8).

( ( )) ( ) ( ) ∑ ( . ) ( )
= =𝜑 . =𝜑 .𝑥 (11)

Inserindo a equação (8) em (7), temos:

= −2. ∑ [𝑑(𝑘) − 𝜑(𝑣(𝑘))] . 𝜑 𝑣(𝑘) . 𝑥 (𝑘) = −2. ∑ 𝛿(𝑘) . 𝑥 (𝑘) (12)


75

O termo 𝛿(𝑘) é o sinal de erro, [𝑑(𝑘) − 𝜑(𝑣(𝑘))], modulado pela derivada da função
de ativação, 𝜑 𝑣(𝑘) . 𝑥 , que representa a quantidade de correção que deve ser
aplicado ao peso 𝑤 .
Reescrevendo a equação (6) para o peso 𝑤 com 𝑖 variando de 0 a n, temos:

𝑤 (𝑡 + 1) = 𝑤 (𝑡) + 2𝜂. ∑ 𝛿(𝑘) . 𝑥 (𝑘) (13)

O desenvolvimento do algoritmo para as redes com múltiplas camadas pode ser


consultado em Hu e Hwang (2002) ou Gonzalez et al. (2010).

Segundo Gonçalves et al. (2010) o algoritmo de retropropagação do erro apresenta


uma série de dificuldades ou deficiências principalmente a velocidade de
convergência do algoritmo para superfícies mais complexas e não raramente o
algoritmo também pode convergir para mínimos locais que apresentam uma solução
estável, embora seja maior do que o mínimo global. Desde que o algoritmo de retro
propagação do erro foi popularizado algumas pesquisas vêm buscando técnicas
tanto para acelerar o algoritmo quanto para reduzir a incidência de mínimos locais.

De acordo com Iyoda (2000) o algoritmo de retro-propagação pode ser classificado


como um método de primeira ordem, já que utiliza apenas a informação do gradiente
da função de erro para ajustar os pesos da rede. Os métodos de primeira ordem são
ineficientes no tratamento de problemas de larga escala, pois apresentam baixas
taxas de convergência. Para problemas de grande dimensionalidade, é justificável a
utilização de um método de otimização não-linear de segunda ordem, onde além do
vetor gradiente da função objetivo, faz-se também o uso da matriz hessiana (matriz
de derivadas de segunda ordem) da função erro. De Castro (1998, apud IYODA,
2000) realizou comparações efetivas entre diversos métodos de primeira e segunda
ordem aplicados no treinamento de redes neurais artificiais e dentre os algoritmos
testados, o algoritmo do gradiente conjugado escalonado proposto por Moller (1993,
apud IYODA, 2000) se destacou por apresentar melhor desempenho na maioria dos
problemas considerados.

Generalização, overfitting e critérios de parada do treinamento


76

A generalização é a capacidade de a rede neural responder adequadamente a


padrões jamais vistos após ser treinada. Um número de neurônios muito superior ao
necessário para o problema em análise poderá super ajustar os pesos sinápticos da
rede para os dados de treinamento, incluindo até ruídos fazendo com que a rede
não apresente bons resultados para novas entradas, esse excesso de ajuste é
denominado overfitting.

No processo de convergência do treinamento utiliza-se a técnica da validação


cruzada, onde o conjunto de dados é divido entre dois subconjuntos, um de
treinamento e outro de validação.

O conjunto de treinamento é utilizado para se ajustar os pesos sinápticos enquanto o


de validação utilizado para testar a resposta da rede com dados diferentes dos que
foram utilizados para os ajustes dos pesos, assim durante o processo de
treinamento quando o erro testado no conjunto de validação começa a crescer
sucessivamente o processo é parado tomando-se os pesos que apresentaram o
menor erro evitando-se o overfitting.

Como exemplo o gráfico da Figura 42 (a) mostra a convergência do erro médio


quadrático do conjunto de treinamento e validação, na época n° 109 o treinamento é
interrompido quando o erro no conjunto de validação cresce sucessivamente por
seis épocas, Figura 42 (b), assim é selecionado o conjunto de pesos ajustados na
época 103 que apresentou o menor erro.

Outros critérios de parada que podem interromper o processo de treinamento são o


número máximo de épocas e o limiar de erro.
77

Figura 42 – Convergência do erro e validação do treinamento.

gradient
Mean Squared Error (mse)

val fail
(a) (b)
Fonte: Elaborado pelo autor utilizando MATLAB, 2017.

Obs: O conjunto “test” mostrado na Figura 42 não influência no treinamento da rede.