Você está na página 1de 5

DESENVOLVIMENTO E APLICAÇÃO DE REDES NEURAIS ARTIFICIAIS PARA A OTIMIZAÇÃO NO GERENCIAMENTO DE UMA ESTAÇÃO DE TRATAMENTO DE ÁGUA

DEVELOPMENT AND APPLICATION OF ARTIFICIAL NEURAL NETWORK IN OPTIMIZATION OF THE MANAGEMENT OF WATER TREATMENT PLANTS

Alexandre Botari 1 , Renan Jeferson Paneco 2 , Janaina Conversani Botari 3

Abstract This work presents the mathematical modeling of particle removal in optimization of the manegement of water treatment plant, through the development of an artificial neural network. The artificial neural network (Ann) of type Multilayer Perceptron (MLP-Multi Layer Perceptron) was programmed in the language of mathematical software MatLab. The RNA was trained with experimental data obteined from the filtration in installation of double filtration runs on a pilot scale. Later, the data were used in a drink water conventional treatment plant in the city of Umuarama-PR. During the training was analyzed the behavior of the RNA depending on the amount of neurons and in relation to the activation function, making changes in your search optimization. The results obtained were satisfactory, with coefficients of determination (R²) between 93 and 99%, using eight, twenty-five and fifty intermediate layer neurons, with the RNA working activation functions, tangent linear and logarithmic sigmoidal.

Index Terms RNA, direct filtration, doble filtration, MLP, particle removal.

INTRODUÇÃO

A água constitui fonte de valor econômico essencial para a manutenção da existência humana, e durante anos ponderou-se que a escassez da água potável era impossível. Água potável é um direito fundamental de todo cidadão, logo a preocupação com a boa distribuição e excelente qualidade é grande e essencial. A busca por melhoramentos no processo de tratamento da água é fundamental para a otimização do processo reduzindo custos e desperdícios, além de contribuir para uma melhor qualidade do produto. O foco do trabalho consiste na criação de uma rede neural artificial para a modelação matemática do processo de filtração direta ascendente.

A rede neural artificial tem características de uma rede do tipo Perceptron Multicamadas (MLP – Multi Layers Perceptron), programada na linguagem do software Matlab. As redes neurais artificiais têm sua concepção computacional inspirada nos sistemas nervosos biológicos. Os neurônios são as chamadas unidades fundamentais nas Redes Neurais Artificiais (RNA). Nos sistemas biológicos, os neurônios estão presentes nos tecidos nervosos, incluindo o cérebro. A RNA é uma rede computacional inspirada em uma rede neural biológica, o cérebro, este por sua vez é um sistema complexo, não linear e paralelo. Ele é altamente capaz de receber dados, processar, organizar e relacionar os mesmos, além de realizar um processo de aprendizagem através de ações rotineiras executadas. Estas características são imitadas por técnicas computacionais a fim de encontrar resultados mais precisos. Definindo basicamente uma rede neural:

Uma rede neural é um processador robusto que funciona com distribuição paralela e é constituído de unidades de processamento simples, cuja função precípua é a de armazenar um histórico na forma de experimentação ou aprendizagem para posteriormente torná-lo disponível em decisões futuras. Considerando um sistema biológico o neurônio é uma célula fundamental da rede neural, nele está contido o núcleo chamado também de soma, os dendritos que são filamentos que se conectam a outras células e um filamento mais longo chamado axônio que simplesmente faz uma conexão mais longa, o conjunto dessas conexões é chamado de sinapses. A rede funciona a partir das sinapses que liberam substâncias químicas transmissoras para os dendritos onde ocorrem os pulsos elétricos, chamados potenciais de ação, que vão para os axônios. As Redes Neurais Artificiais (RNA) são sistemas paralelos distribuídos compostos por unidades de processamento simples, os chamados neurônios, que realizam operações matemáticas lineares ou não lineares. Na maioria dos modelos matemáticos que utilizam RNAs, estes

1 Alexandre Botari, Professor Adjunto do Departamento de Tecnologia DTC da Universidade Estadual de Maringá Campus Umuarama, Av. Ângelo Moreira da Fonseca, 1800 Bairro: Zona VII CEP: 87506-370 Umuarama-PR Fone/fax (44)-36219314, abotari@uem.br

2 Renan Jeferson Paneco, Aluno do curso de Engenharia Civil da Universidade Estadual de Maringá – Campus Umuarama, Av. Ângelo Moreira da Fonseca, 1800 Bairro: Zona VII CEP: 87506-370 Umuarama-PR Fone/fax (44)-36219314, renanpaneco@hotmail.com

3 Janaina Conversani Botari, Professora Me. do Departamento de Tecnologia DTC da Universidade Estadual de Maringá Campus Umuarama, Av. Ângelo Moreira da Fonseca, 1800 Bairro: Zona VII CEP: 87506-370 Umuarama-PR Fone/fax (44)-36219314, jcbotari2@uem.br

DOI 10.14684/INTERTECH.24.2016.284-288 © 2016 COPEC

February 28 – March 02, 2016, Salvador, BRAZIL

XIV International Conference on Engineering and Technology Education

284

neurônios estão associados unidirecionalmente através de conexões associadas a pesos, os quais armazenam o conhecimento por meio do modelo e ponderam a entrada recebida em cada neurônio As redes neurais artificiais funcionam basicamente da mesma forma, tem como componente principal os neurônios que são conectados por links ou conexões sinápticos onde cada um deles tem quantidades associadas denominadas pesos sinápticos. A estrutura e os componentes de um neurônio estão representados na Figura 1:

Função de

ativação X1 W1 u X2 W2 ∑ y φ (.) Sinais Saída de entrada Somatório
ativação
X1
W1
u
X2
W2
y
φ (.)
Sinais
Saída
de
entrada
Somatório
Xp
Wp
ө
pesos
Limiar

sinápticos

FIGURA 1

MODELO NÃO LINEAR DE UM NEURÔNIO

No neurônio k é possível identificar os sinais de entrada (x), os pesos sinápticos (w), a combinação linear entre os sinais e os pesos sinápticos (uk), a saída (yk) e a função de ativação (g(.)). Existem três funções de ativação que são mais usadas: a=pureline(n), a=logsig(n) e a tansig(n), que estão representadas graficamente representadas na Figura 2:

a +1 0 -1
a
+1
0
-1

a=purelin(n)

(a)

n

a +1 0 -1
a
+1
0
-1

a=logsig(n)

(b)

n

FIGURA 2

FUNÇÕES DE ATIVAÇÃO

a +1 0 -1
a
+1
0
-1

a=tansig(n)

(c)

n

Pode-se identificar cada função na Figura 2 como: (a) função Linear, (b) função Log-sigmoidal e (c) Tangente hiperbólica sigmoidal. As redes neurais são estruturadas de acordo com o número de neurônios que estão interligados com o algoritmo de aprendizagem, estas estruturas ou arquiteturas de redes podem ser classificadas em: redes alimentadas adiante com

© 2016 COPEC

camada única; redes alimentadas diretamente com múltiplas camadas; redes recorrentes. As redes com uma única camada, os neurônios estão organizados em forma de camadas no qual apresenta apenas uma camada, já nas redes com múltiplas camadas encontra- se mais camadas interligadas entre si, na Figura 3 está representada uma rede do tipo múltiplas camadas. As redes recorrentes são diferentes das demais por ter um laço de realimentação, os neurônios enviam se sinal de saída para a entrada de outros neurônios. Os algoritmos de aprendizagem, de acordo com [1], é um conjunto preestabelecido de regras bem definidas para a solução de um problema de aprendizagem é denominado um algoritmo de aprendizagem.

Não há apenas um único algoritmo de aprendizagem,

existem vários algoritmos formulados de forma específica para os mais variados trabalhos. Uma rede neural que não deixa de ser uma inteligência artificial tem três características ou mesmo funções básicas,

são elas representação, raciocínio e aprendizagem. A RNA deve colher informações, armazena-las, associá-las com o intuito de resolver problemas e aprender de acordo com o treinamento.

Camadas de neurônios de saída Camadas de Camadas de entrada de nó de neurônios ocultos
Camadas de
neurônios de saída
Camadas de
Camadas de
entrada de nó de
neurônios ocultos

fonte

FIGURA 3

REDE ALIMENTADA ADIANTE OU ACICLICA TOTALMENTE CONECTADA COM UMA CAMADA OCULTA E UMA CAMADA DE SAÍDA

A aprendizagem acontece de acordo com a formação do algoritmo de aprendizagem que executa basicamente três tarefas: apresenta os estímulos esternos a rede; muda os pesos como resultados dos estímulos (estas mudanças acontecem de acordo com a regra de aprendizado); avalia a resposta da rede de acordo com as mudanças. O processo de aprendizagem da RNA pode ser divido em três subconjuntos que são treinamento, teste e validação, o treinamento está na parte mais importante da construção da RNA, nele estão os dados que atualizam os pesos e deve ser capaz de cobriras possíveis variações do problema, esta tarefa de corrigir os pesos acontecem em ciclos que são chamados de épocas. Os outros conjuntos se encarregam com a verificação da aprendizagem da rede. [2] A normalização dos dados deve ser feito dentro de um intervalo para que não haja dispersão ou sobreposição, este

February 28 – March 02, 2016, Salvador, BRAZIL

XIV International Conference on Engineering and Technology Education

285

intervalo é determinado pela função de ativação, como por exemplo, a função tansig com intervalo de (-1,1). [2] Por ser bem mais eficiente em vários sentidos a filtração direta ascendente é mais utilizada. [3]

METODOLOGIA

No trabalho utilizou-se da linguagem de programação do software Matlab, a elaboração da RNA e o treinamento foi feito através do programa Matlab R2011b.

O treinamento da rede foi realizado por meio de dados

obtidos de uma filtração direta ascendente contendo informações sobre tempo de duração (h), temperatura da água (ºC), pH coagulante, pH AE, a turbidez (uT) de acordo com o ponto de coleta, perda de carga a 25 ºC (cm).

acordo com o ponto de coleta, perda de carga a 25 ºC (cm). FIGURA 4 D

FIGURA 4

DESENHO ESQUEMÁTICO DO FILTRO ASCENDENTE DE DUPLA FILTRAÇÃO

FONTE: [3][4]

A Figura 13 representa um filtro ascendente, composto

por pontos de coleta de amostras denominadas por Cn, no qual n é a camada utilizada, no ponto Coagulada coleta-se a água bruta coagulada e Pn são pontos de tomadas

piezométricas no topo da camada logo identificado por n+1.

A filtração foi feita com dois tipos de água com turbidez de 100 uT e 300 uT, respectivamente.[3]

O nível de turbidez foi analisado a cada ponto de coleta

por um turbidímetro, nota-se que a maior parte da perda de carga ocorre no início da filtração, nas primeiras camadas dos filtros, na C1 a perda de carga se mostra mais acentuada, no entanto nas camadas C2 e C3 os níveis de filtração não são tão eficazes quanto na camada C1, mas os resultados são satisfatórios, na C4, C5 e C6 a retenção de partículas foi

© 2016 COPEC

quase que desnecessárias devido à boa qualidade da filtração nas três primeiras camadas. [3]

O trabalho da RNA é relacionar as perdas de carga

através da análise dos níveis de turbidez com o objetivo de expressar matematicamente o funcionamento do filtro para um melhor entendimento no processo da captação de partículas na filtração e assim possivelmente melhorar a qualidade do mesmo. A RNA foi treinada com uma associação de quantidade de neurônios e as funções de ativação. Treinou-se a RNA com 15, 28 e 50 neurônios das quais foram relacionadas e com as três funções: linear, log-sigmoidal e tangente hiperbólica sigmoidal. Os testes foram feitos para cada relação de neurônios/função até encontrar bons resultados e assim analisa-los e determinar qual relação é mais viável para a execução da RNA. Foram inseridos os dados da filtração e o vetor de saída, logo será um treino supervisionado, os vetores de entrada e saída, são dados de turbidez, característica da água escolhida para a avaliação da perda de carga.

RESULTADOS

Os resultados obtidos através do treinamento com 8 neurônios e uma função de ativação tagsig são satisfatórios Os valores da rede se ajustam aos valores experimentais, mantendo praticamente a mesma rotina, quanto melhor a correlação entre os valores obtidos, mais perto do valor unitário será o R², caracterizando um excelente desempenho da RNA.

O coeficiente R² é um coeficiente de determinação, um

indicador do grau de correspondência entre os valores estimados e os dados experimentais. Quanto mais próximo do valor unitário for R², mais confiável será a regressão ou

linha de tendência. [4]

A Tabela 1 apresenta os valores de R² do treinamento

da RNA. O erro de determinação do objetivo absoluto foi programado para 3.6 x 10 -5 , em 50% dos treinamentos a RNA alcançou o objetivo determinado.

TABLELA 1

COEFICIENTES DE DETERMINAÇÃO NO TREINAMENTO COM A FILTRAÇÃO ASCENDENTE DA FIGURA 4

R² (%)

93,34

96,63

98,20

98,54

99,38

Média

98,55

Nas Figuras 5 está representado o treinamento da rede (BKP). No treinamento pode-se notar que a RNA obtém excelentes resultados de acordo com o número de amostras e a concentração de turbidez, os resultados da RNA e o experimental seguem praticamente iguais, os dados são

February 28 – March 02, 2016, Salvador, BRAZIL

XIV International Conference on Engineering and Technology Education

286

oriundos da Estação de Tratamento de água – (ETA) de Umuarama-PR. A parir da Figura 6 até a Figura 11, pode-se notar que com o treinamento a RNA passa por um processo de

aprendizagem até conseguir encontrar valores que satisfação

o objetivo e comparando os vetores de entrada e saída

obteve valores com R² acima de 96% para os dados oriundos

da ETA de Umuarama-PR.

Best Training Performance is 2.6623e-005 at epoch 199997

Train 0 Best 10 Goal -2 10 -4 10 -6 10 0 0.2 0.4 0.6
Train
0
Best
10
Goal
-2
10
-4
10
-6
10
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
200000 Epochs
x 10 5
Mean Squared Error (mse)

FIGURA 5

TREINAMENTO DA REDE (BKP)

Training: R=0.98207

1 Data 0.95 Fit Y = T 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55
1
Data
0.95
Fit
Y = T
0.9
0.85
0.8
0.75
0.7
0.65
0.6
0.55
0.5
0.5
0.6
0.7
0.8
0.9
1
Output ~= 0.95*Target + 0.036

Target

FIGURA 6

GENERALIZAÇÃO DA REDE (BKP) NO INICIO DO TREINAMENTO

© 2016 COPEC

Training: R=0.98511

1 Data 0.95 Fit Y = T 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55
1
Data
0.95
Fit
Y = T
0.9
0.85
0.8
0.75
0.7
0.65
0.6
0.55
0.5
0.5
0.6
0.7
0.8
0.9
1
Output ~= 0.95*Target + 0.035

Target

FIGURA 7

GENERALIZAÇÃO DA REDE (BKP)

Training: R=0.99754

1 Data 0.95 Fit Y = T 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55
1
Data
0.95
Fit
Y = T
0.9
0.85
0.8
0.75
0.7
0.65
0.6
0.55
0.5
0.5
0.6
0.7
0.8
0.9
1
Output ~= 0.99*Target + 0.0044

Target

FIGURA 8

GENERALIZAÇÃO DA REDE (BKP) Training: R=0.9974

1 Data 0.95 Fit Y = T 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55
1
Data
0.95
Fit
Y = T
0.9
0.85
0.8
0.75
0.7
0.65
0.6
0.55
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
Output ~= 0.99*Target + 0.0068

Target

FIGURA 9

GENERALIZAÇÃO DA REDE (BKP)

February 28 – March 02, 2016, Salvador, BRAZIL

XIV International Conference on Engineering and Technology Education

287

Training: R=0.98168

1 Data Fit 0.95 Y = T 0.9 0.85 0.8 0.75 0.7 0.65 0.65 0.7
1
Data
Fit
0.95
Y
= T
0.9
0.85
0.8
0.75
0.7
0.65
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
Output ~= 0.96*Target + 0.029

Target

FIGURA 10

GENERALIZAÇÃO DA REDE (BKP)

Training: R=0.99529

1 Data Fit 0.95 Y = T 0.9 0.85 0.8 0.75 0.7 0.7 0.75 0.8
1
Data
Fit
0.95
Y
= T
0.9
0.85
0.8
0.75
0.7
0.7
0.75
0.8
0.85
0.9
0.95
1
Output ~= 0.99*Target + 0.0079

Target

FIGURA 11

GENERALIZAÇÃO DA REDE (BKP)

No inicio do processo de aprendizagem a RNA encontra dificuldades para encontrar o resultado ideal e chegar à eficiência. Na Figura 6, o R² foi de 98,27%, logo não é um resultado satisfatório em relação aos outros resultados que estão acima de 98%, portanto este treinamento não será computado no momento de obter a média. Os valores da rede se ajustam aos valores experimentais, mantendo praticamente a mesma rotina, quanto melhor a corelação entre os valores obtidos, mais

© 2016 COPEC

perto do valor unitário será o R², caracterizando um excelente desempenho da RNA, é possível notar na Figura 11 a excelência do treinamento. A Tabela 2 apresenta os valores de R² das simulações para os dados oriundos da ETA Umuarama - PR. O erro de determinação do objetivo absoluto foi programado para 3.6 x 10 -7 , em 50% dos treinamentos a RNA alcançou o objetivo determinado.

TABLELA 2

COEFICIENTES DE DETERMINAÇÃO

Figura

R² (%)

6

98,21

7

98,51

8

99,75

9

99,74

10

98,17

11

99,53

Média

98,99

Na tabela entre Figuras e seus respectivos R², é feita a média entre eles, porém nesta média não está relacionada a Figura 6 por estar muito abaixo da média.

CONCLUSÃO

Os resultados obtidos nos treinamentos, na elaboração da RNA foram satisfatórios, alcançando excelentes resultados, com R² entre 96 a 99%, com uma média de 99%,

o que indica que a rede neural foi capaz de generalizar as previsões por meio de um modelo matemático fortemente representativo da eficiência da ETA – Umuarama-PR no período considerado.

AGRADECIMENTOS

Os autores agradecem ao Departamento de Tecnologia e o Centro de Tecnologia da Universidade Estadual de Maringá

– DTC/CTC-UEM.

[1]

REFÊNCIAS

HAIKIN,

S.,

Redes

Neurais

2ªedição, 2000, p. 900.

Artificiais

Princípios

e

práticas,

[2] LIMA, M. M. C., Estimativa de concentração de material particulado em suspensão na atmosfera pro meio da modelagem de redes neurais, Dissertação do Programa de Pós-graduação em Saneamento, Meio Ambiente e Recursos Hídricos, Belo Horizonte: Universidade Federal de Minas Gerais, 2006, p. 91.

[3] BOTARI, A., DI BERNARDO, L. Modelação da perda de carga na filtração direta ascendente em meio granular de areia grossa e pedregulho, Engenharia Sanitária Ambiental, Vol.14, Nº 2, abr/jun 2009, p. 245-256.

[4] BOTARI, A., DI BERNARDO, L. Modelação matemática macroscópica de perda de carga e da remoção de sólidos suspensos totais na filtração direta ascendente, Engenharia Sanitária Ambiental, Vol. 12, Nº 2, abr/jun 2007, p. 149-159

[5] PANECO, R. J.; BOTARI, J. C.; BOTARI, A., Desenvolvimento e aplicação de redes neurais artificiais para a otimização da filtração direta no tratamento de água, XII Safety, Health and Environment World Congress, Vol. 12, jul 2012, São Paulo. p. 556-560.

February 28 – March 02, 2016, Salvador, BRAZIL

XIV International Conference on Engineering and Technology Education

288