Cardoso, Unicamp Sensores

UNIVERSIDADE ESTADUAL DE CAMPINAS
Faculdade de Tecnologia
Sandra Maria Cardoso
ALOCAÇÃO ÓTIMA DE SENSORES DE QUALIDADE DE

ÁGUA EM REDES DE ABASTECIMENTO COM EMPREGO
DE OTIMIZAÇÃO MULTIOBJETIVO
Limeira
2019
Sandra Maria Cardoso
ALOCAÇÃO ÓTIMA DE SENSORES DE QUALIDADE DE ÁGUA EM

REDES DE ABASTECIMENTO COM EMPREGO DE OTIMIZAÇÃO
MULTIOBJETIVO
Dissertação apresentada à Faculdade de Tecnologia

da Universidade Estadual de Campinas como parte
dos requisitos para a obtenção do título de Mestre
em Tecnologia, na área de Ambiente.
Orientadora: Profa. Dra. Lubienska Cristina Lucas Jaquiê Ribeiro

Coorientador: Dr. Bruno Melo Brentan
Este exemplar corresponde à versão final da

Dissertação defendida por Sandra Maria
Cardoso e orientada pela Profa. Dra.
Lubienska Cristina Lucas Jaquiê Ribeiro.
Limeira
2019
FOLHA DE APROVAÇÃO
Abaixo se apresentam os membros da comissão julgadora da sessão pública de defesa de dis-

sertação para o Título de Mestre em Tecnologia na área de concentração de Ambiente, a que
submeteu o aluno Sandra Maria Cardoso, em 18 de outubro de 2019 na Faculdade de Tecnologia
– FT/UNICAMP, em Limeira/SP.
Profa. Dra. Lubienska Cristina Lucas Jaquiê Ribeiro

Presidente da Comissão Julgadora
Prof. Dr. Edevar Luvizotto Junior

FEC/UNICAMP
Dr. Gustavo Meirelles Lima

EHR/UFMG
Ata da defesa, assinada pelos membros da Comissão Examinadora, consta no SIGA/Sistema de

Fluxo de Dissertação/Tese e na Secretaria de Pós Graduação da FT.
agradeço ao universo
por levar
tudo o que levou
e por me dar
tudo o que está dando
- equilíbrio
(Rupi Kaur)
Agradecimentos
O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal

de Nível Superior - Brasil (CAPES) - Código de Financiamento 001.
Nos meus agradecimentos gostaria de registrar a trajetória das duas pessoas mais
importante da minha vida, meus pais. Meu pai, Narcísio Zeferino Cardoso, nasceu em São
José do Triunfo distrito da cidade de Viçosa-MG. Filho de mãe solteira, família humilde
criado pelos avós maternos, com dois irmãos mais novos, sempre gostou de estudar.
Conseguiu entrar na melhor escola da cidade no ensino fundamental, mas andava 14 km com
11 anos de idade e não tinha condições de alimentação adequadas.Pensou em desistir, mas
superou. No ensino médio conseguiu entrar na escola técnica de Florestal onde permaneceu
com ajuda de um professor que pagou sua estadia até conseguir bolsa de estudo. Seu
primeiro trabalho foi na empresa Champion, atual Internacional Paper, onde trabalhou por
23 anos. Aos 39 anos ingressou na faculdade de Engenharia Ambiental. Hoje meu pai está
aposentado e é a pessoa mais inteligente e dedicada que eu conheço.
Minha mãe Maria Aparecida dos Santos Cardoso, de família humilde com 3 irmãos,
nasceu em Santos-SP, e sempre gostou de ajudar a família. Aos sete anos colhia café, também
trabalhou como babá e empregada doméstica. Casou com meu pai aos 21 anos, mãe de três
filhos começou a trabalhar na mesma empresa que meu pai quando completei 3 nos de idade,
muito religiosa e esforçada. Terminou o ensino médio aos 35 anos e fez técnico em química.
Atualmente trabalha de empregada doméstica e continua contagiando as pessoas com sua
alegria, minha amiga e exemplo de mulher guerreira. Meus pais estão casados há 32 anos, são
pessoas humildes, sonhadoras, com uma fé inabalável e muito amor. Sou privilegiada por
nascer em um ambiente familiar cheio de amor, carinho, diálogo e união. Meus pais são meu
exemplo de vida, superação, de união matrimonial e de fé. Sou grata por cada dedicação,
apoio aos meus estudos e por acreditarem no meu potencial.
Sou grata ao universo/Deus por me deixar vir em uma família estruturada, me
possibilitando ter saúde emocional e psicológica em todos os momentos difíceis. Agradeço
pela nova chance de aprender com meus erros e estar viva para continuar minha caminhada.
Gostaria de agradecer meus irmãos João Paulo e Narcísio Jr. pela força, carinho, conversas, e
por acreditarem no meu potencial. Vocês são pessoas especiais e grandes exemplos.
Sou grata por sempre ter verdadeiros amigos que me ajudaram durante esses dois anos de
mestrado. Primeiramente agradeço minha melhor amiga Wélida de Sousa Sarro, que hoje
considero parte da minha família, por me ajudar a dar os primeiros passos na área acadêmica,
por me dar bons conselhos e entender minha forma de ver o mundo, mesmo com nossas
diferenças. É amiga de dar bronca, chorar junto, beber no bar uma "lokal", e cozinhar
coisinhas gostosas quando estou triste. É um grande exemplo de mulher, guerreira, honesta,
trabalhadora e sempre faz o melhor, mesmo com as dificuldades. Obrigada por valorizar
nossa amizade e ser sempre recíproca, você é meu sol.
Ganhei um amigão nesses dois anos de mestrado, Daniel Barros Bezerra, pessoa com um
astral maravilhoso, mesmo com o lado negativo e pessimista. Sempre sincero em palavras e
atitude, menino bom mesmo. Ajudou-me em todas as etapas do mestrado, choramos juntos,
rimos, superamos desafios e crescemos profissionalmente. Obrigada Daniel por ser uma pessoa
tão linda e se doar pela nossa equipe ao longo desses dois anos. Conseguimos fazer um trabalho
lindo juntos e eu só tenho a agradecer. Em nossa equipe temos mais uma mulher maravilhosa,
Eva Carolline Martins Oliveira. Educada, dedicada e com responsabilidade, a equipe precisava
de alguém com juízo. Obrigada Eva por participar de cada etapa desse processo, por ser uma
profissional exemplar que chorou e sorriu conosco e soube extrair o melhor de nós.
Além desses, aos quais me referi especialmente, também ganhei vários amigos ao longo
da minha vida , e sou grata a cada um por fazerem diferença em meus dias contribuindo com
palavras amigas, verdades necessárias, sorrisos sinceros e momentos únicos juntos. Vou
lembrar-me das nossas tardes com café na sala dos meninos, cerveja barata no bar e churras
em casa: Beatriz Xavier, Rayane Alves, Samira Moreira Alves, Thyago Naves, Rodrigo
Oliveira, Vinícius da Silva e Amanda Cunha. E os amigos que não estão na faculdade ao meu
lado no dia-a-dia, mas que fizeram a diferença na minha vida com muito carinho, amor,
conversas e companheirismo. Obrigada por me mostrar que tenho valor e que mereço
reciprocidade Léticia Mônica Silva Santos e Paulo Eduardo Godoy Nogueira.
Gostaria de agradecer de forma especial meu coorientador Bruno Brentan, por ser um
ótimo professor e orientador. Ele soube passar seu conhecimento com dedicação e maestria. É
um profissional generoso ao ensinar e nunca mediu esforços para nos ajudar no processo de
aprendizagem, tanto na teoria quanto na parte prática. Obrigada por entender minha limitação,
por extrair o meu melhor e acreditar no meu potencial. Por me fazer correções cuidadosas
melhorando minha escrita. Obrigada por ser meu coorientador, você é uma pessoa sensacional.
Mas, eu tenho muita sorte, já que além de ótimo coorientador, tenho a Lubienska Ribeiro
como orientadora. Uma peça chave nesses dois anos de mestrado, pois além de orientadora
fez o papel de amiga, criando um laço de confiança e admiração. Obrigada por estar sempre
por perto e entender nossas dificuldades, frustrações, lamentações e limitações. Por cuidar do
nosso emocional e nos estimular a não desistirmos e continuarmos firmes. Obrigada por ser
humana e nos lembrar de que podemos dar nosso melhor cuidando do psicológico.
Estou a 8 anos na Faculdade de tecnologia- FT e ao longo desses anos fiz muitas amizades
com os funcionários que me ajudaram e apoiaram ao longo desses anos. Obrigada por todo
carinho, afeto, conversas, cafezinho e comidinhas: Ivonei Teixeira, Emerson Verzegnassi,
Reginaldo Ferreira, Fátima Guerra, Patricia Gilberti, Gisleiva Ferreira, Ivan Oliveira, Luci
Nascimento e Rodrigo Silvestre. Além de grandes profissionais são ótimas pessoas, gente
como a gente. Agradeço a pós-graduação que sempre me atendeu e está fazendo um ótimo
trabalho e a todos os funcionários da secretária da pós.
Que o Brasil possa entender e reconhecer a importância da pesquisa para o
desenvolvimento do país. Desejo que as pesquisas sejam mais acessíveis à população
brasileira.
Gratidão.
Resumo
A contaminação acidental ou intencional de sistemas de distribuição de água (SDA) é um
problema de saúde pública. É de responsabilidade das companhias de abastecimento de água
garantir a qualidade e a distribuição do produto à população abastecida. O monitoramento da
qualidade da água para consumo humano, é passível de detecção tardia em caso de uma
contaminação. Com isso, estudos do monitoramento de SDA por alocação de sensores
possibilitam a detecção de compostos químicos anormais de forma rápida e eficiente. Os
sensores são dispositivos capazes de detectar alterações nos parâmetros de qualidade da água
em caso de contaminação. Devido ao orçamento restrito da companhia de abastecimento de
água e a necessidade de melhorar a segurança dos SDA, estudadas de otimização da alocação
de sensores proporcionam a minimização do custo e maximização da probabilidade de
detecção. Certas zonas da rede de água têm maior potencial de ataque do que outras,
dependendo da demanda, consumidores especiais, entre outras. Considerando esse cenário
estudos recentes aplicam diferentes probabilidades de contaminação nodal para alocação
ótimas de sensores, com o intuito de priorizar alguns nós da rede de distribuição de água
(RDA) para o monitoramento. Portanto, este trabalho apresenta uma análise dos cenários de
diferentes probabilidades de contaminação nodal e a influência sob um método clássico de
posicionamento ótimo do sensor. Substâncias químicas com alto teor de toxicidade e de
acesso facilitado estão sendo estudados como possíveis contaminantes a serem injetados no
SDA. Os pesticidas possuem alto teor de toxicidade e fácil acesso, podendo causar danos
irreversíveis a sociedade abastecida se injetado intencionalmente ao SDA. A contaminação é
feita pelas reações químicas do pesticida Paration (PA) em simulações de qualidade da água.
Para tanto, uma abordagem multiobjetivo é utilizada, comparando o efeito da incorporação
de modelo probabilístico de contaminação. A fronteira de Pareto é analisada pelos métodos
distância Euclidiana a um ponto ideal e agrupamento k-means, onde a matriz de cobertura é
usada para determinar os centros de cada cluster. O algoritmo genético multiobjetivo
proposto, o NSGA-II, foi capaz de gerar soluções não dominadas, para alocação ótima de
sensores. Os métodos de processamento pós Pareto foram capazes de apresentar um número
menor de soluções ótimas para o decisor, sendo satisfatória sua aplicação.
Palavras-chave: Abastecimento de água, Alocação de sensores, Algoritmos genéticos,
Algoritmo K-means.
Abstract
Accidental or intentional contamination of water distribution systems (WDS) is a public
health problem. It is the responsibility of water supply companies to ensure product quality
and distribution to the population. The monitoring of water quality for human consumption
can be detected late in case of contamination. Thus, WDS monitoring studies by sensor
allocation enable the detection of abnormal chemical compounds quickly and efficiently.
Sensors are devices capable of detecting changes in water quality parameters in case of
contamination. Due to the restricted budget of the water supply company and the need to
improve WDS security, sensor allocation optimization studies provide cost minimization and
detection probability maximization. Highly toxic and easily accessible chemicals are being
studied as possible contaminants to be injected into the WDS. Pesticides are highly toxic and
easily accessible and can cause irreversible damage to the supplied society if intentionally
injected into the WDS. Certain areas of the water network have greater attack potential than
others, depending on demand, special consumers. Therefore, this paper presents an analysis
of the probabilistic contamination scenarios and the influence under a classical method of
optimal sensor positioning. Contamination is done by chemical reactions of pesticide
Paration (PA) in water quality simulations. Therefore, a multiobjective approach is used,
comparing the effect of the incorporation of a probabilistic contamination model. The Pareto
boundary is analyzed by Euclidean distance methods to an ideal point and grouping k-means,
where the coverage matrix is used to determine the centers of each cluster. The proposed
multiobjective genetic algorithm, the NSGA-II, was able to generate non-dominated
solutions for optimal sensor allocation. The methods were able to present a smaller number
of optimal solutions for the decision maker, being their application satisfactory.
Keywords: Water-supply, Sensor placement, Genetic algorithms, K-means algorithm.

Lista de Figuras
3.1 Processo do Algoritmo NSGA-II . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.2 Exemplo de um simples sistema de distribuição de água . . . . . . . . . . . . . 49
4.1 Rede Fictícia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.1 Rede Simples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.2 Comportamento do cloro ao longo da simulação. . . . . . . . . . . . . . . . . . 70
5.3 Fronteira de Pareto para número de vriáveis iguais a 2 e 4 sensores. . . . . . . 71
5.4 Fronteira de Pareto com número de variáveis indeterminado. . . . . . . . . . . 71
5.5 Rede JYN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.6 Comportamento do cloro ao longo da simulação. . . . . . . . . . . . . . . . . . 74
5.7 Rede troncal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.8 Fronteiras de Pareto considerando as diferentes porcentagens de RT em
comparação com a abordagem clássica. . . . . . . . . . . . . . . . . . . . . . . 76
5.9 Fronteiras de Pareto considerando o FPC1 em comparação com a abordagem
clássica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
clássica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
clássica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
clássica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.13 Layout 20% RT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.14 Layout 30% RT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.15 Layout 50% RT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.16 Layout da rede de sensores usando a abordagem clássica. . . . . . . . . . . . . 83
5.17 Layout da rede de sensores usando FPC1. . . . . . . . . . . . . . . . . . . . . . 83
5.21 Pontos representativos com soluções k-means na Fronteira de Pareto - FPC1. . 87
5.25 Layout da rede de sensores - FPC1. . . . . . . . . . . . . . . . . . . . . . . . . . 90
Lista de Tabelas
3.1 Número mínimo de amostras e frequência para o controle da qualidade da

água de sistema de abastecimento, para fins de análises físicas, químicas e de
radioatividade, em função do ponto de amostragem, da população abastecida
e do tipo de manancial (Anexo 12 do Anexo XX). . . . . . . . . . . . . . . . . . 26
3.2 Número mínimo de amostras mensais para o controle da qualidade da água de
sistema de abastecimento, para fins de análises microbiológicas, em função da
população abastecida (Anexo 13 do anexo XX). . . . . . . . . . . . . . . . . . . 27
3.3 Resumo das abordagens analisadas na BWSN . . . . . . . . . . . . . . . . . . . 31
3.4 Seções utilizadas para a elaboração do arquivo de entrada (.msx). . . . . . . . . 47
3.5 Matriz de fração de água . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.1 Degradação do Paration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.2 Matriz de contaminação do primeiro cenário. . . . . . . . . . . . . . . . . . . . 57
4.3 Matriz de contaminação do primeiro cenário. . . . . . . . . . . . . . . . . . . . 58
4.4 Vetor considerando a alocação de 1 sensor para calculo de Z5. . . . . . . . . . 59
4.5 Resultado de Z5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.1 Soluções selecionadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.2 Coordenadas dos pontos ideais e soluções escolhidas. . . . . . . . . . . . . . . 82
5.3 Soluções represetativas dos grupos de cada Fronteira Pareto. . . . . . . . . . . 89
Lista de Abreviações
• ANVISA – Agência Nacional de Vigilância Sanitária
• BWSN – The Battle of the Water Sensor Networks (A Batalha das Redes de Sensores de
Água)
• CMC – Caminho mais curto
• DEA – Data Envelopment Analysis (Análise de Envoltória de dados)
• DPI – Desenvolver a distribuição de probabilidade de impacto
• DWD – Drinking Water Dire active (Diretiva Água Potável)
• EUA – Estados Unidos da América
• FPC – Função de probabilidade de Contaminação
• G-MOGA – Guided Multi-Objective Genetic Algorithm (Algoritmo Genético Orientado

MultiObjetivo)
• JYN – Rede Jiayou
• LPUE – Licença Pública da União Europeia
• MSR – Métodos de superfície de resposta
• 𝑛𝑠 – Número de sensores
• NSGA – Algoritmo genético multiobjetivo elitista
• NSGA-II – Algoritmo genético multiobjetivo
• 𝑃𝑖 – Probabilidade de contaminação
• PA – Paration
• PWB – Printed Wiring Board (Placa de fiação impressa)
• RAP – Redundancy allocation problem (Problema de alocação de redundância)
• RDA – Rede de Distribuição de Água
• RNF – Reservatórios de nível Fixo
• RNV – Reservatório Nivel variável

• RT – Rede Troncal
• SOM – Self-organized map (Mapa auto-organizado)
• SLOTS – sensors local optimal transformation system (Sistema de Transformação Ótima

Local dos Sensores)
• STD – Sólidos totais dissolvidos
• SVS – Secretária de Vigilância em Saúde
• TC – Taxa de Cobertura
• 𝑡𝑑 – Tempo de detecção de contaminante
• TDMC – Tomada de decisão multicritério
• 𝑡𝑗 – Tempo da primeira detecção
• TOPSIS – Técnica para Ordem de Preferência por Similaridade à Solução Ideal
• US. EPA – United States Environmental Protection Agency (Agência de Proteção

Ambiental dos Estados Unidos)
• VCMCA – Valor caminho mais curto acumulado
• WDS – Water Distribution Systems (Sistema de distribuição de água).

Sumário
1 Introdução 16
2 Objetivo 20
2.1 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Fundamentação Teórica 21
3.1 Controle de qualidade da água em SDA . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Métodos de otimização para alocação de sensores em RDA . . . . . . . . . . . 29
3.3 Algoritmos Evolutivos Mono e Multiobjetivo . . . . . . . . . . . . . . . . . . . 33
3.4 Pós processamento da fronteira Pareto . . . . . . . . . . . . . . . . . . . . . . 37
3.5 Teoria dos Grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5.1 Caminho mais curto em grafos . . . . . . . . . . . . . . . . . . . . . . 43
3.6 Simulação Hidráulica e de Qualidade da água . . . . . . . . . . . . . . . . . . . 45
3.7 Ferramenta de suporte à implementação . . . . . . . . . . . . . . . . . . . . . 48
3.8 Conceito de cobertura de demanda . . . . . . . . . . . . . . . . . . . . . . . . . 48
4 Metodologia 52
4.1 Simulação da qualidade da água . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.2 Alocação de sensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3 Função de probabilidade de contaminação- FPC . . . . . . . . . . . . . . . . . 60
4.3.1 FPC1- baseada na variação espacial de demanda nodal. . . . . . . . . . 60
4.3.2 FPC2-baseada nas distâncias de nós comuns para os nós de usuários
especiais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.3.3 Função de probabilidade de contaminação baseada na importância dos
nós nas redes principais (FPC3) e variação da porcentagem de rede
troncal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3.4 FPC4- Baseado nos usuários especias, distância entre nós e demanda
nodal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.4 Otimização das funções objetivo considerando as FPC’s. . . . . . . . . . . . . . 64
4.4.1 Tempo de detecção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.4.2 Probabilidade de Detecção . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.5 Abordagem de otimização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5 Resultados e discussões 68
5.1 Validação da metodologia em rede hipotética . . . . . . . . . . . . . . . . . . . 68
5.1.1 Descrição da Rede de distribuição de água . . . . . . . . . . . . . . . . 68
5.1.2 Abordagem NSGA-II e Extração de Regras . . . . . . . . . . . . . . . . 70
5.2 Aplicação da metodologia em rede real . . . . . . . . . . . . . . . . . . . . . . 72
5.2.1 Descrição da Rede de distribuição de água . . . . . . . . . . . . . . . . 72
5.2.2 Rede Troncal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3 Comparação entre as fronteiras finais de Pareto . . . . . . . . . . . . . . . . . 75
5.3.1 Variação das porcentagens de Rede Troncal . . . . . . . . . . . . . . . 75
5.3.2 Diferentes funções de probabilidade de contaminação . . . . . . . . . . 76
5.4 Comparações de soluções de layout usando a seleção automática . . . . . . . . 79
5.4.1 Layouts gerados pelo método Distância Euclidiana . . . . . . . . . . . 79
5.4.2 Analise da fronteira de Pareto pelo método k-means . . . . . . . . . . 86
6 Conclusões 93
Referências bibliográficas 95
16
Capítulo 1
Introdução
A segurança do Sistema de Distribuição de água (SDA) é uma questão abordada em

diferentes linhas de pesquisa nas áreas de tecnologia e engenharia, pois é um tema amplo e
engloba questões de saúde pública, econômicas e tecnológicas. Por abranger tantas questões
há uma preocupação em identificar possíveis intrusões de contaminantes por causa acidental
ou intencional no SDA. Com isso, diversos trabalhos na literatura (HART; MURRAY, 2010;
SCHWARTZ; LAHAV; OSTFELD, 2014b; PALLETI et al., 2016; HE et al., 2018; CARDOSO
et al., 2018) têm se preocupado em buscar tecnologias eficazes para tal fim.
Uma das tecnologias utilizada para melhorar o monitoramento da RDA são os sensores de
qualidade de água. Esses dispositivos são utilizados para monitorar parâmetros como cloro,
alcalinidade, turbidez e pH, e os transmitem a unidade de processamento. Quando o RDA é
exposto a contaminações tais parâmetros podem sofrer alterações, de tal modo que se bem
utilizados, podem servir como indicadores precoces de tais eventos (SETH et al., 2016;
PALLETI et al., 2016; ELIADES et al., 2015; ELIADES; POLYCARPOU, 2010; HART; MURRAY,
2010). A alocação ótima de sensores em RDA surgiu devido ao alto custo do dispositivo,
sendo economicamente inviável monitorar todos os pontos da RDA, e a necessidade de
melhorar a segurança de tais sistemas por meio do monitoramento da qualidade da água
mais efetivo (OHAR; LAHAV; OSTFELD, 2015; SCHWARTZ; LAHAV; OSTFELD, 2014a;
DOLORES, 2014).
Na área de Engenharia é comum enfrentar problemas de otimização em que existem
vários critérios ou objetivos que necessitem ser atendidos simultaneamente. O projeto da
rede de sensores deve atender a diferentes problemas de otimização que podem ou não
conflitar entre si. Vários métodos de otimização multiobjetivo foram avaliados na Batalha de
Capítulo 1. Introdução 17
Redes de Sensores de Água (BWSN) (OSTFELD et al., 2008) onde 15 diferentes abordagens de
alocação ótima de sensores para SDA foram comparadas, sendo os objetivos propostos: (Z1)
minimização do tempo de detecção, (Z2) minimização da população afetada antes da
detecção, (Z3) minimização do consumo esperado de água contaminada antes da detecção e
(Z4) maximização da probabilidade de detecção. Tais objetivos são conflitantes, entre si, logo
o problema pode ser entendido como a melhor solução possível que satisfaça os objetivos
simultaneamente. Com isso, há multiplobjetivos e restrições para serem consideradas se
tornando um problema de otimização multiobjetivo.
Diferente da abordagem mono-objetivo esse tipo de problema de otimização pode não ter
uma solução que seja melhor em relação a todos os objetivos. Em vez disso, há um conjunto
de soluções que são conhecidas como soluções Pareto-ótimas ou soluções não dominadas
(COELLO COELLO; LAMONT; VELDHUIZEN, 2002). As soluções desse conjunto, também
chamado de Fronteira de Pareto, representam o melhor compromisso entre os objetivos
conflitantes associados ao problema, portanto, qualquer um delas poderia ser escolhido
(DOLORES, 2014; CHIANDUSSI et al., 2012). Dessa forma, as companhias de abastecimento
de água podem utilizar as soluções encontradas para alocação de sensores como auxílio no
processo de tomada de decisão. Existem diversos métodos de otimização multiobjetivos que
podem ser aplicados a otimização da alocação ótima de sensores (RATHI; GUPTA;
ORMSBEE, 2015; HART; MURRAY, 2010; OSTFELD et al., 2008).
Embora vários métodos tenham sido desenvolvidos e estudados para resolver problemas
de otimização multiobjetivo, poucos trabalhos foram realizados no pós-processamento da
fronteira Pareto. Com isso, para facilitar a etapa de análise pós Pareto-ótima uma das formas
é diminuir o conjunto de soluções promissoras a partir do conjunto de soluções
Pareto-ótimas, sendo essa etapa desafiadora por conter um conjunto extremamente grande
ou até um número infinito de soluções (CHEIKH et al., 2010). Portanto, um método
automatizado que facilite essa etapa auxiliando o decisor para escolher a melhor solução
dentro do conjunto de soluções Pareto-ótimas é de grande utilidade, sendo possível com
métodos de análise pós processamento Pareto (CARPITELLA et al., 2018; CHAUDHARI;
DHARASKAR; THAKARE, 2010; VEERAPPA; LETIER, 2011; ZIO; BAZZO, 2012).
As abordagens clássicas de alocação ótima de sensores consideram a distribuição de
probabilidade de contaminação igual para todos os nós da rede (CARDOSO et al., 2018;
OHAR; LAHAV; OSTFELD, 2015; ELIADES et al., 2015; SCHWARTZ; LAHAV; OSTFELD,
2014b). Ou seja, todos os nós da rede independente de suas propriedades e localização na

RDA, terão a mesma probabilidade de ser atacado. Mas, em estudo realizado por He et al.
(2018), é proposto tratar o projeto de amostragem de maneira realista. Os autores
consideraram diferentes probabilidades de contaminação, considerando as regiões da RDA,
variação da densidade populacional, importância dos usuários (escolas, hospitais e
departamentos governamentais), entre outros. Com isso, analisaram quatro funções de
probabilidade de contaminação (FPC) diferentes e baseadas em: distribuição espacial das
demandas nodais (FPC1); comprimento do tubo imediatamente conectado aos nós (FPC2);
fluxos em tubos (FPC3); e propriedade do usuário (FPC4). Ao analisar diferentes
probabilidade de contaminação os autores identificaram as diferenças nas alocações de
sensores em comparação a abordagem clássica.
A importância de tubos na RDA pode estar relacionada ao comprimento do tubo, vazão
transportada e demanda nodal. A topologia das RDA pode ser interpretada como um grafo
orientado, logo ao abstrair a RDA como um grafo é possível aplicar o conceito de caminho
mais curto (CMC) (CAMPBELL, 2017). Do ponto de vista hidráulico, os CMC irão compor a
rede troncal (RT), que pode ser interpretada como uma árvore de tubos e nós nos quais as fontes
de suprimento formam as raízes. O CMC classifica os nós mais importantes quanto maior o
número de nós que ele pode alcançar, os valores correspondentes a cada nó são chamados de
valor do caminho mais curto acumulado (VCMCA) (CAMPBELL, 2017). Logo, quanto maior o
VCMCA em um determinado tubo, maior será sua importância dentro do grafo.
Ao simular a contaminação da RDA, buscando a alocação ótima de sensores, é necessário
analisar o comportamento de substâncias químicas com alto teor de toxicidade, com o intuito
de gerar cenários de contaminação ao longo do RDA. Para tanto, trabalhos anteriores
(CARDOSO et al., 2018; SCHWARTZ; LAHAV; OSTFELD, 2014a) analisaram o
comportamento de pesticidas organofosforados como possíveis contaminantes químicos da
RDA. Uma vez que, os pesticidas são substâncias de fácil acesso e alta toxicidade, podendo
causar disfunções do sistema nervoso e até a morte, caso consumido em grande quantidade,
são estudados como possíveis substâncias a serem introduzidas intencionalmente na RDA
(OHAR; LAHAV; OSTFELD, 2015). No estudo realizado por Duirk, Desetto e Davis (2009), os
pesticidas organofosforados são simulados como contaminantes. As substâncias quando em
contato com a água, que passou por um tratamento convencional (utilizando o cloro como
desinfetante), sofrem reações gerando subprodutos considerados ainda mais tóxicos do que
as substâncias primárias (DUIRK; DESETTO; DAVIS, 2009).
Considerando a importância do monitoramento de RDA frente aos riscos de
contaminação proposital por contaminantes químicos, como pesticidas, esse trabalho propõe
examinar o pesticida organofosforado Paration (PA) como um possível contaminante a ser
introduzido no RDA e diferentes probabilidades de contaminação nodal. Para isso, serão
realizadas simulações de eventos de contaminação que incorporem as reações químicas do
contaminante na modelagem da qualidade da água e analisem mudanças reais da
concentração de cloro, que possivelmente servirá como indicativo de contaminação. Assim, o
objetivo deste trabalho é aplicar um algoritmo multiobjetivo baseado na teoria dos
algoritmos genéticos ao problema de determinação da fronteira Pareto-ótima, para a alocação
dos sensores de qualidade da água em RDA e realizar uma análise de pós processamento da
Pareto.
Esses cenários serão utilizados para a alocação ótima dos sensores, feita com auxílio do
algoritmo genético multiobjetivo elitista NSGA-II na ferramenta Matlab. Esse trabalho está
dividido em: (1) Simulação da qualidade da água ao longo da RDA e injeção de contaminante
(PA); (2) otimização simultânea de três objetivos fundamentais: minimizar o tempo de detecção
(Z1) maximizar a probabilidade de detecção (Z4) e minimizar o número de sensores (Z5), em
primeira instância, em rede fictícia da literatura, e otimização das funções objetivo Z1 e Z4
considerando probabilidades de contaminação nodais diferentes aplicado em uma rede real
Jiayou (JYN) (HE et al., 2018) para demonstrar sua utilidade em condição hipotética; (3) Análise
das fronteiras Pareto por meio de dois métodos de tomada de decisão multicritério.
20
Capítulo 2
Objetivo
O objetivo principal desse trabalho é a alocação ótima de sensores de qualidade de água em

RDA com o emprego de um algoritmo multiobjetivo acoplado a métodos de pós processamento
da Pareto considerando diferentes probabilidades de contaminação nodal.
2.1 Objetivos Específicos

I. Desenvolver um modelo de contaminação utilizando a ferramenta Epanet MSX em
ambiente Matlab;
II. Aplicar o método de otimização multiobjetivo algoritmo genético NSGA-II

implementado ao problema de determinação da melhor alocação de sensores de
qualidade da água, procurando obter soluções que otimizem simultaneamente três
objetivos;
III. Analisar a influência de diferentes probabilidade de contaminação nodal na alocação

ótima de sensores;
IV. Avaliar a fronteira Pareto por dois métodos de análise pós Pareto.
21
Capítulo 3
Fundamentação Teórica
Este capítulo é composto por oito seções principais, na quais são apresentadas as
fundamentações teóricas para cada etapa desse trabalho, sendo: Controle de qualidade da
água em SDA; Métodos de otimização para alocação de sensores em RDA; Algoritmos
Evolutivos Mono e Multiobjetivo; Pós processamento da fronteira Pareto; Teoria dos Grafos;
Simulação Hidráulica e de Qualidade da água; Ferramenta de suporte à implementação;
Conceito de cobertura de demanda.
3.1 Controle de qualidade da água em SDA

No final do século XIX e início do século XX a qualidade da água deixa de ser analisada por
meio de aspectos estéticos (odor, cor e gosto), para ser analisada por meio de aspectos físico-
químicos (FREITAS; FREITAS, 2005). Isso se deve as descobertas das transmissões de doenças
de veiculação hídrica. O surto de cólera em Londres fez com que John Snow, em 1855, provasse
que a contaminação de poços de abastecimento, por esgoto, poderia causar danos à saúde da
população, sendo essa uma entre várias descobertas que alavancaram os avanços nesta área de
pesquisa (FREITAS; FREITAS, 2005). O tratamento de água com o uso de desinfetante, como
o cloro, é feito há várias décadas. Os Estados Unidos aplicou o tratamento de água através
da cloração na cidade de New Jersey, em 1908, enquanto na Europa, no mesmo período foi
utilizado outro desinfetante, o ozônio (COUNCIL, 1980).
A primeira de potabilidade da água para o consumo humano surgiu nos Estados Unidos
(EUA), em 1974. A Safe Drinking Water Act, determinou que toda água distribuída pela
companhia de abastecimento deveria seguir os valores máximos permitidos de elementos
Capítulo 3. Fundamentação Teórica 22
orgânicos, inorgânicos e microbiológicos, respeitando os padrões de potabilidade e

assegurando água sem riscos ou danos a saúde humana. Atualmente a Agência de Proteção
Ambiental dos EUA, United States Environmental Protection Agency (USEPA), é a responsável
pela norma (COUNCIL, 1980).
Na Europa a norma Drinking Water Directive (DWD) 98/83/CE, é a responsável por
garantir a qualidade da água para o consumo humano em todo território europeu, uma vez
que foi concebida especificamente para proteger a população de possíveis efeitos nocivos por
água contaminada, se preocupando em garantir o produto saudável ao consumo humano
(DIRECTIVA. . ., 1998). A última revisão da Diretiva 98/83/CE aconteceu em 2015. Esse
procedimento ocorre a cada cinco anos, com intuito de discutir novas tendências de
gerenciamento de riscos para o setor, com o “plano de segurança da Água”, e definir
estratégias para gestão do sistema de produção de água, como a reavaliação dos valores
máximos permitidos (DIRECTIVA. . ., 1998).
Os padrões de potabilidade da água para o consumo humano no Brasil foram assegurados
com o Decreto Federal nº 79.367 em março de 1977. O mesmo definiu que o Ministério da
saúde seria o órgão responsável pela fiscalização e cumprimento das normas e padrões de
potabilidade da água para consumo humano, em todo país, através da Portaria nº 56 Bsb/77,
publicada no mesmo ano (FREITAS; FREITAS, 2005). Durante os anos seguintes a portaria
passou por revisão até a nova publicação em 29 de dezembro de 2000 da Portaria nº 1469, onde
estabeleceu o controle de vigilância da qualidade da água para consumo humano e seu padrão
de potabilidade (FREITAS; FREITAS, 2005).
Atualmente a PORTARIA DE CONSOLIDAÇÃO Nº 5, DE 28 DE SETEMBRO DE 2017.
(2017), determina no anexo xx, capítulo III, seção I, art. 6 que as competências e
responsabilidades da União serão exercidas pelo Ministério da Saúde e entidades a ele
vinculadas. Dessa forma, compete à secretária de vigilância em saúde do estado, distrito
federal e dos municípios promover e acompanhar a vigilância da qualidade da água para
consumo humano (Art.7, I). Já a Agência Nacional de Vigilância Sanitária (ANVISA) cabe
exercer a vigilância da qualidade da água nas áreas de portos, aeroportos e passagens de
fronteiras terrestres (Art.10). A elaboração dos procedimentos voltados ao monitoramento da
RDA que garantem a distribuição da água com qualidade e segura ao consumo humano
devem atender as normas nacionais ou internacionais mais recentes, tais como: Standard
Methods for the Examination of Water and Wastewater, American Water Works Association e
Water Environment Federation; United States Environmental Protection Agency; Normas

publicadas pela International Standartization Organization; e Metodologias propostas pela
Organização Mundial à Saúde (Art.22).
O padrão de potabilidade exigido na PORTARIA DE CONSOLIDAÇÃO Nº 5, DE 28 DE
SETEMBRO DE 2017. (2017), inclui parâmetros químicos, físicos, biológicos e de
radioatividade. Os mesmos devem ser analisados e quantificados antes da destinação do
produto ao consumo humano, com isso algumas das suas exigências são:
• Cabe às Secretarias de Saúde dos Estados encaminhar aos responsáveis pelo

abastecimento de água quaisquer informações referentes a investigaçações de surtos
relacionado à qualidade da água para consumo humano (Art. 11, VI);
• Cabe às Secretarias de Saúde dos Municípios exercer a vigilância da qualidade da água em

sua área de competência, em articulação com os responsáveis pelo controle da qualidade
da água para consumo humano (Art.12, I);
• Cabe às Secretarias de Saúde dos Municípios inspecionar o controle da qualidade da

água produzida e distribuída e as práticas operacionais adotadas no sistema ou solução
alternativa coletiva de abastecimento de água, notificando seus respectivos responsáveis
para sanar a(s) irregularidade(s) identificada(s) (Art.12, III);
Cabe ao responsável pelo sistema ou solução alternativa coletiva de abastecimento de água

para consumo humano (Art. 13):
• exercer o controle da qualidade da água (Art.13, I);
• garantir a operação e a manutenção das instalações destinadas ao abastecimento de água

potável em conformidade com as normas técnicas da Associação Brasileira de Normas
Técnicas (ABNT) e das demais normas pertinentes (Art.13, II);
• monitorar a qualidade da água no ponto de captação, conforme estabelece o art. 40

(Art.13, VII);
• proporcionar mecanismos para recebimento de reclamações e manter registros

atualizados sobre a qualidade da água distribuída, sistematizando-os de forma
compreensível aos consumidores e disponibilizando-os para pronto acesso e consulta
pública, em atendimento às legislações específicas de defesa do consumidor (Art. 13,

X);
• comunicar imediatamente à autoridade de saúde pública municipal e informar

adequadamente à população a detecção de qualquer risco à saúde, ocasionado por
anomalia operacional no sistema e solução alternativa coletiva de abastecimento de
água para consumo humano ou por não-conformidade na qualidade da água tratada,
adotando-se as medidas previstas no art. 44 (Art. 13 XI);
• assegurar pontos de coleta de água na saída de tratamento e na rede de distribuição, para

o controle e a vigilância da qualidade da água (Art. 13, XII).
O anexo XX, capítulo V da Portaria de consolidação 05/17, também determina o padrão de

potabilidade, logo:
• Na seleção dos locais para coleta de amostras devem ser priorizadas pontas de rede e
locais que alberguem grupos populacionais de risco (Art.28, 2);
• É obrigatória a manutenção de, no mínimo, 0,2 mg/L de cloro residual livre ou 2 mg/L
de cloro residual combinado ou de 0,2 mg/L de dióxido de cloro em toda a extensão do
sistema de distribuição (reservatório e rede) (Art. 34);
• Recomenda-se que, no sistema de distribuição, o pH da água seja mantido na faixa de

6,0 a 9,5(Art.39, 1);
• Recomenda-se que o teor máximo de cloro residual livre em qualquer ponto do sistema
de abastecimento seja de 2 mg/L (Art.39, 2);
Os responsáveis pelo controle da qualidade da água de sistema e solução alternativa

coletiva de abastecimento de água para consumo humano deve elaborar e submeter os planos
de amostragem para análise da autoridade municipal de saúde pública, o plano de
amostragem de cada sistema e solução, respeitando os planos mínimos de amostragem
expressos nos anexos 11, 12, 13 e 14 do anexo XX (Art.41). A amostragem deve obedecer aos
seguintes requisitos:
• distribuição uniforme das coletas ao longo do período (Art.41, I);

• representatividade dos pontos de coleta no sistema de distribuição (reservatórios e

rede), combinando critérios de abrangência espacial e pontos estratégicos, entendidos
como: aqueles próximos a grande circulação de pessoas (terminais rodoviários,
terminais ferroviários, entre outros); edifícios que alberguem grupos populacionais de
risco, tais como hospitais, creches e asilos; aqueles localizados em trechos vulneráveis
do sistema de distribuição como pontas de rede, pontos de queda de pressão, locais
afetados por manobras, sujeitos à intermitência de abastecimento, reservatórios, entre
outros; e locais com sistemáticas notificações de agravos à saúde tendo como possíveis
causas os agentes de veiculação hídrica (Art. 41, II).
O controle da qualidade de SDA é realizado através de coleta de um número mínimo de

amostras em pontos estratégicos, a fim de analisar os parâmetros químicos, físicos e de
radioatividade. As Tabela 3.1 e 3.2 apresentam o número mínimo e frequência de amostras
para o controle da qualidade da água de sistema de abastecimento, em função do ponto de
amostragem, da população abastecida e do tipo de manancial.
Tabela 3.1: Número mínimo de amostras e frequência para o controle da qualidade da água
de sistema de abastecimento, para fins de análises físicas, químicas e de radioatividade, em
função do ponto de amostragem, da população abastecida e do tipo de manancial (Anexo 12
do Anexo XX).
Saída do Tratamento Sistema de distribuição
Tipo de Nº Amostras Frequência

Parâmetro
◦
Manancial N Amostras Frequência População abastecida (hab)
50.000 a 50.000 a
<50.000. >250.000 <50.000 >250.000
250.000 250.000
Superficial 1 a cada 2h 10 1 p/ cada 5mil. 40+ (1 p/cada25 mil) mensal

Cor
Subterrâneo 1 semanal 5 1 p/ cada 10mil 20+ (1 p/ cada 50 mil) mensal
Turbidez,cloro Superficial 1 a cada 2h Conforme 3º do Conforme 3º do
residual livre (1),Dióxido Subterrâneo 1 2 vezes/semana art.41 art. 41
de cloro (1) Superficial 1 a cada 2h

pH e fluoreto Dispensada a análise Dispensada a análise
Subterrâneo 1 2 vezes/semana
semanal quando o
n◦ de
Cianotoxinas Superficial 1 Dispensada a análise Dispensada a análise
cionobactérias
200.000 cél/ml
Produtos secundários Superficial 1 trimestral 1(2) 4(2) 4(2) Trimestral
da desinfecção dispensada dispensada

Subterrâneo 1(2) 1(2) 1(2) anual semestral semestral
a análise a análise
Superficial
Demais parâmetros
ou 1 Semestral 1(5) 1(5) 1(5) Semestral
(3)(4)
Subterrâneo
1
Análise exigida de acordo com o desinfetante utilizado
2
As amostras devem ser coletadas, preferencialmente, em pontos de maior tempo de detenção da água no sistema de distribuição
3
A definição da periodicidade de amostragem para o quesito de radioatividade será definido após o inventário inicial, realizado semestralmente no período
de 2 anos, respeitando a sazonalidade pluviométrica
4
Para agrotóxicos, observar o disposto no parágrafo 5º do artigo 41.
5
Dispensada análise na rede de distribuição quando o parâmetro não for detectado na saída do tratamento e, ou, no manancial, à exceção de substâncias que
potencialmente possam ser introduzidas no sistema ao longo da distribuição.
Fonte: (PORTARIA. . ., 2017).

Tabela 3.2: Número mínimo de amostras mensais para o controle da qualidade da água de
sistema de abastecimento, para fins de análises microbiológicas, em função da população
abastecida (Anexo 13 do anexo XX).
Saída do Tratamento Sistema de distribuição

Parâmetro
(Númerode amostras População abastecida
por unidade de (hab)
Coliformes tratamento)
<5.000 5.000 a 20.000 20.000 a 250.000 >250.000
totais Duas amostras semanais (1)
105+ (1 p/ cada
Escherichia 1 para cada 30+(1 p/
10 5.000 hab.)
coli 500 hab. cada 2.000 hab.)
máx. de 1.000
1
Recomenda-se a coleta de, no mínimo, quatro amostras semanais.
Fonte: (PORTARIA. . ., 2017).
Mesmo com a existência de normas reguladoras de qualidade da água para o consumo

humano, o monitoramento realizado pelas companhias se mostra falho, uma vez que os SDA
sofrem com contaminações acidentais e mostram-se vulneráveis devido a sua geografia
distribuída e diversos pontos de acesso, expondo-se a um possível ataque (ELIADES et al.,
2015). O levantamento realizado por Gleick (2006) de conflitos relacionados à água, com a
intenção de prejudicar a população ou indivíduos de benefícios ambientais em prol de um
interesse político ou social, demonstra essa vulnerabilidade.
Dentre os conflitos relatados por Gleick (2006) de 1700 até 2006 estão os ataques com
produtos químicos. Em destaque, no ano de 1970, nos Estados Unidos da América (EUA), um
grupo que se opõem ao imperialismo americano e à guerra do Vietnã, chamados de
Weathermen, tentam obter agentes biológicos para contaminar os SDA dos centros urbanos.
Na Alemanha, em 1973, um químico ameaçou contaminar os sistemas de abastecimento de
água com bacilos de antraz e clostridium botulinum caso não recebesse uma quantia de 8,5
milhões de dólares. Os sistemas de abastecimento de água das cidades de Nova York, Chicago
e Washington foram ameaçados por um grupo religioso chamado The Covenant, the Sword,
and the Arm of the Lord em 1985, o objetivo era assassinato em massa em nome de uma
missão divina. Para tanto, os mesmos dispunham de 30 galões de cianeto de potássio como
contaminante.
Já no ano 2000, trabalhadores da usina química Cellatex, localizada no norte da França,
após terem benefícios negados, despejaram 5000 litros de ácido sulfúrico em um afluente do
rio Meuse. Em 2001 o abastecimento de água de seis aldeias foi cortado pelas autoridades
Filipinas, após identificarem um cheiro anormal nas torneiras. As autoridades já estavam em
alerta, pois haviam recebido ameaças de envenenamento do abastecimento de água da cidade
de Isabela, ilha de Basilan, dos guerrilheiros de Abu Sayyaf. Em 2002 a polícia italiana prendeu
quatro marroquinos, suspeitos de envolvimento com a Al-Qaeda, por planejarem contaminar
o sistema de abastecimento de água, em Roma. O ataque seria realizado com produto químico
à base de cianeto, incluindo como alvo o edifício da embaixada dos EUA.
Gleick (2006) ainda descreve a descoberta do FBI, em 2002, durante a prisão de um cidadão
libanês em Seattle, recrutador da Al-Qaeda com sede em Londres. Os documentos apreendidos
mostraram o interesse de envenenamento de fontes de água e a busca por informações sobre
abastecimento de água e gestão de água residual nos EUA e no exterior. Com isso em 2003, o
sistema de água dos EUA sofreu ameaça de envenenamento da Al-Qaeda. O último relato de
Gleick (2006), relacionado a envenenamento, ocorreu em 2003-2004 na guerra civil no Sudão,
onde poços de água em Khasan Basao em Dafur foram contaminados como estratégia contra
a população.
Já no Brasil, em 2017 ocorreu a poluição acidental do Rio Atibaia, localizado na cidade de
Sumaré, interior de São Paulo, responsável pelo abastecimento de aproximadamente 70% da
cidade, por meio de Fenol (produto químico industrial) (UOL, s.d.). Outro caso de
contaminação, no Brasil, foi identificado pela Agência Tocantinense de Saneamento,
responsável pelo abastecimento da cidade de Santa Rosa do Tocantins, por um produto
químico não identificado, que levou a paralisação do abastecimento por três dias (PORTAL
G1, s.d.).
Ao estudar o comportamento de contaminantes ao longo da RDA é importante levar em
consideração que a rede possui grande extensão, sendo constituídas por centenas ou milhares
de quilômetros de tubulação; padrões de abastecimento e a demanda variando no tempo e
segundo as necessidades dos clientes; sistemas de distribuição malhados, promovendo a
mistura e diluição de possíveis contaminantes (HART; MURRAY, 2010). Com isso, as
condições de monitoramento por parte das companhias de abastecimento de água podem ser
ineficientes em caso de contaminação, podendo causar danos irreversíveis à sociedade
(ELIADES et al., 2015).
Com a evidência da vulnerabilidade das RDA e com o monitoramento limitado da
qualidade da água por meio da coleta de amostras identifica-se uma dificuldade em garantir
ao consumidor a confiança necessária à água fornecida. Justifica-se, desta forma, a

necessidade de evoluir para metodologias mais eficientes de monitoramento da qualidade da
água. Logo, a implantação de equipamentos de monitoramento contínuo da qualidade da
água pode ser uma forma para mitigar esse problema.
3.2 Métodos de otimização para alocação de sensores em

RDA
Os sensores são dispositivos empregados para o monitoramento de parâmetros de qualidade
da água na RDA, como a concentração de cloro, condutividade, turbidez e pH, uma vez que
muitos desses parâmetros serão alterados em caso de uma contaminação (PALLETI et al.,
2016; ELIADES et al., 2015; HART; MURRAY, 2010). A rede de sensores tem a função de
coletar os dados dos parâmetros de qualidade da água com comportamentos pré-definidos no
SDA, e os transmitirem para a unidade central de processamento (IQBAL et al., 2016). Para
uma detecção efetiva por meio desses dispositivos é necessário que os mesmos sejam capazes
de distinguir entre o padrão normal de variação dos parâmetros da qualidade da água e os
decorrentes de uma contaminação (MURRAY et al., 2010). Dessa forma, existem sensores
diretos e indiretos, ou seja, capazes de detectar contaminantes específicos ou que detectam
alterações significativas na qualidade da água, respectivamente (DOLORES, 2014).
Os estudos de alocação de sensores surgiu devido à necessidade da segurança das redes
de distribuição de água e a problemática envolvida ao custo do dispositivo, que impossibilita
economicamente o monitoramento de todos os nós da RDA (SANKARY; OSTFELD, 2017;
PALLETI et al., 2016; RATHI; GUPTA; ORMSBEE, 2015). Há diferentes tipos de estratégias
para a localização ótima de sensores. Segundo o levantemente feito por Hart e Murray (2010)
três estratégias podem ser destacadas. A primeira é a opinião de especialistas (BERRY et al.,
2005), onde não há a utilização de um modelo computacional, pois os melhores locais são
julgados a partir da análise humana. A segunda é o método de classificação apresentado no
trabalho de Xu et al. (2008), onde um conjunto de informações são analisadas por
especialistas e utilizadas, posteriormente, para classificar os melhores pontos onde julgam
cobrir uma maior extensão do RDA. E por último os métodos de otimização, que possibilitam
calcular computacionalmente um projeto de redes de sensores, buscando minimizar o custo
de implantação e maximizar o nível de proteção da RDA, de forma automatizada (OSTFELD;

SALOMONS, 2006; PREIS; OSTFELD, 2006).
Após o atentado de 11 de setembro de 2001 nos EUA pesquisas sobre a otimização de
alocação de sensores para detecção de contaminantes em RDA cresceu significativamente,
surgindo diferentes abordagens algorítmicas (ALLMANN; CARLSON, 2005). Com o objetivo
de comparar o desempenho de soluções para rede de sensores a The Battle of the Water Sensor
Networks (BWSN), foi um desafio lançado por pesquisadores da área com intuito de comparar
as metodologias por meio de um conjunto de regras comuns em duas redes de abastecimento
de água. A BWSN ocorreu em paralelo ao 8th Annual Water Distribution Systems Analysis
Symposium, em 2006, na cidade de Cincinnati, Ohio, EUA (DOLORES, 2014). As regras
pré-definidas foram formalizadas na BWSN (OSTFELD et al., 2008) e 15 metodologias de
diferentes grupos de pesquisas analisadas. As regras incluíam as características dos eventos
de contaminação e os objetivos a considerar na avaliação das soluções. As funções objetivo
propostas na BWSN foram: (Z1) minimizar o tempo de espera de detecção, (Z2) minimizar a
população afetada esperada antes da detecção, (Z3) minimizar o consumo esperado de água
contaminada antes da detecção e (Z4) maximizar da probabilidade de detecção.
Os projetos da rede de sensores propostos para a detecção dos ataques nas duas redes de
abastecimento de água disponibilizadas na BWSN, deveriam atender aos diferentes problemas
de otimização. As funções objetivo propostas Z1, Z2 e Z3 são funções de minimização enquanto
a Z4 é de maximização e por tanto são conflitantes entre si, tratando-se de uma otimização
multiobjetivo. Em otimização multiobjetivo a solução admissível deve ser não dominada, ou
seja, caracteriza-se por não existir outra solução admissível que melhore simultaneamente
todos os objetivos (DOLORES, 2014). A Tabela 3.3 apresenta de forma resumida as abordagens
de otimização analisadas na BWSN.
Apesar das diversas metodologias multiobjetivo apresentadas na Tabela 3.3 para a
otimização da localização de sensores, não foi definida uma solução única, que represente
todas. Mas, as comparações dos resultados ampliaram as possibilidades de escolha dos
diferentes algoritmos matemáticos para cada caso a ser estudado. Algoritmos multiobjetivo
têm sido amplamente utilizados na última década para a alocação ótima de sensores.
Tabela 3.3: Resumo das abordagens analisadas na BWSN
Autores Abordagem
Algoritmos
Alzamora e Ayala
topológicos
Formulação p-mediana adaptada da teoria de

Berry et al.
localização discreta, utilizando um método heurístico.
Método de otimização
Dorini et al. multiobjectivo com restrições designado “noisy cross entropy sensor
locator (nCESL)”.
Método multiobjetivo, utilizando um

Eliades e Polycarpou
algoritmo de "aprofundamento iterativo das soluções de Pareto"
Heurística baseada na procura, localizando os
Ghimire et al. sensores na proximidade dos nós de maior consumo de água ou então na maior
quantidade de massa libertada.
Metodologia de otimização baseada em

Guan et al.
algoritmos genéticos, com agregação dos quatro objetivos num único objetivo.
Modelo predador-presa aplicado à

Gueli
otimização multiobjetivo, baseado em um processo de evolução
Huang et al. Algoritmo genético multiobjectivo e data mining.
Algoritmo greedy complementado com uma
Krause et al. estratégia de simulated annealing, ou seja considerando os efeitos dos
cenários não detectados
Algoritmo genético
Ostfeld e Salomons
multiobjetivo elitista II (NSGA-II)
Algoritmo genético
Preis e Ostfeld
multiobjetivo elitista NSGA-II
Propato e Piller Programa linear de inteiros-mistos
Abordagem de engenharia selecionando locais com base
em fatores racionais tais como, distribuição

Trachtman
Os autores do trabalho (HART; MURRAY, 2010) fizeram um levantamento com mais de

100 artigos publicados sobre alocação ótima de sensores, onde foram analisadas diferentes
abordagens até o ano da publicação. Uma revisão mais recente da literatura foi realizada por
Rathi, Gupta e Ormsbee (2015) dentre os diversos trabalhos apresentados estão os que
utilizaram métodos multiobjetivo de otimização.
Cada estudo apresentado por Rathi, Gupta e Ormsbee (2015) utilizou uma abordagem
diferente para a localização de sensores: Ehsani e Afshar (2011) otimizaram duas funções
objetivo, sendo minimizar o tempo de detecção e maximizar a probabilidade de detecção.
Para tanto foi utilizada a abordagem Algoritmo genético multiobjetivo elitista (NSGA)
buscando soluções pertencentes à frente de Pareto para a alocação de sensores, com seleção
da solução ótima. Além disso, atribuíram penalidade para eventos não detectados com o
intuito de examinarem a minimização do tempo de detecção por meio da abordagem
algoritmo genético. Com isso, observaram que ambas as abordagens possuem bom
desempenho. A diferença é que a abordagem de mono-objetivo algoritmo genético gera uma
única solução, enquanto a abordagem NSGA fornece um conjunto de soluções Pareto-ótima.
Krause et al. (2008) sugeriram formulações multiobjetivos simples e ponderadas, cuja
maximização resultou na redução dos impactos totais do sistema associados a cenários de
contaminação. Os autores sugeriram uma abordagem heurística para a alocação de sensores,
tendo como objetivo o tempo de detecção e a população exposta. Além disso, a solução
inicial gerada pelo algoritmo greedy foi melhorada ao utilizar a estratégia Simulated
Annealing. Comboul e Ghanem (2013) consideraram incertezas nas demandas nodais e nos
dados coletados pelos sensores no projeto. Para tanto, a formulação proposta por Krause
et al. (2008) foi alterada e resolvida usando um algoritmo greedy.
Cozzolino et al. (2011) devido à incerteza do local e o momento do início dos ataques e a
variabilidade das condições hidráulicas na RDA, criou a distribuição de probabilidade de
impacto (DPI) para considerar a variabilidade aleatória. Dois objetivos diferentes para a
alocação ótima de sensores foram comparados: o primeiro minimiza o valor esperado de uma
medida de dano convencional, enquanto o segundo minimiza um dado percentual da DPI,
utilizando abordagem algoritmo genético na implementação. Como resultados os dois
objetivos foram aplicados a um estudo de caso real, mostrando sua viabilidade.
Dorini et al. (2010) considerou minimizar a população exposta juntamente com a
maximização da probabilidade de detecção, tendo como referência a formulação de Krause
et al. (2008), com o intuito de obter a alocação ótima de sensores por meio do método
heurístico Sistema de Transformação Ótima Local dos Sensores (SLOTS). Fizeram a
comparação do método heurístico com outros algoritmos greedy e analisaram a sensibilidade
do algoritmo ao atribuirem diferentes entradas. Xu et al. (2010) sugeriram dois modelos
robustos para a minimização da população exposta e maximização da probabilidade de
detecção. Com a atribuição de pesos relativos conseguiram converter as duas funções
objetivo em um único objetivo. O método heurístico SLOTS foi sugerido para resolver o
problema de ótimização para a alocação de sensores.
Guidorzi, Franchini e Alvisi (2009) utilizaram a abordagem algoritmo genético
multiobjetivo elitista II (NSGA-II) para a otimização de dois processos, detecção da presença
de um contaminante e implementação de ações para isolar rapidamente o ponto
contaminado. Weickgenannt et al. (2010) utilizou a mesma abordagem de otimização para
alocação de sensores, buscando a minimização do volume de água contaminada consumida e
o número de falsos positivos. Como mostrado anteriormente, durante os últimos anos, vários
algoritmos evolutivos multiobjetivo foram sugeridos. Isso se deve ao fato de os métodos de
otimização se diferenciarem dos métodos clássicos de otimização, pois lidam
simultaneamente com um conjunto de possíveis soluções (população), que permite a geração
de vários elementos do conjunto de soluções Pareto-ótimas, em uma única “execução”.
3.3 Algoritmos Evolutivos Mono e Multiobjetivo

A computação evolucionária inspirou-se em sistemas naturais como a evolução biológica
para o desenvolvimento de métodos computacionais. O algoritmo genético faz parte desse
campo, sendo o método de otimização e pesquisa baseada na teoria da evolução de Darwin,
no processo de evolução natural e sobrevivência dos indivíduos mais adaptados
(CHIANDUSSI et al., 2012). Esse método envolve operações básicas sendo: avaliação de
desempenho (fitness), seleção, recombinação (crossover) e mutação (MITCHELL, 1996).
Logo, um grupo de soluções é gerado aleatoriamente no espaço de busca. Cada elemento
da populaçao é representado por um ponto no espaço de busca, e a codificação desse vetor de
solução é apresentada como a de um cromossomo. A cada iteração, há substituição total ou
parcial das soluções da iteraçao (geração) anterior, através de recombinação (crossover) ou
mutação dos elementos. Logo ocorre a evolução da população de soluções, até que se atinja
um número limite de gerações. A avaliação do desempenho da solução é realizada em cada

geração através do valor de fitness, podendo esse ser apenas o valor da função objetivo ou
incorporar elementos de avaliações adicionais. Dessa forma, os descendentes são fruto dos
elementos com melhor desempenho selecionados por recombinação e por mutação, segundo
uma dada probabilidade. O valor da fitness define a probabilidade de um cromossomo da
população anterior ser reproduzido na geração seguinte, em cada etapa de evolução. Ou seja,
a probabilidade de que as características dos melhores indivíduos se perpetuem nas novas
gerações é maior (MITCHELL, 1996) .
Várias metodologias de alocação ótima de sensores utilizaram a abordagem algoritmo
genético. Al-zahrani e Moied (2003) se basearam no conceito de cobertura de demanda, onde
a qualidade da água do nó a jusante é menor que a do nó a montante. Para auxiliar na
identificação de estações de monitoramento da qualidade da água, em uma RDA, foi gerada
uma matriz de cobertura e aplicada a abordagem algoritmo genético. Dessa forma, foram
identificados os melhores nós para a alocação das estações de monitoramento, possibilitando
a maximização da cobertura da demanda. A metodologia foi verificada em duas redes da
literatura.
Ostfeld e Salomons (2005) propuseram uma metodologia para identificar o layout ideal
de um sistema de alerta precoce, composto por um conjunto de estações de detecção, com
intuito de melhorar a segurança dos SDA do municípios. Para tanto, a metodologia foi dividida
em duas etapas, sendo: construção de uma matriz de poluição aleatória (MPA) e a cobertura
máxima da coluna da MPA usando algoritmo genético. Ostfeld e Salomons (2006) basearam-se
na metodologia proposta por Ostfeld e Salomons (2005), mas consideraram a aleatoriedade da
taxa de fluxo dos contaminantes injetados, nas demandas dos consumidores e a sensibilidade
de detecção e tempo de resposta dos sensores frente a alocação de estação de monitoramento.
Já Schwartz, Lahav e Ostfeld (2014b) apresentaram uma metodologia que integra a
análise hidráulica e a química detalhada ao simular a injeção do pesticida organofosforado
como possível contaminante ao longo do SDA. Dessa forma, foi gerada uma matriz de
poluição, capaz de fornecer uma estimativa da população afetada, sendo os resultados
utilizados para determinar a alocação ótima dos sensores e a minimização da população
exposta, por meio da abordagem algoritmo genético.
Em problemas reais de projeto de engenharia são necessários métodos que busquem
soluções que otimizem simultaneamente uma ampla gama de critérios diferentes. Por
resolver problemas matemáticos complexos de forma simples os algoritmos evolutivos têm

sido largamente explorado em problemas de otimização multiobjetivo (MITCHELL, 1996). No
entanto as funções objetivo podem ser conflitantes, ou seja, a melhoria de um dos objetivos
degrada os demais. Com isso, é necessário encontrar o melhor conjunto de soluções não
dominadas a partir do método de otimização multiobjetivo.
A abordagem NSGA-II (DEB et al., 2002) aplicada ao problema de alocação de sensores
em RDA, permite uma seleção equilibrada sobre as funções objetivos. Logo, o conjunto de
soluções Pareto-ótimas consideram igualmente a importância de cada função objetivo, gerando
as melhores soluções não-dominadas para a alocação de sensores. Uma solução não-dominada
é caraterizada por: “não existir outra solução admissível (i.e., satisfazendo um dado conjunto de
restrições) que melhore simultaneamente todos os objetivos: a melhoria numa função objetivo
só pode ser alcançada à custa da degradação do valor de pelo menos uma outra função objetivo
do modelo matemático” (ANTUNES; ALVES; JOÃO, 2012). A diferença entre a abordagem
NSGA-II e as abordagens de algoritmos genéticos mono-objetivo, está no modo com que o
operador seleção é empregado na recombinação e na mutação (COELLO COELLO; LAMONT;
VELDHUIZEN, 2002).
Com isso, o procedimento irá se repetir até que todos os indivíduos estejam classificados
em alguma frente. Em segunda instância, no caso de pertencerem à mesma frente, ocorre a
classificação pelo ordenador de diversidade (crowding distance), que ordena os indivíduos de
forma a atribuir precedência aqueles que estiverem em regiões menos “povoadas” do espaço
de objetivo. Logo, a aptidão a ser empregada no processo de seleção é calculada pelos
procedimentos denon-dominated sorting e de crowding distance, onde os indivíduos mais
aptos da geração atual são selecionados (Figura 3.1).
Esses indivíduos são utilizados para gerar uma nova população por cruzamento e a
seleção é realizada por meio da técnica chamada de “torneio binário”, onde dois indivíduos da
população são escolhidos aleatoriamente e o melhor entre os dois é selecionado para passar a
próxima geração. Terminado esse processo a nova população gerada é combinada com a
população anterior. A mutação irá ocorrer após o cruzamento já que causa uma perturbação
nas soluções da população vigente, gerando novas soluções (COELLO COELLO; LAMONT;
VELDHUIZEN, 2002).
Figura 3.1: Processo do Algoritmo NSGA-II
Classificação em frente
Ordenação por
de Pareto Pt+1
"crowding distance"
F1
Pt F2
F3
Q
t
Não selecionados
Rt
Fonte: adaptado de (DEB et al., 2002).
Como ilustrado na Figura 3.1 primeiramente cria descendentes e uma população

combinada 𝑅𝑡 e é realizado a seleção por fronteiras de dominância. Cada fronteira armazena
as soluções da população que são não dominadas entre si e a primeira fronteira armazena as
soluções que dominam todas as outras fronteiras. O método utiliza também a crowding
distance, a qual consiste em priorizar os resultados mais diferentes como critério de
desempate na escolha do indivíduo caso estejam na mesma fronteira de dominância e,
melhorando a variabilidade genética da população. O objetivo dessa métrica é que os
indivíduos na primeira fronteira da população sejam mais diversificados possível e próximos
das soluções da Fronteira de Pareto associada ao problema.
Mas, segundo Chiandussi et al. (2012) a otimização multiobjetivo fornece ao decisor um
conjunto de soluções Pareto-ótimas, não dominadas, já que, não há uma solução única, mas
um conjunto de soluções. Logo, sem aferir e especificar as preferências do decisor frente às
diferentes funções objetivo, não é possível avaliar a qualidade das soluções propostas
(DOLORES, 2014). Com isso, é necessário incluir informações sobre as preferências do
decisor, como por exemplo, valores, convicções e perspectivas, no processo de apoio à
tomada de decisão (COELLO COELLO; LAMONT; VELDHUIZEN, 2002). Essa etapa é
geralmente realizada por especialistas, mas existem métodos que possibilitam classificar um
número menor de soluções de forma automatizada.
3.4 Pós processamento da fronteira Pareto

Os conjuntos de soluções Pareto-ótimas podem conter inúmeras soluções, portanto, é difícil
para o decisor selecionar uma única solução que corresponda ao melhor compromisso,
segundo suas preferências (CHEIKH et al., 2010). Neste contexto, métodos de tomada de
decisão multicritério (TDMC) são na atualidade utilizados, uma vez que a análise pós Pareto
auxilia o decisor ao fornece um subconjunto globalmente representativo e com alto grau de
similaridade, do conjunto de soluções não dominadas Pareto, que sejam suficientemente
pequenos para serem tratáveis (CARPITELLA et al., 2018; CHAUDHARI; DHARASKAR;
THAKARE, 2010; VEERAPPA; LETIER, 2011). Ou seja, ao invés de inspecionar um número
grande de soluções individuais, o decisor inspecionará pequenos grupos de soluções, com
alto grau de similaridade, compostos por um número menor de soluções. Dessa forma, a sua
atenção estará focada sobre as características de um grupo, segundo suas preferências,
tornando essa etapa mais eficaz (VEERAPPA; LETIER, 2011).
A literatura apresenta diferentes métodos TDMC em trabalhos que buscaram alcançar
eficiência nessa etapa. Com isso, Andersson (2002) propôs o método algoritmo genético
multiobjetivo combinado com métodos de superfície de resposta (MSR), para avaliar a
robustez das soluções Pareto-ótimas geradas. Para tanto, foram otimizados quatro objetivos
pelo algoritmo genético multiobjetivo. Posteriormente, utilizou-se um método estatístico
baseado em design de experimentos com o MSR para classificar as soluções Pareto-ótimas e
auxiliar no processo de tomada de decisão. O MSR tem a função de construir aproximações
do comportamento de um sistema com base em resultados dos vários pontos no espaço do
projeto com as superfícies resultantes, podendo ser lineares ou quadráticas, ajustadas nesses
pontos. O método estatístico design de experimentos determina onde, no espaço do projeto,
esses pontos devem ser localizados, obtendo-se o melhor ajuste possível, permitindo localizar
áreas desejadas dentro da fronteira de Pareto, que possuam soluções mais favoráveis e que
atendam às expectativas em relação à tarefa simulada, facilitando a seleção da solução ótima
pelo decisor.
Cheikh et al. (2010) propuseram selecionar um conjunto restrito de soluções que fosse
mais representativo dentre os pertencentes à fronteira de Pareto. Os autores se basearam nos
métodos de agrupamento que consistem em descobrir, a partir de uma população, grupos de
indivíduos com características semelhantes, para auxiliar o decisor no processo de tomada de
decisão. Para tanto, foi preciso determinar uma solução representativa dentro de cada cluster.
Isso é feito por meio do cálculo da somatória das distâncias quadradas entre a solução ideal e as
soluções do cluster, dessa forma a solução mais próxima da solução ideal será a escolhida como
representante do cluster. Cada grupo é formado por soluções com propriedades semelhantes,
facilitando a etapa de tomada de decisão, uma vez que o decisor terá que avaliar uma única
solução por cluster.
Já Carpitella et al. (2018) utilizaram a combinação de duas análises, a primeira abordagem
multiobjetivo NSGA-II para otimizar quatro critérios, sendo: falta de serviço operacional, custo
operacional, uniformidade de pressão e resiliência da rede. Com isso, foi gerada a fronteira de
Pareto formada de soluções não-dominadas. A segunda abordagem trata-se da Técnica para
Ordem de Preferência por Similaridade à Solução Ideal (TOPSIS) utilizada para classificar o
conjunto de soluções Pareto-ótimas com base em um conjunto de critérios ponderados, com
o intuito de alcançar um ranking final. A TOPSIS baseia-se no conceito de distância para
uma solução ideal positiva e negativa. Com isso, a melhor alternativa é caracterizada pela
menor distância a primeira e a maior até a última. A TOPSIS utiliza uma matriz de decisão
contendo avaliações de alternativas sob um conjunto de critérios de avaliação e vetor de pesos
que refletem as preferências dos especialistas envolvidos no projeto, auxiliando na etapa de
tomada de decisão.
Outra forma de analisar o conjunto de soluções pertencente à fronteira de Pareto, espaço
n-dimensional, é calculando a similaridade entre o ponto de utopia (ideal) e as soluções
Pareto-ótimas em função da distância entre os mesmos. A maneira mais comum de calcular a
distância entre dois pontos a e b no espaço n-dimensional é conhecida por distância
euclidiana (𝑋𝑎,𝑏 )(Equação 3.1) (NETO; MOITA, 1998).
𝑛 2
𝑋𝑎,𝑏
2
= ∑ (𝑑𝑎𝑗 − 𝑑𝑏𝑗 ) (3.1)
𝑗=1
Vale ressaltar que esse método pressupõe saber qual a solução ideal, mas essa condição
nem sempre é verdadeira.
Zio e Bazzo (2012) compararam alguns métodos TDMC buscando caracterizar as

diferentes abordagens segundo suas vantagens e limitações no que diz respeito ao suporte
que proporcionam ao decisor no processo de seleção de soluções preferenciais. Logo foram
analisados métodos antes e pós Pareto. A abordagem Algoritmo Genético Orientado
Multiobjetivo (G-MOGA) gerou a fronteira de Pareto focalizada, ou seja, as preferências do
decisor foram embutidas no algoritmo genético para influenciar a busca de soluções não
dominadas em direção à região preferida. Os métodos de pós processamento da Pareto
considerados, por outro lado, mostraram-se eficazes na redução do número de soluções. Um
método de agrupamento foi aplicado, classificando subtrativamente as soluções de acordo
com a distância relativa geométrica da Fronteira Pareto e, em seguida, selecionou uma
solução representativa dentro de cada cluster. Os Diagramas de Nível foram usados para
representar e analisar efetivamente as Fronteiras de Pareto reduzidas. Os diagramas
selecionam as soluções representativas por meio da distância das mesmas em relação a
solução ideal (mas não viável), e em relação a todos os objetivos simultaneamente. Outro
método utilizado foi o de atribuição de preferências difusas, caso o decisor tivesse
preferências definidas. Dessa forma é atribuída uma pontuação a cada classe de preferência.
Já o método de mapas auto-organizáveis (SOM) e Data Envelopment Analysis (DEA), foram
aplicados para o agrupamento das soluções Pareto-ótimas e exclusão das soluções menos
eficientes, respectivamente.
Devido à sua simplicidade e versatilidade, o método k-means permanece popular desde
que foi proposto há três décadas por Moore (1959). Chaudhari, Dharaskar e Thakare (2010)
utilizaram a abordagem algoritmo de agrupamento k-means, caracterizado por ser adequado
para etapa de tomada de decisão quando o decisor não tem um conhecimento prévio da
importância relativa dos objetivos conflitantes no problema de otimização muiltiobjetivo.
Para tanto, primeiramente aplica-se a análise de grupos. A determinação do número “ótimo”
de grupos (k), nesse conjunto, pode ser realizada utilizando o diagrama de silhueta para
avaliar a qualidade de uma alocação de agrupamento. Para cada grupo é selecionada uma
solução pertencente a Pareto representativa, por meio do cálculo do centroide, onde a
solução mais próxima de seu centroide de grupo é escolhida. Nesse momento o decisor
poderá selecionar a solução mais próxima do ponto ideal ou utópico dos múltiplos objetivos,
em um espaço padronizado. Para realização do método proposto por Chaudhari, Dharaskar e
Thakare (2010) um código Matlab foi desenvolvido.
Veerappa e Letier (2011) também se basearam em métodos de agrupamento para

classificar as soluções Pareto otimizando o custo e valor, considerados requisitos base na área
industrial. A técnica utilizada foi o agrupamento hierárquico aglomerativo padrão, o qual se
inicia com um único cluster contendo todos os elementos, com posterior divisão. Com isso, a
cada iteração, utiliza-se um algoritmo flat (k-means) de forma a separar o conjunto corrente
em cluster menores, repetindo-se até que obtenha-se apenas conjuntos compostos de um
único elemento ou até o critério de parada. Esse método pode ser definido como uma árvore
que conecta todos os elementos do conjunto de tal forma que a soma das distâncias de todas
as arestas existentes seja mínima.
Uma variante do método é proposto por Zhao, Deng e Ngo (2018) onde uma nova função
objetivo de agrupamento foi desenvolvida sendo viável em todos os espaços de soluções da
Fronteira Pareto. Os autores buscaram melhorar a relação entre a qualidade e eficiência de
agrupamento. Dessa forma, o procedimento de iterações ficou mais simples e convergiu a um
ótimo local consideravelmente melhor. A eficiência foi estudada extensivamente em
agrupamento de documentos, pesquisa de vizinhos mais próximos e agrupamento em
diferentes cenários de imagens, onde foi possível observar um desempenho superior.
Para ilustrar o método de análise de pós processamento da fronteira Pareto Taboada e
Coit (2006) otimizaram simultaneamente dois objetivos: o problema de alocação de
redundância (RAP) e o escalonamento da operação de gargalo de uma linha de fabricação da
placa de fiação impressa (PWB). A otimização foi realizada pelo algoritmo NSGA-II e a
análise de pós processamento da Pareto utilizou o algoritmo de agrupamento k-means
fornecendo ao decisor um conjunto menor de compensações ótimas.
O algoritmo k-means é uma escolha popular por sua simplicidade, eficiência e desempenho
moderado e relativamente estável em diferentes problemas (ZHAO; DENG; NGO, 2018). O
agrupamento da fronteira de Pareto pode ser feito com base em reursos internos e externos.
Os pontos são agrupados em clusters (k) de acordo com uma característica semelhante. Ou
seja, o agrupamento é feito calculando o centroide de cada cluster e atribuindo cada ponto ao
grupo com o centroide mais próximo. O centroide não é um ponto real, sendo uma média de
todos os elementos do cluster. Para a função de associação, cada ponto de dados pertence ao
seu centro mais próximo, formando uma partição dos dados (TABOADA; COIT, 2006).
Os centros são colocados aleatoriamente, assim, os dados são agrupados de acordo com a
distância entre um ponto e os centros. Portanto, tomando um dado de entrada 𝑥𝑖 com
dimensões 𝑚 escritas pelo vetor 𝑥𝑖 = [𝑥1 , 𝑥2 , ..., 𝑥𝑚 ] e um centro 𝑐𝑗 = [𝑐1 , 𝑐2 , ..., 𝑐𝑚 ] a distância
euclidiana pode ser escrita pela Equação 3.2 (BRENTAN, 2017).
𝑑𝑖𝑗 = ‖‖𝑥𝑖 − 𝑐𝑗 ‖‖ (3.2)
Um dado 𝑖 é classificado como pertencente ao grupo 𝑗 se a menor distância entre esses dados
e todos os centros forem 𝑑𝑖 𝑗 (BRENTAN, 2017). Um processo iterativo começa recalculando a
posição dos centros e agrupando novamente o ponto. É necessário recalcular a posição dos
centros para avaliar possíveis mudanças em suas posições. O processo é repetido até que não
ocorra nenhuma alteração (CHEIKH et al., 2010).
Um problema frequente de muitos algoritmos de agrupamento, por exemplo k-means, é a
escolha do número de grupos. Assim, diferentes índices de validade de grupos parciais são
sugeridos para resolver este problema, uma vez que esta é uma questão importante para o
agrupamento geral (TABOADA; COIT, 2006; LIU et al., 2005). O método de plotagem em
silhueta (ROUSSEEUW, 1987) é uma dessas técnicas de avaliação de agrupamento que indica a
qualidade de um processo. Em seguida, o número de grupos que otimiza o índice de qualidade
sob consideração é escolhido como a melhor partição.
Rousseeuw (1987) sugeriu o gráfico de silhueta como critério para analisar a qualidade de
grupos de técnicas de agrupamentos. Para tanto, o valor da silhueta para cada ponto depende
das semelhanças entre os pontos em seu próprio grupo e em comparação com pontos em outros
grupos. O valor conhecido como a largura da silhueta 𝑠(𝑥𝑖 ) (Equação3.3) é um indicador de
confiança na associação entre amostra n e o objeto 𝑥𝑖 (𝑥𝑖 = [𝑥1 , 𝑥2 , ..., 𝑥𝑛 ]). Com isso, o valor
do indicador Silhueta 𝑠(𝑥𝑖 ) varia de +1 ( pontos muito distantes dos clusters vizinhos) a −1 (
pontos que provavelmente estão atribuídos ao cluster errado). O valor 0 indica que os pontos
não estão distintamente em um cluster ou outro, pois 𝑎(𝑥𝑖 ) e 𝑏(𝑥𝑖 ) são aproximadamente iguais
e, portanto, não está claro se 𝑠(𝑥𝑖 ) está atribuído a A ou B. O objeto 𝑥𝑖 fica igualmente distante
de ambos, portanto pode ser considerado como um caso intermediário (ROUSSEEUW, 1987).
𝑠 (𝑥𝑖 ) = [𝑏(𝑥𝑖 ) − 𝑎(𝑥𝑖 )] /𝑚𝑎𝑥 [𝑎(𝑥𝑖 ) − 𝑏(𝑥𝑖 )] (3.3)
em que, 𝑎(𝑥𝑖 ) a distância média entre 𝑥𝑖 e todos os objetos do seu grupo, 𝑏(𝑥𝑖 ) será a distância
média entre 𝑥𝑖 e um outro grupo no qual 𝑥𝑖 não pertença. Dessa forma, o valor da Silhueta de
um objeto diz o quão semelhante ele é com os outros objetos do grupo à que pertence.
3.5 Teoria dos Grafos

A origem da teoria dos grafos ocorreu em meados do século XVII e é associada ao problema
das pontes de Königsberg, atualmente cidade da Prússia chamada Kaliningrad. A cidade tem
parte de sua localização em duas ilhas do rio Pregel as quais estavam ligadas uma à outra e as
margens por sete pontes (CARDOSO, 2005). O matemático suiço Leonhard Euler (1707-1783)
resolveu o problema dual da pontes de Königsberg, ao encontrar uma maneira de viajar pelas
sete pontes da cidade passando por cada uma delas apenas uma vez (COSTA, 2011). Logo, a
teoria de grafos surgiu por meio de especulação puramente teóricas e atualmente é aplicada
em vários ramos da matemática, informática, engenharia, química, psicologia e da indústria.
Um grafo 𝐺(𝑉 , 𝐸), segundo (COSTA, 2011) é considerado uma estrutura matemática
constituída pelos conjuntos 𝑉 (𝑛 vértices ou nós, finito e não vazio) e 𝐸 (𝑚 arestas ou links,
pares não ordenados de elementos 𝑉 ). Graficamente representado com nós (vértice), unidos
por arestas (links). Se as arestas do grafo possuem um ponto de partida e um ponto de
chegada esse grafo é classificado como direcionado ou dígrafo 𝐷(𝑉 , 𝐸). Várias propriedades
topológicas foram desenvolvidas para caracterizar os grafos, possibilitando comparações e
análise da eficiência de algoritmos de exploração de grafos (CAMPBELL, 2017). Em dígrafo,
distingue-se o grau de saída, o número de arestas saindo de um vértice, e o grau de entrada, o
número de arestas entrando em um vértice. Logo, o grau de um vértice em um dígrafo será à
soma dos graus de saída e de entrada (FEOFILOFF; KOHAYAKAWA; WAKABAYASHI, 2011).
A acessibilidade entre vértices é estudada através de caminhos ao longo dos grafos. Logo,
o trajeto num grafo 𝐺, entre os vértices 𝑥 e 𝑦 é designado como toda a sequência de vértices
e arestas da forma 𝑥 = (𝑣1 , 𝑣1 𝑣2 , 𝑣2 , ..., 𝑣𝑘 − 1𝑣𝑘 , 𝑣𝑘 = 𝑦) com eventual repetição de vértices
e arestas (FEOFILOFF; KOHAYAKAWA; WAKABAYASHI, 2011). Um trajeto em um grafo 𝐺
entre os vértices 𝑥 e 𝑦 é um passeio entre x e y sem arestas repetidas, mas podendo existir
vértices repetidos. O número de arestas que integra o caminho constitui seu comprimento.
Esse é o conceito de diâmetro do grafo, que é o comprimento máximo necessário para viajar
de um nó a outro (CAMPBELL, 2017).
Um grafo conexo que não contém laços é chamado de árvore que é um tipo de estrutura
que caracteriza os grafos. Uma árvore 𝑇 = (𝑉 , 𝐸) é considerada enraizada quando um vértice
𝑣 é diferenciado dos outros e o mesmo é denominado “raiz” da árvore. O grafo contém uma
raiz 𝑟 e para todos os vértices 𝑣 do grafo, existe um caminho único de 𝑟 a 𝑣. O grafo contém
uma raiz 𝑟 onde o grau de entrada 𝑟 é nulo, e para todo vértice 𝑣 do grafo diferente de 𝑟, o grau
de entrada de 𝑣 é 1 (COSTA, 2011). Uma árvore 𝑇 é conhecida como árvore geradora de um

grafo conexo 𝐺 se 𝑇 for um sub-grafo de 𝐺 e conter todos os vértices de 𝐺. Supondo um grafo
valorado, onde a cada aresta é atribuído um peso, é possível distinguir as árvores geradoras
desse grafo em relação à soma total dos pesos (COSTA, 2011). Logo, para encontrar a árvore
que minimiza essa soma é necessário utilizar algoritmos gulosos associados a esse problema
de otimização. Em um grafo conexo, a distância entre dois vértices será denominada como o
comprimento do caminho mais curto (CMC). Caso seja um grafo valorado o comprimento será
a soma dos pesos, caso contrário será o número de arestas no caminho.
3.5.1 Caminho mais curto em grafos
O probelma do CMC na teoria dos grafos é parte do problema da teoria do fluxo de custo
mínimo. Ou seja, dado um grafo direcionado 𝐺 = (𝑉 , 𝐸), definido por um conjunto de nós
(arestas) 𝑉 e um conjunto de links (vértices) direcionados 𝐸𝑖𝑗 e caracterizado por: um custo
por unidade de fluxo no (link associado 𝐶𝑖𝑗 que varia linearmente com a quantidade de fluxo
passado por 𝐸𝑖𝑗 ; pela capacidade máxima que pode fliur através de um (link 𝑈𝑖𝑗 ; e um valor
mínimo 𝑙𝑖𝑗 que deve fluir através do (link, sendo o fluxo que flui através de 𝐸𝑖𝑗 denotado 𝑥𝑖𝑗
(AHUJA et al., 1995). A cada nó 𝑖 𝜖𝑉 é atribuido um valor inteiro 𝑏(𝑖) que permite reconhecer
o tipo de nó, sendo nó de suprimento 𝑏(𝑖) > 0; nó demanda 𝑏(𝑖) < 0 e nó transporte 𝑏(𝑖) = 0.
As variáveis de decisão no problema são os fluxos nos (links. A Equação 3.4 determina o CMC
entre dois vértices, onde 𝑃 é um caminho arbitrário (AHUJA et al., 1995).
min ∑ 𝐶𝑖𝑗 𝑋𝑖𝑗 (3.4)

𝑝 (𝑖,𝑗)𝜖𝑃
sujeito a:
∑ 𝑋𝑖𝑗 − ∑ 𝑋𝑖𝑗 = 𝑏(𝑖), ∀𝑖 (3.5)

{𝑗∶(𝑖,𝑗)𝜖𝑃} {𝑗∶(𝑖,𝑗)𝜖𝑃}
𝐼𝑖𝑗 ≤ 𝑥𝑖𝑗 ≤ 𝑢𝑖𝑗 , ∀, 𝑗 (3.6)
Além disso, ∑𝑛𝑖=1 𝑏(𝑖) = 0

O CMC entre nós em uma determinada rede de abastecimento é um conceito amplamente
explorado (MEIRELLES et al., 2018; CAMPBELL et al., 2015). Os tubos de um sistema de
distribuição de água podem ser mais ou menos importantes em termos de transporte de água,
dependendo da vazão. Uma maneira de identificar tubos importantes é usando o CMC,

desenvolvido dentro da teoria dos grafos. A topologia da rede pode ser lida como um grafo
onde os nós são representados pelos vértices e os tubos pela arestas(CAMPBELL et al., 2015).
Aplicando o conceito de dígrafo, para representar graficamente com orientação previamente
definida, é possível definir a frequência de todos os caminhos em um grafo (CAMPBELL
et al., 2015).
Informações de tubos como direção de fluxo, podem ser incorporadas nas arestas do gráfico
definindo a orientação delas. Quando realizada nos cenários de demanda máxima, a direção do
fluxo em cada tubo representa o cenário mais crítico (MEIRELLES et al., 2018) para parâmetros
hidráulicos, como perda de carga hidráulica e também para cenários de contaminação, onde
a intrusão química será rapidamente difundida. Definindo a orientação das arestas, é possível
calcular o valor do caminho mais curto (VCMC) entre cada par de nós. Dado um nó de origem, é
possível explorar todos os vértices do gráfico para encontrar o subconjunto de nós alcançáveis
a partir do nó de origem (MEIRELLES et al., 2018). Portanto, a distância (em termos de número
de vértices) da fonte para todos os conjuntos de nós é calculada. Posteriormente, o VCMC para
cada par de nós é armazenado em uma matriz quadrada (𝑀), onde as colunas representam os
nós iniciais (𝑁 𝐼 ) e as linhas os nós finais (𝑁 𝐹 ). A matriz é preenchida de acordo com o conjunto
de regras, conforme mostrado no conjunto abaixo (CAMPBELL et al., 2015):
⎧
⎪
⎪
⎪
⎪ se 𝑁 𝐼 = 𝑁 𝐹 → 0
⎪
⎪
⎨
⎪ se 𝑁 𝐼 não puder alcançar 𝑁 𝐹 → ∞
⎪
⎪
⎪
⎪ Para qualquer outro caso → Número do nó no CMC
⎪
⎩
Com a matriz (𝑀) é possível classificar os nós de acordo com sua importância no gráfico.
Onde, um nó específico é considerado mais importante quanto maior número de nós que ele
pode alcançar. Esta importância é calculada pela soma de cada linha da matriz (𝑀). A soma
de cada linha é chamada de valor do caminho mais curto acumulado (VCMCA)(CAMPBELL,
2017). A vazão é usada como um multiplicador do VCMCA através de cada tubo. Com isso, é
formada uma hierarquia (ou uma árvore) de links e nós, onde as fontes de suprimento são as
raízes.
O conceito de caminho mais curto (CMC) pode ser implementado através da técnica de
Breadth First Search (BFS) (MOORE, 1959) criado por E.F Moore em 1950. É considerado um
algoritmo simples para a exploração em grafos. Logo, dado um grafo 𝐺 = (𝑉 , 𝐸) e um nó
raiz (𝑅) o algoritmo BFS explora todos os vértices do grafo para encontrar o subconjunto de
nós alcançáveis a partir do nó 𝑅 (MEIRELLES et al., 2018). Com isso, o algoritmo calcula as
distâncias, menor número, do nó 𝑅 para cada um dos nós final. Uma árvore de amplitude é o
resultado do processo que contém todos os nós alcançáveis.
3.6 Simulação Hidráulica e de Qualidade da água

As simulações hidráulicas, em estudos iniciais, consideravam o transporte de contaminantes
de forma simplificada (BERRY; HART; PHILLIPS, 2003). Os softwares de qualidade hidráulica
e de água permitem prever as concentrações de contaminante ao longo da RDA, sendo esses
dados utilizados para estimar os possíveis impactos em caso de contaminação (OHAR;
LAHAV; OSTFELD, 2015). O software EPANET (ROSSMAN, 2000) permite simulações em
regime permanente e em período extensivo do comportamento hidráulico ao longo da RDA.
Logo, é utilizado para auxiliar as análises de SDA, com intuito de melhorar o conhecimento
sobre o transporte e o destino da água potável. As RDA são formadas por tubulações, nós,
bombas, válvulas e reservatórios de capacidade ilimitada (RNF) e/ou altura variável (RNV). O
software permite obter valores de vazão nas tubulações, pressão nos nós e nível de água em
cada reservatório, bem como a concentração de espécies químicas ao longo do período de
simulação, o cálculo da idade da água e o rastreio da origem de água em qualquer ponto da
rede (ROSSMAN, 2000).
O EPANET 2.0 (ROSSMAN, 2000) possui uma interface gráfica, permitindo a elaboração
da rede diretamente no programa . A ferramenta é amplamente utilizada em simulações de
projetos que envolvem expansão de redes, estratégia de gestão para melhorar a qualidade de
água e análise do decaimento de cloro. Após a simulação é possível exportar um relatório dos
resultados de todos os nós e trechos em todo o período de simulação. O relatório apresenta
todas as informações da rede, bem como os parâmetros de simulação hidráulica sua extensão
(.inp) possibilita a visualização em qualquer editor de texto (ROSSMAN, 2000).
Mas, a modelação de qualidade da água no EPANET 2.0 é limitada ao rastrear o
transporte e o destino de apenas uma única espécie química, como o cloro livre. Com isso,
surgiu sua extensão EPANET-MSX (Epanet Multi-Species Extension)(SHANG; UBER;
ROSSMAN, 2008) que permite modelar qualquer sistema de múltiplas espécies químicas que
interajam entre si. Esse recurso foi incorporado em um programa executável autônomo, bem
como em uma biblioteca de funções do kit de ferramentas para programadores. Muitos

problemas de qualidade da água em sistemas de distribuição só podem ser analisados usando
uma abordagem multiespécies (SHANG; UBER; ROSSMAN, 2008).
Ao simular espécies químicas no EPANET-MSX é necessário descrever o detalhamento
químico de cada espécie, com isso é possível obter informações do comportamento da espécie
ao longo da simulação. Com todas as informações das seções necessárias na elaboração do
arquivo com extensão (.msx) dependerá das espécies a serem modeladas e a reação química
ou modelo de equilíbrio que governa sua dinâmica. Esse arquivo e seu relatório de saída terá
extensão (.rpt) (SHANG; UBER; ROSSMAN, 2008). O arquivo (.msx) é organizado em seções e
contém definições necessárias para modelação (Tabela 3.4).
Tabela 3.4: Seções utilizadas para a elaboração do arquivo de entrada (.msx).
[TITLE] Adicionar um título ao arquivo
[OPTION] Definir as opções de simulação
[SPECIES] Definir o nome das espécies químicas
Definir os parâmetros e constantes que

[COEFFICIENTS]
são usadas no modelo químico
Definir as expressões matemáticas que
[TERMS] são usadas como termos intermediários nas expressões para o modelo químico na
reação/equilíbrio.
Definir as taxas e expressões de

[PIPES]
equilíbrio que regem a dinâmica das espécies nas tubulações
Fornecer as taxas e expressões de
[TANKS] equilíbrio que regem a dinâmica das espécies em reservatórios de
armazenamento
Identificar fontes de entrada para

[SOURCES]
espécies selecionadas
Definir a concentração inicial de cada

[QUALITY]
espécie
Definir padrões de tempo usados com

[PATTERNS]
fonte de entrada
Definir o conteúdo que deseja obter um

[REPORT]
resultado no relatório de saída da simulação, extensão (.rpt)
Fonte: (SHANG; UBER; ROSSMAN, 2008).
Por não possuir uma interface gráfica, o software necessita de uma execução em linha de
comando, sendo necessários dois arquivos de entrada: (1) arquivo contendo as características
hidráulicas da rede em estudo, sendo esse gerado a partir do EPANET 2.0 padrão que possui a
extensão (.inp); (2) arquivo que descreve as espécies a serem simuladas, as reações químicas
ou modelos de equilíbrio que governam sua dinâmica, sendo esse fundamental para
funcionamento do EPANET-MSX, sua extensão é (.msx). O relatório de saída é um arquivo

gerado após a execução do programa sendo sua extensão (.rpt).
3.7 Ferramenta de suporte à implementação

O EPANET não possui uma estrutura de dados comum para compartilhar dados entres
diferentes módulos de função e aplicativo. Com isso recentemente criou-se um software de
código aberto, lançado sobre a Licença Pública da União Europeia (LPUE), EPANET- Matlab
toolkit2 (versão 2.1)(ELIADES et al., 2016), que proporciona a interação entre o EPANET e o
Matlab, em um ambiente de programação de alto nível onde o usuário tem acesso a todas as
informações da rede através de uma estrutura de dados, podendo executar chamadas diretas
à biblioteca EPANET, que possibilita modificar e criar redes, bem como simular multiespécies
interagindo entre si, por meio do EPANET-MSX.
As linguagens de programação como o Matlab podem ser usadas para processamento e
análise de dados, em ambiente de programação de alto nível, além de possuir aplicativos
sofisticados para otimização, controle, processamento de sinais, entre outros. O Matlab é
capaz de se conectar a bibliotecas de software externas, permitindo o uso de códigos
desenvolvidos em outras linguagens, como C ou C++. O método de interface utilizado pelo
EPANET-MATLAB toolkit2 usa uma abordagem orientado a objeto possibilita a composição
e interação entre diversas unidades chamadas de objeto, definindo uma classe Matlab, que
fornece uma maneira padronizada de lidar com a estrutura da rede, para chamar todas as
funções, bem como realizar procedimentos usando múltiplas funções, para simular e
executar diferentes tipos de análise na RDA, por meio do objeto correspondente (ELIADES
et al., 2016). Portanto, pesquisadores podem projetar e avaliar novas metodologias e software,
para análises em RDA, com essa ferramenta.
3.8 Conceito de cobertura de demanda

O termo “Cobertura” foi criado com o intuito de explicar que ao alocar uma estação de
monitoramento em um ponto de consumo (nó) é possível inferir a qualidade da água e a
demanda coberta pela estação. Para tanto, é necessário o conhecimento prévio da trajetória
da vazão, a vazão em cada trecho e a demanda nodal. Com isso, determina-se a
representatividade de um determinado nó, em termos de porcentagem de cobertura, em
relação a RDA (SUSE, 2014). Dessa forma, é correto afirmar que se a qualidade da água do nó
amostrado/monitorado é boa, então a qualidade da água dos nós a montante também não é
adequada. A garantia da qualidade da água dada pelas companhias de abastecimento é de
extrema importância para que não haja contaminação em massa. As estações de
monitoramento/sensores consideradas são capazes de monitorar qualquer fração de água
consumida em uma RDA (SUSE, 2014). Para exemplificar como é realizado o cálculo da
cobertura de demanda, Lee e Deininger (1992) utilizaram um sistema hipotético de
distribuição de água (Figura 3.2). A ilustração apresenta o fluxo de água que flui por cada
tubulação, bem como o sentido do escoamento. As demandas associadas a cada no 𝑖 estão
representadas por 𝑑𝑖 .
Figura 3.2: Exemplo de um simples sistema de distribuição de água
1
f1=100
f2=60 2 d2=0
3 f8=40
d3=15
f3=45
7 d7=10
f7=5
4
d4=30 f6=25
f4=20
6
5 d6=20
f5=5
d5=25
Fonte: (LEE; DEININGER, 1992).
Se a estação de monitoramento foi alocada no nó 5, a fração de água (𝑊 ) que parte do nó 4

e chega ao nó 5 representa 80% da demanda, pois 𝑊 (5, 4) = ((20/(20+5) ∗ 100); a fração de água
do nó 6 corresponde a 20% da demanda, pois 𝑊 (5, 6) = (5/(20 + 5) ∗ 100); a fração de água do
nó 3 é igual a 72% pois 𝑊 (5, 3) = ((0, 8 ∗ 45)/(45 + 5)) ∗ 100; a fração de água do nó 7 representa
28%, pois 𝑊 (5, 3) = (((0, 8 ∗ 5)/(45 + 5) + 0, 2) ∗ 100); as frações do nó 2 e 1 correspondem a

100%, pois 𝑊 (5, 2) = 𝑊 (5, 3) + 𝑊 (5, 7) = 1 e 𝑊 (5, 1) = 𝑊 (5, 2) = 1.
Já, ao considerar a estação de monitoramento no nó 6 as frações de água serão 𝑊 (6, 7) =
𝑊 (6, 2) = 𝑊 (6, 1) = 1; e 𝑊 (6, 3) = 𝑊 (6, 4) = 𝑊 (6, 5) = 0. Quando a fração de água que parte
de um nó não faz parte do caminho de escoamento para o nó monitorado, a 𝑊 é igual à zero,
ou seja, não há cobertura desse nó. Esse processo de cálculo poderá ser realizado para todos
os nós da rede fictícia. A Tabela 3.5 (LEE; DEININGER, 1992) apresenta as frações de água de
todos os nós da RDA. Ao alocar a estação de monitoramento no nó 5 temos a cobertura total da
RDA, pois ao considerar que até a menor fração de água que parte dos demais nós pode causar
mudança nos parâmetros monitorados, ao realizar a análise da amostra de água que chega ao
nó monitorado, a cobertura é de 100%.
Tabela 3.5: Matriz de fração de água
Fração de água através do nó
Nó de amostragem 1 2 3 4 5 6 7
1 1 0 0 0 0 0 0
2 1 1 0 0 0 0 0
3 1 1 1 0 0 0 0
4 1 1 0,9 1 0 0 0,1
5 1 1 0,72 0,8 1 0,2 0,28
6 1 1 0 0 0 1 1
7 1 1 0 0 0 0 1
Fonte: (LEE; DEININGER, 1992)
Considerando que até a menor fração de água que parte de um nó pode ser inferido pelo
nó escolhido para o monitoramento a Taxa de Cobertura (TC) pode ser determinada por meio
das matrizes de contaminação geradas a partir dos eventos de contaminação. E cada cenário
de contaminação pode ser identificado pelo conjunto de sensores alocados de acordo com o
layout ideal. O valor dos eventos detectados será 1 se ele tiver identificação pelo conjunto de
sensores e 0 se não for identificado. Ao dividir a soma dos eventos detectados pela quantidade
total de cenários de contaminação considerados, o valor TC é obtido, conforme mostrado na
Equação 3.7
1
𝑇𝐶 = ∑ 𝑑𝑒 ∗ 100
(𝑆 )
(3.7)
onde, (𝑆) é o número de nós contaminados e (𝑑𝑒 ) são os eventos detectados.

52
Capítulo 4
Metodologia
Neste capítulo é abordada a metodologia proposta que está dividida em três seções: (1)
Simulação da qualidade da água ao longo da RDA e injeção de contaminante (PA), (2)
alocação ótima de sensores por meio da otimização multiobjetivo e (3) análise de
pós-processamento Pareto.
4.1 Simulação da qualidade da água

Para a modelação da qualidade da água utilizou-se o software EPANET-MSX (SHANG; UBER;
ROSSMAN, 2008) capaz de modelar a reação e o transporte de múltiplas espécies químicas
interagindo, em conjunto com o EPANET 2.0 (ROSSMAN, 2000) que realiza as simulações
hidráulicas da rede. Ao elaborar o arquivo de entrada (.msx) é necessário definir as equações
diferenciais, que descrevem a degradação e a formação de todas as espécies a serem simuladas,
bem como o comportamento dos parâmetros de qualidade da água analisados.
Ao simular o comportamento de substâncias com alta toxicidade e potencialmente
perigosas ao longo do RDA, como os pesticidas, busca-se criar um banco de dados dos efeitos
causados nas concentrações existentes e nos parâmetros de qualidade da água ao reagirem
com o contaminante (SCHWARTZ; LAHAV; OSTFELD, 2014a). O Paration (PA) é um
pesticida organofosforado com alta toxicidade de fácil acesso, com isso, passível de ser
utilizado como contaminante em RDA.
O modelo de qualidade da água proposto, baseado nos estudos realizados por Ohar, Lahav
e Ostfeld (2015) e Schwartz, Lahav e Ostfeld (2014a) simula o destino do contaminante PA
após a reação com cloro livre. Com isso, um conjunto de equações foi adicionado, além das
Capítulo 4. Metodologia 53
equações de degradação, para calcular os parâmetros como alcalinidade, pH e concentração

residual de cloro. Os mecanismos de reação, estequiometria e cinética utilizados na simulação
são descritos na Tabela 4.1 e nas Equações 4.1, 4.2 e 4.3.
Tabela 4.1: Degradação do Paration.
Reações Estequiometria Taxa/Coeficiente de Equilíbrio a 25 ºC

𝐾𝐻 𝑂𝐶𝐿,𝑂𝑃
5.𝐻 𝑂𝐶𝐿 + 𝑃𝐴 → 𝑃𝐴𝑂 + 5.𝐻 + + 5.𝐶𝐿− + 𝑆𝑂42− (𝐾𝐻 𝑂𝐶𝐿,𝑃𝐴 = 2, 2(±0, 53).106 𝑀 −1 ℎ−1
𝐾ℎ,𝑃𝐴 = 𝐾𝑁 ,𝑃𝐴 + 𝐾𝐵,𝑃𝐴 .[𝑂𝐻 − ]

𝐾ℎ,𝑃𝐴
𝑃𝐴 → 𝑃𝐴𝐻 𝐾𝑁 ,𝑃𝐴 = 2, 66.10−4 ℎ−1
𝐾𝐵,𝑃𝐴 = 4, 3.𝑀 −1 ℎ−1
𝐾ℎ,𝑃𝐴𝑂 = 𝐾𝑁 ,𝑃𝐴𝑂 + 𝐾𝐵,𝑃𝐴𝑂 .[𝑂𝐻 − ]

𝐾ℎ,𝑃𝐴𝑂
𝑃𝐴𝑂 → 𝑃𝐴𝐻 𝐾𝑁 ,𝑃𝐴𝑂 = 2.10−4 ℎ−1
𝐾𝐵,𝑃𝐴𝑂 = 46, 1.𝑀 −1 ℎ−1

𝐾𝑂𝐶𝐿,𝑃𝐴
𝑃𝐴 + 𝑂𝐶𝐿− → 𝑃𝐴𝐻 𝐾𝑂𝐶𝐿,𝑃𝐴 = 37(±10)𝑀 −1 ℎ−1
𝐾𝑂𝐶𝐿,𝑃𝐴𝑂
𝑃𝐴𝑂 + 𝑂𝐶𝐿− → 𝑃𝐴𝐻 𝐾𝑂𝐶𝐿,𝑃𝐴𝑂 = 48(±10)𝑀 −1 ℎ−1
𝐻 𝑂𝐶𝐿 → 𝐻 + + 𝑂𝐶𝐿− 𝑝𝑘𝑎 = 7, 5

Fonte: (SCHWARTZ; LAHAV; OSTFELD, 2014b)
Além disso, são consideradas as características da água potável típica do Brasil na

elaboração do arquivo (.msx), que apresenta valores de temperatura de 298K, sólidos totais
dissolvidos (STD) iguais a 1000𝑚𝑔/𝐿, pH de aproximadamente 7, 3 e alcalinidade de 260𝑚𝑔/𝐿
como 𝐶𝑎𝐶𝑂3 .
𝑑[𝑃𝐴]
= −𝐾ℎ𝑜𝑐𝑙,𝑃𝐴 .[𝐻 𝑂𝐶𝐿].[𝑃𝐴] − 𝐾ℎ,𝑃𝐴 .[𝑃𝐴] − 𝐾𝑜𝑐𝑙,𝑃𝐴 .[𝑂𝐶𝐿− ].[𝑃𝐴]
𝑑𝑡
(4.1)
𝑑[𝑃𝐴𝑂]
= 𝐾ℎ𝑜𝑐𝑙,𝑃𝐴 .[𝐻 𝑂𝐶𝐿].[𝑃𝐴] − 𝐾ℎ,𝑃𝐴𝑂 .[𝑃𝐴𝑂] − 𝐾𝑜𝑐𝑙,𝑃𝐴𝑂 .[𝑂𝐶𝐿− ].[𝑃𝐴𝑂]
𝑑𝑡
(4.2)
𝑑[𝑃𝐴𝐻 ]
= 𝐾ℎ,𝑃𝐴 [𝑃𝐴] + 𝐾𝑜𝑐𝑙,𝑃𝐴 .[𝑂𝐶𝐿− ].[𝑃𝐴] + 𝐾ℎ,𝑃𝐴𝑂 .[𝑃𝐴𝑂] + 𝐾𝑜𝑐𝑙,𝑃𝐴𝑂 .[𝑂𝐶𝐿− ].[𝑃𝐴𝑂]
𝑑𝑡
(4.3)
Sendo: [𝑃𝐴𝑂] e [𝑃𝐴𝐻 ] compostos mãe e filha de 𝑃𝐴; 𝐾ℎ𝑜𝑐𝑙,𝑃𝐴 é o coeficiente de oxidação
de 𝑃𝐴 para 𝑃𝐴𝑂 na presença de [𝐻 𝑂𝐶𝐿]; 𝐾𝑜𝑐𝑙,𝑃𝐴 e 𝐾𝑜𝑐𝑙,𝑃𝐴𝑂 são coeficientes de oxidação para
presença de [𝑂𝐶𝐿− ]; e 𝐾ℎ,𝑃𝐴 , 𝐾ℎ,𝑃𝐴𝑂 são coeficientes da taxa de hidrólise de [𝑃𝐴] e [𝑃𝐴𝑂],
respectivamente.
4.2 Alocação de sensores

Esta etapa do estudo busca a alocação ótima de sensores de qualidade de água
objetivando,minimizar o tempo de detecção (Z1), maximizar a probabilidade de detecção (Z4)
e minimizar o número de sensores (Z5).
1. Tempo de detecção (Z1)
O tempo de detecção de contaminante (𝑡𝑑 ) (Equação 4.4) é o tempo decorrido entre o

início da contaminação e a primeira detecção de uma concentração de contaminante
diferente de zero. O tempo da primeira detecção (𝑡𝑗 ) refere-se à alocação no nó 𝑗. Para a
rede de sensores o 𝑡𝑑 é o tempo de detecção mínimo entre todos os sensores localizados
no projeto em um determinado evento de contaminação.
𝑡𝑑 = 𝑚𝑖𝑛(𝑡𝑗 ), 𝑗 = 1, ..., 𝑛𝑠 (4.4)
A função objetivo Z1 a ser minimizada é o valor esperado calculado sobre a distribuição

de probabilidade assumida de eventos de contaminação, conforme apresentado na
Equação 4.5. Todos os eventos de contaminação não detectados não são considerados.
𝑍 1 = 𝐸 (𝑡𝑑 ) (4.5)
onde 𝐸(𝑡 𝑑 ) denota a expectativa matemática do tempo mínimo de detecção 𝑡𝑑 .
2. Probabilidade de detecção (Z4)
A maximização da probabilidade de detecção (Z4) de uma determinada rede de sensores

(isto é, número e localização) é estimada pela Equação 4.6.
1 𝑠
𝑍4 = ∑ 𝑑𝑟 (4.6)
𝑠 𝑟=1
Em que 𝑑𝑟 = 1 se o evento r for detectado por um dos sensores, e 0 caso contrário; S

representa a quantidade total de cenários de contaminação considerados.
3. Número de sensores (Z5)
Para minimizar o número de sensores a Equação 4.7 é:
𝑍 5 = 𝑚𝑖𝑛.(𝑛𝑠 ) (4.7)
Em que o número de sensores (𝑛𝑠 ) varia aleatoriamente entre o conjunto de nós

pertencentes à rede em análise. A cada iteração o (𝑛𝑠 ) varia e o menor resultado com o
maior número de eventos detectados é selecionado, considerando todos os cenários.
Cálculo das funções objetivo
Para exemplificação dos cálculos de cada função objetivo otimizada pelo algoritmo, foi
utilizada uma RDA fictícia (Figura 4.1), composta por 5 nós e 5 tubos. Considerar todos os
tubos com o mesmo comprimento e material, além dos nós terem a mesma pressão. Logo, o
período de simulação é de 8 passos de tempo e a injeção de contaminação nos nós da RDA no
terceiro passo de tempo, sendo cada vez contaminando um nó, gerando 5 cenários de
contaminação. O sensor é capaz de identificar qualquer alteração da qualidade de água dos
nós a montante, sendo alocado no nó 5.
Figura 4.1: Rede Fictícia.
Fonte:Arquivo pessoal
1. Tempo de detecção (Z1)
O primeiro cenário considera a injeção de contaminante no nó 1. Com isso, obtém uma

matriz de contaminação (Tabela 4.2), onde as colunas representam os nós da RDA e as
linhas o passo de tempo. Observa-se que inicialmente a concentração de contaminante
é igual a 0 em todos os nós. Isso se altera ao longo da simulação, uma vez que a
contaminação ocorre no terceiro passo de tempo.
Tabela 4.2: Matriz de contaminação do primeiro cenário.
Nós
Passo de tempo
1 2 3 4 5
1 0 0 0 0 0
2 0 0 0 0 0
3 1 0 0 0 0
4 1 1 0 0 0
5 1 1 1 1 0
6 1 1 1 1 1
7 1 1 1 1 1
8 1 1 1 1 1
O nó 5, monitorado, detecta à concentração do contaminante no passo de tempo 6, logo

o tempo da primeira detecção (𝑡𝑗 ) é igual á 6 e refere-se à localização do sensor 𝑗 , nesse
caso nó 5.
O segundo cenário considera a injeção de contaminante no nó 2. Com isso a matriz de

contaminação se altera (Tabela 4.3). Nesse cenário o nó 1 não recebe nenhuma fração de
água contaminada, devido ao sentido do escoamento. Como o sensor continua alocado
no nó 5, a localização continua a mesma, enquanto que 𝑡𝑗 passa valer “5” passos de tempo.
Tabela 4.3: Matriz de contaminação do primeiro cenário.
Nós
Passo de tempo
1 2 3 4 5
1 0 0 0 0 0
2 0 0 0 0 0
3 0 1 0 0 0
4 0 1 1 1 0
5 0 1 1 1 1
6 0 1 1 1 1
7 0 1 1 1 1
8 0 1 1 1 1
O terceiro cenário de otimização é gerado ao contaminar o nó 3, dessa vez o 𝑡𝑗 valerá “4”

passos de tempo e os nós 1, 2 e 4 não serão atingidos pelo contaminante. O quarto cenário
de contaminação ocorre com a injeção de contaminante no nó 4 , com isso 𝑡𝑗 valerá “4”
passos de tempo e os nós 1, 2 e 3 não serão contaminados. O quinto e último cenário é
gerado ao injetar contaminante no nó 5, logo o tempo de detecção será imediato, ou seja,
passará a valer “3”passos de tempo, uma vez que o sensores adotado identifica qualquer
concentração de contaminante, nessas condições nenhum outro nó será contaminado.
Com os valores de 𝑡𝑗 para cada cénario detectado pelo sensor é possível calcular o menor
tempo de detecção (𝑡𝑑 ) (Equação 4.4). Nesse caso, também valerá “3” passos de tempo,
uma vez que representa o menor valor entre os 5 cenários de contaminação. Com isso,
Z1 também valerá 3 passos de tempo, nesta condições.
2. Probabilidade de detecção (Z4)
Para calcular a probabilidade de detecção podem ser utilizadas as mesmas matrizes de

contaminação geradas a partir dos eventos de contaminação. Nessas condições tem-se
5 cenários de contaminação. O primeiro cenário de contaminação é identificado pelo
sensor alocado no nó 5, bem como os demais cenários, uma vez que em todos os casos o
escoamento atinge o nó monitorado. O valor de eventos detectados (𝑟) valerá 5, e para
cada evento detectado dr=1. Com isso, pode-se calcular Z4 por meio da Equação 4.6,onde
a somatória de dr será igual a 5. Ao dividir o total de eventos detectados (∑ 𝑑𝑟 ) pela
quantidade total de cenários de contaminação considerados (𝑆), sendo 𝑆 = 5, obtemos
um Z4=1, ou seja, ao alocar o sensor no nó 5 teremos 100% de probabilidade de detecção.
3. Número de sensores (Z5)
Nesse objetivo o número de nós monitorados por sensores (𝑛𝑠 ) irá variar
aleatoriamente dentre os 5 nós pertencentes a rede fictícia em análise. Dessa forma, é
gerado um vetor aleatório composto de 0 e 1, as colunas representando os nós da RDA
fictícia e as linha os nós a serem monitorados, sendo esses gerados aleatoriamente. Em
cada posição cujo valor ocupado seja 1, o modelo interpreta que há o monitoramento
desse nó e quando for 0 não há monitoramento. No caso onde se considera a alocação
de um sensor, tem-se um vetor como o representado na Tabela 4.4. A partir das
matrizes de contaminação geradas pelos cenários de contaminação, já explicados
anteriormente, é possível identificar quantos nós monitorados do layout de sensores
conseguem detectar o maior numero de cenários com um tempo de detecção mínimo, e
dessa forma minimizar o número de sensores. Ou seja, ao considerar que foi alocado
apenas um sensor na rede os resultados são os apresentados na Tabela 4.5.
Tabela 4.4: Vetor considerando a alocação de 1 sensor para calculo de Z5.
Vetor (1 sensor)
Nó 1 Nó 2 Nó 3 Nó 4 Nó 5
0 0 0 0 1
Tabela 4.5: Resultado de Z5
Nós Monitorados (1 sensor)
1 2 3 4 5
Z1 Z4 Z1 Z4 Z1 Z4 Z1 Z4 Z1 Z4
3 0,2 3 0,4 3 0,6 3 0,6 3 1

Os resultados demonstram que ao alocar aleatóriamente um sensor na rede fictícia

analisada é possível detectar 100% dos eventos de contaminação considerando a
solução para alocação de sensores no nó 5. Ao calcular essa função objetivo pelo
algoritmo é obtido um conjunto de soluções pertencentes à Pareto que ao ser analisada
por especialista ou por meio da extração de regras, fornece o número de nós que devem
ser monitorados de forma otimizada.
4.3 Função de probabilidade de contaminação- FPC

Os eventos de contaminação intencional (ou ataques) são considerados mais prováveis de
ocorrer em regiões ou nós que podem ter maiores consequências, ou seja, atingir um número
maior de população ou usuários especiais (escolas, hospitais e departamentos de
organizações governamentais), com o intuito de causar pânico. A detecção de todos os
eventos de contaminação é uma tarefa difícil, se não impossível, porque o orçamento das
empresas de água é restrito, levando a um cenário de poucos sensores alocados na rede.
Portanto, é mais coerente alocar sensores em nós com maior potencial de ataque,
reconhecendo que esse cenário atende também os eventos não intencionais. Seguindo a linha
principal He et al. (2018) uma nova abordagem para FPC é apresentada neste trabalho.
4.3.1 FPC1- baseada na variação espacial de demanda nodal.
As demandas nodais são geralmente modeladas com base na densidade ocupacional. Isso
significa que quanto maior a demanda nodal, maior será a possibilidade de atingir um
número maior da população. Logo, ao analisar esse cenário, nós com maiores demandas
possuem maior probabilidade de contaminação intencional. A equação (Equação 4.8) (HE
et al., 2018) mostra a probabilidade de contaminação nodal como a proporção da demanda
nodal em relação às demandas totais da RDA. A probabilidade de contaminação nodal (𝑃1 )
trata-se de uma relação simples e direta entre uma demanda nodal e a demanda máxima da
rede.
∑𝑡=Δ𝑡
𝐴Δ𝑡
𝐷𝑖 (𝑡)
𝑃1(𝑖) = 𝑁 𝐴Δ𝑡
∑𝑖=1 ∑𝑡=Δ𝑡 𝐷𝑖 (𝑡)
(4.8)
onde 𝑃1 (𝑖) é a probabilidade de contaminação do nó (𝑖 = 1, 2, ..., 𝑁 ) (𝑁 é o número total de nós

no RDA); 𝐷𝑖 (𝑡) é a demanda de água do nó i no tempo t (𝑡 = Δ𝑡, 2Δ𝑡, ..., 𝐴Δ𝑡), 𝐴 número total
de o período de tempo de simulação único Δ𝑡, se Δ𝑡 = 1 e 𝐴 = 24 para uma simulação diária;
∑𝑡=Δ𝑡
𝐴Δ𝑡
𝐷𝑖 (𝑡) é a demanda total de água do nó 𝑖 durante todo o período de tempo (ou seja, todo
o período de tempo da demanda padrão).
4.3.2 FPC2-baseada nas distâncias de nós comuns para os nós de

usuários especiais.
Há nós na RDA que atendem usuários especiais como escolas, hospitais e departamentos
governamentais. Esses tipos de usuários são mais suscetíveis a ataques por contaminante,
pois atingem um grupo específico da população causando pânico social. Por ser alvo de
outros tipos de ataques, possuem segurança reforçada, geralmente, e acesso restrito. Logo,
nós de usuários comuns localizados nas proximidades tornam-se possíveis alvos de ataques
intencionais. Os nós localizados a distâncias menores em relação aos nós especiais possuem
uma maior probabilidade de contaminação, já que sabendo o sentido da vazão da rede é
possível atingir indiretamente os nós de usuários especiais. Geralmente, para modelar esse
tipo de usuário, nós especiais são criados para representar essa demanda exclusiva. No caso
dessa pesquisa, seis nós da rede JYN foram considerados como usuários especiais, como
apresentado na pesquisa de He et al. (2018). Ao reconhecer isso, o FPC2 é representado pela
Equação 4.9. A distância Euclidiana (𝑑𝑖,𝑗 ) é a distância entre os nós de usuários especiais (𝑗) e
os nós comuns (𝑖); (𝑥) e (𝑦) representam as coordenadas dos nós, logo a distância pode ser
calculada como:
𝑑𝑖,𝑗 = [(𝑥𝑖 − 𝑥𝑗 ) + (𝑦𝑖 − 𝑦𝑗 ) ]

2 2
1
2
(4.9)
Observa-se que a distância dos nós especiais é nula (𝑑𝑗,𝑗 = 0). No entanto, isso não exclui a
probabilidade de contaminação dos nós especiais, pois após o calculo das distâncias 𝑑𝑖,𝑗 um
processo de normalização é conduzido, levando a uma distribuição probabilística na qual as
menores distâncias têm maior probabilidade de contaminação. Com isso, os nós especiais
permanecem com a maior probabilidade de serem atacados intencionalmente.
Os valores de 𝑑𝑖,𝑗 são armazenados na matriz 𝐷(𝑛 × 𝑧) (Equação4.10),onde (𝑛) é o número
de nós especiais e (𝑧) e número total de nós da RDA.
⎛𝑑
⎜ 1,1 ... 𝑑1,𝑗 ⎟
⎞
𝐷(𝑛 × 𝑧) = ⎜ ⋮ ⋱ ⋮ ⎟
⎜ ⎟
(4.10)
⎜ ⎟
⎜𝑑 ⋯ 𝑑𝑖,𝑗 ⎟
⎝ 𝑖,1 ⎠
Após a formação da matriz 𝐷(𝑛 × 𝑧) apenas a menor distância entre nós especiais para
todos os nós comuns da rede, formarão o vetor (𝑧 × 1). Logo, todos os valores do vetor foram
normalizados entre 0 e 1 onde valores de distâncias menores possuem valores normalizados
mais próximos de 1 e os com maiores distâncias mais próximos de 0. Esse valores normalizados
são representados por 𝑃2 (Equação 4.11).
𝑃2 = 𝑚𝑖𝑛(𝑑𝑖 ) (4.11)
4.3.3 Função de probabilidade de contaminação baseada na

importância dos nós nas redes principais (FPC3) e variação da
porcentagem de rede troncal.
A teoria dos grafos (AHUJA et al., 1995; CAMPBELL et al., 2015; 2015; MEIRELLES et al., 2018)
foi aplicada para a determinação do caminho mais curto (CMC) da rede JYN. Dessa forma, os
nós e tubulações pertencentes à rede principal possuem uma importância maior em relação
aos demais nós e tubulações da rede, possibilitando uma maior dispersão do contaminante em
caso de ataque químico. A teoria dos grafos determina que tubulações com valor elevado de
caminho mais curto acumulado (VCMCA), possuem maior importância dentro da rede. Logo,
ao determinar as tubulações e nós com maior importância dentro da rede é possível classificar
os nós com maior chance de ataques intencionais. Nesta pesquisa, o VCMCA foi atribuído
como a FPC3, onde são utilizados os valores normalizado entre 0 e 1 a fim de representar a
probabilidade de ataque em nós de maior importância (𝑃3 ).
A teoria de grafos foi aplicada para a determinação da rede troncal (RT) com diferentes
porcentagens, sendo 20, 30, 50%. Dessa forma, os nós pertencentes às diferentes porcentagens
da rede troncal possuem uma importância maior em relação aos demais nós da rede. Isso se
deve ao fato do nó pertencente a RT conseguir alcançar um maior número nós, facilitando a
dispersão do contaminante. Seguindo a teoria, quanto maior o valor do caminho mais curto
acumulado (VCMCA) em um determinado tubo, maior será sua importância dentro da RT.
Logo, ao determinar as tubulações e nós com maior importância dentro da rede é possível
classificar os nós com maior chance de ataques intencionais. As três diferentes probabilidade
de contaminação nodal geradas a partir da rede troncal (20, 30 e 50%) foram analisadas com o
intuito de determinar a influência das mesmas na alocação ótima de sensores. Nesta pesquisa,
o VCMCA foi normalizado entre 0 e 1 a fim de representar a probabilidade de contaminação
(𝑃𝑅𝑇 ) em nós de maior importância.
Já a probabilidade de contaminação dos demais nós da RDA, possui o mesmo valor de
probabilidade de contaminação nodal. Esse valor é 10% menor do que a menor probabilidade
de contaminação nodal atribuída nas três condições de porcentagem da RT. Ou seja, foi feito
um levantamento dos menores VCMCA normalizados, nas três condições de porcentagens.
Posteriormente, houve a diminuição em 10% do menor valor entre os VCMCA normalizados.
Assim, considera-se que existe a possibilidade dos demais nós serem contaminados, mas as
maiores probabilidades de contaminação estão atribuídas aos nós da RT.
4.3.4 FPC4- Baseado nos usuários especias, distância entre nós e

demanda nodal.
Como mencionado anteriormente na FPC2, quanto maior a demanda nodal, mais propenso está
um nó para a um ataque. Com isso, é importante garantir que o monitoramento da qualidade
da água nesses pontos da rede seja priorizado. A FPC4 se diferencia da FPC2 por garantir que
nós de usuários especiais tenham uma probabilidade de contaminação maior, em relação aos
outros nós. Ou seja, a probabilidade de contaminação nos nós especiais é independente da
demanda. Para tanto, uma probabilidade (𝜏 ) é atribuída ao grupo de nós especiais. Além disso,
a probabilidade de contaminação dos nós comuns é atribuída por meio da multiplicação da
demanda nodal pela distância mínima entre os mesmos e os nós especiais. Portanto, com base
na função de probabilidade de contaminação para usuários especiais criada por He et al (HE
et al., 2018) e a probabilidade de contaminação (𝑃4 ) está representada pela Equação 4.12
⎧
⎪𝜏 , 𝑖𝜖Ψ
⎪
⎪
𝑃4 (𝑡) = ⎨ (4.12)
𝑡=Δ𝑡 𝐷𝑖 (𝑡)
×
⎪
⎪ ∑𝐴Δ𝑡 1
𝑡=Δ𝑡 𝐷𝑖 (𝑡)
⎪
⎩ 𝑁 ∑𝐴Δ𝑡
∑ 𝑖=1 𝐷
O conjunto de usuários especiais é representado por (Ψ). A probabilidade é atribuída a

(Ψ) para garantir alta probabilidade independente da demanda nodal. Os outros nós do RDA
recebem probabilidade de acordo com suas demandas (Equação 4.8) multiplicada pelo inverso
da distância mínima (1/𝐷) entre os nós especiais (Equação 4.9).
4.4 Otimização das funções objetivo considerando as

FPC’s.
4.4.1 Tempo de detecção
O tempo de detecção (Equação 4.13) para o nó 𝑖 contaminado no tempo 𝑡 ,𝛾 (𝑖, 𝑡), pode ser
definido como o tempo decorrido desde o início da intrusão de contaminantes no nó 𝑖, até a
primeira identificação da concentração do contaminante por qualquer um dos sensores
alocados na rede (HE et al., 2018). Portanto, o tempo esperado 𝐹1 pode ser expresso como:
∑𝑁𝑖=1 ∑𝑡=Δ𝑡
𝐴Δ𝑡
𝑃 (𝑖) 𝛾 (𝑖, 𝑡)
𝐹1 =
∑𝑖=1 ∑𝑡=Δ𝑡 𝐼 [𝛾 (𝑖, 𝑡)]
𝑁 𝐴Δ𝑡 (4.13)
⎧
⎪1, 𝛾 (𝑖, 𝑡) > 0
⎪
𝐼 [𝛾 (𝑖, 𝑡)] = ⎨
⎪
(4.14)
0, 𝛾 (𝑖, 𝑡) solução é descartada
⎪
⎪
⎪
⎩
onde 𝑃(𝑖) é a probabilidade de contaminação no nó 𝑖. O indicador 𝐼 = [(𝛾 )((𝑖, 𝑡))] = 1 se a
contaminação no nó 𝑖 no momento 𝑡 for detectada por pelo menos um dos sensores de rede,
se 𝐼 (𝛾( 𝑖, 𝑡) = 0 a solução é descartada.
4.4.2 Probabilidade de Detecção
A (𝐹2 ) quantifica os cenários de contaminação detectados pelos sensores na RDA (Equação

4.15):
{ }
𝑁 𝐴Δ𝑡
𝐹2 = ∑ ∑ 𝐼 [𝛾 (𝑖, 𝑡)] 𝑃(𝑖)
[𝐴 ]
1
(4.15)
𝑖=1 𝑡=Δ𝑡
onde 𝑃(𝑖) indica a probabilidade de contaminação do nó 𝑖 no tempo 𝑡 (t=Δt, 2Δt,... , AΔt),

onde 𝐴 é igual o número total do período de tempo de simulação único.
4.5 Abordagem de otimização

A implementação, da abordagem NSGA-II, segundo Deb et al., (2002), tem seu início com a
geração aleatória de uma população de n indivíduos, onde cada indivíduo representa uma
possível solução para o problema. A seleção da população de indivíduos é realizada pela
classificação dos mesmos em frentes. Esse procedimento se inicia com a determinação do
conjunto de indivíduos não dominados, em relação ao conjunto de indivíduos contidos na
população. Esses indivíduos são classificados na primeira frente e retirados do conjunto sob
análise. Os indivíduos restantes são novamente submetidos à análise de não dominância,
sendo os não dominados classificados na segunda frente e também retirados do conjunto sob
análise.
O NSGA-II na primeira etapa da metodologia foi realizado com os seguintes parâmetros,
na otimização das três funções objetivo (Z1, Z4 e Z5): população igual a 50 para 1, 2 e 4
sensores (número de variáveis), quando o número de sensores é pré definido; crossoverpoint
igual a 2; número de gerações sem melhora da função objetivo igual a 100 e número máximo
de indivíduos igual a 200 multiplicado pelo número de variáveis. Já na segunda etapa ao
otimizar as duas funções objetivo (F1 e F2) considerando as diferentes probabilidades de
contaminação os parâmentros populacionais iguais a 1500, com o número de variáveis fixas
(6 sensores); crossoverpoint igual a 2.
Após a otimização da alocação de sensores é necessário avaliar o conjunto de soluções
não dominadas que compõem a fronteira Pareto, já que, a mesma possui inúmeras soluções
possíveis e todas ótimas, logo é necessário apresentar ao gestor um número menor de
soluções. Para tanto, métodos de análise pós Pareto são capazes de classificar um menor
número de soluções representativas dos conjuntos de soluções Pareto-ótima auxiliando na
etapa de decisão. O método de distância Euclidiana determina a menor distância entre o
ponto ideal e o ponto de solução pertencente à frente de Pareto. O ponto ideal pode ser
encontrado executando uma otimização de objetivo único, considerando a cada otimização,
uma função objetivo do problema multi-objetivo. Dessa forma, a solução resultante será a
mais próxima do que é considerada a solução ideal.
Outra abordagem para analisar soluções é o agrupamento da frente de Pareto com base
em recursos internos e externos. O objetivo principal ao agrupar as soluções é oferecer aos
tomadores de decisão pontos representativos da Pareto. Os pontos são agrupados em clusters
(k ) de acordo com uma característica semelhante usando o algoritmo k-means. A abordagem
é baseada nas seguintes etapas: (1) obter o conjunto de soluções Pareto por meio do algoritmo
de otimização; (2) Aplicar o algoritmo k-means para formar clusters nas soluções contidas no
conjunto Pareto; (3) Determinar o número “ótimo” de clusters (k), neste conjunto aplicado os
gráficos de silhueta. O maior valor de largura de silhueta, 𝑠(𝑖), determina o número “ótimo” de
clusters no conjunto de soluções Pareto; (4) Seleção de uma solução representativa para cada
cluster. Para tanto, a solução mais próxima de seu centroide de cluster é escolhido como uma
ótima solução representativa.
tu
68
Capítulo 5
Resultados e discussões
Neste capítulo são apresentadas as aplicações da metodologia em duas redes de distribuição

de água. O capítulo está divido em três seções principais, a primeira: "Validação da
metodologia em rede hipotética", apresenta os resultados obtidos ao aplicar a metodologia
em uma rede pequena com otimização de três funções objetivos para alocação ótima de
sensores. Na segunda seção: "Aplicação da metodologia em rede real", são apresentados os
resultados obtidos ao aplicar a metodologia em uma rede real da literatura com otimização de
duas funções objetivo para a alocação ótima de sensores. Nessa etapa foram consideradas
diferentes probabilidades de contaminação nodal. Já a terceira seção: "Comparações de
soluções de layout usando a seleção automática", são apresentados os diferentes layouts de
alocação de sensores obtidos por meio de dois métodos de tomada de decisão multicritério
5.1 Validação da metodologia em rede hipotética
5.1.1 Descrição da Rede de distribuição de água
A metodologia apresentada foi aplicada à rede hipotética de Al-zahrani e Moied

(2003)(Figura 5.1), composta por 15 nós, 23 tubos e 3 reservatórios (16, 17 e 18). Optou-se por
utilizar essa rede para os primeiros testes por se tratar de uma rede simples sem manobras
hidráulicas, facilitando a análise da metodologia proposta através do desempenho da
abordagem multiobjetivo na otimização da alocação de sensores, junto à modelação de
qualidade da água com reações químicas detalhada do contaminante PA.
Capítulo 5. Resultados e discussões 69
Figura 5.1: Rede Simples.
Fonte:(AL-ZAHRANI; MOIED, 2003).
A cloração da rede, para este estudo, foi realizada por meio da injeção de cloro, com uma
concentração de 1.5𝑚𝑙/𝐿 estabelecida pela PORTARIA DE CONSOLIDAÇÃO Nº 5, DE 28 DE
SETEMBRO DE 2017. (2017), nos três reservatórios durante 24h, sendo os cálculos dos
valores da qualidade da água feitos em passos de tempo de 600s, em todo o RDA. Nesse
estudo considerou a injeção do contaminante (PA) após 6 horas de simulação com uma
concentração de 12.4𝑚𝑔/𝐿, sendo essa a concentração de solubilidade do PA limite para que
não seja feita a identificação visual, uma característica viável em caso de ataque. A simulação
da qualidade da água foi realizada com esse padrão para todos os nós da rede, ou seja, para
cada nó da rede foi injetado o contaminante PA e simulado um cenário de contaminação,
gerando 14 possíveis eventos de contaminação. O mesmo não ocorreu para o nó 14, pois não
estava sendo alimentado.
O padrão do comportamento do cloro ao longo do período de simulação, comportamento
extraído do nó 12, oscila seguindo o comportamento da demanda, como esperado (Figura
5.2), mas ao reagir com o contaminante PA , dando extraído do nó 15, ocorre uma diminuição
abrupta do cloro (Figura 5.2) o tempo 6 horas quanto ocorre a contaminação . O mesmo
comportamento foi observado no estudo de Ohar, Lahav e Ostfeld (2015), devido a esse
comportamento o cloro é um parâmetro indicativo de contaminação, neste estudo.
Figura 5.2: Comportamento do cloro ao longo da simulação.
10-5
Sem contaminação
1.7
Com contaminação
1.6
1.5
1.4
Cloro (mg/L)
1.3
1.2
1.1
0.9
0.8
0.7
0 2 4 6 8 10 12 14
Horas
Fonte: Arquivo pessoal.
5.1.2 Abordagem NSGA-II e Extração de Regras
A implementação multiobjetivo começou otimizando simultaneamente duas funções objetivo,

Z1 e Z4, logo foi necessário determinar um número de sensores, sendo 1, 2 ou 4. Os locais dos
sensores são selecionados aleatoriamente a partir dos resultados dos eventos de contaminação
e das funções objetivo. Os resultados da otimização são obtidos da frente de Pareto que é
composta por um conjunto de soluções não dominadas (Figura 5.3 ).
Figura 5.3: Fronteira de Pareto para número de vriáveis iguais a 2 e 4 sensores.
Fonte: (CARDOSO et al., 2018).
Em seguida simulou uma otimização considerando três funções objetivo, Z1, Z4 e Z5. Nessa
etapa o número de sensores é gerado aleatoriamente mediante aos cenários de contaminação
e as função objetivo Z1 e Z4. O melhor conjunto de soluções da otimização da localização de
sensores foi obtida em frente de Pareto (Figura 5.4).
Figura 5.4: Fronteira de Pareto com número de variáveis indeterminado.
O método da distância Euclidiana é utilizado de forma automatizada com o cálculo da

menor distância entre o ponto ideal e a solução pertencente a fronteira Pareto, para cada
condição analisada. Ou seja, a condição onde são otimizadas simultaneamente as funções
objetivo Z1 e Z4, a solução ideal seria o tempo mínimo de detecção (0s) e a máxima
probabilidade de detecção (100%), logo o ponto ideal é [0,-1]. Já ao considerar as três funções
objetivo, o ponto utópico passa a ser [0, -1,1],onde a solução ideal é o tempo mínimo de
detecção é 0s, a probabilidade máxima para detectar uma contaminação é de 100% e o
número mínimo de sensores é 1. A Tabela 5.1 apresenta os resultados para localização de

sensores pré-definidos.
Tabela 5.1: Soluções selecionadas.
Número de
Nós Tempo de detecção (s)
Sensores
1 15 928,9285
2 12 e15 881,7857
4 9, 11, 12 e 15 879,6429
Sensores otimizados 12, 13 e 15 879,6429

Fonte:(CARDOSO et al., 2018).
Ao analisar as melhores soluções obtidas através da extração de regras apresentadas na

Tabela 5.1 observa-se que o nó 15 é escolhido como o melhor em todas as condições. Isso
deve-se ao fato do mesmo receber o escoamento de toda a RDA, sendo capaz de detectar todos
os eventos de contaminação simulados neste estudo. Já a solução para a alocação de dois
sensores na rede, permite que o tempo de detecção seja diminuído ao monitorar o nó 12. No
entanto, quando quatro nós considerados os melhores pela extração de regras são monitorados,
o tempo de detecção diminui e o evento de contaminação é detectado em todos os cenários, se
comparados com as outras condições e levando em consideração a dimensão pequena da rede.
Mas a solução obtida para otimização das três funções objetivo, mostrou a necessidade do
monitoramento de pelo menos 3 nós da rede em estudo. Ao analisar as posições dos nós,
conclui-se que o nó 13 é dispensável, já que o mesmo está localizado entre dois nós já
monitorados, 12 e 15. Com isso, o monitoramento dos nós 12 e 15, para a rede em estudo, é a
solução ótima alcançada e corrobora para a primeira análise onde os sensores foram
pré-definidos.
5.2 Aplicação da metodologia em rede real
5.2.1 Descrição da Rede de distribuição de água
A metodologia de otimização considera a condição dada pelas companhias de abastecimento

de água, a qual por possuir orçamento restrito estabelece uma quantidade fixa de sensores,
com isso o número de sensores é pré-definido. A metodologia foi aplicada na rede JYN (HE
et al., 2018)(Figura 5.5), a mesma é composta por 300 nós, 451 tubulação e 2 reservatórios.
A cloração da rede para o estudo foi realizada com a injeção de cloro na concentração de
1, 5𝑚𝑔/𝐿 em ambos os reservatórios. O cálculo da simulação da qualidade da água é realizado
no intervalo de tempo de 600s. A simulação tem duração de 48 horas, as primeiras 24horas sem
injeção de contaminante, após esse período houve a injeção de PA com duração de 12 horas
com uma concetração de 12, 4𝑚𝑔/𝐿 (SCHWARTZ; LAHAV; OSTFELD, 2014a). Considerando
que todos os nós podem ser contaminado, 300 eventos de contaminação foram simulados na
rede JYN.
Figura 5.5: Rede JYN.
Reservoirs
Junctions
Pipes
Fonte:(HE et al., 2018).
O comportamento do cloro (Figura 5.6) durante a simulação normal (sem intrusão), dado
extraído do nó 58, oscila seguindo o comportamento da demanda, como esperado. Ao reagir
com o contaminante do PA, dado extraído do nó N225, ocorre uma diminuição repentina do
cloro, o comportamento já era esperado visto que o cloro ser um parâmetro indicativo de
contaminação, como já determinado por Ohar, Lahav e Ostfeld (2015). Os resultados da
otimização são apresentados em termos da frente de Pareto, comparando a abordagem
probabilística, apresentada neste trabalho, com a clássica, onde a probabilidade de intrusão
nodal é igual para todos os nós.
Figura 5.6: Comportamento do cloro ao longo da simulação.
10-5
1.8
Sem contaminação
Com contaminação
1.6
1.4
1.2
Cloro (mg/L)
0.8
0.6
0.4
0.2
0
0 6 12 18 24 32 38
Horas
5.2.2 Rede Troncal
A rede troncal pode ser interpretada como uma árvore de tubos e nós nos quais as fontes
de suprimento formam as raízes. A Figura 5.7 representa as porcentagens 20, 30 e 50% da
RT na rede JYN. O intuito de variar as porcentagens da rede troncal é, verificar a influência
da mesma nos resultados dos pontos de monitoramento por sensores de qualidade gerados
através da abordagem NSGA-II de otimização. Com isso, quanto mais alta a porcentagem da
rede principal em relação a rede JYN, maior será o número de tubulações e nós que compõem
a RT.
Figura 5.7: Rede troncal.
Fonte: (CARDOSO et al., 2019)
5.3 Comparação entre as fronteiras finais de Pareto
5.3.1 Variação das porcentagens de Rede Troncal
A proposta de analisar as diferentes porcentagem de RT possibilitou gerar probabilidades de

contaminação nodal distintas, por meio da teoria dos grafos, diferente da abordagem clássica
onde se atribui a mesma probabilidade de contaminação nodal a todos os nós da rede. As
soluções Pareto-ótimas obtidas representam o melhor compromisso entre as duas funções
objetivo otimizadas simultaneamente (𝐹1 e 𝐹2 ) (Figura 5.8).
Figura 5.8: Fronteiras de Pareto considerando as diferentes porcentagens de RT em comparação

com a abordagem clássica.
As fronteiras Pareto que representam os resultados gerados a partir da variação das

porcentagens da RT, em relação a abordagem clássica, demonstram que há uma diminuição
do conjunto de soluções ótimas. Isso se explica pela restrição de nós preferências para a
instalação da estação de monitoramento. Ou seja, no método clássico todos os nós são eleitos
para o monitoramento. Já ao aumentar a probabilidade de contaminação dos nós
pertencentes a RT em relação aos demais nós o algoritmo terá uma maior restrição. E a maior
parte das soluções geradas pelas três porcentagens de RT (20, 30 e 50%) estão dominando os
resultados apresentados pela abordagem clássica. Ou seja, as fronteiras de Pareto apresentam
conformações variantes, descontinuidade e soluções pertencentes as regiões dominada, em
relação a abordagem clássica.
5.3.2 Diferentes funções de probabilidade de contaminação
A FPC1 faz a distribuição de probabilidade por meio da análise das demandas nodais em
relação a demanda total da RDA, ou seja quanto maior a demanda nodal maior será a
probabilidade de contaminação nesse ponto. Analisando as fronteiras de Pareto do método
clássico e a gerada pela FPC1 (Figura 5.9), ambas abordagem apresentam grande número de
soluções não dominadas, isso se explica por serem menos restrita a escolha dos nós para a
alocação dos sensores, possibilitando soluções não dominadas que se distribuem
uniformemente por toda a fronteira de Pareto. A fronteira de Pareto da FPC1 apresenta
soluções pertencentes às regiões dominadas da abordagens clássica.
Figura 5.9: Fronteiras de Pareto considerando o FPC1 em comparação com a abordagem

clássica.
0 Clássico
solução escolhida- clássico
FPC1
-0.2 solução escolhida- FPC1
Função Objetivo 2
Ponto ideal
-0.4
-0.6
-0.8
-1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Função Objetivo 1
Ao aplicar a FPC2 no estudo da otimização da alocação de sensores na rede JYN busca-se

uma alocação que considere as distâncias entre os nós especiais e os comuns, onde quanto
menor a distância dos nós comuns em relação aos nós especiais maior será a probabilidade de
contaminação. A Figura 5.10 apresenta as fronteiras Pareto da FPC2 e da abordagem clássica.

clássica.
0
Clássico
-0.2 FPC2
solução escolhida- FPC2
Função Objetivo 2
Ponto ideal
-0.4
-0.6
-0.8
-1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Função Objetivo 1

Ao considerar as probabilidades de contaminação da FPC1 e FPC2 na otimização da

alocação de sensores, todos os nós das redes são considerados como possíveis estações de
monitoramento. Com isso, ambas FPC proporcionam uma probabilidade de contaminação
distribuída por toda a rede, onde todos os nós possuem relevância facilitando a busca de
soluções não dominadas e possibilitando a formação da fronteira Pareto contínua, sendo esse
comportamento semelhante ao método tradicional. Mas ambas FPC’s apresentam soluções
pertencentes as regiões dominadas da abordagem clássica.
A FPC3 restringe as maiores probabilidades de contaminação para os nós pertencentes
à rede principal que possuem maior VCMCA, segundo a teoria dos grafos. Dessa forma, a
busca por soluções não dominadas que convergem para fronteira de Pareto é mais complexos,
gerando descontinuidade da Pareto (Figura 5.11). As soluções não dominadas da FPC3 são
dominadas pela fronteira de Pareto da abordagem clássica. O ponto ideal de FPC3 situa-se na
região dominada da fronteira de Pareto.

clássica.
0 Clássico
ponto ideal- Clássico
-0.2 FPC3
Função Objetivo 2

ponto ideal- FPC3
-0.4
-0.6
-0.8
-1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Função Objetivo 1
A FPC4 atribui um peso maior aos nós do tipo especiais independente da demanda nodal
e outras probabilidades. Considera probabilidade de contaminação para os nós comuns da
rede ao considerar a distância mínima entre nós comuns e especiais multiplicadas pela suas
respectivas demandas nodais. Como as maiores probabilidade estão restritas a seis nós da
rede (nós de usuários especiais), o conjunto de soluções não dominadas é inferior. Assim, a
fronteira de Pareto que considera a FPC4 (Figura 5.12) apresenta-se descontínua e sem
distribuição uniforme, demonstrando a dificuldade na busca por soluções não dominadas que
convergem para fronteira Pareto. As soluções não dominadas da FPC4 são dominadas pela
fronteira de Pareto da abordagem clássica.

clássica.
0
Clássico
solução escolhida- Clássico
-0.2 FPC4
Função Objetivo 2
Ponto ideal
-0.4
-0.6
-0.8
-1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Função Objetivo 1
5.4 Comparações de soluções de layout usando a seleção

automática
5.4.1 Layouts gerados pelo método Distância Euclidiana
Layouts gerados com diferentes porcentagens de Rede troncal
Os layouts ideias do projeto da rede de sensores para todas as FPC’s e para a abordagem
clássica foram gerados por meio do método distância Euclidiana. Qualquer solução
pertencente a fronteira de Pareto poderia ser escolhida como solução final, uma vez que são
soluções ótimas. Mas, ao utilizar o método um número menor de soluções ótimas e
representativas pertencentes a fronteira de Pareto são apresentadas ao decisor/companhia de
abastecimento de água. Dessa forma, a etapa de escolha da solução mais adequada para o
problema de alocação ótima de sensores torna-se mais fácil.
Ao aplicar o método distância Euclidiana nas fronteiras de Pareto geradas pela variação
da porcentagem de RT, supõe um ponto ideal na fronteira Pareto normalizada [0,1], em que
0 representa o menor tempo de detecção e 1 a máxima probabilidade de detecção, neste caso.
O resultado é o layout ideal da alocação de sensores para cada condição de porcentagem. Os
layouts das três porcentagens de RT representam a solução mais próxima da ideal do conjunto
de soluções das fronteiras de Pareto, uma vez que a abordagem multiobjetivo NSGA-II não
gera um único resultado ótimo.
A Figura 5.13 representa o layout ideal para a condição de 20% da RT. Ao analisar o grafo
da RT (Figura 5.13) observa-se que o caminho traçado compõe apenas metade dos nós
selecionados para o monitoramento, além de nós escolhidos para o monitoramento estarem
próximos á locais com maior probabilidade contaminação, nessas condições. Na figura 5.13,
quanto maior a dimensão do nó, maior a demanda nodal.
Figura 5.13: Layout 20% RT.
A variação de porcentagem de 30% de RT apresenta um layout ideal (Figura 5.14) onde

apenas dois sensores fazem parte do caminho principal. Em comparação ao layout da
porcentagem de 20% (Figura 5.13), quatro sensores foram alocados na mesma posição. Na
figura 5.14, quanto maior a dimensão do nó, maior a demanda nodal.
Já a condição de 50% da RT representada no layout ideal (Figura 5.15 ), com maior cobertura
espacial, ou seja há uma expansão em relação as condição com menores porcentagens de RT.
Apenas dois nós fazem parte da RT. Na figura 5.15, quanto maior a dimensão do nó, maior a
demanda nodal.

Todas as condições de variação de porcentagens mostram uma alocação próxima. Isso

corrobora com o aumento gradativo de RT, pois a cobertura geográfica seguiu o
comportamento de árvore e atingiu a mais pontos conforme houve a mudança de
porcentagens de RT. Com isso, se o intuito da companhia de abastecimento de água é ter uma
maior cobertura da rede, enquanto pontos mais suscetíveis a ataques químicos também são
cobertos, o melhor seria considerar as probabilidades de contaminação geradas por meio de
maiores porcentagens de RT.
Layout gerados com diferentes funções de probabilidades de contaminação
O método distância Euclidiana aplicado em todas fronteiras de Pareto geradas pelo estudo de
probabilidade de contaminação segue as seguintes etapas: (1) determinação dos pontos ideias
por meio da otimização de objetivo único das funções objetivo F1 e F2 realizada pela abordagem
NSGA II (DEB et al., 2002), gerando um ponto ideal com uma única solução ótima de tempo de
detecção e probabilidade de detecção, para todos os casos; (2) Aplicação do método de distância
Euclidiana no conjunto de soluções ótima Pareto; (3) Seleção de uma solução representativa
para cada fronteira de Pareto. A solução ideal escolhida representa layout ideal formado pela
alocação ideal dos sensores. As coordenadas dos pontos ideais e dos pontos selecionados para
todas FPC e abordagem clássica são mostrados na Tabela 5.2.
Tabela 5.2: Coordenadas dos pontos ideais e soluções escolhidas.
Coordenadas
Função de probabilidade de contaminação
Ponto ideal Ponto escolhido
Clássica 1560, -0.8467 1802.47, -0.6067
FPC1 4.32, -0.0029 6.1289, -0.00231
FPC2 781.18, -0.5039 1051.7319, -0.3477
FPC3 38.5, -0.0182 38.2421, -0.01821
FPC4 0.82, -0.0011 1.7079, -0.00077

O layout ideal da abordagem clássica (Figura 5.16) considera todos os nós com a mesma
probabilidade de contaminação, portanto é possível observar que a cobertura espacial
apresenta nós bem distribuídos na rede JYN. Este cenário forneceu uma cobertura percentual
de 60,93%, consistente com as disposições dos nós.
Figura 5.16: Layout da rede de sensores usando a abordagem clássica.
O layout ideal gerado pela FPC1 (Figura 5.17) considera os nós com maior demanda nodal
como mais inclinados a ataques. Assim, os sensores são espacialmente distribuídos perto de
regiões com alta demanda, possibilitando um aumento na cobertura da rede, com 69,87 % da
RDA sendo monitorada. Na figura 5.17, quanto maior a dimensão do nó, maior a demanda
nodal.
Figura 5.17: Layout da rede de sensores usando FPC1.

Os nós monitorados para o cenário usando o FPC2 são apresentados na figura 5.18. Nesse
caso, nós especiais possuem maior probabilidade de serem contaminados e quanto menor a
distância dos nós comuns em relação aos nós especiais maior será a probabilidade atribuída
aos nós comuns. Com isso, é possível observar que os nós monitorados estão espacialmente
distribuídos e relativamente próximos aos nós especiais. Mas, apesar de os nós especiais
possuírem maior probabilidade de contaminação, nenhum sensor é alocado na posição do nó
especial. A taxa de cobertura do layout ideal da FPC2 é de 60,6%, próxima a apresentada pela
abordagem clássica.
As FPC1 e FPC2 foram as que geraram conjuntos de soluções não dominadas Pareto com
maior uniformidade na fronteira Pareto, sendo esse comportamento semelhante ao
apresentado pelo método clássico. Com isso, as duas FPC’s apresentam a alocação de dois
sensores iguais a abordagem clássica, sendo a posição N7 e N272.
A FPC3 (Figura 5.19) está associada ao maior VCMCA, portanto, os nós mais importantes
segundo o critério da teoria dos grafos, são mais propensos a serem contaminados em relação
aos demais. O layout do posicionamento do sensor é espacialmente distribuído,
proporcionando uma cobertura de 81,46%, corroborando com a distribuição em forma de
árvore onde os nós com maior número de tubos conectados são de maior importância,
atingindo um número maior de usuários.
A FPC4 atribui um peso maior aos nós do tipo especiais independente da demanda nodal
e outras probabilidades. Já os nós comuns também possuem probabilidade de contaminação,
uma vez que foi considerada a distância mínima entre nós comuns e especiais multiplicadas
pela suas respectivas demandas nodais. Com isso, os nós especiais possuem probabilidade de
contaminação maior em relação aos nós comuns, mas todos possuem probabilidade de
contaminação. Ao analisar o layout ideal Figura 5.20, os nós N84 e N95 são do tipo especiais e
foram selecionados para monitoramento, corroborando com o princípio da FPC4.
Com isso, o layout é distribuído com dois pontos de usuários especiais sendo monitorados.
Em relação ao percentual de cobertura, essa probabilidade apresenta 75,17%, mesmo com o
monitoramento de nós especiais a porcentagem de cobertura não diminui, como previsto. Os
layouts ideais de FPC3 e FPC4 não possuem nenhuma semelhança com o da abordagem clássica,
corroborando com o fato de não possuírem uma fronteira de Pareto contínua e uniforme como
a apresentada pelo método clássico.
De modo geral, os layouts possuem diferenças mesmo em relação a abordagem clássica,
demonstrando que todas as FPC’s interferem no resultado final da alocação ótima de sensores.
Com isso, é importante que a companhia de abastecimento de água saiba suas preferências
diante do problema de alocação de sensores antes da escolha do melhor layout .
5.4.2 Analise da fronteira de Pareto pelo método k-means
Outra abordagem para analisar as fronteiras de Pareto é utilizando o algoritmo de agrupamento

k-means com base em recursos internos (funções objetivo) e externos (taxa de cobertura). O
objetivo principal é agrupar as solução Pareto-ótimas e oferecer aos tomadores de decisão um
número menor de soluções representativas dentro do conjunto de soluções. As soluções são
agrupadas em k grupos de acordo com característica semelhante seguindo as etapas descritas:
(1) Obter o conjunto de soluções Pareto por meio do algoritmo de otimização NSGAII ((DEB
et al., 2002); (2) Aplicar o algoritmo k-means para formar clusters nas soluções contidas no
conjunto Pareto; (3) Determinar o número “ótimo” de clusters (k), neste conjunto aplicado os
gráficos de silhueta. O maior valor do indicador silhueta, 𝑠(𝑖), determina o número “ótimo” de
clusters no conjunto de soluções Pareto; (4) Seleção de uma solução representativa para cada
cluster. Para tanto, a solução mais próxima de seu centroide de cluster é escolhido como uma
ótima solução representativa.
As figuras 5.21, 5.22, 5.23 e 5.24 apresentam as fronteiras de Pareto agrupadas em 5 grupos,
cada qual com sua solução escolhida como ideal e representativa dentro do conjunto.
Figura 5.21: Pontos representativos com soluções k-means na Fronteira de Pareto - FPC1.
Clusters e Centroides × 10-3 Representação dos Centroides na Fronteira de Pareto

0
Cluster 1 Fonteira de Pareto
Cluster 2 Centroides
90
Cluster 3
Cluster 4
-0.5
80 Cluster 5
Centroides
70
-1
Função Objetivo 2
60
Taxa de Cobertura
50
-1.5
40
30 -2
20
-2.5
10
0 0
-2 × 10-3 -3
4.5 5 5.5 4.5 5 5.5 6 6.5 7 7.5
6 6.5 7 7.5-4
Função Objetivo 1 Função Objetivo 1
Fonte:Arquivo pessoal.
Clusters e Centroides Representação dos Centroides na Fronteira de Pareto

0
Fronteira de Pareto
Centroide
90 Cluster 1 -0.05
Cluster 2
Cluster 3
80 Cluster 4 -0.1
Cluster 5
Centroide
70 -0.15
Função Objetivo 2
60
Taxa de Cobertura
-0.2
50
-0.25
40
-0.3
30
-0.35
20
-0.4
10
-0.45
0 0
-0.2
800 900 -0.5
1000 -0.4 800 900 1000 1100 1200 1300
1100 1200 1300-0.6 Função Objetivo 2

Clusters e Centroides Representação dos Centroides na Fronteira de Pareto

-0.0182165
Cluster 1 Fronteira de Pareto
84.5 Cluster 2 Centroide
Cluster 3 -0.018217
Cluster 4
Cluster 5
84
Centroide
-0.0182175
83.5
Função Objetivo 2
-0.018218
Taxa de Cobertura
83
-0.0182185
82.5
-0.018219
82
-0.0182195
81.5
-0.01822
81 -0.018216
-0.018218 -0.0182205
38 39 40 -0.01822 38 38.5 39 39.5 40 40.5 41 41.5 42 42.5 43
41 42 43-0.018222
Função Objetivo 1 Função Objetivo 2 Função Objetivo 1
Representação dos Centroides na Fronteira de Pareto
Clusters e Centroides × 10-4
-2
Fronteira de Pareto
90 Centroide
-3
85
-4
80
-5
Cluster 1
Cluster 2
Função Objetivo 2
75
Taxa de Cobertura
Cluster 3 -6
Cluster 4
70 Cluster 5
-7
Centroide
65
-8
60
-9
55
-10
50
-11
45 0
-1 -12
0.5 1 1.5 × 10-3 0.5 1 1.5 2 2.5 3
2 2.5 3-2 Função Objetivo 2
O método de agrupamento foi eficaz na redução do número de soluções a serem

apresentadas ao tomador de decisão. Assim, o problema de fronteira de Pareto foi superado.
A Tabela 5.3 apresenta as cinco soluções ideais de todas as FPC como soluções para o
problema de otimização de alocação de sensores.
Com os valores dos recursos internos e externos utilizados para o agrupamento da Pareto
(Tabela 5.3), o tomador de decisão poderá ter um panorama geral das cinco possíveis soluções
para o problema de alocação de sensores. Além disso, o decisor poderá analisar qual critério
é o mais importante segundo sua análise do problema, ou seja, analisar qual combinação de
recurso irá atender melhor ao problema de alocação de sensores.
Tabela 5.3: Soluções represetativas dos grupos de cada Fronteira Pareto.
Funções de Probabilidade Clusters F1 F2 Taxa de Cobertura (%)
1 6.47 -0.0026 78.15
2 5.22 -0.000867 28.48
CPF1 3 4.86 -0.000456 16.22
4 5.94 -0.0019 56.95
5 5.59 -0.0014 43.71
1 1199.00 -0.489 83.44
2 882.46 -0.115 22.18
CPF2 3 1130.00 -0.447 75.82
4 1050.00 -0.342 59.60
5 967.05 -0.243 44.70
1 42.38 -0.0182 83.11
2 40.10 -0.0182 81.46
CPF3 3 40.38 -0.0182 83.44
4 42.15 -0.0182 82.45
5 38.37 -0.0182 81.79
1 2.34 −9.51𝑥10−4 85.10
2 0.87 −2.34𝑥10−4 47.68
CPF4 3 1.83 −7.77𝑥10−4 78.81
4 1.52 −5.87𝑥10−4 63.91
5 2.14 −9.48𝑥10−4 83.11

Com o intuito de comparar as duas formas de análise da Pareto, distância euclidiana e k-

means, foram elaborados os layouts ideias de todas FPC. A Figura 5.25 apresenta os layouts da
FPC1 com os cinco possíveis layouts de alocações de sensores, sendo que cada layout representa
um cluster. Em comparação com o layout apresentado pela análise da distância Euclidiana
observa-se que o layouts ideal do cluster 4 apresenta três alocações semelhantes (30, N266 e
N272).
Figura 5.25: Layout da rede de sensores - FPC1.
2
5
3
2 3 2
4 3
4 4 1
1
3
5 5
5 4
5
1
1 1 3
5 3
2
4
(1) - Cluster 1
2
(2) - Cluster 2
2
Center
(3) 1
- Cluster 3
4
(4) - Cluster
Center 2 4
(5) - Cluster
Center 3 5
- Nós4Especiais
Center
- Nós5Selecionados
Center
Os layouts da CPF2 (figura 5.26) gerados pelo método k-means alocaram sensores próximos
aos nós especiais, logo está coerente com o proposto em FPC2 onde nós mais próximos aos
nós especiais possuem maior probabilidade de contaminação. Em relação ao método distância
Euclidiana apresenta similaridade da alocação de sensores apenas no cluster 1, onde 4 sensores
foram alocados na mesma posição (N7, N63, N194 e N272).
4 2
1 5
4
2
5
1
4
2
5 5
1 2
3
5
2
3
2
3 1
5 1
3
3
4
(1) - Cluster 1
4 (2) - Cluster 2
Center
(3) 1
- Cluster 3
1
(4) - Cluster
Center 2 4
(5) - Cluster
Center 3 5
- Nós4Especiais
Center
- Nós5Selecionados
Center
3
4
Os layouts da FPC3 (figura 5.27) pelo método k-means possuem dois nós alocados na mesma
posição do método da distância Euclidiana em todos os clusters, sendo a posição 44 e N252.
A taxa de coberturas (Tabela 5.3) também apresenta valores próximos corroborando para a
análise. A similaridade na alocação pode estar relacionada ao fato da FPC3 priorizar nós a
partir do ASPV, logo a alocação de sensores fica mais restrita.
1 2
5 1 2
3
4 5
3
4
5
1 2
3 5
4 2 2
1
3
4
1
5
3
1 2 (1) - Cluster 1
5
3 (2) - Cluster 2
4
(3) - Cluster
Center 1 3
(4) - Cluster
Center 2 4
(5) - Cluster
Center 3 5
- Nós
Center 4Especiais
- Nós Selecionados
Center 5
Já os layouts de FPC4 (Figura 5.28) apresentados pelo método k-means alocaram sensores
em nós especiais, corroborando com a FPC4 que atribui um peso maior de probabilidade de
contaminações para nós especiais independente das propriedades ou demanda real. Além
disso, em comparação ao método da distância euclidiana as mesmas duas posições de nós
especiais (N84 e N95) foram selecionadas para o monitoramento. O cluster 5 foi o mais
semelhante em ambas abordagens, apresentado 5 posições iguais selecionadas para a
alocação de sensores.
1 2 5
3
2
4
3 1 2
2 5 3
5 4
3 4
2 4
2
5 3
4
(1) - Cluster 1
5
(2) - Cluster 2
1
3
Center
(3) 1
- Cluster 3
5
(4) - Cluster
Center 2 4
(5) - Cluster
Center 3 5
- Nós4Especiais
Center
1 - Nós
Center 5 Selecionados

Ao comparar os métodos de tomada de decisão multicritérios observa-se que ambos

mostram-se eficientes para a análise automática do conjunto de soluções Pareto-ótima. Uma
vez que, tanto o método de distância Euclidiana quanto o k-means reduziram o número de
soluções representativas da fronteira de Pareto e com relativa semelhança. Com isso, a etapa
de tomada de decisão que mostrava-se exaustiva e difícil, torna-se mais clara e eficiente.
93
Capítulo 6
Conclusões
A segurança do SDA é uma questão abordada em diferentes linhas de pesquisa nas áreas de
tecnologia e engenharia, englobando questões de saúde pública, sistemas econômicos e
inteligentes. Isso deve-se ao fato de o sistema ser responsável pelo abastecimento de uma
população com a substância indispensável no dia-a-dia, a água. Portanto, a grande extensão
da rede de água e o fácil acesso a pontos de intrusão são fatores que a tornam vulnerável,
facilitando os casos de contaminação que trazem danos irreversíveis à sociedade. Os estudos
de alocação de sensores ideais visam melhorar o monitoramento da qualidade da água
fornecida aos consumidores e detectar possíveis intrusões de contaminantes por causas
acidentais ou intencionais na rede. Este trabalho propôs avaliar a metodologia de alocação de
sensores ótimos incorporando diferentes probabilidades de contaminação para os nós da
rede, já que nos métodos tradicionais a probabilidade é considerada a mesma para todos os
nós.
Para isso, vários cenários de contaminação foram gerados com a injeção do contaminante
PA. Posteriormente, duas funções objetivo (𝐹1 e 𝐹2 ) foram otimizadas, incorporando quatro
diferentes funções de probabilidade de contaminação, 𝑃𝑖 . A abordagem de otimização
multiobjetivo do NSGA-II foi capaz de gerar soluções não dominadas pertencentes à frente de
Pareto, para o estudo de caso com a rede real JYN. O método de apoio à decisão, distância
Euclidiana, ajudou a escolher o melhor layout de rede de sensores pela empresa de
abastecimento de água..
A análise da fronteira de Pareto pode ser desafiadora por possuir inúmeras soluções não
dominadas. Foram sugeridos dois métodos de tomada de decisão multicritério para etapa de
análise pós Pareto. O método distância Euclidiana possibilitou diminuir o número de
Capítulo 6. Conclusões 94
soluções ótimas para todos os FPC representativo dentro do conjunto de solução Pareto. Com
isso, um layout ideal para cada FPC foi analisado por meio da taxa de cobertura, bem como
pelas prioridades que cada um buscava dentro do problema de alocação de sensores. Já o
método de agrupamento k-means agrupou as fronteiras de Pareto em cinco grupo de acordo
com parâmetros de agrupamentos (F1, F2 e Taxa de cobertura), onde uma solução ideal
representativa de cada grupo foi apresentada ao decisor, bem como o layout ideal. Ambas
abordagens de análise pós processamento da fronteira Pareto mostraram-se eficientes e
colaborativas para etapa de tomada de decisão, mas cabe ao decisor/comapanhia de
abastecimento de água avaliar qual das soluções ótimas é mais adequada segundo sua
preferências.
Além disso, todas as FPC’s interferiram na busca da alocação ótima de sensores. Isso
possibilita determinar quais os nós devem ser priorizado segundo as preferências da
companhia de abastecimento de água ou visando possíveis ataques intencionais na SDA
antes de realizar a otimização da alocação de sensores. O estudo contribui com trabalhos
futuros visando a melhoria da segurança em SDA, a partir da alocação ótima de sensores de
qualidade, incorporando diferentes probabilidades de contaminação na metodologia.
95
Referências bibliográficas
AHUJA, R. K.; MAGNANTI, T. L.; ORLIN, J. B.; REDDY, M. Applications of Network

Optimization. Handbooks in Operations Research and Management Science, v. 7, 1995.
ALLMANN, T. P.; CARLSON, K. H. Expanded summary: Modeling intentional distribution

system contamination and detection. American Water Works Association, v. 97, p. 58–61,
2005.
ANDERSSON, J. Sensitivity Analysis in Pareto Optimal Design. Proceedings of the 4th Asia-
Pacific Conference on Simulated Evolution and Learning (SEAL2), v. 1, p. 156–161, 2002.
ANTUNES, C. H.; ALVES, M. J.; JOÃO, C. Manual de Computação Evolutiva e

Metaheurística. [S.l.]: Imprensa da Universidade de Coimbra, 2012. p. 323–356.
BERRY, J. W. et al. Water Quality Sensor Placement in Water Networks with Budget
Constraints. Impacts of Global Climate Change, p. 1–11, 2005.
BERRY, J.; HART, W. E.; PHILLIPS, C. A. Sensor Placement in Municipal Water Networks. J.
Water, v. 131, p. 237–243, 2003.
BRENTAN, B. M. Sistemas de abastecimento de água inteligentes: Previsão de demanda

e controle ótimo em tempo real. Campinas: Tese de Doutorado, FEC-UNICAMP, 2017.
CAMPBELL, E. Sectorización de Redes de Abastecimiento de Agua Potable basada en

detección de comunidades en redes sociales y optimización heurística. Valencia,
Espanha: Tese de Doutorado, DEPARTAMENTO DE INGENIERÍA HIDRÁULICA Y MEDIO
AMBIENTE - Universitat politecnica de Valencia, 2017.
CAMPBELL, E. et al. A flexible methodology to sectorize water supply networks based

on social network theory concepts and multi-objective optimization. [S.l.: s.n.], 2015.
v. 18, p. 62–76.
Referências bibliográficas 96
CARDOSO, D. M. Teoria dos Grafos e Aplicações. Aveiro - Portugal: Mestrado em

Matemática, Universidade de Aveiro, 2005.
CARDOSO, S. M. et al. MULTIOBJECTIVE OPTIMIZATION AND RULE EXTRACTION FOR

OPTIMUM LOCATION OF QUALITY SENSORS IN WATER DISTRIBUTION NETWORK.
1stInternational WDSA / CCWI 2018 Joint Conference, 2018.
CARDOSO, S. et al. ESTUDO PROBABILÍSTICO DE ATAQUES QUÍMICOS EM REDES

VISANDO A ALOCAÇÃO DE SENSORES DE QUALIDADE. XVI SEREA Seminário Ibero
americano sobre Sistemas de Abastecimento e Drenagem, 2019.
CARPITELLA, S. et al. Multi-Objective and Multi-Criteria Analysis for Optimal Pump

Scheduling in Water Systems. 13th International conference on hydroinformatics -
HIC2018, v. 3, p. 364–355, 2018.
CHAUDHARI, P.; DHARASKAR, R.; THAKARE, V. M. Computing the Most Significant

Solution from Pareto Front obtained in Multi-objective Evolutionary. International Journal
of Advanced Computer Science and Applications - Ijacsa, v. 1, p. 63–68, 2010.
CHEIKH, M.; JARBOUI, B.; LOUKIL, T.; SIARRY, P. A method for selecting Pareto optimal
solutions in multiobjective optimization. Journal of Informatics and Mathematical
Sciences, v. 2, p. 51–62, 2010.
CHIANDUSSI, G.; CODEGONE, M.; FERRERO, S.; VARESIO, F. E. Comparison of

multi-objective optimization methodologies for engineering applications. Computers and
Mathematics with Applications, Elsevier Ltd, v. 63, p. 912–942, 2012.
COELLO COELLO, C. A.; LAMONT, G. B.; VELDHUIZEN, D. a. V. Evolutionary Algorithms

for Solving Multi-Objective Problems. 2. ed. Boston: Kluwer Academic Publishers, 2002.
COMBOUL, M.; GHANEM, R. Value of Information in the Design of Resilient Water

Distribution Sensor Networks. Journal of Water Resources Planning and Management,
v. 139, p. 449–455, 2013.
COSTA, P. P. da. Teoria de Grafos e suas Aplicações. Rio Claro - São Paulo: Mestrado
Profissional em Matemática - Universidade Estadual Paulista., 2011.
COUNCIL, N. R. Drinking water and health. Washington, D.C.: [s.n.], 1980. v. 2, p. 144–153.
COZZOLINO, L.; MORTE, R. D.; PALUMBO, A.; PIANESE, D. Stochastic approaches for
sensors placement against intentional contaminations in water distribution systems. Civil
Engineering and Environmental Systems, v. 28, p. 75–98, 2011.
DEB, K.; AGRAWAL, S.; PRATAB, A.; MEYARIVAN, T. A fast and elitist multi-objective genetic
algorithm: NSGA-II. IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION, v. 6,
p. 849–858, 2002.
DIRECTIVA 98/83/CE do Conselho de 3 de Novembro de 1998 relativa à qualidade da água

destinada ao consumo humano. [S.l.: s.n.], 1998.
DOLORES, R. Otimização da localização de sensores para detecção de contaminantes

em redes de abastecimento de água. Coimbra, Portugal: Dissertação (Mestrado em
Engenharia) - Faculdade de ciências e tecnologia Universidade de Comibra, 2014.
DORINI, G.; JONKERGOUW, P.; KAPELAN, Z.; SAVIC, D. SLOTS: Effective Algorithm for
Sensor Placement in Water Distribution Systems. Journal of Water Resources Planning
and Management, v. 136, p. 620–628, 2010.
DUIRK, S. E.; DESETTO, L. M.; DAVIS, G. M. Transformation of organophosphorus pesticides

in the presence of aqueous chlorine: Kinetics, pathways, and structure - Activity relationships.
Environmental Science and Technology, v. 43, p. 2335–2340, 2009.
EHSANI, N.; AFSHAR, A. Optimization of Contaminant Sensor Placement in Water

Distribution Networks: Multi-Objective Approach. Water Distribution Systems Analysis,
v. 41203, p. 338–346, 2011.
ELIADES, D. G.; KYRIAKOU, M.; VRACHIMIS, S. G.; POLYCARPOU, M. M. EPANET-MATLAB

Toolkit : An Open-Source Software for Interfacing EPANET with MATLAB. 14th Computer
Control for Water Industry Conference, CCWI 2016, p. 1–8, 2016.
ELIADES, D.; POLYCARPOU, M. M. A Fault Diagnosis and Security Framework for Water
Systems. Ieee Transactions on Control Systems Technology, v. 18, p. 1254–1265, 2010.
ELIADES, D.; STAVROU, D.; VRACHIMIS, S.; PANAYIOTOU, C. G. Contamination event

detection using multi-level thlreshods. Procedia Engineering, Elsevier Ltd, v. 119,
p. 1429–1438, 2015.
FEOFILOFF, P.; KOHAYAKAWA, Y.; WAKABAYASHI, Y. Uma Introdução Sucinta a Teoria

dos Grafos. In: II Bienal da SBM - Sociedade Brasileira de Matemática. São Paulo: [s.n.], 2011.
p. 1–59.
FREITAS, M.; FREITAS, C. A vigilância da qualidade da água para consumo humano: desafios
e perspectivas para o Sistema Único de Saúde. Ciência e Saúde Coletiva, v. 10, p. 993–1004,
2005.
GLEICK, P. H. Water and terrorism. Water Policy, v. 8, p. 481–503, 2006.
GUIDORZI, M.; FRANCHINI, M.; ALVISI, S. A multi-objective approach for detecting and
responding to accidental and intentional contamination events in water distribution systems.
Urban Water Journal, v. 6, p. 115–135, 2009.
HART, W. E.; MURRAY, R. Review of Sensor Placement Strategies for Contamination Warning
Systems in Drinking Water Distribution Systems. Journal of Water Resources Planning
and Management, v. 136, p. 611–619, 2010.
HE, G.; ZHANG, T.; ZHENG, F.; ZHANG, Q. An efficient multi-objective optimization
method for water quality sensor placement within water distribution systems considering
contamination probability variations. Water Research, Elsevier Ltd, v. 143, p. 165–175, 2018.
IQBAL, M. et al. Multi-objective optimization in sensor networks: Optimization classification,

applications and solution approaches. v. 99, p. 134–161, 2016.
KRAUSE, A.; VANBRIESEN, J.; FALOUTSOS, C.; LESKOVEC, J. Efficient Sensor Placement
Optimization for Securing Large Water Distribution Networks. Journal of Water Resources
Planning and Management, v. 134, p. 516–526, 2008.
LEE, B. H.; DEININGER, R. A. OPTIMAL LOCATIONS OF MONITORING STATIONS IN

WATER DISTRIBUTION SYSTEM. J. Environ. Eng, v. 118, p. 4–16, 1992.
LIU, Y.; ÖZYER, T.; ALHAJJ, R.; BARKER, K. Integrating Multi-Objective Genetic Algorithm
and Validity Analysis for Locating and Ranking Alternative Clustering. Informatica, v. 29,
p. 33–40, 2005.
MEIRELLES, G.; BRENTAN, B.; IZQUIERDO, J.; LUVIZOTTO, E. Trunk network

rehabilitation for resilience improvement and energy recovery in water distribution
networks. Water Switzerland, v. 10, 2018.
MITCHELL, M. An introduction to genetic algorithms. London, England: Computers &

Mathematics with Applications, 1996. v. 32.
MOORE, E. F. The shortest path through a maze. In: PROC. Int. Symp. Switching Theory, 1959.
[S.l.: s.n.], 1959. p. 285–292.
MURRAY, R.; HAXTON, T.; MCKENNA, S. A.; HART, D. B. Water Quality Event Detection
Systems for Drinking Water Contamination Warning Systems. EPA, p. 1–91, 2010.
NETO, J. M. M.; MOITA, G. C. Uma introdução à análise exploratória de dados multivariados.

Quimica Nova, v. 21, p. 467–469, 1998.
OHAR, Z.; LAHAV, O.; OSTFELD, A. Optimal sensor placement for detecting organophosphate
intrusions into water distribution systems. Water Research, Elsevier, v. 73, p. 193–203, 2015.
OSTFELD, A.; SALOMONS, E. Optimal early warning monitoring system layout for water
networks security: Inclusion of sensors sensitivities and response delays. Civil Engineering
and Environmental Science, v. 22, p. 151–169, 2005.
OSTFELD, A.; SALOMONS, E. Sensor Network Design Proposal for the Battle of the Water
Sensor Networks (BWSN). 8th Annual Water Distribution System Analysis Symposium,
pp. 1–16, 2006.
OSTFELD, A.; UBER, J. G.; SALOMONS, E.; HART, W. E. The Battle of the Water Sensor
Networks - BWSN. Journal of Water Resources Planning and Management, v. 134,
p. 556–568, 2008.
PALLETI, V. R. et al. Sensor network design for contaminant detection and identification in
water distribution networks. Computers and Chemical Engineering, Elsevier Ltd, v. 87,
p. 246–256, 2016.
PORTAL G1. Abastecimento de água é suspenso em cidade do TO após produto químico

contaminar rede. [S.l.: s.n.]. Disponível em: <http://g1.globo.com/to/tocantins/
noticia / abastecimento - de - agua - e - suspenso - em - cidade - do - to - apos -
produto-quimico-contaminar-rede.ghtml>.
PORTARIA de Consolidação nº 5, de 28 de Setembro de 2017. [S.l.: s.n.], 2017.
PREIS, A.; OSTFELD, A. Multiobjective Sensor Design for Water Distribution Systems Security.
8th Annual Water Distribution System Analysis Symposium, p. 1–17, 2006.
RATHI, S.; GUPTA, R.; ORMSBEE, L. A review of sensor placement objective metrics for
contamination detection in water distribution networks. Water Science and Technology:
Water Supply, v. 15, p. 898–917, 2015.
ROSSMAN, L. A. EPANET 2.0. [S.l.: s.n.], 2000.
ROUSSEEUW, P. J. Silhouettes : a graphical aid to the interpretation and validation of cluster

analysis. Journal of Computational and Applied Mathematics, v. 20, p. 53–65, 1987.
SANKARY, N.; OSTFELD, A. Incorporating Operational Uncertainty in Early Warning System

Design Optimization for Water Distribution System Security. Procedia Engineering, v. 186,
2017.
SCHWARTZ, R.; LAHAV, O.; OSTFELD, A. Integrated hydraulic and organophosphate

pesticide injection simulations for enhancing event detection in water distribution systems.
Water Research, Elsevier, v. 63, p. 271–284, 2014.
SCHWARTZ, R.; LAHAV, O.; OSTFELD, A. Optimal Sensor Placement in Water Distribution
Systems for Injection of Chlorpyrifos. World Environmental and Water Resources
Congress 2014s Water without Borders. ASCE, 2014.
SETH, A.; KLISE, K. a.; SIIROLA, J. D.; HAXTON, T. Testing Contamination Source
Identification Methods for Water Distribution Networks. Journal of Water Resources
Planning and Management, v. 142, p. 1–11, 2016.
SHANG, F.; UBER, J. G.; ROSSMAN, L. EPANET MULTI-SPECIES EXTENSION USER’S

MANUAL. United States: [s.n.], 2008.
SUSE, R. Localização Otima de estações de monitoramento de qualidade em redes de

distribução de Agua. Campinas: Dissertação de Mestrado, FEC-UNICAMP, 2014.
TABOADA, H. A.; COIT, D. W. Data Mining Techniques to Facilitate the Analysis of the
Pareto-Optimal Set for Multiple Objective Problems. In Proceedings of the 2006
Industrial Engineering Research Conference, p. 43–48, 2006.
UOL. Contaminação afeta abastecimento de água. [S.l.: s.n.]. Disponível em:

<http://portal.tododia.uol.com.br/_conteudo/2017/07/cidades/143963-
contaminacao-afeta-abastecimento-de-agua.php>.
VEERAPPA, V.; LETIER, E. Understanding clusters of optimal solutions in multi-objective

decision problems. IEEE 19th International Requirements Engineering Conference,
p. 89–98, 2011.
WEICKGENANNT, M.; KAPELAN, Z.; BLOKKER, M.; SAVIC, D. A. Risk-Based Sensor

Placement for Contaminant Detection in Water Distribution Systems. Journal of Water
Resources Planning and Management, v. 136, p. 629–636, 2010.
XU, J.; SMALL, M.; FISCHBECK, P.; VANBRIESEN, J. Integrating Location Models with
Bayesian Analysis to Inform Decision Making. Journal of Water Resources Planning and
Management, v. 136, p. 209–216, 2010.
XU, J. et al. Identifying Sets of Key Nodes for Placing Sensors in Dynamic Water Distribution
Networks. Journal of Water Resources Planning and Management, v. 134, p. 378–385,
2008.
AL-ZAHRANI, M. a.; MOIED, K. Optimizing water quality monitoring stations using genetic
algorithms. The Arabian Journal for Science and Engineering, v. 28, p. 57–75, 2003.
ZHAO, W.-l.; DENG, C.-h.; NGO, C.-w. Neurocomputing k -means : A revisit.

Neurocomputing, Elsevier B.V., v. 291, 2018.
ZIO, E.; BAZZO, R. A Comparison of Methods For Selecting Preferred Solutions in

Multiobjective Decision Making. Computational intelligence systems in industrial
engineering, p. 23–43, 2012.

Cardoso, Unicamp Sensores

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Cardoso, Unicamp Sensores

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE ESTADUAL DE CAMPINAS

Sandra Maria Cardoso

ALOCAÇÃO ÓTIMA DE SENSORES DE QUALIDADE DE

ALOCAÇÃO ÓTIMA DE SENSORES DE QUALIDADE DE ÁGUA EM

Dissertação apresentada à Faculdade de Tecnologia

Orientadora: Profa. Dra. Lubienska Cristina Lucas Jaquiê Ribeiro

Este exemplar corresponde à versão ﬁnal da

Abaixo se apresentam os membros da comissão julgadora da sessão pública de defesa de dis-

Profa. Dra. Lubienska Cristina Lucas Jaquiê Ribeiro

Prof. Dr. Edevar Luvizotto Junior

Dr. Gustavo Meirelles Lima

Ata da defesa, assinada pelos membros da Comissão Examinadora, consta no SIGA/Sistema de

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal

Keywords: Water-supply, Sensor placement, Genetic algorithms, K-means algorithm.

3.1 Processo do Algoritmo NSGA-II . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1 Rede Fictícia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5.1 Rede Simples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.1 Número mínimo de amostras e frequência para o controle da qualidade da

4.1 Degradação do Paration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.1 Soluções selecionadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

• ANVISA – Agência Nacional de Vigilância Sanitária

• CMC – Caminho mais curto

• DEA – Data Envelopment Analysis (Análise de Envoltória de dados)

• DPI – Desenvolver a distribuição de probabilidade de impacto

• DWD – Drinking Water Dire active (Diretiva Água Potável)

• EUA – Estados Unidos da América

• FPC – Função de probabilidade de Contaminação

• G-MOGA – Guided Multi-Objective Genetic Algorithm (Algoritmo Genético Orientado

• JYN – Rede Jiayou

• LPUE – Licença Pública da União Europeia

• MSR – Métodos de superfície de resposta

• NSGA – Algoritmo genético multiobjetivo elitista

• NSGA-II – Algoritmo genético multiobjetivo

• PWB – Printed Wiring Board (Placa de ﬁação impressa)

• RAP – Redundancy allocation problem (Problema de alocação de redundância)

• RDA – Rede de Distribuição de Água

• RNF – Reservatórios de nível Fixo

• RNV – Reservatório Nivel variável

• SOM – Self-organized map (Mapa auto-organizado)

• SLOTS – sensors local optimal transformation system (Sistema de Transformação Ótima

• STD – Sólidos totais dissolvidos

• SVS – Secretária de Vigilância em Saúde

• 𝑡𝑑 – Tempo de detecção de contaminante

• TDMC – Tomada de decisão multicritério

• 𝑡𝑗 – Tempo da primeira detecção

• TOPSIS – Técnica para Ordem de Preferência por Similaridade à Solução Ideal

• US. EPA – United States Environmental Protection Agency (Agência de Proteção

• VCMCA – Valor caminho mais curto acumulado

• WDS – Water Distribution Systems (Sistema de distribuição de água).

A segurança do Sistema de Distribuição de água (SDA) é uma questão abordada em

2014b). Ou seja, todos os nós da rede independente de suas propriedades e localização na

O objetivo principal desse trabalho é a alocação ótima de sensores de qualidade de água em

2.1 Objetivos Especíﬁcos

II. Aplicar o método de otimização multiobjetivo algoritmo genético NSGA-II

III. Analisar a inﬂuência de diferentes probabilidade de contaminação nodal na alocação

3.1 Controle de qualidade da água em SDA

orgânicos, inorgânicos e microbiológicos, respeitando os padrões de potabilidade e

Water Environment Federation; United States Environmental Protection Agency; Normas

• Cabe às Secretarias de Saúde dos Estados encaminhar aos responsáveis pelo

• Cabe às Secretarias de Saúde dos Municípios exercer a vigilância da qualidade da água em

• Cabe às Secretarias de Saúde dos Municípios inspecionar o controle da qualidade da

Cabe ao responsável pelo sistema ou solução alternativa coletiva de abastecimento de água

• exercer o controle da qualidade da água (Art.13, I);