Escolar Documentos
Profissional Documentos
Cultura Documentos
ESCOLA DE ENGENHARIA
DEPARTAMENTO DE ENGENHARIA ELÉTRICA
NITERÓI
2022
MARCELO ELIAS ALONSO
Orientador(a):
Prof. Dr. Vitor Hugo Ferreira
Niterói, RJ
2022
AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE
TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA
FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.
BANCA EXAMINADORA
________________________________________________
Prof. Dr. Vitor Hugo Ferreira – Orientador(a)
Universidade Federal Fluminense
________________________________________________
Prof. Dr. Angelo Cesar Colombini – Membro Convidado
Universidade Federal Fluminense
________________________________________________
Prof. Dr. Luciano de Oliveira Daniel – Membro Convidado
Universidade Federal Fluminense
Niterói
2022
Dedico este trabalho ao meu saudoso amigo
Luis Gustavo, que descanse em paz.
AGRADECIMENTOS
Agradeço, primeiramente, aos meus pais e minha irmã, por sempre me apoiarem ao
longo da minha vida, principalmente ao longo da graduação, dando a força e a motivação
necessária para enfrentar os desafios de cada etapa.
Agradeço a minha namorada, Fernanda, pelo apoio e motivação diária na parte final
do curso, sendo um dos principais motivos para a conclusão do presente trabalho.
Agradeço aos meus amigos, Antonio, Gustavo, Vitor Arias e Vitor Tabuquini, com
quem passei grande parte da graduação, compartilhando todas as vitórias e desafios e dando
suporte intelectual quando necessário.
Agradeço também aos meus amigos, Gabriel, Mickael, Marco e Luis Gustavo pelos
tempos que passamos e por sempre estarem disponíveis para compartilhar tanto os bons
momentos quanto os maus momentos.
Por fim, agradeço ao meu professor orientador, Vitor Hugo, pelo constante apoio e
suporte intelectual, além da contribuição para a minha formação e introdução dos assuntos deste
trabalho.
“Sonhos se tornam realidade quando você não dorme”
Virgil Abloh
RESUMO
Asset management is an extremely relevant concept for the energy market, as it aims
to determine dealings and processes so that there is greater reliability and quality in the activities
carried out. As a result, one of the main aspects of this grand area is the maintenance of those
assets, since the main objective of this activity is to maximize the equipment's operating time
and the profitability of that process and the equipment itself. With the rapid growth and
diversification of the Brazilian energy matrix and the imminent opening of the energy market,
we are in a period of constant increase in the domestic supply of energy and construction of
power plants in the country. With this in mind, the present work seeks, from data of a biogas
plant, to develop a machine learning model using notions of neural networks to help and assist
predictive maintenance in electric power plants. With the creation of the model, whose main
function is to predict the pre-failure moment in the operation of the plant, it was observed that
the maximum forecast interval would be 20 hours to take measures of precaution without
unnecessarily interrupting the operation of the plant. Thus, the results of this study confirm the
potential of applying a machine learning model in an industrial setting, maximizing the
efficiency of the plant and its equipment.
Tabela 1 - Tipos de manutenção utilizados no Brasil segundo sua distribuição percentual. ..... 5
Tabela 2 - Matriz Confusão. ..................................................................................................... 20
Tabela 3 - Variáveis contidas na categoria ventilação na sala do motor. ................................. 26
Tabela 4 - Variáveis contidas na categoria circuito água do motor.......................................... 26
Tabela 5 - Variáveis contidas na categoria circuito intercooler. .............................................. 26
Tabela 6 - Histórico do acionamento dos alarmes. ................................................................... 27
Tabela 7 - Estruturas de rede neural analisadas. ....................................................................... 34
Tabela 8 - Métricas de avaliação usando os dados de teste e 4 horas antes da falha como
intervalo de previsão. ................................................................................................................ 38
Tabela 9 - Métricas de avaliação usando os dados em tempo real e 4 horas antes da falha como
intervalo de previsão. ................................................................................................................ 39
Tabela 10 - Métricas de avaliação usando os dados de teste e 8 horas antes da falha como
intervalo de previsão. ................................................................................................................ 40
Tabela 11 - Métricas de avaliação usando os dados em tempo real e 8 horas antes da falha como
intervalo de previsão. ................................................................................................................ 40
Tabela 12 - Métricas de avaliação usando os dados de teste e 12 horas antes da falha como
intervalo de previsão. ................................................................................................................ 41
Tabela 13 - Métricas de avaliação usando os dados em tempo real e 12 horas antes da falha
como intervalo de previsão. ...................................................................................................... 42
Tabela 14 - Métricas de avaliação usando os dados de teste e 16 horas antes da falha como
intervalo de previsão. ................................................................................................................ 43
Tabela 15 - Métricas de avaliação usando os dados em tempo real e 16 horas antes da falha
como intervalo de previsão. ...................................................................................................... 43
Tabela 16 - Métricas de avaliação usando os dados de teste e 20 horas antes da falha como
intervalo de previsão. ................................................................................................................ 44
Tabela 17 - Métricas de avaliação usando os dados em tempo real e 20 horas antes da falha
como intervalo de previsão. ...................................................................................................... 45
LISTA DE ABREVIATURAS E SIGLAS
1 INTRODUÇÃO ............................................................................................................... 1
1.1 OBJETIVOS ................................................................................................................ 1
1.2 ESTRUTURA DO TRABALHO ................................................................................ 2
2 FUNDAMENTAÇÃO TEÓRICA .................................................................................. 3
2.1 GESTÃO DE ATIVOS ................................................................................................ 3
2.2 MANUTENÇÃO ......................................................................................................... 4
2.2.1 MANUTENÇÃO CORRETIVA .......................................................................... 5
2.2.2 MANUTENÇÃO PREVENTIVA ........................................................................ 5
2.2.3 MANUTENÇÃO PREDITIVA ............................................................................ 6
2.2.4 ENGENHARIA DA MANUTENÇÃO ................................................................ 6
2.3 TÉCNICAS E TECNOLOGIAS APLICADAS NA MANUTENÇÃO PREDITIVA 6
2.4 INTELIGÊNCIA ARTIFICIAL .................................................................................. 7
2.5 APRENDIZADO DE MÁQUINAS ............................................................................ 8
2.5.1 CLASSIFICAÇÃO NO APRENDIZADO DE MÁQUINAS .............................. 9
2.6 REDES NEURAIS ARTIFICIAIS ............................................................................ 10
2.6.1 MODELO DE UM PERCEPTRON ................................................................... 11
2.6.2 FUNÇÕES DE ATIVAÇÃO .............................................................................. 12
2.6.3 PERCEPTRON DE MÚLTIPLAS CAMADAS ................................................ 16
2.6.4 TÉCNICAS DE APRENDIZADO ..................................................................... 16
2.6.5 TREINAMENTO ............................................................................................... 17
2.6.6 RETROPROPAGAÇÃO .................................................................................... 18
2.6.7 MÉTODOS DE AVALIAÇÃO .......................................................................... 19
3 METODOLOGIA.......................................................................................................... 23
3.1 ESTUDO DE CASO .................................................................................................. 23
3.2 ETAPAS DO DESENVOLVIMENTO DO MODELO DE ML ............................... 23
3.2.1 FERRAMENTAS UTILIZADAS PARA CONSTRUÇÃO DO MODELO DE
ML 23
3.2.2 DADOS UTILIZADOS ...................................................................................... 24
3.2.3 PROCESSAMENTO DOS DADOS .................................................................. 28
3.2.4 FEATURE ENGINEERING .............................................................................. 29
3.2.5 ESTRUTURA E TREINAMENTO DA REDE NEURAL ................................ 33
4 ANÁLISES E RESULTADOS ..................................................................................... 34
4.1 DEFINIÇÃO DA ESTRUTURA DA REDE NEURAL ........................................... 34
4.2 DETERMINAÇÃO DE PARAMETROS DE TREINAMENTO DA REDE NEURAL
36
4.3 DEFINIÇÃO DO INTERVALO DE PREVISÃO .................................................... 37
4.3.1 APRESENTAÇÃO DOS RESULTADOS ......................................................... 38
4.3.2 DISCUSSÃO DOS RESULTADOS .................................................................. 45
4.4 SIMULAÇÃO EM TEMPO REAL ........................................................................... 46
5 CONCLUSÃO E TRABALHOS FUTUROS ............................................................... 48
REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................................... 49
1
1 INTRODUÇÃO
Um ativo é algo que possui valor ou algum tipo de potencial para uma determinada
organização, podendo ser um equipamento ou, simplesmente, algo virtual, como dados de uma
atividade realizada [5]. Com isso, a gestão de ativos é um processo que busca administrar tais
ativos de forma a atingir os objetivos definidos pelas instituições e otimizar seus ganhos [32],
sendo assim, uma atividade fundamental para empreendimentos e indústrias que buscam
crescimento e eficiência de seus ativos.
No ano de 2004, foi lançado um documento padrão para a gestão de ativos, com
orientações e diretrizes a serem seguidos, denominado PAS 55. Esse documento foi criado em
conjunto pelo Instituto de Gestão de Ativos do Reino Unido e a Instituição Britânica de Padrões
de Especificação e a principal ideia por trás desse documento era determinar os principais
pontos para operação, manutenção e gestão dos ativos para que haja maior confiabilidade e
qualidade nestas atividades [1].
A manutenção, por exemplo, é um trabalho que tem como característica o aumento da
disponibilidade dos equipamentos para a produção em contrapartida ao aumento do custo da
operação. Dessa forma, o objetivo principal de qualquer atividade de manutenção deve ser
maximizar o tempo de funcionamento do equipamento e a rentabilidade daquele processo [2].
No setor de geração de energia elétrica, o processo de manutenção visa reduzir os
riscos de interrupção da atividade e de danos aos equipamentos. É de extrema importância para
este segmento que a confiabilidade do sistema seja aumentada, uma vez que se deve garantir o
atendimento completo da demanda do sistema de geração [3].
Dentro desse contexto, a manutenção preditiva tem sido um ponto muito abordado e
relevante para as indústrias por evitar custos excessivos e minimizar o acontecimento das falhas,
apoiando a redução de danos aos equipamentos e recorrentes manutenções preventivas [2].
1.1 OBJETIVOS
2 FUNDAMENTAÇÃO TEÓRICA
Um ativo pode ser dividido em duas categorias principais: físicos e não físicos. Ativos
físicos podem ser aspectos naturais, como a água, terra e ar, ou aspectos construídos pelo
homem, como instalações e infraestruturas. Já os ativos não físicos podem ser virtuais, como
sistemas e dados, ou conceituais, como sistemas de gestão e de conhecimento [4].
Nesse sentido, a gestão de ativos pode ser descrita como um conjunto de atividades
realizadas e associadas com a identificação, comércio, manutenção e ao aspecto financeiro dos
ativos em questão [5].
Ao longo dos anos o conceito de gestão de ativos evoluiu à medida em que foram
publicados mais artigos, estudos e normas sobre o conceito. Essa evolução pode ser mais bem
observada na linha do tempo apresentada na Figura 1.
Visando a constante evolução dos processos técnicos e alcance dos objetivos previstos,
um traço muito importante da indústria de energia é a constante busca pelo aperfeiçoamento
4
das atividades e a melhor utilização dos ativos, visando a eficiência máxima [5]. Isso é o que
faz da gestão de ativos um tema muito relevante na atualidade, principalmente no contexto de
indústria 4.0 e modernização da cadeia de suprimento.
Na engenharia, essas atividades de incentivo à melhoria da gestão são comumente
voltadas para estruturas e ativos físicos como: máquinas, plantas, prédios, propriedades e
veículos [6]. A evolução deste processo de aperfeiçoamento técnico está diretamente
relacionada à necessidade de melhorar a manutenção e operação destes ativos, a fim de
maximizar os lucros do processo e a minimizar os riscos de falha e defeito.
Em uma planta de geração de energia elétrica essas técnicas podem ser traduzidas
como formas de garantir a constante operação dos equipamentos e extensão de sua vida útil,
evitando qualquer tipo de risco e/ou defeito. Assim, pode-se inferir que uma rotina ou uma
forma de manutenção eficaz é muito importante para que o processo opere com confiabilidade
e bons resultados econômicos [3].
2.2 MANUTENÇÃO
De acordo com a norma ABNT NBR 5462 [7], o conceito de manutenção pode ser
entendido como a “combinação de todas as ações técnicas e administrativas, incluindo as de
supervisão, destinadas a manter ou recolocar um item em um estado no qual possa desempenhar
uma função requerida”.
Desta forma, a manutenção, por se tratar de um conceito bastante abrangente, pode ser
dividida em algumas formas, conforme apresentado na Figura 2.
eficaz na prevenção de falhas, porém requer um bom planejamento, uma vez que quando
realizada de forma desnecessária resulta em um aumento nos custos operacionais [13].
Esse tipo de manutenção, que também pode ser encontrado na literatura como
Manutenção Melhorativa, é focado na causa raiz do problema, buscando eliminar motivos de
falha/defeito dos equipamentos com o auxílio de estudos, análises e modificações nas
estratégias de operação e funcionamento dos ativos [14].
Diferente dos tipos de manutenção apresentados anteriormente, é uma forma de
prevenir os defeitos para que não haja nenhum custo extra relacionado a outros processos de
manutenção que poderiam vir a serem empregados.
• Imagem termal;
• Análise Acústica.
As técnicas mencionadas anteriormente, em sua maioria, são apoiadas por sistemas
computadorizados de gestão da manutenção, também conhecidos como CMMS, que são
baseados nos parâmetros necessários para a realização da manutenção no tipo de ativo analisado
[15].
O CMMS consiste em um software dedicado que integra e faz a gestão de todas as
informações necessárias para a manutenção, como [15]:
• Coleta de dados;
• Processamento de dados;
• Calibração;
• Gestão da agenda da manutenção;
• Procedimentos de acompanhamento do ativo;
• Relatórios;
• Tomada de decisão.
Para as ações e informes de tomada de decisão, esse software pode utilizar diversas
tecnologias diferentes, sendo o uso de noções de inteligência artificial, redes neurais e
algoritmos de machine learning (ML) algumas delas [15].
O conceito de inteligência artificial (IA) começou a ser explorado nos anos 50, nas
áreas da matemática e ciência da computação, e teve como principal objetivo resolver
problemas que seriam dificilmente resolvidos por humanos, além de muito demorados.
Entretanto, com o tempo, passou a ser relacionado com o desenvolvimento de algoritmos que
resolvessem tarefas mais simples, mas difíceis de descrever, como o reconhecimento facial e
de objetos [16].
Atualmente, as técnicas de IA têm se desenvolvido devido a modernização dos
processos industriais, estrutura computacional e a maior difusão da Big Data (dados mais
complexos e com maior variedade, além de maior volume quando comparados com dados
tradicionais) [16]. A Figura 3 ilustra a intersecção destes conceitos no contexto atual da
indústria.
8
Esse método pode ser qualificado como aprendizado supervisionado uma vez que o
modelo aprende utilizando resultados já estabelecidos como exemplos para a definição dos
resultados de saída [17]. É importante notar que neste tipo de problema são necessários dados
que qualifiquem cada uma das classes a serem analisadas para que a saída desejada seja
retornada pelo algoritmo utilizado.
A classificação pode ser dividida nas seguintes categorias:
• Classificação binária, onde são definidos resultados da classificação como duas
classes, sendo elas “verdadeiro ou falso” [17];
10
𝑓(𝑥) = 𝑎𝑥
(1)
Onde 𝑎 é o coeficiente linear da reta, ou seja, o valor que define a inclinação da reta e
𝑥 é um número real [20]. A função pode ser evidenciada na Figura 7.
β 𝑠𝑒 𝑥 ≥ θ
𝑓(𝑥) = {
−δ 𝑠𝑒 𝑥 < θ (2)
Onde β e δ são os valores da função degrau para os valores que ultrapassem o limite
delimitado por θ [20]. A função pode ser ilustrada pela Figura 8.
ϒ 𝑠𝑒 𝑥 ≥ ϒ
𝑓(𝑥) = { 𝑥 𝑠𝑒|𝑥| < ϒ (3)
−ϒ 𝑠𝑒 𝑥 ≤ −ϒ
Onde ϒ representa o valor de saturação da função rampa, isso significa que a transição
entre ϒ e – ϒ, também é feita neste intervalo [20], conforme a Figura 9.
Vale a pena notar que esta função é uma variação da função degrau, porém com uma
transição linear e não imediata entre os dois valores.
15
1
𝑓(𝑥) = (4)
1 + 𝑒 −𝑎𝑥
Esse tipo de função é a mais comumente utilizada. É definida como uma função
crescente com balanceamento adequado entre o comportamento linear e não-linear e também é
diferenciável, o que traz alguns benefícios para a análise dos modelos [21].
16
O aprendizado realizado pelas redes neurais artificiais pode ser definido em dois
grandes espectros: aprendizado supervisionado e aprendizado não supervisionado.
17
O tipo de aprendizado supervisionado pode ser definido quando a rede aprende com
resultados já pré-estabelecidos. Com isso, a rede reconhece padrões e passa a utilizar esse
conhecimento para realizar a predição de novos dados [22].
Já o método de aprendizado não supervisionado é realizado quando a rede é treinada
para associar os padrões e grupos de dados das entradas fornecidas. Desta forma,
diferentemente do treinamento supervisionado, os dados não teriam uma classe específica para
servirem de saída para o problema, cabendo a própria rede estabelecer as classificações de
acordo com as entradas apresentadas [22].
2.6.5 TREINAMENTO
O processo de treinamento de uma rede neural pode ser caracterizado pela busca de
parâmetros ótimos para que o problema em questão seja solucionado da melhor forma possível.
Antes de qualquer outro passo, os parâmetros iniciais devem ser inseridos e os dados devem ser
separados em diferentes amostras para teste, treino e validação do modelo [24].
O treinamento de uma rede neural se refere ao número de vezes que são processados
os dados de entrada e que é atualizado o modelo, levando em conta os pesos sinápticos de cada
camada [22].
Desta forma, a atualização destes pesos sinápticos pode ser feita diversas vezes até que
o resultado do modelo esteja dentro do esperado. O procedimento em que os dados são
processados e é feita a alteração de pesos pode ser definido como uma época. Ao longo do
treinamento são executadas diversas épocas até que o resultado seja atingido. Para auxiliar o
processamento, os dados apresentados podem ser separados em batches, um hiper parâmetro
para assegurar que a taxa de atualização destes pesos seja maximizada [23].
Um problema bastante comum durante a etapa de treinamento é o overfitting, que pode
ser caracterizado pelo aumento do erro nos dados utilizados para a validação enquanto há a
diminuição do erro no modelo de treino [24]. Já o underfitting é o problema que ocorre quando
a validação e o modelo de treino ambos possuem valores elevados de erro. Esses conceitos estão
ilustrados na Figura 12.
18
Fonte: Autor.
Para evitar esses problemas, podem ser utilizadas técnicas como o ajuste do número
de épocas (criando uma parada antecipada) e o tratamento dos dados (balanceando as classes)
Além disso, é importante notar que na etapa de treinamento a mudança dos hiper
parâmetros e ajuste nas amostras de dados são fatores fundamentais para um modelo bem
dimensionado e ajustado.
2.6.6 RETROPROPAGAÇÃO
no final do seu percurso. Após a obtenção dessa saída, gera-se um sinal de erro que
automaticamente é retropropagado para as camadas ocultas anteriores [19].
Essas ações descritas ocorrem conforme o esquema apresentado na Figura 13.
Esse processo deve ocorrer desta forma, visto que as camadas intermediárias não
possuem contato com as saídas e estão em constante atualização de seus pesos sinápticos para
melhorar o resultado do modelo [20]. Isso ocorre durante todo o processo de aprendizado, até
que a saída da rede venha a convergir para o valor desejado.
Para que o modelo seja devidamente avaliado, ele deve passar por alguns testes. O
primeiro é a execução do mesmo a partir de novos dados nunca antes vistos para a determinação
de sua assertividade. Uma vez feito este processo, podem ser definidos parâmetros que ajudem
na avaliação do modelo conforme descrito nas próximas seções.
20
PREVISTO
0 1
Fonte: Autor.
2.6.7.2 ACURÁCIA
𝑉𝑁 + 𝑉𝑃
𝐴𝐶𝑈𝑅Á𝐶𝐼𝐴 = (5)
𝑉𝑁 + 𝑉𝑃 + 𝐹𝑁 + 𝐹𝑃
Desta forma, se um modelo executou 100 medições e 90 delas foram corretas, sendo
5 falsos positivos e 5 falsos negativos, a acurácia do modelo seria de 90%.
Esse método de avaliação pode ser especialmente problemático para modelos
desbalanceados, uma vez que ele não diferencia entre os falsos positivos e os falsos negativos,
podendo acarretar uma falsa impressão de otimização para o algoritmo empregado [25].
2.6.7.3 PRECISÃO
A medição da precisão tem como objetivo determinar qual percentual das predições
são realmente positivas. Esse método pode ser definido pela equação:
𝑉𝑃
𝑃𝑅𝐸𝐶𝐼𝑆Ã𝑂 = (6)
𝑉𝑃 + 𝐹𝑃
Nota-se que conforme os valores de falsos positivos são maiores, menor é o percentual
de precisão daquele modelo.
Um ponto negativo deste método é que ele não leva em consideração a medição
negativa, podendo, em alguns casos, contribuir para mascarar algumas deficiências do modelo
elaborado [25].
2.6.7.4 RECALL
A medição do recall tem como objetivo determinar o quão bem o modelo prevê os
valores positivos. Esse método pode ser definido pela equação:
22
𝑉𝑃
𝑅𝐸𝐶𝐴𝐿𝐿 = (7)
𝑉𝑃 + 𝐹𝑁
Nota-se que conforme os valores de falso negativos são maiores, menor é o percentual
de recall daquele modelo.
23
3 METODOLOGIA
fundamental para a parte final do tratamento dos dados fornecendo funções para mudar a escala
dos dados e realizar a divisão entre os dados utilizados para treinamento e teste.
Já as bibliotecas Tensor Flow e Keras foram utilizadas na construção do modelo, sendo
responsáveis pelas funções, arquitetura da rede neural e ambiente para a execução destes
algoritmos.
Os dados operacionais da usina disponíveis para análise dos modelos foram separados
nas seguintes categorias:
• Potências elétricas;
• Dados do alternador;
• Fator de potência do gerador;
• Óleo do motor;
• Ventilação na sala do motor;
• Circuito água do motor;
• Circuito intercooler;
• Água quente utilitário;
• Carburação;
• Temperaturas dos cilindros.
25
Todas essas categorias possuem subdivisões internas, como por exemplo, a categoria
“Potências Elétricas” possui informações sobre as potências ativas e reativas, bem como
informações da velocidade RPM do gerador.
Os dados são registrados a cada 2 segundos, conforme os parâmetros são lidos por
equipamentos de medição e estão disponíveis em tempo real para conferência e análise dos
mesmos, podendo ser verificados no próprio supervisório ou até mesmo extraídos para
verificação em outro software.
Após uma análise no histórico de acionamento dos dados, optou-se por utilizar o
período de 01/01/2022 a 15/01/2022, pela quantidade de alarmes disparados naquele intervalo,
além da quantidade de dados disponíveis. Deve-se destacar que, devido à grande frequência (a
cada 2 segundos) do registro dos dados dos parâmetros operacionais, o volume de dados
disponíveis já é considerável e suficiente para a análise proposta.
O registro de acionamento dos alarmes de janeiro foi obtido de acordo com cada tipo
de problema e o seu código relacionado, conforme a Tabela 6.
Onde:
• DISTURBO POMPA ACQUA DI RAFFREDDAMENTO MOTORE: alarme
referente a problemas na bomba de água utilizada no resfriamento do motor,
também pode ser acionado quando há oscilações na rede devido a problemas
na rede da distribuidora, uma vez que é o primeiro alarme a ser detectado e
registrado;
• MINIMO LIVELLO OLIO MOTORE: alarme relacionado ao nível de óleo do
motor;
• Generator CB opened: alarme relacionado a problemas de operação do motor
que causaram sua parada;
• TEMPERATURA GAS DI SCARICO SCOSTAMENTO DAL VALORE
MEDIO: alarme relacionado a temperatura do gás nos cilindros.
Os dados obtidos, tanto referentes aos parâmetros operacionais quanto aos alarmes,
foram processados e manipulados utilizando a biblioteca Pandas. O passo a passo desse
processamento está descrito abaixo:
1. Importação do documento .csv dos dados (parâmetros operacionais e
acionamento dos alarmes);
2. Filtragem dos alarmes utilizados;
3. Ajuste do formato das datas;
4. Preenchimento de dados faltantes;
5. Concatenamento de todos os dados;
6. Separação dos dados para aplicação do modelo em tempo real;
7. Ajuste e criação das features;
8. Realização do balanceamento das classes.
29
O feature engineering é o processo que tem como definição a análise dos dados e
seleção de variáveis de forma a obter o melhor desempenho do modelo.
Uma vez feito o processo de importação dos dados das categorias selecionadas,
(ventilação na sala do motor, circuito água do motor e circuito intercooler) os mesmos foram
transformados em gráficos, para que o comportamento das suas variáveis pudesse ser entendido
ao longo do intervalo selecionado. Assim, as Figuras 14, 15 e 16 representam a visualização
destes dados.
Fonte: Autor.
30
Fonte: Autor.
Fonte: Autor.
Conforme observado nas Figuras 14, 15 e 16, estão contidos os parâmetros destas
variáveis e a sua variação devido aos eventos que ocorreram no ativo nestes 15 dias amostrais.
Como a única variável que permanece constante, independente de quaisquer eventos no
período, é “PotVentInterc ValueY”, ela foi removida da lista de variáveis de entrada do modelo.
Com isso, no total, foram utilizadas 14 features para o modelo, sendo elas: "PotVentSalaMot
ValueY", "TTx99 ValueY","TTx90 ValueY", "NUT31 ValueY", "PotVentMotValueY",
"TTx10ValueY", "HeatingWaterSupplyValueY", "TTx11ValueY", "TTx13ValueY",
31
Fonte: Autor.
Fonte: Autor.
3.2.4.4 BASELINE
Para a definição da estrutura da rede neural devem ser levados em conta diversos
fatores como: desempenho computacional, adequação aos dados inseridos e desempenho do
modelo.
Com isso, apesar de existirem boas práticas a serem consideradas na definição da
quantidade de camadas escondidas e de neurônios nas mesmas, a determinação da estrutura
deve ser sempre feita caso a caso, de acordo com o desempenho do modelo.
O mesmo pode ser dito para os parâmetros utilizados para o treino do modelo que
também estão diretamente relacionados à performance do modelo.
Desta forma, as análises e critérios definidos para parte final do modelo serão expostas
na seção de resultados, de forma a exemplificar melhor as decisões tomadas e escolhas feitas.
34
4 ANÁLISES E RESULTADOS
De forma a serem tomadas decisões sobre a estrutura da rede neural, foram feitos testes
de três estruturas, conforme exposto na Tabela 7.
Sendo assim, temos o modelo 1, modelo mais simples dentre os analisados, com apenas
1 camada oculta, enquanto o modelo 2 e 3 possuem 2 e 3 camadas ocultas respectivamente.
As funções de ativação utilizadas para as camadas ocultas e para a camada de saída
foram sigmoides. Como o problema que o modelo busca resolver é uma classificação binária,
a função de perda considerada foi a entropia cruzada.
35
Perda e Acurácia
100,00% 91,57% 87,62%
86,32%
80,00%
60,00%
40,00% 33,21%
28,23%
23,52%
20,00%
0,00%
Modelo 1 Modelo 2 Modelo 3
Perda Acurácia
Fonte: Autor.
9,40
Tempo (s)
9,20
9,03
9,00
8,80
8,60
Modelo 1 Modelo 2 Modelo 3
Fonte: Autor.
Conforme observado nas Figuras 20 e 21, o segundo modelo, com duas camadas
ocultas, performou melhor que os outros dois modelos analisados no quesito perdas e acurácia,
ainda mantendo um esforço computacional comparável ao primeiro modelo, que possui menos
camadas.
36
Desta forma, o modelo que será utilizado para a realização das demais análises é o
modelo 2.
Perda Acurácia
Fonte: Autor.
37
10,00 9,57
8,00
Tempo (s)
6,00 5,00
4,00
2,13
2,00
0,00
32 64 128
Tamanho de batch
Fonte: Autor.
Figura 23 - Curvas de perda utilizando 4 horas antes da falha como intervalo de previsão.
Fonte: Autor.
Tabela 8 - Métricas de avaliação usando os dados de teste e 4 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
97%
Fonte: Autor.
39
Tabela 9 - Métricas de avaliação usando os dados em tempo real e 4 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
87%
Fonte: Autor
Figura 24 - Curvas de perda utilizando 8 horas antes da falha como intervalo de previsão.
Fonte: Autor.
40
Tabela 10 - Métricas de avaliação usando os dados de teste e 8 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
91%
Fonte: Autor.
Tabela 11 - Métricas de avaliação usando os dados em tempo real e 8 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
88%
Fonte: Autor.
41
Figura 25 - Curvas de perda utilizando 12 horas antes da falha como intervalo de previsão.
Fonte: Autor.
Tabela 12 - Métricas de avaliação usando os dados de teste e 12 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
94%
Fonte: Autor.
42
Tabela 13 - Métricas de avaliação usando os dados em tempo real e 12 horas antes da falha
como intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
85%
Fonte: Autor.
Figura 26 - Curvas de perda utilizando 16 horas antes da falha como intervalo de previsão.
Fonte: Autor.
43
Tabela 14 - Métricas de avaliação usando os dados de teste e 16 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
95%
Fonte: Autor.
Tabela 15 - Métricas de avaliação usando os dados em tempo real e 16 horas antes da falha
como intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
78%
Fonte: Autor.
44
Figura 27 - Curvas de perda utilizando 20 horas antes da falha como intervalo de previsão.
Fonte: Autor.
Tabela 16 - Métricas de avaliação usando os dados de teste e 20 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
96%
Fonte: Autor.
45
Tabela 17 - Métricas de avaliação usando os dados em tempo real e 20 horas antes da falha
como intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA
74%
Fonte: Autor.
Como podemos observar das Figuras 24 a 27, que demonstram as curvas de perdas de
cada um dos intervalos de previsão analisados, nenhum dos modelos treinados teve a incidência
do fenômeno do overfitting.
No geral, os intervalos considerados tiveram métricas semelhantes quando analisados
em confronto com o grupo de dados de teste, conforme as Tabelas 8, 10, 12, 14 e 16, tendo uma
acurácia média de 94,6%. Como os dados utilizados para o teste destes modelos eram
balanceados, podemos afirmar que os modelos foram bem-sucedidos no aprendizado do
comportamento destes dados.
Entretanto, quando se considera o cenário em tempo real, conforme as Tabelas 9, 11,
13, 15 e 17, o modelo teve um desempenho pior do que os modelos dos dados de teste. Isso
pode ser atribuído a alguns motivos, como a diferença do comportamento das features no tempo
analisado e a baixa frequência de acionamento de alarmes no período.
Um ponto interessante a se notar é que, utilizando o intervalo de previsão como 4
horas, vimos uma métrica de precisão muito baixa no cenário em tempo real, conforme a Tabela
9. Isso se deu pela baixa amostragem de dados utilizadas no treinamento do modelo, que quando
aumentada apresentou resultados melhores.
Utilizando como parâmetro principal o desempenho do modelo nos dados do tempo
real, foi decidido que, devido a deterioração das métricas de avaliação, principalmente precisão
e recall, pois se trata de um período em que há o desbalanceamento das classes, ou seja, é um
período em que há mais dados fora do intervalo de previsão do que dentro. Assim, o intervalo
máximo considerado para o modelo final seria o de 20 horas antes da falha.
46
Fonte: Autor
47
Tendo em vista a expansão da geração de energia no Brasil, este trabalho trouxe uma
perspectiva do funcionamento de uma planta de biogás para embasar todos estes conceitos e
desenvolver uma ferramenta para o apoio da manutenção preditiva dos ativos da usina
utilizando o ML e noções de redes neurais.
Com isso, foram analisados diferentes tipos de modelos com o intuito de maximizar o
intervalo de previsão da falha, a força computacional e o desempenho do modelo, tanto em
dados de teste nunca vistos antes, como na simulação em tempo real do funcionamento da usina.
Alguns desafios para a elaboração do modelo, foram o balanceamento entre o
desempenho do modelo e o esforço computacional, uma vez que a diminuição do tempo
computacional, muitas vezes, acarretaria a degradação do desempenho do modelo, e também o
processamento dos dados, que por possuírem um grande volume, necessitaram de diversas
tratativas como o ajuste de datas, preenchimento de dados faltantes e concatenação.
Assim, foi desenvolvido um modelo computacional que conseguiu ser mais eficiente
que o modelo baseline, sendo capaz de prever uma falha em até 20 horas antes dela acontecer,
tudo isso com um esforço computacional de treinamento de 1200 segundos para os dados
analisados. Podendo ser, assim, utilizado no apoio da manutenção preditiva da planta.
Para trabalhos futuros, uma possibilidade seria elaborar um modelo de
multiclassificação, considerando todos os alarmes acionados no período analisado, assim como
a elaboração de um dispositivo de alarme que indique a probabilidade de falha considerando as
previsões obtidas.
Além disso, para que o modelo esteja cada vez mais adaptado ao cotidiano da planta,
mais parâmetros de sua operação poderiam ser utilizados em seu treinamento para melhor
desempenho nas demais classificações.
49
REFERÊNCIAS BIBLIOGRÁFICAS
[1] ARESE, Marcelo Contente. Maturidade da gestão de ativos físicos de processo: uma
perspectiva sustentável utilizando lógica nebulosa. 2018.
[2] SOUZA, Rafael Doro. Análise da gestão da manutenção focando a manutenção centrada
na confiabilidade: estudo de caso. MRS logística. Juiz de Fora (MG): UFJF, 2008.
[3] FOONG, Wai Kuan; MAIER, Holger R.; SIMPSON, Angus R. Power plant
maintenance scheduling using ant colony optimization: an improved formulation.
Engineering Optimization, v. 40, n. 4, p. 309-329, 2008.
[5] ALFATIH, Somia; LEONG, M. Salman; HEE, Lim Meng. Definition of engineering
asset management: a review. Applied Mechanics and Materials, v. 773, p. 794-798,
2015.
[8] LEMOS, Mateus Albernaz; ALBERNAZ, C. M.; CARVALHO, Rogerio Atem de.
Qualidade na manutenção. XXXI ENEGEP, v. 31, 2011.
[9] PINTO, Alan Kardec; XAVIER, Júlio Aquino Nascif. Manutenção: função estratégica.
Qualitymark, 2009.
[10] TROJAN, Flavio; MARÇAL, Rui Francisco Martins; BARAN, Leandro Roberto.
Classificação dos tipos de manutenção pelo método de Análise Multicritério ELECTRE
TRI. Simpósio Brasileiro de Pesquisa Operacional, p. 343-357, 2013.
50
[14] A. Kardec and J. Nascif, “Manuetenção: Função Estratégica,” Rio Janeiro Ed. Qual.,
vol.3. ed., p. 384 p., 2009.
[15] SELCUK, Sule. Predictive maintenance, its implementation and latest trends.
Proceedings of the Institution of Mechanical Engineers, Part B: Journal of Engineering
Manufacture, v. 231, n. 9, p. 1670-1679, 2017.
[16] VAN ASSEN, Marly; LEE, Scott J.; DE CECCO, Carlo N. Artificial intelligence from
A to Z: from neural network to legal framework. European Journal of Radiology, v. 129,
p. 109083, 2020.
[17] SARKER, Iqbal H. Machine learning: Algorithms, real-world applications and research
directions. SN Computer Science, v. 2, n. 3, p. 1-21, 2021.
[19] MATSUNAGA, Victoria Yukie. Curso de Redes Neurais utilizando o MATLAB. Belém
do Pará, 2012.
[20] CARDON, André; MÜLLER, Daniel Nehme; NAVAUX, Philippe. Introdução às redes
neurais artificiais. Porto Alegre, 1994.
[21] FLECK, Leandro et al. Redes neurais artificiais: Princípios básicos. Revista Eletrônica
Científica Inovação e Tecnologia, v. 1, n. 13, p. 47-57, 2016.
[22] KROSE, Ben; SMAGT, Patrick van der. An introduction to neural networks. 2011.
51
[23] BROWNLEE, Jason. What is the Difference Between a Batch and an Epoch in a Neural
Network. Machine Learning Mastery, v. 20, 2018.
[24] PANOU, Dimitra N.; RECZKO, Martin. DeepFoldit--A Deep Reinforcement Learning
Neural Network Folding Proteins. arXiv preprint arXiv:2011.03442, 2020.
[25] JAPKOWICZ, Nathalie. Why question machine learning evaluation methods. In: AAAI
workshop on evaluation methods for machine learning. 2006. p. 6-11.
[26] BASE DIGITAL. Raízen inaugura planta de biogás e consolida portfólio de energias
renováveis. 2020. Raizen.com.br. Disponível em: https://www.raizen.com.br/sala-de-
imprensa/raizen-inaugura-planta-de-biogas-e-consolida-portfolio-de-energias-
renovaveis. Acesso em: 2 nov. 2022.
[28] User Guide — pandas 1.5.2 documentation. 2022. Pydata.org. Disponível em:
https://pandas.pydata.org/docs/user_guide/index.html. Acesso em: 11 dez. 2022.
[30] TEAM, K. Keras documentation: Developer guides. 2022. Keras.io. Disponível em:
https://keras.io/guides/. Acesso em: 11 dez. 2022.