Você está na página 1de 67

UNIVERSIDADE FEDERAL FLUMINENSE

ESCOLA DE ENGENHARIA
DEPARTAMENTO DE ENGENHARIA ELÉTRICA

MARCELO ELIAS ALONSO

PROPOSTA DE APLICAÇÃO DE MÉTODOS DE MACHINE LEARNING EM


MANUTENÇÃO PREDITIVA

NITERÓI
2022
MARCELO ELIAS ALONSO

PROPOSTA DE APLICAÇÃO DE MÉTODOS DE MACHINE LEARNING EM


MANUTENÇÃO PREDITIVA

Trabalho de Conclusão de Curso apresentado


ao Corpo Docente do Departamento de
Engenharia Elétrica da Escola de Engenharia da
Universidade Federal Fluminense, como parte
dos requisitos necessários à obtenção do título
de Engenheira(o) Eletricista.

Orientador(a):
Prof. Dr. Vitor Hugo Ferreira

Niterói, RJ
2022
AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE
TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA
FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.

FICHA CATALOGRÁFICA GERADA EM:


http://www.bibliotecas.uff.br/bee/ficha-catalografica
MARCELO ELIAS ALONSO

PROPOSTA DE APLICAÇÃO DE MÉTODOS DE MACHINE LEARNING EM


MANUTENÇÃO PREDITIVA

Trabalho de Conclusão de Curso apresentado


ao Corpo Docente do Departamento de
Engenharia Elétrica da Escola de Engenharia da
Universidade Federal Fluminense, como parte
dos requisitos necessários à obtenção do título
de Engenheira(o) Eletricista.

Aprovado em 19 de dezembro de 2022, com nota 9,5, pela banca examinadora.

BANCA EXAMINADORA

________________________________________________
Prof. Dr. Vitor Hugo Ferreira – Orientador(a)
Universidade Federal Fluminense

________________________________________________
Prof. Dr. Angelo Cesar Colombini – Membro Convidado
Universidade Federal Fluminense

________________________________________________
Prof. Dr. Luciano de Oliveira Daniel – Membro Convidado
Universidade Federal Fluminense

Niterói
2022
Dedico este trabalho ao meu saudoso amigo
Luis Gustavo, que descanse em paz.
AGRADECIMENTOS

Agradeço, primeiramente, aos meus pais e minha irmã, por sempre me apoiarem ao
longo da minha vida, principalmente ao longo da graduação, dando a força e a motivação
necessária para enfrentar os desafios de cada etapa.
Agradeço a minha namorada, Fernanda, pelo apoio e motivação diária na parte final
do curso, sendo um dos principais motivos para a conclusão do presente trabalho.
Agradeço aos meus amigos, Antonio, Gustavo, Vitor Arias e Vitor Tabuquini, com
quem passei grande parte da graduação, compartilhando todas as vitórias e desafios e dando
suporte intelectual quando necessário.
Agradeço também aos meus amigos, Gabriel, Mickael, Marco e Luis Gustavo pelos
tempos que passamos e por sempre estarem disponíveis para compartilhar tanto os bons
momentos quanto os maus momentos.
Por fim, agradeço ao meu professor orientador, Vitor Hugo, pelo constante apoio e
suporte intelectual, além da contribuição para a minha formação e introdução dos assuntos deste
trabalho.
“Sonhos se tornam realidade quando você não dorme”
Virgil Abloh
RESUMO

A gestão de ativos é um conceito de extrema relevância para o mercado de energia,


uma vez que tem como objetivo a determinação de tratativas e processos para que haja maior
confiabilidade e qualidade nas atividades desenvolvidas. Um dos principais aspectos desta área
é a manutenção destes ativos, uma vez que o objetivo principal desta atividade é maximizar o
tempo de funcionamento do equipamento e a rentabilidade daquele processo. Com a crescente
diversificação na matriz energética brasileira e a iminente abertura do mercado de energia,
estamos em um período de constante aumento na oferta interna de energia e construção de
usinas no país. Tendo isso em vista, o presente trabalho busca, a partir dos dados operacionais
e o registro de alarmes de uma usina de biogás, desenvolver um modelo de machine learning
utilizando noções de redes neurais para o auxílio da manutenção preditiva em plantas de geração
de energia elétrica. A partir da criação do modelo, que tem como principal função prever o
momento pré-falha no funcionamento da usina, observou-se que o intervalo máximo de
previsão seria de 20 horas para tomar medidas de precaução sem interromper
desnecessariamente o funcionamento da planta. Assim, os resultados desse estudo corroboram
para afirmar o potencial da aplicação de um modelo de machine learning em um contexto
industrial, maximizando a eficiência de funcionamento da usina e de seus equipamentos.

Palavras-Chave: gestão de ativos, manutenção preditiva, aprendizado de máquinas e


redes neurais.
ABSTRACT

Asset management is an extremely relevant concept for the energy market, as it aims
to determine dealings and processes so that there is greater reliability and quality in the activities
carried out. As a result, one of the main aspects of this grand area is the maintenance of those
assets, since the main objective of this activity is to maximize the equipment's operating time
and the profitability of that process and the equipment itself. With the rapid growth and
diversification of the Brazilian energy matrix and the imminent opening of the energy market,
we are in a period of constant increase in the domestic supply of energy and construction of
power plants in the country. With this in mind, the present work seeks, from data of a biogas
plant, to develop a machine learning model using notions of neural networks to help and assist
predictive maintenance in electric power plants. With the creation of the model, whose main
function is to predict the pre-failure moment in the operation of the plant, it was observed that
the maximum forecast interval would be 20 hours to take measures of precaution without
unnecessarily interrupting the operation of the plant. Thus, the results of this study confirm the
potential of applying a machine learning model in an industrial setting, maximizing the
efficiency of the plant and its equipment.

Keywords: asset management, predictive maintenace, machine learning and neural


networks.
LISTA DE FIGURAS

Figura 1 - Evolução da gestão de ativos ao longo dos anos. ...................................................... 3


Figura 2 - Formas de Manutenção. ............................................................................................. 4
Figura 3 - Princípios fundamentais da IA moderna. ................................................................... 8
Figura 4 - Fluxo do desenvolvimento de um modelo de ML. .................................................... 8
Figura 5 - Exemplificação de um problema de classificação. .................................................... 9
Figura 6 - Modelo de um perceptron. ...................................................................................... 11
Figura 7 - Gráfico de uma função linear................................................................................... 12
Figura 8 - Gráfico de uma função degrau. ................................................................................ 13
Figura 9 - Gráfico de uma função rampa. ................................................................................. 14
Figura 10 - Gráfico de uma função sigmoide. .......................................................................... 15
Figura 11 - Perceptron de múltiplas camadas. ......................................................................... 16
Figura 12 - Overfitting e underfitting. ...................................................................................... 18
Figura 13 - Retropropagação e propagação em uma rede neural. ............................................ 19
Figura 14 - Ventilação na sala do motor................................................................................... 29
Figura 15 - Circuito de água do motor. .................................................................................... 30
Figura 16 - Circuito intercooler................................................................................................ 30
Figura 17 - Ponto da Falha. ...................................................................................................... 32
Figura 18 - Saída Esperada do Modelo considerando um intervalo de previsão de 5 horas. ... 32
Figura 19 - Perda e Acurácia de treinamento dos modelos. ..................................................... 35
Figura 20 - Tempo médio por época dos modelos. .................................................................. 35
Figura 21 - Perda e Acurácia de treinamento de diferentes tamanhos de batch. ...................... 36
Figura 22 - Tempo médio por época dos diferentes tamanhos de batch. ................................. 37
Figura 23 - Curvas de perda utilizando 4 horas antes da falha como intervalo de previsão. ... 38
Figura 24 - Curvas de perda utilizando 8 horas antes da falha como intervalo de previsão. ... 39
Figura 25 - Curvas de perda utilizando 12 horas antes da falha como intervalo de previsão. . 41
Figura 26 - Curvas de perda utilizando 16 horas antes da falha como intervalo de previsão. . 42
Figura 27 - Curvas de perda utilizando 20 horas antes da falha como intervalo de previsão. . 44
Figura 28 - Simulação em tempo real do modelo desenvolvido. ............................................. 46
LISTA DE TABELAS

Tabela 1 - Tipos de manutenção utilizados no Brasil segundo sua distribuição percentual. ..... 5
Tabela 2 - Matriz Confusão. ..................................................................................................... 20
Tabela 3 - Variáveis contidas na categoria ventilação na sala do motor. ................................. 26
Tabela 4 - Variáveis contidas na categoria circuito água do motor.......................................... 26
Tabela 5 - Variáveis contidas na categoria circuito intercooler. .............................................. 26
Tabela 6 - Histórico do acionamento dos alarmes. ................................................................... 27
Tabela 7 - Estruturas de rede neural analisadas. ....................................................................... 34
Tabela 8 - Métricas de avaliação usando os dados de teste e 4 horas antes da falha como
intervalo de previsão. ................................................................................................................ 38
Tabela 9 - Métricas de avaliação usando os dados em tempo real e 4 horas antes da falha como
intervalo de previsão. ................................................................................................................ 39
Tabela 10 - Métricas de avaliação usando os dados de teste e 8 horas antes da falha como
intervalo de previsão. ................................................................................................................ 40
Tabela 11 - Métricas de avaliação usando os dados em tempo real e 8 horas antes da falha como
intervalo de previsão. ................................................................................................................ 40
Tabela 12 - Métricas de avaliação usando os dados de teste e 12 horas antes da falha como
intervalo de previsão. ................................................................................................................ 41
Tabela 13 - Métricas de avaliação usando os dados em tempo real e 12 horas antes da falha
como intervalo de previsão. ...................................................................................................... 42
Tabela 14 - Métricas de avaliação usando os dados de teste e 16 horas antes da falha como
intervalo de previsão. ................................................................................................................ 43
Tabela 15 - Métricas de avaliação usando os dados em tempo real e 16 horas antes da falha
como intervalo de previsão. ...................................................................................................... 43
Tabela 16 - Métricas de avaliação usando os dados de teste e 20 horas antes da falha como
intervalo de previsão. ................................................................................................................ 44
Tabela 17 - Métricas de avaliação usando os dados em tempo real e 20 horas antes da falha
como intervalo de previsão. ...................................................................................................... 45
LISTA DE ABREVIATURAS E SIGLAS

Publicly Available Specification (Especificação publicamente


PAS
disponível).
ABNT Associação Brasileira de Normas Técnicas.
NBR Norma brasileira.
Computerized maintenance management system (sistemas
CMMS
computadorizados de gestão da manutenção)
IA Inteligência Artificial
ML Machine Learning (Aprendizado de máquinas)
VN Verdadeiro Negativo
VP Verdadeiro Positivo
FN Falso Negativo
FP Falso Positivo
LISTA DE SÍMBOLOS

𝑝𝑛 Conjunto de entradas n de um perceptron


𝑤𝑛𝑗 Pesos sinápticos de uma entrada n no neurônio j
∑ Somador do perceptron
y Saída do perceptron
𝑓 Função de ativação
𝑎 Coeficiente linear
𝑥 Número real
β Limite superior da função degrau
δ Limite inferior da função degrau
θ Limiar da função degrau
ϒ Valor de saturação da função rampa
SUMÁRIO

1 INTRODUÇÃO ............................................................................................................... 1
1.1 OBJETIVOS ................................................................................................................ 1
1.2 ESTRUTURA DO TRABALHO ................................................................................ 2
2 FUNDAMENTAÇÃO TEÓRICA .................................................................................. 3
2.1 GESTÃO DE ATIVOS ................................................................................................ 3
2.2 MANUTENÇÃO ......................................................................................................... 4
2.2.1 MANUTENÇÃO CORRETIVA .......................................................................... 5
2.2.2 MANUTENÇÃO PREVENTIVA ........................................................................ 5
2.2.3 MANUTENÇÃO PREDITIVA ............................................................................ 6
2.2.4 ENGENHARIA DA MANUTENÇÃO ................................................................ 6
2.3 TÉCNICAS E TECNOLOGIAS APLICADAS NA MANUTENÇÃO PREDITIVA 6
2.4 INTELIGÊNCIA ARTIFICIAL .................................................................................. 7
2.5 APRENDIZADO DE MÁQUINAS ............................................................................ 8
2.5.1 CLASSIFICAÇÃO NO APRENDIZADO DE MÁQUINAS .............................. 9
2.6 REDES NEURAIS ARTIFICIAIS ............................................................................ 10
2.6.1 MODELO DE UM PERCEPTRON ................................................................... 11
2.6.2 FUNÇÕES DE ATIVAÇÃO .............................................................................. 12
2.6.3 PERCEPTRON DE MÚLTIPLAS CAMADAS ................................................ 16
2.6.4 TÉCNICAS DE APRENDIZADO ..................................................................... 16
2.6.5 TREINAMENTO ............................................................................................... 17
2.6.6 RETROPROPAGAÇÃO .................................................................................... 18
2.6.7 MÉTODOS DE AVALIAÇÃO .......................................................................... 19
3 METODOLOGIA.......................................................................................................... 23
3.1 ESTUDO DE CASO .................................................................................................. 23
3.2 ETAPAS DO DESENVOLVIMENTO DO MODELO DE ML ............................... 23
3.2.1 FERRAMENTAS UTILIZADAS PARA CONSTRUÇÃO DO MODELO DE
ML 23
3.2.2 DADOS UTILIZADOS ...................................................................................... 24
3.2.3 PROCESSAMENTO DOS DADOS .................................................................. 28
3.2.4 FEATURE ENGINEERING .............................................................................. 29
3.2.5 ESTRUTURA E TREINAMENTO DA REDE NEURAL ................................ 33
4 ANÁLISES E RESULTADOS ..................................................................................... 34
4.1 DEFINIÇÃO DA ESTRUTURA DA REDE NEURAL ........................................... 34
4.2 DETERMINAÇÃO DE PARAMETROS DE TREINAMENTO DA REDE NEURAL
36
4.3 DEFINIÇÃO DO INTERVALO DE PREVISÃO .................................................... 37
4.3.1 APRESENTAÇÃO DOS RESULTADOS ......................................................... 38
4.3.2 DISCUSSÃO DOS RESULTADOS .................................................................. 45
4.4 SIMULAÇÃO EM TEMPO REAL ........................................................................... 46
5 CONCLUSÃO E TRABALHOS FUTUROS ............................................................... 48
REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................................... 49
1

1 INTRODUÇÃO

Um ativo é algo que possui valor ou algum tipo de potencial para uma determinada
organização, podendo ser um equipamento ou, simplesmente, algo virtual, como dados de uma
atividade realizada [5]. Com isso, a gestão de ativos é um processo que busca administrar tais
ativos de forma a atingir os objetivos definidos pelas instituições e otimizar seus ganhos [32],
sendo assim, uma atividade fundamental para empreendimentos e indústrias que buscam
crescimento e eficiência de seus ativos.
No ano de 2004, foi lançado um documento padrão para a gestão de ativos, com
orientações e diretrizes a serem seguidos, denominado PAS 55. Esse documento foi criado em
conjunto pelo Instituto de Gestão de Ativos do Reino Unido e a Instituição Britânica de Padrões
de Especificação e a principal ideia por trás desse documento era determinar os principais
pontos para operação, manutenção e gestão dos ativos para que haja maior confiabilidade e
qualidade nestas atividades [1].
A manutenção, por exemplo, é um trabalho que tem como característica o aumento da
disponibilidade dos equipamentos para a produção em contrapartida ao aumento do custo da
operação. Dessa forma, o objetivo principal de qualquer atividade de manutenção deve ser
maximizar o tempo de funcionamento do equipamento e a rentabilidade daquele processo [2].
No setor de geração de energia elétrica, o processo de manutenção visa reduzir os
riscos de interrupção da atividade e de danos aos equipamentos. É de extrema importância para
este segmento que a confiabilidade do sistema seja aumentada, uma vez que se deve garantir o
atendimento completo da demanda do sistema de geração [3].
Dentro desse contexto, a manutenção preditiva tem sido um ponto muito abordado e
relevante para as indústrias por evitar custos excessivos e minimizar o acontecimento das falhas,
apoiando a redução de danos aos equipamentos e recorrentes manutenções preventivas [2].

1.1 OBJETIVOS

Tendo em vista os desafios da indústria de geração de energia elétrica, este trabalho


tem como principal objetivo o desenvolvimento de um algoritmo computacional baseado em
redes neurais na linguagem de computação Python que identifique o momento pré-falha de uma
usina de biogás, podendo ser implementado no apoio à manutenção preditiva.
Para a elaboração deste algoritmo serão utilizados como entrada parâmetros de
operação dos equipamentos e de máquinas da usina analisada e, a partir disso, será executada a
2

previsão de acontecimentos de um determinado evento, indicado pelo acionamento dos alarmes


da planta de energia.
O modelo desenvolvido partirá de uma baseline e será aperfeiçoado considerando o
balanço entre esforço computacional, percentual de sucesso das previsões e tempo de previsão,
sendo este último definido pela quantidade de horas antes da falha. Com isso, espera-se atingir
o melhor desempenho do algoritmo frente a estes parâmetros de funcionamento pré-definidos.

1.2 ESTRUTURA DO TRABALHO

O presente trabalho será dividido em cinco Capítulos, abordando a fundamentação


teórica dos temas abordados, os processos de desenvolvimento do algoritmo proposto,
discussão dos resultados e conclusão. Sendo assim, os capítulos serão divididos da seguinte
forma:
1. Introdução.
Capítulo onde é apresentado o tema do trabalho, bem como sua
contextualização e estruturação.
2. Fundamentação teórica.
Seção em que será descrito o detalhamento conceitual dos temas abordados.
3. Metodologia.
Capítulo onde será abordado todo o desenvolvimento e técnicas de
programação utilizadas na elaboração do algoritmo de machine learning
proposto.
4. Análises e resultados.
Seção em que se descreverá e analisará os resultados encontrados neste
trabalho.
5. Conclusão e trabalhos futuros.
Conclusão com as ponderações finais e reflexões sobre oportunidades de
trabalhos futuros.
3

2 FUNDAMENTAÇÃO TEÓRICA

A fundamentação teórica partirá da conceituação das seguintes temáticas pertinentes a


esse trabalho.

2.1 GESTÃO DE ATIVOS

Um ativo pode ser dividido em duas categorias principais: físicos e não físicos. Ativos
físicos podem ser aspectos naturais, como a água, terra e ar, ou aspectos construídos pelo
homem, como instalações e infraestruturas. Já os ativos não físicos podem ser virtuais, como
sistemas e dados, ou conceituais, como sistemas de gestão e de conhecimento [4].
Nesse sentido, a gestão de ativos pode ser descrita como um conjunto de atividades
realizadas e associadas com a identificação, comércio, manutenção e ao aspecto financeiro dos
ativos em questão [5].
Ao longo dos anos o conceito de gestão de ativos evoluiu à medida em que foram
publicados mais artigos, estudos e normas sobre o conceito. Essa evolução pode ser mais bem
observada na linha do tempo apresentada na Figura 1.

Figura 1 - Evolução da gestão de ativos ao longo dos anos.

Fonte: Desenvolvimento histórico do conceito da gestão de ativos [4].

Visando a constante evolução dos processos técnicos e alcance dos objetivos previstos,
um traço muito importante da indústria de energia é a constante busca pelo aperfeiçoamento
4

das atividades e a melhor utilização dos ativos, visando a eficiência máxima [5]. Isso é o que
faz da gestão de ativos um tema muito relevante na atualidade, principalmente no contexto de
indústria 4.0 e modernização da cadeia de suprimento.
Na engenharia, essas atividades de incentivo à melhoria da gestão são comumente
voltadas para estruturas e ativos físicos como: máquinas, plantas, prédios, propriedades e
veículos [6]. A evolução deste processo de aperfeiçoamento técnico está diretamente
relacionada à necessidade de melhorar a manutenção e operação destes ativos, a fim de
maximizar os lucros do processo e a minimizar os riscos de falha e defeito.
Em uma planta de geração de energia elétrica essas técnicas podem ser traduzidas
como formas de garantir a constante operação dos equipamentos e extensão de sua vida útil,
evitando qualquer tipo de risco e/ou defeito. Assim, pode-se inferir que uma rotina ou uma
forma de manutenção eficaz é muito importante para que o processo opere com confiabilidade
e bons resultados econômicos [3].

2.2 MANUTENÇÃO

De acordo com a norma ABNT NBR 5462 [7], o conceito de manutenção pode ser
entendido como a “combinação de todas as ações técnicas e administrativas, incluindo as de
supervisão, destinadas a manter ou recolocar um item em um estado no qual possa desempenhar
uma função requerida”.
Desta forma, a manutenção, por se tratar de um conceito bastante abrangente, pode ser
dividida em algumas formas, conforme apresentado na Figura 2.

Figura 2 - Formas de Manutenção.

Fonte: Retirado de [8].


5

No Brasil, os tipos de manutenção mais executados, segundo um estudo publicado pela


Associação Brasileira de Manutenção em 2013 (referente ao mesmo ano) [12], estão
representados na Tabela 1.

Tabela 1 - Tipos de manutenção utilizados no Brasil segundo sua distribuição percentual.


Tipo de Manutenção %
Corretiva 30,86
Preventiva 36,55
Preditiva 18,82
Outros 13,77
Fonte: Adaptado de [12].

Com a Tabela 1 é possível observar que as manutenções corretivas e preventivas são as


mais utilizadas no cenário brasileiro, enquanto soluções como engenharia de manutenção e
manutenção preditiva ainda possuem uma participação menor que 20% cada uma.

2.2.1 MANUTENÇÃO CORRETIVA

A manutenção corretiva tem como principal característica a execução pós-falha, e pode


ser dividida em dois principais tipos: manutenção corretiva planejada e manutenção corretiva
não-planejada [8].
A manutenção corretiva planejada ocorre quando o equipamento ou ativo está
performando abaixo do esperado. Ela é realizada por uma decisão gerencial, ou seja, em função
de um acompanhamento preditivo ou pela decisão de operar até a falha [9].
Já a manutenção corretiva não-planejada ocorre sem tempo de planejamento, logo após
a falha ou após uma perda de desempenho do ativo [10]. Este tipo de manutenção costuma
acarretar altos custos devido as perdas pela parada não planejada na produção e danos aos
equipamentos [11].

2.2.2 MANUTENÇÃO PREVENTIVA

A manutenção preventiva é o tipo de manutenção que acontece de forma periódica,


geralmente seguindo um cronograma pré-estipulado. Esse processo tem como objetivo
antecipar defeitos nos equipamentos para evitar a interrupção da produção. É uma abordagem
6

eficaz na prevenção de falhas, porém requer um bom planejamento, uma vez que quando
realizada de forma desnecessária resulta em um aumento nos custos operacionais [13].

2.2.3 MANUTENÇÃO PREDITIVA

Manutenção preditiva é o tipo de manutenção que é executada em conjunto com


ferramentas de monitoramento de integridade dos equipamentos e do processo. Ela só é
executada quando há a detecção de um momento pré-falha pelos sistemas preditivos, de forma
a evitar paradas desnecessárias e avarias nos equipamentos. Geralmente são feitas com o auxílio
de ferramentas preditivas baseadas em dados históricos (como por exemplo, técnicas de
aprendizado de máquina), fatores de integridade (aspectos visuais, desgaste, coloração diferente
da original, entre outros), métodos de inferência estatística e abordagens de engenharia [13].

2.2.4 ENGENHARIA DA MANUTENÇÃO

Esse tipo de manutenção, que também pode ser encontrado na literatura como
Manutenção Melhorativa, é focado na causa raiz do problema, buscando eliminar motivos de
falha/defeito dos equipamentos com o auxílio de estudos, análises e modificações nas
estratégias de operação e funcionamento dos ativos [14].
Diferente dos tipos de manutenção apresentados anteriormente, é uma forma de
prevenir os defeitos para que não haja nenhum custo extra relacionado a outros processos de
manutenção que poderiam vir a serem empregados.

2.3 TÉCNICAS E TECNOLOGIAS APLICADAS NA MANUTENÇÃO PREDITIVA

Conforme mencionado acima, a manutenção preditiva é um método que necessita de


sistemas de apoio, como o monitoramento de ativos e histórico de indicadores, para que seja
executada de forma eficiente e correta [13].
Desta forma, no contexto da manutenção, algumas técnicas utilizadas no mercado atual
podem ser destacadas como [15]:
• Medição de parâmetros de performance;
• Análise da Vibração;
• Análise de Óleo;
7

• Imagem termal;
• Análise Acústica.
As técnicas mencionadas anteriormente, em sua maioria, são apoiadas por sistemas
computadorizados de gestão da manutenção, também conhecidos como CMMS, que são
baseados nos parâmetros necessários para a realização da manutenção no tipo de ativo analisado
[15].
O CMMS consiste em um software dedicado que integra e faz a gestão de todas as
informações necessárias para a manutenção, como [15]:
• Coleta de dados;
• Processamento de dados;
• Calibração;
• Gestão da agenda da manutenção;
• Procedimentos de acompanhamento do ativo;
• Relatórios;
• Tomada de decisão.
Para as ações e informes de tomada de decisão, esse software pode utilizar diversas
tecnologias diferentes, sendo o uso de noções de inteligência artificial, redes neurais e
algoritmos de machine learning (ML) algumas delas [15].

2.4 INTELIGÊNCIA ARTIFICIAL

O conceito de inteligência artificial (IA) começou a ser explorado nos anos 50, nas
áreas da matemática e ciência da computação, e teve como principal objetivo resolver
problemas que seriam dificilmente resolvidos por humanos, além de muito demorados.
Entretanto, com o tempo, passou a ser relacionado com o desenvolvimento de algoritmos que
resolvessem tarefas mais simples, mas difíceis de descrever, como o reconhecimento facial e
de objetos [16].
Atualmente, as técnicas de IA têm se desenvolvido devido a modernização dos
processos industriais, estrutura computacional e a maior difusão da Big Data (dados mais
complexos e com maior variedade, além de maior volume quando comparados com dados
tradicionais) [16]. A Figura 3 ilustra a intersecção destes conceitos no contexto atual da
indústria.
8

Figura 3 - Princípios fundamentais da IA moderna.

Fonte: Adaptado de [16].

2.5 APRENDIZADO DE MÁQUINAS

O aprendizado de máquinas, ou machine learning (ML), é um segmento da grande


área de IA moderna, e tem como definição a capacidade de uma máquina de ter um aprendizado
ensinado a ela [16].
Geralmente o aprendizado é realizado por meio de algoritmos em que as variáveis são
fornecidas manualmente às máquinas. Entretanto, como essa é uma área em constante mudança
devido aos novos avanços tecnológicos, um conceito chamado deep machine learning, em que
o aprendizado de máquinas é realizado de forma similar a um cérebro humano proporcionando
foi desenvolvido de maneira a proporcionar uma experiencia mais sofisticada e robusta [16].
A Figura 4 descreve um fluxo de desenvolvimento de um modelo de ML.

Figura 4 - Fluxo do desenvolvimento de um modelo de ML.

Fonte: Adaptado de [13].


9

A seleção dos dados é a primeira etapa da elaboração de um modelo de ML e se refere


à obtenção e armazenamento dos dados a serem utilizados. Já o pré-processamento tem como
principal foco ajustar essas informações para que elas possam ser processadas de forma
eficiente pelo modelo. O terceiro passo é realizar a elaboração de todo o modelo, considerando
a escolha da arquitetura adequada, realização do treinamento e validação. A última etapa tem
como objetivo manter o desempenho do modelo, sendo fundamental para processos industriais,
pois as atividades e equipamentos podem mudar ao longo do tempo, contribuindo para a sua
degradação [13].

2.5.1 CLASSIFICAÇÃO NO APRENDIZADO DE MÁQUINAS

Classificação é um método de aprendizado de máquinas que pode ser definido como a


previsão de uma ou mais classes, dado uma variável de entrada [17]. Um simples exemplo está
descrito na Figura 5.

Figura 5 - Exemplificação de um problema de classificação.

Fonte: Adaptado de [16].

Esse método pode ser qualificado como aprendizado supervisionado uma vez que o
modelo aprende utilizando resultados já estabelecidos como exemplos para a definição dos
resultados de saída [17]. É importante notar que neste tipo de problema são necessários dados
que qualifiquem cada uma das classes a serem analisadas para que a saída desejada seja
retornada pelo algoritmo utilizado.
A classificação pode ser dividida nas seguintes categorias:
• Classificação binária, onde são definidos resultados da classificação como duas
classes, sendo elas “verdadeiro ou falso” [17];
10

• Classificação multiclasse, onde os resultados da classificação possuem mais de


duas classes, podendo ser agrupados em qualquer uma destas [17];
• Classificação multi-label, onde os resultados da classificação podem pertencer
a mais de uma classe passando a serem agrupados considerando, por exemplo,
uma hierarquia [17].
Tendo isso em vista, muitas abordagens foram desenvolvidas para apoiar essa
classificação. Uma delas é a aplicação de redes neurais artificiais [17], tema que será abordado
no presente trabalho.

2.6 REDES NEURAIS ARTIFICIAIS

As redes neurais artificiais são modelos inspirados no sistema nervoso biológico e


consistem na combinação de diversos modelos matemáticos denominados de neurônios. Esta
modelagem tem como principal objetivo conseguir reproduzir de forma mais próxima possível
o comportamento do cérebro biológico e o seu processamento de dados [18].
Esse modelo de ML tem sido bastante desenvolvido nos últimos anos [17] e possui as
seguintes características:
• Robustez [19];
• Capacidade de processar informações incertas: apesar da entrada de dados
incompletos ainda é possível que esse modelo entregue os resultados desejados
[19];
• Flexibilidade: dependem somente dos dados apresentados, podendo ser
adaptados em qualquer tipo de contexto [19];
• Paralelismo: diversos neurônios estão ativos ao mesmo tempo, aumentando o
poder de processamento de dados [19].
11

2.6.1 MODELO DE UM PERCEPTRON

Nos anos 40 foi iniciado um trabalho de simular o comportamento do cérebro humano


a partir de um modelo computacional. Assim, em 1958, Rosenblat definiu o conceito de
perceptron, um método completamente inovador para época e serviu de base para o estudo das
redes neurais [18].
O perceptron é um simples modelo matemático, sendo representado na Figura 6.

Figura 6 - Modelo de um perceptron.

Fonte: Retirado de [19].

Os elementos de um perceptron, representados na Figura 6, são os seguintes:


1. Um conjunto de entradas, representado por (𝑝𝑛 ), com seu peso sináptico
associado (𝑤𝑛𝑗 ).
2. Um somador (∑) que acumula todas as entradas e seus pesos.
3. O bias que é um sinal que pode facilitar ou dificultar a ativação do perceptron
[19].
4. A função de ativação (𝑓) que tem como finalidade limitar o intervalo de
amplitude da saída para um valor fixo [18].
5. A saída do perceptron.
As conexões de entrada nos neurônios são simuladas com os seus pesos, que podem
ser positivos ou negativos, dependendo de sua natureza. Caso o peso seja positivo, ele possui
natureza excitatória e caso seja negativo possui natureza inibitória. A intensidade do sinal é
definida pelo produto do peso 𝑤 e da entrada 𝑝. A soma destes valores é feita no somador ∑ e
o resultante é enviado a função 𝑓 que define a saída y do neurônio [12].
12

2.6.2 FUNÇÕES DE ATIVAÇÃO

No modelo de um perceptron é necessário o uso das funções de ativação para o


funcionamento do modelo, limitando as amplitudes de saída conforme desejado. Desta forma,
as funções utilizadas mais comuns são [20]:
• Função linear;
• Função degrau;
• Função rampa;
• Função sigmoide;

2.6.2.1 FUNÇÃO LINEAR

A função linear pode ser definida pela seguinte equação:

𝑓(𝑥) = 𝑎𝑥
(1)

Onde 𝑎 é o coeficiente linear da reta, ou seja, o valor que define a inclinação da reta e
𝑥 é um número real [20]. A função pode ser evidenciada na Figura 7.

Figura 7 - Gráfico de uma função linear.

Fonte: Retirado de [20].


13

2.6.2.2 FUNÇÃO DEGRAU

A função degrau pode ser definida pela seguinte equação:

β 𝑠𝑒 𝑥 ≥ θ
𝑓(𝑥) = {
−δ 𝑠𝑒 𝑥 < θ (2)

Onde β e δ são os valores da função degrau para os valores que ultrapassem o limite
delimitado por θ [20]. A função pode ser ilustrada pela Figura 8.

Figura 8 - Gráfico de uma função degrau.

Fonte: Retirado de [20].


14

2.6.2.3 FUNÇÃO RAMPA

A função rampa pode ser definida pela seguinte equação:

ϒ 𝑠𝑒 𝑥 ≥ ϒ
𝑓(𝑥) = { 𝑥 𝑠𝑒|𝑥| < ϒ (3)
−ϒ 𝑠𝑒 𝑥 ≤ −ϒ

Onde ϒ representa o valor de saturação da função rampa, isso significa que a transição
entre ϒ e – ϒ, também é feita neste intervalo [20], conforme a Figura 9.

Figura 9 - Gráfico de uma função rampa.

Fonte: Retirado de [20].

Vale a pena notar que esta função é uma variação da função degrau, porém com uma
transição linear e não imediata entre os dois valores.
15

2.6.2.4 FUNÇÃO SIGMOIDE

A função sigmoide pode ser definida pela seguinte equação:

1
𝑓(𝑥) = (4)
1 + 𝑒 −𝑎𝑥

Onde 𝑎 é um número real positivo que representa o parâmetro de inclinação entre os


estados da função [20]. A função pode ser evidenciada pelo gráfico da Figura 10.

Figura 10 - Gráfico de uma função sigmoide.

Fonte: Retirado de [20].

Esse tipo de função é a mais comumente utilizada. É definida como uma função
crescente com balanceamento adequado entre o comportamento linear e não-linear e também é
diferenciável, o que traz alguns benefícios para a análise dos modelos [21].
16

2.6.3 PERCEPTRON DE MÚLTIPLAS CAMADAS

O perceptron de múltiplas camadas é diferente do modelo simplificado pela presença


de mais de uma sequência de neurônios em formato de uma rede, conforme apresentado na
Figura 11.

Figura 11 - Perceptron de múltiplas camadas.

Fonte: Adaptado de [17].

No esquema da Figura 11 pode-se observar um modelo de perceptron com uma


camada de n entradas e n saídas, tendo a presença de n camadas ocultas com outros n neurônios.
O propósito dessas camadas ocultas é que elas causem uma mediação entre as camadas
de entrada e saída gerando uma contribuição para um melhor resultado do modelo [19].
Apesar disso, o teorema de aproximação universal exposto por Cybenko [34] afirma
que uma rede neural com apenas uma camada oculta e uma quantidade finita de neurônios é
capaz de aproximar qualquer função continua utilizando a função de ativação sigmóide.

2.6.4 TÉCNICAS DE APRENDIZADO

O aprendizado realizado pelas redes neurais artificiais pode ser definido em dois
grandes espectros: aprendizado supervisionado e aprendizado não supervisionado.
17

O tipo de aprendizado supervisionado pode ser definido quando a rede aprende com
resultados já pré-estabelecidos. Com isso, a rede reconhece padrões e passa a utilizar esse
conhecimento para realizar a predição de novos dados [22].
Já o método de aprendizado não supervisionado é realizado quando a rede é treinada
para associar os padrões e grupos de dados das entradas fornecidas. Desta forma,
diferentemente do treinamento supervisionado, os dados não teriam uma classe específica para
servirem de saída para o problema, cabendo a própria rede estabelecer as classificações de
acordo com as entradas apresentadas [22].

2.6.5 TREINAMENTO

O processo de treinamento de uma rede neural pode ser caracterizado pela busca de
parâmetros ótimos para que o problema em questão seja solucionado da melhor forma possível.
Antes de qualquer outro passo, os parâmetros iniciais devem ser inseridos e os dados devem ser
separados em diferentes amostras para teste, treino e validação do modelo [24].
O treinamento de uma rede neural se refere ao número de vezes que são processados
os dados de entrada e que é atualizado o modelo, levando em conta os pesos sinápticos de cada
camada [22].
Desta forma, a atualização destes pesos sinápticos pode ser feita diversas vezes até que
o resultado do modelo esteja dentro do esperado. O procedimento em que os dados são
processados e é feita a alteração de pesos pode ser definido como uma época. Ao longo do
treinamento são executadas diversas épocas até que o resultado seja atingido. Para auxiliar o
processamento, os dados apresentados podem ser separados em batches, um hiper parâmetro
para assegurar que a taxa de atualização destes pesos seja maximizada [23].
Um problema bastante comum durante a etapa de treinamento é o overfitting, que pode
ser caracterizado pelo aumento do erro nos dados utilizados para a validação enquanto há a
diminuição do erro no modelo de treino [24]. Já o underfitting é o problema que ocorre quando
a validação e o modelo de treino ambos possuem valores elevados de erro. Esses conceitos estão
ilustrados na Figura 12.
18

Figura 12 - Overfitting e underfitting.

Fonte: Autor.

Para evitar esses problemas, podem ser utilizadas técnicas como o ajuste do número
de épocas (criando uma parada antecipada) e o tratamento dos dados (balanceando as classes)
Além disso, é importante notar que na etapa de treinamento a mudança dos hiper
parâmetros e ajuste nas amostras de dados são fatores fundamentais para um modelo bem
dimensionado e ajustado.

2.6.6 RETROPROPAGAÇÃO

A retropropagação é uma técnica bastante utilizada nas redes neurais e permite, de


forma iterativa, buscar a menor diferença e erro possível entre as saídas desejadas e as saídas
obtidas [19]. Para isso, é necessário que os pesos das camadas ocultas sejam ajustados durante
o treinamento [22].
O processo da retropropagação ocorre primeiramente com um estímulo nos elementos
da primeira camada da rede que é propagado para as seguintes camadas até que gere uma saída
19

no final do seu percurso. Após a obtenção dessa saída, gera-se um sinal de erro que
automaticamente é retropropagado para as camadas ocultas anteriores [19].
Essas ações descritas ocorrem conforme o esquema apresentado na Figura 13.

Figura 13 - Retropropagação e propagação em uma rede neural.

Fonte: Retirado de [19].

Esse processo deve ocorrer desta forma, visto que as camadas intermediárias não
possuem contato com as saídas e estão em constante atualização de seus pesos sinápticos para
melhorar o resultado do modelo [20]. Isso ocorre durante todo o processo de aprendizado, até
que a saída da rede venha a convergir para o valor desejado.

2.6.7 MÉTODOS DE AVALIAÇÃO

Para que o modelo seja devidamente avaliado, ele deve passar por alguns testes. O
primeiro é a execução do mesmo a partir de novos dados nunca antes vistos para a determinação
de sua assertividade. Uma vez feito este processo, podem ser definidos parâmetros que ajudem
na avaliação do modelo conforme descrito nas próximas seções.
20

2.6.7.1 MATRIZ DE CONFUSÃO

A elaboração da matriz de confusão se mostra essencial para a avaliação da


assertividade de um modelo de ML, uma vez que nos permite analisar de mais de uma maneira
os resultados obtidos pelo algoritmo desenvolvido. A matriz de confusão é normalmente
representada pela Tabela 2, onde:

Tabela 2 - Matriz Confusão.

PREVISTO
0 1

VERDADEIRO FALSO POSITIVO


0
ESPERADO

NEGATIVO (VN) (FP)

FALSO NEGATIVO VERDADEIRO


1
(FN) POSITIVO (VP)

Fonte: Autor.

• Verdadeiro Negativo (VN): é quando o modelo prevê corretamente um valor


negativo de saída;
• Verdadeiro Positivo (VN): é quando o modelo prevê corretamente um valor
positivo de saída;
• Falso Negativo (FN): é quando o modelo prevê incorretamente um valor
negativo de saída (o valor real de saída seria um valor positivo);
• Falso Positivo (FP): é quando o modelo prevê incorretamente um valor positivo
de saída (o valor real de saída seria um valor negativo).
Desta forma, a relação entre os parâmetros da matriz confusão nos permitem avaliar
algumas métricas do modelo, sendo estas: Acurácia, Precisão e Recall.
Para a melhor avaliação de um modelo, uma combinação dos três parâmetros
mencionados acima é recomendada, uma vez que eles se complementam e permitem uma
assertividade maior [25].
21

2.6.7.2 ACURÁCIA

A medição da acurácia de um modelo é a forma mais simples de avaliação de um


modelo e consiste na verificação de quantos acertos um modelo possuiu em sua execução. Ela
pode ser definida pela equação:

𝑉𝑁 + 𝑉𝑃
𝐴𝐶𝑈𝑅Á𝐶𝐼𝐴 = (5)
𝑉𝑁 + 𝑉𝑃 + 𝐹𝑁 + 𝐹𝑃

Desta forma, se um modelo executou 100 medições e 90 delas foram corretas, sendo
5 falsos positivos e 5 falsos negativos, a acurácia do modelo seria de 90%.
Esse método de avaliação pode ser especialmente problemático para modelos
desbalanceados, uma vez que ele não diferencia entre os falsos positivos e os falsos negativos,
podendo acarretar uma falsa impressão de otimização para o algoritmo empregado [25].

2.6.7.3 PRECISÃO

A medição da precisão tem como objetivo determinar qual percentual das predições
são realmente positivas. Esse método pode ser definido pela equação:

𝑉𝑃
𝑃𝑅𝐸𝐶𝐼𝑆Ã𝑂 = (6)
𝑉𝑃 + 𝐹𝑃

Nota-se que conforme os valores de falsos positivos são maiores, menor é o percentual
de precisão daquele modelo.
Um ponto negativo deste método é que ele não leva em consideração a medição
negativa, podendo, em alguns casos, contribuir para mascarar algumas deficiências do modelo
elaborado [25].

2.6.7.4 RECALL

A medição do recall tem como objetivo determinar o quão bem o modelo prevê os
valores positivos. Esse método pode ser definido pela equação:
22

𝑉𝑃
𝑅𝐸𝐶𝐴𝐿𝐿 = (7)
𝑉𝑃 + 𝐹𝑁

Nota-se que conforme os valores de falso negativos são maiores, menor é o percentual
de recall daquele modelo.
23

3 METODOLOGIA

3.1 ESTUDO DE CASO

Com a crescente diversificação na matriz energética brasileira e a iminente abertura


do mercado de energia, estamos em um período de constante aumento na oferta interna de
energia e construção de usinas no país.
Tendo isso em vista, este estudo busca oferecer uma proposta para apoio à
manutenção preditiva destas usinas, utilizando como base os parâmetros operacionais e alarmes
de uma usina de biogás, buscando analisar e construir um modelo computacional que tenha
capacidade de prever o momento pré-falha e auxiliar na manutenção preditiva deste ativo.
Com isso, os pontos que serão abordados ao longo das próximas etapas deste
documento serão os seguintes:
• O modelo desenvolvido consegue ser melhor que a baseline?
• Quanto tempo antes é possível detectar a falha com o modelo desenvolvido?
• Qual é o esforço computacional associado à execução do modelo?

3.2 ETAPAS DO DESENVOLVIMENTO DO MODELO DE ML

Nesta seção, serão abordadas as etapas adotadas para o desenvolvimento do algoritmo


final do modelo apresentado. Para isso será utilizado o fluxo exposto no tópico 2.5 deste
documento.

3.2.1 FERRAMENTAS UTILIZADAS PARA CONSTRUÇÃO DO MODELO DE ML

Para o desenvolvimento do modelo de ML foi utilizada a linguagem de programação


Python, já que a mesma possui diversas bibliotecas que permitem a construção do modelo e o
tratamento dos dados de forma bastante robusta.
As principais bibliotecas utilizadas na fase de desenvolvimento do algoritmo foram:
Pandas [28], Tensor Flow [29], Keras [30] e scikit-learn [31].
A biblioteca Pandas foi fundamental para a importação dos dados e o seu
processamento, permitindo realizar de maneira simples operações e manipulações com o grande
volume de dados apresentado. Ainda em relação aos dados, a biblioteca scikit-learn foi
24

fundamental para a parte final do tratamento dos dados fornecendo funções para mudar a escala
dos dados e realizar a divisão entre os dados utilizados para treinamento e teste.
Já as bibliotecas Tensor Flow e Keras foram utilizadas na construção do modelo, sendo
responsáveis pelas funções, arquitetura da rede neural e ambiente para a execução destes
algoritmos.

3.2.2 DADOS UTILIZADOS

Serão abordados todos os aspectos dos dados utilizados no modelo desenvolvido,


dividindo-se essa seção em três principais tópicos: obtenção, seleção e processamento dos
dados.

3.2.2.1 OBTENÇÃO DOS DADOS

Os dados utilizados para elaboração do modelo foram retirados do sistema


supervisório da usina em questão, podendo separá-los em dois grupos:
1. Parâmetros operacionais.
2. Acionamento de alarmes.

3.2.2.1.1 PARÂMETROS OPERACIONAIS

Os dados operacionais da usina disponíveis para análise dos modelos foram separados
nas seguintes categorias:
• Potências elétricas;
• Dados do alternador;
• Fator de potência do gerador;
• Óleo do motor;
• Ventilação na sala do motor;
• Circuito água do motor;
• Circuito intercooler;
• Água quente utilitário;
• Carburação;
• Temperaturas dos cilindros.
25

Todas essas categorias possuem subdivisões internas, como por exemplo, a categoria
“Potências Elétricas” possui informações sobre as potências ativas e reativas, bem como
informações da velocidade RPM do gerador.
Os dados são registrados a cada 2 segundos, conforme os parâmetros são lidos por
equipamentos de medição e estão disponíveis em tempo real para conferência e análise dos
mesmos, podendo ser verificados no próprio supervisório ou até mesmo extraídos para
verificação em outro software.

3.2.2.1.2 ACIONAMENTO DE ALARMES

Para que possamos classificar os momentos de pré-falha são necessários registros de


problemas passados na usina. Buscando rastrear esses dados, utilizaremos o histórico de
acionamento dos alarmes no período desejado.
Essa informação é registrada de modo a saber o momento exato em que ocorreu a falha
e o alarme correspondente acionado, no formato dd/MM/aaaa HH:mm:ss.

3.2.2.2 SELEÇÃO DOS DADOS

Após uma análise no histórico de acionamento dos dados, optou-se por utilizar o
período de 01/01/2022 a 15/01/2022, pela quantidade de alarmes disparados naquele intervalo,
além da quantidade de dados disponíveis. Deve-se destacar que, devido à grande frequência (a
cada 2 segundos) do registro dos dados dos parâmetros operacionais, o volume de dados
disponíveis já é considerável e suficiente para a análise proposta.

3.2.2.2.1 PARÂMETROS OPERACIONAIS

Conforme exposto na seção anterior, foram analisadas todas as 10 categorias principais


de dados como a possibilidade de extração no período desejado. Porém, algumas exportações
destes dados retornaram como vazias ou corrompidas. Sendo assim, as categorias utilizadas
foram os seguintes:
• Ventilação na sala do motor;
• Circuito água do motor;
• Circuito intercooler.
26

Assim, a Tabela 3 apresenta todas as variáveis contidas na categoria da ventilação da


sala do motor.

Tabela 3 - Variáveis contidas na categoria ventilação na sala do motor.


Ventilação na sala do motor
Variável Explicação
PotVentSalaMot ValueY Potência da ventilação na sala do motor
TTx99 ValueY Temperatura externa
TTx90 ValueY Temperatura da sala do motor
NUT31 ValueY Temperatura do filtro aspiração do motor
Fonte: Autor.

A Tabela 4 apresenta as variáveis na categoria circuito água do motor.

Tabela 4 - Variáveis contidas na categoria circuito água do motor.


Circuito água do motor
Variável Explicação
PotVentMotValueY Potência da ventilação no motor
TTx10ValueY Temperatura de água da entrada do motor
Valor de temperatura da fonte de
HeatingWaterSupplyValueY
aquecimento de água
TTx11ValueY Posição de válvula 3 vias
TTx13ValueY Temperatura de água da saída do motor
PTx10ValueY Pressão de água do motor
Fonte: Autor.

A Tabela 5 apresenta as variáveis na categoria do circuito intercooler.

Tabela 5 - Variáveis contidas na categoria circuito intercooler.


Circuito Intercooler
Variável Explicação
Potência da ventilação do circuito do
PotVentInterc ValueY
intercooler
TTx21 ValueY Posição de válvula 3 vias
TTx23 ValueY Temperatura de água da saída do motor
TTx75 ValueY Temperatura da mistura (gás e ar)
PTx75 ValueY Pressão da mistura (gás e ar)
Fonte: Autor.
27

3.2.2.2.2 ACIONAMENTO DOS ALARMES

O registro de acionamento dos alarmes de janeiro foi obtido de acordo com cada tipo
de problema e o seu código relacionado, conforme a Tabela 6.

Tabela 6 - Histórico do acionamento dos alarmes.


Data-Hora
ID Codigo_Alarme Mensagem Alarme
Parada
01/01/2022 DISTURBO POMPA ACQUA DI
1 1090
04:56:51 RAFFREDDAMENTO MOTORE
02/01/2022 DISTURBO POMPA ACQUA DI
2 1090
11:26:04 RAFFREDDAMENTO MOTORE
05/01/2022 DISTURBO POMPA ACQUA DI
3 1090
12:40:14 RAFFREDDAMENTO MOTORE
06/01/2022 DISTURBO POMPA ACQUA DI
4 1090
18:17:36 RAFFREDDAMENTO MOTORE
07/01/2022 DISTURBO POMPA ACQUA DI
5 1090
09:54:13 RAFFREDDAMENTO MOTORE
08/01/2022 DISTURBO POMPA ACQUA DI
6 1090
06:24:27 RAFFREDDAMENTO MOTORE
08/01/2022 DISTURBO POMPA ACQUA DI
7 1090
11:43:03 RAFFREDDAMENTO MOTORE
08/01/2022 DISTURBO POMPA ACQUA DI
8 1090
15:50:53 RAFFREDDAMENTO MOTORE
09/01/2022 DISTURBO POMPA ACQUA DI
9 1090
08:53:33 RAFFREDDAMENTO MOTORE
09/01/2022 DISTURBO POMPA ACQUA DI
10 1090
10:53:09 RAFFREDDAMENTO MOTORE
10/01/2022
11 1018 MINIMO LIVELLO OLIO MOTORE
15:30:44
11/01/2022
12 1236 Generator CB opened
10:57:48
12/01/2022 DISTURBO POMPA ACQUA DI
13 1090
09:54:14 RAFFREDDAMENTO MOTORE
12/01/2022
14 1236 Generator CB opened
16:46:44
12/01/2022
15 1236 Generator CB opened
17:54:25
13/01/2022 TEMPERATURA GAS DI SCARICO SCOSTAMENTO
16 1044
01:24:50 DAL VALORE MEDIO
13/01/2022 TEMPERATURA GAS DI SCARICO SCOSTAMENTO
17 1044
08:58:00 DAL VALORE MEDIO
13/01/2022
18 1236 Generator CB opened
17:46:55
Fonte: Autor.
28

Onde:
• DISTURBO POMPA ACQUA DI RAFFREDDAMENTO MOTORE: alarme
referente a problemas na bomba de água utilizada no resfriamento do motor,
também pode ser acionado quando há oscilações na rede devido a problemas
na rede da distribuidora, uma vez que é o primeiro alarme a ser detectado e
registrado;
• MINIMO LIVELLO OLIO MOTORE: alarme relacionado ao nível de óleo do
motor;
• Generator CB opened: alarme relacionado a problemas de operação do motor
que causaram sua parada;
• TEMPERATURA GAS DI SCARICO SCOSTAMENTO DAL VALORE
MEDIO: alarme relacionado a temperatura do gás nos cilindros.

Desta forma, os alarmes selecionados para a elaboração do modelo de ML, foram os


de código 1236, uma vez que possuíam diversas ocorrências no mês e configuravam um tipo
de falha mais significativa e rastreável em contraste ao alarme de código 1090. Apesar de
ocorrerem mais frequentemente, os alarmes de código 1090 possuem uma natureza mais
imprevisível e de menor gravidade.

3.2.3 PROCESSAMENTO DOS DADOS

Os dados obtidos, tanto referentes aos parâmetros operacionais quanto aos alarmes,
foram processados e manipulados utilizando a biblioteca Pandas. O passo a passo desse
processamento está descrito abaixo:
1. Importação do documento .csv dos dados (parâmetros operacionais e
acionamento dos alarmes);
2. Filtragem dos alarmes utilizados;
3. Ajuste do formato das datas;
4. Preenchimento de dados faltantes;
5. Concatenamento de todos os dados;
6. Separação dos dados para aplicação do modelo em tempo real;
7. Ajuste e criação das features;
8. Realização do balanceamento das classes.
29

9. Divisão dos dados em dados de teste, treino e validação;


10. Escalonamento dos dados.
É importante notar que o processamento dos dados é fundamental para o desempenho
do modelo, uma vez que está diretamente relacionado ao seu aprendizado.
A separação dos dados para a aplicação em tempo real foi feita de forma que os dados
após o dia 12/01/2022 as 21:46:55 (exatamente 20 horas antes do acionamento do alarme)
fossem retirados dos dados de entrada do modelo.

3.2.4 FEATURE ENGINEERING

O feature engineering é o processo que tem como definição a análise dos dados e
seleção de variáveis de forma a obter o melhor desempenho do modelo.

3.2.4.1 DEFINIÇÃO DAS VARIÁVEIS DE ENTRADA

Uma vez feito o processo de importação dos dados das categorias selecionadas,
(ventilação na sala do motor, circuito água do motor e circuito intercooler) os mesmos foram
transformados em gráficos, para que o comportamento das suas variáveis pudesse ser entendido
ao longo do intervalo selecionado. Assim, as Figuras 14, 15 e 16 representam a visualização
destes dados.

Figura 14 - Ventilação na sala do motor.

Fonte: Autor.
30

Figura 15 - Circuito de água do motor.

Fonte: Autor.

Figura 16 - Circuito intercooler.

Fonte: Autor.

Conforme observado nas Figuras 14, 15 e 16, estão contidos os parâmetros destas
variáveis e a sua variação devido aos eventos que ocorreram no ativo nestes 15 dias amostrais.
Como a única variável que permanece constante, independente de quaisquer eventos no
período, é “PotVentInterc ValueY”, ela foi removida da lista de variáveis de entrada do modelo.
Com isso, no total, foram utilizadas 14 features para o modelo, sendo elas: "PotVentSalaMot
ValueY", "TTx99 ValueY","TTx90 ValueY", "NUT31 ValueY", "PotVentMotValueY",
"TTx10ValueY", "HeatingWaterSupplyValueY", "TTx11ValueY", "TTx13ValueY",
31

"PTx10ValueY", "PotVentInterc ValueY", "TTx21 ValueY", "TTx23 ValueY", "TTx75


ValueY" e "PTx75 ValueY".
Vale ressaltar que os dados de entrada do modelo serão escalonados e normalizados
utilizando a técnica de mínimo-máximo, que tem como objetivo transformar os valores dos
dados para um intervalo de [0,1] trazendo seus valores mais perto da média da feature e
diminuindo o peso dos outliers encontrados [32].

3.2.4.2 DEFINIÇÃO DO INTERVALO DE PREVISÃO

Para a elaboração do algoritmo, o intervalo de previsão da falha analisada é


imprescindível, já que está diretamente relacionado a mobilização da equipe e realização da
manutenção preditiva.
Desta forma, decidiu-se analisar o desempenho do modelo em relação intervalos de
tempo definidos para a tomada de decisão, sendo estes:
• 4 horas antes da falha;
• 8 horas antes da falha;
• 12 horas antes da falha;
• 16 horas antes da falha;
• 20 horas antes da falha;
Estes resultados comparativos serão apresentados na seção 4.
32

3.2.4.3 DEFINIÇÃO DA VARIÁVEL DE SAÍDA

Como o modelo elaborado é responsável pela classificação binária do momento pré-


falha, foi estabelecido que a variável de saída deve ter o valor de 1, quando há operação dentro
do intervalo de previsão (iminência de falha) e 0 quando fora do intervalo de previsão. Assim,
teremos os comportamentos expostos nas Figuras 17 e 18.

Figura 17 - Ponto da Falha.


Ponto da Falha
1,2
1
0,8
0,6
0,4
0,2
0
0 1 2 3 4 5 6 7 8 9 10
Tempo (horas)

Fonte: Autor.

Figura 18 - Saída Esperada do Modelo considerando um intervalo de previsão de 5 horas.


Saída Esperada do Modelo
1,2
1
0,8
0,6
0,4
0,2
0
0 1 2 3 4 5 6 7 8 9 10
Tempo (h)

Fonte: Autor.

3.2.4.4 BASELINE

Como boa prática, a elaboração de um modelo de ML deve conter sempre uma


baseline, ou seja, um ponto de partida. Para isso, foi utilizado modelo DummyClassifier da
biblioteca scikit-learn, pronto anteriormente.
33

Para definir os parâmetros deste classificador foi utilizada a estratégia stratified do


modelo, que é definida por uma seleção aleatória de um vetor de uma distribuição
parametrizada multinomial para as classes empíricas antes das probabilidades das mesmas [27].
Utilizando este modelo para prever os valores de teste, tivemos uma acurácia média
de 50%, valor que não atenderia o propósito de estabelecimento de uma ferramenta de apoio a
manutenção preditiva. Sendo assim, o desenvolvimento do algoritmo foi feito buscando
alcançar um patamar maior que o do modelo baseline.

3.2.5 ESTRUTURA E TREINAMENTO DA REDE NEURAL

Para a definição da estrutura da rede neural devem ser levados em conta diversos
fatores como: desempenho computacional, adequação aos dados inseridos e desempenho do
modelo.
Com isso, apesar de existirem boas práticas a serem consideradas na definição da
quantidade de camadas escondidas e de neurônios nas mesmas, a determinação da estrutura
deve ser sempre feita caso a caso, de acordo com o desempenho do modelo.
O mesmo pode ser dito para os parâmetros utilizados para o treino do modelo que
também estão diretamente relacionados à performance do modelo.
Desta forma, as análises e critérios definidos para parte final do modelo serão expostas
na seção de resultados, de forma a exemplificar melhor as decisões tomadas e escolhas feitas.
34

4 ANÁLISES E RESULTADOS

Nesta seção serão apresentados os resultados encontrados na elaboração do modelo e


determinação do intervalo de previsão.
Para toda análise referente ao esforço computacional foi utilizado como referência uma
máquina com as seguintes especificações:
• Ryzen 5 1600 com seis núcleos operando em 3.2GHz;
• 16 GB de memória RAM DDR4;
• SSD Kingston A400;
• Placa de vídeo AMD RX 580.

4.1 DEFINIÇÃO DA ESTRUTURA DA REDE NEURAL

De forma a serem tomadas decisões sobre a estrutura da rede neural, foram feitos testes
de três estruturas, conforme exposto na Tabela 7.

Tabela 7 - Estruturas de rede neural analisadas.


Neurônios Neurônios Neurônios
Camada na 1ª na 2ª na 3ª Camada
Modelo
de Entrada Camada Camada Camada de Saída
Oculta Oculta Oculta
1 14 8 - - 1
2 14 8 4 - 1
3 14 8 4 2 1
Fonte: Autor.

Sendo assim, temos o modelo 1, modelo mais simples dentre os analisados, com apenas
1 camada oculta, enquanto o modelo 2 e 3 possuem 2 e 3 camadas ocultas respectivamente.
As funções de ativação utilizadas para as camadas ocultas e para a camada de saída
foram sigmoides. Como o problema que o modelo busca resolver é uma classificação binária,
a função de perda considerada foi a entropia cruzada.
35

Para a realização destes testes foi considerado um intervalo de previsão de 16 horas


antes da falha. Com isso tivemos um total de 345606 linhas de dados para cada uma das 16
features consideradas para o treinamento do modelo.
Após 20 épocas, foram obtidos os resultados expostos nas Figuras 19 e 20.

Figura 19 - Perda e Acurácia de treinamento dos modelos.

Perda e Acurácia
100,00% 91,57% 87,62%
86,32%
80,00%

60,00%

40,00% 33,21%
28,23%
23,52%
20,00%

0,00%
Modelo 1 Modelo 2 Modelo 3

Perda Acurácia

Fonte: Autor.

Figura 20 - Tempo médio por época dos modelos.


Tempo Médio Por Época
9,80 9,70
9,57
9,60

9,40
Tempo (s)

9,20
9,03
9,00

8,80

8,60
Modelo 1 Modelo 2 Modelo 3

Fonte: Autor.

Conforme observado nas Figuras 20 e 21, o segundo modelo, com duas camadas
ocultas, performou melhor que os outros dois modelos analisados no quesito perdas e acurácia,
ainda mantendo um esforço computacional comparável ao primeiro modelo, que possui menos
camadas.
36

Desta forma, o modelo que será utilizado para a realização das demais análises é o
modelo 2.

4.2 DETERMINAÇÃO DE PARAMETROS DE TREINAMENTO DA REDE NEURAL

Para o processo de treinamento do modelo, foram separados os dados de forma a


ficarem 80% deles para a etapa de treino, onde 10% destes 80% serão utilizados para a validação
do modelo. Os 20% remanescentes serão utilizados para o teste do modelo, desta forma é
garantido que os dados utilizados para a validação serão diferentes dos dados utilizados para o
teste. Vale ressaltar que na etapa de processamento dos dados estes foram separados de forma
a conter uma amostra aleatória equivalente para ambas as saídas possíveis do modelo (operação
dentro e fora do intervalo de previsão).
O treinamento, de forma a balancear esforço computacional e desempenho, foi feito
em 200 épocas, podendo ter ação da parada antecipada.
A inclusão da parada antecipada no modelo foi implementada utilizando como
argumento a variável de erro relacionado aos dados da validação, de forma a interromper o
modelo, uma vez que este não mostrasse nenhuma melhora em 10 épocas. Assim, o algoritmo
se tornou mais robusto, evitando que o modelo fosse afetado pelo fenômeno de overfitting.
Outro parâmetro fundamental para a execução do modelo é o batch size, que tem
influência direta no tempo de execução do treinamento e na taxa de atualizações dos pesos
sinápticos. Portanto, utilizando o modelo adotado na seção anterior, foram realizados testes com
os seguintes tamanhos de batch: 32 (padrão do Tensor Flow), 64 e 128.
Os resultados obtidos nesta análise estão expostos nas Figuras 21 e 22.

Figura 21 - Perda e Acurácia de treinamento de diferentes tamanhos de batch.


Perda e Acurácia
91,57% 93,98%
100,00% 82,07%
80,00%
60,00% 39,54%
40,00% 23,52% 16,99%
20,00%
0,00%
32 64 128
Tamanho de batch

Perda Acurácia

Fonte: Autor.
37

Figura 22 - Tempo médio por época dos diferentes tamanhos de batch.


Tempo Médio Por Época
12,00

10,00 9,57

8,00
Tempo (s)

6,00 5,00

4,00
2,13
2,00

0,00
32 64 128
Tamanho de batch

Fonte: Autor.

Pode-se observar nas Figuras 21 e 22 que o tamanho de batch de 64 foi o que


performou melhor em todas as métricas analisadas, sendo, desta forma, o tamanho escolhido
para o treinamento do modelo.

4.3 DEFINIÇÃO DO INTERVALO DE PREVISÃO

Para definição do intervalo de previsão foram utilizados os parâmetros de treino e


estruturas definidos nas seções anteriores com os seguintes intervalos:
• 4 horas antes da falha;
• 8 horas antes da falha;
• 12 horas antes da falha;
• 16 horas antes da falha;
• 20 horas antes da falha;
Os intervalos foram aplicados aos dados, com uma posterior análise utilizando as
métricas de avaliação do modelo de duas formas: nos dados de teste e nos dados em tempo real
separados previamente.
É importante destacar que para efeito de comparação o limiar de decisão utilizado foi
de 50% em todos os testes feitos.
38

4.3.1 APRESENTAÇÃO DOS RESULTADOS

4.3.1.1 4 HORAS ANTES DA FALHA

A determinação do intervalo de previsão como sendo 4 horas antes da falha ocasionou


na análise de 86406 linhas de dados para cada uma das 14 features analisadas, levando em
média 1 segundo por época corrida, totalizando 200 segundos.
Sendo assim, estão descritos nas Figuras 23 e nas Tabelas 8 e 9 os resultados obtidos
neste intervalo.

Figura 23 - Curvas de perda utilizando 4 horas antes da falha como intervalo de previsão.

Fonte: Autor.

Tabela 8 - Métricas de avaliação usando os dados de teste e 4 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 8344 341 98% 96%


ESPERADO

97%

1 146 8451 96% 98%

Fonte: Autor.
39

Tabela 9 - Métricas de avaliação usando os dados em tempo real e 4 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 73373 9817 98% 88%


ESPERADO

87%

1 1624 55777 36% 77%

Fonte: Autor

4.3.1.2 8 HORAS ANTES DA FALHA

A determinação do intervalo de previsão como sendo 8 horas antes da falha ocasionou


no treinamento utilizando 172806 linhas de dados para cada uma das 14 features analisadas,
levando em média 2 segundo por época corrida, totalizando 400 segundos. Estão descritos nas
Figuras 24 e nas Tabelas 10 e 11 os resultados obtidos neste intervalo.

Figura 24 - Curvas de perda utilizando 8 horas antes da falha como intervalo de previsão.

Fonte: Autor.
40

Tabela 10 - Métricas de avaliação usando os dados de teste e 8 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 15030 2279 95% 87%


ESPERADO

91%

1 725 16528 88% 96%

Fonte: Autor.

Tabela 11 - Métricas de avaliação usando os dados em tempo real e 8 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 67362 8628 97% 89%


ESPERADO

88%

1 1808 12593 59% 87%

Fonte: Autor.
41

4.3.1.3 12 HORAS ANTES DA FALHA

A determinação do intervalo de previsão como sendo 12 horas antes da falha ocasionou


no treinamento utilizando 259206 linhas de dados para cada uma das 14 features analisadas,
levando em média 4 segundo por época corrida, totalizando 800 segundos.
Sendo assim, estão descritos nas Figuras 25 e nas Tabelas 12 e 13 os resultados obtidos
neste intervalo.

Figura 25 - Curvas de perda utilizando 12 horas antes da falha como intervalo de previsão.

Fonte: Autor.

Tabela 12 - Métricas de avaliação usando os dados de teste e 12 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 23712 2140 95% 92%


ESPERADO

94%

1 1124 24866 92% 96%

Fonte: Autor.
42

Tabela 13 - Métricas de avaliação usando os dados em tempo real e 12 horas antes da falha
como intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 61636 7154 91% 90%


ESPERADO

85%

1 6464 15137 68% 70%

Fonte: Autor.

4.3.1.4 16 HORAS ANTES DA FALHA

A determinação do intervalo de previsão como sendo 16 horas antes da falha ocasionou


no treinamento utilizando 345606 linhas de dados para cada uma das 14 features analisadas,
levando em média 5 segundo por época corrida, totalizando 1000 segundos. Nas Figuras 26 e
nas Tabelas 14 e 15 estão descritos os resultados obtidos nesse intervalo.

Figura 26 - Curvas de perda utilizando 16 horas antes da falha como intervalo de previsão.

Fonte: Autor.
43

Tabela 14 - Métricas de avaliação usando os dados de teste e 16 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 31712 2743 97% 92%


ESPERADO

95%

1 1022 33645 92% 97%

Fonte: Autor.

Tabela 15 - Métricas de avaliação usando os dados em tempo real e 16 horas antes da falha
como intervalo de previsão.

PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 54406 7184 81% 88%


ESPERADO

78%

1 12529 16272 69% 56%

Fonte: Autor.
44

4.3.1.5 20 HORAS ANTES DA FALHA

A determinação do intervalo de previsão como sendo 20 horas antes da falha ocasionou


na análise de 432008 linhas de dados para cada uma das 14 features analisadas, levando em
média 6 segundo por época corrida, totalizando 1200 segundos. Nas Figuras 27 e nas Tabelas
16 e 17 conseguimos observar os resultados obtidos neste intervalo.

Figura 27 - Curvas de perda utilizando 20 horas antes da falha como intervalo de previsão.

Fonte: Autor.

Tabela 16 - Métricas de avaliação usando os dados de teste e 20 horas antes da falha como
intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 41248 2035 97% 95%


ESPERADO

96%

1 1478 41641 95% 97%

Fonte: Autor.
45

Tabela 17 - Métricas de avaliação usando os dados em tempo real e 20 horas antes da falha
como intervalo de previsão.
PREVISTO MÉTRICAS
0 1 PRECISÃO RECALL ACURÁCIA

0 49538 4853 72% 91%


ESPERADO

74%

1 19039 16961 78% 47%

Fonte: Autor.

4.3.2 DISCUSSÃO DOS RESULTADOS

Como podemos observar das Figuras 24 a 27, que demonstram as curvas de perdas de
cada um dos intervalos de previsão analisados, nenhum dos modelos treinados teve a incidência
do fenômeno do overfitting.
No geral, os intervalos considerados tiveram métricas semelhantes quando analisados
em confronto com o grupo de dados de teste, conforme as Tabelas 8, 10, 12, 14 e 16, tendo uma
acurácia média de 94,6%. Como os dados utilizados para o teste destes modelos eram
balanceados, podemos afirmar que os modelos foram bem-sucedidos no aprendizado do
comportamento destes dados.
Entretanto, quando se considera o cenário em tempo real, conforme as Tabelas 9, 11,
13, 15 e 17, o modelo teve um desempenho pior do que os modelos dos dados de teste. Isso
pode ser atribuído a alguns motivos, como a diferença do comportamento das features no tempo
analisado e a baixa frequência de acionamento de alarmes no período.
Um ponto interessante a se notar é que, utilizando o intervalo de previsão como 4
horas, vimos uma métrica de precisão muito baixa no cenário em tempo real, conforme a Tabela
9. Isso se deu pela baixa amostragem de dados utilizadas no treinamento do modelo, que quando
aumentada apresentou resultados melhores.
Utilizando como parâmetro principal o desempenho do modelo nos dados do tempo
real, foi decidido que, devido a deterioração das métricas de avaliação, principalmente precisão
e recall, pois se trata de um período em que há o desbalanceamento das classes, ou seja, é um
período em que há mais dados fora do intervalo de previsão do que dentro. Assim, o intervalo
máximo considerado para o modelo final seria o de 20 horas antes da falha.
46

4.4 SIMULAÇÃO EM TEMPO REAL

Conforme decidido nas seções anteriores, utilizando o modelo 2 (Tabela 7) realizado


o treinamento considerando 200 épocas, 64 de tamanho de batch e um intervalo de previsão de
20 horas, foi obtida a simulação em tempo real dos dados e resultados do modelo conforme a
Figura 28.

Figura 28 - Simulação em tempo real do modelo desenvolvido.

Fonte: Autor
47

A partir da Figura 28 conseguimos ver claramente o momento em que o modelo tomou


a decisão e qual variação dos parâmetros operacionais ele considerou como duvidosos o
suficiente para classificar como momento pré-falha.
Além disso, conforme citado na seção 4.3.2., conseguimos observar, no período entre
14/01 e 15/01, o comportamento similar ao do momento pré-falha dos dados que ocasionou a
classificação pelo modelo.
48

5 CONCLUSÃO E TRABALHOS FUTUROS

Tendo em vista a expansão da geração de energia no Brasil, este trabalho trouxe uma
perspectiva do funcionamento de uma planta de biogás para embasar todos estes conceitos e
desenvolver uma ferramenta para o apoio da manutenção preditiva dos ativos da usina
utilizando o ML e noções de redes neurais.
Com isso, foram analisados diferentes tipos de modelos com o intuito de maximizar o
intervalo de previsão da falha, a força computacional e o desempenho do modelo, tanto em
dados de teste nunca vistos antes, como na simulação em tempo real do funcionamento da usina.
Alguns desafios para a elaboração do modelo, foram o balanceamento entre o
desempenho do modelo e o esforço computacional, uma vez que a diminuição do tempo
computacional, muitas vezes, acarretaria a degradação do desempenho do modelo, e também o
processamento dos dados, que por possuírem um grande volume, necessitaram de diversas
tratativas como o ajuste de datas, preenchimento de dados faltantes e concatenação.
Assim, foi desenvolvido um modelo computacional que conseguiu ser mais eficiente
que o modelo baseline, sendo capaz de prever uma falha em até 20 horas antes dela acontecer,
tudo isso com um esforço computacional de treinamento de 1200 segundos para os dados
analisados. Podendo ser, assim, utilizado no apoio da manutenção preditiva da planta.
Para trabalhos futuros, uma possibilidade seria elaborar um modelo de
multiclassificação, considerando todos os alarmes acionados no período analisado, assim como
a elaboração de um dispositivo de alarme que indique a probabilidade de falha considerando as
previsões obtidas.
Além disso, para que o modelo esteja cada vez mais adaptado ao cotidiano da planta,
mais parâmetros de sua operação poderiam ser utilizados em seu treinamento para melhor
desempenho nas demais classificações.
49

REFERÊNCIAS BIBLIOGRÁFICAS

[1] ARESE, Marcelo Contente. Maturidade da gestão de ativos físicos de processo: uma
perspectiva sustentável utilizando lógica nebulosa. 2018.

[2] SOUZA, Rafael Doro. Análise da gestão da manutenção focando a manutenção centrada
na confiabilidade: estudo de caso. MRS logística. Juiz de Fora (MG): UFJF, 2008.

[3] FOONG, Wai Kuan; MAIER, Holger R.; SIMPSON, Angus R. Power plant
maintenance scheduling using ant colony optimization: an improved formulation.
Engineering Optimization, v. 40, n. 4, p. 309-329, 2008.

[4] ALMEIDA, N. Fundamentos e perspetivas de inovação na gestão de ativos de


engenharia. RAE - Revista de Ativos de Engenharia, [S. l.], v. 1, n. 1, 2022. DOI:
10.29073/rae.v1i1.644. Disponível em:
https://www.revistas.ponteditora.org/index.php/rae/article/view/644. Acesso em: 2 nov.
2022.

[5] ALFATIH, Somia; LEONG, M. Salman; HEE, Lim Meng. Definition of engineering
asset management: a review. Applied Mechanics and Materials, v. 773, p. 794-798,
2015.

[6] HODKIEWICZ, M. R.; PASCUAL, Rodrigo. Education in Engineering Asset


Management–current trends and challenges. In: International physical asset
management conference. 2006. p. 28-31.

[7] NORMA ABNT NBR 5462:1994, Confiabilidade e mantenabilidade

[8] LEMOS, Mateus Albernaz; ALBERNAZ, C. M.; CARVALHO, Rogerio Atem de.
Qualidade na manutenção. XXXI ENEGEP, v. 31, 2011.

[9] PINTO, Alan Kardec; XAVIER, Júlio Aquino Nascif. Manutenção: função estratégica.
Qualitymark, 2009.

[10] TROJAN, Flavio; MARÇAL, Rui Francisco Martins; BARAN, Leandro Roberto.
Classificação dos tipos de manutenção pelo método de Análise Multicritério ELECTRE
TRI. Simpósio Brasileiro de Pesquisa Operacional, p. 343-357, 2013.
50

[11] OTANI, Mario; MACHADO, Waltair Vieira. A proposta de desenvolvimento de gestão


da manutenção industrial na busca da excelência ou classe mundial. Revista Gestão
Industrial, v. 4, n. 2, 2008.

[12] ASSOCIAÇÃO BRASILEIRA DE MANUTENÇÃO. Documento Nacional de


Manutenção: A Situação da manutenção no Brasil. Curitiba, 2013.

[13] CARVALHO, Thyago P. et al. A systematic literature review of machine learning


methods applied to predictive maintenance. Computers & Industrial Engineering, v.
137, p. 106024, 2019.

[14] A. Kardec and J. Nascif, “Manuetenção: Função Estratégica,” Rio Janeiro Ed. Qual.,
vol.3. ed., p. 384 p., 2009.

[15] SELCUK, Sule. Predictive maintenance, its implementation and latest trends.
Proceedings of the Institution of Mechanical Engineers, Part B: Journal of Engineering
Manufacture, v. 231, n. 9, p. 1670-1679, 2017.

[16] VAN ASSEN, Marly; LEE, Scott J.; DE CECCO, Carlo N. Artificial intelligence from
A to Z: from neural network to legal framework. European Journal of Radiology, v. 129,
p. 109083, 2020.

[17] SARKER, Iqbal H. Machine learning: Algorithms, real-world applications and research
directions. SN Computer Science, v. 2, n. 3, p. 1-21, 2021.

[18] FERNEDA, Edberto. Redes neurais e sua aplicação em sistemas de recuperação de


informação. Ciência da Informação, v. 35, p. 25-30, 2006

[19] MATSUNAGA, Victoria Yukie. Curso de Redes Neurais utilizando o MATLAB. Belém
do Pará, 2012.

[20] CARDON, André; MÜLLER, Daniel Nehme; NAVAUX, Philippe. Introdução às redes
neurais artificiais. Porto Alegre, 1994.

[21] FLECK, Leandro et al. Redes neurais artificiais: Princípios básicos. Revista Eletrônica
Científica Inovação e Tecnologia, v. 1, n. 13, p. 47-57, 2016.

[22] KROSE, Ben; SMAGT, Patrick van der. An introduction to neural networks. 2011.
51

[23] BROWNLEE, Jason. What is the Difference Between a Batch and an Epoch in a Neural
Network. Machine Learning Mastery, v. 20, 2018.

[24] PANOU, Dimitra N.; RECZKO, Martin. DeepFoldit--A Deep Reinforcement Learning
Neural Network Folding Proteins. arXiv preprint arXiv:2011.03442, 2020.

[25] JAPKOWICZ, Nathalie. Why question machine learning evaluation methods. In: AAAI
workshop on evaluation methods for machine learning. 2006. p. 6-11.

[26] BASE DIGITAL. Raízen inaugura planta de biogás e consolida portfólio de energias
renováveis. 2020. Raizen.com.br. Disponível em: https://www.raizen.com.br/sala-de-
imprensa/raizen-inaugura-planta-de-biogas-e-consolida-portfolio-de-energias-
renovaveis. Acesso em: 2 nov. 2022.

[27] sklearn.dummy.DummyClassifier. 2022. scikit-learn. Disponível em: https://scikit-


learn.org/stable/modules/generated/sklearn.dummy.DummyClassifier.html. Acesso em:
2 nov. 2022.

[28] User Guide — pandas 1.5.2 documentation. 2022. Pydata.org. Disponível em:
https://pandas.pydata.org/docs/user_guide/index.html. Acesso em: 11 dez. 2022.

[29] API DocumentationTensorFlow v2.11.0. 2021. TensorFlow. Disponível em:


https://www.tensorflow.org/api_docs. Acesso em: 11 dez. 2022.

[30] TEAM, K. Keras documentation: Developer guides. 2022. Keras.io. Disponível em:
https://keras.io/guides/. Acesso em: 11 dez. 2022.

[31] User guide: contents. 2022. scikit-learn. Disponível em: https://scikit-


learn.org/stable/user_guide.html. Acesso em: 11 dez. 2022.

[32] COUTINHO, Rui. Gestão de ativos físicos aplicada às infraestruturas. Revista


Portuguesa de Engenharia de Estruturas, v. 3, n. 4, p. 113-118, 2017.

[33] sklearn.preprocessing.MinMaxScaler. 2022. scikit-learn. Disponível em: https://scikit-


learn.org/stable/modules/generated/sklearn.preprocessing.MinMaxScaler.html. Acesso
em: 11 dez. 2022.

[33] CYBENKO, George. Approximation by superpositions of a sigmoidal function.


52

Mathematics of control, signals and systems, v. 2, n. 4, p. 303-314, 1989.

Você também pode gostar