Você está na página 1de 8

Aplicações de Machine Learning no Contexto da En-

genharia Mecânica: Uma Revisão Exploratória na litera-


tura com uso de Text Mining

Edson Luiz Marques Junior¹, Gilson Adamczuk Oliveira1, Murilo Noriyuki Rubio
Maehashi1
1 Universidade Tecnológica Federal do Paraná, Pato Branco, BR

Resumo. Com o avanço tecnológico provido pela implementação da indústria 4.0 aplica-
ções de machine learning se tornaram cada vez mais necessárias no contexto da engenharia me-
cânica. Com a modernização da indústria surgiram novos problemas onde era necessário gerir
um grande volume de dados que eram gerados pelas máquinas e sensores. Afim de resolver pro-
blemas de gestão causado pelo grande volume de dados foram desenvolvidos algoritmos visuais
nos quais a análise de dados se torna uma tarefa menos árdua. A partir de plataformas de progra-
mação visual se pode realizar o gerenciamento dos dados facilitando o trabalho do engenheiro
nas diversas áreas de atuação como a manutenção, fabricação, projeto e gestão. Nesse sentido a
ferramenta citada foi utilizada para realizar uma revisão exploratória da literatura, sobre as apli-
cações de machine learning para Engenharia Mecânica. Os dados utilizados foram obtidos das
plataformas Capes e scopus e com o auxílio de um workflow do Orange Datamining no módulo
de text mining.

Keywords: machine learning, engenharia mecânica, data science, industria 4.0.

1 Introdução

Em meados do século XX, é apresentada ao mundo a programação: uma forma de se


comunicar com a máquina a partir de um código gerado pelo desenvolvedor. Assim,
diversos estudos surgiram com o intuito de deixar a máquina cada vez mais inteligente,
ao ponto de conseguir adquirir conhecimento a partir de uma quantidade de dados for-
necidas para ela.
Dessa forma, surge o conceito de machine learning (aprendizado da máquina), que
reconhece padrões gerados a partir de uma fonte de dados. O programa desenvolvido é
capaz de gerenciar informações - tanto numéricas quanto textuais - para diversas apli-
cações dentro da engenharia mecânica [1,3].
No geral, existem três formas de aplicação do machine learning:
1. Supervisionado: para cada banco de dados fornecidos ao algoritmo é necessário
que se tenha uma resposta ou uma classificação;
2. Não supervisionado: para cada banco de dados fornecido o algoritmo tende a bus-
car formas de agrupar os dados em formas de clusters, após esses agrupamentos é
necessário análise para determinação do contexto em que esse valor está inserido;
3. Reforço: o algoritmo realiza uma espécie de análise hipotética baseada nos bancos
de dados fornecidos retornando se a hipótese utilizada foi boa ou ruim.
2

Para que se possa utilizar o machine learning para a solução de problemas, são ne-
cessárias algumas condições, como uma base de dados grande o suficiente para o pro-
blema, e filtrar a base de dados, para melhorar sua qualidade, e ao final deve-se ter a
certeza de que o algoritmo está conseguindo resolver o problema e qual é a precisão
com a qual o problema está sendo resolvido [1,3].
Buscou-se, através de uma Revisão Exploratória da Literatura, no formato de uma
Revisão Descritiva, juntamente com um workflow desenvolvido no software Orange
Datamining, aplicações de machine learning no contexto da engenharia mecânica para
relatar o estado da literatura e que se possa propor possíveis trabalhos futuros.

2 Metodologia

Para tal estudo, foi utilizado o software Orange Datamining para a solução dos proble-
mas de machine learning, onde, com a utilização da programação visual, se pode reali-
zar as análises de banco de dados, tanto em formato texto como em formato numérico.
A base de dados foi extraída da plataforma scopus no qual 280 artigos foram obti-
dos. Dentre os arquivos disponíveis na plataforma foram obtidas as aplicações na en-
genharia mecânica: Industria 4.0, deep learning e gestão e empreendedorismo.

2.1 Modelo Latent Dirichlet Allocation (LDA)


Dentro da modelagem de tópico, existe um método que é comumente utilizado cha-
mado Latent Dirichlet Allocation (LDA), este método é um modelo probabilístico ge-
nerativo de um corpus, ele faz com que conjuntos de observações sejam explicados por
variáveis latentes que explicam a semelhança entre os dados [1,3].
Para a execução de tal método é necessário seguir alguns passos, inicialmente é rea-
lizado um pré processamento de texto que busca filtrar o texto dos artigos, é nele em
que é realizado o carregamento dos artigos, a conversão de palavras maiúsculas em
minúsculas e a remoção de URL’s e de stop words [1,3].
Para a realização do segundo passo, modelagem de tópicos, é necessário encontrar a
peça chave desse processo que é o número de perplexidade, é através deste numero em
que o numero ideal de tópicos é calculado. Segue a seguir a equação para encontrar a
perplexidade [2]:

Fig. 1. Equação para cálculo da perplexidade.

O interessante deste modelo é que o número de tópicos pode variar conforme o ob-
jetivo desejado da análise. Caso o objetivo seja ter uma visão mais geral dos artigos um
número de tópicos mais baixo se mostra mais interessante e caso se deseje ter uma visão
mais detalhada um número de tópicos maior se mostra mais interessante [2].
3

O pós processamento de texto, implica na realização da identificação e da rotulação


dos tópicos relevantes. A análise de tal processo é de responsabilidade do pesquisador,
sendo que a rotulagem trata de ser subjetiva podendo ser fornecida diferentes rotulagens
tudo vai depender do objetivo da pesquisa [1].

2.2 Aplicação do Latent Dirichlet Allocation no Orange Datamining


O Orange Datamining é uma ferramenta de programação visual, interativa para análise
qualitativa rápida. Através de workflows se pode realizar análise de dados visualmente.
Dentro dessa ferramenta existe a possibilidade da criação de um workflow do método
LDA, como representado no esquema a seguir [4]:

Fig. 2. Workflow do método LDA no Orange Datamining.

Para esse modelo de workflow, os principais widget são o “Preprocess Text” e o


“Topic modeling”. O pré processamento de texto vai realizar os filtros de transformação
de palavras, remoção de URL’s, remoção da stop words e de números indesejados e
ainda pode filtrar os N-Grams. A seguir o esquema de pré processamento de texto uti-
lizado pelo Orange Datamining [5]:

Fig. 3. Widget Preprocess Text no Orange Datamining.


4

O outro widget realiza a modelagem de tópicos em um corpus com base nas pala-
vras encontradas nos documentos. Esse widget pode realizar modelagem do tipo Latent
Semantic Indexing (LSI), Latent Dirichlet Allocation (LDA) e Hierarchical Dirichelet
Process (HDP). Como o caso do artigo é apenas o LDA, apenas ele foi utilizado, além
disso esse widget já calcula o log da perplexidade [6].

Fig. 4. Widget Topic Modeling no Orange Datamining.

Dentro das métricas da problemática que é alvo de estudo, foram adequados os itens
considerados stop words em um arquivo de texto, aumentando expressivamente o nú-
mero de palavras chaves na word cloud e definido o número de tópicos com base no
log da perplexidade, os resultados demonstram que os principais tópicos estão atrelados
a Indústria 4.0, ao deep learning e a gestão e empreendedorismo.

3 Resultados e Discussão

3.1 Indústria 4.0


A indústria 4.0 foi implementada com o objetivo de automatizar os processos e realizar
a integração de diferentes tecnologias, como a inteligência artificial, ou, mais especifi-
camente, aplicar os conceitos de machine learning. Assim, amplia-se a indústria para a
digitalização das atividades e melhora a eficiência dos processos de produção [10].
A evolução dos sistemas de maquinários é diretamente ligada a inserção de sensores,
atuadores e da internet em sua composição, que possibilitam que a máquina possa “con-
versar” ao longo do processo de produção. Dessa forma, o computador adquire a ca-
pacidade de filtrar os dados pra geração de informações mais precisas nas diversas eta-
pas da cadeia de valor de desenvolvimento de produtos, projetos, produção e pós venda
[7].
Foram identificadas quatro tecnologias chaves da indústria 4.0: a manufatura aditiva,
inteligência artificial, internet das coisas e big data. Como consequência dessa evolução
da indústria, diversos estudos começaram a ser realizados para expandir as diversas
possibilidades de implementação e aplicações do processo [8].
5

Inicialmente, a forma de implementação do modelo é a parte mais importante do


processo. Deve-se identificar a viabilidade de implementação do processo. Até mesmo
em Países como a Polônia e Alemanha a viabilidade pode ser contestada, o que torna
necessário avaliar as possibilidades tecnológicas, considerando o quesito de produção
a partir de robôs [9].
A busca de maturidade digital é um indicador de que a viabilidade de implementação
do sistema é adequada para o País, o que pode não ser o caso para um País emergente
que ainda está no processo de estabelecimento da indústria. Porém, o mesmo não deixa
de ser importante, por conta da necessidade de avaliações para entender as particulari-
dades em nível global do estabelecimento da indústria 4.0 [9].
Ao considerar o caso onde a implementação do sistema é viável, as vantagens do
processo são proporcionais às instalações dos dispositivos no maquinári,o para que
exista comunicação da máquina com o usuário. Essa comunicação é o indicador mais
importante, pois é a partir dela que a base da aplicação de machine learning é formulada
[9].
Os sensores que estão no maquinário disparam para o computador uma quantidade
de dados, que ficam armazenados em bancos de dados, que serão usados para deixar a
máquina cada vez mais inteligente. O programa identifica os valores que podem ser
usadas para a redução de danos a longo prazo, bem como valores que possam melhorar
a eficiência do processo e melhorar os planos de segurança [10].
Essa análise de dados é conhecida como manutenção preditiva. Com o nível certo
de maturidade do algoritmo desenvolvid,o a máquina pode se tornar inteligente ao
ponto de gerar dados para mapear e auxiliar pesquisas na área da manutenção inteli-
gente [10].
Entretanto, as aplicações de machine learning não se limitam à manutenção preditiva:
outro grande ramo que ganha destaque na indústria 4.0 é a tecnologia de manufatura
aditiva, em que, a partir de um modelo 3D, pode ser realizada a produção de peças,
transformando o desenho à medida que a matéria prima é adicionada, camada por ca-
mada [11].

3.2 Deep learning


O conceito de deep learning está diretamente ligado ao machine learning, sendo seu
derivado. Ambos são aprendizados da máquina, mas a grande diferença é que o deep
learning tende a criar modelos hierárquicos complexos, imitando a forma como os seres
humanos conseguem aprender novas informações [13].
Modelos complexos de algoritmos, conhecidos como “redes neurais”, ligam-se a
partir do reconhecimento de padrões. Apesar de sua definição em relação ao machine
learning não ser tão diferente, sua grande vantagem é a eficiência e velocidade com a
qual o programa é capaz de reconhecer tais padrões [13].
O seu funcionamento aproxima-se do formato de machine learning de reforço, ele
tende a melhorar o conjunto de dados, sem a base de regras pré-estabelecidas. Isso faz
com que o sistema analise os dados sem regras ou recursos específicos pré-programa-
dos nele. Logo após isso, o sistema compara o conjunto de dados obtidos, e, em seguida,
é feita uma medição da precisão da previsão dos dados [13].
6

Como consequência da complexidade de dados multidimensionais, os padrões de


eficiência e de qualidades são muito maiores, possibilitando que problemas cada vez
mais complexos sejam resolvidos [14].
Como citado anteriormente, para poder prever futuros problemas que venham a
ocorrer, a manutenção preventiva pode sofrer com atualizações de deep learning. Isso
vai depender do quão complexo o sistema de redes neurais foi desenvolvido para o
sistema implementado [14].
Na manufatura aditiva, pode-se obter um serviço de maior qualidade e eficiência e
custos mais baixos, com a redução do tempo e das despesas com o gasto de material
desnecessário para os desenvolvimentos dos protótipos. Isso só é possível pois o desen-
volvimento complexo da rede neural é capaz de ler dados multidimensionais, melho-
rando a precisão analítica dos dados antes já gravados na base de dados [13, 14].
Outro exemplo da aplicação de deep learning na engenharia, que está sendo estudado
atualmente, é o ramo da microscopia eletrônica, com a aplicação e desenvolvimento do
hardware e software dos componentes das redes neurais, gerando uma otimização do
processo [12].

3.3 Gestão e Empreendedorismo


Os dados gerados por máquinas não compreendem apenas aplicações para a indústria
ou para deixar computadores cada vez mais inteligentes. Estes ainda são utilizados
como ferramentas para gestão e empreendedorismo, através de números de variáveis
econômicas denominadas preço, oferta e demanda [16].
Compreendendo essas variáveis da microeconômica de mercado, pode-se gerir in-
formações de produto, como é o caso da devolução. Outrossim, aumentar a transparên-
cia de dados pode fornecer uma função, que pode gerar um preço de produto mais oti-
mizado em relação a sua qualidade, diminuindo esses problemas de devolução [15].
Outro fator de otimização de gestão é a variável da lucratividade, como é no caso da
indústria manufatureira. Existe a possibilidade da utilização de dados para que se possa
gerenciar, com maior precisão, onde serão realocados os esforços para determinadas
industrias [17].

4 Conclusão

No mundo atual da Engenharia Mecânica, existem diversas aplicações para o machine


learning, seja na indústria 4.0 com a manufatura aditiva, inteligência artificial, internet
das coisas e big data, ou no deep learning com o avanço das tecnologias suas redes
neurais transformando sistemas os deixando cada vez mais inteligentes e modelos de
gestão podem ser otimizados a partir de uma transparência maior dos dados. Porém a
quantidade de artigos publicados em relação as aplicações são muito pequenas, mesmo
com um grande potencial de crescimento, se fazendo necessário assim um maior vo-
lume de estudos em todas as áreas de conhecimento abordadas nesse artigo.
7

5 Referências
[1] Asmussen, C. B., & Møller, C. (2019). Smart literature review: a practical topic
modelling approach to exploratory literature review. Journal of Big Data, 6(1).
https://doi.org/10.1186/s40537-019-0255-7
[2] Campbell, J. C., Hindle, A., & Stroulia, E. (2015). Latent Dirichlet Allocation:
Extracting Topics from Software Engineering Data. The Art and Science of
Analyzing Software Data, 3, 139–159. https://doi.org/10.1016/B978-0-12-
411519-4.00006-9
[3] Xiao, Y., & Watson, M. (2019). Guidance on Conducting a Systematic Literature
Review. Journal of Planning Education and Research, 39(1), 93–112.
https://doi.org/10.1177/0739456X17723971
[4] Página inicial Orange Data Mining, https://orangedatamining.com/, acessou pela
última vez em 2022/06/18
[5] Página do Orange Data Mining – Widget Preprocess Text, https://orangedatami-
ning.com/widget-catalog/text-mining/preprocesstext/, acessou pela última vez
em 2022/06/18
[6] Página do Orange Data Mining – Widget Topic Modeling, https://orangedatami-
ning.com/widget-catalog/text-mining/topicmodelling-widget/, acessou pela úl-
tima vez em 2022/06/18
[7] Bigliardi, B. (2021). Industry 4.0 applied to food. Sustainable food processing and
engineering challenges (pp. 1-23) doi:10.1016/B978-0-12-822714-5.00001-2
[8] Ertz, M., Sun, S., Boily, E., Kubiat, P., & Quenum, G. G. Y. (2022). How transi-
tioning to industry 4.0 promotes circular product lifetimes. Industrial Marketing
Management, 101, 125-140. doi:10.1016/j.indmarman.2021.11.014
[9] Jałowiec, T., & Wojtaszek, H. (2022). Analysis of directional activities for industry
4.0 in the example of poland and germany. Sustainability (Switzerland), 14(7)
doi:10.3390/su14073848
[10] Nacchia, M., Fruggiero, F., Lambiase, A., & Bruton, K. (2021). A systematic map-
ping of the advancing use of machine learning techniques for predictive mainte-
nance in the manufacturing sector. Applied Sciences (Switzerland), 11(6)
doi:10.3390/app11062546
[11] Carou, D. (2021). Aerospace Transformation through Industry 4.0 Technologies.
In: Aerospace and Digitalization. SpringerBriefs in Applied Sciences and Tech-
nology(). Springer, Cham. https://doi.org/10.1007/978-3-030-67849-4_3
[12] Ede, J. M. (2021). Deep learning in electron microscopy. Machine Learning:
Science and Technology, 2(1), 2632. https://doi.org/10.1088/2632-2153/abd614
[13] Schmidhuber, J. (2015). Deep Learning in neural networks: An overview. Neural
Networks, 61, 85–117. https://doi.org/10.1016/j.neunet.2014.09.003
[14] Zhou, Y., Dong, F., Liu, Y., & Ran, L. (2021). A deep learning framework to early
identify emerging technologies in large-scale outlier patents: an empirical study
of CNC machine tool. Scientometrics, 126(2), 969–994.
https://doi.org/10.1007/s11192-020-03797-8
[15] Ambilkar, P., Dohale, V., Gunasekaran, A., & Bilolikar, V. (2022). Product returns
management: A comprehensive review and future research agenda. International
8

Journal of Production Research, 60(12), 3920-3944.


doi:10.1080/00207543.2021.1933645
[16] Gaur, L., Solanki, A., Jain, V., & Khazanchi, D. (2020). Handbook of research on
engineering innovations and technology management in organizations. Handbook
of research on engineering innovations and technology management in organiza-
tions (pp. 1-459) doi:10.4018/9781799827726
[17] Omar, Y. M., Minoufekr, M., & Plapper, P. (2019). Business analytics in
manufacturing: Current trends, challenges and pathway to market lead-
ership. Operations Research Perspec-
tives, 6 doi:10.1016/j.orp.2019.100127

Você também pode gostar