Você está na página 1de 10

Joana Lara Fernandes Feller

Lucas Lopes Serafim


Marcos Raphael Batista Gonçalves

Trabalho de Estatística

Disciplina: Introdução a Estatística

Professor: Dra. Andrea Cristina Konrath

19 de março de 2024
1 INTRODUÇÃO

A estatística é um braço da matemática focado em desenvolver técnicas para a


coleta de dados e respectiva organização destes, promovendo uma interpretação, análise e
representação dos resultados obtidos. De acordo com os autores Larson, Farber e Cyro
(2004) a ciência estatística é dividida em dois grandes ramos, a Estatística descritiva e a
Estatística inferencial. Os tipos de dados estudados podem ser qualitativos por tratarem
de atributos, rótulos ou entradas não numéricas, e quantitativos que consistem em medidas
numéricas ou contagens. Os níveis de mensuração podem ser de quatro categorias: nominal,
ordinal, intervalar e de razão.
A história da estatística remonta à antiguidade, com censos feitos na Babilônia, no
antigo Egito, o Faraó exigia a contagem das safras de cereais para controle de impostos.
Na América, as civilizações pré-colombianas Maias, Astecas e Incas utilizavam a estatística
no desenvolvimento de censos dos recursos locais e da população (ESTATMG, 2022). A
palavra STAATENKUNDE foi utilizada pelo pesquisador alemão Gottfried Achenwall
para representar esse ramo da matemática, por sua vez, a palavra STATISTICS surgiu
pela primeira vez na enciclopédia Britânica em 1797 (IME, 2021).
Atualmente, com a velocidade do escoamento de informações, a estatística passou a
ser uma ferramenta fundamental na produção e propagação de conhecimento. A estatística
está presente em nosso dia a dia de diversas maneiras seja através de dados de acidentes,
resultados de sorteios de loterias, contagens populacionais, entre inúmeras outras.
O presente trabalho se destina a um breve estudo e aplicação de conceitos de
estatística descritiva a um conjunto de dados escolhido a fim de fixação de conceitos
estudados em sala de aula e ampliação de conhecimentos sobre áreas diversas. Ademais,
tal estudo apresenta a versatilidade do uso da estatística e as vantagens do seu uso na
indústria, não somente na fase final dos processos produtivos, mas também na identificação
prévia de futuras falhas que poderiam prejudicar a produção, relacionando a importância
do uso da IA na indústria.

1.1 JUSTIFICATIVA
A estatística contribui de forma expressiva no processo de tomada de decisões, visto
que grande parte do que é realizado se baseia em métodos quantitativos e qualitativos. A
partir da análise estatística é possível extrair informações, identificar padrões e tendências,
e tomar decisões embasadas em dados precisos. (IGNÁCIO, 2010)
A história da análise estatística na indústria remonta do século XX, quando
as indústrias passaram a se preocupar com a qualidade de seus produtos. Em 1924,
Walter A. Shewhart desenvolveu o controle estatístico de processos (CEP), uma forma
de monitoramento e controle da qualidade dos produtos em tempo real, utilizando dados
estatísticos. Nas décadas seguintes, a análise de dados passou também a ser utilizada nos
processos produtivos, permitindo a identificação de gargalos e a realização de melhorias,
evitando perdas na produtividade. (MARTINS et al., 2011)
Nesse sentido, o presente trabalho visa analisar um conjunto de dados de falhas em
máquinas utilizando técnicas estatísticas. O estudo relacionado às falhas em máquinas
é de suma importância na garantia da eficiência e segurança nos processos produtivos,
permitindo a identificação precoce de erros que poderiam levar ao atraso na produção,
perda de insumos, e o comprometimento da segurança. (RUTA et al., 2017)
O dataset escolhido foi o Mafaulda que é uma base de mineração de dados em
fluxo de sensores que mescla uma caracterização baseada na distribuição de dados com
raciocínio padrão, incluindo a causa raiz do problema, a duração do tempo de reparo, e
outras informações relevantes. Com a análise desses dados, é possível desenvolver modelos
preditivos para prever futuras falhas (LOBAO; PINTO, 2020).
Além disso, a pesquisa é justificada por demonstrar a importância da Inteligência
Artificial nos processos industriais. Além de auxiliar na análise de dados e detecção prévia
de problemas, a IA tem se consolidado na indústria pela automatização de processos,
realizando tarefas repetitivas e de risco sem intervenção humana constante. Dessa forma
é possível otimizar tempo, recursos e garantir a padronização, segurança e eficiência em
todos os processos.
Ademais, a IA pode também auxiliar no monitoramento do trabalho, alertando
sobre possíveis perigos e falhas de segurança. Também pode ajudar no treinamento de
funcionários e envio de feedbacks, verificando áreas que necessitam de correção. (SCHWAB,
2019)
À medida que a tecnologia continua a avançar, a Inteligência Artificial assume um
papel cada vez mais importante nas indústrias e nos processos produtivos em geral. Seu
uso, adicionado com a análise estatística, promove a melhoria contínua nos processos e a
maximização da eficácia, desempenho e proteção.
2 MATERIAIS E MÉTODOS

2.1 DATASET MAFAULDA


O conjunto de dados de falhas em máquinas Machinery Fault Dataset (Mafaulda)
(COPPE-UFRJ, 2016), é disponibilizado gratuitamente pelo Laboratório de Sinais, Multi-
mídia e Telecomunicações - COPPE/UFRJ da Universidade Federal do Rio de Janeiro
figura 1. O Dataset é formado por 1951 arquivos em formato CSV e são agrupados por
estado de operação, tipo de falha e diâmetro de mancal. Os sinais de vibração foram
captados através da bancada experimental para teste de falhas em máquinas mecânicas,
MAFAULDA figura 1, que dá nome ao Dataset. A bancada é formada pelo conjunto de
equipamentos listados abaixo com as respectivas especificações:

• Motor de 0,25CV, de 700 a 3600 RPM

• 3 Acelerômetros Radiais

• 3 Acelerômetros Tri-Axiais

• 1 Tacômetro

• 1 Microfone

Figura 1 – Sistema de Captação de dados

Fonte: Adaptado de Marins et al. (2017)

A captação foi feita por um período de 5 segundos, a uma taxa de 50 khz, gerando
250 mil leituras por arquivo, para cada estado de operação. O dataset Mafaulda completo
é composto por 10 diferentes estados de operação, função do escopo do presente trabalho
foram utilizados apenas 4 condições de operação e um único arquivo de leitura para cada
estado, conforme a tabela 1 abaixo: As falhas por desalinhamentos horizontal e vertical
foram simuladas com a instalação de calços nos suportes dos mancais, por sua vez, a
falha por desbalanceamento foi produzida utilizando massas de 6 a 35 gramas no eixo. A
figura 2 apresenta de maneira esquemática os tipos de falhas simulados no experimento e
analisados nesse trabalho. Os modos de operação representam as variáveis qualitativas
nominais da analise enquanto que as medições dos oito sensores representam as variáveis
quantitativas continuas do problema.

Tabela 1 – Classificação das variáveis


Variáveis Variáveis
Qualitativas Nominais: Quantitativas Continuas:
Estado de Operação Leituras
Normal 250 mil
Desalinhamento Horizontal 250 mil
Desalinhamento Vertical 250 mil
Desbalanceado 250 mil
Fonte: Próprios Autores

Figura 2 – Representação esquemática dos 4 estados de operação do sistema, ilustrando


as variáveis qualitativas do sistema
(a) Normal (b) Desalinhamento Horizontal

(c) Desalinhamento Vertical (d) Desbalanceamento

Fonte: Adaptado de Metz (2021)


3 RESULTADOS E DISCUSSÕES
A tabela 2 apresenta os valores de estatística descritiva dos valores dos oito sensores
e quatro estados de operação. Os cálculos e os gráficos foram feitos e gerados com a
linguagem de programação Python utilizando as bibliotecas Pandas, Numpy, Matplotlib e
outras correlatas.

Tabela 2 – Valores de Média e Desvio Padrão dos dataset para 4 situações


(a) Normal (b) Desbalanceamento
Desvio Desvio
Média Média
Padrão Padrão
Sensor 1 -3.448e-5 1.786 1.639325e-04 1.826952
Sensor 2 2.064e-3 0.627 -2.839215e-04 0.794142
Sensor 3 -3.488e-4 0.506 -9.967530e-04 1.281610
Sensor 4 6.117e-4 0.295 5.355892e-04 0.455411
Sensor 5 8.205e-3 0.164 4.908849e-03 0.074646
Sensor 6 2.905e-3 0.036 2.253699e-03 0.028691
Sensor 7 1.157e-1 0.594 9.594101e-03 1.052085
Sensor 8 1.123e-2 0.216 1.062453e-02 0.208678

(c) Horizontal (d) Vertical


Desvio Desvio
Média Média
Padrão Padrão
Sensor 1 2.58e-4 1.802 -3.421e-04 1.801420
Sensor 2 1.178e-2 0.5155 8.541e-03 0.798746
Sensor 3 4.403e-4 0.4743 -9.921e-05 0.553565
Sensor 4 7.13e-4 0.49361 3.728e-04 0.655266
Sensor 5 1.08e-2 1.02201 8.035e-03 0.335798
Sensor 6 2.734e-3 4.063e-02 2.759e-03 0.058214
Sensor 7 -6.643e-3 0.4110 3.795e-02 0.544201
Sensor 8 1.330e-2 0.2143 1.232e-02 0.207810

Fonte: Próprios Autores

A figura 3 trás em formato de gráfico de pontos os valores das médias dos oito
sensores para os quatro estados de operação. É possível notar que o Sensor 7, Tacômetro,
foi o que apresentou a maior variação de valores de media, em uma breve inferência,
é possível interpretara que os desalinhamentos desaceleraram e afetaram a velocidade
de rotação do motor. Ao analisar os sensores 1, 3, 4, 6 e 8, respectivamente, os dois
acelerômetros radiais, dois acelerômetros triaxiais, e o microfone, apresentaram baixas
variações em razão dos desalinhamentos. Os sensores 2, acelerômetro radial, e sensor 5
acelerômetro tri-axial, apresentaram variações significativas que merecem mais analises,
excede o objetivo desse trabalho se aprofundar nesse ponto.
Figura 3 – Média dos oito sensores para os quatro Estados de Operação

Fonte: Próprios Autores

Figura 4 – Gráficos de boxplot dos Sensores de 1 a 4 para os quatro estados de operação


(a) 1º Sensor: Acelerômetro Radial (b) 2º Sensor: Acelerômetro Radial

(c) 3º Sensor: Acelerômetro Radial (d) 4º Sensor: Acelerômetro Tri-Axial

Fonte: Próprios Autores


Os gráficos boxplot foram gerados para cada sensor isolado comparando os quatro
estados de operação, dessa forma, torna-se simples realizar uma analise a respeito do
comportamento dos sensores. Na figura 4(a) é possível observar que não houve diferenças
significativas nas leituras obtidas pelo sensor, para os quatro estados de operação os valores
obtidos foram similares. Em figura 4(b), os valores para media e quartis são parecidos,
porém os valores de outliers são bem diferentes o estado de operação de desalinhamento
vertical. Em figura 4(c), o estado de operação de desbalanceamento apresentou valores
dissonantes. Em figura 4(d), o estado vertical, novamente, foi o mais variante.

Figura 5 – Gráficos de BoxPlot Sensores de 5 a 8


(a) 5º Sensor: Acelerômetro Tri-Axial (b) 6º Sensor: Acelerômetro Tri-Axial

(c) 7º Sensor: Tacômetro (d) 8º Sensor: Microfone

Fonte: Próprios Autores

A figura 5 apresenta os gráficos de boxplot para os outros 4 sensores. Em figura 5(a)


é possível ver que o desalinhamento horizontal foi o que apresentou as maiores variações,
enquanto que para a figura 5(b) os valores variaram pouco para cada estado de operação,
porém as variações para os valores de outliers para o desalinhamento vertical foram mais
expressivos. Por sua vez, os valores medidos para o tacômetro, figura 5(c) foram fortemente
variantes para o estado de desbalanceamento. Por fim, a figura 5(d) para o microfone, não
é possível inferir variações.
4 CONCLUSÕES

A escolha de um dataset de falhas de máquina favoreceu uma expansão de conheci-


mentos para áreas distantes do dia a dia de um acadêmico de Ciências Econômicas, o que
favoreceu, dessa forma, uma integração e interdisciplinariedade ao trabalho.
Este trabalho se mostrou bastante interessante em todos os aspectos, principalmente
por favorecer uma visão polivalente das aplicações das ferramentas estatísticas. A utilização
de uma base de dados de falhas de máquina, algo bem distante do dia a dia de um acadêmico
de Ciências Econômicas, favoreceu a integração e interdisciplinariedade do trabalho, bem
como ajudou a sedimentar e expandir os conhecimentos estudados.
A cerca dos resultados obtidos, foi possível inferir que os valores do primeiro sensor
não são suficientes para tomar decisões, assim como os dados obtidos pelo microfone. Os
valores obtidos para os sensores 3, 5 e para o tacômetro foram os que mostraram mais
variações para os estados de operação, sendo recomendados para analises mais rápidas.
Para os outros sensores, mais analises e estudos são necessários.
Como sugestão para trabalhos futuros, é sugeridos utilizar mais arquivos de leituras
e mais estados de operação, sendo que esse trabalho utilizou apena um arquivo para cada
estado de operação e somente 4 estados de operação. Outras sugestões seriam de estudos
sobre as implementações de algorítimos de inteligência artificial que se valem desse dataset.
Algorítimos como KNN, Redes neurais Profundas, VAE-GAN, entre outros.
REFERÊNCIAS

COPPE-UFRJ. Machinery Fault Simulator. 2016. Disponível em: <https:


//www02.smt.ufrj.br/~offshore/mfs/index.html#TOC1>. Acesso em: 20 de março de
2019. Citado na página iv.

ESTATMG. A História Da Estatística: Desde A Sua Origem Até Os


Dias Atuais. 2022. Disponível em: <https://estatmg.com.br/2022/11/08/
a-historia-da-estatistica-desde-a-sua-origem-ate-os-dias-atuais/>. Acesso em:
11 de abril de 2023. Citado na página ii.

IGNÁCIO, S. A. Importância da estatística para o processo de conhecimento e tomada de


decisão. Revista Paranaense de Desenvolvimento-RPD, n. 118, p. 175–192, 2010. Citado
na página ii.

IME. História da Estatística. 2021. Disponível em: <https://edisciplinas.usp.br/pluginfile.


php/4586607/mod_resource/content/1/Historia_da_Estatistica.pdf>. Acesso em: 11 de
abril de 2023. Citado na página ii.

LARSON, R.; FARBER, B.; CYRO. Estatística aplicada. [S.l.]: Prentice Hall, 2004.
Citado na página ii.

LOBAO, D. A.; PINTO, L. A. Diagnóstico inteligente de falhas em equipamentos


dinâmicos através da transformada wavelet e dados estatístic. In: Congresso Brasileiro de
Automática-CBA. [S.l.: s.n.], 2020. v. 2, n. 1. Citado na página iii.

MARINS, M. et al. Improved similarity-based modeling for the classification of


rotating-machine failures. Journal of the Franklin Institute, v. 355, 07 2017. Citado na
página iv.

MARTINS, S. L. M. et al. Monitoramento do controle estatístico do processo utilizando


ferramentas estatísticas. Universidade Federal de Santa Maria, 2011. Citado na página iii.

METZ, D. The ABCs of Machinery Alignment. 2021. Disponível em: <https:


//www.pumpsandsystems.com/abcs-machinery-alignment>. Acesso em: 11 de abril de
2023. Citado na página v.

RUTA, M. et al. A coap-based framework for collaborative sensing in the semantic web
of things. Procedia Computer Science, Elsevier, v. 109, p. 1047–1052, 2017. Citado na
página iii.

SCHWAB, K. A quarta revolução industrial. [S.l.]: Edipro, 2019. Citado na página iii.

Você também pode gostar