Você está na página 1de 42

2022

Parâmetros, estimativas e ajustes


paramétricos e não paramétricos –
Módulo 2 – Livro 2
Carlos Henrique Mariano
Universidade Tecnológica Federal
do Paraná
28/9/2022
[Digite aqui]
1

Parâmetros, estimativas de parâmetros e ajustes paramétricos


e não paramétricos
1. Introdução – população, amostra e estimativa
Iniciamos com o seguinte problema: necessitamos
informações específicas sobre uma população, mas a
quantidade de indivíduos é muito grande e não dispomos das
condições e nem dos recursos necessários para avaliarmos
cada um deles individualmente. Como faremos?
Digamos que necessitamos avaliar a altura de todos os
homens no sul do Brasil, estamos falando de aproximadamente
14,1 milhões de pessoas. Ou seja, é uma tarefa impraticável,
então a solução do problema seria extrairmos uma ou várias
amostras aleatórias da população. A partir desta(s) amostra(s)
poderíamos calcular a média amostral e a partir desta média
poderíamos obter a característica de interesse da população
ou em outras palavras, a verdadeira média da população ou
a média populacional, que é desconhecida.
Assim, poderemos definir que a característica de interesse
da população é chamada de parâmetro e a característica da
amostra correspondente é chamada de estatística da
amostra ou parâmetro de estimativa.
Como a estatística é um resumo das informações sobre
um parâmetro obtido a partir da amostra, o valor de uma
estatística depende de uma amostra particular que foi
extraída da população. Como o valor de uma estatística varia
de uma amostra aleatória para outra, por conseguinte, uma
estatística é uma quantidade aleatória.
Logo, a distribuição de probabilidade da estatística é
chamada distribuição amostral. A distribuição amostral de
uma estatística é importante porque nos permite tirar

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
2

conclusões sobre o parâmetro de uma população


correspondente com base em uma amostra aleatória.
Então, os parâmetros são, medidas descritivas de toda a
população que podem ser usadas como entradas para uma
função de distribuição de probabilidade (fdp ou pdf do inglês
probability density function) para gerar curvas de distribuição.
Os parâmetros são normalmente representados por letras
gregas para distingui-los de estatísticas amostrais. Por exemplo,
a média populacional é representada pela letra grega mu (µ)
e o desvio padrão da população pela letra grega sigma (σ).
Os parâmetros são constantes fixas, isto é, eles não variam
como as variáveis, contudo, seus valores são normalmente
desconhecidos, porque é inviável medir uma população
inteira.
Um dos objetivos das análises estatísticas é a obtenção
das estimativas dos parâmetros da população, juntamente
com a quantidade de erro associada a essas estimativas. Estas
estimativas também são conhecidas como estatística de
amostra.
As estimativas pontuais são um valor único e mais
provável de um parâmetro. Por exemplo, a estimativa pontual
da média da população (o parâmetro) e a média da amostra
(a estimativa do parâmetro). Já uma estimativa intervalar,
representada por um intervalo de confiança, é uma faixa de
valores que provavelmente conterão o parâmetro da
população.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
3

2. Análise de dados de vida e as estimativas baseadas em


modelos paramétricos e não paramétricos
2.1 - Introdução
No contexto da análise de dados de vida o que foi
anteriormente chamado de indivíduo denominaremos agora
de tempos de falhas. E, o ideal, seria então se conhecêssemos
todos os tempos das falhas relacionados a um determinado
modo de falha. Da mesma maneira como na população de
pessoas, em muitos casos não temos condições de avaliar
todos os tempos de falha pois, muitas vezes, considerando que
o ciclo de vida do sistema é muito grande não há possibilidade
de conhecermos, a priori, como será o acontecimento de
falhas futuras ou mesmo predizer se, poderão acontecer falhas
no próximo ciclo de operação.
Há outros fatores complicadores quando avaliamos
sistemas complexos pois são constituídos por uma diversidade
de sistemas de naturezas diferentes. Mecânicos, mecatrônicos,
eletropneumáticos, eletrônicos/digitais dentre outros, que
possuem modos de falhas distintos e que são atingidos pelo
envelhecimento de forma diferente.
Por esta razão dentre outras, que em life data analysis LDA
também trabalhamos com amostras dos tempos de falhas.
Como discutido anteriormente, podemos realizar a partir
das amostras dos tempos de falhas as estimativas do tempo
médio para falhar, das distribuições de confiabilidade e não
confiabilidade e da função taxa de falha do item ou sistema
em estudo.
2.2 Ajuste paramétrico
Então para realizarmos os cálculos estatísticos a partir de
uma amostra necessitamos ajustar os dados a um modelo

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
4

probabilístico específico. Um modelo probabilístico ou uma


distribuição de probabilidades é uma representação
matemática do comportamento de uma variável aleatória
que no nosso caso pode ser: a probabilidade de sucesso ou
falha dos modelos discretos ou os tempos de falhas dos
modelos contínuos ou distribuições contínuas de
probabilidade. No caso dos modelos contínuos a operação
para encontrarmos a distribuição teórica que melhor se ajusta
aos nossos dados de falha denominaremos de ajuste
paramétrico, em outras palavras, quando buscamos saber
qual distribuição de probabilidade teórica, que é descrita por
parâmetros específicos, que melhor se ajusta ao conjunto de
tempos de falhas em avaliação.
As distribuições teóricas de probabilidade podem ser
classificadas como discretas ou contínuas em função do tipo
de variável aleatória que representam. Quando estamos
avaliando a confiabilidade itens cuja resposta pode ser
sucesso ou falha ou quando estamos avaliando arranjos e/ou
combinações de possíveis modos de falha, que poderão levar
um sistema a falhar, estamos diante de eventos discretos de
falha ou seja quando os eventos podem se enumerados.
Agora quando dentro de um intervalo de tempo podem
ocorrer um número desconhecido de falhas então, estamos
tratando de eventos contínuos consequentemente as
distribuições contínuas se ajustam melhor a esta condição.
As distribuições contínuas de probabilidade são as mais
usuais na avaliação da confiabilidade de itens. Do ponto de
vista da engenharia e, segundo Knesevic , “todos os
parâmetros destas distribuições podem ser classificados em
três categorias:

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
5

1. Parâmetro de escala – Que define a localização da


distribuição na escala horizontal dos tempos;
2. Parâmetro de forma – Que controla a forma das curvas
da distribuição.
3. Parâmetro fonte – Que define a origem ou o mínimo valor
que variável aleatória pode ter.”
As distribuições de probabilidades teóricas mais usuais na
avaliação da confiabilidade de itens e sistemas são:
Exponencial, Normal, Lognormal e Weibull. Porém, podemos
utilizar distribuições com funções, matematicamente mais
complexas, como a Gumbel, a Gamma, Gamma
generalizada, Logística, Loglogística, Rayleigh e a Weibull
Bayesiana.
Os parâmetros de cada uma destas distribuições teóricas
de probabilidade são representados por valores numéricos
definidos. Mas há casos como da distribuição exponencial
de um parâmetro, onde os parâmetros de escala e de
forma são iguais. No quadro 1 vamos identificar os
parâmetros das distribuições exponencial, normal,
lognormal e Weibull segundo a classificação de Knesevic.
Quadro 1 – Parâmetros de algumas distribuições notáveis segundo a
classificação de Knesevic

Distribuição Parâmetro Parâmetro de Parâmetro


de escala forma fonte
Exponencial de 1 𝜆 𝜆
parâmetro
Exponencial de 2 𝜆 𝜆 𝛾
parâmetros
Normal µ(média) σ (desvio
padrão)
Lognormal µy σy
Weibull 2 𝜂 𝛽
parâmetros

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
6

Weibull 3 𝜂 𝛽 𝛾
parâmetros
Fonte: autoria própria

Do ponto de vista estatístico as medidas dos parâmetros


das distribuições podem ser classificadas em:
1. Medidas de posição (parâmetro de posição - a média)
– trata-se de um valor central ao redor do qual se
encontram distribuídos os valores da variável. A
medida de posição ou de localização central mais
significativa é a média. Porém, não podemos
desprezar a mediana e a moda das distribuições que
em determinadas ocasiões poderão ser preteridas à
média.
2. Medidas de dispersão (parâmetro de forma) – são
utilizadas para estudar a concentração dos valores de
um conjunto de dado em torno de uma medida de
localização central ou o grau de variação. As medidas
de dispersão mais notáveis são: o desvio padrão, que
está na mesma unidade dos dados, e a variância.
3. Medidas de assimetria – permitem medir o grau de
afastamento da simetria da distribuição.
4. Medidas de forma (curtose) - que caracterizam o
achatamento da curva da função de distribuição de
probabilidade ou em outras palavras é uma medida
de variabilidade usada para caracterizar a morfologia
de uma distribuição.
Vamos dedicar algumas linhas para a avaliação dos
parâmetros da distribuição Weibull, pois, devido a sua
plasticidade, ela pode assumir várias formas e, por isso,
tornou-se um dos modelos, mais aplicados na engenharia
da confiabilidade e certamente na análise de dados de
vida.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
7

A distribuição Weibull com três parâmetros (1) é definida


pela seguinte função de densidade de probabilidades:
𝑡−𝛾 𝛽
𝛽 𝑡−𝛾 𝛽−1 −( )
𝑓 (𝑡; 𝜂, 𝛽, 𝛾 ) = 𝜂 ( ) 𝑒 𝜂 (1)
𝜂

Onde
β - parâmetro de forma (ou de inclinação)
η – parâmetro de escala (também chamado de vida
característica)
γ – parâmetro de localização (também chamado de vida
mínima)
E com γ=0, as funções de sobrevivência ou de
confiabilidade (2) e da função de densidade de
probabilidade acumulada de falhas ou simplesmente
função de probabilidade de falha (3) seriam:
𝑡 𝛽
(𝜂)
𝑅 (𝑡 ) = 𝑒 (2)
𝑡 𝛽
(𝜂)
𝐹 (𝑡 ) = 1 − 𝑒 (3)
E a função taxa falha de risco ou simplesmente taxa de
falhas (4), para 𝛾 ≠ 0 será:

𝛽 𝑡−𝛾 𝛽−1
ℎ(𝑡 ) = 𝜂 ( 𝜂
) (4)

Assim o parâmetro de forma β indica se a taxa de falha está


crescente, constante ou decrescente. Se β<1, é um indicativo
de que o produto está com a taxa de falha decrescente. Este
cenário é típico da chamada “mortalidade infantil”, indicando
que o produto falha logo no seu período de “nascimento”.
Se β=1, é um indicativo de taxa de falha constante. São

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
8

componentes que após sobreviverem ao “nascimento”


possuem uma taxa de falha constante ao longo do ciclo de
vida útil. Se β>1, temos então a situação de uma taxa de falha
crescente. Este cenário é típico de produtos que falham por
desgaste ou envelhecimento.
A característica de vida, ou parâmetro 𝜂 é uma medida de
escala ou propagação com relação à distribuição dos dados.
Ele representa o número na escala do eixo X em que 63,2% dos
itens falharam. Abordaremos mais características das
distribuições no Livro 3 do módulo 2.

2.2.1 Técnicas para realizar o ajuste paramétrico

Para realizarmos o ajuste dos dados a uma distribuição de


probabilidade teórica conhecida, dispomos de três técnicas
ou métodos mais usuais:
1. Método gráfico - traçado em papel probabilístico –
2. Método dos mínimos quadrados - Regressão linear
3. Método da máxima verossimilhança –
O método gráfico também conhecido como de
plotagem de probabilidades consiste em lançarmos os tempos
e as probabilidades de falhas associadas a eles em papéis
especialmente desenvolvidos para cada uma das principais
distribuições teóricas de probabilidade como: a exponencial
de um parâmetro, a Weibull 2 parâmetros, a normal e a
lognormal dentre outras. Na figura 1 apresentamos o papel
probabilístico para a função Weibull de 2 parâmetros.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
9

Figura 1 – Papel probabilístico para a função Weibull de 2 parâmetros

Fonte: Weibull.com – Disponível em: http://www.weibull.com/GPaper/index.htm

No eixo “y” lançamos as estimativas das probabilidades


de falha (pelo método da classificação mediana (median
rank) ou pelo Kaplan-Meier) e os tempos de falha
correspondentes no eixo x. Após o lançamento dos dados
traça-se uma reta procurando colocar o máximo de pontos
sobre ela e o gráfico ficará com a forma apresentada na figura
2:

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
10

Figura 02 – Demonstração do ajuste por meio do método de plotagem de probabilidades


Probabilidade Acumulada de Falha Estimada

Rank Mediano


10 100 1000

Tempo até a Falha

Fonte: autoria própria

O método analítico dos mínimos quadrados ou regressão


linear (são sinônimos) permite o alinhamento da reta sobre os
pontos, tal que a soma das diferenças ao quadrado dos
pontos à reta seja minimizada. Se a regressão for em Y, será
escolhido o alinhamento que minimiza a soma dos quadrados
dos desvios verticais entre os pontos e a reta (chamada de
RRY). Se a regressão for em X, será escolhido o alinhamento
que minimiza a soma dos quadros dos desvios horizontais
(chamada de RRX). O método também conhecido como
Quadrados Mínimos Ordinários (MQO) ou OLS (do
inglês Ordinary Least Squares), que em outras palavras pode
ser definido como uma técnica

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
11

de otimização matemática que procura encontrar o melhor


ajuste para um conjunto de dados tentando minimizar a soma
dos quadrados das diferenças entre o valor estimado e os
dados observados (tais diferenças são chamadas resíduos).1
A figura 03 apresenta a representação gráfica das
regressões em Y e X
Figura 03 – Ilustração do processo RRY e RRX

Fonte: Parameter Estimation, www.reliawiki.org

O método analítico da máxima verossimilhança


considera que dado um conjunto de dados de falha, pode-se
estimar os parâmetros que maximizam a probabilidade de que
o dado pertence à uma distribuição específica e ao conjunto
de parâmetros. Utiliza-se o cálculo diferencial integral para se
determinar os valores que maximizam a função de
verossimilhança. O método tem propriedades estatísticas
interessantes quando o tamanho da amostra é grande. Alguns
autores consideram que o método é adequado para “n”, que
corresponde ao tamanho da amostra, seja n ≥ 15, outros n ≥ 30
e outros n ≥ 50. Recomendamos utilizar o MLE com amostras
superiores a 30 tempo (𝑛 ≥ 30). Segundo Giolo & Colossimo,
pág. 83, a regressão linear não é recomendada quando não
temos informação do exato momento da falha (dado

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
12

incompleto ou censurado) pois é “incapaz de incorporar


censuras no seu processo de estimação”.

2.2.2 – Testes de bondade de ajuste ou goodness of fit


O teste de bondade de ajuste ou teste de aderência é
utilizado para verificar se os dados da amostra correspondem
a uma distribuição de uma população como por exemplo:
distribuição normal ou distribuição Weibull. Em outras palavras,
um teste de aderência procura verificar se uma distribuição
teórica se ajusta bem ou não aos dados amostrais. Uma forma
de verificar isto, é comparando as frequências amostrais com
as frequências teóricas esperadas pelo modelo probabilístico
(distribuição de probabilidade) que se está julgando válido
para descrever (Bessegato, 2022). Basicamente, dado uma
amostra aleatória de tamanho “n” observada de uma variável
aleatória X (tempo da falha) o objetivo é testar se:
𝐻0 = 𝑋 𝑡𝑒𝑚 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑓 𝑣𝑠 𝐻1 : 𝑋 𝑛ã𝑜 𝑡𝑒𝑚 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑓.
Ou em outras palavras:
𝐻0 : 𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑜 𝑑𝑎𝑑𝑜 𝑣𝑠 𝐻1 : 𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑛ã𝑜 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑜 𝑑𝑎𝑑𝑜
Os testes que são geralmente utilizados são:
Qui-quadrado;
Kolmogorov-Smirnov;
Anderson-Darling;
Shapiro-Wilk, dentre outros.
Os softwares especializados disponíveis no mercado
normalmente dispõem de mecanismos para realizar o teste de
aderência, porém, mesmo que nos seja indicada a melhor
distribuição, o conhecimento sobre o mecanismo da falha

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
13

também deve ser utilizado para julgarmos a adoção ou não


da melhor distribuição. Então, isto significa que deve haver
uma avaliação do ponto de vista da engenharia, para
verificar se a distribuição que melhor se ajusta representa na
realidade o comportamento observado do modo de falha.
Podemos aprofundar a questão do ponto de vista da
engenharia considerando que os comportamentos esperados
de falha variam de acordo com os aspectos construtivos dos
itens que podem variar desde os estritamente mecânicos para
os estritamente eletrônicos. E, entre estes extremos existe uma
gama de variações de itens ou sistemas. Assim, a tendência
atual é uma forte integração de sistemas
mecânicos/elétricos/eletrônicos e informáticos.
A partir dos padrões de falha apresentados por Moubray,
que foram comentados no livro 1 do Módulo 11, os
comportamentos esperados de falha dos itens estão
relacionados com seus aspectos construtivos, para Moubray
então há 6 tipos de padrões de falha que correspondem a
sistemas do : tipo A - motores elétricos, engrenagens; tipo B -
máquinas a pistão, discos, aerofólios; tipo C - turbinas,
compressores, selos de ar, engrenagens, rolamentos; tipo D -
flaps de turbinas; tipo E – lâmpadas; tipo F - componentes
eletrônicos, softwares. Estes padrões ou comportamento
esperados de falha são representados pelas curvas da função
taxa de falha ou de probabilidade condicional de falha como
indicado na figura 04. Insaurrable 2015, figura 05, apresenta a
distribuição dos percentuais correspondentes a cada padrão
de Moubray, e observa que 90% dos casos se referem aos

1Vale salientar que eles foram baseados na avaliação do registro de12 anos dados de
falha da companhia aérea norte-americana United Airlines na década de 60, servem
com um referencial, e que atualmente podem ter sofrido alterações.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
14

padrões “D”,” E” e “F”. Portanto, a partir do conhecimento do


comportamento de falha do item podemos aferir ou validar a
escolha de uma determinada distribuição de probabilidade
feita por meio de um teste de aderência.
Figura 04 – 6 Padrões de falha de Moubray

Fonte: Insaurralde, 2015

Figura 05 Distribuição percentual dos padrões de Moubray

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
15

Fonte: Insaurralde, 2015.

2.2.3 Exemplo de aplicação do ajuste paramétrico

Vamos considerar que coletamos os tempos de falha


(ciclos até a fratura) de uma amostra de 50 rodas de aço,
utilizadas em veículos ferroviários. A falha ocorrerá quando for
detectada a fratura. O quadro 1 contém o registro dos ciclos
até a ocorrência da fratura.
Quadro 1 – Dados ciclos até a fratura

Fonte: Autoria própria

Para realizar um ajuste paramétrico podemos


utilizar softwares proprietários específicos que foram
desenvolvidos por empresas como: Weibul ++ da Reliasoft,

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
16

Reliability Worbench da Aremas, Minitab da Minitab, R4ALL da


brasileira Compass dentro outros e o software estatístico R
com licença livre largamente utilizado no meio acadêmico. E,
podemos usar o Reliability Analytics TollKit aplicativo, gratuito,
disponível na internet que disponibiliza a análise Weibull
(ajuste paramétrico). Weibull Analysis
(reliabilityanalyticstoolkit.appspot.com)
Nestes softwares toda a análise deve ser parametrizada
com informações do tipo: unidade de tempo; se os dados são
completos ou censurados; se há agrupamento (ou seja, mais
de um item falhou no mesmo tempo), se os dados estão
disponíveis em intervalos; que método de ajuste vamos utilizar,
normalmente podemos utilizar a regressão linear em Y ou em X
ou a máxima verossimilhança. A maioria deles disponibilizam
um módulo de teste de bondade de ajuste ou de aderência
para várias distribuições.
Vamos utilizar o R4ALL para apresentarmos a resolução
do exemplo das rodas de aço a partir da coleta de dados
dispostos no quadro 1. A tela inicial do R4ALL tem esta
aparência, fig.06:
Figura 06 – Tela inicial do módulo de LDA do R4ALL

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
17

Fonte: R4All – Disponível em: https://r4all.app/Home/Login

Com os dados já lançados na área de entrada podemos


executar a análise utilizando o módulo de teste de aderência
chamado de “distribution guide”. O distribution guide retorna
um quadro com um conjunto de distribuições ordenado do
melhor ajuste para o pior ajuste ao conjunto de dados, figura
07.
Figura 07 – Resultado do módulo de teste de aderência do R4ALL

Fonte: R4All – Disponível em: https://r4all.app/Home/Login

As distribuições apresentadas, em ordem do melhor


ajuste para o menor ajuste, foram a Weibull de 3 parâmetros
seguida da Weibull 2p, da Lognormal, da Normal e por último
da exponencial. Ao clicarmos no botão apply o software
implementa o melhor ajuste encontrado que foi o Weibull 3
parâmetros, equação (5), cuja pdf está demonstrada na
equação (6) já com a implementação dos parâmetros
encontrados
𝑡−𝛾 𝛽
𝛽 𝑡−𝛾 𝛽−1 −( )
𝑓 (𝑡; 𝜂, 𝛽, 𝛾 ) = 𝜂 ( ) 𝑒 𝜂 (5)
𝜂

𝑡−3,9267 1,7013
1,7013 𝑡−3,9267 1,7013−1 −( 35,9267 )
𝑓 (𝑡; 𝜂, 𝛽, 𝛾 ) = ( ) 𝑒 (6)
35,9267 35,9267

As funções de confiabilidade (7) e não confiabilidade (8) são:


𝑡 1,7013
(35,9267)
𝑅 (𝑡 ) = 𝑒 (7)

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
18

𝑡 1,7013
(35,9267)
𝐹 (𝑡 ) = 1 − 𝑒 (8)
A função taxa de falha (9)
𝛽 𝑡−𝛾 𝛽−1
ℎ(𝑡 ) = 𝜂 ( ) (9)
𝜂

1,7013 𝑡 − 3,9267 1,7013−1


ℎ(𝑡 ) = ( )
35,9267 35,9267
Tempo médio para falhar, figura 08
Figura 08 – Cálculo dos ciclos médios para falhar

Upper Bound: 41.2209


MTTF = 35.9804
Lower Bound: 31.4764

Fonte: R4All – Disponível em: https://r4all.app/Home/Login

Mediana. Tempo em que se espera que 50% das falhas tenham


ocorrido. VidaB50%, figura 09

Figura 09 – Cálculo da mediana utilizando do conceito de VidaB%

Upper Bound: 37.9299


BX% Life (50)% = 32.8908
Lower Bound: 28.5985

Fonte: R4All – Disponível em: https://r4all.app/Home/Login

O terceiro parâmetro da função Weibull, neste caso,


pode ser interpretado como uma determinada quantidade de
ciclos de operação em que o item não falha, passando esta
quantidade de ciclos as falhas começam a acontecer
durante o ciclo operacional. Analisando o gráfico da função

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
19

taxa de falha, figura 10, observa-se que o modo de falha


preponderante seria por desgaste. Em outras palavras com
taxa de falha crescente, ou seja, que tende a aumentar com
o passar do tempo, típico de um processo de envelhecimento.
Figura 10: Gráfico da função taxa de falha

Fonte: Fonte: R4All – Disponível em: https://r4all.app/Home/Login

A figura 11 apresentamos todos os gráficos das curvas do


modelo, que alguns autores apontam como as métricas de
confiabilidade, que são: a função de densidade de
probabilidade de falha; função de confiabilidade ou de
sobrevivência; função de não confiabilidade ou de
probabilidade acumulada de falha e a função de risco ou
taxa de falha. E, inclusive um histograma que poderemos
compará-lo com o que apresentaremos no item 2.3.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
20

Figura 11 – Gráficos das métricas de confiabilidade encontradas a partir do modelo W3p

Fonte: Fonte: R4All – Disponível em: https://r4all.app/Home/Login

2.3 Ajuste não paramétrico


Os métodos não paramétricos são técnicas estatísticas
para as quais não temos que fazer qualquer suposição de
parâmetros para a população que estamos estudando. De
fato, os métodos não têm qualquer dependência da
população de interesse. O conjunto de parâmetros não é mais
fixo, nem a distribuição que usamos. É por essa razão que os

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
21

métodos não paramétricos também são chamados de


métodos livres de distribuição. Os métodos não paramétricos
que apresentaremos na disciplina de análise de dados de vida
serão o Kaplan-Meier, Tabela de vida, median rank
comparando-os com as aproximações e conclusões sobre a
confiabilidade que se podem deduzir a partir do histograma
dos dados e do ajuste paramétrico.
2.3.1 Histogramas
Um histograma é um tipo de gráfico que mostra a
distribuição de frequências de dados, geralmente na forma de
barras verticais. Este tipo de gráfico também é chamado de
histograma de frequência. Em outras palavras trata-se de uma
análise gráfica de frequências em que se marca o número de
vezes que cada valor coletado ocorre. Assim, o histograma nos
permitirá a obtenção das seguintes informações sobre o
conjunto de dados ou observações, segundo Siqueira (2021):
“Centralidade – qual é o centro da distribuição? Onde é
esperado que esteja a maioria das observações?
Amplitude – a distribuição normalmente contém
observações entre quais valores? Qual é o ponto máximo e o
ponto mínimo?
Simetria – será que devemos esperar a mesma frequência
de pontos com valor alto e com valor baixo? Será que o
processo é simétrico ou valores mais altos são mais raros?”
Para se construir um histograma primeiramente
necessitamos de um conjunto de dados brutos ou número de
observações da amostra (N) que podem ser coletados sem
preocupação quanto a sua ordenação. Quando ordenamos
os dados de forma crescente ou decrescente temos então um
rol de dados. Um rol possui uma amplitude que é determinada

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
22

pela diferença entre o máximo valor observado e o mínimo


valor observado. Na sequência determinamos as classes que
são faixas onde os dados serão agrupados e representam a
largura das barras do histograma. As classes podem ser
calculadas ou em alguns casos a experiência (bom senso)
pode determinar a quantidade de classes que melhor traduz
a distribuição dos dados. No quadro 2 apresentamos as
definições dos termos utilizados na construção do histograma:
Quadro 2 - Equações para cálculo do histograma

Termos Equação para cálculo


R Rol
N Número de observações da amostra
K Número de classes
Cálculo de K 𝐾 = 1 + 3,3 ∗ 𝑙𝑜𝑔𝑁
pela regra de
Sturges
Cálculo 𝐾 = √𝑁
alternativo de K
Amplitude da ℎ ≈ 𝑅⁄𝐾
classe (h) (
Ponto central ou 𝑃𝑚𝑖
ponto médio da (𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 + 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒)
=
classe (𝑃𝑚𝑖 ) 2
Frequência de Número de observações que caem dentro da
classe ( 𝑓𝑖 ) classe
Frequência Soma das observações de um intervalo de classes
acumulada (𝑓𝑎 ) (classe 1 até “n”)

Frequência [𝑓𝑅𝑆𝑂 (%)] = 𝑓𝑖⁄𝑁


relativa simples
observada
[𝑓𝑅𝑆𝑂 (%)]
Frequência 𝑓𝑅𝐴𝑂 (%) =
𝑓𝑎⁄
relativa 𝑁
acumulada
observada
[𝑓𝑅𝐴𝑂 (%)]
Fonte: Autoria própria

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
23

Agora vamos retornar ao exemplo dos tempos de falhas


(ciclo até a fratura) das rodas de aço, considerando os dados
agora no quadro 3
Quadro 3 - Dados ciclos até a fratura

Fonte: Autoria própria

Na sequência apresentamos os cálculos para construção


do histograma de acordo com o quadro 4:

Quadro 4 – Cálculos para construção do histograma do problema das fraturas em rodas de aço

Termos Cálculo
R(Rol) R=80-6= 74
N (número de 50
observações da
amostra)
K Número de classes
Cálculo de K pela regra 𝐾 = 1 + 3,3 ∗ log 50 = 6,6066 ≈ 7 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
de Sturges
Cálculo alternativo de K 𝐾 = √𝑁 = √50 = 7,07 ≈ 7 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
Amplitude da classe (h) ℎ ≈ 74⁄7 ≈ 11

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
24

Ponto central ou ponto 𝑃𝑚𝑖


médio da classe (𝑃𝑚𝑖 ) (𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 + 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒)
=
2
Frequência de classe ( 𝑓𝑖 Número de observações que caem dentro da
) classe
Frequência acumulada Soma das observações de um intervalo de classes
(𝑓𝑎 ) (classe 1 até “n”)

Frequência relativa [𝑓𝑅𝑆𝑂 (%)] = 𝑓𝑖⁄𝑁


simples observada
[𝑓𝑅𝑆𝑂 (%)]
Frequência relativa 𝑓𝑅𝐴𝑂 (%) =
𝑓𝑎⁄
acumulada observada 𝑁
[𝑓𝑅𝐴𝑂 (%)]

Fonte: Autoria própria

Considerando os cálculos do rol, número de classes e da


amplitude de classes. Podemos agora apresentar o histograma
calculado no quadro 5.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
25

Quadro 5 – Histograma do exemplo das fraturas em rodas de aço

O Ciclos para Ponto Frequência Frequência Frequência Frequência


rd falhar Médio da Classe Relativa Acumulada Relativa
5
e (x10 ) Simples Acumulada
m Observada Observada
(FRSO) (FRAO)

i xi Pmi fi f(xi) fa F(xi)

1 6 → 17 11,5 7 0,14 7 0,14

2 17 → 28 22,5 9 0,18 16 0,32

3 28 → 39 33,5 15 0,30 31 0,62

4 39 → 50 44,5 9 0,18 40 0,80

5 50 → 61 55,5 4 0,08 44 0,88

6 61 → 72 66,5 2 0,04 46 0,92

7 72 → 83 77,5 4 0,08 50 1,00

Total - 50 1,00 - -

Fonte: Autoria própria

Os gráficos correspondentes às frequências relativa


simples observada (Frso) e a frequência relativa acumulada
observada (Frao), podem ser observados figura 12. Assim um
histograma pode ser utilizado para realizarmos uma simples
estimação não paramétrica de distribuição de probabilidade.
As estimativas podem ser vistas na figura 12 e representam as
curvas em vermelho sobre os gráficos. No gráfico da
frequência relativa simples observada (FRSO) temos a estimativa
da função de densidade de probabilidade de falhas. No
gráfico da frequência relativa observada acumulada (F RAO)
temos a estimativa da função de não confiabilidade ou
função densidade de probabilidade acumulada de falhas.
Considerando que confiabilidade e a não confiabilidade são

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
26

eventos completares a soma de suas probabilidades nos dá


1(um). Assim se fizermos 1-FRAO teremos a estimativa da função
de confiabilidade ou de sobrevivência.
Figura 12 – Gráficos das frequências relativa simples observada e acumulada observada

a) FRSO Frequência relativa simples observada

As linhas que envolvem as


frequências correspondem
às funções: a) densidade
de probabilidade de falha
𝑓(𝑡); b) probabilidade
b) FRAO Frequência relativa acumulada observada –
acumulada de falha ou não
confiabilidade 𝐹(𝑡) e c)
função de sobrevivência ou
confiabilidade 𝑅(𝑡)

c) (1-FRAO) 1- Frequência relativa acumulada observada

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
27

Fonte: Autoria própria

Com o histograma podemos responder que o centro da


distribuição corresponde a classe 3 ou seja a maioria das
observações estão concentradas entre 28 e 39 x 10 5 ciclos
para falhar com uma probabilidade de 62% para que isso
ocorra. E, que os tempos registrados estão entre 6 x 10 5 e 80 x
105 ciclos para falhar correspondendo respectivamente aos
pontos mínimo e máximo da distribuição. A dispersão dos
dados está então entre 6 x 105 a 80 x 105 ciclos para falhar.
Neste caso considerando que a dispersão é da ordem de 74
x105 ciclos para falhar (diferença entre o valor máximo e o
mínimo) devemos verificar se ela é esperada a partir das
especificações do fabricante do item. Pois, constatamos que
o valor máximo é cerca de 13 vezes maior que o menor tempo
registrado.
Trata-se de um histograma enviesado para direita
indicando que a média é maior que a mediana. Também que
a tendência de ocorrência das falhas está concentrada nos
menores registros. Isto pode-se perceber ao avaliarmos a
frequência relativa acumulada observada que contém 40
observações entre 6 e 50 x105 ciclos para falar. Em outras
palavras dos 50 registros, 40 deles ocorreram até 50x10 5 ciclos
para falhar ou seja 80% do total falhas ocorreram até este
tempo. Para saber mais sobre a interpretação dos histograma
acesse os textos “Interpretar os principais resultados para
histograma” e o “Interpretações de histograma.”

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
28

2.3.2 Estimador de Kaplan-Meier

O estimador limite-produto, ou Kaplan-Meier como é


usualmente chamado, é um estimador não-paramétrico para
a função de confiabilidade. Ele é uma adaptação da função
de confiabilidade empírica, que na ausência de censuras é
definida como em (5):
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑡𝑒𝑛𝑠 𝑒𝑚 𝑜𝑝𝑒𝑟𝑎çã𝑜 𝑎𝑡é 𝑜 𝑡𝑒𝑚𝑝𝑜 𝑡
𝑅̂ (𝑡 ) = (5)
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑖𝑡𝑒𝑛𝑠 𝑒𝑚 𝑡𝑒𝑠𝑡𝑒

Essa estimativa de R(t) é uma função escada com degraus


nos tempos observados de falha. O estimador de Kaplan-
Meier, na sua construção, considera tantos intervalos de
tempo quantos forem o número de tempos distintos de falha.
Os limites dos intervalos de tempo são os tempos distintos de
falha.
A estimativa tem saltos somente nos tempos de falha e
decresce por um fator (𝑛𝑗 − 𝑑𝑗)/𝑛𝑗 imediatamente após cada
tempo de falha 𝑡𝑗, 𝑗 = 1, . . . , 𝑘. assim temos a representação
em (6)
𝑛𝑗 −𝑑𝑗
( ) , 𝑠𝑒 𝑗 = 1,
𝑛𝑗
𝑅̂ (𝑡𝑗+ ) = { 𝑛 −𝑑 (6)
( 𝑗 𝑗 ) ∗ 𝑅̂ (𝑡𝑗+ ), 𝑠𝑒 𝑗 = 2, … 𝑘
𝑛 𝑗

𝑂𝑛𝑑𝑒
𝑑𝑗 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑓𝑎𝑙ℎ𝑎𝑠 𝑛𝑜 𝑡𝑒𝑚𝑝𝑜 𝑡𝑖
𝑛𝑗 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑡𝑒𝑛𝑠 𝑒𝑚 𝑟𝑖𝑠𝑐𝑜 𝑛𝑜 𝑡𝑒𝑚𝑝𝑜 𝑡𝑗 (𝑛ã𝑜 𝑓𝑎𝑙ℎ𝑜𝑢 𝑒 𝑛ã𝑜 𝑓𝑜𝑖 𝑐𝑒𝑛𝑠𝑢𝑟𝑎𝑑𝑜 𝑎𝑛𝑡𝑒𝑠 𝑑𝑜 𝑡𝑒𝑚𝑝𝑜 𝑡𝑗 )

Em que 𝑅̂ (𝑡𝑗+ ) representa a estimativa da função de


confiabilidade após o tempo 𝑡𝑗 , j = 1, … . . k.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
29

Vamos novamente utilizar o exemplo das rodas de aço e


apresentar o funcionamento do Kaplan-Meier, com os dados
no quadro 6:
Quadro 6 - Dados ciclos até a fratura

Fonte: Autoria própria

Primeiramente vamos ordenar os dados da amostra do tempo


menor para o maior, quadro 07
Quadro 07 – Dados ordenados do menor para o maior

Fratura de Rodas em Ciclos (x 𝟏𝟎𝟓 )


6 7 9 10 11 12 15 17 18 18
21 22 23 23 24 25 27 29 29 29
29 30 31 31 32 34 34 37 37 38
38 39 39 40 43 45 47 48 48 49
50 50 52 60 64 72 76 77 79 80

Fonte: Autoria própria

A partir da ordenação dos pontos podemos iniciar o cálculo


das estimativas:
50−1 49
𝑅̂ (6) = 50 = 50 = 0,98 (7)
49−1 48
𝑅̂ (7) = 49 ∗ 𝑅̂ (6) = 49 ∗ 0,98 = 0,96 (8)

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
30

E, assim vamos realizando para os demais tempos de


falhas. Todas as estimativas estão no quadro 08. A função de
sobrevivência é representada por um gráfico que se
assemelha a uma escada descendente onde os degraus
correspondem as falhas, em nosso caso, figura 13 a área cinza
corresponde a um intervalo de confiança de 95%.
Figura 13 – Função de sobrevivência ou de confiabilidade do Kaplan Meier

Fonte: Eureka Statisti http://eurekastatistics.com/cs. 2022

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
31

Quadro 08 – Resultados do Kaplan-Meier aplicado ao exemplo das rodas de aço

(nj) Número de itens expostos ao (di) Número de falhas no tempo ti 𝑛𝑗 − 𝑑𝑗


𝑅̂
Tempo da Falha 𝑅 𝑡 =
𝑛𝑗
risco no tempo Tj)
6 50 1 0,98 0,98
7 49 1 0,979591837 0,96
9 48 1 0,979166667 0,94
10 47 1 0,978723404 0,92
11 46 1 0,97826087 0,9
12 45 1 0,977777778 0,88
15 44 1 0,977272727 0,86
17 43 1 0,976744186 0,84
18 42 1 0,976190476 0,82
18 41 1 0,975609756 0,8
21 40 1 0,975 0,78
22 39 1 0,974358974 0,76
23 38 1 0,973684211 0,74
23 37 1 0,972972973 0,72
24 36 1 0,972222222 0,7
25 35 1 0,971428571 0,68
27 34 1 0,970588235 0,66
29 33 1 0,96969697 0,64
29 32 1 0,96875 0,62
29 31 1 0,967741935 0,6
29 30 1 0,966666667 0,58
30 29 1 0,965517241 0,56
31 28 1 0,964285714 0,54
31 27 1 0,962962963 0,52
32 26 1 0,961538462 0,5
34 25 1 0,96 0,48
34 24 1 0,958333333 0,46
37 23 1 0,956521739 0,44
37 22 1 0,954545455 0,42
38 21 1 0,952380952 0,4
38 20 1 0,95 0,38
39 19 1 0,947368421 0,36
39 18 1 0,944444444 0,34
40 17 1 0,941176471 0,32
43 16 1 0,9375 0,3
45 15 1 0,933333333 0,28
47 14 1 0,928571429 0,26
48 13 1 0,923076923 0,24
48 12 1 0,916666667 0,22
49 11 1 0,909090909 0,2
50 10 1 0,9 0,18
50 9 1 0,888888889 0,16
52 8 1 0,875 0,14
60 7 1 0,857142857 0,12
64 6 1 0,833333333 0,1
72 5 1 0,8 0,08
76 4 1 0,75 0,06
77 3 1 0,666666667 0,04
79 2 1 0,5 0,02
80 1 1 0 0

Uma estimativa para o MTTF pode ser obtida calculando


a área sob a curva de confiabilidade estimada pelo método
de Kaplan-Meier. Como esta curva é uma função escada, esta
área é simplesmente a soma das áreas de retângulos. Pode-se
Curso de Especialização em Engenharia da Confiabilidade
Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
32

mostrar que o MTTF é igual a área (integral) sob a função de


confiabilidade. Usando o estimador de Kaplan-Meier com os
tempos ordenados de falha 𝒕𝟏 < 𝒕𝟐 <.........<𝒕𝒌 a estimativa do
MTTF é dada por (9):
̂ = 𝑡1 ∗ 1 + (𝑡2-𝑡1 ) ∗ 𝑅̂ (𝑡1+ ) + ⋯ + (𝑡𝑘 -𝑡𝑘−1 ) ∗ 𝑅̂ (𝑡𝑘−1
𝑀𝑇𝑇𝐹 + )
(9)
Aplicando valores calculados no quadro 08 teríamos (10):

̂ = 6 ∗ 1 + (7 − 6) ∗ 0,98 + (9 − 7) ∗ 0,96 + (10 − 9) ∗ 0,94 +


𝑀𝑇𝑇𝐹
(11 − 10) ∗ 0,92 + ⋯ + (76 − 72) ∗ 0,08 + (77 − 76) ∗ 0,06 + (79 −
77) ∗ 0,04 + (80 − 79) ∗ 0,02 = 35,24 ∗ 105 𝑐𝑖𝑐𝑙𝑜𝑠 𝑝𝑎𝑟𝑎 𝑓𝑎𝑙ℎ𝑎𝑟 (10)

Assim, podemos sumarizar alguns valores notáveis observando


o quadro 8:
A mediana é obtida quando a partir da estimativa 𝑅̂ (0,5) = 32 ∗
105 𝑐𝑖𝑐𝑙𝑜𝑠 𝑝𝑎𝑟𝑎 𝑓𝑎𝑙ℎ𝑎𝑟
Vamos comparar as estimativas paramétricas do MTTF e
da mediana, figuras 08 e 09 respectivamente com as
estimativas não paramétricas pelo Kaplan-Meier, quadro 09

Quadro 09 – Comparativo das estimativas paramétricas e não paramétricas

Estimativa Paramétrico (ciclos Não paramétrico (ciclos


para falhar * 105) para falhar * 105)
MTTF 35,9804 35,24
Mediana 32,8908 32,00
Fonte: Autoria própria

Ou seja, considerando a existência de uma amostra de


bom tamanho N= 50, os resultados para o MTTF e para a

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
33

mediana foram muito próximos considerando que há ausência


de censuras. Neste caso, na presença de censuras o Kaplan-
Meier poderia apresentar valores não tão próximos daqueles
obtidos pelo método paramétrico. Mas, na ausência de
censuras, no caso, ambos os métodos nos proporcionaram
estimativas muito próximas ao ponto de se poder afirmar que,
no tocante, ao conjunto de dados analisado os métodos se
equivaleram. Porém, com o modelo paramétrico podemos
realizar estimativas que estão além dos dados da amostra
como por exemplo calcular a confiabilidade para 90*105 ciclos
para falhar. Ou calcular probabilidades condicionais com
maior facilidade como também avaliar a tendência do modo
de falha por meio da curva da função taxa de falha.
Para analisarmos o Kaplan-Meier na presença de
censuras entre os dados, vamos usar o exemplo seguinte onde
a unidade de tempo este medida em dias e as censuras estão
indicadas por um sinal “+” após o registro do tempo. Os dados
estão indicados no quadro 10:
Quadro 10 – Dados de falha em dias

55 61 + 74 81 93+ 122+
138 151 168 202+ 220+ 238+
Fonte:

Vamos calcular o estimador de Kaplan-Meier, (11 a 16):


11
𝑅̂ (55) = 12 = 0,97 (11)
11 10−1
𝑅̂ (74) = 12 ∗ 10 = 0,825 (12)
11 9 9−1
𝑅̂ (81) = 12 ∗ 10 ∗ 9 = 0,733 (13)
11 9 8 6−1
𝑅̂ (138) = 12 ∗ 10 ∗ 9 ∗ 6 = 0,611 (14)
11 9 8 5 5−1
𝑅̂ (151) = 12 ∗ 10 ∗ 9 ∗ 6 ∗ 5 = 0,488 (15)

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
34

11 9 8 5 4 4−1
𝑅̂ (168) = 12 ∗ 10 ∗ 9 ∗ 6 ∗ 5 ∗ 4 = 0,3666 (16)

Vamos explicar o processo, a primeira falha ocorreu em


55 dias, então a partir do instante igual a zero havia 12 itens em
risco, quando chegamos no quinquagésimo quinto dia (55)
𝑛 −𝑑 12−1
houve a primeira falha assim o 𝑅̂ (55) = 55 55 = = 0,97.
𝑛55 12
Ocorreu uma censura no sexagésimo primeiro dia (61), neste
11 11−0
caso como não houve falha o 𝑅̂ (61) = 12 ∗ 11 = 0,97 , ou seja,
como a censura não foi uma falha 𝑑61 = 0 logo o tempo 61
permaneceu na mesma probabilidade do 𝑑55, por este motivo
ele não apareceu calculado acima. Já no septuagésimo
quarto dia (74) houve uma falha, então a partir de 61 dias e
antes do dia 74 havia 10 itens estavam em risco dado que
houve um registro de falha em 𝑑55 e uma censura em 𝑑61 , logo
dos 12 itens, 2 deles (uma falha + uma censura) já não estavam
mais em risco no momento da ocorrência da segunda falha
no dia 74. Vamos analisar agora a falha em 𝑑138 , no caso,
tivemos 3 suspensões antes dele. Então a partir do registro da
última falha em 𝑑81 , dos 12 itens havia somente 6 itens em risco
dado que, anterior ao tempo 𝑑138 , houve 3 falhas e 3 censuras
(ou suspensões). Assim havia 6 itens, dos 12, ainda em risco
momentos antes da ocorrência no dia 138. Logo, o cálculo do
𝑛138 −𝑑138 6−1
= . Como estas censuras não foram falhas aqui
𝑛138 6
tivemos um exemplo de dados truncados. Itens que por algum
motivo foram retirados da amostra e que não falharam.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
35

2.3.3 Estimador da classificação mediana ou median rank

O estimador da classificação mediana segundo o texto


“Parameter Estimation” é
“utilizado para obter a estimação da não confiabilidade para cada dado de falha. O
rank mediano é o valor que a verdadeira probabilidade de falha, F(Tj), deve ter no jésima falha
de uma amostra de N unidades no nível de confiança 50%. O posto pode ser encontrado para
qualquer ponto percentual, P, maior que zero e menor do que um, resolvendo a equação
binominal cumulativa para Z. Isso representa o posto ou estimativa da não confiabilidade par a
jésima falha na equação a seguir para a função binominal cumulativa (17):
𝑁
𝑃 = ∑𝑁 𝑘
𝑘=𝑗(𝐾 )𝑍 (1 − 𝑍)
𝑁−𝑘 (17)

Onde N é o tamanho da amostra e j é o número de ordem. Rank mediano é obtido pela


equação Z no P=0,50 (18)

𝑁
0,50 = ∑𝑁 𝑘
𝑘=𝑗(𝐾 )𝑍 (1 − 𝑍)
𝑁−𝑘 (18)

Por exemplo, se N=4 temos quatro falhas, resolveríamos a equação do rank mediano para o valor
Z quatro veze; uma vez par cada falha com j=1,2,3 e 4. Este resultado pode então ser usado como
a estimativa da não confiabilidade para cada falha ou o “y” no gráfico.”

Bom, a interpretação deste procedimento não é muito


simples, para Jacquelin, 1993 a função da median rank F(i,n) “
é o estimador da função de probabilidade acumulada de
falhas para o iésimo elemento de amostras com tensões
idênticas” ( o autor estava se referindo a um trabalho anterior
que tratava de falhas produzidas por uma situação de
tensionamento). Jacquelin 1993, complementa que a função
da categoria2 ou classificação(rank) mediana exata é
relacionada à função beta Bx(a,b) e foi resolvida por meio do
método de Newton-Raphson. Assim em (19) apresentamos a
equação da função beta:

2Porém a tradução livre de “rank” – se considerado Verbo: ter categoria superior; ter
precedência; tomar lugar em; tomar posição; como Substantivo: a categoria; a fila; a
classe e a fileira. Porém, a tradução literal de median rank method seria método da
classificação mediana

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
36

𝑎=𝑖; 𝑏 =𝑛−𝑖+1; 𝑥 = 𝐹 ; 𝐵 = 0.5


𝑛! 𝐹
𝐵 = (𝑖−1)!(𝑛−1)! ∫0 𝑡 𝑖−1 (1 − 𝑡 )𝑛−𝑖 𝑑𝑡 (19)

Entretanto um ponto bastante interessante do artigo de


Jacquelin é que ele compara seu algoritmo com os demais
métodos de estimação do “rank” mediano de acordo com o
quadro 12
Quadro 12 – Aproximações para a função de classificação mediana

Autor 𝑖−𝐶 C Maior desvio


1 < 𝑖 < 𝑛: 𝐹 =
𝑛 − 2𝐶 + 1
Caso i=1:F=1-(0,5)(1/n)
Caso i=n: F=(0,5)(1/n)
Da IEC 56 F=(i-0,5)/(n+0,25) inconsistente 0,0385
Weibull F= i/(n+1) 0 0,0215
Hazen F=(i-0,5)/n 0,5 0,0145
Bernard F=(i-0,3)/(n+0,4) 0,3 0,00125
Filliben F=(i-0,3175)/(n+0,365) 0,3175 0,00028
Jacquelin 𝑖−𝐶 variável 0,00002
𝐹=
𝑛 − 2𝐶 + 1
𝐶 = 𝐶𝑖 + 𝐶𝑛−𝑖+1 − 0,2784
1 1⁄
𝐶𝑘 = (1 − (𝑘 + 1)(0,5)𝑘 /(1 − 2(0,5) 𝑘)

Fonte: Jacquelin, 1993

Agora vamos retornar ao nosso exemplo relacionado às


fraturas nas rodas de aço. Onde temos 50 tempos de
ocorrência de fraturas em rodas de aço, em ciclos para falhar
x 105, de acordo com o quadro 13:
Quadro 13 – Dados de fraturas em rodas de aço

Fratura de Rodas em Ciclos (x 10^5)


6 7 9 10 11 12 17 18 18
21 22 23 23 24 25 27 29 29
29 29 30 31 31 32 34 34 37
37 38 38 39 40 43 45 47 48
48 49 50 52 64 72 77 79 80
Fonte: Autoria própria

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
37

Então ao invés recorrermos às funções binominal e/ou


beta vamos calcular a classificação mediana a partir das
aproximações de Bernard e de Filliben. Portanto, vamos
encontrar os estimadores da classificação mediana para a
função de probabilidade de falha das rodas de aço e
compará-los às estimativas de Kaplan-Meier, quadro 14. No
quadro 14, as colunas na cor azul representam a estimativas
feitas pelas aproximações de Bernard e Filliben de acordo com
suas fórmulas que foram destacadas no quadro 12. Para
ambas “i” representa o número de ordem da falha e “n” o
número total de itens da amostra.
Como podemos observar no quadro 14 todas as
estimativas para o valor da probabilidade de falha, para um
mesmo registro falha ficaram muito próximos, logo neste caso
poderíamos utilizar qualquer dos métodos. O método da
classificação mediana se baseia na ordem (postos, “ranks”)
dos dados e recomendamos que sejam aplicados quando a
natureza dos dados implica inevitavelmente numa distribuição
extremamente assimétrica ou os dados não estão em uma
escala numérica e não faz sentido calcular uma média.
E, para que serve então, as estimativas da função de
probabilidade de falhas? Justamente para aplicarmos a
regressão linear (método dos mínimos quadrados) pois, cada
par de pontos a ser avaliado é constituído por uma
coordenada de tempo (no eixo “x”) e uma coordenada
correspondente à probabilidade de falha (no eixo ‘y”)
referente ao mesmo tempo.

Quadro 14 – Comparativo entre os estimadores de Kaplan-Meier e da classificação mediana o


rank mediano

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
38

Tempo da Estimativa da não confiabilidade Estimativa da confiabilidade


Kaplan-
Falha em Ordem i Aproximação de Aproximação de Aproximação de Aproximação de
Meier
ciclos x 10^5 Bernard Filliben Bernard Filliben
6 1 0,013888889 0,013551077 0,986111111 0,986448923 0,98
7 2 0,033730159 0,033406135 0,966269841 0,966593865 0,96
9 3 0,053571429 0,053261193 0,946428571 0,946738807 0,94
10 4 0,073412698 0,073116251 0,926587302 0,926883749 0,92
11 5 0,093253968 0,092971309 0,906746032 0,907028691 0,9
12 6 0,113095238 0,112826368 0,886904762 0,887173632 0,88
15 7 0,132936508 0,132681426 0,867063492 0,867318574 0,86
17 8 0,152777778 0,152536484 0,847222222 0,847463516 0,84
18 9 0,172619048 0,172391542 0,827380952 0,827608458 0,82
18 10 0,192460317 0,1922466 0,807539683 0,8077534 0,8
21 11 0,212301587 0,212101658 0,787698413 0,787898342 0,78
22 12 0,232142857 0,231956716 0,767857143 0,768043284 0,76
23 13 0,251984127 0,251811774 0,748015873 0,748188226 0,74
23 14 0,271825397 0,271666832 0,728174603 0,728333168 0,72
24 15 0,291666667 0,29152189 0,708333333 0,70847811 0,7
25 16 0,311507937 0,311376948 0,688492063 0,688623052 0,68
27 17 0,331349206 0,331232006 0,668650794 0,668767994 0,66
29 18 0,351190476 0,351087064 0,648809524 0,648912936 0,64
29 19 0,371031746 0,370942123 0,628968254 0,629057877 0,62
29 20 0,390873016 0,390797181 0,609126984 0,609202819 0,6
29 21 0,410714286 0,410652239 0,589285714 0,589347761 0,58
30 22 0,430555556 0,430507297 0,569444444 0,569492703 0,56
31 23 0,450396825 0,450362355 0,549603175 0,549637645 0,54
31 24 0,470238095 0,470217413 0,529761905 0,529782587 0,52
32 25 0,490079365 0,490072471 0,509920635 0,509927529 0,5
34 26 0,509920635 0,509927529 0,490079365 0,490072471 0,48
34 27 0,529761905 0,529782587 0,470238095 0,470217413 0,46
37 28 0,549603175 0,549637645 0,450396825 0,450362355 0,44
37 29 0,569444444 0,569492703 0,430555556 0,430507297 0,42
38 30 0,589285714 0,589347761 0,410714286 0,410652239 0,4
38 31 0,609126984 0,609202819 0,390873016 0,390797181 0,38
39 32 0,628968254 0,629057877 0,371031746 0,370942123 0,36
39 33 0,648809524 0,648912936 0,351190476 0,351087064 0,34
40 34 0,668650794 0,668767994 0,331349206 0,331232006 0,32
43 35 0,688492063 0,688623052 0,311507937 0,311376948 0,3
45 36 0,708333333 0,70847811 0,291666667 0,29152189 0,28
47 37 0,728174603 0,728333168 0,271825397 0,271666832 0,26
48 38 0,748015873 0,748188226 0,251984127 0,251811774 0,24
48 39 0,767857143 0,768043284 0,232142857 0,231956716 0,22
49 40 0,787698413 0,787898342 0,212301587 0,212101658 0,2
50 41 0,807539683 0,8077534 0,192460317 0,1922466 0,18
50 42 0,827380952 0,827608458 0,172619048 0,172391542 0,16
52 43 0,847222222 0,847463516 0,152777778 0,152536484 0,14
60 44 0,867063492 0,867318574 0,132936508 0,132681426 0,12
64 45 0,886904762 0,887173632 0,113095238 0,112826368 0,1
72 46 0,906746032 0,907028691 0,093253968 0,092971309 0,08
76 47 0,926587302 0,926883749 0,073412698 0,073116251 0,06
77 48 0,946428571 0,946738807 0,053571429 0,053261193 0,04
79 49 0,966269841 0,966593865 0,033730159 0,033406135 0,02
80 50 0,986111111 0,986448923 0,013888889 0,013551077 0

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
39

Fonte: Autoria própria

Neste livro procuramos introduzir os fundamentos


operacionais da análise de dados de vida (LDA – do inglês life
data analysis) que estão relacionados à determinação do
modelo probabilístico adequado ao conjunto de dados de
falha quer seja ele paramétrico ou não paramétrico.
Apresentamos os métodos de ajuste que basicamente se
dividem em duas categorias: Ajuste gráfico e
Ajuste analítico(matemático). Com relação ao modelo
probabilístico destacamos a função densidade de
probabilidade de falhas a envoltória do histograma também
conhecida pdf (probability density function) representada por
𝑓(𝑡); quando integramos a área da pdf vamos encontrar as
funções de probabilidade acumulada de falhas, função de
não confiabilidade ou de falha 𝐹(𝑡) e a função de
confiabilidade ou de sobrevivência 𝑅(𝑡) e estabelecendo a
𝑓(𝑡)
relação entre a 𝑓(𝑡) e a 𝑅(𝑡) teremos 𝜆(𝑡 ) = ⁄𝑅(𝑡) a função
taxa de falha ou função de risco.
Este é meu próprio trabalho, exceto onde eu reconheço o uso do trabalho de
outras pessoas

REFERÊNCIAS:

Billinton, Roy; Allan Ronald N. Reliability Evalluation of


Engineering Systems – Concepts and techniques. New York,
Plenum Press, Second edition, 1992;
Giolo, Sueli Ruiz; Colossimo, Enrico Antônio. Análise de
sobrevivência aplicada. São Paulo, Blucher, 2ª reimpressão,
2014.
Knesevic, Jezdimir. Reliability, Maintainability and Supportability
- A probabilistic approach. Cambridge, University Press, 1993

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
40

Weibull.com. Repositório desenvolvido pela empresa Reliasoft


do grupo HBM Prenscia. https://www.weibull.com/
Siqueira, Daniel. Histograma O que é, exemplos, gráficos e
tipos. Disponível: Histograma: O que é, Exemplos, Gráficos e Tipos | Alura.
Consultado em 15/08/2022. Publicado em 03/05/2021.
Bessegato, Luércio F. Teste de Aderência – Teste de Bondade
de Ajuste. Disponível em:
http://bessegato.com.br/UFMG/bondade.htm. Acesso em:
18/08/2022.
Parameter Estimation. Disponível em:
http://www.reliawiki.org/index.php/Parameter_Estimation#Ma
ximum_Likelihood_Estimation_.28MLE.29 . Acesso em:
18/08/2022.
Insaurralde, Claudio. Do you know how yuour equioment fail?
(July 8, 2015) Disponível em:
https://reliableandefficient.com/2015/07/how-your-
equipment-fail-failure-pattern/. Acesso em: 18/08/2022
Moubray, John. Reliability Centered Maintenance.New York,
Industrial Press, 2nd edition,1992.
Interpretações de histograma. Disponível em:
https://acervolima.com/interpretacoes-de-
histograma/#:~:text=Interpreta%C3%A7%C3%B5es%20de%20Hi
stograma%20Um%20histograma%20%C3%A9%20uma%20varia
%C3%A7%C3%A3o,em%20cada%20classe%20ocorrem%20no%
20conjunto%20de%20dados. Acesso em: 18/08/2022
Interpretar os principais resultados para Histograma. Disponível
em: https://support.minitab.com/pt-br/minitab/21/help-and-
how-to/graphs/histogram/interpret-the-results/key-results/.
Acesso em: 18/08/2022

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação
41

Visualizing the exact median rank. Disponível em:


https://demonstrations.wolfram.com/VisualizingTheExactMedi
anRank/#more. Acesso em: 22/08/2022.
Jacquelin, Jean. A reliable algorithm for the exact median rank
function. IEEE Transactions on Electrical Insulation – vol.28, nº2,
April, 1993.

Curso de Especialização em Engenharia da Confiabilidade


Curso de Graduação em Engenharia Elétrica
Curso de Graduação em Engenharia de Controle e Automação

Você também pode gostar