Você está na página 1de 27

Especialização Lean 6 Sigma – Certificado Black Belt

COMO AVALIAR SE UMA


DISTRIBUIÇÃO É
NORMAL

Prof. CHRISTIAN SILVA


christian@heijunka360.com
Material Elaborado pelo Prof. Paulo Scheibe
pscheibe@pgsconsultoria.com
COMO AVALIAR SE UMA DISTRIBUIÇÃO POSSUI DISTRIBUIÇÃO
NORMAL
 A curva simétrica em forma de sino representada na figura é conhecida
como distribuição normal. Diversas características de qualidade
seguem pelo menos aproximadamente a distribuião normal.

 Os limites de controle das


cartas X e AM são mais
afetados pela violação da
suposição de normalidade do
que os limites de controle das
cartas Xbar e R.

Representação de uma distribuição  Os limites de controle das


cartas Xbar e R podem ser
 Os limites das cartas de controle empregados, a não ser que a
são calculados supondo que os distribuição seja
dados são normais. Quais são as extremamente diferente da
conseqüências da violação da normal (Teoria do Valor
suposição de normalidade?
Como verificar a normalidade de dados
Central do Limite).
Em teoria das probabilidades, esse teorema afirma que
quando o tamanho da amostra aumenta, a distribuição
amostral da sua média aproxima-se cada vez mais de
uma distribuição normal. Este resultado é fundamental
na teoria da inferência estatística.
Summary of Results

The Central Limit Theorem tells us what we SHOULD have observed,


theoretically. Lets' compare this to what we actually DID observe:

Theoretical Results Observed Results


----------------------- ----------------------
Sample Standard Standard
Size Mean Deviation Mean Deviation
------ ---- --------- -------- ----------
1 3.5 1.707825 3.453 1.7041
2 3.5 1.207615 3.527 1.2320
3 3.5 0.986013 3.546 0.9503
5 3.5 0.763763 3.481 0.7532
10 3.5 0.540062 3.506 0.5289
20 3.5 0.381879 3.510 0.3891
30 3.5 0.311805 3.507 0.3148

Distribution of 1000 Tosses of a Fair Die Distribution of 1000 Averages of


300
Thirty Tosses of a Fair Die
300

250
250

200
200
Occurrences

Occurrences
150
150

100
100

50 50

0 0
1 2 3 4 5 6 1 2 3 4 5 6
Value of Die Value of Average
Graph 1 Graph 7
Histograma de Dado1
Normal

9 Média 3,625
DesvPad 1,793
N 40
8

Frequência
5

0
0 1 2 3 4 5 6 7
Dado1

Histograma 6 dados
Normal
Média 3,492
14 DesvPad 0,7000
N 40
12

10
Frequência

0
2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5
média
COMO AVALIAR SE UMA DISTRIBUIÇÃO POSSUI DISTRIBUIÇÃO
NORMAL
 A verificação é feita por meio de gráfico de probabilidade normal e
do teste estatístico de normalidade, conforme ilustrado no exemplo 1.

EXEMPLO
 Indústria: Fabricante de produtos
químicos. Tempo entre falhas sucessivas da
válvula
 Objetivo: Monitorar o mecanismo de Falha Tempo entre falhas
falhas de uma importante válvula. (horas)

1 286
 Item de controle: Tempo entre falhas 2
3
948
536

sucessivas da válvula (horas). 4


5
124
816
6 729
 Cartas de controle utilizadas: X e AM. 7
8
4
143

 Dados das 20 últimas falhas: Tabela 1. 9


10
431
8
11 2837
12 596
13 81
14 227
15 603
16 492
17 1199
18 1214
19 2831
20 96

Carta de Controle
AVALIAÇÃO DA ESTABILIDADE

Mas será que de fato o processo está instável ?

Teste de Normalidade
NORMALIDADE DOS DADOS

Alternativas quando os dados não são normais

(1) Coletar mais dados

(2) Fazer Box Plot, identificar outliers e retirá-los

(3) Partir para formação de subgrupo

(4) Transformar dos dados – Box Cox

Transformação de Johnson
VERIFICAÇÃO DA SUPOSIÇÃO DE NORMALIDADE

Hipóteses testadas:
 H0: A distribuição é normal.
 H1: A distribuição não
é normal.

Regra de decisão:
(1) Análise  Se P-Value < 0,05
Gráfica
Análise Gráfica (2) Análise Rejeitar H0 (Aceitar H1).
Estatística
 Se P-Value > 0,05
Não rejeitar H0.

Gráfico de probabilidade normal para o tempo entre falhas (horas)

Conclusão:
 A distribuição do tempo entre falhas da válvula não é normal.

O que fazer – Box Cox


COMO PROCEDER QUANDO OS DADOS NÃO SÃO NORMAIS

 Quando há evidências de que a variável não tem uma distribuição


próxima da normal, o procedimento a ser adotado consiste em
transformar a variável original em uma nova variável que seja
aproximadamente normal e então construir as cartas de controle para
essa nova variável. A determinação da transformação a ser utilizada é
feita por meio do procedimento de Box-Cox, ilustrado no exemplo 2

 Transformação do tempo entre falhas:


γ
y=x NOTA : Se lambda = zero, a transformação é y = ln x.
onde:
x = dados originais do tempo entre falhas.
y = dados transformados do tempo entre falhas.
= constante lambda determinada pelo
γ

procedimento de Box-Cox (Best Value).

Saída do Minitab para transformação


Não parece é a mesma pessoa!!!
Não parece é a mesma pessoa!!!
Não parece é a mesma pessoa!!!
Transformação Box-Cox (λ)
Espelho de comportamento
• Se você incluir a transformação de Box-
Cox quando executar identificação de
distribuição individual, o Minitab informa
o valor de lambda (λ) usado na
transformação.
• A transformação de Box-Cox calcula um
valor de lambda, como mostrado na
tabela abaixo, o que minimiza o desvio
padrão de uma variável transformada
padronizada. A transformação resultante
é Yλ quando λ ҂ 0 e In Y quando λ = 0.
• Este método pesquisa através de muitos
tipos de transformações. A tabela a seguir
mostra algumas transformações comuns
onde Y' é a transformação do Y dos dados.
DETERMINAÇÃO DO VALOR DE LAMBDA

 Conclusão: Como o
melhor valor para
lambda é 0,5 (Best
Value), a transformação
é:

y = x0,5, isto é, y = x

 Dados transformados
do tempo entre falhas
da válvula: Tabela 2.

Resultado do procedimento de Box-Cox

Tabela e teste de normalidade com dados transformados


VERIFICAÇÃO DA NORMALIDADE PARA OS DADOS
TRANSFORMADOS
Dados transformados da variável tempo entre falhas da Gráfico de probabilidade normal para os dados transformados
válvula (y = x0,5) do tempo entre falhas da válvula (horas)

Falha x (horas) y = x 0,5


1 286 16,9115
2 948 30,7896
3 536 23,1517
4 124 11,1355
5 816 28,5657
6 729 27,0000
7 4 2,0000
8 143 11,9583
9 431 20,7605
10 8 2,8284
11 2837 53,2635
12 596 24,4131
13 81 9,0000
14 227 15,0665
15 603 24,5561
16 492 22,1811
17 1199 34,6266 Conclusão
18 1214 34,8425
19 2831 53,2071
20 96 9,7980  A distribuição dos dados
transformados do tempo entre
falhas da válvula é normal.

Carta de controle para dados transformados


AVALIAÇÃO DA ESTABILIDADE
 Construção das cartas de controle X e AM para os dados
transformados do tempo entre falhas da válvula:

Conclusão
O tempo entre falhas da válvula está sob controle.
Alternativas para dados não normais
NORMALIDADE DOS DADOS

Alternativas quando os dados não são normais

(1) Coletar mais dados

(2) Fazer Box Plot, identificar outliers e retirá-los

(3) Partir para formação de subgrupo

(4) Transformar dos dados – Box Cox

Transformação de Johnson
TRANSFORMAÇÃO JOHNSON

O que fazer quando os dados fogem muito da normalidade e a


transformação Box Cox não é suficiente ?

 A transformação Box-Cox é fácil de entender, mas é muito limitado e


muitas vezes não encontra uma transformação adequada. Outra
restrição é de que somente é possível aplicar para dados com sinal
positivo.

 A transformação Johnson utiliza um algoritmo diferente do que a


transformação de Box-Cox, com base em três famílias de funções no
sistema .

 Se o algoritmo Box-Cox não encontrar uma transformação adequada,


em seguida, tente a transformação Johnson. A função de transformação
Johnson é mais complicada, mas é muito poderosa para encontrar uma
transformação apropriada
xx.4 AjustarJOHNSON
TRANSFORMAÇÃO uma Curva Empírica
 Famílias
 Família SU, não limitada (do inglês, unbounded), quando a
variável não possui um valor mínimo ou máximo, podendo
variar livremente entre +∞ e - ∞. A função proposta é:
 χ −κ 
κ 1 (χ , ω , κ ) = senh 
−1

 ω 
 Família SB, limitada (do inglês, bounded), para aquelas
distribuições nas quais a variável assume valores entre (k,
k+w). A função proposta é:
 χ −κ 
κ 2 (χ , ω , κ ) = ln 
ω +κ − χ 
 Família SL, lognormal, cuja função proposta é do tipo:
 χ −κ 
κ 3 (χ , ω , κ ) = ln 
 ω 
Dados transforrmados tempo entre falhas
SAÍDA DO MINITAB = TRANSFORMAÇÃO JOHNSON
TEMPO ENTRE FALHAS

Carta com dados transformados


CARTA DE CONTROLE APÓS TRANSFORMAÇÃO JOHNSON
PARA TEMPO ENTRE FALHAS

Conclusão
O tempo entre falhas da válvula está sob controle.
Comparação entre transformações
COMPARAÇÃO ENTRE TRANSFORMAÇÃO JOHNSON E BOX COX

Conclusões

A transformação Johnson
(p_valor = 0,807) tornou os
dados muito mais ‘normais’
do que a transformação box
cox (p_valor=0,377).

 Mas a equação usada


em Johnson é muito mais
complexa.

 A decisão de qual tipo de transformação utilizar depende do estudo e da aplicação.


Por exemplo, se for para utilização de um operador, box cox é muito mais simples.
Se for para estudo que está sendo realizado por um black belt, a johnson pode ser
mais útil.
ATIVIDADE 1

Número de placas produzidas entre ocorrências de placas  Indústria: Equipamentos e


defeituosas (em milhares) sistemas de transmissão e
Placa
Placas produzidas
entre duas placas Placa
Placas produzidas
entre duas placas rádio.
defeituosa defeituosas sucessivas defeituosa defeituosas sucessivas
(em milhares) (em milhares)
1 5,1 15 17,0  Objetivo: Controlar a
2 34,0 16 6,8
3 18,7 17 1,7 ocorrência de placas
4
5
13,6
27,2
18
19
17,0
5,1
G6333B defeituosas.
6 28,9 20 11,9
7
8
90,1
34,0
21 18,7
74,8
 Item de controle: Número
22
9 76,5 23 5,1 de placas produzidas entre
10 35,7 24 42,5
11 6,8 25 68,0 duas ocorrências
12 3,4 26 47,6
13 15,3 27 11,9 sucessivas de placas
14 11,9
defeituosas.

 Processe os dados coletados por meio da construção de uma


carta de controle apropriada e estabeleça conclusões.
ATIVIDADE 2

Número de pedidos realizados entre ocorrências sucessivas  Indústria: Pedidos de


de pedidos incorretos (unidades)
compra realizados por uma
Pedido
Pedidos realizados
entre ocorrências Pedido
Pedidos realizados
entre ocorrências
empresa.
incorreto sucessivas de incorreto sucessivas de
pedidos incorretos pedidos incorretos  Objetivo: Controlar a
1 3 15 10
2 20 16 4 ocorrência de pedidos de
3 11 17 1
4 8 18 10
compra incorretos.
5 16 19 3
6 17 20 7  Item de controle: Número
7 53 21 11
8 20 22 44
de pedidos realizados entre
9 45 23 3 duas ocorrências
10 21 24 25
11 4 25 40 sucessivas de pedidos
12 2 26 28
13 9 27 7
incorretos.
14 7

 Processe os dados coletados por meio da construção de uma carta de


controle apropiada e estabeleça conclusões.

Você também pode gostar