Você está na página 1de 33

Cadernos de

Ciência, Tecnologia e Gestão

6-SIGMA COM VARIÁVEIS NORMAIS, BINOMIAIS E DE POISSON


M. Rui Alvesa,b,#
a Instituto Politécnico de Vina do Castelo, Escola Superior de Tecnologia e Gestão
b REQUIMTE/LAQV – Laboratório Associado para a Química Verde - Tecnologias e Processos Limpos

# Autor correspondente: Resumo


Este Caderno foi concebido com o intuito de fazer uma
M. Rui Alves introdução simples ao estudo dos processos e às métricas seis-
mruialves@estg.ipvc.pt sigma. Tem também por objectivo estabelecer uma
Instituto Politécnico Viana do Castelo
nomenclatura, discutindo algumas das confusões que grassam
Escola Superior Tecnologia e Gestão na literatura sob o tema.
Avenida do Atlântico, s/n Assim, neste caderno abordam-se os tipos de variáveis
4900-348 Viana do Castelo possíveis de encontrar como KPIs dos processos, incluindo:
Portugal - o mundo dos dados contínuos, essencialmente de dados que
seguem as leis de uma distribuição normal, e que dizem respeito
Palavras chave:
à classificação através de medições;
Análise de processos
- o mundo dos atributos, que diz respeito à classificação das
Nível sigma unidades produzidas como defeituosas ou não defeituosas,
Capacidade de processos seguindo os dados as leis de uma distribuição binomial;
Desempenho de processos - e o mundo das contagens, que diz respeito à contagem de
Projectos 6-sigma defeitos observáveis nas unidades produzidas e que seguem as
leis de uma distribuição de Poisson.
Âmbito/destinatários:
Para acompanhar este caderno construíram-se três
funções:
Mestrados MGQSA, MEIIA e MGO
Licenciaturas EA e CTA - a função SS.Cp, que se destina a facilitar o estudo de algumas
Licenciaturas nas áreas electrotécnica métricas relativas ao mundo dos dados contínuos;
e mecânica - a função SS.Defeituosos que trata dados relativos a atributos,
Especialistas em controlo da qualidade podendo simular dados ou ler dados reais de empresas;
Técnicos de gestão da qualidade
- e a função SS.Defeitos que trata dados relativos a contagens,
podendo, tal como anterior, simular dados ou ler dados reais de
empresas.
Em anexo apresentam-se as funções escritas em R que
permitem construir gráficos de forma fácil e calcular as métricas
Versão 3
seis-sigma, para além de ficheiros de dados para serem usados
(actualização em 13.04.2020)
como casos-estudo.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 1 de 33


M. Rui Alves

ÍNDICE

ÍNDICE........................................................................................................................ 2
1. TIPOS DE VARIÁVEIS ..................................................................................... 3
2. PROCESSOS COM VARIÁVEIS CONTÍNUAS NORMAIS.............................. 3
2.1. Caso-estudo...................................................................................................................................... 3
2.2. Processo apenas com causas comuns de variação ........................................................... 4
2.3. Processo com causas comuns e especiais de variação .................................................... 5
2.4. Caracterização dos processos ................................................................................................... 6
2.5. Análise de causas comuns e especiais e variação.............................................................. 7
2.5. Análise da variação de curto e longo prazo ......................................................................... 8
2.6. PPM (partes por milhão) ............................................................................................................ 8
3. PROCESSOS CARACTERIZADOS POR ATRIBUTOS .................................. 9
3.1. Especificação ................................................................................................................................... 9
3.2. Fracção de defeituosos ................................................................................................................ 9
3.3. Melhorar a estimativa de π ..................................................................................................... 10
3.4. Previsão de resultados das amostragens .......................................................................... 11
3.5. Métricas para atributos ............................................................................................................ 13
3.3.1 Amostras de uma só observação (n=1) ............................................................................ 13
3.3.2 Amostras de tamanho igual, n>1 ....................................................................................... 15
3.6. Amostras de tamanho diferente ........................................................................................... 16
3.7. Conclusão sobre processos e atributos .............................................................................. 17
4. PROCESSOS CARACTERIZADOS POR DEFEITOS ................................... 18
4.1. Caracterizar o processo ............................................................................................................ 18
4.2. Especificação ................................................................................................................................ 18
4.3. Terminologia, caso-estudo e procedimento ..................................................................... 18
4.4. Distribuição de Poisson em processos 6σ ......................................................................... 21
4.5. Função SS.Defeitos ...................................................................................................................... 22
4.6. Conclusão sobre processos e contagens ............................................................................ 23
5. CONCLUSÃO GERAL ................................................................................... 23
6. BIBLIOGRAFIA .............................................................................................. 23
6.1. Essencial ......................................................................................................................................... 23
6.2. Recomendada ............................................................................................................................... 23
7. ANEXOS ......................................................................................................... 24
7.1. Função SS.Cp ................................................................................................................................. 24
7.2. Função SS.Defeituosos ............................................................................................................... 26
7.3. Função SS.Defeitos ...................................................................................................................... 28
7.4. Bases de dados............................................................................................................................. 30

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 2 de 33


M. Rui Alves

1. TIPOS DE VARIÁVEIS

Os processos podem ser caracterizados por variáveis (KPI) de três tipos essenciais, que
correspondem a três mundos de dados de natureza muito diferente:

a) O mundo dos dados contínuos, que resultam de medições efectuadas em unidades


produzidas. Em geral trata-se de dados resultantes da medição de grandezas físicas ou
químicas. A distribuição normal representa aqui um papel principal, embora seja sempre
necessário verificar a sua validade em cada situação específica;
b) O mundo dos atributos, no qual se procede à classificação de unidades. Em geral trata-se
da classificação das unidades produzidas como "defeituosas" ou "conformes". Os dados
resultantes seguem as leis da distribuição binomial;
c) O mundo das contagens, que se debruça sobre a contagem de defeitos. Em geral trata-se da
enumeração dos defeitos possíveis de ocorrer em cada unidade e a posterior contagem de
defeitos nas unidades produzidas. Nestas situações aplica-se a distribuição de Poisson.

Cada um destes tipos de dados tem o seu tratamento específico, sendo importante
perceber como podem ser estudados, como surgem na prática, que aspectos gráficos são mais
relevantes e quais as estimativas que podem ser feitas para caracterizar os processos.

2. PROCESSOS COM VARIÁVEIS CONTÍNUAS NORMAIS

2.1. CASO-ESTUDO

Para entender algumas questões importantes relativamente às métricas 6-sigma, quando


os KPI reflectem variáveis normais, consideremos o seguinte caso simulado:

Numa empresa, um processo consiste em encher garrafas de água no valor nominal de 50 ml.
A lei (Portaria 1198/91) estipula que, para essa situação, o erro admissível por defeito é de
9% do valor nominal. Coloca-se a questão de saber se o processo da empresa consegue
cumprir com as disposições legais.
Admitindo que o processo se desenrola de acordo com as leis de uma distribuição normal,
espera-se que as garrafas tenham conteúdos próximos de 50 ml, embora se admita alguma
variação em torno desse valor. A Portaria admite uma variação de 9%.
Para verificar como o processo estava a trabalhar, simulou-se a recolha de 100 garrafas ao
longo do tempo (1 garrafa a cada 30 minutos), e a medição dos seus conteúdos, tendo-se obtido
os resultados que se mostram na Figura 1. A variável «conteúdos das garrafas» é o KPI de
interesse, que será denominado KPI X. Esta simulação pretende demonstrar um processo a
decorrer apenas com causas comuns de variação.
Numa segunda simulação, para simular causas especiais de variação, criou-se o KPI Y a partir
dos valores do KPI X, do seguinte modo: mantendo os primeiros 33 valores do KPI X,
adicionando 2 aos valores de X entre o 34º e o 66º valores, e subtraindo 3 aos valores de X
entre o 67º e o 100º. Os valores do KPI Y assim criados mostram-se na Figura 2.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 3 de 33


M. Rui Alves

2.2. PROCESSO APENAS COM CAUSAS COMUNS DE VARIAÇÃO

Efectuaram-se testes de Anderson-Darling, Cramér-von Mises e Shapiro-Wilks para


análise da normalidade dos dados (ver Figura 1), todos tendo revelado que não há razões para
rejeitar a hipótese de que os dados seguem uma distribuição normal (p.values ≫ 0.05 em todos
os testes). O histograma que se apresenta na Figura 1, que se aproxima da forma da distribuição
normal, também aponta para esse facto, bem como a linha temporal que se mostra na mesma
figura com uma variação bastante regular ao longo do tempo.
A Figura 1 ilustra o que se espera observar quando um processo é normal e está bem
regulado: os valores do KPI vão variando em torno do valor nominal, de forma homogénea ao
longo do tempo, e sempre dentro de determinados limites. Diz-se que a dispersão observada é
causada apenas por causas comuns, intrínsecas ao próprio processo, e impossíveis de remover
no dia-a-dia.

Dados obtidos (simulados)

49.78 47.40 51.01 49.78 49.76 48.10


52.83 48.31 49.15 47.18 47.60 51.85
50.48 51.85 50.81 49.20 47.93 52.26
51.71 49.16 49.94 47.10 51.52 52.65
50.03 52.48 49.01 51.44 50.59 48.47
51.91 48.90 49.67 48.87 47.59 50.60
50.81 50.57 50.36 52.52 49.40 49.47
50.09 50.93 46.17 48.82 48.05 48.61
49.64 51.23 46.30 50.11 50.38 49.62
49.47 49.83 50.44 51.59 51.16 49.02
48.68 52.47 49.28 50.50 49.60 48.63
50.46 51.96 48.18 51.33 49.90 51.63
49.74 50.01 49.37 50.14 49.69 46.77
49.04 53.15 50.72 48.32 51.85 49.43
52.03 47.34 48.30 49.55 50.60 51.27
53.55 51.04 51.49 51.39 49.36 50.47
50.79 51.47 51.84 50.67

Testes à normalidade dos dados

Anderson-Darling normality test


A = 0.1839, p-value = 0.9071

Cramer-von Mises normality test


W = 0.024828, p-value = 0.9103

Shapiro-Wilk normality test


W = 0.99192, p-value = 0.8152

Figura 1
Voz do processo (VOP): Resultados da simulação do KPI X (em cima à esquerda) e saída do R com testes à
normalidade (em baixo, a azul). Em cima, à direita, histograma do KPI X, mostrando o que se espera de um
processo que siga uma distribuição normal. Em baixo, à direita, linha temporal do KPI X, mostrando um
processo estabilizado, só com causas comuns de variação.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 4 de 33


M. Rui Alves

2.3. PROCESSO COM CAUSAS COMUNS E ESPECIAIS DE VARIAÇÃO

Para além das causas comuns de variação, podem existir causas especiais que afectem
a dispersão natural do processo. Entre estas causas especiais podem citar-se mudanças de turno,
quebras na tensão eléctrica, más práticas de controlo, descalibrações de máquinas, etc. Os dados
simulados, relativos ao KPI Y, mostram-se na Figura 2.
Os testes à normalidade mostram que o p.value agora se aproxima de 0.05, logo próximo
da zona de rejeição da hipótese de normalidade. O histograma do KPI Y é mais irregular,
afastando-se do esperado se a distribuição dos dados fosse normal, em consonância com os
testes à normalidade. O diagrama temporal mostra que ao longo do tempo se observam
variações não normais, com os valores subitamente a aumentarem na zona central do gráfico e
a diminuírem muito na zona direita (tal como esperado após a simulação efectuada).

Dados obtidos (simulados)

49.78 47.40 51.01 49.78 49.76 48.10


52.83 48.31 49.15 47.18 47.60 51.85
50.48 51.85 50.81 49.20 47.93 52.26
51.71 49.16 49.94 47.10 51.52 52.65
50.03 52.48 49.01 51.44 50.59 48.47
51.91 48.90 49.67 50.87 49.59 52.60
52.81 52.57 52.36 54.52 51.40 51.47
52.09 52.93 48.17 50.82 50.05 50.61
51.64 53.23 48.30 52.11 52.38 51.62
51.47 51.83 52.44 53.59 53.16 51.02
50.68 54.47 51.28 52.50 51.60 50.63
47.46 48.96 45.18 48.33 46.90 48.63
46.74 47.01 46.37 47.14 46.69 43.77
46.04 50.15 47.72 45.32 48.85 46.43
49.03 44.34 45.30 46.55 47.60 48.27
50.55 48.04 48.49 48.39 46.36 47.47
47.79 48.47 48.84 47.67

Testes à normalidade dos dados

Anderson-Darling normality test


A = 0.70571, p-value = 0.06349

Cramer-von Mises normality test


W = 0.12315, p-value = 0.05337

Shapiro-Wilk normality test


W = 0.98024, p-value = 0.1388

Figura 2
Voz do processo (VOP): Resultados do KPI X (em cima à esquerda) e saída do R com testes à normalidade (em
baixo, a azul). Em cima, à direita, histograma do KPI Y, com forma que se afasta do esperado se a distribuição
fosse normal. Em baixo, à direita, linha temporal do KPI Y, mostrando um processo não estabilizado, devido à
existência de causas comuns e de pelo menos duas causas especiais de variação.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 5 de 33


M. Rui Alves

2.4. CARACTERIZAÇÃO DOS PROCESSOS

Para caracterizar os processos abordados nas secções 2.2 e 2.3, as métricas essenciais
são a média, que dá a localizações do processo, e o desvio padrão, que dá a sua variabilidade.
Decorre do estudo da capacidade dos processos que a amplitude e os limites de variação são
também importantes.
No entanto, existem duas formas de cálculo do desvio padrão:
a) uma, que usa todos os valores existentes, como se se tratasse de uma amostra única, e que
origina o desvio padrão global;
b) outra, que se baseia nos desvios padrão de amostras, ou nas amplitudes entre observações, e
que origina o desvio padrão comum.

2.4.1. Média e desvio padrão global

Para calcular a média e o desvio padrão global, basta:


a) calcular a média do conjunto dos 100 valores e o desvio padrão global dos 100 valores;
b) a partir desses parâmetros calcular os limites do processo, LSP e LIP, dados por µ±3σ;
c) calcular a amplitude do processo, que é dada por LSP–LIP, logo sempre igual a 6σ.

Note-se que se referiu o cálculo do desvio padrão global (que pode indicar-se por σglobal,
ou DPglobal), por se usaram todos os 100 valores para o seu cálculo, como se de uma amostra
única se tratasse:

Para o KPI X (sendo x o conjunto dos 100 valores):


mean(x) # média
[1] 50.0352
sd(x) # desvio padrão global
[1] 1.572016
LSP <- mean(x)+3*sd(x); LSP # limite superior do processo
[1] 54.75125
LIP <- mean(x)-3*sd(x); LIP # limite inferior do processo
[1] 45.31915
amplitude <- LSP – LIP; amplitude # amplitude do processo
[1] 9.432094

Para o KPI Y (sendo y o conjunto dos 100 valores):


mean(y) # média
[1] 49.6752
sd(y) # desvio padrão global
[1] 2.374882
LSP <- mean(y)+3*sd(y); LSP # limite superior do processo
[1] 56.79985
LIP <- mean(y)-3*sd(y); LIP # limite inferior do processo
[1] 42.55055
amplitude <- LSP - LIP; amplitude # amplitude do processo
[1] 14.24929

Estes resultados mostram que o processo com causas especiais de variação tem um
desvio padrão global maior que o processo sem causas especiais de variação. Tal resultado é de
esperar, porque a variação é sempre maior quando o processo não está estabilizado: no processo
estabilizado os resultados variaram entre 45.32 e 54.75, ao passo que no processo não
estabilizado variaram entre 42.55 e 56.80, o que fez com que a amplitude quase duplicasse de
um caso (KPI X) para o outro (KPI Y).

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 6 de 33


M. Rui Alves

2.4.2. Média e desvio padrão comum

Como nos exemplos seguidos os dados se assumem como tendo sido recolhidos ao
longo do tempo, em amostras de uma só observação (analisando 1 só garrafa em cada
momento), uma forma alternativa de calcular o desvio padrão do processo, denominado desvio
padrão comum, identificado por σcomum, ou DPcomum, consiste em:

a) calcular as amplitudes móveis. i.e., as diferenças absolutas entre cada dois valores contíguos;
b) calcular a amplitude móvel média (𝑅̅ ), i.e., a média das 99 amplitudes móveis;
c) calcular o desvio padrão do processo como σcomum = 𝑅̅ /1.128.

No caso do processo estabilizado (sem causas especiais de variação, KPI X), o resultado
é 𝑅̅ = 1.806 e o desvio padrão é σcomum = 1.601:

r <- c() # variável com amplitudes móveis


for (i in 2:100) r <- c(r,abs(x[i]-x[i-1])) # cálculo das amplitudes móveis
Rmedia <- mean(r); Rmedia # média das amplitudes móveis
[1] 1.805556
DPcomum <- Rmedia/1.128; DPcomum # desvio padrão comum
[1] 1.60067

No caso do processo não estabilizado (com causas especiais de variação, KPI Y), o
̅ = 1.823 e o desvio padrão é estimado como σcomum = 1.616:
resultado é R
r <- c() # variável com amplitudes móveis
for (i in 2:100) r <- c(r,abs(y[i]-y[i-1])) # cálculo das amplitudes móveis
Rmedia <- mean(r); Rmedia # média das amplitudes móveis
[1] 1.823131
DPcomum <- Rmedia/1.128; DPcomum # desvio padrão comum
[1] 1.616251

Pode então observar-se que em contraste com os desvios padrão globais, que eram
bastante diferentes nos dois casos, os desvios padrão comuns são muito semelhantes, sendo
σcomum ≈ 1.6.
É importante notar-se que o desvio padrão global é sempre calculado a partir de todos
os dados disponíveis, ao passo que o desvio padrão comum, de acordo com os dados existentes,
pode ser calculado a partir de (recomendações):
a) amplitudes móveis entre um mínimo de N = 100 amostras de n = 1 só observação;
b) variâncias de um mínimo de N = 20 amostras de n = 5 unidades cada, recolhidas ao longo
do tempo;
c) somas de quadrados de desvios de N amostras de tamanhos ni diferentes, mas sempre com
um total de dados no mínimo igual a 100.

2.5. ANÁLISE DE CAUSAS COMUNS E ESPECIAIS E VARIAÇÃO

Quando se começa a trabalhar com processos, os desvios padrão σcomum e σglobal devem
ser usados para verificar a eventual existência de problemas e para a verificação da sua
correcção:
a) O desvio padrão comum, σcomum, é uma boa estimativa do que o processo consegue fazer se
não houver perturbações, i.e., se o processo estiver estabilizado, sem causas especiais de
variação. Isto deve-se ao facto de que as medidas do desvio padrão comum são obtidas
através da análise de pequenas partes do processo, não reflectindo, por isso, problemas que
se verifiquem ao longo do tempo.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 7 de 33


M. Rui Alves

b) O desvio padrão global, σglobal, é uma boa estimativa da performance do processo ao longo
do tempo, reflectindo não só as causas comuns de variação, como também as causas
especiais. Isto deve-se ao facto de que ao usar todos os valores disponíveis para o cálculo do
desvio padrão, necessariamente o cálculo vai incluir todas as variações observadas.
c) Se não houver causas especiais de variação, as estimativas do desvio padrão do processo,
feitas a partir de σcomum e de σglobal serão iguais, pelo que se pode usar este facto como
evidência de que o processo está estabilizado;
d) Se as estimativas do desvio padrão do processo, feitas a partir de σcomum e de σglobal, forem
diferentes, tal significa que há causas especiais de variação, sendo necessário encontrá-las e
eliminá-las, para estabilizar o processo.

2.5. ANÁLISE DA VARIAÇÃO DE CURTO E LONGO PRAZO

Quando os processos já foram estudados e são conhecidos, os desvios padrão σcomum e


σglobal devem ser usados para verificar a estabilidade do processo ao longo do tempo, já que
todos os processos, com o tempo, vão piorar a sua performance:
a) O desvio padrão comum, σcomum, de um processo estabilizado deve manter-se, sendo tal
sinónimo de que o processo se encontra sob controlo absoluto e a desenrolar-se de acordo
com o esperado. Por essa razão também se chama ao desvio padrão comum o desvio padrão
de curto prazo.
b) Mas todos os processos, com o tempo, desregulam, o que inevitavelmente irá gerar um
aumento do desvio padrão global. Assim, em processos estabilizados (sem causas especiais
de variação), o aumento do desvio padrão global, σglobal é uma indicação da performance do
processo, i.e., da forma como o processo se vai comportando ao longo do tempo. Por essa
razão também se chama ao desvio padrão global o desvio padrão de longo prazo.
c) A comparação dos desvios padrão comum e global em processos estabilizados permite
determinar quanto tempo o processo se mantém sob controlo e, portanto, definir a
periodicidade para efectuar intervenções (revisões, calibrações, etc.).
d) Uma alteração inesperada do desvio padrão global num processo estabilizado poderá
significar que novas causas especiais de variação surgiram, sendo por isso indicativo da
necessidade de efectuar novas acções correctivas.

2.6. PPM (PARTES POR MILHÃO)

Os defeituosos produzidos num processo com variáveis contínuas normais só podem ser
calculados face a uma especificação. Por exemplo, suponha-se que um processo de enchimento
das garrafas decorre com média µ = 49.5 ml e desvio padrão σ = 1.5. A lei considera defeituosas
garrafas com menos do que VN-EA = 50-4.5 = 45.5 ml. É então necessário calcular a fracção
defeituosa que se estima produzir, o que é feito de duas formas: a primeira forma consiste em
calcular o LIE em termos do seu valor Z e usar as tabelas da distribuição normal, obtendo a
fracção defeituosa, que deverá ser depois multiplicada por 1000000 (ou usando tabelas seis-
sigmas, ver anexo); a segunda forma consiste em calcular directamente essa métrica usando
software estatístico. No exemplo considerado:
Z <- (45.5-49.5)/1.5; z # valor de Z para usar com tabelas
[1] -2.666667
PPM <- 1000000 * pnorm(q=Z,0,1); PPM # utilização do valor Z com software
[1] 3830.381
PPM <- 1000000 * pnorm(45.5,49.5,1.5); PPM # cálculo directo com software
[1] 3830.381

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 8 de 33


M. Rui Alves

3. PROCESSOS CARACTERIZADOS POR ATRIBUTOS

Muitos KPI não se referem a variáveis contínuas, como no caso visto atrás (secção 2),
mas a atributos. Em terminologia 6-sigma, quando se fala em atributos, refere-se o mundo no
qual as unidades da produção são classificadas como “defeituosas/conformes”, ou como “1/0”,
simplesmente. Os processos caracterizam-se pela fracção de unidades defeituosas produzidas,
que se designa por π.

3.1. ESPECIFICAÇÃO

Como é evidente, ninguém pretenderá produzir unidades defeituosas, nem ninguém


quererá comprar unidades defeituosas produzidos por outros. Mas em termos industriais,
realistas, tem sempre de admitir-se que podem surgir unidades defeituosas, por muito fiáveis
que sejam os processos.
Então, as especificações para este tipo de KPI devem incluir apenas um limite superior
da especificação (LSE), subentendendo-se que o limite inferir (LIE) será o desejável zero. Como
é lógico, não faz aqui qualquer sentido a existência de um valor nominal. Estas especificações
só têm interesse para a empresa que produz, porque será ela que tem que inspecionar os lotes
produzidos e remover as unidades defeituosas. Se a inspecção for realizada pelos clientes, essa
inspecção terá de ser custeada pelo produtor, que além disso terá de substituir as unidades
defeituosas por unidades conformes.
Assim, a empresa tem de conhecer o processo e conhecer o valor de π (a fracção
defeituosa), e desenvolver uma inspecção que lhe permita remover as unidades defeituosas
produzidas. Como resultado dessa inspecção o valor de π deve ser continuamente ajustado à
realidade.

3.2. FRACÇÃO DE DEFEITUOSOS

Quando se inspeccionam as unidades produzidas por um determinado processo ao longo


do tempo, classificando cada unidade observada como "defeituosa" ou "conforme", como se
espera que surjam os dados resultantes dessa classificação? A Figura 3 exemplifica os
resultados esperados num processo de enchimento de garrafas de água classificadas como
defeituosas ("1") ou conformes ("0").
A figura mostra um facto conhecido: sempre que se repete uma amostragem, os
resultados que se obtêm são diferentes, o que diminui a nossa certeza no cálculo do parâmetro
que se pretende conhecer, que é a fracção de defeituosos (π) típica do processo.
A Figura 3 pode ser aproveitada para estabelecer alguma terminologia: o número de
amostras representa-se por N (N=3 na figura), o tamanho de cada amostra representa-se por n
(no exemplo é sempre n=120), o número total de unidades inspeccionadas é Nn (igual a
3×120=360), o número de defeituosos encontrado na amostra é x (na figura x igual a 8, 1 e 4) e
a fracção de defeituosos na amostra é p=x/n (que na figura é 8/120, 1/120 e 4/120), sendo que
cada p é uma estimativa de π, i.e., a fracção de defeituosos na população é estimada a partir da
fracção de defeituosos na amostra.
A estimativa de π é sempre difícil, tal como se mostra na Figura 3. As três estimativas
geram resultados muito diferentes: p ≈0.066, p≈0.008 e p≈0.033, originando estimativas de
6.6%, 0.8% e 3.3% (multiplicando a fracção defeituosa por 100), ou 66000, 8000 e 33000 PPM,
respectivamente (multiplicando a fracção defeituosa por 1000000).
Em média o resultado foi de 0.036 (3.6% ou 36000 PPM) o que será uma melhor
estimativa, agora baseada no total das Nn=360 unidades analisadas.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 9 de 33


M. Rui Alves

Figura 3
Resultados de N=3 amostras de n=120 unidades cada, num processo de enchimento de garrafas de água mineral.
À esquerda os resultados obtidos por amostra, sendo 1 = defeituosa e 0 = conforme. À direita, dispersão ao longo
do tempo.

3.3. MELHORAR A ESTIMATIVA DE π

O exemplo da secção 3.2 mostra que são necessárias amostras muito grandes para
estimar a fracção defeituosa de um processo com um grau de precisão grande. O tamanho de
amostra necessário para se determinar π com uma determinada precisão estipulada a priori,
pode calcular-se do modo seguinte:

𝑧2
𝑛 = 𝜋(1 − 𝜋) [3]
𝛿2

Nesta equação, z é um valor da distribuição normal padrão que origina um determinado


intervalo de confiança e δ é o erro máximo admissível para a previsão. Que valores escolher
para π, z e δ?
• Em geral escolhe-se z = 1.96 que proporciona um grau de confiança de 0.95 (ou 95%);
• Para δ o valor a escolher vai depender do processo em causa, mas não pode ser um valor
muito grande. Suponha-se que se admitia um erro δ = 0.02 e que se obtinha, na prática, um
valor p=0.03. Então a estimativa seria que o processo produzia uma fracção de 0.03±0.02
defeituosos, i.e., 3±2% de unidades defeituosas, ou seja, entre 1% e 5%! É evidente que uma
tal estimativa seria muito má e por isso inútil, sendo necessários erros mais baixos. É
recomendável, para casos gerais, um δ = 0.005 (0.5%);
• Para π deve escolher-se um valor que seja considerado como plausível pela empresa. Se tal
valor não existir, então escolher um valor pequeno, porque não faz sentido que os processos
gerem muitas unidades defeituosas. Recomenda-se o valor π = 0.03, que já é muito grande!

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 10 de 33


M. Rui Alves

Com estas recomendações, para se ter 95% de certeza que a estimativa da fracção de
defeituosos do processo não erra por mais de 0.5%, o tamanho de amostra a usar será:

1.962
𝑛 = 0.03 × 0.97 × ≈ 5550
0.0052

Apresentam-se, na tabela seguinte, alguns tamanhos de amostras (em azul) necessários


para obter uma estimativa com um erro δ (em laranja) para diferentes fracções de defeituosos
previsíveis no processo (π, a amarelo), sempre com um grau de confiança de 95% (usando um
valor z = 1.96).

π
δ 0.005 0.01 0.05 0.25 0.5
0.005 764 1521 7299 28812 38416
0.01 191 380 1825 7203 9604
0.05 8 15 73 288 384

Nesta tabela verifica-se que em certas situações indicadas com células em fundo branco,
quando π é muito pequeno e δ grande, amostras pequenas podem ser suficientes para proceder
a certas estimativas da fracção de defeituosos. No entanto, porque à medida que o valor de π
decresce a distribuição binomial fica progressivamente mais assimétrica, a partir de certo ponto
não se pode usar a aproximação da distribuição normal à binomial. Esse ponto atinge-se quando
nπ<10 ou n(1-π)<10. Assim, na tabela que se segue, para as situações em que nπ<10, o tamanho
da amostra foi calculado como o mínimo n para o qual nπ=10:

π
δ 0,005 0,01 0,05 0,25 0,5
0,005 2000 1521 7299 28812 38416
0,01 2000 1000 1825 7203 9604
0,05 2000 1000 200 288 384

Verifica-se que quanto menos defeituosos houver no processo, e quanto menor for a
precisão necessária, menores serão os tamanhos das amostras necessários para estimar a fracção
real de defeituosos no processo. Mas também será verdade que o tamanho das amostras a usar
tem sempre de ser muito elevado.
Por exemplo, para estimar com ±0.5% de precisão a percentagem de defeituosos de um
processo que se supõe que não produza mais do que 1% de defeituosos, é necessária uma
amostra de n = 1521 unidades!
Nestes exemplos mostra-se que quanto pior for o processo, i.e., maior o π (andando para
a direita na tabela), maiores têm de ser os tamanhos das amostras a usar para estimar o valor
real de π. Se se pretender que essa estimativa tenha um erro pequeno (subindo na tabela)
aumentam os tamanhos das amostras. Estes exemplos mostram também que para estimar π com
um erro aceitável são sempre necessárias amostras muito grandes.

3.4. PREVISÃO DE RESULTADOS DAS AMOSTRAGENS

Sabendo qual o valor de π no processo, e supondo o processo estabilizado, os resultados


da amostragem seguem as leis de uma distribuição binomial. Em média, quando se recolhem
amostras de tamanho n, espera-se obter µ defeituosos na amostra e espera-se, também, que o
número de defeituosos vá variando de amostra para amostra, sendo essa variabilidade expressa
através do desvio padrão σ:

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 11 de 33


M. Rui Alves

𝜇 = 𝑛𝜋 𝜎 = √𝑛𝜋(1 − 𝜋) [4]

Se se trabalhar com fracções de defeituosos nas amostras, as expressões para a média e


desvio padrão devem ser divididas por n, obtendo:

𝜋(1 − 𝜋)
𝜇=𝜋 𝜎=√ [5]
𝑛

A equação [5] torna claro que a incerteza na previsão dos resultados das amostras, dada
por σ, é tanto menor quanto maior for n (divisor para o cálculo do desvio padrão).
Resumindo: é muito importante notar que nas populações caracterizadas por atributos,
o parâmetro que se calcula na prática é π (a fracção de defeituosos típica do processo). O modelo
para os resultados das amostragens, baseado na distribuição binomial, é calculado em função
de π (se for conhecido através da experiência da organização) ou através da uma estimativa
p=x/n (se não houver conhecimento prévio do processo).
Para calcular o número de defeituosos (x) que podem surgir em amostras (de tamanho
n) quando os processos estão estabilizados, faz-se:

𝑃(𝑥) = 𝐶𝑛𝑥 𝜋 𝑥 (1 − 𝜋)𝑛−𝑥 [6]

Na equação [6], P(x) lê-se "probabilidade de encontrar x unidades defeituosas, numa


amostra de n unidades, retirada de um processo com uma fracção de defeituosos igual a π".
Por exemplo, tendo como base a Figura 3, suponha-se que se considerava que o processo
produzisse uma fracção de π=0.03 unidades defeituosas e que o controlo da qualidade era feito
mediante a observação de uma amostra de n=10 unidades. O que se espera que aconteça, i.e.,
qual a previsão teórica? A resposta mostra-se na Figura 4.

X <- dbinom(x=c(0:10),size=10,prob=0.03)

barplot(X,names.arg=c(0:10),col=2,xlab="
x (nº unidades defeituosas na amostra",
+ ylab="probabilidade",main="caso teórico
para Pi=0.03 e n=10")
abline(h=0)

round(X,3)
0.737 0.228 0.032 0.003 0.000 0.000 0.000
0.000 0.000 0.000 0.000

Figura 4
Caso teórico para uma amostragem de n=10 unidades retiradas de um processo com π=0.03. A azul, à direita,
mostram-se as probabilidades de encontrar 0, 1, …, 10 defeituosos na amostra, sendo essas probabilidades
correspondentes à altura das colunas do gráfico à esquerda.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 12 de 33


M. Rui Alves

O que acaba de se expor mostra que a distribuição binomial pode ser usada para
comparar os resultados práticos com os dados teóricos e testar se existem razões para suspeitar
de desvios na fracção defeituosa típica de um processo. Mas, atendendo ao exposto na secção
3.2, para que os testes sejam fiáveis, as amostras a utilizar terão de ser muito grandes, de tal
modo grandes que muitas vezes inviabilizam qualquer prática de rotina fiável.

3.5. MÉTRICAS PARA ATRIBUTOS

Quando os processos se caracterizam por atributos, as principais métricas são a


estimativa da fracção de defeituosos do processo, a estimativa dos PPM produzidos e o nível
sigma (Zbench). A função SS.Defeituosos (ver anexo) resolve problemas relativos a processos
caracterizados por atributos, calculando as métricas e produzindo os aspectos gráficos
essenciais.

3.3.1 AMOSTRAS DE UMA SÓ OBSERVAÇÃO (n=1)

Considere-se o exemplo:
Garrafas de água são classificadas como “defeituosas” ou “1” se os rótulos estiverem mal
colados e como “conformes” ou “0” no caso contrário. Recolheu-se uma garrafa para análise
a cada 15 minutos. Ao fim de 60 horas (uma semana de trabalho) obtiveram-se os resultados
que se mostram na figura 5.

Para avaliar um processo, embora tal não seja recomendável, pode recolher-se uma só
unidade (amostra com n=1) em determinados períodos de tempo, num total de N amostras (neste
exemplo, N=240). Cada unidade deve então ser classificada como “defeituosa” atribuindo-lhe
o valor “1”, ou como “conforme” atribuindo-lhe o valor “0”. Assim, como resultado desse
trabalho, obtém-se uma sequência de n “zeros” e “uns” (ver Figura 5 ou o ficheiro defeituosos-
igual1.txt).
Uma vez que as amostras têm tamanho n=1, todos os dados recolhidos são considerados
uma amostra única de tamanho 240 e podem usar-se as equações [3] a [6].
A Figura 5, que apresenta o que se espera de um processo estabilizado, mostra que se
registaram 234 “zeros” e 6 “uns”, pelo que o número de defeituosos foi x=6. O valor p=x/n,
indica a fracção de defeituosos no total dados observados, sendo por isso a melhor estimativa
da fracção de defeituosos na produção (π). No exemplo, como x=6 defeituosos em N=240
unidades observadas, a estimativa de defeituosos na população, em fracção de defeituosos,
percentagem de defeituosos, e partes por milhão é, respectivamente:

p = 6/240 ≈ 0.025 100×6/240 ≈ 2.5% 1.000.000×6/240 = 25000 PPM

O desvio padrão e a incerteza (dada por z=3 que induz um intervalo de confiança de
99.74%) são:
0.025 × 0.975
𝜎=√ ≈ 0.01 𝑖𝑛𝑐𝑒𝑟𝑡𝑒𝑧𝑎 = ±1.96 × 0.01 = ±0.0196
240

π ∈ [0.025 ± 0.0196] ⟹ π ∈ [0.005 ; 0.049]

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 13 de 33


M. Rui Alves

Figura 5
VOP: função SS.Defeituosos a simular dados de um processo com π=0.03, e um total de N=120
amostras de tamanho n=1. Ilustração dos resultados típicos que se podem obter quando se analisa 1 só unidade
da produção em cada momento, considerando um processo estabilizado. À esquerda: simulação e resultados
estatísticos. À direita gráfico de barras mostrando o total de “não-defeituosos” (zeros) e de “defeituosos” (uns) e
linha temporal, mostrando a distribuição dos “zeros” e “uns” ao longo do tempo

Verifica-se que a estimativa do desempenho do processo, i.e., dos PPM produzidos, se


calcula directamente a partir do parâmetro da população!
Os PPM produzidos, quando se lida com atributos, são sempre por excesso. Por essa
razão o nível sigma reflecte directamente os PPMt estimados. Relembra-se que com variáveis
contínuas os defeituosos podem ser produzidos por defeito ou por excesso, e que por essa razão,
para calcular o Zbench, se somavam os PPMi e PPMs para obter os PPMt, supondo-os em seguida
produzidos por e calculando o Zbench como o valor z correspondente. Com variáveis discretas o
nível sigma é sempre por excesso e é sempre um nível de longo prazo (lp). Edte nível pode
obter-se em tabelas 6-sigma ou através de software (excel, R). No exemplo seguido, usando o
R, considerando uma distribuição normal com uma fracção defeituosa produzida por excesso
igual a 0.025, vem:
nível.sigma <- -qnorm(p=0.025,0,1); nível.sigma
[1] 1.95996

Para fazer este cálculo no Excel seria Zbench = -inv.normal(0,025;0;1). Se se pretender


um nível sigma de curto prazo (cp), que deve ser sempre visto com muta reserva, basta adicionar
1.5 ao valor obtido na prática:

Zbenchcp = Zbenchlp + 1.5 ≈ 1.96 + 1.5 = 3.46

A maioria dos cálculos efectuados ao longo desta secção 3.1 apresenta-se na figura 5,
que apresenta a saída da função SS.Defeituosos, construída no R para estudar processos com
KPIs binomiais. Na figura 5 os dados são uma simulação construída pela própria função a partir
dos argumentos P, N e n. Assim, usando esta função com os argumentos «Simular=“sim”» e
omitindo o argumento «File», pode gerar-se um conjunto de dados provenientes de um processo
e obter todas as métricas e gráficos apropriados.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 14 de 33


M. Rui Alves

3.3.2 AMOSTRAS DE TAMANHO IGUAL, N>1

Como se viu na secção anterior amostras de 1 só observação originam pouca definição


nos resultados e algumas deficiências no cálculo de limites para intervalos de confiança. Os
números têm, por isso, de ser aumentados, embora com isso aumente também o trabalho
necessário!
Considere-se, agora, que em vez de amostras de n=1, para aumentar a precisão do
controlo efectuado, se recolhem amostras com n>1. Nesse caso o exemplo poderia passar a ser:

Garrafas de água são classificadas como “defeituosas” ou “1” se os rótulos estiverem mal
colados e como “conformes” ou “0” no caso contrário. Recolheu-se uma amostra de n=5
garrafas para análise a cada 15 minutos. Ao fim de 60 horas obtiveram-se os resultados que
se mostram na figura 6.

A Figura 6 mostra os resultados de um processo estabilizado do qual se recolheram


N=240 amostras de tamanho n=5 (um total de 1200 garrafas inspeccionadas). Neste caso, o
número de defeituosos em cada amostra (x) pode variar entre 0 e 5. Havendo poucos
defeituosos, como é sempre de esperar em qualquer processo, obter-se-ão muitas amostras com
x=0 defeituosos, algumas amostras com x=1 defeituoso, poucas amostras com x=2 defeituosos,
e mais do que dois defeituosos serão raros.
Sendo xi o número de defeituosos numa amostra de tamanho n, e sendo N o número de
amostras, a melhor estimativa de π é dada pela percentagem média de defeituosos, 𝑝̅ , de acordo
com as equações [7]:
(1) total de defeituosos (soma dos xi) dividido pelo total de observações (n×N);
(2) em alternativa, pode calcular-se a percentagem de defeituosos por amostra, pi = xi/n, e usar
a média dessas percentagens 𝑝̅ como estimativa, obtendo exactamente o mesmo valor;
(3) o cálculo do desvio padrão é ajustado para o número de observações.

∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑝𝑖 𝑝̅(1 − 𝑝̅ )
π ~ 𝑝̅ = ou π ~ 𝑝̅ = e σ=√ [7]
𝑛𝑁 𝑁 𝑛𝑁

Estas equações mostram que é indiferente o facto de se efectuarem cálculos baseados


em amostras, ou no total dos dados existentes, já que basta somar o total de defeituosos
observados e dividir pelo número total de unidades inspeccionadas, independentemente da
forma como foram obtidos, para obter a estimativa da fracção de defeituosos do processo, π.
Todas as restantes métricas mantêm-se iguais. A Figura 6 mostra os resultados da função
SS.Defeituosos após leitura do ficheiro “defeituosos-nigual.txt” que contém dados de N=240
amostras de tamanho n=5. Como se pode observar na Figura 6, a estimativa de π é 0.0242, com
um intervalo de 95% de confiança de 0.0155 a 0.0329. Comparando este valor com o registado
no exemplo anterior (Figura 5) verifica-se que este intervalo é mais estreito, sendo tal devido
ao facto de que na Figura 5 o total de unidades era de Nn=240 unidades, ao passo que na Figura
6 o exemplo consiste em Nn=1200 unidades, baixando o desvio padrão, e consequentemente a
incerteza, por um factor igual a √1200/240 ≈ 2.24.
As restantes métricas mantêm-se como visto para o caso de amostras de tamanho 1.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 15 de 33


M. Rui Alves

Figura 6
VOP (função SS.Defeituosos a ler dados do ficheiro def-n+igu.txt”). Ilustração dos resultados típicos
que se obtêm quando se analisam N=120 amostras de tamanhos iguais. À esquerda: resumo dos dados lidos,
dados lidos e principais métricas. À direita, diagrama de barras relativo ao número de defeituosos por amostra e
gráfico temporal com a evolução ao longo do tempo.

3.6. AMOSTRAS DE TAMANHO DIFERENTE

Neste caso, porque as amostras têm tamanhos diferentes, não é interessante o número
de defeituosos por amostra, xi, porque não são comparáveis. Interessa calcular a percentagem
de defeituosos nas amostras, pi, pois assim podem comparar-se os resultados entre amostras.
Também importa substituir o gráfico de barras (relativo ao número de defeituosos por amostra
que se usou anteriormente) por um histograma com a percentagem de defeituosos por amostra.
Sendo os tamanhos de amostra variáveis, i.e., cada amostra com tamanho ni, as equações
são adaptadas em concordância (equações [8]), substituindo n×N pelo somatório de todos os
tamanhos de amostras (i.e., soma dos ni). Note-se que a média aritmética das fracções de
unidades defeituosas por amostra não pode ser usada para estimar π, mas apenas a média
ponderada. No entanto, como a estimativa pode ser feita somando todas as unidades defeituosas
encontradas, dividindo esse valor pelo total de unidades inspeccionadas, a equações seguintes
são suficientes para os cálculos necessários:

∑𝑁
𝑖=1 𝑥𝑖 𝑝(1 − 𝑝)
π~𝑝 = 𝑁 σ=√ [8]
∑𝑖=1 𝑛𝑖 ∑𝑁
𝑖=1 𝑛𝑖

As restantes métricas são iguais.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 16 de 33


M. Rui Alves

Figura 7
VOP (função SS.Defeituosos a ler dados do ficheiro defeituosos-ndif.txt”). Ilustração dos resultados típicos que
se obtêm quando se analisam N=120 amostras de tamanhos diferentes. À esquerda: resumo dos dados lidos,
dados lidos transformados em percentagem de defeituosos por amostra e principais métricas. À direita,
histograma relativo à percentagem de defeituosos e gráfico temporal com a evolução ao longo do tempo.

3.7. CONCLUSÃO SOBRE PROCESSOS E ATRIBUTOS

Quando se lida com atributos, o único parâmetro que caracteriza o processo é a fracção
de defeituosos produzida, tendo esse valor de ser encontrado na prática, ou estabelecido através
de uma especificação. O seu cálculo na prática, com rigor elevado, é difícil porque exige
amostras de número muito elevado. Se estabelecida por uma especificação, a sua verificação
na prática é também difícil pelas mesmas razões. O desvio padrão, que mede a variabilidade do
processo, não é determinado na prática, mas sim calculado matematicamente, a partir da fracção
de defeituosos e só tem interesse quando se usam amostras grandes, para as quais a similaridade
entre as distribuições normal e a binomial é grande. Os dados que se obtêm nas amostragens
têm de ser analisados com a distribuição binomial.
É indiferente trabalhar com amostras de tamanho 1, de tamanho maior do que 1, ou de
tamanhos diferentes, uma vez que as estimativas do parâmetro do processo, ou do seu
acompanhamento ao longo do tempo, podem ser sempre feitos através da divisão das unidades
defeituosos pelo número total de unidades inspeccionadas.
Os gráficos da evolução dos dados ao longo do tempo não permitem, com facilidade,
detectar desvios no parâmetro da população, a não ser que esses desvios sejam demasiado
grandes. Por essa razão todos os dados recolhidos na prática relativamente a atributos são
sempre considerados de longo prazo.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 17 de 33


M. Rui Alves

4. PROCESSOS CARACTERIZADOS POR DEFEITOS

Dois termos essenciais em 6-sigma são “complexidade” e “oportunidade”. Um processo


diz-se muito complexo se oferecer muitas oportunidades para que “as coisas corram mal”, i.e.,
muitas oportunidades para que surjam defeitos. Neste sentido, uma oportunidade é sinónimo
de um tipo de defeito.
Avaliar a complexidade de um processo envolve determinar com exactidão o número
de operações envolvidas, de partes, de conexões, etc., pois tal ajuda a definir correctamente
todos os tipos de defeitos possíveis de surgir, a que se chama oportunidades de defeitos. Este
trabalho, a ser feito, tem de ser feito de forma minuciosa e consistente, e tem de ser válido ao
longo do tempo.
A abordagem de defeitos pode ser entendida do modo seguinte: cada unidade produzida
é uma “área”, ou “espaço”, onde existem várias oportunidades de defeitos, e em que cada
oportunidade pode gerar um número muito variável de ocorrências. Quando se fala de processos
caracterizados por defeitos, fala-se de processos em que interessa o número de defeitos por
unidade (NDU), independentemente do tipo de defeitos em questão.
Então, é necessário entender que se se estiver interessado em estudar cada tipo de
defeito, se aplicam as técnicas descritas no capítulo 3 sobre processos caracterizados por
atributos. Neste capítulo interessa analisar os processos pelo número total de defeitos que as
unidades podem apresentar, independentemente do tipo de defeito em questão.

4.1. CARACTERIZAR O PROCESSO

Quando se trabalha com números de defeitos por unidade (x ou NDU), o parâmetro a


determinar para caracterizar o processo é o número médio de defeitos por unidade que o
processo produz, e designa-se por λ ou DPU. Espera-se que esse número seja baixo e os dados
resultantes da inspecção das unidades produzidas são constituídos por uma sequência de
números naturais, incluindo o zero, que seguem as leis de uma distribuição de Poisson. Um
exemplo dos resultados que se espera obter num processo caracterizado por contagem de
defeitos mostra-se na Figura 8.

4.2. ESPECIFICAÇÃO

A especificação deve sempre ter em conta que se pretende a existência de zero defeitos,
embora os processos nunca sejam isentos de defeitos. Assim, tal como visto para os atributos,
a especificação pode ser um número máximo de defeitos médio por unidade produzida, embora
apenas para controlo interno!

4.3. TERMINOLOGIA, CASO-ESTUDO E PROCEDIMENTO

A terminologia típica para este tipo de processos pode ser mais facilmente apreciada
com o auxílio de um caso estudo:

Estudou-se o processo de engarrafamento de água mineral e verificou-se que havia um total


de 5 oportunidades de defeitos (OD):
1) “Con” - mau enchimento (conteúdo inferior ao desejado)
2) “Gar” - má formação da garrafa (garrafa imperfeita)
3) “Rot” - má colagem do rótulo (rótulo inclinado ou enrugado)
4) “Cap” - mau encapsulamento (cápsula mal enroscada)
5) “Cra” - má cravação (fixação deficiente da cápsula à anilha do gargalo)

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 18 de 33


M. Rui Alves

Pretende-se avaliar o número de defeitos médios por unidade que o processo faz (λ). Para tal
efectuou-se a recolha de N=13 garrafas. Os resultados obtidos mostram-se na Figura 8..

Figura 8
Leitura e análise de dados com a função SS.Defeitos. Ilustração dos resultados típicos que se podem obter
quando se pesquisam defeitos em N=20 unidades, sabendo que em cada unidade há NO=5 oportunidades de
defeitos. À esquerda cálculo dos NDU (nº defeitos observado por unidade), DPU (nº médio de defeitos por
unidade), DPO (nº médio de defeitos por oportunidade) e DPMO observados, PPM e nível-sigma. À direita (em
cima) gráfico de barras mostrando o total de amostras com 0, 1,…, NO “defeitos”. À direita (em baixo) linha
temporal do processo.

Face aos resultados obtidos, efectua-se o trabalho seguinte:


1. Considera-se o NO, que é o número de oportunidades de defeitos em cada unidade. É muito
importante que as oportunidades de defeitos sejam muito bem definidas e equilibradas entre
si, caso contrário todos os resultados poderão ficar falseados. E.g., se em vez de 5 OD
tivermos uma sexta oportunidade onde nunca aparecem defeitos, estar-se-á a falsear os
resultados futuros. No caso estudo NO (número de oportunidades) = 5.
2. Uma vez definidas as OD, recolhe-se uma amostra de n unidades. No caso estudo, n=20.
3. Inspecciona-se cada unidade, registando o número de defeitos de cada tipo. Somam-se os
defeitos para obter o NDU (o número de defeitos em cada unidade analisada). Esta métrica
é fundamental porque cada unidade com NDU>0 é considerada defeituosa. A seguir
mostra-se o resultado da unidade nº3, que não apresentou qualquer defeito (NDU=0), sendo
considerada conforme, e a unidade nº4, onde se observaram dois defeitos, 1 na
oportunidade "Com" e outro na oportunidade "Gar", originando um total de 2 defeitos
(NDU=2), pelo que se trata de uma unidade defeituosa:

Con Gar Rot Cap Cra NDU


3 0 0 0 0 0 0
4 1 1 0 0 0 2

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 19 de 33


M. Rui Alves

4 Após a determinação dos NDU de todas as unidades, calcula-se o DPU, que é o número
médio de defeitos por unidade, e que se obtém somando todos os NDU e dividindo pelo
número total de unidades analisadas (n). No exemplo:

total defeitos ∑𝑛𝑖=1 𝑁𝐷𝑈𝑖 7


𝐷𝑃𝑈 = = = = 0.35
nº unidades 𝑛 20

5 No passo seguinte calcula-se o DPO, que é o número médio de defeitos por oportunidade,
e que se obtém somando todos os NDU e dividindo pelo número total de unidades (n)
multiplicado pelo número total de oportunidades (NO). No caso-estudo:

total defeitos ∑𝑛𝑖=1 𝑁𝐷𝑈𝑖 7


𝐷𝑃𝑂 = = = = 0.07
total oportunidades 𝑛 × 𝑁𝑂 20 × 5

6 A partir da métrica DPU pode estimar-se a fracção de unidades defeituosas (com pelo
menos um defeito) que serão produzidas. Note-se que ao contrário do estudo de processos
por atributos, aqui as unidades são defeituosas se apresentarem pelo menos 1 defeito no
conjunto dos tipos de defeitos definidos. Essa fracção, indicada por FD, estima-se através
da distribuição de Poisson, como FD = 1−e−DPU. No caso-estudo:

𝐹𝐷 = 1 − 𝑒 −𝐷𝑃𝑈 = 1 − 𝑒 −0.35 ≈ 0.295

7 Consequentemente, o desempenho do processo, expresso em unidades defeituosas por


milhão de unidades produzidas (PPM) é, no caso estudo:

𝐹𝐷 × 106 = 0.295 × 106 = 295000 𝑃𝑃𝑀

8 Dispondo da estimativa da fracção de unidades defeituosas, pode facilmente calcular-se o


nível sigma (Zbench) do processo, procurando o valor de z (da distribuição normal padrão)
que define, à direita, uma área igual a FD: Para tal, usar as tabelas seis-sigma, ou no R
usar a função qnorm(p=1-0.295,0,1), ou no Excel usar a função =inv.normal(0,295;0;1).
Em geral considera-se que este valor, baseado em várias amostras recolhidas ao longo do
tempo, é sempre um nível sigma de longo prazo. Para passar para curto prazo, somar 1.5,
e se for considerado de curto prazo para passar para longo prazo subtrair 1.5. No caso-
estudo:

𝑍𝑏𝑒𝑛𝑐ℎ = 𝑧 | 𝑃(𝑧 ≥ 𝑍𝑏𝑒𝑛𝑐ℎ ) = 𝐹𝐷 → 𝑍𝑏𝑒𝑛𝑐ℎ ≈ 0.54

> qnorm(p=1-0.295,0,1)
[1] 0.538836

4. A métrica mais famosa dos projectos seis-sigma é o DPMO, que aqui se


traduz por defeitos por milhão de oportunidades. Calcula-se o DPMO
multiplicando o DPO por 106. No caso-estudo:

𝐷𝑃𝑂 × 106 = 0.07 × 106 = 70000 𝐷𝑃𝑀𝑂

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 20 de 33


M. Rui Alves

Alguns autores usam os DPO como fracção de defeitos e calculam o nível sigma a partir
dessa métrica. No entanto, a proceder desse modo, os níveis sigma em processos com variáveis
contínuas, atributos e contagens não ficariam comparáveis.

4.4. DISTRIBUIÇÃO DE POISSON EM PROCESSOS 6σ

A distribuição de Poisson descreve os fenómenos raros e tem equação:

𝜆𝑥 × 𝑒 −𝜆
𝑃(𝑥 ) =
𝑥!

O parâmetro da distribuição é a média de defeitos, que se designa por λ (letra grega


lambda), sendo x o fenómeno em estudo (em 6-sigma interessa o número de defeitos total
encontrado nas unidades produzidas). Assim, por exemplo, sabendo que um processo gera 0.4
defeitos por unidade (λ = DPU = 0.4), a probabilidade de encontrar 2 defeitos numa unidade
seleccionada ao acaso (x = 2) é dada por:

0.42 × 𝑒 −0.4
𝑃(𝑥 = 2) = ≈ 0.054
2!

Este valor no Excel seria calculado com a instrução =dist.poisson(2;0,4;falso) e no R


com a instrução dpois(2,0.4).
O número de defeituosos produzidos por um processo no longo prazo pode ser calculado
probabilisticamente através da distribuição de Poisson: se o número médio de defeitos por
unidade é λ=DPU, no longo prazo espera-se que se produza a seguinte fracção de unidades
defeituosas:

𝐷𝑃𝑈 0 × 𝑒 −𝐷𝑃𝑈
𝑃(𝑥 > 0) = 1 − = 1 − 𝑒 −𝐷𝑃𝑈
0!

Por exemplo, se se determinou que um processo opera com (a terrível média de)
DPU=2, então espera-se que seja produzida, no longo prazo, a seguinte fracção defeituosa:

(1 − 𝑒−𝐷𝑃𝑈 ) = (1 − 𝑒−2 ) = 0.864665

e tal significaria que se esperaria que 86% das unidades produzidas teriam de ser renegociadas,
destruídas ou sujeitas a retrabalho!!!
O desvio padrão da distribuição de Poisson é dado pela raiz quadrada da média, i.e.:

𝜎 = √𝜆

Tal como acontecia com a distribuição binomial, também com a distribuição de Poisson
se coloca a necessidade de usar amostras de tamanho muito grande para conseguir avaliar, na
prática, o número de defeitos por unidade típico do processo. Por essa razão, esse parâmetro
tem de ser avaliado ao longo do tempo e preferencialmente com o auxílio de cartas de controlo
da qualidade.
De qualquer modo, se for considerado necessário e praticável na realidade empresarial,
os tamanhos das amostras a utilizar para a estimativa de λ com um grau de confiança elevado e
um erro pequeno são sempre semelhantes ao abordado para a distribuição binomial.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 21 de 33


M. Rui Alves

4.5. FUNÇÃO SS.DEFEITOS

A função SS.Defeitos pode simular dados ou analisar dados práticos existentes. Como
se pôde ver na Figura 8, a função analisa os dados e gera um relatório com uma tabela de
unidades analisadas por oportunidades de defeitos, calculando em seguida as métricas
discutidas. Além das métricas apresenta um gráfico de barras corresponde ao número de
defeitos por unidade e um gráfico de dispersão ao longo do tempo.
Para além da leitura de dados apresentada na Figura 8, a Figura 9 ilustra o processo de
simulação. Para usar esta modalidade definiu-se um vector, denominado Defeitos (de
oportunidades de defeitos), e um vector Lambdas (de médias de defeitos para a função proceder
à simulação), A função lê estes dois vectores e procede à simulação do caso especificado,
mostrando os dados simulados, e procedendo à sua análise. Esta modalidade permite estudar as
diferentes em face dos parâmetros considerados para cada oportunidade de defeito.

Figura 9
Simulação e análise de dados com a função SS.Defeitos. Exemplo criado com base no caso real da Figura 8, para
efeitos comparativos. Notar a necessária definição de dois vectores, um com os nomes das oportunidades de
defeitos e outro com os lambdas para cada defeito. À esquerda dados gerais, apresentação dos dados simulados,
resumo das contagens e métricas. À direita (em cima) gráfico de barras mostrando a distribuição dos NDU. À
direita (em baixo) linha temporal típica de um processo onde se analisam números de defeitos.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 22 de 33


M. Rui Alves

4.6. CONCLUSÃO SOBRE PROCESSOS E CONTAGENS

Uma questão muito importante relativamente aos processos estudados por contagens de
defeitos de vários tipos (diferentes oportunidades) diz respeito à correcta definição das
oportunidades de defeitos. Uma vez que as métricas NDU, DPU, DPO e DPMO todas
dependem do número de oportunidades definidas, se essa definição for mal feita, todas as
métricas resultam erradas.
Deve também notar-se que se os processos definidos por contagens tiverem apenas uma
oportunidade de defeitos, reduzem-se a processos por atributos.
A função SS.Defeitos calcula o nível sigma a partir da fracção de unidades defeituosas
estimadas, pois assim é comparável com os níveis sigma calculados nos processos com atributos
ou variáveis contínuas.

5. CONCLUSÃO GERAL

Como se demonstrou nas secções 3 e 4, a utilização de variáveis discretas, quer se trate


de atributos, quer de contagens, para analisar e melhorar processos, pode não ser a situação
ideal. Tal deve-se ao facto de que são necessárias amostras de grande dimensão para que se
consiga verificar alguma alteração no parâmetro populacional de interesse (fracção de
defeituosos típica do processo quando se trata de atributos, ou número de defeitos típico do
processo quando se trata de contagens).
Assim, sempre que possível, os processos devem ser estudados e deve tentar encontrar-
se uma ou mais variáveis (KPIs), contínuas, que possam ser medidas em alguma etapa do
processo, e que possam ser usadas em substituição das variáveis discretas. Tal permitirá uma
análise mais fina e um controlo mais rigoroso dos processos. Permitirá também desenvolver
projectos seis sigma com a possibilidade de detectar melhorias de modo mais rápido e preciso.
Independentemente das situações, as funções SS.Cp, SS.Normais, SS.Defeituosos e
SS.Defeitos, construídas em linguagem R, permitem ler dados reais e trabalhar em projectos
seis-sigma, ou simular dados reais e estudar esta temática. A função SS.Normais será
apresentada no Caderno relativo a projectos seis-sigma com variáveis normais.

6. BIBLIOGRAFIA

6.1. ESSENCIAL

Pysdek, T.; & Keller, P. (2010). The Six Sigma Handbook. New York: McGraw-Hill.
Wadsworth, H.; Stephens, K.; & Godfrey, B: (2008). Modern Methods For Quality Control and
Improvement. New York: John Wiley and Sons, Inc.

6.2. RECOMENDADA

Alves, M. R. (2020). Seis-Sigma com Variáveis Normais. Cadernos de Ciência, Tecnologia e


Gestão. ESTG, Instituto Politécnico de Viana do Castelo.
Alves, M. R. (20xx). Modelos Estatísticos para Variáveis Discretas. Cadernos de Ciência,
Tecnologia e Gestão. ESTG, Instituto Politécnico de Viana do Castelo.
Alves, M. R. (20xx). Modelos Estatísticos para Variáveis Contínuas. Cadernos de Ciência,
Tecnologia e Gestão. ESTG, Instituto Politécnico de Viana do Castelo.
Alves. M. R. (2011) Introdução à programação em R. Porto: Engebook – Conteúdos de
Engenharia e Gestão. ISBN: 978-972-8953-96-6.

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 23 de 33


M. Rui Alves

7. ANEXOS

7.1. FUNÇÃO SS.CP


# FUNÇÃO SS.Cp – vs3 de 04.04.2020. A PARTIR DE UMA ESPECIFICÃO E DOS
# PARÂMETROS DE UM PROCESSO, DESENHA O PROCESSO BASEADO NA MEDIA E
# DESVIO PADRÃO, E A ESPECIFICAÇÃO BASEADA EM VN E EA. SOMBREIA AS ÁREAS
# CORRESPONDENTES AOS DEFEITUOSOS. FAZ PRINT DE TABELAS COM A CAPACIDADE E
# O DESEMPENHO DO PROCESSO. SE PLOT != T DESENHA APENAS A ESPECIFICAÇÃO
# -----------------------------------------------------------------------

SS.Cp <- function(VN=1000,EA=15,Media=998,DP=4.5,Plot=T){


LIE <- VN-EA; LSE <- VN+EA; LIP <- Media-3*DP; LSP <- Media+3*DP
Left <- LIE-EA/2; Right <- LSE+EA/2
Upper <- dnorm(Media,Media,DP)*1.2
Lower <- dnorm(Media,Media,DP)*(-0.3)
plot(function(x) dnorm(x,mean=Media,sd=DP),type="n",
xlim=c(Left,Right),ylim=c(Lower,Upper))
abline(h=0)
if (Plot==T){
plot(function(x) dnorm(x,mean=Media,sd=DP),xlim=c(Left,Right),
ylim=c(Lower,Upper),col=4,lwd=2,xlab="KPI (variável X)",
ylab="dist normal (densidade)",main="Especificação vs Processo")
# processo
text(x=Media,y=-Lower/3,labels=expression(mu),col=4,pos=3)
text(x=LIP,y=-Lower/3,labels=expression(paste(mu,"-3",sigma)),
col=4,pos=3)
text(x=LSP,y=-Lower/3,labels=expression(paste(mu,"+3",sigma)),
col=4,pos=3)
segments(x0=c(LIP,Media,LSP),y0=Lower/6,
x1=c(LIP,Media,LSP),y=-Lower/3,col=4,lwd=2)
# defeituosos
a <- seq(from=Left-2*EA,to=LIE,length=100)
b <- dnorm(a,mean=Media,sd=DP)
arco <- c(0,b,0)
eixo <- c(from=Left-2*EA,a,to=LIE)
polygon(x=eixo,y=arco,border=4,lwd=2,col=3)
a <- seq(from=LSE,to=Right+2*EA,length=100)
b <- dnorm(a,mean=Media,sd=DP)
arco <- c(0,b,0)
eixo <- c(from=LSE,a,to=Right+2*EA)
polygon(x=eixo,y=arco,border=4,lwd=2,col=3)
} # end if
# especificação
segments(x0=LIE,y0=0,x1=LSE,y1=0,col=2,lwd=2)
segments(x0=c(LIE,VN,LSE),y0=Lower/3,
x1=c(LIE,VN,LSE),y=-Lower/6,col=2,lwd=2)
text(x=c(LIE,VN,LSE),y=Lower/3,labels=c("LIE","VN","LSE"),
col=2,pos=1)
# Métricas
AmpEsp <- LSE-LIE; AmpProc <- LSP-LIP; Cp <- AmpEsp/AmpProc
Cpi <- (LIE-Media)/(3*DP); Cps <- (LSE-Media)/(3*DP)
if (abs(Cpi)<abs(Cps)) {Cpk <- Cpi} else {Cpk <- Cps}
PPMi <- round(pnorm(q=LIE,mean=Media,sd=DP)*1000000,4)
PPMs <- round((1-pnorm(q=LSE,mean=Media,sd=DP))*1000000,4)
PPMt <- PPMi+PPMs
Disp <- round(100*3*DP/EA,1)
Zbench <- round(-qnorm(p=PPMt/1000000,mean=0,sd=1),3)
# tabelas de resultados
Especificação <- data.frame(LIE,VN,LSE,EA,2*EA)
names(Especificação) <- c("LIE","VN","LSE","EA","amplitude")
cat("\n especificação \n")
cat(" ---------------------------------------------------\n")
print.table(Especificação)
Processo <- data.frame(LIP,Media,LSP,DP,6*DP)
names(Processo) <- c("LIP","Média","LSP","DP","amplitude")
cat("\n processo \n")
cat(" ---------------------------------------------------\n")

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 24 de 33


M. Rui Alves

print.table(Processo)
Cp.table <- round(data.frame(AmpEsp,AmpProc,Cp,Cpi,Cps,Cpk),3)
Disp.table <- data.frame(PPMi,PPMs,PPMt,Disp,Zbench)
names(Disp.table) <- c("PPMi","PPMs","PPMt","D(%)","Zbench")
cat("\n tabela de capacidade do processo \n")
cat(" ---------------------------------------------------\n")
print.table(Cp.table)
cat("\n tabela de desempenho e nível sigma do processo \n")
cat(" ---------------------------------------------------\n")
print.table(Disp.table)
}
# -----------------------------------------------------------------------

# exemplo
SS.Cp(VN=500,EA=15,Media=500,DP=5,Plot=T)

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 25 de 33


M. Rui Alves

7.2. FUNÇÃO SS.DEFEITUOSOS


# FUNÇÃO SS.Defeituosos vs3 de 10.04.2020
# COM SIMULAR="não" e File="nomedefile.txt", LÊ FICHEIROS COM DADOS RELATIVOS
# A CONTAGEM DE DEFEITUOSOS FORNECIDOS PELO UTILIZADOR NA FORMA DE UMA TABELA.
# OS DADOS PODEM SER DE N AMOSTRAS DE n=1 OU n>1 (IGUAIS OU DIFERENTES).
# COM SIMULAR="sim" E COM "P" (% DEFEITUOSOS), "N" (Nº DE AMOSTRAS) E "n"
# (TAMANHO DE AMOSTRAS) DEFINIDOS, SIMULA DADOS DE UM PROCESSO.
# FAZ GRÁFICOS DE BARRAS E LINHA TEMPORAL, CALCULA PERCENTAGENS DE DEFEITUOSOS,
# PPMt E NÍVEL SIGMA.

SS.Defeituosos <- function(Simular="sim",P,N,n,Tabela,File) {

# simulação ou leitura de dados ----------

if (Simular=="sim" && missing(File)==TRUE) { #---------- simulação


if (missing(P)==TRUE || missing(N)==TRUE || missing(n)==TRUE) {
cat("\nPara simular dados indicar os valores «P» «N» e «n»\n\n")
break
}
if (P<0 || P>1) {cat("\nP tem de ser um valor entre 0 e 1\n\n");break}
cat("\nA simular resultados de N=",N," amostras com n=",n,"\n",sep="")
cat("retiradas de um processo com P=",P,". Simulação:\n\n",sep="")
x <- rbinom(n=N,size=n,p=P) # simulação
print(x)
n <- rep(n,times=N)
} else if (Simular=="não" && missing(File)==FALSE) { #---------- leitura
cat("\nA ler resultados do ficheiro «",File,"»\n",sep="")
Tab <- read.table(file=File,comment.char="#")
x <- Tab[,2]; n <- Tab[,1]; N <- length(x)
cat("nº amostras lidas: N=",N,"\n",sep="")
w1 <- x[x>n]
if(length(w1)!=0) {
cat("\n\nhá",length(w1),"amostras com mais defeituosos que unidades!\n\n")
break
}
if (any(n==0)) {cat("\n\nhá amostras com zero unidades!!!\n\n");break}
}else{ #---------- erros de simulação/leitura
cat("\nPara simular dados, fazer «Simular=sim» e omitir «File»\n")
cat("Para ler dados, fazer «Simular=não» e «File=nome-do-file»\n\n")
break
}
# produção de gráficos e tabelas
par(mfrow=c(2,1))
tamanho <- sum(n)/N # tem de dar número inteiro diferente de 1
tam <- 1 # para enviar mensagem quando n’s diferentes
if(all(n==1) || all(n==tamanho)){ # amostras de tamanho igual
if (Simular=="não") {
if(all(n==1)) {
cat("todas as amostras têm tamanho n=1\n")
} else {
cat("todas as amostras têm tamanho n=",tamanho,"\n",sep="")
}
cat("total de unidades lidas: ",sum(n),"\n",sep="")
}
y <- c() # nº de observações por nº de defeituosos
for (i in 0:max(x)) y <-c(y,length(x[x==i]))
classe <- c(0:max(x))
cat("\nresultados condensados:\n")
Tabela <- data.frame(classe,y)
names(Tabela) <- c("nº defeituosos","nº amostras")
print(Tabela)
barplot(y,names.arg=c(0:max(x)),horiz=F,col=2,ylim=c(0,max(y)*1.1),
main="classificação das unidades",
xlab="KPI (nº de defeituosos na amostra)",ylab="nº de amostras")
abline(h=0)
plot(x,type="b",col=2,ylim=c(-0.5,max(x)+2),pch=19,

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 26 de 33


M. Rui Alves

main="gráfico temporal",xlab="tempo",ylab="nº defeituosos")


} else { # amostras de tamanho diferente
cat("dados com amostras de tamanhos diferentes\n")
cat("total de unidades lidas: ",sum(n),"\n")
p <- x/n
cat("\nresultados em fracção defeituosa / amostra\n")
print(round(p,3))
cat("\nresultados condensados\n")
a <- hist(p,plot=F)
Tabela <- data.frame(a$counts,a$mids,100*a$mids)
names(Tabela) <- c("contagem","fracção","%")
print(Tabela)
hist(p,col=2,xlab="fracção de defeituosos na amostra",
main="histograma da fracção defeituosa",ylab="contagem")
plot(p,type="b",col=2,ylim=c(-0.005,max(p)*1.5),pch=19,
main="gráfico temporal",xlab="tempo",ylab="fracção")
tam <- 0
}
Med <- round(sum(x)/sum(n),4) # média por amostra
cat("\nFracção defeituosa na(s) amostra(s) é ",Med,"\n")
if(tam==0){cat("\n * nota: valor calculado para um n médio")}
DP <- sqrt(Med*(1-Med)/sum(n)) # estimativa de sigma
cat("Estimativa do desvio padrão é ",DP,"\n")
LI <- round(Med-1.96*DP,4); if(LI<0) LI <- 0
LS <- round(Med+1.96*DP,4)
cat("Intervalo de 95% de confiança para a fracção defeituosa do processo é:\n")
cat("[",LI," ; ",LS,"]\n")
Perc <- 100*Med # resultados em %
cat("\nPercentagem de defeituosos na(s) amostra(s) é ",Perc,"%\n",sep="")
PPMs <- Med * 1000000 # PPMs longo prazo
cat("Performance do processo é de ",PPMs," PPMt no longo prazo\n",sep="")
Zbench <- round(-qnorm(Med,0,1),2) # nível sigma
Zbench.cp <- Zbench+1.5
cat("Nível sigma (Zbench) é ",Zbench,"\n",sep="")
cat("Nível sigma de curto prazo = Zbench+1.5 = ",Zbench.cp,"\n\n",sep="")
}

# Exemplos
SS.Defeituosos(Simular="sim",P=0.01,N=10,n=5)
SS.Defeituosos(Simular="não",File="defeituosos-nigual.txt")
SS.Defeituosos(Simular="não",File="defeituosos-ndif.txt")
SS.Defeituosos(Simular="não",File="defeituosos-nigual1.txt")

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 27 de 33


M. Rui Alves

7.3. FUNÇÃO SS.DEFEITOS


# FUNÇÃO SS.Defeitos vs3 de 13.04.2020
# LÊ FICHEIROS FORNECIDOS PELO UTILIZADORCOM DADOS RELATIVOS À CONTAGEM DE
# DEFEITOS EM VÁRIAS OPORTUNIDADES,ESTANDO AS OPORTUNIDADES COMO NOMES DE
# COLUNAS. DEVE HAVER A 1ª COLUNA COM A NUMERAÇÃO DAS AMOSTRAS E SEM NOME.
# SIMULA DADOS, MAS PARA TAL EXIGE UM VECTOR COM NOMES DAS OPORTUNIDADES E
# UM VECTOR COM LAMBDAS PARA CADA OPORTUNIDADE
# FAZ GRÁFICOS DE BARRAS E LINHA TEMPORAL.

SS.Defeitos <- function(Simular="sim",defeitos,lambdas,N,File) {

if (Simular=="sim" && missing(File)==TRUE) {


NO <- length(defeitos); Def <- list()
for (i in 1:NO) Def[[i]]<-rpois(n=N,lambda=lambdas[i])
Tabela <- data.frame(Def[1:NO])
names(Tabela) <- c(defeitos[1:NO])
cat("\nDefeitos:",defeitos,"\n")
cat("Lambdas para simulação:", lambdas,"\n")
cat("Número de oportunidades é NO=",NO,"\n",sep="")
cat("Número de amostras é N=",N,"\n",sep="")
cat("Os dados simulados são:\n\n")

} else if (Simular=="não" && missing(File)==FALSE) {


Tabela <- read.table(file=File,comment.char="#")
defeitos=names(Tabela); NO <- length(defeitos); N <- length(Tabela[,1])
cat("\nDefeitos:",defeitos,"\n")
cat("Número de oportunidades é NO=",NO,"\n",sep="")
cat("Número de amostras é N=",N,"\n",sep="")
cat("Os dados lidos são:\n\n")

} else {
cat("\nPara simular dados, fazer «Simular=sim» e omitir «File»\n")
cat("Para ler dados, fazer «Simular=não» e «File=nome-do-ficheiro.txt»\n\n")
break
}

NDU <- c()


for(i in 1:N) NDU <- c(NDU,sum(Tabela[i,]))
Tabela <- data.frame(Tabela,NDU)
print(Tabela)

y <- c(); Max <- max(NDU)


for (i in 0:Max) y <- c(y, length(NDU[NDU==i]))
classe <- c(0:Max)
Tabela2 <- data.frame(classe,y)
names(Tabela2) <- c("nº defeitos","nºunidades")
cat("\nNDU - Número de defeitos nas unidades:\n")
print(Tabela2,row.names=F) # contagens

par(mfrow=c(2,1))
barplot(y,names.arg=c(0:Max),horiz=F,col=2,ylim=c(0,max(y)*1.1),
main="contagem de defeitos nas unidades",
xlab="KPI (NDU = nº de defeitos na unidade)",ylab="nº de unidades")
abline(h=0)
plot(NDU,type="b",col=2,ylim=c(-0.5,Max+2),pch=19,
main="gráfico temporal",xlab="tempo",ylab="NDU")
abline(h=0)

DPU <- sum(NDU)/N # nº médio defeitos/unidade


cat("\nnº médio defeitos/unidade: DPU=",DPU,"\n",sep="")
DPO <- sum(NDU)/(NO*N) # nº médio defeitos/oportunidade
cat("nº médio defeitos/oportunidade: DPO=",DPO,"\n",sep="")
DPMO <- DPO * 1000000 # DPMO
cat("defeitos/milhão de oportunidades: DPMO=",DPMO,"\n",sep="")
FDefs <- 1-ppois(q=0,lambda=DPU) # fracção de defeituosos
cat("estimativa da fracção de defeituosos: ",FDefs,"\n",sep="")

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 28 de 33


M. Rui Alves

PPMt <- FDefs * 1000000 # defeituosos em partes por milhão


cat("estimativa dos defeituosos totais em PPM: ",PPMt,"\n",sep="")
Zbench <- -qnorm(FDefs,0,1) # nível sigma
cat("nível sigma: Zbench=",Zbench,"\n",sep="")
} # -------------------------------------------------------------------

# Exemplos
Defeitos <- c("Con","Gar","Rot","Cap","Cra")
Lambdas <- c(0.1,0.01,0.2,0.03,0,05)
SS.Defeitos(Simular="sim",defeitos=Defeitos,lambdas=Lambdas,N=13)
SS.Defeitos(Simular="não",File="defeitos.txt")

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 29 de 33


M. Rui Alves

7.4. BASES DE DADOS


defeituosos-nigual1.txt

# coluna 1 = número da amostra


# coluna 2 = n (tamanho das amostras)
# coluna 3 = x (número de defeituosos na amostra)
# ler com: read.table("defeituosos-nigual1.txt",comment.char="#")
# os nomes «n» e «x» podem ser !=, mas a ordem tem de manter-se

n x n x n x
1 1 0 41 1 0 81 1 0
2 1 0 42 1 0 82 1 0
3 1 0 43 1 0 83 1 0
4 1 0 44 1 0 84 1 0
5 1 0 45 1 0 85 1 0
6 1 0 46 1 0 86 1 1
7 1 0 47 1 0 87 1 0
8 1 0 48 1 0 88 1 0
9 1 0 49 1 0 89 1 0
10 1 0 50 1 0 90 1 0
11 1 0 51 1 0 91 1 0
12 1 0 52 1 0 92 1 0
13 1 0 53 1 0 93 1 0
14 1 0 54 1 1 94 1 0
15 1 0 55 1 0 95 1 0
16 1 0 56 1 0 96 1 0
17 1 0 57 1 0 97 1 0
18 1 0 58 1 0 98 1 0
19 1 0 59 1 0 99 1 0
20 1 0 60 1 0 100 1 0
21 1 0 61 1 0 101 1 0
22 1 0 62 1 0 102 1 0
23 1 0 63 1 0 103 1 0
24 1 0 64 1 0 104 1 1
25 1 0 65 1 0 105 1 0
26 1 0 66 1 0 106 1 1
27 1 0 67 1 0 107 1 0
28 1 0 68 1 0 108 1 0
29 1 0 69 1 0 109 1 0
30 1 0 70 1 1 110 1 0
31 1 0 71 1 0 111 1 0
32 1 0 72 1 0 112 1 0
33 1 0 73 1 0 113 1 0
34 1 0 74 1 0 114 1 0
35 1 0 75 1 0 115 1 0
36 1 0 76 1 0 116 1 0
37 1 0 77 1 0 117 1 0
38 1 0 78 1 0 118 1 0
39 1 0 79 1 0 119 1 0
40 1 0 80 1 0 120 1 0

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 30 de 33


M. Rui Alves

defeituosos-nigual.txt

# coluna 1 = número da amostra


# coluna 2 = n (tamanho das amostras)
# coluna 3 = x (número de defeituosos na amostra)
# ler com: read.table("defeituosos-nigual.txt",comment.char="#")
# os nomes «n» e «x» podem ser !=, mas a ordem tem de manter-se

n x n x n x n x n x n x
1 5 0 41 5 0 81 5 0 121 5 1 161 5 0 201 5 0
2 5 0 42 5 0 82 5 1 122 5 0 162 5 0 202 5 0
3 5 0 43 5 0 83 5 0 123 5 0 163 5 0 203 5 0
4 5 0 44 5 0 84 5 0 124 5 0 164 5 0 204 5 0
5 5 0 45 5 0 85 5 0 125 5 0 165 5 0 205 5 0
6 5 0 46 5 0 86 5 0 126 5 0 166 5 0 206 5 0
7 5 0 47 5 0 87 5 0 127 5 1 167 5 0 207 5 0
8 5 0 48 5 0 88 5 2 128 5 0 168 5 0 208 5 0
9 5 0 49 5 0 89 5 1 129 5 0 169 5 0 209 5 1
10 5 0 50 5 0 90 5 0 130 5 0 170 5 0 210 5 1
11 5 0 51 5 0 91 5 0 131 5 0 171 5 0 211 5 0
12 5 1 52 5 0 92 5 0 132 5 1 172 5 1 212 5 0
13 5 1 53 5 0 93 5 0 133 5 0 173 5 0 213 5 1
14 5 0 54 5 0 94 5 1 134 5 0 174 5 1 214 5 0
15 5 0 55 5 0 95 5 1 135 5 0 175 5 0 215 5 0
16 5 0 56 5 0 96 5 0 136 5 1 176 5 0 216 5 0
17 5 0 57 5 0 97 5 0 137 5 0 177 5 0 217 5 0
18 5 0 58 5 0 98 5 0 138 5 0 178 5 0 218 5 0
19 5 0 59 5 0 99 5 1 139 5 0 179 5 1 219 5 0
20 5 0 60 5 1 100 5 0 140 5 0 180 5 0 220 5 0
21 5 0 61 5 0 101 5 0 141 5 0 181 5 1 221 5 0
22 5 0 62 5 0 102 5 0 142 5 0 182 5 0 222 5 0
23 5 0 63 5 0 103 5 0 143 5 0 183 5 0 223 5 0
24 5 0 64 5 0 104 5 0 144 5 0 184 5 0 224 5 0
25 5 0 65 5 0 105 5 0 145 5 0 185 5 0 225 5 0
26 5 0 66 5 0 106 5 0 146 5 0 186 5 0 226 5 0
27 5 0 67 5 0 107 5 0 147 5 0 187 5 1 227 5 0
28 5 0 68 5 0 108 5 1 148 5 0 188 5 1 228 5 2
29 5 0 69 5 0 109 5 0 149 5 0 189 5 0 229 5 0
30 5 0 70 5 0 110 5 0 150 5 0 190 5 0 230 5 0
31 5 0 71 5 0 111 5 0 151 5 0 191 5 0 231 5 0
32 5 0 72 5 0 112 5 0 152 5 0 192 5 0 232 5 0
33 5 0 73 5 0 113 5 1 153 5 0 193 5 0 233 5 0
34 5 1 74 5 0 114 5 0 154 5 0 194 5 0 234 5 0
35 5 0 75 5 0 115 5 0 155 5 0 195 5 0 235 5 0
36 5 0 76 5 0 116 5 0 156 5 0 196 5 0 236 5 0
37 5 0 77 5 0 117 5 1 157 5 0 197 5 0 237 5 0
38 5 0 78 5 0 118 5 0 158 5 0 198 5 0 238 5 0
39 5 0 79 5 0 119 5 0 159 5 0 199 5 0 239 5 0
40 5 0 80 5 0 120 5 0 160 5 0 200 5 0 240 5 0

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 31 de 33


M. Rui Alves

defeituosos-ndif.txt

# coluna 1 = número da amostra


# coluna 2 = n (tamanho das amostras)
# coluna 3 = x (número de defeituosos na amostra)
# ler com: read.table("defeituosos-ndifs.txt",comment.char="#")
# os nomes «n» e «x» podem ser !=, mas a ordem tem de manter-se

n x n x n x
1 14 0 41 16 0 81 13 0
2 12 1 42 12 0 82 13 0
3 16 0 43 13 0 83 13 0
4 15 1 44 9 0 84 13 0
5 11 1 45 14 0 85 12 0
6 9 2 46 10 2 86 11 0
7 12 2 47 9 0 87 12 0
8 14 1 48 14 0 88 9 2
9 11 1 49 11 0 89 12 0
10 12 0 50 15 2 90 13 0
11 11 1 51 9 0 91 10 1
12 12 0 52 11 0 92 13 1
13 12 0 53 11 0 93 13 1
14 11 0 54 11 0 94 7 0
15 15 0 55 12 0 95 13 0
16 9 0 56 9 1 96 12 0
17 11 3 57 10 1 97 12 1
18 19 0 58 10 0 98 13 0
19 9 2 59 11 2 99 13 0
20 10 1 60 10 1 100 13 1
21 11 0 61 10 0 101 13 0
22 11 1 62 10 0 102 12 0
23 9 0 63 9 1 103 11 0
24 11 0 64 12 0 104 12 0
25 10 0 65 9 1 105 11 0
26 11 1 66 15 0 106 12 1
27 10 0 67 17 1 107 12 0
28 10 0 68 15 1 108 9 1
29 17 0 69 12 0 109 12 0
30 9 0 70 16 1 110 11 2
31 10 0 71 11 1 111 11 0
32 11 0 72 20 2 112 10 1
33 14 0 73 9 0 113 13 0
34 15 0 74 11 1 114 13 3
35 16 0 75 13 0 115 13 0
36 10 0 76 11 1 116 12 1
37 15 0 77 11 2 117 13 1
38 14 1 78 9 0 118 9 1
39 9 0 79 12 3 119 10 0
40 9 0 80 13 1 120 9 1

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 32 de 33


M. Rui Alves

defeitos.txt

# tabela para ser lida com read.table("defeitos.txt", header=T)


# 20 linhas (N = 20 amostras) e 5 colunas (5 oportunidades de defeitos)

Con Gar Rot Cap Cra


1 0 0 0 0 0
2 0 0 0 0 0
3 0 0 0 0 0
4 1 1 0 0 0
5 0 0 0 0 0
6 0 0 0 0 0
7 0 0 0 0 0
8 0 0 1 0 0
9 0 0 0 0 0
10 1 0 0 0 0
11 0 0 0 0 0
12 0 0 2 0 0
13 0 0 0 0 0
14 0 0 0 0 0
15 0 0 0 0 0
16 0 0 0 0 0
17 0 0 0 0 0
18 0 0 0 0 0
19 0 0 0 0 0
20 0 0 1 0 0

Cadernos de Ciência, Tecnologia e Gestão, 1(4), 2018 Página 33 de 33

Você também pode gostar