Escolar Documentos
Profissional Documentos
Cultura Documentos
Chemical Company
- Relatório -
dezembro de 2015
Chemical Company
Resumo
O presente trabalho visa delinear um conjunto de orientações que promovam a
melhoria do processo de produção de uma empresa química – a Chem –, que tem
apresentado problemas de desempenho.
A análise tem por base uma amostra recolhida na última semana pelo engenheiro
responsável, a qual reúne observações referentes a diversas variáveis do processo: perdas
por hora, rotações por minuto (RPM), temperaturas das duas fases de produção (Temp1
e Temp2), fluxo de H2O, concentração do catalisador em dióxido de titânio (TiO2), linha
de produção, operário, nível de vácuo e fornecedor (“supplier”).
Principiando-se pela definição da variável dependente e malgrado o desconhecimento
de detalhes sobre o processo em estudo, estabelece-se como objetivo a minimização da
variável perdas por hora. A análise às restantes variáveis evidencia a concentração da
variável TiO2 em gamas específicas de valores e a relação direta entre estas e a variável
fornecedor, pelo que, face a tal redundância, a análise ulterior tem em conta apenas a
primeira.
Com recurso a análise gráfica (particularmente a gráficos boxplot) e a técnicas de
inferência estatística – como análise de variância (ANOVA) e testes de hipótese à
diferença de valores esperados e à razão de variâncias –, implementadas através do
software “Minitab 17”, conclui-se que a concentração em dióxido de titânio é o principal
fator estatisticamente significativo, sendo que menores concentrações deste composto
químico conduzem a valores inferiores da variável de resposta perdas por hora.
Recomenda-se, então, a utilização de catalisadores com baixa concentração em
dióxido de titânio, o que, in casu, é equivalente a recomendar que a empresa privilegie o
fornecedor “Boopy”.
Finalmente, destaca-se a pertinência de algumas análises/ações adicionais enquanto
potenciais trabalhos futuros: (i) recolha de nova amostra após implementação da
recomendação referida para aferir da existência de outros fatores significativos, (ii)
construção de cartas de controlo e análise da capacidade do processo, (iii) auscultação
dos operários e (iv) recurso a software de simulação.
i
Trabalho de Análise de Dados
Abstract
The current work tries to establish guidelines for the improvement of the production
process at a chemical company – Chem – that has shown performance problems.
Our analysis is based on a sample of observations of several process variables collected
in the most recent week by the engineer in charge: losses per hour, rotations per minute
(RPM), temperature of the two phases of production (Temp1 and Temp2), H2O flow,
concentration of titanium dioxide (TiO2) at the catalyzer, production line, worker, level
of vacuum and supplier.
Starting with the definition of the dependent variable of the process, despite the
ignorance of detail about the process, the goal is to minimize the variable losses per hour.
The analysis of the other variables reveals the concentration of the variable TiO2 on
specific ranges of values and a direct relation between these ranges and the variable
supplier. Thus only the first variable is considered in the forthcoming analysis.
A graphical analysis (particularly boxplot charts) and statistical inference techniques
– such as analysis of variance (ANOVA) and hypothesis tests on the difference of
expected values and on the ratio of variances –, performed with the Minitab 17 software
show that the concentration of titanium dioxide is the main statistically significant
explanatory factor, with lower levels of concentration resulting in lower levels of losses
per hour.
Therefore, we recommend that catalyzers with low levels of titanium dioxide
concentration are used which, in this case, is equivalent to recommending that Chem
prefers the supplier Boopy.
Finally, we highlight the relevance of several additional analysis or actions for future
work: (i) the analysis of a new sample after the implementation of our recommendation
to check the existence of other relevant factors, (ii) building control charts and analyzing
the capacity of the process, (iii) interviewing workers, and (iv) the use of simulation
software.
ii
Chemical Company
Índice de conteúdos
1 Introdução .................................................................................................................... 1
2 Descrição e análise das variáveis ................................................................................. 2
2.1 Descrição das variáveis .................................................................................... 2
2.2 A variável dependente perda por hora.............................................................. 3
2.3 As variáveis independentes e sua relação ........................................................ 4
3 Análise da variável de resposta em função das variáveis de entrada ........................... 5
3.1 Efeito das rotações por minuto ......................................................................... 7
3.2 Efeito do nível de concentração em dióxido de titânio .................................... 8
3.3 Foco nos fatores estatisticamente significativos .............................................. 9
4 Conclusões e recomendações para a melhoria do processo ....................................... 12
5 Trabalhos futuros ....................................................................................................... 13
Bibliografia ..................................................................................................................... 14
Anexos ............................................................................................................................ 15
iii
Trabalho de Análise de Dados
Índice de tabelas
Tabela 1. Variáveis em análise ...................................................................................................... 2
Tabela 2. Resultados dos testes ANOVA para as variáveis potencialmente não significativas .... 7
Tabela 3. Número de observações por par TiO2/RPM .................................................................. 9
Tabela 4. Diferenças entre níveis de RPM para o mesmo nível de TiO2: resultados dos testes .. 10
Índice de figuras
Figura 1. Análise da variável dependente "perda por hora" .......................................................... 3
Figura 2. Dotplot para a variável TiO2 .......................................................................................... 4
Figura 3. Histogramas para as variáveis Temp1 e Temp2 ............................................................ 4
Figura 4. Gráficos de dispersão perda por hora vs Temp1, Temp2 e TiO2 ................................... 5
Figura 5. Gráficos boxplot da variável perda por hora (agrupados de acordo com as variáveis
independentes) ............................................................................................................................... 6
Figura 6. Intervalos de Tukey (comparação por níveis de RPM) .................................................. 7
Figura 7. Intervalos de Tukey (comparação por níveis de TiO2) .................................................. 8
Figura 8. Boxplot da variável perda por hora (agrupado por TiO2 e por RPM) ............................ 9
Figura 9. Boxplot da perda por hora (baixa concentração em TiO2, por fluxo de H2O) ............. 11
Figura 10. Boxplot da perda por hora (baixa concentração em TiO2, por nível de vácuo) ......... 11
iv
Chemical Company
1 Introdução
1
Trabalho de Análise de Dados
1
Desconhecendo-se se a denominação da linha de produção teve por base algum método lógico que
permita a ordenação das classes segundo um critério relevante (nomeadamente por ordem de disposição
das linhas no espaço físico da empresa ou por ordem de antiguidade das linhas) optou-se por não
classificar a variável como “nominal” ou “ordinal”.
2
Chemical Company
Mean
Median
65 70 75
A distribuição dos dados sugere uma maior concentração na zona central, como é
característico das distribuições Gaussianas, embora o coeficiente de assimetria (positivo
de 0,111) aponte para uma distribuição assimétrica à direita. Não sendo o histograma da
Figura 1 conclusivo, é pertinente a realização de um teste à normalidade.
Optou-se pela formulação de Anderson-Darling, tendo-se obtido um valor de prova de
0,117 que é superior ao nível de significância adotado (5%), não havendo, então,
evidências estatísticas que apoiem a rejeição da hipótese de normalidade.
Relativamente à existência de outliers, os testes realizados sugerem a sua ausência,
permitindo uma análise posterior mais conclusiva.
3
Trabalho de Análise de Dados
para Temp1 e Temp2, respetivamente, o que não se opõe à hipótese de normalidade das
Median Median
4
Chemical Company
Loss/hr
Loss/hr
construção de gráficos de dispersão e do cálculo do coeficiente de determinação amostral
(r2). 60 60
Loss/hr
40
* Statistically significant
* Statistically
(p < 0,05)significant (p < 0,05)
110 115 120
60 125 60 130
Temp1
40
100
Selected Model Selected Model
Alternative Model Alt
Statistics Statistics Linear Linear
Quadratic
80
Loss/hr
Para analisar a relação entre a variável perda por hora e as variáveis RPM, fluxo de
H2O, concentração em TiO2 (baixa, média, elevada), linha de produção, operário e nível
de vácuo procedeu-se, inicialmente, à construção de gráficos boxplot, como documenta a
Figura 5. A exclusão da análise da variável supplier justifica-se pela sua relação direta
com os níveis de concentração em TiO2 (a análise de ambas resultaria numa redundância).
Boxplot da perda por hora (por RPM) Boxplot da perda por hora (por fluxo de H20) Boxplot da perda por hora (por TiO2)
120 120 120
80 80 80
Loss/hr
Loss/hr
Loss/hr
60 60 60
40 40 40
Boxplot da perda por hora (por linha) Boxplot da perda por hora (por operário) Boxplot da perda por hora (por vácuo)
120 120 120
80 80 80
Loss/hr
Loss/hr
Loss/hr
60 60 60
40 40 40
Figura 5. Gráficos boxplot da variável perda por hora (agrupados de acordo com as variáveis independentes)
Como expectável, os resultados dos quatro testes apontam para a não rejeição da
hipótese nula, ou seja, as variáveis testadas não têm efeito significativo na variação das
perdas por hora.
2
No caso específico do agrupamento por linha de produção das observações das perdas por hora, a
aplicação, baseada na normalidade da distribuição, do teste de Bartlett (teste bilateral com hipótese nula
assente na igualdade de todas as variâncias) apresenta como resultado a rejeição da hipótese nula, com
um valor de prova de 0,004, pelo que, aquando do teste ANOVA, não se deveria assumir a igualdade
de variâncias. Contudo, por simplificação da análise, ignorou-se o resultado do teste de Bartlett.
7
Trabalho de Análise de Dados
8
Chemical Company
100
90
80
Loss/hr
70
60
50
40
30
RPM 25 30 35 40 25 30 35 40 25 30 35 40
TiO2 L M H
Figura 8. Boxplot da variável perda por hora (agrupado por TiO2 e por RPM)
Como se percebe da Figura 8, existem alguns pares TiO2/RPM para os quais não se
registam observações e outros em que essas observações não são suficientes para
construir um boxplot completo. A Tabela 3 indica o número de observações para cada
par.
Tabela 3. Número de observações por par TiO2/RPM
RPM
25 30 35 40 Total
TiO2
Baixa (L) 16 22 2 0 40
Média (M) 0 6 20 4 30
Elevada (H) 12 0 1 17 30
Total 28 28 23 21 100
9
Trabalho de Análise de Dados
Tabela 4. Diferenças entre níveis de RPM para o mesmo nível de TiO2: resultados dos testes
Hipóteses Resultado P-value
Nível baixo de TiO2 H0: Os valores esperados das
Teste t para 2 amostras amostras são iguais (µ25-µ30=0) Não rejeitar H0.
0,714
(assumindo variâncias H1: Os valores esperados das IC = [-7,73; 5,39]
diferentes3) amostras são diferentes
H0: Os valores esperados das
Nível médio de TiO2
amostras são iguais
Teste ANOVA
H1: Pelo menos um valor Não rejeitar H0. 0,798
(assumindo variâncias
esperado de uma amostra é
iguais)
diferente
Nível elevado de TiO2 H0: Os valores esperados das
Teste t para 2 amostras amostras são iguais (µ25-µ40=0) Rejeitar H0.
0,030
(assumindo variâncias H1: Os valores esperados das IC = [-16,98; -0,93]
iguais4) amostras são diferentes
Face aos resultados expressos na Tabela 4, conclui-se que para os níveis de baixa e
média concentração em dióxido de titânio (os que apresentam menores perdas) a variação
do valor da variável RPM não conduz a variações significativas da variável dependente
perdas por hora.
Apenas quando a concentração em dióxido de titânio é elevada se mostra preferível a
opção pelo valor de 25 RPM em detrimento do valor de 40 RPM, uma vez que o primeiro
apresenta perdas por hora inferiores.
Assim, a concentração em dióxido de titânio surge como o principal fator
estatisticamente significativo. Embora, numa primeira fase, os testes realizados
indicassem a variável RPM como tendo impacto significativo na variação da variável da
resposta, tal não se mostra tão claro após a análise conjugada das variáveis RPM e TiO2.
Essa inferência inicial, que pode, agora, ser considerada falaciosa, mostra-se enviesada
precisamente por causa do desequilíbrio observado na distribuição do número de
observações pelos pares TiO2/RPM.
Pretendendo-se a melhoria do desempenho do processo, o que se traduz, in casu, no
objetivo de minimização das perdas, procurou-se, para finalizar a análise, estudar se para
um nível de baixa concentração em TiO2 (que se mostra como o que potencia menor
perdas) algum dos níveis das restantes variáveis independentes se mostra preferível.
Dos diversos testes ANOVA realizados, cujo detalhe se encontra nos Anexos,
destacam-se (por conduzirem à rejeição da hipótese nula) aqueles que envolvem o fluxo
de H2O e o nível de vácuo.
3
Foi aplicado um teste bilateral à razão de variâncias (admitindo que são normais as populações a partir
das quais se obtêm as amostras): o teste F. O resultado é de rejeição da hipótese nula (razão igual a 1),
com um valor de prova de 0,005. Assim, admite-se no teste T que as variâncias são diferentes.
4
Neste caso, o resultado é de não rejeição da hipótese nula (razão igual a 1), com um valor de prova de
0,314. Assim, admite-se no teste T que as variâncias são iguais.
10
Chemical Company
50
diferença estatisticamente signi-
40 ficativa é 300-200: [0,53; 15,73].
O nível 200 permite menores
30 perdas do que o nível 300.
200 250 300
H2O flow
Figura 9. Boxplot da perda por hora (baixa concentração em TiO2, por fluxo de H2O)
50
diferença estatisticamente signi-
40 ficativa é N-M: [-20,45; -1,07]. O
nível N permite menores perdas do
30
H L M N
que o nível M.
Vacuum
Figura 10. Boxplot da perda por hora (baixa concentração em TiO2, por nível de vácuo)
11
Trabalho de Análise de Dados
12
Chemical Company
5 Trabalhos futuros
5
Relembre-se que o desequilíbrio da amostra enviesou a análise do impacto da variável RPM na
variação da variável de resposta.
13
Trabalho de Análise de Dados
Bibliografia
14
Chemical Company
Anexos
Method
Factor Information
Analysis of Variance
Model Summary
Means
H2O
flow N Mean StDev 95% CI
200 34 67,53 21,63 (60,93; 74,12)
250 33 71,56 19,56 (64,86; 78,25)
300 33 71,47 16,54 (64,78; 78,17)
15
Trabalho de Análise de Dados
Method
Factor Information
Analysis of Variance
Model Summary
Means
16
Chemical Company
Method
Factor Information
Analysis of Variance
Model Summary
Means
17
Trabalho de Análise de Dados
Method
Factor Information
Analysis of Variance
Model Summary
Means
Bartlett’s method is used. This method is accurate for normal data only.
Line N StDev CI
5 20 19,9280 (13,9845; 33,2037)
7 20 26,6524 (18,7033; 44,4077)
9 20 15,6718 (10,9977; 26,1120)
12 20 10,7617 ( 7,5520; 17,9309)
15 20 18,5475 (13,0157; 30,9035)
Individual confidence level = 99%
Tests
Test
Method Statistic P-Value
Bartlett 15,26 0,004
18
Chemical Company
Method
Factor Information
Analysis of Variance
Model Summary
Means
19
Trabalho de Análise de Dados
Method
Factor Information
Analysis of Variance
Model Summary
Means
Coded
TiO2 N Mean StDev 95% CI
L 40 51,25 8,65 (48,32; 54,19)
M 30 74,13 8,48 (70,74; 77,53)
H 30 91,39 10,97 (88,00; 94,78)
Coded
TiO2 N Mean Grouping
H 30 91,39 A
M 30 74,13 B
L 40 51,25 C
20
Chemical Company
Method
F method was used. This method is accurate for normal data only.
Statistics
95% CI for
Variable N StDev Variance Variances
Loss/hr_L-25 16 11,546 133,301 (72,740; 319,303)
Loss/hr_L-30 22 5,867 34,418 (20,372; 70,289)
CI for
CI for StDev Variance
Method Ratio Ratio
F (1,236; 3,258) (1,529; 10,613)
Tests
Test
Method DF1 DF2 Statistic P-Value
F 15 21 3,87 0,005
21
Trabalho de Análise de Dados
Method
Factor Information
Analysis of Variance
Model Summary
Means
22
Chemical Company
Method
F method was used. This method is accurate for normal data only.
Statistics
95% CI for
Variable N StDev Variance Variances
Loss/hr_H-25 12 11,962 143,086 (71,804; 412,488)
Loss/hr_H-40 17 9,121 83,187 (46,142; 192,684)
CI for
CI for StDev Variance
Method Ratio Ratio
F (0,766; 2,384) (0,586; 5,684)
Tests
Test
Method DF1 DF2 Statistic P-Value
F 11 16 1,72 0,314
23
Trabalho de Análise de Dados
Method
Factor Information
Analysis of Variance
Model Summary
Means
H2O
flow N Mean StDev 95% CI
200 14 46,56 10,85 (42,18; 50,94)
250 13 52,88 6,11 (48,33; 57,43)
300 13 54,69 6,08 (50,14; 59,24)
H2O
flow N Mean Grouping
300 13 54,69 A
250 13 52,88 A B
200 14 46,56 B
24
Chemical Company
Method
Factor Information
Analysis of Variance
Model Summary
Means
25
Trabalho de Análise de Dados
Method
Factor Information
Analysis of Variance
Model Summary
Means
26
Chemical Company
Method
Factor Information
Analysis of Variance
Model Summary
Means
27