Você está na página 1de 33

Trabalho de Análise de Dados

Chemical Company
- Relatório -

Ana Rodrigues – 201204011


Andreia Silva – 201205957
Hermano Maia – 201208235
Mª Francisca Monteiro – 201004209

Gestão da Qualidade Total


Prof.ª Maria Henriqueta Sampaio da Nóvoa

Faculdade de Engenharia da Universidade do Porto


Mestrado Integrado em Engenharia Industrial e Gestão

dezembro de 2015
Chemical Company

Resumo
O presente trabalho visa delinear um conjunto de orientações que promovam a
melhoria do processo de produção de uma empresa química – a Chem –, que tem
apresentado problemas de desempenho.
A análise tem por base uma amostra recolhida na última semana pelo engenheiro
responsável, a qual reúne observações referentes a diversas variáveis do processo: perdas
por hora, rotações por minuto (RPM), temperaturas das duas fases de produção (Temp1
e Temp2), fluxo de H2O, concentração do catalisador em dióxido de titânio (TiO2), linha
de produção, operário, nível de vácuo e fornecedor (“supplier”).
Principiando-se pela definição da variável dependente e malgrado o desconhecimento
de detalhes sobre o processo em estudo, estabelece-se como objetivo a minimização da
variável perdas por hora. A análise às restantes variáveis evidencia a concentração da
variável TiO2 em gamas específicas de valores e a relação direta entre estas e a variável
fornecedor, pelo que, face a tal redundância, a análise ulterior tem em conta apenas a
primeira.
Com recurso a análise gráfica (particularmente a gráficos boxplot) e a técnicas de
inferência estatística – como análise de variância (ANOVA) e testes de hipótese à
diferença de valores esperados e à razão de variâncias –, implementadas através do
software “Minitab 17”, conclui-se que a concentração em dióxido de titânio é o principal
fator estatisticamente significativo, sendo que menores concentrações deste composto
químico conduzem a valores inferiores da variável de resposta perdas por hora.
Recomenda-se, então, a utilização de catalisadores com baixa concentração em
dióxido de titânio, o que, in casu, é equivalente a recomendar que a empresa privilegie o
fornecedor “Boopy”.
Finalmente, destaca-se a pertinência de algumas análises/ações adicionais enquanto
potenciais trabalhos futuros: (i) recolha de nova amostra após implementação da
recomendação referida para aferir da existência de outros fatores significativos, (ii)
construção de cartas de controlo e análise da capacidade do processo, (iii) auscultação
dos operários e (iv) recurso a software de simulação.

i
Trabalho de Análise de Dados

Abstract
The current work tries to establish guidelines for the improvement of the production
process at a chemical company – Chem – that has shown performance problems.
Our analysis is based on a sample of observations of several process variables collected
in the most recent week by the engineer in charge: losses per hour, rotations per minute
(RPM), temperature of the two phases of production (Temp1 and Temp2), H2O flow,
concentration of titanium dioxide (TiO2) at the catalyzer, production line, worker, level
of vacuum and supplier.
Starting with the definition of the dependent variable of the process, despite the
ignorance of detail about the process, the goal is to minimize the variable losses per hour.
The analysis of the other variables reveals the concentration of the variable TiO2 on
specific ranges of values and a direct relation between these ranges and the variable
supplier. Thus only the first variable is considered in the forthcoming analysis.
A graphical analysis (particularly boxplot charts) and statistical inference techniques
– such as analysis of variance (ANOVA) and hypothesis tests on the difference of
expected values and on the ratio of variances –, performed with the Minitab 17 software
show that the concentration of titanium dioxide is the main statistically significant
explanatory factor, with lower levels of concentration resulting in lower levels of losses
per hour.
Therefore, we recommend that catalyzers with low levels of titanium dioxide
concentration are used which, in this case, is equivalent to recommending that Chem
prefers the supplier Boopy.
Finally, we highlight the relevance of several additional analysis or actions for future
work: (i) the analysis of a new sample after the implementation of our recommendation
to check the existence of other relevant factors, (ii) building control charts and analyzing
the capacity of the process, (iii) interviewing workers, and (iv) the use of simulation
software.

ii
Chemical Company

Índice de conteúdos

1 Introdução .................................................................................................................... 1
2 Descrição e análise das variáveis ................................................................................. 2
2.1 Descrição das variáveis .................................................................................... 2
2.2 A variável dependente perda por hora.............................................................. 3
2.3 As variáveis independentes e sua relação ........................................................ 4
3 Análise da variável de resposta em função das variáveis de entrada ........................... 5
3.1 Efeito das rotações por minuto ......................................................................... 7
3.2 Efeito do nível de concentração em dióxido de titânio .................................... 8
3.3 Foco nos fatores estatisticamente significativos .............................................. 9
4 Conclusões e recomendações para a melhoria do processo ....................................... 12
5 Trabalhos futuros ....................................................................................................... 13
Bibliografia ..................................................................................................................... 14
Anexos ............................................................................................................................ 15

iii
Trabalho de Análise de Dados

Índice de tabelas
Tabela 1. Variáveis em análise ...................................................................................................... 2
Tabela 2. Resultados dos testes ANOVA para as variáveis potencialmente não significativas .... 7
Tabela 3. Número de observações por par TiO2/RPM .................................................................. 9
Tabela 4. Diferenças entre níveis de RPM para o mesmo nível de TiO2: resultados dos testes .. 10

Índice de figuras
Figura 1. Análise da variável dependente "perda por hora" .......................................................... 3
Figura 2. Dotplot para a variável TiO2 .......................................................................................... 4
Figura 3. Histogramas para as variáveis Temp1 e Temp2 ............................................................ 4
Figura 4. Gráficos de dispersão perda por hora vs Temp1, Temp2 e TiO2 ................................... 5
Figura 5. Gráficos boxplot da variável perda por hora (agrupados de acordo com as variáveis
independentes) ............................................................................................................................... 6
Figura 6. Intervalos de Tukey (comparação por níveis de RPM) .................................................. 7
Figura 7. Intervalos de Tukey (comparação por níveis de TiO2) .................................................. 8
Figura 8. Boxplot da variável perda por hora (agrupado por TiO2 e por RPM) ............................ 9
Figura 9. Boxplot da perda por hora (baixa concentração em TiO2, por fluxo de H2O) ............. 11
Figura 10. Boxplot da perda por hora (baixa concentração em TiO2, por nível de vácuo) ......... 11

iv
Chemical Company

1 Introdução

O presente trabalho é desenvolvido no âmbito da unidade curricular de Gestão da


Qualidade Total do 4.º ano do ciclo de estudos integrado conducente ao grau de Mestre
em Engenharia Industrial e Gestão da Faculdade de Engenharia da Universidade do Porto
e visa delinear um conjunto de orientações que promovam a melhoria do processo de
produção de uma empresa química – a Chem –, que tem apresentado problemas de
desempenho.
Para alcançar tal objetivo, afigura-se essencial a compreensão das principais causas de
preocupação. Assim, a análise basear-se-á nos dados recolhidos, durante a última semana,
sobre as variáveis fundamentais do processo e na aplicação de diversas técnicas
estatísticas através do software Minitab 17, da Minitab Inc..
Inicialmente, proceder-se-á à definição concreta das variáveis sob análise,
nomeadamente à identificação do seu tipo e à avaliação da centragem e dispersão dos
dados.
Ulteriormente, será caracterizada a variável dependente e serão identificadas as
variáveis independentes que apresentam impacto estatisticamente significativo na sua
variação. Nesta fase, destaque-se a importância da construção e interpretação de gráficos
boxplot e da técnica de inferência estatística ANOVA (análise de variância) a 1 fator.
Finalmente, serão elencadas recomendações para a melhoria do processo de produção,
sustentadas na análise supra referida, e avaliar-se-á a pertinência de análises adicionais
enquanto potenciais trabalhos futuros.

1
Trabalho de Análise de Dados

2 Descrição e análise das variáveis

2.1 Descrição das variáveis


A amostra recolhida é constituída por 100 observações, recolhidas pelo engenheiro
responsável, apresentando-se, na Tabela 1, o tipo das variáveis em análise, bem como os
valores tomados pelas mesmas (no caso de variáveis quantitativas contínuas são indicados
o mínimo e o máximo).
Tabela 1. Variáveis em análise
Nome Tipo Observações
Perda por hora Quantitativa contínua Entre 32,371 e 109,854
Rotações por minuto (RPM) Quantitativa discreta 25, 30, 35 ou 40
Temperatura na 1.ª fase de
Quantitativa contínua Entre 108,743 e 130,666
produção (Temp1)
Temperatura na 2.ª fase de
Quantitativa contínua Entre 126,844 e 168,452
produção (Temp2)
Fluxo de H2O Quantitativa discreta 200, 250 ou 300
Concentração do catalisador
Quantitativa contínua Entre 3,43504 e 8,37346
(em dióxido de titânio)
Linha de Produção Qualitativa1 5, 7, 9, 12 ou 15
Operário Qualitativa nominal Mike, Sam, Mary, Sue ou John
N-None, L-Low, M-Medium
Nível de vácuo Qualitativa ordinal
ou H-High
Fornecedor (“supplier”) Qualitativa nominal Boopy, Sloppy ou Grumpy

A variável perda por hora, do tipo quantitativa contínua, corresponderá à variável


dependente do processo, já que constitui uma medida de desempenho e o objetivo do
presente trabalho é, precisamente, a melhoria da performance do processo. As restantes
variáveis assumem-se como os inputs do processo químico.

1
Desconhecendo-se se a denominação da linha de produção teve por base algum método lógico que
permita a ordenação das classes segundo um critério relevante (nomeadamente por ordem de disposição
das linhas no espaço físico da empresa ou por ordem de antiguidade das linhas) optou-se por não
classificar a variável como “nominal” ou “ordinal”.

2
Chemical Company

2.2 A variável dependente perda por hora


Para iniciar o estudo do comportamento da variável perda por hora, foram calculadas
algumas medidas de localização e dispersão e construiu-se um histograma, que, em
domínio contínuo, permite uma perceção global da distribuição dos dados. A média situa-
-se em 70,159, ligeiramente inferior à mediana de 70,482. Por outro lado, o valor mínimo
é 32,371 e o máximo é 109,854, resultando numa amplitude de 77,483. O desvio padrão
é de 19,276.

Análise da variável dependente 'perda por hora'

Anderson-Darling Normality Test


A-Squared 0,60
P-Value 0,117
Mean 70,159
StDev 19,276
Variance 371,559
Skewness 0,110838
Kurtosis -0,850241
N 100
Minimum 32,371
1st Quartile 54,060
Median 70,482
3rd Quartile 83,635
Maximum 109,854
30 45 60 75 90 105
95% Confidence Interval for Mean
66,334 73,983
95% Confidence Interval for Median
62,711 76,742
95% Confidence Interval for StDev
16,924 22,392

95% Confidence Intervals

Mean

Median

65 70 75

Figura 1. Análise da variável dependente "perda por hora"

A distribuição dos dados sugere uma maior concentração na zona central, como é
característico das distribuições Gaussianas, embora o coeficiente de assimetria (positivo
de 0,111) aponte para uma distribuição assimétrica à direita. Não sendo o histograma da
Figura 1 conclusivo, é pertinente a realização de um teste à normalidade.
Optou-se pela formulação de Anderson-Darling, tendo-se obtido um valor de prova de
0,117 que é superior ao nível de significância adotado (5%), não havendo, então,
evidências estatísticas que apoiem a rejeição da hipótese de normalidade.
Relativamente à existência de outliers, os testes realizados sugerem a sua ausência,
permitindo uma análise posterior mais conclusiva.

3
Trabalho de Análise de Dados

2.3 As variáveis independentes e sua relação


Antes de partir para a análise da relação entre as variáveis independentes e a variável
dependente, importa realizar uma análise a cada uma das variáveis independentes,
particularmente daquelas que estão expressas em escala contínua: Temp1, Temp2 e TiO2.
Nesse sentido, foram construídos dotplots e histogramas.
No caso da variável TiO2, ou seja, da concentração do catalisador em dióxido de
titânio, o dotplot (Figura 2) sugere que os valores recolhidos se concentram em três
grupos: entre 3,4 e 4,4; entre 5,4 e 6,4 e entre 7,4 e 8,4. Foram, então, atribuídas,
respetivamente, as categorias de baixa (L), média (M) e elevada (H) concentração.

Dotplot para a variável TiO2

3,5 4,2 4,9 5,6 6,3 7,0 7,7 8,4


TiO2
Figura 2. Dotplot para a variável TiO2

Analisou-se, de seguida, a relação entre a variável supplier (que se assume ser o


fornecedor do catalisador) e a variável TiO2. Todas as observações que registam baixa
concentração em TiO2 têm como fornecedor o Boopy, todas as observações com média
concentração em TiO2 têm como fornecedor o Sloppy e, finalmente, todas as observações
com elevada concentração em TiO2 têm como fornecedor o Grumpy.
Relativamente às variáveis Temp1 e Temp2, estas não parecem seguir a tendência de
agrupamento em gamas específicas de valores como a variável TiO2, estando as
observações, sobretudo para Temp2, concentradas na zona central. Temp1 apresenta uma
média de 119,70 e um desvio padrão de 4,99, enquanto para Temp2 a média situa-se em
145,51 e o desvio padrão é de 7,76.
Temp1 Anderson-Darling Normality Test Temp2 Anderson-Darling Normality Test
A-Squared 0,61 A-Squared 0,26
P-Value 0,108 P-Value 0,692
Mean 119,70 Mean 145,51
StDev 4,99 StDev 7,76
Variance 24,87 Variance 60,28
Skewness -0,130627 Skewness 0,175026
Kurtosis -0,687895 Kurtosis 0,432771
N 100 N 100
Minimum 108,74 Minimum 126,84
1st Quartile 115,97 1st Quartile 140,39
Median 120,26 Median 145,18
3rd Quartile 122,79 3rd Quartile 150,43
Maximum 130,67 Maximum 168,45
95% Confidence Interval for Mean 95% Confidence Interval for Mean
108 112 116 120 124 128 118,71
127,5 135,0 120,69 142,5 150,0 157,5 165,0 143,96 147,05
95% Confidence Interval for Median 95% Confidence Interval for Median
118,61 121,82 143,29 147,32
95% Confidence Interval for StDev 95% Confidence Interval for StDev
4,38 5,79 6,82 9,02

Figura 3. Histogramas para as variáveis Temp1 e Temp2


95% Confidence Intervals 95% Confidence Intervals

O teste à normalidade de Anderson-Darling regista valores de prova de 0,108 e 0,692


Mean Mean

para Temp1 e Temp2, respetivamente, o que não se opõe à hipótese de normalidade das
Median Median

suas distribuições. Averiguou-se a eventual relação de Temp1 e Temp2 entre si e com as


119 120 121 122 143 144 145 146 147

restantes variáveis independentes, contudo nenhuma se destacou.

4
Chemical Company

3 Análise da variável de resposta em função dasRegression


variáveis de entrada
for Loss/hr
Regression
vs Temp1
for Loss/hr vs Temp1
Y: Loss/hr Y: Loss/hr Model Selection Model
Report Selection Report
X: Temp1 X: Temp1
Nesta secção, pretende-se identificar quais dos inputs do processo químico apresentam
Fitted Line Plot for Fitted
LinearLine
Model
Plot for Linear Model
Y = 169,5 -
um efeito estatisticamente significativo na variação da variável de resposta (perdas0,8296Y=X 169,5 - por
0,8296 X Large residual
120 120
hora), ou seja, visa-se a definição dos X’s vitais.
100 entre as 100
Principiou-se pela análise da relação variáveis independentes quantitativas
expressas em escala contínua (Temp1, Temp2 e TiO2) e variável de resposta através da
80 80

Loss/hr

Loss/hr
construção de gráficos de dispersão e do cálculo do coeficiente de determinação amostral
(r2). 60 60

Regression for Loss/hr vs Temp1


Y: Loss/hr 40
Model Selection Report 40
X: Temp1

Fitted Line Plot for Linear Model


Regression for Regression
Loss/hr vs Temp2
for Loss/hr vs Temp2
Y = 169,5 - 0,8296 X 110
Y: Loss/hr Y: Loss/hr
Large residual
110
115 Model115
120
Selection Model 120
125
ReportSelection Report 125
130
120 X: Temp2 X: Temp2 Temp1 Temp1
Fitted Line Plot forFitted
LinearLine
Model
Plot for Linear Model Large residual
100 Y = 108,5 - 0,2637
Y =X 108,5 - 0,2637 X Unusual X
Selected Model Selected
Alternative
ModelModel Alte
120 120
Statistics Statistics Linear Linear
Quadratic
80
Loss/hr

R-squared (adjusted)R-squared (adjusted) 3,63% 3,63%


3,47%
P-value, model P-value, model 0,032* 0,032*
0,067
100 100 linear term P-value, linear term
P-value, 0,032* 0,032*
0,392
60 P-value, quadratic term
P-value, quadratic term — —0,365
Residual standard deviation
Residual standard deviation 18,922 18,922
18,939
80 80
Loss/hr

Loss/hr

40
* Statistically significant
* Statistically
(p < 0,05)significant (p < 0,05)
110 115 120
60 125 60 130
Temp1

Regression for Loss/hr vs Temp2


Y: Loss/hr Model Selection Report
Selected40
Model 40
Alternative Model
X: Temp2 Statistics Linear Quadratic
R-squared (adjusted) Fitted Line Plot for Linear 3,63%
Model 3,47% Regression for Regression for Loss/hr vs TiO2
Loss/hr vs TiO2
130 Large residual 130140 140150 150160 16017
P-value, model Y = 108,5 - 0,2637 X0,032* 0,067
Y: Loss/hr
Y: Loss/hr 0,392Unusual X Model SelectionModel
ReportSelection Report
P-value, linear term 0,032* Temp2 Temp2
120 P-value, quadratic term — X: TiO2 0,365 X: TiO2
Residual standard deviation 18,922 18,939
Fitted Line Plot forFitted
LinearLine Plot for Linear Model
Model
100 * Statistically significant (p < 0,05) Y=
Y = 10,84 + 10,23 X 10,84
Selected + 10,23
Model X
Selected
AlternativeLarge
ModelModelresidua
Alte
120 Statistics
120 Statistics Linear Linear
Quadratic
80 R-squared (adjusted)R-squared (adjusted) 0,12% 0,12%
1,58%
Loss/hr

P-value, model P-value, model 0,293 0,293


0,172
100 100 linear term P-value, linear term
P-value, 0,293 0,293
0,131
60 P-value, quadratic term
P-value, quadratic term — —0,121
Residual standard deviation
Residual standard deviation 19,264 19,264
19,123
80 80
Loss/hr
Loss/hr

40

130 140 150 160 170


60 60
Temp2

Regression for Loss/hr vs TiO2


Y: Loss/hr Model SelectionSelected
Report 40
Model 40
Alternative Model
X: TiO2 Statistics Linear Quadratic
R-squared (adjusted) 0,12%
Fitted Line Plot for Linear Model 1,58%
P-value, model Y = 10,84 + 10,23 X 0,293 3 0,172 3
4 residual
Large 54 65 76 87
P-value, linear term 0,293 0,131
120 P-value, quadratic term — 0,121 TiO2 TiO2
Residual standard deviation 19,264 19,123

100
Selected Model Selected Model
Alternative Model Alt
Statistics Statistics Linear Linear
Quadratic
80
Loss/hr

R-squared (adjusted)R-squared (adjusted) 77,44% 77,44%


77,53%
P-value, model P-value, model 0,000* 0,000*
0,000*
P-value, linear term P-value, linear term 0,000* 0,000*
0,004*
60 P-value, quadratic term —0,240
P-value, quadratic term —
Residual standard deviation
Residual standard deviation 9,156 9,156
9,137
40
* Statistically
* Statistically significant (p < 0,05)significant (p < 0,05)
3 4 5 6 7 8 9
TiO2

Figura 4. Gráficos de dispersão perda por


Selected Model
hora vs Temp1, Temp2 e TiO2
Alternative Model
Statistics Linear Quadratic
R-squared (adjusted) 77,44% 77,53%
P-value, model 0,000* 0,000*
P-value, linear term 0,000* 0,004*
P-value, quadratic term — 0,240
Residual standard deviation 9,156 9,137 5
* Statistically significant (p < 0,05)
Trabalho de Análise de Dados

No caso das temperaturas de ambas as fases de produção, considerando os valores


reduzidos de r2 (3,63% para Temp1 e 0,12% para Temp2) e a considerável dispersão
espelhada nos gráficos, parece inexistir relação destas variáveis com a variável de
resposta. Relativamente à relação da concentração em dióxido de titânio com as perdas
por hora, obteve-se um r2 de 77,44%, sendo que o gráfico evidencia, como já referido
anteriormente, a concentração da variável TiO2 em três gamas distintas de valores. As
concentrações mais elevadas em dióxido de titânio registam um maior valor de perdas
por hora, embora dentro de cada gama de valores se observe alguma dispersão.

Para analisar a relação entre a variável perda por hora e as variáveis RPM, fluxo de
H2O, concentração em TiO2 (baixa, média, elevada), linha de produção, operário e nível
de vácuo procedeu-se, inicialmente, à construção de gráficos boxplot, como documenta a
Figura 5. A exclusão da análise da variável supplier justifica-se pela sua relação direta
com os níveis de concentração em TiO2 (a análise de ambas resultaria numa redundância).
Boxplot da perda por hora (por RPM) Boxplot da perda por hora (por fluxo de H20) Boxplot da perda por hora (por TiO2)
120 120 120

100 100 100

80 80 80
Loss/hr

Loss/hr

Loss/hr

60 60 60

40 40 40

25 30 35 40 200 250 300 L M H


RPM H2O flow TiO2

Boxplot da perda por hora (por linha) Boxplot da perda por hora (por operário) Boxplot da perda por hora (por vácuo)
120 120 120

100 100 100

80 80 80
Loss/hr

Loss/hr

Loss/hr

60 60 60

40 40 40

5 7 9 12 15 John Mary Mike Sam Sue H L M N


Line Operator Vacuum

Figura 5. Gráficos boxplot da variável perda por hora (agrupados de acordo com as variáveis independentes)

Da análise visual, resulta a perceção de que as variáveis RPM e nível de concentração


em TiO2 terão impacto na variação da variável de resposta. No primeiro caso, o gráfico,
embora sendo pouco conclusivo quando RPM é 25, sugere, para os restantes valores de
RPM (30, 35 e 40), que quanto mais elevado for o valor de rotações por minuto, mais
perdas por hora o processo terá. Por outro lado, uma maior concentração em TiO2
aparenta implicar valores mais elevados da variável de resposta.
Em sentido contrário, as variáveis fluxo de H2O, operário, nível de vácuo e linha de
produção – esta última com algumas reservas – parecem não ter impacto significativo na
variação da variável de resposta. Para confirmar a inexistência desse impacto, recorreu-
-se a testes ANOVA (análise de variância), a 1 fator, para cada uma das quatro variáveis.
6
Chemical Company

Os testes pressupuseram variâncias iguais2 e seguiram a seguinte formulação:


Hipótese nula (H0): Os valores esperados das amostras são iguais.
Hipótese alternativa (H1): Pelo menos um valor esperado de uma amostra é diferente.
O nível de significância adotado foi de 5%, indicando-se na Tabela 2 os resultados.
Tabela 2. Resultados dos testes ANOVA para as variáveis potencialmente não significativas
Variável Resultado P-Value
H2O flow Não rejeitar H0. 0,623
Operário Não rejeitar H0. 0,971
Vácuo Não rejeitar H0. 0,573
Linha Não rejeitar H0. 0,177

Como expectável, os resultados dos quatro testes apontam para a não rejeição da
hipótese nula, ou seja, as variáveis testadas não têm efeito significativo na variação das
perdas por hora.

3.1 Efeito das rotações por minuto


A análise gráfica sugeriu a possibilidade da variável RPM ter efeito significativo na
variação da variável de resposta. Aplicou-se, então, um teste ANOVA, a 1 fator, com
formulação idêntica aos testes anteriores e construíram-se intervalos de confiança de
Tukey, a 95%.
O resultado do teste ANOVA é de rejeição da hipótese nula, com um valor de prova
de 0,000, pelo que existem evidências estatísticas de que as rotações por minuto
apresentam um impacto significativo no valor das perdas por hora.

Figura 6. Intervalos de Tukey (comparação por níveis de RPM)

2
No caso específico do agrupamento por linha de produção das observações das perdas por hora, a
aplicação, baseada na normalidade da distribuição, do teste de Bartlett (teste bilateral com hipótese nula
assente na igualdade de todas as variâncias) apresenta como resultado a rejeição da hipótese nula, com
um valor de prova de 0,004, pelo que, aquando do teste ANOVA, não se deveria assumir a igualdade
de variâncias. Contudo, por simplificação da análise, ignorou-se o resultado do teste de Bartlett.

7
Trabalho de Análise de Dados

Rejeitada a hipótese nula, a construção de intervalos de confiança de Tukey é relevante


para concluir quais os valores esperados que são significativamente diferentes uns dos
outros. Os intervalos para as diferenças 40-35, 40-30 e 40-25, não contêm o valor zero,
incluindo apenas valores positivos, pelo que se infere que dos quatro níveis estudados
para a variável RPM, o nível 40 é aquele que apresenta piores resultados, na medida em
que potencia um valor superior da variável perdas por hora. A diferença dos valores
esperados para níveis de RPM de 35 e 30 é também significativa, sendo preferível o nível
30, pois o mesmo possibilita um valor menor de perdas por hora.
Embora não se observem (com α=5%) diferenças significativas entre os valores
esperados 35-25 e 30-25, existem indícios, tendo em conta a representação gráfica dos
intervalos, que podem suportar a preferência do nível 25 em detrimento do nível 35 e do
nível 30 em detrimento do nível 25.

3.2 Efeito do nível de concentração em dióxido de titânio


Seguindo igual procedimento ao adotado na análise do efeito das rotações por minuto,
a aplicação do teste ANOVA teve como resultado a rejeição da hipótese nula, com um
valor de prova de 0,000. Assim, existem evidências estatísticas de que o efeito do nível
de concentração em dióxido de carbono é significativo. Importa, então, analisar os
intervalos de confiança de Tukey, de forma a identificar qual o nível de concentração que
minimiza as perdas do processo.

Figura 7. Intervalos de Tukey (comparação por níveis de TiO2)

As três diferenças de valores esperados estudadas são significativas, sendo possível


concluir que níveis superiores de concentração em dióxido de titânio implicam perdas
superiores. Será então de preferir a utilização de catalisadores com baixos níveis de TiO2,
ou seja, deve privilegiar-se o fornecedor Boopy e evitar-se o fornecedor Grumpy.

8
Chemical Company

3.3 Foco nos fatores estatisticamente significativos


Tendo em conta que a análise e testes realizados indicam que as variáveis
independentes RPM e TiO2 são estatisticamente significativas no que concerne à variação
da variável dependente perda por hora, é relevante proceder a uma análise combinada
daquelas variáveis, ou seja, agrupar as observações por par TiO2/RPM. Começou-se,
então, pela construção do boxplot da Figura 8.

Boxplot da perda por hora (por TiO2 e por RPM)


110

100

90

80
Loss/hr

70

60

50

40

30
RPM 25 30 35 40 25 30 35 40 25 30 35 40
TiO2 L M H

Figura 8. Boxplot da variável perda por hora (agrupado por TiO2 e por RPM)

Como se percebe da Figura 8, existem alguns pares TiO2/RPM para os quais não se
registam observações e outros em que essas observações não são suficientes para
construir um boxplot completo. A Tabela 3 indica o número de observações para cada
par.
Tabela 3. Número de observações por par TiO2/RPM
RPM
25 30 35 40 Total
TiO2
Baixa (L) 16 22 2 0 40
Média (M) 0 6 20 4 30
Elevada (H) 12 0 1 17 30
Total 28 28 23 21 100

Além do evidente desequilíbrio no número de observações para cada par, nota-se,


desde logo, que as observações com 40 RPM estão sobretudo associadas a níveis elevados
de dióxido de titânio, enquanto as observações com 30 RPM têm associado um nível
baixo de dióxido de titânio.
Ignorando os pares para os quais o número de observações é igual ou inferior a 2,
prossegue-se a análise com a realização de testes de hipótese e ANOVA, cuja formulação
e resultados estão indicados na Tabela 4.

9
Trabalho de Análise de Dados

Tabela 4. Diferenças entre níveis de RPM para o mesmo nível de TiO2: resultados dos testes
Hipóteses Resultado P-value
Nível baixo de TiO2 H0: Os valores esperados das
Teste t para 2 amostras amostras são iguais (µ25-µ30=0) Não rejeitar H0.
0,714
(assumindo variâncias H1: Os valores esperados das IC = [-7,73; 5,39]
diferentes3) amostras são diferentes
H0: Os valores esperados das
Nível médio de TiO2
amostras são iguais
Teste ANOVA
H1: Pelo menos um valor Não rejeitar H0. 0,798
(assumindo variâncias
esperado de uma amostra é
iguais)
diferente
Nível elevado de TiO2 H0: Os valores esperados das
Teste t para 2 amostras amostras são iguais (µ25-µ40=0) Rejeitar H0.
0,030
(assumindo variâncias H1: Os valores esperados das IC = [-16,98; -0,93]
iguais4) amostras são diferentes

Face aos resultados expressos na Tabela 4, conclui-se que para os níveis de baixa e
média concentração em dióxido de titânio (os que apresentam menores perdas) a variação
do valor da variável RPM não conduz a variações significativas da variável dependente
perdas por hora.
Apenas quando a concentração em dióxido de titânio é elevada se mostra preferível a
opção pelo valor de 25 RPM em detrimento do valor de 40 RPM, uma vez que o primeiro
apresenta perdas por hora inferiores.
Assim, a concentração em dióxido de titânio surge como o principal fator
estatisticamente significativo. Embora, numa primeira fase, os testes realizados
indicassem a variável RPM como tendo impacto significativo na variação da variável da
resposta, tal não se mostra tão claro após a análise conjugada das variáveis RPM e TiO2.
Essa inferência inicial, que pode, agora, ser considerada falaciosa, mostra-se enviesada
precisamente por causa do desequilíbrio observado na distribuição do número de
observações pelos pares TiO2/RPM.
Pretendendo-se a melhoria do desempenho do processo, o que se traduz, in casu, no
objetivo de minimização das perdas, procurou-se, para finalizar a análise, estudar se para
um nível de baixa concentração em TiO2 (que se mostra como o que potencia menor
perdas) algum dos níveis das restantes variáveis independentes se mostra preferível.
Dos diversos testes ANOVA realizados, cujo detalhe se encontra nos Anexos,
destacam-se (por conduzirem à rejeição da hipótese nula) aqueles que envolvem o fluxo
de H2O e o nível de vácuo.

3
Foi aplicado um teste bilateral à razão de variâncias (admitindo que são normais as populações a partir
das quais se obtêm as amostras): o teste F. O resultado é de rejeição da hipótese nula (razão igual a 1),
com um valor de prova de 0,005. Assim, admite-se no teste T que as variâncias são diferentes.
4
Neste caso, o resultado é de não rejeição da hipótese nula (razão igual a 1), com um valor de prova de
0,314. Assim, admite-se no teste T que as variâncias são iguais.

10
Chemical Company

Boxplot da perda por hora O teste ANOVA resultou na


para baixa concentração em TIO2, por fluxo de H20
rejeição da hipótese nula, com um
70
valor de prova de 0,032.
60
A construção de intervalos de
Tukey a 95% sugere que a única
Loss/hr

50
diferença estatisticamente signi-
40 ficativa é 300-200: [0,53; 15,73].
O nível 200 permite menores
30 perdas do que o nível 300.
200 250 300
H2O flow

Figura 9. Boxplot da perda por hora (baixa concentração em TiO2, por fluxo de H2O)

Boxplot da perda por hora O teste ANOVA resultou na


para baixa concentração em TiO2, por nível de vácuo
70
rejeição da hipótese nula, com um
valor de prova de 0,041.
60
A construção de intervalos de
Tukey a 95% sugere que a única
Loss/hr

50
diferença estatisticamente signi-
40 ficativa é N-M: [-20,45; -1,07]. O
nível N permite menores perdas do
30
H L M N
que o nível M.
Vacuum

Figura 10. Boxplot da perda por hora (baixa concentração em TiO2, por nível de vácuo)

11
Trabalho de Análise de Dados

4 Conclusões e recomendações para a melhoria do processo

O presente trabalho, relembre-se, visava delinear um conjunto de orientações que


permitissem melhorar o processo de produção de uma empresa química – a Chem –, que
tem apresentado problemas de desempenho, o que implicava compreender as principais
causas de preocupação.
Os autores depararam-se com um importante desafio assente na falta de informação
sobre o processo químico em estudo, nomeadamente sobre as operações realizadas (e
respetiva sequência) e sobre as variáveis que constam da folha de cálculo fornecida, que
contém 100 observações recolhidas na última semana.
Definiu-se como variável de resposta as perdas por hora, uma vez que constituem uma
medida da performance do processo. O estudo desenvolvido teve, então, como objetivo a
minimização do valor dessa variável.
A análise realizada aos diversos inputs do processo identificou uma relação direta entre
as variáveis “TiO2” e “supplier”, inferindo-se que a concentração em dióxido de titânio
do catalisador depende diretamente do respetivo fornecedor.
Ulteriormente, a aplicação de diversas técnicas estatísticas conduziu à identificação
das variáveis RPM (rotações por minuto) e TiO2 (concentração do catalisador em dióxido
de titânio) enquanto fatores com impacto significativo na variação da variável de resposta.
No entanto, uma análise posterior, conjugando os diferentes níveis de TiO2 e RPM,
mostrou que apenas o fator TiO2 deve ser tomado como significativo, já que a análise
à variável RPM se apresentou enviesada pelo desequilíbrio do número de observações
para cada par TiO2/RPM (para alguns níveis de RPM a amostra só incluía observações
para certos níveis de TiO2).
Assumindo que para a qualidade do produto final do processo em estudo é indiferente
a concentração química do catalisador, então, para minimizar as perdas do processo, a
empresa deverá recorrer a catalisadores com menor concentração em dióxido de
titânio. Considerando a relação indicada acima, tal é equivalente a recomendar que a
empresa privilegie o fornecedor Boopy.
Em alternativa e tendo em conta as desvantagens e riscos da dependência excessiva
duma empresa de apenas um fornecedor, a empresa deve procurar junto dos outros
fornecedores (Sloppy e Grumpy), ou, em último caso, de terceiros, que estes adotem
medidas que minimizem a concentração em dióxido de titânio dos seus catalisadores. A
par deste diálogo, a Chem deve implementar uma política rigorosa de controlo de
qualidade dos catalisadores recebidos dos seus fornecedores.

12
Chemical Company

5 Trabalhos futuros

Considerando alguns indícios evidenciados no estudo já desenvolvido e as críticas


apontadas à amostra disponível, sugerem-se as seguintes análises/ações adicionais:
(1) Após implementação da recomendação expressa na secção anterior –
privilegiar a utilização de catalisadores com baixa concentração em TiO2 – e
tendo em conta que a parte final da análise indiciou que, para níveis reduzidos
de dióxido de titânio, as diferenças entre alguns dos níveis do fluxo de H2O e
entre algumas das categorias de vácuo são estatisticamente significativas, será
interessante recolher uma nova amostra, de maior dimensão e mais
equilibrada5, para concluir sobre a pertinência desses indícios, nomeadamente
através da técnica de desenho de experiências;
(2) A análise desenvolvida não contemplou a construção de cartas de controlo, por
(i) não existir informação sobre a sequência cronológica de recolha da amostra
e (ii) se desconhecer o detalhe do processo, nomeadamente eventuais limites
de especificação para as variáveis. Assim, após adoção da recomendação já
referida, seria interessante a implementação de cartas de controlo do tipo
“média e desvio padrão amostral” ou “média e amplitude”, como meio de
identificar pontos fora dos limites de controlo, sequências anormais de pontos
e/ou padrões anormais de evolução, e, seguidamente, uma análise da
capacidade do processo;
(3) O envolvimento dos operários neste processo de melhoria é crucial, quer pelos
benefícios inerentes à sua motivação, quer pelas sugestões úteis que podem
advir da sua auscultação (e que podem, por exemplo, contribuir para a
construção de diagramas de causa e efeito com maior aderência à realidade);
(4) Dependendo do grau de complexidade da modelação do processo químico em
estudo e dos custos em termos financeiros e de tempo intrínsecos à recolha
sucessiva de amostras, o recurso a programas de simulação pode constituir uma
boa alternativa.

5
Relembre-se que o desequilíbrio da amostra enviesou a análise do impacto da variável RPM na
variação da variável de resposta.

13
Trabalho de Análise de Dados

Bibliografia

Cabral, J. A. Sarsfield. 2003. Capítulo 5 – Cartas de Controlo Shewhart. Faculdade


de Engenharia da Universidade do Porto.
Nóvoa, M. Henriqueta Sampaio da. 2015. Melhoria da Qualidade – Ferramentas da
Qualidade Estatística e Minitab. Faculdade de Engenharia da Universidade do Porto.
Nóvoa, M. Henriqueta Sampaio da. 2015. Caso Tripcar – Minitab. Faculdade de
Engenharia da Universidade do Porto.

14
Chemical Company

Anexos

One-way ANOVA: Loss/hr versus H2O flow

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


H2O flow 3 200; 250; 300

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


H2O flow 2 356,9 0,97% 356,9 178,5 0,48 0,623
Error 97 36427,4 99,03% 36427,4 375,5
Total 99 36784,3 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


19,3789 0,97% 0,00% 38709,6 0,00%

Means

H2O
flow N Mean StDev 95% CI
200 34 67,53 21,63 (60,93; 74,12)
250 33 71,56 19,56 (64,86; 78,25)
300 33 71,47 16,54 (64,78; 78,17)

Pooled StDev = 19,3789

15
Trabalho de Análise de Dados

One-way ANOVA: Loss/hr versus Operator

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Operator 5 John; Mary; Mike; Sam; Sue

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Operator 4 201,1 0,55% 201,1 50,29 0,13 0,971
Error 95 36583,2 99,45% 36583,2 385,09
Total 99 36784,3 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


19,6236 0,55% 0,00% 40535,4 0,00%

Means

Operator N Mean StDev 95% CI


John 20 70,30 19,28 (61,59; 79,01)
Mary 20 68,87 19,14 (60,16; 77,58)
Mike 20 71,75 21,33 (63,04; 80,46)
Sam 20 71,63 20,83 (62,92; 80,34)
Sue 20 68,24 17,28 (59,53; 76,95)

Pooled StDev = 19,6236

16
Chemical Company

One-way ANOVA: Loss/hr versus Vacuum

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Vacuum 4 H; L; M; N

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Vacuum 3 753,5 2,05% 753,5 251,2 0,67 0,573
Error 96 36030,8 97,95% 36030,8 375,3
Total 99 36784,3 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


19,3732 2,05% 0,00% 39096,0 0,00%

Means

Vacuum N Mean StDev 95% CI


H 25 72,53 20,91 (64,84; 80,22)
L 25 68,51 18,44 (60,82; 76,20)
M 25 73,08 17,11 (65,39; 80,77)
N 25 66,52 20,77 (58,83; 74,21)

Pooled StDev = 19,3732

17
Trabalho de Análise de Dados

One-way ANOVA: Loss/hr versus Line

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Line 5 5; 7; 9; 12; 15

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Line 4 2339 6,36% 2339 584,8 1,61 0,177
Error 95 34445 93,64% 34445 362,6
Total 99 36784 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


19,0415 6,36% 2,42% 38166,3 0,00%

Means

Line N Mean StDev 95% CI


5 20 73,09 19,93 (64,64; 81,54)
7 20 70,98 26,65 (62,52; 79,43)
9 20 67,48 15,67 (59,03; 75,94)
12 20 62,55 10,76 (54,10; 71,00)
15 20 76,69 18,55 (68,24; 85,15)

Pooled StDev = 19,0415

Test for Equal Variances: Loss/hr versus Line


Method

Null hypothesis All variances are equal


Alternative hypothesis At least one variance is different
Significance level α = 0,05

Bartlett’s method is used. This method is accurate for normal data only.

95% Bonferroni Confidence Intervals for Standard Deviations

Line N StDev CI
5 20 19,9280 (13,9845; 33,2037)
7 20 26,6524 (18,7033; 44,4077)
9 20 15,6718 (10,9977; 26,1120)
12 20 10,7617 ( 7,5520; 17,9309)
15 20 18,5475 (13,0157; 30,9035)
Individual confidence level = 99%

Tests
Test
Method Statistic P-Value
Bartlett 15,26 0,004

18
Chemical Company

One-way ANOVA: Loss/hr versus RPM

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


RPM 4 25; 30; 35; 40

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


RPM 3 15848 43,08% 15848 5282,6 24,22 0,000
Error 96 20937 56,92% 20937 218,1
Total 99 36784 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


14,7679 43,08% 41,30% 22628,8 38,48%

Means

RPM N Mean StDev 95% CI


25 28 65,48 21,43 (59,94; 71,02)
30 28 56,21 11,28 (50,67; 61,75)
35 23 73,37 10,99 (67,26; 79,49)
40 21 91,48 11,05 (85,08; 97,88)

Pooled StDev = 14,7679

Tukey Pairwise Comparisons


Grouping Information Using the Tukey Method and 95% Confidence

RPM N Mean Grouping


40 21 91,48 A
35 23 73,37 B
25 28 65,48 B C
30 28 56,21 C

Means that do not share a letter are significantly different.

Tukey Simultaneous Tests for Differences of Means

Difference Difference SE of Adjusted


of Levels of Means Difference 95% CI T-Value P-Value
30 - 25 -9,28 3,95 (-19,60; 1,05) -2,35 0,094
35 - 25 7,89 4,16 ( -2,98; 18,77) 1,90 0,235
40 - 25 26,00 4,26 ( 14,84; 37,15) 6,10 0,000
35 - 30 17,17 4,16 ( 6,30; 28,04) 4,13 0,000
40 - 30 35,27 4,26 ( 24,12; 46,43) 8,27 0,000
40 - 35 18,11 4,46 ( 6,44; 29,77) 4,06 0,001

Individual confidence level = 98,97%

19
Trabalho de Análise de Dados

One-way ANOVA: Loss/hr versus Coded TiO2

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Coded TiO2 3 L; M; H

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Coded TiO2 2 28289 76,91% 28289 14144,5 161,50 0,000
Error 97 8495 23,09% 8495 87,6
Total 99 36784 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


9,35842 76,91% 76,43% 9038,07 75,43%

Means

Coded
TiO2 N Mean StDev 95% CI
L 40 51,25 8,65 (48,32; 54,19)
M 30 74,13 8,48 (70,74; 77,53)
H 30 91,39 10,97 (88,00; 94,78)

Pooled StDev = 9,35842

Tukey Pairwise Comparisons

Grouping Information Using the Tukey Method and 95% Confidence

Coded
TiO2 N Mean Grouping
H 30 91,39 A
M 30 74,13 B
L 40 51,25 C

Means that do not share a letter are significantly different.

Tukey Simultaneous Tests for Differences of Means

Difference Difference SE of Adjusted


of Levels of Means Difference 95% CI T-Value P-Value
M - L 22,88 2,26 (17,49; 28,27) 10,12 0,000
H - L 40,13 2,26 (34,75; 45,52) 17,76 0,000
H - M 17,25 2,42 (11,50; 23,01) 7,14 0,000

Individual confidence level = 98,09%

20
Chemical Company

Test and CI for Two Variances: Loss/hr_L-25; Loss/hr_L-30

Method

Null hypothesis Variance(Loss/hr_L-25) / Variance(Loss/hr_L-30) = 1


Alternative hypothesis Variance(Loss/hr_L-25) / Variance(Loss/hr_L-30) ≠ 1
Significance level α = 0,05

F method was used. This method is accurate for normal data only.

Statistics

95% CI for
Variable N StDev Variance Variances
Loss/hr_L-25 16 11,546 133,301 (72,740; 319,303)
Loss/hr_L-30 22 5,867 34,418 (20,372; 70,289)

Ratio of standard deviations = 1,968


Ratio of variances = 3,873

95% Confidence Intervals

CI for
CI for StDev Variance
Method Ratio Ratio
F (1,236; 3,258) (1,529; 10,613)

Tests

Test
Method DF1 DF2 Statistic P-Value
F 15 21 3,87 0,005

Two-Sample T-Test and CI: Loss/hr_L-25; Loss/hr_L-30

Two-sample T for Loss/hr_L-25 vs Loss/hr_L-30

N Mean StDev SE Mean


Loss/hr_L-25 16 50,1 11,5 2,9
Loss/hr_L-30 22 51,27 5,87 1,3

Difference = μ (Loss/hr_L-25) - μ (Loss/hr_L-30)


Estimate for difference: -1,17
95% CI for difference: (-7,73; 5,39)
T-Test of difference = 0 (vs ≠): T-Value = -0,37 P-Value = 0,714 DF = 20

21
Trabalho de Análise de Dados

One-way ANOVA: Loss/hr_M-30; Loss/hr_M-35; Loss/hr_M-40

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Factor 3 Loss/hr_M-30; Loss/hr_M-35; Loss/hr_M-40

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Factor 2 34,68 1,66% 34,68 17,34 0,23 0,798
Error 27 2052,30 98,34% 2052,30 76,01
Total 29 2086,98 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


8,71843 1,66% 0,00% 2372,79 0,00%

Means

Factor N Mean StDev 95% CI


Loss/hr_M-30 6 74,30 6,50 (67,00; 81,60)
Loss/hr_M-35 20 73,56 9,73 (69,56; 77,56)
Loss/hr_M-40 4 76,77 3,78 (67,83; 85,72)

Pooled StDev = 8,71843

22
Chemical Company

Test and CI for Two Variances: Loss/hr_H-25; Loss/hr_H-40

Method

Null hypothesis Variance(Loss/hr_H-25) / Variance(Loss/hr_H-40) = 1


Alternative hypothesis Variance(Loss/hr_H-25) / Variance(Loss/hr_H-40) ≠ 1
Significance level α = 0,05

F method was used. This method is accurate for normal data only.

Statistics

95% CI for
Variable N StDev Variance Variances
Loss/hr_H-25 12 11,962 143,086 (71,804; 412,488)
Loss/hr_H-40 17 9,121 83,187 (46,142; 192,684)

Ratio of standard deviations = 1,312


Ratio of variances = 1,720

95% Confidence Intervals

CI for
CI for StDev Variance
Method Ratio Ratio
F (0,766; 2,384) (0,586; 5,684)

Tests

Test
Method DF1 DF2 Statistic P-Value
F 11 16 1,72 0,314

Two-Sample T-Test and CI: Loss/hr_H-25; Loss/hr_H-40

Two-sample T for Loss/hr_H-25 vs Loss/hr_H-40

N Mean StDev SE Mean


Loss/hr_H-25 12 86,0 12,0 3,5
Loss/hr_H-40 17 94,94 9,12 2,2

Difference = μ (Loss/hr_H-25) - μ (Loss/hr_H-40)


Estimate for difference: -8,95
95% CI for difference: (-16,98; -0,93)
T-Test of difference = 0 (vs ≠): T-Value = -2,29 P-Value = 0,030 DF = 27
Both use Pooled StDev = 10,3726

23
Trabalho de Análise de Dados

One-way ANOVA: Loss/hr versus H2O flow (apenas Boopy)

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


H2O flow 3 200; 250; 300

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


H2O flow 2 496,5 17,01% 496,5 248,24 3,79 0,032
Error 37 2422,4 82,99% 2422,4 65,47
Total 39 2918,9 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


8,09141 17,01% 12,52% 2821,79 3,33%

Means

H2O
flow N Mean StDev 95% CI
200 14 46,56 10,85 (42,18; 50,94)
250 13 52,88 6,11 (48,33; 57,43)
300 13 54,69 6,08 (50,14; 59,24)

Pooled StDev = 8,09141

Tukey Pairwise Comparisons

Grouping Information Using the Tukey Method and 95% Confidence

H2O
flow N Mean Grouping
300 13 54,69 A
250 13 52,88 A B
200 14 46,56 B

Means that do not share a letter are significantly different.

Tukey Simultaneous Tests for Differences of Means

Difference Difference SE of Adjusted


of Levels of Means Difference 95% CI T-Value P-Value
250 - 200 6,32 3,12 (-1,28; 13,92) 2,03 0,120
300 - 200 8,13 3,12 ( 0,53; 15,73) 2,61 0,034
300 - 250 1,81 3,17 (-5,93; 9,55) 0,57 0,837

Individual confidence level = 98,04%

24
Chemical Company

One-way ANOVA: Loss/hr versus Line (apenas Boopy)

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Line 5 5; 7; 9; 12; 15

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Line 4 434,3 14,88% 434,3 108,57 1,53 0,215
Error 35 2484,6 85,12% 2484,6 70,99
Total 39 2918,9 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


8,42552 14,88% 5,15% 3358,38 0,00%

Means

Line N Mean StDev 95% CI


5 5 45,66 11,90 (38,01; 53,31)
7 10 47,93 10,94 (42,52; 53,34)
9 10 54,58 6,43 (49,17; 59,98)
12 10 53,51 4,05 (48,10; 58,92)
15 5 52,35 8,96 (44,70; 60,00)

Pooled StDev = 8,42552

25
Trabalho de Análise de Dados

One-way ANOVA: Loss/hr versus Operator (apenas Boopy)

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Operator 5 John; Mary; Mike; Sam; Sue

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Operator 4 32,46 1,11% 32,46 8,115 0,10 0,982
Error 35 2886,45 98,89% 2886,45 82,470
Total 39 2918,91 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


9,08130 1,11% 0,00% 3770,05 0,00%

Means

Operator N Mean StDev 95% CI


John 8 52,68 8,64 (46,16; 59,20)
Mary 8 50,19 8,87 (43,67; 56,71)
Mike 8 51,62 9,45 (45,10; 58,13)
Sam 8 51,40 10,24 (44,88; 57,92)
Sue 8 50,39 8,06 (43,87; 56,91)

Pooled StDev = 9,08130

26
Chemical Company

One-way ANOVA: Loss/hr versus Vacuum (apenas Boopy)

Method

Null hypothesis All means are equal


Alternative hypothesis At least one mean is different
Significance level α = 0,05

Equal variances were assumed for the analysis.

Factor Information

Factor Levels Values


Vacuum 4 H; L; M; N

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Vacuum 3 592,2 20,29% 592,2 197,40 3,05 0,041
Error 36 2326,7 79,71% 2326,7 64,63
Total 39 2918,9 100,00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


8,03932 20,29% 13,65% 2872,47 1,59%

Means

Vacuum N Mean StDev 95% CI


H 10 52,08 6,73 (46,92; 57,24)
L 10 50,44 11,09 (45,29; 55,60)
M 10 56,63 4,07 (51,47; 61,78)
N 10 45,87 8,58 (40,71; 51,02)

Pooled StDev = 8,03932

Tukey Pairwise Comparisons


Grouping Information Using the Tukey Method and 95% Confidence

Vacuum N Mean Grouping


M 10 56,63 A
H 10 52,08 A B
L 10 50,44 A B
N 10 45,87 B

Means that do not share a letter are significantly different.

Tukey Simultaneous Tests for Differences of Means

Difference Difference SE of Adjusted


of Levels of Means Difference 95% CI T-Value P-Value
L - H -1,64 3,60 (-11,32; 8,05) -0,46 0,968
M - H 4,55 3,60 ( -5,14; 14,23) 1,26 0,591
N - H -6,21 3,60 (-15,90; 3,47) -1,73 0,324
M - L 6,18 3,60 ( -3,50; 15,87) 1,72 0,329
N - L -4,58 3,60 (-14,26; 5,11) -1,27 0,586
N - M -10,76 3,60 (-20,45; -1,07) -2,99 0,025

Individual confidence level = 98,93%

27

Você também pode gostar