Você está na página 1de 168

UNIVERSIDADE FEDERAL DO TRIÂNGULO MINEIRO

PPGMQMG

Planejamento,
Otimização e Análise de
Experimentos
30,0

25,0
Qmj [m3/h]

20,0 25
20
15,0 15
10
10,0

10,0
0,8
9,0
0,6
8,0
H0 [cm] 0,4 Xb
7,0
6,0 0,2

Profa. Kássia G. Santos


CAPÍTULO I
CONCEITOS BÁSICOS
SOBRE ESTATÍSTICA

2
Conceitos Básicos

1 - INTRODUÇÃO
Exemplo:
Experimento: Uma indústria química formula um experimento para
verificar se um novo método de fabricação de um produto químico é
superior ao método tradicional
Dados: 10 lotes fabricados pelo método tradicional (A)
10 lotes fabricados pelo método novo (B)
Objetivo: Com os dados obtidos, verificar se o método B é melhor que o
método A
Tabela 1 – Dados de produção de um experimento industrial.
Ordem Ordem
Método Produção Método Produção
temporal temporal
1 A 89,7 11 B 84,7
2 A 81,4 12 B 86,1
3 A 84,5 13 B 83,2
4 A 84,8 14 B 91,9
5 A 87,3 15 B 86,3
6 A 79,7 16 B 79,3
7 A 85,1 17 B 82,6
8 A 81,7 18 B 89,1
9 A 83,7 19 B 83,7
10 A 84,5 20 B 88,5 3
Conceitos Básicos

Análise descritiva dos dados:

y a = 84,24 y b = 85,54 (médias aritméticas)

94.00
Método A Método B
92.00

90.00

88.00

86.00

84.00

82.00

80.00

78.00

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Figura 1 - Produção versus ordem temporal


4
Conceitos Básicos

Notas:

1) O novo método (B) apresentou uma média 1,30 unidades acima da


média do método tradicional (A).

2) Como existe grande variabilidade nos resultados individuais, o


pesquisador fica em dúvida, se de fato o novo processo produz
resultados melhores.

3) Duas Questões se colocam:

a) Será que esta diferença não foi ocasionada por pura chance?
b) Será que repetindo o experimento os resultados não poderão
ser invertidos?

É necessário o uso de métodos estatísticos

5
Conceitos Básicos

2 – CONCEITOS BÁSICOS

Erro experimental: Quando um experimento é repetido sob as mesmas


condições, os resultados obtidos não são idênticos. A flutuação que
ocorre de uma repetição para outra é chamada erro experimental ou
simplesmente erro.

Erro sistemáticos: relacionados à equipamentos incorretamente


ajustados e/ou calibrados e ao uso de procedimentos incorretos.

Erros estatísticos (incertezas): Causados por variações


incontroláveis e aleatórias dos instrumentos de medida e de condições
externas.

Média amostral e média populacional

População: População estatística é o conjunto de medidas ou o arquivo


de algumas características correspondendo à coleção inteira de unidades
(população de interesse) para os quais a inferência é feita.
Amostra: Amostra de uma população estatística é o conjunto de medidas
que são realmente selecionadas na população estatística no decorrer da
investigação 6
Conceitos Básicos

Média Populacional
N

y i
= i =1

N
Média Amostral
n

y i
y= i =1

n
A média amostral é uma medida da centralidade dos dados, é dada pela
média aritmética das observações.

N é o número de dados.

Estatísticas e parâmetros

Parâmetro: Um parâmetro é uma quantidade associada com a população.


Por exemplo 

Estatística: Uma estatística é uma quantidade calculada de um conjunto


de dados, em geral uma amostra da população. Por exemplo y . 7
Conceitos Básicos

Nota: A média da população também é chamada de: “o valor esperado de


y, ou a esperança matemática de y, representada por E(y). Assim, =
E(y).

Amostra Aleatória (a.a.)


Uma amostra é aleatória se cada membro da população tem a mesma
chance ou probabilidade de ser escolhido.

Medidas de Variabilidade

Além das medidas de centralidade, é importante saber o espalhamento


ou variabilidade dos dados. Por exemplo, supor que um estudo de
pessoas afetadas por uma certa doença revela que a maioria de pessoas
afetadas são menores de dois anos de idade ou com mais de 70 anos.
Aqui não seria apropriado sumarizar os dados dizendo que a média de
idade das pessoas afetadas pela doença é de 30 anos. Precisamos de uma
medida de variabilidade ou espalhamento dos dados.

8
Conceitos Básicos

Medidas de Variabilidade de Medidas de Variabilidade de uma


uma População Amostra

Variância da População Variância amostral, s2


n

 2 = E( y − ) 2 =
 ( y − ) 2
(y i − y) 2
N s2 = i =1

n −1
Desvio Padrão Desvio padrão amostral, s

 ( y − )
n

(y
2

 = E( y − ) =2 i − y) 2
N s= i =1

n −1

Nota: Em geral o número de


observações da população
idealizada para os dados é
infinito, mas aqui estamos
supondo N finito (um número
grande)
9
Conceitos Básicos

Graus de liberdade, 

Os desvios de n observações de sua média amostral devem somar zero.


Isto constitui uma restrição linear dos desvios ou resíduos usados no
cálculo de s2. Implica que quaisquer das n-1 determinam completamente
a outra observação (n-1 graus de liberdade em s2)

Distribuição Normal

Observações repetidas que diferem devido a erro experimental


freqüentemente variam em torno de um valor central numa distribuição
simétrica onde ocorre mais desvios pequenos do que desvios grandes.
Uma distribuição contínua que representa esta situação é a distribuição
normal ou Gaussiana
P(y)

1 1
p( y ) = exp(− ( y −  ))
2  2 2

Ƞ-3δ Ƞ-2δ Ƞ-δ Ƞ Ƞ+δ Ƞ+2δ Ƞ+3δ


10
Figura 2 – Distribuição Normal
Conceitos Básicos

Teorema do Limite Central (TLC)

Sob certas condições na experimentação, a distribuição de erros tende


para a normalidade quando o número de componentes é grande.

Caracterização da distribuição normal

A média  e a variância 2 caracterizam a distribuição normal


Notação: N (,2)

P(y) N (30;6,25)

N (-5;25)

N (5;100)

-20 0 20 40 y

Figura 3 – Diferentes distribuições normais 11


Conceitos Básicos

Distribuição Normal Padronizada

( y − )
Z=

Z ~ N(0,1): é uma distribuição normal com média igual a zero e


variância igual a 1

Padronizando:

P{z<-2}
P(y)

Ƞ-3δ Ƞ-2δ Ƞ-δ Ƞ Ƞ+δ Ƞ+2δ Ƞ+3δ


12
Figura 2 – Distribuição Normal
Os valores tabelados
correspondem à área a
assinalada na Figura:
P[Z ≥ z(a)]=a

13
Conceitos Básicos

Distribuição t de Student
Na prática, em geral não conhecemos , e devemos substituí-lo por s
obtido de uma amostra pequena de dados.
Com s no lugar de , considerar:
( y − )
t=
s
que tem uma distribuição t de Student com  graus de liberdade
(número de graus de liberdade para s)

14
Figura 4 – Distribuição t de Student para diferentes graus de liberdade
Na tabela registram-se os
valores tGL (a) tais que:


tGL ( a )
f (u )  du

15
CAPÍTULO II
TESTE DE HIPÓTESES

16
Teste de Hipóteses

TESTES DE HIPÓTESES

Uma hipótese estatística é uma afirmação sobre uma população. Sua


validade é avaliada a partir da informação obtida da amostra da
população

Exemplo: Com os dados de produção industrial da Tabela 1, verificar se


o método novo (B) de fabricação é superior ao método tradicional (A).

Temos duas hipóteses:

1) O método novo (B) é superior, ie, B >A


2) O método anterior (A) é superior ao método novo (B), ie, A B

Uma hipótese é chamada hipótese de nulidade (H0) e a outra é chamada


de hipótese alternativa (H1).

17
Teste de Hipóteses

Escolha de H0 e H1
Quando uma investigação é relacionada a um fato baseado na amostra, a
negação deste fato é considerada como a hipótese de nulidade (H0) e o
fato a ser comprovado pelos dados é considerado como a hipótese
alternativa (H1).

No Exemplo: Com os dados de produção Industrial temos:


H0: B A
H1: BA.

Estatística do Teste:

Dois tipos de erros possíveis:


i) H0 é verdadeira mas o teste leva a rejeição de H0 (erro de tipo I)
ii) H0 é falsa, mas o teste leva a não rejeição de H0 (erro de tipo II)
O erro de tipo I é o mais crítico

Nível de significância (a): A probabilidade máxima do erro de tipo I de


um teste de hipóteses é definido como o nível de significância do teste

18
Teste de Hipóteses

Distribuições Amostrais e Inferências Para Amostras Grandes


Na seleção de uma amostra aleatória (a.a.) de uma população normal com
média  e desvio padrão , a média amostral y tem distribuição normal
com média  e variância 2/n. Isto é, se y ~ N(,2), então, y =N(,2/n).
Teorema do Limite Central: Na seleção de uma amostra de uma
população qualquer com média  e desvio padrão , a distribuição
amostral de y é aproximadamente normal com média  e desvio padrão ,
quando n é grande.
Estimação por Ponto da Média Populacional
Um estimador por ponto da média populacional  é dado pela média
amostral y .
Intervalos de Confiança para  (i.c.)
Supor uma distribuição N(,2) para os dados, com  conhecido.
Portanto, y =N(,2/n). Considerar uma probabilidade de 0,95 fixa,
portanto:
 y − 
P −1,96   1,96  = 0,95
 / n 
Daí,  
P y − 1,96  / n    y + 1,96  / n = 0,95 19
Teste de Hipóteses

Interpretação: em amostras repetidas, o intervalo de confiança aleatório


( y − 1,96  / n ; y + 1,96  / n ) inclui o parâmetro desconhecido  com
probabilidade de 0,95.

Em Geral: um i.c. 100(1-a)% para a média populacional de uma


distribuição normal com desvio padrão  conhecido é dado por:

( y − Za / 2  / n ; y + Za / 2  / n )
onde Za/2 é dado por PZ  − Z a / 2  = a / 2

Intervalos de Confiança para  com Amostras Grandes

y =N(,2/n). Portanto, um i.c. 100(1-a)% para , considerando


Pelo TLC,
 
uma amostra grande é dado por: P y − Za / 2 s / n    y + Za / 2 s / n = 1 − a

Isto é, um i.c. 100(1-a)% para , com n grande é dado por:

( y − Za / 2 s / n ; y + Za / 2 s / n )
20
Teste de Hipóteses

Testes de Hipóteses Para a Média Populacional

Na construção de testes de hipóteses, observar o seguinte:

(i) Identificar a hipótese de nulidade (H0) e a hipótese alternativa (H1) em


termos de parâmetros populacionais.
(ii) Escolher o teste estatístico
(iii) Estabelecendo um nível de significância a, determinar a região de
rejeição
(iv) Calcular o valor observado do teste estatístico a partir dos dados da
amostra selecionada. Verificar se este valor observado está incluído na
região de rejeição ou não.

Região de Rejeição do Teste

y − 0
R= c
/ n
Onde, c é determinado a partir da distribuição de y − 0 e com um nível de
significância (a) estipulado. / n
21
Teste de Hipótese

TESTE DE HIPÓTESE:
H0=nulidade e H1=hipótese alternativa.
Para H1:
I: Se η>η0; então Z≥Zα;

y − 0
Z=
s/ n

II: Se η<η0; então Z≤-Zα; Região vermelha é


região de
REJEIÇÃO de H0.

III: Se η≠η0; então |Z|≥Zα/2


Teste de Hipóteses

Nota: Com amostras grandes (n30), y ~ N(0; s2/n)


y − 0
Estatística do Teste: Z =
s/ n
e c=Za (teste Z)
#

Inferências Para Amostras Pequenas com Populações Normais


Problema Prático: experimentos com custo grande que exigem tamanho
amostral pequeno (n<30)

Resultado: Se y1, y2, yn é uma a.a. de uma população normal (N(,2)) ,


( y − )
então t = tem uma distribuição t de Student com n-1 graus de
s/ n
liberdade ().

Intervalo de Confiança para 


Um i.c. 100(1-a)% para  é dado por,
( y − ta / 2 s / n ; y + ta / 2 s / n )
onde ta/2 é o percentil de uma distribuição t de Student com n-1 graus
de liberdade. # 23
Teste de Hipóteses

Testes de Hipóteses:

Para testar hipóteses sobre uma média populacional  de uma população


normal, o teste estatístico é dado por,

( y − 0 )
t= tn −1
s/ n

Assim,

i) Com as hipóteses H0: 0, H1: >0, a região de rejeição é dada por R:
tta, sendo a o nível de significância estipulado.

ii) Com H0: 0, H1: <0, a região de rejeição é dada por, R: t-ta, sendo
a, o nível de significância estipulado

iii) Com H0: =0, H1: 0, a região de rejeição é dada por, R: tta/2,
sendo a, o nível de significância estipulado
#

24
CAPÍTULO III
COMPARAÇÃO DE DOIS
TRATAMENTOS

25
Comparação de dois tratamentos

COMPARAÇÃO DE 2 TRATAMENTOS
Sejam amostras aleatórias (a.a.) independentes de duas populações
Selecionar uma a.a. de tamanho n1 de uma população 1 e uma a.a. de
tamanho n2 de uma população 2.

Tabela 2 – Comparação de dois tratamentos


AMOSTRAS ESTATÍSTICAS
n1

 xi
x = i=1

População 1( x1, n1
n

 (x
x2,.......xn1)
i − x)2
s1 = i =1
2

n1 − 1
n2

 yi
y = i =1

n2
População 2 (y1,
n

 (y
y2,.......yn2)
i − y )2
s2 2 = i =1

n2 − 1
26
Comparação de dois tratamentos

i) Seja x1, x2,.......xn1 uma a.a. de tamanho n1 da população 1 com média


populacional 1 e desvio-padrão populacional 1

ii) Seja y1, y2,.......yn1 uma a.a. de tamanho n2 da população 2 com média
populacional 2 e desvio-padrão populacional 2

iii) As amostras são independentes. Em outras palavras, as medidas dos


dois tratamentos não são relacionados entre si.

Objetivo: Inferências sobre,


1-2 = (média pop.1) - (média pop.2)

27
Comparação de dois tratamentos

INFERÊNCIAS PARA AMOSTRAS GRANDES

Resultado: Sob o modelo estatístico considerado anteriormente, assumindo


n1 e n2 grande (30), x − y tem distribuição aproximadamente normal com
média E ( x − y ) = 1 − 2 e variância var( x − y ) =
1  2

n1 n2
Como n1 e n2 são grandes podemos substituir 12 e 22 pelas variâncias
amostrais s12 e s22, portanto,

x − y − (1 − 2 )
Z= N (0,1)
2 2
s s
1
+ 2
n1 n2

Um i.c. 100(1-a)% para 1-2:

s12 s22 s12 s22


( x − y − Za / 2 + ; x − y + Za / 2 + )
n1 n2 n1 n2

28
Comparação de dois tratamentos

INFERÊNCIAS PARA AMOSTRAS PEQUENAS

Quando as amostras n1 e n2 são pequenas, devemos considerar além das


suposições anteriores, as seguintes suposições adicionais:

i) ambas populações são normais


ii) os desvios padrões das populações 1 e 2 são iguais, isto é, 1=2
iii) x1, x2,.......xn1 é uma a.a. de distribuição N(1,2)
iv) y1, y2,.......yn1 é uma a.a. de distribuição N(2,2)
v) x1, x2,.......xn1 e y1, y2,.......yn1 são duas amostras independentes.

Notas:

E ( x − y ) = 1 − 2
1  2
var( x − y ) = − pois x − y são v.a.’s independentes.
n1 n2

29
Comparação de dois tratamentos

Um estimador ponderado da variância comum para as 2 populações

( n1 − 1)s12 + ( n2 − 1)s22
s =
2
n1 + n2 − 2
p

Resultado: Com as suposições mencionadas temos:


( x − y ) − (1 − 2 )
t= tn1+ n 2− 2 t de student com (n1 + n2 -2) graus de liberdade
1 1
sp +
n1 n2

Um i.c. 100(1-a)% para 1-2 com amostras pequenas é:

1 1
x − y  ta / 2 s p +
n1 n2
onde ta/2 é calculado de uma tabela de distribuição t de student com (n1 +
n2 – 2) graus de liberdade.
#

30
Comparação de dois tratamentos

Notas: É importante salientar que a aleatorização é fundamental para um


bom planejamento experimental. Na comparação de dois tratamentos das
n=n1+n2 unidades experimentais disponíveis, escolher n1 unidades
aleatoriamente para receber o tratamento 1 e considerar as n2 unidades
para o tratamento 2. Observar que:

i) a aleatorização previne contra a existência de vícios na escolha das


unidades para os dois grupos;

ii) a aleatorização previne contra fontes não controladas de variabilidade


nas respostas;

iii) quando a aleatorização não pode ser realizada, é necessário muito


cuidado em interpretar uma diferença nas médias devido à uma diferença
entre os tratamentos. As diferenças podem existir devido a outros fatores.

31
Teste de Hipóteses entre duas amostras

Um experimento é conduzido num laboratório para verificar se 2 métodos


diferentes de tratamento de madeiras produzem índices de resistência
diferentes. Para isso, 25 corpos de prova tirados de uma mesma tora são
divididos aleatoriamente para receber os dois tratamentos e os índices de
resistência são calculados após 3 semanas de tratamento. Obter um IC de
95% para a diferença das médias.
Índice de Resistência
Tratamento 1 44 44 56 46 47 38 58 53 49 35 46 30 41
Tratamento 2 35 47 55 19 40 39 32 41 42 57 51 39
Solução:
Tratamento 1: x = 45,15 ; s12 = 63,97 ; n1=13 ;

Tratamento 2: y = 41, 42 ; s12 = 108,81 ; n2=12 ;

( n − 1) s 2
+ ( n − 1) s 2
s 2p = 1 1 2 2
= 85,42 ⎯⎯
→ s p = 9,24
n1 + n2 − 2
t0,025=2,069 (tabela: GL=23)

1 1
IC 95% p/ƞ1 –ƞ2 = x − y  ta / 2 s p + = {3,74± 7,65}={-3,92;11,39}
n1 n2
Teste de Hipóteses entre duas amostras

O teste de hipóteses (p/ a=0,05)


H0: η1- η2 = 0
H1: η1- η2 ≠ 0 (É diferente?)
( x − y ) − (1 − 2 ) 45,15 − 42, 25
t= = = 0,867
1 1 1 1
sp + 8,36 +
n1 n2 13 12
RAH0

RRH0
RRH0

-2,069 0,867 2,069

FORA da região de rejeição de H0

Conclusão: As amostras têm índices de resistências iguais.


Teste de Hipóteses entre duas amostras

Ex. Dos dados de produção industrial da Tabela 1 da apostila, assumindo


a mesma variância populacional para os dois processos de fabricação A e
B, realizar um teste de hipótese a fim de verificar se B é melhor que A.
Solução:
Na sala de aula:
O teste de hipótese (para a=0,05)
H0: ƞB ≤ ƞA → ƞB - ƞA ≤ 0
H1: ƞB > ƞA → ƞB - ƞA > 0

 (x A − x A ) 2 +  ( yB − yB ) 2
75, 784 + 119,9 ;
s p = 3, 297
s =
2 i =1 i =1
= = 10,87
nA + nB − 2
p
18
t0,05=1,734 (tabela: GL=18)
RAH0

( x − y ) − (1 − 2 ) 85,54 − 84, 24 FORA da


tobs = = = 0,88 RRH0
1 1 1 1 região de
sp + 3, 297 + rejeição
n1 n2 10 10
de H0
0,88 1,734
CAPÍTULO IV

COMPARAÇÃO DE MAIS
DE DOIS
TRATAMENTOS

35
Comparação de mais de dois tratamentos

Exemplo: Na tabela 3, temos os índices de resistência para 24 corpos de


prova retirados de 4 tipos diferentes de madeira (A, B, C e D).

Tabela 3 – Índices de resistência para 4 tipos de madeiras

Tipos de Madeira
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
66 68 64
63
59
Médias 61 66 68 61
Média Geral 64

36
Comparação de mais de dois tratamentos

Estimação da Variabilidade Entre e Dentro de Tratamentos


A) VARIAÇÃO DENTRO DE TRATAMENTOS
Madeira A: n1=4, y1 =61
S1: Soma dos quadrados dos desvios da média do tratamento (SQ):
S1=(62-61)2 + (60-61)2 + (63-61)2 + (59-61)2 = 10
1=n1-1= 3 graus de liberdade
variância amostral: s12= S1/1=10/3=3,3
Da mesma forma: s22=8,0 ; s32=2,8 ; s42=6,8 ( variâncias amostrais para
as madeiras B, C e D)
Em geral: Supondo que K variâncias amostrais estimam a mesma variância
2, temos:
sR2=(1s12 + 2s22 +..............+ ksK2) / (1 + 2 +..............+ k) =
= ( S1 + S2 +........+ SK)/((n1-1)+(n2-1)+........+(nK-1))= (SR)/(N-K)= SR/R
onde: N = n1 + n2 + ........+ nK
sR2 é um estimador ponderado da variância populacional comum 2
Com os dados da tabela 3: SR=10+40+14+48 e R=3+5+5+7=20 37
Comparação de mais de dois tratamentos

Quadrado Médio dentro de Tratamento


SR 112
s =
2
= = 5,6
R
R
20

(s R = 5,6 é um estimador de 2)


2

Soma de Quadrados Dentro do t-ésimo Tratamento


nt
S t =  ( yti − yt ) 2
i =1

onde, yti é a i-ésima observação no t-ésimo tratamento


Soma de Quadrados Dentro de Todos Tratamentos
K nt

SR=S1+S2+..........+SK =  ti t
( y − y
t =1 i =1
) 2

Quadrado Médio dentro dos Tratamentos


K nt
SR
s =
2
=  ( yti − yt ) 2 /( N − K )
N − K t =1 i =1
R

nt – número de observações em cada tratamento


38
Comparação de mais de dois tratamentos

B) VARIAÇÃO ENTRE TRATAMENTOS


Média Geral para todos tratamentos
k nt

 y ti
y= t =1 i =1

N
K
Onde: N = n
t =1
t

1536
No exemplo: y= = 64
24
Nota: Se não existir diferenças entre as médias de tratamentos , um
segundo estimador de 2 pode ser obtido da variabilidade das médias de
tratamentos em torno de y1 =64. Isto é:
K

n (y t t − y) 2
sT2 = t =1

K −1
onde K é o número de tratamentos 39
Comparação de mais de dois tratamentos

Soma de Quadrados entre tratamentos


K
S T =  nt ( y t − y ) 2
t =1
Número de Graus de Liberdade entre Tratamentos
T=K-1
No exemplo, com os dados da tabela 3:

Tratamento
A B C D
yt 61 66 68 61
yt − y -3 2 4 -3
nt 4 6 6 8
y = 64

ST=4(-3)2+6(2)2+6(4)2+8(-3)2=228
T=3 ; sT2= ST/T = 228/3=76
Nota: Notamos uma grande diferença entre sR2 e sT2 (observar que sR2=5,6
com 20 G.L. e sT2=76,0 com 3 G.L.) 40
Comparação de mais de dois tratamentos

C) QUADRO DE ANÁLISE DE VARIÂNCIA (ANOVA)

Resultado: Uma medida da variabilidade para todas as observações é dada


pela variância amostral para as N observações,
K nt
S D =  ( y ti − y ) 2 (Soma de quadrados total dos desvios da média )
t =1 i =1
K nt

 ti
( y − y ) 2
SD
sD =
2 t =1 i =1
= (variância amostral)
N −1 D

No exemplo: Com os dados da Tabela 3,

SD= (62-64)2+(60-64)2+........+(59-64)2 = 340

D=N-1=23

sD2=340/23=14,8

41
Comparação de mais de dois tratamentos

Quadro de ANOVA

FV SQ GL QM
Entre Tratamentos ST=228 T=3 sT2=76,0

Dentro do Tratamento SR=112 R=20 sR2=5,6

Total em torno da média y SD=340 D=23 sD2=14,8

Resultado:
K nt K K nt
S D =  ( yti − y ) =  nt ( yt − y ) +  ( yti − yt ) 2
2 2

t =1 i =1 t =1 t =1 i =1

i.e.: SD = ST + SR

Soma de Quadrados Soma de Soma de Quadrados


y1
Total dos Desvios
= Quadrados Entre + Total dos Desvios
da Média Tratamentos da Média
42
Comparação de mais de dois tratamentos

Nota:
K nt K nt

 ti
( y − y
t =1 i =1
) =  ti t t
( y − y + y −
2
y ) 2
=
t =1 i =1

K nt K nt
=  ( yti − yt )2 +  ( yt − y )2 + 2 ( yti − yt )( yt − y )
t =1 i =1 t =1 i =1
=0
S D = ST + S R
CONTRIBUIÇÃO DA MÉDIA GERAL y
K nt
S D =  yti2 − Ny 2
t =1 i =1

Ny 2 : soma de quadrados devido à média (correção para a média)


N
S A = Ny 2
G =  yi G = yN  G 2 = N 2 y 2
i =1

G2
Portanto, S A = = Ny 2
N
43
Comparação de mais de dois tratamentos

SOMA DE QUADRADOS TOTAL:


K nt
S =  yti2
t =1 i =1

Portanto, SD = S – SA

S = SA + S D

K nt K K nt
Resultado: S =  ti
y 2
= Ny
t =1 i =1
2
+ t t
n ( y
t =1
− y ) 2
+  ti t
( y − y )
t =1 i =1
2

i.e., S = SA + ST + SR

Soma de Soma de
Soma de Soma de
Quadrados Quadrados dentro
Quadrados
Total
= Quadrados
devido à Média
+ entre + de Tratamentos
Tratamentos (Residual)

Número de G.L. : N = 1 + (K-1) + (N-K)

44
Comparação de mais de dois tratamentos

Quadro de ANOVA
FV SQ GL QM
K nt
Média S A = Ny = ( yti ) 2 / N
2
A=1 sA2=SA/A
t =1 i =1

Entre Tratamentos ST = nt =1


t ( yt − y ) 2 T=K-1 sT2= ST/T

K nt

Dentro do Tratamento SR = ( y


t =1 i =1
ti − yt ) 2 R=N-K sR2= SR/R

K nt
Total S =  y
t =1 i =1
2
ti N

No exemplo: Com os dados da Tabela 3

FV SQ GL QM
Média 98304 1 98304
Entre Tratamentos 228 3 76
Dentro do Tratamento 112 20 5,6
Total 98644 24
45
Comparação de mais de dois tratamentos

D) VERIFICAÇÃO DA ADEQUABILIDADE DO MODELO

No exemplo: Considere os dados da Tabela 3.

Suposição: Os dados representam quatro amostras aleatórias de quatro


populações normais com mesma variância mas com médias
populacionais diferentes,
i.e.,

y ti =  t +  ti , i=1,2,..........., nt
t=1,2,..........., K

t = média populacional para o tratamento t

ti são v.a.’s i.i.d. com distribuição N(0,2).

Análise de resíduos: Se as suposições são verdadeiras, os resíduos y ti − yˆ ti


variam aleatoriamente em torno de zero. Veja Figuras 4,5 e 6. ( ˆyti = yt )

46
Comparação de mais de dois tratamentos

Análise
de
resíduos

-6 -4 -2 0 2 4 6
a) Todos Resíduos

Madeira A

Madeira B

Madeira C

Madeira D
-6 -4 -2 0 2 4 6
b) Resíduos para cada tipo de Madeira
47
Figura 5: Gráfico de resíduos.
Comparação de mais de dois tratamentos

y ti − yˆ ti
6

0
60 64 68
yˆ ti
-2

-4

-6

Figura 6: Gráficos dos resíduos versus os valores


estimados.

48
Comparação de mais de dois tratamentos

y ti − yˆ ti
4

0
4 8 12 16 20 24
Ordem temporal
-2

-4

Figura 7: Gráficos dos resíduos em sequência


temporal.

49
Comparação de mais de dois tratamentos

Conclusões: A partir dos gráficos de resíduos verificamos que o modelo


é apropriado para análise dos dados. Na Figura 5, observamos que os
resíduos conjuntamente e individualmente para cada tipo de madeira
estão distribuídos aleatoriamente em torno de zero. Na Figura 6,
também observamos os resíduos aleatoriamente distribuídos em torno
de zero, indicando a variância constante para todos valores da
resposta. Também observamos bom comportamento do resíduo contra
a ordem temporal (Figura 7) o que indica que o treinamento do
pesquisador em medir os corpos de prova foi adequado (medida dos
índices de resistências)

50
Comparação de mais de dois tratamentos

E) USO DO QUADRO DE ANOVA

Considerar o modelo,

y ti =  t +  ti onde i=1,2,..........., nt
t=1,2,..........., K

e o teste de hipóteses,

Ho : A=B=C=D (para o exemplo)

Com os dados da Tabela 3, temos,

ANOVA (Modelo: yti= t + ti)

FV SQ GL QM Razão QM
Entre Tratamentos ST=228 3 sT2=76 sT2 76
= = 13,6
sR2=5,6
2
Dentro do Tratamento SR=112 20 s R 5,6
Total em torno da média
SD=340 23
geral y
51
Comparação de mais de dois tratamentos

Suposição básica: i ~ i.i.d. N(0,2)

Sob H0 : A=B=C=D,

sT2
F3,20
sR2
# F3,20
F3,20(5%)=3,10
F3,20(1%)=4,94 Razão
Ponto 5% observada
sT2 Ponto 1%
Valor observado: 2
= 13, 6
sR F
0 2 4 6 8 10 12 14

Conclusão: Rejeitar H0 nos níveis de significância usuais , i.e. , existe


diferenças reais entre as médias de tratamento.

52
53
54
55
56
57
CAPÍTULO V
PLANEJAMENTOS
FATORIAIS A DOIS
NÍVEIS

58
Planejamento Fatorial a Dois Níveis

Modelos teóricos:
 = f(x1,x2,......,xk)

 : valor médio de uma resposta (qualidade de um produto, eficiência , etc)


x1,x2,......,xk : níveis de algumas variáveis (tempo, concentração, pressão,
catalisador, etc)
 = f ( x)
~
x : vetor com k variáveis x1,x2,......,xk
~

Modelos empíricos: frequentemente o mecanismo do modelo não é muito


claro, ou é muito complicado. Os modelos empíricos são úteis
particularmente sobre amplitudes limitadas das variáveis.

PLANEJAMENTOS FATORIAIS A DOIS NÍVEIS


Nota: Um caso particular é dado por planejamento onde cada variável
ocorre somente em 2 níveis. Alguns fatos importantes relacionados a esses
planejamentos fatoriais com dois níveis são os seguintes:

i) Apesar de usarem um número pequeno de experimentos por fator, esses


planejamentos podem indicar tendências e direções da pesquisa.
59
Planejamento Fatorial a Dois Níveis

ii) É possível aumentar esses experimentos para formar planejamentos


compostos.
iii) É possível trabalhar com frações de planejamentos fatoriais de 2 níveis
iv) A interpretação dos resultados são dadas diretamente por aritmética
elementar.

Exemplo: Considerar um planejamento fatorial 23 onde temos duas


variáveis quantitativas:
- Temperatura
- Concentração
e uma variável qualitativa:
- Catalisador

A resposta (y) é dada pela quantidade do produto químico obtido (gramas).

Nível superior da variável quantitativa: +


Nível inferior da variável quantitativa: -

60
Planejamento Fatorial a Dois Níveis

T: – → 160°C C: – → 20% K: – → A
+ → 180°C + → 40% +→B
Matriz de Planejamento: (todos os pontos do experimento)
Experimento T C K
1 - - -
2 + - -
3 - + -
4 + + -
5 - - +
6 + - +
7 - + +
8 + + +

Resultados experimentais obtidos:


T (C) C (%) K (A ou B) y
Experimento temperatura concentração catalisador Produto
1 - - - 60
2 + - - 72
3 - + - 54
4 + + - 68
5 - - + 52
6 + - + 83
7 - + + 45
8 + + + 80 61
Planejamento Fatorial a Dois Níveis

CÁLCULO DOS EFEITOS PRINCIPAIS DAS VARIÁVEIS:


Efeito Principal de temperatura:
Efeito de mudar a temp. de
Concentração Catalisador
160C a 180C
y2-y1=72-60=12 20 A
y4-y3=68-54=14 40 A
y6-y5=83-52=31 20 B
y8-y7=80-45=35 40 B

O efeito principal da temperatura é dado pela média das 4 medidas:


(12+14+31+35)/4=23
Efeito Principal de Concentração:
Efeito de mudar de conc. Temperatura
Catalisador
de 20% p/ 40% (°C)
y3-y1=54-60=-6 160 A
y4-y2=68-72=-4 180 A
y7-y5=45-52=-7 160 B
y8-y6=80-83=-3 180 B

Efeito principal de concentração : -5 62


Planejamento Fatorial a Dois Níveis

CÁLCULO DOS EFEITOS PRINCIPAIS DAS VARIÁVEIS:


Efeito Principal de catalisador:

Efeito de mudar Temperatura


Concentração
catalisador de A p/ B (°C)
y5-y1=52-60=-8 160 20
y6-y2=83-72=11 180 20
y7-y3=45-54=-9 160 40
y8-y4=80-68=12 180 40

Efeito principal de catalisador: +1,5

Definição: O efeito principal de um fator é dado por uma diferença entre


médias: y + − y − , onde y + é a resposta média para o sinal + da variável e y −
é a resposta média para o sinal – da variável.

63
Planejamento Fatorial a Dois Níveis

REPRESENTAÇÃO GEOMÉTRICA DO EXPERIMENTO:

45 (+35) 80
(-9)
(+14) (+12)
40 54
+ 68
(-7) (-3)

Concentração (-6) (-4)


(C) 52 (+31)
83 + B
(-8)
(+11) Catalisador
20 - - A
60 (+12) 72 (K)
- +

160 180
Temperatura (T)

64
Planejamento Fatorial a Dois Níveis

EFEITOS DE INTERAÇÃO ENTRE FATORES:


Interação entre dois fatores:
Nota: No exemplo anterior, observamos que o efeito principal de
temperatura é 23, mas também observamos que o efeito de temperatura é
muito maior com o catalisador B do que com o catalisador A. As variáveis
temperatura e catalisador não se relacionam aditivamente, elas interagem
entre si.
Efeitos de Interação : É dado pela diferença entre o efeito médio da
temperatura com o catalisador A e o efeito médio da temperatura com o
catalisador B. Por definição é dado pela metade desta diferença e
representado por TxK.
Interação TxK:

Catalisador Efeito médio da temperatura


(+) B 33=(31+35)/2=1/2x(y6-y5+y8-y7) Efeito de
interação
(-) A 13=(12+14)/2=1/2x(y2-y1+y4-y3)
TxK= 20/2=10
Diferença=20

Interação TxK = ½ Diferença = (33-13)/2=10= ¼ (y1-y2+y3-y4-y5+y6-y7+y8) =


¼ (y1+y3+y6+y8)- ¼ (y2+y4+y5+y7) = Diferença entre 2 médias 65
T e K = nível T e K nível diferente
Planejamento Fatorial a Dois Níveis

Interação TxC e CxK:

Efeito médio de Efeito médio de


Concentração Catalisador
Temperatura Concentração
(+) 40% 24,5 (+) B -5
(-) 20% 21,5 (-) A -5
Diferença=3,0 Diferença=0,0

Conclusão: Interação TxC = 3/2 = 1,5


Interação CxK = 0/2 = 0,0
Notas:
Interação TxC = ¼ (y1+y4+y5+y8)- ¼ (y2+y3+y6+y7)
Interação CxK = ¼ (y1+y2+y7+y8)- ¼ (y3+y4+y5+y6)
Interação entre 3 fatores: Considerar a interação TxC. Observar que
duas medidas da interação TxC são dadas pelo experimento, sendo uma
medida para cada catalisador.
i) interação TxC com catalisador B (+): ½((y8-y7)–(y6-y5))= ½((80-45)-(83-52))
= ½ (35-31) = 2,0
ii) interação TxC com catalisador A (-): ½ (y4-y3) – (y2-y1) = ½ (68-54)-
(72-60)= ½ (14-12) = 1,0
66
A interação TxCxK é dada por : (2,0-1,0)/2=1/2=0,5
Planejamento Fatorial a Dois Níveis

Nota:
Interação TxCxK = ¼ (-y1+y2+y3-y4+y5-y6-y7+y8)= ¼ (y2+y3+y5+y8)- ¼
(y1+y4+y6+y7)

INTERPRETAÇÃO DOS RESULTADOS

Efeito Estimador

Média 64,25

Efeitos Principais
Temperatura (T) 23,0
Concentração (C) -5,0
Catalisador (K) 1,5

Interações com 2 fatores:


TxC 1,5
TxK 10,0
CxK 0,0

Interações com 3 fatores:


TxCxK 0,5
67
Planejamento Fatorial a Dois Níveis

-10 -5 0 5 10 15 20

Algumas conclusões:

i) O efeito de concentração é o efeito de reduzir o produto por 5


unidades.

ii) Os efeitos de temperatura T e catalisador K não podem ser


interpretados separadamente pois existe grande interação TxK .

68
Planejamento Fatorial a Dois Níveis

MÉTODOS RÁPIDOS PARA O CÁLCULO DOS EFEITOS

Os efeitos principais e de interações podem ser calculados


diretamente a partir da tabela de contrastes:

Média T C K TC TK CK TCK Resultado


+ - - - + + + - 60
+ + - - - - + + 72
+ - + - - + - + 54
+ + + - + - - - 68
+ - - + + - - + 52
+ + - + - + - - 83
+ - + + - - + - 45
+ + + + + + + + 80
Divisor
4 4 4 4 4 4 4
8

Estimador da média: (60+72+54+68+52+83+45+80)/8 = 64,25

Estimador do Efeito Principal de T: (-60+72-54+68-52+83-45+80)/4 = 23

Estimador do Efeito de Interação TxK: (+60-72+54-68-52+83-45+80)/4 =10


69
Planejamento Fatorial a Dois Níveis

ALGORITMO DE YATES
Outro método rápido para calcular os efeitos é dado pelo algoritmo de
Yates. Supor as observações na ordem padronizada (matriz de
planejamento):
1a coluna: - + - + - + - + - + - + - + - +............
2a coluna: - - + + - - + + - - + + - - + +............
3a coluna: - - - - + + + + - - - - + + + + ............
Em geral: a K-ésima coluna consiste de
2k-1 sinais negativos seguidos de
2k-1 sinais positivos
Uso do algoritmo de Yates para os dados anteriores
Exper. T C K y -1 -2 -3 Divisor Estimador Ident.
1 - - - 60 132 254 514 8 64,25 Média
2 + - - 72 122 260 92 4 23 T
3 - + - 54 135 26 -20 4 -5 C
4 + + - 68 125 66 6 4 1,5 TC
5 - - + 52 12 -10 6 4 1,5 K
6 + - + 83 14 -10 40 4 10 TK
7 - + + 45 31 2 0 4 0 CK
8 + + + 80 35 4 2 4 0,5 TCK
# 70
Planejamento Fatorial a Dois Níveis

71
Planejamento Fatorial a Dois Níveis

72
Planejamento Fatorial a Dois Níveis

x1
x2
x3

Teste x1 x2 x3 yi

73
Exemplo (Montgomery, página 319, 4 ed.).
Fatorial 24. Produção de um produto químico num recipiente sob
pressão. Esse experimento foi realizado com fatores que
provavelmente influenciam a taxa de filtração do produto. Os quatro
fatores colocados em estudo foram:
A: temperatura
B: pressão
C: concentração de
formaldeído
D: taxa de agitação
Os 16 experimentos foram realizados em ordem aleatória. O
engenheiro está interessado em maximizar a taxa de filtração. O
processo atual apresenta uma taxa de filtração em torno de 75 gal/h.
O processo também utiliza o fator C no nível alto. Deseja-se reduzir a
concentração de formaldeído tanto quanto possível, porém, isso causa
uma diminuição na taxa de filtração.
74
Tabela do experimento com taxa de filtração (matriz do delineamento)

Número do Fatores Taxa de


tratamento A B C D filtração
1 - - - - 45
2 + - - - 71
3 - + - - 48
4 + + - - 65
5 - - + - 68
6 + - + - 60
7 - + + - 80
8 + + + - 65
9 - - - + 43
10 + - - + 100
11 - + - + 45
12 + + - + 104
13 - - + + 75
14 + - + + 86
15 - + + + 70
16 + + + + 96

75
Planejamento Fatorial a Dois Níveis

MODELO ESTATÍSTICO

Considerando uma variável aleatória y relacionada com uma


variável controlada x dada pela relação linear,

yi = 0 + 1 xi + i (1)

Para i = 1, 2, ..., n e onde,

i) a variável aleatória yi representa a resposta para o i-ésimo ponto


experimental associada a um valor xi da variável independente;
ii) as variáveis ε1, ε2, ..., εn representam componentes de erros
desconhecidos considerados como variáveis aleatórias não observadas.
Supor que essas variáveis aleatórias εi são independentes e identicamente
distribuídas com distribuição normal N{0;σ};
iii) o parâmetros β0 e β1 são desconhecidos.

A partir das suposições acima, temos Yi ~ N{ 0 + 1 xi ; } , isto é, Yi tem


distribuição normal com médias na reta 0 + 1 xi .
76
Planejamento Fatorial a Dois Níveis

O MÉTODO DE MÍNIMOS QUADRADOS

Supor que o modelo de regressão linear (Eq. 1) seja correto. Para


estimar os parâmetros de regressão β0 e β1 , utilizamos o método de
mínimos quadrados.
O princípio de mínimos quadrados considera estimar os parâmetros
desconhecidos β0 e β1 pelos valores que minimizam a soma de quadrados
dos erros, dada por:
n
S = S( 0 , 1 ) =  i 0 1i
( y
i =1
−  −  x )2
(2)

Os estimadores ̂0 e ̂1 que minimizam (Eq. 2) são denominados


estimadores de mínimos quadrados (EMQ).

Derivando S(β0 , β1) em relação à β0 e β1 temos:

S( 0 ,1 ) n
= −2( yi − 0 − 1 xi )
0 i =1

S( 0 ,1 ) n
= −2 xi ( yi − 0 − 1 xi )
1 i =1 77
Planejamento Fatorial a Dois Níveis

De S( 0 ,1 ) / 0 = 0 e S( 0 ,1 ) / 1 = 0 encontramos ̂0 e ̂1 a partir das
equações normais:

ˆ n n

1  xi =  yi
 n + ˆ

 0
 i =1 i =1
 n n n
(3)

0  xi +1  xi =  xi yi
ˆ ˆ 2
 i =1 i =1 i =1

Portanto, resolvendo-se as equações (3) encontramos os estimadores de


mínimos quadrados ̂0 e ̂1 dados por:
 n

  ( xi − x )( yi − y )
ˆ
 1=
i =1
n

 i =1
( xi − x )2 (4)

ˆ ˆ x
0 = y −  1

A reta ajustada por mínimos quadrados é dada por:


ˆ +
ŷ =  ˆ x (6)
0 1 78
Planejamento Fatorial a Dois Níveis

Nota: Considere a notação básica:


1 n 1 n
x =  xi y =  yi
n i=1 n i=1
n n n
S xx = (xi − x ) =
2
 x − (2
i i /n
x )2

i=1 i=1 i =1
n n n
S yy = (yi − y ) =
2
 y − (2
i i /n
y )2

i=1 i=1 i =1
n n

n n
(  xi )(  yi )
S xy =  (xi − x )(yi − y ) = x y i i − i =1 i =1

i=1 i=1 n
Observar que x e y são as médias amostrais dos dados x e y; Sxx e Syy são
as somas de quadrados dos desvios das médias e Sxy é a soma dos produtos
cruzados dos desvios. Portanto, os estimadores de mínimos quadrados
podem ser reescritos por:
ˆ S xy
 =
 1 S
 xx (7)

ˆ ˆ
 0 = y − 1 x
79
Planejamento Fatorial a Dois Níveis

RESÍDUOS: Os resíduos da regressão linear (Eq. 1) são definidos por:


ˆ -
i = yi − ˆyi = ˆi = yi −  ˆ x i=1,2,..., n (8)
0 1 i

SOMA DE QUADRADOS RESIDUAL: A soma de quadrados devido ao erro


ou soma de quadrados residual é definida por:
n S xy2
SQR =  ˆi2 = S yy − (9)
i =1 S xx

ESTIMADOR DA VARIÂNCIA DE Y: Um estimador da variância é dado por:


SQR
s =
2
(10)
n−2

AVALIAÇÃO DA RELAÇÃO LINEAR

A partir da regressão linear, podemos considerar cada valor observado


dado na forma,
ˆ +
yi = (  ˆ x )+ (y − 
ˆ -
ˆ x ) (11)
0 1 i i 0 1 i

onde ̂0 e ̂1 são os estimadores de mínimos quadrados dos coeficientes de


regressão 0 e 1 . 80
Planejamento Fatorial a Dois Níveis

De (11), observamos que para cada valor de yi temos uma decomposição da


forma,

 VALOR   EXPLICAÇÃO PELA   RESIDUAL OU DESVIO 


  =   +  
 OBSERVADO   RELAÇÃO LINEAR   DA RELAÇÃO LINEAR 

Uma medida geral da discrepância de linearidade é dada pela soma de


quadrados residual:
n S xy2
SQR =  ( yi −
ˆ −
0
ˆ x )2 = S −
1 i yy (12)
i =1 S xx
A variabilidade total das observações yi é dada por:
n
S yy = ( yi − y )2 (13)
i =1

A diferença entre a soma de quadrados total e a soma de quadrados


residual é a soma de quadrados devido à regressão (ou a soma de
quadrados devido ao modelo, SQM):
S xy2
SQM = S yy − SQR = (14)
S xx

81
Planejamento Fatorial a Dois Níveis

Esta decomposição de variabilidade total de y é definida como análise de


variância, isto é:
S xy2
S yy = + SQR (15)
S xx
 VARIABILIDADE 
 VARIABILIDADE     VARIABILIDADE 
 =
  EXPLICADA PELA  +  RESIDUAL 
 TOTAL DE y     
 RELAÇÃO LINEAR 

Um índice para avaliação do modelo de regressão linear é dado pela


proporção de variabilidade explicada pela relação linear, isto é:
2
SQM S xy / S xx S xy2
r =
2
= = (16)
S yy S yy S xx S yy

Como o coeficiente de correlação amostral é dado por r = S xy S xx S yy ,


observamos que a avaliação da relação linear é medida por:
S xy2
r2 = (17)
S xx S yy

que é o quadrado do coeficiente de correlação amostral r. 82


Planejamento Fatorial a Dois Níveis

EXEMPLO 10.7. Sejam os dados de temperatura em função do tempo.


Encontrar os parâmetros da reta que representa o comportamento da
temperatura em função do tempo e o coeficiente quadrático de correlação
amostral e a proporção de variabilidade explicada pelo modelo de regressão
linear é dada por.
t[s) T [C]° B1 5,086957
1 16 B0 9,652174
2 18 SQR 31,04348
5 37 SQM 7380,157
15 82 R2 0,995811
20 114

83
CAPÍTULO VI
PLANEJAMENTOS
FATORIAIS E
REGRESSÃO

84
Planejamentos Fatoriais e Regressão

PLANEJAMENTOS FATORIAIS E REGRESSÃO

1) Planejamentos fatoriais são utilizados para descobrir possíveis fatores


(variáveis) que influenciam uma dada resposta.

2) Quando descobrimos esses fatores, usamos aproximações por uma


função polinomial,

 = f (x1, x2, ....., xk)

: resposta

x1, x2, ....., xk : k variáveis independentes

Matriz de planejamento D

 x11 x21 ..........xk1 


 
 x12 x22 ...........xk 2 
D = . 
 
. 
x x2 n ..........xkn 
 1n 85
Planejamentos Fatoriais e Regressão

Exemplo 1: x1: (temperatura) C


x2: (concentração de um reagente) %
y: Resposta (tempo de reação em segundos)

Níveis considerados: X1 : 150, 200 , 250


X2 : 8, 10, 12

D: matriz de planejamento 3k ; k=2 ; n = 32 = 9 experimentos

150 8
 
150 10 
150 12 
 
 200 8 
D =  200 10 
 200 12 
 
 250 8 
 250 10 
 
 250 12 
86
Planejamentos Fatoriais e Regressão

Exemplo 2: 3 fatores A, B, C ( fatorial 23)

A B C Experimento
- - - -1
1
+ - - a
- + - b
+ + - ab
- - + c
+ - + ac
- + + bc
+ + + abc
X1 X 2 X 3 y
 -1 -1 -1   (1) 
Codificação:
( − i )    
xi = 2 i  a 
di  1 -1 -1 
 -1 1 -1   b 
   
i : valor na escala original  1 1 -1   c 
D=  ab 
-1 -1 1 
   
di : diferença entre o nível alto e o nível baixo  1 -1 1   ac 
 -1 1 1  bc 
 i : média entre os 2 níveis na escala original    
 1 1 1   abc 
  
Planejamentos Fatoriais e Regressão
Exemplo 2: 3 fatores A, B, C ( fatorial 23)
Um modelo possível: y = ˆ X → X ' y = ˆ X ' X → ˆ = ( X ' X ) −1 X ' y
~ ~ ~
yi = o + 1 X1 + 2 X2 + 3 X3 + i ; i = 1,2, .....,8
Obs.: Com apenas 2 níveis, não podemos incluir termos quadráticos no
modelo (X12, X22, X32, mas os termos de interações X1X2, X1X3 ,...... poderão
ser incluídos.
1 -1 -1 -1   1 1 1 1 1 1 1 1
 (1) 
   
-1 1 -1 1 -1 1 -1 1   
1 1 -1 -1  X'=  a 
1 -1 1 -1   -1 -1 1 1 -1 - 1 1 1 
   b 
   
 1 1 1 -1   -1 -1 -1 -1 1 1 1 1 
X = =  c 
1 -1 -1 1  y  ab 
  8 0 0 0 1/ 8 0 0 0
~
 
1 1 -1 1       ac 
1 -1 1 1  X 'X =  0 8 0 0
(X ' X ) −1  0 1/8 0 0
 bc 
       
 1 1 1 1 0 0 8 0 0 0 1/8 0

     
 abc 
 0 0 0 8   0 0 0 1/8 

 (1) + a + b + c + ab + ac + bc + abc   g1 
  g 
− 1 + a − b + ab − c + ac − bc + abc = 2
X 'y =
~  −1 − a + b + ab − c − ac + bc + abc   g3 
   
 − 1 − a − b − ab + c + ac + bc + abc   g4  88
Planejamentos Fatoriais e Regressão

1/8 0 0 0   g1   g1 / 8   ˆ0 
      
0 1/8 0 0   g2   g2 / 8   ˆ1 
ˆ = ( X ' X ) −1 X ' y =  = ˆ
 = 
0 
0 1/8 0  g3   g3 / 8 
~
       ˆ2 
0 0 0 1/8   g 4   g 4 / 8   ˆ 
 3 

ˆ1 = (a + ab + ac + abc − (1) − b − c − bc) / 8

EMQ : ˆ 0 , ˆ 1 , ˆ 2 , ˆ 3

Fato: Os EMQ ̂ 's não são correlacionados entre si.

 ˆ0 
 
 ˆ1 
cov( ˆ ) = cov   =  2 ( X ' X ) −1 = ( 2 8) I
 ˆ2 
 ˆ 
 3 
89
Planejamentos Fatoriais e Regressão

Nota: O planejamento fatorial 2K pertence à uma classe de planejamentos


ortogonais, ou seja, planejamentos onde X’X é uma matriz diagonal (assim
os parâmetros estimados não são correlacionados entre si.

TESTES DE SIGNIFICÂNCIA NOS PARÂMETROS DO MODELO

O planejamento fatorial 2K pertence à uma classe de planejamentos


ortogonais, i.e., os parâmetros estimados não são correlacionados.

Portanto, a SQ da regressão pode ser decomposta em componentes


independentes, onde cada componente expressa a quantidade de regressão
explicada por uma variável individual xi no modelo.

 n 
  yi 
 i =1 
 g1 
SQreg ˆ  X ' y =(
= ˆ ,  ˆ ) g 
ˆ ,.......
0 1 k  2 
 g3 
~

 
 g4 
 
  90
Planejamentos Fatoriais e Regressão

SQ associada à Xi : ˆi gi = gi / n
2

Pois ˆi = g / n

Suposição: erros com distribuição normal

H0 : i = 0

H1 : i  0, i=1,2.........k

Exemplo: 4 variáveis x1, x2, x3, x4 são supostas terem influencia em uma
resposta de acordo com o modelo:
4
y = 0 +   j X j + 
j =1

91
Planejamentos Fatoriais e Regressão
Exemplo: 4 variáveis x1, x2, x3, x4 são supostas
terem influencia em uma resposta de acordo com
X1 X 2 X 3 X 4
o modelo: 4  (1) = 3,0 

y = 0 +  j X j + 
j =1

 a = 5, 0


1

-1 -1 -1 -1 

 b = 7,0  1 1 -1 -1 -1 
X’X =16 I5   1 -1 1 -1 -1 
 c = 2,0   
X1 X2 X3 X4 Y  d = 4,0  1 - 1 -1 1 -1 
- - - - 3   1 -1 -1 -1 1 
+ - - - 5  ab = 12,0   
  1 1 1 - 1 -1 
- + - - 7 = 1 1 -1 
 ac 4 , 0  1 -1
+ + - - 2
 ad = 6,0   
- - + - 4
y=  1 1 -1 -1 1
= X = 
+ - + - 12 ~  bc 5 , 0  1 -1 1 1 -1 
- + + - 4  bd = 9,0  1
+ + + - 6   -1 1 -1 1 
 
- - - + 5  cd = 3,0  1 -1 -1 1 1 
+ - - + 9  abc = 14,0  1
  1 1 1 -1 
- + - + 3  
+ + - + 14  abd = 11,0  1 1 1 -1 1 
- - + + 11   1 1 1 
+ - + + 5  acd = 5 , 0   1 -1
- + + + 7  bcd = 7,0  1 -1 1 1 1 
+ + + + 13    
 abcd = 13 , 0  1 1 1 1 1
(a + ab + ac + ad + abc + abd + acd + abcd − (1) − b − c − d − bc − bd − cd − bcd )
ˆ1 =
16
Planejamentos Fatoriais e Regressão
ˆi = gi / n ˆ0 = 110 / 16 = 6,875

ˆ1 = 30 /16 = 1,375 ˆ2 = 46 /16 = 0,125 ˆ3 = 4 /16 = 0,875 ˆ4 = 6 / 16 = 1,500

RQM ou
PARÂMETRO SQ QM GL Fobs
REGR. 835,000 208,750 5,000
F1,11
MEDIA 6,875 756,250 756,250 1,000
X1 1,375 30,250 30,250 1,000 2,394
X2 0,125 0,250 0,250 1,000 0,020
X3 0,875 12,250 12,250 1,000 0,969
X4 1,500 36,000 36,000 1,000 2,849
TOTAL 974,000 60,875 16,000
0 2 4 6 8 F
ERRO 139,000 12,636 11,000
Planejamentos Fatoriais e Regressão

INCLUSÃO DA INTERAÇÃO
Ex:
Modelo : yi = o + 1 x1i + 2 x2i + 12 x1i x2i + i ; i=1,2, ......., n

Voltando ao Exemplo (Montgomery, página 319, 4 ed.).


Número do Fatores Taxa de
tratamento A B C D filtração Fatorial 24. Produção de um produto
1 - - - - 45 químico num recipiente sob pressão. Esse
2 + - - - 71
3 - + - - 48
experimento foi realizado com fatores que
4 + + - - 65 provavelmente influenciam a taxa de
5 - - + - 68 filtração do produto. Os quatro fatores
6 + - + - 60
7 - + + - 80 colocados em estudo foram:
8 + + + - 65
9 - - - + 43
10 + - - + 100
A: temperatura
11 - + - + 45 B: pressão
12 + + - + 104 C: concentração de formaldeído
13 - - + + 75
14 + - + + 86 D: taxa de agitação
15 - + + + 70
16 + + + + 96
94
Planejamentos Fatoriais e Regressão

EXPERIMENTOS FATORIAIS EM 3 NÍVEIS

K fatores em 3 níveis

Fatorial 3K : úteis quando o modelo de regressão é melhor representado


por uma relação de 2a ordem, i.e., termos de 1a e 2a ordem são incluídos
no modelo.

Desvantagem: se K é grande leva a um número muito grande de


experimentos.

Ex: Planejamento 32

= 0 + 11 + 22 + 1112 + 2222 + 1212


Codificação das variáveis i em xi tomando valores –1 0 1

95
Planejamentos Fatoriais e Regressão

Matriz X:
X1 X2 X12 X 22 X1X 2
 -1 -1 
   1 -1 -1 1 1 1 
- 1 0  
  1 - 1 0 1 0 0 
 -1 1   1 -1 1
  1 1 -1 
 
 0 -1   1 0 -1 0 1 1 
D= 0 0  X = 1 0 0 0 0 0 
   
 0 1  1 0 1 0 1 0 
 1 -1   1 1 -1
  1 1 -1 
 
 1 0  1 1 0 1 0 0 
   
 1 1  1 1 1 1 1 1

X’X não é diagonal

Outra forma de escrever o modelo:

 =  0 + 1 x1 +  2 x2 + 11 ( x12 − x12 ) +  22 ( x22 − x22 ) + 12 x1 x2


x12 e x22 : média dos valores x12 e x22 96
Planejamentos Fatoriais e Regressão

X1 X 2 (X 21 -X12 ) (X22 -X22 ) X1X 2


1 -1 -1 1/3 1/3 1 
 
1 -1 0 1/3 -2/3 0 
1 -1 1 1/3 1/3 -1 
 
1 0 -1 -2/3 1/3 1 
X = 1 0 0 -2/3 -2/3 0 
 
1 0 1 -2/3 1/3 0 
1 1 -1 1/3 1/3 -1 
 
1 1 0 1/3 -2/3 0 
 
1 1 1 1/3 1/3 1 

Daí,
9 0 0 0 0 0
 
0 6 0 0 0 0
0 0 6 0 0 0 Matriz Diagonal –
X 'X =  planejamento ortogonal
0 0 0 2 0 0
0 0 0 0 2 0
 
0 0 0 0 0 4 97
Planejamentos Fatoriais e Regressão

MISTURA BINÁRIA DE PARTÍCULAS EM


LEITO DE JORRO
Esferas de vidro com dp# ≠ (1 e 4 mm)
X b − 0,50 H0 − 8
x1 = x2 =
0, 25 2

Esferas de vidro e polietileno (dp# 4 mm)


X PE − 0,50 H0 − 8
x1 = x2 =
0, 25 2
Planejamento Experimental 3k
Xb H0 x1 x2
Teste
XPE [cm]
1 0,25 6 -1 -1
2 0,50 6 0 -1
3 0,75 6 1 -1
4 0,25 8 -1 0
5 0,50 8 0 0
2 cm 6 0,75 8 1 0
7 0,25 10 -1 1
8 0,50 10 0 1
Unidade Experimental 9 0,75 10 1 1
98
Planejamentos Fatoriais e Regressão

Resultados: Mistura de Esferas de Vidro de 1 e 4 mm

Efeito das variáveis Xb e H0 sobre a condição de jorro mínimo

x1 x2 Q jm [m s ] Pjm [ Pa ]

-1 -1 9,49 663,08
0 -1 10,39 725,67
1 -1 16,66 752,01 1 2
-1 0 18,76 930,72
0 0 14,19 946,24
1 0 20,94 996,71
-1 1 19,78 1217,46
0 1 18,16 1291,50
1 1 28,12 1256,78 3 4

99
4. MISTURA BINÁRIA DE PARTÍCULAS EM LEITO DE JORRO Planejamentos Fatoriais e Regressão

Resultados: Mistura de Esferas de Vidro de 1 e 4 mm

R2= 0,9368 R2= 0,9902

30,0

25,0
Qmj [m3/h]

20,0 25
20
15,0 15
10
10,0

10,0
0,8
9,0
0,6
8,0
H0 [cm] 0,4 Xb
7,0
6,0 0,2

Q jm [m3 / h] = 17,388 + 2,948 x1 + 4,920 x2 − 2,356 x12 Pjm [ Pa] = 975,574 + 32,373 x1 + 270,830 x2

100
4. MISTURA BINÁRIA DE PARTÍCULAS EM LEITO DE JORRO

Resultados: Mistura de Esferas de Vidro de 1 e 4 mm

Efeito das variáveis Xb e H0 sobre a Segregação I M = X B ( X B )0

0,10
1,17
8 cm 1,20 1,14
0,08 1,11
1,08
1,15
0,06
h [m]

IM
1,10
0,04
1,05
0,02 Xb=0,25
Xb=0,50 0,2
Xb=0,75 6,0
0,00 7,0 0,4
0,50 0,75 1,00 1,25 1,50
H0 [cm] 8,0 0,6
Xb/Xb0 9,0 Xb
10,0 0,8

I M −topo = 1,102-0,036x1 -0,020x2 + 0,018x1 x2

101
4. MISTURA BINÁRIA DE PARTÍCULAS EM LEITO DE JORRO

Resultados:
Mistura de Esferas de Vidro e Polietileno
Curva característica H0= 8 cm, com XPE =0,75 Planejamento fatorial 32:
condição de jorro mínimo
conjunto
x1 x2 Q jm [m s ] Pjm [ Pa ]
-1 -1 29,392 482,52
0 -1 40,06 589,09
1 -1 59,78 616,48
-1 0 27,54 349,92
0 0 38,07 445,93
1 0 50,76 487,12
-1 1 24,52 291,07
0 1 32,72 339,80
1 1 42,59 392,85

102
4. MISTURA BINÁRIA DE PARTÍCULAS EM LEITO DE JORRO

Resultados: Mistura de Esferas de Vidro e Polietileno

R2= 0,99357 R2= 0,9900


70,0 700,0
60
50 600
60,0 600,0
40 500

-ΔPms [Pa]
50,0 30 400
Qms [m3/h]

500,0 300
40,0
400,0
30,0
300,0
20,0
10,0 200,0

10,0 10,0
0,8 9,0 0,8
9,0
0,6 8,0 0,6
8,0
H0 [cm] H0 [cm]
7,0 0,4 X
XbPE 7,0 0,4 XXPE
b

6,0 0,2 6,0 0,2

Q jm [m3 / h] = 38,383 − 4,899 x1 + 11,946 x2 Pjm [ Pa] = 443,874 − 110,718 x1 + 62,157 x2


− 1,0738x22 − 3,081x1 x2 − 12,162 x12 + 10,818 x22

103
Planejamentos Fatoriais e Regressão

PLANEJAMENTOS PARA AJUSTE DE MODELOS DE 2a ORDEM

Modelos de 2a ordem devem envolver 3 níveis de cada variável para que os


coeficientes do modelo sejam estimados.

Escolha do planejamento

precisão relativa na estimação dos parâmetros


quantidade do esforço experimental ( no de observações )

Um planejamento óbvio: 3k

Problema: k grande exige um número grande de experimentos

Ex: k=4; 3k = 81 pontos

Nota: Uma alternativa aos planejamentos fatoriais 3k são os chamados


planejamentos compostos.

104
Planejamentos Fatoriais e Regressão

MODELO DE REGRESSÃO MÚLTIPLA


Seja n observações numa variável resposta y e p variáveis
independentes x1, x2, ..., xp.
y x1 x2 x3 ··· xp
y1 x11 x21 x31 ··· xp1
y2 x12 x22 x32 ··· xp2
y3 x13 x23 x33 ··· xp3
⁞ ⁞ ⁞ ⁞ ⁞ ⁞
⁞ ⁞ ⁞ ⁞ ⁞ ⁞
⁞ ⁞ ⁞ ⁞ ⁞ ⁞
yn x1n x2n x3n ⁞ xpn

Modelo Linear: yi = o + 1x1i + 2 x2i + 3x3i + ... + pxpi + i


i : erro aleatório
x1, x2, ..., xp: fixos

Estimadores de mínimos quadrados:


n n
Minimizar: S (o , 1, 2, ........p) = 
i =1
i
2
=  ( yi −  0 − 1 x1i −  2 x2i −  p x pi ) 2
i =1
Com p+1 parâmetros 105
Planejamentos Fatoriais e Regressão

Equações normais:
S11 ˆ1 + S12 ˆ 2 + .............. + S1 p ˆ p = S y1 
 
S12 ˆ1 + S 22 ˆ 2 + .............. + S 2 p ˆ p = S y 2 
 
. 
. 
 
S1 p  1 + S 2 p  2 + .............. + S pp  p = S yp 
ˆ ˆ ˆ
 
Onde :
n
S ij =  ( xik − xi )( x jk − x j ) i; j=1,2,....,p
k =1

n
S yi =  ( y k − y )( xik − xi ) i=1,2,....,p
k =1

n n

x ik y k
xi = k =1
yi = k =1

n n

ˆ o = y − ˆ1 x1 − ˆ 2 x 2 − ........ − ˆ p x p 106


Planejamentos Fatoriais e Regressão

Resolver o sistema acima e achar ˆ o , ˆ 1 , 2 , ..., ˆ p (EMQ)


yˆ i = ˆ o + ˆ1 x1i + ˆ 2 x 2i + ....... + ˆ p x pi

Resíduo observado: ˆi = y i − yˆ i

Nota: usar os resíduos para avaliar a adequabilidade do modelo proposto

NOTAÇÃO MATRICIAL

 x01 x11 ..........x p1   y1  1   0 


       
 x02 x12 ........... x p 2   y2   2   1 
 
X = .


;
y =  .  ;  =  .  ;  =  . 
  ~ ~
. 
~
.  .  . 

 x0 n x1n ..........x pn 
      
   yn   n  p 
Modelo Linear: y = X  +  sem interações (com interações é #)
~ ~ ~

Onde x0i=1 para todo i ( y1= x010+ x111+........+ 1)


Logo: x01=1 (idem para as demais).
107
Planejamentos Fatoriais e Regressão

Suposições : E (  )=0 ; var(  )=2 In


~ ~
Portanto, E ( y )= X 
~ ~
In – matriz identidade

1 0 0 ...0 
 
0 1 0 ...0 
I = 0 0 1 ...0 
 
. 
0 0 0....1 

EMQ: Minimizar S (  )
~
Onde, S (  ) =  '  = ( y − X  ) ( y − X  )
'

~ ~ ~ ~ ~ ~ ~
Daí, ( X ' X ) ˆ = X ' y
~ ~
Assumindo que X’ X tem uma inversa ̂ é dado por:
~
ˆ = ( X ' X ) −1 X ' y
~ ~
Valores de previsão: ŷ = X ˆ
~ ~
Vetor dos resíduos: ˆ = y − yˆ = y − X ˆ
~ 108
~ ~ ~ ~
Planejamentos Fatoriais e Regressão

Propriedades dos EMQ:


i) E ( ˆ ) = 
~ ~

Var ( ˆ ) = E[( ˆ −  )( ˆ −  ) '] =  2 ( X ' X ) −1 =  2 C


~ ~ ~ ~ ~

C = (X’ X)-1 é uma matriz diagonal – matriz de variância e covariância


dos parâmetros
ii) Um estimador não viciado de 2 é s2 dado por:
(ˆ' ˆ) ( y − yˆ ) '( y − yˆ ) ( y' y − ˆ' x ' y )
s2 = ~ ~
= ~ ~ ~ ~
= ~ ~ ~ ~

(n − p − 1) (n − p − 1) (n − p − 1)

O COEFICIENTE DE CORRELAÇÃO MÚLTIPLA


R: Coeficiente de correlação múltipla

2
= 1−
 (y i − yˆ i ) 2 Ótimo ajuste: R2  1
R Péssimo ajuste: R2  0
(y i − yi ) 2

R2: proporção da variabilidade total explicada pela equação de regressão


(um número entre 0 e 1). 109
Planejamentos Fatoriais e Regressão
*

Nota: O valor de R2 é usado como uma medida descritiva para avaliar o


ajuste do modelo linear para os dados. Apesar disso, um valor alto de R2
não implica que os dados estão bem ajustados pelo modelo.

TESTES DE HIPÓTESES

Algumas hipóteses de interesse:


i) todos coeficientes de regressão são iguais a zero;
ii) um subconjunto dos coeficientes de regressão são iguais a zero;
iii) um subconjunto dos coeficientes de regressão são iguais entre si.

MÉTODO GERAL : FM: modelo completo


RM: modelo reduzido sob a hipótese

yˆi : valor de previsão para o modelo completo


yˆ i * : valor de previsão para o modelo reduzido
SQR ( FM ) =  ( yi − yˆi ) 2

SQR ( RM ) =  ( yi − yˆi *) 2 110


y X1 X2 X3 X4 X5 X6
No modelo completo temos p+1 43 51 30 39 61 92 45
parâmetros (o , 1, 2, ........p) 63 64 51 54 63 73 47
71 70 68 69 76 86 48
61 63 45 47 54 84 35
Supor um modelo reduzido (k 81 78 56 66 71 83 47
parâmetros). Para verificar se o 43 55 49 44 54 49 34
modelo reduzido é adequado, 58 67 42 56 66 68 35

comparar ( SQR (RM) - SQR (FM) ) 71


72
75
82
50
72
55
67
70
71
66
83
41
31
com SQR (FM). 67 61 45 47 62 80 41
64 53 53 58 58 67 34
Usar: 67 60 47 39 59 74 41
69 62 57 42 55 63 25
(SQR (RM) - SQR (FM) ) / (p+1-k) 68 83 83 45 59 77 35
SQR(FM) / (n-p-1) 77 77 54 72 79 77 46
81 90 50 72 60 54 36

Teste estatístico: 74
65
85
60
64
65
69
75
79
55
79
80
63
60
65 70 46 57 75 85 46
[ SQR ( RM ) − SQR ( FM )] / ( p + 1 − k ) 50 58 68 54 64 78 52
F= 50 40 33 34 43 64 33
SQR ( FM ) / (n − p − 1) 64 61 52 62 66 80 41
53 66 52 50 63 80 37
Fp +1− k , n − p −1 40 37 42 58 50 57 49
63 54 42 48 66 75 33
66 77 66 63 88 76 72
78 75 58 74 80 78 49
EXEMPLO: Dados n=30 48 57 44 45 51 83 38
85 85 71 71 77 74 55
82 82 39 59 64 78 39
Planejamentos Fatoriais e Regressão

Modelo: y = o + 1 X1 + 2 X2 + ......+ 6 X6 + 

Tabela – Coeficientes da regressão, desvios-padrões e valores de t


Variável Coeficiente D.P. t
X1 0,613 0,161 3,81
X2 -0,073 0,1357 -0,54
X3 0,32 0,1685 1,9
X4 0,081 0,2215 0,37
X5 0,038 0,147 0,26
X6 -0,217 0,1782 -1,22
Constante 10,787 11,589 0,93
N=30 R2=0,7326 s=7,068

Os resíduos têm uma distribuição aleatória em torno do zero.


30
i)
SQR ( FM ) =  ( yi − yˆi ) 2 = 1149
i =1
ii) R2=0,7326 (i.e. 73% da variabilidade de y pode ser explicada pelas 6
variáveis)
iii) Somente as variáveis X1 e X3 apresentam coeficientes de regressão
aparentemente significativos, i.e., diferentes de zero. 112
Planejamentos Fatoriais e Regressão

Teste de Hipóteses:

H0 : 1 = 2 =......... 6 = 0

Sob H0 o modelo reduzido é dado por:

y = o’ +  (somente um parâmetro)

EMQ de o’: ̂ 0 = y
'

30
SQR ( RM ) =  ( yi − y ) 2 = 4297 (uma diferença muito grande de 1149
i =1
indicando que não é verdade).

(4297 − 1149) / 6
Fobs = = 10,50 ; g.l. = 6; 23
1149 / 23

F6, 23(0,01) = 3,71

Conclusão: Fobs=10,50 > 3,71, rejeitar H0 no nível de significância de 1%,


i.e., todos os ’s não são iguais a zero.
113
Planejamentos Fatoriais e Regressão

Outro teste: H0: 2 = 4 = 5 = 6 = 0

Modelo reduzido: y = o + 1 X1 + 3 X3 + 

EMQ (modelo ajustado): yˆ * = 9,871 + 0, 643 X 1 + 0, 211X 3 + 


(7,06) (0,118) (0,134) Desvios padrões

SQR ( RM ) =  ( yi − yˆi* ) 2 = 1254, 6

(1254, 6 − 1149) / 4
Fobs = = 0,528 ; g.l.=4,23
1149 / 23

Conclusão: O valor de Fobs não é significante sob os níveis usuais, i.e.,


não rejeitar H0 : 2 = 4 = 5 = 6 = 0

Portanto só as variáveis X1 e X3 são importantes.

114
CAPÍTULO VII
PLANEJAMENTO
COMPOSTO CENTRAL
(PCC)

115
Planejamento Composto Central

PLANEJAMENTO COMPOSTO CENTRAL (PCC)

Planejamentos compostos centrais são planejamentos fatoriais de


1a ordem aumentados por pontos adicionais para permitir a estimação dos
parâmetros de uma superfície de 2a ordem.

Planejamento fatorial 2k ou fatorial fracionário (níveis codificados –


1 e +1) aumentados pelos seguintes pontos:
x1 x2 x3 xk
 0 0 0 ............... 0 
 
 -a 0 0 ................ 0 
 a 0 0 ................ 0 
 
 0 -a 0 ............... 0 
 0 a 0 ............... 0 
 
 0 0 -a ............... 0 
 0 0 a ............... 0 
 
 0 0 0 ............... -a 
 
 0 0 0 ............... a  116
Planejamento Composto Central

Escolha de a: selecionado pelo pesquisador

Ex: 3 variáveis independentes

 -1 -1 -1 
 
 -1 -1 1 
 -1 -1 

1
 Obs: Desejável mais de um ponto central
 -1 1 1  para atingir algumas propriedades do
 1 -1 - 1  planejamento.

 1 -1 1  n2  1 observações em (0,0,0, ......0)
 
 1 1 -1  (número de réplicas no ponto central)
D= 1 1 1 
  Com a1, cada variável é medida em 5
 0 0 0 
níveis
-a 0 0 
 
 a 0 0  Número total de observações: 2k + 2k +
 0 -a 0  n2 pontos.
 
 0 a 0 
 
 0 0 -a 
 0 a 
 0 117
Planejamento Composto Central

Obs: Para comparar PCC e fatoriais 3k devemos observar a matriz X e a


matriz X’X.

Seja: G: número de pontos fatoriais (G= 2k , se completo)

T: número de pontos adicionais no pcc T= 2k+n2

Com k=3 e n2=1, temos:

Modelo:

3 3
yu =  0 '+   j x ju +   j x jj ( x ju 2 − x j2 ) +   jp x ju x pu +  u
j =1 j =1 j<p

u= 1,2,......., N

118
Planejamento Composto Central

0' 1 2 3 11 22 33 12 13 23


 
 1 -1 -1 -1 1-c 1-c 1-c 1 1 1 
 1 -1 -1 1 1-c 1-c 1-c 1 -1 -1 
 
 1 -1 1 -1 1-c 1-c 1-c -1 1 -1 
 1 -1 1 1 1-c 1-c 1-c -1 -1 1 
 
 1 1 -1 -1 1-c 1-c 1-c -1 -1 1 
 1 1 -1 1 1-c 1-c 1-c -1 1 -1 
 
 1 1 1 -1 1-c 1-c 1-c 1 -1 -1  G + 2a 2
  c=
X = 1 1 1 1 1-c 1-c 1-c 1 1 1  G +T
 1 0 0 0 -c -c -c 0 0 0 
 
 1 -a 0 0 a 2 -c -c -c 0 0 0 
 1 a 0 0 a 2 -c -c -c 0 0 0 

 1 0 -a 0 -c a 2 -c -c 0 0 0 
 
 1 0 a 0 -c a 2 -c -c 0 0 0 
 
 1 0 0 -a -c -c a 2 -c 0 0 0 
 a a 2 -c 0 
 1 0 0 -c -c 0 0
119
Planejamento Composto Central

Ex: k=3 (full); G=8 se n2=1; T=7

c=(8+2a2)/15 se a=1,216 c=0,73

 0' 1 2 3 11  22  33 12 13  23


15 0 0 0 0 0 0 0 0 0
 
0 8 + 2a 2 0 0 0 0 0 0 0 0
0 0 8 + 2a 2 0 0 0 0 0 0 0
 
0 0 0 8 + 2a 2 0 0 0 0 0 0
 
0 0 0 q p q q 0 0 0
X 'X =
0 0 0 q q p q 0 0 0
 
0 0 0 0 0 0 p 0 0 0
0 0 0 0 0 0 0 8 0 0
 
0 0 0 0 0 0 0 0 8 0
0 8 
 0 0 0 0 0 0 0 0

120
Planejamento Composto Central

Matriz X’X (CASO GERAL)

a) Elemento (1,1) = N = G+T


b) Elementos diagonais correspondentes aos coeficientes de 1a ordem :
G+2a2
c) Elementos diagonais correspondentes aos coeficientes de interação : G
d) A matriz kxk simétrica correspondente aos coeficientes quadráticos

(diagonal) GT − 4Ga 2 − 4a 4 + 2(G + T )a 4


p=
G +T

GT − 4Ga 2 − 4a 4
q=
G +T

121
Planejamento Composto Central

PLANEJAMENTO COMPOSTO CENTRAL ORTOGONAL


PCC → a escolhido pelo pesquisador
Uma 1a escolha de a → pcc ortogonal
Pcc ortogonal → X’X diagonal : estimadores fáceis de serem
obtidos e não correlacionados.
X’X diagonal → q=0 →
GT − 4G a 2
− 4a 4
= 0 (elementos fora da
diagonal iguais a zero)
1/ 4
 QG 
a =  onde, Q = [(G+T)1/2 – G1/2]2
 4 

Alguns valores de a para obter-se pcc ortogonal


K a
2 1
3 1,216
4 1,414
5 1,596
6 1,761
7 1,91
# 8 2,045
122
Planejamento Composto Central

Obs: Para k=2, a=1, i.e., o pcc ortogonal é o fatorial 32


x1 x2
-1 -1
1 -1
-1 1
1 1
0 0
-1 0
1 0
0 -1
0 1

123
CAPÍTULO VIII
TÉCNICA DAS
SUPERFÍCIES DE
RESPOSTAS

124
Técnica das Superfície de Respostas

TÉCNICA DAS SUPERFÍCIES DE RESPOSTAS

Seja:
 : resposta
k : variáveis independentes 1, 2, ..., k
 = f (1, 2, ..., k)

f em geral é desconhecida e/ou muito complicada.

OBJETIVO: Aproximar f por um polinômio de ordem baixa numa região


das variáveis independentes.
Ex: Modelo de 1a ordem

 =  0 + 1 x1 +  2 x2 + ... +  k xk
x1, x2, ..., xk: formas codificadas das variáveis independentes 1, 2, ..., k.

Modelo de 2a ordem
k k
 =  0 +  i xi +  ii xi2 +  ij xi x j
i =1 i =1 i j

i<j 125
Técnica das Superfície de Respostas

Suposições:

a) As variáveis envolvidas são quantitativas e contínuas


b) As variáveis independentes x1, x2, ........., xk são controladas no
processo e medidas com pequenos erros .

Nota: Usar técnicas usuais de regressão para estimação e verificação da


adequabilidade do modelo.

Objetivo final: Encontrar valores de previsão de respostas futuras e


encontrar quais valores das variáveis independentes são ótimos em
relação à resposta, i.e., procurar valores de x1, x2, ........., xk que
maximizam a resposta.

Alguns problemas na localização dos pontos ótimos

A região experimental usada é a vizinhança do ponto ótimo.


O ponto ótimo verdadeiro está distante da região experimental.

126
Técnica das Superfície de Respostas

REVISÃO DE ALGUNS CONCEITOS IMPORTANTES


a) Raízes Características de uma matriz
Seja A (mxm) e  um escalar.
A matriz A-Im é a matriz característica de A. O determinante f() = A-
Im é a função característica da matriz A.
As raízes da equação f()=0 são chamadas raízes características ou raízes
latentes de A.

1 2
Ex: A =  
2 2

Equação característica:

1−  2
=0
2 2-
3 17
1 = +
2 2
 2 − 3 − 2 = 0
3 17
2 = − 127
2 2
Técnica das Superfície de Respostas

O autovetor associado com a raiz característica  é definido como um vetor


coluna x que é a solução da equação:

Ax =  x Ou: ( A −  I m ) x = 0
~ ~
~ ~
3 17
Com 1 = + , achamos o autovetor x dado a partir de:
~
2 2
 3 17 
1 − − 2   x1   0 
 2 2   =  
    
3 17     
 2 2− −   x2   0 
 2 2 
Teorema: As raízes características de uma matriz simétrica real são todas
reais.
Formas quadráticas reais
Uma forma quadrática em k variáveis x1, x2, ........., xk é uma
expressão escalar do tipo:
k
Q =  aii xi2 + 2 aij xi x j
i =1
128
i<j
Técnica das Superfície de Respostas

Onde todos elementos aij são reais (i,j=1,2,..........,k). Ou, x~ ' A x~ ' , onde:

 x1   a11 a12 .......... .a1k 


   
 x2  a 22 ........... .a 2k 
A=
x =  ..   . 
~    
.   sim. a kk 
 
xk 
A é uma matriz simétrica

Ex:
Q = x' A x
~ ~

2 1 4   x1 
 
( x1 ,x2 ,x3 )  1 6 3   x2  = 2x12 + 6 x22 + 2x32 + 2x1 x2 + 8x1 x3 + 6 x2 x3
4 2   x3 
 3

129
Técnica das Superfície de Respostas

REDUÇÃO DE UMA FORMA QUADRÁTICA PARA A FORMA CANÔNICA


No estudo da forma de uma superfície de resposta e localização
das regiões de condições ótimas, é útil reduzir uma forma quadrática para
a forma canônica.

Teorema: Se 1, 2, ..., k são as raízes características (todas reais) da


matriz simétrica real A, então existe uma transformação ortogonal x = P w
~ ~
tal que a forma quadrática real Q = x A x
'
é transformada para a forma
~ ~
canônica :
1w12 + 2w22 + ... + kwk2 .

Isto é , a forma quadrática Q é transformada para uma forma com uma


matriz diagonal, onde seus elementos diagonais são as raízes
características da matriz A.

ANÁLISE DA SUPERFÍCIE AJUSTADA


Modelo: Superfície de resposta de 2a ordem
k k k k
 = 0 +   j x j +   jj x +   jm x j xm , j<m
2
j
130
j =1 j =1 j =1 m =1
Técnica das Superfície de Respostas

EMQ: b0 , b1, ..., bk, b11, ..., bkk, b12,....


Superfície de resposta ajustada
k k k k
yˆ = b0 +  b j x j +  b jj x 2j +  b jm x j xm
j =1 j =1 j =1 m =1

Nota: Para a análise da superfície de resposta não é aconselhável


extrapolar além da região onde a auperfície está sendo ajustada.

Objetivo : Estimar as condições em que x1, x2, ........., xk que maximizam


a resposta .

Caso particular

ŷ = b0 + b1 x + b11 x 2
yˆ
= b1 + 2b11 x = 0
x
 2 yˆ
b1 = 2b11  0
x=− será um ponto de máximo se
x 2
2b11 131
Técnica das Superfície de Respostas

Ponto estacionário:

x = -b1/2b11

Em geral:
yˆ = b0 + x' b+ x' B x
~ ~ ~ ~

Onde:
 x1   b1 
     b11 b12 /2......... .b1k / 2 
 x2   b2   
x =  ..  b =  .. 
b ........... . b / 2
    B= 22 2k 
~ ~  . 
.  .   
     sim. b kk 
xk   bk 
k
Obs:
~
'
x b : termos de 1a ordem na função de respostas:
~
b x
j =1
j j

k k k

~
'
x B x : contribuição quadrática:
~
b
j =1
jj x +  b jm x j xm
2
j
j =1 m=1
132
Técnica das Superfície de Respostas

Se o máximo existir, será um conjunto de condições em (x1, x2, .....,xk) , tal


que:
yˆ yˆ yˆ
= = ... = =0
x1 x2 xk
x = ( x10 , x20 ,..., xk 0 ) : ponto estacionário
'
~0

yˆ  
= b0 + x' b+ x' B x  = b+ 2 B x = 0
x x ~ ~ ~ ~ ~ ~
~ ~
# 1
i.e., x0 = − B −1 b
~ 2 ~

Notas: O ponto estacionário x0 pode ser:


~
i) um ponto onde a superfície atinge um máximo;
ii) um ponto onde a superfície atinge um mínimo
iii) um ponto nem de máximo, nem de mínimo (ponto de sela) – “saddle
point”
#

Possíveis problemas:
a) Pode existir um região de máximo e não um ponto de máximo
133
b) Pode ser que o ponto estacionário esteja fora da região experimental
CAPÍTULO IX
ANÁLISE CANÔNICA

134
Análise Canônica

ANÁLISE CANÔNICA

Superfície de 2a ordem
k k k k
yˆ = b0 +  b j x j +  b jj x +  b jm x j xm
2
j
j =1 j =1 j =1 m =1

j<m
Ou yˆ = b0 + x' b + x' B x
~ ~ ~ ~

Objetivo: Determinar a natureza de um ponto estacionário

Procedimento: Considerar uma translação da superfície de respostas da


origem (x1, x2, .....,xk)=(0,0,.........,0) para o ponto estacionário x0
~

Daí a função de resposta é formulada em termos de novas variáveis, w1,


w2,.....wk cujos eixos correspondem aos eixos principais do sistema de
contornos.

135
Análise Canônica

W2
x2 W1

x0
~

x1
Função de respostas em termos das novas variáveis w1, w2, ......, wk
(forma canônica)
yˆ = yˆ 0 + 1w12 + 2 w22 + ... + k wk2
1 −1
ŷ 0 : resposta estimada no ponto estacionário x0 = − B b
~ 2 ~

1, 2., .......k são constantes


136
Análise Canônica

Notas:
a) Os sinais dos ’s e a grandeza dos ’s ajudam a determinar a natureza
do ponto estacionário
b) A relação entre os w’s e os x’s também é importante pois indica ao
pesquisador regiões úteis para exploração

Forma canônica: translação da superfície de resposta para uma nova


origem x0 .
~
Definir: z = x − x0
~ ~ ~
Portanto:
yˆ = b0 + ( z'+ x'0 ) b+ ( z'+ x'0 ) B( z + x0 ) = b0 + x'0 b+ x'0 B x0 + z' b+ z' B x0 + x'0 B z + z' b z
~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~

Daí, sendo z ' B x0 e x'0 B z equivalentes, tem-se:


~ ~ ~ ~

yˆ = yˆ 0 + z'(b+ 2 B x0 )+ z' b z
~ ~ ~ ~ ~

1 −1
mas 0 x = − B b
~ 2 ~
−1
então: yˆ = yˆ 0 + z'[b − 2 B( B b / 2)] + z' b z 137
~ ~ ~ ~ ~
Análise Canônica

Nota : A determinação da matriz M é importante porque a transformação


w = M ' z permite ao pesquisador a obtenção da expressão relacionada as
~ ~
variáveis zi com as variáveis wi.

M = [m , m ,...... m ]
~1 ~ 2 ~ k

m : i-ésima coluna de M (autovetores normalizados associados às


~ i

raízes características i .

 m1i 
 
 m2i 
m = . 
~ i  
 . 
 
 ki 
m

m12i + m22i + ... + mki2 = m m = 1


'
onde : (B-iIk) = 0 no qual
~ i ~ i
138
Análise Canônica

INTERPRETAÇÃO DO SISTEMA
i) se i < 0 , i=1,2,......, k, quando movimentamos em qualquer direção a
partir do ponto estacionário, teremos um decréscimo de , i.e., o ponto
estacionário é um ponto de resposta máxima da superfície ajustada.
ii) se i > 0 , i=1,2,......, k, o ponto estacionário é um ponto de mínimo
para a superfície ajustada.
iii) se os ’s tem sinais diferentes, o ponto estacionário não é nem ponto
de máximo nem de mínimo.

Ex: yˆ = yˆ 0 + 1w12 + 2 w22


i) Supor 1 < 0 e 2 > 0
Um movimento no eixo w1 a partir de x0 em qualquer direção acarreta
~
um decréscimo na resposta estimada, enquanto que um movimento no
eixo w2 acarreta num acréscimo da resposta estimada.

ii) Supor k=2 , 1 < 0 , 2 < 0 e que 2  1 . Daí, um movimento ao longo


de w1 não modifica tanto a resposta estimada ( ŷ ) como um movimento ao
longo de w2.
139
#
Análise Canônica

iii) i  0 → determinamos uma região quase que estacionária na direção


do eixo correspondente.

iv) k=2 , 1 < 0 e 2  0. O ponto estacionário pode não estar na região de


experimentação.

Exemplo 1:

O objetivo de uma pesquisa de laboratório foi encontrar valores de tempo


(t) e temperatura (T) para produzir uma resposta máxima (gramas de
produto). As variáveis codificadas x1 e x2 são dadas por:

tempo − 90 min temperatura − 145 C


x1 = x2 =
10 min 5 C

140
Análise Canônica

Variáveis Originais Variáveis codificadas Resposta


Tempo Temperatura
x1 x2 y
(min) (°C)
80 140 -1 -1 78,8
100 140 1 -1 84,5
80 150 -1 1 91,2
100 150 1 1 77,4
90 145 0 0 89,7
90 145 0 0 86,8
76 145 − 2 0 83,3
104 145 2 0 81,2
90 138 0 − 2 81,2
90 152 0 2 79,5
90 145 0 0 87
90 145 0 0 86

141
Análise Canônica

Superfície de 2a ordem, ajustada por mínimos quadrados


yˆ = 87,36 − 1,39 x1 + 0,37 x2 − 2,15 x12 − 3,12 x22 − 4,88 x1 x2

Ou: yˆ = b0 + x' b + x' B x


~ ~ ~ ~

 x1   − 1,39 
x =   b =  
~
 x2  ~
 0,37 
 - 4,88 
 − 2,15 
B=
2 
 - 4,88 
 - 3,12 
 2 
Raízes características:
−2,15 −  -2,44
=0
-2,44 -3,12-
(-2,15-) (-3,12-)-(2,44)2 = 0
Portanto: 6,71+5,27+2-5,9536=0
Raízes características: 1 = -0,1475 Ponto de
2 = -5,1224 máximo!! 142
Análise Canônica

Superfície ajustada na forma canônica

yˆ = yˆ 0 − 0,1475w12 − 5,1224 w22

Ponto estacionário

1
x0 = − B −1 b
~ 2 ~

1  −4,136 3,234  −1,39   −3, 472 


x0 = −   = 
~ 2  3,234 -2,85  0,37   2,775 

Conclusão: Como 1 < 0 e 2 < 0, implica que x0 é um ponto que


maximiza a superfície de resposta. ~

Na escala original temos:

t0 = 10 x10 +90 = 55,28 min

T0 = 5 x20 + 145 = 158,88 C


143
Análise Canônica

Exemplo 2: x1 x2 x3 y
Na determinação da influencia de 3
-1 -1 -1 6,6
variáveis x1, x2, x3 numa resposta y,
1 -1 -1 6,9
onde as variáveis codificadas em termos
das variáveis originais 1, 2, 3 são dadas -1 1 -1 7,9
por: 1 1 -1 6,1
-1 -1 1 9,2
xi -1,682 -1 0 1 1,682 1 -1 1 6,8
1 204,5 225 255 285 305,5 -1 1 1 10,4
1 1 1 7,3
2 39,9 46 55 64 70,1
-1,682 0 0 9,8
3 0,09 0,5 1,1 1,7 2,11
1,682 0 0 5
0 -1,682 0 6,9
1 − 255
x1 = 0 1,682 0 6,3
30 0 0 -1,682 4
0 0 1,682 8,6
 2 − 55
x2 = 0 0 0 10,1
9 0 0 0 9,9
0 0 0 12,2
 3 − 1,1
x3 = 0 0 0 9,7
0,6 0 0 0 9,7
0 0 0 9,6
Análise Canônica

Modelo ajustado
yˆ = 10,1666 − 1,104 x1 + 0, 087 x2 + 1, 021x3 − 0, 760 x12 − 1, 043x22 − 1,149 x32 − 0,35 x1 x2
−0,500 x1 x3 + 0,15 x2 x3

yˆ = 10,1666 + x' b+ x' B x


~ ~ ~

 x1   − 1,104   − 0,760 - 0,175 - 0,250 


     
x =  x2  b =  0,0872  B =  - 0,175 - 1,043 0,075 
x 
~
 1,0206   - 0,25 - 1,149 
~

 3    0,075
Ponto estacionário
1
x0 = − B −1 b x0 = (−1, 0098; 0, 2602; 0, 6808)
~ 2 ~ ~

dentro da região experimental


Raízes características

−0, 760 −  -0,175 -0,250 ou:


-0,175 -1,043- 0,075 =0 3+2,9523 2+2,7662+0,7999=0
-0,25 0,075 -1,149- 145
Análise Canônica

146
Análise Canônica

Soluções : 1 = -0,5630
2 = -1,2712
3 = -1,1172

Forma canônica

yˆ = 11, 08 − 0,5630 w12 − 1, 2712 w22 − 1,1172 w32

Conclusão: 1 < 0
2 < 0
3 < 0

i.e., x0 = (−1, 0098; 0, 2602; 0, 6808) maximiza a resposta


~

Conclusões:

i) x0 está dentro da região experimental;


~

ii) A superfície de resposta é alongada na direção do eixo w1;

iii) A resposta tem aproximadamente a mesma sensibilidade em termos de


mudanças em w2 e w3; 147
Análise Canônica

Relação entre as variáveis x’s e as variáveis w’s : achar os autovetores


associados à matriz B.

Com R.C. 1 = -0,5630

 b11 + 0,563 b12 / 2 b13 / 2  m11 


  
 b12 / 2 b 22 + 0,563 b 23 / 2  m21 =0
b / 2
 13 b 23 / 2 b 22 + 0,563   m31 

achar m11, m21, m31 tal que sejam normalizados, i.e.,

m112 + m212 + m312 =1

Com m31’ =1 , obtemos m11’=-2,0791 e m21’=0,9142.

achar m11 , m21, m31 dividindo (m112 + m212 + m312)1/2 = (6,1584)1/2

 − 0,8378 0,4535 - 0,3052 


m11=-0,8378  
m21=0,3684 M =  0,3684 0,0552 - 0,9281
m31=0,4030  0,4030 0,8895 0,2132 
 148
Análise Canônica

Relação entre as variáveis wi e xi

 w1   −08378 0,3684 0,4030   x1 + 1,0098 


    
 w2  =  0,4535 0,0552 0,8895   x2 − 0,2602 
 w   -0,3052 -0,9281 0,2132   x3 − 0,6808 
 3 
M
Z = MW
M – Matriz ortogonal → M´=M-1
M´M= I
Exemplo 3: Efeito de 4 fatores numa reação química e encontrar as
condições ótimas, que maximizam a resposta.
Varáveis independentes:
NH3 : quantidade de amônia (gramas)
T : temperatura (C)
H2O : quantidade de água (gramas)
P : pressão (psi)
Variáveis codificadas:
NH 3 − 102 T − 250 H 2O − 300 P − 850
x1 = x2 = x3 = x4 =
51 20 200 350 149
Fator -1,4 -1 0 1 1,4 x1 x2 x3 x4 y
-1 -1 -1 -1 58,2
Amônia (g) 30,6 51 102 153 173,4
1 -1 -1 -1 23,4
Temperatura (C) 222 230 250 270 278 -1 1 -1 -1 21,9
Água (g) 20 100 300 500 580 1 1 -1 -1 21,8
-1 -1 1 -1 14,3
Pressão (psi) 360 500 850 1200 1340 1 -1 1 -1 6,3
-1 1 1 -1 4,5
Superfície ajustada de 2a ordem 1 1 1 -1 21,8
-1 -1 -1 1 46,7
1 -1 -1 1 53,2
ŷ = 40,198 - 1,511x1 + 1,284x2 - 8,739x3 + -1 1 -1 1 23,7
4,955x4 - 6,332x12 - 4,292x22+ 0,020x32- 1 1 -1 1 40,3
-1 -1 1 1 7,5
2,506x42 + 2,194x1x2 - 0,144x1x3 + 1,581x1x4 + 1 -1 1 1 13,3
-1 1 1 1 49,3
8,006 x2x3 + 2,806 x2x4 + 0,294 x3x4
1 1 1 1 20,1
0 0 0 0 32,8
Ponto estacionário: -1,4 0 0 0 31,1
1,4 0 0 0 28,1
x0 = ( x10 , x20 , x30 , x40 ) 0 -1,4 0 0 17,5
~
0 1,4 0 0 49,7
x0 = (0, 265; 1, 034; 0, 291; 1, 668) 0 0 -1,4 0 49,9
~ 0 0 1,4 0 34,2
yˆ 0 = 43,53 0 0 0 -1,4 31,1
0 0 0 1,4 43,1
Análise Canônica

Coeficientes canônicos : 1 ; 2 ; 3 ; 4
Raízes características da matriz:

 - 6,332 1,0969 - 0,0720 0,7905 


 
 - 4,292 4,0030 1,4030 
B=
0,020 0,1470 
 
 Sim. - 2,506 

yˆ = 43,53 − 7,55w12 − 6, 01w22 − 2,16w32 + 2, 60w42

Relação entre as variáveis x’s e as variáveis w’s:


w = M ' ( x − x0 )
~ ~ ~

 w1   0,5977 -0,7025 0,3756 0,0908   x1 − 0, 265 


     
 w2  =  -0,7688 -0,4568 0,2858 0,3445   2x − 1, 034 
 w3   0,2151 0,1374 -0,3071 0,9168   x3 − 0, 291
     
 w4   0,0741 0,5282 0,8264 0,1803   4
x − 1, 668 
Obs: A resposta decresce ao movimento na direção w1, w2 e w3, mas cresce
na direção do eixo w4. 151
Análise Canônica

OBJETIVO: Condições operacionais cuja resposta seja alta na região do


experimento planejado
Note que x3-1,5 , pois se x3=-1,5 o sistema não tem água. Queremos
encontrar condições em x1, x2 , x3 e x4 que dão valor zero para w1, w2 e
w3, e vários valores para w4 (tabela).

w4 1 1,5 2 -1 -1,5 -2 -2,5


x1 0,339 0,376 0,413 0,191 0,154 0,117 0,08
x2 1,562 1,826 2,09 0,506 0,242 -0,022 -0,287
x3 1,117 1,531 1,944 -0,535 -0,949 -1,362 -1,775
x4 1,848 1,938 2,028 1,488 1,398 1,307 1,217

CONCLUSÕES:
i) Para valores positivos de w4, os valores de x estão fora da região
experimental.
ii) Condição mais adequada (para w4-2,2) , i.e., x3=-1,5 (sem água),
x1=0,102; x2=-0,128 e x4=1,27.
iii) Qualquer ponto onde w1=0; w2=0; w3=0 e w4<-2,2 está fora da região
experimental pois x3<-1,5 é um valor impossível. 152
Análise Canônica

Exemplo 4: Análise canônica aplicada à flotação de fosfato


X1 X2 X3 Respostas X1 X2 X3 Respostas
Dosagem de Dosagem de Tamanho de Teor de Recuperação de Dosagem de Dosagem de Tamanho de Teor de Recuperação de
Coletor (g/t) Depressor (g/t) Partícula (µm) P2O5 (%) P2O5 (%) Coletor (g/t) Depressor (g/t) Partícula (µm) P2O5 (%) P2O5 (%)
120 100 306,1 39,09 3,93 200 100 66,1 30,67 66,14
280 100 306,1 37,58 9 360 100 66,1 30,45 76,74
360 100 306,1 35,59 17,52 100 150 66,1 34,24 58,2
280 200 306,1 38,36 4,07 120 150 66,1 32,89 65,55
360 200 306,1 38,38 11,2 200 150 66,1 31,62 72,26
360 300 306,1 37,78 4,75 50 200 66,1 36,93 47,23
120 100 200 38,3 25,8 80 200 66,1 36,51 63,23
280 100 200 35,09 37,01 120 200 66,1 33,46 68,42
360 100 200 35,02 46,31 200 200 66,1 33,51 67,78
80 200 200 39,92 10,06 280 200 66,1 32,16 70,7
120 200 200 39,45 22,8 320 200 66,1 31,64 69,85
200 200 200 39,14 25,07 100 250 66,1 37,11 62,07
280 200 200 36,81 27,02 200 250 66,1 32,55 67,62
360 200 200 34,22 45,13 280 250 66,1 32,65 69,45
80 300 200 37,88 2,41 320 250 66,1 33,21 71,43
120 300 200 39,75 14,49 50 300 66,1 36,8 44,5
200 300 200 38,75 14,24 80 300 66,1 35,57 52,83
360 300 200 36,12 38,3 120 300 66,1 34,98 58,51
120 100 136,9 36,57 48,31 200 300 66,1 32,46 66,03
360 100 136,9 35,32 58,13 280 300 66,1 32,27 67,6
120 300 136,9 37,84 23,93 360 300 66,1 31,93 72,53
360 300 136,9 35,23 48,26 100 400 66,1 34,18 52,79
120 100 105,1 36,56 55,77 200 400 66,1 34,42 65,06
360 100 105,1 34,97 64,93 280 400 66,1 31,43 66,63
120 300 105,1 36,99 33,03 360 400 66,1 32,58 68,54
360 300 105,1 35,66 56,73 120 100 48,8 32,81 73,47
50 60 66,1 34,29 66,33 360 100 48,8 29,15 80,06
80 60 66,1 31,61 71,4 120 300 48,8 36,3 58,87
100 60 66,1 29,93 72,1 360 300 48,8 33,15 73,02
200 60 66,1 27,6 75,38 120 100 25,4 24,79 77,87
50 100 66,1 36,98 61,5 360 100 25,4 22,47 93,64
80 100 66,1 34,96 64,29 120 300 25,4 25,92 79,58
120 100 66,1 33,79 69,5 360 300 25,4 22,94 93,3
Análise Canônica

Variável Faixa Experimental Adimensionalização


Dosagem de coletor
X1 =
(1 − 200 g / t )
50 g/t a 360 g/t
( 1) 120 g / t

Dosagem de depressor
X2 =
(2 − 200 g / t )
60 g/t a 400 g/t
( 2) 120 g / t

Tamanho de partícula médio


25,4 µm a 306,1 µm X3 =
(3 − 130 m )
( 3) 100 m

Superfície de 2a ordem, ajustada por mínimos


quadrados
^
y2 = 47, 70 + x 'b2 + x ' B2 x onde:
^
y2 é a resposta recuperação de P2O5 e

 x1   9,00   −1,75 1,16 1,15 


x =  x2  b2 = -7,19  B2 = 1,16 0 -1,50 
~ 
 x3  -31,89  1,15 -1,50 2,32 
154
Análise Canônica

Raízes características: 1 = -2,89


2 = 0,35
3 = 3,12
Superfície ajustada na forma canônica
yˆ 2 = yˆ 20 + 1w12 + 2 w22 + ... + k wk2 = yˆ 20 − 2,89w12 + 0,35w22 + 3,12w32
Ponto estacionário
1
x0 = − B −1 b
~ 2 ~

10, 44 
x0 = 6,19 
5, 69 
~

FORA da região experimental para as três variáveis


X1→ [-1,25 a 1,33], X2 → [-1,17 a 1,67] e X3 → [-1,05 a 1,76]

Conclusão: Para a recuperação não foi possível encontrar um ponto


ótimo, pois a análise canônica não mostrou um máximo global e o ponto
estacionário está fora da região experimental. Para esta resposta a
otimização deve ser feita, portanto pela análise das superfícies ajustadas. 155
Análise Canônica

Superfície de 2a ordem, ajustada por mínimos quadrados


^
y1 = 35,88 + x 'b1 + x ' B1 x onde:
^
y1 é a variável resposta teor de P2O5 e

 x1   −1,89  1, 20 0 0 
x =  x2  b1 =  1, 23  B1 = 0 1,08 -0,255 
~
 x3   3,74  0 -0,255 -1,30

156
Análise Canônica

Raízes características: 1 = -1,46


2 = -0,92
3 = 1,2
Superfície ajustada na forma canônica
yˆ1 = yˆ10 + 1w12 + 2 w22 + ... + k wk2 = yˆ10 − 1, 46w12 − 0,92w22 + 1, 2 w32
Ponto estacionário
1
x0 = − B −1 b
~ 2 ~

0, 79 
x0 = 0, 25
1,39 
~

DENTRO da região experimental para as três variáveis


X1→ [-1,25 a 1,33], X2 → [-1,17 a 1,67] e X3 → [-1,05 a 1,76]

Calculando a resposta no ponto estacionário e substituindo o resultado de


para o teor P2O5 na forma canônica, temos:

Teor P2O5 = 38,23 - 1,46w1 - 0,92w2 + 1, 2 w3


2 2 2
157
Análise Canônica

Teor P2O5 = 38,23 - 1,46w12 - 0,92w2 2 + 1, 2w32

Valores ótimos para w1 e Para w3, qualquer valor


w2 que MAXIMIZAM a AUMENTA a resposta.
resposta teor de P2O5 é
ZERO

Buscar o valor da variável w3


que leve ao máximo teor
DENTRO da faixa experimental
TEOR DE estudada
P2O5 ÓTIMO

W3 = -2,04

Coletor: 50 g/t X1 = -1,25


Depressor: 220 g/t X2 = 0,25
Tamanho de partícula: 269 µm X3 = 1,39 158
Análise Canônica

Exemplo 4: Análise canônica aplicada à flotação de silicatos no processo


de concentração da apatita.
Objetivo: minimizar o teor de SiO2 no produto de fundo (abaixo de 8%) e a
recuperação de P2O5 no concentrado (no máximo 10%)

159
Análise Canônica

160
Análise Canônica

Variável Faixa Experimental Adimensionalização

Vazão de ar (1) 120 L/h a 40 L/h X1 =


(1 − 90 L / h )
30 L / h

Vazão de chuveiro (2) 0,50 L/min a 0,20 L/min X2 =


(2 − 0, 40 L / min )
0, 20 L / min

Vazão de Reciclo (3) 0,63 L/min a 0,27 L/min X3 =


(3 − 0, 45 L / min )
0,18 L / min

Dosagem de coletor (4) 335,7 g/t a 464,4 g/t X4 =


(4 − 400 g / t )
50 g / t
( − 400 g / t )
X5 = 5
Dosagem de depressor (5) 335,7 g/t a 600 g/t
50 g / t
Tempo de condicionamento do coletor
X6 =
(6 − 3,5 min )
2 min a 10 min
(6) 1,5 min

Equação estimada para o teor de SiO2 no produto de fundo, ajustada


por mínimos quadrados:

Teor de SiO2 prod fundo = 15,80 − 5,18 X 2 − 5,84 X 3 − 8,32 X 4 + 0,93 X 5 + X 6


+3,30 X 1 X 3 − 13,36 X 1 X 4 + 1,93 X 1 X 5 + 0,95 X 1 X 6 − 6,32 X 2 X 3 + 11, 09 X 2 X 4 +
10,87 X 3 X 4 − 0,55 X 4 X 5 − 3,57 X 12 − 11, 75 X 22 − 5, 06 X 42 + 0, 28 X 52 161
Análise Canônica

Raízes características: 1 = -18,02


2 = -8,04
3 = -0,21
4 = 0,07
5 = 1,33
6 = 4,77
Superfície ajustada na forma canônica

Teor de SiO2 prod fundo = yˆ10 − 18, 02 w12 − 8, 04 w22 − 0, 21w32 + 0, 07 w42 + 1,33w52 + 4, 77 w62

Ponto estacionário
 −1, 053 
 
 0,121 
 0,357 
x0 =  
~  0,927 
 2,878 
 
 −1,957 
Calculando a resposta no ponto estacionário ( yˆ10 ) e substituindo o resultado
de para o teor P2O5 na forma canônica, temos:
Teor de SiO2 prod fundo = 10,94 − 18, 02 w12 − 8, 04 w22 − 0, 21w32 + 0, 07 w42 + 1,33w52 + 4, 77 w62
Análise Canônica

Teor de SiO2 prod fundo = 10,94 − 18, 02 w12 − 8, 04 w22 − 0, 21w32 + 0, 07 w42 + 1,33w52 + 4, 77 w62

Análise de sensibilidade Valores ótimos para w4, w5


para w1, w2 e w3 e w6 que MINIMIZAM a
resposta teor de SiO2 no
produto de fundo é ZERO

w1 exerce uma
influencia muito MAIOR
do que w2 e w3

Estudar a influência de
w1 visando encontrar as
melhores condições

163
Análise Canônica

Relação entre as variáveis X1, X2, X3, X4, X5 e X6 e w1 para o teor de SiO2 no
produto de fundo

O maior valor em módulo que


w1 pode assumir é 0,75.

Para w1 = -0,75 Para w1 = 0,75

X1 (v. de ar) = 65 L/h X1 = 50 L/h


X2 (v. de chuveiro) = 0,30 L/min Condições que X2 = 0,50 L/min
X3 (v. de reciclo) = 0,45 L/min minimizam o X3 = 0,50 L/min
X4 (coletor) = 470 g/t teor de SiO2 no X4 = 430 g/t
X5 (depressor) = 550 g/t rejeito X5 = 550 g/t
X6 (t. cond. coletor) = 1 min X6 = 1 min
Análise Canônica

Equação estimada para a recuperação de P2O5 no concentrado, ajustada


por mínimos quadrados:

Recup P2O5 concentrado = 14, 65 + 2,95 X 1 + 5,12 X 2 + 8, 06 X 4 − 1,94 X 5 − 2,34 X 6


+12,54 X 1 X 4 − 1, 76 X 1 X 5 + 0,95 X 1 X 6 + 10, 28 X 2 X 3 − 10, 74 X 3 X 4 + 8,93 X 22
+5, 01X 32 + 0, 41X 62
Raízes características: 1 = -7,73 Ponto estacionário:  −1,102 
2 = -0,22  
 0,022 
3 = 0,41
4 = 1,19  −0,537 
x0 =  
5 = 7,20 ~  − 0, 479 
6 = 13,50  −1, 739 
 
Superfície ajustada na forma canônica  2,854 

Recup P2O5 concentrado = yˆ 20 − 7, 73w12 − 0, 22w22 + 0, 41w32 + 1,19w42 + 7, 20w52 + 13,50w62

Calculando a resposta no ponto estacionário ( yˆ 20 ) e substituindo o


resultado de para o teor P2O5 na forma canônica, temos:

Recup P2O5 concentrado = 9,50 − 7, 73w12 − 0, 22 w22 + 0, 41w32 + 1,19 w42 + 7, 20 w52 + 13,50 w62
165
Análise Canônica

Recup P2O5 concentrado = 9,50 − 7, 73w12 − 0, 22 w22 + 0, 41w32 + 1,19 w42 + 7, 20 w52 + 13,50 w62

Análise de sensibilidade Valores ótimos para w3, w4,


para w1, w2 w5 e w6 que MINIMIZAM a
resposta recuperação de
P2O5 no concentrado é ZERO

w1 exerce uma
influencia muito MAIOR
do que w2

Estudar a influência de
w1 visando encontrar as
melhores condições

166
Análise Canônica

Relação entre as variáveis X1, X2, X3, X4, X5 e X6 e w1 para a recuperação de


P2O5 no concentrado

O maior valor em módulo que


w1 pode assumir é 1,10.

Para w1 = -1,10 Para w1 = 1,10

X1 (v. de ar) = 80 L/h X1 = 40 L/h


X2 (v. de chuveiro) = 0,40 L/min Condições que X2 = 0,40 L/min
X3 (v. de reciclo) = 0,30 L/min minimizam a X3 = 0,39 L/min
X4 (coletor) = 340 g/t recup. de P2O5 X4 = 420 g/t
X5 (depressor) = 320 g/t no concentrado X5 = 310 g/t
X6 (t. cond. coletor) = 8 min X6 = 8 min
Análise Canônica

Conclusão: Os resultados da análise canônica combinado com a análise


das superfícies de resposta permitem a inferência sobre as condições que
conduzem a otimização das duas respostas (teor de SiO2 no produto de
fundo < 8% e recuperação de P2O5 no concentrado < 10%).

X1 (vazão de ar) = 60 ou 40 L/h


X2 (vazão de chuveiro) = 0,40 L/min
X3 (vazão de reciclo) = 0,39 L/min
X4 (dosagem de coletor) = 450 g/t
X5 (dosagem de depressor) = 550 g/t
X6 (tempo condicionamento coletor) = 10 min

Testes finais com condições otimizadas

Você também pode gostar