Escolar Documentos
Profissional Documentos
Cultura Documentos
REGRESSÃO LINEAR
¾ Etapas de Construção de um Modelo Empírico
¾ Método Clássico dos Mínimos Quadrados
¾ Modificação do Método Clássico dos Mínimos Quadrados
¾ Planeamento Estatístico de Ensaios
¾ Exercícios Propostos
64
4. REGRESSÃO LINEAR
A investigação experimental de qualquer sistema dá em geral os resultados dos
ensaios sob a forma duma tabela de variáveis de comando e de entrada e das
correspondentes variáveis de saída. Uma das aplicações mais usuais dos modelos
matemáticos é a descrição de uma vasta gama de dados experimentais. Quando
obtemos uma vasta gama de dados experimentais sob várias condições e encontrar um
modelo matemático que melhor se ajusta aos dados, estamos basicamente a fazer o
tratamento da informação. No lugar de centenas de valores discretos de dados, que
poderia ser pesado de usar, temos expressões matemáticas (modelos) que geram
quaisquer valores experimentais da forma como desejamos.
Portanto, o processo de procurar construir um modelo matemático que melhor se
ajusta aos dados experimentais, chama-se Regressão de Dados. Neste sub capítulo
será abordada a técnica de estimação dos parâmetros de modelos empíricos lineares,
daí o nome Regressão Linear.
Na essência, o que temos são dados experimentais a partir de medições de uma
resposta (variáveis de saída) para vários valores das variáveis de entrada (factores)
que influenciam o sistema.
65
experimental ou variabilidade). Essa tarefa tem vários propósitos usuais:
66
Depois da realização das experiências os resultados escrevem-se sob forma de tabela:
Nº de
x0 x1 x2 ...xn y1 y2 ...yR yj Se
ensaio
1 1 Se1
2 1 Se2
... 1 ...
m 1 Sem
em que:
xo - é uma variável que toma sempre o valor 1;
x1, x2, ...., xn - são as variáveis independentes;
y1,y2, ...., yR - são os valores da função de resposta dos ensaios paralelos;
−
y j - valores médios aritméticos da função de resposta dos ensaios paralelos;
Fórmula do erro:
m 2
⎡ ^
⎤
E = ∑ ⎢Y j − Y j ( X ij )⎥ (i =1, 2, 3, …, n)
j =1 ⎣ ⎦
67
Genericamente, a função escolhida pode ser apresentada pela forma:
Y = f(x0, x1, x2, …, xn, b0,b1, b2, ..., bn)
em que x1, x2,....,xn são as variáveis independentes e b0, b1, b2,...,bn são os parâmetros
desconhecidos. Os parâmetros desconhecidos determinam-se a partir da condição
∂E
=0 ( i = 0,1,2,...., n)
∂bi
Se a função for linear, teremos: Y =b0x0 +b1x1 +b2x2 +…+bnxn
Avaliação do erro
A avaliação do erro obtém-se achando a diferença entre os valores experimentais e os
previstos pelo modelo, tal que:
( )
m
E = ∑ y j − b0 x0 j − b1 x1 j
2
j =1
∂E ⎛ m m m ⎞
= 2⎜⎜ ∑ y j x0 j − b0 ∑ x0 j x0 j − b1 ∑ x1 j x0 j ⎟⎟ = 0
∂b0 ⎝ j =1 j =1 j =1 ⎠
∂E ⎛ m m ⎞
= 2⎜⎜ ∑ y j x1 j − b0 ∑ x0 j x1 j − b1 ∑ x1 j x1 j ⎟⎟ = 0
∂b1 ⎝ j =1 j =1 ⎠
Anulando as derivadas parciais e resolvendo o sistema de equações, os parâmetros
podem ser determinados:
⎧ m m m
⎪ 0∑ 0j 0j
b x x + b 1∑ 1j 0 j
x x = ∑ y j x0 j
⎪ j =1 j =1 j =1
⎨ m m m
⎪b
⎪⎩ 0 ∑ 1∑ 1j 1j ∑
x x
0 j 1j + b x x = y j x1 j
j =1 j =1 j =1
Consideremos:
68
m
C 00 = ∑ x0 j .x0 j
j =1
m
C 01 = C10 = ∑ x0, j .x1, j
j =1
m
C11 = ∑ x1, j .x1, j
j =1
m
D0 = ∑ x 0 , j . y j
j =1
D1 = ∑ x1, j . y j
onde
m
C ik = C ki = ∑ xij .x kj
j =1
m
Di = ∑ y j xij , (i, k = 0, 1, 2,...,n)
j =1
m
C ii = ∑ xij
2
j =1
69
x01 x11 ... x n1
x02 x12 ... x n 2
X =
... ... ... ...
x0 m x1m ... x nm
x01 x02 ... xom
x11 x12 ... x1m
X* =
... ... ... ...
x n1 xn 2 ... x nm
O produto das matrizes X e X*, é a matriz dos valores C, conhecida como matriz de
informação:
C 00 C 01 ... C 0 n
C10 C11 ... C1n
C = X .X * =
... ... ... ...
Cn0 C n1 ... C nn
70
b0
D b1
B= =
C ...
bn
S R2 0 =
1 m
∑
f 2 j =1
( 2
yj − y ,) f2 = m-1
SR =
2 1 m
∑ (y j − ycal )2 , f1 = m-n-1
f1 j =1
c) Aplicação do teste de Fischer (critério F)
S R2
Fα , f1 , f 2 = 2 , Se Fcal < Ft → modelo matemático é válido
SR0
71
Para a verificação do papel das variáveis utiliza-se o critério t de Student.
bi bi
t iα , f 1 = = ,
S (bi ) Se aii
em que
f1 = m(R-1)
bi = parâmetro correspondente à variável xi
S2(bi) – variância do parâmetro bi
Se – desvio padrão dos valores experimentais
aii – elemento diagonal da matriz de co-variação.
A matriz de co-variação é a matriz inversa da matriz de informação:
C00 C01 ... C0 n
C10 C11 ... C1n
C= , matriz de informação
... ... ... ...
Cn 0 Cn1 ... Cnn
Se tcal < ttab, significa que a variável não é significativa e então elimina-se, devendo se
reavaliar o modelo sem a influência desse parâmetro ou variável.
b1 − t α Sb1 ≤ β1 ≤ b1 + t α Sb1
1− 1−
2 2
∧ ∧
Y−t α S∧ ≤ η ≤ Y + t α S∧
1− Y 1− Y
2 2
m
com graus de liberdade f = ∑ Ri − 2
i =1
72
S −2
S =
2
b0 m
Y
∑R
i =1
i
S −2
S =
2
b1 m
Y
∑ R ( x − x)
i =1
i i
2
m Ri
⎛ ∧
⎞
∑∑ ⎜⎝ Y
i =1 j =1
ij − Yi ⎟
⎠
SY2 = m
∑R − 2
i =1
i
⎢ ∑ Y x − x ⎥
( )
m 2 m i i
1 ⎛ ∧
⎞ 1
∑ ⎜ i i ⎟⎠ m − 2 ⎢∑
2
SY2 = Y − Y = ⎢ Y − Y − i =1
⎥
( )
i
m − 2 i =1 ⎝ m
∑ xi − x ⎥
2
i =1
⎢⎣ i =1
⎥⎦
Nota: É necessário que o modelo seja adequado (critério F) para que as duas últimas
equações sejam válidas.
Tabela 4.1
Ni X0 X1 Y1 Y2
1 1 1 5 4.5
2 1 2 7 7.5
3 1 3 9 9.5
4 1 4 11.25 10.75
5 1 5 13 13
Resolução
Passo 0: Construção da tabela: (já está dada);
Passo 1: Cálculo dos valores médios dos ensaios paralelos
Y1 + Y2 5 + 4.5
Exemplo: para Ni=1 temos Y1 = = = 4.75
2 2
Usando essa fórmula, calculamos o resto dos valores e colocamos na coluna 1 da
73
tabela 4.2.
Passo 2: Determinação das variâncias
(Y1 − Y1 ) 2 + (Y1 − Y2 ) 2 (4.75 − 5) 2 + (4.75 − 4.5) 2
Se21 = = = 0.125
n −1 2 −1
Æ Se1= 0.35
Usando essa fórmula, calculamos o resto dos valores de Se e colocamos na coluna 2
da tabela 4.2.
Tabela 4.2
Yj Se
4.75 0.35
7.25 0.35
9.25 0.35
11.0 0.35
13 0
Gt=Gα,ƒ,m
f = R-1, onde: R – é o número de ensaios paralelos
Neste exercício R = 2
f = 2-1 = 1
Para α = 0.05 temos da tabela, G0.05,1,5 = 0.841
GC < Gt Æ variâncias homogéneas
Passo 4: Proposta do modelo, ou seja, escolha de uma função que se adapte aos dados
experimentais Y=f(x).
Y = b0X0 + b1X1
74
⎧C00b0 + C01b1 = D0
⎨
⎩ C10b0 + C11b1 = D1
5
C 00 = ∑ X 0 j . X 0 j = 5
j =1
5
C10 = C 01 = ∑ X 1 j X 0 j = 15
j =1
5
C11 = ∑ X 1 j X 1 j = 55
j =1
5
D0 = ∑ X 0 j Y j = 45.25
j =1
5
D1 = ∑ X 1 j Y j = 156
j =1
Usando a regra de Cramer por exemplo, para a resolução do sistema (1) teremos:
b0 = 2.975
b1 = 2.025
Dai que o modelo proposto é:
75
1 m 2
S e2 = ∑ S ej = 0.098 Æ Se = 0.313
m j =1
f2= m(R-1) = 5(2-1) =5
S R2 0.1125
Fcal = = = 1.15
S 2
e
0.098
76
∆C = C = 50
Co-factor da matriz C é:
C11 − C10 55 − 15
C cof = =
− C 01 C 00 − 15 5
a00 = 1.1
a11 = 0.1
b1 2.025
t b1,cal = = = 20.46
S e a11 0.313 0.1
ttab=ti,α,f1=t0,0.05,5=t1,0.05,5=2.57
f1 = m(R-1) = 5(2-1) = 5
Vemos que tb1,cal > ttab, o que concluímos que a variável em causa é significativa, e
por isso o modelo permanece o mesmo do passo 6.
Y = 2.975X0 + 2.025X1
Para X0 = 1 teremos finalmente:
Y = 2.975 + 2.025X1
Tabela 4.3.
Ni X0 X1 Y1 Y2
1 1 5 53 51
2 1 7 43 41
3 1 -3.5 114 118
4 1 1.5 79 82
5 1 -2 104 101
6 1 10 20 20
77
Construir o modelo de primeira ordem, verifique a sua adequação e bem como o papel
das variáveis.
Resolução:
Passo 0: Tabela de dados experimentais (já está dada)
GC = 8/21 = 0.381
Gtab=Gα,f,m
f =R-1 =2-1=1
Æ Gtab=G0.05,1,6 = 0.781
Portanto GC<Gtab Æ Variâncias são homogéneas
6
C 01 = C10 = ∑ X 1 j * X 0 j = 18
i =1
6
C11 = ∑ X 1 j * X 1 j = 190.5
i =1
78
6
D0 = ∑ X 0 * Y j = 413
i =1
6
D1 = ∑ X 1 j * Y j = 263.75
i =1
c 00 c01 6 18
Matriz de informação C= =
c10 c11 18 190.5
413 b0
D= e B= ?
263.75 b1
Y = 90.27X0 – 7.145X1
∑ (Y
j =1
j − Y jcal ) 2 = 6.50 + 3.30 + 0.518 + 0.903 + 4.24 + 1.39 = 16.58
f1=m-n-1=6-1-1=4
2
S R2 = *16.58 = 8.29
4
Tabela 4.4
79
Yj S e2 Y jcal (Y j − Y jcal ) 2
52 2 54.55 6.50
42 2 40.26 3.30
116 8 115.28 0.518
80.5 4.5 79.55 0.903
102.5 4.5 104.56 4.24
20 0 18.82 1.39
Ftab=Fα,f1,f2
f1=4 e f2=m(R-1)=6(2-1)=6
Æ Ftab=F0.05,4,6=4.53
FC<Ftab Æ o modelo é adequado
a 00 a 01 0.233 − 0.022
C −1 = =
a10 a11 − 0.022 0.0073
b1 − 7.145
t1,cal = 2
= = 44.69
Se a11 1.87 0.0073
Y = 90.27 – 7.145X1
80
4.3. Modificação do Método Clássico dos Mínimos Quadrados
Nalgumas vezes torna-se complicado e trabalhoso elaborar modelos matemáticos com
matrizes de informação muito grandes, principalmente no acto da verificação da
adequação e na verificação do papel das variáveis desses modelos. O objectivo do
método modificado dos mínimos quadrados é de simplificar a matriz de informação
com base na transformação das variáveis reais em novas variáveis reduzidas (xij Æ zij
e yj Æ Vj) e na realização de um ensaio extra (caso seja necessário) de tal modo que
os termos não diagonais cik e cki da matriz de informação sejam nulos.
yj − y 1 m
Vj =
y
; onde: y= ∑ yj
m j =1
m – número de ensaios
b) Determinação da matriz de informação usando variáveis transformadas.
m m
cii = ∑ Z ij2 ; cik = c ki = ∑ Z ij * Z kj
j =1 j =1
m
Di = ∑ Z ij * V j
j =1
81
V = β1 Z1 + β 2 Z 2 ; (modelo com variáveis transformadas)
c11 c 21
Matriz de informação: C =
c12 22
d) Realização do ensaio extra de forma que os termos não diagonais cik = cki
sejam nulos.
d.1) Determinação de Zi,j+1
d.2) Correcção da matriz de informação
c11| 0 D1| c11| 0 β1 D|
C= ; D= e C= = 1|
0 |
c 22 D2| 0 |
c 22 β 2 D2
e) Determinação dos parâmetros modificados do modelo
D1| D2|
β1 = e β2 =
c11| |
c 22
xij − xi
Como vimos na alínea a) Z ij = Æ xi = Z i xi + xi
xi
Portanto,
y = β i xi = β i ( Z i xi + xi )
Tabela 4.5
Ni X0 X1 Y1 Y2
1 1 5 53 51
2 1 7 43 41
3 1 -3.5 114 118
4 1 1.5 79 82
5 1 -2 104 101
6 1 10 20 20
Resolução
Passo 0: Tabela de dados experimentais (já está dada).
82
Os valores médios dos ensaios paralelos (passo 1), variâncias (passo 2) podem ser
vistos na tabela 4.6.
Passo 3: Verificação da homogeneidade das variâncias.
2
S emáx
GC = m
; para S2emáx = 8 e m=6 temos:
∑S
i =1
2
e
GC = 8/21 = 0.381
Gtab=Gα,f,m
f =R-1 =2-1=1
Æ Gtab=G0.05,1,6 = 0.781
X0=1 (constante) e X 0 =
∑X 0
=
6
=1 Æ Z0 j =
X 0 − X1
=
1−1
=0
6 6 X1 1
5 + 7 − 3.5 + 1.5 − 2 + 10
X1 = = 3.0
6
X 11 − X 1 5−3
Z 11 = = = 0.67 ; Z 14 = −0.5
X1 3
X 12 − 3 7 − 3
Z 12 = = = 1.33 ; Z 15 = −1.67
3 3
83
X 13 − 3 − 3.5 − 3
Z 13 = = = −2.17 ; Z 16 = 2.33
3 3
Y1 − Y 52 − 68.83
V1 = = = −0.245
Y 68.83
Y2 − 68.83 42 − 68.83
V2 = = = −0.390
68.83 68.83
Y3 − 68.83 116 − 68.83
V3 = = = 0.685
68.83 68.83
V4=0.169
V5=0.489
V6= - 0.709
m
Di = ∑ Z ij * V j Æ D1 = −4.722
j =1
D1 − 4.722
Mas C11 β 1 = D1 Æ β 1 = = = −0.307
C11 15.395
Proposta do modelo (usando variáveis independentes transformadas – neste caso só
temos uma).
Modelo antigo (a partir do passo 4)
Y = b0 + b1X1
Passagem do modelo usando os novos parâmetros:
X1 − X1 Y −Y
V1 = β1*Z1 mas Z1 = e V =
X1 Y
Y −Y X − X1 ⎛ X − X1 ⎞
Æ = β1 1 e portanto, Y = β 1 Y ⎜⎜ 1 ⎟ +Y
⎟ (*)
Y X1 ⎝ X 1 ⎠
84
⎧ Y = 68.83
⎪
para ⎨β 1 = −0.307 e substituindo esses valores na equação (*) teremos a seguinte
⎪ X = 3.0
⎩ 1
equação do modelo:
Y = 90.27 – 7.145X1
Tabela 4.6.
Yj S e2 Y jcal (Y j − Y jcal ) 2
52 2 54.55 6.50
42 2 40.26 3.30
116 8 115.28 0.518
80.5 4.5 79.55 0.903
102.5 4.5 104.56 4.24
20 0 18.82 1.39
∑ (Y
j =1
j − Y jcal ) 2 = 6.50 + 3.30 + 0.518 + 0.903 + 4.24 + 1.39 = 16.58
f1=m-n-1=6-1-1=4
2
S R2 = *16.58 = 8.29
4
Aplicação do teste de Fischer
85
S R2 8.29
FC = 2
= = 2.37
Se 3.5
Ftab=Fα,f1,f2
f1=4 e f2=m(R-1)=6(2-1)=6
Æ Ftab=F0.05,4,6=4.53
FC<Ftab Æ o modelo é adequado
Matriz inversa de C é:
a 00 a 01 0.233 − 0.022
C −1 = =
a10 a11 − 0.022 0.0073
b1 − 7.145
t1,cal = 2
= = 44.69
Se a11 1.87 0.0073
86
Y = 90.27 – 7.145X1
Tabela 4.7
Ni X0 X1 X2 Yj
1 1 0 0 -25
2 1 0 1 -16
3 1 0 2 -9
4 1 0 3 -4
5 1 1 1 3
6 1 1 2 10
7 1 1 3 15
8 1 2 2 27
Resolução:
Neste exercício não temos ensaios paralelos, portanto, vamos começar logo pelo
passo 4.
Passo 4: Proposta do modelo usando o método modificado
V = β1Z1 + β2Z2
1 8 5
X1 = ∑
m j =1
X 1 j = = 0.625
8
1 8 14
X2 = ∑
8 j =1
X2j =
8
= 1.75
1 8
Y= ∑ Y j = 0.125
8 j =1
87
X 11 − X 1 0 − 0.625 X 12 − 0.625
Z 11 = = = −1 ; Z 12 = = −1
X1 0.625 0.625
8
c12 = c 21 = ∑ Z 1 j * Z 2 j = 1.1434
j =1
8
c 22 = ∑ Z 2 j * Z 2 j = 2.449
j =1
9.92 1.1434
portanto, a matriz de informação será: C =
1.1434 2.449
m
Di = ∑ Z ij * V j
j =1
8
D1 = ∑ Z 1 j * V j = 1041.6
j =1
8
D2 = ∑ Z 2 j * V j = 339.481
j =1
Como se pode ver, aqui não temos uma matriz diagonal (c12 = c21 ≠ 0), portanto,
temos de realizar um ensaio extra.
88
Para Y9 = 1.743 , pode-se calcular V9
Y9 − Y 1.743 − 0.125
V9 = = = 12.94
Y 0.125
c) Realização do ensaio extra (constitui o 9o ensaio na tabela 4.8). Conforme dissemos
anteriormente, este ensaio é feito de tal forma que os termos cik=cki da matriz de
informação sejam nulos.
c'12 = c'21= 0 = c12 + Z1,9 * Z2,9 = 0 (aqui Z1,9 e Z2,9 representam Zi,m+1)
Z1,9 * Z2.9 = - c12 = -1.1434 (aqui procuramos um produto Z1,9*Z2,9 que nos dá -
1.1434)
Portanto, se Z1,9 = 1.1434, então Z2,9 = -1
Nota: Os valores de Z1,9 e Z2,9 escolhidos devem estar dentro dos intervalos
respectivos.
X 1,9 − X 1
Mas Z 1,9 = Æ X 1,9 = Z 1,9 * X 1 + X 1 = 1.1434 * 0.625 + 0.625 = 1.34
X1
Tabela 4.8
Ni X0 X1 X2 Yj Z1 Z2 Vj
1 1 0 0 -25 -1 -1 -201
2 1 0 1 -16 -1 -0.429 -129
3 1 0 2 -9 -1 0.143 -73
4 1 0 3 -4 -1 0.714 -33
5 1 1 1 3 0.6 -0.429 23
6 1 1 2 10 0.6 0.143 79
7 1 1 3 15 0.6 0.714 119
8 1 2 2 27 2.2 0.143 215
9(m+1) 1 1.34 0 1.743 1.1434 -1 12.94
89
c11' 0
C' = '
0 c 22
9 8
Mas c11' = ∑ Z 12j = ∑ Z 12j + Z 22,9 = c11 + Z 12,9 = 9.92 + 1.1434 2 =11.227
j =1 j =1
9 8
'
c 22 = ∑ Z 22 j = ∑ Z 22 j + Z 22,9 = c 22 + Z 22 j = 2.449 + (−1) 2 =3.449
j =1 j =1
11.227 0
Então C ' =
0 3.449
9 8
D2' = ∑ Z 2 j * V j = ∑ Z 2 j * V j = D2 + Z 2,9 * V9 = 339.481 + (−1) * 12.94 = 326.54
j =1 j =1
Y −Y Y −Y X − X1 X − X2
Mas V = Æ = β1 * 1 + β2 * 2 e
Y Y X1 X2
X1 − X1 X2 − X2
Y = β1 * Y + β2 *Y +Y
X1 X2
⎧ X 1 = 0.625
⎪
Para ⎨ X 2 = 1.75 teremos:
⎪ Y = 0.125
⎩
Y = -23.48 + 18.82X1 + 6.78X2
90
Hipótese: Não temos ensaios paralelos e por isso mesmo vamos usar a técnica 1.
a) Cálculo da variância dos valores experimentais da variável dependente em relação
ao seu valor médio aritmético:
9
1
S R2 0 =
f2
∑ (Y
j =1
j − Y ) 2 , f2 = m-1 = 9-1 = 8
1 9
Y= ∑ Y j = 0.305
9 j =1
Tabela 4.9
Ni Y Yj (Y j − Y ) 2 Y j ,cal (Y j ,cal − Y j ) 2
1 0.305 -25
640.343 -23.48 2.3104
2 0.305 -16 265.853 -16.7 0.49
3 0.305 -9 86.58303 -9.92 0.8464
4 0.305 -4 18.53303 -3.14 0.7396
5 0.305 3 7.263025 2.12 0.7744
6 0.305 10 93.99303 8.9 1.21
7 0.305 15 215.943 15.68 0.4624
8 0.305 27 712.623 27.72 0.5184
9 0.305 1.743
2.067844 1.7388 1.76E-05
9
1
Da tabela 4.9 temos ∑ (Y
j =1
j − Y ) 2 = 2043.202 Æ S R2 0 =
9
* 2043.202 = 227.02
91
c11 c12 9.92 1.1434
Matriz de informação C = =
c 21 c 22 1.1434 2.449
2.449 − 1.1434
Co-factor da matriz C ou matriz transposta C * =
− 1.1434 9.92
b1 = 18.82
b2 = 6.78
a11 = 0.107
a22 = 0.431
SR0 = √227.02=15.1
b1 18.82
t1,cal = = = 3.81
S R 0 a11 15.1 0.107
b2 6.78
t 2,cal = = = 0.684
S R 0 a 22 15.1 0.431
Dos cálculos acima vemos que t2,cal<ttab Æ a variável X2 não é significativa, deve-se
eliminar. E assim sendo, o novo modelo será:
Y = -23.48 + 18.82X1
92
experiências (22). Um plano factorial de três níveis de um modelo bidimensional
requer 9 experiências (32). Um plano factorial de dois níveis de um modelo
tridimensional requer 8 experiências (23).
Dimensão refere-se ao número de coordenadas necessário para representar a função
de resposta, excluindo a coordenada função resposta.
Ordem de um modelo refere-se ao grau do polinómio usado.
Factor denomina-se qualquer variável experimental que é deliberadamente alterada
de experiência em experiência.
Planos rotacionais são aqueles em que as variâncias nas extremidades do plano são
constantes. Existem dois tipos de planos rotacionais:
• Planos rotacionais uniformes
• Planos rotacionais ortogonais.
93
determinar a área de variação das variáveis independentes. A determinação da área de
variação das variáveis independentes consiste no estabelecimento dos valores limites
de variação de cada variável, nomeadamente o limite superior, Zi,1 e o limite inferior,
Zi,2.
94
Qualquer valor da variável de código pode ser calculado de acordo com a relação:
1
X i, j = ( Z i , j − Z i ,0 )
∆i
Para a passagem inversa (descodificação) temos a seguinte relação:
Z i , j = Z i ,0 + ∆i X i , j
Exemplo de cálculo:
Plano estatístico de ensaios para um modelo de primeira ordem de um processo com
duas variáveis independentes:
No de X0 X1 X2 Y
ensaio
1 +1 +1 +1 Y1
2 +1 -1 +1 Y2
3 +1 +1 -1 Y3
4 +1 -1 -1 Y4
m
C jk = ∑ xik xij = 0 ; j≠k (plano ortogonal)
i =1
95
m
∑X i, j Y j
1 m D
∑
j =1
bi = m
= X i, j Y j = i (i = 0, 1, 2,...,n)
m j =1 m
∑X
j =1
i
2
Assim,
D0 D1 D2
b0 = ; b1 = ; b2 =
m m m
Y= b0X0 + b1X1 +b2X2 + b12 X1X2 + b13 X1X3 + b23 X2X3+ b123X1X2X3
96
Os parâmetros que geralmente são representados por bik, como por exemplo, b12 e b13,
são calculados pela fórmula que se segue:
m
∑X
j =1
i, j X k, j Y j
bik =
m
O teste estatístico e a avaliação do papel dos efeitos de interacções é o mesmo.
Z1 Z2 Z3
Nível básico, zi,0 3.2 6.3 10.2
Intervalo da variação, ∆i 0.8 1.5 2.0
Nível superior, zi,1 4.0 7.8 12.2
Nível inferior, zi,2 2.4 4.8 8.2
Resolução
A tabela 4.11 constrói-se com base na informação do enunciado que diz que foram
feitas três medições paralelas o que significa ter Y1, Y2 e Y3 e é um processo com três
variáveis independentes o que significa ter X1, X2, e X3.
97
Número mínimo (total ou necessário) de ensaios Ni=2n, onde n - é o número de
variáveis independentes.
Neste exercício temos n=3 Æ Ni = 23 = 8
2
S emáx 10.13
Critério G: GC = 8
= = 0.331
30.57
∑S
i =1
2
e
Gtab = Gα,f,m
f=R-1=3-1=2 Æ Gtab=G0.05,2,8=0.520
Proposta do modelo
Para n=3 temos:
Y = b0X0 + b1X1 + b2X2 + b3X3 (modelo codificado)
a) Matriz de informação
c 00 c 01 c 02 c 03
c10 c11 c12 c13
C=
c 20 c 21 c 22 c 23
c30 c31 c32 c33
98
Determinação dos parâmetros desconhecidos
8
c00 = ∑ X 02 j = 8
j =1
8
c11 = ∑ X 12j = 8
j =1
8
c 22 = ∑ X 22 j = 8
j =1
8
c33 = ∑ X 32j = 8
j =1
8 0 0 0
0 8 0 0
C=
0 0 8 0
0 0 0 8
8
D0 = ∑ X 0 j * Y j =519.57
j =1
8
D1 = ∑ X 1 * Y j = 1.2933
j =1
8
D2 = ∑ X 2 * Y j = 28.327
j =1
8
D3 = ∑ X 3 * Y j = −9.6267
j =1
D0 519.57
b0 = = = 64.95
c00 8
D1 1.2933
b1 = = = 0.1617
c11 8
D2 28.327
b2 = = = 3.541
c 22 8
D3 − 9.6267
b3 = = = −1.203
c33 8
Portanto, o modelo codificado será (para X0=1, constante):
99
Modelo descodificado
Z ij − Z i 0
Sabe-se que X ij =
∆i
Z 1 − 3 .2 Z 2 − 6 .3 Z 3 − 10.3
X1 = , X2 = e X3 =
0 .8 1 .5 2.0
Substituindo na equação do modelo codificado teremos:
( Z 1 − 3 .2 ) ( Z − 6.3) ( Z − 10.3)
Y ( Z i ) = 64.95 + 0.161 + 3.54 2 − 1.203 3
0 .8 1 .5 2 .0
8
3
∑ (Y
i =1
j , cal − Y j ) 2 = 6.531 Æ S R2 =
4
* 6.531 = 4.898
100
e.3) Aplicação do teste de Fischer
f2 = m(R-1) = 8(3-1) = 16
S R2 4.898
FC = 2
= = 1.282
Se 3.822
Da tabela temos:
Ftab= Fα , f 1, f 2 = F0.05, 4,16 = 3.114
0.1617
t1,cal = = 0.23414.75
1.95 1 / 8
3.541
t 2,cal = = 5.130
1.95 1 / 8
− 1.203
t 3,cal = = 1.743
1.95 1 / 8
f1 = m(R-1) = 8(3-1) = 16
ttab = tα,f1= t0.05,16 ≈ 2.16.
Portanto, t1,cal e t3.cal são menores que ttab Æ as variáveis X1 e X3 não são
significativas, devem ser eliminadas:
Assim, a nova equação do modelo fica escrita da seguinte forma:
Y = 64.95 + 3.541X2
101
operação óptima pode ser feita pelo ajustamento do modelo de segunda ordem.
Modelos de 2a ordem são expressões matemáticas sob a forma de polinómios de
segunda ordem.
O planeamento estatístico de ensaios para a construção de modelos de segunda ordem
é um problema mais complexo quando comparado com o planeamento estatísticos
para a construção de modelos matemáticos de primeira ordem e exige um maior
número de ensaios, de tal modo que para sistemas com 4 variáveis independentes já se
torna inaceitável a sua aplicação.
Os plano estatístico de ensaios para modelos de segunda ordem pode ser construídos a
partir dos planos de primeira ordem adicionando-se dois ensaios para cada variável
independente nos pontos com coordenadas +α, e –α, para uma dada variável e 0 para
as restantes variáveis, e m0 ensaios no centro do plano com coordenadas 0 para todas
variáveis de código.
Exemplo: Construção de modelo de 2a ordem com 2 e 3 variáveis independentes.
Y= b0X0 + b1X1 +b2X2 + b3X3 + b12 X1X2 + b13X1X3 + b23 X2X3 + b11X12 +b22 X22 +
+b33X32
Para os planos estatísticos ortogonais, α e m0 estão relacionados pela expressão:
α n + 2n α 2 − 2n −1 (n + 0.5m0 ) = 0
Escolhe-se o número de ensaios para obter o desvio padrão da função de resposta com
o fim de fazer o teste estatístico.
102
Características de um plano de 2a ordem obtido directamente:
1
Z i ,0 = ( Z i ,1 + Z i , 2 )
2
1
∆i = ( Z i ,1 − Z i , 2 )
2α
Valores reais das variáveis independentes
zi
Intervalo de variação , ∆i ∆i
Nível superior, +α zi,1
Nível de +1 zi,0+∆i
Nível básico zi,0
Nível de -1 zi,0-∆i
Nível inferior, -α zi,2
NB: Para modelos de 2 ordem que se obtêm da composição do plano estatístico de 1a
a
Z i , −α = Z i , 0 − α ∆ i
enquanto que ∆i e zi, são os mesmos calculados para o plano de primeira ordem.
N
bi = e −1 ∑ X i , j Y j
j =1
N
bik = mc−1 ∑ X i , j X k , j Y j
j =1
E = −2 H −1eα 4
e = mc + 2α 2
[
F = H −1 Hf + (n − 2) Nmc − (n − 1)e 2 ]
103
G = H −1 (e 2 − Nmc )
[
H = 2α 4 Nf + (n − 1) Mmc − ne 2 ]
f = mc + 2α 4
Contudo, os dos planos mais usados encontram-se tabelados no apêndice B.
Tabela 4.13
Ensaio X1 X2 X3 Z1 Z2 Z3
1 +1 +1 +1 160 28 12
2 -1 +1 +1 140 28 12
3 +1 -1 +1 160 22 12
4 -1 -1 +1 140 22 12
5 +1 +1 -1 160 28 8
6 -1 +1 -1 140 28 8
7 +1 -1 -1 160 22 8
8 -1 -1 -1 140 22 8
Resolução
A partir dos dados do enunciado pode-se construir a seguinte tabela:
N = mc + 2n + m0 = 23 + 2.3 + 1 =15
Tabela 4.14
Ensaio X0 X1 X2 X3 Yj
1 1 +1 +1 +1 80.3
2 1 -1 +1 +1 87.0
3 1 +1 -1 +1 90.0
4 1 -1 -1 +1 82.3
5 1 +1 +1 -1 88.6
104
6 1 -1 +1 -1 89.6
7 1 +1 -1 -1 84.3
8 1 -1 -1 -1 74.0
9 1 +α 0 0 88.1
10 1 -α 0 0 79.4
11 1 0 +α 0 83.3
12 1 0 -α 0 76.5
13 1 0 0 +α 87.2
14 1 0 0 -α 77.1
15 1 0 0 0 85.8
A partir dos intervalos de variação das variáveis acima dados pode-se construir a
tabela de valores reais das variáveis independentes.
Tabela 4.15.
Z1 Z2 Z3
Zio 150 25 10
∆i 10 3 2
Zi1 160 28 12
Zi2 140 22 8
αn + 2n α2 – 2n-1(n+0.5m0) = 0
e resolvendo a equação obtêm-se:
α = 1.215
D = 0.4328
E = -0.1672
e = 10.952
F = 0.2292
G=0
∑Y
j =1
j = 1253.5
15
∑X
j =1
2
1j * Y j = 923.37
15
∑X
j =1
2
2j * Y j = 912
15
∑X
j =1
2
3j * Y j = 918.64
15
∑X
j =1
1j * Y j = 20.87
15
∑X
j =1
2j * Y j = 23.16
105
15
∑X
j =1
3j * Y j = 15.37
15
∑X
j =1
1j * X 2 j * X 3 j * Y j = − 3 .1
3 15 15 15 15
j =1
15
b2 = e −1 * ∑ X 2 j * Y j = 10.952 −1 * 23.16 = 2.11
j =1
15
b3 = e −1 * ∑ X 3 j * Y j = 10.952 −1 * 15.37 = 1.40
j =1
15
b12 = mc−1 * ∑ X 1 j * X 2 j * Y j = 8 −1 * (−25.7) = −3.21
j =1
15
b13 = mc−1 * ∑ X 1 j * X 3 j * Y j = 8 −1 * (−8.3) = −1.04
j =1
15
b23 = mc−1 * ∑ X 2 j * X 3 j * Y j = 8 −1 * (−24.9) = −3.11
j =1
15 3 15 15
b11 = ( F − G )∑ X 12j * Y j + G ∑∑ X ij2 * Y j + E ∑ Y j =
j =1 i =1 j =1 j =1
15 3 15 15
b33 = ( F − G )∑ X 32j * Y j + G ∑∑ X ij2 * Y j + E ∑ Y j =
j =1 i =1 j =1 j =1
106
seu valor médio aritmético.
Os valores de Ycal, o termo (Yj- Y )2 e o termo (Yj-Ycql)2 estão calculados e podem ser
vistos na tabela 4.16.
Tabela 4.16
Ni Yj Yj,cal (Yj- Y )2 (Yj-Ycql)2
1 80.3 82.572 10.6929 5.161984
2 87 87.252 11.7649 0.063504
3 90 90.992 41.3449 0.984064
4 82.3 82.832 1.6129 0.283024
5 88.6 88.072 25.3009 0.278784
6 89.6 88.592 36.3609 1.016064
7 84.3 84.052 0.5329 0.061504
8 74.0 71.732 91.5849 5.143824
9 88.1 87.39691 20.5209 0.494334
10 79.4 82.75561 17.3889 11.26013
11 83.3 83.79435 0.0729 0.244377
12 76.5 78.66705 49.9849 4.696085
13 87.2 85.17851 13.1769 4.086424
14 77.1 81.77651 41.8609 21.86974
15 85.8 82.05 4.9729 14.0625
Méd=83.57 Σ1257.715 Σ367.1735 Σ69.70634
1 15 15
Da tabela 4.16 temos: Y= ∑ Y j = 83.57 ,
15 j =1
∑ (Y
j =1
j − Y ) 2 = 367.17 e
1
S R2 0 = * 367.17 = 26.23
14
1 15 1
S R2 = ∑
f 1 j =1
(Y j ,cal − Y j ) 2 = * 69.71 = 6.34
11
f1 = m-n-1=15-3-1=11
S R2 6.34
FC = 2 = = 0.242
S R 0 26.23
107
Exemplo de cálculo 4.7.
Investiga-se a influência da temperatura de uma mistura reaccional e tempo de
processamento sobre o rendimento de um produto. O nível básico para a
temperatura é T0 = 443 K e tempo de processamento t0 = 5 horas. O intervalo de
variação ∆T = 5K e ∆t = 1hora. Para a obtenção do modelo fez-se inicialmente
ensaios para um plano de 1a ordem, obtendo-se os seguintes resultados.
Tabela 4.17
Ni X1 X2 Yj
1 +1 +1 67
2 -1 +1 57
3 +1 -1 79
4 -1 -1 55
Os valores de Y j são valores médios de três ensaios paralelos com uma variância
2
média S e = 3.7 . Consideremos que chegou-se a conclusão de que os modelos de 1a
ordem para os planos dados não são adequados e é no entanto necessária a construção
de modelos de 2a ordem. Por isso completou-se este plano de ensaios num plano de 2a
ordem e foram feitos os seguintes ensaios e respectivos resultados:
Tabela 4.18
Ni X1 X2 Yj Yj Yj
5 +α 0 73 73 73
6 -α 0 49 49 49
7 0 +α 64.5 64.5 64.5
8 0 -α 71.2 71.2 71.2
PO PRU PRO
9 0 0 68 68 68
10 0 0 67 67 67
11 0 0 66 66 66
12 0 0 0 67.3 67.3
13 0 0 0 66.7 66.7
14 0 0 0 0 67.5
15 0 0 0 0 67.0
16 0 0 0 0 66.5
Encontrar os referidos modelos para todos os planos e fazer a verificação da
108
adequação.
∑Y
j =1
j = 715.7
11
∑X
j =1
2
1j * Y j = 417.12
11
∑X
j =1
2
2j * Y j = 435.84
11
∑X
j =1
1j * Y j = 62.26
11
∑X
j =1
2j * Y j = −16.69
11
∑X
j =1
1j * X 2 j * Y j = −15
2 11 11 11
11 n = 2 11
b0 = D ∑ Y j + E ∑∑ X ij2 * Y j = 0.3011 * 715.7 − 0.1742 * (417.12 + 435.84) = 66.91
j =1 i =1 j =1
11 −1
j =1
11
b2 = e −1 * ∑ X 2 j * Y j = 6.634 −1 * (−16.69) = −2.52
j =1
109
11
b12 = mc−1 * ∑ X 1 j * X 2 j * Y j = 4 −1 * (−15) = −3.75
j =1
11 2 11 11
b11 = ( F − G )∑ X 12j * Y j + G ∑∑ X ij2 * Y j + E ∑ Y j =
j =1 i =1 j = 2 j =1
∑ (Y
j =1
j , cal − Y j ) 2 = 8.028
3
Æ S R2 = * 8.028 = 4.014
6
Aplicação do teste Fischer
S R2 4.014
FC = 2
= = 1.085
Se 3.7
110
Onde n – é o número de variáveis independentes (X1 e X2)
Da tabela das características principais para alguns planos rotacionais uniformes PRU
de N=13 e n=2 teremos:
mc = 4, m0 = 5, α = 1.414, D = 0.2000, -E = 0.1000, e = 8.000,
F = 0. 1437 e G = 0.0187
Proposta do modelo
Y = b0X0 + b1X1 + b2X2 + b12X1X2 + b11X12 + b22X22
∑Y
j =1
j = 849.7
13
∑X
j =1
2
1j * Y j = 500.93
13
∑X
j =1
2
2j * Y j = 528.32
13
∑X
j =1
1j * Y j = 68.94
13
∑X
j =1
2j * Y j = −18.47
13
∑X
j =1
1j * X 2 j * Y j = −15
2 13 13 13
13 n = 2 13
b0 = D ∑ Y j + E ∑∑ X ij2 * Y j = 0.2000 * 849.7 − 0.1000 * (1029.25) = 67.02
j =1 i =1 j =1
13 −1
b1 = e * ∑ X 1 j * Y j = 8 * 68.94 = 8.62
−1
j =1
13
b2 = e −1 * ∑ X 2 j * Y j = 8 −1 * (−18.47) = −2.31
j =1
13
b12 = mc−1 * ∑ X 1 j * X 2 j * Y j = 4 −1 * (−15) = −3.75
j =1
111
13 2 13 13
b11 = ( F − G )∑ X 12j * Y j + G ∑∑ X ij2 * Y j + E ∑ Y j =
j =1 i =1 j = 2 j =1
∑ (Y
j =1
j ,cal − Y j ) 2 = 0.32
5
Æ S R2 = * 0.32 = 0.27
6
Aplicação do teste Fischer
S R2 0.27
FC = 2
= = 0.073
Se 3.7
112
Proposta do modelo
Y = b0X0 + b1X1 + b2X2 + b12X1X2 + b11X12 + b22X22
Determinação dos parâmetros do modelo
N =16
∑Y
j =1
j = 1050.7
16
∑X
j =1
2
1j * Y j = 500.93
16
∑X
j =1
2
2j * Y j = 528.32
16
∑X
j =1
1j * Y j = 68.94
16
∑X
j =1
2j * Y j = −18.47
16
∑X
j =1
1j * X 2 j * Y j = −15
2 16 16 16
16 n = 2 16
b0 = D ∑ Y j + E ∑∑ X ij2 * Y j = 0.1250 * 1050.7 − 0.0625 * 1029.25 = 67.01
j =1 i =1 j =1
16 −1
b1 = e −1 * ∑ X 1 j * Y j = 8 * 68.94 = 8.62
j =1
16
b2 = e −1 * ∑ X 2 j * Y j = 8 −1 * (−18.47) = −2.31
j =1
16
b12 = mc−1 * ∑ X 1 j * X 2 j * Y j = 4 −1 * (−15) = −3.75
j =1
16 2 16 16
b11 = ( F − G )∑ X 12j * Y j + G ∑∑ X ij2 * Y j + E ∑ Y j =
j =1 i =1 j = 2 j =1
113
Y = 67.01 + 8.62X1 – 2.31X2 – 3.75X1X2 – 3.05X12 + 0.37X22
∑ (Y
j =1
j , cal − Y j ) 2 = 0.2285
8
Æ S R2 = * 0.2285 = 0.305
6
Aplicação do teste Fischer
S R2 0.305
FC = 2
= = 0.082
Se 3.7
114
Y = 2 + 3X1 - 2X2 + X3
Usando um projecto experimental a dois níveis elabore a tabela de respostas deste
sistema.
115
1 160 60 60.3
2 150 50 54.3
3 150 70 60.3
4 170 50 62.2
5 170 70 68.0
6 160 60 62.3
7 150 50 56.5
8 150 70 61.7
9 170 50 64.6
10 170 70 66.8
116
13. Usando o método modificado dos mínimos quadrados elabore um modelo
matemático de 1a ordem para os dados experimentais do problema no 12.
117