Você está na página 1de 14

Universidade Federal de Viçosa

Viço
Departamento de Estatística
Disciplina: EST 631 – Métodos Estatísticos II

Apostila

Introdução à Metodologia de Superfícies


Superfície de Resposta

Paulo Roberto Cecon


Anderson Rodrigo da Silva

Viçosa, MG
2011
Introdução à Metodologia de Superfícies de Resposta

ii
Sumário

1. Introdução.................................................................................................................. 1
2. Modelo de Primeira Ordem....................................................................................... 4
3. Delineamentos Experimentais para Ajuste de Modelos de Primeira Ordem ............ 9
3.1. Fatorial Completo .............................................................................................. 9
3.2. Delineamento Composto Central (DCC) ........................................................... 9
3.3. Delineamento Composto Central Rotacionado (DCCR) ................................. 10
3.4. Delineamento de Box-Behnken (DBB) ........................................................... 10
4. Teste de Significância do Modelo........................................................................... 12
5. Medidas e Adequação de Modelos.......................................................................... 13
6. Teste para Falta de Ajuste ....................................................................................... 14
7. Método da Inclinação Ascendente .......................................................................... 15
8. Exemplo de Aplicação para o Modelo de Primeira Ordem .................................... 15
9. Modelo de Segunda Ordem..................................................................................... 21
10. Localização do Ponto Estacionário ......................................................................... 28
11. Caracterizando a Superfície de Resposta ................................................................ 29
Referências ..................................................................................................................... 35

iii
1. Introdução

No contexto da estatística experimental há constante interesse em caracterizar a


possível relação entre uma ou mais variáveis resposta e um conjunto de fatores de
interesse. Isso pode ser executado através da construção de um modelo que descreva a
variável resposta em função dos níveis aplicáveis desses fatores.

Certos tipos de problemas científicos envolvem a expressão de uma variável


resposta, tal como o rendimento de um produto, como uma função empírica de um ou
mais fatores quantitativos, tais como a temperatura de reação e a pressão. Isso pode ser
efetuado utilizando-se uma metodologia que permita modelar a relação: Rendimento em
função de temperatura de reação e pressão. O conhecimento da forma funcional de f,
frequentemente obtida com a modelagem de dados provenientes de experimentos
planejados, permite tanto sumarizar os resultados do experimento quanto predizer a
resposta para níveis dos fatores quantitativos. Assim, a função f define a superfície de
resposta, que em sua essência, consiste em estimar coeficientes da regressão polinomial
para a geração de um modelo empírico, por meio do qual é possível aproximar uma
relação (inicialmente desconhecida ou conhecida) entre os fatores e as respostas do
processo.

Podemos então definir a Superfície de Resposta como sendo a representação


geométrica obtida quando uma variável resposta é plotada como uma função de dois ou
mais fatores quantitativos. A função pode ser assim definida:

Y = f (X1 , X 2 ,..., X k ) + ε

Em que: Y é a resposta (variável dependente); X1 , X 2 ,..., X k são os fatores (variáveis

independentes); e ε é o erro aleatório.

Denota-se a resposta esperada por:

E(Y) = f (X1 , X 2 , ,Xk ) = η

então,

η = f (X1 , X 2 , , Xk )

1
é chamada de superfície de resposta.

A metodologia de superfície de resposta, ou MSR, é uma coleção de técnicas


matemáticas e estatísticas que são úteis para modelagem e análise nas aplicações em
que a resposta de interesse seja influenciada por várias variáveis e o objetivo seja
otimizar essa resposta. Por exemplo, suponha que um engenheiro químico deseje
encontrar os níveis de temperatura (X1) e concentração da alimentação (X2) que
maximizem o rendimento (Y) de um processo. O rendimento de um processo é uma
função dos níveis de temperatura e concentração de alimentação, como
Y = f (x1, x 2 ) + ε , em que ε representa o erro observado na resposta esperada

E(Y) = f (x1, x 2 ) = η , então a superfície representada por η = f (x1, x 2 ) é chamada de


superfície de resposta (Montgomery e Runger, 2008).

Segundo Montgomery (2001), as equações definidas de superfície de resposta


podem ser representadas graficamente e utilizadas de três formas:
• Descrever como as variáveis em teste afetam as respostas;
• Determinar as inter-relações entre as variáveis em teste; e
• Para descrever efeitos combinados de todas as variáveis em teste sobre a
resposta.

Algumas considerações devem ser feitas quando utilizamos superfície de


resposta, a saber:

a) O uso efetivo da superfície de resposta deve considerar cinco pressupostos:

i. Os fatores que são críticos ao processo são conhecidos;


ii. A região em que os fatores influem o processo é conhecida;
iii. Os fatores variam continuamente ao longo da faixa experimental escolhida;
iv. Existe uma função matemática que relaciona os fatores à resposta medida;
v. A resposta que é definida por essa função é uma superfície lisa.

2
b) A técnica também apresenta algumas limitações que devem ser consideradas:

i. Grandes variações dos fatores podem resultar em conclusões falsas;


ii. Os fatores críticos não foram especificados corretamente;
iii. A região de ótimo pode não ser determinada devido ao uso de uma faixa muito
estreita ou ampla;
iv. Como em qualquer experimento, resultados destorcidos podem ser obtidos se os
princípios clássicos da experimentação não forem seguidos (casualização,
repetição e controle local); e
v. Superestimar a computação: o pesquisador dever utilizar de bom senso e seu
conhecimento sobre o processo para chegar a conclusões apropriadas a seus
dados.

A aplicação dessa metodologia foi realizada inicialmente na indústria química,


tendo sido seus fundamentos formalizados por Box e Draper (1987). No campo
agronômico, o uso concentrou-se no estudo do rendimento de cultivares, como efeito de
níveis de nutrientes aplicados ao solo, incluindo-se outros fatores, como: densidade de
plantio e lâminas de irrigação.
A superfície de resposta é útil quando o pesquisador não conhece a relação exata
entre os fatores. Mas, geralmente quando a expressão analítica da função é conhecida, a
metodologia pode ser útil em alguns casos: freqüentemente podem-se encontrar funções
descontínuas, e em muitos casos se trabalha com valores discretos das variáveis de
projeto ou fatores, sendo assim o uso da metodologia de superfície de resposta apresenta
uma ampla aplicação na pesquisa, porque ela considera vários fatores em níveis
diferentes e as interações correspondentes entre esses fatores e níveis.
Dentre as vantagens da metodologia de superfície de resposta, a principal é que
seus resultados são resistentes aos impactos de condições não ideais, como erros
aleatórios e pontos influentes, porque a metodologia é robusta. Outra vantagem é a
simplicidade analítica da superfície de resposta obtida, pois a metodologia gera
polinômios. Em geral, polinômios de duas ou mais variáveis, são funções contínuas.

3
Após o ajuste do modelo aos dados, é possível estimar a sensibilidade da
resposta aos fatores, além de determinar os níveis dos fatores nos quais a resposta é
ótima (por exemplo, máxima ou mínima).

2. Modelo de Primeira Ordem

Na maioria dos problemas em superfície de resposta, a forma do relacionamento


entre as variáveis dependentes e independentes é desconhecida. Assim, o primeiro passo
é encontrar uma aproximação para o verdadeiro relacionamento entre a variável
resposta (y) e as variáveis independentes (fatores). Geralmente utiliza-se de uma
regressão polinomial de baixo grau em alguma região das variáveis independentes. A
forma geral para o modelo de primeira ordem (ou modelo de grau um) em k variáveis de
entrada (independentes) pode ser representado por:
k
Y = β0 + βi X i + ε
i =1

Onde Y é uma variável resposta observada, β 0 , β1 , ..., β k são parâmetros desconhecidos,


e ε é o termo do erro aleatório. Se ε tem média zero, então a porção não aleatória do
modelo geral de primeira ordem representa a verdadeira resposta média, η , que é,
k
η = E(Y) = β0 + βi X i
i =1

e ε é tido como erro experimental. Se, entretanto, o modelo descrito é inadequado para
representar a verdadeira resposta média, então ε contém, adicionalmente ao erro
experimental, um erro não aleatório (sistemático). Este último erro é atribuído a omissão
de termos em X1 , X 2 ,..., X k de grau superior a um que podem ser entendidas como
outras variáveis as quais tem alguma influência sobre a variável resposta. Este erro
adicional (excluindo o erro experimental) é chamado falta de ajuste.
Escrevendo o modelo em notação matricial, considerando N observações, temos:
Y=X +

4
Em que Y é um vetor de N (N k+1) observações, `= [ β0 β1 ... βk ] é um vetor (k+1)

x 1 de parâmetros desconhecidos, `= [ ε1 ε 2 ... ε N ] é um vetor N x 1 de erros, e X é

uma matriz N x (k+1) de coeficientes dos parâmetros que compreende os níveis das
variáveis independentes. Assume-se que os erros aleatórios são NID(0, σ 2 ) , isto é,
independentemente distribuídos com distribuição Normal de média zero e variância
comum. Quando a matriz X é de posto coluna completo, então o estimador de mínimos
quadrados ordinários de pode ser obtido por:
ˆ = ( X`X) −1 X`Y

E a matriz de variâncias e covariâncias de ˆ é dada por:

V( ˆ ) = ( X`X) −1 σ2

Na maioria dos casos, os cálculos para estimação dos parâmetros podem ser
simplificados codificando os níveis das k variáveis independentes Xi por meio de:

2(Xiu − Xi )
x iu = i = 1,2,...,k e u = 1,2,..., N
Ri
N
Em que X i = u =1
X iu / N e R i é a diferença entre o maior e o menor valor dos níveis.

A codificação apresenta a característica:


N
x iu = 0 i = 1,2,...,k
u =1

Exemplo: Os dados a seguir referem-se ao peso de alimentos ingeridos em experimento


com alimentação de ratos em relação a duração do tempo entre inoculação de dosagens
de uma droga e a alimentação (horas).

5
Droga (X1)
Tempo (X2) Peso observado
Dosagem (mg kg-1)
0,3 1 5,63
0,3 1 6,42
0,7 1 1,38
0,7 1 1,94
0,3 5 11,57
0,3 5 12,16
0,7 5 5,72
0,7 5 4,69
0,3 9 12,68
0,3 9 13,31
0,7 9 8,28
0,7 9 7,73

Utilizando variáveis codificadas, tem-se:

2 ( X1u − X1 ) 2 ( X1u − 0,5 ) X1u − 0,5


x1u = = =
R1 0,7 − 0,3 0, 2

2 ( X 2u − X 2 ) 2 ( X 2u − 5 ) X 2u − 5
x 2u = = =
R2 9 −1 4

Então, o modelo de primeira ordem para Yu = β0 + β1X1u + β2 X2u + εu , em notação

matricial Y = X + , utilizando as variáveis codificadas é

5,63 1 −1 −1 ε11
6,42 1 −1 −1 ε12
1,38 1 1 −1 ε21
1,94 1 1 −1 ε22
11,57 1 −1 0 ε31
β0
12,16 1 −1 0 ε32
= β1 +
5,72 1 1 0 ε41
3
β2 1
4,64 1 1 0 ε42
12,68 1 −1 1 ε51
13,31 1 −1 1 ε52
8,28 1 1 1 ε61
12
7,73 1 12
1 1 1 3 ε62
12 1

6
ˆ = ( X' X) −1 X' Y
n n
n x 1u x 2u
u =1 u =1 12 0 0
n n n
X' X = x 1u x 2
1u x 1u x 2u = 0 12 0
u =1 u =1 u =1
n n n 0 0 8
2
x 1u x 1u x 2u x 2u
u =1 u =1 u =1

n
Yu
u =1
n
X'Y = Yu x1u
u =1
n
Yu x 2u
u =1

1
0 0
12 91,46 7,62166
ˆ= 0 1
0 − 32,08 = − 2,67333
12
1 26,63 3,32875
0 0
8

Equação ajustada:

Ŷ = 7,62166 − 2,67333** x1u + 3,32875** x 2 u


X1u − 0,5 X −5
Ŷ = 7,62166 − 2,67333** + 3,32875** 2 u
0,2 4
Ŷ = 10,1440 − 13,3665** X1u + 0,83212875** X 2 u

Hipóteses:

H0 : 1 = 2 =0
H1 : pelo menos um dos difere de zero

7
Quadro da análise de variância:

FV GL SQ QM F
Regressão 2 174,1380 87,0690 84,28**
Resíduo 9 9,2980 1,0331
Total 11 183,4360

174,1380
R2 = = 0,9493
183,4360

Teste para cada um dos parâmetros:

H0 : 1 =0
H1 : 1 ≠0

- 2,67333 - 0
t= = −9,10**
1
(1,0331)
12

H0 : 2 =0
H1 : 2 ≠0

3,32875 − 0
t= = 9,26**
1
(1,0331)
8

**
significativo pelo teste t a 5% de probabilidade.

8
3. Delineamentos Experimentais
Experimentais para Ajuste de
Modelos de Primeira Ordem

3.1. Fatorial Completo

Caracteriza-se
se pela Combinação de todos
todo os níveis de todos os fatores
escolhidos
colhidos pelo pesquisador apresentando comoo desvantagem
des um número muito grande
de ensaios. Deste modo, um fatorial completo com p(níveis) e k(fatores) apresenta pk
combinações distintas,
s, se p = k.
k

Exemplo 1: Em
m um ensaio onde se deseja contrastar
rastar temperatura (30, 35, 40), tempo (3,
5, 7) e pH (5, 6, 7) tentando otimizar uma determinada
deter reação química, temos um
fatorial 33, onde k=3 fatores e p=3 níveis. Ao todo serão 27 tratamentos,
tratamentos conforme a
representação gráfica:

3.2. Delineamento
lineamento Composto Central (DCC)

Caracteriza-se
se pela Combinação de um fatorial
fat 2K (k fatores) mais o ponto
central.
ntral. Sua vantagem é a de reduzir o número
ero de ensaios, todavia sua utilização
restringe-se ao ajuste de modelos de primeira ordem.
ordem

Tomando-se
se como ilustração o exemplo da seção 3.1,, o número de tratamentos
ficaria: 23+1 = 9, uma redução de 18 ensaios em relação
rela ao fatorial completo.

9
3.3. Delineamento Composto Central Rotacionado (DCCR)

É utilizado para experimentos onde k(fatores) ≥ 2 . Este delineamento contém


pontos da parte cúbica codificados para ( ± 1), pontos axiais codificados para ( ± α ,
onde α = (2k)1/4) para testar o modelo de segunda ordem e o ponto central codificado
para (0) que geralmente possui repetições. Assim, número de tratamentos passaria a ser:
fatorial 2k + ponto central + 2k pontos axiais. Para o exemplo da seção 3.1., 23+1+2*3=
15 tratamentos.

3.4. Delineamento de Box-Behnken (DBB)

É utilizado para experimentos com k 3. Tendo como principal vantagem a


redução do número de ensaios para estudar um maior número de fatores. De modo geral
os níveis dos fatores são escolhidos à partir das informações de seus limites inferiores e
superiores.

O número de tratamentos dá-se pela combinação dos níveis da parte cúbica +


ponto central.

A título de ilustração, seguem abaixo outros exemplos:

Exemplo 2. Um experimento com dois fatores de interesse (A e B), possuindo p = 4


níveis para ambos os fatores.

10
Exemplo 3.

Exemplo 4.. Um planejamento experimental com


m 3 fatores
f e 4 níveis cada.

11

Você também pode gostar