Escolar Documentos
Profissional Documentos
Cultura Documentos
Rio de Janeiro
Julho de 2010
Jos
Carlos
Costa
da
Silva
Pinto
Martin Schmal
Tese (doutorado) UFRJ/ COPPE/ Programa de
Engenharia Qumica, 2010.
Referencias Bibliogrficas: p. 260-272.
1. Planejamento de experimentos. 2. Incertezas. 3.
Funes de Informao. I. Pinto, Jos Carlos Costa da
Silva et al. II. Universidade Federal do Rio de Janeiro,
COPPE, Programa de Engenharia Qumica. III. Ttulo.
iii
AGRADECIMENTOS
Eu sou uma destas pessoas de sorte. Tenho tanta sorte porque, em minha vida,
todas as coisas vieram no momento certo e no no momento em que eu queria; na
intensidade certa e no na intensidade que meu ego ansiava, para que meu ego,
observando sua insignificncia, atrapalhasse minimamente meu aprendizado. Seja
pelas leis do caos ou por qualquer razo maior, conheci em minha vida meus mestres
no momento certo, responsveis por todo o meu pouco conhecimento que, apesar de to
mnge, pra mim uma das coisas mais preciosas. Carrego em minha vida muito de
todos que j passaram por ela, grandes irmos e amigos, brilhantes professores, nobres
heris. Aqueles que, pela simplicidade, encantam, ensinam, demonstram, por vezes
expandido minha viso para o que deveria ser bvio, e principalmente para alm do
bvio, me surpreendendo sempre com perspectivas diferentes, inclusive sobre coisas
que eu imaginava conhecer. As pessoas que constam nos agradecimentos desta tese
representam infimamente em nmero as pessoas que eu gostaria e deveria mencionar.
Tambm as palavras aqui contidas expressaro muito pouco o meu sentimento de
gratido e respeito.
Para comear, agradeo meus orientadores, Jos Carlos Pinto e Martin Schmal,
pelo brilhantismo, pela pacincia, pela amizade, pelas inmeras ajudas, conversas,
orientaes, etc (etc mesmo!!!!). Em grande parte, graas a vocs este caminho me foi
aberto, e graas a vocs pude concluir este trabalho.
Agradeo banca, os professores Ponce de Leon, Marcio Schwaab, Argimiro e
Evaristo, pela pacincia em ler e avaliar o trabalho e cujas correes muito contriburam
para a tese.
Aos professores do PEQ, com os quais muito aprendi.
Muito obrigado ao pessoal da secretaria, que, diga-se de passagem, so por
demais eficientes, Paulinha, Luciana, Artur e Cia. A Paulinha, por exemplo, vivia
quebrando galhos pra mim (ex, sempre fazendo minha matrcula).
iv
vi
vii
ix
SUMRIO
PARTE 1 -INTRODUO
1
INTRODUO ...................................................................................................................................2
2.2
2.2.1
Critrio Bayesiano................................................................................................................12
2.2.2
3.2
3.2.1
3.3
3.3.1
3.4
A matriz VZ ............................................................................................................................26
Interpretao estatstica da incerteza paramtrica ..............................................................28
3.4.1
3.4.2
Informao de Fisher.................................................................................................................44
4.2
4.2.1
Variveis discretas................................................................................................................46
4.2.2
Variveis contnuas...............................................................................................................48
4.3
4.4
Informao de Lindley...............................................................................................................50
Introduo ..................................................................................................................................55
5.2
5.3
5.4
5.4.1
5.4.2
5.4.3
ATKINSON e colaboradores.................................................................................................69
5.4.4
5.4.5
5.4.6
5.4.7
TOMMASI e colaboradores..................................................................................................75
5.5
5.6
de parmetros ......................................................................................................................................80
PARTE 3 -RESULTADOS
6
Objetivos .....................................................................................................................................86
6.2
Introduo ..................................................................................................................................86
6.3
6.3.1
6.3.2
6.4
6.5
6.5.1
6.5.2
6.5.3
6.5.4
6.6
6.7
Objetivos ...................................................................................................................................116
7.2
Introduo ................................................................................................................................117
7.3
7.4
7.5
Exemplos...................................................................................................................................126
7.6
Objetivos ...................................................................................................................................145
8.2
Introduo ................................................................................................................................145
8.3
de modelos ..........................................................................................................................................147
8.4
Exemplos...................................................................................................................................149
8.5
xi
9.1
Objetivos ...................................................................................................................................163
9.2
Introduo ................................................................................................................................163
9.3
9.4
9.4.1
9.4.2
9.5
9.5.1
Algoritmo ............................................................................................................................173
9.5.2
9.6
Exemplos...................................................................................................................................176
9.7
xii
xiii
PARTE 1 - INTRODUO
1 INTRODUO
A utilizao de modelos para descrever processos industriais e laboratoriais pode
ser entendida como uma das pedras angulares da Engenharia Qumica. Os modelos
podem ser obtidos: (i) a partir de dedues puramente fenomenolgicas; (ii) atravs de
propostas
emprico-fenomenolgicas,
que
se
fundamentam
em
princpios
(A)
(B)
x
Figura 1.1 Ilustrao de como o mesmo modelo pode ser avaliado como (A) adequado
ou (B) inadequado, a depender da preciso experimental considerada.
y
(A)
(B)
Dado
simulado
x*
C A C A0 e t
i K1, k K 2
ganha trs vezes o valor apostado na primeira casa de apostas e duas vezes o valor
apostado na segunda casa de apostas. Neste caso, as estratgias so cinco:
s1 no apostar
0,00
0,00
-100,00
300,00
-200,00
600,00
-100,00
200,00
-200,00
400,00
natureza. Para o estado da natureza nat1, tem-se U(nat1,s), enquanto para o segundo
estado da natureza nat2, tem-se U(nat2,s). Neste caso, pode-se observar que a casa de
apostas 02 apresenta sempre um lucro inferior ao da casa de apostas 01, ou seja: a
estratgia s2 domina a estratgia s4; e a estratgia s3 domina a estratgia s5. Portanto, as
estratgias s4 e s5 so piores do que outras e podem ser eliminadas. Pode-se observar
que no h dominncia entre as estratgias s1, s2 e s3, que, portanto, constituem a frente
de Pareto neste problema.
Graficamente, tem-se a seguinte soluo deste problema.
Figura 2.1 Utilidades dos dois estados da natureza possveis para os dados
apresentados na Tabela 2.1, sendo a frente de Pareto composta pelos pontos s1, s2 e s3
Fim do Exemplo 2.1
A escolha de um ponto especfico costuma ser feita por meio de probabilidades
dos estados da natureza ou pelo critrio Maximin. Os conceitos apresentados nas
prximas sees podem ser encontrados na literatura clssica de Teoria da Deciso
(CHERNOFF e MOSES, 1959, Cap 5).
11
(E 2.3)
(E 2.4a)
(E 2.4b)
(E 2.5)
(E 2.6)
12
P nat ,1
U max
U nat ,1 , sotm
P
P nat ,2
nat
,2
P nat ,1
2.1, a soluo do problema consiste em encontrar a reta que cruza a frente de Pareto,
conforme ilustrado na Figura 2.2.
U(nat2,s)
600
s3
sotm=s3
s5
s2
300
s4
s1
0
-200
-100
U(nat1,s)
Figura 2.2 Resultado grfico para a escolha de um ponto dentro da frente de Pareto no
Exemplo 2.1, de acordo com a Equao (E 2.3).
No exemplo proposto, o um somatrio P(nat,i)U(nat,i,s) representa a equao
de um hiperplano. A soluo grfica consiste em traar hiperplanos paralelos e observar
qual o hiperplano com mximo valor de P(nat,i)U(nat,i,s) que cruza a frente de Pareto.
A forma da probabilidade dos estados da natureza no foi especificada, portanto,
no h perda de generalidade quando se utiliza qualquer ponderao wi(nat) para
maximizar a funo wi(nat)U(nat,i,s). Sendo wi(nat) funo dos estados da natureza, a
soluo do problema consiste em traar as funes wi(nat)U(nat,i,s) e, de forma
13
Frente de Pareto
U(
na
t_
1 ,s
U(nat_3,s)
Planos paralelos
U(nat_2,s)
14
(E 2.8)
Umin = +
Para j de 1 at o nmero de estados da natureza, faa
U0 = U(si,nat,j)
Se (Umin > U0), ento
Umin = U0
Fim se
Fim faa
Se (Umin > Umaxmin), ento
Umaxmin = Umin
sotm = si
Fim se
Fim faa
Informe sotm
Figura 2.4 Algoritmo para determinao do timo segundo o critrio Maximin.
15
No caso ilustrado no Exemplo 2.1, nos piores casos (ou seja, o So-Paulo no
ganhar) o indivduo perderia o valor apostado. Mas se o indivduo no apostar nada, no
perde nada. Logo, a maximizao do pior valor possvel levaria o indivduo a no
apostar nada, adotando a estratgia s1. O processo de tomada de deciso est
apresentado na Tabela 2.2.
Tabela 2.2 Ilustrao da aplicao do critrio Maximin aos dados do Exemplo 2.1.
Estratgia
s1
0,00
s2
-100,00
mnimos
s3
-200,00
===========
s4
-100,00
s5
-200,00
0,00
Estratgia s1
U(nat2,,s), que partem da reta original em direo ao infinito (Figura 2.6). Dentre os
pontos que pertencerem frente de Pareto e as semi-retas, buscam-se aqueles que
cruzam o mximo da reta U(nat1,,s) = U(nat2,,s), como mostrado na Figura 2.6.
16
Frente de Pareto
U(nat2,s)
Regio
vivel
Soluo
Maximin
U(nat2,s)=U(nat1,s)
U(nat1,s)
Figura 2.5 Ilustrao da soluo Maximin quando h pontos da regio vivel
pertencentes reta U(nat2,,s) = U(nat1,,s).
Na Figura 2.6A, a regio vivel encontra-se abaixo da linha U(nat1,,s) =
U(nat2,,s). O critrio Maximin busca maximizar o pior caso, ou seja, neste caso
admitindo que o estado da natureza seja nat2. Portanto, a estratgia a ser escolhida deve
maximizar U(nat2,,s), conforme ilustrado na Figura 2.6A. A Figura 2.6C anloga.
Na Figura 2.6B, a regio vivel um retngulo. Desconsiderando-se a
dominncia fraca de Pareto, a frente de Pareto seria constituda pela aresta superior da
regio vivel. A regio vivel encontra-se abaixo da linha U(nat1,,s) = U(nat2,,s); logo,
o critrio Maximin busca maximizar o pior caso (neste caso, U(nat2,,s)). Na Figura 2.6B
existem solues que apresentam igualdade em relao ao timo U(nat2,,s), na aresta
superior, que maximizam U(nat2,,s). Neste caso, h um ponto timo indicado na Figura
2.6B que apresenta dominncia fraca de Pareto sobre os pontos da aresta superior. A
estratgia que resulta neste ponto seria a escolha mais adequada.
A utilizao do critrio Maximin muito recomendada quando as conseqncias
da escolha de uma estratgia inadequada para possveis estados da natureza so
demasiadamente negativas. Por exemplo, em uma indstria onde a carga reacional
(estado da natureza) oscila grandemente, a escolha de um tipo de reator (estratgia)
para uma dada condio da carga reacional pode levar exploso do reator. Neste caso,
muito prefervel escolher estratgias que, independentemente da carga reacional, no
levem exploso do reator, ou seja, adotar o critrio Maximin.
17
U(nat2,s)
Soluo
Maximin
Regio vivel
U(nat2,s)=U(nat1,s)
U(nat1,s)
U(nat2,s)
Soluo
Maximin
Regio vivel
U(nat2,s)=U(nat1,s)
U(nat1,s)
U(nat2,s)
Regio
Soluo
vivel
Maximin
U(nat2,s)=U(nat1,s)
U(nat1,s)
Figura 2.6 Ilustrao grfica de solues Maximin.
Para trs estados da natureza, a visualizao grfica possvel, e uma ilustrao
est apresentada na Figura 2.7.
Na Figura 2.7, a funo utilidade para cada estado da natureza corresponde a um
eixo em um grfico 3D, sendo possvel obter a frente de Pareto como o conjunto de
pontos no dominados. A soluo do critrio Maximin consiste em traar a diagonal do
18
Frente de Pareto
na
t_
1,
s)
U(nat_3,s)
Ponto timo
U(
U(nat_2,s)
19
3 ESTIMAO DE PARMETROS
3.1 Modelos em Engenharia Qumica
A nossa cincia pode parecer primitiva e infantil comparada com a realidade,
21
perturbaes aleatrias segundo uma distribuio normal, com mdia igual ao valor
(E 3.1) ( Z )
exp
2
2 Pi det VZ
(E 3.2)
F Z exp M Z VZ 1 Z exp M Z
T
(E 3.3)
M Z Z
(E 3.4)
M X X est
(E 3.5)
M Y Y P est , X est ou M Y Y P
Pode-se observar que a hiptese acima feita apenas por fins prticos, j que as
correlaes das incertezas nas variveis de projeto e variveis de resposta
provavelmente no so nulas. Contudo, devido dificuldade usual de caracterizao da
matriz de covarincia dos dados experimentais, ignora-se quase sempre esta correlao.
Na realidade, a dificuldade de caracterizao das matrizes de covarincia
experimental costuma levar hiptese de medidas no correlacionadas. Desta forma,
24
tanto a matriz VY quanto a matriz VX so admitidas diagonais. Isto leva seguinte funo
objetivo:
(E 3.7)
v y , k ,i
vx , k , j
k 1 i 1
j 1
N exp
(E 3.8)
N exp Ny
k 1 i 1
exp
k ,i
ykP,i
v y , k ,i
(E 3.9)
N exp Ny
y
k 1 i 1
exp
k ,i
ykP,i
(Z), ou seja:
(E 3.10)
25
E est verd 0
(E 3.11b)
E est verd 0
26
(E 3.12)
Z T
Z
V
VZ 1
onde Z representa as variveis obtidas com o modelo, avaliadas nas condies das
variveis estimadas no procedimento de estimao, composto por variveis de projeto
estimadas Xest e valores das variveis de resposta preditas com o modelo YP, calculadas
com base em est e Xest.
27
P
Y P T
1 Y
V '
V
Y
(E 3.13)
Y
P
(E 3.14)
Y P
B
(E 3.15)
V ' BT VY 1 B
(E 3.16)
verd
est
jest j
j j j
28
Z possurem distribuio normal e: (i) os modelos forem lineares nos parmetros; ou (ii)
os erros experimentais forem suficientemente baixos, (iii) ou o nmero de pontos
experimentais for muito elevado (CHERNOFF, 1972). Neste caso, o erro paramtrico
costuma ser representado por (SCHWAAB e PINTO, 2007, pp 296-297):
(E 3.17)
j u v j , j
(E 3.18)
j t , Ngl v j , j
(E 3.19)
F F est
F est
T
1
est 2 F est
(E 3.20)
2 F 2 V
(E 3.21)
30
F F est c.
Figura 3.1 Ilustrao da regio dos parmetros delimitados por uma equao
(E 3.22)
2 Pi det V
Np
est T V 1 est
exp
31
est T
V 1 est exatamente o
est T
(E 3.23)
est T
2
V 1 est Np
,
onde 2Np, o valor mximo da funo chi-quadrado para Np graus de liberdade e nvel
de confiana . A Equao (E 3.23) a equao de uma hiper-elipside e exata apenas
no caso de modelos lineares nos parmetros. Um exemplo ilustrado pode ser visualizado
na Figura 3.2. Sejam pontos experimentais obtidos com preciso conhecida, conforme
indicado na Figura 3.2A, e a varivel dependente (y) descrita por um modelo linear em
relao varivel independente (x). Todas as retas (y=1x+2) apresentadas na Figura
3.2A descrevem adequadamente os resultados experimentais. Na realidade, se forem
calculados todos os conjuntos dos parmetros 1 e 2 que descrevem adequadamente os
resultados experimentais, a regio de confiana dos parmetros ganha a forma mostrada
na Figura 3.2B.
(A)
(B)
Figura 3.2 - Ilustrao de: (A) possveis retas que descrevem os resultados
experimentais adequadamente e; (B) regio de confiana dos parmetros 1 e 2.
32
Uma forma anloga que gera resultados semelhantes para a regio de confiana
pode ser estabelecida avaliando-se diretamente a funo objetivo (BARD, 1974, pp 190,
SCHWAAB e PINTO, 2007, 360-363). A funo no ponto de mnimo F apresenta a
forma da funo chi-quadrado com NExpNy-Np graus de liberdade. A funo
F F est tambm uma funo com forma da funo chi-quadrado com Np graus
de liberdade. A razo entre duas funes chi-quadrado resulta em uma funo F de
Fisher, especificado o grau de confiana. Desta forma, todos os valores dos parmetros
para os quais vlida a relao abaixo so definidos dentro da regio de confiana.
(E 3.24)
F F est
est
Np
FFNp
, Ngl
N Np
onde FFNP
, Ngl o limite superior da distribuio F de Fisher, com Np e Ngl graus de
V =Dvc..Dvc-1. Como V simtrica, pode-se demonstrar que D-1=DT (SCHWAAB e PINTO, 2007,
pp190), o que por fim resulta em V= Dvc..DvcT.
33
(E 3.25)
est T
est T
(B)
-----Direo do autovetor 1
.......Direo do auto vetor 2
34
(E 3.26)
i , j
vi , j
vi ,i
v j , j
A correlao dos parmetros pode ser induzida por: (i) experimentos mal
planejados; (ii) modelo escrito de forma inadequada; (iii) caracterstica intrnseca do
modelo e dos dados experimentais obtidos. Nos casos (i) e (ii), os problemas podem ser
resolvidos com a escolha de experimentos adequados e reparametrizao do modelo.
Contudo, pode haver modelos de difcil reparametrizao, que induzam a uma
correlao inevitvel dos parmetros. Trabalhos de SCHWAAB e PINTO (2007a),
SCHWAAB et al. (2008b) e SCHWAAB e PINTO (2008) demonstraram como a
reparametrizao pode eliminar a correlao entre os parmetros de expresses
cinticas.
Um importante aspecto que ser de grande valia nesta tese a obteno do
35
(E 3.27)
VCR i
i
| V |
(E 3.29)
VCR | V |
36
H 2 Modelo 2
.....
H M Modelo Nmod
H(2), definida como (WALD, 1947, Cap 3, WETHREILL, 1966, Cap 2, CHERNOFF,
1972, Cap 9, PARMIGIANI, 2004):
(E 3.30)
r 1,2
1 Z
2 Z
Dois modelos so distintos se (i) possurem formas matemticas distintas; ou (ii) a mesma
forma matemtica, mas valores de parmetros distintos. Por exemplo, y=exp(-1x) e y=exp(-2x) podem
ser considerados dois modelos distintos, ou duas hipteses.
37
Quanto maior o valor de r(1,2), maior a tendncia de que o modelo 1 seja melhor
do que o modelo 2. Para escolha do modelo 1 em detrimento do modelo 2 ou vice-versa,
a razo r(1,2) deve encontrar-se acima ou abaixo de limites especificados. Obviamente,
r(1,2)=1 indica que o ajuste feito com o modelo 1 idntico ao ajuste do modelo 2.
Definindo-se limites A e B (B <1<A), possvel fazer as seguintes avaliaes:
r 1,2 A
r
1,2
38
razo entre as funes objetivos pode ser avaliada por um teste estatstico para
distribuio normal. Seja a razo:
(E 3.31)
FF
exp
yi(1) P
exp
yi(2) P
FFmin FF FFmax
1
Fisher com Ngl(1) e Ngl(2) graus de liberdade seja igual a
, e FFMax o valor
2
1
para o qual a distribuio de probabilidade acumulada F-Fisher seja
. O nmero
2
de graus e liberdade Ngl(1) igual ao nmero de pontos experimentais menos os
parmetros do modelo 1 e o nmero de graus e liberdade Ngl(2) igual ao nmero de
pontos experimentais menos os parmetros do modelo 2. Desta forma, se a desigualdade
em (E 3.32) no for satisfeita, os modelos podem ser ditos diferentes com nvel de
confiana e um dos modelos ser considerado melhor do que o outro. Ou seja,
possvel avaliar a adequabilidade comparativa de modelos. Quando a preciso
experimental no conhecida, os modelos podem ser avaliados comparativamente,
39
(E 3.33)
FFmin
y
i 1
exp
yi(1) P
Ny v y
FFmax
40
(E 3.34)
1
2
2
Ngl
(Ngl2)
est
2
F Ngl
2
Pr Ngl
F est
F(est)
F est
2
Ngl
d Ngl2
Ngl2
(E 3.35a)
(E 3.35b)
VZP E Z Z
41
(E 3.36)
Z
Z
VZP
V
VZ
Realidade
1(y)
x
Modelo
(A)
2(y)
(C)
(B)
Figura 3.5 Ilustrao da densidade de distribuio de probabilidade dos: (A) dados
experimentais; e (B) dados experimentais e modelo. A Figura (C) mostra as
distribuies de probabilidade do dado experimental e do modelo para uma dada
condio x* (y=1x+ 2, vy y).
A Figura 3.5 ilustra o comportamento da varincia experimental e da varincia
de predio do modelo, para um modelo linear y=1x+2, com varincia experimental
proporcional ao valor da medida. Neste caso, a distribuio de probabilidade do dado
experimental normal, com mdia dada por y=1x+2 e varincia experimental vy
proporcional ao valor de y. O modelo apresenta distribuio normal, com mdia
y=1x+2 e varincia vyPvy.
43
(E 4.1)
ln Z ln Z T
J E
44
(E 4.2)
J V
Z
1 Z
VZ
(E 4.3)
E T1 E T2
**
45
espera-se que a varincia obtida com um estimador T2 seja sempre maior ou igual ao
inverso da matriz de informao de Fisher, ou seja:
(E 4.4)
VT 2 V
(E 4.5)
I det J
ou
I tr J
ou
I min ValCar J
informaes,
sendo
inicialmente
desenvolvida
para
descrever
46
termodinmica, SHANNON (1948) estendeu este conceito de forma muito mais ampla,
propondo como medida da informao a entropia da informao, caracterizando a
quantidade mnimia de bits (ou outra unidade a depender da base logartmica utilizada)
necessrios para descrever uma mensagem obtida de uma varivel aleatria X. Segundo
SHANNON (1948), se uma varivel X={x1, x2, .., xN} representa um conjunto possvel
de valores aleatrios, com probabilidades de ocorrncia PD = {PD1, PD2,..., PDN}, a
quantidade de informao necessria para caracterizao da varivel fica:
N
(E 4.6)
H(x2|x1)
H(x1)
H(x2)
informao total necessria para quantificar o sistema pode ser escrita como:
(E 4.7)
I ( x1 , x2 ) H ( x1 ) H ( x2 ) H ( x2 x1 )
(E 4.8)
H ( X ) ( x) log b ( x) dx
X
tambm no invariante escala, uma vez que H(cX) cH(X), onde c uma constante
(SOOFI, 1994).
Devido a estes problemas, mais comum utilizar medidas relativas de entropia.
Tais comparaes avaliam diferenas entre duas distribuies de probabilidade. Uma
srie de medidas de informao relativas entre duas distribuies de probabilidade so
propostas na literatura (KONISHI E KITAGAWA, 2008, pp 31). Dentre estas, destacase a entropia relativa ou o critrio de Kullback-Leibler, conforme descrito a seguir.
(1) ( y )
(2) ( y)
(1) ( y )
(2) ( y)
48
(E 4.9)
(1) ( y )
(2) ( y)
(1) ( y )
dy
(2) ( y )
distribuio verdadeira dos dados. Desta forma, em alguns trabalhos considera-se como
critrio de informao a soma das divergncias mtuas de probabilidade, conforme
proposto por JEFFREYS (1946):
(E 4.10)
49
(E 4.11) DKL (1) || (2) 1 (1) (2) T V (2) 1 (1) (2) log V
(2)
(1)
tr V (2) 1 V (1) N
4.4
Informao de Lindley
A informao de Lindley foi originalmente desenvolvida com base na Teoria da
(E 4.12)
U E log
(E 4.13)
U log d H
(E 4.14)
U | X * |Y * log |Y * d H |Y *
51
(E 4.15a)
Lindley U |Y U
*
(E 4.15d)
Lindley H H |Y
(E 4.16)
U E
|Y *
log
(E 4.17a)
(E 4.17b)
Lindley U |Y U
*
(E 4.17c)
Lindley |Y log
*
d
|Y *
()
(A)
Y*()
Y*()
(B)
(C)
(E 4.18)
Lindley |Y Y log
*
Y
dY
Y
|Y *
53
(yesp(xesp)), conforme ilustrado na Figura 3.5C. Agora, suponha que seja feito um
(E 4.19)
y x dy
y x
| y*
esp
esp
54
ESTATSTICO
EXPERIMENTADOR
55
56
Conjunto de experimentos
iniciais (0)
Modelos possveis
Faa o(s)
experimento(s)
Sim
Pare
No
Avalie a melhor
regio experimental
para se atingir o
objetivo especificado,
otm
Trabalho finalizado
Figura 5.1 Algoritmo do planejamento seqencial de experimentos.
As tcnicas de planejamento de experimentos se baseiam em idias
relativamente simples e intuitivas. Na traduo matemtica destas idias, na forma de
rotinas computacionais, infelizmente so perdidos potenciais usurios destas tcnicas.
Deve ser salientado que a constante interao do pesquisador com o planejamento,
atravs do uso das ferramentas de planejamento disponveis, pode reduzir
consideravelmente o esforo experimental. Alm disto, o uso destas tcnicas permite a
obteno de concluses com fundamentao estatstica e avaliaes consistentes sobre a
qualidade dos parmetros e das previses dos modelos.
Os dois principais objetivos (discriminao de modelos e estimao de
parmetros
precisos)
costumam
ser
buscados
separadamente.
Realizam-se
57
(E 5.2)
X 1
X2
X3
(E 5.3)
58
(E 5.4)
VP BT VY B V 1
59
1
1
da varincia de predio.
60
para um critrio pode ser timo tambm para um segundo critrio (ATKINSON et al.,
2007, pp 122-123). Com grande freqncia, este teorema aplicado aos critrios Dtimo e G-timo, ou seja, a otimizao do critrio D-timo tambm leva a otimizao do
critrio G-timo. O teorema foi proposto originalmente por KIEFER e WOLFOWITZ
(1960) com rigor estatstico para modelos lineares nos parmetros. Esta extenso pode
ser feita para modelos no lineares aplicando-se expanses em srie de Taylor da funo
objetivo (WHITE, 1973, BARD, 1974, pp 262-265), conforme discutido amplamente no
Captulo 3. DETTE e OBRIEN (1999) salientam que as vantagens dos critrios focados
na predio a invarincia reparametrizao dos parmetros do modelo.
O critrio da forma (E-timo) tende a minimizar a correlao entre os
parmetros; contudo, perde-se esta caracterstica se o problema contiver mais de dois
parmetros. A principal desvantagem do critrio da forma concentrar experimentos na
diminuio da incerteza de um parmetro, cujo erro pode ser difcil de ser minimizado
(PINTO et al., 1990).
FRANCESCHINI e MACCHIETTO (2008a) salientam que, em sua forma
original, o uso do critrio A-timo desencorajado por diversos autores, principalmente
para problemas que apresentam elevada correlao entre os parmetros, uma vez que
no considera os termos fora da diagonal principal. Contudo, conforme salientado por
PINTO et al. (1990), este critrio apresenta um carter flexvel, assemelhando-se ao
critrio da forma quando uma das diagonais muito superior s demais, ou ao do
volume, quando as diagonais apresentam valores prximos.
61
min VCR
min V P
max J P
equivale a minimizar a multiplicao dos valores caractersticos (i) da matriz VP. Isto equivale a
minimizar o determinante da matrz VP, que, por sua vez, equivale a maximizar o determinante da matriz
de informao de Fisher, o que est apresentado em (E 5.5):
62
(BOX e LUCAS, 1959). Ao fazer isto, contudo, o planejamento pode ser distorcido pela
ausncia destas informaes (PINTO et al., 1990).
Outros critrios foram propostos na literatura para minimizar as correlaes
existentes entre os parmetros. PRITCHARD e BACON (1978) propuseram um critrio
de minimizao da norma das correlaes entre os parmetros, de acordo com a
seguinte funo:
12
(E 5.6)
Ccorrel
NP 1 NP
ij2
2
i 1 j i 1 Np Np
i 1, Np j 1, Np j i
63
64
(E 5.8)
(E 5.9)
M 1 M
D Hunter
Y Y
i 1 j i 1
(i ) P
( j)P
(E 5.10)
i 1
j 1
j i
D Roth P (i ) 0 Y ( i ) P Y ( j ) P
0.12
Modelo1
Modelo2
E rroModelo1
E rroModelo2
0.1
0.08
0.06
0.04
0.02
0
0
0.2
0.4
0.6
0.8
1.2
x
Figura 5.3 - Ilustrao da influncia do erro de predio e erro experimental para um
problema de discriminao entre dois modelos rivais.
BOX e HILL (1967) foram os primeiros a incluir no discriminante o erro de
predio do modelo e o erro experimental, baseando-se no critrio de divergncia de
Kullback-Leibler. A idia bsica do discriminante de BOX e HILL (1967) maximizar
a divergncia entre uma distribuio de probabilidades (modelo 1) de outra distribuio
de probabilidades (modelo 2). Ou seja, buscam-se regies onde a informao perdida
ao se utilizar o modelo 1 para explicar o modelo 2 mxima, de forma a favorecer a
66
Distribuio de
probabilidade do
modelo 1
-2
Distribuio de
probabilidade do
modelo 2
y modelo 1
y modelo 2
(E 5.11)
D BoxHill
P P D || D ||
M
(i )
( j)
(i )
( j)
KL
i 1 j i 1
( j)
(i )
KL
(E 5.12)
(i )
P (i ) 0 |( i0) Z
P 0 Z
(k )
(k )
| 0
(E 5.13)
(i )
P (i ) 0 |(i0) Z
P Z
(k )
(k )
| 0
Y ( i ) P Y ( i ) P
V Y
( j ) P 1
Y
( i ) P 1
Y
(i ) P
Y (i ) P
68
(E 5.15)
J (T ) P ( i ) P
1
J
D (i ) Atk _ Cox
T
(
Np max J ) P (i ) P
J
Np
onde J(T)P e J(i)P representam a matriz de informao de Fisher, considerando que o dado
experimental em possa ser gerado com o modelo Y(T), e o termo no denominador
apenas indica o valor mximo de J(T)P/J(i)P, de forma que o resultado seja apresentado
em termos da eficincia de discriminao. Os autores interpretaram que a maximizao
de DAtkin_Cox na Equao (E 5.15) representa a discriminao de um modelo i de modelos
mais completos, contendo termos adicionais. Uma situao desejvel seria buscar uma
condio em que para qualquer modelo as eficincias sejam idnticas, o que equivale a
buscar o critrio Maximin, ou ento concentrar-se em alguns modelos especficos.
ATKINSON e FEDOROV (1975a) propuseram um discriminante para o
problema em que existem dois modelos possveis. Os autores admitiram que um dos
modelos fosse o verdadeiro. Considerando-se o modelo 1 como verdadeiro, o
discriminante dos autores consiste em encontrar a condio experimental que maximiza
a divergncia entre as respostas do modelo 1 e do modelo 2 para as condies
experimentais j realizadas e as condies experimentais planejadas. Contudo, ao
admitir o modelo 1 como verdadeiro, re-estimam-se os parmetros do modelo 2, como
forma de avaliar a flexibilidade do modelo 2 para ajustar-se a novos dados
69
(E 5.16)
Y X , Y
(1) P
(1)
(2) P
X ,
(2)
d X
(E 5.17)
Y X , Y
(1) P
(1)
(2) P
X ,
(2)
d X
(E 5.18)
(E 5.19)
Y X
Nx 1
k 1
(1) P
, (1) Y ( j ) P X k , ( j )
gerados com o modelo considerado verdadeiro e os parmetros dos demais modelos reestimados. Com isto, avalia-se a flexibilidade que os modelos podem adquirir para se
adequar a novos pontos experimentais.
PONCE DE LEON e ATKINSON (1991) estendem os conceitos do trabalho de
ATKINSON e FEDOROV (1975a) para dois modelos rivais quando se tem alguma
informao a priori da qualidade dos modelos. Sejam os parmetros do modelo 1 dados
por alguma distribuio ((1)), e os parmetros do modelo 2 dados por ((2)).
Segundo os autores, considerando o modelo 1 como verdadeiro, o discriminante poderia
ser obtido como a mdia em relao aos parmetros do modelo 1, do critrio proposto
por ATKINSON e FEDOROV (1975a), ou seja:
(E 5.20)
D1 Atk _ Ponce
D
(i )
1,2
Atk _ Fed
d (1)
(1)
(E 5.22)
y ( i ) P y ( j ) P 2
D Buzzi
M (k ) P
i 1 j i 1
M 1 v
k 1
71
Valores muito altos de F ( m) est indicam que no ocorrem apenas desvios aleatrios,
mas tambm erros de modelagem. Devido a isto, nestes casos, o valor de
Pr(2 F ( m) est ), como a frao de vezes em que seriam obtidos resultados melhores
do que aqueles encontrados.
(E 5.23)
P( m) 1 Pr 2 F ( m) est
(E 5.24)
Pr( m)
P( m )
M
(k )
k 1
73
(E 5.25)
Schwaab
i, j
(i ) ( j ) z '
r
r
y y
(i ) P
( j)P
v ( i ) P v ( j ) P
DiSchwaab
Pr(i ) Pr( j )
,j
z'
Y Y V
(i ) P
( j)P
(i , j ) P
Y
Y Y
(i ) P
( j)P
onde:
(E 5.27)
sendo VY(i , j ) P a matriz global dos erros de comparao, resultado da soma das
matrizes de covarincia de predio dos modelos ( VY(i ) P , VY( j ) P ). As matrizes de
covarincias das incertezas de predio podem ser calculadas a partir das matrizes de
covarincias das incertezas paramtricas (V(i), V(j)) e da matriz de covarincia das
incertezas experimentais (VY), segundo a seguinte equao:
(E 5.28)
VY(i ) P B ( i ) V(i ) B (i )T VY
74
(E 5.29)
,j
Y Y
(i ) P
( j)P
(E 5.32)
A integral em relao ao planejamento (X) indica apenas que o termo DKL (1) || (2)
calculado com base apenas nos experimentos j realizados e nos experimentos
planejados. Ou seja, DKL (1) || (2) calculado levando em conta apenas tais
condies experimentais.
TOMMASI (2007) estende o conceito LPEZ-FIDALGO et al. (2007) para
mltiplos modelos. Baseando-se no critrio de ATKINSON e COX (1974), os autores
admitiram um modelo global Y(T) que incorporaria todos os modelos propostos Y(i). A
tais modelos corresponderiam s densidades de distribuio de probabilidades (T) e (i),
respectivamente. Desta forma, a fim de verificar particularidades do modelo i,
TOMMASI (2007) props maximizar a divergncia de Kullback-Leibler entre o modelo
completo Y(T) e o modelo Y(i) para os experimentos j realizados e planejados. Contudo,
de forma anloga aos discriminantes de ATKINSON e colaboradores, isto deve ser feito
re-estimando os parmetros do modelo i; ou seja, a discriminao entre o modelo i e os
demais modelos poderia ser calculada como:
(E 5.33)
(E 5.34)
eff DTom P
(i )
DiTom
max DiTom
DiTom
ou eff DTom min
max DiTom
76
(E 5.35)
(E 5.36)
D12Tom _ Lop
D21Tom _ Lop
(2)
parmetros distintos. Por exemplo, y=5x+7 e y=3x+2 podem ser considerados modelos
distintos, mesmo que ambos tenham a mesma forma matemtica, j que apresentam
parmetros distintos.
O planejamento robusto trata do problema de estimao de parmetros precisos
quando na discriminao de modelos o conhecimento sobre os modelos e parmetros
bastante escasso. Necessariamente, deve-se conhecer a forma matemtica do modelo e
faixas admissveis para os parmetros, tornando possvel realizar simulaes de
respostas dos modelos.
At agora, os critrios de planejamento de experimentos para estimao de
parmetros precisos foram apresentados para melhorar a preciso dos parmetros de um
nico modelo. Contudo, em planejamentos robustos, aborda-se o problema para M
modelos. Logo, para planejamentos robustos, conveniente definir as variveis de
ganho de informao para cada possvel modelo e cada possvel planejamento. Com
isto, o clculo da matriz de informao de Fisher predita deve ser especificado para o
modelo n e o conjunto de experimentos, i; ou seja, J(n)P(,i).
Geralmente, experimentos iniciais so conduzidos, permitindo estimao dos
parmetros dos modelos. Ao invs disto, pode-se tambm admitir um chute inicial dos
parmetros para um modelo e realizar o planejamento timo para o modelo escolhido
com base nos parmetros adotados (CHERNOFF, 1953, ADEWALE e WIENS, 2009).
Outra forma de tratar o problema observ-lo sob a tica da teoria da deciso, adotando
basicamente os critrios Maximin e Bayesiano.
Conforme comentado, modelos com a mesma forma matemtica, mas com
parmetros distintos, podem ser considerados modelos diferentes. Neste sentido, os
critrios de discriminao modelos podem ser adaptados para o planejamento robusto,
quando os parmetros so conhecidos com grande impreciso. A literatura de fato, no
faz distino entre estes critrios (CHERNOFF, 1972 especialmente pp 72-75, SOOFI,
1994). Os critrios Bayesiano e Maximin podem ser utilizados para a obteno de
planejamentos robustos (DETTE et al., 2007).
Alguns autores propuseram que, para para diferentes modelos {Y(1),Y(2),...,Y(M)},
o plano experimental timo otm deveria se obtido maximizando-se o seguinte cririo
Bayesiano (LAUTER , 1974, ATKINSON e DONEV, 1972, pp 253, OBRIEN e
RAWLINGS, 1996):
78
(E 5.37)
w( n )
log J ( n ) P ,
(n)
Np
(E 5.38)
v(yn) P dX
L
onde vy(n)P a varincia de predio feita com o modelo n para a varivel de resposta y.
Este ltimo critrio foca o desempenho da predio, uma vez que se calcula a integral
da varincia de predio ao longo de uma faixa experimental. O termo L modifica o
critrio para cada modelo n: por exemplo, L=1 representa o critrio I-timo; L=+
representa o critrio D/G-timo. Novamente, diferentes modelos podem ser entendidos
como o mesmo modelo com diferentes valores dos parmetros.
ASPREY e MACCHIETTO (2002) empregaram os critrios Bayesiano e
Maximin para experimentos dinmicos. O critrio Bayesiano, semelhante a um dos
critrios propostos por LAUTER (1974), e consiste em admitir uma probabilidade dos
parmetros () e obtm o planejamento timo da seguinte forma:
(E 5.39)
(E 5.40)
A falha principal nos critrios avaliados segundo valor absoluto dos critrios de
informao de acordo com as Equaes (E 5.39) e (E 5.40), que parmetros distintos
79
so avaliados com precises distintas. Para contornar este problema, diversos autores
utilizaram eficincias, ao invs do valor absoluto do critrio de informao.
Considerando o critrio do volume, a eficincia de estimao de um plano pode ser
definida, dividindo-se o determinante de JP aps a execuo do plano otm pelo maior
valor possvel do determinante JP:
(E 5.41)
J ( n ) P ,
(n)
eff E ,
max J ( n ) P ,
Np ( n )
(E 5.42) otm
M
J (n) P
D BoxHill
( n)
0
arg max w
1 w P
max D BoxHill
max J ( n ) P
n 1
80
M 1
(E 5.43)
(E 5.44)
(E 5.45)
n 1
P(n)
log J ( n ) P ,
(n)
Np
(E 5.46)
otm
1 w P ( n )
log J (T ) P , (T )
Np Np ( n )
arg max
M
w P ( n ) 1 w P ( n )
log J ( n ) P ,
(n)
n 1 Np ( n )
Np
onde J(T)P a matriz posterior de informao de Fisher para o modelo completo Y(T).
COOK e WONG (1994) consideraram como funes-objetivos diferentes
critrios de estimao de parmetros precisos. Os autores propuseram a caracterizao
dos planejamentos timos quanto s eficincias em relao aos critrios de estimao.
Segundo os autores, um planejamento timo deveria ser escolhido de forma a
maximizar um critrio, desde que outros critrios resultassem em um valor mnimo de
informao. Por exemplo, maximizar a eficincia segundo o critrio do volume, desde
que a eficincia do critrio do trao fosse maior ou igual a um valor limite.
(E 5.47)
st. tr J P c
82
(E 5.48)
w
arg max eff D D eff E( n ) Np( n )
n 1
(n)
(E 5.49)
otm
(E 5.50)
n 1
wE( n )
(n) P
log
J
Np ( n )
84
PARTE 3 RESULTADOS
85
6.1 Objetivos
Os objetivos principais deste captulo so:
6.2 Introduo
A contribuio contida neste captulo consiste na aplicao do conceito de
propagao de erros para alguns sistemas de Engenharia Qumica, demonstrando como
86
Por sua vez, unidades industriais so compostas por de diversos blocos para o
processamento de uma determinada carga. Cada um destes blocos, bem como as
conexes que os unem, contribuem com uma parcela do erro experimental. As parcelas
de contribuio so peculiares a cada caso. Os conceitos de propagao de erros podem
ser aplicados para determinar a incerteza experimental ao longo de faixas de interesse.
A propagao de erros um tema bem estabelecido na literatura tcnica. A
modelagem da disperso (varincia) juntamente com os valores mdios das variveis
um assunto bem abordado na literatura, podendo ser utilizada para avaliao da
adequabilidade dos modelos (COOK e WEISBERG, 1982). A literatura aborda
principalmente a classe de modelos lineares nos parmetros, para os quais
planejamentos timos podem ser obtidos (ATKINSON e COOK, 1995, PINTO e
PONCE DE LEON, 2006b, BIASOLI, 2005).
Neste captulo, os conceitos de propagao de erros so apresentados no mbito
da Engenharia Qumica (modelos no lineares). Basicamente, a propagao de erros
aleatrios pode ser avaliada para problemas prticos de Engenharia Qumica de forma
simples. Sejam as variveis X sujeitas a oscilaes aleatrias, cuja matriz de covarincia
VX. Se Y e X esto correlacionadas por um modelo na forma Y(X), a varincia das
variveis Y(X), dada por VY, pode ser escrita como (GRABE, 2010, pp 57,58):
(E 6.1)
Y
VY
X
VX
87
Seja um sistema qualquer, constitudo por blocos em srie e/ou paralelo com
correntes materiais e/ou energticas com ou sem retroalimentao. Cada bloco i possui
uma determinada varincia VZ(i) associada s variveis experimentais Z(i).
Bloco 1
VZ(1)
Bloco 3
VZ(3)
Bloco 4
VZ(4)
Bloco 2
VZ(2)
Bloco 5
VZ(5)
88
(E 6.2)
Func ( G ) , Z ( G ) 0
O modelo do processo pode ser representado pelos modelos dos blocos e pelas
equaes de balanos que relacionam as variveis de sada de blocos com as variveis
de entrada de outros blocos. O processo pode correlacionar as variveis de diferentes
blocos, resultando em uma matriz de covarincia posterior das incertezas
(E 6.3)
Z ( G )
Z (G )
VZP( G ) ( G ) VZ ( G ) (G )
Z
Z
Z (G )
onde a matriz (G ) representa a derivada de todas variveis Z(G) em relao cada
Z
uma das variveis Z(G), calculada de acordo com o modelo do processo na Equao (E
6.2).
A formulao acima pode ser simplificada se o sistema no contiver correntes de
retro-alimentao. Em no havendo retro-alimentao, variveis de blocos a montante
(antes) no so influenciadas por variveis de blocos a jusante (depois). Alm do mais,
segundo os modelos dos blocos, variveis de entrada podem no ser influenciadas por
variveis de sada. Desta forma, uma srie de derivadas na Equao (E 6.3) so nulas.
O problema pode tambm ser resolvido pelo mtodo estocstico. Segundo este
mtodo, o modelo deveria ser resolvido um grande nmero de vezes. Contudo, as
variveis de sada dos modelos de cada bloco seriam acrescidas de um erro
caracterstico da variabilidade de cada bloco. Este erro deveria ser gerado
aleatoriamente, dada a distribuio de probabilidades associada variabilidade de cada
bloco.
(E 6.4)
Func ( G ) , Z ( G ) Z ( G ) 0
A variabilidade de cada varivel de sada em cada bloco i, dada por Z(G), deve
ser gerada aleatoriamente a partir da distribuio de probabilidades da incerteza das
variveis de sada de cada bloco.
89
Faa de 1 at Muitos
Informe DesvPadMax
Figura 6.2 Algoritmo para determinao da incerteza, quando os parmetros so
conhecidos em faixas.
90
Cromatgrafo
Bloco 1
Bloco 2
Bloco 3
Na realidade, converso no uma varivel medida, mas sim concentrao de reagente ou rea
92
X R 1 exp
vz
(E 6.5)
k0 e
(E 6.6)
RT
A converso calculada com base nas reas cromatogrficas pode ser obtida como
a converso XR, acrescida de uma incerteza cromatogrfica :
X R1 X R
(E 6.7)
(E 6.8) VZ ( G )
vvz
0
0
0
0
vW
0
0
vT
0
0
0
0
0
v X1
(E 6.9)
VZP( G )
vz
vz
W
vz
vz
X R
vz
X R1
vz
vz
W
vz
T
vz
X R
W
W
W
T
W
X R
T
W
T
T
T
X R
X R
W
X R
T
X R
X R
X R1
W
X R1
T
X R
X R
vz
X R1
W
vvz
X R1
0
T
0
X R1
0
X R
0
X R1
X R1
X R1
0
vW
0
0
0
0
vT
0
0
0
0
0
vz
vz
W
0
vz
0
T
0
vz
0
X R
v X1
vz
X R1
vz
vz
W
vz
T
vz
X R
W
W
W
T
W
X R
T
W
T
T
T
X R
X R
W
X R
T
X R
X R
X R1
W
X R1
T
X R
X R
vz
X R1
W
X R1
T
X R1
X R
X R1
X R1
X R1
93
(E 6.10)
VZP( G )
0
0
X
R
vz
X
R
vz
1
0
0
1
X R
W
X R 2
W
X R
T
X R 2
T
0 0
0 0 vvz
0 0 0
0
1 0 0
0
0 1
vW
0
0
vT
0
0
1
0 0
0 0
0 X
R
0 vz
v X1 X R
vz
1
0
0
1
X R
W
X R 2
W
X R
T
X R 2
T
0 0
0 0
0 0
1 0
0 1
(E 6.11)
(E 6.12)
X R
v vz
v X R1
vz
P
X
P
X1
vvz
VX 0
0
X R
W
X R
T
X R1
W
X R1
T
X R1
X R
0
vW
0
0
vT
vvz
X R
0
X R1
0
1 0
0
0
X R
0
vz
0
X R1
0
vz
0 v X1
vW
0
0
0
vT
0
0
0
0
X R
W
X R
T
X R1
W
X R1
T
X R1
X R
X R
X R1
onde vXP e v XP1 representam as varincias das converses obtidas ao final do reator e
calculada com as reas cromatogrficas. Para o experimentador, o interesse obter a
converso XR1, cuja varincia poderia se escrita como:
2
(E 6.13)
X
X
X
v R1 vvz R1 vW R1 vT vX1
vz
W
T
P
X1
94
X R1
W E W E
E
exp k0 e RT k0 e RT
T
v
v R T 2
(E 6.14a)
ln 1 X R
1 X R
X R1
W E W 1
E
exp k0 e RT k0 e RT
W
v
v W
(E 6.14b)
ln 1 X R
1 X R
X R1
W E W 1
E
exp k0 e RT k0 e RT
vz
vz vz
vz
(E 6.14c)
ln 1 X R
1 X R
(E 6.15) v 1 X R ln 1 X R
P
X1
2
1
1
E
2 vvz 2 vW
v
v X1
T
vz
W
R T 2
(E 6.16)
v XP1 C 1 X R1 ln 1 X R1 v X1
2
(E 6.17)
(E 6.18)
XP C 1 X R1 ln 1 X R1 v X
2
XP
C 1 X R ln 1 X R1 v X1
XR
XR
A Equao (E 6.17) havia sido proposta por GUTIERREZ et al. (2004) para
descrever o comportamento de incertezas em sistemas biolgicos, mas no havia sido
estendida para sistemas catalticos, como apresentado nesta tese. A Figura 6.4 apresenta
o comportamento do erro em funo da converso para um valor arbitrrio da constante
C e varincia analtica vX1 nula, segundo descritos pelas Equaes (E 6.16), (E 6.17) e
(E 6.18), respectivamente.
95
(B)
P
vX1
X1
(A)
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
Converso
0.4
0.6
0.8
1.0
Converso
X1/XR
(C)
0.0
0.2
0.4
0.6
0.8
1.0
Converso
Figura 6.4 - Comportamento do erro da converso como funo da converso, avaliando
a: (A) varincia, (B) desvio padro, e (C) erro relativo (desvio-padro dividido pela
converso) ( v X1 =0).
A Figura 6.4 demonstra um comportamento interessante para o erro
experimental no caso ilustrado. Segundo a Equao (E 6.16), o mximo valor do erro
ocorre para converses de XR=0,63, valor obtido analiticamente, derivando-se a
Equao (E 6.16) e igualando a zero. Para valores baixos e muito elevados de
converso, o erro associado pequeno. Os pontos de inflexo da Figura 6.4A (varincia
da converso) podem ser obtidos igualando-se a derivada segunda da Equao (E 6.16)
a zero. Os pontos em que a curva muda sua concavidade so aproximadamente iguais a:
XR=0,31 e XR=0,93.
Curvas similares foram apresentadas por GUTIERREZ et al. (2004) para
sistemas biolgicos, cuja deduo foi feita pela anlise de sensibilidade, avaliando a
derivada das variveis de sada em relao aos parmetros. Os autores indicaram o
ponto de XR=0,63 como ponto mximo de incerteza paramtrica para a converso de
substrato em sistemas biolgicos.
O termo C estritamente constante, segundo a Equao (E 6.16), se as razes
vzP/vz, WP/W e TP/T2 forem constantes. Esta uma afirmao plausvel para certos
96
casos. Por exemplo, o erro da vazo volumtrica v costuma ser proporcional ao valor
da vazo volumtrica vz em fluxmetros de massa. Por outro lado, em certos casos, a
impreciso na massa de catalisador costuma estar associada impreciso de balanas
analticas ou semi-analticas.
Deve-se salientar que o prprio parmetro C pode no ser constante ao longo da
faixa experimental empregada. Com base no comportamento do erro deduzido nesta
seo, pode-se fazer a anlise de condies timas de experimentao para sistemas
simples, de forma a obter parmetros precisos.
6.5.2 Avaliando condies timas de experimentao
(E 6.19)
X R1
W W 1
exp
v0
vz
ln 1 X
1 X R
(E 6.20)
B 1 X R ln 1 X R
(E 6.21)
1
J P
v
P
1 X ln 1 X
R
vX 1
97
(E 6.22)
1
1
1 X R ln 1 X R
P
v
(E 6.23)
1 X R ln 1 X R
2
P
v
C 1 X R ln 1 X R v X 1
(E 6.24)
1
1
P
v
C 2
98
(E 6.25)
(E 6.26)
N Exp
1
N Exp
0,1 0,1
2
N Exp
vvz vW
vz W
0,1
2
N Exp
(E 6.27)
max
2
v P
max vz
99
(E 6.28)
2
v
1
vX 1
1 X R ln 1 X R
v X 1 a X R1 b
a=0.1
b= 0.01
a=0.0
b= 0.01
a=0.1
b= 0.1
0.0
0.2
0.4
0.6
0.8
1.0
Converso
Figura 6.5 Informao normalizada do parmetro em funo da converso.
A condio tima pode variar desde converses baixas (condio de reator
diferencial) at condies de elevada converso (condio de reator integral). Contudo,
isto parece ser peculiar do aparato experimental e do comportamento das incertezas das
variveis de projeto e variveis de resposta.
100
Este exemplo considera dois reatores CSTR em srie, processando uma reao
em fase lquida de primeira ordem (rA=-CA). Ao sair do primeiro reator, a corrente
diluda com um inerte antes da entrada do segundo reator. O volume dos reatores fixo,
podendo ocorrer oscilaes nas vazes volumtricas de entrada nos reatores em funo
do bombeamento dos lquidos.
Os reservatrios no introduzem oscilaes nem equaes de balano, portanto,
no sendo considerados na avaliao de propagao de erros. As bombas levam a
oscilaes das vazes volumtricas, que podem propagar oscilaes nas concentraes
da espcie A. O nmero total de variveis corresponde s variveis de sada das bombas
e variveis de entrada e sada dos reatores, resultando em 7 variveis totais do processo.
Reservatrio
de inerte
Bomba
vz2
Bomba
C1
vz1
Reservatrio
Reagente +
Inerte
CSTR 1
C2
vz1
C3
vz3
CSTR 2
C4
vz3
(E 6.31)
C3 C2
(E 6.32)
C2
vz1
vz2 vz1
C1
1 V
vz1
101
(E 6.33)
C4
C3
1 V
vz
3
(E 6.34)
(E 6.35)
vz2 1
0
0
VZ 0
0
0
vz2
0
0
0
0
0
0 0 0 0 0 vz1
0 0 0 0 0 vz2
0 0 0 0 0 vz3
0 0 0 0 0 C1
0 0 0 0 0 C2
0 0 0 0 0 C3
0 0 0 0 0 C4
Z (G )
A matriz de derivadas (G ) poderia ser escrita como:
Z
vz1
vz1 vz
1
Z (G )
vz2
vz2
Z (G ) vz1
vz3
vz3
Z (G ) vz1
(E 6.36) Z (G ) C C
1
1
(G ) (G ) vz
1
C2 C
(G ) 2
Z vz1
C3 C
(G ) 3
Z vz1
C4 C
(G ) 4
Z
vz1
vz1
vz2
vz1
vz3
vz1
C1
vz1
C2
vz1
C3
vz2
vz2
vz2
vz3
vz2
C1
vz2
C2
vz2
C3
vz3
vz2
vz3
vz3
vz3
C1
vz3
C2
vz3
C3
C1
vz2
C1
vz3
C1
C1
C1
C2
C1
C3
C2
vz2
C2
vz3
C2
C1
C2
C2
C2
C3
C3
vz2
C3
vz3
C3
C1
C3
C2
C3
C3
C4
vz2
C4
vz3
C4
C1
C4
C2
C4
C3
vz1
C4
vz2
C4
vz3
C4
C1
C4
C2
C4
C3
C4
C4
C4
102
(E 6.37)
zi
zk zi
zk
vvz (1)
vvz( 2)
viP,k
(1)
(1)
(2)
(2)
sai
sai
vzsai
vzsai vzsai
vzsai
P
zi
zi 100
vz1
1000
49,7
50,0
4.97
vz2
300
14,8
15,0
4.95
vz3
1300
51,8
52,0
3.98
C1
1,00
0,00
0,00
0.00
C2
0,80
8,01x10-3
8,00x10-3
1.00
C3
0,61
1,50 x10-2
1,50x10-2
2.44
C4
0,51
1,51 x10-2
1,51 x10-2
2.93
103
C D
A B
E
A
F G
B C
k1 e
E1
C A CB
DEN
RT
(E 6.38)
r1
(E 6.39)
k e RT C A
r2 2
DEN
E2
k3 e
E3
CB CC
DEN
RT
(E 6.40)
r3
(E 6.41)
DEN 1 K A C A K B CB
Reator
Cromatgrafo
Inerte
104
Tabela 6.2 Faixas das variveis e desvios padres correspondentes no Exemplo 6.2.
Varivel
Faixa
Desvio-Padro
Temperatura (K)
573-723
T 4
Vazo de A (mL/min)
25-100
vz 0.1 vz
Vazo de B (mL/min)
25-100
vz 0.1 vz
Vazo de C (mL/min)
25-100
vz 0.1 vz
0,02-0,50
W 104
Valor
Unidades
k1
2.5 x 104
mL2.mol-1.gcat-1.s-1
E1
7.0 x 104
J.mol-1
k2
1.0 x 106
mL.gcat-1.s-1
E2
1.0 x 105
J.mol-1
k3
1.0 x 109
mL2.mol-1.gcat-1.s-1
E3
1.3 x 105
J.mol-1
KA
1.5 x 10-1
mL.mol-1
KB
2.5 x 104
mL.mol-1
105
0.10
0.10
Converso de A
0.08
0.08
0.06
0.06
0.04
0.04
0.02
0.02
0.020
Converso de B
0.015
0.010
0.00
0.0
0.2
0.4
0.6
0.8
1.0
0.005
0.00
0.0
0.2
0.4
XB
Desvio Padro
XA
0.8
1.0
0.000
0.05
0.016
0.6
0.04
0.02
0.00
0.05
0.10
0.15
0.20
0.05
0.10
0.15
0.20
yC
0.03
0.01
0.02
0.008
0.01
0.000
0.0
0.02
0.1
yD
0.2
0.3
0.00
0.0
0.2
0.4
0.6
0.8
yE
0.00
0.00
yF
0.01
0.00
0.00
0.05
0.10
0.15
0.20
yG
Figura 6.8 Desvios padres das converses dos reagentes (A e B) e fraes molares
dos produtos (C, D, E, F e G) em funo das variveis como determinadas pelo mtodo
estocstico.
Conforme pode ser observado na Figura 6.8, todos os desvios padres das
espcies que so puramente geradas ou consumidas aparentemente apresentam mximos
em funo dos valores das variveis. Uma disperso maior parece estar associada
espcie C, gerada na reao 1 e consumida na reao 3. Pode-se observar que os desvios
padres das converses dos reagentes A e B so muito bem descritos pela expresso
deduzida para cinticas de primeira ordem.
A gama de condies experimentais bastante variada. As curvas no so muito
bem definidas porque as condies de operao afetam os erros experimentais de forma
no linear. No entanto, em todos os casos possvel definir uma envoltria com os
mximos erros esperados. Em muitos casos, a envoltria apresenta a mesma forma
indicada pela Equao (E 6.17) e ilustrada na Figura 6.4B.
106
Os erros relativos esto apresentados na Figura 6.9. Pode-se observar que o erro
relativo diminui; medida que o valor da varivel aumenta, em todos os casos.
0.20
0.20
Converso de A
0.15
0.15
0.8
0.4
0.05
0.05
1.0
0.6
0.10
0.10
0.00
0.0
Converso de B
0.2
0.4
XA
0.6
0.8
1.0
0.00
0.0
0.2
0.2
0.4
XB
0.6
0.8
1.0
0.0
0.0
0.1
0.4
0.24
0.2
yC
0.2
0.16
0.1
0.08
0.00
0.0
0.1
0.6
0.4
yD
0.2
0.3
0.0
0.2
0.0
0.3
0.6
yE
0.0
0.0
0.1
0.2
yF
0.2
0.0
0.0
0.1
0.2
yG
Figura 6.9 - Desvios padres relativos das converses dos reagentes (A e B) e fraes
molares dos produtos (C, D, E, F e G) em funo das variveis determinada pelo
mtodo estocstico.
Para determinadas condies, os erros de medio das diferentes variveis so
naturalmente correlacionados pelo processo. Para ilustrar, a Figura 6.10 apresenta as
correlaes entre os erros de medio da converso de A e das demais variveis como
funo do valor de da converso de A, para as diversas simulaes realizadas nas 2430
condies experimentais.
Como possvel observar na Figura 6.10, as correlaes podem ser muito
pronunciadas, o que permite questionar se a hiptese dos erros independentes
realmente boa.
A converso indica o quanto uma espcie reage. A correlao entre os erros de
medida das converses de A e B na maior parte dos casos positiva; contudo,
moderada. A correlao positiva entre os reagentes sugere que oscilaes, tais como
oscilaes na massa de catalisador e temperatura de reao, ocorrem no sentido de
107
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
C
A
X _y
0.2
0.4
0.6
0.8
1.0
X _y
0.0
0.0
0.2
0.4
0.6
0.8
1.0
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
1.0
0.8
0.6
F
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
X _y
X _y
X _y
X _X
0.4
0.2
0.0
-0.2
-0.4
0.0
0.2
0.4
0.6
0.8
1.0
-0.6
Converso de A
Figura 6.10 Distribuio de freqncia das correlaes entre as medidas de XA e as
demais variveis.
J a correlao existente entre a medida de converso da espcie A e a frao
molar de C prxima a +1 em condies de baixa converso de A, e prxima a -1 em
condies de alta converso da espcie A. A correlao fortemente positiva indica que
oscilaes que levem a um maior consumo da espcie A favorecem a formao da
espcie C, o que deve ocorrer quando oscilaes na taxa de reao 1 forem
significativas sobre a distribuio de produtos como sugere o mecanismo de reao.
Contudo, a correlao entre os erros das medidas de XA e yC se torna negativa em elevas
converses de A, quando oscilaes na taxa de reao R1 no modificam
significativamente a distribuio de produtos. Desta forma, oscilaes que tendam a
levar a uma menor converso de A (A no reage) tambm favorecem uma menor
quantidade de C, que reagente na reao R3.
108
(E 6.42)
dc t
dt
c t 1
s (t )
2 s (t )
109
(E 6.43)
s (t ) s (0)
c t c 0
3
mg
0, 4 2
0, 6
L
(E 6.44) 0, 2 1 h 1 0,3
(E 6.45)
0
c
c 0
0, 05 ,
s 0
s 0
0, 05 ,
t
c
c t
0, 03 ,
st
s t
0, 03
110
(E 6.46)
0, 03 ,
0, 03
1
2
1
c c d
s s d
111
(E 6.48)
c ,max max c
s ,max max s
112
(A)
0.30
(B)
1.0
0.25
0.8
s(t)
c(t)
0.20
0.15
0.4
0.10
0.2
0.05
0.00
0.6
0.0
10
15
20
25
30
10
15
(C)
0.016
20
25
30
tempo (h)
tempo (h)
0.06
(D)
s(t) (mg.L-1)
c(t) (mg.L-1)
0.04
0.008
0.02
0.004
0.000
10
15
20
25
0.00
10
tempo (h)
15
20
25
30
tempo (h)
0.075
0.08
c(t) / c(t)
(E)
(F)
0.07
Desvio padro
relativo mdio de s
0.06
s(t) / s(t)
0.050
0.05
0.04
0.025
0.03
0.02
0.000
10
15
20
25
tempo (h)
30
0.01
10
15
20
25
30
tempo (h)
Figura 6.11 (A,B) Valor mdio; e (C,D) desvio padro; e (E,F) desvio padro relativo
para a concentrao celular c(t) e de substrato s(t) em funo do tempo.
Fim do Exemplo 6.3
113
fato,
muito
provavelmente
diversas
medidas
so
naturalmente
115
7 PLANEJAMENTO INICIAL
RESUMO
Este captulo apresenta uma discusso sobre um tema abordado h certo tempo
na literatura referente ao planejamento inicial de experimentos, quando apenas faixas
possveis para os parmetros esto disponveis para avaliao de planejamentos
timos. Rotinas em linguagem Fortran com busca em malha para avaliao de
condies timas foram desenvolvidas. Contudo, o problema apresenta elevada
complexidade de soluo numrica para problemas de grande porte, o que leva a uma
exploso combinatorial pela busca em malha. Neste caso, algoritmos de otimizao
deveriam ser empregados para obteno de condies timas. No entanto, tais rotinas
deveriam ser adaptadas, uma vez que o problema de otimizao no trivial. Uma
conciliao simples entre os critrios apresentados na literatura proposta. Trs
exemplos de planejamento inicial timo so apresentados para ilustrar os
procedimentos.
7.1 Objetivos
Os principais objetivos abordados deste captulo so:
de
parmetros
sobre
planejamento
inicial
de
experimentos;
116
7.2 Introduo
Os critrios de planejamento de experimentos procuram melhorar o valor dos
parmetros conhecidos com alguma preciso. No entanto, ao iniciar um planejamento
de experimentos, muitas vezes no se conhece boas estimativas iniciais para os
parmetros, mas apenas faixas admissveis dos parmetros, ou mais comumente das
variveis de sada do modelo.
Seja E(,) uma funo de informao referente estimao precisa de
parmetros ao se fazer um conjunto de experimentos . O termo E(,) pode
representar qualquer um dos critrios de informao apresentados na Seo 5.3 (A, D,
E-timo, G, I-timo, entre outros). Uma normalizao do critrio pode ser tomada como
o valor do critrio dividido pelo valor mximo que o critrio pode atingir, na forma:
(E 7.1)
Enorm ,
E ,
max E ,
Por exemplo, seja um modelo y=e-.x. Admite-se que a um parmetro e varincia experimental
vy=1. A condio de timo x=1/. Ao considerar como possvel valor do parmetro =1 e realizar um
experimento na condio de timo x=1, o erro paramtrico fica igual a =e-1/ . Por outro lado, ao
considerar como possvel valor do parmetro =2 e realizar um experimento na condio de timo x=1/2,
o erro paramtrico fica igual a =0,5e-1. Ou seja, em valores numricos o parmetro =1 pode ser
estimado com muito mais preciso do que o parmetro =2. Contudo, na realidade, o parmetro assume
apenas um nico valor desconhecido.
117
J P ,
eff ,
max J P ,
(E 7.2)
Np
O termo 1/Np fornece uma normalizao, uma vez que o determinante uma
multiplicao dos valores das incertezas paramtricas (ATKINSON et al., 2007, pp
368).
Vale ressaltar, contudo, que o volume da regio de confiana uma medida
adequada de informao para avaliao da incerteza paramtrica como descrito no
Captulo 10. Desta forma, a eficincia de estimao de um parmetro com um
conjunto de experimentos ; poderia ser escrita como o volume da regio de confiana
mnimo dividido pelo volume da regio de confiana de um planejamento , ou seja,
VCRmin()/VCR(,), onde VCR representa o volume da regio de confiana. Logo, em
termos
da
matriz
de
informao
de
Fisher,
isto
seria
dado
por
118
Possveis
regies do
alvo
imaginadas
pelo
atirador
Figura 7.1 Ilustrao de um atirador que deve acertar um alvo desconhecido com
alguns tiros (analogia com o planejamento de experimentos inicial).
Duas formas principais so aceitas para a obteno de planejamentos timos
focados na estimao de parmetros precisos: o critrio Bayesiano e o critrio Maximin
(ATKINSON et al., 2007, pp 258, DETTE et al.,. 2006, 2008). conveniente definir a
eficincia mdia effMedia() e a eficincia mnima de estimao. Considerando o critrio
do volume, para um planejamento qualquer , tais eficincias so dadas respectivamente
por:
(E 7.3)
J ,
eff Media
J max
(E 7.4)
J ,
eff Min min
J max
Np
Np
119
(E 7.6)
Este segundo caso busca o plano timo que garanta um bom valor mnimo do
critrio de informao no importa qual seja o valor do parmetro.
Conforme comentado por ASPREY e MACCHIETTO (2002), o critrio
Bayesiano adequado se os valores mdios so prximos aos valores verdadeiros dos
parmetros, mas perde sua eficincia se os valores mdios da distribuio paramtrica
forem distintos dos valores verdadeiros dos parmetros. Contudo, uma caracterstica
aparente surge ao se observar o critrio Bayesiano para planejamentos iniciais. Esta
incoerncia fica evidente ao se observar modelos com um nico parmetro, ={} e
uma nica varivel de resposta Z={y}. Neste caso, a informao total sobre um
parmetro resultado da soma das informaes de diversos experimentos da seguinte
forma:
yi 2
2
eff Media , w
x
yi
i
i
x1 , x2 ,...
(E 7.7)
Se
uma
y
w i
condio
2
nica
xotm
maximiza
informao
experimento para qualquer nmero de experimentos que se deseja, ou seja, otm ={xotm,
xotm, ...}. Este argumento parece simples e irrefutvel. A nica possibilidade de ter mais
y
de um ponto timo se o mximo w i
y2 xi d for obtido de
i
forma idntica para mais de um ponto x. Contudo, neste caso, tanto faz repetir os
experimentos em um nico ponto que maximiza o critrio ou dividir os experimentos
entre os pontos que maximizam o critrio (HAINES, 1995). CHALONER e LARNTZ
120
(E 7.8)
J , Np
J max d
E , In
Bayes
eff Media otm , Bayes
E , In
onde Bayes
representa o valor da eficincia mdia segundo um plano dividida pela
(E 7.9)
Np
J
,
min
J max ,
E , In
MaxMin
eff Min otm , MaxMin
E , In
O termo Max
min representa a eficincia de um planejamento para o pior
conjunto de parmetros dividido pela maior valor da menor eficincia segundo todos os
planejamentos.
Estabelecendo
estas
funes
como
dois
limites,
podem-se
escolher
121
critrio Maximin adotando-se uma ponderao w entre estas eficincias, que pode ser
escrita como:
(E 7.10a)
E , In
E , In
E , In w Bayes
1 w MaxMin
(E 7.10b)
representam normalizaes
das eficincias de
estimao
mdia
mnima.
Figura 7.2 ilustra frentes de Pareto cncava e convexa e a escolha de pontos para uma
ponderao w=0,5.
122
E , In
Bayes
(A)
E , In
Bayes
(B)
w=0,5
w=0,5
Ponto
timo
Pontos
timos
1
E , In
Bayes
w=0,5
E , In
MaxMin
E , In
1 MaxMin
E , In
Bayes
w=0,5
Ponto
timo
Ponto
timo
(C)
(D)
E , In
1 MaxMin
E , In
1 MaxMin
Figura 7.2- Ilustrao de frentes de Pareto onde o critrio: (A) no coincide com
Bayesiano ou Maximin; e (B) coincide com Bayesiano ou Maximin ; (C) coincide com
Bayesiano; (D) coincide com Maximin.
As frentes de Pareto apresentadas restringem-se a duas funes, as eficincias
dos critrios Maximin e Bayesiano, independente da complexidade do problema. Desta
forma, possvel montar a frente de Pareto, permitindo uma avaliao visual, e avaliar a
eficincia relativa dos critrios para a escolha do prximo ponto.
Outro dado que pode ser obtido a varincia paramtrica esperada, tornando
possvel calcular o erro relativo esperado para cada parmetro ao se realizar o
planejamento inicial. Isto pode ser feito invertendo a matriz de informao de Fisher
J(,) para obter a matriz de covarincia paramtrica V, onde representa o conjunto
de parmetros do modelo ={1, 2,..., Np}. Logo, o erro relativo de cada parmetro j
pode ser dado pela raiz quadrada da diagonal da matriz V dividida pelo valor do
parmetro j.
123
124
E , In
= effMin(i)/effMaxMin
MaxMin
E , In
E , In
E , In = w Bayes
+(1-w) MaxMin
E , In
Se ( E , In > otm
) Ento
E , In
otm
= E , In
otm=i
Fim se
Fim faa
Figura 7.3 Algoritmo para determinao do planejamento timo.
Para o clculo da eficincia mdia, necessrio realizar uma integral mltipla no
espao dos parmetros. No algoritmo apresentado na Figura 7.3, esta etapa corresponde
ao clculo k 1 k eff k , V par , k . Em todos os exemplos apresentados nesta
N
(E 7.11)
eff Media
1
V par
eff , V
i 1
par , k
7.5 Exemplos
Trs exemplos sero apresentados para ilustrar a escolha de planos iniciais. O
primeiro exemplo um exemplo simples com um modelo exponencial contendo uma
nica varivel de sada e um nico parmetro. O segundo exemplo apresenta modelos
exponenciais e uma comparao com resultados da literatura. O terceiro exemplo um
exemplo mais complexo, com equaes diferenciais para a cintica de Monod.
Exemplo 7.1 - Modelo exponencial simples
Seja o modelo exponencial y=e-x, cujo parmetro pode assumir quatro valores
={1,2,3,4}, todos igualmente equiprovveis. O erro experimental da varivel de
resposta constante igual a vy=0,01.
Neste exemplo, admite-se que o pesquisador acredite que o parmetro possa
assumir quatro valores possveis, e igualmente provveis, ou seja, ={1,2, 3, 4}. Ao
se fazer trs experimentos segundo um plano ={x1,x2,x3}, qual o planejamento timo
para a estimao precisa do parmetro ?
A soluo clssica de estimao precisa de dada por:
(E 7.12)
xotm
126
(E 7.13)
1 1
e
J max
vy
(E 7.14)
J ,
J max
x e
i 1
xi
1 1
i 1
3
(E 7.15)
x e x ,
eff 1 , i
2
1
i 1 3 1 e
3
eff 3 ,
i 1
xi e3 x
i
3 e 1
3
xi e2 x
eff 2 ,
i 1
3 e 1
2
, eff 4 ,
i 1
xi e4 x
i
3 e 1
4
(E 7.16)
eff Media
1 4
eff k ,
4 k 1
Pode ser observado que o nmero de funes objetivos reduzido a duas se for
considerado apenas o critrio Bayesiano e o critrio Maximin. A informao
127
(E 7.17)
E , In
Bayes
eff Media
(E 7.18)
(E 7.19)
E , In
MaxMin
eff Min
diversos pontos: qualquer ponto dentro da frente de Pareto uma soluo tima do
problema. O problema foi resolvido com o algoritmo implementado em linguagem
Fortran. Os valores de x foram tomados entre x=(0,1), com divises em 100 pontos. As
eficincias mdias e a eficincia mnima para cada planejamento experimental esto
apresentadas na Figura 7.4A. A normalizao segundo o critrio Bayesiano e Maximin
para os pontos dentro da frente de Pareto esto apresentadas na Figura 7.4B (o total de
planos experimentais analisados foi de 171.700).
Um ponto timo pode ser escolhido, segundo a Equao (E 7.10), adotando-se
(E 7.20)
E , In
E , In
otm arg max 0,5 Bayes
0,5 MaxMin
128
Ponto timo
escolhido
(B)
E,In
Bayes()
1.0
tg = -1
0.9
0.8
0.7
0.7
0.8
0.9
1.0
E,In
MaxMin()
Figura 7.4 (A) Eficincias mdia mnima de estimao para todos os planejamentos
analisados (em destaque a frente de Pareto); (B) eficincias segundo o critrio
Bayesiano e Maximin para a frente de Pareto (ponto timo escolhido para w=0,5).
As eficincias de informao para cada um dos critrios esto apresentadas na
Tabela 7.1.
Tabela 7.1 Plano experimental timo, valor da eficincia mdia e da eficincia
mnima segundo cada critrio
Critrios
Plano experimental
x1
x2
x3
effMedia(,)
effMin(,)
w = 0,5
0,4509
0,4651
0,4651
0,7835
0,6257
Bayesiano
0,3743
0,3743
0,3743
0,8079
0,4897
Maximin
0,4509
0,4651
0,4651
0,7835
0,6257
129
) de
cada parmetro para o plano experimental timo segundo este critrio esto
apresentadas na Figura 7.5.
Eficiencia
Errorelativo
1.0
0.30
0.25
0.8
0.15
0.4
eff(,)
0.20
0.6
0.10
0.2
0.0
0.05
0.00
Figura 7.5 Eficincias de estimao (espao de informao) e erro relativo para cada
valor de parmetro, segundo a estratgia tima escolhida.
Conforme pode ser observado na Figura 7.5, os parmetros 1 e 4 apresentam
pior eficincia de estimao, da ordem de 0,60. Os parmetros 2 e 3 apresentam
eficincias de estimao elevadas (>0,90). O erro relativo da ordem de 15-20% para
130
y 1 e0 x
(E 7.22)
y 1 e0 x
(E 7.23)
y 1 1 e 0 x
(E 7.24)
y 1 2 e0 x
0,6
0,6
x2
x3
x4
Referncia
0,00 1,28
0,5 0,5
0,00 1,27
0,5 0,5
0,968
0,834
Este trabalho
Este trabalho
0,00 0,28 0,92 1,92 0,4 0,25 0,22 0,13 0,790 DETTE et al. (2006a)
0,00 0,27 0,81 1,90 0,25 0,25 0,25 0,25 0,768
Este trabalho
x2
x3
Referncia
0,00 1,28
0,50 0,50
0,00 1,28
0,50 0,50
0,964
Este trabalho
0,00 0,39 1,67 0,46 0,35 0,20 0,788 DETTE et al. (2006a)
0,6
Este trabalho
0,00 0,27 1,31 0,45 0,34 0,21 0,750 DETTE et al. (2006a)
0,6
Este trabalho
132
0,6
0,6
x2
x3
Referncia
1,27 10,00
0,50 0,50
1,28 10,00
0,50 0,50
0,968
Este trabalho
0,45 1,67 10,00 0,27 0,30 0,43 0,819 DETTE et al. (2006a)
0,51 1,72 10,00 0,33 0,33 0,33 0,834
Este trabalho
0,30 1,34 10,00 0,25 0,32 0,43 0,777 DETTE et al. (2006a)
0,30 1,72 10,00 0,33 0,33 0,33 0,768
Este trabalho
0,6
0,6
x2
x3
x4
x5
Referncia
0,978
0,925
Este trabalho
Este trabalho
0,00 0,26 0,94 1,97 10,00 0,30 0,18 0,14 0,11 0,27 0,874 DETTE et al. (2006a)
0,00 0,21 0,69 1,86 10,00 0,20 0,20 0,20 0,20 0,20 0,896
Este trabalho
dc t
dt
(E 7.25)
dc t
c t 1
dt
s(t )
2 s (t )
O modelo admite que substrato seja consumido para a gerao de massa celular
em uma proporo constante, resultando na Equao (E 7.26).
(E 7.26)
s (t ) s(0)
c t c 0
3
(E 7.27)
t1
wt
t2
t3 ... T
134
t t
J , N exp wti c i c i
i
T
(E 7.28)
(E 7.29)
t
c t
1
b ln
1 b ln
c 0
1
0
(E 7.30)
c1
w
c1
c 2
c 3 ... cT
wc2
(E 7.31)
c t t
t 1
c t c t t c t t
t t 2
t t
c
t 3
136
para o critrio Maximin, uma srie de otimizaes internas so necessrias (no sendo
descritas aqui).
Em um trabalho posterior (STRINGUL et al., 2009), os autores propuseram
algoritmos para obter planejamentos timos, contudo, considerando que boas
estimativas iniciais para os parmetros eram conhecidas. Neste caso, o planejamento
timo para um conjunto de parmetros, mas pode resultar em baixa eficincia se as
estimativas para os parmetros forem inadequados. O algoritmo proposto pelos autores
sugere, como critrio de busca, a avaliao aleatria dos tempos de amostragem para a
escolha de um planejamento timo.
Resultados obtidos nesta tese
De acordo com DETTE et al. (2005), amplas faixas de parmetros (que refletem
pouco conhecimento do sistema) so apresentadas abaixo:
(E 7.32) 0, 2 1 h 1 0,3
mg
0, 4 2
0, 6
L
mg
0, 2 3
0,3
mg
1.0
(A)
-1
0.2
[0.2,0.4,0.2]
[0.3,0.4,0.2]
[0.2,0.6,0.2]
[0.3,0.6,0.2]
[0.2,0.4,0.3]
[0.3,0.4,0.3]
[0.2,0.6,0.3]
[0.3,0.6,0.3]
0.1
0.0
[0.2,0.4,0.2]
[0.3,0.4,0.2]
[0.2,0.6,0.2]
[0.3,0.6,0.2]
[0.2,0.4,0.3]
[0.3,0.4,0.3]
[0.2,0.6,0.3]
[0.3,0.6,0.3]
(B)
0.8
s(t) (mg.L )
-1
c(t) (mg.L )
0.3
10
15
tempo (h)
20
25
30
0.6
0.4
0.2
0.0
10
15
tempo (h)
20
25
30
Figura 7.6 Concentrao (A) celular e (B) de substrato para diferentes combinaes
dos valores dos parmetros [1,2, 3] para c(0)=0,03 mg.L-1 e s(0) = 1 mg.L-1.
137
t1
t2
t3
t4
t5
t6
Fonte
9,53
16,74
53,11
--
--
--
11,87
16,84
30,00
--
--
--
Este trabalho
10,93
15,83
17,32
--
--
10,26
15,53
18,16
30,00
--
--
Este trabalho
10,23
14,06
16,84
19,41
--
11,57
15,52
26,05
27,36
30,00
--
Este trabalho
8,51
11,98
15,16
19,10
23,67
7,94
12,35
15,29
19,70
24,11
30,00
Este trabalho
O tempo mximo investigado foi 30h, tempo em que c(t) e s(t) praticamente se estabilizam.
138
{ wt 3 , wt 4 }={0,105; 0,149}, enquanto um peso mais elevado dado para o ponto final
{t5}={+}, dado por { wt 5 }={0,281}. Como os dados obtidos no presente trabalho
consideram a mesma ponderao para todos os tempos, o planejamento timo obtido
nesta tese indicou que tempos de amostragem mais elevados so mais adequados. Como
discutido, o uso de pesos pode no ser adequado quando o nmero de amostras baixo.
Avaliao para estrutura do erro conhecida
A partir deste ponto, avaliam-se planejamentos timos para estruturas do erro
conhecidos, e variveis de sada concentrao celular e de substrato. Considera-se que
os parmetros possam ser quaisquer dentro das faixas (idntico ao exemplo 03 no
Captulo 06):
0, 2 1 0,3
0, 4 2 0, 6
0, 2 3 0,3
-10 6
-8 6
-5 3
0.06
--4 2
-6 4
0.008
0.004
0.04
0.02
(A)
0
10
15
-5 3
8.4931899x10 t + 9.3669600x10 t +
-4 2
-3
-2
1.6474036x10 t - 7.6755005x10 t + 6.2779516x10
0.012
0.000
s = -2.9168743x10-9t6 + 2.6754146x10-7t5 -
s(t) (mg.L-1)
c(t) (mg.L-1)
0.016
(B)
20
25
30
0.00
tempo (h)
10
15
20
25
30
tempo (h)
Figura 7.7 Ajustes empricos para o desvio padro da (A) concentrao celular e (B)
concentrao de substrato de acordo com resultados obtidos no Captulo 6.
Tabela 7.7 Eficincias mdia e mnima para diferentes nmero amostras para critrios
(E 7.10), Bayesiano e Maximin. Tempos timos segundo a Equao (E 7.10).
Nmero de pontos no tempo e
Critrio
Eficincia mdia
Eficincia mnima
(E 7.10)
0,7714
0,4691
Bayesiano
0,8606
0,2452
Maximin
0,7714
0,4691
(E 7.10)
0,8435
0,6441
Bayesiano
0,8795
0,3296
t4=30,00)
Maximin
0,8074
0,6503
(E 7.10)
0,8353
0,6683
Bayesiano
0,8645
0,5700
t4=16,84; t5=30,00)
Maximin
0,8047
0,6849
(E 7.10)
0,8424
0,6752
Bayesiano
0,8954
0,5775
Maximin
0,8060
0,7012
tempos correspondentes*
3
(t1=8,95; t2,=14,21; t3=26,05)
1.0
1.0
0.6
0.4
0.8
tg = -1
Bayes)
Ponto timo
escolhido
(A)
(B)
0.2
0.2
0.0
0.0
0.4
0.2
0.4
0.6
0.8
0.0
0.0
1.0
0.2
0.4
1.0
0.8
tg = -1
Ponto timo
escolhido
Bayes)
Ponto timo
escolhido
E,In
0.6
E,In
1.0
1.0
0.8
Bayes)
0.8
MaxMin)
MaxMin)
(C)
tg = -1
0.6
0.4
(D)
0.2
0.2
0.0
0.0
0.6
E,In
E,In
0.4
tg = -1
Ponto timo
escolhido
0.6
E,In
E,In
Bayes)
0.8
0.2
0.4
0.6
E,In
MaxMin)
0.8
1.0
0.0
0.0
0.2
0.4
0.6
0.8
1.0
E,In
MaxMin)
E , In
E , In
Figura 7.8 Frentes de Pareto das funes de informao Bayes
e MaxMin
para:
141
RT
Regio de
confiana
Valor de
= 0e1/RT pode
ser muito
inadequado para
simular o dado
experimental
Pc
0
0
Figura 7.9 Ilustrao da regio de confiana e do intervalo de valores possveis de 0 e
1; ponto PC dentro do intervalo pode ser inadequado para avaliar o dado experimental.
Os exemplos apresentados demonstraram como possvel avaliar planos
experimentais a partir de faixas possveis dos parmetros. Conforme demonstrado pelo
exemplo 03 para o modelo de Monod, o critrio Bayesiano pode indicar experimentos
bastante inadequados se a faixa de parmetros for ampla. O critrio Maximin tende a
levar a um risco muito inferior. O critrio conforme apresentado na Equao (E 7.10),
pode ser prefervel por conciliar pontos com boa eficincia mdia e boa eficincia
mnima, levando a apenas duas funes objetivos (critrio Bayesiano e Maximin),
independente da complexidade do problema.
144
8 TRATAMENTO
MULTIOBJETIVO
DADO
8.1 Objetivos
O principal objetivo deste captulo apresentar um tratamento multiobjetivo ao
problema de estimao de parmetros precisos e discriminao de modelos, levando a
caracterizao das frentes de Pareto dos problemas e determinando as solues timas.
8.2 Introduo
As rotinas de planejamento experimental para estimao de parmetros precisos
e discriminao de modelos estabelecem naturalmente problemas multiobjetivos, uma
vez que as funes de informao a serem maximizadas so mltiplas.
Mesmo apenas os planejamentos para a estimao de parmetros precisos
estabelecem por si s um problema mulitobjetivo, j que a estimao de parmetros
precisos pode ser obtida com auxlio de diferentes critrios. Tratamentos multiobjetivos
tm sido apresentados na literatura para determinao de parmetros precisos (COOK e
145
WONG, 1994), e frentes de Pareto para tais problemas obtidas por CLYDE e
CHALONER (1996). Neste caso, o nmero de funes objetivos igual ao nmero de
critrios de informao que se deseja maximizar (A, D, E-timo,G-timo, etc).
Quando se trabalha com diversos modelos, mesmo quando se fixa um nico
critrio para estimao de parmetros precisos, o problema novamente multiobjetivo.
Isto ocorre porque a estimao de parmetros precisos deve ser avaliada para cada
modelo. Nestes casos, o nmero de funes objetivos pelo menos igual ao nmero de
modelos.
No que se refere discriminao de modelos, diversas formas de discriminantes
podem ser propostas e diversos objetivos podem ser, portanto, formulados. Por
exemplo, nos discriminantes propostos por ATKINSON e colaboradores, admite-se que
cada modelo pode representar o dado experimental; logo, o nmero de discriminantes
igual ao nmero de modelos propostos. Nas formulaes apresentadas por BUZZIFERRARIS et al. (1983, 1990), BUZZI-FERRARIS e FORZATTI (1984) e BOX e
HILL (1965) apenas um discriminante formulado. Contudo, em tais propostas o plano
experimental timo pode no resultar em bons pontos para discriminao de modelos
individuais, j que maximiza uma divergncia mdia entre os modelos. No
discriminante proposto por SCHWAAB et al. (2006), busca-se a maximizao da
divergncia entre pares de modelos, de maneira que o problema pode ser facilmente
abordado segundo a tica multiobjetivo.
Uma vez que diversas funes de informao devem ser maximizadas, em todos
esses casos o problema pode ser tratado sob a tica multiobjetivo, levando a
determinao da frente de Pareto com as condies timas. A prxima seo aborda este
assunto. Alguns trabalhos buscam conciliar os objetivos de discriminao de modelos e
estimao de parmetros precisos, como HILL et al. (1968), ATKINSON (2008),
TOMMASI (2009), dentre outros, descrito em maiores detalhes na Seo 5.4.
Este captulo apresenta a frente de Pareto obtido quando se estabelecem critrios
para estimao precisa e discriminao de modelos durante o planejamento
experimental. Para a escolha de um ponto especfico, podem ser utilizados
procedimentos semelhantes ao proposto por ATKINSON (2008), que maximiza uma
soma ponderada, envolvendo os termos de eficincia de estimao e eficincia de
discriminao.
146
DiSchwaab
Pr(i ) Pr( j )
,j
z'
Y Y V
(i ) P
( j)P
(i , j ) P
Y
Y Y
(i ) P
( j)P
(E 5.28)
VY(i ) P B ( i ) V(i ) B (i )T VY
147
(E 5.29)
,j
(E 5.30)
(E 5.4)
VP BT VY B V 1
Y Y
(i ) P
( j)P
148
DNorm
(E 8.2)
ENorm ,n
D Schwaab
Schwaab
max
J (n) P
max J ( n ) P
DNorm
Post
D Schwaab
Post
max D Schwaab
Post
8.4 Exemplos
Dois exemplos so apresentados para ilustrar a obteno das frentes de Pareto
em problemas de discriminao de modelos e estimao de parmetros. Em ambos os
exemplos, a estimao de parmetros foi realizada a partir de um mtodo hbrido,
conforme descrito por SCHWAAB et al. (2008a). Primeiramente, utiliza-se um mtodo
heurstico de otimizao baseado no enxame de partculas (KENNEDY e EBERHART,
2001) para obter os parmetros que ajustam os dados experimentais. Em seguida, o
melhor valor dos parmetros obtido pela tcnica de enxame fornecido como estimativa
inicial em um mtodo determinstico de Newton, utilizando a aproximao de Gauss
(mtodo de Gauss-Newton) (SCHWAAB e PINTO, 2007a).
149
Modelo 1: y1 1(1)
2(1) x
1 2 (1) x
Modelo 2: y2 1(2) x2
( 2)
150
x (bar)
y (mol.Kg-1)
0,50
1,40
1,00
1,99
2,00
2,41
F(m)
P(m)
1(m) 1(m)
2(m) 2(m)
0,135
76,1
3,175 0,283
1,613 0,402
1,478
23,9
1,892 0,060
0,372 0,055
151
faixas possveis dos valores de x. A Figura 8.2 apresenta as frentes de Pareto entre os
critrios Enorm,1 e Enorm,2 versus Dnorm.
Funes normalizadas
1.0
DNorm
Post
DNorm
0.8
ENorm,1
ENorm,2
0.6
0.4
0.2
0.0
x (bar)
ENorm,1 e ENorm,2
1.0
0.8
ENorm,1
0.6
tg() =-1
ENorm,2
0.4
0.2
0.0
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
DNorm
Figura 8.2 Frente de Pareto dos critrios normalizados de estimao dos modelos 1 e 2
versus o critrio normalizado de discriminao DNorm no Exemplo 8.1.
A escolha de um ponto pode ser feita de acordo com o critrio Maximin ou
ponderando-se entre as eficincias de estimao e discriminao (ATKINSON, 2008).
O planejamento timo poderia ser obtido maximizando-se a seguinte soma ponderada.
152
(E 8.3)
Modelo 1: y1
Modelo 2: y1
Modelo 3: y1
1(1) x1 x2
,
1 3(1) x1 4 (1) x2
1(2) x1 x2
(2)
3
x1 4 (2) x2
1(3) x1 x2
(3)
4
x2
,
2
y2
,
2
y2
2(1) x1 x2
1 3(1) x1 4 (1) x2
y2
(2)
3
x1
2(3) x1 x2
1(4) x1 x2
,
Modelo 4: y1
1 3(4) x1 4 (4) x2
2(2) x1 x2
(3)
3
x1
2 (4) x1 x2
y2
1 3(4) x1
153
x1
20,0
30,0
20,0
30,0
25,0
x2
20,0
20,0
30,0
30,0
25,0
y1
13,443
13,817
17,809
21,139
16,039
y2
1,299
1,433
1,885
2,118
1,635
1(m)
0,1311
0,0743
0,0281
0,1162
2(m)
0,0134
0,0068
0,0067
0,0107
3(m)
0,1431
0,0233
0,0017
0,1187
4(m)
P(m)
0,0145 0,400
0,0034 0,312
0,0232 0,00
0,0162 0,389
Critrios de estimao de
Critrios de Discriminao
Experimentais
parmetros precisos
DNormPost
|V(1)|
(z=0)
(z=1)
(z=1)
1021
1026
1022
DNorm
DNormPos
(z=0)
|V(2)|
|V(4)|
x1
x2
55,0
43,2
2,93
19,02
0,29
1,90
17,62
24,41
6,75
55,0
55,0
2,50
31,98
0,25
3,20
6,71
4,82
3,31
18,2
55,0
2,87
16,52
0,37
2,12
7,07
0,77
1,60
51,1
55,0
1,82
21,77
0,18
2,18
7,08
0,47
3,33
6,9
55,0
2,40
23,74
0,31
3,05
8,20
0,71
0,27
Avaliando ENorm,1, ENorm,2 e ENorm,4 versus DNorm, conforme pode ser observado
na Figura 8.3, as frentes de Pareto so descontnuas e os diferentes critrios de
otimalidade no so conciliados; ou seja, bons pontos para a discriminao no so bons
pontos para a estimao de parmetros precisos, e vice-versa.
1.0
0.9
1.0
0.8
(A)
0.8
ENorm,2
ENorm,1
0.9
0.7
(B)
0.7
0.6
0.5
0.6
0.4
0.5
0.3
0.2
0.4
0.1
0.3
0.84
0.88
0.92
DNorm
0.96
Post
1.00
DNorm
0.6
0.7
DNorm
0.8
0.9
DNorm
1.0
Post
1.0
0.9
0.8
(C)
ENorm,4
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.70
0.75
0.80
DNorm
0.85
0.90
DNorm
0.95
Post
1.00
Figura 8.3 Frentes de Pareto das funes normalizadas para discriminao DNorm () e
DNormPost ( ) versus a funo normalizada para estimao precisa para os modelos: (A)
1; (B) 2 e (C) 4 (z=0) no Exemplo 8.2.
A Figura 8.4 apresenta os resultados da frente de Pareto para o critrio de
estimao de parmetros precisos do modelo 1 e os critrios de discriminao de
modelo que consideram (DNormPost) e que desconsideram (DNorm) a influncia da matriz
de covarincias posterior dos parmetros. Para obter os resultados apresentados na
Figura 8.4, adotou-se z=1 (ou seja, apostando-se em modelos que apresentaram melhor
desempenho).
Avaliando ENorm,1 e ENorm,2 versus DNorm, conforme pode ser observado na Figura
8.4, pode-se observar que h bons pontos para a simultnea estimao de parmetros
precisos e bons pontos para a discriminao de modelos. O mesmo no ocorre para o
modelo 4.
Avaliando ENorm,1, ENorm,2 e ENorm,4 versus DNormPost, conforme pode ser observado
na Figura 8.4, todos os objetivos podem ser conciliados. De forma geral, as frentes de
Pareto dos diferentes objetivos dos critrios de discriminao e estimao tendem a ser
156
1.00
0.99
0.9
ENorm,2
Enorm,1
(A)
0.98
0.97
0.96
(B)
0.8
0.7
0.95
0.6
0.7
DNorm
0.8
DNorm
0.9
Post
1.0
0.5
0.6
DNorm
0.7
0.8
DNorm
0.9
Post
1.0
1.0
ENorm,4
0.8
0.6
(C)
0.4
0.2
0.80
0.85
0.90
DNorm
0.95
Post
1.00
DNorm
157
P(1) = 0,5789
P(2) = 0,0785
P(4) = 0,0198
P(1) = 0,5962
P(2) = 0,1435
estimao
so
iguais
DNorm=0,9980;
DNormPost=0,9992;
ENorm,1=0,7321;
P(2) = 0,000
158
N do Exp
x1
x2
y1
y2
P(1)x100
P(2)x100
P(4)x100
Inicial
1-5
---
---
---
---
40,0
31,2
38,9
55,0
43,2
34,212
3,424
52,7
12,7
58,5
4,8
55,0
11,933
1,267
59,1
24,3
0,0
28,3
55,0
34,925
3,519
74,1
0,0
0,0
55,0
55,0
43,037
4,293
50,2
15,6
47,4
5,3
55,0
13,623
1,363
61,9
27,8
0,0
27,4
55,0
35,064
3,556
70,3
0,0
0,0
18,2
55,0
29,194
3,004
61,0
0,4
0,2
7*
55,0
55,0
43,037
4,293
59,6
0,8
0,0
8*
55,0
55,0
41,124
4,401
23,1
0,2
0,0
55,0
55,0
43,037
4,293
50,2
15,6
47,4
7,9
55,0
18,110
1,876
60,5
24,5
0,0
28,4
55,0
34,872
3,573
72,5
0,0
0,0
55,0
55,0
43,037
4,293
50,2
17,5
47,4
9,8
55,0
21,835
2,160
64,9
23,7
0,0
55,0
55,0
41,124
4,401
18,4
4,8
0,0
51,1
55,0
41,322
4,223
59,9
29,2
59,1
14,8
55,0
27,490
2,708
63,6
2,8
0,0
55,0
55,0
43,037
4,293
67,5
2,4
0,0
6,9
55,0
17,506
1,746
59,5
28,4
9,3
55,0
55,0
43,037
4,293
67,3
25,9
0,0
55,0
55,0
41,124
4,401
21,9
6,2
0,0
10,1
55,0
21,608
2,163
57,89
7,9
1,98
55,0
55,0
43,523
4,341
59,62
14,3
0,0
29,0
55,0
36,296
3,622
74,26
0,0
0,0
DNorm
(z=0)
DNormPost
(z=0)
DNorm
(z=1)
DNormPost
(z=1)
|V1|
|V2|
|V4|
MO
159
1E-24
1E-19
(1)
|V |
1E-21
1E-22
1E-25
(2)
1E-20
|V |
1E-26
1E-27
1E-23
1E-28
(A)
(B)
1E-24
1E-29
1E-25
Exp 1-5
Exp 6
Exp 7
Exp 8
Exp 1-5
Exp 6
Exp 7
Exp 8
Experimentos
Experimentos
1E-20
Disc Sem Post (z'=0)
Disc Com Post (z'=0)
Disc Sem Post (z'=1)
Disc Com Post (z'=1)
Est Prec Modelo 1
Est Prec Modelo 2
Est Prec Modelo 4
Multiobjetivo
1E-21
(4)
|V |
1E-22
1E-23
1E-24
(C)
1E-25
1E-26
Exp 1-5
Exp 6
Exp 7
Exp 8
Experimentos
161
9 DISCRIMINAO DE MODELOS
RESUMO
Os discriminantes apresentados na literatura buscam planejamentos timos que
maximizam a distncia entre as respostas dos modelos. Neste caso, muitos
discriminantes so altamente influenciados por valores numricos de divergncias para
os pares de modelos, no levando em conta se a discriminao entre diversos modelos
de fato possvel naquela condio. Desta forma, parece interessante avaliar um
discriminante que se baseia no nmero de modelos que se espera discriminar. Este
captulo apresenta uma proposta para a discriminao de modelos que se baseia
primeiramente no nmero de modelos discriminados e como termo secundariamente em
algum discriminante proposto na literatura.
Em resumo, propem-se avaliar o potencial de discriminao de um plano
experimental atravs do seguinte critrio:
D
,
Dmax
, n VB
n 1
onde: (,n) uma funo binria que assume o valor 1 se o modelo n discriminado
ou 0 se o modelo n no discriminado; D() o valor de um discriminante usual da
literatura; Dmax o valor mximo que D() pode assumir; e VB um valor
suficientemente baixo para que o termo D()/Dmax fique em segundo plano, comparado
ao nmero de modelos discriminados.
Contudo, para utilizao do critrio de planejamento de experimentos,
necessrio prever o dado experimental obtido ao quando ao executar . Similarmente
ao discriminante proposto por ATKINSON e FEDOROV (1975a,b), isto pode ser feito
quando se considera um modelo m como verdadeiro. Os parmetros dos demais
modelos (n=1,M; nm) podem ser re-estimados e sua adequabilidade avaliada pelo
teste chi-quadrado. Contudo, qualquer dos modelos m (m=1,M) provveis podem ser
verdadeiros. Logo, o problema naturalmente multiobjetivo, com nmero de funes
objetivos igual ao nmero de modelos. As funes-objetivo so os critrios calculados
quando se considera que a resposta real dada pelo modelo m (m=1,M), ou seja,
{ |Z 1 , |Z 2 ,..., |Z M }. A escolha de um plano experimental pode ento
162
ser realizada pelo critrio Bayesiano, Maximin ou outro critrio qualquer para
problemas multiobjetivos. Com isto, o experimentador tem uma expectativa do nmero
de modelos que sero discriminados ao se fazer um plano experimental .
9.1 Objetivos
O objetivo deste captulo apresentar uma nova funo de informao para
discriminao de modelos que leva em conta o nmero de modelos que se espera
discriminar.
9.2 Introduo
A literatura apresenta discriminantes que buscam a maximizao de divergncias
entre os modelos. O problema que, quando muitos modelos so avaliados, a regio de
maior divergncia mdia pode no ser boa para discriminar nenhum dos modelos. Por
isto, alguns critrios de discriminao apresentados na literatura propuseram avaliar
discriminantes com base em pares de modelos (BUZZI-FERRARIS et al., 1983,
SCHWAAB et al., 2006). A dificuldade de se definir o discriminante devida
basicamente ao seguinte fato: no existe uma nica previso da realidade, j que cada
modelo pode predizer uma resposta diferente; conseqentemente, diversas formulaes
podem ser apresentadas para a discriminao de modelos. O que ocorre de fato que se
desconhece o estado da natureza; ou seja, a resposta do experimento. Cada modelo
pode ser ento considerado como um estado da natureza, fornecendo base para fazer as
previses sobre possveis valores o experimento deve fornecer. Portanto, o problema
proposto naturalmente multiobjetivo, sendo o nmero de objetivos igual ao nmero de
modelos que de se dispem.
A Seo 9.3 apresenta a formulao do problema proposto sob a tica
multiobjetivo. A Seo 9.4.2 apresenta a implementao do critrio e o algoritmo
empregado para determinao de um plano timo. De forma sucinta, o procedimento
consiste em admitir um modelo como verdadeiro e realizar a re-estimao dos
parmetros dos modelos, conforme proposto por ATKINSON e FEDOROV (1975a,b).
POSTULADO 9.1:
y
Modelo 3
Modelo 1
Modelo 2
x1
x2
(E 9.1)
Dmax
, n VB
n 1
165
Z(*). Assim, admite-se, por exemplo, que um dado plano experimental * pode gerar
respostas Z(*) que estaro contidas em faixas Z(*)***. Neste caso, se o modelo
verdadeiro est entre os modelos propostos, ento o potencial de discriminao pode
ser avaliado tomando-se o pior conjunto de valores de Z(*) que garantam o maior valor
do discriminante. Contudo, pelo menos um dos modelos deve manter-se provvel. Este
critrio pode ser formulado como:
(E 9.2)
M
D *
Dmax
n 1
*
st.
, n M
n 1
A condio de desigualdade
n, M
*
n 1
modelos no pode ser eliminado. A Equao (E 9.2) pode ser entendida da seguinte
forma: independentemente do valor de Z * Z * , garante-se um valor mnimo
da informao para o pior valor de Z * que maximize a funo de discriminao.
O critrio apresentado na Equao (E 9.2) altamente conservador, exigindo
elevado esforo computacional. Alm disto, depende do conhecimento prvio por parte
do pesquisador quanto possveis faixas nas quais os valores das variveis encontremse ao longo para as condies experimentais investigadas.Pode-se argumentar que
prefervel utilizar os modelos para realizar a predio do dado experimental, conforme
discutido a seguir.
***
166
Considera-se que os dados experimentais possam ser avaliados pela predio dos
modelos. Com isto, o dado experimental deve ser simulado para cada modelo, entendido
no jargo da Teoria da Deciso como cada possvel estado da natureza. Desta forma, o
nmero de funes objetivos a serem maximizadas seriam os critrios de informao
para cada possvel estado da natureza. Logo, se M modelos so provveis, o nmero de
funes objetivos seria igual a M. A funo de informao neste caso ficaria na forma:
(E 9.3)
D( )
|Z ( m ) |Z ( m ) , n VB
n 1
Dmax
nm
Dmax
Retorne as probabilidades dos modelos, os valores dos parmetros e os dados
experimentais condio original
Fim faa
Figura 9.2 Algoritmo para o clculo do critrio |Z ( m ) * de um planejamento *
para todo m (m=1,M), se D() o mesmo para todos m.
167
(E 9.4)
D1| Z ( m ) ( )
D2 ( m ) ( )
VB2 |Z
|Z ( m ) |Z ( m ) , n VB1
n 1
D1max |Z ( m )
D2max|Z ( m )
nm
168
caso, o algoritmo apresentado na Figura 9.2 deve ser adaptado, conforme apresentado
na Figura 9.4.
Encontre Dmax. Se D avaliado para pares de modelos, encontre Dmax(m,n) para todos os
pares de modelos m,n
Para todo m=1,M faa
=0
D1max(*) = 1x10-15 (valor muito baixo)
D2max(*) = 1x10-15 (valor muito baixo)
Simule as respostas dos experimentos em * com o modelo m, como pontos
experimentais
Para todo n (n=1,M; nm), faa
Re-estime os parmetros do modelo n e avalie o modelo n pelo teste chiquadrado
Se o modelo n foi descartado, ento
=+1
Atualize D2|Z(m)(*)(*) (modelos discriminados)
Atualize D2max (modelos discriminados) a partir de Dmax(m,n)
Seno
Atualize D1|Z(m)(*)(*) (modelos no discriminados)
Atualize D1max (modelos no discriminados) a partir de Dmax(m,n)
Fim se
Fim faa
D1 ( m ) * ( * )
D 2 ( m ) * ( * )
Z
|
| Z
VB
|Z ( m ) * * VB1
2
D1 ( m ) * max
D 2 ( m ) * max
|Z
| Z
169
170
(E 9.5)
(E 9.5b)
(m)
( )
( )
(m)
m 1
M
(E 9.5c)
(m)
( )
( )
( )
( )
onde P(m) a probabilidade do modelo m. Para que haja uma hierarquia, neste trabalho,
considerou-se VB1=0,99/M e VB2=0,99/(2M).
BUZZI-FERRRARIS e MANENTI (2009) argumentam contra o uso de
probabilidades de modelos. Segundo os autores, infinitas explicaes podem ser
formuladas para explicar um fenmeno, levando cada explicao a uma probabilidade
que tende a zero. Contudo, apostar em estados da natureza mais provveis por meio
do uso de probabilidades um procedimento comumente adotado em problemas de
tomada de deciso (CHERNOFF e MOSES, 1959). De fato, a utilizao de
probabilidades de modelos til e funcional, fornecendo uma simultnea avaliao da
qualidade comparativa dos modelos e indicando modelos mais provveis para o
procedimento de discriminao (SCHWAAB et al,, 2006). Deve-se salientar, contudo,
que testes estatsticos para avaliao da adequabilidade dos modelos aos dados
experimentais (chi-quadrado, por exemplo) so fundamentais para avaliar se os modelos
so bons. Neste sentido, a probabilidade relativa dos modelos apenas um artifcio
matemtico, que em nada descreve a adequabilidade dos modelos aos dados
experimentais.
Preferencialmente a escolha de pontos timos de discriminao deve ser
criteriosa, onde o experimentador deve escolher um ponto com base nos possveis
cenrios esperados. Como o problema tem mltiplos objetivos, infinitas solues so
esperadas. Um exemplo ilustrativo apresentado a seguir para demonstra como um
cenrio complexo pode surgir para a escolha de um planejamento timo.
171
1
2
3
4
No elimina nenhum
No elimina nenhum
modelo
modelo
modelo
Elimina o modelo 2
Elimina o modelo 1
No elimina nenhum
No elimina nenhum
modelo
Elimina o modelo 3
Elimina o modelo 1
Elimina os modelos 2
No elimina nenhum
No elimina nenhum
e3
modelo
modelo
modelo
D()/ Dmax
~1
~0
~0
~0
DiSchwaab
Pr(i ) Pr( j )
,j
z'
Y Y V
(i ) P
( j)P
(i , j ) P
Y
Y Y
(i ) P
( j)P
173
onde a matriz VY(i,j)P a matriz de covarincias das incertezas de Y, que pode ser
calculada como a soma das varincias experimentais e de predio VY(i)P e VY(j)P, na
forma:
(E 5.27)
(E 5.28)
VY(i ) P B ( i ) V(i ) B (i )T VY
O parmetro de Tsallis (z) foi arbitrado como sendo igual a zero, eliminando a
influncia das probabilidades dos modelos. No procedimento proposto, a probabilidade
dos modelos pode ser levada em conta se for adotado o critrio Bayesiano para a
escolha de um planejamento timo, conforme Equao (E 9.5b). Conforme descrito por
SCHWAAB et al. (2006), a probabilidade dos modelos pode ser obtida atravs da
avaliao do teste chi-quadrado, da seguinte forma:
(E 9.6)
P ( m ) 1 Pr N2
Exp Ny Np
(m)
F (m)
onde: P(m) a probabilidade do modelo m, Pr indica a probabilidade do teste chiquadrado com NExpNy-Np(m) graus de liberdade, NExpNy representa o nmero de
variveis de resposta e Np(m) o nmero de parmetros do modelo m; e F(m) representa a
funo objetivo do modelo m. O modelo m considerado inadequado se sua
probabilidade for menor um valor limite especificado pelo grau de confiana .
Desprezando-se os limites superior (modelo superparametrizado) e inferior (modelo
inadequado) do teste chi-quadrado, o modelo dito inadequado se:
(E 9.7)
1
1
(m)
(m)
P ou P
2
2
174
(E 5.29)
,j
|Z ( m ) * * VB1
2
D1max
D 2max
Fim faa
Retorne as probabilidades dos modelos, os valores dos parmetros e os dados
experimentais condio original
Fim faa
Figura 9.5 Algoritmo para avaliar o critrio |Z ( m ) de todos os planejamentos k
(E 9.8)
F|Z( n( m) ) F ( n ) Z ( n ) Z ( m ) VZ Z ( n ) Z ( m )
T
9.6 Exemplos
Dois exemplos so apresentados a seguir para ilustrar a aplicabilidade do critrio
proposto. Em ambos os exemplos, experimentos iniciais foram simulados com o modelo
verdadeiro e acrescidos de perturbaes aleatrias. A estimao de parmetros foi
conduzida mediante um algoritmo hbrido, conforme descrito por SCHWAAB et al.
(2008a, 2008b). Primeiramente, uma busca global dos parmetros timos conduzida
segundo o mtodo do Enxame de Partculas (KENNEDY e EBERHART, 2001). O
melhor ponto do Enxame de Partculas alimentado a um algoritmo determinstico
baseado no mtodo de Gauss-Newton, em um pacote computacional implementado em
176
Este exemplo simples foi proposto por SCHWAAB et al. (2008c). Trata-se do
Exemplo 8.1 apresentado no Captulo 8. Neste exemplo, dois modelos de isotermas de
adsoro so considerados:
Modelo 1: y1 1(1)
2(1) x
1 2 (1) x
Modelo 2: y2 1(2) x2
( 2)
x (bar)
y (mol.Kg-1)
0,50
1,40
1,00
1,99
2,00
2,41
F(m)
P(m)
1(m) 1(m)
2(m) 2(m)
0,135
76,1
3,175 0,283
1,613 0,402
1,478
23,9
1,892 0,060
0,372 0,055
0<x5, sendo feita 100 divises em x. A Figura 9.6 apresenta os resultados dos critrios
de discriminao de modelos considerando os modelos 1 ou 2 como verdadeiros.
1.4
1.4
(A)
1.2
1.0
1.0
0.8
()
()
(B)
1.2
Pontos de discriminao
0.8
0.6
Pontos de discriminao
0.6
0.4
0.4
0.2
0.2
0.0
0.0
x (bar)
x (bar)
|Z
(1)
( 2)
no Exemplo 9.2.
Conforme pode ser observado na Figura 9.6, para regies de x0,05, ambos os
modelos podem ser discriminados. Contudo, segundo as simulaes, para regies de x
em torno de 5, ocorrer discriminao de modelos apenas se o modelo 2 for verdadeiro.
A escolha natural neste caso um ponto na regio de x=0,05. Conforme indicado na
Figura 9.6, h uma expectativa de que o modelo 2 consiga se ajustar a um experimento
gerado com o modelo 1 para x prximo de 5bar.
Como mostrado por SCHWAAB et al. (2008c) e apresentado no Exemplo 8.1 do
Captulo 8, um experimento realizado em x=5bar permite a discriminao do modelo 2.
A discrepncia surge porque que os parmetros estimados para o modelo 1 com os
dados experimentais obtidos na Tabela 9.2 diferem dos parmetros verdadeiros do
modelo 1. Com isto, o experimentador levado a crer que a discriminao no seria
possvel em x=5bar. Assim, os resultados indicam que esperada a discriminao em
178
Este exemplos simples foi proposto por BUZZI-FERRARIS et al. (1984) e foi
tambm investigado por SCHWAAB et al. (2006). Trata-se do Exemplo 8.2
apresentado no Captulo 8. Neste exemplo, quatro modelos cinticos so considerados.
Modelo 1: y1
Modelo 2: y1
Modelo 3: y1
1(1) x1 x2
,
1 3(1) x1 4 (1) x2
1(2) x1 x2
(2)
3
x1 4 (2) x2
1(3) x1 x2
(3)
4
x2
,
2
y2
y2
,
2
y2
2(1) x1 x2
1 3(1) x1 4 (1) x2
(2)
3
x1
2(3) x1 x2
1(4) x1 x2
,
Modelo 4: y1
1 3(4) x1 4 (4) x2
2(2) x1 x2
(3)
3
x1
2 (4) x1 x2
y2
1 3(4) x1
x1
x2
y1
y2
01
20,0
20,0
13,443
1,299
02
30,0
20,0
13,817
1,433
03
20,0
30,0
17,809
1,885
04
30,0
30,0
21,139
2,118
05
25,0
25,0
16,039
1,635
4(m)
01
1(m)
2(m)
0,1311 0,0134
3(m)
0,1431
P(m)
0,0145 0,400
02
0,0743 0,0068
0,0233
0,0034 0,312
03
0,0281 0,0067
0,0017
0,0232
04
0,1162 0,0107
0,1187
0,0162 0,389
0,00
180
|Z2()
|Z1()
(A)
(B)
0
10
20
x1
30
40
30
20
40
10
x2
10
50
50
20
30
x1
30
20
40
50
x2
10
50
40
|Z4()
(C)
1
0
10
20
30
x1
40
30
20
40
50
10
50
x2
Figura 9.7 - Valores de: (A) |Z(1)(); (B) |(2)(); e (C) |Z(4)() ao longo da faixa
experimental no Exemplo 9.3.
Tabela 9.6 Valores mximos dos critrios de deciso no Exemplo 9.3.
Condio experimental
Valor do critrio
( )
( )
( )
Critrio
x1
x2
Maximin
18,16
55,00
2,0476
1,0958
1,0433
Bayesiano
23,42
55,00
2,1238
1,0742
1,0249
Iguais Probabilidades
23,42
55,00
2,1238
1,0742
1,0249
(1)
( )
( 2)
( )
( 4)
( )
181
Critrio
Condio
Variveis de
experimental
resposta
experimento adicional
x1
x2
y1
y2
Modelo 1
Modelo 2
Modelo 4
Maximin
18,16 55,00
29,55
2,958
0,58
0,00
0,00
Bayesiano
23,42 55,00
32,98
3,300
0,27
0,00
0,00
Igual pesos
23,42 55,00
32,98
3,300
0,27
0,00
0,00
182
dominados. Os critrios Maximin e Bayesiano, entre outros, podem ser utilizados para a
escolha de um plano experimental especfico.
A utilizao de probabilidades de modelos condenada por alguns autores
(BUZZI-FERRARIS e MANENTI, 2009). Contudo, qualquer uma dentre as solues
timas pode ser escolhida como soluo do problema. Por conseguinte, o critrio
Bayesiano, com utilizao de probabilidades de modelos, uma soluo perfeitamente
aceitvel para o problema. O clculo da probabilidade conforme proposto por
SCHWAAB et al. (2006) pode ser utilizado para a escolha de um planejamento timo,
segundo o critrio Bayesiano.
Problemas naturais surgem no processo de otimizao para avaliar o
planejamento timo. Primeiramente, as funes de informao so descontnuas para os
pontos de discriminao, exigindo um mtodo de otimizao robusto. Algumas
alternativas de otimizao podem ser investigadas. Por exemplo: (i) uma primeira
estratgia o emprego de algoritmos heursticos, tais como algoritmo gentico ou
enxame de partculas, que devem ter suas eficincias avaliadas para obter planejamentos
timos; (ii) outra alternativa a realizao de diversas otimizaes, usando por exemplo
o mtodo de Newton, que permite avaliar timos locais para o discriminantes escolhido
da literatura (tais discriminantes so geralmente funes contnuas), obtendo solues
timas locais (mximos locais) dos discriminantes usuais. Estas condies poderiam ser
fornecidas como estimativas iniciais em outros algoritmos de otimizao, que no usam
derivadas, avaliado em seguida a funo de discriminao que leva em conta o nmero
de modelos discriminados, conforme critrio (E 9.1). Enfim, estudos especficos de
otimizao podem ser conduzidos para avaliar planejamentos timos, segundo o critrio
apresentado neste capitulo. Ainda assim, o planejamento de mltiplos experimentos
pode tornar o algoritmo de otimizao nada trivial. Nesta tese, exemplos foram
apresentados com apenas um experimento adicional considerado.
Um questionamento relevante diz respeito vantagem de utilizao do critrio
proposto: o discriminante proposto neste captulo leva a planejamentos experimentais
melhores do que os discriminantes usuais da literatura? A resposta to incerta quanto
o dado experimental. Ou seja, a priori no pode ser estabelecida qual a melhor estratgia
sem o conhecimento do resultado experimental final. Desta forma, em muitos casos,
alguns discriminantes podem resultar em melhores valores do que outros; contudo, para
outros casos, a situao pode ser invertida. O problema multiobjetivo por natureza,
uma vez que se trata de um processo de tomada de deciso onde h mltiplos estados da
183
184
185
w
n 1
(n)
VCR ( n ) 0
, onde: w(n) um peso
1
(n)
0
VCRT
multiobjetivo, cuja soluo dada pela frente de Pareto. A escolha de um ponto dentro
da frente de Pareto pode ser feita pelo critrio Maximin, Bayesiano ou qualquer outro
critrio.
10.1 Objetivos
O principal objetivo deste captulo apresentar uma proposta para conciliar os
objetivos de estimao de parmetros precisos e discriminao de modelos. Isto feito
atravs da definio de um critrio para medir o ganho de informao com um conjunto
de experimentos .
10.2 Introduo
A estimao de parmetros precisos e a discriminao de modelos muitas vezes
so atingidas diversas vezes em direes opostas. Diversas tentativas tm sido feitas de
conciliao destes objetivos, conforme tratado no Captulo 5, Seo 5.6. O Captulo 8
apresentou a soluo deste problema sob a tica multiobjetivo. Contudo, conforme
demonstrado no Captulo 8, diversas funes objetivos podem ser formuladas de
maneira que a obteno da frente de Pareto para tantas funes pode ser uma tarefa nada
trivial. Neste cenrio complexo, pode-se argumentar que o domnio do pesquisador a
respeito da expectativa de ganho de informao com o experimento tenha sido
totalmente perdido. O experimentador pode ser informado de um planejamento timo e
cegamente realiz-lo, sem qualquer expectativa sobre o resultado a ser obtido. Neste
sentido, parece interessante estabelecer um critrio de ganho de informao que
signifique algo para o pesquisador. A complexidade do problema deveria ser reduzida
ao mximo, para tornar este critrio simples e factvel.
Os critrios de informao avaliam a reduo na incerteza de uma varivel.
conveniente relembrar alguns aspectos da Teoria da Informao apresentados no
Captulo 4. Sejam um conjunto de variveis, cuja distribuio de probabilidades
representada por (). A entropia da informao associada dada por:
(E 10.1)
H E log log d
187
posteriori log | . Contudo, o valor mdio desta diferena deveria ser tomado em
relao distribuio de probabilidades a posteriori, ou seja:
(E 10.2)
(E 10.3)
Lindley | ln
|
d
188
POSTULADO 10.1:
(E 10.4)
S| S| |
S|
aps realizar . Em outras palavras, pode-se imaginar que a incerteza sobre que o
experimentador imaginava ter antes de ser fazer seja dada por S1. Aps realizar , o
pesquisador descobre que a incerteza que ele de fato tinha antes de fazer era dada por
189
S2. O pesquisador verifica tambm que a incerteza aps fazer dada por S2|. Desta
forma, a incerteza total antes de executar dada por S 2 S1 e a incerteza aps se
fazer dada por S2|, conforme ilustrado na Figura 10.1.
S2
S2|
S1
Figura 10.1 Ilustrao das incertezas que o pesquisador imaginava ter antes de (S1),
que de fato tinha antes de (S2) e que o pesquisador tem aps (S2|).
Portanto, a porcentagem total de estados da natureza eliminados pode ser escrita
como:
(E 10.5)
S 2|
S 2 S1
190
volume VCRT(n). Este volume constitudo pela unio das regies de confiana que o
experimentador imaginava ter e que de fato tinha; ou seja:
(E 10.6)
(E 10.7)
Vale relembrar formas matemticas idnticas com valores dos parmetros distintos podem ser
consideradas diferentes modelos, ou seja, y=e-1*x e y=e-2x podem ser considerados diferentes modelos ou
possveis estados da natureza.
191
Valores
possveis de
(3)
Valores
possveis de
(M-1)
Valores
possveis de
(2)
Valores
possveis de
(M)
Valores
possveis de
(1)
Valores possveis de
(G)
Figura 10.2 Ilustrao da unio de todos os conjuntos dos valores possveis dos
parmetros dos diferentes modelos.
Ao se realizar um conjunto de experimentos em , o ganho de informao de
acordo com o Postulado 10.1 fica:
(E 10.9)
N ( G )
i 1
(G )
(G )
i
, i(G )
N (G )
N(G) o nmero de elementos em ( G ) (como N(G) pode ser infinito, a razo entre
,
(G )
i
192
(E 10.10)
w( G , n )
n 1
N ( n )
,
(n)
j
j 1
N G
onde N(n) representa o nmero de elementos que pertencem ao conjunto (n). Uma
forma conveniente de definir o peso dado aos estados da natureza com a mesma forma
matemtica :
(E 10.11)
wG ,n
w( n )
N ( n )
N (G )
onde:
(E 10.12)
(n)
n 1
Na Equao (E 10.11),
N ( n )
N ( G )
(E 10.13)
w
(n)
n 1 N
N (G )
(n)
, (jn )
j
(G )
N
193
, (jn )
w( n ) j
N ( n )
n 1
(E 10.14)
(E 10.15)
n 1
(E 10.16)
VCRT n 0 VCR n 0
VCRT n 0
w ( n )
M
n 1
w ( n ) 1
VCR n 0
VCRT n 0
(m=1,4), cada um com dois parmetros {1(m), 2(m)}. Admite-se que a estimao de
parmetros a partir de alguns experimentos iniciais 0 dos modelos levou seguinte
regio de confiana dos modelos ( VCR ( n ) 0 ), apresentados na Figura 10.3:
2(1)
2(3)
2(2)
Modelo 01
1(1)
Modelo 02
1(2)
2(4)
Modelo 03
1(3)
Modelo 04
1(4)
Figura 10.3 Ilustrao de regies de confiana de quatro modelos (cada um com dois
parmetros) aps realizar 0.
VCR(n)(0)
VCRT(n)(0)
VCR(n)(0+)
VCR|(Zn)
Regies de confiana em 0
Regies de confiana em 0+
Figura 10.4 Regies de confiana que se imaginava ter em 0, que de fato se tinha em
(E 10.17)
w( n )
1
M
196
(E 10.18)
w( n ) P ( n )
(E 10.19)
(n)
otm
arg min VCR ( n ) 0
st: Z Z ( n )
A condio Z Z ( n ) indica que otm(n) deve ser avaliado considerando
que os dados sejam dados pelo modelo n. De forma a obter a eficincia de informao,
os pesos podem ento ser escolhidos como:
(E 10.20)
w( n )
(n)
VCR ( n ) 0 otm
1
(n)
0
VCRT
(k )
0
(k )
M
min VCR otm
1
VCRT ( k ) 0
k 1
(E 10.21)
M VCRT ( n ) 0 VCR ( n ) 0
max max
(n)
197
De forma mais simples, recomenda-se aqui a escolha dos pesos definidos nas
Equaes (E 10.17) ou (E 10.18).
10.3.4 Determinando o volume de incerteza em 0
(E 10.22)
0
VCR
(E 10.23)
V n 0
n
0
VCRT
max V n 0 , V n |Z 0
se , n 1
se , n 0
|B|
198
forma a evitar a inverso da matriz de informao de Fisher para obteno das matrizes
de covarincias das incertezas paramtricas. Assim, a razo entre os volumes fica:
min
w( n ) 1
n 1
(E 10.24)
J ( n ) 0 ,
J |(Zn) 0
J ( n ) 0
1 , n
199
M
n 1
(E 10.25)
VCR n 0
VCRT n 0
st.
, n M
n 1
A condio
, n M
n 1
(E 10.26)
OF |Z ( m ) , |Z ( m ) , |Z ( m ) ,..., |Z ( M 1) , |Z ( M )
200
VCR n 0 VCR|(Zn()m ) 0
(E 10.28)
(E 10.29)
(E 10.30)
(m)
(m)
m 1
(E 10.31)
1
M
m 1
| Z ( m )
Vale sempre ressaltar que qualquer ponto dentro da frente de Pareto timo; e,
portanto, no h estratgia melhor ou pior do que outra, se ambas pertencem frente de
Pareto. Por isso, qualquer outro critrio pode ser utilizado para escolha de um ponto
dentro da frente de Pareto (DONCKELS et al., 2010).
201
0,5
, onde
J n 0
VCR|(Zn()m ) 0 0
Seno
VCR ( n ) 0 = J |(Zn()m ) 0
0,5
, onde J |(Zn()m ) 0 a
VCR|(Zn()m ) 0 J |(Zn()m ) 0
0,5
VCRT ( n ) 0 VCR ( n ) 0
Fim se
Fim faa
Calcule |Z ( m ) com a Equao (E 10.16)
Retorne as probabilidades dos modelos, os dados experimentais e os valores dos
parmetros dos dados originais
Fim faa
Figura 10.5 Algoritmo para o clculo de |Z ( m ) para todos os modelos m
(m=1,M) de um planejamento especfico .
202
(E 10.32)
F|Z( n( m) ) F ( n ) Z ( n ) Z ( m ) VZ Z ( n ) Z ( m )
T
Com o uso da Equao (E 10.32), o algoritmo fica muito mais simples e menos
custoso. Isto pode evitar problemas numricos nas diversas repeties do procedimento
de re-estimao de parmetros dos modelos. Contudo, perde-se a avaliao da
flexibilidade dos modelos aos novos dados experimentais, de maneira que a anlise se
torna menos eficaz. Alm disto, boas estimativas iniciais dos parmetros esto
disponveis a partir dos dados obtidos em 0. Logo, o processo de re-estimao de
parmetros consideravelmente facilitado, quando se fornecem boas estimativas iniciais
ao algoritmo baseado no mtodo de Gauss-Newton (SCHWAAB et al., 2010).
Para avaliao de um planejamento timo, o procedimento apresentado na
Figura 10.5 deve ser includo em um procedimento de otimizao. Nesta tese, por
simplicidade, foi implementada uma busca em malha para obteno de planejamentos
timos. Dois exemplos so apresentados a seguir para ilustrar a aplicabilidade do
algoritmo.
10.5 Exemplos
Dois exemplos apresentados a seguir ilustram a aplicabilidade do novo critrio
proposto. Em ambos os exemplos, experimentos iniciais foram realizados (isto ,
simulados com um modelo conhecido e acrescidos de perturbaes aleatrias para
simular o erro experimental), de forma a permitir uma primeira estimao de parmetros
dos modelos. A estimao de parmetros foi conduzida segundo um algoritmo hbrido,
de forma anloga descrita por SCHWAAB et al. (2006, 2008a), utilizando
primeiramente o Enxame de Partculas (KENNEDY e EBERHART, 2001) para uma
busca global dos valores dos parmetros. Em seguida, o melhor ponto obtido pela
tcnica do enxame de partculas foi alimentado como estimativa inicial a um mtodo de
Gauss-Newton (SCHWAAB e PINTO, 2007), sendo todas as rotinas implementadas em
linguagem Fortran (SCHWAAB et al., 2010). Os planejamentos consistiram de um
203
yexp
0,1
0,0405
0,2
0,1010
0,5
0,3520
Os parmetros (1) e (2) e suas respectivas varincias v(1) e v(2) podem ser
estimados a partir dos dados experimentais como:
3
(E 10.33)
est
1
i 1
xi
x
i 1
(E 10.34)
exp
0, 6676
VCR 1 0 v (1)
vy
0, 00133
x
i 1
204
(E 10.35)
2 est
i 1
i 1
(E 10.36)
xi1,5
exp
1, 0059
VCR 2 0 v ( 2 )
vy
0, 00298
i 1
(1) est |Z
(E 10.38)
(1)
0, 6676
y2
3
x4 2 xi 2
i 1
exp
(E 10.39)
(2) est |Z
(1)
3
est
1 x4 x41,5 yi exp xi1,5
i 1
x43 xi 3
i 1
(E 10.40)
VCR 2 0 v ( 2 ) |Z (1)
y2
3
x43 xi 3
i 1
(E 10.41)
(E 10.42)
(E 10.43)
1
2
0
se F(2) >F 2
se F(2) F 2
(E 10.44)
v 1|Z (1)
|Z (1) w 1
v (1)
(1)
v ( 2) (1)
w2 1 |Z 1 2
v ( 2 )
(E 10.45)
|Z
(1)
v (1) |Z (1)
1
1
v (1)
2
v ( 2 ) (1)
1 |Z 1 2
2
v ( 2)
Este critrio relativamente simples e pode ser avaliado mediante uma planilha
eletrnica (por exemplo, Excel).
206
exp
(E 10.46)
(1) est |Z
(2)
4
y
3
est 1,5
2 x4 x4 yi exp xi
i 1
x4 2 xi 2
i 1
(E 10.47)
VCR 1 0 v ( 2) |Z ( 2)
y2
3
x4 2 xi 2
i 1
(E 10.48)
(2) est |Z
(E 10.49)
VCR 2 0 v ( 2 ) |Z ( 2 )
(2)
(2) est
y2
3
x43 xi 3
i 1
(E 10.50)
1
1
0
se F1 >F 2
se F F 2
1
(E 10.51)
|Z
(2)
1
v (1) |Z ( 2 )
v (2) (2)
1
1
1 1 1 |Z
2
v (1)
v ( 2)
2
que tambm pode ser calculada com o uso de uma planilha eletrnica (Excel). A
avaliao da condio de timo para o ponto x4 foi feita na regio 0<x41. Os valores
207
1.0
(A)
(B)
0.8
0.6
0.6
0.8
0.4
0.2
0.4
0.2
0.0
0.0
0.2
0.4
0.6
x4
0.8
1.0
0.0
0.0
0.2
0.4
0.6
0.8
1.0
x4
Figura 10.6 Valores dos critrio (A) |Z(1) , e (B) |Z( 2) para ={x4} entre 0
e 1 no Exemplo 10.2.
Considerando o modelo 1 verdadeiro, o critrio no indica que o modelo 2 seja
eliminado se x4<0,68. Contudo, para x40,68, o modelo 2 eliminado, o que
representado na Figura 10.6 pela descontinuidade na curva do critrio de informao.
Considerando o modelo 2 como verdadeiro, em uma pequena faixa de x4 prxima a 0,2
espera-se a eliminao do modelo 1, conforme indicado pela descontinuidade na curva
do critrio de informao na Figura 10.6. Contudo, exceto por esta pequena faixa, o
modelo 1 mostra flexibilidade suficiente para se ajustar aos dados gerados com o
modelo 2 para x4<0,59 e no ser eliminado. Para x40,59, espera-se que o modelo 1 seja
discriminado, conforme indicado pela descontinuidade na curva de informao na
Figura 10.6.
Neste exemplo simples, o ponto x4=1,00 constitui a soluo tima nica do
problema (frente de Pareto com um nico ponto), uma vez que nesta condio ambos os
critrios de informao so maximizados. Conforme indicado na Figura 10.6, ao
executar um experimento em x4=1,00, considerando o modelo 1 verdadeiro, espera-se
eliminar cerca de 76% da incerteza paramtrica total. Considerando o modelo 2
verdadeiro e realizando um experimento em x4=1,00, espera-se eliminar cerca de 83%
dos possveis estados da natureza originalmente considerados provveis.
Fim do Exemplo 10.2
208
Este exemplo foi tambm apresentado nos Captulos 8 e 9. Apenas por clareza,
os resultados apresentados nestes captulos referentes simulao dos experimentos
iniciais sero repetidos aqui. Os quatro modelos considerados esto ilustrados a seguir.
Modelo 1: y1
Modelo 2: y1
Modelo 3: y1
Modelo 4: y1
1(1) x1 x2
,
1 3(1) x1 4 (1) x2
1(2) x1 x2
(2)
3
x1 4 (2) x2
1(3) x1 x2
(3)
4
x2
y2
y2
,
2
y2
,
2
2(1) x1 x2
1 3(1) x1 4 (1) x2
2(2) x1 x2
(2)
3
x1
2(3) x1 x2
1(4) x1 x2
,
1 3(4) x1 4 (4) x2
(3)
3
y2
x1
2 (4) x1 x2
1 3(4) x1
x1
x2
y1
y2
01
20,0
20,0
13,443
1,299
02
30,0
20,0
13,817
1,433
03
20,0
30,0
17,809
1,885
04
30,0
30,0
21,139
2,118
05
25,0
25,0
16,039
1,635
209
4(m)
01
2(m)
1(m)
0,1311 0,0134
3(m)
0,1431
P(m)
0,0145 0,400
02
0,0743 0,0068
0,0233
0,0034 0,312
03
0,0281 0,0067
0,0017
0,0232
04
0,1162 0,0107
0,1187
0,0162 0,389
0,00
1.0
1.0
(A)
0.8
0.6
0.4
0.6
0.2
0.0
(B)
0.8
0.4
0.2
10
20
x1
30
40
50
10
60
20
30
40
50
60
0.0
10
x2
20
30
x1
40
50
10
60
20
30
40
50
60
x2
1.0
(C)
0.8
0.6
0.4
0.2
0.0
10
20
x1
30
40
50
10
60
20
30
40
50
60
x2
Figura 10.7 - Valores de (A) |Z(1) , (B) |Z( 2) , e (C) |Z( 4) ao longo da
malha experimental no Exemplo 10.3.
A avaliao do planejamento timo a ser realizado consiste em determinar a
prxima condio experimental, de forma a simultaneamente estimar os parmetros
precisos a discriminar os modelos. Considera-se que apenas um experimento deve ser
planejado; ou seja, ={x1,x2}. Para isto, a regio experimental foi avaliada entre
210
|Z
(1)
, |Z
( 2)
211
x1
x2
|Z
(1)
12,9
55,0
N
x1
06
12,9
Modelo 1(m)
01
0,1413
02
0,0537
03
04
0,0592
x1
x2
x2
|Z
( 2)
0,95
x2
55,0
2(m)
0,0143
0,0053
0,0059
|Z
(1)
55,0
55,0
N
x1
07
55,0
Modelo 1(m)
01
0,1074
02
0,0561
03
04
x1
|Z
39,2
55,0
N
x1
08
39,2
Modelo 1(m)
01
0,1033
02
0,0570
03
04
-
(1)
( 2)
( 4)
( 2)
( 4)
-y2
4,341
4(m)
0,0122
0,0007
-
|Z
0,68
y1
39,970
3(m)
0,1033
0,0176
-
0,96
y2
2,488
4(m)
0,0199
0,0005
0,0011
|Z
0,90
y1
43,523
3(m)
0,1084
0,0173
-
|Z
0,67
x2
55,0
2(m)
0,0104
0,0054
-
|Z
0,97
y1
24,859
3(m)
0,1523
0,0164
0,0486
|Z
0,92
x2
55,0
2(m)
0,0108
0,0054
-
( 4)
0,0
y2
3,987
4(m)
0,0109
0,0010
-
minm |Z ( m )
0,95
0,93
Modelo bom?
Sim
Sim
No
No
minm |Z ( m )
0,90
0,89
Modelo bom?
Sim
Sim
No
No
minm |Z ( m )
0,67
0,74
Modelo bom?
Sim
No
No
No
212
26
25
0.8
21
0.4
20
(1)
22
Log |J |
23
0.6
24
19
0.2
18
0.0
10
11
12
13
14
17
Experimentos
Figura 10.8 - Ganho de informao e log|J(1)| com experimentos adicionais no
Exemplo 10.3.
Pode ser observado que, aps a realizao do experimento 06, h uma reduo
na ordem do determinante de J(1) de cerca de 102 vezes, o que ilustra como o ganho de
213
216
11 MINIMIZAO
DA
INCERTEZA
FOCANDO
PREDIO
RESUMO:
Este captulo apresenta um critrio de informao, visando minimizao da
incerteza com foco nas predies feitas com o modelo. O princpio semelhante ao
apresentado no Captulo 10; contudo, os estados da natureza considerados no so os
modelos, mas as respostas e os respectivos intervalos de confiana gerados com tais
modelos. Seja Z(X)={z1(X),z2(X),...,zNZ(X)} o conjunto de variveis que so obtidas com
os modelos. Aps realizar um conjunto inicial de experimentos 0, considera-se que um
modelo prediga uma varivel zi(X) para uma condio experimental X dentro do
intervalo zci( m ) X zi( m ) P X u zi( m ) P , zi( m ) P X u zi( m ) P , onde: zi( m ) P X o
valor predito como o modelo m, zi( m ) P a varincia de predio do modelo m (que j
contabiliza a varincia experimental) associada varivel zi, e u um valor que indica
o limite do intervalo de confiana. Todos os possveis valores de zi(m) dentro do
intervalo so possveis estados da natureza, de acordo com o modelo m. Todos os
possveis valores de zi de acordo com os M modelos seriam dados pela unio dos
conjuntos de predies com os modelos; ou seja, zci {zci(1) zci(2) zci(3) .... zci( M ) } .
O nmero de elementos dentro do conjunto zci denominado por Nelem,i(0) (este
nmero infinito para intervalos contnuos). Aps realizar um conjunto de
experimentos , o ganho de informao referente varivel zi dado pela porcentagem
de estados da natureza que foram eliminados. Seja Nelem,i(X,0+) o nmero de
elementos possveis da varivel zi, segundo predio feita com todos os modelos para
uma dada condio X. Logo, o ganho de informao referente varivel zi dado por
N elem ,i X , 0
1
. Contudo, isto pode ser representado pela razo entre os
0
N
X
,
,
elem
i
volumes dos intervalos de confiana que se obtm aps realizar e que se tinha em 0;
zi X , 0
ou seja, 1
ziT X , 0
217
varivel zi.
Vale lembrar que, semelhante ao apresentado no Captulo 10, o conhecimento
que o pesquisador tinha em 0 podia no ser correto. Portanto, este conhecimento
tambm deve ser avaliado com os parmetros estimados em 0+, de forma que o
ganho de informao seja sempre positivo. Se o interesse no for restrito a uma
condio especfica, mas ao longo de uma faixa experimental (X0,XF), o critrio de
NZ
zi X , 0
'
informao pode ser escrito como 1 wi wi X , zi
dX ,
i 1
ziT X , 0
onde
nmero
Z
| Z (1)
de
modelos.
As
funes
de
informao
ficam
11.1 Objetivos
O principal objetivo deste captulo estender a funo de informao
apresentada no Captulo 10 para problemas em que o objetivo minimizar a incerteza
de predio. O uso deste critrio interessante quando no h interesse nos valores dos
parmetros do modelo, mas apenas na predio feita com tais modelos.
218
11.2 Introduo
Este captulo estende os conceitos apresentados no Captulo 10 para problemas
em que o foco no o conhecimento dos modelos, mas sim a predio feita com tais
modelos. Vale relembrar apenas alguns conceitos importantes apresentados no Captulo
3 para contextualizar a funo de informao obtida neste captulo. Admite-se que um
conjunto de experimentos iniciais 0 foi realizado, sendo estimados os parmetros de M
modelos que se adquam aos dados experimentais. A estimao de parmetros leva
matriz de covarincias das incertezas paramtricas para cada modelo m, dada por V(m).
A matriz de covarincias das incertezas de predio pode ser escrita como:
(E 11.1)
VZ( m ) P B ( m ) V( m ) B ( m )T VZ
onde VZ(m)P a matriz de covarincias das incertezas de predio feitas com o modelo
m, B(m) a matriz de sensibilidade e VZ a matriz de covarincias das incertezas
experimentais. Da expresso acima, fica claro que a incerteza de predio a soma da
incerteza associada predio do modelo e incerteza experimental. Logo, o modelo
prediz um dado sempre mais incerto do que o dado experimental.
O intervalo de confiana de uma varivel zi, de acordo com a predio do
modelo m pode ser dado por:
(E 11.2)
A partir das hipteses geralmente adotadas de distribuio normal dos dados e dos
parmetros, o intervalo de confiana no seria descrito por uma distribuio t-Student, mas sim por uma
distribuio normal. A considerao da distribuio t-Student uma forma conservadora de representar a
incerteza de predio, uma vez que os intervalos calculados com a distribuio t-Student so superiores
aos intervalos obtidos com a distribuio normal de probabilidades.
219
A mesma lgica apresentada pelos Postulados 9.1 e 10.1. A idia bsica destes
postulados adaptada para quando o interesse a predio feita com os modelos, ou
seja:
Postulado 11.1
Uma medida do ganho de informao ao executar um plano experimental
pode ser dada pela porcentagem do nmero de estados da natureza que eram
considerados possveis antes de executar e foram eliminados aps executar . Se o
objetivo de um pesquisador minimizar a incerteza de predio feita com os modelos,
deve-se minimizar o conjunto de possveis valores de predio.
Considera-se aqui que os possveis estados da natureza so as possveis respostas
do modelo; ou seja, as variveis Z. Neste caso, a funo de ganho de informao com
um conjunto de experimentos com base nas variveis experimentais Z={z1,z2,,zNz}
definida como Z(). Admite-se que tenham sido realizados experimentos iniciais 0,
permitindo estabelecer regies de confiana das incertezas sobre as variveis Z. Um
novo conjunto de experimentos realizado, diminuindo as incertezas sobre Z. Logo,
segundo o Postulado 1, o ganho de informao pode ser escrito como:
(E 11.3)
S| Z S| Z|
S| Z
onde: S|(Z) representa a incerteza total sobre a varivel Z antes de realizar o conjunto de
experimentos , avaliada com base no conhecimento que se dispe em ; e S|(Z|)
representa a incerteza total sobre Z aps realizar . Estabelecendo a mesma importncia
para cada valor predito com os modelos, a incerteza sobre as variveis Z pode ser obtida
pela unio das incertezas de predio de cada modelo.
220
z2(2)
(A)
(B)
Modelo 3
Modelo 3
Modelo 2
Modelo 2
Modelo 1
Modelo 1
z1(1)
z2(3)
z1(2)
(C)
Possveis estados da
natureza eliminados
Possveis estados da
natureza restantes
z1(3)
Figura 11.1 Ilustrao das regies de confiana das incertezas de predio para trs
modelos. (A) com os experimentos em 0; (B) com os experimentos adicionais em ; e
(C) ilustrao dos possveis estados da natureza eliminados e restantes aps .
Neste exemplo, trs modelos so provveis, conforme ilustrado na Figura 11.1
(z1 e z2 poderiam ser, por exemplo, converso e seletividade a uma dada condio
221
definido como Nelem,C (este nmero infinito para intervalos contnuos das variveis).
(No Exemplo Ilustrativo 11.1, o conjunto ZC em 0 seria dado pela unio das regies de
confiana apresentadas na Figura 11.1A). Logo, o critrio de informao gerado pelo
Postulado 11.1 e em conformidade com os conceitos apresentados no Captulo 10
estabelece que o ganho de informao associado a um conjunto de experimentos pode
ser dado por:
(E 11.4)
N elem ,C
N elem,C
k 1
wC ,k , ZGk
onde: wC,k um peso dado eliminao do estado da natureza ZCk; e , ZCk uma
funo binria, que assume 1 se o estado da natureza ZC,k eliminado com os
experimentos em e 0 no caso contrrio.
Um segundo exemplo ilustrativo apresentado a seguir para fixar o significado
do critrio.
222
Figura 11.2 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental: ilustrao da obteno de ZC e do nmero de elementos de
ZC.
Conforme pode ser observado na Figura 11.2, uma das possveis condies
experimentais {4,Sim} predita pelos trs modelos. O conjunto ZC dado pela unio de
todos os conjuntos possveis preditos pelos modelos. O conjunto ZC composto por
quatro possveis condies ZC={Z1,Z2,Z3,Z4}. A primeira condio Z1={3,Sim}, a
segunda condio ZC2={4,Sim}, e assim por diante. O nmero total de condies
possveis Nelem,C igual a 4.
Agora, considera-se que um conjunto de experimentos tenha sido realizado.
Como conseqncia, cada modelo passa a predizer uma nica condio possvel,
conforme apresentado na Figura 11.3.
223
ZC(1)={{3; Sim}}
ZC(2)={{3;No}}
ZC(3)={{4;Sim}}
ZC=ZC(1)C U ZC(2)C ZC(3)
ZC={{3;Sim},{3;No},{4;Sim}}
(3)
(3)
Nelem,C(0+ )=3
Figura 11.3 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental aps realizar .
Aps realizar , o nmero de possveis respostas igual a 3. Logo, o ganho de
informao com dado pela porcentagem de estados da natureza eliminados, de acordo
com a Equao (E 11.3), pode ser escrito como:
(E 11.5)
1
1
0 0 0 1
4
4
ou Z
1
1
4 3
4
4
225
X;
zci X , 0 - conjunto das incertezas totais em 0+, para uma dada
condio X;
(E 11.6)
Contudo, para mltiplos modelos, o conjunto zci pode ser contnuo por partes,
ento, o volume associado a este conjunto o resultado da soma dos tamanhos dos
intervalos que compem zci. Pelos mesmos argumentos apresentados no Captulo 10, a
incerteza total que o pesquisador tinha em 0 dado pela unio dos conjuntos de
incerteza que o pesquisador imaginava ter em 0 e de fato tinha em 0, ou seja:
(E 11.7)
(E 11.8)
226
(E 11.11)
Nz
Z wi
i 1
N elem ,i
1
N elem,i
, zc
j 1
i, j
onde Nelem,i o nmero de elementos que a varivel zi pode assumir e wi um peso dado
varivel zi. Os termos no numerador e denominador geralmente so infinitos, mas sua
razo finita. Esta razo dada pela diviso entre o volume de incerteza aps realizar
os experimentos em pelo volume de incerteza antes de realizar os experimentos em ,
ou seja:
(E 11.12)
Nz
i 1
Z wi 1
zi X , 0
ziT X , 0
227
(E 11.13)
Nz
i 1
Z 1 wi
zi X , 0
ziT X , 0
(E 11.14a)
XF
Nz
zi X , 0
1 wi wi ' X
dX
i 1
ziT X , 0
X0
onde:
Nz
(E 11.14b)
w 1
i
i 1
XF
(E 11.14c)
w ' X dX 1
i
X0
Definindo Smin,i como a incerteza mnima que possvel alcanar para uma
varivel i, pode-se escrever que:
(E 11.15)
228
(E 11.16)
ziexp ( X ) 2 u zi
(E 11.17)
Nz
S min,i
i 1
S1i
Sextra 1 wi
(E 11.18)
S1i wi' X zi X , 0 dX
Sextra
zc1={3;4;5}
Nelem,1(0)=3
zc2={No,Sim}
Nelem,2(0)=2
Figura 11.4 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental, ilustrao da obteno de zc1 e zc2 e do nmero de
elementos no Exemplo Ilustrativo 11.3.
Aps realizar um conjunto de experimentos , cada modelo passou a predizer
apenas uma possvel resposta. As incertezas esto representadas na Figura 11.5.
zc1={3,4}
Nelem,1(0+ )=2
Figura 11.5 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental aps realizar no Exemplo Ilustrativo 11.3.
230
(E 11.20)
1 1
2 3
1 1
2 2
Z 3 2 2 2
1
6
Sejam trs modelos quaisquer que se adqem aos dados experimentais obtidos
em um conjunto de experimentos iniciais 0. Para uma condio especfica X, uma
varivel zi apresenta os intervalos de confiana ilustrados na Figura 11.6. O conjunto de
todos os possveis valores de zi dado pela unio dos conjuntos de zi(m) predito com os
modelos. No caso da Figura 11.6, trata-se de um conjunto contnuo por partes. O
volume de cada parte contnua pode ser calculado como o maior valor do intervalo
231
menos o menor valor do intervalo. Somando o volume de cada parte contnua, tem-se o
volume total de zci(X,0), representado por ||zi(X,0)||. O nmero de elementos que
pertencem ao conjunto zi proporcional ao volume de incertezas de zi (Figura 11.6).
1,7
zci(3)(X)
1,5
1,4
zci(2)(X)
Nelem,i(X,0) ||zi(X,0)||
zci(X,0)
1,2
||zi(X,0)||=(1,7-1,5)+(1,4-0,8)
1,1
||zi(X,0)||=0,8
zci(1)(X)
0,8
Figura 11.6 Possveis valores de zi preditos com trs modelos, zci,1, zci,2 e zci,3;
obteno de zci como unio dos conjuntos e nmero de elementos em zci proporcional
ao tamanho do intervalo.
1,65
1,55
zci(3)(X)
zci(X, +)
0
Nelem,i(X,0+) ||ziT(X,0+)||
||ziT(X,0+)||=(1,65-1,55)+(1,15-0,85)
1,15
zci(1)(X)
||ziT(X,0+)||=0,40
0,85
Figura 11.7 Possveis valores de zi preditos com trs modelos, zci,1, zci,2 e zci,3;
obteno de zci como unio dos conjuntos e nmero de elementos em zci proporcional
ao tamanho do intervalo aps realizar .
232
(E 11.21)
zi X , 0
N elem ,i X , 0
1
1
N elem ,i X , 0
zi X , 0
(E 11.22)
zi X , 0
1
zi X , 0
0, 40
0,50
1
0,80
No caso ilustrado, o ganho em relao varivel zi foi de 0,5; ou seja, 50% dos
valores possveis que a varivel zi podiam assumir foram eliminados com os
experimentos em .
Fim do Exemplo Ilustrativo 11.4
Seja um sistema com uma nica varivel de projeto e uma nica varivel de
resposta. Considera-se que o erro da varivel de projeto {x} seja desprezvel; porm, a
varivel de resposta {y} apresenta um erro experimental conhecido. Um conjunto inicial
de experimentos 0 foi realizado, permitindo o ajuste de dois modelos que descrevam
adequadamente os dados experimentais. Neste exemplo, o modelo 2 admitido como o
verdadeiro. Um novo experimento , consistindo de um nico ponto, deve ento ser
realizado. Como a incerteza, segundo o critrio Z(), reduzida quando se escolhe
como um ponto de discriminao ao invs de um ponto de estimao precisa? Para
responder a esta pergunta, sejam duas condies experimentais em que pode ser
realizado, x** ou x*, correspondendo a um ponto em que os modelos no so
discriminados e um ponto em que os modelos so discriminados, respectivamente.
A Figura 11.8 ilustra os volumes de incerteza envolvidos. Na Figura 11.8A esto
ilustradas as incertezas experimentais e incertezas associadas aos erros paramtricos dos
modelos. A unio destas regies est apresentada na Figura 11.8B, que ilustra o
tamanho da incerteza total da varivel y em 0.
Quando se realiza um experimento em x**, conforme indicado na Figura 11.8C,
os modelos no so discriminados, mas os parmetros dos modelos so estimados de
forma mais precisa. Por conseqncia, a reduo das incertezas pequena e est
associada reduo das incertezas devido impreciso paramtrica. Por outro lado, um
experimento x* elimina o modelo 01, de forma que toda incerteza associada s regies
em que o modelo 01 prediz resultados diferentes do modelo 2 eliminada. Por
conseqncia, o ganho de informao neste caso bastante elevado.
234
Modelo 1
(A)
Incerteza
experimental
(B)
Incerteza dos
modelos
Incerteza total
Modelo 2
x
y
(C)
x**
(D)
x*
235
utiliza modelos para prever o dado experimental, o que leva a M possveis cenrios
(onde M o nmero de modelos).
11.4.1 Planejamento robusto (sem utilizar modelos para prever o dado
experimental)
236
assumir o valor calculado com cada modelo; ou seja, Z = |ZZ ( m ) , para todo n=1,M.
Portanto, as M funes de informao a serem maximizadas so:
(E 11.24)
(E 11.25)
(E 11.26)
(m)
(m)
m 1
(E 11.27)
1
M
m 1
Z
| Z ( m )
Vale salientar que qualquer outro critrio pode ser adotado, desde que escolha
pontos dentro da Frente de Pareto. O algoritmo usado para propor um plano
experimental especfico segundo o critrio analisado est apresentado a seguir.
11.4.3 Algoritmo para o planejamento experimental
237
Para uma faixa de interesse, especifique a faixa (X0,XF). Divida esta regio em diversos
pontos, armazenando estes pontos em Xgrid={xgrid,1, xgrid,2, xgrid,3,....}
A partir dos dados experimentais em 0, estime os parmetros de todos os modelos m
(m=1,M)
Especifique os pesos wi para cada varivel (por exemplo, wi=1/Nz); bem como o peso
para cada varivel ao longo da faixa experimental (por exemplo, wi(X)=1/VolX, onde
VolX o volume da regio (X0,XF)
Para todos os pontos de Xgrid, calcule para todas as variveis zi (i=1,Nz) e para todos os
modelos m (m=1,M), o desvio padro de predio z(im ) xgrid , o valor mnimo e o valor
mximo das variveis preditas zi( m ) min xgrid , 0 e zi( m ) max xgrid , 0
Para todos os modelos m (m=1,M), faa
Gere dados com o modelo m para o plano experimental *, considerando estes
dados como dados experimentais
Para todos os modelos (n=1,M; nm), faa
Re-estime os parmetros do modelo n
Se o modelo n tornou-se inadequado, ento
Para todos os pontos de Xgrid, faa
Para todas as variveis zi (i=1,Nz), faa
zi( n ) min xgrid , 0 = zi( n ) max xgrid , 0 = 0
Fim faa
Fim faa
Seno
Para todos os pontos de Xgrid, faa
Para todas as variveis zi (i=1,Nz), faa
Com dados de 0, mas com parmetros estimados em 0+,
calcule o desvio padro z(in )|Z ( m ) xgrid , 0 e o valor mximo
e mnimo da varivel zi predita com o modelo n, dadas por
zi( n )|min
x , 0 e zi( n )|max
x , 0 , respectivamente
Z ( m ) ( ) grid
Z ( m ) ( ) grid
Se ( z(in )|Z xgrid , 0 < z(in ) xgrid , 0 ), ento
zi( n )|max
x , 0 = zi( m ) max xgrid , 0
Z ( m ) ( ) grid
zi( n )|min
x , 0 = zi( m ) min xgrid , 0
Z ( m ) ( ) grid
Fim se
Com dados obtidos em 0+ e parmetros re-estimados em
0+, calcule z(in ) xgrid , 0 e o mnimo e mximo valor
predito da varivel zi, representado por zi( n ) min xgrid , 0 e
zi( n ) max xgrid , 0 , respectivamente
Fim faa
238
Fim faa
Fim se
Calcule o volume de interseo das variveis zi e para todos os pontos dentro
do malha Xgrid:
zi 0 a partir de zi( n ) min xgrid , 0 e zi( n ) max xgrid , 0 ;
ziT 0 a partir de zi( n )|min
x , 0 e zi( n )|max
x , 0 ,
Z ( m ) ( ) grid
Z ( m ) ( ) grid
sendo (n=1,M)
Calcule a integral a partir da Equao (E 11.14), obtendo o valor de
|ZZ
(m)
Elimine os dados gerados com o modelo m para o plano que haviam sido
adicionados aos dados experimentais
Retorne os parmetros de todos os modelos e as probabilidades de todos os
modelos aos valores originais
Fim faa
Fim faa
Figura 11.9 Algoritmo para obteno dos critrios ZZ( m ) para todos os modelos
m (m=1,M) de um conjunto de experimentos especfico .
Por simplicidade, a etapa de re-estimao de parmetros dos modelos pode ser
substituda pela avaliao da qualidade dos modelos, considerando os parmetros
estimados com os dados experimentais em 0. Assim, a funo objetivo com os dados
obtidos em poderia ser calculada como:
(E 11.28)
F|Z( n( m) ) F ( n ) Z ( n ) Z ( m ) VZ Z ( n ) Z ( m )
T
Desta forma, o algoritmo torna-se muito mais simples e menos custoso. Isto
pode evitar problemas numricos nas diversas repeties do procedimento de reestimao de parmetros dos modelos. Contudo, perde-se a avaliao da flexibilidade
dos modelos em relao aos novos dados experimentais e a anlise torna-se mais pobre.
Alm disto, boas estimativas iniciais dos parmetros esto disponveis a partir dos dados
obtidos em 0, e o processo de re-estimao de parmetros consideravelmente
facilitado ao fornecer boas estimativas iniciais a um algoritmo baseado no mtodo de
Gauss-Newton (SCHWAAB et al., 2010).
Para avaliao de um planejamento timo, o procedimento apresentado na
Figura 10.5 deve ser includo em um procedimento de otimizao. Nesta tese, por
simplicidade, foi implementada a busca em uma malha para obteno de planejamentos
239
11.5 Exemplos
Os mesmos dois exemplos numricos apresentados no Captulo 10 so
novamente empregados aqui para ilustrar a aplicabilidade do novo critrio de
planejamento. Em ambos os exemplos, experimentos iniciais foram simulados com um
modelo conhecido e acrescidos de perturbaes aleatrias para simular o erro
experimental, de forma a permitir uma primeira estimao de parmetros dos modelos.
A estimao de parmetros foi conduzida segundo um algoritmo hbrido, de forma
anloga descrito por SCHWAAB et al. (2006, 2008c) e PEREIRA et al. (2009),
utilizando primeiramente a tcnica do Enxame de Partculas (KENNEDY e
EBERHART, 2001) para realizar uma busca global dos valores dos parmetros. Em
seguida, o melhor ponto encontrado pelo algoritmo do enxame de partculas foi
alimentado como estimativa inicial a um mtodo de Gauss-Newton (SCHWAAB e
PINTO, 2007). Todas as rotinas numricas foram implementadas em linguagem Fortran
(SCHWAAB et al., 2010). Os planejamentos consistiram de um nico experimento
adicional de cada vez. Para busca do planejamento timo, a regio experimental foi
discretizada, realizando-se a busca na malha resultante.
Nos exemplos apresentados, o objetivo obter o ganho mximo de informao
ao realizar um experimento adicional ao longo de uma faixa experimental (X0,XF).
Desta forma, necessrio calcular uma integral mltipla com a Equao (E 11.14). Para
avaliao da integral da funo de informao ao longo da faixa experimental, o peso
dado a cada varivel ao longo da faixa experimental foi uniforme; ou seja,
w1(X)=w2(X)=1/VolX, onde VolX o volume da regio experimental. A integral foi
avaliada dividindo-se a regio experimental em diversos domnios k=1,Nk. Para cada
regio k, calculava-se a funo de informao
zi X k , 0
ziT X k , 0
em um ponto. A
integral podia ento ser obtida considerando que este valor da funo de informao era
o mesmo para todos os pontos dentro do domnio k (regra do retngulo). Desta forma, a
integral pode ser aproximada pela soma ponderada dos volumes de cada regio, na
forma:
240
Nk
1 zi X , 0
1 zi X k , 0
dX
Volk
VolX ziT X , 0
ziT X k , 0
k 1 VolX
X0
XF
(E 11.29)
yexp
0,1
0,0405
0,2
0,1010
0,5
0,3520
Os parmetros (1) e (2) e suas varincias v(1) e v(2) podem ser estimados a partir
dos dados experimentais, respectivamente, como:
3
(E 11.30)
est
1
i 1
i 1
(E 11.31)
xi
exp
0, 6676
VCR 1 0 v (1)
vy
x
i 1
(E 11.32)
2est
y
i 1
xi1,5
exp
x
i 1
0.00133
1, 0059
241
(E 11.33)
VCR 2 0 v ( 2 )
vy
0, 00298
i 1
(1) est |Z
(E 11.35)
v (1) |Z (1)
(1)
0, 6676
y2
3
x4 2 xi 2
i 1
exp
(E 11.36)
(2) est |Z
(1)
3
est
1 x4 x41,5 yi exp xi1,5
i 1
x43 xi 3
i 1
(E 11.37)
v ( 2) |Z (1)
y2
3
x43 xi 3
i 1
(E 11.38)
P
v (1)
x |Z (1) x 2 v (1) |Z (1) v y
y
(E 11.39)
P
v (2)
x |Z (1) x 2 v ( 2 ) |Z (1) v y
y
242
(E 11.40)
P
y1|Z 1 1est |Z 1 x t3,0.975 v (1)
x |Z 1
y
(E 11.41)
P
y2| Z 1 x1.5 2 est |Z 1 t3,0.975 v (2)
x Z 1
y
(E 11.42)
y y1|Z 1 y2|Z 1
(E 11.43)
(E 11.44)
1
2
0
se F(2) >F 2
se F(2) F 2
(E 11.45)
|ZZ
(1)
1
dx
0
y1 y2
243
(E 11.46)
|ZZ
0,68
(1)
1 0
dx
y1|Z (1)
0,68
y1 y2
dx
(E 11.47)
Z
| Z ( 2 )
y1|Z ( 2) 1 1 y2|Z ( 2 )
1
dx
1 0
y
y
1
2
0,55
0,55
(A)
0,50
0,45
0,45
0,40
0,40
0,35
(B)
0,35
0,50
0,30
0,30
0,25
0,25
0,20
0,20
0,0
0,2
0,4
0,6
0,8
1,0
0,0
x4
0,2
0,4
x4
0,6
0,8
1,0
Figura 11.10 Valores dos critrios (A) |ZZ (1) e (B) |ZZ ( 2) para x4 na faixa
(0,1) no Exemplo 11.6.
Os valores dos critrios |ZZ (1) e |ZZ ( 2) foram calculados com um cdigo
implementado em linguagem Fortran. A condio tima do prximo experimento x4 foi
investigada para pontos de x entre 0 e 1, sendo este intervalo dividido em 100 pontos
244
igualmente espaados. O critrio de informao foi calculado para cada um destes 100
pontos, sendo os resultados destes critrios apresentados na Figura 11.10.
O ganho de informao significativamente elevado para os pontos de
discriminao, conforme indicado pela descontinuidade das curvas na Figura 11.10. A
soluo nica do problema o ponto x4=1. O ganho de informao esperado ao se
realizar o experimento em x4=1 de cerca de 55% para ambos os modelos.
Fim do Exemplo 11.6
Exemplo 11.7 Modelo cintico
1(1) x1 x2
Modelo 1: y1
,
1 3(1) x1 4 (1) x2
Modelo 2: y1
Modelo 3: y1
1(2) x1 x2
(2)
3
x1 4 (2) x2
1(3) x1 x2
(3)
4
x2
,
2
2(1) x1 x2
y2
1 3(1) x1 4 (1) x2
,
2
y2
y2
(2)
3
x1
2(3) x1 x2
1(4) x1 x2
Modelo 4: y1
,
1 3(4) x1 4 (4) x2
2(2) x1 x2
(3)
3
x1
2 (4) x1 x2
y2
1 3(4) x1
regio experimental foi avaliada entre 5,0x155,0 e 5,0x255,0, sendo cada varivel
divida em 20 pontos igualmente espaados. Logo, 400 condies experimentais foram
avaliadas. O peso dado a cada varivel foi idntico e igual a w1=w2=.
Tabela 11.2 Experimentos iniciais realizados no Exemplo 11.7.
Experimento
x1
x2
y1
y2
01
20,0
20,0
13,443
1,299
02
30,0
20,0
13,817
1,433
03
20,0
30,0
17,809
1,885
04
30,0
30,0
21,139
2,118
05
25,0
25,0
16,039
1,635
4(m)
01
1(m)
2(m)
0,1311 0,0134
3(m)
0,1431
P(m)
0,0145 0,400
02
0,0743 0,0068
0,0233
0,0034 0,312
03
0,0281 0,0067
0,0017
0,0232
04
0,1162 0,0107
0,1187
0,0162 0,389
0,00
(m)
nos grficos de I |Z m .
246
0.2
0.1
0.0
10
20
30
40
x1
0.3
50
10
60
20
30
40
50
60
20
30
40
x1
50
10
60
20
30
40
50
30
10
40
x1
50
10
60
20
30
40
20
x1
0.1
20
x2
0.2
10
50
50
60
10
60
20
30
50
60
x2
(D)
(E)
40
40
60
0.3
0.0
30
0.1
10
20
0.2
10
x1
(C)
0.0
x2
(B)
(A)
0.3
30
40
50
10
60
20
30
40
50
60
x2
(F)
x2
10
20
x1
30
40
50
10
60
20
30
40
50
60
x2
Figura 11.11 - Valores de (A) |ZZ (1) , (B) I |Z (1) , (C) |ZZ ( 2) , (D)
Exemplo 11.7.
Este resultado pode ser contrastado com os resultados obtidos no Captulo 10
para este mesmo exemplo. No Captulo 10 foi observado que o critrio que visa
maximizao de informao sobre modelos e parmetros (o critrio |Z ( m ) ) escolhe
247
x1
18,15
N
06
Modelo
01
02
03
04
x2
55,0
x1
7,63
1(m)
0,1395
0,0533
0,0609
|ZZ
(1)
0,3370
x2
55,00
2(m)
0,0141
0,0051
0,0058
|ZZ
(1)
|ZZ
0,2836
y1
29,554
3(m)
0,1512
0,0157
0,0493
(1)
0,2815
y2
2,958
4(m)
0,0181
0,0011
0,0029
minm |ZZ ( m )
0,2815
0,3430
P(m)
0,584
0,000
0,000
248
|ZZ
(m)
admissvel, conforme esperado para esta condio admitindo que o modelo 1 seja
verdadeiro.
A partir deste ponto, o critrio concentra-se em estimar os parmetros do modelo
1 de forma precisa, visando a minimizar a incerteza de predio. A Tabela 11.5
apresenta os experimentos indicados pelo critrio Maximin, a execuo destes
experimentos e a quantidade de informao extra que pode ser eliminada, comparada ao
erro experimental.
Tabela 11.5 Experimentos realizados segundo indicao do critrio Maximin e
quantidade extra de informao que ainda pode ser eliminada no Exemplo 11.7.
N do Experimento
x1
x2
y1
y2
Sextra
01-05
0,5780
06
0,3750
07
55,0
55,0
43,523
4,341
0,1826
08
55,0
55,0
43,326
4,325
0,1501
09
10,3
55,0
21,738
2,177
0,1250
10
55,0
55,0
42,787
4,281
0,1087
11
12,9
28,7
14,395
1,439
0,0959
12
12,9
55,0
25,359
2,529
0,0855
13
55,0
55,0
42,347
4,245
0,0767
14
12,9
26,1
13,742
1,363
0,0692
paramtrica que se espera conseguir, conforme proposto por SANTOS et al. (2002).
Dessa forma, o custo de realizar os experimentos pode ser comparado preciso
experimental esperada, para posterior tomada de deciso a respeito de se vale a pena ou
no vale a pena continuar os experimentos.
Para fins de comparao com o critrio apresentado no Captulo 10, o logaritmo
do determinante da matriz de informao de Fisher do modelo 1 (log|J(1)|) obtido com
os experimentos indicados pelo critrio do Captulo 10, conforme apresentados na
Figura 10.8 e obtido com os experimentos apresentados na Tabela 11.5 para 9
experimentos adicionais so mostradas na Figura 11.12.
26
Critrio captulo 11
Critrio captulo 10
(1)
Log|J |
24
22
20
18
10
11
12
13
14
Experimentos
250
251
de
predio.
problema
multiobjetivo
surge
naturalmente
do
252
253
PARTE 4 CONCLUSES,
REFERNCIAS, SUGESTES
254
12 CONCLUSES
Esta tese tratou do estudo de diversos conceitos referentes ao planejamento
seqencial de experimentos.
As seguintes questes foram abordadas:
(1)
(2)
(3)
(4)
(5)
(6)
importncia que um plano experimental deve ter para constituir um bom plano para
discriminao de modelos. A funo de ganho de informao proposta ao realizar
nada mais do que avaliar primeiramente o nmero de modelos discriminados, e, em
segundo plano, a divergncia numrica entre as respostas dos modelos. Contudo, para
fins de planejamento, necessrio prever o dado experimental ao realizar , o que foi
feito nesta tese utilizando os modelos com valores de parmetros estimados a partir de
dados experimentais iniciais. Para avaliar o critrio para um plano experimental ,
considerando que um modelo m seja verdadeiro, simula-se o dado experimental com o
modelo m e re-estimam-se os parmetros de todos os modelos n (n=1,M), avaliando a
adequabilidade dos modelos n por um teste estatstico. Isto deve ser repetido para todos
os modelos m=1,M. Por conseqncia, obtm-se um problema multiobjetivo, onde o
nmero de objetivos igual ao nmero de modelos admissveis. A etapa de reestimao de parmetros dos modelos permite avaliar a flexibilidade dos modelos para
ajustar-se a novos dados experimentais. Embora de maior complexidade numrica que
alguns discriminantes propostos na literatura, o discriminante proposto nesta tese
apresenta alguns aspectos conceituais relevantes no procedimento de discriminao de
modelos. Tambm, fornece ao pesquisador uma expectativa sobre o resultado obtido ao
se realizar , permitindo avaliar de forma mais coerente se a discriminao ser ou no
possvel.
O Captulo 10 apresentou como os problemas de estimao de parmetros e
discriminao de modelos no so distintos, mas um s. Cada possvel valor dos
parmetros (independente de sua forma matemtica) constitui-se um estado da
natureza. Logo, de acordo com o Postulado 10.1, a funo de ganho de informao
avaliada com base nos possveis estados da natureza eliminados com um conjunto de
experimentos . Conforme apresentado no Captulo 10, parece ser conveniente conferir
o mesmo peso a todos os possveis estados da natureza cuja forma matemtica idntica
(ou seja, mesmo peso aos possveis valores dos parmetros de um mesmo modelo).
Com isto, obtm-se um critrio de informao baseado na eliminao dos volumes das
regies de confiana dos parmetros dos modelos. Isto leva naturalmente ao critrio do
volume para estimao de parmetros precisos quando apenas um nico modelo
considerado. Para mltiplos modelos, os critrios de discriminao so naturalmente
includos, uma vez que a eliminao de um modelo elimina toda regio de confiana
associada ao modelo. Com isto, o critrio de informao deduzido no Captulo 10
naturalmente privilegia pontos de discriminao de modelos. Contudo, em estgios
257
critrios, afirmando quais critrios so melhores ou piores do que outros, uma vez que a
incerteza associada aos problemas de planejamento de experimentos impede
generalizaes sobre o desempenho dos critrios. Acredita-se, contudo, que as formas
apresentadas nesta tese apresentam boa abrangncia conceitual, em certos aspectos
superiores aos critrios apresentados na literatura. A discriminao de modelos pode ser
buscada quanto ao objetivo que realmente importa ao pesquisador, o nmero de
modelos discriminados. Os desenvolvimentos apresentados nos Captulos 10 e 11
indicam como conciliar naturalmente os procedimentos e estimao de parmetros
precisos e discriminao de modelos, de acordo com o objetivo que o pesquisador
deseja, ou seja, concentrar esforos para minimizar as incertezas dos parmetros dos
modelos ou a incerteza de predio associada aos modelos.
De forma sucinta, as seguintes sugestes so apresentadas para a realizao de
trabalhos futuros:
desenvolver metodologias para iniciar o plano experimental que
apresentem pouca dependncia do conhecimento do pesquisador sobre os
modelos e faixas admissveis para os parmetros, permtindo explorar ao
mximo as condies experimentais, ponderando de forma adequada
obteno de rplicas para avaliao das incertezas experimentais e a
realizao de experimentos em condies distintas;
desenvolver e aplicar procedimentos de otimizao para todos os
problemas abordados nos Captulos 7, 8, 9, 10 e 11;
aplicar os procedimentos de planejamento timo abordados nesta tese em
problemas reais de modelagem, como, por exemplo, estudos cinticos de
reaes catalticas, problemas de transferncia de massa, etc
Por fim, esta tese se encerra com um agradecimento (quem tiver curiosidade,
veja Agradecimentos) a todos os que contriburam para sua realizao. Pelo gigantesco
aprendizado que eu tive ao longo destes quatro anos dentro do Programa de Engenharia
Qumica da COPPE/UFRJ, sou muito grato aos professores, aos colegas, aos amigos e
irmos que conquistei, e minha famlia, sempre presente. Muito obrigado a todos!!!
259
13 REFERNCIAS BIBLIOGRFICAS
ADEWALE, A. J., WIENS, D. P., 2009, "Robust Designs for Misspecified Logistic
Models", Journal of Statistical Planning and Inference, v. 139, n. 1, pp. 3-15.
AGARWAL, A. K., BRISK, M. L., 1985a, "Sequential Experimental-Design for Precise
Parameter-Estimation .1. Use of Reparameterization", Industrial & Engineering
Chemistry Process Design and Development, v. 24, n. 1, pp. 203-207.
BERNARDO, J. M., SMITH, A. F. M., 2000, Bayesian Theory, Nova York, John
Wiley & Sons.
BIASOLI, P. K., Modelagem Conjunta de Mdia e Varincia em Experimentos
Fracionados sem Repetio Utilizando GLM, Dissertao de Mestrado, UFRGS,
BOX, G. E. P., 1960, "Fitting Empirical Data", Annals of the New York Academy of
Sciences, v. 86, n. 3, pp. 792-816.
BUZZI-FERRARIS, G., FORZATTI, P., 1983, "A New Sequential ExperimentalDesign Procedure for Discriminating Among Rival Models", Chemical
Engineering Science, v. 38, n. 2, pp. 225-232.
BUZZI-FERRARIS, G., FORZATTI, P., EMIG, G., HOFMANN, H., 1984, "Sequential
Experimental-Design for Model Discrimination in the Case of Multiple
Responses", Chemical Engineering Science, v. 39, n. 1, pp. 81-85.
BUZZI-FERRARIS, G., FORZATTI, P., CANU, P., 1990, "An Improved Version of A
Sequential Design Criterion for Discriminating Among Rival Multiresponse
Models", Chemical Engineering Science, v. 45, n. 2, pp. 477-481.
BUZZI-FERRARIS, G., MANENTI, F., 2009, "Kinetic Models Analysis", Chemical
Engineering Science, v. 64, n. 5, pp. 1061-1074.
CHAKONG, V., HAIMES, Y. Y., 1983, Multiobjective Decision Making: Theory and
Methodology, Nova York, Elsevier Science Publishing.
CHERNOFF, H., 1972, Sequential Analysis and Optimal Design, Philadelphia, SIAM.
262
CLYDE, M., CHALONER, K., 1996, "The Equivalence of Constrained and Weighted
Designs in Multiple Objective Design Problems", Journal of the American
Statistical Association, v. 91, n. 435, pp. 1236-1244.
DETTE, H. , NEUGEBAUER, H. M., 1996, "Bayesian Optimal One Point Designs for
One Parameter Nonlinear Models", Journal of Statistical Planning and
Inference, v. 52, n. 1, pp. 17-31.
DETTE, H., WONG, W. K., 1999, "E-Optimal Designs for the Michaelis-Menten
Model", Statistics & Probability Letters , v. 44, n. 4, pp. 405-408.
DETTE, H., BIEDERMANN, S., 2003, "Robust and Efficient Designs for the
Michaelis-Menten Model", Journal of the American Statistical Association, v.
98, n. 463, pp. 679-686.
DETTE, H., MELAS, V. B., PEPELYSHEV, A., STRIGUL, N., 2003, "Efficient
Design of Experiments in the Monod Model", Journal of the Royal Statistical
Society Series B-Statistical Methodology, v. 65, n. 9 pp. 725-742.
DETTE, H., MELAS, V. B., PEPELYSHEV, A., STRIGUL, N., 2005, "Robust and
Efficient Design of Experiments for the Monod Model", Journal of Theoretical
Biology, v. 234, n. 4, pp. 537-550.
DETTE, H., MELAS, V. B., WONG, W. K., 2006b, "Locally D-Optimal Designs for
Exponential Regression Models", Statistica Sinica, v. 16, n. 4, pp. 1447.
DETTE, H., MELAS, V. B., PEPELYSHEV, A., 2006c, "Local C- and E-Optimal
Designs for Exponential Regression Models", Annals of the Institute of
Statistical Mathematics, v. 58, n. 2, pp. 407-426.
DETTE, H., HAINES, L. M., IMHOF, L. A., 2007, "Maximin and Bayesian Optimal
Designs for Regression Models", Statistica Sinica, v. 17, n. 2, pp. 463-480.
DETTE, H., KUNERT, J., PEPELYSHEV, A., 2008, "Exact Optimal Designs for
Weighted Least Squares Analysis With Correlated Errors", Statistica Sinica, v.
18, n. 1, pp. 135-154.
DONCKELS, B. M. R., 2009, Optimal Experimental Design To Discriminate Among
Rival Dynamic Mathematical Models, PhD Thesis, Department of Applied
264
265
Properties
of
Heterogeneous
Enzymatic
Assays,
Analytical
HILL, P. D. H., 1978, "Review of Experimental-Design Procedures for RegressionModel Discrimination", Technometrics, v. 20, n. 1, pp. 15-21.
HILL, W. J., HUNTER, W. G., WICHERN, D. W., 1968, "A Joint Design Criterion for
Dual
Problem
of
Model
Discrimination
and
Parameter
Estimation",
HUNTER, W. G., REINER, A. M., 1965, "Designs for Discriminating Between 2 Rival
Models", Technometrics, v. 7, n. 3, pp. 307-323.
IMHOF, L., WONG, W. K., 2000, "A Graphical Method for Finding Maximin
Efficiency Designs", Biometrics, v. 56, n. 1, pp. 113-117.
266
JAROSCH, K., EL SOLH, T., DE LASA, H. I., 2002, Modelling The Catalytic Steam
Reforming Of Methane: Discrimination Between Kinetic Expressions Using
Sequentially Designed Experiments, Chemical Engineering Science, v. 57, n.
16 , pp. 3439-3451.
JEFFREYS, H., 1946, "An Invariant Form for the Prior Probability in Estimation
Problems", Proceedings of the Royal Society of London Series A-Mathematical
and Physical Sciences, v. 186, n. 1007, pp. 453-461.
KALOGERAKIS, N., LUUS, R., 1984, "Sequential Experimental-Design of DynamicSystems Through the Use of Information Index", Canadian Journal of Chemical
Engineering, v. 62, n. 6, pp. 730-737.
KENNEDY, J., EBERHART, R.C., 2001. Swarm Intelligence, San Diego, Morgan
Kaufmann Publishers.
KIEFER, J., 1959, "Optimum Experimental-Designs", Journal of the Royal Statistical
Society Series B-Statistical Methodology, v. 21, n. 2, pp. 272-319.
KIEFER, J., WOLFOWITZ, J. 1960, "The Equivalence of Two Extremum Problems ",
Canadian Journal of Mathematics, v. 12, pp. 363-366.
KONISHI, S., KITAGAWA, G., 2008, Information Criteria and Statistical Modeling,
Nova York, Springer.
KULLBACK, S., 1959, Information Theory and Statistics, Nova York, John Wiley
and Sons.
KULLBACK, S., LEIBLER, R. A., 1951, "On Information and Sufficiency", Annals of
Mathematical Statistics, v. 22, n. 1, pp. 79-86.
267
MLLER, P., PARMIGIANI, G., 1995, Optimal Design Via Curve Fitting of Monte
Carlo Experiments, Journal of the American Statistical Association, v. 90, n
432, pp.1332-1330.
OBRIEN, T. E., RAWLINGS, J. O., 1996, A nonsequential design procedure for
parameter estimation and model discrimination in nonlinear regression models,
Journal of Statistical and Planning Inference, v. 55, n 1, pp 77-93.
Janeiro, Brasil.
268
PARMIGIANI, G., INOUE, L., 2009, Decision Theory: Principles and Approaches,
John Wiley & Sons.
PETROV, L. A., ELIYAS, A. E., MAXIMOV, C. S., 1991, "Difficulties in the
Application of Sequential Experimental-Design to Kinetic-Model Discrimination
and Parameter-Estimation", Industrial & Engineering Chemistry Research, v.
30, n. 4, pp. 639-645.
PINTO, J. C., LOBAO, M. W., MONTEIRO, J. L., 1990, "Sequential ExperimentalDesign for Parameter-Estimation - A Different Approach", Chemical
Engineering Science, v. 45, n. 4, pp. 883-892.
PINTO, J. C., LOBAO, M. W., MONTEIRO, J. L., 1991, "Sequential ExperimentalDesign for Parameter-Estimation - Analysis of Relative Deviations", Chemical
Engineering Science, v. 46, n. 12, pp. 3129-3138.
pp. 181-188.
PONCE DE LEON, A. C. M., ATKINSON, A. C., 1991, "Optimum ExperimentalDesign for Discriminating Between 2 Rival Models in the Presence of Prior
Information", Biometrika, v. 78, n. 3, pp. 601-608.
269
ROTH, P. M., 1965, Design of experiments for discrimination among rival models,
Ph.D. Thesis, Princeton University, Nova Jersey, USA.
SANE, P. P., WOODS, J. M., ECKERT, R. E., 1973, "Sequential Design of Initial
Experiments for Chemical Kinetic Modeling Isomerization of N-Pentane",
Chemical Engineering Science, v. 28, n. 8, pp. 1609-1616.
SANTOS, T. J., PINTO, J. C., 1998, "Taking Variable Correlation into Consideration
During Parameter Estimation", Brazilian Journal of Chemical Engineering, v.
15, n. 1, pp. 1-20.
SANTOS, T. J., MONTEIRO, J. L., PINTO, J. C., 2002, "Algoritmo Para Previso De
Planos Experimentais Seqenciais", XIV Congresso Brasileiro De Engenharia
Qumica, 2002, Natal.
SEVERO Jr., J.B., 2007, Sntese Biocataltica Do Sorbitol E cido Lactobinico Com
Separao Simultnea Por Eletrodilise, Dissertao de MSc., COPPE/UFRJ,
270
SCHWAAB, M., BISCAIA, E. C., MONTEIRO, J. L., PINTO, J. C., 2008a, "Nonlinear
Parameter Estimation through Particle Swarm Optimization", Chemical
Engineering Science, v. 63, n. 6, pp. 1542-1552.
Papers.
SCHWAAB, M., PINTO, J. C., 2007b, "Optimum Reference Temperature for
Reparameterization of the Arrhenius Equation. Part 1: Problems Involving One
Kinetic Constant", Chemical Engineering Science, v. 62, n. 10, pp. 2750-2764.
SCHWAAB, M., ALBERTON, A. L., PINTO, J. C., 2010, Estima II: Pacote de
Planejamento de Experimentos e Estimao de Parmetros, Relatrio Tcnico,
271
SOOFI, E. S., 1994, "Capturing the Intangible Concept of Information", Journal of the
American Statistical Association, v. 89, n. 428, pp. 1243-1254.
STRIGUL, N., DETTE, H., MELAS, V. B., 2009, "A Practical Guide for Optimal
Designs of Experiments in the Monod Model, Environmental Modelling &
Software, v. 24, n. 9, pp. 1019-1026.
TOMMASI, C., 2007, "Optimal Designs for Discriminating Among Several NonNormal Models", In: LOPEZ-FIDALGO, J., RODRIGUEZ-DIAS, J.M.,
TORSNEY, B. (eds), mODa 8: Advances in Model-Oriented Design and
Analysis, Heidelberg, Physica-Verlag, pp. 213-220.
TOMMASI, C., 2009, "Optimal Designs for Both Model Discrimination and Parameter
Estimation", Journal of Statistical Planning and Inference, v. 139, n. 12, pp.
4123-4132.
TOMMASI, C., LOPEZ-FIDALGO, J., 2010, "Bayesian Optimum Designs for
Discriminating Between Models With Any Distribution", Computational
Statistics & Data Analysis, v. 54, n. 1, pp. 143-150.
272
APNDICES
273
(E.A1)
2 F
2
1
2 F
Hes 1 2
....
2 F
1 Np
2 F
1 2
2 F
22
....
2 F
2 Np
2 F
1 Np
2 F
....
2 Np
....
....
2 F
....
2
Np
....
(E A.2a)
(E A.2b)
Hes
T
2 F
T
Z est
Z est
1
exp
est
exp
est T
1
Hes
V
Z
Z
Z
Z
V
(E A.2c)
Z est
2
VZ 1 Z exp Z est
Hes
(E A.2d)
T
est
Z est T
2 Z est
1 Z
VZ
VZ 1 Z exp Z est
Hes 2
274
(E A.3)
est
Z est
1 Z
Hes 2
VZ
Z est
O termo
corresponde derivada das variveis Z em relao aos
Z est ,est
OBTENDO V
Pode-se supor que os dados experimentais esto sujeitos oscilaes Zest+Z,
resultando em parmetros tambm sujeitos a oscilaes est+, de forma que a funo
objetivo pode ser escrita na forma:
(E A.4a)
F
0
Z est ,est
(E A.4b)
F
0
Z est Z ,est
(E A.5)
Z est ,est
Z Z est ,est
Z 0
275
(E A.6)
Hes 1
F
Z
Z Z est ,est
(E A.7)
V E T
(E A.8)
vij E i j
(E A.9a)
T
2
2
T F
1 F
1
V E Hes
Z
Z
Hes
Z Z est ,est
Z Z est ,est
(E A.9b)
2 F
2 F
T
V Hes
E Z Z
Hes 1
Z Z est ,est
Z Z est ,est
1
(E A.10)
2 F
2 F
VZ
V Hes
Hes 1
Z Z est ,est
Z Z est ,est
1
pode
276
(E A.11a)
2F
Z Z
(E A.11b)
T
2 F
2
Z exp Z est VZ 1
(E A.11c)
Z est T
2 F
1
V
Z
Z
exp
(E A.12a)
est
Z est
1
1 Z
V 4 Hes
V
V
V
Z
Z
Z
1
(E A.12b)
est
Z est
1 Z
V 4 Hes
V
Z
1
1
Hes
1
Hes
(E A.13a)
V 4 Hes 1
(E A.13b)
V 2 Hes 1
Hes
Hes 1
2
que pode ser obtida a partir dos dados experimentais da seguinte forma pela Equao (E
A.3):
(E A.14)
est
Z est T
1 Z
V
V
Z
encontrar valores de variveis desconhecidas para ajustar dados experimentais com base
no princpio de mxima-verossimilhana. Na formulao acima, cada varivel de sada
reconciliada poderia ser considerada como um parmetro a ser estimado. Alm disto, a
forma apresentada da Equao (E A.14) permite obter correlaes entre os parmetros e
as variveis reconciliadas.
278
APNDICE B
MATRIZ DE INFORMAO DE FISHER
Para a distribuio normal de dados, segundo a Equao (E 3.1), pode-se
observar que:
T
1
1
ln
exp Z exp Z est VZ 1 Z exp Z est
2 Pi det VZ
2
ln Z
(E B.1a)
(E B.1b)
ln Z
1
ln
2 Pi det VZ
1 exp
est T
est
1
exp
ln exp Z Z VZ Z Z
2
1
T
ln
ln exp 1 Z exp Z est VZ 1 Z exp Z est
2 Pi det VZ
2
(E B.1c) ln Z
T
1
(E B.1d)
Z
T
ln Z
1
(E B.1e)
Z exp Z est VZ 1
est
1 Z V
est
Z exp Z est
Z est
ln Z
(E B.1f)
VZ 1 Z exp Z est
ln Z ln Z T
(E B.2) J E
EZ
ln Z ln Z
est
279
est T
Z est T
Z
(E B.3) J EZ
VZ 1 Z exp Z est
VZ 1 Z exp Z est
(E B.4)
est
Z est T
1
exp
exp
1 Z
est
est T
VZ Z Z Z Z VZ
J EZ
V
Z
Z
Z
Z
V
(E B.5)
(E B.6a)
est
Z est
1
exp
exp
1 Z
est T
est
J
VZ E Z Z Z Z VZ
(E B.6b)
est
Z est
1
1 Z
J
V
V
V
Z
Z
Z
(E B. 6c)
est
Z est
1 Z
J
V
Z
que uma forma anloga forma obtida pela Equao (E A.14), onde J=V-1.
280
APNDICE C
SIGNIFICADO ESTATSTICO DO TESTE-F DE FISHER
Sejam duas varincias amostrais, s12 e s22, obtidas a partir de dois conjuntos de
dados, com Nx1 e Nx2 pontos, respectivamente. Logo, os graus de liberdade das duas
amostras so 1 =Nx1-1 e 2 =Nx2-1, respectivamente. Sejam 12 e 22 as varincias
verdadeiras das populaes 1 e 2, respectivamente. Definindo-se FF como a seguinte
razo:
s12
(E C.1)
FF
s22
12
22
(E C.2)
1
1
1 2 1 1
F 2
2 2 2
1 2
P ( F , 1 , 2 )
1 2
1 2
2
F
1
2
2 2
(E C.3)
s12
FF 2
s2
(E C.4)
FFmin
s12
FFmax
s22
281
e
, respectivamente, definidas como:
2 2
(E C.5a)
Pr
, 1 , 2 Fmin
2
(E C.5b)
Pr
, 1 , 2 Fmax
2
probabilidade acumulada de F, Pr
, 1 , 2 ; analogamente,
2
acumulada de FF, Pr
, 1 , 2
2
282
APNDICE D
OBTENO DA MATRIZ VZP
A varincia de predio pode ser obtida pela seguinte esperana:
(E D.1)
VZP E Z Z T
(E D.2a)
Z
est
Z Z est
(E D.2b)
Z
Z
(E D.3)
T
Z
Z
est
est
V E
P
Z
(E D.4)
T
Z
est
est T Z
V E
P
Z
283
(E D.4)
Z
est
est T Z
V
E
P
Z
Mas:
(E D.5)
E est est
(E D.6)
Z
Z
V
V
P
Z
Z
Z
V0. Nesta condio, o termo
V
0. Contudo, ao fazer um
experimento em uma dada condio, o experimentador no pode esperar obter o dado
com preciso maior do que a preciso experimental (VZ). Ou seja, para fins prticos, a
incerteza na predio do modelo deve incluir a incerteza da predio experimental, ou
seja:
T
(E D.7)
Z
Z
V
V
VZ
P
Z
284
APNDICE E
EXEMPLO DO GANHO DE INFORMAO DE LINDLEY
Seja um modelo exponencial na forma:
(E E.1)
y 10 e x
0,5
6,5897
0,7
4,7640
0,8
3,9689
(E E.2)
x1 e
est x1
x2 e
est x2
x3 e est x3
0.03042
(E E.3)
1.02898 2
1
exp
2 0.03042
2 0.03042
285
(E E.4)
1.05074 2
1
y*
exp
2 0.02265
2 0.02265
(E E.5)
Lindley y* ln
y*
d
y*
Lindley 0.0298
Este ganho no deve ser avaliado como valor absoluto, mas sim como um
comparativo com os outros experimentos.
286