Você está na página 1de 299

COPPE/UFRJ

ESTIMAO DE PARMETROS E PLANEJAMENTO DE EXPERIMENTOS:


ESTUDO DE INCERTEZAS E FUNES DE INFORMAO

Andr Lus Alberton

Tese de Doutorado apresentada ao Programa de


Ps-graduao em Engenharia Qumica, COPPE,
da Universidade Federal do Rio de Janeiro, como
parte dos requisitos necessrios obteno do
ttulo de Doutor em Engenharia Qumica.
Orientadores: Jos Carlos Costa da Silva Pinto
Martin Schmal

Rio de Janeiro
Julho de 2010

ESTIMAO DE PARMETROS E PLANEJAMENTO DE EXPERIMENTOS:


ESTUDO DE INCERTEZAS E FUNES DE INFORMAO
Andr Lus Alberton
TESE SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO
LUIZ COIMBRA DE PS-GRADUAO E PESQUISA DE ENGENHARIA
(COPPE) DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE
DOS REQUISITOS NECESSRIOS PARA A OBTENO DO GRAU DE DOUTOR
EM CINCIAS EM ENGENHARIA QUMICA.
Examinada por:
________________________________________________
Prof. Jos Carlos Costa da Silva Pinto, D.Sc.
________________________________________________
Prof. Martin Schmal, Dr.Ing.
________________________________________________
Prof. Argimiro Resende Secchi, D.Sc.
________________________________________________
Prof. Evaristo Chalbaud Biscaia Junior, D.Sc.
________________________________________________
Prof. Antnio Carlos Monteiro Ponce de Leon, Ph.D.
________________________________________________
Prof. Marcio Schwaab, D.Sc.

RIO DE JANEIRO, RJ - BRASIL


JULHO DE 2010

Alberton, Andr Lus


Estimao de parmetros e planejamento de experimentos:
estudo de incertezas e funes de informao/Andr Lus
Alberton. Rio de Janeiro: UFRJ/COPPE, 2010.
XIII, 286 p.: il.; 29,7 cm.
Orientadores:

Jos

Carlos

Costa

da

Silva

Pinto

Martin Schmal
Tese (doutorado) UFRJ/ COPPE/ Programa de
Engenharia Qumica, 2010.
Referencias Bibliogrficas: p. 260-272.
1. Planejamento de experimentos. 2. Incertezas. 3.
Funes de Informao. I. Pinto, Jos Carlos Costa da
Silva et al. II. Universidade Federal do Rio de Janeiro,
COPPE, Programa de Engenharia Qumica. III. Ttulo.

iii

AGRADECIMENTOS
Eu sou uma destas pessoas de sorte. Tenho tanta sorte porque, em minha vida,
todas as coisas vieram no momento certo e no no momento em que eu queria; na
intensidade certa e no na intensidade que meu ego ansiava, para que meu ego,
observando sua insignificncia, atrapalhasse minimamente meu aprendizado. Seja
pelas leis do caos ou por qualquer razo maior, conheci em minha vida meus mestres
no momento certo, responsveis por todo o meu pouco conhecimento que, apesar de to
mnge, pra mim uma das coisas mais preciosas. Carrego em minha vida muito de
todos que j passaram por ela, grandes irmos e amigos, brilhantes professores, nobres
heris. Aqueles que, pela simplicidade, encantam, ensinam, demonstram, por vezes
expandido minha viso para o que deveria ser bvio, e principalmente para alm do
bvio, me surpreendendo sempre com perspectivas diferentes, inclusive sobre coisas
que eu imaginava conhecer. As pessoas que constam nos agradecimentos desta tese
representam infimamente em nmero as pessoas que eu gostaria e deveria mencionar.
Tambm as palavras aqui contidas expressaro muito pouco o meu sentimento de
gratido e respeito.
Para comear, agradeo meus orientadores, Jos Carlos Pinto e Martin Schmal,
pelo brilhantismo, pela pacincia, pela amizade, pelas inmeras ajudas, conversas,
orientaes, etc (etc mesmo!!!!). Em grande parte, graas a vocs este caminho me foi
aberto, e graas a vocs pude concluir este trabalho.
Agradeo banca, os professores Ponce de Leon, Marcio Schwaab, Argimiro e
Evaristo, pela pacincia em ler e avaliar o trabalho e cujas correes muito contriburam
para a tese.
Aos professores do PEQ, com os quais muito aprendi.
Muito obrigado ao pessoal da secretaria, que, diga-se de passagem, so por
demais eficientes, Paulinha, Luciana, Artur e Cia. A Paulinha, por exemplo, vivia
quebrando galhos pra mim (ex, sempre fazendo minha matrcula).

iv

Ao pessoal do xrox, das bibliotecas e afins..... Agradeo ao pessoal do registro


pela pacincia!!!!!
Ao pessoal do Nucat, Clio, Macarro, Ayr, Antnio Gordinho, Anacleto, Leila,
Natlia, Carlos Andr, Luciana (secretaria), Marta etc. Muito obrigado especialmente
Dora, que bem representa a alma do Nucat. Sem ela o trabalho no Nucat seria muito
mais difcil. Muito embora eu tenha abandonado a parte experimental que era
originalmente um dos objetivos do trabalho, essa galera sempre me ajudou muito nos
experimentos que fiz e que no constam na tese.
Ao CNPq, que me concedeu a bolsa de doutorado. Chemtech, que tambm
concedeu uma bolsa de auxlio.
Aos meus amigos, Fbio (Fabola querida), Carlos (Oscarlos Massafera),
Castoldi (Castandi, grande amigo e parceiro nas sadas e nas cervejadas), Leandro
(Veandro), Robinson (Mr. Manfred), Joo Paulo (Joo mesmo), Walter (Presidente),
Chaline e Fred, Gaby e Luis, Analia (Lolita Rodriguez), Mercedez (Mercedez Benz),
Giovana Ceni (Dona J), Erika e Crisstomo (Erika com k e seu Cristopo), Silvia
Moya (S Silvia), Cintia (Shirley), Fernanda (Beira-Mar), Ceclia (Dona Ccera),
Rodrigo Azevedo dos Reis, Herval (Demerval), Karina e o meu grande amigo Alvio
(Karix e Grande Alvito).
Aos meus grandes amigos de Maring, Jos Baslio, Amlia e merson, Jnior,
Gustavo, Dirceu e cia, ao Eduardo Silva, tambm minha madrinha e padrinho Cidinha e
Geraldo, etc.
Aos meus amigos de laboratrio do LMSCP, o grande Eduardo Lemos
(Mr.Monster), cujas sugestes foram muito teis na tese, ao Eduardo Lima, Diego, Jlio
e Tiago (Tlio 1 e Tlio 2), caro (Fgaro F ou Senhor Jesus), Willian (Sir Vilian),
Isaas (Jeremy spoke), a galera mais nova Paulinha, Carol, Carlos, Franklin (Martins, ou
M Martan), Cau (Seu Coruja), etc.

Ao Marquinhos Lobo, cujas discusses, conversas e amizade (inclusive rotinas


em Fortran sobre combinaes, que ele me cedeu e foram fundamentais para a
concluso do Captulo 7) tanto me ajudaram.
A galera do fracasso, meus grandes amigos que muito contriburam para minha
tese Joo Batista (Zuzuzinho) e Fabrcio (Fabrica). Ao grande amigo Jos da Paixo
(Zuza), que desde o incio do mestrado tem acompanhado.
Aos meus amigos de PEQ e repblica, Jackson (Jack Tequila), Rodrigo Danieli,
e muito especialmente aos grandes Adit (Adito, el Aditoso) e Leandro Von Mulhen
(Thiago).
A uma pessoa muito importante e especial para mim, Liliane Pollo, que esteve
comigo durante trs anos do doutorado.
A dois de meus heris, Luiz Gustavo Tavares Krause (in memoriam) e Josmar
Henrique Gonalves (in memoriam), cuja fora me impressiona e motiva. suas
famlias, especialmente o Felipe e Marlene Krause, cuja amizade para mim uma
honra.
Aos meus amigos e mestres Elisa Coutinho (Dra. Elisera) e de novo Marcio
Schwaab (Seu Schwaarm), que muito me ajudaram no direcionamento de minha linha
de pesquisa e tudo mais. O meu grande amigo, Seu Schwaarm, tambm co-autor desta
tese, muito me ajudou (muito quer dizer pra c....) em toda a tese.
Com certeza vai faltar algum que contribuiu muito com este trabalho, ento,
agradeo pessoa que eu me esqueci de mencionar.......
Muitos dos que eu citei eu tenho como amigos, muitos como grandes amigos e,
alguns, como irmos.
linda morena dos acesos olhos verdes, de um corao radiante e to bonito,
minha querida mineirinha Kese.

vi

A minha famlia, que me permitiu novamente realizar este sonho. s minhas


cunhadas Karla e Alessandra. Aos meus muito, mas muito queridos sobrinhos, na ordem
em que vieram ao mundo para iluminar nossas vidas: Joo Pedro, Gabriel, Iarinha,
Arturzinho, Miguelzinho. Ao meu pai Aroldo (in memorian), aos meus irmos, Jos
Ricardo (Pi), Mario Henrique (Mariozo), Joo Luiz (Joca). Muito especialmente ao
meu irmo Aroldo (L) e minha me Ivete, a quem tenho como heris e a quem devo
tudo.
A todos o meu muito obrigado......
Valeu galera!!!!!!!!!!!
Aquele abrao!!!!!!

vii

Resumo da Tese apresentada COPPE/UFRJ como parte dos requisitos necessrios


para a obteno do grau de Doutor em Cincias (D.Sc.)

ESTIMAO DE PARMETROS E PLANEJAMENTO DE EXPERIMENTOS:


ESTUDO DE INCERTEZAS E FUNES DE INFORMAO
Andr Lus Alberton
Julho/2010
Orientadores: Jos Carlos Costa da Silva Pinto
Martin Schmal
Programa: Engenharia Qumica
A utilizao de modelos em Engenharia Qumica constitui-se uma de suas bases
fundamentais. Diversos modelos podem ser obtidos a partir de hipteses distintas, logo,
os modelos devem ser confrontados com dados experimentais. Quando propostos, os
modelos geralmente apresentam diversas variveis desconhecidas, cujo valor deve ser
obtido atravs do procedimento de estimao de parmetros. O conhecimento da
preciso experimental fundamental para avaliar se os modelos descrevem os dados
experimentais dentro da preciso com que foram medidos. Os esforos experimentais
so muito reduzidos ao realizar a avaliao as condies timas de experimentao na
medida em que os pontos so tomados, aplicando as tcnicas de planejamento
seqencial de experimentos, cujos principais objetivos costumam ser a discriminao de
modelos e a estimao de parmetros precisos. Neste trabalho so tratados importantes
aspectos do problema de estimao de parmetros e planejamento seqencial de
experimentos, tais como: (i) estudo de incertezas em sistemas de Engenharia Qumica;
(ii) planejamento inicial de experimentos, quando apenas faixas admissveis para o valor
dos parmetros so conhecidas; (iii) otimizao multiobjetivo aplicada aos problemas de
estimao de parmetros e discriminao de modelos; (iv) discriminao de modelos,
(v) conciliao dos objetivos de discriminao de modelos e estimao de parmetros;
(vi) minimizao da incerteza focando a predio.
viii

Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the


requirements for the degree of Doctor of Science (D.Sc.)

PARAMETERS ESTIMATION AND EXPERIMENTAL DESIGN: STUDY OF


UNCERTAINTIES AND INFORMATION FUNCTIONS
Andr Lus Alberton
July/2010
Advisors: Jos Carlos Costa da Silva Pinto
Martin Schmal
Department: Chemical Engineering
The use of models in Chemical Engineering is one of its fundamental bases.
Several models can be obtained from different hypothesis; therefore, models must be
confronted with experimental data. In the proposition of the models, several variables
are unknown, and their values must be obtained from the parameters estimation
procedure. The experimental precision is fundamental to evaluate if the models are able
to describe experimental data in the precision that the last had been obtained. The
experimental efforts can be significantly reduced if optimal conditions are evaluated as
the experiments are being performed, applying the sequential experimental design
techniques, for which the main objectives are model discrimination and precise
parameters estimation. In this work, important aspects of the procedures of parameters
estimation and sequential experimental design are investigated, such as: (i) uncertainties
study on Chemical Engineering systems; (ii) initial experimental design, when only
possible ranges of parameters values are known; (iii) multiobjective optimization
applied to the problems of precise parameters estimation and model discrimination; (iv)
model discrimination; (v) conciliating the objectives of model discrimination and
precise parameters estimation; (vi) minimizing the uncertainty with focus on the
prediction.

ix

SUMRIO
PARTE 1 -INTRODUO
1

INTRODUO ...................................................................................................................................2

PARTE 2 -ESTADO DA ARTE


2

ELEMENTOS DA TEORIA DA DECISO ....................................................................................8


2.1

Problema multiobjetivo e a frente de Pareto .............................................................................9

2.2

Escolhendo um ponto da frente tima......................................................................................11

2.2.1

Critrio Bayesiano................................................................................................................12

2.2.2

Critrio Maximin ..................................................................................................................15

ESTIMAO DE PARMETROS ................................................................................................20


3.1

Modelos em Engenharia Qumica.............................................................................................20

3.2

Obteno dos parmetros a partir do princpio de mxima-versossimilhana ....................22

3.2.1
3.3

A incerteza paramtrica ............................................................................................................27

3.3.1
3.4

A matriz VZ ............................................................................................................................26
Interpretao estatstica da incerteza paramtrica ..............................................................28

Qualidade dos modelos ..............................................................................................................37

3.4.1

Adequabilidade do modelo ...................................................................................................37

3.4.2

Varincia de predio ..........................................................................................................41

ELEMENTOS DA TEORIA DA INFORMAO ........................................................................44


4.1

Informao de Fisher.................................................................................................................44

4.2

Entropia da informao de Shannon........................................................................................46

4.2.1

Variveis discretas................................................................................................................46

4.2.2

Variveis contnuas...............................................................................................................48

4.3

Entropia relativa: critrio de divergncia de Kullback Leibler (DKL)...................................48

4.4

Informao de Lindley...............................................................................................................50

PLANEJAMENTO SEQENCIAL DE EXPERIMENTOS ........................................................55


5.1

Introduo ..................................................................................................................................55

5.2

Algumas definies bsicas........................................................................................................58

5.3

Estimao de parmetros precisos............................................................................................59

5.4

Discriminao de modelos .........................................................................................................64

5.4.1

HUNTER e REINNER (1965); ROTH (1965).......................................................................64

5.4.2

BOX e HILL (1967)...............................................................................................................66

5.4.3

ATKINSON e colaboradores.................................................................................................69

5.4.4

BUZZI-FERRARIS e colaboradores .....................................................................................71

5.4.5

SCHWAAB et al. (2006)........................................................................................................72

5.4.6

SCHWAAB et al. (2008c), DONCKELS et al. (2009) ...........................................................75

5.4.7

TOMMASI e colaboradores..................................................................................................75

5.5

Planejamentos robustos (mltiplos modelos)...........................................................................77

5.6

Otimizao multiobjetivo aplicada aos problemas de discriminao de modelos e estimao

de parmetros ......................................................................................................................................80

PARTE 3 -RESULTADOS
6

AVALIAO DO COMPORTAMENTO DOS ERROS..............................................................86


6.1

Objetivos .....................................................................................................................................86

6.2

Introduo ..................................................................................................................................86

6.3

Aplicao do conceito de propagao de erros ........................................................................88

6.3.1

Formulao geral .................................................................................................................88

6.3.2

Alguns aspectos importantes.................................................................................................90

6.4

Descrio dos exemplos..............................................................................................................91

6.5

Estudo de caso: Reao cataltica de primeira ordem ............................................................92

6.5.1

Descrevendo a varincia da converso para sistemas simples ............................................92

6.5.2

Avaliando condies timas de experimentao ..................................................................97

6.5.3

Erro constante: .....................................................................................................................98

6.5.4

Erro de acordo com a Equao (E 6.16) ..............................................................................98

6.6

Estudos de caso sistemas mais complexos ...........................................................................101

6.7

Discusso e concluses .............................................................................................................113

PLANEJAMENTO INICIAL ........................................................................................................116


7.1

Objetivos ...................................................................................................................................116

7.2

Introduo ................................................................................................................................117

7.3

Conciliao dos critrios Bayesiano e Maximin ....................................................................121

7.4

Implementao do algoritmo ..................................................................................................124

7.5

Exemplos...................................................................................................................................126

7.6

Discusso e concluses .............................................................................................................142

TRATAMENTO MULTIOBJETIVO DADO ESTIMAO DE PARMETROS

PRECISOS E DISCRIMINAO DE MODELOS........................................................................145


8.1

Objetivos ...................................................................................................................................145

8.2

Introduo ................................................................................................................................145

8.3

Tratamento multiobjetivo dado ao problema de estimao de parmetros e discriminao

de modelos ..........................................................................................................................................147

8.4

Exemplos...................................................................................................................................149

8.5

Discusso e concluses .............................................................................................................160

DISCRIMINAO DE MODELOS .............................................................................................162

xi

9.1

Objetivos ...................................................................................................................................163

9.2

Introduo ................................................................................................................................163

9.3

Formulao do potencial de discriminao............................................................................163

9.4

Potencial de discriminao como critrio de discriminao de modelos.............................165

9.4.1

Planejamento robusto (sem predio do dado experimental pelos modelos) .....................166

9.4.2

Utilizando os modelos para realizar a predio.................................................................167

9.5

Implementao do algoritmo ..................................................................................................173

9.5.1

Algoritmo ............................................................................................................................173

9.5.2

Algoritmo simplificado .......................................................................................................176

9.6

Exemplos...................................................................................................................................176

9.7

Discusso e concluses .............................................................................................................182

10 CONCILIANDO A ESTIMAO DE PARMETROS PRECISOS E A DISCRIMINAO


DE MODELOS .......................................................................................................................................186
10.1 Objetivos ...................................................................................................................................187
10.2 Introduo ................................................................................................................................187
10.3 Medida de ganho de informao.............................................................................................188
10.3.1 Propondo uma medida de informao adequada ...............................................................188
10.3.2 Ganho de informao em problemas de planejamento timo.............................................190
10.3.3 Fatores de ponderao .......................................................................................................196
10.3.4 Determinando o volume de incerteza em 0 ........................................................................198
10.4 Critrio para o planejamento de experimentos .....................................................................199
10.4.1 Planejamento robusto (sem utilizar modelos para prever o dado experimental) ...............199
10.4.2 Utilizando modelos para prever o dado experimental........................................................200
10.4.3 Algoritmo para o clculo do critrio de informao ..........................................................202
10.5 Exemplos...................................................................................................................................203
10.6 Discusso e concluses .............................................................................................................214
11 MINIMIZAO DA INCERTEZA FOCANDO A PREDIO...............................................217
11.1 Objetivos ...................................................................................................................................218
11.2 Introduo ................................................................................................................................219
11.3 Estendendo o conceito para problemas focados na predio ...............................................220
11.3.1 Extenso rigorosa ...............................................................................................................220
11.3.2 Simplificando o critrio ......................................................................................................225
11.3.3 Calculando a incerteza mnima e a quantidade de incerteza que pode ser eliminada .......228
11.4 Utilizando Z() como critrio para planejamento de experimentos...................................235
11.4.1 Planejamento robusto (sem utilizar modelos para prever o dado experimental) ...............236
11.4.2 Utilizando modelos para prever o dado experimental........................................................236
11.4.3 Algoritmo para o planejamento experimental ....................................................................237
11.5 Exemplos...................................................................................................................................240
11.6 Discusso e concluses .............................................................................................................251

xii

PARTE 4 -CONCLUSES, REFERNCIAS E SUGESTES


12 CONCLUSES ...............................................................................................................................255
13 REFERNCIAS BIBLIOGRFICAS ..........................................................................................260

xiii

PARTE 1 - INTRODUO

1 INTRODUO
A utilizao de modelos para descrever processos industriais e laboratoriais pode
ser entendida como uma das pedras angulares da Engenharia Qumica. Os modelos
podem ser obtidos: (i) a partir de dedues puramente fenomenolgicas; (ii) atravs de
propostas

emprico-fenomenolgicas,

que

se

fundamentam

em

princpios

fenomenolgicos, mas que utilizam termos empricos para correes de caractersticas


especficas do sistema investigado; (iii) ou a partir de proposies puramente empricas,
que buscam ajustar os dados experimentais modelos empricos em faixas limitadas de
interesse.
Quando se buscam modelos que descrevam adequadamente os dados
experimentais, quase sempre alguns parmetros dos modelos so desconhecidos. Os
modelos so descritos em termos de: variveis medidas Z={z1, z2, ... zNz}; parmetros
conhecidos a partir de valores reportados na literatura; e parmetros desconhecidos
={1, 2, ... Np}. As variveis medidas podem ser divididas em variveis de projeto
X={x1, x2, ... xNx}, geralmente definidas pelo usurio; e variveis de resposta Y={y1, y2, ...
yNy} que geralmente no so fixadas pelo usurio e constituem as respostas do modelo.
O processo de estimao de parmetros consiste em encontrar valores dos parmetros
desconhecidos , de forma que os modelos possam descrever adequadamente os dados
experimentais Z.
Mesmo quando obtidos a partir de dedues puramente fenomenolgicas, quase
sempre mais de um modelo pode ser proposto para ajustar os dados experimentais. Por
exemplo, diferentes expresses de taxa de reao podem ser obtidas a partir de
diferentes mecanismos de reao propostos. Isto d origem ao primeiro grande
problema dos estudos de modelagem: a avaliao do melhor modelo dentre os
modelos investigados, por meio da discriminao de modelos.
Em quase todos os problemas de natureza emprica, os dados experimentais so
conhecidos de forma inexata e esto sujeitos a flutuaes aleatrias devido a
imprecises dos procedimentos experimentais. Desta forma, os parmetros estimados a
partir das medidas corrompidas por incertezas tambm so conhecidos de forma inexata.
A incerteza paramtrica indesejvel, uma vez que compromete as predies feitas com
2

o modelo e a anlise de influncia das variveis nas respostas do modelo. Experimentos


adicionais podem aumentar a confiana nos valores paramtricos e reduzir a incerteza
associada a tais valores. Isto origina o segundo grande problema dos estudos de
modelagem: a estimao de parmetros precisos.
A maior parte dos bons estudos apresentados na literatura busca resolver os dois
problemas propostos com a realizao de experimentos em diferentes condies, de
forma a esquadrinhar a faixa experimental. No entanto, a carga experimental pode ser
consideravelmente reduzida com o uso de tcnicas de planejamento seqencial de
experimentos. Tais tcnicas buscam avaliar regies timas de experimentao, de
acordo com respostas possveis do(s) modelo(s). Isto permite concentrar esforos em
regies timas de experimentao e evitar regies experimentais que fornecem pouca
informao sobre a adequabilidade dos modelos e/ou sobre a preciso paramtrica.
Quando bem utilizadas, as tcnicas de planejamento tendem a reduzir
significativamente os esforos experimentais. Por exemplo, no estudo sobre a
desidrogenao de etanol a aldedo actico conduzido por FRANCKAERTS e
FROMENT (1964), foram realizados mais de quinhentos experimentos. O mesmo nvel
de confiana estatstica poderia ser obtido com apenas 25 pontos experimentais, se
utilizadas as tcnicas de planejamento seqencial de experimentos (PINTO et al., 1990).
No entanto, alguns pr-requisitos so necessrios para a utilizao de tcnicas de
planejamento seqencial de experimentos.
Para saber se um modelo descreve adequadamente o dado experimental,
necessrio conhecer a preciso com que o dado experimental medido. Isto pode ser
ilustrado na Figura 1.1, onde o mesmo modelo ajustado aos mesmos dados
experimentais com precises experimentais diferentes. Nestes casos, a pergunta: o
modelo descreve adequadamente os resultados experimentais? encontra resposta sim
para a Figura 1.1A e no para a Figura 1.1B.
O conhecimento da preciso experimental pr-requisito bsico para quaisquer
avaliaes dos dados experimentais e inferncias feitas a partir destes. Contudo, em
muitos casos a preciso experimental no conhecida pelos experimentadores. Esta
informao tambm necessria para o emprego de tcnicas de planejamento
seqencial de experimentos.
De qualquer forma, admita-se inicialmente que seja conhecida a preciso
experimental. Neste caso, as tcnicas de planejamento de experimentos essencialmente
buscam antecipar o resultado de experimentos atravs de simulaes feitas com os
3

modelos. Por exemplo, seja um modelo ajustado a dados experimentais conforme


ilustrado na Figura 1.2A. Pode-se avaliar qual a influncia de um ponto x* sobre a
preciso paramtrica, simulando o dado experimental com o modelo e avaliando como a
preciso dos parmetros seria alterada se um experimento fosse feito na condio x*,
conforme indicado na Figura 1.2B.
y

(A)

(B)
x

Figura 1.1 Ilustrao de como o mesmo modelo pode ser avaliado como (A) adequado
ou (B) inadequado, a depender da preciso experimental considerada.

y
(A)

(B)

Dado
simulado

x*

Figura 1.2 (A) Dados experimentais e ajuste de um modelo; e (B) incluso de um


dado simulado.
Se o interesse a estimao de parmetros precisos, as tcnicas de planejamento
de experimentos procuram definir a condio experimental x* que resultam na maior
preciso dos parmetros do modelo. Fica evidente que as tcnicas de planejamento de
experimentos exigem alguns conhecimentos prvios do pesquisador. importante estar
ciente que: As tcnicas de planejamento de experimentos no fazem milagres. Elas
apenas nos informam como utilizar melhor as informaes que temos. No se pode
esperar obter tudo sem informar nada. O pesquisador que faz isto costuma dizer que o
planejamento no funciona!!!! Com certa freqncia, a metodologia de tal pesquisador
tambm no funciona, mas ele no sabe disto!!!!
4

De fato, em muitas circunstncias, no se conhecem as informaes necessrias


para utilizar adequadamente as tcnicas de planejamento de experimentos. Por exemplo,
pode-se supor que um pesquisador saiba que a lei de decaimento de um reagente
exponencial na forma:
(E 1.1)

C A C A0 e t

onde CA a concentrao do reagente, CA0 a concentrao inicial do reagente, t o


tempo e o valor da constante cintica. Mas no se sabe qual o valor da constante .
A pergunta qual a condio tima de experimentao para melhor estimar ? no
tem como ser respondida, simplesmente porque no se tem idia de que valor o dado
experimental pode assumir. A avaliao de condies timas de experimentao
comea a se tornar possvel se o pesquisador puder informar que se encontra em uma
faixa; por exemplo, 0,5<<3,0. Desta forma, possvel fazer previses sobre o dado
experimental e, por conseguinte, avaliar regies timas de experimentao.
Segundo um raciocnio semelhante, no difcil imaginar que existe certa
dificuldade em prever dados experimentais para avaliar condies timas de
experimentao quando se trabalha com mltiplos modelos. Por exemplo, caso se
disponha de 15 modelos, pode-se ter pelo menos 15 respostas diferentes. Como ento
avaliar condies timas de experimentao em cenrios complexos?
Todos estes so problemas relevantes para as tcnicas de planejamento de
experimentos. Neste contexto, o objetivo principal desta tese apresentar discusses e
propostas sobre como tratar incertezas de medio e suas influncias no planejamento
das condies timas de experimentao; segundo as tcnicas de planejamento de
experimentos. Alguns aspectos relevantes sobre as funes de informao utilizadas
para formulao das tcnicas de planejamento seqencial de experimentos so
discutidos. Os problemas de estimao de parmetros precisos e discriminao de
modelos so reunidos sob um nico tratamento: a reduo da incerteza total do
problema.
O ganho de informao ou reduo da incerteza pode ser medido a partir de
conceitos da Teoria da Informao. A deciso a respeito das regies timas de
experimentao exige o emprego de alguns conceitos de Teoria da Deciso. Portanto,
importante apresentar conceitos bsicos sobre tais reas do conhecimento.

Os Captulos 2, 3, 4 e 5 apresentam revises da literatura sobre elementos de


Teoria da Deciso, a estimao de parmetros, elementos de Teoria da Informao e das
tcnicas de planejamento seqencial de experimentos, respectivamente. O Captulo 6
apresenta um estudo sobre a inferncia da incerteza experimental a partir do
conhecimento das incertezas de medio atravs do conceito de propagao de erros. O
Captulo 7 apresenta discusses, bem como alguns resultados referentes proposio e
uso de tcnicas de ao planejamento inicial de experimentos. O Captulo 8 apresenta um
tratamento multiobjetivo para os problemas de planejamento de experimentos e
estimao de parmetros precisos. O Captulo 9 apresenta uma investigao sobre as
tcnicas de planejamento para discriminao de modelos, sob a tica multiobjetivo. O
Captulo 10 apresenta a ligao entre as tcnicas de planejamento experimental para
estimao de parmetros precisos a e discriminao de modelos. O Capitulo 11 estende
os conceitos apresentados no Captulo 10 quando o foco no conhecimento dos
parmetros dos modelos, mas sim a predio. No Captulo 12 esto apresentadas as
principais concluses deste trabalho. As referncias bibliogrficas esto apresentadas no
Captulo 13. Dedues adicionais encontram-se nos Apndices.

PARTE 2 ESTADO DA ARTE

2 ELEMENTOS DA TEORIA DA DECISO


Os conceitos bsicos associados ao processo de tomada de deciso so
relativamente simples. Elementos da Teoria da Deciso esto presentes em diversas
definies estabelecidas intuitivamente por todos. As decises possveis de serem
tomadas so denominadas aqui de estratgias (s). As decises so tomadas visando
maximizar um benefcio. A medida do benefcio pode envolver o benefcio financeiro,
pessoal, sade, bem-estar, etc. Assim, de forma genrica, define-se a funo estatstica
utilidade (U) para medir o benefcio que se obtm ao se adotar determinada estratgia.
A forma da funo utilidade depende obviamente da importncia que o indivduo d a
cada aspecto que envolve sua deciso. O benefcio auferido, ou a funo utilidade,
depende da estratgia a ser tomada e de variveis que so muitas vezes desconhecidas.
As variveis desconhecidas que influenciam a utilidade so denominadas estados da
natureza (nat). As funes utilidades devem ser maximizadas. De forma anloga,
possvel definir funes de risco, perda ou lucro a serem minimizadas ou maximizadas
para que a deciso resulte no mximo benefcio possvel. A funo utilidade a ser
maximizada depende do conjunto de decises a serem tomadas e do estado
desconhecido da natureza (nat); ou seja, (U(nat,,s)) (PARMIGIANI e INOUE, 2009, pp
33-50, CHERNOFF e MOSES, 1959, pp 1,2). No presente trabalho, a funo utilidade
representa a informao obtida com os modelos, parmetros, predies, etc. Contudo, a
formulao do problema de tomada de deciso apresenta grande generalidade.
O problema de tomada de deciso costuma resultar em problemas de otimizao
multiobjetivo, para os quais a soluo conhecida como frente de Pareto (CHERNOFF
e MOSES, 1959). Critrios podem ser adotados de forma a permitir a escolha de um
nico ponto timo dentro da frente de Pareto, transformando o problema multiobjetivo
em um problema com uma nica funo objetivo a ser otimizada. No entanto, para
permitir uma compreenso da formulao do problema de tomada de deciso,
conveniente apresentar o conceito de problema multiobjetivo e sua soluo, a frente de
Pareto. Estes conceitos sero apresentados de forma sucinta, com um exemplo
ilustrativo da formulao de um problema de tomada de deciso.

2.1 Problema multiobjetivo e a frente de Pareto


Em diversos casos, o processo de tomada de deciso e de otimizao se depara
com mais de uma funo a ser otimizada, resultando em um problema multiobjetivo. A
soluo para o problema multiobjetivo a chamada frente de Pareto, constituda pelos
pontos no dominados segundo o critrio de dominncia de Pareto (CHANKONG e
HAIMES, 1989). Suponha que se deseja maximizar M funes objetivos, FO1,FO2, ...,
FOM, manipulando-se um conjunto de variveis X={x1,x2,x3,..,xNx}. Uma condio X1
dita dominada se houver alguma condio X2 tal que:
(E 2.1)

FOi X 1 FOi X 2 i 1,.., M

Se houver uma condio X2 que satisfaa (E 2.1), a condio X2 melhor do que


a condio X1 para todas as funes objetivos; portanto, X2 domina X1. Ao conjunto de
pontos no dominados d-se o nome de frente de Pareto, que constitui o conjunto de
solues timas para um problema multiobjetivo. Em outras palavras, quando o
problema multiobjetivo, o que se pode fazer eliminar pontos que sejam certamente
piores do que outros. Se uma condio no puder ser considerada sempre pior do que
outra, ento ela faz parte do conjunto de solues timas.
O conceito de dominncia fraca utilizado quando um ponto X2 melhor do que
um ponto X1 para algumas funes e igual X1 quando outras funes so consideradas.
Seja K1 o conjunto de funes objetivos cujos valores avaliados em X1 so inferior aos
valores avaliados em X2, e K2 o conjunto de funes objetivo cujos valores avaliados
em X1 so iguais aos valores avaliados em X2. Neste caso, h relaes de desigualdade e
igualdade na forma:
(E 2.2) FOi X 1 FOi X 2 e FOk X 1 FOk X 2

i K1, k K 2

Exemplo 2.1 - Formulao do problema de tomada de deciso


Para exemplificar, pode-se supor que em janeiro de 2010 um indivduo esteja
considerando no apostar nada, apostar R$100,00 ou apostar R$200,00 em duas casas
de jogos, admitindo que o So-Paulo ser campeo brasileiro em 2010 (o que ser
conhecido apenas em dezembro de 2010). Se o So-Paulo for campeo, o indivduo

ganha trs vezes o valor apostado na primeira casa de apostas e duas vezes o valor
apostado na segunda casa de apostas. Neste caso, as estratgias so cinco:

Estratgia 01 (s1), no apostar;

Estratgia 02 (s2), apostar R$100,00 reais na casa de aposta 01;

Estratgia 03 (s3), apostar R$200,00 reais na casa de aposta 01;

Estratgia 04 (s4), apostar R$100,00 reais na casa de aposta 02;

Estratgia 05 (s5), apostar R$200,00 reais na casa de aposta 02.

Os estados da natureza so dois:

Estado 01 (nat1), So-Paulo no ganha o Campeonato Brasileiro de 2010;

Estado 02 (nat2) So-Paulo ganha o Campeonato Brasileiro de 2010.

A utilidade, neste caso, o lucro que o indivduo ter ao final do campeonato.


Este lucro depende: da atitude do indivduo ou da estratgia, ou seja, em que casa
apostar e quanto apostar; e do estado desconhecido da natureza, ou seja, o resultado do
Campeonato Brasileiro de 2010. Desta forma pode-se montar uma tabela com a
utilidade para cada estado da natureza e para cada estratgia, conforme apresentado
Tabela 2.1.
Tabela 2.1 Ganho do indivduo em funo da estratgia e do estado da natureza no
Exemplo 2.1.
Estratgia

nat1 So Paulo no ganha

nat2 So Paulo ganha

s1 no apostar

0,00

0,00

s2 apostar R$100,00 na casa 01

-100,00

300,00

s3 apostar R$200,00 na casa 01

-200,00

600,00

s4 apostar R$100,00 na casa 02

-100,00

200,00

s5 apostar R$200,00 na casa 02

-200,00

400,00

O indivduo pode escolher no apostar e, conseqentemente, no ganhar nem


perder nada, independentemente do estado da natureza. Se adotar a estratgia s2
(apostar R$100,00 na casa de apostas 01), poder perder o valor apostado se o So
Paulo no ganhar o campeonato ou ganhar R$300,00 se o So Paulo vencer o
campeonato, e assim por diante.
Este exemplo pode ser utilizado para exemplificar o conceito de dominncia de
Pareto. No exemplo dado, pode-se definir uma funo utilidade para cada estado da
10

natureza. Para o estado da natureza nat1, tem-se U(nat1,s), enquanto para o segundo
estado da natureza nat2, tem-se U(nat2,s). Neste caso, pode-se observar que a casa de
apostas 02 apresenta sempre um lucro inferior ao da casa de apostas 01, ou seja: a
estratgia s2 domina a estratgia s4; e a estratgia s3 domina a estratgia s5. Portanto, as
estratgias s4 e s5 so piores do que outras e podem ser eliminadas. Pode-se observar
que no h dominncia entre as estratgias s1, s2 e s3, que, portanto, constituem a frente
de Pareto neste problema.
Graficamente, tem-se a seguinte soluo deste problema.

Figura 2.1 Utilidades dos dois estados da natureza possveis para os dados
apresentados na Tabela 2.1, sendo a frente de Pareto composta pelos pontos s1, s2 e s3
Fim do Exemplo 2.1
A escolha de um ponto especfico costuma ser feita por meio de probabilidades
dos estados da natureza ou pelo critrio Maximin. Os conceitos apresentados nas
prximas sees podem ser encontrados na literatura clssica de Teoria da Deciso
(CHERNOFF e MOSES, 1959, Cap 5).

2.2 Escolhendo um ponto da frente tima


A escolha de um ponto da frente tima costuma ser feita basicamente de duas
formas: (i) pelo critrio Bayesiano, adotando-se probabilidades para os possveis

11

estados da natureza; e (ii) maximizando a utilidade no pior caso possvel (critrio


Maximin).
2.2.1 Critrio Bayesiano
Segundo o critrio Bayesiano, a estratgia sotm escolhida com base na definio
de uma probabilidade para cada possvel estado da natureza, P(nat,i), e a subseqente
maximizao da seguinte soma ponderada:

(E 2.3)

sotm arg max s P nat ,i U nat ,i , s


i

onde: U(nat,i,s) representa a funo utilidade e P(nat,i) representa a probabilidade do


estado da natureza nat,i.
Se a varivel nat,i for contnua, a probabilidade do intervalo [nat,i, nat,i+1] pode
ser escrita como o produto da densidade de probabilidades (nat,i) pelo tamanho do
intervalo i (isto , P(nat,i)= (nat,i)i), resultando em:

(E 2.4a)

sotm arg max s nat ,i U nat ,i , s nat ,i


i

(E 2.4b)

sotm arg max s nat U nat , s d nat

A interpretao grfica do problema proposto instrutiva. Por exemplo, seja a


frente de Pareto apresentada no Exemplo 2.1, onde so dois os estados da natureza
possveis. Para exemplificar, admite-se que a probabilidade de que o So Paulo seja
campeo seja de 80% (logo a probabilidade de que o So Paulo no seja campeo de
20%). A Equao (E 2.3) escrita para este caso fica na forma:

(E 2.5)

sotm arg max s P nat ,1 U nat ,1 , s P nat ,2 U nat ,2 , s

Seja Umax o valor mximo da Equao (E 2.5), de forma que:

(E 2.6)

P nat ,1 U nat ,1 , sotm P nat ,2 U nat ,2 , sotm U max

12

Isolando U(nat,2,sotm), tem-se que:

(E 2.7) U nat ,1 , sotm

P nat ,1

U max
U nat ,1 , sotm
P

P nat ,2
nat
,2

Pode-se ento propor a representao grfica do critrio Bayesiano. A estratgia


tima (sotm), portanto, deve satisfazer a Equao (E 2.7) e pertencer frente de Pareto.

P nat ,1

Traando-se retas paralelas com inclinao


nos pontos da Figura
P nat ,2

2.1, a soluo do problema consiste em encontrar a reta que cruza a frente de Pareto,
conforme ilustrado na Figura 2.2.

U(nat2,s)

600

s3
sotm=s3
s5
s2

300

s4
s1

0
-200

-100

U(nat1,s)
Figura 2.2 Resultado grfico para a escolha de um ponto dentro da frente de Pareto no
Exemplo 2.1, de acordo com a Equao (E 2.3).
No exemplo proposto, o um somatrio P(nat,i)U(nat,i,s) representa a equao
de um hiperplano. A soluo grfica consiste em traar hiperplanos paralelos e observar
qual o hiperplano com mximo valor de P(nat,i)U(nat,i,s) que cruza a frente de Pareto.
A forma da probabilidade dos estados da natureza no foi especificada, portanto,
no h perda de generalidade quando se utiliza qualquer ponderao wi(nat) para
maximizar a funo wi(nat)U(nat,i,s). Sendo wi(nat) funo dos estados da natureza, a
soluo do problema consiste em traar as funes wi(nat)U(nat,i,s) e, de forma

13

anloga ao hiperplano, observar o ponto em que o valor mximo de wi(nat)U(nat,i,s)


cruza a frente de Pareto.
Para trs estados da natureza, pode-se traar hiperplanos paralelos e observar o
hiperplano que cruza a frente de Pareto. A Figura 2.3 apresenta a ilustrao grfica para
a escolha de um ponto, quando trs so os estados da natureza possveis. A visualizao
grfica restringe-se a trs possveis estados da natureza, embora os conceitos
matemticos apresentados aqui sejam vlidos para dimenses quaisquer.

Frente de Pareto

U(

na

t_

1 ,s

U(nat_3,s)

Planos paralelos

U(nat_2,s)

Figura 2.3 Ilustrao da frente de Pareto para trs estados da natureza e o


estabelecimento de planos paralelos para obteno grfica de um ponto timo.
Generalizao do critrio Bayesiano
De acordo com a Equao (E 2.4b), a deciso a ser tomada deve maximizar uma
utilidade mdia U (CHANKONG e HAIMES, 1983, pp 90-91). Contudo, s vezes as
probabilidades dos estados da natureza so inferidas a partir de outra varivel medida.
Neste caso, ao se adotar uma estratgia s, obtm-se uma resposta y, da qual se infere o
estado da natureza nat.
Por exemplo, seja o parmetro equivalente ao estado da natureza (nat). Uma
estratgia s refere-se a fazer certo conjunto de experimentos em condies x, cujas
respostas no fornecem o parmetro, mas sim variveis de resposta y(x). Antes de se
fazer o experimento, no se conhece y(x). Contudo, possvel inferir qual a estratgia

14

tima maximizando-se a seguinte expresso (LINDLEY, 1972, pp 18-22, MLLER e


PARMIGIANI, 1995, PINTO e PONCE DE LEON, 2006a, pp 55):

(E 2.8)

xotm arg max x y x U s, nat | y x nat d dy

O processo resulta em uma integral mltipla de difcil obteno, onde: (y(x))


a densidade de probabilidade da varivel y na condio x; U(s,nat) o valor da utilidade
para o estado da natureza nat, e |y(x)(nat) a densidade de probabilidade do estado da
natureza dado y(x). Ou seja, dada uma condio x, para cada possvel valor de y
necessrio recalcular |y(x)(nat), podendo ser obtida pelo mtodo de Monte Carlo
(MLLER e PARMIGIANI, 1995, PARMIGIANI e INOUE, 2007, pp 280, PINTO e
PONCE DE LEON, 2006a, pp 55).
2.2.2 Critrio Maximin

O critrio Maximin prope a maximizao do mnimo valor possvel para a


funo utilidade. Ao se adotar uma estratgia si, avalia-se qual o pior valor de utilidade
possvel considerando todos os estados da natureza. Este procedimento repetido para
todas as estratgias. A idia bsica do critrio pode ser resumida na Figura 2.4.
Inicie Umaxmin = -
Para i de 1 at o nmero de estratgias, faa

Umin = +
Para j de 1 at o nmero de estados da natureza, faa

U0 = U(si,nat,j)
Se (Umin > U0), ento

Umin = U0
Fim se
Fim faa
Se (Umin > Umaxmin), ento

Umaxmin = Umin
sotm = si
Fim se
Fim faa
Informe sotm
Figura 2.4 Algoritmo para determinao do timo segundo o critrio Maximin.
15

O critrio Maximin bastante conservador. A idia do algoritmo pode ser


ilustrada com os dados do Exemplo 2.1. Neste caso:

para cada estratgia, busca-se o pior valor possvel da funo utilidade;

dentre os valores mnimos (piores valores), procura-se o valor mximo.

No caso ilustrado no Exemplo 2.1, nos piores casos (ou seja, o So-Paulo no
ganhar) o indivduo perderia o valor apostado. Mas se o indivduo no apostar nada, no
perde nada. Logo, a maximizao do pior valor possvel levaria o indivduo a no
apostar nada, adotando a estratgia s1. O processo de tomada de deciso est
apresentado na Tabela 2.2.
Tabela 2.2 Ilustrao da aplicao do critrio Maximin aos dados do Exemplo 2.1.
Estratgia

Valor mnimo (pior valor)


possvel de U(nat,,s)

s1

0,00

Mximo dentre os valores

s2

-100,00

mnimos

s3

-200,00

===========

s4

-100,00

s5

-200,00

0,00
Estratgia s1

A interpretao grfica do algoritmo tambm auxilia a compreenso do


significado do critrio Maximin (a visualizao mais clara do que a descrio). Para
ilustrar a compreenso grfica conveniente considerar casos em que sejam dois os
estados da natureza possveis. O conjunto delimitado por estratgias possveis
definido como a regio vivel. A frente de Pareto um subconjunto da regio vivel.
Para a ilustrao grfica, conveniente traar a reta U(nat1,,s) = U(nat2,,s). Se houver
um ponto na frente de Pareto que pertena a esta reta, este ponto a soluo do
problema. Neste caso, independente de qual for o estado da natureza, garante-se um
valor mnimo da utilidade, j que U(nat2,,s) = U(nat1,,s).
Se no houver um ponto dentro da regio vivel (logo da frente de Pareto) que
satisfaa a reta, traam-se semi-retas paralelas aos eixos das utilidades U(nat1,,s) e

U(nat2,,s), que partem da reta original em direo ao infinito (Figura 2.6). Dentre os
pontos que pertencerem frente de Pareto e as semi-retas, buscam-se aqueles que
cruzam o mximo da reta U(nat1,,s) = U(nat2,,s), como mostrado na Figura 2.6.

16

Frente de Pareto
U(nat2,s)
Regio
vivel

Soluo
Maximin

U(nat2,s)=U(nat1,s)
U(nat1,s)
Figura 2.5 Ilustrao da soluo Maximin quando h pontos da regio vivel
pertencentes reta U(nat2,,s) = U(nat1,,s).
Na Figura 2.6A, a regio vivel encontra-se abaixo da linha U(nat1,,s) =

U(nat2,,s). O critrio Maximin busca maximizar o pior caso, ou seja, neste caso
admitindo que o estado da natureza seja nat2. Portanto, a estratgia a ser escolhida deve
maximizar U(nat2,,s), conforme ilustrado na Figura 2.6A. A Figura 2.6C anloga.
Na Figura 2.6B, a regio vivel um retngulo. Desconsiderando-se a
dominncia fraca de Pareto, a frente de Pareto seria constituda pela aresta superior da
regio vivel. A regio vivel encontra-se abaixo da linha U(nat1,,s) = U(nat2,,s); logo,
o critrio Maximin busca maximizar o pior caso (neste caso, U(nat2,,s)). Na Figura 2.6B
existem solues que apresentam igualdade em relao ao timo U(nat2,,s), na aresta
superior, que maximizam U(nat2,,s). Neste caso, h um ponto timo indicado na Figura
2.6B que apresenta dominncia fraca de Pareto sobre os pontos da aresta superior. A
estratgia que resulta neste ponto seria a escolha mais adequada.
A utilizao do critrio Maximin muito recomendada quando as conseqncias
da escolha de uma estratgia inadequada para possveis estados da natureza so
demasiadamente negativas. Por exemplo, em uma indstria onde a carga reacional
(estado da natureza) oscila grandemente, a escolha de um tipo de reator (estratgia)
para uma dada condio da carga reacional pode levar exploso do reator. Neste caso,
muito prefervel escolher estratgias que, independentemente da carga reacional, no
levem exploso do reator, ou seja, adotar o critrio Maximin.
17

U(nat2,s)
Soluo
Maximin

Regio vivel

U(nat2,s)=U(nat1,s)
U(nat1,s)
U(nat2,s)
Soluo
Maximin
Regio vivel

U(nat2,s)=U(nat1,s)
U(nat1,s)
U(nat2,s)
Regio

Soluo

vivel

Maximin

U(nat2,s)=U(nat1,s)
U(nat1,s)
Figura 2.6 Ilustrao grfica de solues Maximin.
Para trs estados da natureza, a visualizao grfica possvel, e uma ilustrao
est apresentada na Figura 2.7.
Na Figura 2.7, a funo utilidade para cada estado da natureza corresponde a um
eixo em um grfico 3D, sendo possvel obter a frente de Pareto como o conjunto de
pontos no dominados. A soluo do critrio Maximin consiste em traar a diagonal do
18

hipercubo, observando o ponto em que a diagonal cruza a frente de Pareto (conforme


ilustrado na Figura 2.7). Se no houver tal ponto, ento devem ser traados semiplanos
que partem da diagonal em direo ao infinito, observando-se o semiplano que cruza a
frente de Pareto e apresenta maior valor da diagonal (CHERNOFF e MOSES, 1959, pp
159-165). A visualizao grfica no possvel para mais de quatro estados da natureza.
Obviamente, quando a varivel contnua, a soluo grfica no pode ser visualizada,
embora os conceitos apresentados ainda sejam vlidos.

Frente de Pareto

na

t_
1,

s)

U(nat_3,s)

Ponto timo

U(

U(nat_2,s)

Figura 2.7 - Ilustrao da frente de Pareto para trs estados da natureza e o


estabelecimento de planos paralelos para obteno grfica de um ponto timo segundo
critrio Maximin.

19

3 ESTIMAO DE PARMETROS
3.1 Modelos em Engenharia Qumica
A nossa cincia pode parecer primitiva e infantil comparada com a realidade,

mas a coisa mais preciosa que temos (Albert Einstein).


Primeiramente, relevante apresentar uma reflexo sobre a modelagem dos
sistemas em Engenharia Qumica e a confiabilidade das predies dos modelos. Os
modelos so ferramentas teis para descrever a realidade. Um projetista busca nos
modelos os pontos timos de operao. Em bancada, um cientista que trabalha no
desenvolvimento de processos procura tambm o entendimento dos fenmenos atravs
dos modelos, que permitem a proposio de novas rotas e avanos tecnolgicos para o
processo estudado. Para fins prticos (viso do projetista), pouco importa se o modelo
contempla todos os fenmenos envolvidos, desde que seja uma ferramenta confivel de
predio. Assim, no interessante sofisticar a modelagem do sistema: quanto mais
simples, melhor!!! Um modelo com poucos parmetros bem estimados, ainda que no
contemple todos os fenmenos envolvidos, pode ser prefervel a modelos mais
rebuscados, com muitos parmetros mal estimados.
Contudo, sabido por experincia e lgica que, quanto mais proximamente se
descreve a realidade, melhor e mais adequadas so as previses obtidas a partir dos
modelos. Tentar descrever a realidade por modelos empricos o mesmo que tentar
encaixar um cilindro no espao de um cubo: certamente sero observadas discrepncias
em determinadas regies. Em sistemas demasiadamente complexos, a faixa de validade
de modelos empricos costuma ser consideravelmente baixa.
Por outro lado, a descrio fenomenolgica pode ser muito difcil. De fato,
necessrio salientar que a nossa incapacidade de formular bons modelos freqente, o
que faz com que o uso de modelos seja muitas vezes evitado em teses e dissertaes.
Isto ocorre especialmente em estudos de desenvolvimento de novos materiais, quando
as pesquisas fundamentam-se essencialmente em anlises fsico-qumicas e de
desempenho, majoritariamente qualitativas, e usualmente, com baixa reprodutibilidade.
Dizer o quanto uma varivel influencia a resposta muito mais difcil do que dizer que
20

uma varivel influencia a resposta. Obviamente existem perdas quando se escolher o


caminho mais fcil. No utilizar modelos dificulta significativamente a obteno de
condies timas, demandando o esquadrinhamento da faixa experimental. Alm disto,
no utilizar modelos torna as concluses menos gerais, inviabiliza as predies e retrai
avanos sobre o entendimento e aplicaes dos fenmenos investigados.
Contudo, o desenvolvimento de modelos puramente fenomenolgicos raro.
Quando possvel, a descrio fenomenolgica pode introduzir um grande nmero de
modelos admissveis, cada qual com elevado nmero de parmetros. Adicionalmente, a
quantidade de experimentos necessrios para obter uma boa discriminao de modelos e
boa estimao dos parmetros costuma ser invivel. Assim sendo, a maior parte dos
modelos simplificada e, portanto, incapaz de descrever adequadamente todos os
fenmenos envolvidos. Como o processo de estimao de parmetros no busca os
valores verdadeiros dos parmetros, mas sim os valores que minimizam uma funo
objetivo (mnimos quadrados, por exemplo), os modelos propostos conseguem bom
ajuste aos dados experimentais. Esta flexibilidade do problema faz com que muitos dos
fenmenos no considerados estejam sendo embutidos nos valores dos parmetros
estimados. Diante disto, preciso ter cautela ao discutir caractersticas fenomenolgicas
com base no valor dos parmetros.
Pelas razes apresentadas, a utilizao de modelos para predizer o
comportamento do sistema em determinadas regies pode levar a discrepncias
significativas. Muitos estudos de estimao de parmetros no fazem uma validao do
modelo em pontos experimentais diferentes daqueles utilizados para a estimao de
parmetros. Muitas vezes, os pesquisadores que procuram realizar esta tarefa encontram
diferenas significativas entre a predio e a experimentao, uma vez que os erros de
predio de modelos complexos costumam ser elevados.
A experincia permite afirmar que modelos com grande nmero de parmetros
conseguem com freqncia se adaptar aos dados experimentais, de forma a predizer
satisfatoriamente os pontos experimentais empregados no processo de estimao de
parmetros. No entanto, o emprego de poucos pontos experimentais em relao ao
nmero de parmetros do modelo pode levar a elevados erros paramtricos. O erro
paramtrico se transfere para o erro de predio, quando se utiliza o modelo para
simular as respostas em outras regies experimentais. Outro problema com freqncia
pouco mencionado em trabalhos de estimao de parmetros a correlao paramtrica.

21

Na literatura tcnica, comum observar a discusso sobre a natureza de fenmenos com


base nos valores de parmetros; contudo, sem avaliao estatstica adequada.
Grande parte dos estudos experimentais na rea de Engenharia Qumica no
apresenta rplicas para a determinao do erro experimental e posterior clculo do erro
paramtrico. Poucos trabalhos fazem uso de rotinas de planejamento seqencial de
experimentos, para avaliao de regies timas para discriminao de diferentes
modelos e/ou estimao de parmetros precisos. A validao dos modelos em diferentes
condies tambm escassa.
Diante deste cenrio, o experimentador no deve esperar milagres no ajuste de
modelos. Uma vez que grande parte dos modelos utilizados em Engenharia Qumica
essencialmente emprica ou emprico-fenomenolgica, discrepncias significativas
devem ser esperadas. Ainda assim, com base neles que somos capazes de entender
fenmenos e projetar sistemas. Um pesquisador perspicaz no deve desprezar a
importncia dos modelos, nem subestimar as ferramentas e os processos de estimao
de parmetros. So com base nas equaes de balanos e equaes constitutivas que a
Engenharia Qumica permite grandes passos para aplicaes na vida prtica.
Parafraseando a sentena inicial, a descrio da realidade obtida com o uso de
modelos utilizando modelos , de fato, primitiva e infantil; ainda assim, constitui-se
uma ferramenta muito til para consecuo das atividades de pesquisa em engenharia.

3.2 Obteno dos parmetros a partir do princpio de mximaversossimilhana


O dicionrio Aurlio define verossimilhana como qualidade do que

verossmil ou verdadeiro. De forma sucinta, o principio da mxima-verossimilhana


consiste em admitir que dados experimentais obtidos sejam os mais provveis, segundo
a densidade de distribuio de probabilidade (Z) dos dados. Seja a funo de densidade
da distribuio de probabilidade de variveis Z definida como (Z). Sejam dados
experimentais da varivel Z (Zexp) obtidos. O princpio de mxima-verossimilhana
estabelece que a probabilidade de obteno dos experimentos (ZExp) mxima. Este
princpio aplica-se a qualquer distribuio de probabilidade; i.e., no est restrito
distribuio normal (MONTGOMERY e RUNGER, 2009, pp 48, CHERNOFF, 1972,
pp 16).
Para a quase totalidade dos exemplos prticos de estimao de parmetros em
problemas de Engenharia Qumica, admite-se que as variveis so sujeitas a
22

perturbaes aleatrias segundo uma distribuio normal, com mdia igual ao valor

esperado da varivel e varincia experimental VZ; ou seja, Z Normal M Z , VZ . Neste


caso, a distribuio de probabilidades das variveis medidas pode ser descrita como:
Z exp M T V 1 Z exp M
Z
Z
Z

(E 3.1) ( Z )
exp

2
2 Pi det VZ

onde: Zexp representa um vetor das variveis medidas, Mz representa um vetor da


esperana dos valores de Z (valores verdadeiros); e VZ representa a matriz de
covarincia das variveis Z. Desta forma, a aplicao do princpio de mximaverossimilhana com distribuio de probabilidades normal implica que (ZExp)
mximo, e, por conseqncia, o termo dentro da exponencial mnimo. O termo dentro
da exponencial a ser minimizado denominado funo objetivo:

(E 3.2)

F Z exp M Z VZ 1 Z exp M Z
T

Sejam as variveis medidas experimentalmente Z() descritos por um modelo,


onde representa o vetor de parmetros do modelo, isto , ={1, 2,..., Np}.
Admitindo-se que o modelo verdadeiro, a mdia da varivel Z seria dado pelo modelo,
ou seja:

(E 3.3)

M Z Z

Portanto, a minimizao da funo objetivo em (E 3.2) pode ser obtida pela


estimao de parmetros encontrando-se os valores de est que minimizam F.
Conforme comentado anteriormente, a varivel Z engloba as todas variveis
medidas, incluindo as variveis de projeto X e as variveis de reposta Y. Os valores das
variveis de projeto medidos podem ser imprecisos e o valor real desconhecido. Neste
caso, os valores verdadeiros das variveis de projeto X podem ser obtidos no
procedimento de estimao, resultando em Xest. Neste caso, o procedimento de
estimao de parmetros tambm conhecido como reconciliao de dados
(SCHWAAB e PINTO, 2007, pp 263). Na reconciliao de dados, os valores
23

verdadeiros das variveis de projeto so desconhecidos, contudo, so obtidos durante


o procedimento de estimao na forma:

(E 3.4)

M X X est

Admitindo que o modelo descreva exatamente as variveis de resposta, o valor


da mdia das variveis de resposta MY pode ser obtido a partir do valor predito pelo
modelo YP, que por sua vez funo dos parmetros estimados est e das variveis de
projeto verdadeiras Xest; ou seja, YP(est,Xest). Por simplicidade de notao, o termo
que indica que YP funo dos parmetros e das variveis de entrada (est,Xest) ser
omitido da notao de YP(est,Xest):

(E 3.5)

M Y Y P est , X est ou M Y Y P

O processo de estimao de parmetros consiste em encontrar os parmetros e


os valores de X que minimizam a funo objetivo. As variveis de sada preditas com o
modelo YP devem ser calculadas com base nos valores estimados dos parmetros est e
de Xest. Deve ser salientado que o processo de reconciliao de dados e estimao de

parmetros so completamente anlogos. Cada uma das variveis de projeto a serem


estimadas pode ser considerado um parmetro desconhecido a ser estimado.
Se no houver correlaes entre as variveis de projeto e de resposta, os termos
que representam as covarincias entre X e Y na matriz VZ so nulos, o que permite
escrever a funo objetivo como:
(E 3.6) F Y exp Y P VY 1 Y exp Y P X exp X est VX 1 X exp X est
T

Pode-se observar que a hiptese acima feita apenas por fins prticos, j que as
correlaes das incertezas nas variveis de projeto e variveis de resposta
provavelmente no so nulas. Contudo, devido dificuldade usual de caracterizao da
matriz de covarincia dos dados experimentais, ignora-se quase sempre esta correlao.
Na realidade, a dificuldade de caracterizao das matrizes de covarincia
experimental costuma levar hiptese de medidas no correlacionadas. Desta forma,

24

tanto a matriz VY quanto a matriz VX so admitidas diagonais. Isto leva seguinte funo
objetivo:

(E 3.7)

Ny y exp y P 2 Nx x exp x est 2


k ,i
k ,i
k, j
k, j

v y , k ,i
vx , k , j
k 1 i 1
j 1

N exp

onde NExp o nmero de experimentos, Ny o nmero de variveis de sada, Nx o


nmero de variveis de projeto, vy,k,i a varincia da varivel de resposta i no
experimento k e vx,k,j o varincia da varivel de projeto j no experimento k.
Mais comumente ainda, desprezam-se as incertezas nas variveis de projeto,
levando seguinte funo objetivo:

(E 3.8)

N exp Ny

k 1 i 1

exp
k ,i

ykP,i

v y , k ,i

Resumidamente, a funo objetivo apresentada na Equao (E 3.8) foi obtida,


considerando-se distribuio normal dos valores medidos das variveis de resposta, com
mdia igual ao valor fornecido pelo modelo (hiptese do modelo perfeito) e sem erros
nas variveis de projeto. A conhecida funo de mnimos quadrados um caso
particular da Equao (E 3.8) quando se considera que as varincias das variveis de
resposta so iguais em todas as condies.

(E 3.9)

N exp Ny

y
k 1 i 1

exp
k ,i

ykP,i

Conforme apresentado, o princpio de mxima verossimilhana estabelece que


os parmetros devam ser ajustados de forma a maximizar a densidade probabilidade

(Z), ou seja:

(E 3.10)

est arg max Z exp , arg min F

25

No jargo estatstico, o estimador representa a equao adotada para estimar os


parmetros, que deve levar em conta a distribuio de probabilidade dos dados medidos
e o modelo considerado (as expresses (E 3.1), (E 3.2), (E 3.6), (E 3.7), (E 3.8) e (E 3.9)
so estimadores). Se a esperana do parmetro estimado for igual do valor verdadeiro
do parmetro, diz-se que o estimador no apresenta desvios sistemticos e no
tendencioso (do ingls, unbiased). Caso contrrio, h um desvio sistemtico no
procedimento adotado para estimar o parmetro e o estimador dito tendencioso (do
ingls, biased) (MONTGOMERY e RUNGER, 2009, pp 144-145):
(E 3.11a)

E est verd 0

Estimador no tendencioso (unbiased)

(E 3.11b)

E est verd 0

Estimador tendencioso (biased)

Neste trabalho, considera-se que os modelos so perfeitos e capazes de descrever


exatamente os dados experimentais, e no havendo erros sistemticos nos parmetros
estimados. Esta hiptese freqentemente no vlida para os modelos de Engenharia
Qumica, mas costuma ser adotada mesmo quando existe sabida incapacidade de
formular bons modelos.
3.2.1 A matriz VZ

Os elementos da matriz VZ podem ser representados na forma Vz=[vz i,j]. O


elemento diagonal [vz i,i] fornece a varincia da varivel zi. Os elementos que esto fora
da diagonal principal fornecem as covarincias entre as variveis. Na maior parte dos
trabalhos, desprezam-se diversos (seno todos) os elementos posicionados fora da
diagonal principal da matriz VZ. Isto se deve principalmente ao desconhecimento
experimental dos termos desta matriz.
No entanto, o desempenho de tcnicas de estimao de parmetros e de
planejamento de experimentos pode ser prejudicado pela desconsiderao dos termos
que esto fora da diagonal da matriz VZ. Por exemplo, DETTE et al. (2008) concluram
que as tcnicas de planejamento de experimentos perdiam consideravelmente sua
eficincia

ao desprezar os termos fora da diagonal da matriz de incertezas

experimentais ao estudar modelos lineares nos parmetros. ATKINSON et al. (2007, pp


441-443) apresentam um exemplo no qual a considerao de variveis fortemente
correlacionadas leva a planejamentos timos que tendem a distribuir ao mximo os

26

pontos na regio de busca, enquanto o planejamento timo para variveis no


correlacionadas concentra os experimentos em algumas regies experimentais.
SANTOS e PINTO (1998) concluram que consideraes inadequadas sobre as
covarincias das incertezas experimentais levam a concluses equivocadas sobre os
valores de parmetros e adequabilidade de modelo.
Ainda que a matriz VZ seja caracterizada corretamente por dados experimentais,
um problema pertinente passa a ser a inverso da matriz VZ para os clculos baseados na
funo objetivo. Variveis fortemente correlacionadas dificultam muito a inverso da
matriz VZ, o que pode comprometer avaliaes da funo objetivo baseada na hiptese
de normalidade. Na presente tese discute-se como obter a matriz VZ a partir de alguns
conhecimentos bsicos sobre o sistema. Alguns problemas relacionados inverso da
matriz VZ sero discutidos no Captulo 6.

3.3 A incerteza paramtrica


No processo de estimao, no so observados diretamente os parmetros ,
mas sim os valores das variveis Zexp. Se a informao contida em Zexp pode ser
transferida para sem perdas de informao (i.e., no h perda de informao ao se
calcular a partir dos valores de Zexp), a varivel Zexp dita estatisticamente suficiente
para . Esta, no entanto, dificilmente a realidade dos problemas de Engenharia
Qumica.
A informao da incerteza paramtrica comumente caracterizada pela matriz
de covarincia das incertezas paramtricas (V). A matriz V pode ser obtida a partir
dos dados experimentais da seguinte forma (ver APNDICE A).

(E 3.12)

Z T
Z
V
VZ 1

onde Z representa as variveis obtidas com o modelo, avaliadas nas condies das
variveis estimadas no procedimento de estimao, composto por variveis de projeto
estimadas Xest e valores das variveis de resposta preditas com o modelo YP, calculadas
com base em est e Xest.

27

Se no houver correlao entre variveis de projeto (X) e as variveis de resposta


(Y), os termos da matriz VZ que envolvem a covarincia entre X e Y so nulos. Neste
caso, pode-se escrever:

P
Y P T
1 Y
V '
V
Y

(E 3.13)

onde V representa a matriz de covarincia das incertezas paramtricas, envolvendo


unicamente parmetros (excluem-se as variveis de projeto reconciliadas). A matriz de
derivadas

Y
P

conhecida como matriz de sensibilidade, representada

usualmente por B, na forma:

(E 3.14)

Y P
B

Portanto, a matriz de incertezas paramtricas poderia ser representada por:

(E 3.15)

V ' BT VY 1 B

Devido total semelhana entre o procedimento de reconciliao de dados e de


estimao de parmetros, no ser feita distino entre as matrizes V e V.
3.3.1 Interpretao estatstica da incerteza paramtrica

A forma mais usual de estabelecer as incertezas paramtricas costuma ser a


representao por intervalos de confiana, na forma:

(E 3.16)

verd
est
jest j
j j j

onde: jest representa o valor estimado do parmetro; jverd representa o valor


verdadeiro (e desconhecido) do parmetro; e j representa o erro do parmetro. Para
determinar o erro do parmetro, geralmente admite-se que os parmetros tambm
possuem distribuio normal. Isto estritamente vlido apenas se as variveis medidas

28

Z possurem distribuio normal e: (i) os modelos forem lineares nos parmetros; ou (ii)
os erros experimentais forem suficientemente baixos, (iii) ou o nmero de pontos
experimentais for muito elevado (CHERNOFF, 1972). Neste caso, o erro paramtrico
costuma ser representado por (SCHWAAB e PINTO, 2007, pp 296-297):

(E 3.17)

j u v j , j

onde u representa um valor obtido da distribuio normal com grau de confiana , e

v j , j representa o elemento diagonal j da matriz V. Interpretaes equivocadas do


intervalo de confiana dos parmetros na literatura so comentadas por BUZZIFERRARIS e MANENTI (2009) e BUZZI-FERRARIS (2000).
A Equao (E 3.17) apresenta o seguinte significado estatstico para modelos
com um nico parmetro: se forem repetidos infinitas vezes o mesmo conjunto de
experimentos, se o modelo for perfeito e a varincia paramtrica for de fato
representada por jj, ao estabelecer o erro na forma da Equao (E 3.17), por cento
das vezes o parmetro estimado estar no intervalo especificado que contm o valor
verdadeiro. Conseqentemente, (1-) por cento das vezes o parmetro verdadeiro no
estar dentro do intervalo de confiana calculado.
Em grande parte dos trabalhos, os autores consideram que o parmetro uma
mdia obtida a partir de valores amostrais, e tanto parmetro quanto dados
experimentais so normalmente distribudos. Neste caso, a distribuio paramtrica
segue a distribuio t-Student, e a incerteza do parmetro pode ser representada por
(SCHWAAB e PINTO, 2007):

(E 3.18)

j t , Ngl v j , j

onde Ngl o nmero de graus de liberdade, dado por Ngl=NExp.Ny-Np. A Equao (E


3.18) mais conservadora do que a Equao (E 3.17), i.e., t,Nglu; contudo, para
elevados graus de liberdade, o valor de t,Ngl tende ao valor de u.
No obstante, a utilizao de intervalos de confiana pouco representativa da
incerteza paramtrica para modelos multiparamtricos, para os quais ferramentas de
avaliao numricas so recomendadas (SCHWAAB e PINTO, 2007 pp 290-306). A
matriz de covarincias paramtricas (V) cheia, mesmo quando a matriz de
29

covarincias experimentais diagonal (SCHWAAB, 2007). Ou seja, h informao


sobre o erro paramtrico nos termos fora da diagonal da matriz. Contudo, os intervalos
de confiana fazem uso apenas da diagonal da matriz V, no carregando a informao
dos elementos fora da diagonal.
Em problemas de minimizao onde a aproximao quadrtica da funo
adequada, a matriz Hessiana positiva definida e caracteriza a regio de mnimo
(EDGAR e HIMMELBLAU, 1989, pp 149). Seja a aproximao quadrtica da funo
objetivo na regio de mnimo, de acordo com uma expanso em srie de Taylor
truncada no termo quadrtico:

(E 3.19)

F F est
F est

T
1
est 2 F est

Conforme demonstrado no APNDICE A, a matriz das derivadas segundas,


tambm conhecida como matriz Hessiana, pode ser escrita em termos da matriz V da
seguinte forma:

(E 3.20)

2 F 2 V

No ponto de mnimo, a derivada da funo objetivo em relao aos parmetros


nula. Logo, a Equao (E 3.19) pode ser escrita da seguinte forma:

(E 3.21)

F F est est V 1 est


T

Sendo a aproximao quadrtica da funo adequada, ao estabelecer um limite


para a diferena F F est c, delimita-se uma regio no espao dos parmetros que
descreve os dados experimentais com certa preciso. Todos os parmetros dentro da
regio descrevem a funo objetivo melhor ou igual aos parmetros na fronteira da
regio. O lado direito da Equao (E 3.21) representa a equao de um hiper-elipside,
geometria geralmente utilizada para descrever a incerteza paramtrica. Se a
aproximao quadrtica na regio de mnimo for adequada, isto tambm valido para o
lado esquerdo da Equao (E 3.21). Para um modelo com dois parmetros, a Figura 3.1

30

ilustra o conjunto de todos os parmetros dentro da regio delimitada pelo limite

F F est c.

Figura 3.1 Ilustrao da regio dos parmetros delimitados por uma equao

F F est c de um modelo com dois parmetros 1 e 2.

Isto introduz a idia de regio de confiana dos parmetros. A regio de


confiana dos parmetros representa o conjunto de parmetros que descrevem
adequadamente os dados experimentais, e so diversas as formas para se obt-la.

Quando se trabalha com a funo objetivo, necessrio estabelecer o limite de


corte c para a desigualdade F F est c, de maneira que se possa determinar o
conjunto de parmetros que descrevem a funo com igual ou melhor preciso do que o
limite de corte. Para avaliar a incerteza paramtrica, admite-se usualmente que os
parmetros tambm possuem distribuio normal. Conforme comentado, esta afirmao
vlida apenas para problemas lineares nos parmetros; ou quando os erros
experimentais so suficientemente baixos; ou nmero de pontos experimentais muito
elevado. Se os parmetros tambm possuem distribuio normal, a distribuio de
probabilidade dos parmetros pode ser escrita como:

(E 3.22)

2 Pi det V

Np

est T V 1 est

exp

31

O termo dentro da exponencial

est T

V 1 est exatamente o

mesmo obtido na Equao (E 3.21) e representa uma soma de variveis normalmente


distribudas ponderadas por suas respectivas varincias, definindo a forma da funo
estatstica chi-quadrado. Espera-se que a funo chi-quadrado se encontre dentro de
limites especficos, uma vez conhecidos o nmero de graus de liberdade e o grau de
confiana. Neste caso, o nmero de graus de liberdade dado pelo nmero de
parmetros e o grau de confiana deve ser especificado. Assim, espera-se que o valor de

est T

V 1 est se encontre dentro de faixas especificadas pela funo chi-

quadrado, conforme apresentado abaixo:

(E 3.23)

est T

2
V 1 est Np
,

onde 2Np, o valor mximo da funo chi-quadrado para Np graus de liberdade e nvel
de confiana . A Equao (E 3.23) a equao de uma hiper-elipside e exata apenas
no caso de modelos lineares nos parmetros. Um exemplo ilustrado pode ser visualizado
na Figura 3.2. Sejam pontos experimentais obtidos com preciso conhecida, conforme
indicado na Figura 3.2A, e a varivel dependente (y) descrita por um modelo linear em
relao varivel independente (x). Todas as retas (y=1x+2) apresentadas na Figura
3.2A descrevem adequadamente os resultados experimentais. Na realidade, se forem
calculados todos os conjuntos dos parmetros 1 e 2 que descrevem adequadamente os
resultados experimentais, a regio de confiana dos parmetros ganha a forma mostrada
na Figura 3.2B.
(A)

(B)

Figura 3.2 - Ilustrao de: (A) possveis retas que descrevem os resultados
experimentais adequadamente e; (B) regio de confiana dos parmetros 1 e 2.
32

Uma forma anloga que gera resultados semelhantes para a regio de confiana
pode ser estabelecida avaliando-se diretamente a funo objetivo (BARD, 1974, pp 190,
SCHWAAB e PINTO, 2007, 360-363). A funo no ponto de mnimo F apresenta a
forma da funo chi-quadrado com NExpNy-Np graus de liberdade. A funo

F F est tambm uma funo com forma da funo chi-quadrado com Np graus
de liberdade. A razo entre duas funes chi-quadrado resulta em uma funo F de
Fisher, especificado o grau de confiana. Desta forma, todos os valores dos parmetros
para os quais vlida a relao abaixo so definidos dentro da regio de confiana.

(E 3.24)

F F est

est

Np

FFNp
, Ngl
N Np

onde FFNP
, Ngl o limite superior da distribuio F de Fisher, com Np e Ngl graus de

liberdade e com grau de confiana , sendo Ngl=NExp*Ny-Np (nmero de pontos


experimentais menos o nmero de parmetros). Embora tambm se baseie na hiptese
de distribuio normal dos parmetros, a Equao (E 3.24) no restringe a forma da
regio de confiana geometria elptica. Deve ser salientado que a no linearidade dos
modelos pode levar a formas pouco esperadas da regio de confiana. Isto ocorre
porque as hipteses simplificadores consideradas para a obteno da forma elptica
pressupem que os parmetros apresentem distribuio normal, o que vlido apenas
para modelos lineares nos parmetros, ou erros experimentais pequenos ou quando o
conjunto de dados experimentais elevado. SCHWAAB et al. (2008a) demonstraram
que formas complexas da regio de confiana, incluindo regies desconexas e no
convexas, podem ser obtidas para modelos no lineares.
Vale ressaltar que as caractersticas geomtricas da funo objetivo nas
proximidades do mnimo esto contidas na matriz de covarincia paramtrica V se a
distribuio dos parmetros tambm for normal. Tais caractersticas costumam ser mais
bem visualizadas pela decomposio da matriz V em valores e vetores caractersticos.
Decompondo-se a matriz de covarincia dos parmetros*:

A decomposio da matriz V obtida resolvendo V Dvc=Dvc., que leva equao

V =Dvc..Dvc-1. Como V simtrica, pode-se demonstrar que D-1=DT (SCHWAAB e PINTO, 2007,
pp190), o que por fim resulta em V= Dvc..DvcT.

33

(E 3.25)

est T

V 1 est est Dvc 1 DvcT est


T

onde Dvc representa a matriz de vetores caractersticos e representa a matriz diagonal


de valores caractersticos resultantes da decomposio de V. A multiplicao dos eixos

est T

pela matriz de vetores caractersticos Dvc resulta em uma rotao de eixos,

que representam os eixos da hiper-elipside da regio de confiana. Em outras palavras,


os vetores caractersticos Dvc indicam as direes da inclinao dos eixos da hiperelipside. Se os vetores caractersticos possurem a mesma direo dos eixos originais, a
hiper-elipside no inclinada. Os valores caractersticos esto relacionados ao
comprimento de cada eixo da hiper-elipside (SCHWAAB e PINTO, 2007, pp 184-193,
BOX e DRAPER, 1987, pp 332-345, EDGAR e HIMMEUBLAU, 1989, pp 143-149).
No caso da Figura 3.1, a elipse no inclinada, o que indica que os vetores
caractersticos possuem praticamente o mesmo sentido dos eixos originais dos
parmetros. A inclinao da elipse na Figura 3.2B indica correlao entre os valores dos
parmetros. Isto significa que os valores de 1 que pertencem regio de confiana
apresentam grande dependncia dos valores de 2, e vice-versa. Uma indicao do
sentido geomtrico dos valores e vetores caractersticos para os exemplos da Figura 3.1
e Figura 3.2B est apresentada na Figura 3.3.
(A)

(B)

------ Eixo proporcional raiz do autovalor 1


...... Eixo proporcional raiz do autovalor 2
-----Direo do autovetor 1
.......Direo do auto vetor 2

------ Eixo proporcional raiz do autovalor 1


...... Eixo proporcional raiz do autovalor 2

-----Direo do autovetor 1
.......Direo do auto vetor 2

Figura 3.3 Ilustrao do sentido geomtrico de valores e vetores caractersticos


aplicados s regies de confiana apresentadas nas: (A) Figura 3.1 e (B) Figura 3.2.
A correlao entre os parmetros dificulta a anlise dos resultados, uma vez que
a faixa vlida para um parmetro dependente dos valores dos demais parmetros.
Quando a elipse inclinada, conforme ilustrado na Figura 3.2B, os termos fora da

34

diagonal principal de V so significativos para a representao apropriada da regio de


confiana. Como a anlise da significncia destes termos depende dos valores das
varincias paramtricas (particular para cada caso), comumente realizada a
normalizao da matriz (V), para visualizao mais fcil da dependncia entre os
parmetros. O resultado a matriz de correlao dos parmetros, cujos termos podem
ser calculados da seguinte forma:

(E 3.26)

i , j

vi , j
vi ,i

v j , j

A matriz de correlao apresenta termos entre zero e um em valores absolutos (a


diagonal obviamente unitria). Quanto mais prximos da unidade forem os valores
absolutos fora da diagonal, mais correlacionados esto os parmetros e maior a
inclinao da hiper-elipside. Esta correlao indesejada, principalmente por dois
fatores:

compromete a avaliao da importncia dos parmetros;

dificulta a minimizao da funo objetivo.

A correlao dos parmetros pode ser induzida por: (i) experimentos mal
planejados; (ii) modelo escrito de forma inadequada; (iii) caracterstica intrnseca do
modelo e dos dados experimentais obtidos. Nos casos (i) e (ii), os problemas podem ser
resolvidos com a escolha de experimentos adequados e reparametrizao do modelo.
Contudo, pode haver modelos de difcil reparametrizao, que induzam a uma
correlao inevitvel dos parmetros. Trabalhos de SCHWAAB e PINTO (2007a),
SCHWAAB et al. (2008b) e SCHWAAB e PINTO (2008) demonstraram como a
reparametrizao pode eliminar a correlao entre os parmetros de expresses
cinticas.
Um importante aspecto que ser de grande valia nesta tese a obteno do

volume da regio de confiana. Admitindo que a aproximao elptica da regio de


confiana uma forma adequada de descrever das incertezas paramtricas, o volume da
regio de confiana (VCR) proporcional multiplicao dos eixos da hiper-elipside.
Conforme ilustrado na Figura 3.3, os eixos das elipses so proporcionais raiz quadrada
dos valores caractersticos da matriz . A matriz uma matriz diagonal, cuja diagonal

35

dada por ={1,2,..,Np}. Logo, a relao de proporcionalidade entre o volume da


regio de confiana e os valores caractersticos da matriz escrita como:

(E 3.27)

VCR i
i

Por sua vez, o produtrio dos valores caractersticos da matriz igual ao


determinante da matriz V, ou seja:
(E 3.28)

| V |

onde |.| representa o determinante. Substituindo-se (E 3.28) em (E 3.27), obtm-se que


o volume da regio de confiana proporcional raiz quadrada do determinante de V,
ou seja:

(E 3.29)

VCR | V |

As tcnicas usadas para a determinao das regies de confiana dos parmetros


descritas anteriormente fazem uso de avaliaes da funo objetivo. H outras formas
de determinao da regio de confiana dos parmetros, destacando-se a tcnica de
Bootstrap (KONISHI e KITAGAWA, 2008, Cap 8). Esta tcnica basicamente consiste
em gerar valores aleatrios das variveis Z (utilizando um computador), dentro da faixa
especificada de impreciso das variveis medidas, e re-estimar os parmetros para cada
conjunto de valores gerados aleatoriamente. Todos os parmetros estimados constituem
a regio de confiana dos parmetros. O mtodo de Bootsrap no restringe a regio de
confiana a nenhuma forma especfica e uma forma bastante representativa da
incerteza paramtrica. Contudo, o esforo computacional elevado (COVER e
THOMAS, 1991, WASSERMAN, 2006).

A decomposio da matriz V resulta em Dvc..Dvc-1. Pela propriedade de determinantes, o

determinante da multiplicao de matrizes a multiplicao do determinante das matrizes. Logo, tem-se


que |V| pode ser ecrito como |Dvc| x || x |Dvc-1|=|Dvc| x |Dvc-1| x ||=|DvcDvc-1| x ||=|I| x ||= ||, onde I
a matriz identidade, cujo determiante 1. Como || diagonal, seu determiante dado por (i).

36

Um equvoco comum confundir parmetros bem estimados com modelo


adequado. Por exemplo, segundo a Equao (E 3.24), quanto maior o nmero de pontos
experimentais, menor o termo do lado direito da equao. Portanto, para um nmero
muito grande de pontos experimentais, o hiper-elipside fica limitado por um pequeno
conjunto de valores e o erro paramtrico pequeno. Isto acontece mesmo em casos em
que o modelo no descreva adequadamente os resultados experimentais. Ou seja,
parmetros bem estimados no so sinnimos de modelos adequados. A avaliao do
modelo tambm pode ser feita por testes estatsticos, conforme apresentado a seguir.

3.4 Qualidade dos modelos


3.4.1 Adequabilidade do modelo

No jargo estatstico, um modelo costuma ser representado como uma hiptese


(H). Aps a estimao de parmetros de cada modelo, pode-se obter o valor da
densidade de probabilidades de cada modelo (por exemplo, para distribuio normal,
basta calcular a Equao (E 3.1) com os parmetros estimados). Logo, para M modelos,
tem-se que:
H Modelo 1

1 Z Dens. de prob. do modelo 1

H 2 Modelo 2

2 Z Dens. de prob. do modelo 2

.....
H M Modelo Nmod

M Z Dens. de prob. do modelo M

Deve-se ento aplicar testes estatsticos, levando em conta a distribuio de


probabilidades dos dados, para avaliar a adequabilidade dos modelos (LAZIC, 2004, pp
22-29). Uma das formas avaliar a razo de verossimilhana para duas hipteses H(1) e

H(2), definida como (WALD, 1947, Cap 3, WETHREILL, 1966, Cap 2, CHERNOFF,
1972, Cap 9, PARMIGIANI, 2004):

(E 3.30)

r 1,2

1 Z

2 Z

Dois modelos so distintos se (i) possurem formas matemticas distintas; ou (ii) a mesma

forma matemtica, mas valores de parmetros distintos. Por exemplo, y=exp(-1x) e y=exp(-2x) podem
ser considerados dois modelos distintos, ou duas hipteses.

37

Quanto maior o valor de r(1,2), maior a tendncia de que o modelo 1 seja melhor
do que o modelo 2. Para escolha do modelo 1 em detrimento do modelo 2 ou vice-versa,
a razo r(1,2) deve encontrar-se acima ou abaixo de limites especificados. Obviamente,

r(1,2)=1 indica que o ajuste feito com o modelo 1 idntico ao ajuste do modelo 2.
Definindo-se limites A e B (B <1<A), possvel fazer as seguintes avaliaes:

r 1,2 A
r

1,2

Modelo 1 melhor do que Modelo 2


Modelo 1 pior do que Modelo 2

B r 1,2 A Os modelos no podem ser ditos distintos


Os limites A e B devem ser escolhidos com base nos riscos associados escolha
errada dos modelos. Os testes estatsticos estabelecem quase sempre a avaliao das
hipteses tomadas duas a duas. til considerar um exemplo simples com trs modelos.
Exemplo 3.1 - Sejam considerados trs modelos, de forma que:

modelo 1 no melhor do que modelo 2 (B<r(1,2)<A);

modelo 1 melhor do que modelo 3 (r(1,3)>A);

modelo 2 no melhor do que modelo 3 (B<r(2,3)<A).

Neste caso, o modelo 1 melhor do que o modelo 3 e, portanto, o modelo 3


pode ser desconsiderado. No entanto, o modelo 1 no pode ser dito melhor do que o
modelo 2, mesmo que o modelo 2 e o modelo 3 no sejam estatisticamente diferentes.
Os modelos finais seriam, portanto, o modelo 1 e 2. Experimentos adicionais deveriam
ser conduzidos para avaliar se o modelo 1 de fato melhor do que o modelo 2.
Fim do Exemplo 3.1

Esta forma de avaliao de modelos til, sobretudo quando no se tem boas


avaliaes das incertezas experimentais. Neste caso, no est sendo avaliado se os
modelos predizem bem os dados experimentais com a preciso do experimento, mas
sim se os modelos so estatisticamente diferentes entre si. Deve ser salientado que a
caracterizao da incerteza experimental fundamental para avaliao da qualidade dos
modelos; no entanto, isto em muitos casos no feito na prtica.
Em funo do desconhecimento da incerteza experimental, a funo de mnimos
quadrados, Equao (E 3.9), comumente utilizada. Para dois modelos distintos, a

38

razo entre as funes objetivos pode ser avaliada por um teste estatstico para
distribuio normal. Seja a razo:

(E 3.31)

FF

exp

yi(1) P

exp

yi(2) P

onde: o numerador representa a funo objetivo do modelo 1; o denominador representa


a funo objetivo do modelo 2, yiexp representa o dado experimental do experimento i
e yi(1) P e yi(2) P representam os dados calculados com o modelo 1 e modelo 2,
respectivamente. O termo no numerador pode ser entendido como a varincia total do
modelo 1; analogamente, o termo no denominador pode ser entendido como a varincia
total do modelo 2. Se os dados so normalmente distribudos, a comparao entre duas
varincias geralmente feita pelo teste F-Fisher (SCHWAAB e PINTO, 2007, 166168). O teste F-Fisher estabelece que, com grau de confiana , as varincias dos
modelos no podero ser ditas diferentes se a seguinte condio for satisfeita.
(E 3.32)

FFmin FF FFmax

onde FFmin o valor de FF para o qual a distribuio de probabilidade acumulada F-

1
Fisher com Ngl(1) e Ngl(2) graus de liberdade seja igual a
, e FFMax o valor
2
1
para o qual a distribuio de probabilidade acumulada F-Fisher seja
. O nmero
2
de graus e liberdade Ngl(1) igual ao nmero de pontos experimentais menos os
parmetros do modelo 1 e o nmero de graus e liberdade Ngl(2) igual ao nmero de
pontos experimentais menos os parmetros do modelo 2. Desta forma, se a desigualdade
em (E 3.32) no for satisfeita, os modelos podem ser ditos diferentes com nvel de
confiana e um dos modelos ser considerado melhor do que o outro. Ou seja,
possvel avaliar a adequabilidade comparativa de modelos. Quando a preciso
experimental no conhecida, os modelos podem ser avaliados comparativamente,

O significado estatstico do teste F apresentatdo no APNDICE C

39

resultando na escolha de um ou mais modelos; contudo, possvel que os modelos


escolhidos sejam completamente inadequados.
O modelo se mostra adequado se a varincia de predio do modelo for da
mesma ordem da varincia experimental. Em alguns casos, comparam-se pelo teste F as
varincias do modelo e da medida experimental (abaixo ilustrado para varincia
experimental constante) (SCHWAAB e PINTO, 2007, pp 232-235).
Ny

(E 3.33)

FFmin

y
i 1

exp

yi(1) P

Ny v y

FFmax

Se o modelo bom, a varincia do modelo ( yi exp yi(1) P ) deve ser da


2

mesma ordem da varincia experimental.


A comparao pelo teste F-Fisher ou pelo teste chi-quadrado devem levar a
resultados semelhantes. Conforme comentado anteriormente, a funo chi-quadrado
uma somatria do quadrado de variveis normalmente distribudas, ponderadas pelas
suas respectivas varincias. A funo objetivo apresentada na Equao (E 3.2) apresenta
a forma da funo chi-quadrado, sendo a forma mais adequada para avaliao da
qualidade de modelos com muitas variveis de resposta e varincia experimental
dependente da condio empregada. A curva de densidade de distribuio de
probabilidades de uma funo chi-quadrado est ilustrada na Figura 3.4.
A partir do valor da funo objetivo no ponto de mnimo (F(est)), e
especificado o nmero de graus de liberdade, possvel obter o valor da probabilidade
(Pr(2 F(est))) associada funo objetivo. A interpretao estatstica desta funo
a seguinte: sendo os erros normalmente distribudos e o modelo perfeito, se o mesmo
grupo de experimentos fosse repetido infinitas vezes, Pr(2= F(est)) vezes o valor da
funo objetivo seria menor do que o valor (F(est)). Isto permite concluir que valores
muito altos ou muito baixos de Pr(2 F(est)) costumam indicar problemas em relao
ao modelo. Valores muito altos sugerem que os erros obtidos no se devem apenas a
oscilaes aleatrias, mas provavelmente ao emprego de um modelo ruim. Valores
muito baixos indicam excessiva preciso de predio, superior preciso da medida
experimental, o que sugere superparametrizao do modelo. comum adotar um nvel

40

de confiana () e estabelecer limites mximo e mnimo para o valor da funo objetivo,


segundo a distribuio 2 com Ngl (Ngl=NExpNy-Np) graus de liberdade, na forma:

(E 3.34)

1
2

2
Ngl

(Ngl2)

est
2
F Ngl

2
Pr Ngl
F est

F(est)

F est

2
Ngl
d Ngl2

Ngl2

Figura 3.4 Forma caracterstica da funo chi-quadrado.

3.4.2 Varincia de predio

A varincia de predio do modelo resultado da soma da varincia de predio


devido incerteza dos parmetros e da varincia experimental do ponto. Ou seja, o
modelo sempre mais incerto do que o dado experimental.
Sejam os valores dos parmetros verdadeiros dados por verd, com os
correspondentes valores das variveis Zverd. Se os parmetros fossem estimados
realizando-se infinitas vezes o mesmo conjunto de experimentos, as incertezas nas
variveis calculadas poderiam ser obtida expandindo-se em srie de Taylor a varivel Z,
ou seja:

(E 3.35a)

VZP E Z Z verd Z Z verd

(E 3.35b)

VZP E Z Z

41

A varincia de predio pode ser escrita conforme apresentado na Equao (E


3.36) (ver APNDICE D).
T

(E 3.36)

Z
Z
VZP
V
VZ

Realidade
1(y)
x

Modelo

(A)

2(y)

(C)

(B)
Figura 3.5 Ilustrao da densidade de distribuio de probabilidade dos: (A) dados
experimentais; e (B) dados experimentais e modelo. A Figura (C) mostra as
distribuies de probabilidade do dado experimental e do modelo para uma dada
condio x* (y=1x+ 2, vy y).
A Figura 3.5 ilustra o comportamento da varincia experimental e da varincia
de predio do modelo, para um modelo linear y=1x+2, com varincia experimental
proporcional ao valor da medida. Neste caso, a distribuio de probabilidade do dado
experimental normal, com mdia dada por y=1x+2 e varincia experimental vy
proporcional ao valor de y. O modelo apresenta distribuio normal, com mdia
y=1x+2 e varincia vyPvy.

Os conceitos apresentados aqui esto relacionados com a informao sobre


modelos, parmetros, predies, etc. Como os objetivos dos procedimentos de
42

estimao de parmetros e planejamento seqencial timo esto relacionados obteno


de informao a partir dos dados experimentais, necessrio conhecer formas
adequadas para quantificar a informao. O Captulo 4 apresenta os conceitos bsicos
sobre conceitos de Teoria da Informao, de forma a contextualizar as medidas de
informao que sero apresentadas nos Captulos subseqentes.

43

4 ELEMENTOS DA TEORIA DA INFORMAO


Este captulo tem por objetivo apresentar conceitos bsicos da Teoria da
Informao, utilizadas nesta tese como ferramentas de planejamento de experimentos.
GILBERT (1958) define:
...Informao uma medida do custo e do tempo de algo que particular do
uso de um engenheiro em seu papel de projetar experimentos...

Esta frase descreve bem a utilidade da caracterizao da informao em


problemas de planejamento de experimentos e estimao de parmetros voltados
engenharia. Ronald Fisher na dcada de 1920 foi pioneiro em estabelecer formas de
mensurar a informao de parmetros estimados a partir de dados experimentais, por
meio da hoje conhecida informao de Fisher. Contudo, a Teoria da Informao
estendida para sistemas discretos teve sua base lanada por Claude Shannon em sua tese
de doutorado dcadas depois, propondo a entropia da informao como forma de
avaliar a quantidade de informao necessria para decodificao de sinais. Avanos
subseqentes baseados na proposta de Shannon foram propostos por diversos
pesquisadores, sendo descrita de forma sucinta nesta tese o critrio de divergncia de
Kullback-Leibler e a informao de Lindley.

4.1 Informao de Fisher


FISHER (1935, pp 239-241) props que a informao sobre parmetros fosse
medida pela inversa da matriz de covarincia paramtrica, J=V-1, onde J denominada
matriz de informao de Fisher. A literatura tcnica costuma apresentar a matriz de
informao de Fisher definida da seguinte forma (CHERNOFF, 1972, pp 16-23):

(E 4.1)

ln Z ln Z T
J E

44

onde (Z) a distribuio de probabilidade dos dados experimentais (para distribuio


normal, (Z) seria dado pela Equao (E 3.1).
Admitindo-se que os dados sigam a distribuio normal, pode-se demonstrar que
a matriz de informao de Fisher dada por (APNDICE B):
T

(E 4.2)

J V

Z
1 Z

VZ

que exatamente o inverso da Equao (E 3.14), apresentada no Captulo 3.


Quando o nmero de dados experimentais elevado, o Teorema do Limite
Central estabelece que os parmetros tendem a uma distribuio normal. Isto ocorre
mesmo quando a distribuio de probabilidades dos dados no normal (CHERNOFF,
1972, pp 21). Logo, acredita-se que a distribuio de probabilidades dos parmetros
possa ser descrita por Normal verd , V verd . O princpio de mximaverossimilhana estabelece que os dados obtidos sejam representativos da mdia
verdadeira e da varincia verdadeira; ou seja, acredita-se que Vest = Vverd e est= verd.
Na realidade, os valores estimados tendem assintoticamente aos valores verdadeiros
para um nmero de amostras suficientemente elevado.
Conforme comentado no Captulo 2**, o estimador representa a equao
utilizada para estimar o parmetro. Um estimador T1 domina sobre outro estimador T2
se a varincia do parmetro determinada com o estimador T1 for menor do que a
varincia do parmetro determinada com o estimador T2; ou seja (COVER e THOMAS,
1991, pp 327):

(E 4.3)

E T1 E T2

A desigualdade de Cramer-Rao procura demonstrar que a varincia obtida com


um determinado estimador ser sempre maior do que a varincia verdadeira do
parmetro. Uma vez que o valor da varincia paramtrica obtida segundo o princpio de
mxima-verossimilhana tende assintoticamente varincia verdadeira dos parmetros,

**

Estimador definido na pgina 25

45

espera-se que a varincia obtida com um estimador T2 seja sempre maior ou igual ao
inverso da matriz de informao de Fisher, ou seja:
(E 4.4)

VT 2 V

Conforme apresentado no Captulo 3, informaes sobre caractersticas


geomtricas da funo objetivo em relao aos parmetros esto contidas na matriz de
covarincia paramtrica (V), a inversa da informao de Fisher (J). Um valor nico da
informao I pode ser dado por mtricas especficas da matriz de informao de Fisher
(J), como determinante, trao, menor valor caracterstico, etc. Ou seja, a informao
pode ser dada por:

(E 4.5)

I det J

ou

I tr J

ou

I min ValCar J

Estes conceitos so amplamente utilizados para determinar condies timas de


experimentao para estimao de parmetros precisos, conforme ser descrito no
Captulo 5. Embora a matriz de informao de Fisher tenha sido definida por Fisher por
volta da dcada de 1920, a Teoria da Informao comeou a tomar forma dcadas
depois com trabalhos de Claude Shannon, conforme segue.

4.2 Entropia da informao de Shannon


Claude Shannon, em seu artigo clssico (SHANNON, 1948), fundou as bases do
que veio a ser Teoria da Informao. Esta teoria permitiu estabelecer formas de
quantificar

informaes,

sendo

inicialmente

desenvolvida

para

descrever

armazenamento e a transferncia de dados. Desenvolvimentos posteriores permitiram


aplicaes da teoria em diferentes campos da cincia, como engenharia eltrica,
estatstica, fsica, economia, entre outras (COVER e THOMAS, 1991).
4.2.1 Variveis discretas

Focando na capacidade de distinguir duas seqncias de smbolos, HARTLEY


(1928) havia proposto que a informao poderia ser mensurada pela forma logartmica
H=n*logNH, onde NH representava o nmero de smbolos possveis, e n representava o

nmero de smbolos na transmisso. Segundo analogia com a segunda lei da

46

termodinmica, SHANNON (1948) estendeu este conceito de forma muito mais ampla,
propondo como medida da informao a entropia da informao, caracterizando a
quantidade mnimia de bits (ou outra unidade a depender da base logartmica utilizada)
necessrios para descrever uma mensagem obtida de uma varivel aleatria X. Segundo
SHANNON (1948), se uma varivel X={x1, x2, .., xN} representa um conjunto possvel
de valores aleatrios, com probabilidades de ocorrncia PD = {PD1, PD2,..., PDN}, a
quantidade de informao necessria para caracterizao da varivel fica:
N

(E 4.6)

H ( X ) PDi ( xi ) log b PDi ( xi )


i 1

A base logartmica b determina a unidade da informao: b=2 equivale a bits,


enquanto b=e equivale a nats, embora muitas vezes a medida absoluta de entropia no
apresenta qualquer significado (KULLBACK, 1959).

H(x2|x1)

H(x1)

H(x2)

Figura 4.1 Entropia de duas variveis x1 e x2 e informao mtua de x1 e x2.


Dentre as diversas propriedades da entropia da informao definida por Shannon
destaca-se o princpio de que a informao no prejudicial (do ingls, information
never hurts) (COVER e THOMAS, 1991). Considerando duas variveis (x1, x2), a

informao total necessria para quantificar o sistema pode ser escrita como:

(E 4.7)

I ( x1 , x2 ) H ( x1 ) H ( x2 ) H ( x2 x1 )

onde H(x2|x1) a entropia de x2 que obtida a partir do conhecimento de x1. Ou seja,


uma varivel x1 pode fornecer informaes sobre uma varivel x2, conforme ilustrado na
Figura 4.1, o que reduziria a incerteza sobre x2.
47

Quanto menor a entropia, menor a quantidade de informao necessria para


descrever o sistema (cenrio desejvel). No entanto, para variveis contnuas, a entropia
no guarda todas as propriedades das variveis discretas, conforme mostrado a seguir.
4.2.2 Variveis contnuas

Para variveis contnuas, a entropia pode ser definida como (COVER e


THOMAS, 1991):

(E 4.8)

H ( X ) ( x) log b ( x) dx
X

onde (x) a densidade de probabilidades da varivel x. A entropia de variveis


contnuas no mantm todas as propriedades da entropia das variveis discretas. Por
exemplo, a entropia de variveis contnuas pode ser negativa. Alm do mais, a equao
(E 4.8) no pode ser deduzida da Equao (E 4.6). Tomando-se como limite PDi(xi)=
(xi), com tendendo a zero, a entropia ficaria igual a -. A entropia diferencial

tambm no invariante escala, uma vez que H(cX) cH(X), onde c uma constante
(SOOFI, 1994).
Devido a estes problemas, mais comum utilizar medidas relativas de entropia.
Tais comparaes avaliam diferenas entre duas distribuies de probabilidade. Uma
srie de medidas de informao relativas entre duas distribuies de probabilidade so
propostas na literatura (KONISHI E KITAGAWA, 2008, pp 31). Dentre estas, destacase a entropia relativa ou o critrio de Kullback-Leibler, conforme descrito a seguir.

4.3 Entropia relativa: critrio de divergncia de Kullback


Leibler (DKL)
Sejam duas distribuies de probabilidades (1)(y) e (2)(y) propostas para
explicar a distribuio da varivel y. Um critrio de entropia relativa como medida de
informao foi proposto por KULLBACK e LEIBLER (1951). Os autores definiram
que a informao de y para discriminao de (1)(y) em relao (2)(y) poderia ser
calculada como o logaritmo da razo de mxima-verossimilhana entre (1)(y) e (2)(y),

. De forma semelhante razo de mxima-verossimilhana (Seo


3.4.1), quanto maior o valor de log
, melhor o modelo 1 em relao ao modelo 2
isto , log

(1) ( y )
(2) ( y)

(1) ( y )
(2) ( y)

48

(KULLBACK e LEIBLER, 1951, KULLBACK, 1959, pp 3-7). Se a hiptese (1)(x) for


verdadeira, o valor mdio de log

(E 4.9)

(1) ( y )
(2) ( y)

pode ser calculado como:

DKL ( (1) || (2) ) (1) ( y ) log b

(1) ( y )
dy
(2) ( y )

ou seja, DKL((1)||(2)) pode ser entendido como a informao contida em 1 para


discriminar entre 1 e 2. Por consistncia, admite-se que (2)(y) no nula no intervalo
de definio de (1)(y), caso contrrio, poderia haver uma diviso por zero. Uma diviso
por zero indica que (2)(y) no pode ser utilizada para explicar (1)(y).
Interpretaes no rigorosas consideram que: (i) DKL((1)||(2)) uma medida da
informao perdida quando se utiliza (2) para explicar (1), sendo (1) a distribuio
verdadeira dos dados; ou analogamente (ii) o ganho de informao quando (2)
substituda por (1), sendo (1) a distribuio verdadeira ou mais confivel (EMMERTSTREIB e DEHMER, 2009, pp 189, SOOFI, 1994, STOICA E SELEN, 2004).
O critrio proposto sempre positivo e invariante reparametrizao. No
entanto, o critrio apresenta a desvantagem de no ser simtrico; ou seja,
DKL((1)||(2))DKL((2)||(1)). Isto importante, j que praticamente nunca conhecida a

distribuio verdadeira dos dados. Desta forma, em alguns trabalhos considera-se como
critrio de informao a soma das divergncias mtuas de probabilidade, conforme
proposto por JEFFREYS (1946):

(E 4.10)

J KL DKL (1) || (2) DKL (2) || (1)

Outra desvantagem do critrio proposto o fato de haver comparaes apenas


entre duas distribuies de probabilidade. Em muitos casos diversos modelos no
poderiam avaliados simultaneamente com uma nica frmula, mas comparados dois a
dois.
Uma aplicao especial da divergncia de Kullback-Leibler consiste na
avaliao de duas distribuies de probabilidades dadas por curvas normais. Neste caso,
o critrio de divergncia pode ser escrito como (KULLBACK, 1959):

49

(E 4.11) DKL (1) || (2) 1 (1) (2) T V (2) 1 (1) (2) log V

(2)
(1)

tr V (2) 1 V (1) N

onde M o vetor de mdias e V a matriz de covarincias das distribuies. Os


sobrescritos 1 e 2 indicam as distribuies, |.| representa o determinante da matriz, tr
representa o trao da matriz e N o nmero de variveis das distribuies.
Ligaes entre o critrio de divergncia de Kullback-Leibler e o princpio de
mxima-verossimilhana podem ser estabelecidos. Alm disto, tais conceitos tambm
so teis para estabelecer as bases da informao de Lindley, conforme mostrado a
seguir.

4.4

Informao de Lindley
A informao de Lindley foi originalmente desenvolvida com base na Teoria da

Informao e utilizada posteriormente sob a tica da Teoria da Deciso (PARMIGIANI


e INOUE, 2009, pp 277).
A Teoria da Deciso busca otimizar funes objetivos como custo, lucro, risco,
etc. No entanto, em muitos casos busca-se apenas fazer inferncias sobre distribuies
de probabilidades dos dados; ou seja, a informao a funo a ser maximizada. Este
problema tratado formalmente pelo conceito de informao de Lindley (BERNARDO,
1979).
Lindley props que a informao de um experimento poderia ser quantificada,
avaliando-se a modificao da distribuio de probabilidades dos parmetros
investigados. Em outras palavras, admita-se que um parmetro inicialmente apresente
distribuio de probabilidades (). Como a distribuio de probabilidades deste
parmetro |Y*( ) seria modificada ao se realizar um experimento X*, obtendo-se como
resposta Y*? LINDLEY (1956) props que o ganho de informao poderia ser
determinado, avaliando-se a diferena da entropia referente distribuio de
probabilidades do parmetro antes de fazer o experimento com a entropia aps fazer o
experimento. Diversas referncias apresentam em mais detalhes os conceitos de
informao de Lindley (PARMIGIANI e INOUE, 2009, Cap 13, LINDLEY, 1972, pp
72-73).
Sejam os parmetros com distribuio de probabilidade () a partir de
alguns experimentos 0. A princpio, uma srie de funes utilidades em termos de ()
poderiam ser definidas para avaliar a informao do parmetro, como funes
50

quadrticas, logartmicas, etc. O logaritmo da probabilidade amplamente utilizado em


estatstica para descrever a informao, como por exemplo, no caso da entropia de
Shannon. BERNARDO (1979) apresenta uma explanao terica a favor da utilizao
da forma logartmica da funo utilidade, quando decises envolvem a escolha de
funes de densidade de probabilidades, indicando consistncia da informao de
Lindley (PARMIGIANI e INOUE, 2009, pp 193-199, SINGPURWALLA, 2006, pp
162, BERNARDO e SMITH, 2000, pp 153-154). Aplicaes estatsticas normalmente
definem a funo utilidade como o valor esperado do logaritmo da densidade de
probabilidades do parmetro, na forma:

(E 4.12)

U E log

O valor mdio desta funo utilidade dado por:

(E 4.13)

U log d H

que exatamente o negativo da entropia (H) da informao associada aos parmetros.


Suponha que se deseja saber como a entropia mudaria aps a realizao um novo
conjunto de experimentos , consistindo de uma nova condio experimental X*
resultando em uma varivel de resposta Y*. Aps fazer , ou seja, um experimento na
condio X*, sendo Y* o resultado do experimento, seria obtida a informao sobre os
parmetros , que teriam sua distribuio de probabilidade modificada para |Y*() (um
exemplo apresentado no APNDICE E). A probabilidade () dita probabilidade a
priori (antes) e |Y*() dita probabilidade a posteriori (depois) do experimento .

Logo, a utilidade ficaria na forma:

(E 4.14)

U | X * |Y * log |Y * d H |Y *

Espera-se que a entropia da informao H|Y* aps a realizao do experimento Y*


seja menor que a entropia inicial H, antes da realizao experimento. O ganho de
informao referente ao experimento poderia ser medido como esta diferena na
entropia ou utilidade, na forma:

51

(E 4.15a)

Lindley U |Y U
*

(E 4.15b) Lindley |Y * log |Y * d log d


(E 4.15c)

Lindley log d |Y log |Y d

(E 4.15d)

Lindley H H |Y

No entanto, na forma apresentada na Equao (E 4.15a-d), pode ocorrer que a


entropia do parmetro aumente, ao invs de diminuir. Isto poderia acontecer se o novo
experimento revelasse que sabemos menos do parmetro do que imaginvamos
conhecer, indicando um ganho negativo de informao ao se fazer o experimento. Este
problema pode ser evitado se, ao invs de calcularmos a utilidade antes de fazer o
experimento com relao distribuio a priori, calcularmos a utilidade com relao a
distribuio a posteriori, ou seja:

(E 4.16)

U E

|Y *

log

A Equao (E 4.13) indica o quanto de informao imaginvamos ter antes de


fazer o experimento. A Equao (E 4.16) indica o quanto de informao tnhamos de
fato antes do experimento; contudo, observando isto com base na informao que temos
depois do experimento. Desta forma, o ganho do experimento pode ser dado por:

(E 4.17a)
(E 4.17b)

Lindley U |Y U
*

Lindley |Y log |Y d |Y log d

(E 4.17c)

Lindley |Y log
*

d

|Y *

que assume a forma do critrio de divergncia de Kullback-Leibler, das distribuies a


posteriori e a priori do experimento em X* com resultado Y*. Por conseqncia, o ganho

de informao sempre positivo. Segundo LINDLEY (1956), um experimento timo


se maximizar (E 4.17c), o que equivale a aumentar a distncia existente entre a
distribuio a posteriori e a distribuio a priori. Ou seja, um bom experimento
52

aquele que mais reduz a entropia da distribuio de probabilidades do parmetro,


conforme ilustrado na Figura 4.2.

()

(A)

Y*()

Y*()

(B)

(C)

Figura 4.2 Ilustrao das distribuies a priori (A) e a posteriori de um experimento


ruim (B) e um experimento bom (C).
A Figura 4.2A representa a distribuio a priori (antes do experimento). A
Figura 4.2B representa a distribuio a posteriori de um experimento ruim, que pouco
influenciou a distribuio do parmetro. J a Figura 4.2C apresenta a distribuio a
posteriori de um experimento bom, que modifica significativamente a distribuio de

probabilidades do parmetro, resultando em menor incerteza.


Pode ser observado que a funo de informao de Lindley, embora aplicado
comumente estimao de parmetros , pode tambm ser aplicado minimizao da
incerteza das variveis de resposta Y (CLYDE, 2004). Neste caso, a equao poderia ser
re-escrita da seguinte forma:

(E 4.18)

Lindley |Y Y log
*

Y
dY
Y
|Y *

Por exemplo, pode-se considerar a Figura 3.5 apresentada no Captulo 3,


representando a distribuio de probabilidades de uma varivel y, descrita por um
modelo linear y=1x+ 2. A distribuio de probabilidades de uma varivel y para cada
condio x dada por uma curva de distribuio normal; ou seja, para uma condio
especfica de xesp, tem-se y(xesp) e sua correspondente distribuio de probabilidades

53

(yesp(xesp)), conforme ilustrado na Figura 3.5C. Agora, suponha que seja feito um

experimento qualquer em x*, obtendo-se y* como resposta. Este experimento resultaria


em um ganho de informao sobre o modelo; ou seja, a distribuio de probabilidade
seria modificada para todas as condies de x, o que incluiria xesp, sendo a densidade de
distribuio de probabilidades |y*(y(xesp)). O ganho de informao sobre a distribuio
de probabilidades em y para uma condio xesp fica na forma:

(E 4.19)

y x dy
y x

Lindley | y y xesp log


*

| y*

esp

esp

importante salientar que o ganho de informao escrito na Equao (E 4.19)


est sendo avaliado para uma nica condio de x (xexp). Esta pode ser uma funo de
informao utilizada para o planejamento de experimentos, avaliando em que regies de
experimentao o ganho de informao esperado mximo.

54

5 PLANEJAMENTO SEQENCIAL DE EXPERIMENTOS


5.1 Introduo
Os principais objetivos do planejamento seqencial de experimentos costumam
ser:
Discriminao de modelos: verificar, dentre os modelos propostos, qual o
modelo que melhor descreve os resultados experimentais (modelo verdadeiro);
Estimao de parmetros precisos: estimar de forma precisa os parmetros dos
modelos em questo, especialmente do melhor modelo.
Estes objetivos so atingidos atravs da constante atualizao dos parmetros
dos modelos, na medida em que so realizados os experimentos. luz de dados
experimentais disponveis at o momento, as tcnicas de planejamento permitem avaliar
as melhores regies experimentais para que se atinjam os objetivos especificados, como
discriminar modelos ou estimar de forma precisa os parmetros do modelo.
Boa parte da literatura aborda os problemas de discriminao de modelos e de
estimao de parmetros apenas para modelos lineares nos parmetros. Isto ocorre
porque a soluo destes problemas relativamente simples, e porque como modelos
empricos so usualmente lineares nos parmetros. Contudo, em problemas de
Engenharia Qumica, o uso de tais modelos freqentemente no possvel.
A no linearidade do modelo exige que o experimentador informe ao
procedimento de planejamento os valores dos parmetros dos modelos. Contudo, esta
exatamente uma das informaes que se buscam. De acordo com COCHRAN (1973),
neste cenrio, seria possvel imaginar um dilogo entre um estatstico e um
experimentador, conforme ilustrado a seguir.
Diga-me o valor do
parmetro, e eu te
direi
a
melhor
condio para estimar
o parmetro

ESTATSTICO

Quem precisa de voc?

EXPERIMENTADOR

55

Outra informao necessria a preciso de cada medida experimental.


Contudo, geralmente o comportamento do erro experimental nas diferentes condies
de experimentao no conhecido. Esta informao negligenciada na maior parte
dos casos. Em alguns problemas, a principal fonte de erro conhecida, como no caso
em que a impreciso concentrada nos equipamentos de medida (cromatgrafo, por
exemplo). Ou seja, o uso adequado das tcnicas de planejamento de experimentos exige
informaes que o experimentador geralmente no dispe. Por isto o planejamento
costuma ser influenciado negativamente pela ausncia de tais informaes.
Apesar dos problemas relatados anteriormente, o uso das tcnicas de
planejamento de experimentos , sem dvida alguma, vantajosa quando se deseja
utilizar modelos como ferramentas de anlise e predio. Ao invs de informar os
valores verdadeiros dos parmetros, o experimentador pode sempre fornecer ao
planejamento bons chutes iniciais, obtidos a partir de um conjunto mnimo de
experimentos ou da experincia prvia. A preciso das medidas, na ausncia de outra
alternativa, pode ser considerada uniforme a partir de rplicas realizadas em um nico
ponto. Na medida em que novos experimentos vo sendo realizados, os parmetros
podem ser atualizados e as condies para o prximo experimento podem ser
determinadas de forma mais precisa.
Ao se dar incio ao planejamento seqencial de experimentos, geralmente so
realizados alguns experimentos exploratrios iniciais. A escolha destes experimentos
normalmente realizada com base em planejamentos fatoriais. De posse de experimentos
iniciais (e de modelos possveis), pode ser feita a estimao dos parmetros e a anlise
da qualidade do ajuste obtido com os diferentes modelos. Uma vez estimados os valores
dos parmetros para os diferentes modelos, a partir do conjunto inicial de experimentos,
possvel realizar previses para os diferentes modelos e identificar que regies
experimentais so mais adequadas para atingir os objetivos desejados. Assim, o
prximo experimento pode ser realizado na condio indicada pelas tcnicas de
planejamento. Os valores dos parmetros podem ser re-estimados aps a adio do novo
ponto experimental e as regies experimentais mais adequadas para atingir o objetivo
desejado podem ser reavaliadas. O procedimento pode ser repetido at que os objetivos
sejam atingidos ou at o momento em que se verifique que os objetivos no podero ser
atingidos. Este procedimento est ilustrado na Figura 5.1 (SCHWAAB, 2007).

56

Conjunto de experimentos
iniciais (0)

Modelos possveis

Faa o(s)
experimento(s)

Estimao de parmetros dos modelos

Sim

O objetivo pode ser


atingido?

Avaliao da qualidade dos parmetros


e qualidade do modelo

O(s) objetivo(s) foi(ram) atingido(s)?


No
Sim

Pare
No

Avalie a melhor
regio experimental
para se atingir o
objetivo especificado,
otm

Trabalho finalizado
Figura 5.1 Algoritmo do planejamento seqencial de experimentos.
As tcnicas de planejamento de experimentos se baseiam em idias
relativamente simples e intuitivas. Na traduo matemtica destas idias, na forma de
rotinas computacionais, infelizmente so perdidos potenciais usurios destas tcnicas.
Deve ser salientado que a constante interao do pesquisador com o planejamento,
atravs do uso das ferramentas de planejamento disponveis, pode reduzir
consideravelmente o esforo experimental. Alm disto, o uso destas tcnicas permite a
obteno de concluses com fundamentao estatstica e avaliaes consistentes sobre a
qualidade dos parmetros e das previses dos modelos.
Os dois principais objetivos (discriminao de modelos e estimao de
parmetros

precisos)

costumam

ser

buscados

separadamente.

Realizam-se

separadamente os procedimentos para a discriminao entre os diferentes modelos e


para a estimao precisa de parmetros dos modelos. A literatura reporta uma srie de
funes de informao para a obteno dos objetivos desejados. Uma reviso sobre as
critrios de planejamento para a estimao de parmetros precisos, discriminao de

57

modelos, alm da apresentao de tcnicas de planejamento robusto e de critrios


multiobjetivos de planejamento ser feita nas sees seguintes.

5.2 Algumas definies bsicas


De acordo com a Figura 5.1, considera-se que um conjunto inicial de
experimentos 0 j tenha sido realizado. Define-se como um conjunto de experimentos
que esto sendo planejados. A literatura tcnica costuma apresentar da seguinte forma:
X 1 X 2 X 3 ... X NX
(E 5.1)
wX1 wX 2 wX 3 ... wX NX

onde Xi representa a condio experimental i e wX i representa o peso dado condio i.


Por exemplo, um plano experimental com trs condies experimentais pode ser dado
por:

(E 5.2)

X 1

X2

X3

No planejamento acima, 50% dos experimentos devem ser concentrados na


condio X1 e 25% dos experimentos devem ser concentrados nas condies X2 e X3.
Embora seja interessante para avaliao de condies timas, este tipo de representao
do planejamento pode no ser realista. Por exemplo, pode-se supor que um
experimentador deseja tomar trs amostras em um experimento dinmico. Neste caso,
no h como concentrar metade das coletas na condio X1 e 25% das coletas nas
condies X2 e X3. Neste caso, os pesos devem ser fixados e a busca feita para obter os
tempos timos.
Para planejar experimentos, define-se uma funo de informao qq(), onde o
sobre-escrito qq indica qualquer funo de informao, associada discriminao de
modelos e/ou estimao de parmetros precisos. Buscam-se as condies experimentais
que maximizem a funo de informao, ou seja:

(E 5.3)

otm arg max qq

58

5.3 Estimao de parmetros precisos


Esta seo aborda os critrios de estimao de parmetros precisos quando
apenas um modelo considerado. A literatura prope vrios critrios para a estimao

de parmetros precisos. Os critrios propostos incluem a reduo de caractersticas


geomtricas da regio de confiana e a minimizao da correlao entre os parmetros.
Essencialmente, a maior parte das funes de informao minimiza alguma
combinao entre os termos da matriz de covarincias posterior dos parmetros ( VP ). A
matriz denominada de covarincias posterior porque calculada com base nos
experimentos que esto sendo planejados, admitindo-se que os valores dos parmetros
no iro ser alterados significativamente com a realizao destes novos experimentos.
Pode-se estimar como a matriz VP mudaria aps serem realizados os
experimentos adicionais a priori, ou seja, antes de se realizar . Isto feito a partir do
conhecimento da matriz V calculada com os experimentos j realizados 0, a matriz de
sensibilidade B() em relao ao planejamento e a matriz de erros experimentais VY
em . Para isto, considera-se que os dados possam ser gerados com o modelo em
questo; desta forma, a matriz VP pode ser obtida a partir da matriz V atravs da
seguinte equao (BARD, 1974, pp 262):

(E 5.4)

VP BT VY B V 1

Conforme comentando na Seo 3.3.1 do Captulo 3, a forma da regio de


confiana admitida como elptica, o que estritamente vlido apenas para modelos
lineares nos parmetros e na presena de flutuaes experimentais normalmente
distribudas. Ainda assim, esta simplificao quase sempre adotada, devido
complexidade de obteno e manipulao de formas mais realsticas para a regio de
confiana dos parmetros.
As dimenses da regio de confiana podem ser caracterizadas por combinaes
matemticas dos termos da matriz (V). De acordo com o que foi apresentado na Seo
3.3.1, as diagonais da hiper-elipside so proporcionais raiz quadrada dos valores
caractersticos da matriz V (={1, 2, .., N}), conforme ilustrado na Figura 5.2.

59

1
1

Figura 5.2 Ilustrao da regio de confiana de um modelo linear.


Os critrios de otimizao de VP so classificados de acordo com o tipo de
mtrica proposta a partir dos termos da matriz de covarincias das incertezas
paramtricas e nomeados de acordo com uma ordem alfabtica. Os principais critrios
de estimao de parmetros precisos so (ATKINSON et al., 2007, KIEFER 1959,
PINTO e PONCE DE LEON, 2006, pp 26-29):

D-timo ou critrio do volume - minimiza o determinante da matriz ( VP ) ou a

multiplicao dos valores caractersticos da matriz, minimizando o volume da


regio de confiana dos parmetros;

E-timo ou critrio da forma - minimiza a razo entre o maior e menor eixo da

hiper-elipside (maior valor caracterstico dividido pelo menor valor


caracterstico de VP );

A-timo ou critrio do trao - minimiza a soma da diagonal principal da matriz

( VP ), diminuindo assim a diagonal do hipercubo que circunscreve a hiperelipside;

C-timo - minimiza uma soma ponderada dos parmetros;

G-timo - minimiza a mxima varincia de predio;

I-timo ou V-timo - minimiza a integral, ao longo de uma regio experimental,

da varincia de predio.

60

Trabalhos com interface em modelos de Engenharia Qumica empregaram ou


desenvolveram estudos de caso utilizando tais critrios, conforme sumarizado por
FRANCESCHINI e MACCHIETTO (2008a). Por exemplo, so reportadas aplicaes a
estudos cinticos convencionais (FROMENT e MEZAKI, 1970, ISSANCHOU et al.,
2005), bem como estudos de casos para modelos de Monod (DETTE et al., 2005, 2009),
Michaelis-Menten (DETTE e WONG, 1999, DETTE e BIEDERMANN, 2003),
decaimento exponencial de concentraes (DETTE e NEUGEBAUER, 1997,
BIEDERMANN et al., 2007), entre outros.
Os critrios D, E, A e C-timo focam os parmetros, enquanto os critrios G e I
timos focam a predio. Contudo, os critrios focados na predio podem tambm
resultar em parmetros bem estimados, conforme demonstrado como um dos resultados
do Teorema da Equivalncia Geral. Um dos principais resultados do Teorema da
Equivalncia Geral estabelece que, sob certas condies, o plano experimental timo

para um critrio pode ser timo tambm para um segundo critrio (ATKINSON et al.,
2007, pp 122-123). Com grande freqncia, este teorema aplicado aos critrios Dtimo e G-timo, ou seja, a otimizao do critrio D-timo tambm leva a otimizao do
critrio G-timo. O teorema foi proposto originalmente por KIEFER e WOLFOWITZ
(1960) com rigor estatstico para modelos lineares nos parmetros. Esta extenso pode
ser feita para modelos no lineares aplicando-se expanses em srie de Taylor da funo
objetivo (WHITE, 1973, BARD, 1974, pp 262-265), conforme discutido amplamente no
Captulo 3. DETTE e OBRIEN (1999) salientam que as vantagens dos critrios focados
na predio a invarincia reparametrizao dos parmetros do modelo.
O critrio da forma (E-timo) tende a minimizar a correlao entre os
parmetros; contudo, perde-se esta caracterstica se o problema contiver mais de dois
parmetros. A principal desvantagem do critrio da forma concentrar experimentos na
diminuio da incerteza de um parmetro, cujo erro pode ser difcil de ser minimizado
(PINTO et al., 1990).
FRANCESCHINI e MACCHIETTO (2008a) salientam que, em sua forma
original, o uso do critrio A-timo desencorajado por diversos autores, principalmente
para problemas que apresentam elevada correlao entre os parmetros, uma vez que
no considera os termos fora da diagonal principal. Contudo, conforme salientado por
PINTO et al. (1990), este critrio apresenta um carter flexvel, assemelhando-se ao
critrio da forma quando uma das diagonais muito superior s demais, ou ao do
volume, quando as diagonais apresentam valores prximos.
61

Um problema que de fato afeta os critrios A-timo e E-timo a diferena de


ordem de grandeza das varincias dos parmetros, devido s unidades empregadas. Por
exemplo, a varincia na temperatura pode se encontrar na ordem de 10C, enquanto a
varincia na concentrao pode estar na faixa de 1x10-3mol/L. Neste caso, a varincia
na temperatura predominaria sobre a varincia da concentrao e as unidades
influenciariam os critrios A-timo e E-timo. PINTO et al. (1991) propuseram a
normalizao das varincias para minimizao deste problema.
Observa-se na literatura o uso mais freqente do critrio do volume (D-timo).
Uma vantagem associada a este critrio a invarincia com respeito a algumas
transformaes aplicadas nos parmetros, como re-escalamento (FRANCESCHINI e
MACCHIETTO, 2008a). Uma desvantagem que o critrio D-timo tende a dar grande
importncia para parmetros aos quais o modelo mais sensvel (PINTO et al., 1990),
concentrando todo o esforo experimental para a estimao de um nico parmetro do
modelo. Minimizar o volume da regio de confiana (VCR) equivale a maximizar o
determinante da matriz de informao de Fisher, ou seja:
(E 5.5)

min VCR
min V P
max J P

Aps serem feitos experimentos em , a distribuio de probabilidades dos


parmetros dada por (), com entropia igual a ln d . A minimizao
da entropia leva otimizao do critrio D-timo, como demonstrado rigorosamente
para modelos lineares nos parmetros (LINDLEY, 1956, CHALLONER e
VERDINELI, 1995). Esta concluso pode ser estendida para modelos no lineares,
admitindo-se distribuio normal dos parmetros (BARD, 1974, pp 261-262).
Em muitos casos utilizam-se formas simplificadas para clculo da matriz VP ,
principalmente pelo desconhecimento de termos importantes, como a varincia
experimental VY e a prpria matriz de covarincias dos parmetros V. Por exemplo, em
muitos casos busca-se maximizar o determinante da matriz BTB, que uma

Conforme apresentado na pgina 36, minimizar o volume da regio de confiana (VCR)

equivale a minimizar a multiplicao dos valores caractersticos (i) da matriz VP. Isto equivale a
minimizar o determinante da matrz VP, que, por sua vez, equivale a maximizar o determinante da matriz
de informao de Fisher, o que est apresentado em (E 5.5):

62

simplificao da Equao (E 5.4), obtida quando se considera que os termos da matriz


V so elevados, que a matriz VY diagonal e que os erros experimentais so constantes

(BOX e LUCAS, 1959). Ao fazer isto, contudo, o planejamento pode ser distorcido pela
ausncia destas informaes (PINTO et al., 1990).
Outros critrios foram propostos na literatura para minimizar as correlaes
existentes entre os parmetros. PRITCHARD e BACON (1978) propuseram um critrio
de minimizao da norma das correlaes entre os parmetros, de acordo com a
seguinte funo:
12

(E 5.6)

Ccorrel

NP 1 NP
ij2

2
i 1 j i 1 Np Np

onde ij a correlao entre os parmetros i e j e Np o nmero de parmetros. No


entanto, conforme salientado por alguns autores (FRANCESCHINI e MACCHIETTO,
2008a, AGARWAL e BRISK, 1985b), embora tais planejamentos tendam a produzir
regies esfricas, as dimenses das diagonais da hiper-elipside obtida podem ser muito
elevadas.
Para conciliar os critrios tradicionais com a diminuio da correlao entre os
parmetros, FRANCESCHINI e MACCHIETTO (2008b) apresentam quatro formas
para obteno de planejamentos timos segundo critrios tradicionais; no entanto,
sujeitos s restries associadas ao valor da correlao entre os parmetros. Por
exemplo, o plano experimental a ser escolhido deve maximizar um critrio de
informao, sendo a correlao entre dois parmetros i e j (ij) menor ou igual a uma
correlao mxima permitida (ij). O problema de otimizao pode ser entendido da
seguinte forma (onde |.| representa o determinante):
(E 5.7)

otm arg max | J P |


st. ij max

i 1, Np j 1, Np j i

onde |JP| o determinante da matriz de informao de Fisher.


Outra abordagem para diminuio da correlao entre os parmetros a
reparametrizao, bastante reportada na literatura (ARGAWAL e BRISK, 1985a, BOX,
1960). SCHWAAB e PINTO (2007b), SCHWAAB et al. (2008b) e SCHWAAB e

63

PINTO (2008) demonstraram que possvel minimizar a correlao entre os parmetros


de expresses de taxa de reao por meio da reparametrizao.
preciso salientar que o desempenho dos mtodos apresentados fortemente
influenciado pelas estimativas iniciais dos parmetros do modelo. Por causa disto, os
experimentos iniciais exercem uma grande influncia em todo o planejamento
subseqente. Alguns trabalhos procuram propor planejamentos iniciais para a estimao
de parmetros precisos, sem que experimentos prvios tenham sido realizados. Nestes
casos, dispe-se de faixas admissveis para os parmetros, sendo que os planejamentos
mais adequados empregam critrios robustos, como ser apresentado na Seo 5.5.
Antes, contudo, uma primeira descrio sobre a discriminao de modelos ser
apresentada se Seo 5.4.

5.4 Discriminao de modelos


A discriminao de modelos deve ser realizada quando mais de um modelo
descreve adequadamente os resultados experimentais, sendo necessria a realizao de
mais experimentos para que um modelo se confirme como o modelo verdadeiro. A
maior parte dos procedimentos de discriminao pressupe a disponibilidade de um
nmero inicial de experimentos, de forma que seja possvel realizar a estimao de
parmetros destes modelos a partir dos experimentos iniciais. Como os parmetros dos
modelos so conhecidos de forma aproximada, possvel realizar simulaes, sendo
tambm possvel obter a resposta dos modelos em qualquer condio experimental. A
literatura apresenta uma srie de trabalhos focados em modelos lineares nos parmetros,
que no sero destacados nesta reviso.
Neste caso, a funo de informao qq() descrita em termos de DNome, onde D
indica o discriminante e o sobrescrito identifica os autores que o propuseram.
5.4.1 HUNTER e REINNER (1965); ROTH (1965)

O trabalho de HUNTER e REINNER (1965) foi pioneiro na anlise do problema


de planejamento seqencial de experimentos, propondo o primeiro critrio para que a
discriminao de modelos. Segundo os autores, para que a discriminao entre dois
modelos seja possvel, o experimento deve ser realizado na condio em que as
respostas dos modelos sejam as mais distintas possveis. Assim, deve ser buscada a
condio experimental que maximiza a Equao (E 5.8):

64

(E 5.8)

D Hunter Y (1) P Y (2) P

onde DHunter() o discriminante entre os modelos 1 e 2, representa o conjunto de


experimentos que esto sendo planejados (geralmente considera-se apenas um
experimento adicional), Y(1)P o resultado simulado para o modelo 1 e Y(2)P o
resultado simulado para o modelo 2, ambos na condio .
A generalizao da Equao (E 5.8) para M modelos pode ser obtida segundo a
Equao (E 5.9).

(E 5.9)

M 1 M

D Hunter

Y Y

i 1 j i 1

(i ) P

( j)P

Embora de grande utilidade, o critrio de HUNTER e REINER (1965) no leva


em considerao aspectos importantes do problema, que a literatura se encarregou de
considerar ao longo das dcadas seguintes. O uso da Equao (E 5.9) para muitos
modelos pode indicar regies experimentais na qual a soma da diferena entre os
modelos mxima; contudo, o ponto pode no ser adequado para a discriminao de
nenhum modelo. Alm disto, o discriminante no prioriza bons modelos e, em alguns
casos, o prximo experimento indicado pela maximizao do discriminante pode ser
baseado em modelos ruins.
Visando priorizao de previses fornecidas pelos bons modelos, diversos
autores propuseram a associao de probabilidades aos modelos. Em 1965, ROTH
(apud REILLY, 1970) props a maximizao de um discriminante semelhante ao de
HUNTER e REINNER (1965); contudo, ponderado pela probabilidade de cada modelo,
de acordo com a seguinte expresso:

(E 5.10)

i 1

j 1
j i

D Roth P (i ) 0 Y ( i ) P Y ( j ) P

onde Pi(0) a probabilidade do modelo i considerando os experimentos j realizados,


calculada com base na estatstica Bayesiana. Trabalhos seguintes apresentaram formas
um pouco modificadas para a obteno do discriminante, embora, semelhantes ao
critrio proposto por ROTH (1965).
65

5.4.2 BOX e HILL (1967)

Um aspecto desconsiderado nos discriminantes propostos por HUNTER e


REINNER (1965), ROTH (1965) e outros a influncia do erro de predio e do erro
experimental sobre o discriminante. Se a maior diferena entre os modelos ocorrer em
regies experimentais em que o erro de predio associado ao erro experimental muito
elevado, este ponto pode no ser bom para a discriminao entre os modelos. Neste
caso, pode ser prefervel escolher um ponto no qual a diferena entre os modelos no
mxima, mas em que o erro de predio associado pequeno. A Figura 5.3 ilustra um
caso de discriminao entre dois modelos rivais. Segundo os discriminantes
apresentados at o momento, o ponto escolhido para o prximo experimento seria o
maior valor de x; contudo, nesta regio os erros associados sugerem que este ponto no
seria o mais adequado para a discriminao entre os modelos.

0.12

Modelo1

Modelo2

E rroModelo1

E rroModelo2

0.1

0.08

0.06

0.04

0.02

0
0

0.2

0.4

0.6

0.8

1.2

x
Figura 5.3 - Ilustrao da influncia do erro de predio e erro experimental para um
problema de discriminao entre dois modelos rivais.
BOX e HILL (1967) foram os primeiros a incluir no discriminante o erro de
predio do modelo e o erro experimental, baseando-se no critrio de divergncia de
Kullback-Leibler. A idia bsica do discriminante de BOX e HILL (1967) maximizar
a divergncia entre uma distribuio de probabilidades (modelo 1) de outra distribuio
de probabilidades (modelo 2). Ou seja, buscam-se regies onde a informao perdida
ao se utilizar o modelo 1 para explicar o modelo 2 mxima, de forma a favorecer a

66

discriminao. Nesta condio, os modelos prediriam resultados diferentes e ento


poderia ser procedida a discriminao entre os modelos.

Distribuio de
probabilidade do
modelo 1

-2

Distribuio de
probabilidade do
modelo 2

y modelo 1

y modelo 2

Figura 5.4 Ilustrao das distribuies de probabilidades de dois modelos em uma


dada condio experimental (JAROSH et al., 2002).
O critrio de BOX e HILL (1967) dado pela soma da divergncia de KullbackLeibler dos modelos dois a dois, ponderada pela probabilidade dos modelos:

(E 5.11)

D BoxHill

P P D || D ||
M

(i )

( j)

(i )

( j)

KL

i 1 j i 1

( j)

(i )

KL

onde P(i) e P(j) so as probabilidades dos modelos i e j aps N experimentos.


Inicialmente, as probabilidades dos modelos so admitidas iguais; ou seja,
P(i)(0)=P(j)(0)=1/M, onde M o nmero de modelos. Tendo sido feito experimentos 0,

os parmetros seriam re-estimados e o valor das funes de densidade de probabilidade


de cada modelo poderiam ser obtidos. Com isto, a probabilidade dos modelos aps estes
experimentos iniciais seria dada por:

(E 5.12)

(i )

P (i ) 0 |( i0) Z

P 0 Z
(k )

(k )
| 0

Na medida em que pontos experimentais so tomados, as probabilidades so


atualizadas com base no critrio Bayesiano, conforme na forma:
67

(E 5.13)

(i )

P (i ) 0 |(i0) Z

P Z
(k )

(k )
| 0

As distribuies (i)(Z) e (j)(Z) so admitidas normais e dadas pela Equao (E


3.1). Neste caso, substituindo a Equao (E 4.11) na Equao (E 5.11), o critrio fica
(FORZATTI et al., 1986, SCHWAAB, 2007):
M

(E 5.14) D BoxHill P ( i ) 0 P ( j ) 0 tr VY( j ) P VY(i ) P VY(i ) P VY( j ) P 2 Id


i 1 j i 1

Y ( i ) P Y ( i ) P

V Y

( j ) P 1
Y

( i ) P 1
Y

(i ) P

Y (i ) P

onde Id a matriz identidade e VY(i)P e VY(j)P representam a matrizes de covarincias das


incertezas de predio do modelo i e do modelo j. Todos os termos relacionados s
matrizes de covarincia aos valores de predio devem ser avaliados para cada uma das
condies de .
Outros autores tambm propuseram critrios de discriminao baseando-se no
critrio de divergncia de Kullback-Leibler (CHERNOFF, 1959, BLOT e MEETER
1973). Trabalhos de REILY (1970) e FEDOROV (1972) apresentam variantes do
discriminante proposto por BOX e HILL (1967); contudo, nos exemplos analisados por
estes autores no foram detectadas diferenas significativas em relao ao discriminante
apresentado por HUNTER e REINER (1965) (HILL, 1978).
BUZZI-FERRARIS e FORZATTI (1983) demonstraram que os resultados
obtidos para a probabilidade dos modelos, segundo o critrio de BOX e HILL (1967),
dependem da ordem com que os experimentos so realizados. Este fato indica uma
incoerncia do discriminante, j que a avaliao dos modelos deve depender unicamente
dos resultados disponveis, independentemente da ordem em que foram obtidos. Outro
problema do discriminante proposto por BOX e HILL (1967), salientado por BUZZIFERRARIS e FORZATTI (1983), o fato de que valores altos da variabilidade
experimental podem elevar o valor do discriminante. Assim, o experimentador pode ser
informado de que o melhor ponto experimental aquele que apresenta o maior erro
associado, o que obviamente um absurdo.

68

5.4.3 ATKINSON e colaboradores

Outro conjunto de discriminantes foi adotado nos trabalhos de Atkinson e


colaboradores. ATKINSON e COX (1974) propuseram um discriminante para modelos
lineares nos parmetros. Sejam os modelos {Y(1), Y(2),..., Y(M} com suas respectivas
matrizes de informao de Fisher {J(1), J(2),..., J(M}. Um modelo completo Y(T) conteria
todos os termos dos modelos individuais; ou seja, a forma matemtica do modelo
completo seria resultado da soma dos modelos individuais. A este modelo completo
estaria associada uma matriz de informao de Fisher J(T). A forma matemtica do
modelo Y(T) difere da forma matemtica do modelo Y(i) por um conjunto de parmetros
Np. A relevncia destes termos contidos no modelo completo e no contidos no modelo
Y(i) pode ser avaliada maximizando-se a seguinte expresso:

(E 5.15)

J (T ) P ( i ) P
1
J

D (i ) Atk _ Cox
T
(
Np max J ) P (i ) P
J

Np

onde J(T)P e J(i)P representam a matriz de informao de Fisher, considerando que o dado
experimental em possa ser gerado com o modelo Y(T), e o termo no denominador
apenas indica o valor mximo de J(T)P/J(i)P, de forma que o resultado seja apresentado
em termos da eficincia de discriminao. Os autores interpretaram que a maximizao
de DAtkin_Cox na Equao (E 5.15) representa a discriminao de um modelo i de modelos
mais completos, contendo termos adicionais. Uma situao desejvel seria buscar uma
condio em que para qualquer modelo as eficincias sejam idnticas, o que equivale a
buscar o critrio Maximin, ou ento concentrar-se em alguns modelos especficos.
ATKINSON e FEDOROV (1975a) propuseram um discriminante para o
problema em que existem dois modelos possveis. Os autores admitiram que um dos
modelos fosse o verdadeiro. Considerando-se o modelo 1 como verdadeiro, o
discriminante dos autores consiste em encontrar a condio experimental que maximiza
a divergncia entre as respostas do modelo 1 e do modelo 2 para as condies
experimentais j realizadas e as condies experimentais planejadas. Contudo, ao
admitir o modelo 1 como verdadeiro, re-estimam-se os parmetros do modelo 2, como
forma de avaliar a flexibilidade do modelo 2 para ajustar-se a novos dados

69

experimentais. A re-estimao de parmetros envolve encontrar os parmetros do


modelo 2 que minimizam a divergncia entre os modelos (min(2)). Com isto:

(E 5.16)

D1 Atk _ Fed min ( 2 )

Y X , Y
(1) P

(1)

(2) P

X ,
(2)

d X

A integral (X) representa os pontos experimentais compostos pelos


experimentos j feitos e pelos experimentos planejados, ou seja, a integral na realidade
uma somatria da divergncia entre os modelos, calculada com base nos experimentos
realizados e planejados. Como admitir que um dos modelos seja o modelo verdadeiro
no parece razovel, os autores propuseram tambm a avaliao inversa, considerandose o modelo 2 como verdadeiro.

(E 5.17)

D2 Atk _ Fed min (1)

Y X , Y
(1) P

(1)

(2) P

X ,
(2)

d X

Os autores sugeriram que fosse adotado o pior dentre os dois discriminantes,


como uma estratgia conservadora. Ou seja, neste caso o discriminante pode ser escrito
como:

(E 5.18)

D Atk _ Fed min D1 Atk _ Fed , D2 Atk _ Fed

ATKINSON e FEDOROV (1975b) estenderam este conceito para diversos


modelos; contudo, ainda assim admitindo um dos modelos como verdadeiro. Se o
modelo 1 for considerado verdadeiro, os autores propuseram o discriminante anlogo ao
apresentado na Equao (E 5.16) entre o modelo 1 e um modelo j:

(E 5.19)

D1 j Atk _ Fed 2 min ( j )

Y X

Nx 1
k 1

(1) P

, (1) Y ( j ) P X k , ( j )

Os modelos poderiam ser ordenados em relao ao valor de sua funo objetivo,


e o discriminante Di,j poderia ser tomado para um par dentre os melhores modelos ou
como um que maximiza a divergncia entre pares de melhores modelos. Nos
procedimentos propostos por ATKINSON e FEDOROV (1975a,b), os dados podem ser
70

gerados com o modelo considerado verdadeiro e os parmetros dos demais modelos reestimados. Com isto, avalia-se a flexibilidade que os modelos podem adquirir para se
adequar a novos pontos experimentais.
PONCE DE LEON e ATKINSON (1991) estendem os conceitos do trabalho de
ATKINSON e FEDOROV (1975a) para dois modelos rivais quando se tem alguma
informao a priori da qualidade dos modelos. Sejam os parmetros do modelo 1 dados
por alguma distribuio ((1)), e os parmetros do modelo 2 dados por ((2)).
Segundo os autores, considerando o modelo 1 como verdadeiro, o discriminante poderia
ser obtido como a mdia em relao aos parmetros do modelo 1, do critrio proposto
por ATKINSON e FEDOROV (1975a), ou seja:

(E 5.20)

D1 Atk _ Ponce

D
(i )

1,2

Atk _ Fed

d (1)

(1)

Sejam as probabilidades dos modelos indicadas por P(1) e P(2). PONCE DE


LEON e ATKINSON (1991) propem calcular o discriminante da seguinte forma:
(E 5.21)

D Atk _ Ponce P (1) D1 Atk _ Ponce P (2) D2 Atk _ Ponce

Vale ressaltar que um aspecto interessante nos discriminantes de ATKINSON e


colaboradores a re-estimao de parmetros dos demais modelos ao considerar que um
dos modelos verdadeiro. Com isto, avalia-se a flexibilidade dos modelos a adequar-se
a novos dados experimentais.
5.4.4 BUZZI-FERRARIS e colaboradores

BUZZI-FERRARIS e FORZATTI (1983) propuseram um discriminante no qual


nenhum modelo admitido verdadeiro. Para M modelos, o discriminante foi proposto
como a razo entre os desvios dos modelos e a mdia das varincias experimentais e de
predio, segundo a equao:

(E 5.22)

y ( i ) P y ( j ) P 2

D Buzzi
M (k ) P

i 1 j i 1
M 1 v
k 1

71

O discriminante que considera M modelos pode indicar que o prximo


experimento deve ser realizado em uma regio em que a soma global das diferenas
entre os modelos mxima, mas que pode contribuir pouco para a discriminao de
quaisquer dos modelos. Conforme salientam os autores, pode ser prefervel tomar o
discriminante aos pares (considerando os modelos dois a dois) e ento escolher o maior
dos discriminantes para determinar o prximo experimento. Desta forma, procura-se
uma maior garantia de que um dos modelos do conjunto poder ser discriminado dos
demais. Trabalhos posteriores de BUZZI-FERRARIS et al. (1984) e BUZZIFERRARIS et al. (1990) apresentaram variantes do discriminante apresentados na
Equao (E 5.22), incluindo a extenso para problemas com vrias respostas. Contudo,
as idias bsicas que levaram ao discriminante apresentado na Equao (E 5.22) foram
mantidas.
BUZZI-FERRARIS e MANENTI (2009) argumentam contra o uso de
probabilidades de modelos nos processos de discriminao. Segundo os autores,
infinitas explicaes poderiam ser propostas para explicar um mesmo fenmeno,
resultando em uma probabilidade nula para cada modelo. No entanto, o emprego de
discriminantes que contm probabilidades de modelos til e funcional. A
probabilidade do modelo, calculada ao mesmo tempo em que se estima os parmetros,
permite uma avaliao mais simples e no-ambgua da qualidade das respostas do
modelo, alm de permitir a concentrao dos esforos experimentais na escolha dos
modelos mais provveis (SCHWAAB et al., 2006).
5.4.5 SCHWAAB et al. (2006)

Em uma verso melhorada do critrio proposto por OLIVEIRA et al. (1997) e


utilizada por DARIVA et al. (1998), SCHWAAB et al. (2006) propuseram um
discriminante que alia as caractersticas dos trabalhos de Buzzi-Ferraris com o emprego
de probabilidades de modelos. Contudo, diferentemente dos critrios que calculam as
probabilidades segundo a estatstica Bayesiana, para o discriminante proposto por
SCHWAAB et al. (2006) a ordem dos experimentos no afeta a avaliao global dos
modelos.
Para erros normalmente distribudos, para um modelo m, a funo objetivo
assume a forma da funo estatstica 2 (conforme comentado anteriormente), com
NExpNy-Np(m) graus de liberdade, onde NExpNy o nmero de pontos experimentais e
Np(m) o nmero de parmetros. A pergunta estatstica correta ao se comparar a funo
72

objetivo no ponto mnimo com a funo 2, a seguinte: ao se realizar novamente o


mesmo conjunto de experimentos, qual a probabilidade de se encontrar valores da
funo objetivo menores do que aqueles encontrados se as diferenas observadas forem
controladas por erros experimentais? A resposta fornecida pelo valor da probabilidade

Pr(2 F ( m) est ), onde 2 a funo 2 com NExpNy-Np(m) graus de liberdade.

Valores muito altos de F ( m) est indicam que no ocorrem apenas desvios aleatrios,
mas tambm erros de modelagem. Devido a isto, nestes casos, o valor de

Pr(2 F ( m) est ) muito elevado. A idia bsica de SCHWAAB et al. (2006)


admitir que a probabilidade do modelo (P(i)) pode ser calculada a partir de

Pr(2 F ( m) est ), como a frao de vezes em que seriam obtidos resultados melhores
do que aqueles encontrados.

(E 5.23)

P( m) 1 Pr 2 F ( m) est

Se o valor de P(m) cair dentro de uma faixa aceitvel para a funo 2,


indicativo de que o erro de modelagem pouco importante e de que o valor da funo
objetivo parece estar sujeito predominantemente a flutuaes aleatrias. Para o uso no
discriminante, SCHWAAB et al. (2006) propuseram a normalizao do valor das
probabilidades dos modelos, obtendo a probabilidade relativa de cada modelo (Pr(m)), na
forma:

(E 5.24)

Pr( m)

P( m )
M

(k )

k 1

Esta probabilidade relativa nada diz em relao qualidade do modelo,


constituindo-se apenas um artifcio matemtico til para concentrar esforos em bons
modelos, a partir de um valor normalizado de probabilidade. Conforme salientado por
SCHWAAB (2007), quando o valor da probabilidade absoluta de todos os modelos for
baixo, o procedimento deve ser interrompido para a incluso de mais modelos.
O discriminante proposto por SCHWAAB et al. (2006) semelhante ao
apresentado nos trabalhos de BUZZI-FERRARIS et al. (1984, 1990) e BUZZI-

73

FERRARIS e FORZATTI (1983); contudo, incluindo termos de probabilidade relativa


de cada modelo. Para uma varivel de resposta, o discriminante pode ser escrito como:

(E 5.25)

Schwaab
i, j

(i ) ( j ) z '
r
r

y y
(i ) P

( j)P

v ( i ) P v ( j ) P

ou, para o caso de mltiplas variveis de resposta:


(E 5.26)

DiSchwaab
Pr(i ) Pr( j )
,j

z'

Y Y V
(i ) P

( j)P

(i , j ) P
Y

Y Y
(i ) P

( j)P

onde:
(E 5.27)

VY(i , j ) P VY(i ) P VY( j ) P

sendo VY(i , j ) P a matriz global dos erros de comparao, resultado da soma das
matrizes de covarincia de predio dos modelos ( VY(i ) P , VY( j ) P ). As matrizes de
covarincias das incertezas de predio podem ser calculadas a partir das matrizes de
covarincias das incertezas paramtricas (V(i), V(j)) e da matriz de covarincia das
incertezas experimentais (VY), segundo a seguinte equao:
(E 5.28)

VY(i ) P B ( i ) V(i ) B (i )T VY

No processo proposto por SCHWAAB et al. (2006), o discriminante tomado


apenas para pares de modelos. O maior valor do discriminante, dentre os pares de
modelos analisados, deve ser utilizado como referncia para realizao do prximo
experimento. O parmetro z indica a confiana que se tem nos modelos mais provveis.
Na prtica, quanto maior o valor do parmetro z, mais acentuada a diferena admitida
entre os modelos. Dessa forma, o nmero de experimentos pode ser reduzido se os
melhores modelos apresentam desde o incio maior probabilidade que os demais.
O discriminante seria escolhido como o valor mximo dentre os discriminantes
avaliados para os pares de modelos, ou seja:

74

(E 5.29)

D Schwaab max i , j DiSchwaab

,j

5.4.6 SCHWAAB et al. (2008c), DONCKELS et al. (2009)

SCHWAAB et al. (2008c) observaram que, aps a realizao de um novo


experimento, a atualizao dos dados referentes aos modelos pode levar a uma
estimao mais precisa dos parmetros do modelo, diminuindo assim a varincia de
predio. Desta forma, SCHWAAB et al. (2008c) propuseram que a atualizao das
matrizes de covarincias paramtrica e de predio deveria ser feita no ponto a ser
escolhido para o prximo experimento. Neste caso, a matriz das incertezas de Y na
condio pode ser identificada por VY(i ) Post . Esta matriz calculada da seguinte
forma:
(E 5.30)

VY(i ) Post B (i ) V(i ) P B (i )T VY

onde V(i ) P representa a matriz de covarincias posterior das incertezas paramtricas,


calculada de acordo com a Equao (E 5.4); ou seja, utiliza-se VYPost() ao invs de
VYP() na Equao (E 5.27). Neste caso, a matriz de covarincias das incertezas
paramtricas atualizada com base no experimento planejado. Isto aumenta o potencial
de discriminao dos experimentos avaliado. O procedimento proposto seria exato se
os valores dos parmetros no se modificassem com o novo experimento a ser realizado.
Apesar disto, essa uma aproximao bem mais razovel do que a desconsiderao
total da influncia do novo ponto sobre a preciso dos parmetros e a qualidade de
previso do modelo. Com isto, o discriminante poderia ser escrito como:
Post
(E 5.31) DiSchwaab
Pr(i ) Pr( j ) Y (i ) P Y ( j ) P VY(i, j ) Post
,j
z'

Y Y
(i ) P

( j)P

Este mesmo resultado foi obtido posteriormente e de forma independente por


DONCKELS et al. (2009).
5.4.7 TOMMASI e colaboradores

Trabalhos recentes empregaram o critrio de divergncia de Kullback-Leibler


para a discriminao de modelos.
75

LPEZ-FIDALGO et al. (2007) apresentam o critrio de Kullback-Leibler para


dois modelos. Segundo os autores, assumindo um dos modelos como verdadeiro, o
critrio de discriminao consistira em maximizar a divergncia de Kullback-Leibler
entre os dois modelos nas condies dos experimentos realizados e planejados. De
forma anloga aos discriminantes de ATKINSON e colaboradores, isto feito reestimando os parmetros do outro modelo. Ou seja, o critrio de discriminao
admitindo o modelo 1 como verdadeiro pode ser escrito como:

(E 5.32)

D12 Lopes _ Tom _1 min ( 2) DKL (1) || (2) d X

A integral em relao ao planejamento (X) indica apenas que o termo DKL (1) || (2)
calculado com base apenas nos experimentos j realizados e nos experimentos
planejados. Ou seja, DKL (1) || (2) calculado levando em conta apenas tais
condies experimentais.
TOMMASI (2007) estende o conceito LPEZ-FIDALGO et al. (2007) para
mltiplos modelos. Baseando-se no critrio de ATKINSON e COX (1974), os autores
admitiram um modelo global Y(T) que incorporaria todos os modelos propostos Y(i). A
tais modelos corresponderiam s densidades de distribuio de probabilidades (T) e (i),
respectivamente. Desta forma, a fim de verificar particularidades do modelo i,
TOMMASI (2007) props maximizar a divergncia de Kullback-Leibler entre o modelo
completo Y(T) e o modelo Y(i) para os experimentos j realizados e planejados. Contudo,
de forma anloga aos discriminantes de ATKINSON e colaboradores, isto deve ser feito
re-estimando os parmetros do modelo i; ou seja, a discriminao entre o modelo i e os
demais modelos poderia ser calculada como:

(E 5.33)

DiTom min ( i ) DKL (T ) || (i ) d X

Segundo o autor, o critrio Bayesiano ou o critrio Maximin poderiam ser


empregados para escolher um ponto sem adotar um modelo especfico, na forma:

(E 5.34)

eff DTom P
(i )

DiTom

max DiTom

DiTom
ou eff DTom min

max DiTom

76

onde P(i) a probabilidade do modelo i. Desta forma, a razo DiTom()/max(DiTom) pode


ser entendida como uma eficincia de discriminao. Uma forma semelhante a este
critrio foi utilizado por LPEZ-FIDALGO et al. (2008) para a discriminao de
modelos do tipo Michaelis Menten investigando dois modelos possveis.
TOMMASI e LPEZ-FIDALGO (2010) apresentaram a extenso do critrio
proposto por LPEZ-FIDALGO et al. (2007) aplicada a dois modelos com
distribuies quaisquer, quando probabilidades dos modelos so disponveis. Para dois
modelos 1 e 2, os parmetros dos modelos, (1) e (2), respectivamente, so incertos.
Desta forma, considerando um modelo 1 como verdadeiro, os autores propuseram
avaliar uma mdia do critrio de divergncia de Kullback-Leibler, re-estimando os
valores dos parmetros do modelo 2; ou seja (similar ao critrio apresentado por
PONCE DE LEON e ATKINSON (1991)):

(E 5.35)

D12Tom _ Lop E (1) min ( 2) DKL (T ) || ( i ) dX

Os autores propuseram ainda um discriminante formado como a soma dos


critrios D12 e D21, ponderados pela probabilidade dos modelos, na forma:

(E 5.36)

DTom _ Lop P (1)

D12Tom _ Lop
D21Tom _ Lop
(2)

max D12Tom _ Lop


max D21Tom _ Lop

A vantagem dos critrios que utilizam a divergncia de Kullback-Leibler que a


distribuio de probabilidades no restrita distribuio normal. Por outro lado, no
mbito da Engenharia Qumica, dificilmente um pesquisador ir admitir uma
distribuio de dados no normal. O critrio proposto por TOMMASI e LPEZFIDALGO (2010) apresenta a desvantagem de ser de difcil implementao.

5.5 Planejamentos robustos (mltiplos modelos)


Nas sees anteriores, cada modelo correspondia a uma forma matemtica
distinta. Ou seja, nas sees anteriores diferentes modelos seriam, por exemplo:
y=1x+2 e y=1x2, o modelo 1 sendo uma reta e o modelo 2 sendo uma parbola.
Contudo, em planejamentos robustos, diferentes modelos podem corresponder a formas
matemticas distintas ou mesmo formas matemticas idnticas com valores dos
77

parmetros distintos. Por exemplo, y=5x+7 e y=3x+2 podem ser considerados modelos
distintos, mesmo que ambos tenham a mesma forma matemtica, j que apresentam
parmetros distintos.
O planejamento robusto trata do problema de estimao de parmetros precisos
quando na discriminao de modelos o conhecimento sobre os modelos e parmetros
bastante escasso. Necessariamente, deve-se conhecer a forma matemtica do modelo e
faixas admissveis para os parmetros, tornando possvel realizar simulaes de
respostas dos modelos.
At agora, os critrios de planejamento de experimentos para estimao de
parmetros precisos foram apresentados para melhorar a preciso dos parmetros de um
nico modelo. Contudo, em planejamentos robustos, aborda-se o problema para M
modelos. Logo, para planejamentos robustos, conveniente definir as variveis de
ganho de informao para cada possvel modelo e cada possvel planejamento. Com
isto, o clculo da matriz de informao de Fisher predita deve ser especificado para o
modelo n e o conjunto de experimentos, i; ou seja, J(n)P(,i).
Geralmente, experimentos iniciais so conduzidos, permitindo estimao dos
parmetros dos modelos. Ao invs disto, pode-se tambm admitir um chute inicial dos
parmetros para um modelo e realizar o planejamento timo para o modelo escolhido
com base nos parmetros adotados (CHERNOFF, 1953, ADEWALE e WIENS, 2009).
Outra forma de tratar o problema observ-lo sob a tica da teoria da deciso, adotando
basicamente os critrios Maximin e Bayesiano.
Conforme comentado, modelos com a mesma forma matemtica, mas com
parmetros distintos, podem ser considerados modelos diferentes. Neste sentido, os
critrios de discriminao modelos podem ser adaptados para o planejamento robusto,
quando os parmetros so conhecidos com grande impreciso. A literatura de fato, no
faz distino entre estes critrios (CHERNOFF, 1972 especialmente pp 72-75, SOOFI,
1994). Os critrios Bayesiano e Maximin podem ser utilizados para a obteno de
planejamentos robustos (DETTE et al., 2007).
Alguns autores propuseram que, para para diferentes modelos {Y(1),Y(2),...,Y(M)},
o plano experimental timo otm deveria se obtido maximizando-se o seguinte cririo
Bayesiano (LAUTER , 1974, ATKINSON e DONEV, 1972, pp 253, OBRIEN e
RAWLINGS, 1996):

78

(E 5.37)

otm arg max


n 1

w( n )
log J ( n ) P ,
(n)
Np

O termo w(n) reflete a probabilidade do modelo n. O termo no expoente Np(n) indica o


nmero de parmetros do modelo n e uma normalizao para o determinante, uma vez
que modelos com nmero de parmetros distintos naturalmente vo possuir parmetros
distintos.
Seguindo a mesma notao, DETTE e OBRIEN (1999) propuseram que otm
deveria se obtido maximizando-se o seguinte critrio Bayesiano para um modelo com
uma varivel de resposta:

(E 5.38)

otm arg max w( n )


n 1

v(yn) P dX
L

onde vy(n)P a varincia de predio feita com o modelo n para a varivel de resposta y.
Este ltimo critrio foca o desempenho da predio, uma vez que se calcula a integral
da varincia de predio ao longo de uma faixa experimental. O termo L modifica o
critrio para cada modelo n: por exemplo, L=1 representa o critrio I-timo; L=+
representa o critrio D/G-timo. Novamente, diferentes modelos podem ser entendidos
como o mesmo modelo com diferentes valores dos parmetros.
ASPREY e MACCHIETTO (2002) empregaram os critrios Bayesiano e
Maximin para experimentos dinmicos. O critrio Bayesiano, semelhante a um dos
critrios propostos por LAUTER (1974), e consiste em admitir uma probabilidade dos
parmetros () e obtm o planejamento timo da seguinte forma:

(E 5.39)

otm arg max J P , d

O critrio Maximin pode ser escrito da seguinte forma:

(E 5.40)

otm arg max min J P ,

A falha principal nos critrios avaliados segundo valor absoluto dos critrios de
informao de acordo com as Equaes (E 5.39) e (E 5.40), que parmetros distintos
79

so avaliados com precises distintas. Para contornar este problema, diversos autores
utilizaram eficincias, ao invs do valor absoluto do critrio de informao.
Considerando o critrio do volume, a eficincia de estimao de um plano pode ser
definida, dividindo-se o determinante de JP aps a execuo do plano otm pelo maior
valor possvel do determinante JP:

(E 5.41)

J ( n ) P ,
(n)
eff E ,
max J ( n ) P ,

Np ( n )

O termo 1/Np(n) aparece como forma de ponderao do determinante, de forma


que a eficincia seja apresentada como razo de varincias (uma vez que a ordem do
determinante depende do nmero de parmetros dos modelos) (ATKINSON et al.,
2007, pp 368).
DETTE e colaboradores tambm investigaram critrios de planejamento de
experimentos robustos, segundo critrios Maxmin e Bayesiano para anlise do modelo
de Monod (DETTE et al., 2005, STRIGUL et al., 2009), fornecendo algumas diretrizes
para os planejamentos iniciais em sistemas regidos por tais modelos.

5.6 Otimizao multiobjetivo aplicada aos problemas de


discriminao de modelos e estimao de parmetros
Alguns trabalhos tratam dos problemas de estimao e discriminao sob a tica
de um problema multibjetivo. O primeiro trabalho a tentar reunir os critrios de
discriminao de modelos e estimao de parmetros precisos foi o trabalho de HILL et
al. (1968). Para M modelos, os autores propuseram a maximizao do seguinte critrio
para a avaliao do prximo conjunto de experimentos:

(E 5.42) otm

M
J (n) P
D BoxHill
( n)
0
arg max w
1 w P
max D BoxHill
max J ( n ) P
n 1

onde DBoxHill() o valor do discriminante de Box e Hill, J(n)P a matriz posterior de


informao de Fisher para o modelo n e P(n)(0) o valor da probabilidade do modelo n

80

aps a realizao de 0 experimentos, calculada de acordo com o critrio de Box e Hill.


O peso w pondera a importncia dada a cada critrio.
Os autores procuraram desenvolver um critrio que inicialmente favorece os
procedimentos de discriminao, j que no incio todas as probabilidades so baixas.
medida que os modelos mais provveis apresentam maiores valores de probabilidade, o
critrio indica experimentos para estimao de parmetros precisos de tais modelos. Os
autores sugerem ento que o peso w seja colocado da seguinte forma:
M 1 Pmelhor _ mod elo
w

M 1

(E 5.43)

onde M o nmero de modelos, Pmelhor_modelo a probabilidade do melhor modelo aps a


realizao dos NExp experimentos, e o parmetro que controla a queda do valor de w
(0<<), de forma a privilegiar o critrio de estimao em detrimento do critrio de
discriminao. Nos exemplos apresentados, os autores empregaram =2.
Conforme comentado por COCHRAN (1973) e demonstrado em exemplos no
artigo de HILL et al. (1968), pontos timos de discriminao em muitos casos no so
bons pontos para a estimao, e vice-versa. O critrio proposto na Equao (E 5.42) na
realidade no sincroniza os dois objetivos, mas assemelha-se ao tratamento usual dado
ao problema. Dependendo do valor especificado de , o processo inicialmente escolhe
apenas pontos para discriminao dos modelos. medida que um modelo se torne mais
provvel, so preferencialmente escolhidos pontos timos para a estimao dos
parmetros deste modelo. Trabalhos de SANE et al. (1973) e PETROV et al. (1991),
empregando o critrio de HILL et al. (1968), concluram que a eficincia do critrio
apresenta forte dependncia de erros experimentais pequenos e bons valores iniciais dos
parmetros.
OBRIEN e RAWLINGS (1996) propuseram um critrio que busca conciliar
uma soma ponderada dos fatores de discriminao de modelos e estimao de
parmetros precisos. Os autores baseiam-se no critrio proposto por ATKINSON e
COX (1974) para discriminao de modelos, conforme apresentado na Equao (E
5.15). Neste caso, um modelo completo Y(T) conteria todos os termos dos modelos
individuais. Admitindo uma probabilidade P(n) para cada modelo, os autores propem
obter o discriminante maximizando-se a expresso:
81

(E 5.44)

D O ' Brien _ Rawlings P ( n ) log D ( n ) Atkin _ Cox


n 1

Os autores baseiam-se no critrio do volume para estimao de parmetros


precisos conforme apresentado na Equao (E 5.37). Com isto, o critrio proposto pelos
autores, considerando-se w(n) como a probabilidade do modelo P(n) pode ser escrito
como:

(E 5.45)

n 1

otm arg max 1 w D O ' Brien _ Rawlings w

P(n)
log J ( n ) P ,
(n)
Np

Onde w um peso entre 0 e 1 que pondera a importncia da discriminao e da


estimao. Segundo os autores, maximizar a (E 5.45) equivale a maximizar o seguinte
critrio:

(E 5.46)

otm

1 w P ( n )
log J (T ) P , (T )
Np Np ( n )

arg max
M
w P ( n ) 1 w P ( n )

log J ( n ) P ,
(n)
n 1 Np ( n )
Np

onde J(T)P a matriz posterior de informao de Fisher para o modelo completo Y(T).
COOK e WONG (1994) consideraram como funes-objetivos diferentes
critrios de estimao de parmetros precisos. Os autores propuseram a caracterizao
dos planejamentos timos quanto s eficincias em relao aos critrios de estimao.
Segundo os autores, um planejamento timo deveria ser escolhido de forma a
maximizar um critrio, desde que outros critrios resultassem em um valor mnimo de
informao. Por exemplo, maximizar a eficincia segundo o critrio do volume, desde
que a eficincia do critrio do trao fosse maior ou igual a um valor limite.

(E 5.47)

otm arg max J P

st. tr J P c

82

Contudo, ao invs de estabelecer a constante c, os autores caracterizaram a


soluo multiobjetivo variando o valor de entre 0 e 1 na expresso (E 5.48):

(E 5.48)

otm arg max J P 1 tr J P

CLYDE e CHALONER (1996) estenderam os conceitos do trabalho de COOK e


WONG (1994) para mais de dois critrios de informao. Os autores apresentaram as
frentes de Pareto para eficincias do critrio do volume e do trao na forma grfica.
ATKINSON (2008) apresentou uma forma de obter a discriminao de modelos
e a estimao de parmetros precisos. O autor props a maximizao da seguinte
expresso:
wE
M

w
arg max eff D D eff E( n ) Np( n )

n 1

(n)

(E 5.49)

otm

onde: effD a eficincia de discriminao e effE(n) a eficincia de estimao,


considerando que o modelo n verdadeiro; e wD e wE(n) so pesos que ponderam a
importncia de tais critrios. A eficincia da discriminao pode ser obtida como o
discriminante de ATKINSON e FEDOROV (1975a,b) apresentado nas Equaes (E
5.16)-(E 5.19) dividido pelo mximo valor que o discriminante pode assumir. A
maximizao acima pode ser obtida da seguinte forma:

(E 5.50)

n 1

otm arg max wD log D Atk _ Fed

wE( n )
(n) P
log
J

Np ( n )

onde |J(n| determinante da matriz de informao de Fisher, considerando os


experimentos de . Segundo ATKINSON (2008), os pesos poderiam ser variados de
forma a se obter um valor elevado de eficincia para ambos os critrios. Uma maneira
semelhante utilizada no Captulo 8 para obter pontos timos de estimao e
discriminao.
Outra abordagem possvel a proposio de metodologias que combinam
diferentes critrios de estimao de parmetros precisos. KALOGERAKIS e LUUS
(1984) propuseram metodologias de alternncia entre diferentes critrios de estimao.
83

Os autores sugeriram a avaliao da forma da regio de confiana dos parmetros,


mediante a razo entre o mximo e mnimo valores caractersticos da matriz V,
proporcionais s diagonais da hiper-elipside. De acordo com a forma prevista, os
autores sugeriram a alternncia entre os critrios da forma e volume, E-timo e D-timo,
respectivamente.
Na realidade, uma gama muito grande de ponderaes pode ser estabelecida para
conciliar os diferentes critrios de otimalidade. A soluo para este problema consiste
na otimizao multiobjetivo, constituda pela frente de Pareto, cujas funes a serem
maximizadas podem ser a informao sobre a estimao precisa e sobre a discriminao
de modelos. Este assunto ser descrito com maiores detalhes no Captulo 8.

84

PARTE 3 RESULTADOS

85

6 AVALIAO DO COMPORTAMENTO DOS ERROS


RESUMO
O principal objetivo deste captulo apresentar conceitos de propagao de
erros e aplic-los a sistemas de Engenharia Qumica para fins de estimao de
parmetros e planejamento de experimentos. Desta forma, demonstra-se que possvel
avaliar faixas das incertezas experimentais, fundamentais para alimentar os
procedimentos de estimao de parmetros e planejamento seqencial de experimentos.
Um estudo de caso apresentado para reaes qumicas com cintica de primeira
ordem em sistemas simples, seguindo uma discusso sobre condies timas de
experimentao para estimao precisa da constante cintica. Rotinas para avaliao
de propagao de erros foram implementadas em linguagem Fortran e utilizadas para
sistemas com maior complexidade, conforme demonstrado em alguns exemplos.
Algumas discusses sobre condies timas de experimentao tambm so
apresentadas.

6.1 Objetivos
Os objetivos principais deste captulo so:

apresentar conceitos de propagao de erros e sua aplicao em sistemas


laboratoriais e industriais;

exemplificar a implementao de rotinas para avaliao da propagao de


erros;

realizar estudos de caso, para sistemas de baixa e relativamente elevada


complexidade;

apresentar discusses sobre a importncia destas metodologias e


discusses sobre as condies timas de experimentao.

6.2 Introduo
A contribuio contida neste captulo consiste na aplicao do conceito de
propagao de erros para alguns sistemas de Engenharia Qumica, demonstrando como

86

possvel descrever as incertezas experimentais esperadas do processo bem como


indicar como apresentar discusses quanto como as regies timas de experimentao
so afetadas pelo comportamento esperado do erro.
Os sistemas laboratoriais de engenharia qumica se compem basicamente de:

sistemas de alimentao das espcies;

processos de separao e/ou reao e/ou transferncias de calor e/ou


escoamentos, entre outros;

sistemas de anlise (cromatgrafo, espectrmetro de massas, etc).

Por sua vez, unidades industriais so compostas por de diversos blocos para o
processamento de uma determinada carga. Cada um destes blocos, bem como as
conexes que os unem, contribuem com uma parcela do erro experimental. As parcelas
de contribuio so peculiares a cada caso. Os conceitos de propagao de erros podem
ser aplicados para determinar a incerteza experimental ao longo de faixas de interesse.
A propagao de erros um tema bem estabelecido na literatura tcnica. A
modelagem da disperso (varincia) juntamente com os valores mdios das variveis
um assunto bem abordado na literatura, podendo ser utilizada para avaliao da
adequabilidade dos modelos (COOK e WEISBERG, 1982). A literatura aborda
principalmente a classe de modelos lineares nos parmetros, para os quais
planejamentos timos podem ser obtidos (ATKINSON e COOK, 1995, PINTO e
PONCE DE LEON, 2006b, BIASOLI, 2005).
Neste captulo, os conceitos de propagao de erros so apresentados no mbito
da Engenharia Qumica (modelos no lineares). Basicamente, a propagao de erros
aleatrios pode ser avaliada para problemas prticos de Engenharia Qumica de forma
simples. Sejam as variveis X sujeitas a oscilaes aleatrias, cuja matriz de covarincia
VX. Se Y e X esto correlacionadas por um modelo na forma Y(X), a varincia das
variveis Y(X), dada por VY, pode ser escrita como (GRABE, 2010, pp 57,58):

(E 6.1)

Y
VY
X

VX

A Equao (E 6.1) corresponde exatamente a uma varincia de predio, sendo


anloga Equao (E 3.36) apresentada no Captulo 3. Assim, possvel aplicar os
conceitos de propagao de erros para determinar os erros de processos industriais e

87

laboratoriais em Engenharia Qumica, quando as variveis esto correlacionadas atravs


de um modelo.
Vale ressaltar que no se considera os erros tendenciosos das variveis e dos
modelos. A validade dos conceitos apresentados neste captulo restringe-se a sistemas
que apresentam erros aleatrios de medio das variveis. Alm disto, admite-se que os
modelos descrevem adequadamente o comportamento do sistema.

6.3 Aplicao do conceito de propagao de erros


6.3.1 Formulao geral

Seja um sistema qualquer, constitudo por blocos em srie e/ou paralelo com
correntes materiais e/ou energticas com ou sem retroalimentao. Cada bloco i possui
uma determinada varincia VZ(i) associada s variveis experimentais Z(i).

Bloco 1
VZ(1)
Bloco 3
VZ(3)

Bloco 4
VZ(4)

Bloco 2
VZ(2)
Bloco 5
VZ(5)

Figura 6.1- Exemplo de um processo qualquer constitudo por blocos.


A varincia total das variveis pode ser dada pela contribuio da varincia de
cada bloco e da propagao de erros, em funo do processo. Pode-se reunir todas as
variveis do processo em um vetor nico Z(G), com uma correspondente matriz de
covarincias global VZ ( G ) , que contm apenas as informaes das varincias de cada
bloco VZ ( i ) . Por conseqncia, a matriz VZ ( G ) nula em todos os termos que representam
covarincias de variveis de blocos distintos, sendo no nula apenas para covarincias
de variveis que pertenam a um mesmo bloco, conforme ilustrado na Figura 6.1.
O processo apresenta um modelo que engloba os modelos de todos os blocos

Func(G), representado por sistemas de equaes:

88

(E 6.2)

Func ( G ) , Z ( G ) 0

O modelo do processo pode ser representado pelos modelos dos blocos e pelas
equaes de balanos que relacionam as variveis de sada de blocos com as variveis
de entrada de outros blocos. O processo pode correlacionar as variveis de diferentes
blocos, resultando em uma matriz de covarincia posterior das incertezas

experimentais dada por:


T

(E 6.3)

Z ( G )
Z (G )
VZP( G ) ( G ) VZ ( G ) (G )
Z
Z

Z (G )
onde a matriz (G ) representa a derivada de todas variveis Z(G) em relao cada
Z
uma das variveis Z(G), calculada de acordo com o modelo do processo na Equao (E
6.2).
A formulao acima pode ser simplificada se o sistema no contiver correntes de
retro-alimentao. Em no havendo retro-alimentao, variveis de blocos a montante
(antes) no so influenciadas por variveis de blocos a jusante (depois). Alm do mais,
segundo os modelos dos blocos, variveis de entrada podem no ser influenciadas por
variveis de sada. Desta forma, uma srie de derivadas na Equao (E 6.3) so nulas.
O problema pode tambm ser resolvido pelo mtodo estocstico. Segundo este
mtodo, o modelo deveria ser resolvido um grande nmero de vezes. Contudo, as
variveis de sada dos modelos de cada bloco seriam acrescidas de um erro
caracterstico da variabilidade de cada bloco. Este erro deveria ser gerado
aleatoriamente, dada a distribuio de probabilidades associada variabilidade de cada
bloco.

(E 6.4)

Func ( G ) , Z ( G ) Z ( G ) 0

A variabilidade de cada varivel de sada em cada bloco i, dada por Z(G), deve
ser gerada aleatoriamente a partir da distribuio de probabilidades da incerteza das
variveis de sada de cada bloco.

89

O sistema acima deveria ser resolvido centenas ou milhares de vezes, e os


valores das variveis de entrada e sada de cada bloco deveriam ser armazenados. Aps
a realizao de diversas simulaes e armazenamento dos valores, a varincia associada
a cada varivel de entrada Z pode ser calculada. Ento, seria possvel determinar a
mdia das variveis, sua distribuio de probabilidade e a matriz de correlao entre as
diversas variveis.
6.3.2 Alguns aspectos importantes

Se no houver correntes de retroalimentao, o modelo global pode ser dividido


nos modelos de cada bloco, que ento podem ser solucionados de forma seqencial,
conforme aparecem no processo.

Desvio padro mximo de cada


varivel DesvPadMax= 0

Faa de 1 at Muitos

Escolha aleatoriamente parmetros


dentre os valores possveis
Calcule o desvio padro de cada
varivel DesvPad

Para cada varivel


Se (DesvPad > DesvPadMax) Ento
DesvPadMax = DesvPad
Fim se
Fim Faa

Informe DesvPadMax
Figura 6.2 Algoritmo para determinao da incerteza, quando os parmetros so
conhecidos em faixas.
90

Probabilidades associadas a valores dos parmetros devem ser interpretadas com


cautela. Se os parmetros oscilam no processo, de acordo com alguma distribuio de
probabilidades, o tratamento matemtico associado incerteza paramtrica deve ser
absolutamente idntico ao tratamento das variveis experimentais. Contudo, se os
parmetros so fixos, mas desconhecidos, ento a anlise de varincia das variveis
experimentais deve ser feita de acordo com os possveis cenrios decorrentes dos
parmetros desconhecidos. Isto ocorre porque a anlise de varincia apresentada
anteriormente no se preocupa com o valor absoluto das variveis de experimentais,
mas apenas com o tamanho das incertezas que as variveis experimentais podem
assumir.
Por exemplo, quando os parmetros do modelo so conhecidos com impreciso,
mas no oscilam no processo, pode-se realizar avaliaes para diferentes conjuntos de
parmetros, armazenando o pior valor da varincia possvel. Isto poderia fornecer o pior
cenrio possvel, de forma a permitir que o experimentador venha a fazer consideraes
com base nestes valores de varincias ou desvio padro de cada varivel. Estes clculos
podem tambm indicar o desvio padro mdio de cada varivel, calculado como a
mdia do desvio padro para diversas combinaes de parmetros.

6.4 Descrio dos exemplos


Um estudo de caso apresentado para reaes de primeira ordem em aparatos
experimentais simples. Discusses sobre condies timas de experimentao para a
estimao de parmetros precisos so apresentadas. Neste caso, equaes so deduzidas
e os problemas resolvidos de formas simples, com o auxilio de planilhas eletrnicas, tais
como Excel.
Outros trs estudos de casos (Exemplos 6.1, 6.2 e 6.3) so apresentados para
sistemas mais complexos, cuja soluo obtida de forma numrica. O exemplo 6.1
consiste de um sistema cuja soluo numrica pode ser obtida com o auxlio de
planilhas eletrnicas, tais como Excel. Neste exemplo, ilustra-se como os clculos
podem ser executados obter as incertezas, de acordo com as Equao (E 6.4) . Uma
validao por comparao com o mtodo estocstico tambm apresentada. Rotinas
implementadas em linguagem Fortran e estudos de validaes executadas em Excel
foram usadas para a soluo deste exemplo.
Nos exemplos 6.2 e 6.3, os modelos so diferenciais, sendo recomendado o uso
de softwares robustos, devido ao tempo de cmputo. O mtodo estocstico tambm foi
91

aplicado nestes dois exemplos, sendo implementadas rotinas em linguagem Fortran. O


exemplo 6.2 ilustra o caso de uma reao cataltica, demonstrando como as oscilaes
nas variveis de sada tornam-se altamente correlacionadas por causa do processo.
Algumas implicaes deste fato so discutidas. O exemplo 6.3 aplicado a um modelo
dinmico, o modelo de Monod. Neste caso, faixas dos parmetros so conhecidos e a
anlise da propagao dos erros apresentada para os diferentes cenrios com o intuito
de demonstrar como as incertezas paramtricas podem ser consideradas durante a
caracterizao dos erros.

6.5 Estudo de caso: Reao cataltica de primeira ordem


A discusso sobre estudo dos erros em sistemas catalticos com reao de
primeira ordem pode ser encontrada em ALBERTON et al. (2009).
6.5.1 Descrevendo a varincia da converso para sistemas simples

Um sistema cataltico simples est ilustrado na Figura 6.3.


Reagente
Reator

Cromatgrafo

Bloco 1
Bloco 2

Bloco 3

Figura 6.3 Ilustrao dos blocos de um sistema cataltico simples.


As variveis de entrada so a vazo volumtrica de alimentao do reagente (vz),
a quantidade de catalisador no reator (W) e a temperatura do reator (T). A varivel de
sada a converso do reagente na sada do reator (XR) e aps medida do cromatgrafo
(XR1). O conjunto de variveis experimentais dado por Z ={vz,W, T, XR, XR1}. Este
conjunto pode ser dividido em variveis de entrada e variveis de entrada X={vz,W, T} e
sada Y={XR,XR1}, respectivamente.
A converso do reagente pode ser escrita como (modelo do reator):

Na realidade, converso no uma varivel medida, mas sim concentrao de reagente ou rea

cromatogrfica. Por simplicidade, considera-se a converso como varivel de sada

92

X R 1 exp
vz

(E 6.5)

onde o parmetro uma constante do tipo Arrhenius, dado por:

k0 e

(E 6.6)

RT

A converso calculada com base nas reas cromatogrficas pode ser obtida como
a converso XR, acrescida de uma incerteza cromatogrfica :

X R1 X R

(E 6.7)

A vazo volumtrica pode oscilar no sistema de alimentao dos reagentes


(bloco 1). A massa de catalisador e a temperatura esto tambm sujeitas a erro no reator
(bloco 2), enquanto o erro puro associado medida de converso se concentra no
sistema cromatogrfico (bloco 3). As varincias destas variveis so, respectivamente,

vv, vW, vT, vX1.


A matriz VZ(G) pode ser escrita como:

(E 6.8) VZ ( G )

vvz

0
0

0
0

vW
0

0
vT

0
0

0
0

0
v X1

A matriz de covarincias de predio fica:

(E 6.9)
VZP( G )

vz
vz

W
vz

vz
X R

vz
X R1

vz

vz
W

vz
T

vz
X R

W
W

W
T

W
X R

T
W

T
T

T
X R

X R
W

X R
T

X R
X R

X R1
W

X R1
T

X R
X R

vz
X R1

W
vvz
X R1
0
T

0
X R1
0
X R
0
X R1
X R1

X R1

0
vW
0
0

0
0
vT
0

0
0
0
0

vz
vz

W
0
vz
0
T
0
vz
0
X R
v X1
vz
X R1

vz

vz
W

vz
T

vz
X R

W
W

W
T

W
X R

T
W

T
T

T
X R

X R
W

X R
T

X R
X R

X R1
W

X R1
T

X R
X R

vz
X R1

W
X R1
T

X R1
X R

X R1
X R1

X R1

93

Como as variveis de entrada no esto relacionadas pelo modelo, e as variveis

XR e XR1 no influenciam as variveis de entrada, diversos termos na Equao (E 6.9)


podem ser zerados. Alm disto, a diagonal da matriz de derivadas unitria, permitindo
escrever:

(E 6.10)
VZP( G )

0
0
X
R
vz
X
R
vz

1
0

0
1

X R
W
X R 2
W

X R
T
X R 2
T

0 0

0 0 vvz

0 0 0
0
1 0 0

0
0 1

vW
0

0
vT

0
0

1
0 0

0 0
0 X
R
0 vz
v X1 X R

vz

1
0

0
1

X R
W
X R 2
W

X R
T
X R 2
T

0 0

0 0
0 0

1 0

0 1

A Equao (E 6.10) permite dividir em variveis de entrada e variveis de sada


em blocos, mostrado nas Equaes (E 6.11) e (E 6.12):

(E 6.11)

(E 6.12)

X R
v vz

v X R1
vz

P
X
P
X1

vvz

VX 0
0

X R
W

X R
T

X R1
W

X R1
T

X R1
X R

0
vW
0

0
vT

vvz
X R
0

X R1
0

1 0
0

0
X R
0
vz
0
X R1
0
vz
0 v X1

vW
0
0

0
vT
0

0
0
0

X R
W

X R
T

X R1
W

X R1
T

X R1
X R

X R
X R1

onde vXP e v XP1 representam as varincias das converses obtidas ao final do reator e
calculada com as reas cromatogrficas. Para o experimentador, o interesse obter a
converso XR1, cuja varincia poderia se escrita como:
2

(E 6.13)

X
X
X
v R1 vvz R1 vW R1 vT vX1
vz
W
T
P
X1

Agora, pode-se analisar os termos envolvendo as derivadas. As Equaes (E


6.14a-c) apresentam a derivao da Equao (E 6.13), agrupando termos da derivada em
funo da prpria converso.

94

X R1
W E W E
E

exp k0 e RT k0 e RT
T
v
v R T 2

(E 6.14a)

ln 1 X R

1 X R

X R1
W E W 1
E

exp k0 e RT k0 e RT
W
v
v W

(E 6.14b)

ln 1 X R

1 X R

X R1
W E W 1
E

exp k0 e RT k0 e RT
vz
vz vz
vz

(E 6.14c)

ln 1 X R

1 X R

Como as derivadas podem ser escritas em termos da prpria converso,


conforme representado em (E 6.14b), possvel fazer:

(E 6.15) v 1 X R ln 1 X R
P
X1

2
1

1
E
2 vvz 2 vW

v
v X1
T

vz
W
R T 2

Se, sob certas condies, o termo envolvendo as varincias das variveis de


entrada puder ser considerado constante, a varincia da converso fica:

(E 6.16)

v XP1 C 1 X R1 ln 1 X R1 v X1
2

cujo desvio padro e o erro relativo so dados respectivamente por:

(E 6.17)

(E 6.18)

XP C 1 X R1 ln 1 X R1 v X
2

XP

C 1 X R ln 1 X R1 v X1

XR

XR

A Equao (E 6.17) havia sido proposta por GUTIERREZ et al. (2004) para
descrever o comportamento de incertezas em sistemas biolgicos, mas no havia sido
estendida para sistemas catalticos, como apresentado nesta tese. A Figura 6.4 apresenta
o comportamento do erro em funo da converso para um valor arbitrrio da constante
C e varincia analtica vX1 nula, segundo descritos pelas Equaes (E 6.16), (E 6.17) e
(E 6.18), respectivamente.

95

(B)
P

vX1

X1

(A)

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

Converso

0.4

0.6

0.8

1.0

Converso

X1/XR

(C)

0.0

0.2

0.4

0.6

0.8

1.0

Converso
Figura 6.4 - Comportamento do erro da converso como funo da converso, avaliando
a: (A) varincia, (B) desvio padro, e (C) erro relativo (desvio-padro dividido pela
converso) ( v X1 =0).
A Figura 6.4 demonstra um comportamento interessante para o erro
experimental no caso ilustrado. Segundo a Equao (E 6.16), o mximo valor do erro
ocorre para converses de XR=0,63, valor obtido analiticamente, derivando-se a
Equao (E 6.16) e igualando a zero. Para valores baixos e muito elevados de
converso, o erro associado pequeno. Os pontos de inflexo da Figura 6.4A (varincia
da converso) podem ser obtidos igualando-se a derivada segunda da Equao (E 6.16)
a zero. Os pontos em que a curva muda sua concavidade so aproximadamente iguais a:
XR=0,31 e XR=0,93.
Curvas similares foram apresentadas por GUTIERREZ et al. (2004) para
sistemas biolgicos, cuja deduo foi feita pela anlise de sensibilidade, avaliando a
derivada das variveis de sada em relao aos parmetros. Os autores indicaram o
ponto de XR=0,63 como ponto mximo de incerteza paramtrica para a converso de
substrato em sistemas biolgicos.
O termo C estritamente constante, segundo a Equao (E 6.16), se as razes
vzP/vz, WP/W e TP/T2 forem constantes. Esta uma afirmao plausvel para certos
96

casos. Por exemplo, o erro da vazo volumtrica v costuma ser proporcional ao valor
da vazo volumtrica vz em fluxmetros de massa. Por outro lado, em certos casos, a
impreciso na massa de catalisador costuma estar associada impreciso de balanas
analticas ou semi-analticas.
Deve-se salientar que o prprio parmetro C pode no ser constante ao longo da
faixa experimental empregada. Com base no comportamento do erro deduzido nesta
seo, pode-se fazer a anlise de condies timas de experimentao para sistemas
simples, de forma a obter parmetros precisos.
6.5.2 Avaliando condies timas de experimentao

A Equao (E 6.16) pode auxiliar na obteno de condies timas de


experimentao. A incerteza paramtrica pode ser escrita em termos da Equao (E
3.15). Para sistemas isotrmicos, a matriz B representa a derivada das variveis de sada
em relao aos parmetros. Neste caso, a matriz B constituda de um nico elemento,
dado por:

(E 6.19)

X R1
W W 1
exp
v0
vz

ln 1 X
1 X R

que, escrita em termos da converso, fica na forma:

(E 6.20)

B 1 X R ln 1 X R

Ou seja, a informao sobre a incerteza paramtrica (matriz de informao de


Fisher) pode ser obtida como:

(E 6.21)

1
J P
v
P

1 X ln 1 X
R

vX 1

97

A seguir sero avaliadas as regies timas de experimentao para a estimao


precisa do parmetro em dois casos: (i) erro constante; e (ii) erro determinado segundo
a Equao (E 6.16).
6.5.3 Erro constante:

Se o erro vX1 for considerado constante, a condio tima de experimentao


deve ser encontrada maximizando a informao de Fisher:

(E 6.22)

1
1
1 X R ln 1 X R
P
v

Esta funo apresenta mximo no ponto de XR=0,63. Contudo, este ponto


exatamente o ponto de maior erro experimental, de acordo com a Equao (E 6.16). Ou
seja, a desconsiderao do comportamento do erro experimental indicaria ao
experimentador a realizao de um experimento na condio de maior erro
experimental. Este resultado ilustra a distoro dos procedimentos de planejamento ao
se desconsiderar o erro experimental.
6.5.4 Erro de acordo com a Equao (E 6.16)

Desconsiderando o erro analtico, substituindo-se a Equao (E 6.16) na


Equao (E 6.21), tem-se que:
2

(E 6.23)

1 X R ln 1 X R


2
P
v
C 1 X R ln 1 X R v X 1

Pode-se agora analisar alguns cenrios.


Cenrio 01- Erro analtico desprezvel
Se o erro analtico puder ser desprezado (vx1=0), a varincia paramtrica pode
ser escrita como:

(E 6.24)

1
1

P
v
C 2

98

Pode-se observar que, neste caso, no h condio tima de experimentao. A


sensibilidade ao valor do parmetro apresenta a mesma forma funcional do erro
experimental. Desta forma, a preciso paramtrica estaria associada ao valor da
constante C, que depende da preciso das variveis de projeto (v, W, T). Por exemplo, se
o erro relativo (v/v e W/W) das variveis de projeto v e W for da ordem de 10% do
valor da varivel, no havendo erro na temperatura, o erro relativo do parmetro aps
serem executados NExp experimentos poderia ser obtido a priori da seguinte forma:

(E 6.25)

(E 6.26)

N Exp

1
N Exp

0,1 0,1
2

N Exp

vvz vW

vz W

0,1

2
N Exp

Ou seja, possvel conhecer a priori a preciso paramtrica com base na


preciso das variveis de projeto. Isto ilustra como a elevada preciso das variveis de
projeto pode determinar a preciso paramtrica obtida.
Neste momento, difcil generalizar o comportamento da preciso paramtrica.
Por exemplo, se a varincia da vazo dominar o erro e v for considerada constante, a
mxima preciso paramtrica seria obtida maximizando-se a informao de Fisher.

(E 6.27)

max

2
v P

max vz

Ou seja, o trabalho deveria ser conduzido na maior condio de vazo possvel,


o que levaria a um menor valor de converso. Pode-se observar que a condio mnima
de converso apenas conseqncia do maior valor da vazo e no h uma regio tima
de operao diretamente em funo da converso.
Cenrio 02- Erro analtico no desprezvel
Se o erro analtico no for desprezvel, o inverso do erro relativo do parmetro
pode ser dado por:

99

(E 6.28)

2
v

1
vX 1

1 X R ln 1 X R

Se C puder ser considerado constante, a condio tima de experimentao em


funo da converso pode ser analisada pelo segundo termo do lado direito da Equao
(E 6.28). Pode-se supor que o erro analtico possa ser descrito em termos da converso
em expresses da forma:
(E 6.29)

v X 1 a X R1 b

onde a e b so constantes. Desta forma, possvel avaliar regies timas de


experimentao. A condio tima de converso independe do parmetro C, se este for
considerado constante. Portanto, a informao do parmetro pode ser avaliada em
funo da converso para diferentes valores de a e b na Equao (E 6.29). O grfico
apresenta a informao de Fisher relativa para um valor arbitrado C=0 em diferentes
valores de a e b.
a=0.1
b= 0.0

a=0.1
b= 0.01

a=0.0
b= 0.01

a=0.1
b= 0.1

0.0

0.2

0.4

0.6

0.8

1.0

Converso
Figura 6.5 Informao normalizada do parmetro em funo da converso.
A condio tima pode variar desde converses baixas (condio de reator
diferencial) at condies de elevada converso (condio de reator integral). Contudo,
isto parece ser peculiar do aparato experimental e do comportamento das incertezas das
variveis de projeto e variveis de resposta.

100

6.6 Estudos de caso sistemas mais complexos


Exemplo 6.1 - Reatores em srie, soluo por mtodo de derivadas e pelo mtodo
estocstico

Este exemplo considera dois reatores CSTR em srie, processando uma reao
em fase lquida de primeira ordem (rA=-CA). Ao sair do primeiro reator, a corrente
diluda com um inerte antes da entrada do segundo reator. O volume dos reatores fixo,
podendo ocorrer oscilaes nas vazes volumtricas de entrada nos reatores em funo
do bombeamento dos lquidos.
Os reservatrios no introduzem oscilaes nem equaes de balano, portanto,
no sendo considerados na avaliao de propagao de erros. As bombas levam a
oscilaes das vazes volumtricas, que podem propagar oscilaes nas concentraes
da espcie A. O nmero total de variveis corresponde s variveis de sada das bombas
e variveis de entrada e sada dos reatores, resultando em 7 variveis totais do processo.

Reservatrio
de inerte

Bomba
vz2

Bomba
C1
vz1

Reservatrio
Reagente +
Inerte

CSTR 1

C2
vz1

C3
vz3

CSTR 2

C4
vz3

Figura 6.6 Ilustrao do sistema experimental do Exemplo 6.1.


Para sistemas lquidos, o modelo do processo pode ser escrito como:
(E 6.30)

vz3 vz1 vz2

(E 6.31)

C3 C2

(E 6.32)

C2

vz1
vz2 vz1

C1
1 V
vz1

101

(E 6.33)

C4

C3

1 V

vz
3

As Equaes (E 6.30)-(E 6.33) representam o modelo global do processo.


Englobando as variveis totais do processo em um vetor Z(G), tem-se que:

(E 6.34)

Z (G ) vz1 , vz2 , vz3 , C1 , C2 , C3 , C4

Como as nicas variveis sujeitas a oscilaes nos blocos so as vazes


volumtricas de sada das bombas, a matriz VZ(G) nula em todos os outros termos
correspondentes as correspondentes s demais variveis e pode ser escrita como:
vz1 vz2 vz3 C1 C2 C3 C4

(E 6.35)

vz2 1

0
0

VZ 0

0
0

vz2
0
0
0
0
0

0 0 0 0 0 vz1

0 0 0 0 0 vz2
0 0 0 0 0 vz3

0 0 0 0 0 C1

0 0 0 0 0 C2
0 0 0 0 0 C3

0 0 0 0 0 C4

Z (G )
A matriz de derivadas (G ) poderia ser escrita como:
Z
vz1
vz1 vz
1
Z (G )

vz2
vz2
Z (G ) vz1

vz3
vz3
Z (G ) vz1
(E 6.36) Z (G ) C C
1
1
(G ) (G ) vz



1
C2 C
(G ) 2
Z vz1
C3 C
(G ) 3
Z vz1
C4 C
(G ) 4
Z
vz1

vz1
vz2

vz1
vz3

vz1
C1

vz1
C2

vz1
C3

vz2
vz2

vz2
vz3

vz2
C1

vz2
C2

vz2
C3

vz3
vz2

vz3
vz3

vz3
C1

vz3
C2

vz3
C3

C1
vz2

C1
vz3

C1
C1

C1
C2

C1
C3

C2
vz2

C2
vz3

C2
C1

C2
C2

C2
C3

C3
vz2

C3
vz3

C3
C1

C3
C2

C3
C3

C4
vz2

C4
vz3

C4
C1

C4
C2

C4
C3

vz1
C4

vz2
C4
vz3

C4
C1

C4
C2

C4
C3

C4
C4

C4

102

Todos os elementos fora da diagonal so nulos na matriz VZ(G) e os nicos


elementos da diagonal no nulos so as varincias das vazes volumtricas de sada das
bombas. Desta forma, pode-se escrever cada elemento viP,k da matriz de predio da
seguinte forma:

(E 6.37)

zi
zk zi
zk
vvz (1)

vvz( 2)
viP,k

(1)
(1)
(2)
(2)
sai
sai
vzsai
vzsai vzsai
vzsai

Para exemplificar, admite-se que o parmetro seja igual a 1min-1, a


concentrao seja igual a 1 mol.L-1 as vazes volumtricas das bombas 1 e bomba 2
sejam iguais a 1000 L.min-1 e 300 L.min-1, respectivamente, os volumes dos reatores
sejam V=250 L. Os desvios das vazes volumtricas so admitidos iguais a 5% do valor
das vazes, dadas respectivamente por v1 igual a 50 L.min-1 e v2 igual a 15 L.min-1.
O problema foi resolvido com uma rotina em Fortran, sendo o valor das variveis,
desvio-padro das variveis e o erro relativo (desvio-padro dividido pelo valor da
varivel) apresentados na Tabela 6.1:
Tabela 6.1 Variveis do exemplo ilustrativo: valor (zi), desvio-padro ( zPi ) e erro

relativo em porcentagem ( zPi zi 100 ) no Exemplo 6.1.


Varivel
zi
ziP (estocstico)
ziP (derivada)

P
zi

zi 100

vz1
1000
49,7
50,0
4.97

vz2
300
14,8
15,0
4.95

vz3
1300
51,8
52,0
3.98

C1
1,00
0,00
0,00
0.00

C2
0,80
8,01x10-3
8,00x10-3
1.00

C3
0,61
1,50 x10-2
1,50x10-2
2.44

C4
0,51
1,51 x10-2
1,51 x10-2
2.93

Conforme pode ser observado na Tabela 6.1, oscilaes na ordem de 5% da


vazo de alimentao levam a oscilaes na maioria das demais variveis da ordem de
2-5%.
Fim do Exemplo 6.1
Exemplo 6.2- Reao cataltica

A seguir ser apresentado um exemplo para ilustrar como a anlise proposta


pode ser empregada em sistemas mais complexos. Seja o seguinte sistema reacional:

103

C D
A B
E
A
F G
B C

Cujas taxas de reao so dadas por:

k1 e

E1

C A CB
DEN
RT

(E 6.38)

r1

(E 6.39)

k e RT C A
r2 2
DEN

E2

k3 e

E3

CB CC
DEN
RT

(E 6.40)

r3

(E 6.41)

DEN 1 K A C A K B CB

Neste exemplo, o equipamento experimental constitudo por de sistemas de


alimentao independentes dos reagentes A, B e um inerte. Estas linhas se unem em
direo a um reator PFR, que segue posteriormente para um cromatgrafo, conforme
ilustrado na Figura 6.7.

Reator

Cromatgrafo

Inerte

Figura 6.7 Ilustrao do sistema reacional do Exemplo 6.2.


As faixas experimentais esto indicadas na Tabela 6.2.
Os valores dos parmetros considerados para esta simulao esto apresentados
na Tabela 6.3.

104

Tabela 6.2 Faixas das variveis e desvios padres correspondentes no Exemplo 6.2.
Varivel

Faixa

Desvio-Padro

Temperatura (K)

573-723

T 4

Vazo de A (mL/min)

25-100

vz 0.1 vz

Vazo de B (mL/min)

25-100

vz 0.1 vz

Vazo de C (mL/min)

25-100

vz 0.1 vz

Massa de catalisador (g)

0,02-0,50

W 104

Simulaes estocsticas foram realizadas para uma srie de combinaes das


condies experimentais indicadas na Tabela 6.2. As variveis temperatura e vazes
volumtricas foram avaliadas a trs nveis, enquanto a massa de catalisador foi avaliada
a trinta nveis. Ou seja, o nmero de condies experimentais investigados foi 34x30
=2430 condies experimentais. Para cada condio experimental fixada, o modelo foi
resolvido 1000, sendo para cada resoluo as variveis de projeto eram perturbadas de
acordo com uma distribuio normal de probabilidades. A gerao de perturbaes
aleatrias das variveis de projeto foi feita com o auxlio de uma rotina interna do
Fortran, a partir do desvio padro de cada varivel, conforme indicado na Tabela 6.2.. A
partir dos resultados das 1000 simulaes, determinava-se a mdia e o desvio padro de
cada varivel do modelo.
Tabela 6.3 Valores dos parmetros utilizados para realizar as simulaes.
Parmetro

Valor

Unidades

k1

2.5 x 104

mL2.mol-1.gcat-1.s-1

E1

7.0 x 104

J.mol-1

k2

1.0 x 106

mL.gcat-1.s-1

E2

1.0 x 105

J.mol-1

k3

1.0 x 109

mL2.mol-1.gcat-1.s-1

E3

1.3 x 105

J.mol-1

KA

1.5 x 10-1

mL.mol-1

KB

2.5 x 104

mL.mol-1

105

Os resultados do desvio padro de cada varivel de sada em funo da prpria


varivel de sada para as 2430 condies experimentais est apresentado na Figura 6.8.

0.10

0.10

Converso de A

0.08

0.08

0.06

0.06

0.04

0.04

0.02

0.02

0.020

Converso de B

0.015

0.010

0.00
0.0

0.2

0.4

0.6

0.8

1.0

0.005

0.00
0.0

0.2

0.4

XB

Desvio Padro

XA

0.8

1.0

0.000

0.05

0.016

0.6

0.04

0.02

0.00

0.05

0.10

0.15

0.20

0.05

0.10

0.15

0.20

yC

0.03
0.01

0.02

0.008

0.01
0.000
0.0

0.02

0.1

yD

0.2

0.3

0.00

0.0

0.2

0.4

0.6

0.8

yE

0.00

0.00

yF

0.01

0.00

0.00

0.05

0.10

0.15

0.20

yG

Figura 6.8 Desvios padres das converses dos reagentes (A e B) e fraes molares
dos produtos (C, D, E, F e G) em funo das variveis como determinadas pelo mtodo
estocstico.
Conforme pode ser observado na Figura 6.8, todos os desvios padres das
espcies que so puramente geradas ou consumidas aparentemente apresentam mximos
em funo dos valores das variveis. Uma disperso maior parece estar associada
espcie C, gerada na reao 1 e consumida na reao 3. Pode-se observar que os desvios
padres das converses dos reagentes A e B so muito bem descritos pela expresso
deduzida para cinticas de primeira ordem.
A gama de condies experimentais bastante variada. As curvas no so muito
bem definidas porque as condies de operao afetam os erros experimentais de forma
no linear. No entanto, em todos os casos possvel definir uma envoltria com os
mximos erros esperados. Em muitos casos, a envoltria apresenta a mesma forma
indicada pela Equao (E 6.17) e ilustrada na Figura 6.4B.

106

Os erros relativos esto apresentados na Figura 6.9. Pode-se observar que o erro
relativo diminui; medida que o valor da varivel aumenta, em todos os casos.

0.20

0.20

Converso de A

0.15

0.15

0.8

0.4

0.05

0.05

Desvio Padro Relativo

1.0

0.6
0.10

0.10

0.00
0.0

Converso de B

0.2

0.4

XA

0.6

0.8

1.0

0.00
0.0

0.2
0.2

0.4

XB

0.6

0.8

1.0

0.0
0.0

0.1

0.4

0.24

0.2

yC

0.2

0.16
0.1

0.08
0.00
0.0

0.1

0.6

0.4

yD

0.2

0.3

0.0

0.2

0.0

0.3

0.6

yE

0.0
0.0

0.1

0.2

yF

0.2

0.0
0.0

0.1

0.2

yG

Figura 6.9 - Desvios padres relativos das converses dos reagentes (A e B) e fraes
molares dos produtos (C, D, E, F e G) em funo das variveis determinada pelo
mtodo estocstico.
Para determinadas condies, os erros de medio das diferentes variveis so
naturalmente correlacionados pelo processo. Para ilustrar, a Figura 6.10 apresenta as
correlaes entre os erros de medio da converso de A e das demais variveis como
funo do valor de da converso de A, para as diversas simulaes realizadas nas 2430
condies experimentais.
Como possvel observar na Figura 6.10, as correlaes podem ser muito
pronunciadas, o que permite questionar se a hiptese dos erros independentes
realmente boa.
A converso indica o quanto uma espcie reage. A correlao entre os erros de
medida das converses de A e B na maior parte dos casos positiva; contudo,
moderada. A correlao positiva entre os reagentes sugere que oscilaes, tais como
oscilaes na massa de catalisador e temperatura de reao, ocorrem no sentido de

107

diminuir os avanos de ambas as reaes, levando flutuaes na mesma direo. Por


outro lado, oscilaes nas vazes dos reagentes, alimentados em paralelo, tenderiam a

1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

C
A

X _y
0.2

0.4

0.6

0.8

1.0

X _y

0.0

0.0

0.2

0.4

0.6

0.8

1.0

1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

0.4

0.6

0.8

1.0

1.0
0.8
0.6
F

1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

X _y

X _y

X _y

X _X

diminuir a correlao entre estas espcies.

0.4
0.2
0.0
-0.2
-0.4

0.0

0.2

0.4

0.6

0.8

1.0

-0.6

Converso de A
Figura 6.10 Distribuio de freqncia das correlaes entre as medidas de XA e as
demais variveis.
J a correlao existente entre a medida de converso da espcie A e a frao
molar de C prxima a +1 em condies de baixa converso de A, e prxima a -1 em
condies de alta converso da espcie A. A correlao fortemente positiva indica que
oscilaes que levem a um maior consumo da espcie A favorecem a formao da
espcie C, o que deve ocorrer quando oscilaes na taxa de reao 1 forem
significativas sobre a distribuio de produtos como sugere o mecanismo de reao.
Contudo, a correlao entre os erros das medidas de XA e yC se torna negativa em elevas
converses de A, quando oscilaes na taxa de reao R1 no modificam
significativamente a distribuio de produtos. Desta forma, oscilaes que tendam a
levar a uma menor converso de A (A no reage) tambm favorecem uma menor
quantidade de C, que reagente na reao R3.

108

H correlao significativa entre os erros de converso de A e de frao molar


de D para baixas e moderadas converses de A, o que esperado, uma vez que a
espcie D formada e medida que A consumido na reao R1. A correlao entre os
erros de converso da espcies A e de frao molar da espcie E positiva e moderada.
Isto possivelmente ocorre devido dois fatores: primeiramente, E formado a partir de
A na reao R2, desta forma, oscilaes no leito que tendam a levar a uma maior
converso de A favorecem a frao de E, causando correlao positiva. Por outro lado,
oscilaes que levam a um acmulo da vazo de A favorecem a formao de E, mas
diminuem a converso de A, levando a uma correlao negativa. H forte correlao
entre os erros da converso de A e os erros das espcies D e F.
parte as especificidades de cada sistema, a Figura 6.10 indica que para
diversas condies as medidas das diferentes variveis so naturalmente correlacionadas
pelo processo, a depender da condio experimental empregada. LARENTIS et al.
(2003) demonstraram que os erros de medio de reagentes e produtos so
correlacionados atravs do mecanismo de reao por oscilaes que tendam a favorecer
uma maior concentrao de produtos em detrimento da concentrao de reagentes e
vice-versa.
Um dos objetivos deste exemplo foi demonstrar que a expresso desenvolvida
para cinticas de primeira ordem na Seo 6.5.1 pode em muitos casos descrever
adequadamente o comportamento das incertezas experimentais em sistemas mais
complexos. Tambm, demonstra-se que os erros de medio das diferentes variveis so
altamente correlacionados pelo processo, ainda que a correlao seja geralmente
desprezada na maior parte estudos de modelagem cintica.
Fim do Exemplo 6.2
Exemplo 6.3: Modelo de Monod

O modelo de Monod descreve a cintica de crescimento celular e consumo de


substrato em sistemas biolgicos. O modelo de Monod relaciona a taxa de crescimento
da concentrao celular (c(t)) com a concentrao de substrato (s(t)) atravs da
seguinte expresso:

(E 6.42)

dc t
dt

c t 1

s (t )
2 s (t )

109

O modelo admite que a concentrao de substrato seja consumida para a gerao


de massa celular em uma proporo constante, resultando na Equao (E 6.43).

(E 6.43)

s (t ) s (0)

c t c 0
3

O vetor de parmetros do modelo dado por ={1, 2, 3}, representando a


mxima taxa de crescimento celular especfico, a constante de saturao e o coeficiente
de rendimento, respectivamente.
O modelo de Monod foi amplamente investigado nos trabalhos de DETTE e
colaboradores (DETTE et al., 2003, 2005, STRINGUL et al., 2009). De acordo com
DETTE et al. (2005), faixas abrangente dos valores dos parmetros (revelando pouco
conhecimento do sistema) podem ser dadas por:
mg
0, 2 3
0,3
mg

mg
0, 4 2
0, 6
L

(E 6.44) 0, 2 1 h 1 0,3

De acordo com os autores, a especificao destas faixas no admite um bom


chute inicial dos parmetros, mas sim vago conhecimento sobre os valores possveis dos
parmetros.
As reaes descritas pelos modelos de Monod so geralmente conduzidas em
reatores batelada. Neste sistema, os reagentes so adicionados ao reator, sendo retiradas
amostras para avaliaes da concentrao celular e de substrato. As fontes de erro esto
associadas principalmente a erros na preparao das concentraes de clulas e
substrato, bem como a erros analticos na determinao destas concentraes. Para as
simulaes aqui apresentadas, consideraram-se erros de 5% na preparao das
concentraes iniciais e erros analtico da ordem de 3% para determinao das
concentraes celular e de substrato.

(E 6.45)

0
c

c 0

0, 05 ,

s 0

s 0

0, 05 ,

t
c

c t

0, 03 ,

st

s t

0, 03

110

Tratando-se de sistemas biolgicos, oscilaes nos parmetros cinticos tambm


podem ser esperadas. Desta forma, considerou-se que os parmetros 1 e 2 sujeitos
oscilaes da ordem de 3%.

(E 6.46)

0, 03 ,
0, 03
1
2
1

Para avaliar a estrutura da incerteza ao longo do tempo, adotou-se uma condio


especfica de concentraes iniciais de clulas e substratos, respectivamente dado por
c(0)=0,03 mg.L-1 e s(0)=1 mg.L-1, conforme sugerido por STRINGUL et al. (2009).

Avaliou-se a estrutura do erro por simulaes estocsticas. Como os parmetros


so conhecidos em faixas, foram utilizadas diferentes combinaes dos parmetros,
indicando diferentes cenrios. De forma similar ao Exemplo 6.3, a condio
experimental de c(0)=0,03 mg.L-1 e s(0)=1 mg.L-1, cerca de 3000 simulaes foram
feitas, sendo que em cada simulao as variveis c(0) e s(0) eram perturbadas em torno
do valor original, com o acrscimo de flutuaes aleatrias. Tais flutuaes aleatrias
foram geradas com o auxlio de uma rotina interna do Fortran, mediante o clculo de
uma inversa da distribuio normal de probabilidades com desvio padro para cada
varivel. Os resultados de concentrao das 3000 simulaes foram armazenados, e os
valores das variveis de c(t) e s(t) ao longo da faixa de tempo t=(0,30)h permitiram o
clculo do desvio padro da concentrao celular e de substrato em cada tempo. Os
parmetros tambm foram permitidos variar, sendo calculados mediante perturbaes
aleatrias em torno de seus valores mdios de forma idntica que as variveis de
projeto.
Como os parmetros so conhecidos em faixas, o procedimento descrito no
pargrafo anterior foi repetido para diversas combinaes dos parmetros, gerados
dentro da faixa especificada em (E 6.45). Para diversas combinaes dos parmetros,
calculava-se o desvio padro mdio e o desvio padro mximo das variveis de c(t) e
s(t). O clculo do desvio padro mdio da concentrao celular e de substrato est

ilustrado na Equao (E 6.47), sendo () considerada uniforme. O clculo do desvio


padro mximo da concentrao celular e de substrato est demonstrado na Equao (E
6.48).
(E 6.47)

c c d

s s d

111

(E 6.48)

c ,max max c

s ,max max s

Os valores mdios das concentraes celulares (c(t)) e de substrato (s(t)) na


faixa de tempo t=(0,30)h, o valor mdio do desvio padro das variveis de sada
( c (t ) ) e valor mximo de desvio padro das variveis de sada ( s (t ) ) so

apresentados na Figura 6.11. A Figura 6.11 apresenta tambm o erro relativo da


concentrao ( c c ) celular e de substrato ( s s ).
Pode ser observado nas Figura 6.11 (C,D) que os desvios padres das variveis
apresentam mximos em funo do tempo. Isto mostra que, nesse processo, os erros de
medio podem variar fortemente no tempo. O comportamento heteroscedstico da
varincia deve ser de fato esperado para a maioria dos sistemas reais, conforme, por
exemplo, reportado por SEVERO (2007) e PEREIRA et al. (2009). O desvio padro
relativo (E,F), por outro lado, situa-se em uma faixa mais estreita para as variveis, da
ordem de 2-6% para concentrao de clulas e de substrato.
Conforme esperado para modelos dinmicos, as variveis so altamente
correlacionadas para variveis tomadas ao longo do tempo. Isto inviabiliza a inverso da
matriz de incertezas experimentais na forma rigorosa, e, por conseguinte, impede a
avaliao rigorosa de condies timas de experimentao. Por esta razo, pode no ter
qualquer sentido estabelecer procedimentos baseados na premissa de que as medidas
experimentais estejam sujeitas a flutuaes independentes.
A estrutura do erro para o modelo de Monod foi estudada por GUTIERREZ e
DANIELSON (2006) e GUTIERREZ et al. (2004). Os autores propuseram expresses
para descrever a incerteza experimental de tais sistemas. De forma similar ao
apresentado na seo 6.5.1 deste captulo, a estrutura do erro proposta por GUTIERREZ
e DANIELSON (2006) deduzida a partir das expresses do modelo, obtendo formas
fechadas para a funo do erro. Embora formas analticas possam ser de grande
utilidade, a avaliao por mtodos numricos muito mais abrangente.
Por exemplo, pode-se observar que a incluso de erros analticos e erros na
preparao das solues iniciais levam a curvas mais complexas para a estrutura do
erro. Conforme demonstrado nas simulaes apresentadas, possvel avaliar a estrutura
do erro em modelos biolgicos para fins de estimao de parmetros e planejamento de
experimentos (uma discusso mais aprofundada deste tema apresentada no captulo 7).

112

(A)

0.30

(B)

1.0

0.25

0.8

s(t)

c(t)

0.20
0.15

0.4

0.10

0.2

0.05
0.00

0.6

0.0

10

15

20

25

30

10

15

Desvio padro maximo de c

(C)

0.016

20

25

30

tempo (h)

tempo (h)
0.06

(D)

s(t) (mg.L-1)

c(t) (mg.L-1)

Desvio padro maximo de s


0.012

0.04

0.008

0.02

0.004

0.000

Desvio padro mdio de c

10

15

20

25

Desvio padro mdio de s


30

0.00

10

tempo (h)

15

20

25

30

tempo (h)

0.075

0.08

c(t) / c(t)

(E)

(F)

0.07

Desvio padro
relativo mdio de s

0.06

s(t) / s(t)

0.050

0.05
0.04

0.025

Desvio padro relativo mdio de c

0.03
0.02

0.000

10

15

20

25

tempo (h)

30

0.01

10

15

20

25

30

tempo (h)

Figura 6.11 (A,B) Valor mdio; e (C,D) desvio padro; e (E,F) desvio padro relativo
para a concentrao celular c(t) e de substrato s(t) em funo do tempo.
Fim do Exemplo 6.3

6.7 Discusso e concluses


No estudo de caso de sistemas de primeira ordem, demonstrou-se que a condio
tima de experimentao, se que existe alguma, dificilmente pode ser conhecida a
priori, sendo conveniente realizar experimentaes em amplas faixas de converso. Foi

demonstrado como a incerteza experimental das variveis de projeto se transfere

113

diretamente para a incerteza paramtrica, o que forte argumento a favor do elevado


controle sobre as variveis de projeto para fins de estimao de parmetros.
Para modelos mais complexos, o Exemplo 6.1 ilustrou como proceder os
clculos para modelos quaisquer. Foi feita tambm a validao, quando se calculou a
varincia de predio pelas Equaes (E 6.3) e pelo mtodo estocstico segundo a
Equao (E 6.4).
O exemplo 6.2 demonstrou como oscilaes nas variveis do processo podem se
tornar altamente correlacionadas devido s oscilaes nas variveis de projeto. Contudo,
na prtica, a correlao entre as variveis dificilmente caracterizada. A ausncia desta
correlao pode distorcer significativamente o planejamento timo e a estimao de
parmetros. Por exemplo, DETTE et al. (2008) investigaram condies timas de
experimentao de modelos simples para variveis altamente correlacionadas. Os
autores concluram que a distribuio igualmente espaada de pontos de amostragem
resulta em boa estimao de parmetros. De fato, ATKINSON et al. (2007, pp 441-443)
apresentou um exemplo de um modelo dinmico no qual a considerao de variveis
fortemente correlacionadas leva a planejamentos timos que tendem a distribuir ao
mximo os pontos na regio de busca, enquanto o planejamento timo para variveis
no correlacionadas concentra os experimentos em algumas regies experimentais. Por
outro lado, ao desprezar a correlao das incertezas experimentais, o planejamento
timo pode levar a resultados insatisfatrios para a estimao de parmetros. SANTOS
e PINTO (1998) tambm demonstraram que correlaes inadequadas podem distorcer
completamente a anlise da significncia dos parmetros.
Quando muito, a maior parte dos estudos experimentais determina o desvio
padro de cada varivel. A prpria considerao de medidas correlacionadas dificulta a
inverso da matriz de incertezas experimentais, acarretando problemas numricos
durante o procedimento de estimao de parmetros e planejamento de experimentos.
H um grande problema numrico associado inverso de matrizes de incertezas
experimentais de medidas fortemente correlacionadas, o que foi observado para o
exemplo apresentado na seo anterior. Por exemplo, nos exemplos 6.2 e 6.3, a elevada
correlao entre as variveis no permitiu com freqncia a inverso da matriz de
covarincias experimentais.
De

fato,

muito

provavelmente

diversas

medidas

so

naturalmente

correlacionadas para a maioria dos processos de Engenharia Qumica. Esta correlao


geralmente ignorada por desconhecimento do pesquisador.
114

A obteno de condies timas quando nenhum experimento ainda tiver sido


realizado (a exemplo do que foi feito no Estudo de Caso da Cintica de Primeira
Ordem) leva a um problema de otimizao nada trivial. Mesmo se estimativas iniciais
para os valores dos parmetros estiverem prximos aos valores verdadeiros dos
parmetros, para que a matriz de informao de Fisher seja inversvel, o nmero de
pontos experimentais deve ser maior (ou em certas condies igual) ao nmero de
parmetros do modelo. Neste caso, certo nmero de experimentos iniciais deveria ser
planejado. Trata-se de um problema de otimizao bastante complexo, descrito em mais
detalhes no Captulo 7.
Pode-se conjecturar que as condies timas de experimentao podem
depender de forma muito especfica dos diversos erros caractersticos do processo e
desconhecidos pelo pesquisador. De forma similar, podem depender dos parmetros
desconhecidos dos modelos, conforme ilustrado para o modelo de primeira ordem na
Seco 6.5.1. Desta forma, quando se tem muito pouco conhecimento sobre o sistema
experimental, pode ser bastante complicado avaliar regies timas de experimentao.
No parece nenhum absurdo propor a realizao de experimentos de carter
exploratrio, distribudos segundo alguma heurstica sobre a faixa experimental (como
por exemplo, plano fatorial clssico).
Mesmo no sendo aplicada de forma rigorosa para fins de avaliao de
condies timas de experimentao, a metodologia descrita neste captulo pode ser
bastante til. Pode-se empregar esta metodologia para a determinao das incertezas
experimentais, e posterior uso destas incertezas nos processos de estimao de
parmetros e planejamento seqencial de experimentos. Contudo, problemas numricos
associados inverso das matrizes de incertezas experimentais devem ser esperados se
as medidas forem excessivamente correlacionadas pelo processo.
O Captulo 7 ilustra como os resultados obtidos aqui podem ser alimentados para
avaliao de condies timas, tomando-se como exemplo o Modelo de Monod.

115

7 PLANEJAMENTO INICIAL
RESUMO
Este captulo apresenta uma discusso sobre um tema abordado h certo tempo
na literatura referente ao planejamento inicial de experimentos, quando apenas faixas
possveis para os parmetros esto disponveis para avaliao de planejamentos
timos. Rotinas em linguagem Fortran com busca em malha para avaliao de
condies timas foram desenvolvidas. Contudo, o problema apresenta elevada
complexidade de soluo numrica para problemas de grande porte, o que leva a uma
exploso combinatorial pela busca em malha. Neste caso, algoritmos de otimizao
deveriam ser empregados para obteno de condies timas. No entanto, tais rotinas
deveriam ser adaptadas, uma vez que o problema de otimizao no trivial. Uma
conciliao simples entre os critrios apresentados na literatura proposta. Trs
exemplos de planejamento inicial timo so apresentados para ilustrar os
procedimentos.

7.1 Objetivos
Os principais objetivos abordados deste captulo so:

apresentar os conceitos bsicos desenvolvidos na literatura de


estimao

de

parmetros

sobre

planejamento

inicial

de

experimentos;

apresentar uma proposta simples para conciliar os dois principais


critrios utilizados na literatura para a escolha de planejamentos
timos;

apresentar alguns exemplos que ilustram caractersticas das solues


timas;

discutir os problemas de otimizao envolvidos na obteno de


solues timas.

116

7.2 Introduo
Os critrios de planejamento de experimentos procuram melhorar o valor dos
parmetros conhecidos com alguma preciso. No entanto, ao iniciar um planejamento
de experimentos, muitas vezes no se conhece boas estimativas iniciais para os
parmetros, mas apenas faixas admissveis dos parmetros, ou mais comumente das
variveis de sada do modelo.
Seja E(,) uma funo de informao referente estimao precisa de
parmetros ao se fazer um conjunto de experimentos . O termo E(,) pode
representar qualquer um dos critrios de informao apresentados na Seo 5.3 (A, D,
E-timo, G, I-timo, entre outros). Uma normalizao do critrio pode ser tomada como

o valor do critrio dividido pelo valor mximo que o critrio pode atingir, na forma:

(E 7.1)

Enorm ,

E ,
max E ,

Isto conveniente para aplicao no planejamento inicial, uma vez que


parmetros com valores distintos podem ser estimados com precises distintas. Caso
no seja feita a normalizao, parmetros que so estimados com valores mais precisos
tenderiam a dominar os critrios descritos neste captulo.
Como critrio de estimao precisa, neste captulo ser utilizado sempre o
critrio do volume (D-timo). Isto condizente com os resultados que sero
apresentados no Captulo 10, onde o critrio do volume deduzido a partir de uma
proposta de medida de informao. Alm disto, o critrio do volume apresenta a
vantagem de ser invariante reparametrizao, no sendo influenciado pelas diferentes
escalas dos parmetros, como so os critrios A-timo e E-timo.

Por exemplo, seja um modelo y=e-.x. Admite-se que a um parmetro e varincia experimental
vy=1. A condio de timo x=1/. Ao considerar como possvel valor do parmetro =1 e realizar um
experimento na condio de timo x=1, o erro paramtrico fica igual a =e-1/ . Por outro lado, ao
considerar como possvel valor do parmetro =2 e realizar um experimento na condio de timo x=1/2,
o erro paramtrico fica igual a =0,5e-1. Ou seja, em valores numricos o parmetro =1 pode ser
estimado com muito mais preciso do que o parmetro =2. Contudo, na realidade, o parmetro assume
apenas um nico valor desconhecido.

117

A literatura apresenta o valor normalizado do critrio do volume como eficincia


de estimao da seguinte forma:

J P ,
eff ,
max J P ,

(E 7.2)

Np

O termo 1/Np fornece uma normalizao, uma vez que o determinante uma
multiplicao dos valores das incertezas paramtricas (ATKINSON et al., 2007, pp
368).
Vale ressaltar, contudo, que o volume da regio de confiana uma medida
adequada de informao para avaliao da incerteza paramtrica como descrito no
Captulo 10. Desta forma, a eficincia de estimao de um parmetro com um
conjunto de experimentos ; poderia ser escrita como o volume da regio de confiana
mnimo dividido pelo volume da regio de confiana de um planejamento , ou seja,
VCRmin()/VCR(,), onde VCR representa o volume da regio de confiana. Logo, em

termos

da

matriz

de

informao

de

Fisher,

isto

seria

dado

por

J P , max J P , ; ou seja, a razo entre os determinantes elevado a ao

invs de 1/Np. No entanto, para fins de comparao com a literatura, define-se a


eficincia de estimao em concordncia com o que apresentado na literatura, de
acordo com a Equao (E 7.2).
O problema de planejamento inicial pode ser comparado a um atirador que deve
acertar um alvo. Contudo, h um pano preto que recobre as possveis posies em que o
alvo se encontra. Portanto, o atirador desconhece a posio exata do alvo, mas conhece
algumas posies possveis, conforme ilustrado na Figura 7.1. Onde o atirador deveria
mirar para conseguir uma maior pontuao? A analogia pronta: onde concentrar
experimentos (tiros) se h grande incerteza quanto ao ganho de informao (alvos) que
se espera ter em cada posio que se mira?
Este problema pode ser resolvido com conceitos de Teoria da Deciso
apresentados no Captulo 2. Cada possvel valor dos parmetros pode ser considerado
um possvel estado da natureza. Logo, o nmero de funes objetivos corresponderia
funo de informao para cada possvel valor do parmetro. Sendo diversos os
possveis estados da natureza , o problema multiobjetivo e a soluo do problema

118

consiste na frente de Pareto, ou conjunto de planos experimentais no dominados.


Contudo, para a maioria dos problemas de planejamento inicial, o nmero de solues
timas infinito. Para incertezas paramtricas contnuas, o prprio nmero de funes
objetivos (ou estados da natureza) infinito.

Possveis
regies do
alvo
imaginadas
pelo
atirador

Figura 7.1 Ilustrao de um atirador que deve acertar um alvo desconhecido com
alguns tiros (analogia com o planejamento de experimentos inicial).
Duas formas principais so aceitas para a obteno de planejamentos timos
focados na estimao de parmetros precisos: o critrio Bayesiano e o critrio Maximin
(ATKINSON et al., 2007, pp 258, DETTE et al.,. 2006, 2008). conveniente definir a
eficincia mdia effMedia() e a eficincia mnima de estimao. Considerando o critrio
do volume, para um planejamento qualquer , tais eficincias so dadas respectivamente
por:

(E 7.3)

J ,
eff Media
J max

(E 7.4)

J ,

eff Min min
J max

Np

Np

A escolha de um ponto timo segundo o critrio Bayesiano procura maximizar a


eficincia mdia, ou seja:
(E 7.5)

otm, Bayes arg max eff Media

119

O segundo critrio apresentado na literatura o critrio Maximin, que busca


maximizar a informao para o pior conjunto de parmetros possvel. Segundo este
critrio, o plano timo deve ser obtido maximizando-se a seguinte expresso:

otm, Maxi min arg max eff Min

(E 7.6)

Este segundo caso busca o plano timo que garanta um bom valor mnimo do
critrio de informao no importa qual seja o valor do parmetro.
Conforme comentado por ASPREY e MACCHIETTO (2002), o critrio
Bayesiano adequado se os valores mdios so prximos aos valores verdadeiros dos
parmetros, mas perde sua eficincia se os valores mdios da distribuio paramtrica
forem distintos dos valores verdadeiros dos parmetros. Contudo, uma caracterstica
aparente surge ao se observar o critrio Bayesiano para planejamentos iniciais. Esta
incoerncia fica evidente ao se observar modelos com um nico parmetro, ={} e
uma nica varivel de resposta Z={y}. Neste caso, a informao total sobre um
parmetro resultado da soma das informaes de diversos experimentos da seguinte
forma:
yi 2

2
eff Media , w
x

yi
i
i

x1 , x2 ,...

(E 7.7)

Se

uma

y
w i

condio
2

nica

xotm

maximiza

informao

y2 xi d , o critrio Bayesiano indicar a repetio do mesmo


i

experimento para qualquer nmero de experimentos que se deseja, ou seja, otm ={xotm,
xotm, ...}. Este argumento parece simples e irrefutvel. A nica possibilidade de ter mais
y
de um ponto timo se o mximo w i

y2 xi d for obtido de
i

forma idntica para mais de um ponto x. Contudo, neste caso, tanto faz repetir os
experimentos em um nico ponto que maximiza o critrio ou dividir os experimentos
entre os pontos que maximizam o critrio (HAINES, 1995). CHALONER e LARNTZ

120

(1993) e DETTE e NEUGEBAUER (1996) apresentam consideraes matemticas para


avaliar um se um planejamento timo tem apenas uma nica condio xotm.
No entanto, no parece lgico repetir o mesmo experimento ao invs de realizar
experimentos com carter exploratrio em condies distintas uma vez que no se
conhece os parmetros. Neste caso, o critrio Maximin parece ser mais adequado para
avaliao de condies timas de experimentao, uma vez que no tende a indicar a
repetio do mesmo experimento.

7.3 Conciliao dos critrios Bayesiano e Maximin


Neste trabalho prope-se uma conciliao bastante simples para os critrios
Bayesiano e Maximin. Tomando o critrio Bayesiano como base e a medida de
informao pelo determinante da matriz de informao de Fisher, a eficincia de um
planejamento em relao ao critrio Bayesiano pode ser escrita como:
1

(E 7.8)

J , Np
J max d

E , In
Bayes

eff Media otm , Bayes

E , In
onde Bayes
representa o valor da eficincia mdia segundo um plano dividida pela

eficincia mdia mxima. Analogamente para o critrio Maximin, a eficincia de um


planejamento em relao ao critrio Maximin pode ser escrita como:

(E 7.9)

Np

J
,

min

J max ,

E , In
MaxMin

eff Min otm , MaxMin

E , In
O termo Max
min representa a eficincia de um planejamento para o pior

conjunto de parmetros dividido pela maior valor da menor eficincia segundo todos os
planejamentos.
Estabelecendo

estas

funes

como

dois

limites,

podem-se

escolher

planejamentos que apresentem bons valores segundo o critrio Bayesiano e segundo o

121

critrio Maximin adotando-se uma ponderao w entre estas eficincias, que pode ser
escrita como:
(E 7.10a)

E , In
E , In
E , In w Bayes
1 w MaxMin

(E 7.10b)

otm arg max E , In

Obviamente, w=1 leva escolha do critrio Bayesiano, e quando w=0 leva


escolha do critrio Maximin. Diversas ponderaes entre critrios de estimao precisa
so apresentadas na literatura (COOK e WONG, 1994, ATKINSON, 2008, CLYDE e
E , In
E , In
CHALONER, 1996, IMHOF e WONG,, 2000). Os termos Bayes
e MaxMin

representam normalizaes

das eficincias de

estimao

mdia

mnima.

Normalizaes das funes em problemas multiobjetivos so comuns como formas de


evitar decises equivocadas com base nas diferentes magnitudes das funes
(CHANKONG e HAIMES, 1983, pp 25-30, MIETTINEN, 2008, pp 11). A
aproximao proposta usual em problemas multiobjetivos, mas no foi encontrado
algum trabalho em que esta aproximao fosse aplicada aos critrios Bayesiano e
Maximin.
Uma questo pode ser levantada sobre a vantagem de se obter um planejamento
timo segundo o critrio apresentado na Equao (E 7.10). A resposta que o critrio
escolhe um ponto diferente dos pontos timos para o critrio Bayesiano ou Maximin se
a perda na eficincia de um critrio, Bayesiano, por exemplo, compensada por uma
maior eficincia no critrio Maximin, e vice-versa. Ou seja, possvel entender as
E , In
E , In
funes de informao Bayes
e MaxMin
como funes lucro. Se as funes

lucros possuem a mesma ordem de grandeza (mesma importncia), o valor adequado de


E , In
E , In
w 0.5. Uma perda aceitvel na funo Bayes
somente se o ganho em MaxMin

E , In
for superior perda em Bayes
, e vice-versa. Desta forma, se a frente de Pareto for
E , In
E , In
cncava entre Bayes
e MaxMin
, pontos intermedirios entre as condies timas
E , In
E , In
de Bayes
e MaxMin
podem ser escolhidos. Por outro lado, se a frente de Pareto
E , In
E , In
for convexa, prefervel escolher a condio que maximiza Bayes
ou MaxMin
. A

Figura 7.2 ilustra frentes de Pareto cncava e convexa e a escolha de pontos para uma
ponderao w=0,5.
122

E , In
Bayes

(A)

E , In
Bayes

(B)

w=0,5

w=0,5

Ponto
timo
Pontos
timos

1
E , In
Bayes

w=0,5

E , In
MaxMin

E , In
1 MaxMin

E , In
Bayes

w=0,5

Ponto
timo

Ponto
timo

(C)

(D)
E , In
1 MaxMin

E , In
1 MaxMin

Figura 7.2- Ilustrao de frentes de Pareto onde o critrio: (A) no coincide com
Bayesiano ou Maximin; e (B) coincide com Bayesiano ou Maximin ; (C) coincide com
Bayesiano; (D) coincide com Maximin.
As frentes de Pareto apresentadas restringem-se a duas funes, as eficincias
dos critrios Maximin e Bayesiano, independente da complexidade do problema. Desta
forma, possvel montar a frente de Pareto, permitindo uma avaliao visual, e avaliar a
eficincia relativa dos critrios para a escolha do prximo ponto.
Outro dado que pode ser obtido a varincia paramtrica esperada, tornando
possvel calcular o erro relativo esperado para cada parmetro ao se realizar o
planejamento inicial. Isto pode ser feito invertendo a matriz de informao de Fisher
J(,) para obter a matriz de covarincia paramtrica V, onde representa o conjunto
de parmetros do modelo ={1, 2,..., Np}. Logo, o erro relativo de cada parmetro j
pode ser dado pela raiz quadrada da diagonal da matriz V dividida pelo valor do
parmetro j.

123

7.4 Implementao do algoritmo


Rotinas para determinao das condies timas para sistemas complexos foram
desenvolvidas em linguagem Fortran. A busca da soluo tima nesta rotina foi obtida
pela busca em malha, na qual todas as combinaes das variveis so consideradas. A
implementao do algoritmo est exemplificada a seguir por um exemplo ilustrativo. O
algoritmo utilizado est apresentado na Figura 7.3.
Especificaes:
Faixas dos parmetros (min, max). O vetor composto por {1, 2,.., Np}
Nmero de divises em cada parmetro j representado por Ndivj;
Faixas das variveis de projeto (X0, XF); sendo que X corresponde ao vetor das variveis {x1, x2,..,xNp}
Nmero de divises em cada varivel xi representado por Ndivxi
Nmero de experimentos NExp
Nmero de rplicas permitidas
Probabilidades dos parmetros (k)
Peso w
Diviso de cada parmetro j de acordo com Ndivj
Diviso de cada varivel xi de acordo com Ndivxi

Gerao de todos os experimentos possveis


Gerao de todos os planos experimentais possveis, combinando todos os possveis
experimentos NExp a NExp
Gerao de todos os possveis valores dos parmetros a partir da combinao de todos
os possveis valores dos parmetros j (j=1,Np), resultando em k (k=1,N). Cada
possvel valor k representa a regio k, em que o espao dos parmetros foi dividido.
Clculo do volume dos parmetros representado pela regio k, indicado por Vpar,k
Para cada possvel valor dos parmetros k (k=1,N), faa
|Jmax(k)| = 0
Para cada plano experimental possvel (i=1,N), faa
Calcule |J(k,i)|
Se ( |J(k,i)|> |Jmax(k)|) Ento
|Jmax(k)|=|J(k,i)|
Fim se
Fim faa
Fim faa
Para cada valor do parmetro k (k=1,N), para cada plano experimental (i=1,N) faa
eff(k,) = (|J(k,i)|/ |Jmax(k)|)1/Np
Fim faa
effMediaMax=0 e effMaxmin=0
Para cada plano experimental possvel (i=1,N), faa
N
effMedia(i)= k 1 k eff k , i V par ,k
effMin(i)=+

124

Para cada possvel valor dos parmetros k (k=1,N), faa


Se (eff(k,i)<effMin(i)) Ento
effMin(i)= eff(k,i)
Fim se
Fim faa
Se (effMin(i)> effMaxMin) Ento
effMaxMin=effMin(i)
otm,MaxMin=i
Fim se
Se (effMedia(i)>effMediaMax) Ento
effMediaMax = effMedia(i)
otm,MediaMax=i
Fim se
Fim faa
O conjunto de todos os pontos pode ser analisado por um filtro de Pareto (opcional)
E , In
otm
0

Para cada plano experimental possvel (i=1,N), faa


E , In
Bayes
= effMedia(i)/effMediaMax

E , In
= effMin(i)/effMaxMin
MaxMin
E , In
E , In
E , In = w Bayes
+(1-w) MaxMin
E , In
Se ( E , In > otm
) Ento
E , In
otm
= E , In

otm=i
Fim se
Fim faa
Figura 7.3 Algoritmo para determinao do planejamento timo.
Para o clculo da eficincia mdia, necessrio realizar uma integral mltipla no
espao dos parmetros. No algoritmo apresentado na Figura 7.3, esta etapa corresponde
ao clculo k 1 k eff k , V par , k . Em todos os exemplos apresentados nesta
N

tese considera-se distribuio de probabilidades () uniforme no espao dos


parmetros; ou seja, ()=1/Vpar, onde Vpar o volume do espao dos parmetros. Esta
integral mltipla foi calculada dividindo-se o espao dos parmetros em Nk regies,
cada uma com volume Vpar,k. O valor de eff k , calculado para um ponto dentro
da regio, e considerado igual para todos os elementos dentro da regio k. Considera-se
125

com isto um incremento retangular no intervalo k, levando ao seguinte clculo da


integral:

(E 7.11)

eff Media

1
V par

eff , V
i 1

par , k

Para ilustrar o funcionamento do algoritmo, alguns exemplos so apresentados a


seguir.

7.5 Exemplos
Trs exemplos sero apresentados para ilustrar a escolha de planos iniciais. O
primeiro exemplo um exemplo simples com um modelo exponencial contendo uma
nica varivel de sada e um nico parmetro. O segundo exemplo apresenta modelos
exponenciais e uma comparao com resultados da literatura. O terceiro exemplo um
exemplo mais complexo, com equaes diferenciais para a cintica de Monod.
Exemplo 7.1 - Modelo exponencial simples

Seja o modelo exponencial y=e-x, cujo parmetro pode assumir quatro valores
={1,2,3,4}, todos igualmente equiprovveis. O erro experimental da varivel de
resposta constante igual a vy=0,01.
Neste exemplo, admite-se que o pesquisador acredite que o parmetro possa
assumir quatro valores possveis, e igualmente provveis, ou seja, ={1,2, 3, 4}. Ao
se fazer trs experimentos segundo um plano ={x1,x2,x3}, qual o planejamento timo
para a estimao precisa do parmetro ?
A soluo clssica de estimao precisa de dada por:

(E 7.12)

xotm

Para o valor do critrio de informao de Fisher (matriz de informao de


Fisher) fica:

126

(E 7.13)

1 1
e

J max

vy

Desta forma, a informao obtida com um experimento para um parmetro


pode ser escrita como:
3

(E 7.14)

J ,
J max

x e
i 1

xi

1 1

i 1
3

Contudo, o valor de pode assumir quatro valores distintos e, portanto, so


quatro os possveis estados da natureza. O problema , portanto, multiobjetivo com
quatro funes objetivos, e pode ser resolvido sob a tica da Teoria da Deciso
apresentada no Captulo 2. As quatro funes objetivos, representando as eficincias de
estimao, so apresentadas abaixo:

(E 7.15)

x e x ,
eff 1 , i
2
1
i 1 3 1 e
3

eff 3 ,
i 1

xi e3 x
i

3 e 1
3

xi e2 x

eff 2 ,
i 1

3 e 1
2

, eff 4 ,
i 1

xi e4 x
i

3 e 1
4

Uma vez que todos os estados da natureza so equiprovveis, o critrio


Bayesiano, que fornece uma eficincia mdia, para um plano pode ser escrito como:

(E 7.16)

eff Media

1 4
eff k ,
4 k 1

Pode ser observado que o nmero de funes objetivos reduzido a duas se for
considerado apenas o critrio Bayesiano e o critrio Maximin. A informao

127

apresentada acima um valor de eficincia mdia de estimao dos parmetros. Pode-se


definir a eficincia em relao aos critrios. Em relao ao critrio Bayesiano:

(E 7.17)

E , In
Bayes

eff Media

max eff Media

De forma anloga, o critrio Maximin de um planejamento pode ser escrito


como:

(E 7.18)

eff Min mink eff k ,

A normalizao do critrio Maximin pode ser escrita como:

(E 7.19)

E , In
MaxMin

eff Min

max eff Min

O problema inicialmente de quatro funes objetivos passa agora a ter apenas


duas funes objetivos. As duas funes objetivo so ento dadas pelas eficincias
E , In
E , In
Bayes
e MaxMin
. A soluo dada pela frente de Pareto, que se constitui de

diversos pontos: qualquer ponto dentro da frente de Pareto uma soluo tima do
problema. O problema foi resolvido com o algoritmo implementado em linguagem
Fortran. Os valores de x foram tomados entre x=(0,1), com divises em 100 pontos. As
eficincias mdias e a eficincia mnima para cada planejamento experimental esto
apresentadas na Figura 7.4A. A normalizao segundo o critrio Bayesiano e Maximin
para os pontos dentro da frente de Pareto esto apresentadas na Figura 7.4B (o total de
planos experimentais analisados foi de 171.700).
Um ponto timo pode ser escolhido, segundo a Equao (E 7.10), adotando-se

w=0,5, o que resulta em:

(E 7.20)

E , In
E , In
otm arg max 0,5 Bayes
0,5 MaxMin

128

Graficamente, a Equao (E 7.20) equivale a traar uma reta com inclinao -1


na Figura 7.4B e observar o mximo ponto em que esta reta cruza a Frente de Pareto.

Ponto timo
escolhido

(B)

E,In

Bayes()

1.0
tg = -1

0.9

0.8

0.7
0.7

0.8

0.9

1.0

E,In

MaxMin()

Figura 7.4 (A) Eficincias mdia mnima de estimao para todos os planejamentos
analisados (em destaque a frente de Pareto); (B) eficincias segundo o critrio
Bayesiano e Maximin para a frente de Pareto (ponto timo escolhido para w=0,5).
As eficincias de informao para cada um dos critrios esto apresentadas na
Tabela 7.1.
Tabela 7.1 Plano experimental timo, valor da eficincia mdia e da eficincia
mnima segundo cada critrio
Critrios

Plano experimental

Valor dos critrios

x1

x2

x3

effMedia(,)

effMin(,)

w = 0,5

0,4509

0,4651

0,4651

0,7835

0,6257

Bayesiano

0,3743

0,3743

0,3743

0,8079

0,4897

Maximin

0,4509

0,4651

0,4651

0,7835

0,6257

129

Conforme mostrado na Tabela 7.1, o critrio Bayesiano indica a repetio do


mesmo experimento. O critrio Maximin indica repetio de dois experimentos e um
terceiro experimento em condio ligeiramente distinta dos dois primeiros.
Segundo a Tabela 7.1, a eficincia mnima segundo o planejamento timo para o
critrio Bayesiano igual a 0,4897, enquanto a eficincia mnima segundo o
planejamento timo para o critrio Maximin igual a 0,6257. Ou seja, observando o
menor valor da eficincia, o critrio Maximin significativamente superior. A
eficincia mdia de estimao muito prxima para os planejamentos timos segundo
os critrios Maximin e Bayesiano, 0,7835 e 0,8079 respectivamente. Portanto, o
planejamento timo segundo o critrio Maximin parece ser uma escolha mais adequada.
Conforme indicado na Figura 7.4B e apresentado na Tabela 7.1, o ponto timo
segundo a ponderao w=0,5 para a Equao (E 7.20) corresponde ao critrio Maximin.
As eficincias de estimao ( eff , ), juntamente com os erros relativos (

) de

cada parmetro para o plano experimental timo segundo este critrio esto
apresentadas na Figura 7.5.

Eficiencia
Errorelativo

1.0

0.30

0.25

0.8

0.15
0.4

eff(,)

0.20
0.6

0.10
0.2

0.0

0.05

0.00

Figura 7.5 Eficincias de estimao (espao de informao) e erro relativo para cada
valor de parmetro, segundo a estratgia tima escolhida.
Conforme pode ser observado na Figura 7.5, os parmetros 1 e 4 apresentam
pior eficincia de estimao, da ordem de 0,60. Os parmetros 2 e 3 apresentam
eficincias de estimao elevadas (>0,90). O erro relativo da ordem de 15-20% para

130

todos os parmetros, valor esperado para a incerteza paramtrica aps a realizao do


planejamento timo segundo critrio ponderado com w=0,5.
Particularmente neste caso, o critrio Maximin, mesmo no indicando a
repetio de todos os experimentos em uma nica condio, sugere condies timas
muito prximas umas das outras como apresentado na Tabela 7.1. Ou seja, em alguns
casos, o critrio Maximin pode no apresentar o carter exploratrio que o
experimentador deseja em experimentos iniciais. Contudo, o critrio Maximin
extremamente conservador, garantindo uma mxima eficincia mnima independente do
valor do parmetro informado ao critrio. Vale ressaltar que, se o experimentador tem
dvidas quanto ao modelo que descreve o fenmeno investigado, necessrio refletir a
validade de experimentos timos sugeridos por critrios que confiam nos modelos para
fazer previses dos dados experimentais. Alguns trabalhos futuros abordaro estas
questes.
Fim do Exemplo 7.1
Exemplo 7.2 - Modelos exponenciais com dois e trs parmetros

Modelos exponenciais tm sido amplamente estudados na literatura para o


planejamento inicial (DETTE e NEUGEBAUER, 1997, DETTE et al., 2006a,b,c,
HAINES, 1995, ATKINSON et al. 2007, BIEDERMANN et al., 2007). Este exemplo
apenas apresenta uma comparao entre os resultados obtidos por DETTE et al. (2006a)
e os obtidos nesta tese. Os autores investigaram planejamentos iniciais para diversos
modelos exponenciais com dois e trs parmetros, conforme apresentados nas Equaes
(E 7.21)-(E 7.24):
(E 7.21)

y 1 e0 x

(E 7.22)

y 1 e0 x

(E 7.23)

y 1 1 e 0 x

(E 7.24)

y 1 2 e0 x

Considerando o tempo como a nica varivel de deciso a ser avaliada, as faixas


dos parmetros 1 e 2 no so relevantes, podendo ser quaisquer. Faixas quaisquer
destas variveis foram fixadas em um valor qualquer entre 1<1<3 e 1<2<3. O
parmetro 0 foi dividido em 100 intervalos entre faixas (0min,0max) especificadas
131

conforme o trabalho de DETTE et al. (2006a). As Tabela 7.2-Tabela 7.5 apresentam os


resultados obtidos nesta tese, comparados com os resultados de DETTE et al. (2006a)
para os diferentes modelos exponenciais. Neste exemplo considerou-se apenas o critrio
Maximin.
Conforme pode ser observado nas Tabela 7.2 a Tabela 7.5, os resultados obtidos
neste trabalho esto em boa concordncia com os resultados obtidos por DETTE et al.
(2006a). Os resultados no so idnticos uma vez que no trabalho de DETTE et al.
(2006a), os pesos wxi em cada tempo xi tambm so otimizados, enquanto a presente
tese considera que todos os pontos so equivalentes. Pelo mesmo motivo, as mximas
eficincias mnimas obtidas por DETTE et al. (2006a) so quase sempre superiores s
obtidas neste trabalho.
Tabela 7.2 Tempos timos para o modelo y 1 e0 x .
0min 0max x1
0,6

0,6

0,6

x2

x3

x4

wx1 wx2 wx3 wx4 effMin

Referncia

0,00 1,28

0,5 0,5

0,968 DETTE et al. (2006a)

0,00 1,27

0,5 0,5

0,968

0,00 0,47 1,53

0,43 0,3 0,26

0,826 DETTE et al. (2006a)

0,00 0,48 1,40

0,33 0,33 0,33

0,834

Este trabalho
Este trabalho

0,00 0,28 0,92 1,92 0,4 0,25 0,22 0,13 0,790 DETTE et al. (2006a)
0,00 0,27 0,81 1,90 0,25 0,25 0,25 0,25 0,768

Este trabalho

Tabela 7.3 Tempos timos para o modelo y 1 e0 x


0min 0max x1
0,6

x2

x3

wx1 wx2 wx3 effMin

Referncia

0,00 1,28

0,50 0,50

0,968 DETTE et al. (2006a)

0,00 1,28

0,50 0,50

0,964

Este trabalho

0,00 0,39 1,67 0,46 0,35 0,20 0,788 DETTE et al. (2006a)
0,6

0,00 0,32 0,97 0,33 0,33 0,33 0,773

Este trabalho

0,00 0,27 1,31 0,45 0,34 0,21 0,750 DETTE et al. (2006a)
0,6

0.00 0.20 0.81 0.33 0.33 0.33 0.721

Este trabalho

132

Tabela 7.4 Tempos timos para o modelo y 1 1 e 0 x .


0min 0max x1
0,6

0,6

0,6

x2

x3

wx1 wx2 wx3 effMin

Referncia

1,27 10,00

0,50 0,50

0,970 DETTE et al. (2006a)

1,28 10,00

0,50 0,50

0,968

Este trabalho

0,45 1,67 10,00 0,27 0,30 0,43 0,819 DETTE et al. (2006a)
0,51 1,72 10,00 0,33 0,33 0,33 0,834

Este trabalho

0,30 1,34 10,00 0,25 0,32 0,43 0,777 DETTE et al. (2006a)
0,30 1,72 10,00 0,33 0,33 0,33 0,768

Este trabalho

Tabela 7.5 Tempos timos para o modelo y 1 2 e 0 x .


0min 0max x1
0,6

0,6

0,6

x2

x3

x4

x5

wx1 wx2 wx3 wx4 wx5 effMin

Referncia

0,00 1,27 10,00

0,33 0,33 0,33

0,980 DETTE et al. (2006a)

0,00 1,26 10,00

0,33 0,33 0,33

0,978

0,00 0,45 1,61 10,00

0,31 0,21 0,19 0,29

0,897 DETTE et al. (2006a)

0,00 0,43 1,45 10,00

0,25 0,25 0,25 0,25

0,925

Este trabalho
Este trabalho

0,00 0,26 0,94 1,97 10,00 0,30 0,18 0,14 0,11 0,27 0,874 DETTE et al. (2006a)
0,00 0,21 0,69 1,86 10,00 0,20 0,20 0,20 0,20 0,20 0,896

Este trabalho

Vale lembrar que atribuir distintos pesos aos dados experimentais em


procedimentos de planejamento inicial pode ser interessante para determinar nmero de
pontos a serem tomados, bem como a importncia relativa de cada ponto. Contudo,
pode no ser adequado quando o experimentador ir coletar pequeno nmero de
amostras. Obviamente, o procedimento de DETTE et al. (2006a) pode contornar este
problema atribuindo pesos idnticos aos experimentos.
Fim do Exemplo 7.2.
Exemplo 7.3 - Modelo de Monod

Este exemplo investiga o modelo de Monod, modelo diferencial com mltiplas


variveis de projeto (X) e mltiplas variveis de resposta (Y). O modelo de Monod
utilizado para descrever a cintica de crescimento celular e consumo de substrato em
sistemas biolgicos. Conforme apresentado no Captulo 6, o modelo de Monod admite
que a taxa de crescimento celular (

dc t

dt

) pode ser obtida em funo da


133

concentrao celular (c) e da concentrao de substrato (s(t)) segundo a Equao (E


7.25).

(E 7.25)

dc t

c t 1

dt

s(t )
2 s (t )

O modelo admite que substrato seja consumido para a gerao de massa celular
em uma proporo constante, resultando na Equao (E 7.26).

(E 7.26)

s (t ) s(0)

c t c 0
3

O vetor de parmetros do modelo dado por ={1, 2, 3}, representando a


mxima taxa de crescimento celular especfico (m), a constante de saturao (KS), e o
coeficiente de rendimento (Ys), respectivamente.
DETTE e colaboradores estudaram extensivamente planejamentos iniciais o
modelo de Monod. A descrio do trabalho dos autores e suas concluses, apresentadas
a seguir, so relevantes para avaliao dos resultados apresentados nesta tese.
Trabalhos de DETTE e colaboradores sobre o modelo de Monod
DETTE et al. (2003, 2005) investigaram extensivamente o modelo de Monod
em planejamentos iniciais. Os autores consideraram que apenas a concentrao celular
era medida ao longo do tempo. Fixando condies iniciais c(0) e s(0), foram
investigados tempos timos de amostragem no intervalo t=(0,T) e seus respectivos
pesos. Os planos fatoriais apresentados pelos autores eram da seguinte forma:

(E 7.27)

t1


wt

t2

t3 ... T

wt2 wt3 ... wT

onde ti o tempo de amostragem e wti representa o peso dado ao ponto i, ou seja, a


porcentagem de vezes em que o tempo de amostragem deve ser ti. Admitindo que as
medidas no sejam correlacionadas, o critrio do volume estabelece que:

134

t t
J , N exp wti c i c i
i

T

(E 7.28)

Para avaliar condies timas de experimentao, os autores integraram a


Equao (E 7.25) para obter explicitamente o tempo em funo da concentrao celular,
obtendo a seguinte expresso:

(E 7.29)

t
c t
1
b ln
1 b ln

c 0
1
0

onde b=2.3.c-1 e c=s(0)3+c(0). Uma vez que o comportamento do sistema


estabelece uma relao monotonicamente crescente entre tempo e concentrao celular,
possvel substituir a varivel tempo de amostragem por concentrao celular. O
planejamento timo poderia ser obtido ao se encontrar as concentraes celulares que
maximizam algum critrio de informao (volume, por exemplo). Ao invs de se
utilizar o tempo como varivel de deciso, utiliza-se a concentrao celular, e o
planejamento pode ser escrito na forma:

(E 7.30)

c1

w

c1

c 2

c 3 ... cT

wc2

wc3 ... wcT

O vetor de derivadas da concentrao celular em funo do tempo pode ser


escrito como:

(E 7.31)

c t t

t 1
c t c t t c t t

t t 2
t t
c
t 3

Derivando a Equao (E 7.29) e substituindo esta derivada com a Equao (E


7.25) na Equao (E 7.31), obtm-se um sistema de equaes onde o tempo no aparece
135

explicitamente (no apresentado aqui). Desta forma, o critrio de informao em (E


7.28) do modelo implcito de Monod pode ser obtido de forma explcita, sem a
necessidade de se resolver a equao diferencial, j que o tempo no aparece na
Equao (E 7.31). Uma vez determinadas as concentraes celulares timas dadas pelo
planejamento, pode-se utilizar a Equao (E 7.29) para obter os tempos
correspondentes. Assim, o esforo computacional pode ser significativamente reduzido
pela no resoluo da equao diferencial do modelo. Os autores apresentaram algumas
dedues tericas a partir das expresses desenvolvidas. Tambm obtiveram de forma
numrica planejamentos experimentais timos para o modelo de Monod. As principais
concluses obtidas pelos autores so resumidas abaixo:

As simulaes sugeriram que planejamentos timos para parmetros


conhecidos poderiam ser obtidos a partir de trs pontos timos (t1,t2,T), onde
T+; contudo, T>1,5t2 j garante boa eficincia. Para um nmero de
pontos maior do que trs, (t1,t2,t3,...,tn-1,T), como heurstica, indica-se T>2tn1;

Os autores compararam planejamentos timos segundo (otm,) para


valores especficos de parmetros () com planejamentos uniformes, cujas
amostras eram tomadas em tempos igualmente espaados otm,uni. Os autores
observaram que, se os parmetros verdadeiros forem diferentes dos
parmetros escolhidos para determinar o planejamento timo (otm,),
eficincias muito baixas de estimao podem ser obtidas. Neste caso, o
planejamento uniforme pode ser muito superior;

Por outro lado, comparando o planejamento segundo o critrio Maximin


com o planejamento uniforme, os autores observaram que o critrio
Maximin praticamente sempre resulta em parmetros melhor estimados,
exceto para o parmetro 3. Segundo as simulaes dos autores, a varincia
dos parmetros pode ser reduzida metade ao se adotar o critrio Maximin,
comparado ao planejamento uniforme;

Simulaes indicaram que no mximo a repetio de 6 pontos de


amostragem foi obtida para o planejamento timo para planos iniciais onde
os parmetros so conhecidos em faixas admissveis.
Numericamente, os autores obtiveram os planejamentos timos a partir de uma
estimativa inicial das condies experimentais, avaliando direes de busca. Contudo,

136

para o critrio Maximin, uma srie de otimizaes internas so necessrias (no sendo
descritas aqui).
Em um trabalho posterior (STRINGUL et al., 2009), os autores propuseram
algoritmos para obter planejamentos timos, contudo, considerando que boas
estimativas iniciais para os parmetros eram conhecidas. Neste caso, o planejamento
timo para um conjunto de parmetros, mas pode resultar em baixa eficincia se as
estimativas para os parmetros forem inadequados. O algoritmo proposto pelos autores
sugere, como critrio de busca, a avaliao aleatria dos tempos de amostragem para a
escolha de um planejamento timo.
Resultados obtidos nesta tese
De acordo com DETTE et al. (2005), amplas faixas de parmetros (que refletem
pouco conhecimento do sistema) so apresentadas abaixo:

(E 7.32) 0, 2 1 h 1 0,3

mg
0, 4 2
0, 6
L

mg
0, 2 3
0,3
mg

Foram fixadas a concentrao celular inicial c(0)=0,03 mg.L-1 e concentrao


de substrato inicial s(0)=1 mg.L-1, para a determinao de tempos timos de
amostragem. A Figura 7.6 apresenta a concentrao celular c(t) e de substrato s(t) em
funo do tempo para as combinaes mximas e mnimas dos valores possveis dos
parmetros.

1.0

(A)
-1

0.2
[0.2,0.4,0.2]
[0.3,0.4,0.2]
[0.2,0.6,0.2]
[0.3,0.6,0.2]
[0.2,0.4,0.3]
[0.3,0.4,0.3]
[0.2,0.6,0.3]
[0.3,0.6,0.3]

0.1

0.0

[0.2,0.4,0.2]
[0.3,0.4,0.2]
[0.2,0.6,0.2]
[0.3,0.6,0.2]
[0.2,0.4,0.3]
[0.3,0.4,0.3]
[0.2,0.6,0.3]
[0.3,0.6,0.3]

(B)

0.8

s(t) (mg.L )

-1

c(t) (mg.L )

0.3

10

15

tempo (h)

20

25

30

0.6
0.4
0.2
0.0

10

15

tempo (h)

20

25

30

Figura 7.6 Concentrao (A) celular e (B) de substrato para diferentes combinaes
dos valores dos parmetros [1,2, 3] para c(0)=0,03 mg.L-1 e s(0) = 1 mg.L-1.

137

Primeiramente, uma comparao com os resultados reportados por DETTE e


colaboradores apresentada para validar as rotinas desenvolvidas nesta tese.
Posteriormente, a estrutura do erro determinada no Captulo 6 includa no
planejamento.
Comparao com os resultados de DETTE e colaboradores
Primeiramente, alguns resultados comparativos reportados na literatura e os
obtidos nesta tese esto apresentados na Tabela 7.6 para diferentes faixas dos
parmetros. Neste caso, considera-se que o erro constante e a nica varivel de sada

a concentrao celular. Os resultados obtidos neste trabalho e os reportados por


DETTE e colaboradores esto apresentados na Tabela 7.6.
Tabela 7.6 Tempos timos de amostragem segundo o critrio Maximin obtidos na
literatura e neste trabalho*.
[1min-1max],[2min-2max],[3min-3max]
[0,25-0,25],[0,50-0,50],[0,25-0,25]
[0,24-0,26],[0,47-0,53],[0,24-0,26]
[0,23-0,27],[0,43-0,57],[0,23-0,27]
[0,20-0,30],[0,40-0,60],[0,20-0,30]
*

t1

t2

t3

t4

t5

t6

Fonte

9,53

16,74

53,11

--

--

--

STRINGUL et al. (2009)

11,87

16,84

30,00

--

--

--

Este trabalho

10,93

15,83

17,32

--

--

DETTE et al. (2005)

10,26

15,53

18,16

30,00

--

--

Este trabalho

10,23

14,06

16,84

19,41

--

DETTE et al. (2005)

11,57

15,52

26,05

27,36

30,00

--

Este trabalho

8,51

11,98

15,16

19,10

23,67

DETTE et al. (2005)

7,94

12,35

15,29

19,70

24,11

30,00

Este trabalho

O tempo mximo investigado foi 30h, tempo em que c(t) e s(t) praticamente se estabilizam.

H expectativa que os resultados obtidos neste trabalho e os reportados por


DETTE e colaboradores no sejam idnticos. Isto se deve principalmente s seguintes
razes: (i) DETTE e colaboradores obtiveram os planos experimentais ponderados por
eficincias, conforme Equao (E 7.27), enquanto a presente tese pondera igualmente os
pontos; (ii) os autores utilizaram mtodos de otimizao contnuos para avaliao dos
tempos timos, enquanto neste trabalho, todas as faixas de busca foram divididas em
uma malha numrica.
Valores de tempo da ordem de t=30h representam um comportamento
assinttico, j que praticamente o sistema entra em regime estacionrio a partir deste
ponto (Figura 7.6).

138

Conforme apresentado na Tabela 7.6, observa-se relativa boa concordncia entre


os resultados reportados neste trabalho e os resultados reportados na literatura. Uma
aparente discrepncia parece haver entre a comparao para cinco tempos de
amostragem, conforme reportado por DETTE et al. (2005), cujos tempos so (10,23;

14,06; 16,84; 19,41,+), enquanto os apresentados neste trabalho so (11,57; 15,52;


26,05; 27,36; 30,00). Contudo, nos resultados reportados por DETTE et al. (2005),
pesos baixos so dados para os tempos {t3, t4}={16,84; 19,41}, respectivamente

{ wt 3 , wt 4 }={0,105; 0,149}, enquanto um peso mais elevado dado para o ponto final
{t5}={+}, dado por { wt 5 }={0,281}. Como os dados obtidos no presente trabalho
consideram a mesma ponderao para todos os tempos, o planejamento timo obtido
nesta tese indicou que tempos de amostragem mais elevados so mais adequados. Como
discutido, o uso de pesos pode no ser adequado quando o nmero de amostras baixo.
Avaliao para estrutura do erro conhecida
A partir deste ponto, avaliam-se planejamentos timos para estruturas do erro
conhecidos, e variveis de sada concentrao celular e de substrato. Considera-se que
os parmetros possam ser quaisquer dentro das faixas (idntico ao exemplo 03 no
Captulo 06):
0, 2 1 0,3

0, 4 2 0, 6

0, 2 3 0,3

Para esta faixa de parmetros, a estrutura do erro experimental para o modelo de


Monod foi investigada no Captulo 6, sendo utilizada nesta seo para avaliao de
planejamento inicial timo. Para aplicao do critrio de otimalidade do planejamento
inicial do modelo de Monod, conveniente obter um ajuste emprico da varincia
experimental a partir dos resultados reportados no Capitulo 6. O ajuste apresentado na
Figura 7.7 (este ajuste emprico vale apenas para as condies investigadas nesta seo,
idnticas s condies investigadas no Captulo 6).
A correlao entre as medidas foi desconsiderada devido s dificuldades
numricas envolvidas na inverso da matriz de incertezas experimentais. Os ajustes
empricos foram includos na rotina para avaliao de planejamentos timos. Os
resultados das eficincias dos critrios (E 7.10), critrio Bayesiano e critrio Maximin
esto apresentados na Tabela 7.7 para diferentes nmeros de pontos:
139

-10 6

-8 6

(t) = 1.319574x10 t - 2.530533x10 t +


-6 4

-5 3

0.06

--4 2

-6 4

0.008

0.004

0.04

0.02

(A)
0

10

15

-5 3

8.4931899x10 t + 9.3669600x10 t +
-4 2
-3
-2
1.6474036x10 t - 7.6755005x10 t + 6.2779516x10

0.012

0.000

s = -2.9168743x10-9t6 + 2.6754146x10-7t5 -

1.599930x10 t - 4.431884x10 t + 5.124404x10 t -3


-3
1.152807x10 t + 2.205812x10

s(t) (mg.L-1)

c(t) (mg.L-1)

0.016

(B)
20

25

30

0.00

tempo (h)

10

15

20

25

30

tempo (h)

Figura 7.7 Ajustes empricos para o desvio padro da (A) concentrao celular e (B)
concentrao de substrato de acordo com resultados obtidos no Captulo 6.
Tabela 7.7 Eficincias mdia e mnima para diferentes nmero amostras para critrios
(E 7.10), Bayesiano e Maximin. Tempos timos segundo a Equao (E 7.10).
Nmero de pontos no tempo e

Critrio

Eficincia mdia

Eficincia mnima

(E 7.10)

0,7714

0,4691

Bayesiano

0,8606

0,2452

Maximin

0,7714

0,4691

(E 7.10)

0,8435

0,6441

(t1=7,63; t2 =12,89; t3=18,15;

Bayesiano

0,8795

0,3296

t4=30,00)

Maximin

0,8074

0,6503

(E 7.10)

0,8353

0,6683

(t1=8,95; t2 =11,57; t3=15,52;

Bayesiano

0,8645

0,5700

t4=16,84; t5=30,00)

Maximin

0,8047

0,6849

(E 7.10)

0,8424

0,6752

(t1=9,41; t2 =10,88; t3=15,29;

Bayesiano

0,8954

0,5775

t4=16,76; t5=18,23; t6=30,00)

Maximin

0,8060

0,7012

tempos correspondentes*
3
(t1=8,95; t2,=14,21; t3=26,05)

Tempos timos segundo a Equao (E 7.10)


A Tabela 7.7 apresenta os valores mdios e mnimos das eficincias se os

planejamentos timos forem realizados segundo os timos de cada critrio. A leitura


dos dados da Tabela 7.7 deve ser feita da seguinte forma: (i) se o planejamento timo
for escolhido segundo o critrio Bayesiano para trs pontos de amostragem no tempo, a
eficincias mdia igual a 0,8606 e a eficincia mnima igual a 0,2452; (ii) se o ponto
140

timo for escolhido segundo o critrio Maximin para 3 tempos de amostragem, a


eficincia mdia 0,7714 e a eficincia mnima 0,4691; e assim por diante.
Pode-se observar que o critrio apresentado na Equao (E 7.10) pode apresentar
eficincias mdias prximas das do critrio Bayesiano e eficincias mnimas prximas
das do critrio Maximin. Ou seja, h uma conciliao natural dos dois critrios. A
vantagem do uso da Equao (E 7.10) pode ser ilustrada observando-se os
planejamentos timos com quatro tempos de amostragem. O critrio Bayesiano indica
uma eficincia mdia de 0,8795; contudo, com risco de obter eficincia mnima de
0,3296. O critrio Maximin indica eficincia mdia de 0,8074; contudo, com risco de
obter eficincia mnima de 0,6503. O critrio segundo a Equao (E 7.10), por outro
lado, possui uma eficincia mdia boa de 0,8435; mas o risco prximo ao do critrio
Maximin, igual a 0,6431.
As frentes de Pareto para os diferentes nmeros de pontos esto apresentadas na
Figura 7.8, juntamente com a escolha do ponto segundo (E 7.10) para w=0,5.

1.0

1.0

0.6
0.4

0.8

tg = -1

Bayes)

Ponto timo
escolhido

(A)

(B)

0.2

0.2
0.0
0.0

0.4

0.2

0.4

0.6

0.8

0.0
0.0

1.0

0.2

0.4

1.0

0.8

tg = -1

Ponto timo
escolhido

Bayes)

Ponto timo
escolhido

E,In

0.6

E,In

1.0

1.0

0.8

Bayes)

0.8

MaxMin)

MaxMin)

(C)

tg = -1

0.6
0.4

(D)

0.2

0.2
0.0
0.0

0.6
E,In

E,In

0.4

tg = -1

Ponto timo
escolhido

0.6

E,In

E,In

Bayes)

0.8

0.2

0.4

0.6
E,In

MaxMin)

0.8

1.0

0.0
0.0

0.2

0.4

0.6

0.8

1.0

E,In

MaxMin)

E , In
E , In
Figura 7.8 Frentes de Pareto das funes de informao Bayes
e MaxMin
para:

(A) 3, (B) 4, (C) 5 e (D) 6 tempos de amostragem.

141

Em todos os casos, os pontos sugerem uma frente de Pareto cncava, indicando


que o uso da Equao (E 7.10) pode ser adequado para conciliao dos critrio
Bayesiano e Maximin no modelo de Monod.
Fim do Exemplo 7.3

7.6 Discusso e concluses


Neste captulo foi demonstrado como planejamentos iniciais podem ser
avaliados para faixas de parmetros possveis. Foi proposta uma aproximao simples
para os critrios Bayesiano e Maximin, de forma a conciliar os dois critrios escolhidos
na literatura referente ao planejamento inicial de experimentos.
Contudo, o problema de otimizao envolvido consideravelmente complexo.
Vale lembrar que, avaliando o critrio de informao na forma de eficincias de
estimao, necessrio conhecer o planejamento timo de cada possvel valor do
parmetro. A obteno de planejamentos timos para valores de parmetros conhecidos
consideravelmente complexa para sistemas que possuam mltiplas variveis de
deciso (X). Supondo que os parmetros sejam conhecidos, encontrar a condio tima
de experimentao de um sistema com mltiplas variveis de projeto no uma tarefa
trivial. Por exemplo, seja um dado sistema em que o nmero de variveis de projeto 5,
o nmero de parmetros igual a 6, com uma nica varivel de sada. Neste caso, pelo
menos 7 experimentos devem ser planejados para permitir o clculo da matriz de
covarincia paramtrica. Ento, seria necessrio escolher as condies timas das 5
variveis de projeto para cada um dos 7 experimentos. Mas a condio tima de cada
experimento no pode ser avaliada independentemente dos demais experimentos. Neste
caso, deveria-se encontrar a condio tima para 35 (=7x5) variveis de projeto.

Adicionalmente, os parmetros no so conhecidos. Logo, para o clculo das


eficincias necessrio o conhecimento das condies timas de estimao para cada
possvel valor dos parmetros. Se os parmetros forem conhecidos em faixas,
necessrio discretizar o problema para resoluo do mesmo. Contudo, para cada valor
discretizado necessrio realizar uma otimizao de forma a encontrar o planejamento
timo de cada possvel valor do parmetro. Por exemplo, para um sistema com 6
parmetros, se cada parmetro for dividido em 4 pontos, o nmero total de pontos ser
igual a 46 = 4096. Logo 4096 otimizaes deveriam ser realizadas antes de iniciar a
otimizao da funo objetivo, o que pode tornar o problema intratvel. Obviamente,
142

diversas estratgias de otimizao poderiam ser empregadas. Acredita-se que este


assunto merea estudos especficos de otimizao, o que foge ao escopo desta tese.
Neste trabalho implementou-se a busca em malha de pontos possveis de serem
realizados os experimentos. Contudo, a exploso combinatorial inviabiliza resoluo de
problemas de grande porte. Algoritmos de otimizao tais como Hooke and Jeeves e
Branch and Bound (EDGAR e HIMMELBLAU, 1989) podem ser implementados para
tratar problemas de grande porte. Tratamentos que levam a solues de forma mais
simples como propostos por LAUTER (1974) podem se aplicados para obteno do
critrio Bayesiano. Neste caso, um planejamento timo poderia ser escolhido pela
multiplicao de eficincias, na forma (TOMMASI, 2007, ATKINSON, 2008):

otm arg max eff i ,

Que, para o critrio do volume, equivale a maximizar a seguinte expresso:

otm arg max log J P | d

Onde JP(|) a matriz de informao de Fisher para os parmetros se os


experimentos forem realizados. Com isto, a obteno do critrio Bayesiano no
depende de uma otimizao inicial para cada valor dos parmetros, sendo que o
logaritmo fornece certa normalizao para as distintas precises com que os parmetros
so estimados. Contudo, o critrio Maximin ainda continua sendo de difcil obteno.
Deve-se ter cautela quando parmetros altamente correlacionados so
conhecidos em faixas. Isto ocorre porque as diferentes combinaes dos parmetros
podem no representar faixas adequadas para os dados experimentais. Por exemplo, seja
a constante de Arrhenius 0 e

RT

, cujos parmetros fator pr-exponencial 0 e

energia de ativao 1 so altamente correlacionados (SCHWAAB e PINTO, 2007). A


Figura 7.9 ilustra a correlao dos parmetros de Arrhenius e o problema de utilizar
faixas possveis dos parmetros.
Conforme ilustrado na Figura 7.9, ao especificar faixas possveis para os
parmetros, considera-se que qualquer ponto gerado no hipercubo formado pela faixa
143

dos parmetros deve ser considerado na estimao precisa, quando, na realidade, a


gerao de combinaes de um parmetro no devia ser feita de forma independente do
outro parmetro. No entanto, para a maioria dos casos, a correlao paramtrica
desconhecida. Em muitos casos, a faixa de parmetros completamente desconhecida.
Provavelmente, o que se conhece uma faixa de valores experimentais admissveis.
Desta forma, uma das alternativas mais viveis gerar diversos valores
simulados dentro da faixa possvel para as variveis experimentais e estimar os
parmetros do modelo a partir destes valores. Este processo deve ser repetido diversas
vezes, de forma a obter diversos valores possveis dos parmetros, o que se assemelha
tcnica de Bootstrap (ver Seo 3.3). Contudo, os dados so puramente simulados.
Desta forma, o conjunto de parmetros gerados representa a regio de confiana dos
parmetros e a avaliao do planejamento inicial pode prosseguir.

Regio de
confiana

Valor de
= 0e1/RT pode
ser muito
inadequado para
simular o dado
experimental

Pc

0
0
Figura 7.9 Ilustrao da regio de confiana e do intervalo de valores possveis de 0 e

1; ponto PC dentro do intervalo pode ser inadequado para avaliar o dado experimental.
Os exemplos apresentados demonstraram como possvel avaliar planos
experimentais a partir de faixas possveis dos parmetros. Conforme demonstrado pelo
exemplo 03 para o modelo de Monod, o critrio Bayesiano pode indicar experimentos
bastante inadequados se a faixa de parmetros for ampla. O critrio Maximin tende a
levar a um risco muito inferior. O critrio conforme apresentado na Equao (E 7.10),
pode ser prefervel por conciliar pontos com boa eficincia mdia e boa eficincia
mnima, levando a apenas duas funes objetivos (critrio Bayesiano e Maximin),
independente da complexidade do problema.

144

8 TRATAMENTO

MULTIOBJETIVO

DADO

ESTIMAO DE PARMETROS PRECISOS E


DISCRIMINAO DE MODELOS
RESUMO:
O planejamento de experimentos para estimao de parmetros precisos e
discriminao de modelos estabelecem naturalmente problemas multiobjetivos, uma vez
que existem mltiplas funes de informao a serem maximizadas simultaneamente.
Portanto, a soluo consiste em obter a frente de Pareto para tais funes objetivos.
Neste captulo, o problema de discriminao de modelos e estimao de parmetros
tratado sob a tica multiobjetivo, obtendo-se a frente de Pareto de alguns exemplos. Os
resultados sugerem que os objetivos de discriminao de modelos e estimao de
parmetros precisos tendem a ser mais bem conciliados quando se considera no
discriminante a influncia do novo ponto experimental na preciso paramtrica, de
acordo com a proposta de SCHWAAB et al. (2008c).

8.1 Objetivos
O principal objetivo deste captulo apresentar um tratamento multiobjetivo ao
problema de estimao de parmetros precisos e discriminao de modelos, levando a
caracterizao das frentes de Pareto dos problemas e determinando as solues timas.

8.2 Introduo
As rotinas de planejamento experimental para estimao de parmetros precisos
e discriminao de modelos estabelecem naturalmente problemas multiobjetivos, uma
vez que as funes de informao a serem maximizadas so mltiplas.
Mesmo apenas os planejamentos para a estimao de parmetros precisos
estabelecem por si s um problema mulitobjetivo, j que a estimao de parmetros
precisos pode ser obtida com auxlio de diferentes critrios. Tratamentos multiobjetivos
tm sido apresentados na literatura para determinao de parmetros precisos (COOK e
145

WONG, 1994), e frentes de Pareto para tais problemas obtidas por CLYDE e
CHALONER (1996). Neste caso, o nmero de funes objetivos igual ao nmero de
critrios de informao que se deseja maximizar (A, D, E-timo,G-timo, etc).
Quando se trabalha com diversos modelos, mesmo quando se fixa um nico
critrio para estimao de parmetros precisos, o problema novamente multiobjetivo.
Isto ocorre porque a estimao de parmetros precisos deve ser avaliada para cada
modelo. Nestes casos, o nmero de funes objetivos pelo menos igual ao nmero de
modelos.
No que se refere discriminao de modelos, diversas formas de discriminantes
podem ser propostas e diversos objetivos podem ser, portanto, formulados. Por
exemplo, nos discriminantes propostos por ATKINSON e colaboradores, admite-se que
cada modelo pode representar o dado experimental; logo, o nmero de discriminantes
igual ao nmero de modelos propostos. Nas formulaes apresentadas por BUZZIFERRARIS et al. (1983, 1990), BUZZI-FERRARIS e FORZATTI (1984) e BOX e
HILL (1965) apenas um discriminante formulado. Contudo, em tais propostas o plano
experimental timo pode no resultar em bons pontos para discriminao de modelos
individuais, j que maximiza uma divergncia mdia entre os modelos. No
discriminante proposto por SCHWAAB et al. (2006), busca-se a maximizao da
divergncia entre pares de modelos, de maneira que o problema pode ser facilmente
abordado segundo a tica multiobjetivo.
Uma vez que diversas funes de informao devem ser maximizadas, em todos
esses casos o problema pode ser tratado sob a tica multiobjetivo, levando a
determinao da frente de Pareto com as condies timas. A prxima seo aborda este
assunto. Alguns trabalhos buscam conciliar os objetivos de discriminao de modelos e
estimao de parmetros precisos, como HILL et al. (1968), ATKINSON (2008),
TOMMASI (2009), dentre outros, descrito em maiores detalhes na Seo 5.4.
Este captulo apresenta a frente de Pareto obtido quando se estabelecem critrios
para estimao precisa e discriminao de modelos durante o planejamento
experimental. Para a escolha de um ponto especfico, podem ser utilizados
procedimentos semelhantes ao proposto por ATKINSON (2008), que maximiza uma
soma ponderada, envolvendo os termos de eficincia de estimao e eficincia de
discriminao.

146

8.3 Tratamento multiobjetivo dado ao problema de estimao


de parmetros e discriminao de modelos
No presente trabalho foram utilizados: (i) o critrio do volume como funo de
informao para estimao de parmetros precisos; e (ii) o discriminante descrito por
SCHWAAB et al. (2006) e SCHWAAB et al. (2008c) como funes de informao
para discriminao de modelos. Os resultados de SCHWAAB et al. (2008c) tambm
foram obtidos de forma independente por DONCKELS et al. (2009).
O discriminante a seguir proposto por SCHWAAB et al. (2006, 2008c)
novamente apresentado aqui. Para pares de modelos i e j, o discriminante pode ser
escrito como:
(E 5.26)

DiSchwaab
Pr(i ) Pr( j )
,j

z'

Y Y V
(i ) P

( j)P

(i , j ) P
Y

Y Y
(i ) P

( j)P

onde: Pr(i) e Pr(j) so as probabilidades relativas dos modelos i e j avaliadas em 0; Y(i)P e

Y(j)P so os valores preditos pelos modelos i e j na condio ; e VY(i,j)P a matriz de


covarincias das incertezas de Y, que pode ser calculada como a soma da varincia de
predio VY(i)P e VY(j)P, na forma:
(E 5.27)

VY(i , j ) P VY(i ) P VY( j ) P

A matriz de covarincias de predio dos modelos pode ser calculada como


(BARD, 1974, pp 262):

(E 5.28)

VY(i ) P B ( i ) V(i ) B (i )T VY

No discriminante proposto por SCHWAAB et al. (2006), define-se um fator z,


que indica a confiana nos modelos mais provveis. Elevados valores de z levam o
discriminante a maximizar a divergncia entre os pares de modelos mais provveis. Por
outro lado, o valor de z=0 busca a mxima divergncia entre pares de modelos,
independentemente de sua probabilidade. O discriminante de um plano experimental
pode ser tomado como o maior valor dentre os discriminantes de pares de modelos, ou
seja:

147

(E 5.29)

D Schwaab max i , j DiSchwaab

,j

SCHWAAB et al. (2008c) e um trabalho posteriormente realizado por


DONCKELS et al. (2009), propuseram a avaliao do discriminante levando em conta
como a predio dos modelos afetada com o novo ponto experimental. Desta forma, a
predio dos modelos se torna mais precisa e o potencial de discriminao aumentado.
Neste caso, a nica diferena em relao ao discriminante apresentado na Equao (E
5.26) diz respeito ao clculo da matriz VY(i)P e VY(j)P, j que a obteno destas matrizes
feita avaliando como a matriz de covarincia dos parmetros afetada pela novo
experimento planejado, na forma:

(E 5.30)

VY(i ) Post B (i ) V(i ) P B (i )T VY

Como a matriz V(i)P pode ser calculada na forma:

(E 5.4)

VP BT VY B V 1

o discriminante pode ser escrito como:


Post
(E 5.31) DiSchwaab
Pr(i ) Pr( j ) Y (i ) P Y ( j ) P VY(i, j ) Post
,j
z'

Y Y
(i ) P

( j)P

No presente trabalho foram considerados os discriminantes propostos em


trabalhos do grupo. Os seguintes discriminantes podem ser formulados, quando se muda
a estratgia de clculos da matriz de covarincias de predio: (i) discriminante
conforme a Equao (E 5.26) com z=0 e com z=1; (ii) discriminante conforme a
Equao (E 5.31) com z=0 e z=1.
Para fins de comparao, conveniente definir as funes em termos de
eficincias. Definindo:

DNorm como a eficincia de discriminao, calculada de acordo com


SCHWAAB et al. (2006) (sem considerar a matriz de covarincias posterior
das incertezas paramtricas);

148

DNormPost como a eficincia de discriminao, calculada de acordo com


SCHWAAB et al. (2008c) (considerando a matriz de covarincias posterior
das incertezas paramtricas);

Enorm,i como eficincias de estimao, de acordo com o critrio do


volume para o modelo i.
As eficincias podem ser tomadas como o valor da funo de informao
dividido pelo valor mximo que as funes podem assumir; ou seja:
(E 8.1)

DNorm

(E 8.2)

ENorm ,n

D Schwaab

Schwaab

max

J (n) P

max J ( n ) P

DNorm

Post

D Schwaab

Post

max D Schwaab

Post

onde |J(n)P| o determinante da matriz de informao de Fisher do modelo i,


considerando os experimentos j realizados 0 e os experimentos que esto sendo
planejados , admitindo que as respostas possam ser geradas com o modelo n.
A frente de Pareto de mltiplos critrios pode ser obtida e um ponto que concilie
bons valores de todos os critrios pode ser formulado. Este procedimento apresenta
semelhana com o trabalho de ATKINSON (2008). No presente trabalho, contudo, so
obtidas as frentes de Pareto das solues timas.
Alguns exemplos numricos so apresentados a seguir para ilustrar o tratamento
multiobjetivo ao problema de planejamento de experimentos.

8.4 Exemplos
Dois exemplos so apresentados para ilustrar a obteno das frentes de Pareto
em problemas de discriminao de modelos e estimao de parmetros. Em ambos os
exemplos, a estimao de parmetros foi realizada a partir de um mtodo hbrido,
conforme descrito por SCHWAAB et al. (2008a). Primeiramente, utiliza-se um mtodo
heurstico de otimizao baseado no enxame de partculas (KENNEDY e EBERHART,
2001) para obter os parmetros que ajustam os dados experimentais. Em seguida, o
melhor valor dos parmetros obtido pela tcnica de enxame fornecido como estimativa
inicial em um mtodo determinstico de Newton, utilizando a aproximao de Gauss
(mtodo de Gauss-Newton) (SCHWAAB e PINTO, 2007a).

149

No procedimento de planejamento de experimentos, os pontos timos dos


critrios de informao (discriminante e D-timo dos diferentes modelos) foram obtidos
separadamente. Para tanto, utilizou-se tambm o mtodo do enxame de partculas para
otimizao de um nico objetivo, para escolha do plano experimental timo (otm) de
cada critrio. Estes valores foram utilizados para alimentar o clculo das eficincias de
estimao e discriminao nos procedimentos multiobjetivo.
A frente de Pareto pode ser obtida por diferentes mtodos, tais como mtodos
baseados no algoritmo gentico (SILVA, 2003), tcnica de enxame de partculas
COELLO-COELLO (2004), dentre outros. Os algoritmos originais destinados a
otimizar uma nica funo objetivo so adaptados para a busca multiobjetivo,
fornecendo o conjunto de pontos no dominados, a frente de Pareto. No presente
trabalho, foi implementado o algoritmo de busca multiobjetivo baseado na tcnica do
enxame de partculas conforme descrito por COELLO-COELLO (2004).
Exemplo 8.1 - Modelo de adsoro

Este exemplo foi proposto por SCHWAAB et al. (2008c) e constitui um


exemplo simples para ilustrar a metodologia de tratamento multiobjetivo no problema
de planejamento timo. Tratam-se de dois modelos de adsoro, Langmuir e Freudlich,
que descrevem a quantidade adsorvida y (em mol.Kg-1) em funo da presso de
adsorbato x (em bar). Os dois modelos esto descritos abaixo:

Modelo 1: y1 1(1)

2(1) x
1 2 (1) x

Modelo 2: y2 1(2) x2

( 2)

Neste caso, o conjunto de parmetros do modelo 1 dado por (1)={1(1),2(1)},


enquanto para o modelo 2 o conjunto de parmetros dado por 2={1(2),2(2)}. O
modelo correto o modelo 1, com parmetros 1(1)=3.mol.Kg-1 e 2(1)=2.bar-1, sendo a
varincia experimental constante e igual a 0,01. A inicializao do plano experimental
foi feita com trs experimentos iniciais, conforme apresentados na Tabela 8.1. Estes
experimentos foram gerados com os valores verdadeiros dos parmetros do modelo 1,
sendo acrescida de uma oscilao aleatria normalmente distribuda com mdia 0 e
varincia 0,01 (mol2.Kg-2).

150

Com os resultados dos experimentos da Tabela 8.1 foi conduzida a estimao de


parmetros para os dois modelos. Para cada modelo m, a Tabela 8.2 apresenta os
resultados da funo objetivo F(m), da probabilidade dos modelos P(m), dos parmetros
estimados {1(m),2(m)} e suas respectivas incertezas {1(m), 2(m)}.
Tabela 8.1 Experimentos iniciais no Exemplo 8.1.
Experimento

x (bar)

y (mol.Kg-1)

0,50

1,40

1,00

1,99

2,00

2,41

Tabela 8.2 Resultados da estimao de parmetros no Exemplo 8.1.


Modelo

F(m)

P(m)

1(m) 1(m)

2(m) 2(m)

0,135

76,1

3,175 0,283

1,613 0,402

1,478

23,9

1,892 0,060

0,372 0,055

necessrio determinar um plano experimental timo que seja bom


simultaneamente para a estimao de parmetros e para a discriminao entre os dois
modelos. Uma vez que apenas dois modelos so considerados, a escolha de z
arbitrria e no influencia o discriminante. As eficincias do critrio do volume para
estimao de parmetros precisos dos modelos 1 e 2 so dados por ENorm,1 e ENorm,2,
respectivamente. As funes normalizadas para discriminao de modelos de acordo
com Equao (E 8.1), so dadas, respectivamente por DNorm e DNormPost, onde Post indica
que a matriz de covarincias posterior dos parmetros levada em considerao na
discriminao de modelos (ou seja, DNorm calculada conforme discriminante proposto
por SCHWAAB et al. (2006), e DNormPost calculada conforme discriminante proposto
por SCHWAAB et al. (2008c)).
As funes normalizadas para estimao e discriminao so apresentadas na
Figura 8.1.
Conforme pode ser observado na Figura 8.1, ambos os critrios de estimao so
mximos no ponto x=5. Por outro lado, o critrio de discriminao usual que no leva
em conta a matriz de covarincias posterior dos parmetros apresenta eficincia mxima
para valores de x0,05. A frente de Pareto no constituda por um nico ponto, mas

151

faixas possveis dos valores de x. A Figura 8.2 apresenta as frentes de Pareto entre os
critrios Enorm,1 e Enorm,2 versus Dnorm.

Funes normalizadas

1.0

DNorm
Post

DNorm

0.8

ENorm,1
ENorm,2

0.6
0.4
0.2
0.0

x (bar)

Figura 8.1 Resultados das funes normalizadas de discriminao e estimao de


parmetros do Exemplo 8.1.

ENorm,1 e ENorm,2

1.0
0.8

reta para w=0.5

ENorm,1

0.6

tg() =-1

ENorm,2

0.4
0.2
0.0
0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

DNorm

Figura 8.2 Frente de Pareto dos critrios normalizados de estimao dos modelos 1 e 2
versus o critrio normalizado de discriminao DNorm no Exemplo 8.1.
A escolha de um ponto pode ser feita de acordo com o critrio Maximin ou
ponderando-se entre as eficincias de estimao e discriminao (ATKINSON, 2008).
O planejamento timo poderia ser obtido maximizando-se a seguinte soma ponderada.

152

(E 8.3)

otm arg max w ENorm,1 1 w DNorm

Ao se escolher o valor de w=0,5, o ponto escolhido seria x=5,0, tanto ao se


considerar o problema gerado por ENorm,1&DNorm quanto o problema gerado por

ENorm,2&DNorm, conforme indicado na Figura 8.2. No entanto, observa-se que a frente de


Pareto descontnua e os objetivos de estimao precisa de parmetros e discriminao
de modelos no so conciliados. Contudo, quando se utiliza o critrio de discriminao
que leva em conta a matriz de covarincias posterior dos parmetros DNormPost, o ponto
timo da discriminao x=5. Neste caso, a frente de Pareto entre os critrios de
estimao e o critrio de discriminao DNormPost formada apenas pelo ponto x=5. Isto
sugere que os objetivos de estimao de parmetros e discriminao de modelos tendem
a ser mais conciliados quando se considera a influncia do novo ponto na preciso
paramtrica para o clculo do discriminante.
Fim do Exemplo 8.1
Exemplo 8.2 - Modelos cinticos

Este exemplo foi proposto por BUZZI-FERRARIS et al. (1984) e tambm


investigado por SCHWAAB et al. (2006), constituindo um exemplo mais complexo
com mltiplas variveis de projeto, mltiplas variveis de resposta e mltiplos
parmetros.
Neste exemplo so considerados quatro os modelos possveis.

Modelo 1: y1
Modelo 2: y1

Modelo 3: y1

1(1) x1 x2
,
1 3(1) x1 4 (1) x2
1(2) x1 x2

(2)
3

x1 4 (2) x2

1(3) x1 x2

(3)
4

x2

,
2

y2
,
2

y2

2(1) x1 x2
1 3(1) x1 4 (1) x2

y2

(2)
3

x1

2(3) x1 x2

1(4) x1 x2
,
Modelo 4: y1
1 3(4) x1 4 (4) x2

2(2) x1 x2

(3)
3

x1

2 (4) x1 x2
y2
1 3(4) x1

153

Neste exemplo, o modelo correto o modelo 1, cujos parmetros so dados por

1(1)=0,1; 2(1)=0,01; 3(1)=0,1; e 4(1)=0,01. As varincias experimentais so constantes


e iguais a 0,35 e 2,3x10-2 para as variveis y1 e y2, respectivamente. Cinco experimentos
iniciais foram simulados com o modelo 1 e acrescidos de uma oscilao aleatria
normalmente distribuda com mdia zero e varincia 0,35 e 2,3x10-2 para as variveis y1
e y2, respectivamente. Os resultados esto apresentados na Tabela 8.3.
Tabela 8.3 Experimentos iniciais realizados no Exemplo 8.2.
Experimento
01
02
03
04
05

x1
20,0
30,0
20,0
30,0
25,0

x2
20,0
20,0
30,0
30,0
25,0

y1
13,443
13,817
17,809
21,139
16,039

y2
1,299
1,433
1,885
2,118
1,635

A partir dos experimentos apresentados na Tabela 8.3, os parmetros dos quatro


modelos foram estimados e a adequabilidade de cada modelo foi avaliada pelo teste chiquadrado. Os resultados esto apresentados na Tabela 8.4.
Tabela 8.4 Resultados da estimao de parmetros no Exemplo 8.2.
Modelo
01
02
03
04

1(m)
0,1311
0,0743
0,0281
0,1162

2(m)
0,0134
0,0068
0,0067
0,0107

3(m)
0,1431
0,0233
0,0017
0,1187

4(m)
P(m)
0,0145 0,400
0,0034 0,312
0,0232 0,00
0,0162 0,389

Neste caso, o planejamento inicial 0 consiste nos cinco primeiros experimentos


da Tabela 8.3. A avaliao do planejamento timo a ser realizado consiste em
determinar a prxima condio experimental, de forma a estimar os parmetros de
forma precisa e discriminar entre os modelos, a fim de obter o modelo verdadeiro.
Conforme pode ser observado na Tabela 8.5, os critrios de discriminao de
modelos que consideram a matriz de covarincias posterior dos parmetros DPost (z=0 e

z=1) e o critrio de estimao de parmetros precisos para o modelo 1 apresentam


mximo na mesma condio experimental (x1 =55,0 e x2=55,0). Os mximos das
demais funes no so coincidentes.
Conforme pode ser observado na Tabela 8.5, o valor dos discriminantes que
consideram a matriz de covarincias posterior das incertezas paramtricas sempre
154

significativamente superior ao discriminante que no considera a influncia da matriz de


covarincias posterior das incertezas paramtricas (ou seja, DNormPost>DNorm). Portanto,
ao se considerar como o novo ponto experimental afeta a preciso dos parmetros,
aumenta-se o potencial de discriminao dos pontos experimentais (SCHWAAB et al.
2008c).

Tabela 8.5 - Condies timas para discriminao de modelos e estimao precisa


segundo diferentes critrios no Exemplo 8.2.
Condies

Critrios de estimao de

Critrios de Discriminao

Experimentais

parmetros precisos

DNormPost

|V(1)|

(z=0)

(z=1)

(z=1)

1021

1026

1022

DNorm

DNormPos

(z=0)

|V(2)|

|V(4)|

x1

x2

55,0

43,2

2,93

19,02

0,29

1,90

17,62

24,41

6,75

55,0

55,0

2,50

31,98

0,25

3,20

6,71

4,82

3,31

18,2

55,0

2,87

16,52

0,37

2,12

7,07

0,77

1,60

51,1

55,0

1,82

21,77

0,18

2,18

7,08

0,47

3,33

6,9

55,0

2,40

23,74

0,31

3,05

8,20

0,71

0,27

A Figura 8.3 apresenta os resultados da frente de Pareto para o critrio de


estimao de parmetros precisos modelo 1 e para os critrios de discriminao de
modelos que consideram (DNormPost) e que desconsideram (DNorm) a influncia da matriz
de covarincia posterior dos parmetros. Para obter os resultados apresentados na Figura
8.3, adotou-se z=0.

Avaliando ENorm,1, ENorm,2 e ENorm,4 versus DNorm, conforme pode ser observado
na Figura 8.3, as frentes de Pareto so descontnuas e os diferentes critrios de
otimalidade no so conciliados; ou seja, bons pontos para a discriminao no so bons
pontos para a estimao de parmetros precisos, e vice-versa.

Avaliando ENorm,1 e ENorm,2 versus DNormPost, conforme pode ser observado na


Figura 8.3, a estimao precisa dos modelos 1 e 2 podem ser muito bem conciliadas
com a discriminao de modelos. O mesmo no vlido para o modelo 4, para o qual
bons pontos de discriminao no se constituem bons pontos de estimao precisa.
Apesar disto, parece claro que a introduo da matriz de covarincias posterior dos
parmetros afeta positivamente o planejamento de experimentos para discriminao de
modelos, conforme discutido por SCHWAAB et al. (2008c).
155

1.0
0.9

1.0

0.8

(A)

0.8

ENorm,2

ENorm,1

0.9

0.7

(B)

0.7
0.6
0.5

0.6

0.4

0.5

0.3
0.2

0.4

0.1

0.3
0.84

0.88

0.92

DNorm

0.96
Post

1.00

DNorm

0.6

0.7

DNorm

0.8

0.9

DNorm

1.0

Post

1.0
0.9
0.8

(C)

ENorm,4

0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.70

0.75

0.80

DNorm

0.85

0.90

DNorm

0.95
Post

1.00

Figura 8.3 Frentes de Pareto das funes normalizadas para discriminao DNorm () e

DNormPost ( ) versus a funo normalizada para estimao precisa para os modelos: (A)
1; (B) 2 e (C) 4 (z=0) no Exemplo 8.2.
A Figura 8.4 apresenta os resultados da frente de Pareto para o critrio de
estimao de parmetros precisos do modelo 1 e os critrios de discriminao de
modelo que consideram (DNormPost) e que desconsideram (DNorm) a influncia da matriz
de covarincias posterior dos parmetros. Para obter os resultados apresentados na
Figura 8.4, adotou-se z=1 (ou seja, apostando-se em modelos que apresentaram melhor
desempenho).

Avaliando ENorm,1 e ENorm,2 versus DNorm, conforme pode ser observado na Figura
8.4, pode-se observar que h bons pontos para a simultnea estimao de parmetros
precisos e bons pontos para a discriminao de modelos. O mesmo no ocorre para o
modelo 4.

Avaliando ENorm,1, ENorm,2 e ENorm,4 versus DNormPost, conforme pode ser observado
na Figura 8.4, todos os objetivos podem ser conciliados. De forma geral, as frentes de
Pareto dos diferentes objetivos dos critrios de discriminao e estimao tendem a ser
156

mais bem conciliadas quando se considera no discriminante a influncia da matriz de


covarincia posterior dos parmetros.
1.0

1.00
0.99

0.9

ENorm,2

Enorm,1

(A)
0.98
0.97
0.96

(B)
0.8

0.7

0.95

0.6
0.7

DNorm

0.8

DNorm

0.9
Post

1.0

0.5

0.6

DNorm

0.7

0.8

DNorm

0.9
Post

1.0

1.0

ENorm,4

0.8

0.6

(C)

0.4

0.2
0.80

0.85

0.90

DNorm

0.95
Post

1.00

DNorm

Figura 8.4 Frentes de Pareto das funes normalizadas de discriminao DNorm () e

DNormPost ( ) versus a funo normalizada de estimao precisa para os modelos: (A) 1;


(B) 2 e (C) 4 (z=1) no Exemplo 8.2.
A escolha de um ponto dentro da frente tima pode ser feita ponderando-se
igualmente as funes de informao. Estabelecendo para z=0, o ponto escolhido seria:
(E 8.4) otm arg max DNorm z ' 0 DNorm Post z ' 0 ENorm,1 ENorm,2 ENorm,4

A maximizao resulta no ponto x1=10,12 e x2=55,0. Neste ponto, as eficincias


so as seguintes: DNorm=0,9078; DNormPost=0,7384; ENorm,1=0,9668; ENorm,2=0,9723 e

ENorm,4=0,7824. A realizao de um experimento nesta condio, acrescida de um erro


aleatrio, gera os valores de y1=21,608 e y2=2,163. Aps a realizao deste
experimento, as probabilidades dos modelos ficam:

157

P(1) = 0,5789

P(2) = 0,0785

P(4) = 0,0198

Conforme observado, a probabilidade do modelo 4 inferior 0,025; ou seja,


inferior ao nvel de confiana assumido. Logo, o modelo 4 inadequado. Aplicando
novamente o critrio, todas as funes de informao (DNorm, DNormPost, ENorm,1, ENorm,2)
indicam que a frente de Pareto constituda por um nico ponto, x1=x2=55,0. Um
experimento nesta condio resulta em valores de y1=43,523 e y2=4,341. Aps a
realizao deste experimento, as probabilidades dos modelos ficam

P(1) = 0,5962

P(2) = 0,1435

Novamente, aplica-se o critrio indicado na Equao (E 8.4). O critrio indica o


ponto x1=29,08 e x2=55,00. Nesta condio, as funes normalizadas de discriminao
e

estimao

so

iguais

DNorm=0,9980;

DNormPost=0,9992;

ENorm,1=0,7321;

ENorm,2=0,8687. Ao realizar um experimento nesta condio, obtm-se y1=36,296 e


y2=3,622. As probabilidades dos modelos ficam ento iguais a:
P(1) = 0,7426

P(2) = 0,000

Ou seja, o modelo 2 foi descartado e apenas o modelo 1 permanece verdadeiro,


como deveria se esperado.
Este procedimento foi adotado tambm para os diferentes critrios de
planejamento. A Tabela 8.6 apresenta os resultados de trs experimentos planejados e
realizados (simulados com o modelo 1 com os parmetros verdadeiros, sendo
acrescida uma perturbao aleatria para simular o erro experimental) de acordo com os
diferentes critrios e de acordo com o critrio apresentado na Equao (E 8.4).
Um resultado interessante que os discriminantes que consideram a matriz de
covarincias posterior das incertezas paramtricas no levam discriminao dos
modelos com um nico experimento, diferente do critrio de discriminao que no leva
em conta a matriz de covarincias posterior dos parmetros com z=1. Isto ocorre
porque o discriminante no avalia a flexibilidade dos modelos para que se adqem aos
novos pontos experimentais (este assunto ser tratado no Captulo 10).

158

Tabela 8.6 Seqncia de experimentos de acordo com diferentes critrios no Exemplo


8.2.
Critrio

N do Exp

x1

x2

y1

y2

P(1)x100

P(2)x100

P(4)x100

Inicial

1-5

---

---

---

---

40,0

31,2

38,9

55,0

43,2

34,212

3,424

52,7

12,7

58,5

4,8

55,0

11,933

1,267

59,1

24,3

0,0

28,3

55,0

34,925

3,519

74,1

0,0

0,0

55,0

55,0

43,037

4,293

50,2

15,6

47,4

5,3

55,0

13,623

1,363

61,9

27,8

0,0

27,4

55,0

35,064

3,556

70,3

0,0

0,0

18,2

55,0

29,194

3,004

61,0

0,4

0,2

7*

55,0

55,0

43,037

4,293

59,6

0,8

0,0

8*

55,0

55,0

41,124

4,401

23,1

0,2

0,0

55,0

55,0

43,037

4,293

50,2

15,6

47,4

7,9

55,0

18,110

1,876

60,5

24,5

0,0

28,4

55,0

34,872

3,573

72,5

0,0

0,0

55,0

55,0

43,037

4,293

50,2

17,5

47,4

9,8

55,0

21,835

2,160

64,9

23,7

0,0

55,0

55,0

41,124

4,401

18,4

4,8

0,0

51,1

55,0

41,322

4,223

59,9

29,2

59,1

14,8

55,0

27,490

2,708

63,6

2,8

0,0

55,0

55,0

43,037

4,293

67,5

2,4

0,0

6,9

55,0

17,506

1,746

59,5

28,4

9,3

55,0

55,0

43,037

4,293

67,3

25,9

0,0

55,0

55,0

41,124

4,401

21,9

6,2

0,0

10,1

55,0

21,608

2,163

57,89

7,9

1,98

55,0

55,0

43,523

4,341

59,62

14,3

0,0

29,0

55,0

36,296

3,622

74,26

0,0

0,0

DNorm
(z=0)
DNormPost
(z=0)
DNorm
(z=1)
DNormPost
(z=1)

|V1|

|V2|

|V4|

MO

Os critrios de estimao de parmetros precisos no tendem a levar


discriminao de modelos (exceto do modelo 4), sugerindo que a estimao de
parmetros dos modelos pode no ser adequada para discriminao de modelos neste
exemplo.
A Figura 8.5 apresenta o determinante da matriz V(n) para os modelos 1, 2 e 4
para os trs experimentos planejados na seqncia indicada na Tabela 8.6.

159

1E-24

1E-19

(1)

|V |

1E-21
1E-22

1E-25
(2)

1E-20

Disc Sem Post (z'=0)


Disc Com Post (z'=0)
Disc Sem Post (z'=1)
Disc Com Post (z'=1)
Est Prec Modelo 1
Est Prec Modelo 2
Est Prec Modelo 4
Multiobjetivo

|V |

Disc Sem Post (z'=0)


Disc Com Post (z'=0)
Disc Sem Post (z'=1)
Disc Com Post (z'=1)
Est Prec Modelo 1
Est Prec Modelo 2
Est Prec Modelo 4
Multiobjetivo

1E-26
1E-27

1E-23

1E-28

(A)

(B)

1E-24

1E-29
1E-25

Exp 1-5

Exp 6

Exp 7

Exp 8

Exp 1-5

Exp 6

Exp 7

Exp 8

Experimentos

Experimentos
1E-20
Disc Sem Post (z'=0)
Disc Com Post (z'=0)
Disc Sem Post (z'=1)
Disc Com Post (z'=1)
Est Prec Modelo 1
Est Prec Modelo 2
Est Prec Modelo 4
Multiobjetivo

1E-21
(4)

|V |

1E-22
1E-23
1E-24

(C)

1E-25
1E-26

Exp 1-5

Exp 6

Exp 7

Exp 8

Experimentos

Figura 8.5 Determinantes da matriz de covarincia posterior dos parmetros para os


modelos (A) 1, (B) 2 e (C) 4 para os experimentos 06, 07 e 08, seguindo os
planejamentos timos dos diferentes critrios, conforme indicados na Tabela 8.6.
Observa-se que no h diferena muito significativa para a preciso final
atingida pelos parmetros segundo os diferentes critrios. Ainda assim, a preciso
obtida com o critrio DNorm(z=0) parece ser quase sempre inferior obtida adotando-se
outros critrios. Ainda assim, ao adotar uma estratgia multiobjetivo, obtm-se ao longo
dos experimentos uma preciso que parece conciliar melhor os diferentes objetivos.
Fim do Exemplo 8.2

8.5 Discusso e concluses


Os resultados apresentados sugerem que a discriminao de modelos e a
estimao de parmetros precisos tendem a ser mais bem conciliadas quando se
considera no discriminante a influncia da matriz de covarincia posterior dos
parmetros, conforme sugerido por SCHWAAB et al. (2008c). Contudo, a maioria das
formas de discriminantes no capaz de avaliar a flexibilidade dos modelos para o
160

ajuste de novos dados experimentais, excetuam-se os discriminantes conforme


propostos por ATKINSON e colaboradores (ATKINSON e FEDOROV, 1975a,b,
PONCE DE LEON e ATKINSON, 1991). Este problema ser tratado em mais detalhes
no Captulo 9. Alm disto, pode ser difcil determinar pontos que apresentem bons
valores de todas as funes objetivos simultaneamente. O Captulo 10 apresenta a
proposta de conciliao dos objetivos de discriminao de modelos e estimao de
parmetros como um tratamento nico.
Foi mostrado que o tratamento do problema sob a tica multiobjetivo constitui
uma estratgia vivel, por gerar um procedimento relativamente simples em relao s
metodologias que sero adotadas nos Captulos 9, 10 e 11. As frentes de Pareto podem
ser construdas duas a duas e observadas quanto concavidade. Desta forma, possvel
avaliar se os objetivos podem ser conciliados ou o tratamento dos diferentes objetivos
deve ser buscado separadamente. A escolha de um ponto especfico pode ser feita
maximizando-se uma soma ou multiplicao ponderada de distintos critrios, de forma
semelhante ao que foi proposto por ATKINSON (2008).

161

9 DISCRIMINAO DE MODELOS
RESUMO
Os discriminantes apresentados na literatura buscam planejamentos timos que
maximizam a distncia entre as respostas dos modelos. Neste caso, muitos
discriminantes so altamente influenciados por valores numricos de divergncias para
os pares de modelos, no levando em conta se a discriminao entre diversos modelos
de fato possvel naquela condio. Desta forma, parece interessante avaliar um
discriminante que se baseia no nmero de modelos que se espera discriminar. Este
captulo apresenta uma proposta para a discriminao de modelos que se baseia
primeiramente no nmero de modelos discriminados e como termo secundariamente em
algum discriminante proposto na literatura.
Em resumo, propem-se avaliar o potencial de discriminao de um plano
experimental atravs do seguinte critrio:

D
,
Dmax

, n VB
n 1

onde: (,n) uma funo binria que assume o valor 1 se o modelo n discriminado
ou 0 se o modelo n no discriminado; D() o valor de um discriminante usual da
literatura; Dmax o valor mximo que D() pode assumir; e VB um valor
suficientemente baixo para que o termo D()/Dmax fique em segundo plano, comparado
ao nmero de modelos discriminados.
Contudo, para utilizao do critrio de planejamento de experimentos,
necessrio prever o dado experimental obtido ao quando ao executar . Similarmente
ao discriminante proposto por ATKINSON e FEDOROV (1975a,b), isto pode ser feito
quando se considera um modelo m como verdadeiro. Os parmetros dos demais
modelos (n=1,M; nm) podem ser re-estimados e sua adequabilidade avaliada pelo
teste chi-quadrado. Contudo, qualquer dos modelos m (m=1,M) provveis podem ser
verdadeiros. Logo, o problema naturalmente multiobjetivo, com nmero de funes
objetivos igual ao nmero de modelos. As funes-objetivo so os critrios calculados
quando se considera que a resposta real dada pelo modelo m (m=1,M), ou seja,
{ |Z 1 , |Z 2 ,..., |Z M }. A escolha de um plano experimental pode ento



162

ser realizada pelo critrio Bayesiano, Maximin ou outro critrio qualquer para
problemas multiobjetivos. Com isto, o experimentador tem uma expectativa do nmero
de modelos que sero discriminados ao se fazer um plano experimental .

9.1 Objetivos
O objetivo deste captulo apresentar uma nova funo de informao para
discriminao de modelos que leva em conta o nmero de modelos que se espera
discriminar.

9.2 Introduo
A literatura apresenta discriminantes que buscam a maximizao de divergncias
entre os modelos. O problema que, quando muitos modelos so avaliados, a regio de
maior divergncia mdia pode no ser boa para discriminar nenhum dos modelos. Por
isto, alguns critrios de discriminao apresentados na literatura propuseram avaliar
discriminantes com base em pares de modelos (BUZZI-FERRARIS et al., 1983,
SCHWAAB et al., 2006). A dificuldade de se definir o discriminante devida
basicamente ao seguinte fato: no existe uma nica previso da realidade, j que cada
modelo pode predizer uma resposta diferente; conseqentemente, diversas formulaes
podem ser apresentadas para a discriminao de modelos. O que ocorre de fato que se
desconhece o estado da natureza; ou seja, a resposta do experimento. Cada modelo
pode ser ento considerado como um estado da natureza, fornecendo base para fazer as
previses sobre possveis valores o experimento deve fornecer. Portanto, o problema
proposto naturalmente multiobjetivo, sendo o nmero de objetivos igual ao nmero de
modelos que de se dispem.
A Seo 9.3 apresenta a formulao do problema proposto sob a tica
multiobjetivo. A Seo 9.4.2 apresenta a implementao do critrio e o algoritmo
empregado para determinao de um plano timo. De forma sucinta, o procedimento
consiste em admitir um modelo como verdadeiro e realizar a re-estimao dos
parmetros dos modelos, conforme proposto por ATKINSON e FEDOROV (1975a,b).

9.3 Formulao do potencial de discriminao


Pode-se estabelecer um postulado para o ganho de informao de um
experimento, que permeia as principais idias apresentadas nesta tese referente s
propostas de funes de informao.
163

POSTULADO 9.1:

Uma medida do ganho de informao ao executar um plano experimental


pode ser dada pela porcentagem do nmero de estados da natureza que eram
considerados possveis antes de executar e foram eliminados aps executar . Se o
objetivo de um pesquisador eliminar modelos inadequados, deve-se minimizar o
nmero de possveis modelos.
A idia apresentada neste captulo basicamente a seguinte: avalia-se qual o
plano experimental timo otm que leva a um maior nmero de modelos discriminados.
A vantagem disto pode ser obtida atravs do seguinte exemplo ilustrativo apresentado
na Figura 9.1. Sejam trs experimentos realizados, sendo o ajuste dos trs modelos
quaisquer satisfatrios aos dados experimentais.

y
Modelo 3

Modelo 1

Modelo 2
x1

x2

Figura 9.1 Exemplo ilustrativo de trs modelos que descrevem adequadamente os


dados experimentais, com a comparao de dois pontos x1 e x2 para discriminao de
modelos.
O planejamento timo segundo critrios de discriminao consiste em avaliar a
condio tima de experimentao para a escolha do melhor modelo. A maior parte dos
discriminantes apresentados na literatura provavelmente escolheria o ponto x2 na Figura
9.1, uma vez que a divergncia entre o modelo 2 e os demais modelos bastante
significativa. Neste ponto, seria possvel discriminar o modelo 2 dos demais modelos.
Contudo, pode-se observar que o ponto x1 pode ser mais adequado, uma vez que ao se
fazer um experimento neste ponto, provvel que apenas um modelo permanea como
164

o modelo verdadeiro. Logo, no o valor da divergncia entre os modelos que deve


ser predominante, mas sim o nmero de modelos que se espera discriminar.
Logo, o potencial de discriminao de um ponto pode ser escrito como:

(E 9.1)

Dmax

, n VB
n 1

onde: M o nmero de modelos provveis antes de executar ; wn um peso dado ao


modelo n; (,n) uma funo binria, que assume valor 1 se o modelo n eliminado
ou valor 0 caso o modelo n no seja eliminado; D() representa o valor de um
discriminante da literatura ao se realizar o plano experimental ; e Dmax representa o
valor mximo que o discriminante D() pode assumir. Desta forma, o termo D()/Dmax
representa a eficincia de discriminao e assume um valor entre 0 e 1. O termo VB
um valor suficientemente baixo de forma que o termo D()/Dmax fique totalmente em
segundo plano ao se avaliar o potencial de discriminao de um plano experimental ,
sendo recomendado que este valor seja inferior 1/M.
Contudo, para utilizao de qualquer critrio de discriminao de modelos,
preciso informar a resposta prevista para os experimentos aps a realizao de um
planejamento experimental . Por isto, a utilizao da Equao (E 9.1) como critrio de
discriminao de modelos descrita a seguir.

9.4 Potencial de discriminao como critrio de discriminao


de modelos
Duas formas so propostas para avaliar a discriminao de modelos: (i) o
planejamento no qual no se considera qualquer modelo para prever o dado
experimental; e (ii) o planejamento no qual as respostas so simuladas pelos modelos.
Vale ressaltar que, uma vez preditas as respostas de um determinado plano experimental

, deve-se re-estimar os parmetros de todos os modelos e avaliar sua adequabilidade.


Isto se constitui um diferencial nos procedimentos de discriminao, onde a etapa de reestimao dos parmetros dos modelos dificilmente realizada (excetuam-se os
discriminantes baseados nas idias propostas por ATKINSON e FEDOROV (1975a,b),
para os quais a re-estimao de parmetros feita).

165

9.4.1 Planejamento robusto (sem predio do dado experimental pelos


modelos)

Quando no se faz a simulao do dado experimental, ainda assim necessrio


conhecer os valores admissveis das variveis de resposta ao se realizar planos
experimentais. Ou seja, o pesquisador deve saber que as condies indicadas no
planejamento *, os valores das variveis Z(*) devem encontrar-se dentro de uma faixa

Z(*). Assim, admite-se, por exemplo, que um dado plano experimental * pode gerar
respostas Z(*) que estaro contidas em faixas Z(*)***. Neste caso, se o modelo
verdadeiro est entre os modelos propostos, ento o potencial de discriminao pode
ser avaliado tomando-se o pior conjunto de valores de Z(*) que garantam o maior valor
do discriminante. Contudo, pelo menos um dos modelos deve manter-se provvel. Este
critrio pode ser formulado como:

(E 9.2)

M
D *

arg max min Z Z * , n VB


Dmax
n 1
*

st.

, n M
n 1

A condio de desigualdade

n, M
*

indica que pelo menos um dos

n 1

modelos no pode ser eliminado. A Equao (E 9.2) pode ser entendida da seguinte
forma: independentemente do valor de Z * Z * , garante-se um valor mnimo
da informao para o pior valor de Z * que maximize a funo de discriminao.
O critrio apresentado na Equao (E 9.2) altamente conservador, exigindo
elevado esforo computacional. Alm disto, depende do conhecimento prvio por parte
do pesquisador quanto possveis faixas nas quais os valores das variveis encontremse ao longo para as condies experimentais investigadas.Pode-se argumentar que
prefervel utilizar os modelos para realizar a predio do dado experimental, conforme
discutido a seguir.

***

Por exemplo, em um sistema cataltico, em uma condio *, que corresponde a uma

temperatura de 500K, vazo de alimentao de 100mL.min-1, massa de catalisador de 100mg e frao de


reagente de 0,1, sabe-se de alguma forma que a converso est entre 0,3 e 0,6, ou seja 0,3Z(*)0,6.

166

9.4.2 Utilizando os modelos para realizar a predio

Considera-se que os dados experimentais possam ser avaliados pela predio dos
modelos. Com isto, o dado experimental deve ser simulado para cada modelo, entendido
no jargo da Teoria da Deciso como cada possvel estado da natureza. Desta forma, o
nmero de funes objetivos a serem maximizadas seriam os critrios de informao
para cada possvel estado da natureza. Logo, se M modelos so provveis, o nmero de
funes objetivos seria igual a M. A funo de informao neste caso ficaria na forma:

(E 9.3)

D( )

|Z ( m ) |Z ( m ) , n VB

n 1

Dmax

nm

Todos os termos so equivalentes aos descritos na Equao (E 9.1); contudo,


sempre avaliados considerando que a resposta de um determinado planejamento
experimental possa ser obtida segundo a simulao com o modelo m. Os
discriminantes D()/Dmax podem independer da considerao de que o modelo m seja
verdadeiro. Neste caso, o algoritmo de avaliao de |Z ( m ) considerando todos os
modelos m (m=1,M) como verdadeiros est apresentado na Figura 9.2.
Encontre o plano otm que maximiza D; ou seja, Dmax =D(otm)
Calcule D(*)
Para todo m=1,M faa
=0
Simule as respostas dos experimentos em * com o modelo m, como experimentos
Para todo n (n=1,M; nm), faa
Re-estime os parmetros do modelo n e avalie o modelo n pelo teste chiquadrado
Se o modelo n foi descartado, ento
=+1
Fim se
Fim faa
D( * )
|Z ( m ) * * VB


Dmax
Retorne as probabilidades dos modelos, os valores dos parmetros e os dados
experimentais condio original
Fim faa
Figura 9.2 Algoritmo para o clculo do critrio |Z ( m ) * de um planejamento *
para todo m (m=1,M), se D() o mesmo para todos m.
167

Uma caracterstica interessante pode ser includa nos discriminantes, no que


tange ao ltimo termo da Equao (E 9.1), VB.D()/Dmax. Se uma condio experimental
discrimina entre alguns modelos, pode-se considerar como critrio secundrio
potenciais de discriminao de modelos no discriminados em . Como critrio em
terceiro plano, poderia ser considerada a eficincia de discriminao de modelos que
esperam ser discriminados ao se realizar . Desta forma, o discriminante ficaria na
forma:

(E 9.4)

D1| Z ( m ) ( )
D2 ( m ) ( )

VB2 |Z

|Z ( m ) |Z ( m ) , n VB1
n 1

D1max |Z ( m )
D2max|Z ( m )

nm

onde os ndices 1 e 2 referem-se aos modelos no discriminados em e aos modelos


discriminados em , respectivamente. Os termos VB1. e VB2. so arbitrrios e podem ser
utilizados para controlar a importncia dos termos na funo de informao. Como
recomendao, nesta tese, estes termos so assumidos, respectivamente, iguais a 0,99/M
e 0,99/(2M). O discriminante da Equao (E 9.4) pode ser entendido de forma
hierrquica, conforme ilustrado na Figura 9.3.

Figura 9.3 Aspectos hierrquicos considerados no valor do discriminante.


Neste caso, os discriminantes D1() e D2() so avaliados para os modelos que
no devem ser discriminados e os que so discriminados em , respectivamente. Neste

168

caso, o algoritmo apresentado na Figura 9.2 deve ser adaptado, conforme apresentado
na Figura 9.4.
Encontre Dmax. Se D avaliado para pares de modelos, encontre Dmax(m,n) para todos os
pares de modelos m,n
Para todo m=1,M faa
=0
D1max(*) = 1x10-15 (valor muito baixo)
D2max(*) = 1x10-15 (valor muito baixo)
Simule as respostas dos experimentos em * com o modelo m, como pontos
experimentais
Para todo n (n=1,M; nm), faa
Re-estime os parmetros do modelo n e avalie o modelo n pelo teste chiquadrado
Se o modelo n foi descartado, ento
=+1
Atualize D2|Z(m)(*)(*) (modelos discriminados)
Atualize D2max (modelos discriminados) a partir de Dmax(m,n)
Seno
Atualize D1|Z(m)(*)(*) (modelos no discriminados)
Atualize D1max (modelos no discriminados) a partir de Dmax(m,n)
Fim se
Fim faa
D1 ( m ) * ( * )
D 2 ( m ) * ( * )
Z

|
| Z

VB

|Z ( m ) * * VB1
2

D1 ( m ) * max
D 2 ( m ) * max
|Z
| Z

Retorne as probabilidades dos modelos, os valores dos parmetros e os dados


experimentais condio original
Fim faa
Figura 9.4 Algoritmo para avaliar o critrio |Z m * de um planejamento * para

todo m (m=1,M) conforme apresentado em (E 9.4).


Um aspecto no apresentado na maior parte dos discriminantes usuais da
literatura e considerado no novo discriminante proposto a flexibilidade que os
modelos podem assumir com determinado experimento. SCHWAAB et al. (2008) e
DONCKELS et al. (2009) demonstraram a influncia que o novo ponto experimental
pode exercer na estimao precisa dos parmetros. Para o clculo do discriminante
proposto, ao se fazer um plano experimental , simula-se o valor das variveis de
resposta com o modelo m, adicionando estes valores aos dados experimentais
disponveis. Em seguida, restima-se todos os parmetros de todos os modelos,
avaliando-se quais modelos sero discriminados. Com isto, tanto a influncia do

169

planejamento na preciso paramtrica quanto na flexibilidade dos modelos so levadas


em conta. No discriminante proposto, o primeiro dgito do discriminante indica quantos
modelos devem ser eliminados ao executar o plano experimental .
A obteno do planejamento timo, portanto, resume-se a um problema de
otimizao. A forma mais simples de implementao do algoritmo para determinao
do plano experimental timo a busca em uma malha experimental. Neste caso, dividese a regio experimental em diversos pontos, avaliando-se o discriminante para cada um
destes pontos. Contudo, quando se deseja avaliar um plano experimental com mltiplos
experimentos, o problema se torna combinatorial e a soluo por meio deste mtodo
pode ser invivel. Ou seja, ao se trabalhar com mltiplos experimentos, algoritmos de
otimizao mais sofisticados devem ser empregados. Estes algoritmos devem lidar com
o fato de as funes no serem contnuas, uma vez que h um termo inteiro, indicando o
nmero de modelos discriminados, e um termo real, de acordo com o discriminante
escolhido da literatura.
importante salientar que necessrio conhecer o plano experimental timo
para cada modelo empregado, de forma a determinar Dmax(m). Isto envolve uma
otimizao para cada modelo. Se Dmax(m) for independente do modelo, apenas uma
otimizao para determinao de Dmax(m) necessria.
O esforo computacional considervel, uma vez que necessrio re-estimar os
parmetros para todos os modelos para cada plano experimental avaliado. Contudo,
como boas estimativas iniciais dos parmetros esto disponveis a partir da estimao
dos parmetros com base nos dados experimentais, algoritmos de otimizao que
empregam derivadas, como o mtodo de Gauss-Newton, podem ser utilizados. Desta
forma, o esforo computacional necessrio pode ser tornar aceitvel.
Pode-se argumentar tambm que os parmetros so imprecisos, o que torna as
respostas dos modelos tambm imprecisas. Neste sentido, poderia ser proposta a
avaliao do discriminante para o pior conjunto de parmetros dos modelos. Contudo,
isto envolveria etapas adicionais de otimizao, o que pode tornar o processo de
discriminao uma tarefa invivel devido ao excessivo nmero de clculos.
Uma vez que so considerados M modelos, o problema resulta em M funes
objetivos; ou seja, os discriminantes que consideram cada modelo como o verdadeiro.
Matematicamente, a escolha de qualquer ponto da frente de Pareto tima. Pode-se
destacar trs solues especficas: (i) a soluo Maxmin, (ii) soluo Bayesiana (soma

170

ponderada dos discriminantes), e (iii) a soma no ponderada dos discriminantes, dados


respectivamente por:

(E 9.5)

otm arg max min m |Z

(E 9.5b)

otm arg max P ( m ) |Z

(m)

( )

( )

(m)

m 1
M

(E 9.5c)

otm arg max |Z


m 1

(m)

( )

( )

( )

( )

onde P(m) a probabilidade do modelo m. Para que haja uma hierarquia, neste trabalho,
considerou-se VB1=0,99/M e VB2=0,99/(2M).
BUZZI-FERRRARIS e MANENTI (2009) argumentam contra o uso de
probabilidades de modelos. Segundo os autores, infinitas explicaes podem ser
formuladas para explicar um fenmeno, levando cada explicao a uma probabilidade
que tende a zero. Contudo, apostar em estados da natureza mais provveis por meio
do uso de probabilidades um procedimento comumente adotado em problemas de
tomada de deciso (CHERNOFF e MOSES, 1959). De fato, a utilizao de
probabilidades de modelos til e funcional, fornecendo uma simultnea avaliao da
qualidade comparativa dos modelos e indicando modelos mais provveis para o
procedimento de discriminao (SCHWAAB et al,, 2006). Deve-se salientar, contudo,
que testes estatsticos para avaliao da adequabilidade dos modelos aos dados
experimentais (chi-quadrado, por exemplo) so fundamentais para avaliar se os modelos
so bons. Neste sentido, a probabilidade relativa dos modelos apenas um artifcio
matemtico, que em nada descreve a adequabilidade dos modelos aos dados
experimentais.
Preferencialmente a escolha de pontos timos de discriminao deve ser
criteriosa, onde o experimentador deve escolher um ponto com base nos possveis
cenrios esperados. Como o problema tem mltiplos objetivos, infinitas solues so
esperadas. Um exemplo ilustrativo apresentado a seguir para demonstra como um
cenrio complexo pode surgir para a escolha de um planejamento timo.

171

Exemplo Ilustrativo 9.1- Necessidade de escolha criteriosa do plano experimental

Sejam por exemplo, as solues timas construdas a partir das Equaes (E


9.5), onde trs solues timas so possveis, dadas por 1, 2, 3, correspondendo aos
critrios Maximin, Bayesiano e Igual Peso aos Modelos. Seja um planejamento 4
obtido ao maximizar a informao considerando o modelo 1 como verdadeiro. Os
resultados dos cenrios esperados ao se realizar os planejamentos 1, 2, 3 e 4 esto
apresentados na Tabela 9.1.
Tabela 9.1 Ilustrao dos possveis cenrios a partir de 4 planos experimentais no
Exemplo Ilustrativo 8.1.
Plano

1
2
3
4

Modelo 1 verdadeiro Modelo 2 verdadeiro Modelo 3 verdadeiro


No elimina nenhum

No elimina nenhum

No elimina nenhum

modelo

modelo

modelo

Elimina o modelo 2

Elimina o modelo 1

No elimina nenhum

No elimina nenhum
modelo

Elimina o modelo 3

Elimina o modelo 1

Elimina os modelos 2

No elimina nenhum

No elimina nenhum

e3

modelo

modelo

modelo

D()/ Dmax
~1
~0
~0
~0

A escolha dos experimentos timos segundo o critrio Maximin, o plano 1


apresentado na Tabela 9.1, indica ao pesquisador que ele no deve esperar a eliminar
nenhum modelo, contudo, deve aumentar a divergncia entre todos os modelos, uma
vez que nesta condio, o termo D()/ Dmax elevado.
A escolha dos experimentos timos segundo o critrio Bayesiano, o plano 2
apresentado na Tabela 9.1, indica que, se os modelos 1 ou 2 forem verdadeiros, esperase eliminar pelo menos um dos modelos. Se o modelo 3 for verdadeiro, o resultado
deste planejamento ruim.
A escolha dos experimentos timos segundo o critrio que atribui Igual Peso aos

Modelos, o plano 3 apresentado na Tabela 9.1, indica que, se os modelos 2 ou 3 forem


verdadeiros, espera-se eliminar pelo menos um dos modelos. Se o modelo 1 for
verdadeiro, o resultado deste planejamento ruim.
Por fim, ao se adotar o planejamento timo que considera o modelo 1
verdadeiro, o plano 4 apresentado na Tabela 9.1, possvel eliminar dois modelos.
172

Contudo, se o modelo verdadeiro for o modelo 2 ou modelo 3, o resultado do plano


experimental deve ser ruim.
Este exemplo ilustra como a escolha de um planejamento timo pode ser
complexa, contudo, salienta a importncia da interao entre o pesquisador e a escolha a
ser feita com o auxlio das tcnicas de planejamento de experimentos. Ou seja,
importante que o pesquisador escolha os planejamentos assumindo os riscos que o
planejamento informa, tendo a expectativa fundamentada da informao que o plano
experimental deve fornecer ao ser realizado.
Fim do Exemplo Ilustrativo 9.1

9.5 Implementao do algoritmo


9.5.1 Algoritmo

A implementao do algoritmo deve ser feita preferencialmente em um software


que apresente robustez e rapidez numrica. Devido ao esforo computacional elevado,
envolvendo a re-estimao dos parmetros dos modelos, associada aos procedimentos
de otimizao, ambientes como MAPLE, MATLAB, MATHCAD e similares devem ser
evitados se o usurio estiver interessado em obter uma resposta em tempo razovel.
Desta forma, ambientes de programao em linguagem FORTRAN e C++ so
recomendados.
Conforme comentado, o procedimento de otimizao pode ser bastante custoso,
e a natureza descontnua das funes de informao pode introduzir uma complexidade
adicional aos algoritmos de otimizao. razovel admitir que trabalhos adicionais
devam ser desenvolvidos para avaliar o desempenho de algoritmos de otimizao em
problemas complexos de planejamento de experimentos. A obteno de tais algoritmos
foge ao escopo da presente tese.
Buscando fazer uma ilustrao da utilizao do critrio, foi implementada uma
busca em uma malha experimental, considerando-se apenas um experimento adicional
possvel. Os discriminantes foram escolhidos conforme proposto por SCHWAAB et al.
(2006), de acordo com as Equaes (E 5.26)-(E 5.29). Apenas relembrando, o
discriminante proposto por SCHWAAB et al. (2006) na forma:
(E 5.26)

DiSchwaab
Pr(i ) Pr( j )
,j

z'

Y Y V
(i ) P

( j)P

(i , j ) P
Y

Y Y
(i ) P

( j)P

173

onde a matriz VY(i,j)P a matriz de covarincias das incertezas de Y, que pode ser
calculada como a soma das varincias experimentais e de predio VY(i)P e VY(j)P, na
forma:

(E 5.27)

VY(i , j ) P VY(i ) P VY( j ) P

Por sua vez, a matriz de covarincias das incertezas de predio do modelo i (e


analogamente para o modelo j) pode ser escrita como:

(E 5.28)

VY(i ) P B ( i ) V(i ) B (i )T VY

O parmetro de Tsallis (z) foi arbitrado como sendo igual a zero, eliminando a
influncia das probabilidades dos modelos. No procedimento proposto, a probabilidade
dos modelos pode ser levada em conta se for adotado o critrio Bayesiano para a
escolha de um planejamento timo, conforme Equao (E 9.5b). Conforme descrito por
SCHWAAB et al. (2006), a probabilidade dos modelos pode ser obtida atravs da
avaliao do teste chi-quadrado, da seguinte forma:

(E 9.6)

P ( m ) 1 Pr N2

Exp Ny Np

(m)

F (m)

onde: P(m) a probabilidade do modelo m, Pr indica a probabilidade do teste chiquadrado com NExpNy-Np(m) graus de liberdade, NExpNy representa o nmero de
variveis de resposta e Np(m) o nmero de parmetros do modelo m; e F(m) representa a
funo objetivo do modelo m. O modelo m considerado inadequado se sua
probabilidade for menor um valor limite especificado pelo grau de confiana .
Desprezando-se os limites superior (modelo superparametrizado) e inferior (modelo
inadequado) do teste chi-quadrado, o modelo dito inadequado se:

(E 9.7)

1
1
(m)
(m)

P ou P

2
2

O discriminante calculado conforme pares de modelos. Segundo SCHWAAB

et al. (2006), o discriminante deve ser dado por:

174

(E 5.29)

D Schwaab max i , j DiSchwaab

,j

Estabelea todos os conjuntos de planos experimentais possveis {1, 2, 3,..., N}


Para todo k, avalie a matriz de covarincias experimentais VY(k)
Para todo m (m=1,M) faa
D1max(*) = 1x10-15 (valor muito baixo)
D2max(*) = 1x10-15 (valor muito baixo)
Para todo k (k=1,N), faa
Calcule a matriz de covarincias das incertezas de predio com o modelo m
para o plano k; ou seja, VY(m)P=B(m)(k)V(m)B(m)T (k)+VY(k)
=0
Simule as respostas dos experimentos em k com o modelo m, como pontos
experimentais
Para todo n (n=1,M; nm), faa
Re-estime os parmetros do modelo n e avalie o modelo n pelo teste chiquadrado. A matriz de covarincias das incertezas paramtricas reatualizada VR(n)
Calcule a matriz de covarincias das incertezas de predio com n, com
parmetros re-estimados VRY(n)P=BR(n)(k)VR(n)BR(n)T(k)+VY, onde
BR(n)(k) a matriz de sensibilidade com parmetros do modelo n reestimados
VY(n,m)P = VRY(n)P+ VY(m)P
Se o modelo n foi descartado, ento
=+1
D2(k) =(Y(n)P-Y(m)P)T (VY(n,m)P)-1(Y(n)P-Y(m)P)
Se (D2max<D2(k)) D2max= D2(k)
Seno
D1(k) =(Y(n)P-Y(m)P)T (VY(n,m)P)-1(Y(n)P-Y(m)P)
Se (D1max<D1(k)) D1max= D1(k)
Fim se
Fim faa
Fim faa
Para todo k (k=1,N), faa
D1( * )
D 2( * )
VB

|Z ( m ) * * VB1

2

D1max
D 2max
Fim faa
Retorne as probabilidades dos modelos, os valores dos parmetros e os dados
experimentais condio original
Fim faa
Figura 9.5 Algoritmo para avaliar o critrio |Z ( m ) de todos os planejamentos k

(k=1,N) e todos os modelos m (m=1,M).


Neste caso, D() no o mesmo para todos os modelos, uma vez que se
estabelece a ordem hierrquica de importncia de fatores. A Figura 9.5 ilustra o
procedimento proposto.
175

9.5.2 Algoritmo simplificado

Uma forma simplificada de implementao do algoritmo envolve as etapas de


re-estimao de parmetros. Ao invs de re-estimar os parmetros dos modelos, pode-se
avaliar a adequabilidade de cada modelo com os valores dos parmetros originais dos
modelos. Seja F(n) a funo objetivo do modelo n calculada com base nos dados
experimentais. Ao se fazer um determinado plano experimental * sendo o modelo m
verdadeiro, a funo objetivo do modelo n poderia ser atualizada com base no valor de

F(n) e na contribuio do plano experimental simulado com o modelo m; ou seja:

(E 9.8)

F|Z( n( m) ) F ( n ) Z ( n ) Z ( m ) VZ Z ( n ) Z ( m )
T

Este procedimento deveria ser repetido para todo n =1,M, n m. Em seguida


seria avaliada a adequabilidade de cada modelo n para o plano experimental
considerado , eliminando-se os modelos inadequados. Isto confere robustez numrica
ao mtodo, uma vez que no exige o clculo de derivadas nem o ajuste de parmetros
dos modelos, que pode ser muito sensvel a problemas numricos durante a avaliao
sistemtica do procedimento de estimao, realizado grande numero de vezes. Contudo,
esta simplificao restringe a avaliao da flexibilidade dos modelos ao ajuste a novos
dados experimentais. Ainda assim, tal implementao pode ser consideravelmente mais
til e funcional, devido maior simplicidade de clculo e menor sensibilidade a
problemas numricos. Nesta tese, contudo, foi implementado o algoritmo com a reestimao de parmetros, conforme apresentado na Figura 9.5. Alguns exemplos sero

apresentados a seguir para ilustrar a aplicabilidade do algoritmo.

9.6 Exemplos
Dois exemplos so apresentados a seguir para ilustrar a aplicabilidade do critrio
proposto. Em ambos os exemplos, experimentos iniciais foram simulados com o modelo
verdadeiro e acrescidos de perturbaes aleatrias. A estimao de parmetros foi
conduzida mediante um algoritmo hbrido, conforme descrito por SCHWAAB et al.
(2008a, 2008b). Primeiramente, uma busca global dos parmetros timos conduzida
segundo o mtodo do Enxame de Partculas (KENNEDY e EBERHART, 2001). O
melhor ponto do Enxame de Partculas alimentado a um algoritmo determinstico
baseado no mtodo de Gauss-Newton, em um pacote computacional implementado em
176

linguagem Fortran (SCHWAAB et al., 2010). O plano timo investigado constituiu de


apenas um nico experimento adicional em ambos os experimentos. Para determinao
desta condio experimental, a regio experimental foi discretizada e a busca em uma
malha experimental foi aplicada.
Exemplo 9.2 Modelo de adsoro

Este exemplo simples foi proposto por SCHWAAB et al. (2008c). Trata-se do
Exemplo 8.1 apresentado no Captulo 8. Neste exemplo, dois modelos de isotermas de
adsoro so considerados:

Modelo 1: y1 1(1)

2(1) x
1 2 (1) x

Modelo 2: y2 1(2) x2

( 2)

Neste caso, o conjunto de parmetros do modelo 1 dado por (1)={1(1),2(1)},


enquanto para o modelo 2 o conjunto de parmetros dado por 2={1(2),2(2)}. Neste
exemplo, o modelo correto o modelo 1, cujos parmetros verdadeiros so

1(1)=3mol.Kg-1 e 2(1)=2bar-1 e a varincia experimental constante e igual a


0,01mol2.Kg-2. A inicializao do plano experimental foi feita com trs experimentos
iniciais, conforme apresentados na Tabela 9.2. Estes experimentos foram gerados com
os valores verdadeiros dos parmetros do modelo 1, sendo acrescida de uma oscilao
aleatria normalmente distribuda com mdia 0 e varincia 0,01 mol2.Kg-2.
Tabela 9.2 Experimentos iniciais no Exemplo 9.2.
Experimento

x (bar)

y (mol.Kg-1)

0,50

1,40

1,00

1,99

2,00

2,41

Com os experimentos da Tabela 9.2 foi conduzida a estimao de parmetros


dos dois modelos. Para cada modelo m, a Tabela 9.3 apresenta os resultados da funo
objetivo F(m), da probabilidade dos modelos P(m), dos parmetros estimados parmetros

{1(m),2(m)} e suas respectivas incertezas {1(m), 2(m)}.


177

Tabela 9.3 Resultados da estimao de parmetros do Exemplo 9.2.


Modelo

F(m)

P(m)

1(m) 1(m)

2(m) 2(m)

0,135

76,1

3,175 0,283

1,613 0,402

1,478

23,9

1,892 0,060

0,372 0,055

Neste exemplo, considera-se apenas um experimento adicional a ser planejado;


isto , ={x}. Para avaliar a melhor condio x, a faixa experimental foi fixada em

0<x5, sendo feita 100 divises em x. A Figura 9.6 apresenta os resultados dos critrios
de discriminao de modelos considerando os modelos 1 ou 2 como verdadeiros.

1.4

1.4

(A)

1.2
1.0

1.0

0.8

()

()

(B)

1.2

Pontos de discriminao

0.8

0.6

Pontos de discriminao

0.6

0.4

0.4

0.2

0.2

0.0

0.0

x (bar)

x (bar)

Figura 9.6 Critrios de informao considerando: (A) o modelo 1 verdadeiro

|Z

(1)

; e (B) modelo 2 verdadeiro |Z

( 2)

no Exemplo 9.2.

Conforme pode ser observado na Figura 9.6, para regies de x0,05, ambos os
modelos podem ser discriminados. Contudo, segundo as simulaes, para regies de x
em torno de 5, ocorrer discriminao de modelos apenas se o modelo 2 for verdadeiro.
A escolha natural neste caso um ponto na regio de x=0,05. Conforme indicado na
Figura 9.6, h uma expectativa de que o modelo 2 consiga se ajustar a um experimento
gerado com o modelo 1 para x prximo de 5bar.
Como mostrado por SCHWAAB et al. (2008c) e apresentado no Exemplo 8.1 do
Captulo 8, um experimento realizado em x=5bar permite a discriminao do modelo 2.
A discrepncia surge porque que os parmetros estimados para o modelo 1 com os
dados experimentais obtidos na Tabela 9.2 diferem dos parmetros verdadeiros do
modelo 1. Com isto, o experimentador levado a crer que a discriminao no seria
possvel em x=5bar. Assim, os resultados indicam que esperada a discriminao em
178

x=0,05bar. Aps realizao do experimento nesta condio, ocorre a eliminao do


modelo 2. interessante ainda observar que o critrio proposto permite avaliar
rapidamente a robustez do planejamento para a discriminao de modelos, uma vez que
as fronteiras onde a discriminao possvel so descontnuas e bem marcadas.
Fim do Exemplo 9.2
Exemplo 9.3 Modelo cintico

Este exemplos simples foi proposto por BUZZI-FERRARIS et al. (1984) e foi
tambm investigado por SCHWAAB et al. (2006). Trata-se do Exemplo 8.2
apresentado no Captulo 8. Neste exemplo, quatro modelos cinticos so considerados.

Modelo 1: y1
Modelo 2: y1

Modelo 3: y1

1(1) x1 x2
,
1 3(1) x1 4 (1) x2
1(2) x1 x2

(2)
3

x1 4 (2) x2

1(3) x1 x2

(3)
4

x2

,
2

y2

y2

,
2

y2

2(1) x1 x2
1 3(1) x1 4 (1) x2

(2)
3

x1

2(3) x1 x2

1(4) x1 x2
,
Modelo 4: y1
1 3(4) x1 4 (4) x2

2(2) x1 x2

(3)
3

x1

2 (4) x1 x2
y2
1 3(4) x1

Admite-se que o modelo correto o modelo 1, cujos parmetros so dados por

1(1)=0,1; 2(1)=0,01; 3(1)=0,1; e 4(1)=0,01. As varincias experimentais so constantes


e iguais a 0,35 e 2,3x10-2 para as variveis y1 e y2, respectivamente. Cinco experimentos
iniciais foram realizados, i.e., simulados com o modelo 1 e acrescidos de uma
oscilao aleatria normalmente distribuda com mdia zero e varincia 0,35 e 2,3x10-2
para as variveis y1 e y2, respectivamente. Os resultados esto apresentados na Tabela
9.4.
Com os dados apresentados na Tabela 9.4 os parmetros dos quatro modelos
foram estimados e a adequabilidade de cada modelo avaliada pelo teste chi-quadrado.
Os resultados esto apresentados na Tabela 9.5.
Neste caso, o planejamento inicial 0 consiste nos cinco experimentos da Tabela
9.4. A avaliao do planejamento timo a ser realizado consiste em determinar a
prxima condio experimental para discriminar os modelos. Neste caso, considera-se
179

apenas um experimento a ser planejado; ou seja, ={x1,x2}. Para isto, a regio


experimental foi avaliada entre 5,0x155,0 e 5,0x255,0, sendo cada varivel divida
em 20 pontos igualmente espaados. Logo, 400 condies experimentais foram
avaliadas.
Tabela 9.4 Experimentos iniciais realizados no Exemplo 9.3.
Experimento

x1

x2

y1

y2

01

20,0

20,0

13,443

1,299

02

30,0

20,0

13,817

1,433

03

20,0

30,0

17,809

1,885

04

30,0

30,0

21,139

2,118

05

25,0

25,0

16,039

1,635

Tabela 9.5 Resultados da estimao de parmetros no Exemplo 9.3.


Modelo

4(m)

01

1(m)
2(m)
0,1311 0,0134

3(m)
0,1431

P(m)
0,0145 0,400

02

0,0743 0,0068

0,0233

0,0034 0,312

03

0,0281 0,0067

0,0017

0,0232

04

0,1162 0,0107

0,1187

0,0162 0,389

0,00

A Figura 9.7 apresenta os resultados dos critrios, considerando cada modelo


como verdadeiro. A descontinuidade dos critrios respalda as regies onde a
discriminao dos modelos esperada ocorrer. Conforme pode ser observado, ao se
considerar o modelo 1 como verdadeiro, alguns pontos experimentais indicam que um
modelo pode ser eliminado, enquanto outros pontos experimentais indicam que at dois
modelos podem ser eliminados. Por outro lado, ao considerar os modelos 2 e 4 como
verdadeiros, espera-se que apenas um dos modelos seja discriminado com um
experimento adicional.
A frente de Pareto obtida no Exemplo 9.3 contm infinitos planos experimentais.
A escolha de um dos planos experimentais pode ser realizada com o critrio Bayesiano,
Maximin, atribuindo iguais probabilidades aos modelos ou com qualquer outro critrio
que permita a escolha de um ponto. A Tabela 9.6 apresenta os pontos experimentais

180

escolhidos segundo o critrio Bayesiano, Maximin e atribuindo iguais probabilidades


aos modelos.

|Z2()

|Z1()

(A)

(B)

0
10

20

x1

30

40

30
20

40

10

x2

10

50

50

20

30

x1

30
20

40

50

x2

10

50

40

|Z4()

(C)
1

0
10

20

30

x1

40

30
20

40
50

10

50

x2

Figura 9.7 - Valores de: (A) |Z(1)(); (B) |(2)(); e (C) |Z(4)() ao longo da faixa
experimental no Exemplo 9.3.
Tabela 9.6 Valores mximos dos critrios de deciso no Exemplo 9.3.

Condio experimental

Valor do critrio

( )

( )

( )

Critrio

x1

x2

Maximin

18,16

55,00

2,0476

1,0958

1,0433

Bayesiano

23,42

55,00

2,1238

1,0742

1,0249

Iguais Probabilidades

23,42

55,00

2,1238

1,0742

1,0249

(1)

( )

( 2)

( )

( 4)

( )

Conforme pode ser observado na Tabela 9.6, os critrios Bayesiano e de Iguais


Pesos aos Modelos indicam a mesma condio experimental. O critrio Maximin indica
uma condio experimental um pouco distinta dos demais critrios. A realizao de um

181

experimento adicional nas condies indicadas na Tabela 9.6 foi simulada. Os


resultados esto apresentados na Tabela 9.7.
Tabela 9.7 Experimentos conduzidos de acordo com os diferentes critrios
apresentados na Tabela 9.6.

Critrio

Condio

Variveis de

Probabilidade dos modelos aps um

experimental

resposta

experimento adicional

x1

x2

y1

y2

Modelo 1

Modelo 2

Modelo 4

Maximin

18,16 55,00

29,55

2,958

0,58

0,00

0,00

Bayesiano

23,42 55,00

32,98

3,300

0,27

0,00

0,00

Igual pesos

23,42 55,00

32,98

3,300

0,27

0,00

0,00

Conforme indicado na Tabela 9.7, os dois modelos foram discriminados aps a


realizao de um nico experimento adicional. Isto j podia ser esperado ao considerar o
modelo 1 como verdadeiro, conforme resultados apresentado na Tabela 9.6, na qual o
valor de Z (1) ( ) ( ) maior do que 2 para qualquer uma das condies indicadas na
Tabela 9.6.
Fim do Exemplo 9.3

9.7 Discusso e concluses


Este captulo apresentou consideraes sobre o procedimento de discriminao
de modelos, tendo como principal objetivo no processo de discriminao de modelos
maximizar o nmero de modelos discriminados. Desta forma, os discriminantes usuais
da literatura foram adaptados em um critrio que avalia primeiramente o nmero de
modelos que se espera discriminar. Com isto, o discriminante assume um significado
para o experimentador: o experimentador pode ter idia a priori se a discriminao com
um determinado plano experimental possvel e o nmero de modelos que se espera
que sejam discriminados.
O problema multiobjetivo resultante inevitvel, uma vez que diversas podem
ser as formas de se prever o dado experimental para um dado conjunto de experimentos

. A soluo do problema multiobjetivo a frente de Pareto dos planejamentos no

182

dominados. Os critrios Maximin e Bayesiano, entre outros, podem ser utilizados para a
escolha de um plano experimental especfico.
A utilizao de probabilidades de modelos condenada por alguns autores
(BUZZI-FERRARIS e MANENTI, 2009). Contudo, qualquer uma dentre as solues
timas pode ser escolhida como soluo do problema. Por conseguinte, o critrio
Bayesiano, com utilizao de probabilidades de modelos, uma soluo perfeitamente
aceitvel para o problema. O clculo da probabilidade conforme proposto por
SCHWAAB et al. (2006) pode ser utilizado para a escolha de um planejamento timo,
segundo o critrio Bayesiano.
Problemas naturais surgem no processo de otimizao para avaliar o
planejamento timo. Primeiramente, as funes de informao so descontnuas para os
pontos de discriminao, exigindo um mtodo de otimizao robusto. Algumas
alternativas de otimizao podem ser investigadas. Por exemplo: (i) uma primeira
estratgia o emprego de algoritmos heursticos, tais como algoritmo gentico ou
enxame de partculas, que devem ter suas eficincias avaliadas para obter planejamentos
timos; (ii) outra alternativa a realizao de diversas otimizaes, usando por exemplo
o mtodo de Newton, que permite avaliar timos locais para o discriminantes escolhido
da literatura (tais discriminantes so geralmente funes contnuas), obtendo solues
timas locais (mximos locais) dos discriminantes usuais. Estas condies poderiam ser
fornecidas como estimativas iniciais em outros algoritmos de otimizao, que no usam
derivadas, avaliado em seguida a funo de discriminao que leva em conta o nmero
de modelos discriminados, conforme critrio (E 9.1). Enfim, estudos especficos de
otimizao podem ser conduzidos para avaliar planejamentos timos, segundo o critrio
apresentado neste capitulo. Ainda assim, o planejamento de mltiplos experimentos
pode tornar o algoritmo de otimizao nada trivial. Nesta tese, exemplos foram
apresentados com apenas um experimento adicional considerado.
Um questionamento relevante diz respeito vantagem de utilizao do critrio
proposto: o discriminante proposto neste captulo leva a planejamentos experimentais
melhores do que os discriminantes usuais da literatura? A resposta to incerta quanto
o dado experimental. Ou seja, a priori no pode ser estabelecida qual a melhor estratgia
sem o conhecimento do resultado experimental final. Desta forma, em muitos casos,
alguns discriminantes podem resultar em melhores valores do que outros; contudo, para
outros casos, a situao pode ser invertida. O problema multiobjetivo por natureza,
uma vez que se trata de um processo de tomada de deciso onde h mltiplos estados da
183

natureza e as solues so mltiplas. Portanto, avaliando estritamente sob a tica


multiobjetivo, no h critrios melhores ou piores do que outros, se tais critrios
indicarem planejamentos timos no dominados, segundo o conceito de dominncia de
Pareto.
Assim, as vantagens de diferentes discriminantes podem ser avaliadas quanto a
sua abrangncia sobre aspectos importantes no processo de avaliao de planejamentos
timos discriminantes, facilidade de implementao, robustez numrica, tempo de
cmputo e capacidade de fornecer informaes teis aos pesquisadores.
O critrio apresentado neste captulo permite tratar o problema sob a tica
multiobjetivo, destacando aspectos importantes, com freqncia no abordados em
discriminantes usuais da literatura. A discusso apresentada destacou a grande
dependncia do resultado final em relao ao dado experimental desconhecido,
indicando que o experimentador deve conhecer o risco envolvido quando se adotam
modelos para prever o dado experimental. Desta forma, incertezas experimentais mal
avaliadas ou incertezas paramtricas errneas comprometem o planejamento. As etapas
de re-estimao de parmetros levam em conta a flexibilidade dos modelos para
descrio de novos dados experimentais de forma semelhante ao trabalho de
ATKINSON e FEDOROV (1975a,b). Deve ser salientado ainda que o discriminante
proposto pondera o que realmente importa para o pesquisador: a eliminao de modelos,
sendo que a divergncia mxima entre os modelos pode ser avaliada em segundo plano.
Nesse caso, torna-se possvel inclusive avaliar a robustez do planejamento proposto em
relao ao nmero provvel de modelos que sero discriminados na regio experimental
considerada.
A implementao do discriminante no complexa, especialmente para busca
em uma malha experimental, conforme implementado nesta tese. Contudo, como
desvantagem, destaca-se o tamanho do problema de otimizao envolvido e o custo
computacional para avaliao do discriminante proposto nesta tese. O processo de reestimao de parmetros pode no ser custoso, uma vez que bons chutes inicias para os
parmetros so obtidos dos dados experimentais, sendo alimentados nos algoritmos de
estimao de parmetros pelo mtodo de Gauss-Newton. Ainda assim, o processo
repetitivo de estimao de parmetros pode levar a falhas numricas e problemas de
convergncia,a depender das caractersticas dos modelos investigados e dos algoritmos
de otimizao adotados. A alternativa apresentada na Seo 9.5.2 contorna este

184

problema; contudo, se adotada esta estratgia, deixa de ser possvel avaliar a


flexibilidade dos modelos para adequao novos pontos experimentais.
Em suma, o discriminante proposto neste captulo pode ser mais complexo do
que os discriminantes apresentados na literatura. Esta complexidade pode depender da
forma de discriminante a ser implementada com base nos conceitos discutidos neste
captulo (Figura 9.2, Figura 9.4, Figura 9.5). Quanto mais profundamente avalia-se o
problema, mais complexa se torna a implementao. Contudo, aspectos relevantes para
o processo de discriminao so avaliados pelo discriminante proposto nesta tese,
levando a um maior domnio do resultado, sendo o experimentador informado sobre a
expectativa de resultados do planejamento experimental a priori.

185

10 CONCILIANDO A ESTIMAO DE PARMETROS


PRECISOS E A DISCRIMINAO DE MODELOS
RESUMO:
Este captulo apresenta a proposta para a conciliao dos objetivos de
discriminao de modelos e estimao de parmetros precisos. Anlogo ao
apresentado no Captulo 9, propem que a medida de ganho de informao ao realizar
um conjunto de experimentos pode ser dado pela porcentagem de estados da natureza
que eram considerados possveis antes de e foram eliminados aps realizar .
Conforme ser demonstrado neste captulo, obtm-se por deduo a seguinte
medida de informao:

w
n 1

(n)

VCR ( n ) 0
, onde: w(n) um peso
1
(n)
0

VCRT

dado ao modelo n, 0 um conjunto inicial de experimentos; o conjunto de


experimentos para o qual se deseja avaliar o ganho de informao (); VCRT(n)(0)
o volume total da regio de confiana das incertezas paramtricas do modelo n com os
experimentos 0; e VCR(n)(0+) o volume da regio de confiana das incertezas
paramtricas calculado com os dados 0+ para o modelo n. Para um nico modelo, o
critrio se reduz ao critrio do volume de estimao de parmetros precisos. Para
diversos modelos, se um modelo n eliminado com o conjunto de experimentos , o
volume VCR(n)(0+) nulo e o ganho de informao neste caso elevado. Logo, a
medida de informao naturalmente privilegia pontos de discriminao.
Esta medida de informao pode ser utilizada para o planejamento de
experimentos. Contudo, necessrio conseguir prever o dado experimental quando se
executam os experimentos em . Isto pode ser feito utilizando os modelos para prever o
dado experimental. A medida de informao () pode ser obtida considerando que os
resultados em , representados por Z(), podem ser calculados com o modelo m, i.e.,
Z()=Z(m)(). Neste caso, a medida de informao fica |Z ( m ) . Contudo, este
procedimento deveria ser repetido para todos os modelos m=(1,M); logo, o nmero de
funes objetivos a serem maximizadas igual ao nmero de modelos, e o conjunto de
funes objetivos corresponde a { |Z(1) , |Z( 2) ,..., |Z ( M ) }. O problema
186

multiobjetivo, cuja soluo dada pela frente de Pareto. A escolha de um ponto dentro
da frente de Pareto pode ser feita pelo critrio Maximin, Bayesiano ou qualquer outro
critrio.

10.1 Objetivos
O principal objetivo deste captulo apresentar uma proposta para conciliar os
objetivos de estimao de parmetros precisos e discriminao de modelos. Isto feito
atravs da definio de um critrio para medir o ganho de informao com um conjunto
de experimentos .

10.2 Introduo
A estimao de parmetros precisos e a discriminao de modelos muitas vezes
so atingidas diversas vezes em direes opostas. Diversas tentativas tm sido feitas de
conciliao destes objetivos, conforme tratado no Captulo 5, Seo 5.6. O Captulo 8
apresentou a soluo deste problema sob a tica multiobjetivo. Contudo, conforme
demonstrado no Captulo 8, diversas funes objetivos podem ser formuladas de
maneira que a obteno da frente de Pareto para tantas funes pode ser uma tarefa nada
trivial. Neste cenrio complexo, pode-se argumentar que o domnio do pesquisador a
respeito da expectativa de ganho de informao com o experimento tenha sido
totalmente perdido. O experimentador pode ser informado de um planejamento timo e
cegamente realiz-lo, sem qualquer expectativa sobre o resultado a ser obtido. Neste
sentido, parece interessante estabelecer um critrio de ganho de informao que
signifique algo para o pesquisador. A complexidade do problema deveria ser reduzida
ao mximo, para tornar este critrio simples e factvel.
Os critrios de informao avaliam a reduo na incerteza de uma varivel.
conveniente relembrar alguns aspectos da Teoria da Informao apresentados no
Captulo 4. Sejam um conjunto de variveis, cuja distribuio de probabilidades
representada por (). A entropia da informao associada dada por:

(E 10.1)

H E log log d

Quanto menor a entropia, menor a quantidade de informao necessria para


descrever (cenrio desejado). Esta entropia tem algumas ligaes com a informao

187

de Fisher. Por exemplo, a minimizao da entropia leva ao critrio D-timo de


estimao de parmetros precisos (LINDLEY, 1956, BARD, 1974). Contudo, a entropia
da informao para variveis contnuas pode ser negativa e no ser invariante
reparametrizao (SOOFI, 1994).
A informao de Lindley comumente utilizada para medir o ganho de
informao com experimentos (PARMIGIANI e INOUE, 2009). LINDLEY (1956)
props que o ganho de informao com um conjunto de experimentos poderia ser
dado pela diferena de entropia entre as probabilidades a priori log e a

posteriori log | . Contudo, o valor mdio desta diferena deveria ser tomado em
relao distribuio de probabilidades a posteriori, ou seja:

(E 10.2)

Lindley E log E log |

(E 10.3)

Lindley | ln

|
d

que o critrio de divergncia de Kullback-Leibler entre as distribuies priori e

posteriori. Este um valor sempre positivo e invariante reparametrizao


(KULLBACK e LEIBLER, 1951). Contudo, o valor absoluto deste critrio pouco
informativo e a base logartmica imaterial (KULLBACK, 1959), sendo o ganho de
informao utilizado de forma comparativa entre experimentos para avaliar o melhor
conjunto de experimentos. Como desvantagem adicional, esta medida est restrita
comparao entre duas distribuies de probabilidade. Desta forma, parece ser
interessante estabelecer um critrio que seja informativo ao pesquisador, conforme
mostrado a seguir.

10.3 Medida de ganho de informao


10.3.1 Propondo uma medida de informao adequada

Uma vez que a reduo na incerteza de variveis est associada eliminao de


possveis valores das variveis (DEGROOT, 1962), pode-se estabelecer o seguinte
postulado:

188

POSTULADO 10.1:

Uma medida do ganho de informao ao executar um plano experimental


pode ser dada pela porcentagem do nmero de estados da natureza que eram
considerados possveis antes de executar e foram eliminados aps executar . Se o
objetivo de um pesquisador obter conhecimento sobre os parmetros dos modelos,
deve-se minimizar o conjunto de possveis valores de parmetros de todos os modelos.
A eliminao de 100% dos estados da natureza de uma varivel indica que o
experimentador no possui nenhum conhecimento absoluto sobre a varivel . Neste
caso, as hipteses propostas pelo pesquisador sobre a varivel mostraram-se todas
inadequadas. Contudo, o ganho do experimento indica que 100% de estados da

natureza inadequados foram eliminados.


Contudo, um experimento pode aumentar o nmero de possveis estados da

natureza que explicam o fenmeno investigado, revelando que o pesquisador sabia


menos sobre o fenmeno do que imaginava saber (PARMIGIANI e INOUE, 2009,
DEGROOT, 1962). No obstante, o ganho de informao com novos dados
experimentais deve sempre ser positivo (GINEBRA, 2007). Neste caso, h um ganho de
informao implcito que foi revelado pelos experimentos , do qual o pesquisador no
tinha conhecimento. O ganho de informao deve ser avaliado considerando o
conhecimento que o pesquisador de fato tinha antes de se realizar , mas com o
conhecimento obtido em (DEGROOT, 1962, GINEBRA, 2007). Define-se ()
como a funo de ganho de informao segundo o Postulado 10.1 de um plano
experimental dado S como a incerteza associada s variveis . Desta forma, ()
pode ser calculado como (DEGROOT, 1962):

(E 10.4)

S| S| |
S|

onde: S|() representa a incerteza de que o experimentador tinha antes de realizar ,


embora avaliada com o conhecimento que se tem em ; S|(|) representa a incerteza de

aps realizar . Em outras palavras, pode-se imaginar que a incerteza sobre que o
experimentador imaginava ter antes de ser fazer seja dada por S1. Aps realizar , o
pesquisador descobre que a incerteza que ele de fato tinha antes de fazer era dada por

189

S2. O pesquisador verifica tambm que a incerteza aps fazer dada por S2|. Desta
forma, a incerteza total antes de executar dada por S 2 S1 e a incerteza aps se
fazer dada por S2|, conforme ilustrado na Figura 10.1.

S2
S2|
S1

Figura 10.1 Ilustrao das incertezas que o pesquisador imaginava ter antes de (S1),
que de fato tinha antes de (S2) e que o pesquisador tem aps (S2|).
Portanto, a porcentagem total de estados da natureza eliminados pode ser escrita
como:

(E 10.5)

S 2|
S 2 S1

O Postulado 10.1 permite reunir os objetivos de discriminao de modelos e


estimao de parmetros em um nico objetivo: o ganho de informao atravs da
reduo dos possveis estados da natureza.
10.3.2 Ganho de informao em problemas de planejamento timo

Sejam 0 experimentos iniciais e M modelos que se ajustam adequadamente aos


dados experimentais. Para cada modelo n (n=1, M), o ajuste dos parmetros fornece
uma regio de confiana CR(n), cujo volume dado por VCR n 0 . Contudo, a regio
de confiana VCR n 0 pode de fato no representar a incerteza dos parmetros,
porque um novo conjunto de experimentos pode revelar que o experimentador tinha
menos informao em 0 do que imaginava ter. Define-se VCR|Zn 0 como a regio
de confiana que o experimentador de fato tinha em 0, mas com os parmetros
estimados com conhecimento adicionado dos dados obtidos em ; ou seja, Z(). Desta
forma, a regio de confiana total em 0 para o modelo n definida como CRT(n), cujo

190

volume VCRT(n). Este volume constitudo pela unio das regies de confiana que o
experimentador imaginava ter e que de fato tinha; ou seja:

(E 10.6)

VCRT ( n ) 0 VCR n 0 VCR|Z 0


n

O volume total de incerteza referente ao modelo n pode ser escrito como:

VCRT n 0 VCR n 0 VCR|Z 0 VCR n 0 VCR|Z 0


n

(E 10.7)

A determinao de VCRT(n) pode se tornar uma tarefa bastante complexa, uma


vez que as regies de confiana dos parmetros so dadas por hiper-elipsides no
espao dos parmetros. Desta forma, o volume de interseo de hiper-elipsides pode
ser de difcil determinao. Contudo, o volume VCRT(n) est compreendido entre dois
limites, conforme apresentado abaixo:

(E 10.8) max VCR n 0 , VCR|Zn 0 VCRT n 0 VCR n 0 VCR|Zn 0


O limite inferior representa o caso em que uma das regies VCR n 0 ou
VCR|Z 0 est contida na outra. O limite superior representa o caso em que a
n

interseo entre as regies VCR n 0 e VCR|Zn 0 nula (o que ser demonstrado


visualmente no Exemplo Ilustrativo 9.1, pgina 195, Figura 10.4).
Para reunir os conceitos de estimao de parmetros e discriminao de
modelos, pode-se agrupar todos os possveis valores dos parmetros dos modelos em
um nico conjunto (G)={(1),(2),...,(M)}, conforme ilustrado na Figura 10.2. Neste
caso, (G) representa a unio de todas as regies de confiana CRT(n) de todos os
modelos reunidos em um s conjunto. Este conjunto total engloba todos os possveis

estados da natureza capazes de explicar os dados experimentais em 0.

Vale relembrar formas matemticas idnticas com valores dos parmetros distintos podem ser

consideradas diferentes modelos, ou seja, y=e-1*x e y=e-2x podem ser considerados diferentes modelos ou
possveis estados da natureza.

191

Valores
possveis de
(3)

Valores
possveis de
(M-1)

Valores
possveis de
(2)

Valores
possveis de
(M)

Valores
possveis de
(1)

Valores possveis de
(G)

Figura 10.2 Ilustrao da unio de todos os conjuntos dos valores possveis dos
parmetros dos diferentes modelos.
Ao se realizar um conjunto de experimentos em , o ganho de informao de
acordo com o Postulado 10.1 fica:

(E 10.9)

N ( G )


i 1

(G )


(G )
i

, i(G )
N (G )

onde: i( G ) representa qualquer elemento dentro do conjunto ( G ) , w(G ) i(G ) um


peso dado eliminao do elemento i( G ) ; e , i(G ) representa uma funo binria,
assumindo o valor 1 se o elemento i( G ) eliminado e o valor 0 no caso contrrio;

N(G) o nmero de elementos em ( G ) (como N(G) pode ser infinito, a razo entre

,
(G )
i

N (G ) deve ser finita). Uma considerao plausvel dar o mesmo peso

w(G ) i( G ) a todo elemento i( G ) que possua a mesma forma matemtica; isto ,


pertenam ao mesmo modelo. Pode parecer um contra-senso reunir todos os possveis
valores dos parmetros de todos os modelos em um grupo (G) e depois reagrup-los de
acordo com sua forma matemtica. Contudo, isto importante para corroborar a idia

192

de que os possveis estados da natureza no precisam ser tratados de forma distinta,


independentemente de sua forma matemtica.
Dando o mesmo peso a todos os elementos que possuam a mesma forma
matemtica, o critrio de informao fica na forma:

(E 10.10)

w( G , n )
n 1

N ( n )

,
(n)
j

j 1

N G

onde N(n) representa o nmero de elementos que pertencem ao conjunto (n). Uma
forma conveniente de definir o peso dado aos estados da natureza com a mesma forma
matemtica :

(E 10.11)

wG ,n

w( n )
N ( n )

N (G )

onde:

(E 10.12)

(n)

n 1

Na Equao (E 10.11),

N ( n )
N ( G )

representa a porcentagem de elementos que

possuem a forma matemtica do modelo n, comparado com os elementos totais de (G),


enquanto e w(n) representa o peso dado ao modelo n. Assim, o critrio de informao
fica na forma:

(E 10.13)

w
(n)
n 1 N

N (G )

(n)

, (jn )
j

(G )
N

193

, (jn )

w( n ) j

N ( n )
n 1

(E 10.14)

A razo no somatrio na Equao (E 10.14) pode ser entendida como a soma da


porcentagem de estados da natureza; isto , possveis valores dos parmetros
eliminados para cada modelo n. Isto exatamente a soma da porcentagem do volume da
regio de confiana eliminado para o modelo n. Com isto, o critrio de informao fica:

(E 10.15)

n 1

(E 10.16)

VCRT n 0 VCR n 0

VCRT n 0

w ( n )
M

n 1

w ( n ) 1

VCR n 0

VCRT n 0

Este critrio de informao permite reunir os critrios de estimao de


parmetros e discriminao de modelos em um nico objetivo, sendo uma medida
adequada da informao. O critrio apresentado acima representa uma soma ponderada
da porcentagem do volume eliminado da regio de confiana de cada modelo n ao se
realizar um conjunto de experimentos . Para um nico modelo, a medida de ganho de
informao com se reduz conforme o critrio do volume. Por outro lado, se um plano
experimental elimina uma forma matemtica n (discrimina n), o volume da regio de
confiana n aps nulo, e o ganho de informao elevado. Com isto, planos
experimentais que levam discriminao de modelos so naturalmente privilegiados na
medida de informao apresentada acima.
Alm disto, a medida de informao apresentada na Equao (E 10.16)
informativa ao pesquisador, estando normalizada entre 0 e 1. Esta medida informa
quantos estados da natureza considerados possveis antes de foram eliminados aps se
realizar . Isto difere das medidas de informao de discriminao normalmente usadas
para modelos e estimao de parmetros.
Exemplo Ilustrativo 10.1- Ilustrao geomtrica da medida de ganho de informao

Como forma ilustrativa das caractersticas geomtricas no caso de regies de


confiana que correspondam a hiper-elipsides, pode-se considerar 4 modelos quaisquer
194

(m=1,4), cada um com dois parmetros {1(m), 2(m)}. Admite-se que a estimao de
parmetros a partir de alguns experimentos iniciais 0 dos modelos levou seguinte
regio de confiana dos modelos ( VCR ( n ) 0 ), apresentados na Figura 10.3:

2(1)

2(3)

2(2)

Modelo 01

1(1)

Modelo 02

1(2)

2(4)

Modelo 03

1(3)

Modelo 04

1(4)

Figura 10.3 Ilustrao de regies de confiana de quatro modelos (cada um com dois
parmetros) aps realizar 0.

VCR(n)(0)

VCRT(n)(0)

VCR(n)(0+)

VCR|(Zn)

Regies de confiana em 0

Regies de confiana totais em 0

Regies de confiana em 0+

Figura 10.4 Regies de confiana que se imaginava ter em 0, que de fato se tinha em

0, regies de confiana total em 0 e regies de confiana em 0+.


195

Um conjunto adicional de experimentos foi realizado, os parmetros dos


modelos foram re-estimados, as probabilidades dos modelos re-calculadas e as regies
de confiana dos modelos foram re-determinadas ( VCR ( n ) 0 ). As regies de
confiana que o experimentador tinha ( VCR|(Zn) 0 ) em 0 foram tambm avaliadas
com base nos parmetros obtidos em . A unio de VCR ( n ) 0 e VCR|(Zn) 0 fornece
a incerteza total em 0 ( VCRT ( n ) 0 ). Os resultados so apresentados na Figura 10.4.
Neste exemplo ilustrativo, o modelo 4 foi eliminado aps realizar .
No exemplo ilustrado acima, o modelo 4 eliminado aps e o ganho de
informao consideravelmente elevado, devido discriminao deste modelo. Os
ganhos de informao em relao aos demais modelos esto associados estimao
mais precisa dos parmetros destes modelos.
Fim do Exemplo Ilustrativo 10.1

Novamente, importante salientar que os procedimentos de discriminao de


modelos e estimao de parmetros consistem basicamente na reduo do nmero dos
possveis estados da natureza que explicam determinado fenmeno, seja para
formulaes matemticas idnticas (mesmo modelo com parmetros distintos) ou
formulaes matemticas distintas.
de grande importncia ressaltar que, de acordo com o Postulado 10.1, foi
obtido o critrio do volume para avaliar a estimao de parmetros precisos.
10.3.3 Fatores de ponderao

A forma mais simples de definir os fatores de ponderao dar a mesma


importncia cada forma matemtica (cada modelo). Esta forma simples e funcional
recomendada quando o ganho de informao o principal objetivo perseguido e todos
os modelos provveis podem ser considerados equivalentes. Neste caso, tem-se que:

(E 10.17)

w( n )

1
M

Outra forma considerar como pesos as probabilidades dos modelos, P(n),


calculadas conforme proposto por SCHWAAB et al. (2006). Neste caso:

196

(E 10.18)

w( n ) P ( n )

Os pesos tambm podem ser escolhidos de forma a maximizar a eficincia de


informao de cada modelo; isto , a informao eliminada com experimentos
ponderada pela informao mxima que pode ser eliminada para cada modelo n. Para
este terceiro caso, seja um plano experimental otm(n) que timo para reduzir a regio
de confiana do modelo n, desde que o dado seja gerado com tal modelo; ou seja:

(E 10.19)

(n)
otm
arg min VCR ( n ) 0

st: Z Z ( n )
A condio Z Z ( n ) indica que otm(n) deve ser avaliado considerando
que os dados sejam dados pelo modelo n. De forma a obter a eficincia de informao,
os pesos podem ento ser escolhidos como:

(E 10.20)

w( n )

(n)
VCR ( n ) 0 otm

1

(n)
0

VCRT

(k )
0
(k )
M
min VCR otm
1

VCRT ( k ) 0
k 1

Ao escolher esta forma, maximizar o critrio de informao equivale a


maximizar a seguinte forma funcional:

(E 10.21)

M VCRT ( n ) 0 VCR ( n ) 0

max max
(n)

n 1 VCRT ( n ) 0 VCR ( n ) 0 otm

Na Equao (E 10.21), o numerador representa o volume eliminado ao realizar ,


enquanto o denominador indica o mximo volume eliminado para o modelo n,
considerando que o modelo n no seja eliminado. Desta forma, a razo entre numerador
e denominador representa uma eficincia de estimao. Contudo, se a forma matemtica
do modelo n for eliminada com um plano experimental , ento o numerador pode se
tornar maior que o denominador e, portanto, o critrio daria grande importncia s
regies experimentais que levariam discriminao.

197

De forma mais simples, recomenda-se aqui a escolha dos pesos definidos nas
Equaes (E 10.17) ou (E 10.18).
10.3.4 Determinando o volume de incerteza em 0

Conforme comentado, a determinao completa e exata de VCRT n 0 pode


ser bastante difcil porque, sob certas condies de regularidade, os volumes das regies
de confiana representam hiper-elipsides no espao dos parmetros, cujo clculo do
volume de interseo pode bastante complexo. Contudo, a Equao (E 10.8) indica os
limites mximo e mnimo que VCRT n 0 pode assumir. Considerando que os valores
dos parmetros obtidos com 0 no sejam bruscamente alterados, espera-se que as
regies de confiana VCR n 0 e VCR|Zn 0 apresentem volumes de interseo
elevados. Desta maneira, espera-se que uma boa porcentagem de uma regio de
confiana esteja contida na outra regio de confiana. Neste caso, o valor de
VCRT n 0 estaria prximo ao limite inferior, de acordo com a Equao (E 11.8) e o

valor de VCRT n 0 poderia ser obtido como:

(E 10.22)

VCRT ( n ) 0 max VCR n 0 , VCR|Zn 0

Considerando a aproximao elptica para a regio de confiana dos parmetros,


o volume das regies de confiana proporcional raiz quadrada do determinante da
matriz de covarincias das incertezas paramtricas (Equaes (E 3.28) e (E 3.29)).
Logo, a razo entre os volumes da regio de confiana fica na forma:
0

0
VCR
(E 10.23)
V n 0

n

0
VCRT
max V n 0 , V n |Z 0

se , n 1

se , n 0

onde |.| representa o determinante da matriz. Pela propriedade de determinante, a


razo entre os volumes pode ser calculada atravs da matriz de informao de Fisher, de

Se A uma matriz inversvel, de forma que A-1=B, ento | A | 1

|B|

198

forma a evitar a inverso da matriz de informao de Fisher para obteno das matrizes
de covarincias das incertezas paramtricas. Assim, a razo entre os volumes fica:
min

w( n ) 1
n 1

(E 10.24)

J ( n ) 0 ,

J |(Zn) 0

J ( n ) 0

1 , n

Logo, o critrio de informao pode ser calculado. Contudo, na forma


apresentada na Equao (E 10.16), o critrio constitui uma medida de informao para
experimentos j realizados . No entanto, para utilizao como critrio de planejamento
de experimentos, preciso prever o dado experimental ao se realizar um conjunto de
experimentos . Isto est discutido nas sees seguintes.

10.4 Critrio para o planejamento de experimentos


Diversas podem ser as formas de se prever o dado experimental. Nesta seo,
duas formas sero apresentadas: a primeira considera que o dado experimental seja
conhecido em uma faixa, tomando o pior valor possvel do dado experimental dentro da
faixa para maximizar a informao; o segundo critrio utiliza modelos para prever o
dado experimental, o que leva a M possveis cenrios (onde M o nmero de modelos).
10.4.1 Planejamento robusto (sem utilizar modelos para prever o dado
experimental)

Neste caso, no se utilizam modelos para realizar predies dos dados


experimentais. Contudo, necessrio conhecer uma faixa possvel no qual os dados
experimentais devem se encontrar. Sejam Z() os dados experimentais obtidos em ,
cujos valores se encontram em uma faixa Z(). Quando no se utilizam modelos para
predizer o dado, pode-se maximizar a informao para o pior valor possvel de Z()
contido em Z(); ou seja, deseja-se eliminar ao mximo os possveis estados da
natureza (valores dos parmetros dos modelos) ao se realizar , independentemente de
qual seja o resultado obtido. Contudo, pelo menos um modelo deve ser capaz de se
adequar aos dados experimentais (considerando que pelo menos um dos modelos
verdadeiro). Logo, o critrio de informao fica:

199

M
n 1

arg max min Z Z wn 1

(E 10.25)

VCR n 0

VCRT n 0

st.

, n M
n 1

A condio

, n M

indica que pelo menos um modelo deve permanecer

n 1

provvel. Esta forma de avaliar o problema leva a um procedimento de otimizao


bastante complexo, uma vez que muitos so os possveis valores que Z() pode assumir
em uma faixa Z(). Alm disto, esse um critrio bastante conservador que no faz
uso dos modelos para predizer os resultados. Pode ser prefervel e bem mais eficaz
utilizar modelos para predizer o comportamento experimental, conforme segue.
10.4.2 Utilizando modelos para prever o dado experimental

De forma semelhante proposta por diversos autores (BOX e HILL, 1967,


BUZZI-FERRARIS e FORZATTI, 1983, BUZZI-FERRARIS et al., 1984, SCHWAAB
et al., 2006, 2008c, ATKINSON e FEDOROV, 1975a,b, PONCE DE LEON e
ATKINSON, 1991), o ponto experimental pode ser predito com os modelos
considerando, os valores dos parmetros estimados a partir dos dados experimentais em
0. Contudo, ao considerar que o resultado de um experimento em igual ao valor
predito com um modelo, os parmetros dos demais modelos dos demais modelos devem
ser re-estimados de forma anloga ao procedimento proposto por ATKINSON e
FEDOROV (1975a,b) e sua adequabilidade reavaliada pelo teste do chi-quadrado, para
discriminao de modelos. Este procedimento parece ser bastante razovel; no entanto,
leva M cenrios possveis, uma vez que o dado experimental pode assumir qualquer
valor predito pelos M modelos provveis. A funo de informao deve ser ento
avaliada, considerando que o dado experimental pode assumir o valor previsto de cada
modelo; ou seja, = |Z ( m ) , para todo m=1,M. Assim, as M funes de informao a
serem maximizadas so:

(E 10.26)

OF |Z ( m ) , |Z ( m ) , |Z ( m ) ,..., |Z ( M 1) , |Z ( M )

200

O problema , portanto, multiobjetivo, cuja soluo dada pela frente de Pareto.


A soluo constituda por infinitos pontos na maioria dos problemas prticos. Logo, a
priori no se pode estabelecer qual estratgia tima (infelizmente isto somente pode
ser avaliado aps obter todos os dados experimentais). Contudo, a abrangncia
conceitual do problema multiobjetivo mais ampla do que os procedimentos
empregados usualmente para conciliar a estimao de parmetros e a discriminao de
modelos.
Os volumes das regies de confiana antes de executar e aps realizar podem
ser avaliados simulando o dado experimental com o modelo m, re-estimando os
parmetros de todos os modelos e calculando o volume da regio de confiana, na
forma:
(E 10.27)

VCR n 0 VCR|(Zn()m ) 0

(E 10.28)

VCRT n 0 max VCR n 0 , VCR|Zn(m ) 0

Portanto, o clculo de cada critrio de informao |Z ( m ) pode ser feito


substituindo as Equaes (E 10.27) e (E 10.28) na Equao (E 10.16). A escolha de um
ponto especfico dentro da frente de Pareto dos planejamentos experimentais timos
pode ser feita por qualquer critrio para problemas multiobjetivos, como Maximin,
Bayesiano, ou Pesos Iguais aos Modelos, conforme mostrado nas seguintes equaes.

(E 10.29)

otm arg max min m |Z

(E 10.30)

otm arg max P ( m ) |Z

(m)

(m)

m 1

(E 10.31)

otm arg max

1
M

m 1

| Z ( m )

Vale sempre ressaltar que qualquer ponto dentro da frente de Pareto timo; e,
portanto, no h estratgia melhor ou pior do que outra, se ambas pertencem frente de
Pareto. Por isso, qualquer outro critrio pode ser utilizado para escolha de um ponto
dentro da frente de Pareto (DONCKELS et al., 2010).

201

10.4.3 Algoritmo para o clculo do critrio de informao

O algoritmo usado para avaliar o critrio de informao para um plano


experimental est apresentado na Figura 10.5.
A partir dos dados experimentais em 0, estimar os parmetros de todos os modelos

n=1,M e calcular o volume VCR n 0 = J n 0

0,5

, onde

J n 0

determinante da matriz de informao de Fisher do modelo n


Especifique os pesos w(n) para todos os modelos n=1,M; por exemplo, w(n)=1/M
Para todos os modelos m (m=1,M), faa
Gere dados com o modelo m para o plano experimental , considerando estes
dados como dados experimentais
Para todos os modelos (n=1,M; nm), faa
Re-estime os parmetros do modelo n
Se o modelo n tornou-se inadequado, ento
VCR ( n ) 0 = 0

VCR|(Zn()m ) 0 0
Seno

VCR ( n ) 0 = J |(Zn()m ) 0

0,5

, onde J |(Zn()m ) 0 a

matriz de informao de Fisher obtida com os novos dados para o


modelo n

VCR|(Zn()m ) 0 J |(Zn()m ) 0

0,5

, onde J |(Znm) 0 a matriz

de informao de Fisher com os dados em 0, mas com os parmetros


dos modelos re-estimados com os dados gerados com o modelo m
Fim se
Se( VCRZ nm 0 > VCR ( n ) 0 ) Ento
VCRT ( n ) 0 VCR|(Zn()m ) 0
Seno

VCRT ( n ) 0 VCR ( n ) 0

Fim se
Fim faa
Calcule |Z ( m ) com a Equao (E 10.16)
Retorne as probabilidades dos modelos, os dados experimentais e os valores dos
parmetros dos dados originais
Fim faa
Figura 10.5 Algoritmo para o clculo de |Z ( m ) para todos os modelos m
(m=1,M) de um planejamento especfico .

202

Por simplicidade, a etapa de re-estimao de parmetros dos modelos pode ser


substituda pela avaliao da qualidade dos modelos, considerando os parmetros
estimados com os dados experimentais em 0. Desta forma, a funo objetivo com os
dados obtidos em poderia ser calculada como:

(E 10.32)

F|Z( n( m) ) F ( n ) Z ( n ) Z ( m ) VZ Z ( n ) Z ( m )
T

Com o uso da Equao (E 10.32), o algoritmo fica muito mais simples e menos
custoso. Isto pode evitar problemas numricos nas diversas repeties do procedimento
de re-estimao de parmetros dos modelos. Contudo, perde-se a avaliao da
flexibilidade dos modelos aos novos dados experimentais, de maneira que a anlise se
torna menos eficaz. Alm disto, boas estimativas iniciais dos parmetros esto
disponveis a partir dos dados obtidos em 0. Logo, o processo de re-estimao de
parmetros consideravelmente facilitado, quando se fornecem boas estimativas iniciais
ao algoritmo baseado no mtodo de Gauss-Newton (SCHWAAB et al., 2010).
Para avaliao de um planejamento timo, o procedimento apresentado na
Figura 10.5 deve ser includo em um procedimento de otimizao. Nesta tese, por
simplicidade, foi implementada uma busca em malha para obteno de planejamentos
timos. Dois exemplos so apresentados a seguir para ilustrar a aplicabilidade do
algoritmo.

10.5 Exemplos
Dois exemplos apresentados a seguir ilustram a aplicabilidade do novo critrio
proposto. Em ambos os exemplos, experimentos iniciais foram realizados (isto ,
simulados com um modelo conhecido e acrescidos de perturbaes aleatrias para
simular o erro experimental), de forma a permitir uma primeira estimao de parmetros
dos modelos. A estimao de parmetros foi conduzida segundo um algoritmo hbrido,
de forma anloga descrita por SCHWAAB et al. (2006, 2008a), utilizando
primeiramente o Enxame de Partculas (KENNEDY e EBERHART, 2001) para uma
busca global dos valores dos parmetros. Em seguida, o melhor ponto obtido pela
tcnica do enxame de partculas foi alimentado como estimativa inicial a um mtodo de
Gauss-Newton (SCHWAAB e PINTO, 2007), sendo todas as rotinas implementadas em
linguagem Fortran (SCHWAAB et al., 2010). Os planejamentos consistiram de um

203

nico experimento adicional. Para busca do planejamento timo, a regio experimental


foi discretizada, realizando-se a busca em na malha experimental resultante. Os
resultados foram tambm confirmados atravs da utilizao da planilha eletrnica
Excel.
Exemplo 10.2 Resoluo analtica de um problema simples

Sejam dois modelos


Modelo 1: y (1) x
Modelo 2: y (2) x1,5
A varincia experimental vy constante e igual a 4x10-4. O modelo admitido
como verdadeiro e utilizado para gerao dos dados foi o modelo 2, com parmetro
(2)=1. Trs experimentos iniciais foram simulados com o modelo 2, sendo as
perturbaes geradas com distribuio normal, com mdia zero e varincia igual a vy. O
resultado dos trs experimentos iniciais est apresentado na Tabela 10.1:
Tabela 10.1 Experimentos iniciais no Exemplo 10.2.
x

yexp

0,1

0,0405

0,2

0,1010

0,5

0,3520

Os parmetros (1) e (2) e suas respectivas varincias v(1) e v(2) podem ser
estimados a partir dos dados experimentais como:
3

(E 10.33)

est
1

i 1

xi

x
i 1

(E 10.34)

exp

0, 6676

VCR 1 0 v (1)

vy

0, 00133

x
i 1

204

(E 10.35)

2 est

i 1

i 1

(E 10.36)

xi1,5

exp

1, 0059

VCR 2 0 v ( 2 )

vy

0, 00298

i 1

As funes objetivos dos modelos 1 e 2 foram, respectivamente, iguais a


(1)

F =5,1738 e F(2)=0,5341. O limite da funo chi-quadrado com dois graus de


liberdade e 97,5% confiana igual a F2=7,3777. Como ambas as funes objetivo
esto abaixo do limite do chi-quadrado, nenhum modelo desprezado.
Neste caso, os trs primeiros experimentos correspondem aos experimentos
iniciais; ou seja, 0={x1,x2,x3}. O plano experimental a ser avaliado corresponde a um
nico experimento adicional; ou seja, ={x4,}. Para avaliar a condio tima, considerase que tanto o modelo 1 quanto o modelo 2 possam ser verdadeiros. Para cada valor de
x4 avaliado quando se considera o modelo 1 verdadeiro, os valores dos parmetros 1 e
2 e suas varincias ficam na forma:
(E 10.37)

(1) est |Z

(E 10.38)

VCR (1) 0 v (1) |Z (1)

(1)

0, 6676

y2
3

x4 2 xi 2
i 1

exp

(E 10.39)

(2) est |Z

(1)

3
est
1 x4 x41,5 yi exp xi1,5

i 1

x43 xi 3
i 1

(E 10.40)

VCR 2 0 v ( 2 ) |Z (1)

y2
3

x43 xi 3
i 1

Tambm preciso avaliar a informao que se tinha em 0 com os parmetros


re-estimados aps fazer . Contudo, a preciso paramtrica neste caso independe do
valor do parmetro, uma vez que os modelos so lineares nos parmetros. Esta preciso
205

depende apenas da condio experimental dos experimentos contidos em 0. Logo, nesta


condio, estabelece-se a igualdade:

(E 10.41)

VCR|Z (1) 0 VCR n 0


n

Como conseqncia, o volume total da regio de confiana em 0 fica:

(E 10.42)

VCRT n 0 max VCR n 0 , VCR|Z (1) 0 VCR n 0


n

A incluso do ponto x4 gerado com o modelo 1 pode ou no eliminar o modelo


2. Caso a incluso deste ponto elimine o modelo 2 (F(2)> F2), ento:

(E 10.43)

1
2
0

se F(2) >F 2
se F(2) F 2

O termo F 2 avaliado com nvel de confiana igual a 97,5% e grau de


liberdade igual a 3 (devido ao novo experimento x4), resultando em F 2 =9,3484. Ento,
o critrio de informao considerando o modelo 1 como verdadeiro pode ser escrito na
seguinte forma:

(E 10.44)

v 1|Z (1)
|Z (1) w 1

v (1)

(1)

v ( 2) (1)
w2 1 |Z 1 2

v ( 2 )

Tomando w(n=1/M, onde M o nmero de modelos, tem-se que:

(E 10.45)

|Z

(1)

v (1) |Z (1)
1
1
v (1)
2

v ( 2 ) (1)
1 |Z 1 2
2

v ( 2)

Este critrio relativamente simples e pode ser avaliado mediante uma planilha
eletrnica (por exemplo, Excel).

206

Repetindo-se o mesmo procedimento, considerando o modelo 2 como


verdadeiro, os valores estimados dos parmetros e suas respectivas varincias ficam na
forma:

exp

(E 10.46)

(1) est |Z

(2)

4
y

3
est 1,5
2 x4 x4 yi exp xi

i 1

x4 2 xi 2
i 1

(E 10.47)

VCR 1 0 v ( 2) |Z ( 2)

y2
3

x4 2 xi 2
i 1

(E 10.48)

(2) est |Z

(E 10.49)

VCR 2 0 v ( 2 ) |Z ( 2 )

(2)

(2) est

y2
3

x43 xi 3
i 1

A incluso de um ponto x4 simulado com o modelo 2 pode ou no eliminar o


modelo 1. De forma anloga apresentada na Equao (E 10.43), a eliminao do
modelo 1 pode ser representada por:

(E 10.50)

1
1
0

se F1 >F 2
se F F 2
1

Por conseqncia, o critrio de informao considerando o modelo 2 como


verdadeiro pode ser escrito como:

(E 10.51)

|Z

(2)

1
v (1) |Z ( 2 )
v (2) (2)
1
1
1 1 1 |Z
2
v (1)
v ( 2)
2

que tambm pode ser calculada com o uso de uma planilha eletrnica (Excel). A
avaliao da condio de timo para o ponto x4 foi feita na regio 0<x41. Os valores

207

dos critrios considerando o modelo 1 como verdadeiro e considerando o modelo 2


como verdadeiro esto apresentados na Figura 10.6.
1.0

1.0

(A)

(B)

0.8

0.6

0.6

0.8

0.4
0.2

0.4
0.2

0.0
0.0

0.2

0.4

0.6

x4

0.8

1.0

0.0
0.0

0.2

0.4

0.6

0.8

1.0

x4

Figura 10.6 Valores dos critrio (A) |Z(1) , e (B) |Z( 2) para ={x4} entre 0
e 1 no Exemplo 10.2.
Considerando o modelo 1 verdadeiro, o critrio no indica que o modelo 2 seja
eliminado se x4<0,68. Contudo, para x40,68, o modelo 2 eliminado, o que
representado na Figura 10.6 pela descontinuidade na curva do critrio de informao.
Considerando o modelo 2 como verdadeiro, em uma pequena faixa de x4 prxima a 0,2
espera-se a eliminao do modelo 1, conforme indicado pela descontinuidade na curva
do critrio de informao na Figura 10.6. Contudo, exceto por esta pequena faixa, o
modelo 1 mostra flexibilidade suficiente para se ajustar aos dados gerados com o
modelo 2 para x4<0,59 e no ser eliminado. Para x40,59, espera-se que o modelo 1 seja
discriminado, conforme indicado pela descontinuidade na curva de informao na
Figura 10.6.
Neste exemplo simples, o ponto x4=1,00 constitui a soluo tima nica do
problema (frente de Pareto com um nico ponto), uma vez que nesta condio ambos os
critrios de informao so maximizados. Conforme indicado na Figura 10.6, ao
executar um experimento em x4=1,00, considerando o modelo 1 verdadeiro, espera-se
eliminar cerca de 76% da incerteza paramtrica total. Considerando o modelo 2
verdadeiro e realizando um experimento em x4=1,00, espera-se eliminar cerca de 83%
dos possveis estados da natureza originalmente considerados provveis.
Fim do Exemplo 10.2

208

Exemplo 10.3 Modelo cintico

Este exemplo foi tambm apresentado nos Captulos 8 e 9. Apenas por clareza,
os resultados apresentados nestes captulos referentes simulao dos experimentos
iniciais sero repetidos aqui. Os quatro modelos considerados esto ilustrados a seguir.

Modelo 1: y1
Modelo 2: y1

Modelo 3: y1

Modelo 4: y1

1(1) x1 x2
,
1 3(1) x1 4 (1) x2
1(2) x1 x2

(2)
3

x1 4 (2) x2

1(3) x1 x2

(3)
4

x2

y2

y2

,
2

y2

,
2

2(1) x1 x2
1 3(1) x1 4 (1) x2
2(2) x1 x2

(2)
3

x1

2(3) x1 x2

1(4) x1 x2
,
1 3(4) x1 4 (4) x2

(3)
3

y2

x1

2 (4) x1 x2
1 3(4) x1

Admite-se que o modelo correto o modelo 1, cujos parmetros so dados por


1(1)=0,1; 2(1)=0,01; 3(1)=0,1; e 4(1)=0,01. As varincias experimentais so
consideradas constantes e iguais a 0,35 e 2,3x10-2 para as variveis y1 e y2,
respectivamente. Cinco experimentos iniciais foram realizados, i.e., simulados com o
modelo 1 e acrescidos de uma oscilao aleatria normalmente distribuda com mdia
zero e varincia 0,35 e 2,3x10-2 para as variveis y1 e y2, respectivamente. Os resultados
esto apresentados na Tabela 10.2.
Com os experimentos da Tabela 10.2, os parmetros dos quatro modelos foram
estimados e a adequabilidade de cada modelo foi avaliada pelo teste chi-quadrado. Os
resultados esto apresentados na Tabela 10.3.
Tabela 10.2 Experimentos iniciais realizados no Exemplo 10.3.
Experimento

x1

x2

y1

y2

01

20,0

20,0

13,443

1,299

02

30,0

20,0

13,817

1,433

03

20,0

30,0

17,809

1,885

04

30,0

30,0

21,139

2,118

05

25,0

25,0

16,039

1,635

209

Tabela 10.3 Resultados da estimao de parmetros do Exemplo 10.3.


Modelo

4(m)

01

2(m)
1(m)
0,1311 0,0134

3(m)
0,1431

P(m)
0,0145 0,400

02

0,0743 0,0068

0,0233

0,0034 0,312

03

0,0281 0,0067

0,0017

0,0232

04

0,1162 0,0107

0,1187

0,0162 0,389

0,00

No caso estudado, o planejamento inicial 0 composto pelos cinco primeiros


experimentos apresentados na Tabela 10.2.

1.0
1.0

(A)

0.8

0.6

0.4

0.6

0.2
0.0

(B)

0.8

0.4
0.2

10

20

x1

30

40

50

10
60

20

30

40

50

60

0.0

10

x2

20

30

x1

40

50

10
60

20

30

40

50

60

x2

1.0

(C)

0.8

0.6
0.4
0.2
0.0

10

20

x1

30

40

50

10
60

20

30

40

50

60

x2

Figura 10.7 - Valores de (A) |Z(1) , (B) |Z( 2) , e (C) |Z( 4) ao longo da
malha experimental no Exemplo 10.3.
A avaliao do planejamento timo a ser realizado consiste em determinar a
prxima condio experimental, de forma a simultaneamente estimar os parmetros
precisos a discriminar os modelos. Considera-se que apenas um experimento deve ser
planejado; ou seja, ={x1,x2}. Para isto, a regio experimental foi avaliada entre
210

5,0x155,0 e 5,0x255,0, sendo cada varivel divida em 20 pontos igualmente


espaados. Logo, 400 condies experimentais compem a malha experimental
avaliada. A Figura 10.7 apresenta os resultados dos critrios, considerando cada modelo
como verdadeiro.
A descontinuidade dos critrios indica os pontos de discriminao dos modelos.
Conforme pode ser observado na Figura 10.7, quando se considera o modelo 1 como
verdadeiro, alguns pontos experimentais indicam que um modelo pode ser eliminado,
enquanto outros pontos experimentais indicam que at dois modelos podem ser
eliminados. Por outro lado, quando se considera os modelos 2 e 4 como verdadeiros,
espera-se que apenas um dos modelos seja discriminado com um experimento adicional.
Conforme pode ser observado na Figura 10.7, se o prximo experimento for
conduzido na regio de x255,0 (faixa limite superior) para qualquer valor de x1, o
ganho de informao esperado, independentemente de quem seja o modelo, prximo a
1. Ou seja, nessa regio h uma reduo significativa esperada das incertezas
paramtricas e/ou discriminao de modelos. Alm disto, os pontos de descontinuidade
das curvas na Figura 10.7 (regies onde se espera que a discriminao de modelos seja
atingida) difere pouco dos pontos em que no se espera atingir a discriminao de
modelos. Ou seja, mesmo em regies onde no deve ser esperada a discriminao de
modelos, o ganho de informao indicado pelos critrios bastante elevado, devido
reduo da elevada incerteza paramtrica.
A Tabela 10.4 apresenta os resultados obtidos com trs experimentos
seqencialmente planejados, escolhidos de acordo com o critrio Maximin. Nesta tabela
para cada um destes trs experientos, esto apresentados: (i) os valores dos critrios de

|Z

(1)

, |Z

( 2)

e |Z( 4) para o planejamento timo escolhido segundo o

critrio Maximin; (ii) os experimentos realizados na condio indicada pelo critrio


Maximin, (iii) a avaliao do ganho real de informao obtido com o experimento
realizado calculado com o dado experimental obtido na etapa (ii); e (iv) a nova
estimativa dos parmetros e adequabilidade dos modelos aps realizar , para trs
experimentos seqencialmente planejados.
Como o modelo 1 o modelo verdadeiro do problema, o valor do ganho real de
informao deve ser parecido com o valor esperado considerando o modelo 1
como verdadeiro |Z(1) .

211

Tabela 10.4 Resultados obtidos com o planejamento seqencial de trs experimentos


no Exemplo 10.3.
Critrio
(Maximin)
Experimento
Estimao de
parmetros
Critrio
(Maximin)
Experimento
Estimao de
parmetros
Critrio
(Maximin)
Experimento
Estimao de
parmetros

x1

x2

|Z

(1)

12,9
55,0
N
x1
06
12,9
Modelo 1(m)
01
0,1413
02
0,0537
03
04
0,0592
x1

x2

x2

|Z

( 2)

0,95
x2
55,0
2(m)
0,0143
0,0053
0,0059

|Z

(1)

55,0
55,0
N
x1
07
55,0
Modelo 1(m)
01
0,1074
02
0,0561
03
04
x1

|Z

39,2
55,0
N
x1
08
39,2
Modelo 1(m)
01
0,1033
02
0,0570
03
04
-

(1)

( 2)

( 4)

( 2)

( 4)

-y2
4,341
4(m)
0,0122
0,0007
-

|Z

0,68
y1
39,970
3(m)
0,1033
0,0176
-

0,96
y2
2,488
4(m)
0,0199
0,0005
0,0011

|Z

0,90
y1
43,523
3(m)
0,1084
0,0173
-

|Z

0,67
x2
55,0
2(m)
0,0104
0,0054
-

|Z

0,97
y1
24,859
3(m)
0,1523
0,0164
0,0486

|Z

0,92
x2
55,0
2(m)
0,0108
0,0054
-

( 4)

0,0
y2
3,987
4(m)
0,0109
0,0010
-

minm |Z ( m )

0,95


0,93
Modelo bom?
Sim
Sim
No
No

minm |Z ( m )

0,90


0,89
Modelo bom?
Sim
Sim
No
No

minm |Z ( m )
0,67


0,74
Modelo bom?
Sim
No
No
No

Conforme pode ser observado na Tabela 10.4, aps a realizao do experimento


06, apenas o modelo 4 discriminado. O ganho de informao mnimo esperado de
0,95; ou seja, espera-se que 95% dos possveis valores dos parmetros sejam
eliminados. O ganho real de informao avaliado aps realizar o experimento 6 foi de
0,93. Vale ressaltar que o critrio indicava de fato a discriminao de apenas um modelo
para o experimento escolhido, ou seja, no se esperava que houvesse discriminao de
dois modelos com este experimento.
Aps a realizao do experimento 07, o modelo 2 ainda permanece adequado.
Contudo, o ganho de informao esperado pelo critrio Maximin e o ganho de

212

informao real so respectivamente iguais a 0,90 e 0,89. Ou seja, ocorre reduo de


cerca de 90% dos possveis valores dos parmetros dos modelos nestas condies.
Ainda assim, o ponto indicado tambm no um ponto timo para discriminao de
modelos.
Por exemplo, ao considerar os resultados do Capitulo 09 para este exemplo, com
um nico experimento seria possvel realizar a discriminao de dois modelos. Contudo,
luz dos resultados apresentados no presente captulo, se a incerteza paramtrica pode
ser reduzida em cerca de 90%, mesmo que no sejam discriminados modelos, parece ser
razovel investir primeiramente na reduo da incerteza paramtrica antes de se buscar
a discriminao de modelos.
Para o experimento 08, o ganho de informao esperado era de 0,66 e o ganho
real foi de 0,73. Aps a realizao do experimento 08, o modelo 2 considerado
inadequado e o modelo 1 o nico modelo remanescente. A partir da, os experimentos
planejados visam a reduzir as incertezas paramtricas do modelo 1 e o critrio de
informao se reduz ao critrio do volume. A Figura 10.8 ilustra o ganho de informao
real aps a realizao dos experimentos 6-14 adicionais, bem como o logaritmo da
matriz de informao de Fisher para o modelo 1.
1.0

26
25

0.8

21

0.4

20

(1)

22

Log |J |

23

0.6

24

19

0.2

18
0.0

10

11

12

13

14

17

Experimentos
Figura 10.8 - Ganho de informao e log|J(1)| com experimentos adicionais no
Exemplo 10.3.
Pode ser observado que, aps a realizao do experimento 06, h uma reduo
na ordem do determinante de J(1) de cerca de 102 vezes, o que ilustra como o ganho de
213

informao prximo a 1 para este experimento. Para o experimento 07, h uma


reduo de cerca de 103 no valor do determinante de J(1), sendo novamente o ganho de
informao prximo a 1 para este experimento. Para o experimento 08, no h reduo
de ordem do valor do determinante to significativa quanto nos experimentos 06 e 07;
contudo, o ganho de informao com o experimento 08 elevado, uma vez que este
experimento elimina o modelo 2. Para os experimentos subseqentes, o valor do
determinante de J(1) no se reduz to significativamente em ordens de grandeza e o
ganho de informao reduzido consideravelmente, estabilizando-se em cerca de 0,20
aps o 10 experimento (o valor baixo do ganho de informao no experimento 13 devese a um ponto experimental obtido com elevado erro experimental).
Fim do Exemplo 10.3

10.6 Discusso e concluses


Conforme apresentado, o critrio de informao proposto concilia naturalmente
os procedimentos de estimao de parmetros e discriminao de modelos atravs da
medida de informao, que elimina ao mximo os possveis valores dos parmetros de
todos os modelos. Para utilizao como critrio de planejamento de experimentos,
preciso prever os dados experimentais com os modelos, tornando diversos cenrios
factveis e caracterizando o problema como multiobjetivo, tpico de problemas oriundos
de Teoria da Deciso.
Neste sentido, no se pode estabelecer a priori qual estratgia ou critrio
timo, contanto que tal estratgia ou critrio no seja claramente pior do que outra
estratgia ou critrio conhecido. Contudo, uma vez que o dado experimental de fato no
conhecido, dificilmente pode ser dito que um critrio superior a outro para todos os
problemas e vice-versa. Antes, os critrios devem ser avaliados quanto abrangncia
conceitual, informao e domnio do pesquisador sobre o resultado, facilidade de
implementao, funcionalidade do critrio, robustez numrica, entre outros.
A avaliao do presente critrio segue a mesma linha da argumentao
apresentada no Captulo 9. O novo critrio estabelece um problema multiobjetivo,
diferente de alguns critrios propostos na literatura (HILL et al., 1968, ATKINSON,
2008), mas em concordncia com trabalhos recentes apresentados (DONCKELS et al.,
2010). Como complicao, a etapa de re-estimao de parmetros estabelece uma
dificuldade numrica, devido ao esforo computacional adicional necessrio. Para
214

alguns modelos, cuja estimao de parmetros difcil por causa de instabilidades


numricas, o procedimento recursivo de re-estimao dos parmetros de modelos pode
levar a problemas numricos inevitveis. A Seo 10.4.3 apresenta uma alternativa para
este problema, sendo a adequabilidade dos modelos avaliada sem a re-estimao de
parmetros; contudo, neste caso, a avaliao da flexibilidade dos modelos para ajustar
novos dados experimentais no pode ser feita.
Por outro lado, como boas estimativas inicias para os valores dos parmetros
esto disponveis, a etapa de re-estimao de parmetros pode ser factvel quando se
utilizam mtodos que empregam derivadas, como os mtodos de Gauss-Newton.
Acredita-se que o presente critrio apresenta abrangncia conceitual superior aos
critrios apresentados na literatura. O fato de estabelecer um problema multiobjetivo
surge do desconhecimento do dado experimental e do tratamento do problema sob a
tica da Teoria da Deciso. Alm disto, o critrio normalizado e informativo,
estabelecendo um valor que tem significado para o experimentador e fornece uma
expectativa do resultado que o experimentador pode ter.
Vale ressaltar que o critrio do volume para estimao de parmetros precisos
surge naturalmente. Parece ser, portanto, uma mtrica bastante adequada, deduzida a
partir de uma medida de informao. As demais mtricas propostas apresentam
interpretaes geomtricas referentes forma elptica da regio de confiana das
incertezas paramtricas (FRANCESCHINI e MACHIETTO, 2008a) e no so obtidas a
partir de medidas de informao, embora possam tambm ser utilizadas para este fim.
A conciliao dos diferentes objetivos de estimao de parmetros e
discriminao de modelos parece bastante razovel, quando o objetivo se concentra em
ganhar informao sobre os modelos e seus parmetros. Conforme demonstrado no
Exemplo 02, quando a incerteza paramtrica elevada, o critrio de informao pode
escolher pontos que no so pontos de discriminao, mas de estimao precisa dos
parmetros. Esta mesma argumentao utilizada por DONCKELS et al. (2010). Os
autores argumentam que no parece razovel investir na discriminao de modelos em
casos nos quais os parmetros so conhecidos com grande impreciso. Desta forma,
estes autores propuseram maximizar a reduo na incerteza paramtrica, pela utilizao
do critrio do volume das regies de confiana em experimentos iniciais para melhorar
as incertezas paramtricas. Em concordncia com estes autores, os resultados obtidos
nesta tese conciliam naturalmente os procedimentos de discriminao de modelos e de
estimao de parmetros precisos, sem necessidade de utilizao de critrios heursticos.
215

Na medida em que a reduo na incerteza paramtrica no to elevada com


experimentos adicionais, o critrio procura escolher pontos de discriminao que
eliminam regies de confiana de modelos inadequados; ou seja, inicialmente
estabelece-se a estimao precisa e em seguida, buscam-se pontos de discriminao para
eliminao de modelos. Se a discriminao no possvel, o critrio busca a estimao
precisa dos modelos remanescentes. Restando apenas um modelo, retoma-se a
estimao precisa.
Quando resta apenas um modelo, pode-se estabelecer um critrio de parada, de
acordo com o apresentado por SANTOS et al. (2002). De acordo com os autores, podese simular diversos experimentos com o modelo e avaliar qual a preciso paramtrica
esperada. Assim, possvel tomar uma deciso quanto relao custo/benefcio de
melhorar a preciso paramtrica atravs da contnua experimentao. Porm, se mais de
um modelo continuar provvel, o estabelecimento de um critrio de parada, avaliandose o resultado esperado em diversos experimentos possveis segundo os diferentes
modelos admissveis pode ficar computacionalmente muito complexo.

216

11 MINIMIZAO

DA

INCERTEZA

FOCANDO

PREDIO
RESUMO:
Este captulo apresenta um critrio de informao, visando minimizao da
incerteza com foco nas predies feitas com o modelo. O princpio semelhante ao
apresentado no Captulo 10; contudo, os estados da natureza considerados no so os
modelos, mas as respostas e os respectivos intervalos de confiana gerados com tais
modelos. Seja Z(X)={z1(X),z2(X),...,zNZ(X)} o conjunto de variveis que so obtidas com
os modelos. Aps realizar um conjunto inicial de experimentos 0, considera-se que um
modelo prediga uma varivel zi(X) para uma condio experimental X dentro do
intervalo zci( m ) X zi( m ) P X u zi( m ) P , zi( m ) P X u zi( m ) P , onde: zi( m ) P X o
valor predito como o modelo m, zi( m ) P a varincia de predio do modelo m (que j
contabiliza a varincia experimental) associada varivel zi, e u um valor que indica
o limite do intervalo de confiana. Todos os possveis valores de zi(m) dentro do
intervalo so possveis estados da natureza, de acordo com o modelo m. Todos os
possveis valores de zi de acordo com os M modelos seriam dados pela unio dos
conjuntos de predies com os modelos; ou seja, zci {zci(1) zci(2) zci(3) .... zci( M ) } .
O nmero de elementos dentro do conjunto zci denominado por Nelem,i(0) (este
nmero infinito para intervalos contnuos). Aps realizar um conjunto de
experimentos , o ganho de informao referente varivel zi dado pela porcentagem
de estados da natureza que foram eliminados. Seja Nelem,i(X,0+) o nmero de
elementos possveis da varivel zi, segundo predio feita com todos os modelos para
uma dada condio X. Logo, o ganho de informao referente varivel zi dado por
N elem ,i X , 0
1
. Contudo, isto pode ser representado pela razo entre os
0
N
X
,

,
elem
i

volumes dos intervalos de confiana que se obtm aps realizar e que se tinha em 0;

zi X , 0
ou seja, 1

ziT X , 0

, onde ||.|| indica o tamanho do intervalo de confiana.

217

Quando se consideram diversas variveis, a reduo da porcentagem de incerteza


associadas todas as variveis (ou seja, o ganho de informao com um experimento
Nzi
zi X , 0
) fica na forma 1 wi
i 1
ziT X , 0

, onde wi um peso dado

varivel zi.
Vale lembrar que, semelhante ao apresentado no Captulo 10, o conhecimento
que o pesquisador tinha em 0 podia no ser correto. Portanto, este conhecimento
tambm deve ser avaliado com os parmetros estimados em 0+, de forma que o
ganho de informao seja sempre positivo. Se o interesse no for restrito a uma
condio especfica, mas ao longo de uma faixa experimental (X0,XF), o critrio de
NZ

zi X , 0
'
informao pode ser escrito como 1 wi wi X , zi
dX ,
i 1

ziT X , 0

onde

w X dX 1 um peso dado varivel zi ao longo da faixa experimental.


'
i

O ganho de informao proposto uma funo normalizada e que pode ser


interpretada facilmente pelo pesquisador. Contudo, para utilizao como critrio de
planejamento, necessrio prever o dado experimental ao executar um conjunto de
experimentos . Isto pode ser feito utilizando os modelos para prever o dado
experimental; isto , gerando os resultados em e considerando estes resultados como
dados experimentais. Com isto, o problema resulta em M cenrios possveis, onde M
o

nmero
Z
| Z (1)

de

modelos.

As

funes

de

informao

ficam

, |ZZ ( 2 ) , |ZZ ( 3) ,..., |ZZ ( M 1) , |ZZ ( M ) . O resultado deste problema multiobjetivo

dado pela frente de Pareto, conjunto de planejamentos experimentais no dominados.


O nmero de solues , na maior parte dos casos, infinito. A escolha de um ponto
especfico pode ser feita de acordo com o critrio Maximin ou Bayesiano, dentre
outros.

11.1 Objetivos
O principal objetivo deste captulo estender a funo de informao
apresentada no Captulo 10 para problemas em que o objetivo minimizar a incerteza
de predio. O uso deste critrio interessante quando no h interesse nos valores dos
parmetros do modelo, mas apenas na predio feita com tais modelos.
218

11.2 Introduo
Este captulo estende os conceitos apresentados no Captulo 10 para problemas
em que o foco no o conhecimento dos modelos, mas sim a predio feita com tais
modelos. Vale relembrar apenas alguns conceitos importantes apresentados no Captulo
3 para contextualizar a funo de informao obtida neste captulo. Admite-se que um
conjunto de experimentos iniciais 0 foi realizado, sendo estimados os parmetros de M
modelos que se adquam aos dados experimentais. A estimao de parmetros leva
matriz de covarincias das incertezas paramtricas para cada modelo m, dada por V(m).
A matriz de covarincias das incertezas de predio pode ser escrita como:

(E 11.1)

VZ( m ) P B ( m ) V( m ) B ( m )T VZ

onde VZ(m)P a matriz de covarincias das incertezas de predio feitas com o modelo
m, B(m) a matriz de sensibilidade e VZ a matriz de covarincias das incertezas
experimentais. Da expresso acima, fica claro que a incerteza de predio a soma da
incerteza associada predio do modelo e incerteza experimental. Logo, o modelo
prediz um dado sempre mais incerto do que o dado experimental.
O intervalo de confiana de uma varivel zi, de acordo com a predio do
modelo m pode ser dado por:

(E 11.2)

zci( m ) X zi( m ) P X t Ngl ( m ) , zi( m ) P , zi( m ) P X t Ngl ( m ) , zi( m ) P

onde: zi( m ) P X o valor predito como o modelo m, zi( m ) P o desvio padro de


predio feito com o modelo m (resultado da incerteza paramtrica somada incerteza
experimental) associada varivel zi; e t N Np( m ) , um valor obtido da distribuio tStudent com Ngl(m)=NExpNy-Np(m) graus de liberdade e nvel de confiana .

A partir das hipteses geralmente adotadas de distribuio normal dos dados e dos

parmetros, o intervalo de confiana no seria descrito por uma distribuio t-Student, mas sim por uma
distribuio normal. A considerao da distribuio t-Student uma forma conservadora de representar a
incerteza de predio, uma vez que os intervalos calculados com a distribuio t-Student so superiores
aos intervalos obtidos com a distribuio normal de probabilidades.

219

Qualquer elemento zi dentro do intervalo especificado na Equao (E 11.2)


considerado um possvel estado de zi.

11.3 Estendendo o conceito para problemas focados na


predio
11.3.1 Extenso rigorosa

A mesma lgica apresentada pelos Postulados 9.1 e 10.1. A idia bsica destes
postulados adaptada para quando o interesse a predio feita com os modelos, ou
seja:
Postulado 11.1
Uma medida do ganho de informao ao executar um plano experimental
pode ser dada pela porcentagem do nmero de estados da natureza que eram
considerados possveis antes de executar e foram eliminados aps executar . Se o
objetivo de um pesquisador minimizar a incerteza de predio feita com os modelos,
deve-se minimizar o conjunto de possveis valores de predio.
Considera-se aqui que os possveis estados da natureza so as possveis respostas
do modelo; ou seja, as variveis Z. Neste caso, a funo de ganho de informao com
um conjunto de experimentos com base nas variveis experimentais Z={z1,z2,,zNz}
definida como Z(). Admite-se que tenham sido realizados experimentos iniciais 0,
permitindo estabelecer regies de confiana das incertezas sobre as variveis Z. Um
novo conjunto de experimentos realizado, diminuindo as incertezas sobre Z. Logo,
segundo o Postulado 1, o ganho de informao pode ser escrito como:

(E 11.3)

S| Z S| Z|
S| Z

onde: S|(Z) representa a incerteza total sobre a varivel Z antes de realizar o conjunto de
experimentos , avaliada com base no conhecimento que se dispe em ; e S|(Z|)
representa a incerteza total sobre Z aps realizar . Estabelecendo a mesma importncia
para cada valor predito com os modelos, a incerteza sobre as variveis Z pode ser obtida
pela unio das incertezas de predio de cada modelo.
220

Um primeiro exemplo ilustrativo apresentado a seguir para ilustrar a extenso


do critrio. Nos exemplos ilustrativos (Exemplos 11.1-11.5) o conhecimento que o
pesquisador tinha antes de realizar os experimentos em o mesmo que ele imaginava
ter em . Assim, nos exemplos ilustrativos, os experimentos em no revelaram que o
pesquisador sabia menos do que imaginava saber antes de realizar .
Exemplo Ilustrativo 11.1 Ilustrao geomtrica da medida de ganho informao

A Figura 11.1 representa as regies de confiana das incertezas de predio de


duas variveis z1 e z2 para uma dada condio experimental.
z2(1)

z2(2)

(A)

(B)

Modelo 3

Modelo 3

Modelo 2

Modelo 2

Modelo 1

Modelo 1

z1(1)
z2(3)

z1(2)

(C)
Possveis estados da
natureza eliminados

Possveis estados da
natureza restantes

z1(3)
Figura 11.1 Ilustrao das regies de confiana das incertezas de predio para trs
modelos. (A) com os experimentos em 0; (B) com os experimentos adicionais em ; e
(C) ilustrao dos possveis estados da natureza eliminados e restantes aps .
Neste exemplo, trs modelos so provveis, conforme ilustrado na Figura 11.1
(z1 e z2 poderiam ser, por exemplo, converso e seletividade a uma dada condio
221

experimental). Por simplicidade, neste exemplo considera-se que o conhecimento que o


experimentador tinha em 0 era idntico ao que o experimentador imaginava ter em 0.
A Figura 11.1A ilustra as incertezas de predio com os modelos antes de
realizar , enquanto a Figura 11.1B ilustra as incertezas de predio aps se realizar e
a Figura 11.1C ilustra a sobreposio das Figura 11.1A e Figura 11.1B.
O ganho de informao, de acordo com a Equao (E 11.3), est associado
porcentagem de estados da natureza eliminados, em relao incerteza total que se
tinha na Figura 11.1A, representados pela regio achurada na Figura 11.1C.
Fim do Exemplo Ilustrativo 11.1

Agora, possvel estender o critrio proposto pelo Postulado 11.1, focando na


minimizao da incerteza de predio. Seja o vetor de todos os possveis valores das
variveis preditas com um modelo m em um condio experimental (ou ao longo de
uma faixa experimental (X0,XF)) definido como ZC(m). Se os valores preditos com os
modelos m (m=1,M) so considerados equiprovveis, ento o conjunto total de variveis
preditas com os modelos dado pela unio dos conjuntos de variveis preditas com os
modelos: ZC ZC (1) ZC (2) ZC (3) .... ZC ( M ) . O nmero de elementos em ZC

definido como Nelem,C (este nmero infinito para intervalos contnuos das variveis).
(No Exemplo Ilustrativo 11.1, o conjunto ZC em 0 seria dado pela unio das regies de
confiana apresentadas na Figura 11.1A). Logo, o critrio de informao gerado pelo
Postulado 11.1 e em conformidade com os conceitos apresentados no Captulo 10
estabelece que o ganho de informao associado a um conjunto de experimentos pode
ser dado por:

(E 11.4)

N elem ,C

N elem,C

k 1

wC ,k , ZGk

onde: wC,k um peso dado eliminao do estado da natureza ZCk; e , ZCk uma
funo binria, que assume 1 se o estado da natureza ZC,k eliminado com os
experimentos em e 0 no caso contrrio.
Um segundo exemplo ilustrativo apresentado a seguir para fixar o significado
do critrio.

222

Exemplo Ilustrativo 11.2 Ilustrao para variveis discretas

Um engenheiro est avaliando a operao de um reator industrial em uma dada


condio experimental. O engenheiro realizou alguns experimentos iniciais 0 e obteve
trs modelos para descrever o comportamento do sistema. As variveis de resposta do
modelo que interessam ao engenheiro so Z={z1,z2}, sendo z1 o nmero de bateladas
necessrio para atingir um dado volume de produo (Nbat) e z2 a indicao de que o
produto satisfaz uma especificao desejada (Esp). Estas variveis so avaliadas para
uma dada condio experimental investigada pelo engenheiro. Neste exemplo, cada um
dos trs modelos prediz duas possveis respostas, correspondendo s regies de
confiana das incertezas de predio dos modelos. Os possveis valores das variveis, de
acordo com os trs modelos na condio experimental que o engenheiro avalia a
operao do reator, esto apresentados na Figura 11.2.

{z1(1),z2(1)} ={Nbat;Esp}= {3; Sim}


Modelo 01 ou
{z1(1),z2(1)} ={Nbat;Esp}= {4; Sim}

ZC(1)={{3; Sim};{4; Sim}}


ZC(2)={{3;No},{4;Sim}}
ZC(3)={{4;Sim},{5;Sim}}

{z1(2),z2(2)} ={Nbat;Esp}= {3;No}


Modelo 02 ou
{z1(2),z2(2)} ={Nbat;Esp }={4;Sim}
{z1(3),z2(3)} ={Nbat;Esp}= {4;Sim}
Modelo 03 ou
{z1(3),z2(3)} ={Nbat;Esp }= {5;Sim}

ZC=ZC(1)C U ZC(2)C ZC(3)


ZC={{3;Sim},{4;Sim},{3;No},{5;Sim}}
Nelem,C(0)=4

Figura 11.2 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental: ilustrao da obteno de ZC e do nmero de elementos de
ZC.
Conforme pode ser observado na Figura 11.2, uma das possveis condies
experimentais {4,Sim} predita pelos trs modelos. O conjunto ZC dado pela unio de
todos os conjuntos possveis preditos pelos modelos. O conjunto ZC composto por
quatro possveis condies ZC={Z1,Z2,Z3,Z4}. A primeira condio Z1={3,Sim}, a
segunda condio ZC2={4,Sim}, e assim por diante. O nmero total de condies
possveis Nelem,C igual a 4.
Agora, considera-se que um conjunto de experimentos tenha sido realizado.
Como conseqncia, cada modelo passa a predizer uma nica condio possvel,
conforme apresentado na Figura 11.3.
223

ZC(1)={{3; Sim}}

Modelo 01 {z1(1),z2(1)} ={Nbat;Esp}= {3; Sim}

ZC(2)={{3;No}}
ZC(3)={{4;Sim}}
ZC=ZC(1)C U ZC(2)C ZC(3)

Modelo 02 {z1(2),z2(2)} ={Nbat;Esp}= {3;No}

ZC={{3;Sim},{3;No},{4;Sim}}

(3)

(3)

Modelo 03 {z1 ,z2 } ={Nbat;Esp}= {4;Sim}

Nelem,C(0+ )=3

Figura 11.3 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental aps realizar .
Aps realizar , o nmero de possveis respostas igual a 3. Logo, o ganho de
informao com dado pela porcentagem de estados da natureza eliminados, de acordo
com a Equao (E 11.3), pode ser escrito como:

(E 11.5)

1
1
0 0 0 1
4
4

ou Z

1
1
4 3
4
4

Fim do Exemplo Ilustrativo 11.2

Para variveis contnuas, geralmente considera-se que as regies de confiana


das incertezas de predio so dadas por hiper-elipsides (veja Figura 11.1). O nmero
de elementos que compem os hiper-elipsides infinito. Contudo, embora infinito, o
nmero de elementos proporcional ao volume das hiper-elipsides. Logo, a razo
entre o nmero de elementos eliminados pelo nmero de elementos iniciais pode ser
dada pelo volume dos hiper-elipsides eliminado, dividido pelo volume das hiperelipsides originais.
Aplicar a funo de informao apresentada envolve, portanto, determinar a
unio de hiper-elipsides. Contudo, a proposta do critrio de informao segundo esta
forma para variveis contnuas (que constituem a maioria dos problemas de interesse)
pode ser complexa e no funcional devido a alguns fatores:
determinar volumes de unio das regies de confiana das incertezas
dadas por hiper-elipsides no espao das variveis bastante complexo;
as regies de confiana das incertezas de predio para modelos no
lineares podem diferir significativamente de hiper-elipsides, de forma que
224

um tratamento mais rebuscado para contemplar o problema considerando


hiper-elipsides pode no ser vlido para modelos reais de interesse;
na forma apresentada do critrio de informao, diminui-se o volume de
hiper-elipsides. Contudo, esta diminuio pode estar associada
diminuio da incerteza de variveis em que o pesquisador no tem
interesse. Portanto, parece razovel ter um fator de ponderao para cada
varivel.
Devido a estes fatores, parece razovel estabelecer algumas simplificaes para
tornar o critrio mais til e funcional.
11.3.2 Simplificando o critrio

Ao invs de considerar hiper-elipsides, pode-se considerar que a incerteza de


predio de cada varivel independentemente das incertezas de predio das demais
variveis. Isto desvincula as variveis e permite ponderar a diminuio da incerteza das
variveis para priorizar variveis de interesse. Desta forma, ao invs de considerar os
volumes de incerteza das regies de confiana dos modelos, considera-se o volume de
incerteza dos intervalos de confiana.
Suponha que um conjunto inicial de experimentos 0 tenha sido realizado. Para
as Nz variveis, admite-se que cada modelo prediga a varivel zi em dados intervalos de
confiana. Contudo, conforme comentado no Captulo 10, um novo conjunto de
experimentos pode aumentar a incerteza sobre uma varivel, indicando que o
pesquisador sabia menos sobre a varivel do que imaginava saber. Logo, a incerteza
total associada a uma varivel para um conjunto de experimentos iniciais 0 deve
tambm ser avaliada com o conhecimento adicional que o pesquisador adquiriu ao
realizar . Assim, o ganho de informao fica sempre positivo. Logo, ao se realizar um
novo conjunto de experimentos , sempre ocorre um ganho de informao referente s
variveis zi.
Definindo em relao varivel zi:
zci X , 0 - conjunto de possveis valores de zi que o pesquisador
imaginava ter em 0 para uma dada condio X;

zi X , 0 - volume de incerteza que o pesquisador imaginava ter em

0 para uma dada condio X;

225

zci|Z X , 0 - conjunto de possveis valores de zi que o pesquisador de


fato tinha em 0 para uma dada condio X;

zi|Z X , 0 - volume de incerteza que o pesquisador de fato tinha em

0, para uma dada condio X;


zciT X , 0 - conjunto das incertezas totais 0 para uma dada condio X;

ziT X , 0 - volume de incerteza total em 0 para uma dada condio

X;
zci X , 0 - conjunto das incertezas totais em 0+, para uma dada
condio X;

zi X , 0 - volume de incerteza que o pesquisador tem em 0+,

para uma dada condio X.


Ao conjunto zci est associado um volume e o tamanho do intervalo de
confiana. Para um nico modelo, o intervalo de confiana contnuo e o volume do
intervalo de confiana a distncia do maior ao menor valor, na forma:

(E 11.6)

zi( m ) 2 t Ngl ( m ) , z(im ) P

Contudo, para mltiplos modelos, o conjunto zci pode ser contnuo por partes,
ento, o volume associado a este conjunto o resultado da soma dos tamanhos dos
intervalos que compem zci. Pelos mesmos argumentos apresentados no Captulo 10, a
incerteza total que o pesquisador tinha em 0 dado pela unio dos conjuntos de
incerteza que o pesquisador imaginava ter em 0 e de fato tinha em 0, ou seja:
(E 11.7)

zciT X , 0 zci X , 0 zci| Z X , 0

Esta unio pode ser obtida da seguinte forma:

(E 11.8)

zciT X , 0 zci X , 0 zci| Z X , 0 zci X , 0 zci|Z X , 0

Esta mesma relao vlida para os volumes de incerteza em zi, ou seja:

226

(E 11.9) ziT X , 0 zi X , 0 zi|Z X , 0 zi X , 0 zi|Z X , 0

De forma anloga apresenta no Captulo 10, o volume total de incerteza de zi


em 0 est contido entre dois limites:

(E 11.10) max zi X , 0 , zi|Z X , 0 ziT X , 0 zi X , 0 zi|Z X , 0

O limite inferior indica o caso em que um dos conjuntos de incertezas que o


pesquisador imaginava ter em 0 ou de fato tinha em 0 est contido no outro. O limite
superior indica o caso em que os conjuntos de incerteza que o pesquisador imaginava ter
em 0 ou de fato tinha em 0 no apresentam nenhum ponto de interseo.
Seja zci,m o conjunto dos possveis valores preditos para a varivel zi com o
modelo m, dentro de um intervalo de confiana, conforme apresentado na Equao (E
11.2). Quando se dispe de mais de um modelo, os valores possveis de zi so resultado
da unio dos conjuntos de zci(m), ou seja, zci {zci(1) zci(2) zci(3) .... zci( M ) } , onde o
sobre-escrito zci(m) indica o conjunto de todos os possveis valores de zi(m). Logo, o
critrio de informao de acordo com a Equao (E 11.11) pode ser escrito como:

(E 11.11)

Nz

Z wi
i 1

N elem ,i

1
N elem,i

, zc
j 1

i, j

onde Nelem,i o nmero de elementos que a varivel zi pode assumir e wi um peso dado
varivel zi. Os termos no numerador e denominador geralmente so infinitos, mas sua
razo finita. Esta razo dada pela diviso entre o volume de incerteza aps realizar
os experimentos em pelo volume de incerteza antes de realizar os experimentos em ,
ou seja:

(E 11.12)

Nz

i 1

Z wi 1

zi X , 0

ziT X , 0

que pode ser escrito como:

227

(E 11.13)

Nz

i 1

Z 1 wi

zi X , 0

ziT X , 0

Quando o interesse no uma nica condio experimental X, mas sim uma


faixa (X0,XF), pode-se obter um valor mdio integrado da Equao (E 11.13), na forma:

(E 11.14a)

XF
Nz

zi X , 0
1 wi wi ' X
dX
i 1

ziT X , 0
X0

onde:
Nz

(E 11.14b)

w 1
i

i 1

XF

(E 11.14c)

w ' X dX 1
i

X0

Alm disto, o critrio de parada pode ser feito comparando-se as incertezas


referentes s variveis de interesse com as incertezas mnimas que podem ser obtidas, j
que, quando o erro paramtrico tender a zero, a incerteza de predio tende incerteza
experimental (na Equao (E 11.1), se V(m)0, VZ( m ) P VZ ). Logo, pode-se avaliar a
incerteza mxima que pode ser eliminada comparando-se a incerteza de predio com a
incerteza de predio experimental.
11.3.3 Calculando a incerteza mnima e a quantidade de incerteza que pode
ser eliminada

Definindo Smin,i como a incerteza mnima que possvel alcanar para uma
varivel i, pode-se escrever que:

(E 11.15)

S min,i wi' X ziexp X dX

onde ||ziexp(X)|| representa o tamanho da incerteza experimental na condio X, que


pode ser calculado como:

228

(E 11.16)

ziexp ( X ) 2 u zi

onde u um nmero obtido a partir da distribuio normal com nvel de confiana e


zi o desvio-padro experimental da varivel zi. Portanto, a porcentagem mxima de
incerteza que pode ser eliminada (Sextra) pode ser calculada como:

(E 11.17)

Nz

S min,i

i 1

S1i

Sextra 1 wi

onde S1i indica a incerteza total referente varivel zi em uma condio de


experimentos j realizados 0, podendo ser obtida como:

(E 11.18)

S1i wi' X zi X , 0 dX

Logo, possvel definir um nvel de tolerncia abaixo do qual a incerteza


paramtrica pequena comparada incerteza experimental. Portanto, pode ser
conveniente parar os experimentos se:
(E 11.19)

Sextra

Assim, se a condio acima for satisfeita, o ganho da preciso paramtrica ao


executar novos experimentos baixo e, portanto, os experimentos podem ser
interrompidos ou a preciso experimental deve ser melhorada (por exemplo, pela
utilizao de equipamentos mais precisos).
Dois exemplos ilustram a aplicao dos critrios de informao. Por
simplicidade, admite-se em ambos os exemplos que o conhecimento que o pesquisador
tinha em 0 o mesmo que ele imaginava ter em 0.
Exemplo ilustrativo 11.3 Ilustrao do critrio simplificado para variveis discretas

Este exemplo ilustra como a simplificao proposta afetaria os resultados do


Exemplo Ilustrativo 11.2. Trata-se, portanto, da mesma formulao original do Exemplo
Ilustrativo 02. H trs modelos possveis que explicam dados experimentais iniciais
229

obtidos em um conjunto de experimentos 0. Cada modelo prediz dois possveis valores


das variveis z1 e z2, sendo estas o nmero de bateladas (Nbat) e a especificao do
produto Esp, respectivamente. Inicialmente, admite-se o mesmo cenrio ilustrado na
Figura 11.2. Contudo, para anlises das incertezas, as variveis so desvinculadas e seus
possveis valores tratados independentemente das demais variveis. Com isto, monta-se
um conjunto de possveis valores de z1 e possveis valores de z2, dados respectivamente
por zc1 e zc2, conforme ilustrado na Figura 11.4.
{z1(1),z2(1)} ={Nbat;Esp}= {3; Sim}
Modelo 01 ou
{z1(1),z2(1)} ={Nbat;Esp}= {4; Sim}

zc1={3;4;5}
Nelem,1(0)=3

{z1(2),z2(2)} ={Nbat;Esp}= {3;No}


Modelo 02 ou
{zi(2),z2(2)} ={Nbat;Esp }={4;Sim}

zc2={No,Sim}
Nelem,2(0)=2

{z1(3),z2(3)} ={Nbat;Esp}= {4;Sim}


Modelo 03 ou
{z1(3),z2(3)} ={Nbat;Esp }= {5;Sim}

Figura 11.4 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental, ilustrao da obteno de zc1 e zc2 e do nmero de
elementos no Exemplo Ilustrativo 11.3.
Aps realizar um conjunto de experimentos , cada modelo passou a predizer
apenas uma possvel resposta. As incertezas esto representadas na Figura 11.5.

Modelo 01 {z1(1),z2(1)} ={Nbat;Esp}= {3; Sim}

zc1={3,4}
Nelem,1(0+ )=2

Modelo 02 {z1(2),z2(2)} ={Nbat;Esp}= {3;No}


zc2={No,Sim}
Nelem,2(0+ )=2
Modelo 03 {z1(3),z2(3)} ={Nbat;Esp}= {4;Sim}

Figura 11.5 Possveis valores de variveis preditas com os trs modelos para uma
dada condio experimental aps realizar no Exemplo Ilustrativo 11.3.

230

Comparando a Figura 11.5 com a Figura 11.4, um valor possvel da varivel z1


foi eliminado (z1=5). Em relao varivel z2, nenhum possvel valor foi eliminado.
Considerando que ambas as variveis so igualmente importantes, pode-se estabelecer
que w1=w2=1/2. Logo, o ganho de informao com os experimentos em , de acordo
com a Equao (E 11.13) dado por:

(E 11.20)

1 1
2 3

1 1
2 2

Z 3 2 2 2

1
6

Segundo o critrio proposto, em relao varivel z2, o ganho de informao foi


nulo. Isto ocorre porque a varivel z2 continua podendo assumir os mesmos dois valores
que podia assumir antes de realizar , embora tenham sido eliminadas algumas
combinaes {z1,z2}. Em relao varivel z1, um tero dos possveis valores que esta
varivel podia assumir foi eliminado com . Logo, em relao z1, o ganho de
informao foi de 1/3; contudo, como foi dado um peso de w1=1/2, o ganho de
informao final foi de 1/6.
Pode-se observar que o ganho de informao obtido de acordo com a Equao
(E 11.20) inferior ao obtido de acordo com a Equao (E 11.5). Isto ocorre uma vez
que o conjunto de experimentos eliminou combinaes entre as variveis z1 e z2.
Contudo, o critrio apresentado na Equao (E 11.14) no avalia combinaes
eliminadas, mas somente possveis valores que as variveis podiam assumir e que foram
eliminados ao realizar .
Fim do Exemplo Ilustrativo 11.3

Mais um exemplo ilustrativo apresentado a seguir para ilustrar a aplicabilidade


do critrio a variveis contnuas.
Exemplo Ilustrativo 11.4 Ilustrao do critrio simplificado para variveis contnuas

Sejam trs modelos quaisquer que se adqem aos dados experimentais obtidos
em um conjunto de experimentos iniciais 0. Para uma condio especfica X, uma
varivel zi apresenta os intervalos de confiana ilustrados na Figura 11.6. O conjunto de
todos os possveis valores de zi dado pela unio dos conjuntos de zi(m) predito com os
modelos. No caso da Figura 11.6, trata-se de um conjunto contnuo por partes. O
volume de cada parte contnua pode ser calculado como o maior valor do intervalo
231

menos o menor valor do intervalo. Somando o volume de cada parte contnua, tem-se o
volume total de zci(X,0), representado por ||zi(X,0)||. O nmero de elementos que
pertencem ao conjunto zi proporcional ao volume de incertezas de zi (Figura 11.6).

1,7

zci(3)(X)

1,5
1,4

zci(2)(X)

Nelem,i(X,0) ||zi(X,0)||

zci(X,0)

1,2

||zi(X,0)||=(1,7-1,5)+(1,4-0,8)

1,1

||zi(X,0)||=0,8

zci(1)(X)
0,8

Figura 11.6 Possveis valores de zi preditos com trs modelos, zci,1, zci,2 e zci,3;
obteno de zci como unio dos conjuntos e nmero de elementos em zci proporcional
ao tamanho do intervalo.

1,65
1,55

zci(3)(X)

zci(X, +)
0

Nelem,i(X,0+) ||ziT(X,0+)||

||ziT(X,0+)||=(1,65-1,55)+(1,15-0,85)

1,15

zci(1)(X)

||ziT(X,0+)||=0,40

0,85

Figura 11.7 Possveis valores de zi preditos com trs modelos, zci,1, zci,2 e zci,3;
obteno de zci como unio dos conjuntos e nmero de elementos em zci proporcional
ao tamanho do intervalo aps realizar .

232

Realizando-se um conjunto de experimentos , a incerteza de predio


reduzida. Neste exemplo, o modelo 2 eliminado com o novo conjunto de experimentos
. A Figura 11.7 apresenta uma ilustrao da reduo da incerteza.
Novamente, o nmero de pontos que pertencem a zi proporcional ao volume de
incerteza de zi. Segundo a analogia com a Equao (E 11.13), tem-se que a porcentagem
de informao eliminada com os experimentos em referente varivel zi dada por:

(E 11.21)

zi X , 0
N elem ,i X , 0
1
1

N elem ,i X , 0
zi X , 0

Portanto, pode-se determinar a porcentagem de elementos em zi que foram


eliminados com um novo conjunto de experimentos , o que pode fornecer a medida de
ganho de informao de .
Substituindo os valores numricos, tem-se que o ganho em relao varivel zi
dado por:

(E 11.22)

zi X , 0
1

zi X , 0

0, 40
0,50
1
0,80

No caso ilustrado, o ganho em relao varivel zi foi de 0,5; ou seja, 50% dos
valores possveis que a varivel zi podiam assumir foram eliminados com os
experimentos em .
Fim do Exemplo Ilustrativo 11.4

Alguns aspectos devem levar os critrios focados na predio a resultados


diferentes dos critrios cujo objetivo principal obter informaes sobre os modelos.
Primeiro, importante relembrar que o modelo sempre prediz as variveis de resposta
com impreciso superior experimental. Isto fica claro da Equao (E 11.1), onde a
incerteza de predio resultado da soma da incerteza associada ao erro paramtrico
com a incerteza experimental. Alm disto, para a maioria dos casos, os modelos
predizem pelo menos alguns valores das variveis de resposta similares. Por exemplo,
para um sistema com dois modelos, se as predies feitas com um modelo estiverem
contidas dentro da predio feita com outro modelo, o interesse concentra-se
233

basicamente em reduzir a impreciso associada ao pior modelo. Ou seja, no h grande


interesse em melhorar a preciso paramtrica do modelo cujas predies esto contidas
no outro modelo. Por fim, o que importa para o critrio de informao Z() so as
faixas em que os valores das variveis do modelo se encontram. As etapas de
discriminao so naturalmente includas neste critrio, o que pode ser demonstrado
com o exemplo ilustrativo seguinte.
Exemplo Ilustrativo 11.5- Ilustrao do critrio avaliado ao longo de uma faixa
experimental

Seja um sistema com uma nica varivel de projeto e uma nica varivel de
resposta. Considera-se que o erro da varivel de projeto {x} seja desprezvel; porm, a
varivel de resposta {y} apresenta um erro experimental conhecido. Um conjunto inicial
de experimentos 0 foi realizado, permitindo o ajuste de dois modelos que descrevam
adequadamente os dados experimentais. Neste exemplo, o modelo 2 admitido como o
verdadeiro. Um novo experimento , consistindo de um nico ponto, deve ento ser
realizado. Como a incerteza, segundo o critrio Z(), reduzida quando se escolhe
como um ponto de discriminao ao invs de um ponto de estimao precisa? Para
responder a esta pergunta, sejam duas condies experimentais em que pode ser
realizado, x** ou x*, correspondendo a um ponto em que os modelos no so
discriminados e um ponto em que os modelos so discriminados, respectivamente.
A Figura 11.8 ilustra os volumes de incerteza envolvidos. Na Figura 11.8A esto
ilustradas as incertezas experimentais e incertezas associadas aos erros paramtricos dos
modelos. A unio destas regies est apresentada na Figura 11.8B, que ilustra o
tamanho da incerteza total da varivel y em 0.
Quando se realiza um experimento em x**, conforme indicado na Figura 11.8C,
os modelos no so discriminados, mas os parmetros dos modelos so estimados de
forma mais precisa. Por conseqncia, a reduo das incertezas pequena e est
associada reduo das incertezas devido impreciso paramtrica. Por outro lado, um
experimento x* elimina o modelo 01, de forma que toda incerteza associada s regies
em que o modelo 01 prediz resultados diferentes do modelo 2 eliminada. Por
conseqncia, o ganho de informao neste caso bastante elevado.

234

Modelo 1

(A)
Incerteza
experimental

(B)

Incerteza dos
modelos

Incerteza total

Modelo 2

x
y

(C)

x**

(D)

x*

Figura 11.8 Exemplo ilustrativo de: (A) incerteza experimental e incerteza de


predio; (B) incerteza total; incerteza total aps realizar (C) x**; e (D) x*.
Fim do Exemplo Ilustrativo 11.5

Na forma apresentada at agora, o critrio Z() uma medida de ganho de


informao para experimentos que j tenham sido realizados. Contudo, para conseguir
utilizar o critrio para fins de planejamento de experimentos, preciso ser capaz de
prever o dado experimental ao realizar . A prxima seo trata deste assunto, de forma
anloga apresentada nos Captulos 9 e 10.

11.4 Utilizando Z() como critrio para planejamento de


experimentos
De forma anloga apresentada nos Captulos 9 e 10, duas formas so propostas
para calcular o ganho de informao ao realizar experimentos . A primeira considera
que o dado experimental seja conhecido em uma faixa, tomando o pior valor possvel do
dado experimental dentro da faixa para maximizar a informao; o segundo critrio

235

utiliza modelos para prever o dado experimental, o que leva a M possveis cenrios
(onde M o nmero de modelos).
11.4.1 Planejamento robusto (sem utilizar modelos para prever o dado
experimental)

Neste caso, no se utilizam modelos para realizar predies dos dados


experimentais. Contudo, necessrio conhecer uma faixa possvel no qual os dados
experimentais devem ser encontrados. Sejam Z() os dados experimentais obtidos em ,
conhecidos em uma faixa Z(). Quando no se utilizam modelos para predizer o dado,
pode-se maximizar a informao para o pior valor possvel de Z() contido em Z().
Ou seja, deseja-se eliminar ao mximo os possveis estados da natureza (valores dos
parmetros dos modelos) ao realizar , independentemente de qual seja o resultado.
Contudo, pelo menos um modelo deve ser capaz de se adequar aos dados experimentais
(considerando que pelo menos um dos modelos verdadeiro). Logo, o critrio de
informao fica na forma:
(E 11.23)

arg max min Z Z Z


st. Z 1

A condio Z 1 indica que pelo menos um modelo deve permanecer


provvel. Esta forma de avaliar o problema leva a um procedimento de otimizao
bastante complexo, uma vez que muitos so os possveis valores que Z() pode assumir
em uma faixa Z(). Alm disto, um critrio bastante conservador que no faz uso dos
modelos para predizer os resultados. Pode ser prefervel e bem mais eficaz utilizar
modelos para predizer o comportamento experimental, conforme discutido a seguir.
11.4.2 Utilizando modelos para prever o dado experimental

De forma anloga apresentada nos Captulos 9 e 10, o ponto experimental pode


ser predito utilizando os valores calculados com os modelos, considerando valores dos
parmetros estimados a partir dos dados experimentais em 0. Este procedimento parece
ser bastante razovel, mas leva a M cenrios possveis, uma vez que o dado
experimental pode assumir qualquer valor predito pelos M modelos admissveis. A
funo de informao deve ser avaliada, considerando que o dado experimental possa

236

assumir o valor calculado com cada modelo; ou seja, Z = |ZZ ( m ) , para todo n=1,M.
Portanto, as M funes de informao a serem maximizadas so:

(E 11.24)

OF |ZZ (1) , |ZZ ( 2 ) , |ZZ ( 3) ,..., |ZZ ( M 1) , |ZZ ( M )

O problema , portanto, multiobjetivo, cuja soluo dada pela frente de Pareto.


A soluo constituda de infinitos pontos para a maioria dos problemas prticos. Pelos
mesmos argumentos apresentados no Captulo 9, o desconhecimento do dado
experimental leva a mltiplos objetivos. Logo, a priori no se pode estabelecer qual
estratgia tima. Contudo, a abrangncia conceitual do problema multiobjetivo mais
ampla do que a dos demais procedimentos empregados usualmente para conciliar a
estimao de parmetros e a discriminao de modelos.
De forma anloga apresentada nos Captulos 9 e 10, um ponto timo pode ser
escolhido dentro da Frente de Pareto pelos critrios Maximin, Bayesiano ou atribuindose igual peso aos modelos, conforme segue.

(E 11.25)

otm arg max min m |ZZ

(E 11.26)

otm arg max P ( m ) |ZZ

(m)

(m)

m 1

(E 11.27)

otm arg max

1
M

m 1

Z
| Z ( m )

Vale salientar que qualquer outro critrio pode ser adotado, desde que escolha
pontos dentro da Frente de Pareto. O algoritmo usado para propor um plano
experimental especfico segundo o critrio analisado est apresentado a seguir.
11.4.3 Algoritmo para o planejamento experimental

O algoritmo para avaliar o critrio de informao Z() para um plano


experimental est apresentado na Figura 10.5.

237

Para uma faixa de interesse, especifique a faixa (X0,XF). Divida esta regio em diversos
pontos, armazenando estes pontos em Xgrid={xgrid,1, xgrid,2, xgrid,3,....}
A partir dos dados experimentais em 0, estime os parmetros de todos os modelos m
(m=1,M)
Especifique os pesos wi para cada varivel (por exemplo, wi=1/Nz); bem como o peso
para cada varivel ao longo da faixa experimental (por exemplo, wi(X)=1/VolX, onde
VolX o volume da regio (X0,XF)
Para todos os pontos de Xgrid, calcule para todas as variveis zi (i=1,Nz) e para todos os
modelos m (m=1,M), o desvio padro de predio z(im ) xgrid , o valor mnimo e o valor
mximo das variveis preditas zi( m ) min xgrid , 0 e zi( m ) max xgrid , 0
Para todos os modelos m (m=1,M), faa
Gere dados com o modelo m para o plano experimental *, considerando estes
dados como dados experimentais
Para todos os modelos (n=1,M; nm), faa
Re-estime os parmetros do modelo n
Se o modelo n tornou-se inadequado, ento
Para todos os pontos de Xgrid, faa
Para todas as variveis zi (i=1,Nz), faa
zi( n ) min xgrid , 0 = zi( n ) max xgrid , 0 = 0
Fim faa
Fim faa
Seno
Para todos os pontos de Xgrid, faa
Para todas as variveis zi (i=1,Nz), faa
Com dados de 0, mas com parmetros estimados em 0+,
calcule o desvio padro z(in )|Z ( m ) xgrid , 0 e o valor mximo
e mnimo da varivel zi predita com o modelo n, dadas por
zi( n )|min
x , 0 e zi( n )|max
x , 0 , respectivamente
Z ( m ) ( ) grid
Z ( m ) ( ) grid
Se ( z(in )|Z xgrid , 0 < z(in ) xgrid , 0 ), ento
zi( n )|max
x , 0 = zi( m ) max xgrid , 0
Z ( m ) ( ) grid
zi( n )|min
x , 0 = zi( m ) min xgrid , 0
Z ( m ) ( ) grid

Fim se
Com dados obtidos em 0+ e parmetros re-estimados em
0+, calcule z(in ) xgrid , 0 e o mnimo e mximo valor
predito da varivel zi, representado por zi( n ) min xgrid , 0 e
zi( n ) max xgrid , 0 , respectivamente

Fim faa
238

Fim faa
Fim se
Calcule o volume de interseo das variveis zi e para todos os pontos dentro
do malha Xgrid:
zi 0 a partir de zi( n ) min xgrid , 0 e zi( n ) max xgrid , 0 ;
ziT 0 a partir de zi( n )|min
x , 0 e zi( n )|max
x , 0 ,
Z ( m ) ( ) grid
Z ( m ) ( ) grid

sendo (n=1,M)
Calcule a integral a partir da Equao (E 11.14), obtendo o valor de

|ZZ

(m)

Elimine os dados gerados com o modelo m para o plano que haviam sido
adicionados aos dados experimentais
Retorne os parmetros de todos os modelos e as probabilidades de todos os
modelos aos valores originais
Fim faa
Fim faa
Figura 11.9 Algoritmo para obteno dos critrios ZZ( m ) para todos os modelos
m (m=1,M) de um conjunto de experimentos especfico .
Por simplicidade, a etapa de re-estimao de parmetros dos modelos pode ser
substituda pela avaliao da qualidade dos modelos, considerando os parmetros
estimados com os dados experimentais em 0. Assim, a funo objetivo com os dados
obtidos em poderia ser calculada como:

(E 11.28)

F|Z( n( m) ) F ( n ) Z ( n ) Z ( m ) VZ Z ( n ) Z ( m )
T

Desta forma, o algoritmo torna-se muito mais simples e menos custoso. Isto
pode evitar problemas numricos nas diversas repeties do procedimento de reestimao de parmetros dos modelos. Contudo, perde-se a avaliao da flexibilidade
dos modelos em relao aos novos dados experimentais e a anlise torna-se mais pobre.
Alm disto, boas estimativas iniciais dos parmetros esto disponveis a partir dos dados
obtidos em 0, e o processo de re-estimao de parmetros consideravelmente
facilitado ao fornecer boas estimativas iniciais a um algoritmo baseado no mtodo de
Gauss-Newton (SCHWAAB et al., 2010).
Para avaliao de um planejamento timo, o procedimento apresentado na
Figura 10.5 deve ser includo em um procedimento de otimizao. Nesta tese, por
simplicidade, foi implementada a busca em uma malha para obteno de planejamentos

239

timos. Dois exemplos so apresentados a seguir para ilustrar a aplicabilidade do


algoritmo proposto.

11.5 Exemplos
Os mesmos dois exemplos numricos apresentados no Captulo 10 so
novamente empregados aqui para ilustrar a aplicabilidade do novo critrio de
planejamento. Em ambos os exemplos, experimentos iniciais foram simulados com um
modelo conhecido e acrescidos de perturbaes aleatrias para simular o erro
experimental, de forma a permitir uma primeira estimao de parmetros dos modelos.
A estimao de parmetros foi conduzida segundo um algoritmo hbrido, de forma
anloga descrito por SCHWAAB et al. (2006, 2008c) e PEREIRA et al. (2009),
utilizando primeiramente a tcnica do Enxame de Partculas (KENNEDY e
EBERHART, 2001) para realizar uma busca global dos valores dos parmetros. Em
seguida, o melhor ponto encontrado pelo algoritmo do enxame de partculas foi
alimentado como estimativa inicial a um mtodo de Gauss-Newton (SCHWAAB e
PINTO, 2007). Todas as rotinas numricas foram implementadas em linguagem Fortran
(SCHWAAB et al., 2010). Os planejamentos consistiram de um nico experimento
adicional de cada vez. Para busca do planejamento timo, a regio experimental foi
discretizada, realizando-se a busca na malha resultante.
Nos exemplos apresentados, o objetivo obter o ganho mximo de informao
ao realizar um experimento adicional ao longo de uma faixa experimental (X0,XF).
Desta forma, necessrio calcular uma integral mltipla com a Equao (E 11.14). Para
avaliao da integral da funo de informao ao longo da faixa experimental, o peso
dado a cada varivel ao longo da faixa experimental foi uniforme; ou seja,
w1(X)=w2(X)=1/VolX, onde VolX o volume da regio experimental. A integral foi
avaliada dividindo-se a regio experimental em diversos domnios k=1,Nk. Para cada
regio k, calculava-se a funo de informao

zi X k , 0
ziT X k , 0

em um ponto. A

integral podia ento ser obtida considerando que este valor da funo de informao era
o mesmo para todos os pontos dentro do domnio k (regra do retngulo). Desta forma, a
integral pode ser aproximada pela soma ponderada dos volumes de cada regio, na
forma:

240

Nk
1 zi X , 0
1 zi X k , 0

dX

Volk

VolX ziT X , 0
ziT X k , 0
k 1 VolX
X0

XF

(E 11.29)

Exemplo 11.6 Resoluo analtica de um problema simples

Sejam dois modelos


Modelo 1: y (1) x
Modelo 2: y (2) x1,5
A varincia experimental vy admitida constante e igual a 4x10-4. Admite-se que
o modelo verdadeiro o modelo 2, com parmetro (2) = 1. Trs experimentos iniciais
foram simulados com o modelo 2, sendo as perturbaes geradas com distribuio
normal, com mdia zero e varincia igual a vy. O resultado dos trs experimentos
iniciais est apresentado na Tabela 11.1:
Tabela 11.1 Experimentos iniciais no Exemplo 11.6
x

yexp

0,1

0,0405

0,2

0,1010

0,5

0,3520

Os parmetros (1) e (2) e suas varincias v(1) e v(2) podem ser estimados a partir
dos dados experimentais, respectivamente, como:
3

(E 11.30)

est
1

i 1

i 1

(E 11.31)

xi

exp

0, 6676

VCR 1 0 v (1)

vy

x
i 1

(E 11.32)

2est

y
i 1

xi1,5

exp

x
i 1

0.00133

1, 0059

241

(E 11.33)

VCR 2 0 v ( 2 )

vy

0, 00298

i 1

Os valores mnimos das funes objetivos obtidos com os modelos 1 e 2 foram,


respectivamente, F(1)=5,1738 e F(2)=0,5341. O limite da funo chi-quadrado com dois
graus de liberdade e 97,5% de confiana igual a F2=7,3777. Como ambas as funes
objetivos esto abaixo do limite do chi-quadrado, nenhum modelo pode ser desprezado.
No caso considerado, os trs primeiros experimentos correspondem aos
experimentos iniciais; ou seja, 0={x1,x2,x3}. O plano experimental a ser avaliado
corresponde a um nico experimento adicional; ou seja, ={x4,}. Para avaliar a condio
tima, considera-se que tanto o modelo 1 quanto o modelo 2 possam ser verdadeiros.
Para cada valor de x4 avaliado considerando-se o modelo 1 como verdadeiro, os valores
dos parmetros (1) e (2) e suas varincias ficam, respectivamente, iguais a:
(E 11.34)

(1) est |Z

(E 11.35)

v (1) |Z (1)

(1)

0, 6676

y2
3

x4 2 xi 2
i 1

exp

(E 11.36)

(2) est |Z

(1)

3
est
1 x4 x41,5 yi exp xi1,5

i 1

x43 xi 3
i 1

(E 11.37)

v ( 2) |Z (1)

y2
3

x43 xi 3
i 1

As varincias de predio obtidas com os modelos 1 e 2 so dadas,


respectivamente por:

(E 11.38)

P
v (1)
x |Z (1) x 2 v (1) |Z (1) v y
y

(E 11.39)

P
v (2)
x |Z (1) x 2 v ( 2 ) |Z (1) v y
y

242

O intervalo de predio dos modelos pode ento ser escrito como:

(E 11.40)

P
y1|Z 1 1est |Z 1 x t3,0.975 v (1)
x |Z 1
y

(E 11.41)

P
y2| Z 1 x1.5 2 est |Z 1 t3,0.975 v (2)
x Z 1
y

O volume de incerteza associado a tais intervalos pode ser obtido da seguinte


forma:

(E 11.42)

y y1|Z 1 y2|Z 1

(E 11.43)

y y1|Z 1 y2|Z 1 y1|Z 1 y2|Z 1

Tambm preciso avaliar a informao que se tinha em 0 com os parmetros


re-estimados aps executar . Contudo, a preciso paramtrica neste caso independe do
valor do parmetro, uma vez que os modelos so lineares nos parmetros. A preciso
depende apenas da condio experimental dos experimentos em 0. Logo, o
conhecimento que o pesquisador tinha em 0 o que de fato ele imaginava ter em 0.
A incluso do ponto x4 gerado com o modelo 1 pode ou no eliminar o modelo
2. Caso a incluso deste ponto elimine o modelo 2 (F(2)> F2), tem-se que:

(E 11.44)

1
2
0

se F(2) >F 2
se F(2) F 2

O termo F 2 avaliado com probabilidade igual a 97,5% e trs graus de


liberdade (devido ao novo experimento x4), resultando em F 2 = 9,3484. Ento, o
critrio de informao que considera o modelo 1 como verdadeiro pode ser escrito na
forma:

(E 11.45)

|ZZ

(1)

y1|Z (1) 1 2 y2|Z (1)


1

1
dx
0
y1 y2

243

Conforme apresentado no Exemplo 01 do Captulo 9, onde o mesmo problema


foi estudado, quando se considera o modelo 1 como verdadeiro, o modelo 2 no
discriminado se x4<0,68, e discriminado se 0.68x41. Logo, a Equao (E 11.45)
pode ser escrita como:

(E 11.46)

|ZZ

0,68

(1)

1 0

y1|Z (1) y2|Z (1)


y1 y2

dx

y1|Z (1)

0,68

y1 y2

dx

O volume de interseo na integral acima deve ser obtido de forma numrica,


exigindo certo grau de programao e algum esforo computacional.
O mesmo procedimento repetido, considerando que o modelo 2 possa ser o
modelo verdadeiro. O procedimento absolutamente anlogo ao descrito acima.
Portanto, o critrio de informao que considera o modelo 2 como modelo verdadeiro
pode ser escrito como:

(E 11.47)

Z
| Z ( 2 )

y1|Z ( 2) 1 1 y2|Z ( 2 )
1

dx
1 0
y
y

1
2

0,55

0,55

(A)

0,50

0,45

0,45

0,40

0,40

0,35

(B)

0,35

0,50

0,30

0,30

0,25

0,25

0,20

0,20

0,0

0,2

0,4

0,6

0,8

1,0

0,0

x4

0,2

0,4

x4

0,6

0,8

1,0

Figura 11.10 Valores dos critrios (A) |ZZ (1) e (B) |ZZ ( 2) para x4 na faixa
(0,1) no Exemplo 11.6.
Os valores dos critrios |ZZ (1) e |ZZ ( 2) foram calculados com um cdigo
implementado em linguagem Fortran. A condio tima do prximo experimento x4 foi
investigada para pontos de x entre 0 e 1, sendo este intervalo dividido em 100 pontos
244

igualmente espaados. O critrio de informao foi calculado para cada um destes 100
pontos, sendo os resultados destes critrios apresentados na Figura 11.10.
O ganho de informao significativamente elevado para os pontos de
discriminao, conforme indicado pela descontinuidade das curvas na Figura 11.10. A
soluo nica do problema o ponto x4=1. O ganho de informao esperado ao se
realizar o experimento em x4=1 de cerca de 55% para ambos os modelos.
Fim do Exemplo 11.6
Exemplo 11.7 Modelo cintico

Este o mesmo exemplo apresentado nos Captulos 8, 9 e 10. Apenas por


clareza, os resultados apresentados nestes captulos referentes simulao dos
experimentos iniciais sero repetidos aqui. Os quatro modelos esto ilustrados abaixo.

1(1) x1 x2
Modelo 1: y1
,
1 3(1) x1 4 (1) x2
Modelo 2: y1

Modelo 3: y1

1(2) x1 x2

(2)
3

x1 4 (2) x2

1(3) x1 x2

(3)
4

x2

,
2

2(1) x1 x2
y2
1 3(1) x1 4 (1) x2
,
2

y2

y2

(2)
3

x1

2(3) x1 x2

1(4) x1 x2
Modelo 4: y1
,
1 3(4) x1 4 (4) x2

2(2) x1 x2

(3)
3

x1

2 (4) x1 x2
y2
1 3(4) x1

Admite-se que o modelo correto o modelo 1, cujos parmetros so dados por


1(1)=0,1; 2(1)=0,01; 3(1)=0,1; e 4(1)=0,01. As varincias experimentais so admitidas
constantes e iguais a 0,35 e 2,3x10-2 para as variveis y1 e y2, respectivamente. Cinco
experimentos iniciais foram simulados com o modelo 1 e acrescidos de uma oscilao
aleatria normalmente distribuda com mdia zero e varincia 0,35 e 2,3x10-2 para as
variveis y1 e y2, respectivamente. Os resultados esto apresentados na Tabela 11.2.
Com os dados apresentados na Tabela 11.2, os parmetros dos quatro modelos
foram estimados e a adequabilidade de cada modelo avaliada pelo teste chi-quadrado.
Os resultados esto apresentados na Tabela 11.3.
Neste caso, o planejamento inicial 0 consiste nos cinco primeiros experimentos.
A avaliao do planejamento timo a ser realizado consiste em determinar a prxima
condio experimental, de forma a minimizar a incerteza de predio. Neste caso,
considera-se apenas um experimento a ser planejado; ou seja, ={x1,x2}. Para isto, a
245

regio experimental foi avaliada entre 5,0x155,0 e 5,0x255,0, sendo cada varivel
divida em 20 pontos igualmente espaados. Logo, 400 condies experimentais foram
avaliadas. O peso dado a cada varivel foi idntico e igual a w1=w2=.
Tabela 11.2 Experimentos iniciais realizados no Exemplo 11.7.
Experimento

x1

x2

y1

y2

01

20,0

20,0

13,443

1,299

02

30,0

20,0

13,817

1,433

03

20,0

30,0

17,809

1,885

04

30,0

30,0

21,139

2,118

05

25,0

25,0

16,039

1,635

Tabela 11.3 Resultados da estimao de parmetros no Exemplo 11.7.


Modelo

4(m)

01

1(m)
2(m)
0,1311 0,0134

3(m)
0,1431

P(m)
0,0145 0,400

02

0,0743 0,0068

0,0233

0,0034 0,312

03

0,0281 0,0067

0,0017

0,0232

04

0,1162 0,0107

0,1187

0,0162 0,389

0,00

conveniente definir uma varivel que determine o nmero de modelos


discriminados quando se realizam os experimentos em , considerando que o modelo m
verdadeiro. Este termo poderia ser entendido como a parte inteira do critrio

(m)

apresentado no Captulo 9; ou seja:

(E 11.48) I Z ( m ) n de modelos discriminados ao fazer se m verdadeiro

Os valores dos critrios, |ZZ ( m ) , I |Z ( m ) para os modelo m=1,2 e 4


ao longo da faixa experimental esto apresentados na Figura 10.7. A descontinuidade
dos critrios indica os pontos de discriminao de modelos, o que pode ser observado

nos grficos de I |Z m .

246

0.2

0.1

0.0

10

20

30

40

x1

0.3

50

10
60

20

30

40

50

60

20

30

40

x1

50

10
60

20

30

40

50

30

10

40

x1

50

10
60

20

30

40

20

x1

0.1

20

x2

0.2

10

50

50

60

10
60

20

30

50

60

x2

(D)

(E)

40

40

60

0.3

0.0

30

0.1

10

20

0.2

10

x1

(C)

0.0

x2

(B)

(A)

0.3

30

40

50

10
60

20

30

40

50

60

x2

(F)

x2

10

20

x1

30

40

50

10
60

20

30

40

50

60

x2

ao longo da faixa experimental no

Figura 11.11 - Valores de (A) |ZZ (1) , (B) I |Z (1) , (C) |ZZ ( 2) , (D)

I |Z ( 2 ) , (E) |ZZ ( 4) e (F) I |Z ( 4)

Exemplo 11.7.
Este resultado pode ser contrastado com os resultados obtidos no Captulo 10
para este mesmo exemplo. No Captulo 10 foi observado que o critrio que visa
maximizao de informao sobre modelos e parmetros (o critrio |Z ( m ) ) escolhe
247

pontos em que no ocorre discriminao de modelos, mas nos quais a quantidade de


incerteza referente aos parmetros dos modelos de cerca de 95%. Contudo, quando o
objetivo reduzir a incerteza de predio pelo critrio |ZZ ( m ) , pontos de
discriminao tendem a ser escolhidos, uma vez que boa parte da incerteza eliminada
ao se eliminar um modelo. Isto ocorre pelas razes ilustradas na Figura 11.8. O erro
experimental desempenha um papel fundamental neste aspecto, uma vez que diferentes
modelos que predigam valores de resposta distintos tendem a apresentar tanto elevada
incerteza tanto experimental quanto a incerteza de predio. Portanto, a eliminao de
um modelo elimina toda incerteza associada a este modelo, indicando que pontos de
discriminao tende a ser escolhidos segundo o critrio |ZZ m .
De forma a manter um procedimento similar ao utilizado nos captulos
anteriores, escolhe-se o critrio Maximin (embora os trs critrios indiquem a mesma
condio experimental para os experimentos seqenciais planejados). O experimento
indicado pelo critrio Maximin foi simulado com o modelo verdadeiro e acrescido de
um erro aleatrio (de forma a simular a realizao do experimento). Ao realizar este
experimento, espera-se a discriminao de modelos, eliminando-se dois modelos se o
modelo 1 for verdadeiro, um modelo se o modelo 2 for verdadeiro e um modelo se o
modelo quatro for verdadeiro. O experimento indicado foi ento simulado, as
informaes sobre os modelos reavaliadas e os resultados esto apresentados na Tabela
11.4.

Tabela 11.4 Valores de |ZZ ( m ) e I |Z ( m ) segundo critrio Maximin,


realizao do experimento indicado, ganho de informao real Z e reavaliao dos
modelos no Exemplo 11.7.
Critrio (Maximin)
Experimento
Estimao de
parmetros

x1
18,15
N
06
Modelo
01
02
03
04

x2
55,0
x1
7,63
1(m)
0,1395
0,0533
0,0609

|ZZ

(1)

0,3370
x2
55,00
2(m)
0,0141
0,0051
0,0058

|ZZ

(1)

|ZZ

0,2836
y1
29,554
3(m)
0,1512
0,0157
0,0493

(1)

0,2815
y2
2,958
4(m)
0,0181
0,0011
0,0029

minm |ZZ ( m )
0,2815

0,3430
P(m)
0,584
0,000
0,000

248

Conforme pode ser observado na Tabela 11.4. o valor real de Z avaliado


aps realizar foi ligeiramente superior ao esperado se o modelo 1 fosse o verdadeiro,

|ZZ

(m)

Os modelos 2 e 4 tornaram-se inadequados e o modelo 1 permaneceu

admissvel, conforme esperado para esta condio admitindo que o modelo 1 seja
verdadeiro.
A partir deste ponto, o critrio concentra-se em estimar os parmetros do modelo
1 de forma precisa, visando a minimizar a incerteza de predio. A Tabela 11.5
apresenta os experimentos indicados pelo critrio Maximin, a execuo destes
experimentos e a quantidade de informao extra que pode ser eliminada, comparada ao
erro experimental.
Tabela 11.5 Experimentos realizados segundo indicao do critrio Maximin e
quantidade extra de informao que ainda pode ser eliminada no Exemplo 11.7.
N do Experimento

x1

x2

y1

y2

Sextra

01-05

0,5780

06

0,3750

07

55,0

55,0

43,523

4,341

0,1826

08

55,0

55,0

43,326

4,325

0,1501

09

10,3

55,0

21,738

2,177

0,1250

10

55,0

55,0

42,787

4,281

0,1087

11

12,9

28,7

14,395

1,439

0,0959

12

12,9

55,0

25,359

2,529

0,0855

13

55,0

55,0

42,347

4,245

0,0767

14

12,9

26,1

13,742

1,363

0,0692

Apresentado na Tabela 9.4; Apresentado na Tabela 11.4

Conforme pode ser observado, aps a realizao do experimento N 10, apenas


cerca de 10% de informao extra pode ser eliminada quando se conduzirem infinitos
experimentos. Aps o experimento N 14, a incerteza paramtrica frente incerteza
experimental de cerca de 7%. Este pode ser considerado um critrio de parada, de
acordo com o pesquisador.
Uma alternativa para avaliar se vale a pena continuar os experimentos simular
continuamente os experimentos com o nico modelo que restou e avaliar a preciso
249

paramtrica que se espera conseguir, conforme proposto por SANTOS et al. (2002).
Dessa forma, o custo de realizar os experimentos pode ser comparado preciso
experimental esperada, para posterior tomada de deciso a respeito de se vale a pena ou
no vale a pena continuar os experimentos.
Para fins de comparao com o critrio apresentado no Captulo 10, o logaritmo
do determinante da matriz de informao de Fisher do modelo 1 (log|J(1)|) obtido com
os experimentos indicados pelo critrio do Captulo 10, conforme apresentados na
Figura 10.8 e obtido com os experimentos apresentados na Tabela 11.5 para 9
experimentos adicionais so mostradas na Figura 11.12.

26

Critrio captulo 11
Critrio captulo 10

(1)

Log|J |

24

22

20

18

10

11

12

13

14

Experimentos

Figura 11.12 Logaritmo da matriz de informao de Fisher do modelo 1 para os


experimentos indicados segundo o critrio apresentados no Captulo 10 e 11.
Conforme pode ser observado na Figura 11.12, h muito pouca diferena no
valor de log|J(1)| para os experimentos indicados segundo os dois critrios. Isto ocorre
porque os experimentos segundo ambos os critrios so informativos para estimao de
parmetros precisos. O critrio focando predio (Captulo 11) leva discriminao
dos demais modelos com um nico experimento adicional, e, por conseqncia, os
experimentos subseqentes segundo este critrio visam a estimao precisa do modelo
1. Com isto, para os experimentos iniciais, o log|J(1)| ligeiramente superior para o
procedimento apresentado no presente captulo para os experientos 6-8. No entanto, os
valores de log|J(1)| obtidos segundo os dois critrios tornam-se muito parecidos com a

250

realizao de experimentos adicionais. Esta mesma observao foi obtida por


DONCKELS (2009) investigando modelos dinmicos. Segundo o autor, mesmo que,
para critrios distintos, alguns experimentos iniciais sejam diferentes quanto
capacidade de discriminao de modelos, se tais experimentos so informativos para a
estimao de parmetros precisos, com a realizao de um nmero mais elevado de
experimentos, espera-se que a preciso paramtrica seja similar, independentemente do
critrio adotado.
Para ambos os critrios apresentados nos Captulo 10 e 11, os pontos de
discriminao podem no ser to vantajosos se os parmetros so por demais
imprecisos; neste caso, os critrios buscariam eliminar primeiro a incerteza paramtrica
e, na medida em a incerteza paramtrica no se reduz tanto, indicar pontos de
discriminao de modelos. No entanto, uma comparao do critrio apresentado no
Captulo 10 com o critrio apresentado no Captulo 11 indica que o ltimo tende a
concentrar mais esforos em regies experimentais de discriminao de modelos.
Contudo, para fins de estimao de parmetros precisos, se os experimentos indicados
pelos critrios so informativos, o resultado final quanto preciso paramtrica pode ser
bastante semelhante para ambos os critrios.
Fim do Exemplo 11.7

11.6 Discusso e concluses


Alguns aspectos so bastante semelhantes aos apresentados na discusso e
concluses dos Captulos 9 e 10.
De forma anloga observada com a funo de informao (), a funo de
informao Z() concilia naturalmente os procedimentos de estimao de parmetros e
discriminao de modelos atravs da medida de informao que elimina ao mximo os
possveis estados da natureza. Contudo, os estados da natureza que Z() considera so
as respostas possveis com os modelos, e no os possveis valores dos parmetros.
O clculo de Z() exige dois aspectos de programao e esforo computacional
que exigem certa complexidade, conforme descrito a seguir:

necessrio determinar o volume de unio de intervalos de confiana para cada


varivel ao longo de uma faixa experimental;

necessrio resolver uma integral mltipla (onde o nmero de integrais igual


ao nmero de variveis de projeto, Nx).

251

Alm disto, para utilizao como critrio de planejamento de experimentos,


necessrio prever o dado experimental, o que pode ser feito utilizando os M modelos.
Isto resulta em um problema multiobjetivo, com M objetivos distintos, |ZZm ,
m=1,M. Logo, a escolha de um ponto exige a adoo de algum critrio para problemas
multiobjetivos. Neste caso, o dado experimental gerado com cada um dos M modelo,
os parmetros dos modelos so re-estimados e a adequabilidade dos modelos reavaliada. Isto envolve um procedimento numrico que exige certo esforo
computacional.
Uma complicao adicional diz respeito ao procedimento de otimizao para
encontrar otm. Nesta tese, de forma simplificada, foi empregada a busca em malha.
Contudo, quando o nmero de variveis de projeto muito elevado, esta busca pode ser
muito custosa ou mesmo invivel. Por outro lado, algoritmos de otimizao podem
encontrar problemas, uma vez que as funes de informao so descontinuas. Este
aspecto deve ser alvo de investigaes futuras.
Apesar de exigir elevado esforo computacional, os aspectos conceituais so
bem abrangidos pela funo de informao proposta. Trata-se de uma funo
informativa ao pesquisador e que pode ser relacionada ao tamanho da regio de
confiana

de

predio.

problema

multiobjetivo

surge

naturalmente

do

desconhecimento do estado da natureza.


importante salientar que, qualquer critrio que busque minimizar a incerteza
de predio ao longo de uma faixa experimental exige o cmputo de integrais mltiplas.
Portanto, a complexidade numrica deve-se unicamente ao fato de contemplar o
problema com aspectos conceituais mais abrangentes do que as funes de informao
geralmente utilizadas.
Quando se comparam os critrios apresentados nos Captulos 10 e 11, observase que ao focar a predio, h expectativa de que o critrio seja fortemente influenciado
por pontos de discriminao de modelos. Quanto preciso paramtrica, se os
experimentos iniciais segundo ambos os critrios forem informativos, ao final os
parmetros podem apresentar preciso semelhante independentemente do critrio
escolhido.
Vale ressaltar que ambos os critrios apresentados nos Captulos 10 e 11
naturalmente conciliam os objetivos de estimao de parmetros precisos e
discriminao de modelos. Tais objetivos recebem um nico tratamento, sendo que

252

ambos os critrios buscam a minimizao da incerteza, focando a diminuio da


impreciso paramtrica ou da impreciso associada predio dos modelos.

253

PARTE 4 CONCLUSES,
REFERNCIAS, SUGESTES

254

12 CONCLUSES
Esta tese tratou do estudo de diversos conceitos referentes ao planejamento
seqencial de experimentos.
As seguintes questes foram abordadas:
(1)

Como incertezas para variveis de um processo podem ser obtidas a


partir do conhecimento das varincias dos diferentes blocos que
compem o processo (Captulo 6);

(2)

Como obter planejamentos iniciais quando apenas se dispe de um


conhecimento sobre faixas admissveis dos valores dos parmetros
(Captulo 7);

(3)

Tratamento multiobjetivo do problema de discriminao de modelos


e de estimao de parmetros (Captulo 8);

(4)

Proposta de um discriminante que leve em conta o nmero de


modelos que se espera discriminar (Captulo 9);

(5)

Conciliao dos objetivos de estimao de parmetros precisos e


discriminao de modelos, com um nico tratamento a estes
problemas, quando o interesse se concentra em obter informao
sobre os modelos e os parmetros (Capitulo 10);

(6)

Conciliao dos objetivos de estimao de parmetros precisos e


discriminao de modelos, com um nico tratamento a estes
problemas, quando o interesse se concentra em obter informao
sobre a predio feita com os modelos e parmetros (Captulo 11);

No Captulo 6, com a simples extenso da tcnica de propagao de erros, foi


demonstrado como a incerteza de uma varivel pode ser obtida em um processo, se
varincias individuais dos blocos que compem o processo so conhecidas. Uma das
principais mensagens do Captulo 6 a importncia da reconciliao de dados em
problemas em que a propagao de erros atravs do processo influencia
significativamente o comportamento das variveis. A reconciliao , portanto, de
grande importncia para obter a estimao de parmetros a partir de dados
experimentais. A anlise do comportamento pode ser feita se uma faixa para os valores
255

dos parmetros conhecida, ou boas estimativas iniciais esto disponveis. Se boas


estimativas para os parmetros esto disponveis, ento possvel determinar condies
timas de experimentao atravs de um otimizador que seja capaz de planejar
conjuntos de experimentos. Devem ser esperados problemas numricos associados
inverso da matriz de covarincia das incertezas experimentais, devido elevada
correlao entre as variveis. A utilizao do conhecimento das incertezas
experimentais para planejamento timo quando apenas faixas dos parmetros esto
disponveis bem mais complexa. Este assunto foi tratado no Captulo 7.
O Captulo 7 apresentou os conceitos desenvolvidos na literatura tcnica acerca
do planejamento inicial de experimentos, quando o modelo conhecido, mas os
parmetros so desconhecidos, sob a tica da Teoria da Deciso. As funes de
informao podem ser obtidas a partir da matriz de informao de Fisher (por exemplo,
A-timo, E-timo, D-timo, etc). O problema naturalmente multiobjetivo devido ao
desconhecimento dos estados da natureza; neste caso, o valor correto dos parmetros. A
escolha de um ponto timo pode ser feita pelo critrio Bayesiano ou critrio Maximin.
Neste trabalho, props-se uma simples conciliao para tais critrios, que depende da
concavidade formada pela frente de Pareto quando se tomam como funes a serem
maximizadas a informao segundo o critrio Bayesiano e o critrio Maximin. Contudo,
a tarefa de otimizao envolvida para a determinao de timos destas funes de
informao complexa, e estudos especficos devem ser desenvolvidos para se trabalhar
com este tema.
O Captulo 8 apresentou um tratamento multiobjetivo dado ao planejamento de
experimentos e discriminao de modelos. O conceito bastante simples: uma vez que
diferentes objetivos so formulados, obtm-se a frente de Pareto, soluo do problema
multiobjetivo investigado. Com base nisto, possvel avaliar se os objetivos podem ou
no ser conciliados. Atravs de alguns exemplos, sugere-se que os objetivos de
discriminao de modelos e estimao de parmetros tendem a ser mais bem
conciliados quando se leva em conta nas funes de discriminao de modelos a
influncia do novo ponto experimental na preciso paramtrica, de acordo com o
procedimento proposto por SCHWAAB et al. (2008c). Contudo, diversas funes
podem ser formuladas. Para restringir a complexidade do problema, as funes a serem
maximizadas podem ser escolhidas de acordo com os modelos mais provveis.
No Captulo 9, uma abordagem conceitual sobre o objetivo da discriminao de
modelos foi apresentada. Por conseqncia, um discriminante foi proposto com base na
256

importncia que um plano experimental deve ter para constituir um bom plano para
discriminao de modelos. A funo de ganho de informao proposta ao realizar
nada mais do que avaliar primeiramente o nmero de modelos discriminados, e, em
segundo plano, a divergncia numrica entre as respostas dos modelos. Contudo, para
fins de planejamento, necessrio prever o dado experimental ao realizar , o que foi
feito nesta tese utilizando os modelos com valores de parmetros estimados a partir de
dados experimentais iniciais. Para avaliar o critrio para um plano experimental ,
considerando que um modelo m seja verdadeiro, simula-se o dado experimental com o
modelo m e re-estimam-se os parmetros de todos os modelos n (n=1,M), avaliando a
adequabilidade dos modelos n por um teste estatstico. Isto deve ser repetido para todos
os modelos m=1,M. Por conseqncia, obtm-se um problema multiobjetivo, onde o
nmero de objetivos igual ao nmero de modelos admissveis. A etapa de reestimao de parmetros dos modelos permite avaliar a flexibilidade dos modelos para
ajustar-se a novos dados experimentais. Embora de maior complexidade numrica que
alguns discriminantes propostos na literatura, o discriminante proposto nesta tese
apresenta alguns aspectos conceituais relevantes no procedimento de discriminao de
modelos. Tambm, fornece ao pesquisador uma expectativa sobre o resultado obtido ao
se realizar , permitindo avaliar de forma mais coerente se a discriminao ser ou no
possvel.
O Captulo 10 apresentou como os problemas de estimao de parmetros e
discriminao de modelos no so distintos, mas um s. Cada possvel valor dos
parmetros (independente de sua forma matemtica) constitui-se um estado da
natureza. Logo, de acordo com o Postulado 10.1, a funo de ganho de informao
avaliada com base nos possveis estados da natureza eliminados com um conjunto de
experimentos . Conforme apresentado no Captulo 10, parece ser conveniente conferir
o mesmo peso a todos os possveis estados da natureza cuja forma matemtica idntica
(ou seja, mesmo peso aos possveis valores dos parmetros de um mesmo modelo).
Com isto, obtm-se um critrio de informao baseado na eliminao dos volumes das
regies de confiana dos parmetros dos modelos. Isto leva naturalmente ao critrio do
volume para estimao de parmetros precisos quando apenas um nico modelo
considerado. Para mltiplos modelos, os critrios de discriminao so naturalmente
includos, uma vez que a eliminao de um modelo elimina toda regio de confiana
associada ao modelo. Com isto, o critrio de informao deduzido no Captulo 10
naturalmente privilegia pontos de discriminao de modelos. Contudo, em estgios
257

iniciais, quando a incerteza paramtrica elevada, a exemplo de resultados reportados


na literatura (DONCKELS et al., 2010), o critrio busca estimar de forma mais precisa
os parmetros do modelo. Esta conciliao dos objetivos de discriminao de modelos e
estimao de parmetro , portanto, natural, sendo que ambos os problemas recebem um
nico tratamento.
O Captulo 11 estendeu os conceitos deduzidos no Captulo 10, quando o
objetivo minimizar a incerteza de predio dos modelos. O problema pode ser
entendido de forma rigorosa, conforme descrito na Seo 11.3.1, ou de forma
simplificada, conforme descrito na Seo 11.3.2. Foi implementado um algoritmo
conforme procedimento descrito na Seo 11.3.2. A funo distinta das funes de
informao obtidas na literatura que focam a predio. A razo simples: no se olha
para a preciso com que o modelo prediz as variveis, mas sim os possveis valores que
as variveis de resposta podem assumir. Desta forma, no exatamente a preciso dos
parmetros dos modelos que importa, mas sim as possveis respostas dos modelos. Com
isto, o enfoque fica centrado na predio. Pelas razes salientadas no Captulo 11, o
critrio tende a dar grande importncia para condies experimentais de discriminao
de modelos, uma vez que tais condies eliminam grande parte dos possveis valores
das variveis de resposta. Os problemas numricos associados abordagem apresentada
no Captulo 11 so provenientes de questes conceituais relevantes. A maior
complexidade numrica est associada obteno de informaes da predio dos
modelos ao longo de faixas experimentais.
Em relao ao estudo das incertezas, como concluses finais, fundamental
salientar a importncia da caracterizao das incertezas experimentais para utilizao
adequada das tcnicas de planejamento de experimentos, o que torna o estudo das
incertezas um aspecto de fundamental importncia para estudos criteriosos de ajuste de
modelos, incluindo a estimao de parmetros e o planejamento de experimentos.
Quanto ao planejamento inicial, fica evidente a dificuldade de estabelecer
planejamentos timos de experimentos quando se tem muito pouca informao dos
sistemas, o que refora a idia de aplicao de planejamentos que explorem ao mximo
a faixa experimental, tambm indicando a necessidade de desenvolvimento de novas
tcnicas para guiar o planejamento inicial de experimentos.
Como comentrios finais em relao discriminao de modelos e busca
multiobjetivo aplicada discriminao de modelos e estimao de parmetros precisos,
novas formas de tratar o problema foram propostas. No parece conveniente comparar
258

critrios, afirmando quais critrios so melhores ou piores do que outros, uma vez que a
incerteza associada aos problemas de planejamento de experimentos impede
generalizaes sobre o desempenho dos critrios. Acredita-se, contudo, que as formas
apresentadas nesta tese apresentam boa abrangncia conceitual, em certos aspectos
superiores aos critrios apresentados na literatura. A discriminao de modelos pode ser
buscada quanto ao objetivo que realmente importa ao pesquisador, o nmero de
modelos discriminados. Os desenvolvimentos apresentados nos Captulos 10 e 11
indicam como conciliar naturalmente os procedimentos e estimao de parmetros
precisos e discriminao de modelos, de acordo com o objetivo que o pesquisador
deseja, ou seja, concentrar esforos para minimizar as incertezas dos parmetros dos
modelos ou a incerteza de predio associada aos modelos.
De forma sucinta, as seguintes sugestes so apresentadas para a realizao de
trabalhos futuros:
desenvolver metodologias para iniciar o plano experimental que
apresentem pouca dependncia do conhecimento do pesquisador sobre os
modelos e faixas admissveis para os parmetros, permtindo explorar ao
mximo as condies experimentais, ponderando de forma adequada
obteno de rplicas para avaliao das incertezas experimentais e a
realizao de experimentos em condies distintas;
desenvolver e aplicar procedimentos de otimizao para todos os
problemas abordados nos Captulos 7, 8, 9, 10 e 11;
aplicar os procedimentos de planejamento timo abordados nesta tese em
problemas reais de modelagem, como, por exemplo, estudos cinticos de
reaes catalticas, problemas de transferncia de massa, etc
Por fim, esta tese se encerra com um agradecimento (quem tiver curiosidade,
veja Agradecimentos) a todos os que contriburam para sua realizao. Pelo gigantesco
aprendizado que eu tive ao longo destes quatro anos dentro do Programa de Engenharia
Qumica da COPPE/UFRJ, sou muito grato aos professores, aos colegas, aos amigos e
irmos que conquistei, e minha famlia, sempre presente. Muito obrigado a todos!!!

259

13 REFERNCIAS BIBLIOGRFICAS
ADEWALE, A. J., WIENS, D. P., 2009, "Robust Designs for Misspecified Logistic
Models", Journal of Statistical Planning and Inference, v. 139, n. 1, pp. 3-15.
AGARWAL, A. K., BRISK, M. L., 1985a, "Sequential Experimental-Design for Precise
Parameter-Estimation .1. Use of Reparameterization", Industrial & Engineering
Chemistry Process Design and Development, v. 24, n. 1, pp. 203-207.

AGARWAL, A. K., BRISK, M. L., 1985b, "Sequential Experimental-Design for


Precise Parameter-Estimation .2. Design Criteria", Industrial & Engineering
Chemistry Process Design and Development, v. 24, n. 1, pp. 207-210.

ALBERTON, A. L., SCHWAAB, M., SCHMAL, M., PINTO, J. C., 2009,


"Experimental Errors in Kinetic Tests and Its Influence on the Precision of
Estimated Parameters. Part I-Analysis of First-Order Reactions", Chemical
Engineering Journal, v. 155, n. 3, pp. 816-823.

ASPREY, S. P., MACCHIETTO, S., 2002, "Designing Robust Optimal Dynamic


Experiments", Journal of Process Control, v. 12, n. 4, pp. 545-556.
ATKINSON, A. C., 2008, "DT-Optimum Designs for Model Discrimination and
Parameter Estimation", Journal of Statistical Planning and Inference, v. 138, n.
1, pp. 56-64.
ATKINSON, A. C., COOK, R. D., 1995, "D-optimal Designs for Heteroscedastic
Linear Models", Journal of American Statistical Association, v. 90, n. 429, pp.
204-212.
ATKINSON, A. C., COX, D. R., 1974, "Planning Experiments for Discriminating
Between Models", Journal of the Royal Statistical Society Series BMethodological, v. 36, n. 3, pp. 321-348.

ATKINSON, A. C., FEDOROV, V. V., 1975a, "Design of Experiments for


Discriminating Between Two Rival Models", Biometrika, v. 62, n. 1, pp. 57-70.
260

ATKINSON, A. C., FEDOROV, V. V., 1975b, "Optimal Design - Experiments for


Discriminating Between Several Models", Biometrika, v. 62, n. 2, pp. 289-303.
ATKINSON, A. C., DONEV, A. N., 1992, Optimal Experimental Design, Oxford,
Clarendon Press.
ATKINSON, A. C., DONEV, A. N., TOBIAS, R. D., 2007, Optimal Experimental
Design, With SAS, Nova York, Oxford University Press.

BARD, Y. 1974, Nonlinear Parameter Estimation, San Diego, Academic Press.


BERNARDO, J. M., 1979, "Expected Information As Expected Utility", Annals of
Statistics, v. 7, n. 3, pp. 686-690.

BERNARDO, J. M., SMITH, A. F. M., 2000, Bayesian Theory, Nova York, John
Wiley & Sons.
BIASOLI, P. K., Modelagem Conjunta de Mdia e Varincia em Experimentos
Fracionados sem Repetio Utilizando GLM, Dissertao de Mestrado, UFRGS,

Rio Grande do Sul, Brasil.


BIEDERMANN, S., DETTE, H., PEPELYSHEV, A., 2007, "Optimal Discrimination
Designs for Exponential Regression Models", Journal of Statistical Planning
and Inference, v. 137, n. 8, pp. 2579-2592.

BLOT, W. J., MEETER, D. A., 1973, "Sequential Experimental Design Procedures",


Journal of the American Statistical Association, v. 68, n. 343, pp. 586-593.

BOX, G. E. P., 1960, "Fitting Empirical Data", Annals of the New York Academy of
Sciences, v. 86, n. 3, pp. 792-816.

BOX, G. E. P., HILL, W. J., 1967, "Discrimination Among Mechanistic Models",


Technometrics, v. 9, n. 1, pp. 57-71.

BOX, G. E. P., LUCAS, H. L., 1959, "Design of Experiments in Non-Linear


Situations", Biometrika, v. 46, n. 1-2, pp. 77-90.
BOX, G. P., DRAPER, N. R., 1987, Empirical Model Bulding and Response Surfaces,
Nova York, John Wiley & Sons.
261

BUZZI-FERRARIS, G., 2000, "Letter to Editor", Computers and Chemical


Engineering, v. 24, pp. 2037-2039.

BUZZI-FERRARIS, G., FORZATTI, P., 1983, "A New Sequential ExperimentalDesign Procedure for Discriminating Among Rival Models", Chemical
Engineering Science, v. 38, n. 2, pp. 225-232.

BUZZI-FERRARIS, G., FORZATTI, P., EMIG, G., HOFMANN, H., 1984, "Sequential
Experimental-Design for Model Discrimination in the Case of Multiple
Responses", Chemical Engineering Science, v. 39, n. 1, pp. 81-85.
BUZZI-FERRARIS, G., FORZATTI, P., CANU, P., 1990, "An Improved Version of A
Sequential Design Criterion for Discriminating Among Rival Multiresponse
Models", Chemical Engineering Science, v. 45, n. 2, pp. 477-481.
BUZZI-FERRARIS, G., MANENTI, F., 2009, "Kinetic Models Analysis", Chemical
Engineering Science, v. 64, n. 5, pp. 1061-1074.

CHAKONG, V., HAIMES, Y. Y., 1983, Multiobjective Decision Making: Theory and
Methodology, Nova York, Elsevier Science Publishing.

CHALONER, K., LARNTZ, K. 1993, Optimal Bayesian Experimental Design Applied


to Logistic Regression Experiments, Journal of Statistical Planning and
Inference, v. 21, n 2, 191-208.

CHALONER, K., VERDINELLI, I., 1995, "Bayesian Experimental Design: A


Review", Statistical Science, v. 10, n. 3, pp. 273-304.
CHERNOFF, H., MOSES, L. E., 1959, Elementary Decision Theory, Nova York,
Wiley.
CHERNOFF, H., 1953, "Locally Optimal Designs for Estimating Parameters", Annals
of Mathematical Statistics, v. 24, n. 4, pp. 586-602.

CHERNOFF, H., 1972, Sequential Analysis and Optimal Design, Philadelphia, SIAM.

262

CLYDE, M., CHALONER, K., 1996, "The Equivalence of Constrained and Weighted
Designs in Multiple Objective Design Problems", Journal of the American
Statistical Association, v. 91, n. 435, pp. 1236-1244.

COCHRAN, W. G., 1973, "Experiments for Nonlinear Functions", Journal of the


American Statistical Association, v. 68, n. 344, pp. 771-781.

COELLO-COELLO, C. A., PULIDO,G. T., LECHUGA, M. S., 2004. "Handling


Multiple Objectives With Particle Swarm Optimization". In: IEEE Transactions
on Evolutionary Computation 8, n. 3, pp. 256-279.

COOK, R. D., WEISBERG, S. 1982, "Diagnostics for Heteroscedasticity in


Regression", Biometrika, v. 70, n. 1, pp. 1-10.
COOK, R. D., WONG, W. K., 1994, "On the Equivalence of Constrained and
Compound Optimal Designs", Journal of the American Statistical Association,
v. 89, n. 426, pp. 687-692.
COVER, T., THOMAS, J., 1991, Elements of Information Theory, Nova York, John
Wiley and Sons.
DARIVA, C., OLIVEIRA, J. V., PINTO, J. C., 1998, "Experimental Design for Model
Discrimination of Thermodynamic Models", Fluid Phase Equilibria, v. 146, n.
1-2, pp. 35-50.
DEGROOT, M. H., 1962, "Uncertainty, Information, and Sequential Experiments",
Annals of Mathematical Statistics, v. 33, n. 2, pp. 404-&419.

DETTE, H. , NEUGEBAUER, H. M., 1996, "Bayesian Optimal One Point Designs for
One Parameter Nonlinear Models", Journal of Statistical Planning and
Inference, v. 52, n. 1, pp. 17-31.

DETTE, H., NEUGEBAUER, H. M., 1997, "Bayesian D-Optimal Designs for


Exponential Regression Models", Journal of Statistical Planning and Inference,
v. 60, n. 2, pp. 331-349.
DETTE, H., O'BRIEN, T. E., 1999, "Optimality Criteria for Regression Models Based
on Predicted Variance", Biometrika, v. 86, n. 1, pp. 93-106.
263

DETTE, H., WONG, W. K., 1999, "E-Optimal Designs for the Michaelis-Menten
Model", Statistics & Probability Letters , v. 44, n. 4, pp. 405-408.
DETTE, H., BIEDERMANN, S., 2003, "Robust and Efficient Designs for the
Michaelis-Menten Model", Journal of the American Statistical Association, v.
98, n. 463, pp. 679-686.
DETTE, H., MELAS, V. B., PEPELYSHEV, A., STRIGUL, N., 2003, "Efficient
Design of Experiments in the Monod Model", Journal of the Royal Statistical
Society Series B-Statistical Methodology, v. 65, n. 9 pp. 725-742.

DETTE, H., MELAS, V. B., PEPELYSHEV, A., STRIGUL, N., 2005, "Robust and
Efficient Design of Experiments for the Monod Model", Journal of Theoretical
Biology, v. 234, n. 4, pp. 537-550.

DETTE, H., LOPEZ, I. M., RODRIGUEZ, I. M. O., PEPELYSHEV, A., 2006a,


"Maximin Efficient Design of Experiment for Exponential Regression Models",
Journal of Statistical Planning and Inference, v. 136, n. 12, pp. 4397-4418.

DETTE, H., MELAS, V. B., WONG, W. K., 2006b, "Locally D-Optimal Designs for
Exponential Regression Models", Statistica Sinica, v. 16, n. 4, pp. 1447.
DETTE, H., MELAS, V. B., PEPELYSHEV, A., 2006c, "Local C- and E-Optimal
Designs for Exponential Regression Models", Annals of the Institute of
Statistical Mathematics, v. 58, n. 2, pp. 407-426.

DETTE, H., HAINES, L. M., IMHOF, L. A., 2007, "Maximin and Bayesian Optimal
Designs for Regression Models", Statistica Sinica, v. 17, n. 2, pp. 463-480.
DETTE, H., KUNERT, J., PEPELYSHEV, A., 2008, "Exact Optimal Designs for
Weighted Least Squares Analysis With Correlated Errors", Statistica Sinica, v.
18, n. 1, pp. 135-154.
DONCKELS, B. M. R., 2009, Optimal Experimental Design To Discriminate Among
Rival Dynamic Mathematical Models, PhD Thesis, Department of Applied

Mathematics, Biometrics and Process Control, Ghent University, Ghent,


Belgium.

264

DONCKELS, B. M. R., DE PAUW, D. J. W., DE BAETS, B., MAERTENS, J.,


VANROLLEGHEN, P. A., 2009, "An Anticipatory Approach to Optimal
Experimental Design for Model Discrimination", Chemometrics and Intelligent
Laboratory Systems, v. 95, n. 1, pp. 53-63.

DONCKELS, B. M. R., DE PAUW, D. J. W., VANROLLEGHEM, P. A., DE BAETS,


B., 2010, "An Ideal Point Method for the Design of Compromise Experiments to
Simultaneously Estimate the Parameters of Rival Mathematical Models",
Chemical Engineering Science, v. 65, n. 5, pp. 1705-1719.

EMMERT-STREIB, F., DEHMER, M., 2009, Information Theory and Statistics


Learning, Nova York, Springer.

EDGAR, T. F., HIMMELBLAU, D. M., 1989, Optimization of Chemical Processes,


Nova York, McGraw-Hill.
FEDOROV, V. V., 1972, Theory of Optimal Experiments, Nova York, Academic
Press.
FISHER, R., 1971, The Design of Experiments, 9 Edio, Nova York, Macmillan.
FRANCESCHINI, G., MACCHIETTO, S., 2008a, "Model-Based Design of
Experiments for Parameter Precision: State of the Art", Chemical Engineering
Science, v. 63, n. 19, pp. 4846-4872.

FRANCESCHINI, G., MACCHIETTO, S., 2008b, "Novel Anticorrelation Criteria for


Model-Based Experiment Design: Theory and Formulations", AIChE Journal, v.
54, n. 4, pp. 1009-1024.
FRANCKAERTS, J., FROMENT, G. F., 1964, "Kinetic Study of the Dehydrogenation
of Ethanol", Chemical Engineering Science, v. 19, n. 10, pp. 807-818.
FORZATTI, P., FERRARIS, G. B., TRONCONI, E., 1986, "Sequential Design of
Experiments .1. A Review of the Procedures for Discriminating Between Rival
Models", Chimica & LIndustria, v. 68, n. 4, pp. S8-S11.

265

FROMENT, G. F., MEZAKI, R., 1970, "Sequential Discrimination and Estimation


Procedures for Rate Modeling in Heterogeneous Catalysis", Chemical
Engineering Science, v. 25, n. 2, pp. 293-301.

GILBERT, E. N., 1958, "An Outline of Information-Theory", American Statistician, v.


12, n. 1, pp. 13-19.
GINEBRA, J., 2007, "On the Measure of the Information in a Statistical Experiment",
Bayesian Analysis, v. 2, n. 1, pp. 167-211.

GRABE, M., 2010, Generalized Gaussian Errors, Berlim, Spring-Verlag.


GUTIERREZ, O. A., CHAVEZ, M., LISSI, E., 2004. A Theoretical Approach to Some
Analytical

Properties

of

Heterogeneous

Enzymatic

Assays,

Analytical

Chemistry, v. 76, n. 9, pp. 26642668.

GUTIERREZ, O. A., DANIELSON, U. H., 2006, "Sensitivity Analysis and Error


Structure of Progress Curves", Analytical Biochemistry, v. 358, n. 1, pp. 1-10.
HARTLEY, R. V. L., 1928, Transmission of Information, The Bell System Technical
Journal, v. 7, n 3, pp. 535-563.

HAINES, L. M., 1995, "A Geometric Approach to Optimal-Design for One-Parameter


Nonlinear Models", Journal of the Royal Statistical Society Series BMethodological, v. 57, n. 3, pp. 575-598.

HILL, P. D. H., 1978, "Review of Experimental-Design Procedures for RegressionModel Discrimination", Technometrics, v. 20, n. 1, pp. 15-21.
HILL, W. J., HUNTER, W. G., WICHERN, D. W., 1968, "A Joint Design Criterion for
Dual

Problem

of

Model

Discrimination

and

Parameter

Estimation",

Technometrics, v. 10, n. 1, pp. 145-160.

HUNTER, W. G., REINER, A. M., 1965, "Designs for Discriminating Between 2 Rival
Models", Technometrics, v. 7, n. 3, pp. 307-323.
IMHOF, L., WONG, W. K., 2000, "A Graphical Method for Finding Maximin
Efficiency Designs", Biometrics, v. 56, n. 1, pp. 113-117.

266

JAROSCH, K., EL SOLH, T., DE LASA, H. I., 2002, Modelling The Catalytic Steam
Reforming Of Methane: Discrimination Between Kinetic Expressions Using
Sequentially Designed Experiments, Chemical Engineering Science, v. 57, n.
16 , pp. 3439-3451.
JEFFREYS, H., 1946, "An Invariant Form for the Prior Probability in Estimation
Problems", Proceedings of the Royal Society of London Series A-Mathematical
and Physical Sciences, v. 186, n. 1007, pp. 453-461.

KALOGERAKIS, N., LUUS, R., 1984, "Sequential Experimental-Design of DynamicSystems Through the Use of Information Index", Canadian Journal of Chemical
Engineering, v. 62, n. 6, pp. 730-737.

KENNEDY, J., EBERHART, R.C., 2001. Swarm Intelligence, San Diego, Morgan
Kaufmann Publishers.
KIEFER, J., 1959, "Optimum Experimental-Designs", Journal of the Royal Statistical
Society Series B-Statistical Methodology, v. 21, n. 2, pp. 272-319.

KIEFER, J., WOLFOWITZ, J. 1960, "The Equivalence of Two Extremum Problems ",
Canadian Journal of Mathematics, v. 12, pp. 363-366.

KONISHI, S., KITAGAWA, G., 2008, Information Criteria and Statistical Modeling,
Nova York, Springer.
KULLBACK, S., 1959, Information Theory and Statistics, Nova York, John Wiley
and Sons.
KULLBACK, S., LEIBLER, R. A., 1951, "On Information and Sufficiency", Annals of
Mathematical Statistics, v. 22, n. 1, pp. 79-86.

LARENTIS, A. L., BENTES, A. M. P., RESENDE, N. S., SALIM, V. M. M., PINTO,


J. C., 2003, "Analysis of Experimental Errors in Catalytic Tests for Production of
Synthesis Gas", Applied Catalysis A-General, v. 242, n. 2, pp. 365-379.
LAZIC, Z. R., 2004, Design of Experiments in Chemical Engineering, Weinhein,
Wiley VCH Verlag.

267

LAUTER, E., 1974, "Experimental design in a Class of Models", Mathematische


Operationsforschung und Statistik, Serie Statistik, v. 5, pp. 379-398.

LINDLEY, D. V., 1956, "On A Measure of the Information Provided by An


Experiment", Annals of Mathematical Statistics, v. 27, n. 4, pp. 986-1005.
LINDLEY D.V., 1972, Bayesian Statistics, a Review, Philadelphia, SIAM.
LOPEZ-FIDALGO, J., TOMMASI, C., TRANDAFIR, P. C., 2007, "An Optimal
Experimental Design Criterion for Discriminating Between Non-Normal
Models", Journal of the Royal Statistical Society Series B-Statistical
Methodology, v. 69, n.2, pp. 231-242.

LOPEZ-FIDALGO, J., TOMMASI, C., TRANDAFIR, P. C., 2008, "Optimal Designs


for Discriminating Between Some Extensions of the Michaelis-Menten Model",
Journal of Statistical Planning and Inference, v. 138, n. 12, pp. 3797-3804.

MIETTINEN, K., 2008, "Introduction to Multiobjective Optimization: Noninteractive


Approaches". In: BRANKE, J., MIETTINEN, K., DEB, K., SLOWINSKI, R.,
Multiobjective Optimization: Interactive and Evolutionary Approaches,

Captulo 1, Berlim, Spring-Verlag, pp. 1-26.


MONTGOMERY, D. C., RUNGER, G. C., 2009, Estatstica Aplicada e Probabilidade
Para Engenheiros, 4 Ed, Rio de Janeiro, LTC.

MLLER, P., PARMIGIANI, G., 1995, Optimal Design Via Curve Fitting of Monte
Carlo Experiments, Journal of the American Statistical Association, v. 90, n
432, pp.1332-1330.
OBRIEN, T. E., RAWLINGS, J. O., 1996, A nonsequential design procedure for
parameter estimation and model discrimination in nonlinear regression models,
Journal of Statistical and Planning Inference, v. 55, n 1, pp 77-93.

OLIVEIRA, S. L., 1997, Planejamento Sequencial de Experimentos para


Discriminao de Modelos, Dissertao de Mestrado, COPPE/UFRJ, Rio de

Janeiro, Brasil.

268

PEREIRA, J. A. M., SCHWAAB, M., DELL'ORO, E., PINTO, J. C., MONTEIRO, J.


L. F., HENRIQUES, C. A., 2009, "The Kinetics of Gibbsite Dissolution in
NaOH", Hydrometallurgy, v. 96, n. 1-2, pp. 6-13.
PARMIGIANI, G., 2004, "Decision Theory: Bayesian", International Encyclopedia of
the Social & Behavioral Sciences, pp. 3327-3334.

PARMIGIANI, G., INOUE, L., 2009, Decision Theory: Principles and Approaches,
John Wiley & Sons.
PETROV, L. A., ELIYAS, A. E., MAXIMOV, C. S., 1991, "Difficulties in the
Application of Sequential Experimental-Design to Kinetic-Model Discrimination
and Parameter-Estimation", Industrial & Engineering Chemistry Research, v.
30, n. 4, pp. 639-645.
PINTO, J. C., LOBAO, M. W., MONTEIRO, J. L., 1990, "Sequential ExperimentalDesign for Parameter-Estimation - A Different Approach", Chemical
Engineering Science, v. 45, n. 4, pp. 883-892.

PINTO, J. C., LOBAO, M. W., MONTEIRO, J. L., 1991, "Sequential ExperimentalDesign for Parameter-Estimation - Analysis of Relative Deviations", Chemical
Engineering Science, v. 46, n. 12, pp. 3129-3138.

PINTO, E. R., PONCE DE LEON, A. C. M., 2006a, Planejamento timo de


experimentos, So Paulo, Associao Brasileira de Estatstica.

PINTO, E. R., PONCE DE LEON, A. C. M., 2006b, Bayesian DS-Optimal Designfor


Generalized Linear Models with Varying Dispersion Parameter, In: LOPEZFIDALGO, J., RODRIGUEZ-DIAS, J.M., TORSNEY, B. (eds), mODa 8:
Advances in Model-Oriented Design and Analysis, Heidelberg, Physica-Verlag,

pp. 181-188.
PONCE DE LEON, A. C. M., ATKINSON, A. C., 1991, "Optimum ExperimentalDesign for Discriminating Between 2 Rival Models in the Presence of Prior
Information", Biometrika, v. 78, n. 3, pp. 601-608.

269

PRITCHARD, D. J., BACON, D. W., 1978, "Prospects for Reducing Correlations


Among Parameter Estimates in Kinetic-Models", Chemical Engineering
Science, v. 33, n. 11, pp. 1539-1543.

REILLY, P. M., 1970, "Statistical Methods in Model Discrimination", Canadian


Journal of Chemical Engineering, v. 48, n. 2, pp. 168-173.

ROTH, P. M., 1965, Design of experiments for discrimination among rival models,
Ph.D. Thesis, Princeton University, Nova Jersey, USA.
SANE, P. P., WOODS, J. M., ECKERT, R. E., 1973, "Sequential Design of Initial
Experiments for Chemical Kinetic Modeling Isomerization of N-Pentane",
Chemical Engineering Science, v. 28, n. 8, pp. 1609-1616.

SANTOS, T. J., PINTO, J. C., 1998, "Taking Variable Correlation into Consideration
During Parameter Estimation", Brazilian Journal of Chemical Engineering, v.
15, n. 1, pp. 1-20.
SANTOS, T. J., MONTEIRO, J. L., PINTO, J. C., 2002, "Algoritmo Para Previso De
Planos Experimentais Seqenciais", XIV Congresso Brasileiro De Engenharia
Qumica, 2002, Natal.

SEVERO Jr., J.B., 2007, Sntese Biocataltica Do Sorbitol E cido Lactobinico Com
Separao Simultnea Por Eletrodilise, Dissertao de MSc., COPPE/UFRJ,

Rio de Janeiro, RJ, Brasil.


SCHWAAB, M., 2007, Desenvolvimento e Implementao de Novas Tcnicas de
Estimao de Parmetros e Planejamento Seqencial de Experimentos, Tese de

DSc., COPPE/UFRJ, Rio de Janeiro, RJ, Brasil.


SCHWAAB, M., SILVA, F. M., QUEIPO, C. A., BARRETO Jr., A. G., NELE, M.,
PINTO, J. C., 2006, "A New Approach for Sequential Experimental Design for
Model Discrimination", Chemical Engineering Science, v. 61, n. 17, pp. 57915806.

270

SCHWAAB, M., BISCAIA, E. C., MONTEIRO, J. L., PINTO, J. C., 2008a, "Nonlinear
Parameter Estimation through Particle Swarm Optimization", Chemical
Engineering Science, v. 63, n. 6, pp. 1542-1552.

SCHWAAB, M., LEMOS, L. P., PINTO, J. C., 2008b, "Optimum Reference


Temperature for Reparameterization of the Arrhenius Equation. Part 2: Problems
Involving Multiple Reparameterizations", Chemical Engineering Science, v. 63,
n. 11, pp. 2895-2906.
SCHWAAB, M., MONTEIRO, J. L., PINTO, J. C., 2008c, "Sequential Experimental
Design for Model Discrimination - Taking into Account the Posterior Covariance
Matrix of Differences Between Model Predictions", Chemical Engineering
Science, v. 63, n. 9, pp. 2408-2419.

SCHWAAB, M., PINTO, J. C., 2007, Anlise De Dados Experimentais I:


Fundamentos De Estatstica e Estimao De Parmetros, Rio de Janeiro, E-

Papers.
SCHWAAB, M., PINTO, J. C., 2007b, "Optimum Reference Temperature for
Reparameterization of the Arrhenius Equation. Part 1: Problems Involving One
Kinetic Constant", Chemical Engineering Science, v. 62, n. 10, pp. 2750-2764.
SCHWAAB, M., ALBERTON, A. L., PINTO, J. C., 2010, Estima II: Pacote de
Planejamento de Experimentos e Estimao de Parmetros, Relatrio Tcnico,

Universidade Federal do Rio de Janeiro.


SCHWAAB, M., PINTO, J. C., 2008, "Optimum Reparameterization of Power Function
Models", Chemical Engineering Science, v. 63, n. 18, pp. 4631-4635.
SHANNON, C. E., 1948, "A Mathematical Theory of Communication", Bell System
Technical Journal, v. 27, n. 3, pp. 379-423.

SILVA, C. M., 2003, Otimizao multiobjetivo de processos qumicos por estratgias


evolucionrias, Tese de DSc., COPPE/UFRJ, Rio de Janeiro, RJ, Brasil.

SINGPURWALLA, N. D., 2006, Reliability and Risk: A Bayesian Perspective, West


Sussex, John Wiley & Sons.

271

SOOFI, E. S., 1994, "Capturing the Intangible Concept of Information", Journal of the
American Statistical Association, v. 89, n. 428, pp. 1243-1254.

STOICA, P. , SELEN, Y., 2004, "Model-Order Selection", Ieee Signal Processing


Magazine, v. 21, n. 4, pp. 36-47.

STRIGUL, N., DETTE, H., MELAS, V. B., 2009, "A Practical Guide for Optimal
Designs of Experiments in the Monod Model, Environmental Modelling &
Software, v. 24, n. 9, pp. 1019-1026.

TOMMASI, C., 2007, "Optimal Designs for Discriminating Among Several NonNormal Models", In: LOPEZ-FIDALGO, J., RODRIGUEZ-DIAS, J.M.,
TORSNEY, B. (eds), mODa 8: Advances in Model-Oriented Design and
Analysis, Heidelberg, Physica-Verlag, pp. 213-220.

TOMMASI, C., 2009, "Optimal Designs for Both Model Discrimination and Parameter
Estimation", Journal of Statistical Planning and Inference, v. 139, n. 12, pp.
4123-4132.
TOMMASI, C., LOPEZ-FIDALGO, J., 2010, "Bayesian Optimum Designs for
Discriminating Between Models With Any Distribution", Computational
Statistics & Data Analysis, v. 54, n. 1, pp. 143-150.

WALD, A., 1947, Sequential Analysis, Nova York, Wiley.


WASSERMAN, L., 2006, All of Nonparametric Statistics, Nova York, SpringerVerlag.
WHITE, L. V., 1973, "Extension of General Equivalence Theorem to Nonlinear
Models", Biometrika, v. 60, n. 2, pp. 345-348.

272

APNDICES

273

APNDICE A Deduo da matriz V


A MATRIZ HESSIANA E A APROXIMAO DE GAUSS
A matriz Hessiana comumente utilizada em problemas de minimizao e
representa a derivada segunda da funo objetivo em relao s variveis de projeto. No
caso de estimao de parmetros, em que se minimiza a funo objetivo em relao aos
parmetros do modelo, a matriz Hessiana definida como:

(E.A1)

2 F

2
1
2 F

Hes 1 2

....
2 F

1 Np

2 F
1 2
2 F
22
....
2 F
2 Np

2 F

1 Np
2 F

....
2 Np

....
....
2 F
....

2
Np

....

O clculo da matriz Hessiana pode ser feito da seguinte forma:

(E A.2a)

(E A.2b)

Hes

T
2 F

Z exp Z est VZ 1 Z exp Z P

T
Z est
Z est
1
exp
est
exp
est T
1

Hes
V
Z
Z
Z
Z
V

(E A.2c)

Z est
2
VZ 1 Z exp Z est
Hes

(E A.2d)

T
est
Z est T

2 Z est
1 Z
VZ

VZ 1 Z exp Z est
Hes 2

Pode-se observar na Equao (E A.2e) que h um termo envolvendo a derivada


segunda dos valores calculados em relao aos valores estimados com o modelo. Neste
caso, costuma-se utilizar a aproximao de Gauss, que consiste em admitir que os

274

desvios eventualmente observados entre o modelo e os experimentos apresentam mdia


zero, de maneira que E{Zexp-Zest}=0. Assim, a matriz Hessiana fica:
T

(E A.3)

est
Z est

1 Z
Hes 2
VZ

Z est
O termo
corresponde derivada das variveis Z em relao aos

parmetros nas condies de e Z que foram obtidas no procedimento de estimao;


Z
.
ou seja,

Z est ,est

OBTENDO V
Pode-se supor que os dados experimentais esto sujeitos oscilaes Zest+Z,
resultando em parmetros tambm sujeitos a oscilaes est+, de forma que a funo
objetivo pode ser escrita na forma:

(E A.4a)

F
0
Z est ,est

(E A.4b)

F
0
Z est Z ,est

Expandido em srie de Taylor a Equao (E A.4b) em relao a e Z:

(E A.5)

Z est ,est

Z Z est ,est

Z 0

O primeiro termo da equao acima representa a matriz Hessiana; i.e., a matriz


de derivadas segundas da funo objetivo em relao aos parmetros. Ento, a variao
nos parmetros pode ser escrita em termos da variao nas variveis medidas da
seguinte forma:

275

(E A.6)

Hes 1

F
Z

Z Z est ,est

A matriz de covarincias das incertezas paramtricas dos parmetros, V,


definida pela seguinte esperana:

(E A.7)

V E T

Cada elemento da matriz V, , por definio, escrito como:

(E A.8)

vij E i j

Portanto, substituindo a Equao (E A.6) na Equao (E A.7), a matriz de


covarincias das incertezas paramtricas fica:

(E A.9a)

T
2
2

T F
1 F
1

V E Hes
Z
Z
Hes

Z Z est ,est
Z Z est ,est

(E A.9b)

2 F
2 F
T
V Hes
E Z Z
Hes 1

Z Z est ,est
Z Z est ,est
1

A esperana E{Z, ZT} igual matriz de incertezas experimentais VZ; logo:


T

(E A.10)

2 F
2 F
VZ
V Hes
Hes 1

Z Z est ,est
Z Z est ,est
1

Todas as derivadas so avaliadas nas condies dos parmetros estimados, logo,


por simplicidade de notao, no ser apresentado nas equaes que as derivadas so
2
avaliadas em relao s condies dos parmetros estimados. O termo F

pode

ser escrito como:

276

(E A.11a)

2F

Z Z

(E A.11b)

T
2 F

2
Z exp Z est VZ 1

(E A.11c)

Z est T

2 F
1

V
Z
Z

exp

Z est VZ 1 Z exp Z est


T

Assim, a matriz de covarincias das incertezas paramtricas pode ser escrita


como:
T

(E A.12a)

est
Z est
1
1 Z

V 4 Hes
V
V
V
Z

Z
Z


1

(E A.12b)

est
Z est
1 Z

V 4 Hes
V
Z


1

1
Hes

1
Hes

Substituindo a Equao (E A.3) na Equao (E A.12), tem-se que:

(E A.13a)

V 4 Hes 1

(E A.13b)

V 2 Hes 1

Hes
Hes 1
2

que pode ser obtida a partir dos dados experimentais da seguinte forma pela Equao (E
A.3):

(E A.14)

est
Z est T
1 Z
V
V
Z

Na formulao acima, a matriz V engloba todas as variveis que devem ser


estimadas, minimizando-se a funo objetivo. Isto inclui os valores dos parmetros do
modelo propriamente ditos e os valores das variveis de projeto que devem ser
reconciliadas. Neste sentido, no h diferena entre o procedimento de estimao e o
procedimento de reconciliao de dados. Ambos os procedimentos consistem em
277

encontrar valores de variveis desconhecidas para ajustar dados experimentais com base
no princpio de mxima-verossimilhana. Na formulao acima, cada varivel de sada
reconciliada poderia ser considerada como um parmetro a ser estimado. Alm disto, a
forma apresentada da Equao (E A.14) permite obter correlaes entre os parmetros e
as variveis reconciliadas.

278

APNDICE B
MATRIZ DE INFORMAO DE FISHER
Para a distribuio normal de dados, segundo a Equao (E 3.1), pode-se
observar que:

T
1
1

ln
exp Z exp Z est VZ 1 Z exp Z est
2 Pi det VZ
2

ln Z

(E B.1a)

(E B.1b)

ln Z


1
ln
2 Pi det VZ

1 exp
est T
est
1
exp
ln exp Z Z VZ Z Z
2

1
T
ln
ln exp 1 Z exp Z est VZ 1 Z exp Z est

2 Pi det VZ
2

(E B.1c) ln Z

T
1

Z exp Z est VZ 1 Z exp Z est


ln Z
2


(E B.1d)

Z
T
ln Z
1
(E B.1e)
Z exp Z est VZ 1

est

1 Z V
est

Z exp Z est

Z est
ln Z
(E B.1f)

VZ 1 Z exp Z est

Considerando-se que o valor verdadeiro dos parmetros possa ser representado


pelo valor estimado (princpio de mxima-verossimilhana), a integrao em relao
aos parmetros pode tambm ser representada pela integrao em relao s variveis
experimentais, considerando que os parmetros verdadeiros sejam iguais aos parmetros
estimados. Assim:

ln Z ln Z T
(E B.2) J E

EZ

ln Z ln Z

est

279

que fica na forma:


T

est T
Z est T

Z

(E B.3) J EZ
VZ 1 Z exp Z est
VZ 1 Z exp Z est

Pela natureza quadrtica da matriz J e VZ, tem-se:


T

(E B.4)

est
Z est T

1
exp
exp
1 Z
est
est T

VZ Z Z Z Z VZ

Logo, pode-se escrever:


T
est


Z est
1
exp
exp
1 Z
est
est T

J EZ
V
Z
Z
Z
Z
V

(E B.5)

A matriz VZ e os termos envolvendo as derivadas so constantes (admitindo-se


que os parmetros verdadeiros so iguais aos parmetros estimados, segundo o princpio
de mxima-verossimilhana). Portanto:
T

(E B.6a)

est
Z est

1
exp
exp
1 Z
est T
est
J
VZ E Z Z Z Z VZ

(E B.6b)

est
Z est

1
1 Z

J
V
V
V
Z

Z
Z

(E B. 6c)

est
Z est

1 Z

J
V
Z

que uma forma anloga forma obtida pela Equao (E A.14), onde J=V-1.

280

APNDICE C
SIGNIFICADO ESTATSTICO DO TESTE-F DE FISHER
Sejam duas varincias amostrais, s12 e s22, obtidas a partir de dois conjuntos de
dados, com Nx1 e Nx2 pontos, respectivamente. Logo, os graus de liberdade das duas
amostras so 1 =Nx1-1 e 2 =Nx2-1, respectivamente. Sejam 12 e 22 as varincias
verdadeiras das populaes 1 e 2, respectivamente. Definindo-se FF como a seguinte
razo:
s12

(E C.1)

FF

s22

12
22

a distribuio de probabilidades da varivel FF descrita pela distribuio FF de Fisher


com 1 e 2 graus de liberdade, dada por (SCHWAAB e PINTO, pp 166):

(E C.2)

1

1
1 2 1 1
F 2
2 2 2

1 2
P ( F , 1 , 2 )
1 2
1 2
2

F

1
2
2 2

Se as varincias forem iguais, ou seja, as populaes 1 e 2 possurem a mesma


varincia verdadeira, ento a razo FF fica:

(E C.3)

s12
FF 2
s2

Obviamente, se as populaes forem idnticas, a equao acima vlida. A


distribuio F de Fisher utilizada para comparar duas varincias amostrais. Neste
caso, com grau de confiana , as varincias no so ditas estatisticamente diferentes se:

(E C.4)

FFmin

s12
FFmax
s22

281

onde FFmin e FFmax so os valores da funo F-Fisher com probabilidade acumulada


1 1

e
, respectivamente, definidas como:
2 2

(E C.5a)

Pr
, 1 , 2 Fmin
2

(E C.5b)

Pr
, 1 , 2 Fmax
2

onde Pr a probabilidade acumulada da funo F-Fisher e grau de confiana.


Desta forma, pode-se descrever o significado estatstico da distribuio F de
Fisher quando se comparam duas varincias amostrais.

Sejam duas populaes que possuem a mesma varincia verdadeira;

Sejam feitos o conjunto de experimentos para a populao 1 com Nx1


experimentos e para a populao 2 com Nx2 experimentos, calculando-se
posteriormente as varincias amostrais s12 e s22 e a razo FF= s12/s22;

Se o procedimento descrito no pargrafo anterior for repetido infinitas


1
vezes,
% das vezes os valores de FF estaro abaixo da
2
1

probabilidade acumulada de F, Pr
, 1 , 2 ; analogamente,
2

% das vezes os valores de FF estaro acima da probabilidade


2
1

acumulada de FF, Pr
, 1 , 2
2

Logo, o grau de confiana a porcentagem de vezes em que esperamos


encontrar a razo das varincias dentro da faixa especificada na Equao (E C.4).
Se a razo FF no se encontrar dentro da faixa especificada pela Equao (E
C.4), duas explicaes so possveis: (i) a primeira que as varincias so de fato
diferentes; (ii) a segunda que as varincias so iguais, mas os experimentos levaram a
resultados de FF com baixa probabilidade (quer dizer, com % de confiana, pode-se
dizer que o cidado que fez os experimentos muito azarado!!!!!!).

282

APNDICE D
OBTENO DA MATRIZ VZP
A varincia de predio pode ser obtida pela seguinte esperana:

(E D.1)

VZP E Z Z T

O princpio de mxima-verossimilhana admite que o valor verdadeiro dos


parmetros igual ao estimado com os experimentos que foram realizados (verd= est).
Como conseqncia, os valores verdadeiros de Z so considerados iguais aos obtidos
com o modelo. Expandindo em srie de Taylor a varivel Z, tem-se que:

(E D.2a)

Z
est
Z Z est

(E D.2b)

Z
Z

Substituindo a Equao (E D.2b) na Equao (E D.1), tem-se que:

(E D.3)

T
Z

Z
est
est
V E





P
Z

que pode ser escrito como:

(E D.4)

T
Z

est
est T Z
V E




P
Z

Pelo princpio de mxima-verossimilhana, verd= est; logo, as derivadas em


relao ao valor verdadeiro podem ser admitidas iguais s derivadas nos valores
estimados dos parmetros, sendo consideradas constantes. Logo:

283

(E D.4)

Z
est
est T Z
V
E



P
Z

Mas:

(E D.5)

E est est

Portanto, tem-se que:


T

(E D.6)

Z
Z
V
V



P
Z

Este o componente da varincia de predio devido incerteza nos parmetros


do modelo. A varincia total deve levar em conta tambm a varincia experimental VZ.
A necessidade de incluir a varincia experimental pode ser demonstrada pelo mtodo de
reduo ao absurdo. Pode-se supor que o nmero de pontos experimentais tenha sido
to elevado que os parmetros so conhecidos com preciso mxima, de forma que
T

Z
Z
V0. Nesta condio, o termo
V
0. Contudo, ao fazer um


experimento em uma dada condio, o experimentador no pode esperar obter o dado
com preciso maior do que a preciso experimental (VZ). Ou seja, para fins prticos, a
incerteza na predio do modelo deve incluir a incerteza da predio experimental, ou
seja:
T

(E D.7)

Z
Z
V
V
VZ


P
Z

284

APNDICE E
EXEMPLO DO GANHO DE INFORMAO DE LINDLEY
Seja um modelo exponencial na forma:
(E E.1)

y 10 e x

Admite-se que a varincia experimental vy constante e igual a 1. Neste


exemplo, foram feitos trs experimentos iniciais apresentados na Tabela A.1
Tabela A.1 Experimentos iniciais do Exemplo
x

0,5

6,5897

0,7

4,7640

0,8

3,9689

A estimao do parmetro resulta no valor de est=1.02898. A varincia 2 pode


ser calculada como:

(E E.2)

x1 e

est x1

x2 e

est x2

x3 e est x3

0.03042

Neste caso, a distribuio de probabilidade do parmetro admitida normal,


sendo descrita por:

(E E.3)

1.02898 2
1


exp

2 0.03042
2 0.03042

Agora se deseja avaliar qual o ganho de informao obtido quando se fazer um


experimento em x igual a 1. Suponha que o experimento tenha resultado em um valor de
y igual a 3.2934. Realizando-se novamente a estimao de parmetros, tem-se que est =
1.05074 e 2 igual a 0.02265. A probabilidade do parmetro fica:

285

(E E.4)

1.05074 2
1

y*
exp

2 0.02265
2 0.02265

O ganho de informao resultante do experimento, segundo a informao de


Lindley, fica na forma:

(E E.5)

Lindley y* ln

y*
d
y*

Avaliando a integral pelo software MAPLE 12 , tem-se que:


(E E.6)

Lindley 0.0298

Este ganho no deve ser avaliado como valor absoluto, mas sim como um
comparativo com os outros experimentos.

286

Você também pode gostar