Escolar Documentos
Profissional Documentos
Cultura Documentos
Departamento de Matematica
Notas de Aula
Otimiza cao Escalar e Vetorial
Volume 1: Conceitos Preliminares
Professor: Ricardo H. C. Takahashi
Belo Horizonte, Janeiro de 2007
Conte udo
I Introdu cao e Conceitos Preliminares 6
1 Introdu cao 7
1.1 Otimiza c ao em Projeto Assistido por Computador . . . . . . . 7
1.2 Sistemas de Projeto Assistido por Computador . . . . . . . . . 9
1.3 Otimiza c ao em PAC . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.1 A Abordagem Escalar . . . . . . . . . . . . . . . . . . 12
1.3.2 A Abordagem Vetorial . . . . . . . . . . . . . . . . . . 16
1.4 Formula c ao do Problema de Otimiza c ao Vetorial . . . . . . . . 17
1.4.1 Etapa de Determina c ao das Solu c oes Ecientes . . . . 17
1.4.2 Etapa de Decis ao . . . . . . . . . . . . . . . . . . . . . 18
2 Deni c oes de Referencia 20
2.1 Espa cos e Normas . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Espa cos Topol ogicos . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 Cones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4 Hiperplanos e Poliedros . . . . . . . . . . . . . . . . . . . . . . 28
3 Caracteriza cao das Fun c oes 29
3.1 Superfcies de Nvel e Modalidade . . . . . . . . . . . . . . . . 30
3.1.1 Bacias de Atra c ao . . . . . . . . . . . . . . . . . . . . . 32
3.2 Continuidade e Diferenciabilidade . . . . . . . . . . . . . . . . 32
3.3 Convexidade e Quasi-Convexidade . . . . . . . . . . . . . . . . 33
3.4 Mnimos Locais e Mnimos Globais . . . . . . . . . . . . . . . 36
3.5 Caracteriza c ao dos Mnimos Locais . . . . . . . . . . . . . . . 37
4 Convergencia de Algoritmos 42
4.1 Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1
CONTE
UDO 2
II Otimiza cao Escalar 46
5 Interpreta cao Geometrica 47
5.1 O Jogo da Otimiza c ao . . . . . . . . . . . . . . . . . . . . . . 47
5.1.1 Formula c ao do Problema de Otimiza c ao . . . . . . . . 48
5.1.2 As Regras do Jogo . . . . . . . . . . . . . . . . . . . . 54
5.2 Otimiza c ao Sem Restri c oes . . . . . . . . . . . . . . . . . . . . 57
5.2.1 Estrategias de Dire c ao de Busca . . . . . . . . . . . . . 62
5.2.2 Estrategias de Exclus ao de Regi oes . . . . . . . . . . . 67
5.2.3 Estrategias de Popula c oes . . . . . . . . . . . . . . . . 74
5.3 Otimiza c ao com Restri c oes de Desigualdade . . . . . . . . . . 80
5.3.1 Interpreta c ao geometrica de uma restri c ao de desigual-
dade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.3.2 Interpreta c ao geometrica de v arias restri c oes de desi-
gualdade . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.3.3 Barreiras e Penalidades . . . . . . . . . . . . . . . . . . 85
5.3.4 Composi c ao pelo M aximo . . . . . . . . . . . . . . . . 89
5.4 Otimiza c ao com Restri c oes de Igualdade . . . . . . . . . . . . 90
5.5 Otimiza c ao Linear . . . . . . . . . . . . . . . . . . . . . . . . 93
6 Dire c oes de Busca 98
6.1 Estrutura B asica . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Busca em Dire c oes Aleat orias . . . . . . . . . . . . . . . . . . 100
6.3 Algoritmo do Gradiente . . . . . . . . . . . . . . . . . . . . . 102
6.3.1 C alculo do Gradiente . . . . . . . . . . . . . . . . . . . 103
6.3.2 Otimiza c ao Unidimensional . . . . . . . . . . . . . . . 104
6.3.3 Criterios de Parada . . . . . . . . . . . . . . . . . . . . 108
6.3.4 Convergencia . . . . . . . . . . . . . . . . . . . . . . . 112
6.4 Aproxima c oes Quadr aticas . . . . . . . . . . . . . . . . . . . . 115
6.4.1 Algoritmo de Newton . . . . . . . . . . . . . . . . . . . 118
6.4.2 Metodo de Newton Modicado . . . . . . . . . . . . . 119
6.4.3 Determina c ao Numerica da Hessiana . . . . . . . . . . 122
6.4.4 Constru c ao da Hessiana . . . . . . . . . . . . . . . . . 122
6.4.5 Corre c ao de Posto 1 . . . . . . . . . . . . . . . . . . . 124
6.4.6 Metodos Quasi-Newton . . . . . . . . . . . . . . . . . . 129
6.5 Tratamento de Restri c oes . . . . . . . . . . . . . . . . . . . . 132
6.5.1 Metodo de Barreira . . . . . . . . . . . . . . . . . . . . 132
6.5.2 Metodo de Penalidades . . . . . . . . . . . . . . . . . . 133
CONTE
UDO 3
6.6 Comportamento dos Metodos de Dire c ao de Busca . . . . . . . 135
6.6.1 N ao-Diferenciabilidade . . . . . . . . . . . . . . . . . . 135
6.6.2 N ao-Convexidade . . . . . . . . . . . . . . . . . . . . . 137
6.6.3 Multimodalidade . . . . . . . . . . . . . . . . . . . . . 138
7 Exclusao de Semi-Espa cos 139
7.1 Formula c ao Geral . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.2 Metodos de Planos de Corte . . . . . . . . . . . . . . . . . . . 141
7.2.1 Algoritmo de Planos de Corte de Kelley . . . . . . . . 144
7.3 Algoritmo Elipsoidal . . . . . . . . . . . . . . . . . . . . . . . 144
7.3.1 Algoritmo Elipsoidal com Deep Cut . . . . . . . . . 146
7.4 Tratamento de Restri c oes . . . . . . . . . . . . . . . . . . . . 147
7.5 Caractersticas de Comportamento . . . . . . . . . . . . . . . 149
7.5.1 Descontinuidades e N ao-Diferenciabilidade . . . . . . . 149
7.5.2 N ao-Convexidade . . . . . . . . . . . . . . . . . . . . . 150
7.5.3 Multimodalidade . . . . . . . . . . . . . . . . . . . . . 150
7.5.4 Velocidade de Convergencia . . . . . . . . . . . . . . . 150
7.6 Algoritmo Cone-Elipsoidal . . . . . . . . . . . . . . . . . . . . 151
7.7 Deni c ao do Problema . . . . . . . . . . . . . . . . . . . . . . 152
7.8 Metodo Elipsoidal Convencional . . . . . . . . . . . . . . . . . 152
7.8.1 Problemas Difceis para o Metodo Convencional . . . . 153
7.9 Cones das Dire c oes Factibilizantes . . . . . . . . . . . . . . . . 155
7.10 O Metodo Cone-Elipsoidal . . . . . . . . . . . . . . . . . . . . 157
7.10.1 Primeira Reformula c ao do Problema . . . . . . . . . . 158
7.10.2 Segunda Reformula c ao do Problema . . . . . . . . . . . 160
7.11 O Algoritmo MCE . . . . . . . . . . . . . . . . . . . . . . . . 163
7.12 N ao-Convexidade de Restri c oes de Igualdade . . . . . . . . . . 164
7.13 Conclus oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
8 Otimiza cao por Popula c oes 167
8.1 Algoritmo Evolucion ario Simples . . . . . . . . . . . . . . . . 169
8.2 Algoritmo de Simulated Annealing . . . . . . . . . . . . . . . 170
8.3 Algoritmos Geneticos . . . . . . . . . . . . . . . . . . . . . . . 173
8.3.1 Algoritmo Genetico - Codica c ao Bin aria . . . . . . . . 174
8.3.2 Algoritmo Genetico - Codica c ao Real - Polarizado . . 176
8.4 Sobre a Estrutura do AG-B e do AG-RP . . . . . . . . . . . . 181
8.4.1 Resultados para o AG-B . . . . . . . . . . . . . . . . . 181
8.4.2 Resultados para o AG-RP . . . . . . . . . . . . . . . . 194
CONTE
UDO 4
8.4.3 Teste das Propriedades de Convergencia . . . . . . . . 198
8.5 Metodologia de Avalia c ao da Eciencia de AGs . . . . . . . . 204
8.5.1 Metodologia de Avalia c ao . . . . . . . . . . . . . . . . 206
8.6 Tratamento de Restri c oes . . . . . . . . . . . . . . . . . . . . 212
8.7 Caractersticas de Comportamento . . . . . . . . . . . . . . . 212
8.7.1 Descontinuidades e N ao-Diferenciabilidade . . . . . . . 212
8.7.2 Multimodalidade . . . . . . . . . . . . . . . . . . . . . 212
8.7.3 Velocidade de Convergencia . . . . . . . . . . . . . . . 213
9 Exerccios - Otimiza cao Escalar 216
III Otimiza cao Vetorial 222
10 Solu c oes de Pareto 223
10.1 O Problema de Otimiza c ao Vetorial . . . . . . . . . . . . . . . 223
10.1.1 Nota c ao . . . . . . . . . . . . . . . . . . . . . . . . . . 224
10.2 Ordenamento de Solu c oes . . . . . . . . . . . . . . . . . . . . 225
10.3 O Conjunto Pareto-
Otimo . . . . . . . . . . . . . . . . . . . . 226
10.3.1 Conjunto localmente Pareto- otimo . . . . . . . . . . . 234
10.3.2 Solu c ao ut opica . . . . . . . . . . . . . . . . . . . . . . 235
10.4 O Problema de Determina c ao das Solu c oes Ecientes . . . . . 237
10.5 Condi c oes de Kuhn-Tucker para Eciencia . . . . . . . . . . . 238
11 Gera cao de Solu c oes Ecientes 242
11.1 Abordagem via Problema Ponderado . . . . . . . . . . . . . . 242
11.1.1 Interpreta c ao geometrica . . . . . . . . . . . . . . . . . 243
11.1.2 Algoritmos P
. . . . . . . . . . . . . . . . . . . . . . . 250
11.2 Abordagem via Problema -Restrito . . . . . . . . . . . . . . . 252
11.2.1 Algoritmos P
. . . . . . . . . . . . . . . . . . . . . . . 257
11.3 Abordagem hbrida: Ponderando e Restringindo . . . . . . . . 259
11.4 Abordagem da Programa c ao-Alvo . . . . . . . . . . . . . . . . 260
11.5 Abordagem P
. . . . . . . . . . . . . . . . . . . . . . . . . . 265
11.6 Teste de Eciencia . . . . . . . . . . . . . . . . . . . . . . . . 270
11.6.1 Algoritmos P
. . . . . . . . . . . . . . . . . . . . . . . 271
CONTE
UDO 5
12 Propriedades de Grupo 273
12.1 Verica c ao versus Falseamento . . . . . . . . . . . . . . . . . . 274
12.2 Estrutura do Conjunto Pareto-
Otimo . . . . . . . . . . . . . . 276
12.3 An alise Multiobjetivo . . . . . . . . . . . . . . . . . . . . . . 279
12.3.1 Consistencia . . . . . . . . . . . . . . . . . . . . . . . . 280
12.3.2 Ordenamento e Domin ancia . . . . . . . . . . . . . . . 281
12.3.3 Extens ao . . . . . . . . . . . . . . . . . . . . . . . . . . 281
12.3.4 Dados Extremos . . . . . . . . . . . . . . . . . . . . . 283
12.4 Decis ao e Sntese Multiobjetivo . . . . . . . . . . . . . . . . . 283
12.5 Algoritmo Genetico Multiobjetivo . . . . . . . . . . . . . . . . 285
12.5.1 Constru c ao do Algoritmo Genetico Multiobjetivo . . . 285
12.5.2 AG-RPMO . . . . . . . . . . . . . . . . . . . . . . . . 287
12.6 Exemplo de Aplica c ao: Projeto de Controladores . . . . . . . 293
12.6.1 Realimenta c ao completa de estados . . . . . . . . . . . 293
12.6.2 Realimenta c ao est atica de sadas . . . . . . . . . . . . 296
13 Exerccios - Otimiza cao Vetorial 299
Exerccios Computacionais . . . . . . . . . . . . . . . . . . . . 304
Parte I
Introdu cao e Conceitos
Preliminares
6
Captulo 1
Introdu cao
Este conjunto de notas de aula tem o objetivo de apresentar o lugar da oti-
miza c ao multiobjetivo, ou otimiza c ao vetorial dentro do problema de projeto
assistido por computador. Com o objetivo de sistematizar um conjunto de
conceitos necess arios ` a apresenta c ao da teoria da otimiza c ao vetorial, e ainda
para tornar este texto auto-contido, s ao apresentados alguns captulos iniciais
com a teoria da otimiza c ao escalar (ou mono-objetivo).
Neste captulo, discute-se:
1. o que e o problema de projeto assistido por computador (PAC) de sis-
temas;
2. qual e o papel dos mecanismos de otimiza c ao dentro dos sistemas de
PAC;
3. qual e o papel da abordagem multiobjetivo, no contexto dos problemas
de otimiza c ao em PAC.
Por m, e apresentada ainda neste captulo a formaliza c ao do problema de
otimiza c ao multiobjetivo.
1.1 Otimiza cao em Projeto Assistido por Com-
putador
Os mecanismos de otimiza c ao tratam da quest ao de determinar a melhor
solu c ao de problemas abstratos para os quais e possvel quanticar o grau
7
CAP
ITULO 1. INTRODUC
AO 8
de adequa c ao de cada solu c ao ` a necessidade em causa. Assim, esses mecanis-
mos se encontram presentes em uma grande variedade de aparatos tecnicos.
Alguns contextos nos quais s ao encontrados mecanismos de otimiza c ao s ao:
Problemas de gerencia (gest ao de recursos, gest ao da produ c ao, etc).
Nesse contexto, a otimiza c ao e usualmente denominada pesquisa ope-
racional.
Problemas especcos de projeto de aparatos. Nesse contexto, a teo-
ria de otimiza c ao e fundida com alguma outra teoria, dando origem a
sub-campos com denomina c ao especca, tais como: teoria de controle
otimo, teoria de identica c ao de sistemas, etc.
Sistemas de projeto assistido por computador.
No primeiro caso acima, existe em geral um modelo relativamente gros-
seiro do processo sob an alise. O pr oprio processo, por sua vez, pode ser
bastante complexo, possuindo muitas vezes um grande n umero de vari aveis.
Pode ser necess ario que a otimiza c ao seja executada rapidamente, para uti-
liza c ao dos resultados em tempo real. O resultado do mecanismo de oti-
miza c ao e utilizado, em geral, como uma linha de conduta, que serve para
guiar a a c ao gerencial, sem ter o papel entretanto de especicar os deta-
lhes dos procedimentos a serem seguidos. Isso tudo repercute no tipo de
sistema de otimiza c ao que e empregado nesse contexto, que ter a freq uente-
mente caractersticas do tipo: pouca necessidade de solu c oes precisas e alta
necessidade de execu c ao veloz.
No segundo caso, a formula c ao te orica do problema de otimiza c ao e sem-
pre embutida em um mecanismo especco para o sistema em quest ao. J a no
momento de formular o algoritmo, o mecanismo de otimiza c ao torna-se indi-
visvel do mecanismo de modelagem do sistema, de forma que os algoritmos
resultantes s ao inteiramente especcos para cada caso. Nessas situa c oes, em
geral, o modelo do processo e bastante renado (embora isso n ao queira ne-
cessariamente dizer que seja preciso, no sentido de equivaler ao sistema fsico
real que est a sendo tratado), sendo entretanto tambem bastante simples, no
sentido em que n ao preve uma grande diversidade de varia c oes nem uma
grande complexidade estrutural (ou seja, n ao admite modelos com diver-
sos blocos funcionais de naturezas diferentes interligados). Freq uentemente,
h a um conhecimento suciente do modelo em quest ao para que se possam
construir algoritmos que com certeza convergem para as solu c oes otimas no
CAP
ITULO 1. INTRODUC
AO 9
sentido analtico. Devido ` a especicidade do algoritmo empregado, este e
freq uentemente muito eciente computacionalmente.
O terceiro caso acima trata-se de uma situa c ao intermedi aria, entre o pri-
meiro em que s ao utilizados algoritmos gerais em problemas com formula c ao
grosseira e problemas em que s ao utilizados algoritmos especializados em
problemas com formula c ao bastante detalhada. Os mecanismos de projeto
assistido por computador aparecem onde quer que haja modelos de sistemas
a serem projetados. Nesse contexto, nem sempre ser a interessante desenvol-
ver algoritmos especcos para a otimiza c ao do processo em quest ao, uma
vez que: (i) o ganho em eciencia computacional pode n ao compensar o
trabalho de formula c ao te orica de um algoritmo especco e (ii) a comple-
xidade do problema pode ser excessiva, elevando de maneira substancial tal
esfor co te orico necess ario. S ao utilizados, portanto, algoritmos de prop osito
geral. Por outro lado, os modelos s ao freq uentemente bastante renados (o
que n ao impede a imprecis ao, ou seja, a existencia de desvios em rela c ao ` a
realidade fsica). Sua complexidade muitas vezes n ao permite que se conhe ca
de antem ao todas as propriedades desses modelos, de forma que n ao e trivial
o problema de saber se uma solu c ao e a melhor possvel, em um problema
de otimiza c ao. O n umero de vari aveis a otimizar normalmente n ao e muito
grande, o que reduz o custo computacional do processo de otimiza c ao. Por
outro lado, em geral n ao e crtico que se obtenham as solu c oes em curto
prazo, de forma que normalmente e possvel realizar c alculos extensivos, que
viabilizam metodos renados de busca de solu c oes.
Estas notas tratam de problemas de otimiza c ao nesse terceiro contexto.
Ser ao particularmente enfatizados aqui problemas de otimiza c ao de sistemas
com modelos n ao-lineares contnuos.
1.2 Sistemas de Projeto Assistido por Com-
putador
A gura 1.1 mostra um diagrama generico de um sistema de projeto assistido
por computador (PAC).
Esse sistema visa projetar um determinado dispositivo, para o qual e
disponvel um modelo computacional parametrizado. O projeto consiste na
escolha dos par ametros adequados do dispositivo, para que o mesmo tenha
um comportamento adequado.
CAP
ITULO 1. INTRODUC
AO 10
Interface
com
Projetista
Modelo
computacional
do dispositivo
escolha de
parmetros
simulao parmetros finais
simulao final
Sistema
de PAC
especificao
Figura 1.1: Diagrama de blocos de um sistema de projeto assistido por computador
generico.
O sistema fsico a ser projetado e modelado atraves de um conjunto de
equa c oes que descrevem as rela c oes entre as vari aveis do modelo, e que
comp oem o bloco modelo do sistema. O bloco modelo do sistema in-
clui ainda um mecanismo de simula c ao do funcionamento do sistema, dado
um conjunto de par ametros denidos pelo usu ario. O bloco interface com
o usu ario permite ao usu ario a deni c ao dos par ametros do sistema, e de-
volve ao mesmo a visualiza c ao do comportamento do sistema dados aqueles
par ametros (atraves, por exemplo, de gr acos). Esses dois blocos constituem,
juntos, o sistema mais elementar possvel de PAC, em que a intera c ao entre
o modelo do dispositivo e o projetista e feita diretamente. Este esquema e
mostrado na gura 1.2. O projetista neste caso, utilizando sua experiencia e
Interface
com
Projetista
Modelo
computacional
do dispositivo
escolha de
parmetros
simulao
Figura 1.2: Diagrama de blocos de um sistema de projeto assistido por computador
primitivo, constitudo apenas pelo modelo computacional do dispositivo a ser projetado.
conhecimento, vai variando os valores dos par ametros do dispositivo ate de-
terminar uma combina c ao considerada adequada. O problema b asico desse
esquema elementar de PAC e o excesso de op c oes que se colocam para o
projetista. Desde as melhores solu c oes (que s ao relativamente poucas) ate
as muito ruins (que se constituem, geralmente, na maioria das possibilidades
CAP
ITULO 1. INTRODUC
AO 11
de combina c oes de par ametros), todas est ao indiscriminadamente disponveis
para o projetista. O projetista ent ao n ao e guiado pelo sistema de PAC
para a escolha das op c oes razo aveis, tendo de utilizar apenas seu conheci-
mento, sua intui c ao ou sua sorte para procurar uma solu c ao de projeto que
seja adequada.
Para munir o projetista de ferramentas que efetivamente o auxiliem na es-
colha dos par ametros de projeto adequados, uma primeira abordagem possvel
e a inclus ao de uma base de dados de solu c oes ou de regras de projeto. Com
essa base e possvel, por exemplo, partir de solu c oes j a determinadas para
problemas anteriormente resolvidos, como solu c ao inicial para o problema
em quest ao. Se se tratar de uma base de regras de projeto, o conhecimento
anteriormente adquirido pode ser sistematizado, por exemplo atraves de me-
canismos de inteligencia articial, para auxiliar na triagem das solu c oes.
Uma outra abordagem seria a deni c ao, em termos quantitativos, do que
seriam os objetivos de projeto. Havendo tal deni c ao quantitativa, se-
ria possvel comparar de maneira inequvoca duas possveis solu c oes, sendo
possvel determinar de maneira n ao-ambgua qual delas e melhor. Com
tal maneira de ordenar as solu c oes em uma escala de piores e melhores,
torna-se possvel fazer a pr opria m aquina come car a gerar automaticamente
solu c oes e caminhar automaticamente para solu c oes cada vez melhores.
Esta e a abordagem da otimiza c ao, que ser a discutida neste trabalho. Neste
texto, ser a estudado especicamente o caso em que o sistema PAC e cons-
titudo por um mecanismo de otimiza c ao, como mostrado na gura 1.3.
Interface
com
Projetista
Modelo
computacional
do dispositivo
escolha de
parmetros
simulao
medida de
desempenho
Clculo de
Objetivos
Algoritmo de
Otimizao
definio de
objetivos e
restries
parmetros finais
simulao final
Figura 1.3: Diagrama de blocos de um sistema de projeto assistido por computador
`a base de um mecanismo de otimiza cao.
CAP
ITULO 1. INTRODUC
AO 12
1.3 Otimiza cao em PAC
Os sistemas de PAC baseados em otimiza c ao s ao denidos em termos de dois
blocos funcionais b asicos:
O modelo do sistema, incluindo agora uma avalia c ao de uma gura de
merito associada a uma dada implementa c ao do sistema. Esse bloco
possui como entradas os par ametros de projeto do sistema, e como
sada aquela gura de merito.
Um mecanismo otimizador, que possui como entrada a gura de
merito obtida do bloco anterior, e que produz como sada um conjunto
de par ametros de projeto (uma tentativa de solu c ao).
Esses blocos funcionais devem interagir autonomamente, sem interven c ao do
usu ario, produzindo ao nal do processo uma solu c ao otima, ou seja, um
conjunto de par ametros de projeto que minimiza (ou maximiza) a gura de
merito.
1.3.1 A Abordagem Escalar
Classicamente, os sistemas de PAC baseados em mecanismos de otimiza c ao
tem empregado a abordagem mono-objetivo, ou escalar. Isso signica que
a gura de merito que o mecanismo de otimiza c ao deve minimizar e um
funcional (uma fun c ao cuja imagem e escalar). Seja x R
n
o vetor de
par ametros de projetos que devem ser escolhidos, e f() : R
n
R o funcional-
objetivo que quantica a adequa c ao de cada solu c ao x (considere-se aqui a
conven c ao de que quanto menor f(x) melhor ser a a solu c ao x). O problema
de otimiza c ao pode ser expresso como:
x
= arg min
x
f(x) (1.1)
ou seja, o mecanismo de otimiza c ao deve ser capaz de determinar o vetor
x
ITULO 1. INTRODUC
AO 13
motivos mais subjetivos. Para expressar tais restri c oes, denem-se regi oes
no espa co de par ametros R
n
atraves de desigualdades ou de igualdades:
g
i
(x) 0 i = 1, . . . , r
h
i
(x) = 0 i = 1, . . . , p
(1.2)
As solu c oes do problema de otimiza c ao ser ao procuradas apenas entre aque-
las que atenderem a tais igualdades e desigualdades. O problema de deter-
mina c ao de solu c oes que atendam ` as restri c oes (1.2) e o chamado problema
de factibilidade.
Um problema de otimiza c ao combinado com um problema de factibilidade
e a situa c ao mais freq uentemente encontrada na pr atica, sendo expresso por:
x
= arg min
x
f(x)sujeito a:
g
i
(x) 0 i = 1, . . . , r
h
i
(x) = 0 i = 1, . . . , p
(1.3)
A formula c ao (1.3) corresponde ` a chamada otimiza c ao restrita.
Sabe-se que os sistemas com signicado pr atico devem ser projetados para
atender a m ultiplos criterios de projeto, n ao necessariamente compar aveis
entre si. Considere-se um problema de projeto com m objetivos distintos:
x
i
= arg min
x
f
i
(x) i = 1, . . . , m
sujeito a:
g
i
(x) 0 i = 1, . . . , r
h
i
(x) = 0 i = 1, . . . , p
(1.4)
Esse problema conduzir a a m solu c oes distintas, cada qual atendendo da
melhor forma possvel a um dos objetivos. A quest ao que se coloca para
o projetista e: ser a possvel escolher apenas um dos objetivos de projeto
para implementar, ignorando os demais objetivos, ou haver a uma maneira
de considerar simultaneamente todos os objetivos distintos?
Exemplo 1.1 Determinado equipamento deve ser fabricado a um custo mnimo
de produ c ao, mas deve tambem apresentar o melhor desempenho possvel. Eviden-
temente, o projeto mais barato possvel tende a n ao apresentar o melhor desem-
penho, assim como o projeto que visa ao melhor desempenho possvel tende a n ao
ser o mais barato.
CAP
ITULO 1. INTRODUC
AO 14
Posta essa diculdade de lidar com objetivos que em geral s ao coni-
tantes, dentro da abordagem cl assica de otimiza c ao h a um expediente que
e em geral utilizado para tratar de m ultiplos objetivos: faz-se uma soma
ponderada dos objetivos, atribuindo maior pondera c ao ` aqueles considerados
de maior import ancia, e menor pondera c ao ` aqueles considerados de menor
import ancia. Com isso, constitui-se uma nova fun c ao objetivo que agora e
um escalar, composto de parcelas que correspondem aos m ultiplos objetivos:
x
= arg min
x
m
i=1
i
f
i
(x)
sujeito a:
g
i
(x) 0 i = 1, . . . , r
h
i
(x) = 0 i = 1, . . . , p
(1.5)
Este problema possui uma solu c ao unica, que foi gerada a partir de consi-
dera c oes que incluram todos os diferentes objetivos. Em princpio, variando-
se o valor dos diversos
i
, s ao obtidas diferentes solu c oes que ponderam dife-
rentemente os objetivos individuais. O problema e solucion avel por qualquer
metodo de otimiza c ao mono-objetivo.
Esse metodo de lidar com m ultiplos objetivos funciona, apresentando
resultados satisfat orios, em muitos contextos. Em diversos outros contextos,
entretanto, pode-se perceber que o metodo falha, se seus resultados forem
submetidos a uma an alise mais sutil. O ferramental para realizar tal an alise,
assim como para produzir as solu c oes adequadas, e fornecido pela otimiza c ao
multiobjetivo, ou otimiza c ao vetorial.
Exemplo 1.2 Para mostrar o tipo de diculdade que e possvel haver na uti-
liza c ao da abordagem mono-objetivo para a otimiza c ao de m ultiplos objetivos, e
aqui mostrado um exemplo em que tal abordagem falha completamente. Este exem-
plo ser a comentado em maior detalhe no momento adequado. Considerem-se as
duas fun c oes de uma unica vari avel:
f
1
(x) = 1 exp
_
(x4)
2
9
_
f
2
(x) = 1 exp
_
(x+4)
2
9
_
Suponha-se, para ns de raciocnio, que tratam-se de duas fun c oes signicando o
custo de uma pe ca (f
1
) e o desempenho da pe ca (f
2
), de acordo com uma unica
vari avel x considerada como par ametro de projeto da pe ca.
CAP
ITULO 1. INTRODUC
AO 15
-10 -8 -6 -4 -2 0 2 4 6 8 10
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Figura 1.4: Representa cao das fun c oes-objetivo f
1
, f
2
e das fun c oes ponderadas
0.7f
1
+ 0.3f
2
e 0.4f
1
+ 0.6f
2
.
Ambas as fun c oes est ao representadas no gr aco da gura 1.4 em tra co contnuo.
A fun c ao dada por:
F
1
(x) = 0.7f
1
(x) + 0.3f
2
(x)
aparece representada no mesmo gr aco em tra co-tra co. Se esta for a fun c ao-
objetivo escolhida, isto signica que o custo tem maior peso, e o desempenho menor
import ancia para o projetista. A fun c ao:
F
2
(x) = 0.4f
1
(x) + 0.6f
2
(x)
aparece em ponto-ponto. A escolha de tal fun c ao-objetivo signicaria que o pro-
jetista atribui maior import ancia ao desempenho, e uma import ancia um pouco
menor ao custo.
Pode-se perceber que F
1
(x) possui mnimo que coincide com o de f
1
(x), e que
F
2
(x) possui mnimo que coincide com o de f
2
(x). De fato, a solu c ao de qualquer
problema formulado como:
min
x
f
1
(x) + (1 )f
2
(x)
ir a sempre produzir como resultados apenas os pontos x = 4 e x = 4, ou seja, os
mnimos individuais de f
1
(x) ou de f
2
(x). Se o projetista se basear nos resultados
desse esquema de otimiza c ao, suas unicas alternativas ser ao: ou escolher a solu c ao
de mnimo custo (mnimo f
1
) ou ent ao escolher a solu c ao de m aximo desempe-
nho (mnimo f
2
). O projetista n ao ter a ` a sua disposi c ao nenhuma alternativa
intermedi aria.
CAP
ITULO 1. INTRODUC
AO 16
1.3.2 A Abordagem Vetorial
A abordagem de otimiza c ao multiobjetivo, ou otimiza c ao vetorial, parte da
constata c ao de que, havendo diversos objetivos em quest ao num problema
de projeto, haver a solu c oes de dois tipos:
1. Haver a solu c oes que, sob todos os objetivos simultaneamente consi-
derados, ser ao suplantadas por outras solu c oes. Isso signica que h a
solu c oes que conseguem valores menores de fun c ao objetivo para todos
os m objetivos f
i
(). Essas solu c oes, naturalmente, devem ser descar-
tadas, pois h a solu c oes melhores.
2. Haver a ainda solu c oes que, comparadas com outras solu c oes, ser ao me-
lhores em algum ou alguns objetivos, mas piores em outro ou outros
objetivos. Isso signica que o projetista, quando se deparar com um
par dessas solu c oes, dever a considerar a hip otese de adotar uma ou
outra (n ao dever a haver o descarte autom atico de nenhuma das duas),
sendo que a escolha provavelmente ser a realizada com algum grau de
subjetividade.
As solu c oes desse ultimo grupo s ao denominadas solu c oes ecientes ou solu c oes
Pareto- otimas. O conjunto dessas solu c oes e um objeto bem determinado,
posto um problema de otimiza c ao com m ultiplos objetivos. A determina c ao,
no todo ou em parte, desse conjunto, e um dos problemas centrais da oti-
miza c ao vetorial.
Deve-se observar que esse problema faz sentido exatamente porque em
princpio tende a n ao existir uma solu c ao unica x
que simultaneamente
minimiza todas as diferentes fun c oes-objetivo. Um problema com mais de
um objetivo tende a possuir um conjunto, em geral limitado, com innitas
solu c oes.
Para o objetivo de resolver um problema de projeto de determinado sis-
tema, deve-se convergir para uma unica solu c ao nal. O conjunto Pareto-
otimo constitui um elenco de alternativas, todas candidatas a se tornarem
essa solu c ao nal. Para viabilizar a sntese nal do sistema pelo projetista,
a otimiza c ao multiobjetivo emprega ainda uma outra etapa, na qual o con-
junto de solu c oes-candidatas e reduzido ate a determina c ao de uma unica
solu c ao, atraves de uma sistem atica de intera c ao com o projetista (ou deci-
sor). Essa etapa, que inclui uma sistem atica de busca (em uma trajet oria
sobre o conjunto Pareto- otimo), sup oe a existencia dentro do decisor de uma
CAP
ITULO 1. INTRODUC
AO 17
chamada fun c ao utilidade, que signica um padr ao de preferencias coerente
e ordenado.
O problema multiobjetivo (PMO) pode ent ao ser formulado como uma
combina c ao dessas etapas de determina c ao das solu c oes ecientes e de escolha
da solu c ao nal (aplica c ao da fun c ao utilidade).
1.4 Formula cao do Problema de Otimiza cao
Vetorial
Nesta se c ao, e apresentada preliminarmente a formula c ao completa do pro-
blema de otimiza c ao vetorial, incluindo as etapas de determina c ao do con-
junto de solu c oes Pareto- otimas e de aplica c ao a esse conjunto da fun c ao
utilidade. Essas formula c oes ser ao exploradas em detalhe nos captulos sub-
seq uentes.
1.4.1 Etapa de Determina cao das Solu c oes Ecientes
Seja x R
n
o vetor dos par ametros de projeto de um problema multiobjetivo
(PMO), e seja T
x
R
n
um subconjunto do espa co ao qual o vetor x se
encontra restrito. Seja ainda f() : R
n
R
m
o vetor de fun c oes-objetivo
desse problema. Dados f() e T
x
, o conjunto A
e dada por:
A
x T
x
[ ,x
1
T
x
tal que f(x
1
) f(x) e f(x
1
) ,= f(x) (1.7)
Para a express ao (1.7) fazer sentido, e necess ario denir os operadores re-
lacionais e < envolvendo vetores, o que tambem ser a feito no captulo
10.
Algoritmos de determina c ao das solu c oes ecientes de um PMO ser ao
formulados, a partir das propriedades do conjunto A
ITULO 1. INTRODUC
AO 18
1.4.2 Etapa de Decisao
Uma vez que se tenha determinado o conjunto das solu c oes ecientes do
problema, passa-se ` a etapa de escolha de uma solu c ao nal dentre essas
op c oes
1
.
O decisor real, que efetivamente ir a escolher a alternativa nal de projeto,
pode ser um ser humano projetista, ou toda uma equipe de projeto. As
alternativas de projeto devem ser apresentadas ao decisor, para que o mesmo
selecione aquela que efetivamente ser a implementada.
Caso o conjunto de solu c oes ecientes do problema envolva um conjunto
pequeno de alternativas, este pode ser todo apresentado ao decisor, para que
seja tomada uma decis ao com base na avalia c ao simult anea de todo o universo
de possibilidades ecientes. No entanto, este n ao e usualmente o caso.
Freq uentemente, existe uma quantidade muito grande de alternativas, que
n ao podem ser processadas simultaneamente pelo ser humano.
E necess aria,
portanto, uma sistem atica de apresenta c ao das alternativas, segundo uma
seq uencia que permita o afunilamento das escolhas de maneira consistente,
garantindo ao mesmo tempo que:
O n umero de consultas ao decisor ser a mantido no menor patamar
possvel, sendo que as respostas a cada consulta ser ao utilizadas para
eliminar uma grande quantidade de alternativas;
A cada consulta ao decisor, ser ao apresentados dados em quantidade
tal que um ser humano consiga lidar simultaneamente, sendo evitada a
apresenta c ao de dados em excesso que impossibilitem a formula c ao de
uma decis ao racional;
As melhores alternativas n ao ser ao perdidas, sendo que a sistem atica
de decis ao permitir a, de maneira determinstica, encontrar a mesma
solu c ao que seria alcan cada caso o decisor fosse apresentado a todas as
alternativas simultaneamente, e caso estivesse ao seu alcance processar
todas essas alternativas simultaneamente.
1
E possvel que a intera c ao entre o decisor e o sistema de projeto assistido por compu-
tador ocorra de tal forma que sejam concomitantes as etapas de determina c ao de solu c oes
ecientes e de escolha de decis ao. Nesse caso, cada solu c ao eciente que for determinada
ser a sumetida ao decisor, cuja opini ao direcionar a a escolha de uma nova solu c ao eci-
ente. Esse modelo de decis ao possivelmente envolve um menor n umero de avalia c oes das
fun c oes-objetivo, e um maior n umero de consultas ao decisor.
CAP
ITULO 1. INTRODUC
AO 19
O sistema de consultas ao decisor e o objeto da chamada etapa de decis ao
da otimiza c ao multiobjetivo.
Captulo 2
Deni c oes de Referencia
Neste captulo s ao estabelecidas diversas deni c oes matem aticas, que s ao
utilizadas para construir os conceitos que ser ao empregados no restante do
trabalho. Essas deni c oes n ao s ao diretamente relacionadas com o tema
da otimiza c ao, sendo antes deni c oes comuns a contextos matem aticos
diversos. Por este motivo, foram agrupadas neste captulo introdut orio.
As deni c oes aqui apresentadas s ao provenientes das fontes citadas. Por
vezes, a deni c ao e adaptada, tanto em termos formais quanto de nota c ao,
com o objetivo de assegurar a consistencia metodol ogica do conjunto dos
conceitos formulados, bem como a coerencia com o material desenvolvido
no restante deste trabalho. Entretanto, a deni c ao apresentada e sempre
equivalente ` a encontrada na fonte original. Este captulo apenas compila
conceitos j a denidos na literatura, tendo sido includo com o objetivo de
tornar preciso o signicado dos termos a serem empregados no restante do
trabalho.
2.1 Espa cos e Normas
As deni c oes contidas nesta se c ao seguem as referencias (Chen 1984) e (Vidyasagar
1993).
Deni cao 2.1 (Corpo) Um corpo consiste num conjunto, denotado F, de
elementos denominados escalares, e duas opera c oes chamadas adi c ao (+ :
F F F) e multiplica c ao ( : F F F), satisfazendo as seguintes
condi c oes , , F:
20
CAP
ITULO 2. DEFINIC
OES DE REFER
ENCIA 21
(C1) + F e F.
(C2) + = + e = .
(C3) ( + ) + = + ( + ) e ( ) = ( ).
(C4) ( + ) = ( ) + ( ).
(C5) F contem um elemento denotado por 0 e um elemento denotado por 1
tais que: + 0 = e 1 = .
(C6) A todo F corresponde um elemento F tal que + = 0.
(C7) A todo ,= 0 F corresponde um elemento F tal que = 1.
Deni cao 2.2 (Espa cos Vetoriais Lineares) Um espa co vetorial linear e
caracterizado por um conjunto 1, um corpo F e duas opera c oes, a opera c ao
adi c ao vetorial (+ : 1 1 1) e a opera c ao multiplica c ao por escalar
( : F 1 1), tais que os seguintes axiomas sejam v alidos x, y, z 1 e
c, c
1
, c
2
F:
(V1) x + y = y + x.
(V2) x + (y + z) = (x + y) + z.
(V3) Existe um elemento 0 1 tal que x +0 = 0 + x = x, x 1.
(V4) Para cada x 1 existe um elemento denotado por x 1 tal que
x + (x) = 0.
(V5) c
1
(c
2
x) = (c
1
c
2
) x.
(V6) c (x + y) = c x + c y.
(V7) (c
1
+ c
2
) x = c
1
x + c
2
x.
(V8) 1 x = x.
CAP
ITULO 2. DEFINIC
OES DE REFER
ENCIA 22
Deni cao 2.3 (Subespa co Vetorial) Denomina-se subespa co vetorial a
qualquer subconjunto / de um espa co vetorial linear 1 (sobre o corpo F) tal
que:
1. x, y / x + y /
2. x /, c F c x /.
Deni cao 2.4 (Norma) Seja 1 um espa co vetorial sobre o corpo dos reais.
Uma fun c ao F : 1 R com imagem no conjunto dos n umeros reais e
domnio no conjunto 1 e denominada uma norma dos elementos de 1 se
satisfaz as seguintes propriedades x, y 1 e R:
(N1) F(x) 0, F(x) = 0 x = 0.
(N2) F(x) = [[ F(x).
(N3) F(x + y) F(x) + F(y).
A nota c ao |x| ser a empregada genericamente neste texto para indicar F(x).
O contexto dever a deixar claro a que espa co e a que norma especcos tal
nota c ao se refere.
i=1
[x
i
[
p
1
p
, 1 p < (2.1)
Para p = a deni c ao e:
|x|
= max
1in
[x
i
[ (2.2)
CAP
ITULO 2. DEFINIC
OES DE REFER
ENCIA 23
Exemplo 2.1 A norma euclideana de um vetor e um exemplo de uma norma p,
para p = 2:
x
2
=
_
n
i=1
x
2
i
(2.3)
Qx|
2
, ou seja, a norma
vetorial 2 do vetor x
Qx.
Deni cao 2.7 (Espa cos Normados) Um espa co normado c e um par or-
denado (1, F) em que 1 e um espa co vetorial sobre um corpo F e F : 1 R
e uma norma aplic avel aos elementos de 1. O espa co normado c e denido
como:
x c (F(x) < , x 1) (2.4)
Deni cao 2.8 (Convergencia de Seq uencia) Seja uma seq uencia orde-
nada de vetores x
i
, i = 1, . . . , pertencentes a um espa co vetorial nor-
mado (A, ||). Diz-se que essa seq uencia converge para x
0
A se, para todo
escalar > 0, existe um inteiro N = N() tal que:
|x
i
x
0
| < , i N (2.5)
Deni cao 2.9 (Seq uencia de Cauchy) Seja uma serie ordenada de veto-
res x
i
, i = 1, . . . , pertencentes a um espa co vetorial normado (A, ||).
Essa serie e denominada uma seq uencia de Cauchy se, para todo escalar
> 0, existe um inteiro N = N() tal que:
|x
i
x
j
| < i, j > N (2.6)
Deni cao 2.10 (Espa co de Banach) Um espa co linear normado (A, ||)
e dito ser completo, ou um espa co de Banach, se toda seq uencia de Cauchy
em (A, ||) converge para um elemento de A.
CAP
ITULO 2. DEFINIC
OES DE REFER
ENCIA 24
Exemplo 2.2 Um exemplo de espa co de Banach e o espa co R
n
, no qual toda
seq uencia de Cauchy converge para um ponto desse mesmo espa co. Um exemplo
de espa co que n ao e espa co de Banach e o espa co Q
n
, dos vetores sobre o corpo
dos n umeros racionais. Claramente, algumas seq uencias em Q, que corresponde
ao caso n = 1, convergem para n umeros irracionais, que se encontram fora de Q.
CAP
ITULO 2. DEFINIC
OES DE REFER
ENCIA 25
Deni cao 2.13 (Vizinhan ca) Seja um ponto x contido em um espa co to-
pol ogico. Uma vizinhan ca de x e qualquer conjunto aberto que contenha x.
, e denido como a
uni ao de todos os conjuntos abertos contidos em A.
=
(2.11)
CAP
ITULO 2. DEFINIC
OES DE REFER
ENCIA 26
Deni cao 2.20 (Conjunto Conexo) Seja o conjunto Q R
n
. Esse con-
junto e dito conexo se, dados quaisquer dois pontos x
1
, x
2
Q, existe uma
curva contnua nita q tal que x
1
q, x
2
q, e q Q.
Deni cao 2.21 (Conjunto Convexo) Seja um conjunto A, contido em
um espa co vetorial, e seja a fun c ao x(x
1
, x
2
, ) denida por:
x(x
1
, x
2
, ) = x
1
+ (1 )x
2
(2.12)
para x
1
e x
2
elementos do espa co vetorial e um escalar. Se se vericar:
x
1
, x
2
A ; 0 1 x(x
1
, x
2
, ) A (2.13)
ent ao o conjunto A e dito ser convexo.
ITULO 2. DEFINIC
OES DE REFER
ENCIA 27
iii. ,D convexo tal que:
D S
D ((S)
D ,= ((S)
2.3 Cones
Um conjunto de grande interesse e o cone.
Deni cao 2.24 (Cone) Um conjunto C e um cone se:
x C (x) C 0 (2.14)
= y : y
x 0 , x C (2.16)
CAP
ITULO 2. DEFINIC
OES DE REFER
ENCIA 28
2.4 Hiperplanos e Poliedros
Um conjunto convexo particularmente importante e o hiperplano.
Deni cao 2.27 (Hiperplano) Seja c um vetor diferente de 0 e um es-
calar qualquer. Ent ao o conjunto:
H = x : c
x = (2.17)
dene um hiperplano.
A cada hiperplano correspondem semi-espa cos abertos e fechados:
semi-espa cos fechados
x : c
x
H
x : c
x
semi-espa cos abertos
H
>
x : c
x >
H
<
x : c
x <
(2.18)
Note que para qualquer hiperplano H:
R
n
= H
H
>
= H
H
<
(2.19)
Deni cao 2.28 (Politopo e Poliedro) A interse c ao de um n umero nito
de semi-espa cos fechados e chamada de politopo. Um politopo limitado e
chamado de poliedro.
Deni cao 2.29 (Hiperplano Suporte) Um hiperplano H que contem pelo
menos um ponto da fronteira de um conjunto C e que situa esse conjunto C
inteiramente no interior de um de seus semi-espa cos fechados e chamado de
hiperplano suporte de C.
Em outras palavras, se C admite um hiperplano suporte em um ponto x
0
de
sua fronteira, ent ao existem um vetor c ,= 0 e um escalar R tais que:
H =
x : c
x
0
=
e C H
ou C H
(2.20)
Conjuntos convexos fechados podem ser caracterizados pela interse c ao de
todos os semi-espa cos fechados que os contem.
Captulo 3
Caracteriza cao das Fun c oes
O problema de otimiza c ao, na sua formula c ao mono-objetivo, pode ser de-
nido como:
x
= arg min
x
f(x)
sujeito a:
g
i
(x) 0 ; i = 1, . . . , r
h
j
(x) = 0 ; j = 1, . . . , p
(3.1)
sendo que x R
n
, f() : R
n
R
1
, g() : R
n
R
r
, e h() : R
n
R
p
.
A escolha de tecnicas adequadas para tratar esse problema depende da
natureza das fun c oes f(x), g(x) e h(x). N ao h a uma tecnica de otimiza c ao
que seja universal, no sentido de ser a melhor tecnica para otimizar quais-
quer fun c oes. O objetivo deste captulo e o de formular caracteriza c oes para
essas fun c oes que sejam relevantes para a constru c ao e an alise de algoritmos
para sua otimiza c ao.
Neste captulo s ao postas as seguintes quest oes, relacionadas com a quest ao
de o que s ao as solu c oes do problema (3.1):
1. Dado o funcional
1
f(), o que s ao os pontos de mnimo desse funcional,
ou seja, o que s ao as solu c oes do problema de otimiza c ao?
2. O que s ao os pontos de mnimo desse funcional, se s ao dadas tambem
as restri c oes g
i
(x) 0 e h
i
(x) = 0?
1
Um funcional e uma fun c ao de um espa co vetorial em seu pr oprio corpo, ou seja, que
retorna um unico valor (um n umero escalar) cuja natureza e a mesma das componentes
do argumento. Ou seja, se f() e um funcional real ent ao f : R
n
R
1
.
29
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 30
3. Dado um ponto x R
n
, que tipo de testes podem ser realizados para
determinar se esse ponto e ou n ao um ponto de mnimo de f(), nos
dois casos acima?
Respostas a essas quest oes ser ao fornecidas tanto num sentido local (mnimos
locais) quanto global (mnimos globais).
Alem de caracterizar as solu c oes do problema (3.1), e necess ario agregar
alguma informa c ao que seja util para se decidir como proceder para encontrar
tais solu c oes. Algumas caracteriza c oes uteis, denidas a seguir neste captulo,
classicam as fun c oes em:
1. Unimodais ou multimodais;
2. Contnuas ou descontnuas;
3. Diferenci aveis ou n ao diferenci aveis;
4. Convexas, quasi-convexas ou n ao convexas.
Cada uma dessas informa c oes a respeito da fun c ao, se estiver disponvel,
permite a agrega c ao de um certo tipo de informa c ao de car ater global que
auxilia o processo de otimiza c ao.
3.1 Superfcies de Nvel e Modalidade
A caracteriza c ao de fun c oes adotada aqui se fundamenta nos conceitos de
superfcie de nvel e de regi ao sub-nvel.
Deni cao 3.1 (Superfcie de Nvel) Seja f() : C R
n
R. A su-
perfcie de nvel S(f, ), associada ao nvel , e denida como:
S(f, ) = x C [ f(x) = (3.2)
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 31
Normalmente S(f, ) corresponde a uma fronteira de R(f, ), embora
seja possvel escolher C de forma que isso n ao ocorra. Claramente e v alida
uma rela c ao de ordena c ao das regi oes de sub-nvel de uma fun c ao:
Proposi cao 3.1 Seja f() : C R
n
R. As regi oes de sub-nvel dessa
fun c ao obedecem a:
R(f,
1
) R(f,
2
)
1
>
2
(3.4)
_
1 0
0 0
_ _
x
1
x
2
_
para a qual todos os pontos que pertencem ao eixo x
1
= 0 (esses pontos formam um
conjunto conexo mas n ao compacto) constituem mnimos. Essa observa c ao revela
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 32
uma diferen ca fundamental das no c oes de fun c ao unimodal e de fun c ao multimodal
aqui denidas em rela c ao ` as deni c oes usualmente encontradas na literatura. O
presente autor acredita que, no formato apresentado neste texto, essas deni c oes
ganham maior funcionalidade para articularem a teoria de otimiza c ao.
C
um mnimo local de f(). A bacia de atra c ao de x
, sendo
o nvel correspondente,
tal que a fun c ao restrita a essa regi ao:
f() : R
c
(f,
, x
) R (3.5)
e unimodal. A bacia de atra c ao e dita estrita se nessa regi ao a fun c ao e
estritamente unimodal.
3.2 Continuidade e Diferenciabilidade
Suposi c oes de continuidade e de diferenciabilidade das fun c oes permitem ex-
trair conseq uencias interessantes a respeito de suas superfcies de nvel e
bacias de atra c ao.
Proposi cao 3.2 Seja f() : C R
n
R. Se f() e contnua no domnio
C, ent ao
dist(S(f,
1
), S(f,
2
)) > 0 (
1
,
2
) [ [
1
2
[ > 0 (3.6)
sendo dist(, ) a fun c ao dist ancia.
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 33
Corolario 3.1 Superfcies de nvel de fun c oes contnuas n ao se tocam nem
se cruzam.
Proposi cao 3.3 Seja f() : C R
n
R. Se f() e diferenci avel no
domnio C, ent ao toda superfcie de nvel S(f, ) e suave, sendo o hiperplano
tangente ` a superfcie em cada ponto perpendicular ao gradiente da fun c ao no
ponto.
A hip otese de diferenciabilidade de uma fun c ao permite elaborar es-
trategias de otimiza c ao baseadas no fato de que o gradiente de uma fun c ao
(que, no caso de fun c oes diferenci aveis, e sempre bem denido) indica quais
s ao as dire c oes do espa co para as quais, partindo-se de um ponto, ocorre lo-
calmente a diminui c ao da fun c ao. Isso equivale ` a determina c ao das dire c oes
para as quais se caminha para regi oes de sub-nvel inferiores. A proposi c ao
a seguir formaliza esse fato, que deriva da proposi c ao 3.3.
Proposi cao 3.4 Seja f() : C R
n
R uma fun c ao diferenci avel no
domnio C, seja x
o
um ponto pertencente ` a superfcie de nvel S(f, ) e seja
f(x
o
) o gradiente de f() no ponto x
o
. Seja ainda um vetor d R
n
. Ent ao,
se:
d f(x
o
) < 0 (3.7)
ent ao existe > 0 tal que:
f(x
o
+ d) < f(x
o
) (3.8)
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 34
Analogamente, f() e (estritamente) c oncava se f() for (estritamente)
convexa.
Deni cao 3.8 (Subgradiente) Seja uma fun c ao convexa f() : R
n
R.
Um funcional linear f
sb
e um subgradiente de f no ponto x
0
se:
f(x) f(x
0
) + f
sb
(x x
0
) , x (3.10)
Proposi cao 3.5 (Caracteriza c oes de Fun c oes Convexas) Seja f() uma
fun c ao duas vezes diferenci avel, sobre um conjunto convexo C R
n
. Ent ao
s ao equivalentes as armativas abaixo:
i. f (x + (1 )y) f(x) + (1 )f(y) [0, 1]
ii. f(y) f(x) +f(x)
(y x) x, y C
iii. F(x) 0 x C
sendo f(x) o vetor gradiente no ponto x e F(x) a matriz hessiana no ponto
x.
Exerc
i=1
i
f
i
() e convexa sobre
m
i=1
C
i
para
i
0 , i = 1, . . . , m
Exerc
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 35
Proposi cao 3.7 Seja f() : C R
n
R uma fun c ao convexa sobre C
convexo. Ent ao a regi ao de sub-nvel R(f, ) e convexa para todo R.
A recproca n ao e verdadeira.
A convexidade de R(f, ) dene um novo tipo de fun c ao, as fun c oes quasi-
convexas:
Deni cao 3.9 (Fun cao Quasi-Convexa) Seja f() : C R
n
R uma
fun c ao tal que suas regi oes de sub-nvel R(f, ) s ao convexas para todo R.
Nesse caso, diz-se que f() e quasi-convexa no domnio C.
Proposi cao 3.8 Se f() : C R
n
R e uma fun c ao quasi-convexa, ent ao:
f (x + (1 )y) max f(x), f(y) x, y C , [0, 1] (3.11)
Outro resultado envolvendo conjuntos e fun c oes convexas pode ser obtido a
partir da deni c ao de Epgrafo:
Deni cao 3.10 (Epgrafo) O epgrafo de uma fun c ao f() : C R
n
R
e denido como:
[f, C] = (x, ) R
n
R : x C , f(x) (3.12)
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 36
Proposi cao 3.10 Todas as regi oes de sub-nvel de uma fun c ao convexa num
domnio convexo s ao conjuntos convexos.
Proposi cao 3.11 Uma fun c ao convexa em um domnio convexo possui uma
unica bacia de atra c ao, a qual e um conjunto convexo.
A informa c ao a respeito da convexidade de uma fun c ao pode ser usada
em um processo de otimiza c ao a partir da proposi c ao a seguir.
Proposi cao 3.12 Seja uma fun c ao convexa f() : C R
n
R, seja um
ponto qualquer x
o
R
n
, e seja s(x
o
) R
n
um vetor subgradiente da fun c ao
no ponto. Ent ao a regi ao de sub-nvel que possui o ponto x
o
em sua fronteira
est a contida no semi-espa co fechado negativo denido pelo vetor subgradiente
no ponto x
o
, ou seja:
E
s
= x R
n
[ (x x
o
) s(x
o
) 0
R(f, f(x
o
)) E
s
(3.13)
) f(x) , x 1(x
, ) C (3.14)
onde 1(x
, ) x : |x x
| < . O ponto x
C e um mnimo local
estrito se vale a desigualdade estrita para x ,= x
.
Naturalmente, o conjunto C e o subconjunto do espa co R
n
denido pelas
restri c oes:
C x R
n
[ g
i
(x) 0 ; i = 1, . . . , m ; h
j
(x) = 0 ; j = 1, . . . , p (3.15)
, ) C = C, ent ao
x
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 37
3.5 Caracteriza cao dos Mnimos Locais
Considere-se a seguir a nota c ao (
n
para representar o conjunto das fun c oes
n vezes continuamente diferenci aveis.
Proposi cao 3.13 (Otimiza cao Irrestrita) Seja f() (
2
e x
R
n
. Se
forem simultaneamente satisfeitas:
i. f(x
) = 0
ii. F(x
) > 0
ent ao x
tal que h
i
(x
) = 0 , i = 1, . . . , r. Se existem
multiplicadores
1
,
2
, . . . ,
r
tais que
i. f(x
) +
r
i=1
i
h
i
(x
) = 0
ii. F(x
)+
r
i=1
i
H
i
(x
) > 0 sobre M = y R
n
: h
i
(x
y = 0 , i = 1, . . . , r
s ao simultaneamente satisfeitos, ent ao x
tal que g
i
(x
) 0 , i = 1, . . . , p. Se existem
multiplicadores
1
,
2
, . . . ,
p
tais que
i.
i
0 , i = 1, . . . , p
ii.
i
g
i
(x
) = 0 , i = 1, . . . , p
iii. f(x
) +
p
i=1
i
g
i
(x
) = 0
iv. F(x
)+
p
i=1
i
G
i
(x
) > 0 sobre M = y R
n
: g
i
(x
y = 0 , i I(x
),
I(x
) = i : g
i
(x
) = 0 ,
i
> 0
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 38
s ao simultaneamente satisfeitos, ent ao x
tem-se
que:
f(x
d 0 (3.16)
Demonstrac
ao: Se d e factvel em x
, ent ao
x() = x
+ d [0, ]
Seja v() = f(x()); ent ao v possui um mnimo em = 0. Em serie de Taylor:
v() = v(0) + v(0) +O()
Se v(0) < 0 ent ao para > 0 sucientemente pequeno tem-se v() < v(0), o que
contraria a hip otese de otimalidade de v(0). Portanto v(0) = f(x)
d 0.
Proposi cao 3.17 (Condi c oes Necessarias de 2a Ordem) Seja R
n
e f uma fun c ao duas vezes diferenci avel sobre . Se x
e um mnimo local
de f sobre , ent ao para qualquer d R
n
factvel em x
, tem-se que:
i. f(x
d 0
ii. Se f(x
d = 0, ent ao d
F(x
)d 0
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 39
Demonstrac
d = 0. Neste caso:
v() = v(0) +
1
2
v(0)
2
+O(
2
)
Se v(0) < 0, ent ao v() < v(0) para > 0 sucientemente pequeno, o que contraria
a hip otese de otimalidade. Portanto v(0) = d
F(x
)d 0.
Nota 3.2 Observe-se que se x
) = 0
ii. d
F(x
)d 0 , d R
n
satisfazendo um conjunto
de restri c oes de igualdade h(x
) e g
j
(x
) = 0 forem linearmente
independentes.
A seguinte condi c ao de primeira ordem para otimalidade de um problema
generico de otimiza c ao, apresentada por Kuhn e Tucker em 1951, possui
import ancia hist orica, servindo de base para diversos algoritmos numericos
de otimiza c ao existentes.
Proposi cao 3.18 (Condi c oes Necessarias de Kuhn-Tucker para Oti-
malidade) Seja x
h
i
(x) = 0 , i = 1, . . . , l
g
j
(x) 0 , j = 1, . . . , m
(3.17)
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 40
sendo que f, g, h (
1
. Para x
R
l
e
R
m
com
0 tal que:
f(x
) +
l
i=1
i
h
i
(x
) +
m
j=1
j
g
j
(x
) = 0
j
g
j
(x
) = 0 j = 1, . . . , m
(3.18)
Nota 3.3 Essas condi c oes necess arias tornam-se tambem sucientes em proble-
mas convexos (com fun c ao objetivo convexa e todas as restri c oes convexas).
= arg min
x
f(x)
sujeito a:
_
_
_
g
1
(x) 0
g
2
(x) 0
sendo:
f(x) =
_
x
1
x
2
_
1 0
0 1
_ _
x
1
x
2
_
g
1
(x) = 1 x
1
g
2
(x) = 1 x
2
A solu c ao desse problema e o ponto:
x
=
_
1
1
_
Pode-se vericar que esse ponto atende ` as condi c oes de Kuhn-Tucker, pois:
f(x
) =
_
2
2
_
g
1
(x
) =
_
1
0
_
g
2
(x
) =
_
0
1
_
de forma que:
f(x
) + 2g
1
(x
) + 2g
2
(x
) = 0
CAP
ITULO 3. CARACTERIZAC
AO DAS FUNC
OES 41
Deve-se notar que, como a fun c ao objetivo e as restri c oes desse problema s ao todos
convexos, as condi c oes de Kuhn-Tucker tornam-se necess arias e sucientes para
caracterizar a otimalidade da solu c ao.
Exemplo 3.2 Considere-se o problema de otimiza c ao denido por:
x
= arg min
x
f(x)
sujeito a:
_
g(x) 0
sendo:
f(x) =
_
x
1
1 x
2
1
_
1 0
0 1
_ _
x
1
1
x
2
1
_
g(x) = 8
_
x
1
x
2
_
1 0
0 1
_ _
x
1
x
2
_
A solu c ao desse problema e o ponto:
x
=
_
2
2
_
Pode-se vericar que esse ponto atende ` as condi c oes de Kuhn-Tucker, pois:
f(x
) =
_
2
2
_
g(x
) =
_
4
4
_
de forma que:
2f(x
) +g(x
) = 0
Este problema possui fun c ao objetivo convexa, porem a restri c ao e uma fun c ao
c oncava. Dessa forma, as condi c oes de Kuhn-Tucker s ao apenas necess arias para
a otimalidade local de um ponto, sendo possvel que haja pontos que atendam ` as
condi c oes e n ao sejam mnimos locais do problema. Esse e o caso do ponto:
x =
_
2
2
_
Nesse ponto observa-se que:
f( x) =
_
6
6
_
g( x) =
_
4
4
_
de forma que:
1
3
f(x
) +
1
2
g(x
) = 0
o que signica que as condi c oes de Kuhn-Tucker se vericam no ponto. Entretanto,
o ponto x n ao e um mnimo local do problema, uma vez que h a pontos com valores
menores de fun c ao objetivo em toda vizinhan ca que se tomar do mesmo.
Captulo 4
Convergencia de Algoritmos
Um aspecto importante na constru c ao de algoritmos de otimiza c ao e a de-
termina c ao de condi c oes mediante as quais tais algoritmos convergem para
as solu c oes do problema.
Este captulo ir a lidar com dois conceitos distintos porem relacionados
com o problema da convergencia: Primeiro, ser a abordada a quest ao de
estabelecer que um algoritmo converge para a solu c ao do problema. A seguir,
ser a discutida a velocidade com que ocorre tal convergencia.
A maior parte do material deste captulo foi extrada da referencia (Luenberger
1984).
4.1 Algoritmos
Um algoritmo e denido como um mapeamento recursivo. A forma mais
simples de denir algoritmos e baseada no conceito de mapeamento de um
ponto para um ponto:
Deni cao 4.1 (Algoritmo) Seja x
0
R
n
, e seja o operador A() : R
n
R
n
. Esse operador e denominado algoritmo e a seq uencia denida por:
x
k+1
= A(x
k
) (4.1)
a partir de x
0
e denominada sada do algoritmo para a entrada x
0
.
Uma outra deni c ao de algoritmo que tambem se faz util para a an alise de
determinados problemas e mais geral, e se baseia no conceito de mapeamento
de um ponto para um conjunto.
42
CAP
ITULO 4. CONVERG
ENCIA DE ALGORITMOS 43
Deni cao 4.2 (Algoritmo Generalizado) Seja o espa co vetorial R
n
. Dena-
se Q como o conjunto de todos os subconjuntos desse espa co. Seja o operador
A() : R
n
Q tal que:
A = A(x) (4.2)
sendo x R
n
e A Q. Esse operador e um algoritmo generalizado.
Deni cao 4.3 (Sada do Algoritmo Generalizado) Toda seq uencia [x
k
]
gerada segundo a lei:
A
i+1
= A(x
i
)
x
i+1
A
i+1
(4.3)
ou seja, tomando como x
k+1
qualquer ponto pertencente ao conjunto A
k+1
e
chamada de sada do algoritmo generalizado, para um dado ponto inicial x
0
.
ITULO 4. CONVERG
ENCIA DE ALGORITMOS 44
i. x
k
x , x
k
R
n
ii. y
k
y , y
k
A(x
k
)
implicarem que:
y A(x)
O algoritmo generalizado A e dito fechado num domnio D se for fechado em
todos os pontos de D.
Deve-se observar que o conceito de algoritmo fechado, aplic avel a algo-
ritmos generalizados, recai no conceito de mapeamento contnuo, quando
se particularizam as condi c oes para o caso de algoritmos ordin arios. Ou
seja, um algoritmo ordin ario (ponto-para-ponto) que for um mapeamento
contnuo ser a um caso particular de algoritmo fechado. Com esses conceitos,
e possvel estabelecer um teorema que estabelece condi c oes sucientes para
a convergencia global de algoritmos fechados.
Teorema 4.1 (Teorema da Convergencia Global) Seja A um algo-
ritmo fechado num espa co R
n
. Suponha-se que, dado um ponto x
0
R
n
,
a seq uencia [x
k
]
k=0
e gerada, satisfazendo
x
k+1
A(x
k
)
Seja dado um conjunto-solu c ao R
n
, e suponha-se que:
i. Todos os pontos x
k
est ao contidos num conjunto compacto S R
n
;
ii. Existe uma fun c ao contnua z() : R
n
R tal que:
(a) x , z(y) < z(x) y A(x)
(b) x z(y) z(x) y A(x)
iii. O algoritmo A e fechado em todos os pontos fora de .
Ent ao o limite de toda subseq uencia convergente [x
k
] e uma solu c ao (pertence
a ).
Demonstrac
ITULO 4. CONVERG
ENCIA DE ALGORITMOS 45
que z(x
k
) z(x) > 0 para todo k. Pela convergencia de z() na subseq uencia,
existe, para um certo > 0, algum K K tal que z(x
k
) z(x) < para todo
k > K, com k K. Assim, para todo k > K:
z(x
k
) z(x) = z(x
k
) z(x
K
) + z(x
K
) z(x) <
Isso estabelece que z(x
k
) z(x).
Para completar a prova falta mostrar que x e uma solu c ao. Suponha-se que
n ao seja. Considere-se a subseq uencia [x
k+1
]
K
. Uma vez que todos os pontos
dessa seq uencia est ao contidos em um conjunto compacto, existe um
K K tal
que [x
k+1
]
K
converge para algum limite x. Tem-se ent ao que x
k
x, k
K, e
x
k+1
A(x
k
) com x
k+1
x, k K. Assim, uma vez que A e fechado em x
segue-se que x A(x). Mas isso implica z( x) = z(x), o que contradiz o fato de
que z() e uma fun c ao descendente.
Corolario 4.1 Sob as condi c oes do teorema 4.1, se consiste de um unico
ponto x
.
Bibliograa
Ackley, D. H., Hinton, G. E. & Sejnowski, T. J. (1985). A learning algorithm
for Boltzman Machines, Cognitive Science 9: 147169.
Akg ul, M. (1984). Topics in Relaxation and Ellipsoidal Methods, number 97
in Research Notes in Mathematics, Pitman Publishing Inc., London,
UK.
Belmont-Moreno, E. (2001). The role of mutation and population size in
genetic algorithms applied to physics problems, International Journal
of Modern Physics C 12(9): 13451355.
Bland, R. G., Goldfarb, D. & Todd, M. J. (1981). The ellipsoid method: a
survey, Operations Research 29(6): 10391091.
Cao, Y.-Y., Lam, J. & Sun, Y.-X. (1998). Static output feedback stabiliza-
tion: an ILMI approach, Automatica 34(12): 16411645.
Chankong, V. & Haimes, Y. Y. (1983). Multiobjective Decision Making:
Theory and Methodology, North-Holland (Elsevier), New York.
Chen, B. S., Cheng, Y. M. & Lee, C. H. (1995). A genetic approach to
mixed H
/H
2
optimal PID control, IEEE Control Systems Magazine
15(5): 5160.
Chen, C. T. (1984). Linear System Theory and Design, Hartcourt Brace
College Pub.
Choi, D. H. & Oh, S. Y. (2000). A new mutation rule for evolutionary pro-
gramming motivated from backpropagation learning, IEEE Transacti-
ons on Evolutionary Computation 4(2): 188190.
308
BIBLIOGRAFIA 309
Dias-Filho, W. (2003). Algoritmos Cone-Elipsoidais para Gera c ao de
Solu c oes Ecientes: Constru c ao e Aplica c oes, PhD thesis, Programa
de P os-Gradua c ao em Engenharia Eletrica da Universidade Federal de
Minas Gerais, Belo Horizonte, MG.
Dorigo, M., Maniezzo, V. & Colorni, A. (1996). Ant system: optimization
by a colony of cooperating agents, IEEE Trans. Sys. Man Cyb. - Part
B 26(1): 2941.
Dziuban, S. T., Ecker, J. G. & Kupferschmid, M. (1985). Using deep cuts
in an ellipsoidal algorithm for nonlinear programming, Math. Program.
Study 25: 93107.
Goldberg, D. E. (1989). Genetic Algorithms in Search, Optimization and
Machine Learning, Addison-Wesley.
J. C. Potts, T. D. G. & Yadav, S. B. (1994). The development and eva-
luation of an improved genetic algorithm based on migration and ar-
ticial selection, IEEE Transactions on Systems, Man and Cybernetics
24(1): 7386.
Jain, A. & Zongker, D. (1997). Feature selection: evaluation, application,
and small sample performance, IEEE Transactions on Pattern Analysis
and Machine Intelligence 19(2): 153158.
Johnson, J. M. & Ramat-Semii, Y. (1997). Genetic algorithms in engineering
electromagnetics, IEEE Antennas and Propagation Magazine 39(4): 7
25.
K. F. Man, K. S. T. & Kwong, S. (1996). Genetic algorithms: concepts and
applications, IEEE Transactions on Industrial Electronics 43(5): 519
534.
K. Rashid, J. A. R. & Freeman, E. M. (2000). A general approach for extrac-
ting sensitivity analysis from a neuro-fuzzy model, IEEE Transactions
on Magnetics 36(4): 10661070.
Khargonekar, P. P. & Rotea, M. A. (1991). Mixed H
2
/H
control: a con-
vex optimization approach, IEEE Transactions on Automatic Control
36(7): 824837.
BIBLIOGRAFIA 310
Luenberger, D. G. (1984). Linear and Nonlinear Programming, Addison-
Wesley.
Meneguim, R. A. (1999). An alise da sensibilidade de solu c oes em oti-
miza c ao atraves de elips oides mnimos, Masters thesis, Programa de
P os-Gradua c ao em Engenharia Eletrica da Universidade Federal de Mi-
nas Gerais, Belo Horizonte, MG.
Miranda, M. F. (2000). Controle Multivari avel na Presen ca de Incertezas,
PhD thesis, Programa de P os-Gradua c ao em Engenharia Eletrica da
Universidade Federal de Minas Gerais, Belo Horizonte, MG.
Naudts, B. & Kallel, L. (2000). A comparison of predictive measures of
problem diculty in evolutionary algorithms, IEEE Transactions on
Evolutionary Computation 4(1): 115.
Popper, K. R. (1974). A L ogica da Pesquisa Cientca (trad.), Ed. Cultrix.
(Logic der Forschung, 5a. ed. 1973; 1a. ed. 1934).
Rudin, W. (1991). Functional Analysis, McGraw-Hill.
Saldanha, R. R., Takahashi, R. H. C., Vasconcelos, J. A. & Ramirez, J. A.
(1999). Adaptive deep-cut method in ellipsoidal optimization for electro-
magnetic design, IEEE Transactions on Magnetics, Part I 35(3): 1746
1749.
Sareni, B. & Krahenbuhl, L. (1998). Fitness sharing and niching methods
revisited, IEEE Transactions on Evolutionary Computation 2(3): 97
106.
Schell, T. & Wegenkittl, S. (2001). Looking beyond selection probabilities:
adaptation of the
2
measure for the performance analysis of selection
methods in GAs, Evolutionary Computation 9(2): 243256.
Scherer, C., Gahinet, P. & Chilali, M. (1997). Multiobjective output-feedback
control via LMI optimization, IEEE Transactions on Automatic Control
42(7): 896911.
Shah, S., Mitchell, J. E. & Kupferschmid, M. (2001). An ellipsoid algorithm
for equality-constrained nonlinear programs, Computers and Operations
Research 28: 8592.
BIBLIOGRAFIA 311
Shimomura, T. & Fujii, T. (2000). Multiobjective control design via suces-
sive over-bounding of quadratic terms, Proceedings of the 39th IEEE
Conference on Decision and Control, Sydney, Australia, pp. 27632768.
Takahashi, R. H. C., Palhares, R. M., Dutra, D. A. & Gon calves, L. P. S.
(2001). Synthesis and characterization of Pareto-optimal solutions for
the mixed H
2
/H