Escolar Documentos
Profissional Documentos
Cultura Documentos
Trabalho de Graduao
Bases
de
Grbner
e
aplicaes em otimizao
por
Orientador:
Sumrio
Introduo
1 Preliminares
1.1
Estruturas algbricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Espao de Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3
1.4
Ideais Polinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2 Bases de Grbner
14
2.1
Algoritmo de Buchberger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
2.2
19
2.3
Sistemas Polinomiais
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
2.4
Comandos Computacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
3 Otimizao No Linear
26
3.1
Preldio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
3.2
Condies de Minimalidade
28
3.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1
. . . . . . . . . . . . . . . . . . . . . .
3.2.2
28
. . . . . . . . . . . . .
31
Um abordagem algbrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
3.3.1
Critrios de Factibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
3.3.2
39
3.3.3
Complexidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
42
4.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
4.2
44
Referncias Bibliogrcas
48
Agradecimentos
A Deus, por seu imenso amor, piedade e misericrdia em cada innitesimal de tempo que j vivi.
minha me Ceclia e meu pai Ezio pelos inmeros conselhos, auxlios e incentivos de todas
as formas possveis.
Ao meu irmo Masao por sempre ter sido meu irmo. Acredito que no haja melhor maneira
de expressar minha gratido.
Rayara Guedes, por ter me mostrado o verdadeiro valor das coisas; por ter me ensinado tanto
sobre minha prpria conscincia e valores pessoais; por toda a pacincia, motivao, os inmeros
gestos de carinho e pela oportunidade de fazer parte de sua vida.
Tania e Amrico Guedes, por abrirem seus coraes e me adotarem como um membro da
famlia.
minha av Toshiko e meus tios: Yuji, Srgio e Marina, por terem sido to pacientes, especialmente enquanto me acolhiam em sua casa.
minha antiga sala do ensino mdio, por me mostrar que existem vrias coisas para se fazer na
escola, alm de estudar. E aos meus professores do ensino mdio e fundamental, por me lembrarem
que estudar algo que se deve fazer na escola.
Aos meus amigos de graduao e repblica, especialmente: Catarina, Matheus Micadei, Wellinghton, Daniel Gaspar, Henrique Suetake, Chun, Maria Lvia, Joo, Gordo, Mariane, Nathan, Aline,
Fernanda, Jade, Henrique Euclides, Renan, Letcia, Fernandinho, Fbio, Nicolas, Vinicius, Karen,
Nickollas, Daniel Adamis, Calvin, Jordo, Douglas, Matheus Antunes, Guilherme, Reis, Gois e
Igor, por ajudarem a transformar at os piores dias em agradveis, e o fato do Pq. Tecnolgico ser
to longe do Satlite, em algo to bom! Fiz questo de citar alguns nomes, mas minha memria
realmente ruim.
Ao meu orientador, Angelo Bianchi, pela pacincia, conselhos, risadas e a esperana de que eu
tenha algum potencial.
Aos meus professores, especialmente: Lus Felipe, Grasiele, Gama, Pedro, Thiago, Shida, Rossano, Flvia, Camila, Ricardo, Vilhena, Juliana, Gabriel, Elizangela, Renato, Erwin, Robson, lvaro,
Vanessa, Jurandy e Reginaldo, pela humildade, por tudo o que me ensinaram, dentro e fora de sala,
pelo companheirismo, pacincia e toda a preocupao que tiveram.
A toda a irmandade, pelo enorme carinho e pelas oraes em tempos difceis.
Catarina, Matheus e Angelo novamente, pelas inmeras correes.
Bonnie, por ser a alegria dos nais de semana e no dar um nico momento de sossego; e ao
Gato, por deitar sobre os livros enquanto eu estudava.
Introduo
A teoria das Bases de Grbner foi proposta na tese de doutorado de Bruno Buchberger, em
1965, com a nalidade de fornecer uma forma prtica para a resoluo de importantes problemas
de deciso envolvendo ideais polinomiais em anis comutativos, por meio de conjuntos geradores
dotados de propriedades convenientes e calculados atravs do consagrado Algoritmo de Buchberger.
A abordagem a sistemas polinomiais atravs de ideais traz consigo um ganho algbrico inexistente
em outros mtodos, destacando-se a Teoria das Bases de Grbner, onde torna-se uma tarefa computacional a vericao da existncia de solues e o clculo efetivo destas. Isto abre uma vasta gama
de aplicaes em diversas reas.
Este trabalho voltado ao estudo e aplicao da Teoria das Bases de Grbner em alguns tipos
de problemas de otimizao polinomial, isto , que consistem em determinar os pontos que minimizam
o valor de uma funo polinomial, dadas restries tambm polinomiais. Pode ser considerado como
um caso particular, quando os polinmios associados estas restries e funo possuem apenas
coecientes inteiros no negativos.
Captulo 1
Preliminares
Neste captulo sero denidos os objetos de estudo e os rudimentos da teoria a ser utilizada no
decorrer do texto. Os resultados a seguir foram baseados, majoritariamente, em [3].
1.1
Estruturas algbricas
Notao 1.1.1.
sobre um conjunto
(M, +)
e, quando no houver
M.
Denio 1.1.2 (Semigrupo e Monide). Uma estrutura algbrica (M, +), dita semigrupo se, para
quaisquer
a, b, c
elementos de
M,
a + (b + c) = (a + b) + c (propriedade associativa). Um
id+ M , tal que id+ + m = m e
M , chamado monide.
vale que
m + id+ = m
para todo
Denio 1.1.3
pertencente a
Dado um monide
Notao 1.1.4.
M,
x M,
se existir,
(M, +, ),
sendo
operaes binrias
(M, +)
(M, )
de um dado
x.
+)
um grupo abeliano;
um semigrupo;
Para quaisquer
a, b, c M , a (b + c) = a b + a c
(a + b) c = a c + b c
(propriedade
distributiva).
Um anel dito com identidade (ou anel com unidade) se
(M, )
(M, ) abeliano. Um anel comutativo com unidade dito um domnio (de integridade)
a b = id+ a = id+ ou b = id+ . Um domnio um corpo, se (M \ {0}, ) for um grupo abeliano.
comutativo se
se
Um subconjunto de um anel que tambm anel chamado subanel, este conceito anlogo para as
outras estruturas.
CAPTULO 1.
PRELIMINARES
Notao 1.1.6.
ser chamada de
adio
ser
usualmente denominada
esta ser omitida.
Proposio 1.1.8.
quaisquer
Se M um anel e S M ,
a, b M , a b M e ab M .
ento
S 6=
e para
Conveno 1.1.9. Daqui em diante, qualquer referncia a anel, corresponder a um anel comutativo
com unidade 1, que ser denotado por
1.2
A,
Espao de Trabalho
(K[x1 , . . . , xn ], +, ),
K.
denotado por
K,
variveis
para, em
com coecientes em
Denio 1.2.1. O conjunto dos polinmios em n variveis sobre umPanel A, denotado A[x1 , . . . , xn ]
ou, simplesmente,
(i1 , . . . , in ) e xi
da forma
r
i=0
ai x i ,
onde
r N, i =
A[x1 , . . . , xn ] A.
Observao 1.2.2.
Dado
f A
(ou seja,
um polinmio
constante).
Para justicar a terminologia anel de polinmios, interessante discutir o caso do anel de polinmios em uma varivel e, indutivamente, ser construdo o anel de polinmios em vrias variveis.
Lema 1.2.3.
Pmax{n,m}
i=0
um caso
Seja
Demonstrao.
para
n N, n 2.
n = 1, o
A[x1 , . . . , xn1 ] um anel. Pode-se construir o conjunto
A[x1 , . . . , xn1 ], que um anel, devido ao lema anterior,
xn
sobre o anel
CAPTULO 1.
PRELIMINARES
Observao 1.2.5.
ento
f=
m
X
ai x1i1 . . . xnin , ai A
ij N {0},
i=1
para quaisquer
P
in
f= m
i=1 bi xn
i n1
i Nm e j Nn . Seja bi = ai x1 i1 . . . xn1
A[x1 , . . . , xn1 ], pode-se escrever
A[x1 , . . . , xn1 ][xn ]. A incluso contrria pode ser vericada analogamente.
Os teoremas a seguir fornecem dois resultados acerca dos divisores de zero e dos elementos
invertveis do anel de polinmios:
Teorema 1.2.6.
Demonstrao.
n
0
Se
(A, +, )
Como
um domnio, ento
A[x1 , . . . , xn ]
para
um domnio.
n 2,
ar1 br2 6= 0.
Teorema 1.2.7.
elementos
(A, +, )
invertveis de A.
Demonstrao.
Se
Como
A A[x1 , . . . , xn ],
A[x1 , . . . , xn ]
so os
A[x1 , . . . , xn ]. Proceda agora por induo no nmero de variveis. Para n = 1, dado f A[x1 ]
invertvel, se f
/ A ento deg(f ) 1 e existiria g A[x1 ], tal que f g = 1. Pelo Teorema anterior,
A[x1 ] um domnio logo deg(1) = deg(f ) + deg(g) > 1, pois deg(f ) > 1 e deg(g) > 0, o que um
absurdo, pois deg(1) < 1. Agora, suponha que os nicos elementos invertveis de A[x1 , . . . , xn1 ] so
aqueles invertveis em A. Assim, se f A[x1 , . . . , xn ] \ A invertvel, ento, pela hiptese indutiva,
f A[x1 , . . . , xn ] \ A[x1 , . . . , xn1 ] e, por um raciocnio anlogo ao feito na base da induo, desta
vez para o domnio A[x1 , . . . , xn1 ], chega-se ao absurdo de que deg(1) > 1. Portanto, os nicos
elementos invertveis de A[x1 , . . . , xn ] so os elementos invertveis de A.
veis em
Para uma parte posterior do trabalho, sero necessrios alguns resultados referentes a homomorsmos entre anis.
Denio 1.2.8
Sejam
Proposio 1.2.9.
Demonstrao.
Sejam
: A B um homomorsmo,
Ker() ideal de A.
Se
A,
so subanis de
so anis e
c, d Im(),
existem
cd = (a)(b) = (ab)
ab A
como
de
B.
Da
a, b A
e
tais que
(a) = c
ento
(b) = d,
Im()
Ker()
logo
logo
Im()
subanel
e f, ef Ker()
Ker()
subanel de
A.
Finalmente, sejam
ab Ker() e
subanel de A.
e conclui-se que
CAPTULO 1.
PRELIMINARES
de
Sejam
todo
aR
como o conjunto
um anel e
I R
Seja
um ideal. A funo
: R R/I ,
(a) = a + I , para
com ncleo I , chamada
denida por
Teorema 1.2.11
Ento,
(Teorema do Isomorsmo)
A/Ker()
isomorfo a
Se
:AB
so anis e
um homomorsmo.
Im().
Demonstrao.
1.3
Nesta seo ser estabelecida uma forma de ordenar elementos do anel de polinmios
K[n] ,
sendo
um corpo. Inicialmente, ser deninda uma relao de ordem, passando s ordens monomiais e, por
m, estabelecendo a divisibilidade entre polinmios.
Denio 1.3.1 (Relao de Ordem). Uma relao de ordem uma relao binria num conjunto
M 6=
1.
satisfazendo:
a a, a M
2. Se
a, b M
3. Se
a, b, c M
(reexividade).
so tais que
so tais que
a b,
Denio 1.3.2
ab
b a,
ab
ento
b c,
a=b
ento
(antissimetria).
ac
(transitividade).
diz-se que
precede ou igual a
b (a, b, M ).
Um conjunto
Princpio da Boa Ordenao (ou Princpio da Boa Ordem) quando possui um elemento que precede
todos os outros.
Notao 1.3.3.
M
K[x1 , . . . , xn ]
Denio 1.3.4
(Ordem Monomial)
sobre
a, b M
e so tais que
a b,
ento
a c b c, c M.
Observao 1.3.5.
Note que:
CAPTULO 1.
2. Se
PRELIMINARES
Exemplo
1.3.6
Q
(Ordem Lexicogrca)
M,
m, n M,
M.
Q
m = ni=0 xi i e
= , existe
tais que
se, denindo
a ordem que ordena pelo grau do monmio e, caso dois monmios tenham graus iguais, vale a ordem
Lexicogrca. possvel denir verses reversas dessas ordens: a Ordem Lexicogrca Reversa diz
que
Reversa ordena pelo grau do monmio e, no caso de igualdade, vale a Lexicogrca Reversa. Estas
ordens monomiais so relaes de ordem totais.
Denio 1.3.7
mio lder de
cl(f ),
. Fixada uma ordem monomial, dado f K[x1 , . . . , xn ], o monml(f ) := max {m|m M(f )}, o coeciente lder de f , denotado por
a ml(f ) e o termo lder de f tl(f ) := ml(f ) cl(f ).
(Termos Lderes)
denido sendo
o coeciente associado
Denio 1.3.8
mltiplo de
p),
(Divisibilidade)
com a notao
Observao 1.3.9.
b1
p|q ,
Sejam
bn
Teorema 1.3.10
tais que
(Algoritmo da Diviso)
f =qg+r
(ou que
quando existe
p, q M,
equivalente a dizer
Dados
f, g K[n] ,
p = x1 a1 . . . xn an e q =
que existe t M na forma
tais que
com
g 6= 0,
existem nicos
q, r K[n]
ml(g) - ml(r).
Demonstrao.
e, fazendo o mesmo em
Da, tome
q1 , q2 , r1 , r2 K[n] sendo f = q1 g + r1 e
f = q2 g + r2 de modo que ml(g) - ml(r1 ) e ml(g) - ml(r2 ). Primeiramente, note que se ml(g) - ml(r1 ),
ento ml(g) - m para todo m M(r1 ) e o mesmo vale para r2 . Como q1 g + r1 = q2 g + r2 logo
(q1 q2 ) g = r2 r1 e isto implica em r2 = r1 , caso contrrio valeria que tl(g) | tl(r2 r1 ) e isto
seria um absurdo, j que M(r2 r1 ) M(r1 ) M(r2 ). Se r2 = r1 segue que q2 = q1 , o que encerra a
Para mostrar a unicidade, suponha que existam
demonstrao.
Denio 1.3.11.
rg (f ),
chamado de
i Nk .
a1 , a2 , . . . , ak
r K[n] ,
tais que
por
g,
CAPTULO 1.
Demonstrao.
10
PRELIMINARES
Dado um polinmio
f K[n] ,
a1 , r1 K[n] ,
[n]
existem a2 , r2 K
tais que
Denio 1.3.13. Na notao do Teorema anterior, r ser chamado de resto da diviso generalizada
de
por
G = {f1 , . . . , fk }
e denotado por
rG (f ).
Vale mencionar que este resto no nico e pode-se ilustrar isto atravs de um exemplo.
Exemplo 1.3.14.
1.4
Tome
Ideais Polinomiais
K[x1 , . . . , xn ],
que ser o
principal objeto de estudo deste trabalho. Exibir-se-o tambm algumas propriedades e proposies
que fundamentaro vrios conceitos-chave para o desenvolvimento do trabalho. Sero apresentadas
proposies para anis em geral e, em seguida, resultados especcos para anis de polinmios.
0 I;
2.
a, b I
implica que
3.
aI
bA
Seja
Se
I A. I
A,
se:
a b I.
um anel, ento
a1 , . . . , a s A ,
um anel e
a + b I;
implica em
Observao 1.4.2.
(A, +, )
ideal gerado
{0}
so ideais de
A.
interessante denir o menor ideal que contm estes polinpor estes elementos. possvel formalizar esta ideia denindo
natural que ele seja o menor ideal (no sentido de que qualquer outro ideal o contm) que contm
a1 , . . . , a s ,
j que qualquer outro ideal que tiver tais elementos conter tambm o ideal gerado por
eles.
Denio 1.4.3
(Conjunto Gerado)
Dados
a1 , a2 , . . . , ak A,
ha1 , a2 , . . . , ak i
conjunto
{a1 b1 + a2 b2 + + ak bk | b1 , b2 , . . . , bk A},
a1 , a2 , . . . , ak .
a1 , a2 , . . . , ak .
Proposio 1.4.4.
Demonstrao.
Dados
f1 , . . . , fk A, hf1 , . . . , fk i
um ideal de
ento existem
a = f 1 a1 + + f k ak
o conjunto
A.
0 = a1 0 + + fk 0 hf1 , . . . , fk i,
a1 , . . . , ak , b1 , . . . , bk , tais que
a, b hf1 , . . . , fk i,
ha1 , a2 , . . . , ak i
j que
0 A.
Se
CAPTULO 1.
11
PRELIMINARES
b = f 1 b1 + + f k bk .
Logo,
a + b = f1 (a1 + b1 ) + + fk (ak + bk ),
a + b hf1 , . . . , fk i,
ou seja,
e, dado
c A,
a c = f 1 a1 c + + f k ak c
ai c A
e, como
para todo
i Nk , a c hf1 , . . . , fk i.
em
quando em
I + J,
Proposio 1.4.5.
hf1 , . . . , fk i
um ideal de
A.
I, J so
I + J = {a + b | a I, b J}.
Demonstrao.
I J,
Portanto,
Se
ideais de
A,
ento
IJ
I+J
tambm so ideais de
A,
sendo
e, como
que
Denio 1.4.6
S
ou seja,
Se
a + b I + J.
SI
Um ideal de
hSi = I , ento
que I um ideal
principal.
Analogamente, verica-se
unitrio, dito
Proposio 1.4.7.
1. Se
L I,
2. Se
L M A,
ento
Demonstrao.
Seja
I,
A,
ento:
hLi I .
ento
1. Seja
pertencem a
um ideal de
pois
hLi hM i.
2. Seja
a
dos elementos de
I,
Demonstrao.
{g1 , . . . , gs }
O fato de
que gera
Se
L,
de elementos de
L,
I.
gi I, i Ns .
que
Sendo
G=
gi
CAPTULO 1.
Proposio 1.4.9.
Demonstrao.
12
PRELIMINARES
Todo ideal de
Fixe
K[x]
principal.
Se
I = {0}
ou
I = K[x], no h nada a provar. Caso contrrio, escolha f I tal que deg(f ) o menor elemento
de {deg(g) | g I}. Pelo algoritmo da diviso, para cada g I existem qg , rg K[x] tal que
g = f qg + rg , com tl(g) - tl(rg ), ou seja, deg(f ) > deg(rg ). Sabe-se que rg I , pois f, qg g I .
Logo, pela minimalidade de deg(f ) e, como I 6= {0} e I 6= K[x], rg = 0. Portanto, g hf i, o que
conclui a demonstrao.
Lema de Dickson, que ser enunciado e demonstrado a seguir, representa uma ferramenta de
grande importncia na fundamentao das Bases de Grbner.
O
K[n]
mios.
Demonstrao.
Seja
I K[n]
Proceda por
I 6= {0}.
de induo).
f1 I
u N tal que I = hf1 , . . . , fu i. Para isto suponha que esta sequncia innita e dena
G = {g1 , g2 , . . .}. Por hiptese de induo o ideal J = hGi K[n1] nitamente gerado por
monmios, ou seja, existe M = {m1 , . . . , ms } J tal que J = hM i. Logo possvel escrever cada
elemento de G como combinao dos elementos de M e, como so todos monmios, cada elemento de
G mltiplo de algum elemento de M e o contrrio tambm vale: cada elemento de M mltiplo de
[n1]
algum em G. Em outras palavras, possvel dizer que para todo i N existem j N e pi K
[n1]
tais que gi = pi mj e, da mesma forma, para este j existem k N e qj K
tais que mj = qj gk ,
assim gi = pi qj gk . Isto trivial se i = k . Porm i 6= k , pois se fossem iguais pi qj = 1 e, portanto,
pi K e isto implicaria no conjunto M ser innito, anal, todo elemento de G seria associado a um
elemento de M . Mas dois elementos de G no podem estar associados a um mesmo elemento de
M , pois isto faria com que eles fossem associados entre si, o que no poderia ocorrer, j que cada f
existe
foi escolhido de modo a no pertencer a ideais gerados pelos termos anteriores da sequncia. Desta
forma, para cada elemento de
i > k,
A proposio a seguir fornece uma ideia simplicada do que vir a ser chamado de
Buchberger
no prximo captulo.
Proposio 1.4.11.
somente se,
Critrio de
Um elemento
M(f ) I .
f K[n]
I = hm1 , . . . , ms i
se, e
CAPTULO 1.
13
PRELIMINARES
Demonstrao.
f
f1 = f tl(f ), note
lder de f1 . Como f tem uma quantidade
pertencem a I , isto , M(f ) I .
dena
termo
Captulo 2
Bases de Grbner
Um dos grandes problemas da lgebra comutativa como chegar uma concluso a respeito do
problema da pertinncia de um elemento a um ideal num anel de polinmios sobre um corpo. Em
apenas uma varivel, como todo ideal principal, basta utilizar o Algoritmo da Diviso para resolver
este problema. No caso de ideais monomiais, foi visto que possvel resolver este problema simplesmente vericando se todos os monmios de um dado polinmio pertencem a este ideal. Isto fornece
uma ideia intuitiva de como possvel generalizar este conceito para ideais polinomiais quaisquer,
buscando elementos geradores cujos monmios lderes possuam propriedades convenientes.
conjuntos sero chamados
Bases de Grbner.
Estes
Denio 2.0.12
(Ideal Inicial)
I e chama-se ideal
in(I) = hml(I)i.
ml(I).
Em outras palavras
Denio 2.0.13
[n]
(Base de Grbner)
Fixe
existe
u ml(G)
tal que
mltiplo de
G
u.
inicial de
K[n] .
Seja
dos
por
um ideal de
quando, dado
v ml(I),
A seguir, h uma srie de equivalncias a respeito destes conjuntos que sero largamente utilizadas para estabelecer resultados importantes.
Teorema 2.0.14
{g1 , . . . , gp } I ,
(Teo.
2.26 de [3])
.
Dados
I K[n]
G =
1.
2.
in(I) = hml(G)i.
3.
f I
4.
com respeito a
.
rG (f ) = 0.
Ps
Demonstrao.
g hml(I)i um polinmio. Como
Ps todo ideal monomial nitamente gerado,
existem monmios m1 , . . . , ms ml(I) tais que g =
i=1 mi e, para todo i Ns existe um polinmio
fi I e um monmio hi K[n] tais que mi = hi ml(fi ). Como G uma Base de Grbner para I ,
se fi I existe u G tal que ml(fi ) mltiplo de ml(u), ou seja, fi hml(G)i. Consequentemente,
g hml(G)i e, portanto, hml(I)i hml(G)i. Por outro lado, como G I , ml(G) ml(I) e
hml(G)i hml(I)i.
(1
2)
Seja
14
CAPTULO 2.
15
BASES DE GRBNER
[n]
3) Seja
Ps f I . Pelo Algoritmo da Diviso Generalizado, existem q1 , q2 , . . . qs , rG (f ) K
tais que f =
i=1 gi qi +
Prs G (f ) e ml(rG (f )), no divisvel por ml(gi ) para qualquer i Ns , se
for no nulo. Dena q =
i=1 gi qi , como q combinao dos elementos de G I , ento q I e,
como f I , rG (f ) = f q I . Isto implica que ml(rG (f )) ml(I) hml(I)i = hml(G)i, ou seja,
ml(rG (f )) mltiplo de algum gi , o que ocorre somente se rG (f ) = 0. A recproca trivial, uma vez
que rG (f ) = 0 implica que f combinao dos elementos de G e, portanto, elemento de I .
(2
(4
ml(G),
4)
1)
ento
Se
Para todo
uma
Proposio 2.0.15.
Demonstrao.
I.
Nestas condies
ideal e
G = {g1 , . . . , gs }
ento
Agora, como
G hGi,
ento
ml(G) ml(hGi)
o que implica em
ml(J) ml(I),
logo
logo
Como consequncia direta da proposio seguinte, possvel concluir que uma Base de Grbner
, de fato, um conjunto gerador para seu ideal.
Proposio 2.0.16.
Se
in(I) = in(J),
Demonstrao.
Fixe
ento
I, J K[n]
J I.
I 6= J ,
Sejam
Corolrio 2.0.17.
gerador de
Seja
ento
I K[n]
um ideal.
Se
I,
ento
um
I.
Demonstrao.
Como
hml(G)i = in(J)
logo
que
in(I) =
Um dos resultados mais importantes que fundamentam a teoria a existncia das Bases de
K[n] .
CAPTULO 2.
16
BASES DE GRBNER
Teorema 2.0.18.
K[n]
Demonstrao.
I K[n]
um ideal e
Com este teorema em mos, possvel obter uma demonstrao alternativa de um caso particular do famoso Teorema da base de Hilbert, que foi provado inicialmente em 1888, pelo matemtico
alemo David Hilbert.
Todo ideal de
K[n]
de geradores.
Demonstrao.
Fixada uma ordem monomial, todo ideal possui, com respeito a esta ordem, uma
Base de Grbner
2.1
G,
Algoritmo de Buchberger
Ser estabelecida nesta seo uma forma de calcular efetivamente uma Base de Grbner, a partir
de qualquer conjunto nito de geradores de um ideal
I.
Denio 2.1.2
S-polinmio de
(S-polinmio)
e
g,
denotado por
S(f, g),
Exemplo 2.1.4.
xy y e g2 = y x
Dados
f, g K[n] ,
dene-se o
f
tl(f )
mmc(ml(f ), ml(g))
g
tl(g)
Qn bi
ai
,
m
=
x
2
i
i=1 xi
i=1
n
ci
,
sendo
c
=
max{a
x
i
i , bi },
i=1 i
Qn
como:
Observao 2.1.3.
M.
Algoritmo de
K[x, y]
com
y x.
Considere os polinmios
g1 =
S(g1 , g2 ) = (xy 2 )
xy y
y2 x
(xy 2 )
= y(xy y) x(y 2 x) = x2 y 2 .
xy
y2
A seguir, duas proposies que auxiliaro na construo de resultados essenciais para dar continuidade ao trabalho.
2.35 de [3])
vlido que:
S(f, g) = S(g, f ).
2. Se
m1 , m2 M,
ento
S(m1 , m2 ) = 0.
3.
f
ml(mmc(ml(f ), ml(g)) tl(f
) = mmc(ml(f ), ml(g)).
)
4.
CAPTULO 2.
17
BASES DE GRBNER
Demonstrao.
1.
f
S(f, g) = mmc(ml(f ), ml(g)) ( tl(f
2.
m1
3. Escreva
mmc(ml(f ),ml(g))
. Se
tl(f )
q=
g
)
tl(g)
ml(f ) =
Qp
g
= mmc(ml(f ), ml(g)) ( tl(g)
m2
)
tl(m2 )
i=1
xi ai
f
)
tl(f )
1
= mmc(ml(f ), ml(g)) ( m
m1
mmc(ml(f ), ml(g)) =
ml(g) =
p
Y
Qp
i=1
xi b i ,
= S(g, f ).
m2
)
m2
= 0.
segue que
xi max{ai ,bi } .
i=1
ml(q f ) = q ml(f ) =
mmc(ml(f ), ml(g)).
Logo,
4.
Qp
i=1
xi i ,
onde
i = (ci ai ) + ai = ci .
Portanto,
ml(q f ) =
f
g
mmc(ml(f ), ml(g)) tl(g)
)
ml(S(f, g)) = ml(mmc(ml(f ), ml(g)) tl(f
)
max{ml(f ), ml(g)} mmc(ml(f ), ml(g)).
ml(S(f, g))
S(f, g)
ml(f )
ml(g).
Teorema 2.1.6
(Critrio de Buchberger)
[n]
[Prop.
Demonstrao.
G,
Se
verdade que
e dados quaisquer
g1 , g2
tl(h1 g1 ) = tl(tl(h1 ) g1 ),
tl(h1 ) g1 tl(h2 ) g2
+
).
tl(h1 g1 ) tl(h2 g2 )
tl(h1 g1 ) = tl(h2 g2 ),
CAPTULO 2.
18
BASES DE GRBNER
tl(h1 )g1
tl(h1 ) g1 + tl(h2 ) g2 = tl(h1 g1 ) ( tl(h
+
1 g1 )
g1
= tl(h1 g1 ) ( tl(g
+
1)
tl(h1 g1 )
mmc(ml(g1 ),ml(g2 ))
S(g1 , g2 ).
Mas como
G,
g2
)
tl(g2 )
tl(h2 )g2
)
tl(h2 g2 )
elementos de
de
de
G:
s
X
X
tl(h1 g1 )
pi gi + (h1 tl(h1 )) g1 + (h2 tl(h2 )) g2 +
f=
hi gi .
mmc(ml(g1 ), ml(g2 )) i=1
i=3
Como
ml((h1 tl(h1 )) g1 ) L
e, alm disso,
ml(h1 g1 )
)L
mmc(ml(g1 ), ml(g2 ))
ml(S(g1 , g2 )
ento, pela forma como
ml((h2 tl(h2 )) g2 ) L
de
tal que
ml(hj gj ) = L
e que, claro, diferente dos que foi exibido at o momento, mas alm disso outro ter que existir
tambm, pois
deixam resto nulo na diviso pelo prprio conjunto, o que implicaria que este uma Base de Grbner.
Disso surge o Algoritmo de Buchberger, que visa incluir os restos da diviso dos S-Polinmios cujos
restos na diviso por
Algoritmo de Buchberger.
1.
Faa
2.
Enquanto
3.
G=S
dena
P 6= ,
Sejam
um ideal de
a partir de
SI
hSi = I .
Uma maneira
P = {(g, g 0 ) | g, g 0 G, g 6= g 0 }
faa :
4.
Escolha
um par de polinmios
5.
Calcule
r = rG (S(g, g 0 ))
6.
Se
r 6= 0,
K[n]
G,
ento faa
7.
8.
Retorne
(g, g 0 ) P
G = G {r}
remova-o
de
P = P {(g, r) | g G}
Note que, se em algum momento P = , isso signica que para qualquer par de polinmios
(g, g 0 ) G seu S-Polinmio deixa resto nulo na diviso por G e, portanto, G uma Base de Grbner,
isto j justica sua corretude. Resta ento vericar se o algoritmo nito, o que pode ser feito uma
[n]
vez vericada a
em K . Quando esta vlida, diz-se que o anel
Noetheriano.
ento existe
m N,
tal que
Im = Im+j ,
Sejam
para todo
CAPTULO 2.
Demonstrao.
19
BASES DE GRBNER
hf1 , . . . , fr i = I Im I,
ento como para qualquer
j , I Im Im+j I ,
conclui-se que
Im = Im+j ,
para todo
j N.
G.
Chamando-os de
com os quais foram adicionados ao conjunto, pode-se denir a sequncia, com os ndices respectivos
S(g1 , g2 ) = (xy 2 )
y2 x
xy y
(xy 2 )
= y(xy y) x(y 2 x) = x2 y 2 ,
xy
y2
rS (S(g1 , g2 )) = x2 + x 6= 0.
G = {g1 , g2 , g3 }. Calculando os S-Polinmios
verica-se que
S(g1 , g2 ) = g3 ,
logo
G,
g3 = x2 + x
obtm-se:
rG (S(g1 , g2 )) = 0;
2
S(g2 , g3 ) = (x2 y 2 ) x xx
(x2 y 2 ) y yx
= y 2 (x2 x) x2 (y 2 x) = x3 xy 2 = xg3 xg2
2
2
portanto, rG (S(g2 , g3 )) = 0.
Logo,
2.2
e,
I.
Sabendo como calcular Bases de Grbner a partir de qualquer conjunto nito de geradores, outro
problema pode ser encontrado: a Base de Grbner
algum sentido? Os resultados seguintes fornecem uma boa maneira de denir este sentido.
Proposio 2.2.1.
ml(g) | ml(h),
ento
para
I.
Se
g, h G
CAPTULO 2.
Demonstrao.
20
BASES DE GRBNER
I.
Diz-se
Seja
I K[n]
um ideal e
GI
de Grbner, ento
Seno
p = h,
mas
a proposio, pois
1. Todo elemento de
2. Dados quaisquer
Exemplo 2.2.3.
mnico;
g1 , g2 G
distintos,
ml(g1 ) - ml(g2 ).
A Base de Grbner
G.
A proposio a seguir til para demonstrar um importante resultado sobre unicidade e tambm
Proposio 2.2.4.
Seja
I K[n]
um ideal,
G I
H I
I.
Ento,
1.
tm a mesma cardinalidade;
G ou H
de modo que
Demonstrao.
1. Tanto
quanto
Suponha que as
2. Dado
g1 G,
existe
Denio 2.2.5 (Base de Grbner Reduzida). Seja I K[n] um ideal e G I uma Base de Grbner
para
1.
I. G
G
2. Dado
g G,
para todo
h G \ {g}, rh (g) = g .
o que mais restrito que no ser divisvel. Para obter uma Base de Grbner reduzida a partir de
uma mnima, pode-se simplesmente trocar todo elemento de
assim garantido que o conjunto resultante respeita a segunda propriedade de uma Base de Grbner
reduzida.
CAPTULO 2.
21
BASES DE GRBNER
Proposio 2.2.6.
Demonstrao.
Seja
Seja
um ideal de
g G.
termo de
existem
Ao dividir
g=
m1
X
gi qi + rH (g),
i=1
pelo Algoritmo da Diviso Generalizado, sendo
o termo (mnico) lder de
g.
Desta forma
rH (g) = g
m1
X
gi qi = ml(g) + rH (g ml(g)),
i=1
I , possui resto igual a ele mesmo na diviso por H , j que, novamente pelo Algoritmo
da Diviso, nenhum elemento de H divide rH (g ml(g)) e, por G ser base mnima, nenhum elemento
divide ml(g), como vale esse mesmo raciocnio para todo elemento de
que pertence a
Q = P,
logo
I,
mas como
g - rH (g ml(g)),
ento
I.
para o ideal
Proposio 2.2.8.
gi
de
pelos outros
K[n] ,
todo ideal
gi .
I K[n]
Demonstrao.
{h1 , . . . , hk },
os conjuntos
G = {g1 , . . . , gk }
H =
qualquer
gi = hi ,
ento
H=G
ml(hp ) 6= ml(hi ).
i Nk
qualquer e provadp
Obtendo a informao sobre a unicidade das Bases de Grbner Reduzidas, possvel estabelecer
um resultado til a respeito da igualdade entre dois ideais, que segue como corolrio da proposio
anterior.
Corolrio 2.2.9.
so iguais.
Dois ideais de
K[n]
CAPTULO 2.
22
BASES DE GRBNER
Demonstrao.
Se dois ideais so iguais, ento suas Bases de Grbner reduzidas so iguais, devido
[n]
sua unicidade. Por outro lado, se dois ideais I, J K
possuem uma mesma Base de Grbner
reduzida
G,
ento
J = hGi = I .
Observao 2.2.10.
feita que calcular Bases de Grbner Reduzidas pode ser visto como uma espcie de generalizao
da Eliminao de Gauss para sistemas polinomiais no lineares.
Exemplo 2.2.11. Considere o seguinte sistema polinomial e a ordem lexicogrca em C[x, y, z], com
z y x.
2
x yz = 3,
y 2 xz = 4,
2
z xy 5.
Calculando a Base de Grbner reduzida do conjunto
S = {x2 yz 3, y 2 xz 4, z 2 xy 5}
13x + 11z = 0,
13y z = 0,
36z 2 = 169.
Este sistema mais simples em termos de grau e, assim como na Eliminao de Gauss, uma parte do
sistema de fcil resoluo, no caso, a terceira equao de uma varivel apenas e obter os valores
de
2.3
Sistemas Polinomiais
Agora ser feita a interpretao de resultados a respeito de sistemas polinomiais e suas solues em
[n]
termos de ideais. Ser feita livre associao entre um polinmio f K
e sua funo polinomial
n
n
homnima associada f : K K. Um elemento p K chamado de
ou
do polinmio f
n
quando f (p) = 0. Num sistema de equaes polinomiais, pode-se dizer que q K uma
raiz
deste, se
zero em comum
zero
soluo
Todo polinmio de
C[z]
C.
Observao 2.3.1.
C[n]
Lema 2.3.2.
tal que
Um polinmio
p q = 1.
p C[n]
q C[n]
CAPTULO 2.
Demonstrao:
23
BASES DE GRBNER
p no tem razes, ento deg(p) < 1. Caso contrrio, teria razes devido ao Teorema
1
Fundamental da lgebra. Da p C, logo existe q = , tal que q p = 1. Vale ressaltar que, como
p
p no tem razes, p no o polinmio nulo. E como C um corpo, ento p tem inverso. Por outro
lado, se existe q , tal que p q = 1, suponha que p tenha pelo menos uma raiz, ou seja, que exista
u Cn , tal que p(u) = 0. Como p(z) q(z) = 1 para todo z Cn , ento signica que, como C[n]
n
um domnio, para todo z C , p(z) 6= 0 e q(z) 6= 0, o que um absurdo pois u raiz de p.
Se
Proposio 2.3.3
[n]
(Teo. 6 de [4]) Fixe uma ordem monomial em C . Um conjunto nito de
[n]
polinmios p1 , p2 , . . . , pm C
no tm razes em comum se, e somente se, existem polinmios
[n]
q1 , . . . , qm C , tais que p1 q1 + + pm qm = 1.
Isto pode ser traduzido em termos de ideais como: um sistema de equaes polinomiais em
vrias variveis com coecientes complexos no possui soluo se, e somente se, 1 pertence ao ideal
gerado pelos polinmios que formam o sistema, o que fornece uma maneira de vericar se um sistema
no possui soluo. Este resultado conhecido como
Proposio 2.3.4.
weak nullstellensatz
ou
[n]
Demonstrao.
z Kn , tal que
seja, uma soluo de Sp . Seja g um
Pr
Pr si (z) = 0, i Nr , ou
[n]
elemento qualquer de I , ento g =
i=1 ai (z) si (z) = 0, o
i=1 ai si , com ai K . Logo, g(z) =
que mostra, em particular, que z soluo de Gp tambm. Analogamente, as solues de Gp tambm
so solues de Sp . Portanto, os dois sistemas so equivalentes.
Seja
Teorema da Eliminao,
Teorema 2.3.5
(Eliminao)
Sejam
Isto signica que, num sistema de equaes polinomiais, se houver soluo e parte do sistema
for de fcil resoluo, possvel estender suas solues para o sistema completo.
A seguir, dois
Exemplo 2.3.6.
x = 1,
so para
g1 .
encontram-se
Resolvendo
e
o
Exemplo 2.3.7.
2
g2
{g1 , g2 }.
yz 3, y xz
2
Considere o mesmo sistema do Exemplo 2.2.11, formado pelo conjunto S = {x
2
4, z xy 5}, e a ordem lexicogrca em C[x, y, z], com z y x. O sistema
13x + 11z = 0,
13y z = 0,
36z 2 = 169.
CAPTULO 2.
24
BASES DE GRBNER
um caso ideal para aplicar a Eliminao, pois so conhecidos os valores possveis da varivel
13
13
so z =
e z = , logo possvel elimin-la e resolver outros dois sistemas da forma:
6
6
Observao 2.3.8.
z , que
13x = 11 ( 13
),
6
13
13y = 6 .
, 1 , 13 )
( 11
6 6 6
( 11
, 61 , 13
),
6
6
Apesar dos resultados desta seo terem sido desenvolvidos para o corpo
C.
C,
R, que, apesar de no ser algebricamente
possvel resolv-lo por meio dos mtodos deduzidos at este ponto e, eventualmente, obter solues
reais, ignorando as que so complexas.
Tambm existe o interesse em saber se o sistema admite nitas solues ou no, caso tenha ao
menos uma soluo. Para isto faz-se necessrio ter em mos um resultado conhecido como a
Teorema 2.3.9.
de
Sejam
verso
so zeros
Demonstrao.
1 = h(1 yf ) + h1 f1 + + hm fm
e, em particular, para
y = 1/f
1=
(formal),
m
X
i=1
s N \ 0 escolhido convenientemente
g1 , . . . , gm C[x1 , . . . , xn ] tais que
Logo, existe
polinmios
f =
m
X
fs
obtm-se
i=1
s
o que conclui a demonstrao pois, desta forma, f I . A recproca trivial, j que toda raiz comum
s
de f1 , . . . , fm ser tambm raiz de f e, consequentemente, de f .
Como uma consequncia direta dos passos utilizados na demonstrao anterior, pode-se enunciar, em termos de ideais, que
f1 , . . . , f m
1 hf1 , . . . , fm , 1 yf i.
O resultado a seguir fornece um critrio para saber se a quantidade de solues de um sistema
polinomial nita ou no.
Sejam
f1 , . . . , f m
CAPTULO 2.
25
BASES DE GRBNER
Demonstrao.
i
Suponha que, para todo i Nn , existe i N \ {0} tal que xi ml(I). Ento,
existe gn I de modo que ml(gn ) = xnn . Logo, gn C[xn ], pela ordem lexicogrca xada. O
nmero de solues da equao gn = 0 limitado superiormente por degxn (gn ) = n (sendo este o
n1
grau de gn referente varivel xn ). Da mesma forma, existe gn1 I tal que ml(gn1 ) = xn1 e
gn1 C[xn1 , xn ] pois xn xn1 . Para cada soluo zn de gn = 0, o nmero de solues da equao
gn1 (xn1 , zn ) = 0 limitado por n1 , logo o nmero de solues do sistema gn = gn1 = 0 limitado
superiormente por n n1 . Prosseguindo com argumentos anlogos para i = 1, 2, . . . , n 2, possvel
concluir que o nmero de solues do sistema g1 = g2 = = gn = 0 limitado por 1 2 . . . n . Todas
as solues de f1 = f2 = = fm = 0 so tambm solues de g1 = g2 = = gn = 0 e este possui
nitas solues, portanto, o mesmo ocorre com o sistema original. Reciprocamente, se f1 , . . . , fm
possuem uma quantidade nita de zeros em comum, denote-os por l1 = (z11 , . . . , zn1 ), . . . , lk =
Q
(z1k , . . . , znk ). Construa hi = kj=1 (xi zij ) C[xi ] C[x1 , . . . , xn ], com i Nn e k N, e tem-se
k
que ml(hi ) = xi para todo i. Note que l1 , . . . , lk so razes de hi para todo i Nn . Logo, pelo
ksi
s1
s
teorema anterior, existem s1 , . . . , sn tais que {h1 , . . . , hnn } I , logo ml(hi ) = xi
ml(I) para todo
i Nn .
possvel trabalhar com os resultados exibidos nesta seo utilizando uma linguagem mais
enxuta para representar o conjunto de solues de um sistema polinomial.
espao am, que o domnio das funes polinomiais que foi utilizado at este momento,
ser explicitado o que vem a ser uma variedade de um ideal.
conceito de
Denio 2.3.11
ai K, i Nn }
(Espao Am)
chamado de
Seja
n-simo
um corpo. Para
n N,
o conjunto
Kn = {(a1 , . . . , an ) |
espao am.
Denio 2.3.12
(Variedade Am)
Sejam
f1 , . . . , fn K[n]
I K[n]
polinmios. Fazendo a devida associao destes polinmios com suas funes polinomiais, dene-se
n
a variedade am de I como o conjunto V (I) = {a K | f (a) = 0, f I}.
[n]
Para determinar a variedade am de um ideal I K
basta saber quais os elementos do
n
espao am K que anulam um conjunto gerador de I . Quando a cardinalidade de V (I) for nita,
diz-se que
I I(V (I)) e, em geral, I(V (I)) 6= I (o Teorema 2.3.9 acerta sobre o ideal I(V (I)) coincidir com o
radical de I , isto , o ideal dos elementos que possuem alguma potncia em I , mas isto foge do escopo
deste trabalho). Por vezes ser utilizada esta linguagem, mas, na maior parte do texto, predominar
uma abordagem mais rstica, assim como a que veio sendo utilizada at ento.
2.4
Comandos Computacionais
software Maple 2010 possui um pacote para o clculo de Bases de Grbner a partir de qualquer conjunto G de polinmios e uma ordem monomial desejada. Aps carregar o pacote com With(Groebner),
o comando Basis(J :=hGi, Ordem Monomial(x1 , x2 , . . . , xn )) fornece a Base de Grbner reduzida B
O
do ideal
J = hGi
software
Faugre F4
C[x1 , . . . , xn ].
O algoritmo para o
IsProper(J) e,
quantidade de solues nita com IsZeroDimensional(J). O comando Solve(G)
car se o sistema
G=0
V (J).
caso positivo, se a
simplica e resolve
por
G,
utiliza-se o comando
Captulo 3
Otimizao No Linear
Ser discutida neste captulo uma forma para se aplicar a Teoria das Bases de Grbner na resoluo
de problemas de otimizao.
3.1
Preldio
Esta seo ser aberta denindo o que um problema de otimizao, deixando implcita a relao
[n]
entre polinmios em R
e suas funes polinomiais homnimas associadas ao longo do texto.
Problema 3.1.1.
Sejam
polinomiais homnimas a
seguinte problema:
min f (x1 , . . . , xn ),
sujeito a
gi 6 0, i Np
hj = 0, j Nq .
restrio
de igualdade e um ponto que satisfaz todas as restries do problema dito vivel ou factvel.
Neste problema, cada
gi
recebe o nome de
restrio de desigualdade
(P1)
e cada
hi
chamada
Para resolv-lo, sero necessrios alguns resultados do Clculo que, a priori, no sero propostos
formalmente, resumindo-se apenas a discusses.
limite e derivada para uma nica varivel e, em seguida, estes conceitos sero comentados em vrias
variveis.
Denio 3.1.2
dito o limite de
implica em
Proposio 3.1.3.
Dadas
f, g : I R R
1.
2.
26
z I,
ento:
CAPTULO 3.
27
OTIMIZAO NO LINEAR
Denio 3.1.4
(Derivada)
Seja
I R
um intervalo,
f :I R
uma funo e
z I. f
dita
lim
xz
f (x) f (z)
.
xz
f (z)
. Uma funo que
x
0
derivel em todo ponto de seu domnio ser dita derivvel (ou diferencivel). A funo f : I R
Se existir, o limite chamado derivada de
que associa cada ponto de
em
e denotado por
f 0 (z)
ou
como sendo aquele que associa cada funo diferencivel sua funo
x
derivada.
Observao 3.1.5. A derivada da derivada de uma funo f (chamada tambm de segunda derivada)
f 00
Proposio 3.1.6.
a, b R,
ou
2f
. De forma anloga, a
x2
O operador
nx
f (n)
ou
f, g : I R R
ento
f
g
(a f + b g)
=a
+b
.
x
x
x
Exemplo 3.1.7.
n1
n-sima
n
0
A derivada de uma funo constante zero e a derivada de f (x) = x f (x)
N. Em particular, se f (x) = an xn + + a1 x + a0 , ento a derivada de f (x)
f 0 (x) = n an xn1 + + 2 a2 x + a1 .
Proposio 3.1.8
Dom(f ).
Ento,
Denio 3.1.9
(Regra da Cadeia)
0
0
(f (g(x))) = f (g(x))
(Mnimo e Mximo)
Sejam
g 0 (x).
Seja
f, g : R R
Im(g)
I,
de mnimo/mximo global.
um elemento
Proposio 3.1.11.
2
aI
Seja f : I R
f (a)
= 0.
tal que
x
derivada parcial
ou
direcional
derivando em uma nica varivel, tratando as demais como constantes. Dada uma funo derivvel
f : I Rn R nas variveis x1 , . . . , xn , pode-se denotar sua derivada parcial em relao varivel
. Em uma varivel, o sinal da derivada indica a direo de
xi , i Nn , num ponto z I por fx(z)
i
crescimento da funo, em vrias variveis o sinal de cada derivada parcial um componente da
direo de crescimento da funo. Ser denida formalmente a generalizao deste conceito.
. . . fx1 (z)
x1
n
.
.
JF (z) =
,
.
Sejam
fm (z)
x1
...
fm (z)
xn
e dene-se aqui tambm o operador jacobiano, que relaciona um vetor de funes diferenciveis
sua Matriz Jacobiana.
CAPTULO 3.
28
OTIMIZAO NO LINEAR
no ponto
z,
denotado por
f (z),
f : I Rn R
derivvel em
a Matriz Jacobiana de
em
z I,
o vetor
transposta, isto ,
f (z)
f (z) =
x1
.
. ,
.
f (z)
xn
e seu sentido e direo indicam o crescimento da funo, como o nome sugere. Dene-se aqui tambm
o operador gradiente, que associa uma funo diferencivel ao seu vetor gradiente.
Assim como em uma varivel, podem ser denidos pontos crticos como sendo aqueles em que
a derivada zero em todas as direes, ou seja, em que o gradiente nulo. Pode-se tambm extender
a regra da cadeia para funes de vrias variveis por meio do jacobiano.
Denio 3.1.14
(Matriz Hessiana)
Seja
f : I R R
z I.
Um
2
conceito anlogo ao de segunda derivada em vrias variveis a Matriz Hessiana, denotada por f ,
que o resultado da aplicao do operador jacobiano ao gradiente de
2 f (z)
...
x21
2 f (z)
x x . . .
2 1
2 f (z) =
.
.
.
2 f (z)
...
xn x1
Denio 3.1.15.
f.
Explicitamente,
2 f (z)
x1 xn
2 f (z)
x2 xn
2 f (z)
x2n
Observao 3.1.16.
n N,
uma matriz
zero do gradiente da funo objetivo e cuja Matriz Hessiana neste ponto denida positiva, uma
soluo local de (P1). De fato, pontos que satisfazem tais condies so minimizadores locais, o que
tambm um resultado generalizado do Clculo. Estes conceitos fornecem a ideia para decidir quando
um ponto soluo local de um problema de otimizao, que tambm ser livremente chamado de
mnimo local.
3.2
Condies de Minimalidade
Esta seo dedicada ao estabelecimento de algumas condies necessrias e sucientes para que um
ponto seja mnimo local e foi baseada em [5].
Sabe-se que um ponto crtico vivel um candidato a mnimo local (Proposio 3.1.11), mas
existe a possibilidade de no existirem pontos crticos na regio vivel, neste caso devem-se estabelecer
condies tambm para que um ponto ordinrio seja candidato a mnimo.
Observao 3.2.1.
Ao longo desta seo ser pressuposto que as funes envolvidas so pelo menos
3.2.1
Sero construdas condies de minimalidade partindo de casos particulares, por exemplo, quando o
problema conta apenas com restries de igualdade. Neste caso, a interseo de todas as restries
resulta ou no conjunto vazio, que no interessa no momento; ou em uma superfcie de dimenso igual
ou inferior do domnio da funo objetivo, que ser chamada de
problema da forma
regio factvel.
Tem-se ento um
CAPTULO 3.
29
OTIMIZAO NO LINEAR
min f (x)
sujeito a h(x) = 0,
com
x Rn , f : Rn R
h = (h1 , . . . , hq ) : Rn Rq ,
S = {x Rn | hi (x) = 0, i Nq }
Se
com
(P2)
q N.
arcos factveis, isto , curvas que podem ser descritas por parametrizaes
x : I R S , de modo que
disso, para cada t I , a coleo
x(t) =
0
de vetores x (t) =
superfcie tangente a S .
para todo
x : I S,
para todo
necessrio que a tangente a cada arco factvel seja ortogonal aos gradientes das restries. Logo, a
superfcie tangente dada pelas derivadas dos arcos factveis. Mas pode acontecer de no existirem
arcos factveis em nenhum ponto da regio factvel, o que no interessante neste contexto, logo a
existncia de arcos factveis mais uma hiptese a se trabalhar.
Um ponto factvel
so linearmente independentes.
Observao 3.2.3. Sempre possvel caracterizar arcos factveis diferenciveis em pontos regulares.
O teorema a seguir resume o que foi discutido anteriormente.
Teorema 3.2.4
S
em
Observao 3.2.5.
com o
ncleo
Ker(Jh (z))
z Rn ,
S,
ento a superfcie
a superfcie tangente de
tangente a
coincide
para homomorsmos). Isto pode ser melhor visualizado com restries lineares, a ento seria um
problema de minimizar
f (x)
e o ncleo de
Agora que foi proporcionada uma caracterizao da superfcie tangente, pode-se especular que,
num ponto de mnimo, o gradiente da funo objetivo ortogonal ao plano tangente regio factvel.
Isto tem sentido porque, se assim no fosse, haveria uma direo vivel em que a funo objetivo
assume valor menor, j que a superfcie das direes de descida cortaria a superfcie vivel neste
ponto. Isto no acontece se sua fronteira coincidir com a superfcie tangente. Pode-se formalizar o
que foi discutido neste pargrafo por:
Teorema 3.2.6.
Seja
que
f (z) =
q
X
1 , . . . , q R
tais
i hi (z).
i=1
Demonstrao.
x : I R S,
(s) = f (x(s)) em que s?
s?
se
z = x(s? ),
ento (P2)
raiz de
z,
o gradiente de
z,
ou seja,
CAPTULO 3.
30
OTIMIZAO NO LINEAR
so chamados
Denio 3.2.7 (Funo Lagrangeana). Sobre o problema de otimizao (P2), dene-se como funo
lagrangeana
a funo
positiva no espao de trabalho todo, mas apenas no plano tangente regio vivel.
Teorema 3.2.8.
Se
Demonstrao.
y t 2x L(z, ) y > 0
no ponto
Rq
para todo
tal que
y T,
z.
x : I R S , com z = x(s? ),
qual s? soluo. Sabe-se que
(s) = f (x(s))
no
Rm ,
denindo
(s) = t h(x(s)),
mesma forma,
(s? ) =
q
X
como
vivel, ento
t h(x(s? )) = 0
e, da
i t hi (x(s? )) x0 (s? ) = 0,
i=1
e, tambm,
00
(s? ) =
q
X
i=1
Utilizando as relaes obtidas, tem-se
00
q
X
i=1
Se
q
X
i=1
mnimo, ento vale a condio necessria de primeira ordem, que permite considerar
como
00
q
X
i=1
onde a no negatividade decorre do fato de que
de
T,
s?
e que
2x L(z, )
= f (z) +
q
X
i=1
conclui-se que
2z L(z, )
y >0
para qualquer
y T.
i 2 hi (z),
x0 (s? )
qualquer vetor
CAPTULO 3.
31
OTIMIZAO NO LINEAR
12.4 de [5])
Sejam
um ponto regular em
o plano tangente
em
z.
tal que
y t 2z L(z, ) y > 0
para todo
y T \ {0},
Observao 3.2.10.
3.2.2
O objetivo agora estabelecer condies similares s da subseo anterior, mas para problemas
envolvendo restries de desigualdade. Em outras palavras, o foco estar no problema:
min f (x)
sujeito a
sendo
f : I Rn R, hi : I R, i Np
gj (x) 6 0, j Nq ,
hi (x) = 0, i Np ,
gj : I R, j Nq
(P3)
funes e
n, p, q N.
Tratando o caso com restries de desigualdade, se dentro da regio vivel existir algum ponto
crtico de
f,
ento este ser, claro, um candidato a mnimo local, bastando apenas vericar se a
Matriz Hessiana em tal ponto denida positiva. Caso contrrio, um candidato a mnimo local
certamente estar em uma das fronteiras da regio, pois se
direo oposta de
f (z)
Ou seja, algumas das restries sero satisfeitas com igualdade e estas sero chamadas de
ativas
em
restries
z.
Assim como foi feito com o Problema (P2), que possua restries somente de igualdade, podese deduzir algo semelhante para um problema com ambos os tipos de restries e estabelecer algumas
condies necessrias e sucientes para minimalidade de um ponto. Considere ento
z factvel e, se z
hi (x) = 0, i Np , j Nq }, possvel
gj (x) 6 0
z soluo do
S = {x I |
como restries
Teorema 3.2.11.
a Matriz Jacobiana de
ou seja, removendo as
linhas correspondentes s derivadas das restries no ativas. Considere tambm que o nmero de
p
restries ativas em z s(z) e a funo h := (h1 , . . . , hp ) : I R . Se z mnimo local de (P3), ento
q
s(z)
t
t
existem R , R
tais que f (z) + Jh (z) + Wg (z) = 0 e k > 0 para todo k Ns(z) .
A ideia para validar este teorema a mesma de quando isto foi feito para restries de igualdade,
tomando o cuidado de considerar apenas as restries ativas e garantir que o ponto seja vivel
quanto s outras restries. Isto envolve o uso um pouco mais delicado dos arcos factveis e existe
a necessidade de
CAPTULO 3.
32
OTIMIZAO NO LINEAR
i gi (z) = 0,
Redena a funo lagrangeana como
primeira ordem novamente se resumir
Np ,
se
com
i > 0,
para todo
i Np .
for mnimo local. Alm disso, pode-se tambm denir condies de segunda ordem.
Teorema 3.2.12.
Se
Rq
Rs(z)
tais que
k > 0
para todo
k Ns(z) .
Alm disso
y t 2z L(z, , ) y > 0,
sendo
Wg
para todo
y T = {y Rn | Jh (z) y = 0
Wg (z) y = 0},
Pq
i=1
i 2 hi (x) +
Pp
j=1
j 2 gj (x).
Com isso todas as condies necessrias de minimalidade, de primeira e segunda ordem, foram estabelecidas.
Assim como antes, estas condies so tambm sucientes para um ponto ser
Teorema 3.2.14.
com
i > 0
para
Seja
z S,
i Ns(z) ,
Rq
Rs(z) ,
satisfazendo
y t 2z L(z, , ) y > 0,
sendo
Wg
para todo
y T,
Denio 3.2.15. As condies necessrias (Teorema 3.2.12) e sucientes (Teorema 3.2.14) chamamse
3.3
Um abordagem algbrica
Neste ponto o objetivo exibir uma forma de abordar problemas de otimizao polinomial no linear
utilizando a teoria algbrica desenvolvida neste trabalho.
f : Rn R, gi : Rn R, i Np
hj : Rn R, j Nq
min f (x1 , . . . , xn )
sujeito a
gi 6 0, i Np ,
hj = 0, j Nq .
Existe mais de uma maneira de reduzir este problema num sistema polinomial.
agora apresentar uma destas e vericar sua funcionalidade, vantagens e desvantagens.
(P4)
A inteno
CAPTULO 3.
33
OTIMIZAO NO LINEAR
Variveis de Folga
1
Problema (P4) num outro constitudo apenas por restries de igualdade. Isto ser feito inserindo
variveis de folga
Problema 3.3.2.
Considere
n, p, q N
f, g1 , g2 , . . . , gp , h1 , . . . , hq R[n+p]
e o seguinte problema:
g1 + x2n+1 =: g1? = 0,
...
sujeito a
gp + x2n+p =: gp? = 0,
hj = 0, j Nq .
(P5)
claro que qualquer soluo do Problema (P5) deve, ao menos, ser soluo do sistema de
restries e os valores das variveis de folga na verdade no fazem diferena num mbito geral, desde
que seu quadrado seja positivo. Contudo isto no um problema, j que solues cujos valores das
variveis de folga forem complexos sero ignoradas, ressaltando que o sistema KKT resolvido em
R.
i gi (z) = 0,
g ? (z) = 0,
h(z) = 0,
sendo
z = (x1 , . . . , xn , . . . , xn+p )
em
Rn+p , Rq , Rp ,
esto sendo consideradas no clculo dos gradientes e ainda mantm-se a condio da nulidade dos
multiplicadores em restries ativas. vivel calcular a Base de Grbner Reduzida do ideal gerado
pelos polinmios associados cada equao do sistema considerando
Exemplo 3.3.3.
Considere o problema
g1 (z) = 1 x1 x2 6 0,
g2 (z) = 1 x2 6 0,
sujeito a
g3 (z) = x3 1 6 0.
Pode-se vericar se este problema factvel pelo critrio estabelecido no Teorema 2.3.3, ou seja,
vericando se 1 pertence ao ideal gerado pelos polinmios do sistema de restries, j inseridas as
1A
abordagem feita desta maneira foi inspirada em [7], porm com modicaes. O crdito pela sugesto de utilizar
de variveis de folga quadrticas para lidar com desigualdades deve-se a Lus Felipe Bueno.
CAPTULO 3.
variveis de folga.
retorna
34
OTIMIZAO NO LINEAR
y1 , y2 , y3
IsProper
multiplicadores de Lagrange, e
z1 , z2 , z3
as variveis
18x1 y1 x2 = 0,
2x2 y1 x1 y2 = 0,
18x3 + y3 = 0,
y1 (1 x1 x2 ) = 0,
y2 (1 x2 ) = 0,
y3 (x3 1) = 0,
1 x1 x2 + z12 = 0,
1 x2 + z22 = 0,
x3 1 + z32 = 0.
J C[x1 , x2 , x3 , y1 , y2 , y3 , z1 , z2 , z3 ]
gerado
pelos polinmios associados estas equaes, considerando a ordem lexicogrca graduada com
z1 z2 z3 y1 y2 y3 x1 x2 x3 ,
18x3 + y3 = 0,
18 y3 + 18z32 = 0,
1 x2 + z22 = 0,
y32 + 18y3 = 0,
2y2 + y22 + y2 y1 = 0,
36 + y12 + 2y2 y22 36z12 = 0,
y2 + y2 x2 = 0,
y1 x2 18x1 = 0,
2x22 y2 y1 = 0,
18y2 x1 2y2 + y22 = 0,
2x2 + y1 x1 + y2 = 0,
1 + x1 x2 z12 = 0,
18x21 y1 = 0,
16y2 + y22 + 18y2 z12 = 0,
32y2 + 14y22 + y23 = 0,
y1 z12 = 0,
16y2 + y22 + 36x2 z12 = 0,
x1 z12 = 0,
z12 + z14 = 0.
Este sistema essencialmente mais simples, apesar de maior. Vericando o critrio estabelecido pelo
Teorema 2.3.10, atravs do comando
IsZeroDimensional
do
Maple,
problema admite uma quantidade nita de solues. Sabendo isso possvel determinar todas estas
solues utilizando o comando
Solve
do
Maple.
p2 = ( 3/3, 3, 0, 6, 0, 0, 0, p3 1, 1),
p3 = ( 3/3, 3, 1, 6, 0, 18, 0,
3 1, 0),
p4 = (1, 1, 0, 18, 16, 0, 0, 0, 1),
p5 = (1, 1, 0, 18, 16, 0, 0, 0, 1),
p6 = (1, 1, 1, 18, 16, 18, 0, 0, 0).
CAPTULO 3.
35
OTIMIZAO NO LINEAR
p1
e p2 so basicamente os mesmos pontos e o mesmo ocorre entre p4 e p5 . Os pontos
( 3/3, 3, 0), ( 3/3, 3, 1), (1, 1, 0) e (1, 1, 1) so crticos. A partir daqui podem-se vericar as
Observe que
condies de segunda ordem para estes quatro pontos ou simplesmente avaliar o valor da funo
z = ( 3/3, 3, 0)
3.3.1
f (z) = 6.
Critrios de Factibilidade
Alm
de resoluo direta como um mtodo, outra forma de aplicar Bases de Grbner a problemas de
a
otimizao estabelecendo alguns critrios para pr-avaliao da coleo de restries e do prprio
conjunto de solues. Isto o que foi feito no Exemplo 3.3.3, onde utilizou-se o Teorema 2.3.3 para
vericar a factibilidade das restries. A inteno desta proposta auxiliar a execuo de mtodos
populares de otimizao. Fazendo esta anlise prvia possvel prevenir, por exemplo, a execuo de
um mtodo iterativo que no convergir, vericando se
1 pertence ao ideal I
associados s restries. Pode-se tambm saber se o problema (no caso, o sistema KKT associado ao
problema) possui nitas solues vericando se alguma potncia de cada uma das variveis pertence
a
ml(I)
(Teorema 2.3.10).
otimizao global, por exemplo, o que foi feito no m do Exemplo 3.3.3, caso exista uma regio
crtica, possvel determinar as equaes que descrevem esta regio. O exemplo a seguir um caso
em que existem innitas solues e ilustra que possvel determinar a regio tima, ou seja, alm de
resolver o problema globalmente, se houverem mltiplas solues, todas podem ser determinadas.
Exemplo 3.3.4.
Considere o problema
centrada em
(0, 0, 0)
(0, 0, 1)
existem dois crculos como regio crtica e um destes crculos a regio tima.
1 6 hg1 , g2 i
(via
Maple,
e uma esfera de
Constatando que
y1 , y2 R
2x1 (y1 + y2 + 1) = 0,
2x2 (y1 + y2 + 1) = 0,
2x3 (y1 y2 + 1) 2y2 = 0,
2
x1 + x22 (x3 1)2 = 0.
Vericando se o problema possui nitas solues (pelo Teorema 2.3.10), obtm-se a resposta esperada:
no. possvel resolver o problema por completo, calculando a Base de Grbner reduzida do ideal
gerado por este sistema em
C[x1 , x2 , x3 , y1 , y2 ]
com
y 1 y 2 x1 x2 x3
1 + y1 = 0,
y2 = 0,
x3 + x21 + x22 = 5/2,
2
x3 x3 = 3/2.
2O
crdito pela sugesto de estabelecer critrios para pr-utilizao de um mtodo clssico de otimizao deve-se
a Angelo Calil Bianchi.
CAPTULO 3.
36
OTIMIZAO NO LINEAR
Somando as duas ltimas equaes e substituindo na terceira, observa-se que as regies crticas so
3
a interseo da esfera de raio 2 centrada na origem com um dos planos em R determinados por
(+)
x3 = (1 7)/2, ou seja, dois crculos paralelos ao plano xy centrados no eixo z em alturas x3 e
()
x3 . Deduz-se que a regio
correspondente menor altura, ou seja, a regio descrita
tima2 aquela
2
por S := {(x1 , x2 , (1
7)/2) | x1 + x2 = 2 + 7/2}.
Note que o problema deste exemplo foi inteiramente resolvido, diferindo dos mtodos clssicos,
que resultariam apenas em um dos pontos de
S.
Exemplo 3.3.5.
y3
sendo um novo
z1 , z2 variveis de folga :
2x1 (y1 + y2 y3 + 1) = 0,
2x2 (y1 + y2 y3 + 1) = 0,
x2 x2 x23 + 4 + z22 = 0,
2 1 2 2
x1 + x2 (x3 1)2 = 0.
Claro que este problema modicado tambm no possui uma quantidade nita de solues. Para
este sistema, a Base de Grbner reduzida do ideal
J C[x1 , x2 , x3 , y1 , y2 , y3 , z1 , z2 ]
gerado pelos
z1 z2
y1 y2 y3 x1 x2 x3 :
2
z1 + z22 = 0,
y1 y2 = 0,
y1 y12 + y1 y3 = 0,
y2 y3 = 0,
y1 y3 + y32 y12 ,
x1 y1 x1 y2 + x1 y3 x1 = 0,
2 y1 x2 y2 + x2 y3 x2 = 0,
y1 z12 = 0,
y3 z12 = 0,
Solve,
expressam subvariedades de
V (J),
CAPTULO 3.
37
OTIMIZAO NO LINEAR
z1 = 0,
y12 + y32 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
z2 = 0.
z1 = 0,
y1 = 0,
y3 + 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
z2 = 0.
z1 = 0,
y1 = 0,
y3 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
z2 = 0.
z1 = 0,
y12 + 1 = 0,
y3 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
z2 = 0.
z1 = 0,
2y12 + 1 = 0,
1 + 2y32 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
z2 = 0.
z1 = 0,
y12 + y32 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
x1 = 0,
5 + 2x3 + 2x22 = 0,
z2 = 0.
(R1)
(R2)
(R3)
(R4)
(R5)
(R6)
z1 = 0,
y12 + y32 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
5 + 2x3 + 2x21 = 0,
x = 0,
2
z2 = 0.
(R7)
2
2z1 3 = 0,
y1 = 0,
y3 = 0,
1 + y22 = 0,
1 + 2x3 = 0,
9 + 4x21 + 4x22 = 0,
3 + 2z22 = 0.
(R8)
z1 = 0,
y1 = 0,
y3 + 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
x1 = 0,
5 + 2x3 + 2x22 = 0,
z2 = 0.
(R9)
z1 = 0,
y1 = 0,
y3 + 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
5 + 2x3 + 2x21 = 0,
x = 0,
2
z2 = 0.
(R10)
z1 = 0,
y1 = 0,
y3 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
x1 = 0,
5 + 2x3 + 2x22 = 0,
z2 = 0.
(R11)
z1 = 0,
y1 = 0,
y3 1 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
5 + 2x3 + 2x21 = 0,
x = 0,
2
z2 = 0.
(R12)
CAPTULO 3.
38
OTIMIZAO NO LINEAR
z1 = 0,
y12 + 1 = 0,
y3 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
x1 = 0,
5 + 2x3 + 2x22 = 0,
z2 = 0.
z12 = 0,
y1 + 1 = 0,
y3 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
5 + 2x3 + 2x21 = 0,
x = 0,
2
z2 = 0.
z1 = 0,
2y12 + 1 = 0,
1 + 2y32 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
x1 = 0,
5 + 2x3 + 2x22 = 0,
z2 = 0.
z1 = 0,
2y1 + 1 = 0,
1 + 2y32 = 0,
y2 = 0,
3 2x3 + 2x23 = 0,
5 + 2x3 + 2x21 = 0,
x = 0,
2
z2 = 0.
3 + z12 = 0,
y1 = 0,
y3 = 0,
1 + 2y22 = 0,
x3 1 = 0,
x1 = 0,
x = 0,
2 2
3 + z2 = 0.
(R13)
2
2z1 3 = 0,
y1 = 0,
y3 = 0,
1 + y22 = 0,
1 + 2x3 = 0,
x1 = 0,
2x 3 = 0,
2 2
3 + 2z2 = 0.
(R18)
(R14)
2
2z1 3 = 0,
y1 = 0,
y3 = 0,
1 + y22 = 0,
1 + 2x3 = 0,
x1 = 0,
2x + 3 = 0,
2 2
3 + 2z2 = 0.
(R19)
2
2z1 3 = 0,
y1 = 0,
y3 = 0,
1 + y22 = 0,
1 + 2x3 = 0,
2x1 3 = 0,
x = 0,
2
3 + 2z22 = 0.
(R20)
2
2z1 3 = 0,
y1 = 0,
y3 = 0,
1 + y22 = 0,
1 + 2x3 = 0,
2x1 + 3 = 0,
x = 0,
2
3 + 2z22 = 0.
(R21)
(R15)
(R16)
(R17)
So descartadas as regies no inteiramente reais, isto , as regies dadas pelos sistemas: (R4),
(R5), (R8), (R13), (R14), (R15), (R16), (R17), (R18), (R19), (R20) e (R21). Dentre as restantes,
aquelas que diferem apenas pelos valores dos multiplicadores de Lagrange e variveis de folga so as
mesmas, ou seja, os sistemas: (R1), (R2), (R3), (R6), (R7), (R9), (R10), (R11) e (R12) so solues
equivalentes e, pode ser representada por:
x23 x3 = 3/2,
x3 + x21 + x22 = 5/2,
CAPTULO 3.
39
OTIMIZAO NO LINEAR
que, como o esperado, a mesma soluo obtida anteriormente. A diferena neste caso so diferentes
multiplicadores de Lagrange que se relacionam mesma soluo e o tamanho da Base de Grbner.
Observao 3.3.6.
dade redundantes, uma vez que a Base de Grbner reduzida do problema inicial do exemplo anterior
era constituda de um nmero muito menor de polinmios que a do problema modicado. Porm,
a soluo atravs de um sistema que determinado por uma Base de Grbner reduzida mais
alcanvel computacionalmente.
3.3.2
Quando o problema possui mais de uma funo objetivo ele recebe o nome de
multiobjetivo.
Se
existir uma relao de precedncia entre as funes objetivo, ento o problema ser chamado, neste
texto, de
sequencial.
g(x)
f (z)
sujeita a um
H,
em
I J,
sendo
O custo
j ser
2
2
dada por
x3 = (1
7)/2
x1 + x2 = 2 +
7/2.
3.3.4, dentre os pontos mais prximos da origem, determinar aquele mais prximo do ponto
(1, 0, 0).
f (x).
precede
g(z)
g(z).
sujeito a
x21 + x22 = 2 +
7/2, x3 = (1
7)/2,
y1 , y2
2(x1 1) + 2x1 y1 = 0,
2x2 (1 + y1 ) = 0,
y2 = 0,
2
2
x
+
x
=
2
+
7/2,
1
2
x3 = (1 7)/2,
e o sistema associado Base de Grbner reduzida sobre
x3
C[x1 , x2 , x3 , y1 , y2 ]
com
y1 y2 x1 x2
CAPTULO 3.
40
OTIMIZAO NO LINEAR
y2 = 0,
2x1 + (4 7)y1 = 4 + 7,
x2 = 0,
2x3 = 1 7,
2y1 + y12 = 71
,
9
7,
0,
1/2(1/2)
7, 4/3+
z
=
(1/2+(1/2)
1
(1/3) 7, 0) e z2 = (1/2 (1/2) 7, 0, 1/2 (1/2) 7, 2/3 (1/3) 7, 0). Um deles o ponto de
mximo e o outro, de mnimo. Como g(z1 ) = 0.11992 e g(z2 ) = 7.4116, conclui-se que a soluo do
problema z1 .
o qual zero-dimensional, isto conrma duas solues:
3.3.3
3
Complexidade
O objetivo desta seo fornecer uma ideia acerca da complexidade do mtodo de otimizao
Denio 3.3.8.
f : N R,
considere
f (x))
t:NR
se
que representa o limitante superior de t, caso o problema seja computvel, dada em funo
Teorema 3.3.9
(Teo.
1.1 de [6])
Sejam
respectivamente,
p
Y
= ( di )
i=1
chamado o grau de
i0 ++ip =np
I.
Pode-se concluir que, de fato, o nmero de variveis, de restries e solues afetam diretamente
na complexidade. Embora isto tenha sido feito para polinmios sobre o corpo
3 Credito
a Lus Felipe Bueno, por indicar a referncia [6], na qual esta seo foi baseada.
Q,
as solues reais
CAPTULO 3.
41
OTIMIZAO NO LINEAR
(Spaenlehauer [6]).
Reescrevendo o
6 D (D 1)
np
n
6 (2D)n = DO(n) ,
p
obtm-se:
Corolrio 3.3.10
Seja
com
D > 1.
complexidade de se computar uma Base de Grbner com respeito a alguma ordem lexicogrca
O(n)
limitada superiormente por D
.
Isto razovel, uma vez que no se distancia muito dos outros mtodos exatos para resolver a
mesma classe de problemas globalmente (Spaenlehauer [6]). Com isto, tem-se um limitante para a
complexidade de mtodos usuais para computar Bases de Grbner. Para ser feita uma anlise completa do mtodo para otimizao discutido no incio deste captulo necessrio levar em considerao
o tempo necessrio para se computar gradientes, inserir variveis de folga e resolver um sistema no
linear utilizando o Teorema 2.3.5. De toda forma, como a operao que demanda mais tempo de
todo o mtodo o clculo de uma Base de Grbner, isto faz com que este limitante determine o do
mtodo, ou seja, os tempos das outras operaes no exercem tanta inuncia no desempenho do
mtodo, quanto o do clculo da Base de Grbner.
No foi comparado o tempo de execuo da utilizao de Bases de Grbner com outros mtodos
exatos de otimizao global. Isso se deve ao uso de um
software
muitas operaes foram feitas por meio da interface do programa e no como linha de comando.
Sendo assim, apesar de todas elas estarem implementadas, a passagem entre uma e outra deve ser
feita manualmente, seja digitando ou selecionando um comando.
Captulo 4
Otimizao Linear Inteira
No captulo anterior, foi vista uma forma prtica e notavelmente exata para a resoluo de problemas de otimizao polinomial no linear. O objetivo desta seo exibir uma maneira de abordar
problemas de otimizao linear inteira atravs do uso de Bases de Grbner.
Esta parte do texto foi baseada em [9] e [10], sem muitas modicaes.
Considere o seguinte problema:
Problema
4.0.11.
P
n
j=1
hi =
aij xj ,
Sejam
com
tais que
min d(x1 , . . . , xn ) = b1 x1 + + bn xn ,
sujeito a
Observao 4.0.12.
hi =
Pn
aij xj = ci , i Nq .
j=1
(P6)
coecientes no negativos inteiros e contam apenas com restries de igualdade. Outros casos exigem
mais cuidados.
4.1
O primeiro passo para se abordar (P6) reduz-lo a um problema de polinmios, cujo mtodo de
resoluo conhecido.
no anel
K[y1 , . . . , yq ] (K
Pn
yi
para
i Nq
j=1
aij xj
= yici ,
e, para tratar do sistema inteiro, pode-se represent-lo por completo utilizando apenas
Pn
j=1
y1
Observe que, considerando ainda
a1j xj
Pn
. . . yq
x1 , . . . , x n
j=1
aqj xj
= y1c1 . . . yqcq .
(4.1.1)
xj , j N n
em comum,
(y1a11 y2a21 . . . yqaq1 )x1 . . . (y1a1n y2a2n . . . yqaqn )xn = y1c1 . . . yqcq .
Agora, denindo o homomorsmo
: K[z1 , . . . , zn ] K[y1 , . . . , yq ]
tal que
(zi ) = mi = y1a1i . . . yq qi
e notando que ele inteiramente denido pela imagem em cada varivel, devido s suas propriedades
multiplicativa e aditiva, pode-se representar
Im() = K[m1 , . . . , mn ].
para determinar quando um sistema linear inteiro da classe das restries de (P6) tem soluo:
42
CAPTULO 4.
43
Proposio 4.1.1.
cq
c1
se, y1 . . . yq
de (P6).
n
Existe uma soluo em Z>0 para o sistema de restries de (P6) se, e somente
cq
c1
Im(). Alm disso, se y1 . . . yq = (z1s1 . . . znsn ), ento x = (s1 , . . . , sn ) ponto vivel
Demonstrao.
(v1 , . . . , vn ) Zn>0
(P6), logo
(y1a11 y2a21 . . . yqaq1 )v1 . . . (y1a1n y2a2n . . . yqaqn )vn = y1c1 . . . yqcq
e, como
((z1 ))v1 . . . ((zn ))vn = (z1v1 ) . . . (znvn ) = (z1v1 . . . znvn ) = y1c1 . . . yqcq
c
z1v1 . . . znvn K[z1 , . . . , zn ], isto implica que y1c1 . . . yqq Im(). Para a recproca, suponha
cq
c1
que exista u K[z1 , . . . , zn ] tal que (u) = y1 . . . yq . Note que u deve ser um monmio, logo pode
s1
s
ser escrito como u = z1 . . . znn , para alguns si Z>0 , i Nn logo
e, como
(u) = (z1s1 ) . . . (znsn ) = (y1a11 y2a21 . . . yqaq1 )s1 . . . (y1a1n y2a2n . . . yqaqn )sn = y1c1 . . . yqcq
e, portanto,
(s1 , . . . , sn ) Zn>0
cq
c1
De acordo com este Teorema, se y1 . . . yq Im(), procurado o elemento h K[z1 , . . . , zn ]
cq
c1
tal que (h) = y1 . . . yq . Para obter um tal candidato, pode-se proceder estabelecendo o isomorsmo
natural entre Im() e K[z1 , . . . , zn ]/Ker(), a m de estabelecer um critrio de no pertinncia de
um candidato a
Ker().
Proposio 4.1.2.
a K[z1 , . . . , zn ],
A funo
um isomorsmo.
Com este isomorsmo, basta ento calcular uma Base de Grbner para
o problema de pertinncia.
Ker(),
para resolver
Lema 4.1.3.
Z>0 ,
Ker()
A.
Para quaisquer
1 , . . . , n
vlido que
2.4.2 de [9])
Seja
(denido anteriormente),
Sabendo que
f Im()
h K[z1 , . . . , zn ]
tal que
(h) = f ,
se
f 6= 0,
ento corresponde a alguma classe h + Ker() diferente de zero, pois h 6 Ker(). Logo, pode-se
Ps
?
?
?
?
dizer que f = h+
i=1 gi ti , onde G = {g1 , . . . , gs } uma Base de Grbner para Ker() (calculada a
partir de G, que uma Base de Grbner para J ) e ti K[z1 , . . . , zn ], i Ns . Para isto, necessrio e
suciente que
rG (f ) = h, o que revela uma ideia intuitiva de como calcular efetivamente uma soluo
formalmente.
Teorema 4.1.5
(Teo.
2.4.4 de [9])
Seja
J K[z1 , . . . , zn , y1 , . . . , yq ]
z y.
rG (f ) = h.
h K[z1 , . . . , zn ]
tal que
Ento
CAPTULO 4.
44
Foi obtido agora com um algoritmo para calcular solues inteiras no negativas para sistemas
lineares com coecientes inteiros: primeiro compute uma Base de Grbner G para J , considerando
cq
c1
uma ordem monomial em que z y ; em seguida calcule h = rG (y1 . . . yq ). Se h 6 K[z1 , . . . , zn ],
x1
x
ento o sistema no possui soluo inteira no negativa. Caso contrrio, se h = z1 . . . znn , ento
(x1 , . . . , xn ) soluo do sistema. Isto pode ser ilustrado isso com um exemplo.
Exemplo 4.1.6.
Considere o sistema:
x1 + x2 + x3 = 3,
3x1 + 5x2 + 2x3 = 10.
(y1 y23 )x1 (y1 y25 )x2 (y1 y22 )x3 = y13 y210 .
m1 = y1 y23 , m2 = y1 y25 e m3 = y1 y22 e J = hz1 y1 y23 , z2 y1 y25 , z3 y1 y22 i. Computando a Base
Grbner reduzida de J com respeito ordem lexicogrca graduada com z3 z2 z1 y2 y1 ,
Logo,
de
obtm-se
NormalForm
3 10
constata-se que rG (y1 y2 )
4.2
= z3 z1 z2 .
Portanto,
(x1 , x2 , x3 ) = (1, 1, 1)
y13 y210
por
G,
soluo do sistema.
J foi deduzido um mtodo para calcular uma soluo de um sistema linear inteiro.
No existe
problema algum quando esta soluo nica, referente ao sistema de restries, mas quando no ,
precisa-se decidir de alguma forma qual(is) minimiza(m) a funo objetivo. Diferente da abordagem
feita para otimizao no linear, esta no calcula toda a regio vivel. Desde que a ordem monomial
considerada satisfaa
z y,
cada ordem (em termos da relao de precedncia entre as variveis) pode resultar em uma Base
de Grbner diferente, logo o que deve-se fazer incorporar a funo objetivo na ordem monomial
utilizada. A seguir um exemplo de quando a soluo no nica:
Exemplo 4.2.1.
Considere o problema:
max
sujeito a
x1 + x2 + x3 = 4,
x1 + x2 + 2x3 = 5.
z2 z1
(x1 , x2 , x3 ) =
(0, 3, 1) um ponto vivel. Trocando a ordem entre as variveis z3 e z1 na ordem monomial, resulta na
2
4 5
3
Base de Grbner H = {z1 + z2 , y1 z3 z1 , z1 y2 z3 , z1 + y2 y1 } e rH (y1 y2 ) = z1 z3 , logo (x1 , x2 , x3 ) =
(3, 0, 1) outro ponto vivel.
CAPTULO 4.
45
d(3, 0, 1) = 11
d(0, 3, 1) = 5,
difcil obter todos os pontos viveis, o que faz necessrio estabelecer a melhor ordem monomial,
no sentido de ser compatvel com a funo objetivo.
monmios que representam pontos viveis do sistema de restries acompanhem a mesma relao de
precedncia de seus respectivos valores associados na funo objetivo.
Denio 4.2.2
(Compatibilidade, cf.
[9])
d sobre as variveis zi , i
x?
x?
(z1x1 . . . znxn ) = (z1 1 . . . znn ) e
Teorema 4.2.3
para
(Prop.
2.8.8 de [9])
e considere
Ao trabalhar com coecientes inteiros no negativos, uma ordem monomial que satisfaz os
critrios do teorema anterior a ordenao pelos coecientes da funo objetivo (Adams [9]). Isto ,
tomando como maior varivel em
x,
se
Exemplo 4.2.4.
J.
z1 z3
De fato o , pois d(0, 3, 1) = 5, d(1, 2, 1) =
Observao 4.2.5. A teoria desenvolvida para tratar de problemas inteiros muito bonita em certos
aspectos. Embora nada tenha sido propriamente demonstrado neste captulo, somente os resultados e
a forma como a teoria foi construda so impressionantes. O modo como o problema foi interpretado
em linguagem algbrica simplesmente genial.
Histrico
As metas propostas para o Trabalho de Graduao II foram atendidas.
Julho
Parte 1
Agosto
Setembro
Outubro
Novembro
Parte 2
Parte 3
Parte 1:
Parte 2:
Parte 3:
Embora algumas demonstraes tenham sido omitidas, o contedo envolvido foi mais extenso do que
o planejado inicialmente, resultando numa boa amplitude terica. Isto ocorreu devido s sugestes
de algumas pessoas e ideias do autor.
Quanto abordagem dos problemas de otimizao no linear, uma das ideias iniciais era partir
de uma boa sugesto:
igualdades como se faz com problemas lineares; outra era resolver o sistema KKT e depois eliminar
os pontos inviveis, estratgia de Lindberg, Hagglof e Svensson [7], apresentando assim duas maneiras
de abordar o mesmo problema. Mas, como as duas abordagens eram complementares, foi feita uma
s englobando as duas tcnicas. Outra boa sugesto foi a de estabelecer condies que caracterizem o
tipo de problema dado, antes de aplicar qualquer mtodo para resoluo, e exibir a complexidade do
clculo de uma Base de Grbner e isto foi feito. Uma ideia do autor foi aplicar a estratgia utilizada
em problemas com mais de uma funo objetivo com ordens de precedncia, uma vez que pode-se
obter toda a regio tima utilizando as tcnicas discutidas isto tambm foi feito. A aplicao em
otimizao inteira era opcional, mas tambm foi realizada e mostrou-se particularmente bela sem
arrependimentos quanto a isso.
46
Consideraes Finais
Em termos do contedo, pode-se concluir que a teoria das Bases de Grbner conta com imenso
potencial para aplicao, no s em problemas que se resumem a sistemas polinomiais, mas tambm
abordando-os diretamente atravs da questo de pertinncia. Por exemplo, o que foi visto no Captulo
4, onde o problema foi traduzido para linguagem algbrica e a soluo era dada nas potncias de um
monmio provido por uma Base de Grbner.
Em particular, quanto aplicao em otimizao pode-se dizer que, embora o seu uso no
seja to eciente computacionalmente (ou seja, no existe uma forma de se calcular uma Base de
Grbner em tempo polinomial), no ca muito distante de outros mtodos exatos para resolver
globalmente a mesma classe de problemas no lineares e inteiros. A estratgia mais comum dentre os
mtodos exatos existentes para otimizaao global envolve executar um mtodo de otimizao local
(por exemplo, Lagrangeano Aumentado) diversas vezes e, para programao inteira, o mesmo ocorre,
um dos mtodos mais famosos (Branch and Bound) envolve executar um mtodo de programao
linear (por exemplo, o Simplex) a cada iterao. Isso torna estes algoritmos pouco ecientes, pois
cada um destes mtodos clssicos que so executados vrias vezes tem complexidade no polinomial.
O clculo de uma Base de Grbner tambm tem complexidade no polinomial, porm feito uma
nica vez durante a execuo do mtodo.
Um ponto que se mostrou especialmente interessante a respeito desta tcnica a exatido com
a qual pode-se obter as solues, sendo localmente menos suscetvel a erros numricos, pois, se for o
caso, pode retornar as equaes que descrevem a regio tima, sendo esta contnua ou discreta; outro
ponto a se destacar a resoluo algbrica de um tipo de problema que originalmente no formulado
utilizando uma linguagem de fcil manipulao, sendo um dos poucos mtodos conhecidos capazes
disso. A possibilidade de se resolver problemas com mais de uma funo objetivo globalmente com
total preferncia para uma delas tambm algo cuja meno vlida, j que no se encontra sobre
isto na literatura tradicional. A simplicidade da teoria a torna quase bsica, sendo este outro ponto
de grande destaque, pois admite tanto as mais simples e diretas aplicaes, quanto algumas mais
complexas e elaboradas.
Quanto experincia, possvel dizer que a execuo deste trabalho foi de grande importncia
para o desenvolvimento do autor, tanto por fornecer uma boa base torica, apesar de introdutria,
sobre temas atuais, como por proporcionar um bom perodo de estudo dirigido e dar a chance do
autor exercitar sua criatividade, buscando aplicaes para uma teoria to verstil. Apesar de no ser
to recomendvel devido ao baixo nvel de conhecimento provido da graduao, durante a execuo
deste trabalho o autor evitou se vincular a um texto, buscando concluir, propor e demonstrar por
conta prpria alguns resultados.
Apesar de ser um estudo concludo, tudo o que foi feito aqui apenas introdutrio e tem
potencial para melhor desenvolvimento, seria interessante transformar um problema de otimizao
no linear polinomial (ou talvez at no polinomial, aproximando por sries de potncias, embora
isto acarrete na perda da vantagem relacionada preciso da soluo) num equivalente em linguagem
algbrica, assim como foi feito no Captulo 4. Isto tiraria todas as desvantagens de se basear nas
condies KKT, como, por exemplo, a piora de desempenho devido presena de vrias solues
iguais com multiplicadores de Lagrange diferentes.
47
Referncias Bibliogrcas
[1] COUTINHO, S. C., Polinmios e Computao Algbrica. Coleo Matemtica e Apicaes.
Universidade Federal do Rio de Janeiro, 2009.
[2] COX, D., LITTLE, J. e O'SHEA, D., Ideals, Varieties and Algorithms: An Introduction to Computational Algebraic Geometry and Commutative Algebra, Second Edition, Springer-Verlag,
1997.
[3] HERNANDES, M. E.,
[4] MANETTI, M.,
A New Ecient Algorithm for Computing Grbner Basis, J. of Pure and Applied
48