O Controlo Optimo e As Suas Multiplas Ap PDF

O controlo ptimo
e as suas mltiplas aplicaes

Cristiana J. Silva
Departamento de Matemtica Universit dOrlans, UFR Sciences
Universidade de Aveiro Fdration Denis Poisson
3810183 Aveiro, Portugal Laboratoire MAPMO, UMR 6628
45067 Orlans Cedex 2, France
cjoaosilva@ua.pt
Delfim F. M. Torres
Departamento de Matemtica
Universidade de Aveiro
3810193 Aveiro, Portugal
delfim@ua.pt
Emmanuel Trlat
Universit dOrlans, UFR Sciences
Fdration Denis Poisson
Laboratoire MAPMO, UMR 6628
45067 Orlans Cedex 2, France
emmanuel.trelat@univ-orleans.fr
Resumo: Neste trabalho so referidas motivaes, aplicaes e relaes da
teoria do controlo com outras reas da matemtica. Apresentamos uma
breve resenha histrica sobre o controlo ptimo, desde as suas origens no
clculo das variaes e na teoria clssica do controlo aos dias de hoje, dando
especial destaque ao princpio do mximo de Pontryagin.
Palavras chave: controlo ptimo, princpio do mximo de Pontryagin,

aplicaes da teoria matemtica dos sistemas de controlo.
Abstract: In this work we refer to motivations, applications, and relations of

control theory with other areas of mathematics. We present a brief historical
review of optimal control theory, from its roots in the calculus of variations
and the classical theory of control to the present time, giving particular
emphasis to the Pontryagin maximum principle.
Keywords: optimal control, Pontryagin maximum principle, applications

of the mathematical theory of control.

Dedicado a Francis Clarke e a Richard Vinter por ocasio da celebrao do sexagsimo
aniversrio de ambos os matemticos, Workshop in Control, Nonsmooth Analysis and
Optimization, Porto, 4 a 8 de Maio de 2009 <http://ceoc.mat.ua.pt/fc-rv-60>.
Boletim da SPM 61, Outubro 2009, pp. 1137

12 O controlo ptimo e as suas mltiplas aplicaes
1 Introduo
Todos ns j tentmos, numa ou outra ocasio, manter em equilbrio uma
vara sobre o dedo indicador (i.e., resolver o problema do pndulo invertido).
Por outro lado muito mais difcil, sobretudo se fecharmos os olhos, manter
em equilbrio um pndulo invertido duplo. A teoria do controlo permite
faz-lo sob a condio de dispormos de um bom modelo matemtico.
Um sistema de controlo um sistema dinmico, que evolui no tempo,
sobre o qual podemos agir atravs de uma funo de comando ou controlo.
Um computador, que permite a um utilizador efectuar uma srie de comandos,
um ecossistema sobre o qual podemos agir favorecendo esta ou aquela espcie,
os tecidos nervosos que formam uma rede controlada pelo crebro e realizam a
transformao de estmulos provenientes do exterior em aces do organismo,
um robot que deve efectuar uma tarefa bem precisa, uma viatura sobre
a qual agimos por intermdio de um pedal de acelerao, de travagem e
embraiagem e que conduzimos com a ajuda de um volante, um satlite ou
uma nave espacial, so todos eles exemplos de sistemas de controlo, os quais
podem ser modelados e estudados pela teoria dos sistemas de controlo.
A teoria do controlo analisa as propriedades de tais sistemas, com o intuito
de os conduzir de um determinado estado inicial a um dado estado final,
respeitando eventualmente certas restries. A origem de tais sistemas pode
ser muito diversa: mecnica, elctrica, biolgica, qumica, econmica, etc. O
objectivo pode ser o de estabilizar o sistema tornando-o insensvel a certas
perturbaes (problema de estabilizao) ou ainda determinar as solues
ptimas relativamente a um determinado critrio de optimizao (problema
do controlo ptimo). Para modelar os sistemas de controlo podemos recorrer a
equaes diferenciais, integrais, funcionais, de diferenas finitas, s derivadas
parciais, determinsticas ou estocsticas, etc. Por esta razo a teoria do
controlo vai beber e contribui em numerosos domnios da matemtica (vide,
e.g., [4, 11, 12, 21, 23, 27]).
A estrutura de um sistema de controlo representada pela interconexo
de certos elementos mais simples que formam sub-sistemas. Neles transita
informao. A dinmica de um sistema de controlo define as transformaes
possveis do sistema, que ocorrem no tempo de maneira determinista ou
aleatria. Os exemplos j dados mostram que a estrutura e a dinmica de um
sistema de controlo podem ter significados muito diferentes. Em particular,
o conceito de sistema de controlo pode descrever transformaes discretas,
contnuas, hbridas ou, de um modo mais geral, numa time scale ou measure
chain [13, 14, 22].
Um sistema de controlo diz-se controlvel se o podemos conduzir (em

C. J. Silva, D. F. M. Torres e E. Trlat 13
tempo finito) de um determinado estado inicial at um estado final prescrito.

Em relao ao problema da controlabilidade, Kalman demonstrou em 1949
um resultado importante que caracteriza os sistemas lineares controlveis
de dimenso finita (Teorema 7). Para sistemas no lineares o problema
matemtico da controlabilidade muito mais difcil e constitui um domnio
de investigao ainda activo nos dias de hoje.
Assegurada a propriedade de controlabilidade, podemos desejar passar

de um estado inicial a um estado final minimizando ou maximizando um
determinado critrio. Temos ento um problema de controlo ptimo. Por
exemplo, um condutor que efectue o trajecto Lisboa-Porto pode querer viajar
em tempo mnimo. Nesse caso escolhe o trajecto pela auto-estrada A1. Uma
consequncia de tal escolha ser o pagamento de portagem. Outro problema
de controlo ptimo obtido se tivermos como critrio de minimizao os
custos da viagem. A soluo de tal problema envolver a escolha de estradas
nacionais, gratuitas, mas que levam muito mais tempo a chegar ao destino
(segundo a informao do stio da internet http://www.google.pt/maps o
trajecto pela auto-estrada dura 3h e pela estrada nacional dura 6h45m).
Um problema de controlo ptimo pode ser formulado do seguinte modo.
Consideremos um sistema de controlo, cujo estado num determinado instante
representado por um vector. Os controlos so funes ou parmetros,
habitualmente sujeitos a restries, que agem sobre o sistema sob a forma
de foras exteriores, de potenciais trmicos ou elctricos, de programas de
investimento, etc. e afectam a dinmica. Uma equao dada, ou tipicamente
um sistema de equaes diferenciais, relacionando as variveis e modelando
a dinmica do sistema. depois necessrio utilizar a informao presente e
as caractersticas do problema para construir os controlos adequados que vo
permitir realizar um objectivo preciso. Por exemplo, quando nos deslocamos
na nossa viatura agimos de acordo com o cdigo da estrada (pelo menos
aconselhvel) e concretizamos um plano de viagem para chegar ao nosso
destino. So impostas restries sobre a trajectria ou sobre os controlos,
que imprescindvel ter em considerao. Fixamos um critrio permitindo
medir a qualidade do processo escolhido. Este apresenta-se normalmente
sob a forma de uma funcional que depende do estado do sistema e dos
controlos. Para alm das condies anteriores procuramos ainda minimizar
(ou maximizar) esta quantidade. Um exemplo j dado anteriormente o
de deslocarmo-nos em tempo mnimo de um ponto a outro. Notemos que a
forma das trajectrias ptimas depende fortemente do critrio de optimizao.
Por exemplo, para estacionar o nosso carro fcil verificar que a trajectria
seguida difere se queremos realizar a operao em tempo mnimo (o que

arriscado) ou minimizando a quantidade de combustvel gasta na operao.
Figura 1: a teoria do controlo ptimo tem um papel importante na engenharia

aeroespacial.
A teoria do controlo ptimo tem uma grande importncia no domnio

aeroespacial, nomeadamente em problemas de conduo, transferncia de
rbitas aero-assistidas, desenvolvimento de lanadores de satlites recuper-
veis (o aspecto financeiro aqui muito importante) e problemas da reentrada
atmosfrica, como seja o famoso projecto Mars Sample Return da Agncia
Espacial Europeia (ESA), que consiste em enviar uma nave espacial ao
planeta Marte com o objectivo de trazer amostras marcianas (Figura 1).
2 Breve resenha histrica

O clculo das variaes nasceu no sculo dezassete com o contributo de
Bernoulli, Fermat, Leibniz e Newton. Alguns matemticos como H.J. Sus-
smann e J.C. Willems defendem a origem do controlo ptimo coincidente
com o nascimento do clculo das variaes, em 1697, data de publicao da
soluo do problema da braquistcrona pelo matemtico Johann Bernoulli
[28]. Outros vo ainda mais longe, chamando a ateno para o facto do
problema da resistncia aerodinmica de Newton, colocado e resolvido por
Isaac Newton em 1686, no seu Principia Mathematica, ser um verdadeiro
problema de Controlo ptimo [25, 30].
Em 1638 Galileu estudou o seguinte problema: determinar a curva sobre
a qual uma pequena esfera rola sob a aco da gravidade, sem velocidade
inicial e sem atrito, de um ponto A at um ponto B com um tempo de
percurso mnimo (escorrega de tempo mnimo, ver Figura 2).

Figura 2: problema da braquistcrona.
Trata-se do problema da braquistcrona (do grego brakhistos, o mais

breve, e chronos, tempo). Galileu pensou (erradamente) que a curva
procurada era um arco de crculo. Observou no entanto, correctamente,
que o segmento de linha recta no o caminho de tempo mais curto. Em
1696, Jean Bernoulli colocou este problema como um desafio aos melhores
matemticos da sua poca. Ele prprio encontrou a soluo, assim como o
seu irmo Jacques Bernoulli, Newton, Leibniz e o marqus de lHopital. A
soluo um arco de ciclide comeando com uma tangente vertical [20, 28].
As rampas de skate assim como as descidas mais rpidas dos aqua-parques,
tm a forma de ciclide (Figura 3).
Figura 3: arcos de ciclide conduzem s descidas mais rpidas e adrenalina

mxima.
A teoria do controlo ptimo surge depois da segunda guerra mundial, res-

pondendo a necessidades prticas de engenharia, nomeadamente no domnio
da aeronutica e da dinmica de voo. A formalizao desta teoria colocou
vrias questes novas. Por exemplo, a teoria do controlo ptimo motivou a in-
troduo de novos conceitos de solues generalizadas na teoria das equaes

diferenciais e originou novos resultados de existncia de trajectrias. Regra

geral, considera-se que a teoria do controlo ptimo surgiu em finais dos anos
cinquenta na antiga Unio Sovitica, em 1956, com a formulao e demons-
trao do Princpio do Mximo de Pontryagin por L.S. Pontryagin (Figura 4)
e pelo seu grupo de colaboradores: V.G. Boltyanskii, R.V. Gamkrelidze e
E.F. Mishchenko [24].
Figura 4: Lev Semenovich Pontryagin (3/Set/1908 3/Maio/1988)
Pontryagin e os seus companheiros introduziram um aspecto de impor-

tncia primordial: generalizaram a teoria do clculo das variaes a curvas
que tomam valores em conjuntos fechados (com fronteira). A teoria do
controlo ptimo est muito ligada mecnica clssica, em particular aos
princpios variacionais (princpio de Fermat, equaes de Euler-Lagrange,
etc.) Na verdade o princpio do mximo de Pontryagin uma generalizao
das condies necessrias de Euler-Lagrange e de Weierstrass. Alguns pontos
fortes da nova teoria foram a descoberta do mtodo de programao din-
mica, a introduo da anlise funcional na teoria dos sistemas ptimos e a
descoberta de ligaes entre as solues de um problema de controlo ptimo
e os resultados da teoria de estabilidade de Lyapunov [31, 32]. Mais tarde
apareceram as fundaes da teria do controlo estocstico e da filtragem em
sistemas dinmicos, a teoria dos jogos, o controlo de equaes com derivadas
parciais e os sistemas de controlo hbrido algumas de entre as muitas reas
de investigao actual [1, 19, 27].

3 Controlo ptimo linear

A teoria do controlo ptimo muito mais simples quando o sistema
de controlo sob considerao linear. O controlo ptimo no linear ser
abordado na Seco 4. A teoria linear ainda , nos dias de hoje, a mais usada
e conhecida nas reas de engenharia e suas aplicaes.
3.1 Questes centrais

Seja A Mn (R) (denotamos por Mn (R) o conjunto das matrizes n n
de entradas reais); B, X0 Mn,1 (R) ' Rn ; I um intervalo de R; e u : R R
uma funo mensurvel (u L1 ) tal que u(t) I t. O teorema de existncia
de soluo para equaes diferenciais assegura a existncia de uma nica
aplicao R 3 t 7 X(t) Rn absolutamente contnua (X AC) tal que

X(t) = AX(t) + Bu(t) t ,
(1)
X(0) = X0 .
Esta aplicao depende do controlo u. Ao mudarmos a funo u obtemos

uma outra trajectria t 7 X(t) em Rn (Figura 5).
X0
Figura 5: a trajectria soluo do sistema de controlo (1) depende da escolha

concreta do controlo u.
Neste contexto, surgem naturalmente duas questes:

Nas aplicaes considera-se normalmente como classe dos controlos admissveis o
conjunto dos controlos seccionalmente contnuos ou mesmo seccionalmente constantes.
Mostra-se que a famlia de trajectrias correspondentes aos controlos seccionalmente
constantes densa no conjunto de todas as solues com controlos mensurveis (vide, e.g.,
[3]).

(i) Dado um ponto X1 Rn , existir um controlo u tal que a trajectria

associada a esse controlo liga X0 a X1 em tempo finito T ? (Figura 6)
este o problema da controlabilidade.
X(t)
X0 X1 = X(T )
Figura 6: problema da controlabilidade.
(ii) Assegurada a controlabilidade (questo anterior), existir um controlo

que minimiza o tempo de percurso de X0 at X1 ? (Figura 7) Temos
ento um problema de controlo ptimo (de tempo mnimo).
X0 X1 = X(T )
Figura 7: problema do tempo mnimo.
Os teoremas que se seguem respondem a estas questes. As respectivas

demonstraes so bem conhecidas e podem facilmente ser encontradas na
literatura (vide, e.g., [18, 21, 33]).
3.2 Conjunto acessvel

Considerando o sistema linear de controlo (1) comeamos por introduzir
um conjunto de grande importncia: o conjunto acessvel.
Definio 1. O conjunto dos pontos acessveis a partir de X0 em tempo
T > 0 denotado e definido por
A(X0 , T ) = {X1 Rn | u L1 ([0, T ], I),
X : R Rn AC com X(0) = X0 ,

t [0, T ] X(t) = AX(t) + Bu(t), X(T ) = X1 } .

Por palavras, A(X0 , T ) o conjunto das extremidades das solues de

(1) em tempo T , quando fazemos variar o controlo u (Figura 8).
X0
A(X0 , T )
Figura 8: conjunto acessvel.
Teorema 2. Sejam T > 0, I compacto e X0 Rn . Ento para todo o

t [0, T ], A(X0 , t) compacto, convexo e varia continuamente com t em
[0, T ].
A soluo de
X = AX + Bu
(
(2)
X(0) = X0
Z t
X(t) = etA + etA esA Bu(s) ds .
0
Constatamos que se X0 = 0, i.e., se partirmos da origem, ento a expresso
de X(t) simplificada: X(t) = e Bu(s) ds linear em u. Esta
tA
R t sA
0e
observao leva-nos seguinte proposio.
Proposio 3. Suponhamos que X0 = 0 e I = R. Ento,
1. T > 0 A(0, T ) um sub-espao vectorial de Rn . Alm disso,
2. 0 < T1 < T2 A(0, T1 ) A(0, T2 ).
Definio 4. O conjunto A(0) = t0 A(0, T ) o conjunto dos pontos

acessveis (num tempo qualquer) a partir da origem.
Corolrio 5. O conjunto A(0) um sub-espao vectorial de Rn .

3.3 Controlabilidade
O sistema de controlo X = AX + Bu diz-se controlvel se para todo o
X0 , X1 Rn existe um controlo u tal que a trajectria associada une X0 a
X1 em tempo finito T (Figura 9). De modo mais formal temos:
Definio 6. O sistema de controlo X = AX + Bu diz-se controlvel se
X0 , X1 Rn T > 0 u : [0, T ] I L1
X = AX + Bu ,

X : [0, T ] Rn |

X(0) = X0 ,
X(T ) = X .

1
X0 X1
Figura 9: controlabilidade.
O teorema seguinte d-nos uma condio necessria e suficiente de con-

trolabilidade chamada condio de Kalman.
Teorema 7 (Condio de Kalman). O sistema X = AX +Bu controlvel se

e somente se a matriz C = (B|AB| |An1 B) tiver caracterstica completa
(i.e., rank(C) = n).
3.4 Princpio do Mximo de Pontryagin para o problema de

tempo mnimo
Comeamos por formalizar, com a ajuda do conjunto acessvel A(X0 , t),
a noo de tempo mnimo.
Sejam X0 , X1 Rn . Suponhamos que X1 acessvel a partir de X0 , i.e.,
suponhamos que existe pelo menos uma trajectria unindo X0 a X1 . De
entre todas as trajectrias que unem X0 a X1 gostaramos de caracterizar
aquela que o faz em tempo mnimo T (Figura 10).
Se T for o tempo mnimo, ento para todo o t < T , X1 6 A(X0 , T ) (com
efeito, se assim no fosse X1 seria acessvel a partir de X0 num tempo inferior
a T e T no seria o tempo mnimo). Consequentemente,
T = inf{t > 0 | X1 A(X0 , t)} . (3)

X0 X1 = X(T )
Figura 10: qual a trajectria X para a qual T mnimo?
O valor de T est bem definido pois, a partir do Teorema 2, A(X0 , t) varia

continuamente com t, logo {t > 0 | X1 A(X0 , t)} fechado em R. Em
particular o nfimo em (3) mnimo. O tempo t = T o primeiro instante
para o qual A(X0 , t) contm X1 (Figura 11).
X0 X1
A(X0 , T )
A(X0 , t)
Figura 11: o tempo mnimo T corresponde ao primeiro instante t para o qual

A(X0 , t) {X1 } =
6 .
Por outro lado, temos necessariamente:

X1 Fr A(X0 , T )\ int A(X0 , T ) .
Com efeito, se X1 pertencesse ao interior de A(X0 , T ), ento para t < T pr-
ximo de T , X1 pertenceria ainda a A(X0 , t) pois A(X0 , t) varia continuamente
com t. Isto contradiz o facto de T ser o tempo mnimo. Estas observaes
do uma viso geomtrica noo de tempo mnimo e conduzem-nos
seguinte definio:
Definio 8. Seja u L1 ([0, T ], I). O controlo u diz-se ptimo para o
sistema (1) se a correspondente trajectria X verifica X(T ) Fr A(X0 , T ).
Dizer que u ptimo dizer que a trajectria associada a u une X0 a
X1 em tempo mnimo. O objectivo ento o de determinar os controlos

ptimos. O teorema que se segue d-nos uma condio necessria e suficiente

de optimalidade.
Teorema 9 (Princpio do Mximo de Pontryagin (caso linear)). Considere-se

o sistema de controlo
X = AX + Bu ,
(
X(0) = X0 .
Seja T > 0. O controlo u L1 ([0, T ], I = [1, 1]) ptimo se e somente se
u(t) = sinalh(t), Bi
onde h, i o produto interno em Rn e (t) Rn soluo da equao

T = T A.
A condio inicial (0) depende de X1 . Como ela no directamente

conhecida, a utilizao do Teorema 9 maioritariamente indirecta. Vejamos
um exemplo.
3.5 Exemplo: controlo ptimo de um oscilador harmnico

(caso linear)
Consideremos uma massa pontual m ligada a uma mola cujo movimento
est restrito a um eixo Ox (Figura 12).
O x
m
Figura 12: sistema massa-mola.
A massa pontual sai da origem por uma fora que supomos igual a
k1 (x l) k2 (x l)3
onde l o comprimento da mola em repouso. Aplicamos a essa massa pontual

uma fora exterior horizontal u(t)~l. A segunda Lei de Newton diz-nos que

a fora resultante aplicada directamente proporcional ao produto entre a

massa inercial e a acelerao adquirida pela mesma, ou seja
x(t) + k1 (x(t) l) + k2 (x(t) l)3 = u(t) .

m (4)
As leis bsicas da Fsica dizem-nos tambm que todas as foras so limitadas.

Impomos a seguinte restrio fora exterior:
|u(t)| 1 t.
Isto significa que a fora apenas pode tomar valores no intervalo fechado
[1, 1]. Suponhamos que a posio e a velocidade iniciais do objecto so,
respectivamente, x(0) = x0 e x(0)
= y0 . O problema consiste em trazer, em
tempo mnimo, a massa pontual posio de equilbrio x = l por escolha
adequada da fora externa u(t) e tendo em conta a restrio |u(t)| 1. A
fora u aqui o nosso controlo.
Problema. Dadas as condies iniciais x(0) = x0 e x(0)
= y0 , encontrar a
funo u que permite transportar a massa para a sua posio de equilbrio
em tempo mnimo.
3.5.1 Modelao matemtica

Para simplificar a apresentao, vamos supor m = 1 kg, k1 = 1 N.m1 e
l = 0 m (passamos a l = 0 por translao). A equao de movimento (4)
ento equivalente ao sistema diferencial de controlo
= y(t)
(
x(t)
= x(t) k2 x(t)3 + u(t)
y(t) (5)
x(0) = x0 , x(0)
= y0 .
Escrevemos facilmente (5) na notao matricial
X = AX + f (X) + Bu , X(0) = X0 , (6)
tomando
0 1 0
! !
A= , B= ,
1 0 1
0
! ! !
x x0
X= , X0 = , f (X) = .
y y0 k2 x3

Tendo em mente que estamos na seco de controlo linear fixamos k2 = 0,

desprezando efeitos conservativos no lineares (na Seco 4, onde abordamos
o controlo ptimo no linear, consideraremos o caso k2 6= 0). Para k2 = 0
temos f (X) 0 e obtemos o sistema de controlo (6) na forma (2) (sistema
de controlo linear). Pretendemos responder a duas questes:
1. Existir sempre, para toda e qualquer condio inicial x(0) = x0 e x(0)
=
y0 , uma fora exterior horizontal (um controlo) que permite transportar
em tempo finito T a massa pontual para sua posio de equilbrio x(T ) = 0
e x(T
) = 0?
2. Se a primeira pergunta for respondida positivamente, qual a fora (qual o
controlo) que minimiza o tempo de transporte da massa pontual sua
posio de equilbrio?
3.5.2 Controlabilidade do sistema

O nosso sistema escreve-se na forma
X = AX + Bu
(
X(0) = X0
com A = 0 1 e B = ( 01 ). Temos ento

1 0
0 1
!
rank (B|AB) = rank =2
1 0
e o Teorema 7 garante-nos que o sistema controlvel (se u(t) R). Isto

significa que existem controlos para os quais as trajectrias associadas unem
X0 a 0. Temos assim resposta afirmativa nossa primeira questo, admitindo
que o sistema mantm-se controlvel com controlos que verificam a restrio
|u| 1 (o que ser verificado a posteriori). Esta resposta esperada em
termos fsicos. Se no aplicarmos uma fora exterior, i.e., se u = 0, a equao
do movimento x + x = 0 e a massa pontual oscila sem nunca parar, nunca
voltando sua posio de equilbrio em tempo finito. Por outro lado, ao
aplicarmos determinadas foras exteriores, temos tendncia a amortecer as
oscilaes. A teoria do controlo prev que conseguimos realmente parar a
massa em tempo finito.
3.5.3 Determinao do controlo ptimo

Sabemos que existem controlos que permitem conduzir o sistema de X0
a 0. Agora queremos determinar, em concreto, qual desses controlos o faz

em tempo mnimo. Para isso aplicamos o Teorema 9:

u(t) = sinal h(t), Bi ,
1 (t)
!
onde (t) R2 soluo de T = T A.Seja (t) = . Ento,
2 (t)
u(t) = sinal 2 (t) e 1 = 2 , 2 = 1 , ou seja, 2 + 2 = 0. Logo 2 (t) =
cos t + sen t. Consequentemente, o controlo ptimo seccionalmente
constante em intervalos de comprimento e toma valores alternadamente
1.
Se u = 1, obtemos o sistema diferencial
x = y ,
(
(7)
y = x 1 .
Se u = +1, obtemos
x = y ,
(
(8)
y = x + 1 .
A trajectria ptima unindo X0 a 0 constituda por pedaos de solues de
(7) e (8) concatenadas. As solues de (7) e (8) so facilmente obtidas:
d
x = y, y = x 1 ((x + 1)2 + y 2 ) = 0
dx
(x + 1)2 + y 2 = const = R2
e conclumos que as curvas solues de (7) so crculos centrados em x = 1
e y = 0 de perodo 2 (com efeito, x(t) = 1 + R cos t e y(t) = R sen t); como
solues de (8) obtemos x(t) = 1 + R cos t e y(t) = R sen t, i.e., as solues
de (8) so crculos centrados em x = 1 e y = 0 de perodo 2.
A trajectria ptima de X0 at 0 segue alternadamente um arco de crculo
centrado em x = 1 e y = 0 e um arco de crculo centrado em x = 1 e y = 0.
O estudo detalhado da trajectria ptima e a sua implementao numrica,
para todo e qualquer X0 , podem ser encontrados em [33].
4 Controlo ptimo no linear

Apresentamos agora algumas tcnicas para a anlise de problemas de
controlo ptimo no lineares. Em particular, formulamos o Princpio do
Mximo de Pontryagin numa forma mais geral do que aquela que vimos na
Seco 3. O exemplo no linear da massa-mola ser tratado como exemplo
de aplicao.

4.1 Problemtica geral

De um ponto de vista global, o problema deve se formulado numa varie-
dade M , mas o nosso ponto de vista vai ser local e trabalhamos sobre um
aberto V de Rn suficientemente pequeno. A problemtica geral do controlo
ptimo a seguinte. Consideremos um sistema de controlo

x(t) = f (x(t), u(t)) (9)
sobre V onde f : Rn Rm Rn suave e o conjunto dos controlos
admissveis U composto por aplicaes u : [0, T (u)] Rm mensurveis
limitadas. Dada uma aplicao f 0 : Rn Rm R, denotamos por
Z T0
C(u) = f 0 (x(t), u(t)) dt
0
o custo de uma trajectria x : t 7 x(t) associada a u() e definido sobre
[0, T 0 (u)], T 0 (u) T (u). Sejam M0 e M1 duas sub-variedades regulares de
V . O problema do controlo ptimo consiste em encontrar, de entre todas as
trajectrias que unem M0 a M1 , aquelas cujo custo mnimo. Comeamos
por restringir-nos ao caso em que M0 e M1 so pontos x0 e x1 de V . Sendo
o nosso ponto de vista local, podemos sempre supor que x0 = 0.
4.2 Aplicao entrada-sada

Consideremos para o sistema (9) o seguinte problema de controlo: dado
um ponto x1 V , encontrar um tempo T e um controlo u sobre [0, T ] tal
que a trajectria xu associada a u, soluo de (9), verifica
xu (0) = 0 , xu (T ) = x1 .
Isto leva-nos a definir:
Definio 10. Seja T > 0. A aplicao entrada-sada em tempo T do
sistema de controlo (9) inicializado em 0 a aplicao:
ET : U V
u 7 xu (T )
onde U o conjunto dos controlos admissveis.

F.H. Clarke criou nos anos setenta a chamada Anlise No-Suave (Nonsmooth
Analysis) que permite o estudo de problemas de controlo ptimo mais gerais, em que as
funes envolvidas no so necessariamente diferenciveis no sentido clssico. Dado o
carcter introdutrio do nosso texto, restringimo-nos ao caso suave no sentido C : todos
os objectos manipulados so aqui, salvo casos particulares mencionados, C . Remetemos
o leitor interessado na Anlise No-Suave para [5, 6, 7, 8].

Por outras palavras, a aplicao entrada-sada em tempo T associa a

um controlo u o ponto final da trajectria associada a u. Uma questo
importante na teoria do controlo estudar esta aplicao ET , descrevendo a
sua imagem, as suas singularidades, a sua regularidade, etc. A resposta a
estas questes depende, obviamente, do espao U de partida e da forma do
sistema (da funo f ). Com toda a generalidade temos o seguinte resultado
(vide, e.g., [17, 27]).
Proposio 11. Consideremos o sistema (9) onde f suave e U
L ([0, T ]). Ento ET suave no sentido L .
Seja u U um controlo de referncia. Exprimamos a diferenciabili-
dade (no sentido de Frchet) de ET no ponto u. Consideremos A(t) =
x (xu (t), u(t)) e B(t) = u (xu (t), u(t)). O sistema
f f
y v (t) = A(t)yv (t) + B(t)v(t)

yv (0) = 0
chamado sistema linearizado ao longo de (xu , u). O diferencial de Frchet

de ET em u a aplicao
Z T
dET (u) v = yv (T ) = M (T )M 1 (s)B(s)v(s) ds
0
onde M a soluo matricial de M = AM , M (0) = Id.
4.3 Controlos singulares

Seja u um controlo definido sobre [0, T ] tal que a trajectria partindo de
x(0) = x0 definida sobre [0, T ]. Dizemos que o controlo u (ou a trajectria
xu ) singular sobre [0, T ] se o diferencial de Frchet dET (u) da aplicao
entrada-sada no ponto u no sobrejectiva. Caso contrrio dizemos que u
regular.
Proposio 12. Sejam x0 e T fixos. Se u um controlo regular, ento ET
uma aplicao aberta numa vizinhana de u.
4.4 Conjunto acessvel e controlabilidade

O conjunto acessvel em tempo T para o sistema (9), denotado por A(T ),
o conjunto das extremidades em tempo T das solues do sistema partindo
de 0. Por outras palavras, a imagem da aplicao entrada-sada em tempo
T.

Definio 13. O sistema (9) diz-se controlvel se
A(T ) = Rn .
[
T 0
Argumentos do tipo do teorema da funo implcita permitem deduzir

os resultados de controlabilidade local do sistema de partida a partir do
estudo da controlabilidade do sistema linearizado (vide, e.g., [18]). Por exem-
plo, deduzimos do teorema de controlabilidade no caso linear a proposio
seguinte.
Proposio 14. Consideremos o sistema de controlo (9) onde f (0, 0) = 0.
Seja A = f
x (0, 0) e B = u (0, 0). Se
f
rank(B|AB| |An1 B) = n
ento o sistema no linear (9) localmente controlvel em 0.

Em geral o problema da controlabilidade difcil. Diferentes abordagens
so possveis. Umas fazem uso da Anlise, outras da Geometria, outras ainda
da lgebra. O problema da controlabilidade est ligado, por exemplo,
questo de saber quando um determinado semi-grupo opera transitivamente.
Existem tambm tcnicas para mostrar, em certos casos, que a controlabili-
dade global. Uma delas, importante, a chamada tcnica de alargamento
(vide [17]).
4.5 Existncia de controlos ptimos

Para alm de um problema de controlo, consideramos tambm um pro-
blema de optimizao: de entre todas as solues do sistema (9) unindo
0 a x1 , encontrar uma trajectria que minimiza (ou maximiza) uma certa
funo custo C(T, u). Uma tal trajectria, se existir, diz-se ptima para
esse custo. A existncia de trajectrias ptimas depende da regularidade
do sistema e do custo. Para um enunciado geral de existncia vide, e.g.,
[17, 18]. Pode tambm acontecer que um controlo ptimo no exista na
classe de controlos considerada, mas exista num espao mais abrangente.
Esta questo remete-nos para outra rea importante: o estudo da regulari-
dade das trajectrias ptimas. Francis Clarke e Richard Vinter deram um
contributo importantssimo nesta rea, introduzindo o estudo sistemtico
da regularidade lipschitziana dos minimizantes no controlo ptimo linear
[9, 10, 34]. Resultados gerais de regularidade lipschitziana das trajectrias
minimizantes para sistemas de controlo no lineares podem ser encontrados
em [29].

4.6 Princpio do Mximo de Pontryagin

Dado um problema de controlo ptimo para o qual esto garantidas as
condies de existncia e regularidade da soluo ptima, como determinar os
processos optimais? A resposta a esta questo dada pelo clebre Princpio
do Mximo de Pontryagin. Para um estudo aprofundado das condies
necessrias de optimalidade sugerimos [5, 26, 33].
Comeamos por mostrar que uma trajectria singular pode ser parametri-
zada como a projeco de uma soluo de um sistema hamiltoniano sujeito a
uma equao de restrio. Consideremos o hamiltoniano do sistema (9):
H : Rn Rn \{0} Rm R
(x, p, u) 7 H(x, p, u) = hp, f (x, u)i
onde h , i denota o produto escalar usual de Rn .
Proposio 15. Seja u um controlo singular e x a trajectria singular

associada a esse controlo em [0, T ]. Ento, existe um vector linha contnuo
p : [0, T ] Rn \{0} tal que as equaes seguintes so verificadas para quase
todo o t [0, T ]:
H H

x(t) = (x(t), p(t), u(t)) , p(t)
= (x(t), p(t), u(t))
p x
H
(x(t), p(t), u(t)) = 0 (equao de restrio)
u
onde H o hamiltoniano do sistema.
Demonstrao. Por definio, o par (x, u) singular sobre [0, T ] se dET (u)
no sobrejectiva. Logo existe um vector linha p Rn \{0} tal que
Z T
v() L ([0, T ]) h
p, dET (u) vi = p M (T )M 1 (s)B(s)v(s) ds = 0 .
0
Consequentemente,
pM (T )M 1 (s)B(s) = 0 em q.t.p. de [0, T ] .
Seja p(t) = pM (T )M 1 (t), t [0, T ]. Temos que p um vector linha de

Rn \{0} e p(T ) = p. Diferenciando, obtemos
f
= p(t)
p(t) (x(t), u(t)) .
x

Introduzindo o hamiltoniano H(x, p, u) = hp, f (x, u)i conclumos que

H

x(t) = f (x(t), u(t)) = (x(t), p(t), u(t))
p
e
f H
= p(t)
p(t) (x(t), u(t)) = (x(t), p(t), u(t)) .
x x
A equao de restrio vem de p(t)B(t) = 0 pois B(t) = f u (x(t), u(t)).
Definio 16. Ao vector linha p : [0, T ] Rn \{0} da Proposio 15 cha-

mamos vector adjunto do sistema (9).
4.6.1 Princpio do Mximo fraco (Teorema de Hestenes)

Procuramos condies necessrias de optimalidade. Consideremos o
sistema (9). Os controlos u() U so definidos em [0, T ] e tomam valores
em = Rm (no existem restries aos valores dos controlos). As trajectrias
associadas devem verificar x(0) = x0 e x(T ) = x1 . O problema consiste em
minimizar um custo da forma
Z T
C(u) = f 0 (x(t), u(t)) dt , (10)
0
onde f 0 : Rn Rm R uma aplicao C e T est fixo.

Associamos ao sistema (9) o sistema aumentado

x(t) = f (x(t), u(t))
(11)
x (t) = f 0 (x(t), u(t))
0
e usamos a notao x = (x, x0 ) e f = (f, f 0 ). O problema reduz-se ento

procura de uma trajectria soluo de (11) com x 1 = (x1 , x0 (T ))
0 = (x0 , 0) e x
0
de tal modo que a ltima coordenada x (T ) seja minimizada.
Seja x
0 = (x0 , 0) fixo. O conjunto dos estados acessveis a partir de
0 para o sistema (11) A(
x x0 , T ) = u() x(T, x0 , u). Seja, agora, u um
controlo e x a trajectria associada, soluo do sistema aumentado (11)

saindo de x0 = (x0 , 0). Se u ptimo para o critrio (10), ento o ponto

(T ) pertence fronteira do conjunto A(
x x0 , T ). Com efeito, se assim no
fosse existiria uma vizinhana do ponto x (T ) = (x1 , x0 (T )) em A( x0 , T )
contendo um ponto y (T ) soluo do sistema (11) e tal que y (T ) < x0 (T ), o
0
que contradiz a optimalidade do controlo u (Figura 13). Consequentemente,

o controlo u , pela Proposio 12, um controlo singular para o sistema
aumentado (11).
Usando a Proposio 15 obtemos o seguinte teorema.

x0
x0 , T )
A(
x0 (T )
x1 x
Figura 13: se u ptimo, ento x x0 , T ).

(T ) Fr A(
Teorema 17 (Princpio do Mximo fraco Teorema de Hestenes [16]). Se

u um controlo ptimo, ento existe uma aplicao p : [0, T ] Rn+1 \{0}
tal que (
x , p , u
) satisfaz o sistema hamiltoniano
H
H
(t) =
x ( (t)), p (t) =
x (t), p (t), u (
x (t), p (t), u
(t)) (12)
p
x
e a condio de estacionaridade
H
(
x (t), p (t), u
(t)) = 0 , (13)
u
onde H( p, f(
x, p, u) = h x, u)i.
O Teorema 17 tem a sua gnese nos trabalhos de Graves de 1933, tendo
sido obtido primeiramente por Hestenes em 1950 [16]. Trata-se de um caso
particular do Princpio do Mximo de Pontryagin, onde no so consideradas
restries aos valores dos controlos (i.e., u(t) com = Rm ).
Escrevendo p = ( p1 , . . . , pn , p0 ) = (p, p0 ) (Rn R)\{0}, onde p0 a
varivel dual do custo e p (t) =

p (t)fx (
x , u (t)), temos que (
p, p0 ) satisfaz
o sistema
f
0
!
(p, p0 ) = (p, p0 ) f 0 x
x 0
e
H f f 0
=0=p + p0
u u u

onde H = h 0
p, f (x, u)i = p f + p0 f . Repare-se que p0 (t) = 0, isto , p0 (t)
constante em [0, T ]. Como o vector p (t) definido a menos de uma constante
multiplicativa, escolhe-se normalmente p0 0.

Definio 18. Uma extremal do problema de controlo ptimo um terno

ordenado (x, p, u) soluo das equaes (12) e (13). Se p0 = 0, dizemos que
a extremal anormal. Nesse caso ela no depende do custo e (x(t), u(t))
uma trajectria singular do sistema (9).
A designao anormal histrica. Sabe-se hoje que os minimizantes

anormais so frequentes e normais em muitos e variadssimos problemas
de optimizao. Ao leitor interessado no estudo de extremais anormais
sugerimos o livro [2].
4.6.2 Princpio do Mximo de Pontryagin

O princpio do mximo de Pontryagin uma verso forte do Teorema 17
onde so admitidas restries sobre os valores dos controlos. A existncia de
tais restries imposta pelas aplicaes e altera por completo a natureza
das solues. O princpio do mximo de Pontryagin muito mais difcil de
demonstrar do que o Teorema de Hestenes (vide, e.g., [18, 24]). Para uma
abordagem simples ao princpio do mximo de Pontryagin sugerimos dois
livros excelentes escritos em lngua Portuguesa: [19, 26]. O enunciado geral
o seguinte.
Teorema 19 (Princpio do Mximo de Pontryagin). Considere-se o sistema

de controlo em Rn

x(t) = f (x(t), u(t)) ,
onde f : Rn Rm Rn de classe C 1 e onde os controlos so aplicaes
mensurveis e limitadas, definidos no intervalo [0, t(u)] de R. Denotemos por
U o conjunto dos controlos admissveis cujas trajectrias associadas unem um
ponto inicial de M0 a um ponto final de M1 . Para um tal controlo definimos
o custo Z t(u)
C(u) = f 0 (x(t), u(t)) dt ,
0
onde f 0 : Rn Rm R de classe C 1 .
Se o controlo u U ptimo em [0, t ], ento existe uma aplicao no
trivial (i.e., no identicamente nula) (p(), p0 ) : [0, t ] Rn R absoluta-
mente contnua, chamada vector adjunto, onde p0 uma constante negativa
ou nula, tal que a trajectria ptima x associada ao controlo u verifica, em
quase todos os pontos de [0, t ], o sistema hamiltoniano
H H
x = (x, p, p0 , u) , p = (x, p, p0 , u)
p x

e a condio do mximo
H(x(t), p(t), p0 , u(t)) = max H(x(t), p(t), p0 , v) , q.t.p. t [0, t ] ,
v
onde o hamiltoniano H dado por H(x, p, p0 , u) = hp, f (x, u)i + p0 f 0 (x, u).
Alm disso, tem-se para todo o t [0, t ] que
max H(x(t), p(t), p0 , v) = 0 . (14)
v
Se M0 e/ou M1 so variedades de Rn com espaos tangentes Tx(0) M0 em

x(0) M0 e Tx(t ) M1 em x(t ) M1 , ento o vector adjunto satisfaz as
seguintes condies de transversalidade:
p(0)Tx(0) M0 e p(t )Tx(t ) M1 .
Observao 20. No Teorema 19 o tempo final livre. Se impusermos um
tempo final fixo igual a T , isto , se procuramos, partindo de M0 , atingir
o alvo M1 em tempo T e minimizando o custo C(u) em [0, T ] (problema a
tempo fixo), ento o teorema continua verdadeiro, salvo a condio (14) que
deve ser substituda por
max H(x(t), p(t), p0 , v) = const t [0, T ]
v
(com constante no necessariamente nula).

Observao 21. O problema de tempo mnimo corresponde ao caso em que
f 0 = 1.
Observao 22. Se o conjunto alvo M1 igual a todo o Rn (problema com
extremidade final livre), ento a condio de transversalidade no instante
final diz-nos que p(t ) = 0.
O princpio do mximo de Pontryagin um resultado profundo e impor-
tante da Matemtica contempornea, com inmeras aplicaes na Fsica,
Biologia, Gesto, Economia, Cincias Sociais, Engenharia, etc. (vide, e.g.,
[4]).
4.7 Exemplo: controlo ptimo de um oscilador harmnico

(caso no linear)
Reconsideremos o exemplo (no linear) da mola, modelado pelo sistema
de controlo

x(t) = y(t) ,
= x(t) 2x(t)3 + u(t) ,
y(t)

onde admitimos como controlos todas as funes u() seccionalmente con-

tnuas tais que |u(t)| 1. O objectivo consiste em levar a mola de uma
posio inicial qualquer (x0 , y0 = x 0 ) sua posio de equilbrio (0, 0) em
tempo mnimo t .
Apliquemos o Princpio do Mximo de Pontryagin a este problema. O
hamiltoniano tem a forma
H(x, y, px , py , p0 , u) = px y + py (x 2x3 + u) + p0 .
Se (x, y, px , py , p0 , u) uma extremal, ento

H H
px = = py (1 + 6x2 ) e py = = px .
x y
Notemos que uma vez que o vector adjunto (px , py , p0 ) deve ser no trivial, py
no pode anular-se num intervalo (seno teramos igualmente px = py = 0
e, por anulao do hamiltoniano, teramos tambm p0 = 0). Por outro lado,
a condio do mximo d-nos
py u = max py (t) .
|v|1
Em particular, os controlo ptimos so sucessivamente iguais a 1, isto

, verifica-se o princpio bang-bang (vide, e.g., [18, 21]). Concretamente,
podemos afirmar que
u(t) = sinal(py (t)) onde py a soluo de

py (t) + py (t)(1 + 6x(t)2 ) = 0
(
py (t ) = cos , py (t ) = sen ,
[0, 2[. Invertendo o tempo (t 7 t) o nosso problema equivalente ao

problema de tempo mnimo para o sistema
= y(t)

x(t)
= x(t) + 2x(t)3 sinal(py (t))

y(t)

p y (t) = px (t)

2
px (t) = py (t)(1 + 6x(t) ) .

Dadas as condies iniciais x0 e x 0 (posio e velocidade inicial da massa),

o problema facilmente resolvido. O leitor interessado encontra em [33] uma
resoluo efectuada com o sistema de computao algbrica Maple. Sobre o
uso do Maple no clculo das variaes e controlo ptimo veja-se [15, 20].

Nota final
A Teoria Matemtica dos Sistemas e Controlo ensinada nas instituies
dos autores, nos Departamentos de Matemtica da Universidade de Aveiro
e da Universidade de Orlans, Frana. Em Aveiro no mbito do Mestrado
Matemtica e Aplicaes, especializao em Matemtica Empresarial e Tec-
nolgica [35], e no mbito do Programa Doutoral em Matemtica e Aplicaes
este ltimo uma associao entre os Departamentos de Matemtica da
Universidade de Aveiro e da Universidade do Minho [36]; em Orlans na
opo Controlo Automtico do Mestrado PASSION [37]. O primeiro autor
foi aluno de Mestrado em Aveiro e faz actualmente um doutoramento em
Aveiro e Orlans na rea do Controlo ptimo, com o apoio financeiro da
FCT, bolsa SFRH/BD/27272/2006.
Agradecemos a um revisor annimo a apreciao cuidada e as numerosas
e pertinentes observaes, comentrios e sugestes.
Referncias
[1] A. A. Agrachev, Y. L. Sachkov. Control theory from the geometric
viewpoint, Encyclopaedia Math. Sci., 87, Springer, Berlin, 2004.
[2] A. V. Arutyunov, Optimality conditions Abnormal and degenerate

problems, Kluwer Acad. Publ., Dordrecht, 2000.
[3] A. Bressan and B. Piccoli, Introduction to the mathematical theory of

control, American Institute of Mathematical Sciences (AIMS), Springfi-
eld, MO, 2007.
[4] A. E. Bryson Jr. Optimal control 1950 to 1985, IEEE Control Syst.
Mag 16 (1996), no. 3, 2633.
[5] F. H. Clarke. Optimization and nonsmooth analysis, Wiley, New York,

1983.
[6] F. H. Clarke. Nonsmooth analysis in control theory: a survey, Eur. J.

Control 7 (2001), 6378.
[7] F. H. Clarke. Necessary conditions in dynamic optimization, Mem. Amer.

Math. Soc. 173, 2005.
[8] F. H. Clarke, Yu. S. Ledyaev, R. J. Stern, P. R. Wolenski. Nonsmooth

analysis and control theory, Springer, New York, 1998.

[9] F. H. Clarke, R. B. Vinter. Regularity properties of solutions to the

basic problem in the calculus of variations, Trans. Amer. Math. Soc.
289 (1985), no. 1, 7398.
[10] F. H. Clarke, R. B. Vinter. Regularity properties of optimal controls,
SIAM J. Control Optim. 28 (1990), no. 4, 980997.
[11] J. M. Coron, E. Trlat. Tout est sous contrle, Plein Sud Spcial
Recherche, 2004, 126131.
[12] J. M. Coron, E. Trlat. Tout est sous contrle, Matapli 83, 2007, 5973.
[13] R. A. C. Ferreira, D. F. M. Torres. Higher-order calculus of variations
on time scales, Mathematical Control Theory and Finance, Springer,
2008, 149159.
[14] G. N. Galbraith, R. B. Vinter. Optimal control of hybrid systems with
an infinite set of discrete states, J. Dynam. Control Systems 9 (2003),
no. 4, 563584.
[15] P. D. F. Gouveia, D. F. M. Torres. Automatic computation of conser-
vation laws in the calculus of variations and optimal control, Comput.
Methods Appl. Math. 5 (2005), no. 4, 387409.
[16] M. R. Hestenes. An Elementary Introduction to the Calculus of Variati-
ons, Math. Mag. 23 (1950), no. 5, 249267.
[17] V. Jurdjevic. Geometric control theory, Cambridge Univ. Press, Cam-
bridge, 1997.
[18] E. B. Lee, L. Markus. Foundations of optimal control theory, Wiley, New
York, 1967.
[19] A. Leito. Clculo Variacional e Controle timo, Instituto de Matem-
tica Pura e Aplicada (IMPA), Rio de Janeiro, 2001.
[20] A. M. F. Louro, D. F. M. Torres. Computao Simblica em Maple no
Clculo das Variaes, Bol. Soc. Port. Mat. 59 (2008), 1330.
[21] J. W. Macki, A. Strauss. Introduction to optimal control theory, Springer,
New York, 1982.
[22] N. Martins, D. F. M. Torres. Calculus of Variations on Time
Scales with Nabla Derivatives, Nonlinear Anal., in press. DOI:
10.1016/j.na.2008.11.035

[23] E. J. McShane. The calculus of variations from the beginning through

optimal control theory, SIAM J. Control Optim. 27 (1989), no. 5, 916
939.
[24] L. S. Pontryagin, V. G. Boltyanskii, R. V. Gamkrelidze, E. F. Mish-
chenko. The mathematical theory of optimal processes, Translated from
the Russian by K. N. Trirogoff; edited by L. W. Neustadt, Interscience
Publishers John Wiley & Sons, Inc. New York, 1962.
[25] C. J. Silva, D. F. M. Torres. Two-dimensional Newtons problem of
minimal resistance, Control Cybernet. 35 (2006), no. 4, 965975.
[26] G. Smirnov, V. Bushenkov. Curso de Optimizao Programao Mate-
mtica, Clculo de Variaes, Controlo ptimo, Escolar Editora, 2005.
[27] E. D. Sontag. Mathematical control theory, Springer, New York, 1990.
[28] H. J. Sussmann, J. C. Willems. 300 Anos de Controlo Optimal: da
Braquistcrona ao Princpio do Mximo, Bol. Soc. Port. Mat. 45 (2001),
2154.
[29] D. F. M. Torres. Lipschitzian regularity of the minimizing trajectories
for nonlinear optimal control problems, Math. Control Signals Systems
16 (2003), no. 2-3, 158174.
[30] D. F. M. Torres, A. Yu. Plakhov. Optimal control of Newton-type
problems of minimal resistance, Rend. Semin. Mat. Univ. Politec. Torino
64 (2006), no. 1, 7995.
[31] E. Trlat. Thorie du contrle: contrle optimal et stabilisation, Micros-
coop 55 (2008), 1415.
[32] E. Trlat. Introduction au contrle optimal, Revue de Math. Sp, Math.
Concrtes 3, 2002/2003.
[33] E. Trlat. Contrle optimal, Vuibert, Paris, 2005.
[34] R. Vinter. Optimal control, Birkhuser Boston, Boston, MA, 2000.
[35] http://www.mat.ua.pt/PageCourse.aspx?id=123&b=1
[36] http://www.mat.ua.pt/PageText.aspx?id=6248
[37] http://www.univ-orleans.fr/mapmo/membres/trelat/masterPASSION.
html

O Controlo Optimo e As Suas Multiplas Ap PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

O Controlo Optimo e As Suas Multiplas Ap PDF

Enviado por

Direitos autorais:

Formatos disponíveis

O controlo ptimo

e as suas mltiplas aplicaes

Palavras chave: controlo ptimo, princpio do mximo de Pontryagin,

Abstract: In this work we refer to motivations, applications, and relations of

Keywords: optimal control, Pontryagin maximum principle, applications

Boletim da SPM 61, Outubro 2009, pp. 1137

Boletim da SPM 61, Outubro 2009, pp. 1137

tempo finito) de um determinado estado inicial at um estado final prescrito.

Assegurada a propriedade de controlabilidade, podemos desejar passar

Boletim da SPM 61, Outubro 2009, pp. 1137

arriscado) ou minimizando a quantidade de combustvel gasta na operao.

Figura 1: a teoria do controlo ptimo tem um papel importante na engenharia

A teoria do controlo ptimo tem uma grande importncia no domnio

2 Breve resenha histrica

Boletim da SPM 61, Outubro 2009, pp. 1137

Figura 2: problema da braquistcrona.

Trata-se do problema da braquistcrona (do grego brakhistos, o mais

Figura 3: arcos de ciclide conduzem s descidas mais rpidas e adrenalina

A teoria do controlo ptimo surge depois da segunda guerra mundial, res-

Boletim da SPM 61, Outubro 2009, pp. 1137

diferenciais e originou novos resultados de existncia de trajectrias. Regra

Figura 4: Lev Semenovich Pontryagin (3/Set/1908 3/Maio/1988)

Pontryagin e os seus companheiros introduziram um aspecto de impor-

Boletim da SPM 61, Outubro 2009, pp. 1137

3 Controlo ptimo linear

3.1 Questes centrais

Esta aplicao depende do controlo u. Ao mudarmos a funo u obtemos

Figura 5: a trajectria soluo do sistema de controlo (1) depende da escolha

Neste contexto, surgem naturalmente duas questes:

Boletim da SPM 61, Outubro 2009, pp. 1137

(i) Dado um ponto X1 Rn , existir um controlo u tal que a trajectria

Figura 6: problema da controlabilidade.

(ii) Assegurada a controlabilidade (questo anterior), existir um controlo

Figura 7: problema do tempo mnimo.

Os teoremas que se seguem respondem a estas questes. As respectivas

3.2 Conjunto acessvel

Boletim da SPM 61, Outubro 2009, pp. 1137

Por palavras, A(X0 , T ) o conjunto das extremidades das solues de

Figura 8: conjunto acessvel.

Teorema 2. Sejam T > 0, I compacto e X0 Rn . Ento para todo o

Proposio 3. Suponhamos que X0 = 0 e I = R. Ento,

1. T > 0 A(0, T ) um sub-espao vectorial de Rn . Alm disso,

2. 0 < T1 < T2 A(0, T1 ) A(0, T2 ).

Definio 4. O conjunto A(0) = t0 A(0, T ) o conjunto dos pontos

Corolrio 5. O conjunto A(0) um sub-espao vectorial de Rn .

Boletim da SPM 61, Outubro 2009, pp. 1137

Definio 6. O sistema de controlo X = AX + Bu diz-se controlvel se

O teorema seguinte d-nos uma condio necessria e suficiente de con-

Teorema 7 (Condio de Kalman). O sistema X = AX +Bu controlvel se

3.4 Princpio do Mximo de Pontryagin para o problema de

T = inf{t > 0 | X1 A(X0 , t)} . (3)

Boletim da SPM 61, Outubro 2009, pp. 1137

Figura 10: qual a trajectria X para a qual T mnimo?

O valor de T est bem definido pois, a partir do Teorema 2, A(X0 , t) varia

Figura 11: o tempo mnimo T corresponde ao primeiro instante t para o qual

Por outro lado, temos necessariamente:

Boletim da SPM 61, Outubro 2009, pp. 1137

ptimos. O teorema que se segue d-nos uma condio necessria e suficiente

Teorema 9 (Princpio do Mximo de Pontryagin (caso linear)). Considere-se

Seja T > 0. O controlo u L1 ([0, T ], I = [1, 1]) ptimo se e somente se

onde h, i o produto interno em Rn e (t) Rn soluo da equao

A condio inicial (0) depende de X1 . Como ela no directamente

3.5 Exemplo: controlo ptimo de um oscilador harmnico