Você está na página 1de 101

Topicos em Teoria de Controle 1

A. Leitao
Departamento de Matematica
Universidade Federal de Santa Catarina (UFSC)
G.N. Silva
Departamento de Computacao e Estatstica
Universidade Estadual Paulista (UNESP)

1 Manuscrito

atualizado em: 04 Outubro 2004

Conte
udo
1 Sistemas Lineares
1.1 Introduca
o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Sistemas N
ao-Aut
onomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Sistemas Aut
onomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1
1
6
11

2 Controlabilidade
2.1 Controlabilidade Para Sistemas Lineares
2.2 A Matriz de Controlabilidade . . . . . .
2.3 Conjunto dos Estados Atingveis . . . .
2.4 Controles Redundantes . . . . . . . . . .
2.5 Consideraco
es Finais . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

17
17
23
29
34
35

3 Estabilidade
3.1 Conceito e Exemplos . . . . . . . . . . . . .
3.2 Estabilidade de Sistemas Lineares . . . . . .
3.3 Criterio de RouthHurwitz . . . . . . . . .
3.4 Perturbaca
o de Sistemas Lineares . . . . . .
3.5 Metodo de Lyapunov . . . . . . . . . . . . .
3.6 Equaca
o Matricial de Lyapunov . . . . . . .
3.7 Estabilidade de Sistemas Lineares Discretos
Exerccios . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

37
37
41
42
44
49
53
55
56

4 Estabiliza
c
ao
4.1 Sistemas Lineares . . . . . . . . . .
4.2 Colocaca
o de P
olos . . . . . . . . .
4.3 Observador Din
amico . . . . . . .
4.4 Estabilizaca
o por Realimentaca
o de
4.5 Pontos de Operaca
o . . . . . . . .
Exerccios . . . . . . . . . . . . . .

. . . .
. . . .
. . . .
Sada
. . . .
. . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

59
59
62
65
68
69
71

5 Princpio do M
aximo
5.1 Problemas com Horizonte Finito .
5.2 Problemas com Horizonte Infinito .
5.3 Aplicaco
es do Princpio do M
aximo
Exerccios . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

73
73
77
80
90

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

Bibliografia

93

ii

Captulo 1

Sistemas Lineares
Neste captulo vamos apresentar a teoria b
asica de sistemas equaco
es diferenciais ordin
arias lineares
que ser
au
til para o estudo de sistemas de controle lineares.
O material relacionado a sistemas lineares contido neste captulo pode ser encontrado citesotomayor. O teorema da contraca
o e assunto b
asico dos cursos de matem
atica. O material que aqui
aparece foi retirado de [Hon].

1.1

Introdu
c
ao

Sistemas Lineares s
ao aqueles que tem a forma:
0
x1 = a11 (t)x1 + . . . + a1n (t)xn + b1 (t)

x02 = a21 (t)x1 + . . . + a2n (t)xn + b2 (t)


..

0
xn = an1 (t)x1 + . . . + ann (t)xn + bn (t)

(1.1)

onde os aij , bi s
ao funco
es contnuas em um intervalo I, aberto com i,j=1,2,. . . ,n.
Equivalentemente podemos escrever
x0i

n
X

[aij (t)xj (t) + bi (t)], i = 1, 2, ..., n.

j=1

Se um conjunto de soluco
es {1 , 2 ,...,n } de classe C 1 em I0 I satisfaz
n

X
d
i (t) =
[aij (t)j (t) + bi (t)], i = 1, 2, ..., n.
dt
j=1

ent
ao tal conjunto e soluca
o do sistema (1.1) em I0 para todo t I0 .
Considerando agora A(t) a matriz cujos elementos s
ao as funco
es a ij e b(t) o vetor cujos elementos
s
ao as funco
es bi (t), temos a equaca
o matricial:
x0 = A(t)x + b(t).

(1.2)

Assim, se um conjunto {1 , 2 ,...,n } e soluca


o de (1.1) em I0 ent
ao a aplicaca
o =(1 , 2 ,...,n )
e soluca
o para (1.2) em I0 , isto e,
0 = A(t)(t) + b(t), t I0 .
1

Antes de prosseguirmos, vamos apresentar algumas noco


es de espaco
es metricos necess
arios ao
desenvolvimento deste captulo.
Defini
c
ao 1.1.1 Um espaco metrico e um par (X,d) onde X e um conjunto e d e uma funca
o,
d : X X R
(x, y) d(x, y),
chamada dist
ancia de x a y, que satisfaz:
(a) d(x,x) = 0
(b) x 6= y d(x, y) > 0
(c) d(x,y) = d(y,x)
(d) d(x,y) d(x,z)+d(z,y) - (desigualdade triangular)
Defini
c
ao 1.1.2 Seja X um espaco metrico com a metrica d. Dizemos que uma aplicaca
o T : X
X e uma contraca
o se existe c R, 0 c < 1 tal que x1 , x2 X temos que d(T (x1 ), T (x2 ))
cd(x1 , x2 ), onde c e a chamada de constante de contraca
o de T.
Nota
c
ao: Seja T : X X, denotaremos T 2 = T T , T 3 = T T 2 , ou seja T n = T T n1 .
Lema 1.1.3 Sejam 0 c < 1 e m > n 1. Ent
ao 1 + c + c2 + ... + cmn1 (1 c)1 .
Demonstra
c
ao: Exerccio.
Defini
c
ao 1.1.4 Dada uma sequencia (xn ) em (X, d) e um ponto x X, dizemos que (xn ) converge
a x se a sequencia de n
umeros reais d(xn , x) converge a zero.
Defini
c
ao 1.1.5 Uma sequencia (xn ) de X e chamada de sequencia de Cauchy se dado > 0, existe
n0 N tal que
d(xn , xm ) < para todo n, m > n0 .
Dizemos que um espaco metrico e completo se toda sequencia de Cauchy neste espaco for convergente.
Teorema 1.1.6 (Teorema do ponto fixo de Banach para contra
co
es)
Sejam X um espaco metrico e T : X X uma contraca
o. Ent
ao:
(i) ! x : T (x) = x;
(ii) x1 , a seq
uencia (xn )nN , onde xn+1 = T n (x1 ), converge a x;
(iii) n temos d(xn , x)

cn1
d(xn , x).
1c
2

Demonstra
c
ao: (i) Mostremos primeiramente a existencia. Seja x1 X qualquer e xn+1 = T (xn ),
n = 1, 2, ...
Vamos demonstrar que (xn )nN e uma sequencia de Cauchy.
Para n > 1, temos
d(xn , xn+1 ) = d(T xn1 , T xn ) cd(xn1 , xn )
e, por induca
o sobre n, vem que
d(xn , xn+1 ) cn1 d(x1 , x2 ).
Ent
ao, para 1 n m, temos
d(xn , xm ) d(xn , xn+1 ) + ... + d(xm1 , xm )
cn1 d(x1 , x2 ) + ... + cm2 d(x1 , x2 )

= cn1 d(x1 , x2 ) 1 + c + ... + cmn1

cn1
d(x1 , x2 ) ( Lema (1.1.3)).
1c

e, como cn 0, segue que (xn ) e uma sequencia de Cauchy. Como X e um espaco metrico completo,
temos que existe x
X tal que xn x
.
Mostremos agora que T x
=x
. Assim sendo
d(T x
, xn+1 ) = d(T x
, T xn ) cd(
x , xn )
e, como d(
x, xn ) 0, segue que xn T x
. Pelo teorema de unicidade do limite, temos ent
ao que
Tx
=x
.
Mostremos agora a unicidade. Sejam x
, y X, x
6= y, com T x
=x
, T y = y. Ent
ao
0 < d(
x, y) = d(T x
, T y) cd(
x, y)
e, portanto, c 1, o que contradiz a hip
otese.
(ii) Observe que a sequencia definida em i) tambem pode ser escrita da seguinte forma
xn+1 = Txn1
Sabemos que esta sequencia converge a um ponto fixo, mas pela unicidade do ponto fixo temos que
ela converge a x.
(iii) Da demonstraca
o de i) resulta que para 1 n m,
d(xn , x
) d(xn , xm ) + d(xm , x
)

cn1
d(x1 , x2 ) + d(xm , x)
1c

Como d(xm , x
) 0, segue a afirmaca
o (iii).
Corol
ario 1.1.7 Seja T : X X tal que, para algum m, T m e uma contraca
o. Ent
ao T tem
um e somente um ponto fixo e, para qualquer que seja x1 X, a seq
uencia (T n x1 )nN converge ao
ponto fixo.
3

Demonstra
c
ao: Como T m e uma contraca
o, seja x seu u
nico ponto fixo, ou seja T m x = x. Ent
ao:
T m (T x) = T (T mx) = T x
Logo T x e ponto fixo de T m . Mas como x e o u
nico ponto fixo de T m , temos que x = T x
(existencia), ou seja x e ponto fixo de T .
Para provar que x e u
nico, tomemos x
e como um outro ponto fixo de T. Assim,
T m (e
x) = T m1 (T x
e) = T m1 (e
x) = T m2 (T x
e) = ... = T x
e=x
e

Logo x
e e ponto fixo de T m , e portanto x = x
e.
Provemos ent
ao a segunda parte do corol
ario.
Seja x1 X. Tome yk = (T m )k y1 , onde y1 = T r x1 , com r N fixo e k N. Pelo Teorema do
ponto fixo de Banach para contraco
es, yk x. Ent
ao, para n > m, temos que r N , 1 r < m,
tal que n = km + r. Assim,
T n x1 = T mk+r x1 = T mk (T r x1 ) = (T m )k y1 = yk
Como yk x, temos que T n x1 x.
Consideraremos C(I0 , E) := {x : I0 E} o espaco das funco
es contnuas com a metrica
d(x, y) = max |x(t) y(t)| =k x y k .
t I0

Observa
c
ao: Denotaremos por E os espacos Rn ou Cn .
Teorema 1.1.8 Se as funco
es aij e bi , i,j=1,2,...,n, s
ao contnuas em I, ent
ao existe uma u
nica
soluca
o (t) (definida em I) da equaca
o
x0 = A(t)x + b(t),
que satisfaz a condica
o inicial
(t0 ) = x0 , t0 I,

onde x0 E e um valor arbitr


ario.

Rt
Demonstra
c
ao: Seja T : C C definida por T (t) := x0 + t0 [A(s)(s) + b(s)]ds. Assim T
est
a bem definida. Provemos que T possui um u
nico ponto fixo em C, o que implica no resultado
desejado. Dados u, v C, temos
|T u(t) T v(t)| = |

t
t0

[A(s)(u(s) v(s))]ds|

K k u v k |t t0 |,

t
t0

k A(s) kk u v k ds

onde K := supsI0 k A(s) k . Tambem temos:


|T 2 u(t) T 2 v(t)|

= |T (T u)(t) T (T v)(t)|
K

t
t0

t
t0

k A(s)(T u(s) T v(s)) k ds

|T u(s) T v(s)|ds

K k u v k

t
t0

|s t0 |ds = K 2 k u v k

(t t0 )2
2!

Por induca
o, provamos que
|T n u(t) T n v(t)|

Kn
k u v k |t t0 |n
n!

Suponhamos que a desigualdade acima seja verdadeira para n N. Ent


ao
|T

n+1

u(t) T

n+1

v(t)|

= |T (T u)(t) T (T v)(t)| = |
K

t
t0

t
t0

A(s)(T n u(s) T n v(s))ds|

K n+1
Kn
k u v k |s t0 |n ds
k u v k |t t0 |n+1 .
n!
(n + 1)!

Sendo I0 = [a, b] com a < b, segue que


|T n u(t) T n v(t)|

K n (b a)n
k u v k , n N.
n!

Logo, para algum m N suficientemente grande, podemos afirmar que T m e uma contraca
o. Do
Corol
ario (1.1.7) segue que T possui um u
nico ponto fixo C, tal que
T = ,
isto e,
(t) = x0 +

[A(s)(s) + b(s)]ds

(1.3)

t0

o que demonstra o teorema da existencia e unicidade em quest


ao.
Consideremos a equaca
o diferencial
x(n) = p1 (t)x(n1) + p2 (t)x(n2) + . . . + pn1 (t)x0 + pn (t)x + g(t),

(1.4)

onde as funco
es p1 , p2 , . . . , pn e g s
ao contnuas num intervalo I. Podemos transformar a equaca
o
(1.4) num sistema de n equaco
es de primeira ordem, assim:

z1 = x

z10 = x0 = z2

0
00

z20 = x000 = z3
z3 = x = z 4

..

z0
= x(n1) = zn

n1
0
zn = x(n) = p1 (t)x(n1) + . . . + pn (t)x + g(t) = p1 (t)zn + . . . + pn (t)z1 + g(t)

(1.5)

Com tal mudanca facilitaremos os c


alculos a serem feitos, j
a que precisaremos apenas de achar a
soluca
o de equaco
es diferenciais de primeira ordem.
O sistema (1.5) e equivalente na forma matricial a
`
z 0 = A(t)z + b(t),
5

onde

z1
z2
..
.

z=

zn1
zn

A(t) =

0
0
..
.
0
pn (t)

1
0
..
.

0
1
..
.

0
0
pn1 (t) pn2 (t)

..
.

0
0
..
.

1
p1 (t)

b(t) =

0
0
..
.
0
g(t)

Assim, como pelo Teorema 1.1.8 a equaca


o diferencial acima tem u
nica soluca
o, conseq
uentemente,
a equaca
o (1.4) tambem tem soluca
o u
nica.
Exemplo 1.1.9 Transforme a equaca
o
ax00 + bx + c = 0
onde a, b e c s
ao constantes, num sistema de equaco
es lineares.
b
c
Solu
c
ao: O sistema dado e equivalente a
` x00 + x0 +
= 0. Facamos x1 = x; ent
ao x01 = x0 .
a
a
b
c
b
c
Facamos agora, x2 = x0 ; ent
ao x02 = x00 = x0 = x1 .
a
a
a
a
Assim, obtemos o sistema
( 0
x1 = x 2
c
b
x02 = x1
a
a
que e equivalente a
 


 0  
0 1
0
x1
x1
+ c .
= b
x2
x02
0
a
a
Se a matriz A(t) do sistema de equaco
es
x0 = A(t)x + b(t),
e constante, isto e, os elementos aij s
ao constantes, dizemos que o sistema associado e um sistema
aut
onomo. Caso contr
ario, chamamos o sistema de sistema n
ao-aut
onomo. Trataremos agora
do caso mais geral, onde o sistema e n
ao-aut
onomo.

1.2

Sistemas N
ao-Aut
onomos

Estudaremos equaco
es da forma

x0 = A(t)x + b(t),

(1.6)

onde todos os elementos da matriz A(t) e do vetor b(t) s


ao funco
es contnuas num intervalo I. Como
j
a visto, a equaca
o (1.6) possui u
nica soluca
o.
Corol
ario 1.2.1 Sejam , soluco
es da equaca
o homogenea
x0 = A(t)x.
(a) Se a e b s
ao constantes arbitr
arias, ent
ao = a + b e soluca
o da equaca
o (1.7);

(1.7)

(b) Se (s) = 0 para algum s I ent


ao (t) = 0, t I.
Demonstra
c
ao: (a) Se e s
ao soluco
es da equaca
o (1.7), ent
ao satisfazem
0 = A(t)

0 = A(t).

Logo,
0 (t) = a0 (t) + b 0 (t)
= aA(t)(t) + bA(t)(t)
= A(t)[a(t) + b(t)]
= A(t)(t).
(b) A funca
o nula e soluca
o da equaca
o (1.7) e satisfaz a condica
o inicial (s) = 0. Pelo Teorema
1.1.8 esta soluca
o e u
nica. Ent
ao
(t) = 0, t I.

Teorema 1.2.2 O conjunto A de todas as soluco


es da equaca
o (1.7) e um subespaco do espaco
vetorial das funco
es contnuas : I E, de dimens
ao n, e para cada s I, a aplicaca
o que a
cada x0 E associa a soluca
o (t) satisfazendo (s) = x0 e um isomorfismo de E sobre A.
Demonstra
c
ao: A primeira parte e conseq
uencia imediata do Corol
ario 1.2.1,Provemos a segunda
parte. Representemos por s a aplicaca
o de A em E, dada por
s () = (s), s I.
Observemos que s e linear:
s (a1 + 2 ) = (a1 + 2 )(s)
= a1 (s) + 2 (s)
= as (1 ) + s (2 ),
onde 1 e 2 s
ao soluco
es da equaca
o (1.7). Pelo Teorema 1.1.8, temos que para x 0 E, i A
tal que s () = (s) = x0 , ou seja, s e sobrejetora. Agora
ker s = { A : s () = 0}.
Mas pela parte (b) do Corol
ario 1.2.1, a u
nica soluca
o que satisfaz (s) = 0 e a soluca
o nula. Logo
ker s = {0}, ou seja, s e injetora. Portanto s e bijetora, e existe 1
em bijetora),
s (tamb
1
s (x0 ) = (t), com (s) = x0 .
Assim obtemos uma aplicaca
o de E em A, bijetora. Logo esta e isomorfismo de E sobre A e portanto
dimA = dimE.
Notemos que como A e um subespaco vetorial, tambem e um espaco vetorial. Particularmente
se v1 , v2 , . . . , vn formam uma base de E, ent
ao 1 (t), 2 (t), . . . , n (t) com 1 (s) = v1 , 2 (s) =
v2 , . . . , n (s) = vn formam uma base de A.
7

Consideremos agora as equaco


es matriciais lineares
X 0 = A(t)X,

(1.8)

onde X e uma matriz quadrada de ordem n. (t) e soluca


o da equaca
o (1.8) se, e somente se, para
todo 1 j n, a j-esima coluna j (t) de (t) e soluca
o da equaca
o homogenea x0 = A(t)x.
Definimos a matriz fundamental da equaca
o (1.7) como sendo uma matriz quadrada (t) de
ordem n cujas colunas formam uma base do espaco de soluco
es de (1.7).
Como as colunas de uma matriz fundamental formam uma base do espaco A de soluco
es de
(1.7), estas s
ao linearmente independentes. Temos que a dimens
ao de A e n; logo temos n colunas
linearmente independentes, e assim a matriz fundamental e n
ao-singular1.
Pelo Teorema 1.1.8, dado t0 I, e M0 uma matriz n
ao-singular, existe uma u
nica matriz fundamental tal que (t0 ) = M0 .
Seja C uma matriz constante, n n. Ent
ao se (t) e uma soluca
o da equaca
o (1.8), (t) = (t)C
e tambem soluca
o de (1.8), pois
0 (t) = 0 (t)C = A(t)(t)C = A(t)(t).
Proposi
c
ao 1.2.3 Sejam (t) e (t) soluco
es da equaca
o
X 0 = A(t)X,
sendo fundamental. Ent
ao existe uma u
nica matriz C, n n, tal que
(t) = (t)C,

t I.

C e n
ao singular se e somente se (t) e fundamental.
Demonstra
c
ao: Como e fundamental, e n
ao singular para todo t I. Ent
ao temos
[1 (t)(t)]0 = [1 (t)]0 (t) + 1 (t) 0 (t).

(1.9)

Mas 1 (t) = 1 (t)(t)1 (t). Logo


[1 (t)]0

= [1 (t)(t)1 (t)]0
= [1 (t)]0 (t)1 (t) + 1 (t)0 (t)1 (t) + 1 (t)(t)[1 (t)]0
= [1 (t)]0 + 1 (t)0 (t)1 (t) + [1 (t)]0 .

Assim obtemos [1 (t)]0 = 2[1 (t)]0 + 1 (t)0 (t)1 (t), ou seja,


[1 (t)]0

= 1 (t)0 (t)1 (t)

= 1 (t)A(t)(t)1 (t)
= 1 (t)A(t),

(1.10)

e substituindo em (1.9), obtemos


[1 (t)(t)]0 = 1 (t)A(t)(t) + 1 (t)A(t)(t) = 0.
Portanto

1 (t)(t) = C = (t) = (t)C.

Desta forma, temos que


det 1 (t) det (t) = det[1 (t)(t)] = det C.
Assim, det C 6= 0, isto e, C e n
ao singular se e somente se det (t) 6= 0, ou seja, se e somente se (t)
e fundamental.
1 det[(t)]

6= 0, ou seja, e inversvel.

Teorema 1.2.4 Se (t) e uma matriz fundamental da equaca


o
x0 = A(t)x,
ent
ao a soluca
o (t), com (t0 ) = x0 , da equaca
o
x0 = A(t)x + b(t),
e dada por


(t) = (t)

(t0 )x0 +

(s)b(s)ds .

t0

(1.11)

Demonstra
c
ao: Por causa do Teorema 1.1.8 basta verificar que (t) dada em (1.11) satisfaz a
condica
o inicial (t0 ) = x0 (o que pode ser feito por inspeca
o) e a equaca
o (1.6). Verifiquemos que
(t) satisfaz (1.6). De fato

0 (t) = 0 (t)[1 (t0 )x0 +

1 (s)b(s)ds] + (t)[1 (t0 )x0 +

t0

A(t)(t)[1 (t0 )x0 +

1 (s)b(s)ds]0 =

t0

1 (s)b(s)ds] + (t)1 (t)b(t) = A(t) + b(t).

t0

A ttulo de ilustraca
o vamos mostrar como deduzir a carade usando o metodo de variaca
o
de par
ametros. Seja C(t) tal que
(t) = (t)C(t), (t0 ) = x0 .

(1.12)

Como (t) e fundamental, e n


ao singular. Ent
ao
C(t0 ) = 1 (t0 )(t0 ) = 1 (t0 )x0 .
Desde que (t) e soluca
o, satisfaz
0 (t) = A(t)(t) + b(t).

(1.13)

Mas de (1.12), temos


0 (t)

= 0 (t)C(t) + (t)C 0 (t)


= A(t)(t)C(t) + (t)C 0 (t)
= A(t)(t) + (t)C 0 (t).

De (1.13) e (1.14) segue que


A(t)(t) + b(t) = A(t)(t) + (t)C 0 (t) b(t) = (t)C 0 (t) C 0 (t) = 1 (t)b(t).
Assim
C(t) =

1 (s)b(s)ds + k,

t0

(1.14)

onde k e um vetor constante arbitr


ario. Podemos determin
a-lo utilizando a condica
o inicial C(t 0 ) =
1 (t0 )x0 . Deste modo
Z t
1 (s)b(s)ds,
C(t) = 1 (t0 )x0 +
t0

e portanto



Z t
(t) = (t)C(t) = (t) 1 (t0 )x0 +
1 (s)b(s)ds .
t0

Observemos que para a caso homogeneo,


x0 = A(t)x,
a soluca
o e dada por
(t) = (t)1 (t0 )x0 .
Exemplo 1.2.5 Ache a soluca
o da equaca
o
x0 = A(t)x,
com
x=

x1
x2

e A=

0
k 2

1
0

Solu
c
ao: Uma matriz fundamental para esta equaca
o e dada por (na pr
oxima seca
o veremos como
encontr
a-la):


sen kt cos kt
.
(t) =
k cos kt k sen kt
Efetuando os c
alculos, temos que 1 (t) e dada por

sen kt
1 (t) =
cos kt

1
k
1
k

cos kt
sen kt

Vimos que a soluca


o e dada por
(t) = (t)1 (t0 )x0 .
Assim temos que

onde x01 e x02

x01 cos k(t t0 ) + x02 (1/k) senk(t t0 )


(t) =
x01 k senk(t t0 ) + x02 cos k(t t0 )


x0 1
.
s
ao as componentes do vetor x0 , isto e, x0 =
x0 2

Um problema importante e o caso associado com o sistema adjunto ao sistema (1.7). Definimos
o sistema adjunto como sendo o sistema
y 0 = [A(t)]t y.
Seja (t) uma matriz fundamental para a equaca
o (1.7). Segue de (1.10) que [ 1 (t)]t e uma
matriz fundamental do sistema adjunto. Se A(t) = [A(t)]t , o sistema e chamado auto-adjunto.
Neste caso [1 (t)]t = (t).
10

1.3

Sistemas Aut
onomos

Estudaremos equaco
es da forma

x0 = Ax + b(t),

(1.15)

onde A e uma matriz n n constante.


Consideremos primeiro o caso homogeneo
x0 = Ax.

(1.16)

Seja (t) a matriz fundamental da equaca


o (1.16), com (0) = Id .
Proposi
c
ao 1.3.1 (a) 0 (t) = A(t), (0) = Id ;
(b) (t + s) = (t)(s), t, s R;
(c) 1 (t) = (t);
(d) a serie

k k
X
t A
k!

(1.17)

k=0

converge para (t) em R, uniformemente em cada intervalo compacto.


Demonstra
c
ao: (a) Como (t) e a matriz fundamental,
0 (t) = A(t), (0) = Id .
(b) Fixemos s. Consideremos a equaca
o matricial
X 0 = AX,

(1.18)

e as matrizes
(t) = (t + s), (t) = (t)(s).
Para a primeira matriz, temos
0 (t) = 0 (t + s) = A(t + s) = A(t).
Logo (t) e a soluca
o da equaca
o (1.18), com X(0) = (s). Para a segunda matriz, temos
0 (t) = [(t)(s)]0 = (t)0 (s) = A(t).
Logo (t) tambem e soluca
o da equaca
o (1.18), com X(0) = (s). Porem, pelo Teorema 1.1.8 a
soluca
o e u
nica. Da (t) = (t), ou seja,
(t + s) = (t)(s).
(c) Do item anterior, temos,
(t + s) = (t)(s) t, s R.
Pondo s = t, temos
(t t) = (t)(t) Id = (t)(t) 1 (t) = (t).
11

(d) Consideremos a sequencia de aplicaco


es k dadas por

0 (t) = Id
Rt
k+1 (t) = Id + 0 Ak (s)ds.

Temos que

1 (t)
2 (t)
3 (t)

= Id +
= Id +
= Id +

A0 (s)ds = Id +
0
t

A1 (s)ds = Id +
0
t

A2 (s)ds = Id +
0

t3
t2
= Id + tA + A2 + A3 .
2!
3!

Ads = Id + tA,
0
t

A(Id + sA)ds = Id + tA +
0
t

A(Id + sA +
0

t2 2
A ,
2!

s2 2
A )ds
2!

Tomemos por hip


otese de induca
o que
k1 (t) = Id +

t
0

Logo

k (t) = Id +
= Id +

k2
X
j=0

Ak1 ds = Id +
0
t
0

k1

X sj Aj
s A
ds =
.
j!
j!
j=0
j

0
2

k1
X
j=0

sj Aj
ds
j!

s A
sk1 Ak1
A Id + sA +
+... +
2!
(k 1)!

= Id + tA +

X tj A j
t2 2
tk
A + . . . + Ak =
.
2!
k!
j!
j=0

ds

Portanto, por induca


o temos
k (t) =

k
X
tj A j
j=0

j!

Procedendo como na demonstraca


o do Teorema 1.1.8, agora para a equaca
o linear homogenea
X 0 = AX,

X(0) = Id ,

temos que a sequencia k converge uniformemente para a soluca


o da equaca
o acima, em cada intervalo compacto. Assim a serie (1.17) converge para (t) em R, uniformemente em cada intervalo
compacto.
Observemos que a aplicaca
o t (t) tem propriedades an
alogas a
` funca
o exponencial. Definimos a exponencial da matriz A como sendo a matriz eA definida por (1). Assim
A

e =

X
Aj
j=0

Logo, podemos reescrever a Proposica


o 1.3.1.
12

j!

d tA
(e ) = AetA e e0A = Id ;
dt

Proposi
c
ao 1.3.2 (a)
(b) e(t+s)A = etA esA ;
(c) (etA )1 = etA ;
(d) etA =

k=0

tk A k
k! ,

sendo a convergencia da serie uniforme em cada intervalo compacto.

Consequentemente a soluca
o da equaca
o (1.16) e dada por
(t) = etA et0 A x0 .
E voltando ao caso n
ao-homogeneo, com base no Teorema 1.2.4, a soluca
o da equaca
o (1.15) e
dada por


Z t
sA
t0 A
tA
e
b(s)ds .
e
x0 +
(t) = e
t0

Na pr
oxima seca
o trabalharemos com a condica
o inicial x(0) = x 0 . Neste caso as soluco
es acima
tornam-se
(t) = etA para o caso homogeneo,
h
i
Rt
ao-homogeneo.
(t) = etA x0 + 0 esA b(s)ds , para o caso n

Exemplo 1.3.3 Calcule etA , com

A=

0 1
1 0

Solu
c
ao: Efetuando os c
alculos, obtemos
A

2k

e
A

2k1

Portanto
etA

X
A k tk

k=0

k!

k=0

X
A2k t2k
k=0

(1)k t2k
(2k)!

0
(1)k t2k
(2k)!

k=0
=

P
(1)k t2k1

k=1

(2k)!

(2k1)!

cos t
sen t

sen t
cos t

(1) t
(2k)!

k=0

0
(1)k

(1)k+1
0

(2k 1)!

(1)k+1 t2k1
(2k1)!

k=1

0
(1)k

k=1

k 2k

k=0

(1)k
0

X
A2k1 t2k1

(1)k t2k
(2k)!

13

k=1

k=1
(1)k t2k1
(2k1)!

(1)k+1 t2k1
(2k1)!

Lema 1.3.4 Seja A uma matriz n n constante. Se e um auto-valor de A e v e um auto-vetor


correspondente, ent
ao (t) = et v e uma soluca
o da equaca
o
x0 = Ax.
Demonstra
c
ao: Temos Av = v. Logo
0 (t) = et v = vet = Avet = A(t).

Proposi
c
ao 1.3.5 Seja A uma matriz n n constante. Se A tem auto-valores 1 , 2 , . . . , n e
v1 , v2 , . . . , vn s
ao auto-vetores linearmente independentes, com Avi = i vi , ent
ao a matriz V (t),
cuja i-esima coluna, i = 1, 2, . . . , n, e i (t) = ei t vi , e uma matriz fundamental da equaca
o
x0 = Ax.
Em particular etA = V (t)V 1 (0).
Demonstra
c
ao: Como os auto-valores vi s
ao linearmente independentes, o resultado e imediato do
Lema (1.3.4). A particularidade
etA = V (t)V 1 (0),
segue da unicidade da soluca
o da equaca
o
X 0 = AX,

com X(0) = Id .

Quando os auto-valores da matriz A (real) s


ao complexos conjugados, teremos uma soluca
o complexa para a equaca
o (1.16). Mas podemos express
a-la como soluca
o real. Sejam = + i um
auto-valor e v = v1 + iv2 um auto-vetor correspondente; assim = i tambem e um auto-valor
com auto-vetor correspondente v = v1 iv2 , pois Av = v Av = v Av = v.
ao soluco
es linearmente independentes da
Pela Proposica
o (1.3.5), (t) = et v e (t) = et v s
equaca
o (1.16). Deste modo
1 (t) =

1
[(t) + (t)]
2

2 (t) =

1
[(t) (t)]
2i

s
ao soluco
es reais de (1.16), com 1 (0) = v1 , 2 (0) = v2 . Veja:
01 (t) =

1 0
1
1
[ (t) + 0 (t)] = [A(t) + A(t)] = A [(t) + (t)] = A1 (t),
2
2
2

1
1
1 0
[ (t) 0 (t)] = [A(t) A(t)] = A [(t) (t)] = A2 (t),
2i
2i
2i
1
1
1
1 (0) = [(0) + (0)] = [v + v] = [2v1 ] = v1 ,
2
2
2
1
1
1
2 (0) = [(0) (0)] = [v v] = [2iv2 ] = v2 .
2i
2i
2i
Os vetores v1 e v2 s
ao linearmente independentes, pois, caso contr
ario teramos v2 = cv1 e assim
v = v1 + iv2 = v1 + icv1 = (1 + ic)v1 e v = v1 iv2 = v1 icv1 = (1 ic)v1 resultariam linearmente
dependentes, o que n
ao e verdade. Ent
ao as soluco
es 1 (t) e 2 (t) s
ao linearmente independentes.
Agora,
(t) = e(+i)t v = et (cos t + i sen t)(v1 + iv2 ),
02 (t) =

14

e
(t) = e(i)t v = et (cos t i sen t)(v1 iv2 ).
Logo
1 (t)

1
1
[(t) + (t)] = [et (2v1 cos t 2v2 sen t)].
2
2
= et [(v1 cos t v2 sen t)],

1
1
[(t) (t)] = [et (2iv1 sen t + 2iv2 cos t)]
2i
2i
= et [(v1 sen t + v2 cos t)].

2 (t) =

Exemplo 1.3.6 Encontre uma matriz fundamental para a equaca


o
x0 = Ax,
com
x=

x1
x2

e A=

0
k 2

1
0

Solu
c
ao: Temos que ik e ik s
ao auto-valores de A e

 



i
0
1
v=
=
+i
= v1 + iv2
k
k
0
e um auto-vetor correspondente ao auto-valor ik. Portanto
1 (t) = et (v1 cos t v2 sen t)




0
1
=
cos kt
sen kt
k
0


sen kt
,
=
k cos kt
e
2 (t) = et (v1 sen t + v2 cos t)




0
1
=
sen kt +
cos kt
k
0


cos kt
=
.
k sen kt
Consequentemente uma matriz fundamental para a equaca
o dada e


sen kt
cos kt
.
(t) =
k cos kt k sen kt
Agora considerando a equaca
o n
ao-homogenea (1.15), devemos ressaltar que o Teorema 1.2.4,
naturalmente, tambem e v
alido para sistemas aut
onomos; tanto e que j
a o usamos na soluca
o do
Exemplo (1.2.5).
15

16

Captulo 2

Controlabilidade
Neste captulo vamos introduzir as noco
es b
asicas de controle de sistemas lineares. Para isto vamos
estudar a controlabilidade a
` origem e as propriedades do conjunto de estados control
aveis. Vamos
introduzir a matriz de controlabilidade e algumas propriedades desta que, em conjunto com outras
condico
es, caracterizam a controlabilidade do sistema linear.
Tambem ser
a objeto de estudo neste captulo as propriedades do conjunto dos estados atingveis
do sistema.

2.1

Controlabilidade Para Sistemas Lineares

Estudaremos sistemas aut


onomos da forma
x0 = Ax + Bu,

(2.1)

onde A Rnn e B Rnm s


ao matrizes constantes. Denominamos o vetor x (n-dimensional) de
vetor estado e u (m-dimensional) de vari
avel de controle.
Consideraremos primeiramente controlabilidade a
` origem; desta forma, o alvo e x = 0. Por
trabalharmos com sistemas aut
onomos, podemos escolher o tempo inicial como sendo zero. Assim,
o estado inicial e dado por
x(0) = x0 .
(2.2)
As vari
aveis de controle s
ao funco
es de t, integr
aveis. Atribuiremos classes aos diferentes tipos
de vari
aveis de controle; se as funco
es s
ao ilimitadas, dizemos que u U u ; se s
ao limitadas, isto e,
se |ui (t)| 1, i = 1, 2, . . . , m, dizemos que u Ub . Quando |ui (t)| = 1, i = 1, 2, . . . , m, dizemos
que u Ubb . Desta forma
Ubb Ub Uu ,
onde Ubb , Ub e Uu s
ao os conjuntos de controle.
Definimos o conjunto control
avel no tempo t1 como sendo o conjunto de estados iniciais x0
que podem ser levados a
` origem no tempo t1 usando um controle admissvel, isto e, um controle
pertencente ao conjunto de controle escolhido. Denotaremos o conjunto definido acima por C(t 1 ),
mas, podemos ser ainda mais exatos, denotando tal conjunto por C(t1 , u, 0), onde t1 e o tempo e
u U e o controle usado, e 0 (zero) e o alvo.
Definimos o conjunto control
avel C como sendo o conjunto de pontos que podem ser levados a
`
17

origem em qualquer tempo finito, ou seja,


C=

t1 0

C(t1 ).

Temos que C Rn , porem e desej


avel que C = Rn . Quando isto ocorre todos os estados iniciais s
ao
control
aveis a
` origem e dizemos que o sistema e completamente control
avel.
Proposi
c
ao 2.1.1 Se x0 C e se y e um ponto na trajet
oria de x0 a
` 0, ent
ao y C.
Demonstra
c
ao: Suponhamos que x(t) seja a trajet
oria, com controle u(t). Por hip
otese x 0 C,
assim x(t1 ) = 0, para algum t1 0. Tambem por hip
otese, y e um ponto na trajet
oria de x0 a
` 0,
ent
ao para algum tempo , x( ) = y.
Tomemos o controle v(t) = u(t + ) (para comecarmos a partir de y, ou seja, mudamos a origem).
Ent
ao com x(0) = y, seguimos a mesma trajet
oria de x0 e alcancamos a origem no tempo t1 .
Deste modo y C(t1 ) e portanto y C.
Com este resultado podemos afirmar que toda trajet
oria de x0 a
` 0 fica totalmente no conjunto
control
avel.

C
X0

Figura 2.1: Ilustraca


o referente a
` Proposica
o 2.1.1

Apresentaremos a seguir, algumas definico


es necess
arias para pr
oximas demonstraco
es.
Defini
c
ao 2.1.2 Um caminho num espaco metrico X e uma aplicaca
o contnua : I X onde
I = [0, 1] R. Os pontos x1 = (0) e x2 = (1) s
ao chamados respectivamente, de ponto inicial e
ponto final do caminho . Dizemos tambem que e um caminho ligando os pontos x1 e x2 .
Defini
c
ao 2.1.3 (Conexidade por Caminhos) Um espaco metrico X e conexo por
caminhos, se para todo x1 , x2 X existe um caminho ligando x1 e x2 .
Proposi
c
ao 2.1.4 C e conexo por caminhos.
18

Demonstra
c
ao: Sejam x0 , y0 C. Pela Proposica
o 2.1.1, existe um caminho de cada ponto a
`
origem que fica totalmente em C. Assim existe um caminho em C conectando x0 e y0 . De maneira
an
aloga se mostra que C(t1 ) e conexo por caminhos. Portanto podemos observar que C n
ao e composto de um n
umero de partes disjuntas.

C
X0

Figura 2.2: Ilustraca


o referente a
` Proposica
o 2.1.4

Proposi
c
ao 2.1.5 Se t1 < t2 , ent
ao C(t1 ) C(t2 ).
Demonstra
c
ao: Seja x0 um ponto qualquer de C(t1 ), com controle u(t). Consideremos o controle
v definido por

u(t) para 0 t t1 ,
v(t) =
0
para t1 < t t2 .
Apliquemos este controle em x0 . Ent
ao

x(t1 ) = 0
x0 = Ax

pois x0 C(t1 ),
para t1 < t t2 .

Logo x(t) = 0 para t1 < t t2 . Claramente o controle v e integr


avel e assim e admissvel. Desta
forma x0 e um ponto de C(t2 ) e assim mostramos que o conjunto control
avel em qualquer tempo
contem o conjunto control
avel em todos os tempos anteriores.
Obviamente 0 pertence a C(0). Logo 0 C(t1 ) para qualquer t1 0 e ent
ao 0 C.
Proposi
c
ao 2.1.6 C e aberto, se e somente se, 0 int C.1
Demonstra
c
ao:[] Vimos que 0 C. Mas quando C e aberto, temos que C = int C. Logo 0 int
C.
[] Se 0 int C, ent
ao existe uma bola B(0, r) C. Seja u o controle que leva um ponto arbitr
ario
x0 a
` 0 no tempo t1 . Seja y(t) a soluca
o com y(0) = y0 , onde y0 B(x0 , r0 ). Pela continuidade da
1 int

C denota o interior de C

19

soluca
o do PVI, y(t1 ) = y1 B(0, r) para r0 suficientemente pequeno. Como B(0, r) C, podemos
encontrar um controle u
que leva y1 a
` 0 no tempo t2 . Tomemos o controle v definido por

u(t)
para 0 t t1 ,
v(t) =
u
(t t1 ) para t1 < t t2 .
Logo usando este controle, e possvel levar y0 a
` 0 no tempo t1 + t2 . Deste modo y0 C(t1 + t2 ) e
B(x0 , r0 ) C, x0 C. Portanto C e aberto se 0 int C.

C
( t1 )

r0
X0

( t1 )

Y0

0
( t2 )

Figura 2.3: Ilustraca


o referente a
` Proposica
o 2.1.6

As equaco
es estado para o sistema linear aut
onomo s
ao dadas conforme j
a vimos por x 0 =
Ax + Bu, da seca
o anterior temos que a soluca
o e dada por
x(t) = e

tA

x0 +

sA

Bu(s)ds .

(2.3)

Temos que x0 C(t1 ) se e somente se existe um controle u U, tal que x(t1 ) = 0, ou seja,
0=e

t1 A

x0 +

t1

sA

Bu(s)ds ,

e como a funca
o exponencial nunca se anula,
x0 =

t1

esA Bu(s)ds.

(2.4)

Precisamos agora saber sob que condico


es o sistema e completamente control
avel, isto e, C R n .
Os conjuntos de controle que usaremos s
ao integr
aveis, com ou sem limite, ou seja, U pode ser U u
ou Ub . Provaremos agora alguns resultados sobre o conjunto control
avel. Adimitimos que o conjunto
de controles admissveis U e convexo
Proposi
c
ao 2.1.7 C(t1 ) e simetrico e convexo.
20

Demonstra
c
ao: Primeiro provemos que C(t1 ) e simetrico. Seja x0 C(t1 ) com controle u(t). Da
equaca
o (2.4), segue que x0 C(t1 ) com controle u(t), e assim C(t1 ) e simetrico.
Agora provemos a convexidade. Temos que o conjunto U e convexo:
cu1 + (1 c)u2 U, para 0 c 1, u1 , u2 U.
Suponhamos que os controles u1 e u2 levam os pontos x1 e x2 a
` origem no tempo t1 , respectivamente.
De (2.4), segue que
Z t1
Z t1
sA
x1 =
e
Bu1 (s)ds e x2 =
esA Bu2 (s)ds.
0

Temos que
cx1 + (1 c)x2

Z t1
Z t1
= c
esA Bu1 (s)ds (1 c)
esA Bu2 (s)ds
0
0
Z t1
esA B[cu1 (s) + (1 c)u2 ]ds, para 0 c 1.
=
0

Logo cx1 + (1 c)x2 C(t1 ) e portanto C(t1 ) e convexo.


Proposi
c
ao 2.1.8 C e simetrico e convexo.
Demonstra
c
ao: Lembremos que C = t1 0 C(t1 ). A simetria e o
bvia. Provemos que C e convexo.
Sejam x1 C(t1 ) e x2 C(t2 ) com t1 < t2 . Desde que t1 < t2 , C(t1 ) C(t2 ), e da segue que
x1 C(t2 ). Pela Proposica
o 2.1.7 C(t2 ) e convexo, ent
ao
cx1 + (1 c)x2 C(t2 ),

para 0 c 1.

Mas C(t2 ) C. Logo C e convexo.

Exemplo 2.1.9 Consideremos um sistema inst


avel com dois componentes, isto e, qualquer desvio
da origem, se o sistema for incontrol
avel, levar
a a um estado de desequilbrio. Para um sistema
control
avel com estas caractersticas, podemos considerar as equaco
es estado
 0
x1 = x 1 + u 1
x02 = x2 + u1
e u1 Ub , ou seja, |u1 | 1. Encontre C(t1 ) e C.
Solu
c
ao: O sistema dado e equivalente a
x0 = Ax + Bu,




 
1 0
x1
1
,A=
eB=
com x =
. De (2.4) segue que x C(t1 ) se
x2
0 1
1
(x1 , x2 )t =
Mas
eId s =

X
(s)k (Id )k
k=0

k!

t1

eId s Bu1 ds.

= Id

X
(s)k
k=0

21

k!

= Id es .

Logo
x1 = x 2 =

t1

es u1 ds.

Agora, como |u1 | 1 temos


|x1 | =

t1

t1

e
0

Z

u1 ds

t1
0

|es ||u1 |ds

es ds = et1 + 1.

Assim
C(t1 ) = {x1 = x2 : |x1 | 1 et1 },
e
C = {x1 = x2 : |x1 | < 1}.

Observemos que, como parte do R2 , int C=. Da segue que C n


ao e aberto (Proposica
o 2.1.6).
Com C = {x1 = x2 : |x1 | < 1} podemos concluir que para qualquer estado inicial fora do intervalo
1 < x1 < 1, o sistema e incontrol
avel. Porem a origem pertence a este intervalo e o sistema e
control
avel a. O sistema continua control
avel para qualquer desvio da origem menor que 1. Mas,
em geral, n
ao e possvel controlar os dois componentes simultaneamente com o mesmo controle. Isto
s
o e possvel se os desvios iniciais dos dois componentes forem iguais.
Geralmente s
ao necess
arias duas condico
es para o sistema ser completamente control
avel. O
conjunto control
avel deve ser n-dimensional e ilimitado, mesmo quando os controles pertencem a U b .

C(t )

-(1-et 1)

-1
1-e t1

Figura 2.4: Ilustraca


o referente ao Exemplo 2.1.9

22

2.2

A Matriz de Controlabilidade

Definimos a matriz de controlabilidade M, como sendo a matriz formada pela matriz B, n m,


e o seu produto com potencias da matriz A, n n, ou seja, a matriz
M = [B AB A2 B An1 B],
que tem n linhas e nm colunas.
Exemplo 2.2.1 Ache a matriz de controlabilidade para o sistema do exemplo anterior, onde




1
1 0
.
e B=
A=
1
0 1
Solu
c
ao: Temos que


1
1

M = [B AB] =

1 1
1 1

AB =
Logo

Provaremos agora, alguns resultados sobre a controlabilidade completa que dependem do posto
de M e dos auto-valores de A. Observemos por exemplo, que o posto da matriz de controlabilidade
no exemplo anterior e 1, e pelo Exemplo 2.1.9 existem pontos pr
oximos a
` origem que n
ao s
ao
control
aveis.
Proposi
c
ao 2.2.2 0 int C posto(M ) = n.
Demostra
c
ao:[] Temos que posto(M ) n. Suponhamos que posto(M ) < n. Ent
ao n
ao existem
n colunas de M linearmente independentes, e assim existe pelo menos um vetor y Rn , com k y k= 1,
que e ortogonal a todas as colunas de M . Deste modo y tambem e ortogonal a cada coluna de B e
a cada coluna de Ak B, k = 1, 2, ..., n 1, ou seja,
y t B = y t Ak B = 0, k = 1, 2, ..., n 1.
Pelo Teorema de Cayley-Hamilton (Ver [Lim]) concluimos que
y t Ak B = 0, k N.
Da seca
o anterior sabemos que
esA =

X
Ak (s)k
k=0

k!

isto e, esA e uma combinaca


o linear de Ak , onde k N. Portanto de (2.5) e (2.6), segue que
y t esA B = 0.
De (2.4), temos que x0 C(t1 ) se
x0 =

t1

esA Bu(s)ds.

23

(2.5)

(2.6)

Ent
ao, para todo x0 C(t1 )
y t x0 =

t1

y t esA Bu(s)ds = 0.

Consequentemente C(t1 ) fica num hiperplano com normal y, para todo t1 > 0. E o conjunto control
avel fica no mesmo hiperplano, e ent
ao qualquer bola B(0, r) 6 C, r.
Portanto
0 6 int C, o que contradiz a hip
otese. Logo posto(M ) = n.
[] Suponhamos que 0 6 int C. Como C(t1 ) C, t1 , temos que 0 6 int C(t1 ), o que implica que
0 fr2 C(t1 ). Como j
a vimos, C(t1 ) e convexo. Deste modo existe um hiperplano suporte a
` C(t1 )
passando por 0, para todo t1 . Seja b(t1 ) o normal a este hiperplano. Ent
ao bt x0 0, x0 C(t1 ).
De (2.4), temos que x0 C(t1 ) se
x0 =
Assim,

t1
0

t1

esA Bu(s)ds.

bt esA Bu(s)ds = bt x0 , x0 C(t1 ).

Mas u U u U. Portanto
Z t1
bt esA Bu(s)ds = bt x0 0, x0 C(t1 ).

(2.7)

(2.8)

Assim de (2.7) e (2.8) segue que

t1

bt esA Bu(s)ds = 0,

o que implica que


bt esA B = 0, para 0 s t1 .

(2.9)

Como (2.9) e v
alida para qualquer s [0, t1 ], tomemos s = 0. Assim
bt B = 0.
Derivando (2.9) k vezes e tomando sempre s = 0, obtemos
bt Ak B = 0.
Logo b e ortogonal a todas as colunas de M , e assim posto(M ) < n, contradizendo a hip
otese.
Portanto 0 int C.
Com este resultado temos uma relaca
o entre o posto da matriz de controlabilidade com a origem,
e consequentemente (de acordo com a Proposica
o 2.1.6) com o conjunto ser aberto ou n
ao. Se o
posto de M e menor que n, o sistema n
ao e completamente control
avel. Porem, se o posto de M e
igual a n, o sistema pode ou n
ao ser completamente control
avel, dependendo agora do conjunto de
controle.
Proposi
c
ao 2.2.3 Se posto(M ) = n, e u Uu , ent
ao C = Rn .
2 fronteira

de C(t1 )

24

Demonstra
c
ao: Por hip
otese posto(M ) = n. Logo, pela proposica
o anterior, 0 int C. Ent
ao
existe uma bola B(0, r) C, para algum r > 0. Seja x0 Rn um ponto arbitr
ario. Consideremos
y0 = cx0 , com c = 12 r kx10 k . Temos que k y0 k=k cx0 k= c k x0 k= 21 r. Logo y0 B(0, r), e assim e
control
avel com um controle v pertencente a Uu . Portanto
Z t1
y0 =
esA Bv(s)ds.
0

Ent
ao
cx0 =

t1

esA Bv(s)ds x0 =

t1

esA B

v(s)
ds =
c

t1

esA Bu(s)ds,

onde

v(s)
Uu .
c
Deste modo x0 e control
avel, e como x0 foi tomado arbitrariamente temos que C = Rn . De maneira
an
aloga podemos mostrar que C(t1 ) = Rn , t1 > 0.
u(s) =

A partir de agora consideraremos apenas o conjunto Ub como sendo o conjunto de controle.


Proposi
c
ao 2.2.4 Se posto(M ) = n, e Re(i ) < 03 para cada auto valor i de A, ent
ao C = Rn .
Demonstra
c
ao: Suponhamos a princpio que A e diagonaliz
avel. Seja x0 Rn um ponto arbitr
ario.
Consideremos a equaca
o
x0 = Ax,
(2.10)
e facamos a transformaca
o x = P y, onde P e a matriz formada pelos auto-vetores linearmente
independentes correspondentes aos auto-valores i de A. De x = P y, temos
x0 = P y 0

(2.11)

Assim, das equaco


es (2.10) e (2.11) segue que
P y 0 = Ax = AP y y 0 = P 1 AP y = Dy,
onde D e a matriz

D=

1
0
..
.

0
2
..
.

...
...
..
.

0
0
..
.

. . . n

A soluca
o da equaca
o diferencial acima e dada por

y(t) = eDt y0 ,
onde y0 = P 1 x0 . Determinemos eDt . Temos que
k
1 0
0 k2

Dk = .
..
..
.
0

3 Re(

i)

representa a parte real de i

25

...
...
..
.

0
0
..
.

. . . kn

logo,

eDt =

X
D k tk
k=0

k!

k
k
1t
k!

k=0

k=0

..
.
0
e 1 t
0
..
.

e 2 t
..
.

...

...

..
.

..

..
.

...

k
k
2t

k!

...
...
..
.

0
0
..
.

. . . e n t

k=0

k
k
nt
k!

(2.12)

Desde que Re(i ) < 0, temos que ei t 0 e assim k y(t) k 0 quando t . De x = P y segue
que k x(t) k=k P y(t) kk P kk y(t) k 0, ou seja, k x(t1 ) k< para algum t1 > 0 e > 0 e tomado
arbitrariamente pequeno. Por hip
otese posto(M ) = n, ent
ao pela Proposica
o 2.2.2 0 int C. Assim
existe uma bola B(0, ) C. Como k x(t1 ) k< , x(t1 ) pode ser levado a
` 0 em algum tempo t2 por
um controle u
, digamos, pertencente a Ub . Consideremos o controle v definido por

0 para 0 t t1 ,
v(t) =
u
para t1 < t t2 .
Usando o controle v, podemos levar x0 a
` 0 em algum tempo t1 + t2 . Portanto
x0 C(t1 + t2 ) C. Como x0 era um ponto arbitr
ario em Rn , temos que C = Rn . Se A n
ao e
diagonaliz
avel, a matriz D ter
a alguns elementos n
ao nulos acima da diagonal principal. Contudo,
ainda e verdade que k y(t) k 0 e assim este detalhe n
ao invalida a demonstraca
o apresentada.
Em alguns casos onde temos auto-valores imagin
arios puros o resultado anterior n
ao e aplic
avel.
Contudo, podemos provar um resultado similar para estes casos.
Proposi
c
ao 2.2.5 Se posto(M ) = n, e Re(i ) 0 para cada auto-valor i de A, ent
ao C = Rn .
Demonstra
c
ao: Suponha por absurdo que C 6= Rn e que y 6 C. Deste modo existe um hiperplano
com normal b separando y e C, tal que
bt x0 p, x0 C e bt y > p.
Se mostramos que
b t x0 =

t1

bt esA Bu(s)ds > p

para t1 suficientemente grande e para algum controle u Ub , teremos uma contradica


o. A igualdade
acima segue diretamente de (2.4). Ent
ao vamos definir z t (s) = bt esA B, assim z(t) 6= 0 para
0 t t1 . Escolhendo ui (t) = sgn zi (t) temos
Z t1
|z(t)|dt.
b t x0 =
0

Cada componente de z e uma combinaca


o de termos da forma q(t)ei t , onde q e um polin
omio e
i e um auto-valor de A.
26

Consideremos, a princpio, os auto-valores com parte real negativa. Assim q(t)e i t quando
t . Os termos correspondentes aos auto-valores com parte real nula s
ao polin
omios em t ou s
ao
termos peri
odicos em t. Tanto os termos polinomiais como os termos peri
o
dicos
d
a
o
uma
contribui
c
a
o
Rt
positiva a
` integral acima num intervalo n
ao nulo. Portanto bt x0 = 0 1 |z(t)|dt e arbitrariamente
grande para t1 suficientemente grande. Logo obtemos a contradica
o requerida e C = R n .
Como j
a vimos, se posto(M ) < n o sistema n
ao e totalmente control
avel, ou seja, C 6= R n . Mas
mesmo com posto(M ) = n o sistema ainda pode n
ao ser totalmente control
avel.
Proposi
c
ao 2.2.6 Se posto(M ) = n, e A tem um auto-valor com parte real positiva, ent
ao C 6= R n .
Demonstra
c
ao: Sejam um auto-valor de A com Re() > 0 e y um auto-vetor a
` esquerda
correspondente.
Ent
ao temos
y t A = y t .
Observemos que
y t AA = y t A y t A2 = y t y t A2 = 2 y t .
Suponhamos por induca
o que
y t Ak1 = k1 y t .
Mas
y t Ak1 A = k1 y t A y t Ak = k1 y t y t Ak = k y t .
Logo provamos que
y t Ak = k y t .

(2.13)

Das equaco
es (2.6) e (2.13) segue que
y t esA

= yt
=
=
=
=
=

k!

k=0


A2 s2
A3 s3
y Id As +

+ ...
2!
3!
y t A3 s3
y t A2 s2

+ ...
y t Id y t As +
2!
3!
2 y t s 2
3 y t s 3
y t y t s +

+ ...
2!
3! 

2 s 2
3 s 3
1 s +

+ ... y t
2!
3!
!

X
k (s)k
yt
k!
t

= e
Deste modo

X
Ak (s)k

k=0
s t

y.

y t esA = es y t .

Seja x0 C. Logo x0 C(t1 ), para algum t1 > 0. Assim


x0 =

t1

esA Bu(s)ds,

27

(2.14)

e da equaca
o (2.14) segue que
t

y x0 =

t1

t sA

ye
0

Bu(s)ds =

t1

es y t Bu(s)ds.

(2.15)

Quando t1 , es 0 pois Re() > 0, e assim es e limitado. Desde que y t B e um termo


constante e u(s) pertence ao conjunto Ub (u(s) e limitado), temos que es y t Bu(s) e limitado, o que
implica que
Z
t1

es y t Bu(s)ds < p, para algum p.

De (2.15) segue que


y t x0 < p,
e assim existe um hiperplano separando C e com normal y, e o conjunto control
avel fica em um dos
semi-espacos definidos pelo hiperplano. Portanto C 6= Rn .
Exemplo 2.2.7 Verifique a controlabilidade do sistema x0 = Ax + Bu com:




0 1
1 1
(a)A =
, B=
;
0 1
0 0
(b)A =

0 0
1 1

, B=

1 1
0 0


p 1 0
q
(c)A = 0 p 1 , B = r , onde p, q, r e s s
ao n
umeros reais.
0 0 p
s
Solu
c
ao: (a) Temos que

M = [B AB] =



1 1
0 0

 



0 1
0 1

1 1
0 0



1 1 0 0
0 0 0 0

Neste caso posto(M ) = 1 6= n = 2. Assim o sistema n


ao e completamente control
avel.
(b) Temos que

M = [B AB] =



1 1
0 0

 

0 0
1 1



1 1
0 0



1 1 0 0
0 0 1 1

Neste caso posto(M ) = 2 = n. Logo se u Uu , o sistema e completamente control


avel. Agora se
u Ub , devemos analisar os auto-valores de A. Temos que 0 e 1 s
ao os auto-valores de A. Como
Re(1) > 0, o sistema n
ao e completamente control
avel.
(c) Temos que



q
p 1 0
p 1 0
q
p 1 0
q
r
0 p 1
r 0 p 1
M = [B AB AB 2 ] = r 0 p 1
s
0 0 p
0 0 p
s
0 0 p
s

28


q pq + r p2 q + 2pr + s
p2 r + 2ps .
= r pr + s
s
ps
p2 s

Neste caso posto(M ) = 3 = n. Portanto se u Uu , o sistema e completamente control


avel. Porem
se u Ub e Re(p) 0 (note que p e o u
nico auto-valor de A) o sistema e completamente control
avel.

2.3

Conjunto dos Estados Atingveis

Ate ent
ao consideramos controlabilidade a
` origem. Mas, de maneira semelhante, podemos definir
a controlabilidade a um ponto x1 . Definimos C(t1 , x1 ) como sendo o conjunto dos pontos control
aveis
a x1 no tempo t1 . Temos que x0 C(t1 , x1 ) se e somente se existe controle u U, tal que x(t1 ) = x1 ,
ou seja,


Z t1
esA Bu(s)ds .
x1 = e t1 A x0 +
0

Logo,
x0 = e

t1 A

x1

t1

esA Bu(s)ds.

(2.16)

O resultado acima segue diretamente de (2.3). Muitos resultados que provamos anteriormente
para C(t1 ) tambem s
ao v
alidos para C(t1 , x1 ), por exemplo a convexidade. Por outro lado alguns
ao podemos
resultados n
ao s
ao v
alidos, por exemplo se n
ao existe controle u tal que Ax 1 + Bu = 0 n
afirmar que C(t1 , x1 ) C(t2 , x1 ) para t2 > t1 .
Agora vamos definir o conjunto dos estados atingveis. Definimos R(t1 , x0 ) como sendo o
conjunto dos pontos que s
ao atingveis a partir de um ponto inicial x0 no tempo t1 . De (2.3) segue
que x1 R(t1 , x0 ) se


Z t1
x1 = e t1 A x0 +
esA Bu(s)ds ,
(2.17)
0

para algum u U.
Podemos observar claramente uma reciprocidade entre os dois conjuntos: x1 R(t1 , x0 ), ent
ao
x0 C(t1 , x1 ). Tambem, podemos definir o sistema tempo-inverso. Definimos este sistema como
sendo o sistema com a seguinte equaca
o estado
x0 = Ax Bu.

(2.18)

Agora determinemos quando x0 pertence aos conjuntos C(t1 , x0 ) e R(t1 , x0 ) para o sistema tempoinverso. Da seca
o anterior, temos que a soluca
o de (2.18) e dada por
x(t) = e

tA

x0

Logo, x0 C(t1 , x1 ) se
x0 = e t1 A x1 +
e x1 R(t1 , x0 ) se
x1 = e

t1 A

x0

sA

t1

Bu(s)ds .

esA Bu(s)ds,

(2.19)

t1

e
0

29

sA

Bu(s)ds .

(2.20)

Existe uma relaca


o entre o sistema tempo-inverso (2.18)
( e o original (2.1). Se fizermos a mudanca
= t1 se s = 0
. Assim,
de vari
avel s = t1 em (2.19), teremos ds = d e
= 0 se s = t1
x0

= e t1 A x1 +
= e

t1 A

0
t1

et1 A e A Bu(t1 )(d )

t1 A

x1 + e

Z
t1 A
= e
x1 +

t1

e A Bu(t1 )d

t1
A
e
Bu
( )d ,
0

(2.21)

onde pomos u
( ) = u(t1 ). Portanto comparando (2.17) e (2.21) podemos concluir que o conjunto
control
avel para o sistema tempo-inverso e igual ao conjunto dos estados atingveis para o sistema
original. Conseq
uentemente as propriedades gerais do conjunto control
avel tambem ser
ao v
alidas
para o conjunto dos estados atingveis.
Exemplo 2.3.1 Encontre o conjunto control
avel e o conjunto dos estados atingveis para o sistema
unidimensional

x0 = x + u;
1
x0 = , |u| 1.
2

1
Solu
c
ao: De (2.17) temos que x1 R(t1 , ) se
2


Z t1
1
t1
s
x1 = e
+
e u(s)ds
2
0
Z t1
1 t1
e + e t1
=
es u(s)ds.
2
0
Mas como |u| 1, temos



Z t1


x1 1 e t1 e t1
es ds


2
0

= et1 (et1 + 1) = et1 1.

Portanto
1 e t1 x 1
e assim,

1 t1
e et1 1,
2



1
1 t1 3 t1
R(t1 , ) = 1 e , e 1 .
2
2
2

De (2.20) temos que os pontos pertencentes ao conjunto dos estados atingveis para o sistema
tempo-inverso s
ao dados por


Z t1
1
t1
s

x1 = e
e u(s)ds
2
0
Z t1
1 t1
e
=
et1
es u(s)ds.
2
0
30

Considerando que |u| 1, temos




Z t1


x1 1 et1 et1
es ds


2
0

= et1 (et1 1) = 1 et1 .

Assim,
et1 1 x1

1 t1
e
1 et1 ,
2

e o conjunto procurado e o intervalo fechado




3 t1
1 t1
1, 1 e
e
,
2
2
1
ao.
que pelo que vimos anteriormente e o conjunto control
avel ao ponto para o sistema em quest
2
1
Notemos que todos os pontos em R s
ao atingveis por num tempo finito, mas somente os pontos no
2
1
intervalo (1, 1) s
ao control
aveis a (isto pode se facilmente observado tomando t1 arbitrariamente
2
grande).

10
8
6
4
2
1

0.5

1.5

-2

Figura 2.5: A linha vertical representa o conjunto R(t1 , 1/2)

Proposi
c
ao 2.3.2 Os conjuntos dos estados atingveis e control
avel s
ao contnuos em t 1 .
Demonstra
c
ao: Para mostrar que isto e uma propriedade geral, vamos considerar, por simplicidade,
que o conjunto dos estados atingveis pela origem com controles limitados, o qual denotaremos por
R(t). Logo de (2.19) segue que x R(t) quando
x=

esA Bu(s)ds.

Mostremos que R(t1 ) e contnua, ou seja, se dado  > 0, () > 0 tal que |t2 t1 | < (),
ent
ao dH (R(t2 ), R(t1 )) < , que e equivalente a
` max(H12 , H21 ) <  para t2 (t1 , t1 + ), onde
H12 = sup {d(y, R(t1 ))}yR(t2 ) e H21 = sup {d(x, R(t2 ))}xR(t1 ) .
31

0.75
0.5
0.25
1

0.5

1.5

-0.25
-0.5
-0.75

Figura 2.6: A linha vertical representa o conjunto C(t1 , 1/2)


Tomemos M = max k esA B kt1 ,t2 [0,T ] .
Seja x
R(t1 ) com controle u. Temos que mostrar que d(
x, R(t2 )) < .
Tomemos t3 = min(t1 , t2 ) e consideremos o controle v definido por
(
u(t), para 0 t t3 ,
v(t) =
u
(t), para t3 t T.
onde u
Ub .
Se
y =

t2

(2.22)

esA Bv(s)ds,

(2.23)

ent
ao y R(t2 ).
Suponhamos t3 = t1 e de (2.22) e (2.23) temos
Z t2

Z t1


sA
sA


d(
x, y) =k x
y k =
e Bv(s)ds
e Bu(s)ds
0
0
Z t1
Z
Z t2

esA Bv(s)ds
esA Bv(s)ds +
=
t1

t1

e
0

Da,

kx
y k =

t2
t3

Z

esA Bv(s)ds

t2
t3

sA



Bu(s)ds

k esA Bv(s)ds k

M |t2 t3 |.
Assim, se <


temos
M


= .
M
O caso t3 = t2 tambem se verifica analogamente. Logo, k x
y k< ,
x R(t1 ). Portanto,
d(
x, R(t2 )) <  e assim H21 < .
Da mesma forma, mostra-se que H12 < . Portanto, max{H12 , H21 } < .
kx
y k< M |t2 t3 | < M

32

Para a pr
oxima proposica
o precisamos das seguintes notaco
es e conceitos. Considere o espaco
vetorial de funco
es reais
L2 ([0, t1 ], R) := {f : [0, t1 ] R : f possui quadrado integr
avel}.
A este espaco associamos a norma usual, k . k2 , dada por
k f (t) k:=

Z

t1
0

|f (s)|2 ds

1/2

, f L2 ([0, t1 ], R).

conhecido que L2 ([0, t1 ], R) e um espaco de Hilbert e que bolas fechadas s


E
ao fracamente compactas.
Relembremos a noca
o de convergencia fraca para esse espaco. Diz-se que uma sequencia (f k )
L2 ([0, t1 ], R), k, converge fracamente a uma funca
o f L2 ([0, t1 ], R) se
Z

t1
0

v(s)f (s)ds

t1

v(s)f (s)ds,
0

v L2 ([0, t1 ], R).

Proposi
c
ao 2.3.3 O conjunto dos estados atingveis e compacto.
Demonstra
c
ao: De (2.17) temos que x1 R(t1 , x0 ) quando


Z t1
esA Bu(s)ds .
x1 = e t1 A x0 +

(2.24)

Assim, se considerarmos u Ub , claramente R(t1 , x0 ) e limitado. Agora temos que provar que
R(t1 , x0 ) e fechado. Para isto, devemos mostrar que toda sequencia convergente de pontos em
R(t1 , x0 ) possui limite em R(t1 , x0 ).
Seja


Z
(k)

x1

t1

= e t1 A x0 +

esA Bu(k) (s)ds

uma sequencia de pontos em R(t1 , x0 ), onde uk Ub e a sequencia de controles correspondentes.


Denotemos por i , i = 1, 2, . . . , m, a i-esima coluna de esA B. Ent
ao
"
Z t1
t #
Z t1
(k)
(k)
t1 A
(k)
x1 = e
x0 +
1 (s)u1 (s)ds + +
m (s)um (s)ds
,
(2.25)
0

onde

(k)
u1 (s)

..
.
u(k) (s) =
.

(k)
um (s)

(k)

Suponhamos que x1 x
1 , quando k , para algum x
1 R. Mostremos que x
1 R(t1 , x0 ),
isto e, x
1 e da forma (2.24), para algum u
Ub . A demonstraca
o deste fato estar
a concluida, uma
vez que mostrarmos que u
Ub tal que
Z t1
Z t1
(k )
i (s)ui j (s)ds
i (s)
ui (s)ds, i = 1, 2, . . . , m,
0

(kj )

para alguma subsequencia ui


Rn .

(k)

de ui , devido a (2.25) e a
` unicidade do limite de sequencias em

33

Estamos considerando u(k) Ub . Logo


(k)

k ui (t) k2 =

Z

t1
0

(k)

De (2.26) vemos que a sequencia ui

1/2 Z


(k) 2
(s)
ds

ui

t1

ds
0

1/2

= (t1 )1/2 .

(2.26)



(k )
e limitada em L2 [0, t1 ]. Portanto possui subsequencia ui j

fracamente convergente para algum u


i L2 [0, t1 ], isto e,
Z

t1
0

(k )
f (s)ui j (s)ds

t1

f L2 [0, t1 ].

f (s)
ui (s)ds,
0

(2.27)

Agora suponhamos que u


i > 1 num subconjunto H [0, t1 ] com medida h > 0. Seja
(
1 se s H,
f (s) =
0 se s 6 H.
Ent
ao

Mas,

Z
Z

t1
0

t1

f (s)
ui (s)ds =
0

(kj )

f (s)ui

(s)ds =

Z
Z

u
i ds > h.
H

(kj )

ui

ds h.

Portanto temos uma contradica


o. Se tomarmos ui < 1, analogamente teremos outra contradica
o.
Deste modo, 1 ui 1, ou seja, |ui | 1. Desde que os pontos no conjunto dos estados atingveis
s
ao definidos em termos de integrais da forma (2.26) para funco
es especficas f (t), o conjunto dos
estados atingveis e fechado e consequentemente e compacto.
No desenvolvimento da teoria n
ao fizemos restrico
es no n
umero de controles usados, isto e, na
dimens
ao do vetor u. Ocasionalmente, pode haver uma redund
ancia entre estes controles. Podemos
remover esta redund
ancia, sem perdermos algo de import
ancia pr
atica nas aplicaco
es da teoria.

2.4

Controles Redundantes

Na equaca
o (2.1) vemos que os controles s
ao dados pelo termo Bu, onde B e uma matriz
n m e u e um vetor m-dimensional. A soluca
o desta equaca
o por um dado ponto inicial e u
nica.
Deste modo, se a matriz B tem m colunas linearmente independentes, diferentes controles levam a
diferentes trajet
orias, isto e, Bu = Bv implica que u = v. Se m > n, obviamente isto n
ao e verdade,
pois e impossvel B ter m colunas linearmente independentes. Ent
ao podemos reduzir o n
umero
de controles independentes. Suponhamos que B tenha m
colunas linearmente independentes. Se
m
< n, atraves de operaco
es com as colunas, podemos encontrar uma matriz P de modo que
u = Pu

BP = B,

(2.28)

n m, e a matriz formada pelas m


onde B,
colunas linearmente independentes de B, e as m
m
colunas restantes s
ao nulas. Sempre podemos colocar as m
colunas linearmente independentes
ocupando as m
primeiras posico
es. De (2.28) temos que
u
Bu = BP u
=B

34

Vamos definir a matriz C, n m,


como sendo a matriz formada pelas colunas n
ao nulas de B; e
o vetor v, m-dimensional, como sendo o vetor formado pelos primeiros m
componentes de u
. Deste
modo
u
Cv = B
= Bu
e obtemos um sistema com m
controles independentes.
Exemplo 2.4.1 Verifique a redund
ancia entre os controles do sistema
x0 = Ax + Bu
com B =

1 2 3
1 2 3

e u t = [ u1

u2

u3 ].

Solu
c
ao: Neste caso temos m = 3 e n = 2. Consideremos a matriz elementar P

1 2 3
0 1
0 .
0 0
1
Ent
ao

BP =

1 2 3
1 2 3

Bu =

1 2 3
1 2 3

Logo,
C=

1
1



1 2 3
1 0 0

0 1
0 =
= B,
1 0 0
0 0
1

 u1


u
u2 = u1 + 2u2 + 3u3 = B
.
u1 + 2u2 + 3u3
u3

v = u1 + 2u2 + 3u3 .

Qualquer escolha dos controles originais tal que u1 + 2u2 + u3 = v n


ao afeta a trajet
oria. Assim
o sistema original possui uma dupla redund
ancia.

2.5

Considera
co
es Finais

Neste captulo de Controlabilidade provamos v


arios resultados sobre o conjunto control
avel e para
facilitar o entendimento procuramos fazer diversas ilustraco
es e exemplos. Foram discutidas tambem
as condico
es sobre a total controlabilidade do sistema; vimos que tais condico
es est
ao associadas ao
posto da matriz de controlabilidade M e dos auto-vetores de A.
Fizemos um breve estudo tambem sobre o conjunto dos estados atingveis onde vimos que de
maneira semelhante ao que fizemos em controlabilidade a
` origem, o alvo pode ser um ponto qualquer.
E por u
ltimo em controles reduntantes vimos que quando a matriz B, n m, tem m colunas
linearmente independentes, diferentes controles levam a
` diferentes trajet
orias, mas quando isto n
ao
ocorre podemos reduzir o n
umero de controles independentes.

35

36

Captulo 3

Estabilidade
Estudamos neste captulo o comportamento em perodos longos de tempo das soluco
es de sistemas
aut
onomos de equaco
es diferenciais ordin
arias (EDOs). O principal interesse est
a em determinar
se uma soluca
o (trajet
oria) permanece ou n
ao limitada e, em caso afirmativo, se esta converge
assintoticamente para algum ponto de equilbrio.
Na Secca
o 3.1 e definido o conceito de estabilidade de um ponto de equilbrio. Na Secca
o 3.2 s
ao
discutidas condico
es necess
arias e suficientes para estabilidade de sistemas lineares aut
onomos. A
Secca
o 3.3 se destina a analisar um criterio algebrico (teorema de Hurwitz) para garantir estabilidade
de matrizes. Na Secca
o 3.4 consideramos sistemas obtidos por perturbaco
es de sistemas lineares
est
aveis. As Secco
es 3.5 e 3.6 tratam do criterio de estabilidade formulado por Lyapunov. Na
Secca
o 3.7 aplicamos o criterio de Lyapunov a sistemas lineares discretos.

3.1

Conceito e Exemplos

Considere a equaca
o diferencial ordin
aria
z 0 = f (z),

(3.1)

em que o campo vetorial f satisfaz as seguintes condico


es:
f : D IRn , D IRn aberto;
D, f () = ;

f e continuamente diferenci
avel em D.

(3.2)
(3.3)
(3.4)

Como o sistema e aut


onomo, i.e. o campo vetorial f n
ao depende explicitamente do tempo, podemos
sem perda de generalidade estudar as soluco
es a partir do instante de tempo t 0 = 0. A hip
otese (3.4)
garante, para toda condica
o inicial z0 IRn , a existencia de uma soluca
o local para o problema de
valor inicial (PVI):
z 0 = f (z), z(0) = z0 .
(3.5)
Essa soluca
o pode ser prolongada a um intervalo m
aximo de existencia, o qual e aqui representado
por1
J(z0 ) = [0, (z0 )).
1 Estamos

interessados apenas no futuro.

37

Nesse intervalo a soluca


o e unicamente determinada. Este resultado e conseq
uencia do teorema de
PicardLindel
off.2 A chave para esse resultado e considerar a equaca
o integral associada ao PVI
(3.5)
Z t
f (z(s)) ds, t [0, ],
z(t) = z0 +
0

no espaco C([0, ]; IR ), onde > 0 e escolhido de forma adequada. Representamos esta soluca
o
maximal por z(, z0 ).
A condica
o (3.3) garante que e um ponto de equilbrio do sistema, pois o PVI com condica
o
inicial z0 = possui apenas a soluca
o z(, z0 ) (repouso). Note que a escolha de como ponto de
equilbrio n
ao e restritiva, uma vez que e sempre possvel (atraves de translaco
es) alterar um campo
vetorial de forma a atingir esta configuraca
o, desde que o campo possua apenas um zero. 3
Defini
c
ao 3.1.1 O ponto de equilbrio z = do sistema (3.1) e denominado est
avel quando:
> 0 > 0 tq z0 B (
z ) = J(z0 ) = [0, ) e z(t, z0 ) B t 0 ;
e denominado atrativo quando:
> 0 tq z0 B (
z ) = J(z0 ) = [0, ) e lim z(t, z0 ) = ;
t

e denominado assintoticamente est


avel quando e simultaneamente est
avel e atrativo.

2 2 2

Exemplo 3.1.2 Considere o problema do pendulo n


ao linear modelado pela equaca
o diferencial
x
+ sin x = 0.
O sistema correspondente e:
z 0 = f (z) com f (z) :=

z2
sin z1

cujo campo vetorial e mostrado na Figura 3.1.


de simples verificaca
E
o o fato dos pontos
 


0
k
e
, k IN.
0
0
serem pontos de equilbrio do sistema. Atraves de uma translaca
o, o ponto de equilbrio (, 0) pode
intuitivamente claro que os
ser levado na origem e ent
ao analisado no sentido da Definica
o 3.1.1. E
pontos de equilbrio (0, 0) e (, 0) s
ao de natureza diferente. Sem entrar em detalhes, comentamos
por hora que (0, 0) e um ponto de equilbrio est
avel, enquanto que (, 0) n
ao o e.
2 2 2
Exemplo 3.1.3 Consideremos agora o conhecido sistema n
ao linear de Lorenz:

s(z2 z1 )
z 0 = f (z) com f (z) = rz1 z2 z1 z3 ,
z1 z2 bz3
2 Maiores
3 Na

detalhes na literatura especializada em EDO; por exemplo [Sot] ou [Wa2].


definica
o a seguir e no resto do texto adotamos a seguinte notaca
o: Para r 0, temos

r (x) = {v IRn | |x v| r}, Br = Br (), B


r = B
r ().
Br (x) = {v IRn | |x v| < r}, B

38

(3.6)

-10

-5

0 0

10
x

-2

-4

Figura 3.1: Campo vetorial de x00 + sin x = 0


onde s, r e b s
ao constantes positivas. Este sistema foi utilizado por Lorenz como modelo de dimens ao
finita para um fen
omeno fsico (a convecca
o de RayleighBenard).
Em particular, a escolha dos par
ametros s = 10, r = 28 e b = 8/3 gera um atrator estranho, que foi observado numericamente e tem sido objeto intensivo de estudo de v
arios grupos
de pesquisadores.4 Para r > 1, o sistema possui tres pontos de equilbrio:
p

pb(r 1)
0
pb(r 1)
z = 0 , z = b(r 1) e z = b(r 1) .
0
r1
r1

A estabilidade destes 3 pontos de equilbrio pode ser analisada quando conhecemos um pouco melhor
possvel assim, verificar de forma clara a natureza inst
a aproximaca
o linear do campo vetorial. E
avel
do sistema.
2 2 2
importante observar que a atratividade n
Observa
c
ao 3.1.4 E
ao implica, em geral, na estabilidade
assint
otica. Um exemplo e encontrado no sistema n
ao linear
 0
x = (x2 (y x) + y 5 ) / (x2 + y 2 )(1 + (x2 + y 2 )2 )
y 0 = y 2 (y 2x) / (x2 + y 2 )(1 + (x2 + y 2 )2 )
cuja din
amica e ilustrada na Figura 3.2. Entretanto, para sistemas aut
onomos, as definico
es de
atratividade e estabilidade assint
otica s
ao equivalentes. Tal fato e analisado na pr
oxima secca
o.
Sistemas est
aveis mas n
ao atrativos s
ao mais f
aceis de ser encontrados. Considere, por exemplo,
4 Maiores

detalhes por exemplo em [Je].

39

1.5

1
y

0.5

-1

-0.5

0.5
x

-0.5

-1

-1.5
Figura 3.2: A origem e um ponto de equilbrio atrativo, porem n
ao e est
avel

40

f (z) = Az, onde A corresponde a


` matriz de rotaca
o pelo a
ngulo de /2.

3.2

2 2 2

Estabilidade de Sistemas Lineares

Analisamos nesta secca


o o importante caso particular do sistema (3.1) em que a din
amica do sistema
e descrita pela equaca
o
z 0 = A z,
(3.7)
onde A IRn,n . O objetivo principal e esclarecer a quest
ao da estabilidade do ponto de equilbrio
z = . Neste caso e usual referir-mo-nos ao sistema (3.7) como sistema est
avel.
Teorema 3.2.1 Seja o sistema (3.7). S
ao equivalentes as seguintes afirmaco
es:
a) O ponto de equilbrio z = e assintoticamente est
avel;
b) O ponto de equilbrio z = e atrativo;
c) max{Re() | e autovalor de A} < 0.

Demonstraca
o: a) = b) Segue imediatamente da Definica
o 3.1.1.
b) = c) Suponha que A possui um autovalor = + i com 0. Se v e um autovetor
correspondente, definimos atraves de
z(s) := Re (es v), s 0
uma soluca
o que claramente n
ao satisfaz lim z(t) = .
t

c) = a) Temos que

keAt k cet , t 0,

com constantes c 0 e > 0. Observando que a soluca


o do sistema e z(t, z 0 ) = eAt z0 , conclumos
que z = e assintoticamente est
avel.
Observa
c
ao 3.2.2 Se o ponto de equilbrio z = e assintoticamente est
avel, podemos concluir do
Teorema 3.2.1 que todas as soluco
es de (3.7) convergem exponencialmente para quando t .
Esta propriedade e denominada estabilidade exponencial. Fica claro, portanto, que os conceitos de
estabilidade assint
otica e exponencial s
ao equivalentes no caso dos sistemas lineares aut
onomos.
2 2 2
Observa
c
ao 3.2.3 Caso o ponto de equilbrio z = do sistema (3.7) seja assintoticamente est
avel,
ent
ao o sistema
z 0 = A z + b(t), t 0,
(3.8)

e BIBOest
avel (Bounded-Input Bounded-Output). Isto e, se b L ([0, ); IRn ), ent
ao toda soluca
o
de (3.8) est
a tambem em L ([0, ); IRn ). Este fato segue imediatamente da representaca
o da soluca
o para o problema n
ao homogeneo. Tal propriedade e entretanto perdida quando o ponto de
equilbrio z = e somente est
avel (veja o pr
oximo exemplo).
2 2 2
Exemplo 3.2.4 Considere o oscilador harm
onico modelado pela equaca
o diferencial
x + a2 x = b(t)
e o respectivo sistema


z10
z20

0
a2

1
0


41

z1
z2

0
b(t)

Note que z = e um ponto de equilbrio do sistema


 0 



z1
0
1
z1
=
.
z20
z2
a2 0
Como uma matriz fundamental para esse sistema e dada por


sin at
cos at
, t 0,
a cos at a sin at
podemos concluir que o ponto de equilbrio e est
avel.
Considere agora como inomogeniedade (entrada) a funca
o limitada b(t) := cos t. A soluca
o
correspondente e dada por

t
, para = a
2 sin t
x(t) =
1
(cos
t

cos
at)
,
para 6= a
2
2
a
A interpretaca
o da soluca
o obtida e a seguinte:
Para 6= a, a soluca
o e formada pela composica
o de duas vibraco
es com frequencias respectivamente a/2 (frequencia da energia do sistema) e /2 (frequencia da forca externa).
No caso a = , observamos o fen
omeno de resson
ancia: com o tempo o sistema ganha cada vez
mais energia e a soluca
o se torna ilimitada. Na pr
atica, o sistema acaba sendo destrudo, devido a
`
sobrecarga de energia acumulada.
2 2 2
Observa
c
ao 3.2.5 Suponha que no sistema (3.7) tenhamos max{ Re()| e autovalor de A} = 0.
Nesse caso o ponto z = ser
a est
avel exatamente quando todos os blocos de Jordan relativos aos
autovalores com Re() = 0 tiverem forma diagonal (por que?).
2 2 2
Defini
c
ao 3.2.6 Uma matriz M IRn,n que satisfaz
max {Re() | e autovalor de M } < 0.
e denominada matriz est
avel.

3.3

2 2 2

Crit
erio de RouthHurwitz

Como sabemos, os autovalores da matriz A IRn,n do sistema (3.7) s


ao as razes do polin
omio
caracterstico de A (aqui denominado pA ). Suponha que pA e da forma
pA (r) = rn +

n
X

ai rni .

i=1

Pela Definica
o 3.2.6 a matriz A e est
avel quando todas as razes de p a estiverem no semi-plano
esquerdo do plano complexo. Discutimos nesta secca
o uma condica
o necess
aria (criterio de Routh
Hurwitz) para a estabilidade de uma matriz.
Lema 3.3.1 Se A e uma matriz est
avel, ent
ao todos os coeficientes a 1 , . . . , an de pA s
ao positivos.
Demonstraca
o: Denotando por k os autovalores reais de A e por j os autovalores com parte
imagin
aria n
ao nula, temos que
Y
Y
pA (r) =
(r k )
(r2 2Re(j )r + |j |2 ).
k

42

A hip
otese da estabilidade de A implica em
k > 0, 2Re(j ) > 0.
Provando assim que os coeficientes de pA s
ao positivos.
Uma desvantagem o
bvia da aplicaca
o deste criterio e a necessidade do conhecimento do polin
omio
caracterstico pA . O exemplo a seguir mostra que o criterio n
ao e suficiente para garantir a estabilidade de A.
Exemplo 3.3.2 Considere a equaca
o diferencial
x(3) + x(2) + x(1) + x = 0.
O polin
omio caracterstico do sistema correspondente e
p(r) = r3 + r2 + r + 1
e possui razes 1, i. Portanto, o ponto de equilbrio z = do sistema correspondente e est
avel,
mas n
ao e assintoticamente est
avel.
2 2 2
Observa
c
ao 3.3.3 No caso dos polin
omios de grau menor ou igual a 4, e possvel encontrar condico
es
suficientes para garantir a estabilidade da matriz A a partir da aplicaca
o do teorema fundamental
da a
lgebra (veja [Gon]). De fato, os polin
omios
i)
ii)
iii)
iv)

r+a
r2 + ar + b
r3 + ar2 + br + c
r4 + ar3 + br2 + cr + d

com coeficientes reais possuem apenas razes com parte real negativa se e somente se as seguintes
condico
es s
ao respectivamente satisfeitas:
i )
ii )
iii )
iv )

a>0
a > 0, b > 0
a > 0, b > 0, c > 0 e ab > c
a > 0, b > 0, c > 0, d > 0 e abc > c2 + a2 d.

2 2 2

Exemplo 3.3.4 Considere um circuito com um resistor (de resistencia R), dois indutores (cada um
com indut
ancia L) e um capacitor (de capacit
ancia C), onde as constantes R, L e C s
ao positivas.
O problema e modelado pela equaca
o diferencial escalar
L2 Cx(3) + RLCx(2) + 2Lx(1) + Rx = 0.
A funca
o x representa a diferenca de potencial (DDP). Da Observaca
o 3.3.3 segue a estabilidade
assint
otica do circuito (veja ainda a Observaca
o 3.2.2).
2 2 2
O pr
oximo passo e a obtenca
o de uma condica
o suficiente para o caso geral de (3.7). O criterio
apresentado a seguir foi descoberto por Routh em 1877. Seja
p(r) = rn +

n
X
i=1

43

ai rni

um polin
omio com coeficientes reais positivos. Defina os polin
omios U e V (com coeficientes tambem
reais positivos) de modo que
U (r) + iV (r) = p(ir), r IR.
Temos ent
ao:
Grau de U = n e grau de V = n 1, se n for par;
Grau de U = n 1 e grau de V = n, se n for mpar.
Definimos a partir de U e V os seguintes polin
omios:
q1 := U, q2 := V, se n e par;
q1 := V, q2 := U, se n e mpar.
q3 , . . . , qm s
ao obtidos a partir do algoritmo de divis
ao de Euclides aplicado ao par q 1 , q2 .
Temos assim:5
qk1 = k qk qk+1 , k = 2, . . . , m 1 e qm1 = m qm .
Ap
os esta construca
o estamos prontos para enunciar o teorema de Routh.
Teorema 3.3.5 Sejam U , V , q1 , . . . , qm definidos como acima. As seguintes afirmaco
es s
ao equivalentes:
a) O polin
omio p possui apenas razes com Re() < 0;
b) m = n + 1 e os sinais dos coeficientes de maior grau de q1 , . . . , qn+1 alternam.
A demonstraca
o deste resultado foge aos nossos objetivos e n
ao e apresentada. O leitor interessado pode encontrar em [Gan] uma demonstraca
o baseada em um teorema de resduos da an
alise
complexa.

3.4

Perturba
c
ao de Sistemas Lineares

Consideramos nesta secca


o sistemas da forma
z 0 = A z + g(z),

(3.9)

onde A IRn,n e g : IRn IRn . Supomos ainda que as hip


oteses em (3.3) e (3.4) sejam satisfeitas
pela funca
o
f (z) := Az + g(z), z D := IRn .
O teorema a seguir nos fornece uma condica
o suficiente para garantir a estabilidade do ponto de
equilbrio do sistema (3.9).
Teorema 3.4.1 Seja A uma matriz est
avel e g : IRn IRn uma aplicaca
o satisfazendo lim |g(z)|/|z| =
0. Ent
ao o ponto de equilbrio z = do sistema (3.9) e assintoticamente est
avel.
Demonstraca
o: Das hip
oteses temos que
c 0, > 0 tq (keAt k ce2t ), t 0,
> 0 tq (|g(y)| c1 |y|), y B .
5 Note

que qm e (a menos de uma constante) o maior divisor comum de q1 , q2 .

44

|z|0

Seja z : [0, T ) IRn uma soluca


o local do sistema
z 0 = A z + g(z).
(A existencia desta soluca
o e garantida pela hip
otese (3.4).) Temos ent
ao
At

eA(ts) g(z(s)) ds,


Z t
At
|z(t)| ke k |z(0)| +
keA(ts) k |g(z(s))| ds
0
Z t
2t
ce
|z(0)| +
e2(ts) |z(s)| ds, t [0, T ).
z(t) = e

z(0) +

Definindo w(t) := e2t |z(t)| para t [0, T ), obtemos a estimativa


w(t) c |z(0)| +

t
0

w(s) ds, t [0, T ).

Temos agora como resultado do lema de Gronwall que


w(t) c |z(0)| et , t [0, T ),
de onde segue

z(t) c |z(0)| et , t [0, T ).

(3.10)

Podemos ent
ao concluir que a soluca
o local z pode ser prolongada ao intervalo [0, ). Logo, a
estimativa (3.10) vale para T = e o teorema fica provado.
Observa
c
ao 3.4.2 A import
ancia do Teorema 3.4.1 e a forma pela qual ele pode ser aplicado na
an
alise da estabilidade dos pontos de equilbrio dos sistemas de controle em (3.9):
Expanda o campo vetorial f no ponto de equilbrio z = . O sistema resultante e da forma
(3.9), onde A = df () e g(z) = f (z) df ()g. (A hip
otese de g estar definida em todo IR n n
ao
e restritiva, pois na demonstraca
o necessitamos de g somente em uma vizinhanca de z = .)
Verifique se A = df () e uma matriz est
avel.
A hip
otese lim|z|0 |g(z)|/|z| = 0 e trivialmente satisfeita, pois f e suposta continuamente
diferenci
avel.
Note, entretanto, que este metodo de linearizaca
o fornece apenas uma condica
o suficiente para a
estabilidade. Tal condica
o e por demasiado restritiva e est
a longe de ser necess
aria (veja o Exemplo 3.5.1).
2 2 2
Exemplo 3.4.3 Aplicamos o metodo de linearizaca
o ao oscilador n
ao linear com amortecimento
a > 0, que e descrito pela equaca
o diferencial
x
+ 2a x + sin x = 0.
O sistema correspondente e:
0

z = f (z) com f (z1 , z2 ) =


45

z2
2az2 sin z1

(3.11)

e a linearizaca
o do sistema no ponto de equilbrio z = nos fornece a matriz


0
1
.
A = df () =
1 2a
f
E
acil verificar que os autovalores da matriz A s
ao:
p
= a a2 1.

A matriz A e portanto est


avel e o ponto de equilbrio z = e assintoticamente est
avel. O sistema
(3.11) possui ainda outro ponto de equilbrio, a saber: z = (, 0). A linearizaca
o neste ponto gera
a matriz


0
1

,
A = df (
z) =
1 2a

que possui um autovalor com Re() > 0. O Teorema 3.4.1 n


ao se aplica, entretanto o ponto de
equilbrio z n
ao e est
avel. Nas Figuras 3.3 e 3.4 e mostrado o campo em vizinhancas dos pontos
z = e z = (, 0), respectivamente.
2 2 2
Exemplo 3.4.4 Consideremos novamente o sistema de Lorenz (veja Exemplo 3.1.3), descrito pela
equaca
o diferencial

s(z2 z1 )
z 0 = f (z) com f (z) = rz1 z2 z1 z3 ,
(3.12)
z1 z2 bz3

f
onde s, r e b s
ao constantes positivas. E
acil verificar que, para r > 1, existem tres pontos de
equilbrio:

p

p
0
pb(r 1)
pb(r 1)
z = 0 , z = b(r 1) e z = b(r 1) .
0
r1
r1
Linearizando o sistema nestes pontos, obtemos respectivamente as matrizes:

s s
0
A = df (
z ) = r 1 0 ,
0
0 b

s
A = df (
z) = p 1
b(r 1)

s
1
p
b(r 1)

p 0
b(r 1) ,
b

s
s
1
A = df (
z) = p 1
p
b(r 1) b(r 1)

p 0
b(r 1) .
b

Para o ponto de equilbrio z obtemos o polin


omio caracterstico

p() = ( + b) (2 + (s + 1) s(r 1)),


o qual possui duas razes negativas e uma positiva. Portanto, a estabilidade numa vizinhanca de z
e improv
avel.
46

0.3

0.2
y

0.1

-1

-0.5

0.5
x

-0.1

-0.2

-0.3

Figura 3.3: Campo vetorial de x00 + 2ax0 + sin x = 0 (para a = 1) em uma vizinhanca do ponto
z = .

47

0.3

0.2
y

0.1

0 2

2.5

3
x

3.5

-0.1

-0.2

-0.3

Figura 3.4: Campo vetorial de x00 + 2ax0 + sin x = 0 (para a = 1) em uma vizinhanca do ponto
z = (, 0).

48

40

30

20

10

-15
-10
-20

-5

-10

0
00

20

10
5

10

15

20

Figura 3.5: Orbita


do atrator de Lorenz (3.12) para os par
ametros s = 10, r = 28 e b = 8/3; condica
o
inicial: z(0) = (0.1, 0.1, 0.1).
Os pontos de equilbrio z e z est
ao associados ao mesmo polin
omio caracterstico:
p() = 3 + (s + 1 + b)2 + b(s + r) + 2bs(r 1).
O criterio de RouthHurwitz e aplic
avel quando6
(s + 1 + b)b(s + r) 2bs(r 1) > 0
Este e o caso se
s > b + 1 , r < rc := s

s+3+b
,
sb1

quando ent
ao podemos concluir que os pontos de equilbrio z e z s
ao assintoticamente est
aveis. Para
os valores especiais s = 10, r = 28 e b = 8/3, temos r > rc 24.74 e os tres pontos de equilbrio
n
ao mais s
ao est
aveis. Entretanto, os polin
omios caractersticos de z e z ainda possuem uma raiz
negativa, fato que contribui para o comportamento mpar das o
rbitas do sistema (veja Figura 3.5).
2 2 2

3.5

M
etodo de Lyapunov

Um metodo eficiente de se verificar a estabilidade e o desenvolvido por A.M. Lyapunov (1893). O


metodo trata de sistemas n
ao lineares da forma (3.1) e se baseia na an
alise de autovalores. Analisamos
a seguir um exemplo que serve de motivaca
o para o metodo apresentado nesta secca
o.
6 Veja

Observaca
o 3.3.3.

49

Exemplo 3.5.1 Considere o sistema


z 0 = f (z)

com

f (z1 , z2 ) =

3z2 z15
2z2 + z15

(3.13)

Os autovalores da matriz A = df () s
ao 0 e 2. Logo, A n
ao e uma matriz est
avel e a quest
ao da
estabilidade do ponto de equilbrio permanece em aberto.
Defina V (z1 , z2 ) := z16 + 9z22 e seja z = (z1 , z2 ) IR2 uma soluca
o do sistema (3.13). Temos
ent
ao
d
V (z1 (t), z2 (t)) = 6z1 (t)10 36z2 (t)2 0,
dt
de onde segue
Z t
0 V (z1 (t), z2 (t)) = V (z1 (0), z2 (0))
(6z1 (s)10 + 36z2 (s)2 ) ds, t 0.
0

A estabilidade do ponto de equilbrio e agora uma conseq


uencia direta desta desigualdade. Alem
disto, temos ainda que limt z(t) = . De fato, como a funca
o t 7 V (z1 (t), z2 (t)) e mon
otona n
ao
crescente, existe o limite a := limt V (z1 (t), z2 (t)).
Como V (z1 , z2 ) = 0 se e somente se (z1 , z2 ) = , basta verificar que a = 0. Suponha por contradica
o
que a > 0. Temos ent
ao que
0 < a V (z1 (t), z2 (t)) V (z1 (0), z2 (0)), t 0.
Defina m := inf{6z110 + 36z22 | (z1 , z2 ) IR2 ; a V (z1 , z2 ) V (z1 (0), z2 (0))}. Como V e contnua,
temos que m > 0. Para t 0 temos agora
Z t
dt = V (z1 (0), z2 (0)) mt.
0 V (z1 (t), z2 (t)) V (z1 (0), z2 (0)) m
0

Como o lado direito da u


ltima express
ao se torna negativo para t suficientemente grande, chegamos
a
` desejada contradica
o.
2 2 2
Defini
c
ao 3.5.2 Uma funca
o V : U IR, onde U e uma vizinhanca qualquer de z = , e denominada funca
o de Lyapunov para o sistema z 0 = f (z) quando satisfaz:
i) V e contnua em U e continuamente diferenci
avel em U \{};
ii) V () = 0, V (x) > 0 para todo x U, x 6= ;
iii) hV (x), f (x)i 0 para todo x U \{}.

V e denominada funca
o de Lyapunov estrita quando, ao inves da condica
o iii), satisfizer:
iii ) hV (x), f (x)i < 0 para todo x U \{}.

2 2 2

Teorema 3.5.3 Seja U uma vizinhanca qualquer de z = e V : U IR uma funca


o de Lyapunov
para o sistema z 0 = f (z). S
ao verdadeiras as afirmativas:
a) z = e um ponto de equilbrio est
avel ;
b) z = e um ponto de equilbrio atrativo se e somente se existe vizinhanca W
de de modo que a soluca
o estacion
aria seja a u
nica soluca
o
d
0
V (z(t)) = 0, t [0, ).
z : [0, ) U de z = f (z) com z(0) W e
dt
Demonstraca
o: Provamos primeiro o item a). Seja r > 0 tal que B2r U .
50

Defina :=

r Br . Ent
min{V (x) | |x| = r} e U := {x U | V (x) < } B
ao > 0 e a continuidade
de V implica que U 6= e que U e uma vizinhanca de . Seja z uma soluca
o de
z 0 = f (z), z(0) = z0 U .

Temos ent
ao V (z(0)) < e
d
V (z(t)) = hV (z(t)), z 0 (t)i = hV (z(t)), f (z)i 0, t [0, (z0 )),
(3.14)
dt
r , t [0, (z0 )]. Se existisse t1 (0, (z0 )] tal que
onde (z0 ) e o maior real que satisfaz z(t) B
|z(t1 )| = r, teramos
V (z(0)) < V (z(t1 ))

pela definica
o de e

V (z(t1 )) V (z(0))

como conseq
uencia de (3.14), nos levando a uma contradica
o. Portanto, temos necessariamente
z(t) Br , para todo t [0, (z0 )]. Isto porem contradiz a maximalidade do intervalo [0, (z0 )],
provando assim que (z0 ) = e z(t) Br para todo t [0, ). Fica assim provado que z = e
um ponto de equilbrio est
avel.
Provamos agora b). Defina inicialmente W := U .
(=) Como z e atrativo, existe > 0 tal que, para todo z0 B , a soluca
o correspondente z(, z0 )
converge para z quando t . Caso W 6 B , redefina W := U B . Seja z : [0, ) U uma
d
soluca
o de z 0 = f (z); z(0) = z0 W satisfazendo dt
V (z(t)) = 0, t [0, ). Temos ent
ao
V (z(0)) = lim V (z(t)) = V ( lim z(t)) = V () = 0.
t

Logo, z(0) = e de V (z(t)) = V (z(0)), t, conclumos que z(t) = , t [0, ).


(=) Seja z uma soluca
o de z 0 = f (z) com z(0) W . Do item a) temos que z : [0, )
Br . Logo, para toda seq
uencia (tn )nIN com limn tn = , a seq
uencia (z(tn ))nIN possui uma
subseq
uencia convergente. Para provar que e um ponto de equilbrio atrativo, basta verificarmos
que o limite limn z(tn ) e sempre . Suponhamos por contradica
o que existe uma seq
uencia (t n )nN
com lim tn = e limn z(tn ) = z 6= . Se |
z | = r chegaramos (como em a)) a
` contradica
o:
V (z(0)) < V (
z ) e V (
z ) V (z(0)). Logo z Br . Note ainda que a hip
otese V (
z ) = implica
r .
na mesma contradica
o acima. Logo V (
z ) < e portanto z U = {x U | V (x) < } B
Considere agora a soluca
o z do sistema
z0 = f (
z ), z(0) = z.
Do item a) temos que
z : [0, ) Br ,

Como z 6= e V (
z (t)) e mon
otona n
ao crescente, ent
ao V (
z (t)) V (
z (0)) = V (
z ), t. Caso a
igualdade sempre se verificasse, a hip
otese em b) implicaria em z(t) e z = . Portanto, existe
um > 0 com V (
z ( )) < V (
z ).
A equaca
o diferencial e aut
onoma, logo as funco
es zn : [0, ) IRn definidas por zn (t) :=
0
z(tn + t) s
ao soluco
es respectivamente de zn = f (zn ), zn (0) = z(tn ). Como limn z(tn ) = z, segue
que
lim |zn (t) z(t)| = lim |z(tn + t) z(t)| = 0, t [0, ].
n

Isto e, limn zn (t) = z(t), t [0, ]. Temos, portanto,


lim V (z(tn + )) = V (
z ( )) < V (
z ).

Isto porem e um absurdo, pois sendo V (z(t)) mon


otona n
ao crescente, e possvel encontrar, para
todo n IN, um m IN tal que V (z(tn + )) V (z(tm )) V (
z ) = limn V (z(tn )).
51

Corol
ario 3.5.4 (Lyapunov) Seja V uma funca
o de Lyapunov estrita em U , uma vizinhanca de
, para o sistema z 0 = f (z). Ent
ao, o ponto de equilbrio z = e assintoticamente est
avel.
Demonstraca
o: O Teorema 3.5.3 a) garante estabilidade de z em alguma vizinhanca B r U .
Note agora que, para toda soluca
o de z 0 = f (z) que permanece em Br para t 0, a aplicaca
o
t 7 V (z(t)) e mon
otona estritamente decrescente. Portanto, a u
nica dentre essas soluco
es que
d
V (z(t)) = 0, t 0 e a soluca
o estacion
aria z(t) . Do Teorema 3.5.3 b) segue que z e
satisfaz dt
atrativo.
Exemplo 3.5.5 Considere novamente o sistema n
ao linear
z 0 = f (z) com f (z1 , z2 ) =

3z2 z15
2z2 + z15

No Exemplo 3.5.1 introduzimos a funca


o de Lyapunov estrita
V (z1 , z2 ) := z16 + 9z22 , (z1 , z2 ) IR2
a fim de analisar este sistema. Podemos agora concluir diretamente do Corol
ario 3.5.4 que o ponto
de equilbrio z = e assintoticamente est
avel.
2 2 2
Exemplo 3.5.6 Considere a equaca
o diferencial para o circuito eletrico RLC:
CL
x + RC x + x = 0,
cujo sistema associado e
z 0 = f (z) com f (z1 , z2 ) =

0
[LC]1

1
RL1



z1
z2

onde R, L e C s
ao constantes positivas. Uma funca
o de Lyapunov para este sistema e
V (z1 , z2 ) := Lz22 + C 1 z12 , (z1 , z2 ) IR2 ,
de onde calculamos
hV (z1 , z2 ), f (z1 , z2 )i = 2Rz22 , (z1 , z2 ) IR2 .
Logo, V n
ao e uma funca
o de Lyapunov estrita e o Teorema 3.5.3 a) garante que z = e est
avel.
Note porem que a condica
o 2Rz2 (t)2 = 0, para todo t 0, implica em z2 (t) = z20 (t) = 0, t 0.
Da equaca
o diferencial temos ent
ao z1 (t) = 0, t 0. Assim sendo, o Teorema 3.5.3 b) garante que
z = e tambem atrativo e, portanto, assintoticamente est
avel.
2 2 2
Exemplo 3.5.7 Considere agora o sistema
0

z = f (z) com f (z1 , z2 ) =

0 1
1 0



z1
z2

Uma funca
o de Lyapunov e dada por V (z1 , z2 ) = z12 + z22 . O Teorema 3.5.3 garante que z = e
um ponto de equilbrio est
avel mas n
ao atrativo (verifique!).
2 2 2
52

3.6

Equa
c
ao Matricial de Lyapunov

Iniciamos esta secca


o recordando alguns importantes conceitos da a
lgebra linear, relacionados com
os autovalores de uma matriz.
Defini
c
ao 3.6.1 Uma matriz simetrica M IRn,n e denominada

Positiva definida quando hx, M xi > 0, para todo x IRn , x 6= ;

Positiva semi-definida quando hx, M xi 0, para todo x IR n ;

Negativa definida quando M e positiva definida.

2 2 2

No lema a seguir apresentamos a soluca


o de uma equaca
o matricial que e fundamental para a
formulaca
o do criterio de Lyapunov.
Lema 3.6.2 Sejam U IRn,n , V IRm,m e W IRn,m . Se U e V s
ao matrizes est
aveis, ent
ao a
soluca
o u
nica da equaca
o matricial
U X + XV + W =

(X IRn,m )

e a matriz est
avel X definida por
X :=

etU W etV dt.

Demonstraca
o: Da hip
otese, temos que existem constantes c 0 e > 0 tais que
ketU k cet , ketV k cet , t 0.
Note que para T > 0, temos
eT U W e T V W

=
=
=

T
0

d tU
(e W etV ) dt
dt

(U etU W etV + etU W V etV ) dt

0
T

(U etU W etV + etU W etV V ) dt.

Tomando o limite quando T , temos que


Z
X=

etU W etV dt

e soluca
o da equaca
o matricial W = U X + XV , ficando assim provada a existencia de soluco
es.
Para provar unicidade, suponha que X1 , X2 s
ao ambas soluco
es de U X + XV + W = e defina
b := X1 X2 . Logo, X
b IRn,m e soluca
X
o de
Temos ent
ao
e portanto,

b + XV
b
UX
= .

d tU b tV
b + XV
b )etV =
(e Xe ) = etU (U X
dt

b tV = e0U Xe
b 0V = X.
b
etU Xe
b = .
Tomando o limite quando t , obtemos X
53

No teorema a seguir e apresentada uma equaca


o matricial, que fornece uma forma equivalente
de definir a estabilidade de uma matriz.
Teorema 3.6.3 Dada uma matriz A IRn,n , s
ao equivalentes as as seguintes afirmaco
es:

a) A e uma matriz est


avel;

b) Existe uma matriz positiva definida P IRn,n tal que


A P + P A = I.

(3.15)

Demonstraca
o: Se a matriz A e est
avel, a existencia de P segue do Lema 3.6.2 com U = A , V = A
e X = P . Reciprocamente, se P satisfaz a equaca
o (3.15), defina
V (x) := hx, P xi, x IRn .
Logo, a funca
o diferenci
avel V satisfaz V (0) = 0, V (x) > 0, x 6= e ainda
hV (x), Axi

= hP x + P x, Axi

= hA P x, xi + hx, P Axi
= h(A P + P A)x, xi
= hx, xi.

Isto e, V e uma funca


o de Lyapunov estrita. O Corol
ario 3.5.4 implica que o ponto de equilbrio
z = e assintoticamente est
avel. O Teorema 3.2.1 garante por fim que os autovalores de A possuem
parte real estritamente negativa.
Observa
c
ao 3.6.4 No Teorema 3.6.3, a equaca
o (3.15) pode ser substituda pela exigencia de A P +
P A ser negativa definida.
2 2 2
Teorema 3.6.5 Sejam A, X, W IRn,n e C IRl,n matrizes satisfazendo
A X + XA = W ;

W C C e positiva semi-definida;

(A, , C) e observ
avel.

Ent
ao a matriz A e est
avel sse X for positiva definida.
Demonstraca
o: (=) Seja A uma matriz est
avel. Do Lema 3.6.2 temos que X =
Logo, para x IRn temos
Z
hx, Xxi =
hetA x, W etA xi dt
0
Z
hetA x, C CetA xi dt

Z0
=
|CetA x|2 dt.

R
0

etA W etA dt.

Como (A, , C) e observ


avel, conclumos que CetA x = , t 0 sse x = .
(=) Suponha X positiva definida. Defina como na demonstraca
o do Teorema 3.6.3 a funca
o
V (x) := hx, Xxi, x IRn .
54

Como W C C e positiva semi-definida, ent


ao W tambem o e. Logo, V e uma funca
o de Lyapunov,
pois hV (z(t)), Az(t)i = hz, W zi (veja Observaca
o 3.6.4). Seja agora z uma soluca
o de z 0 = Az
d
V (z(t)) = 0, t 0. Temos ent
ao
com dt
0 =
Logo,

d
V (z(t)) = hz(t), W z(t)i.
dt

0 hz(t), (W C C)z(t)i = hCz(t), Cz(t)i, t 0.

Portanto, Cz(t) = , t 0, e da observabilidade de (A, , C) temos z(0) = . O Teorema 3.5.3 b)


garante que o ponto de equilbrio z = e assintoticamente est
avel e do Teorema 3.2.1 segue a
estabilidade da matriz A.
A equaca
o matricial (3.15) e denominada equaca
o matricial de Lyapunov. Igualmente interessante
na an
alise da estabilidade de sistemas n
ao lineares e o criterio de Popow, que fornece condico
es
suficientes para garantir a estabilidade absoluta de sistemas de loop fechado. Para detalhes sobre o
conceito de estabilidade absoluta e sobre o criterio de Popow veja [F
o3].

3.7

Estabilidade de Sistemas Lineares Discretos

Uma an
alise de estabilidade semelhante a
` realizada na Secca
o 3.2 para problemas contnuos pode
ser estendida para sistemas de evoluca
o discretos da forma
xk+1 = A xk , k = 0, 1, . . .

(3.16)

onde A IRn,n e xk IRn , k 0.


Defini
c
ao 3.7.1 O ponto de equilbrio x
= do sistema (3.16) e denominado:
est
avel quando: dado > 0, para todo x0 B , temos xk B , k = 1, 2, . . .
atrativo quando: para todo x0 IRn , temos lim xk = .
k

2 2 2

Como nos sistemas contnuos aut


onomos, a atratividade implica na estabilidade. A an
asise da
estabilidade de tais sistemas e bastante simples e e esclarecida com os seguintes lemas:
Lema 3.7.2 Dado um sistema linear discreto da forma (3.16), s
ao equivalentes as afirmaco
es:
a) O ponto de equilbrio x
= e atrativo;
b) O operador A considerado como elemento do espaco L(IR n , IRn ) e contrativo, i.e.
kAk :=

sup
xIRn \{}

kAxk
< 1.
kxk

Demonstraca
o: a) = b) Seja um autovalor de A e x0 o respectivo autovetor. Logo, xk =
Ak x0 = k x0 . Da hip
otese temos agora
lim ||k kx0 k = 0,

o que implica em < 1. Como e arbitr


ario, b) fica provado.
b) = a) Dado x0 IRn , temos da hip
otese
lim kxk k kx0 k lim kAkk = 0

e o teorema fica provado.


55

No que se refere a
` verificaca
o da estabilidade do ponto de equilbrio de (3.16) temos o lema a
seguir, que por sua semelhanca com o Lema 3.7.2 e deixado para o leitor como exerccio.
Lema 3.7.3 Dado o sistema linear discreto (3.16), s
ao equivalentes as afirmaco
es:
a) O ponto de equilbrio x
= e est
avel;
b) O operador A considerado como elemento do espaco L(IR n , IRn ) e n
ao expansivo, i.e.
kAk :=

sup
xIRn \{}

kAxk
1.
kxk

O criterio de Lyapunov tambem se aplica a sistemas discretos, com a finalidade de estabelecer


condico
es suficientes para estabilidade.
Defini
c
ao 3.7.4 Uma funca
o V : IRn IR e denominada funca
o de Lyapunov quadr
atica para o
sistema xk+1 = Axk quando satisfaz:
i) V e da forma: V (x) = hx, P xi, com P positiva definida;
ii) V (A x) < V (x) para todo x IRn \{}.

2 2 2

Lema 3.7.5 Seja V uma funca


o de Lyapunov quadr
atica para o sistema (3.16). Ent
ao o ponto de
equilbrio x
= e atrativo.
Demonstraca
o: Seja um autovalor de A e x o respectivo autovetor. Por hip
otese temos
||2 hx, P xi = hAx, P Axi < hx, P xi,
provando assim que || < 1. Como e arbitr
ario, o lema fica provado.
Do Lema 3.7.5, obtemos para sistemas discretos um resultado an
alogo ao Teorema 3.6.3.
Lema 3.7.6 O ponto de equilbrio x
= do sistema xk+1 = Axk e atrativo se e somente se existe
matriz definida positiva P tal que A P A P e negativa definida.

Demonstraca
o: (=) Como kAk < 1, e f
acil verificar que P = I (a matriz identidade) e tal que
A P A P e negativa definida. (Na verdade para qualquer matriz positiva definida P a express
ao
acima e negativa definida.)
(=) Basta observar que V (x) := hx, P xi define uma funca
o de Lyapunov quadr
atica para o
sistema.
A equaca
o A P A P = I e denominada equaca
o matricial discreta de Lyapunov.

Corol
ario 3.7.7 Se o ponto de equilbrio x = do sistema xk+1 = Axk e atrativo, ent
ao existe
uma funca
o de Lyapunov quadr
atica para o sistema.
Demonstraca
o: Segue imediatamente do Lema 3.7.6.

Exerccios
3.1 Verifique que o ponto de equilbrio do sistema no Exemplo 3.5.7 e est
avel mas n
ao atrativo.
56

3.2 Considere o sistema do oscilador n


ao linear amortecido (veja Exemplo 3.4.3)
x 1 = x2 ,

x 2 = x2 sin(x1 ),

onde > 0 e > 0 s


ao constantes.
a) Mostre que V (x1 , x2 ) := 21 x22 cos x1 e uma funca
o de Lyapunov para o sistema;

b) Verifique que todas as soluco


es do sistema possuem intervalo de existencia [0, );
c) Prove que toda soluca
o (x1 , x2 ) do sistema satisfaz

lim (x1 (t), x2 (t)) = (2k, 0),

onde k IN depende da condica


o inicial (x1 (0), x2 (0)).
3.3 Encontre para o sistema
x1 = x2 ,

x2 = x1 + 2x31 x2

uma funca
o de Lyapunov da forma
V (x1 , x2 ) = a11 x21 + 2a12 x1 x2 + a22 x22 ,
provando assim que a origem e um ponto de equilbrio assintoticamente est
avel.
3.4 Encontre para o sistema
x1 = x1 + 2x1 x2 ,

x2 = x2 + x3 ,

x3 = x2 4x3

uma funca
o de Lyapunov da forma
V (x1 , x2 , x3 ) = a11 x21 + a22 x22 + a33 x23 + 2a12 x1 x2 + 2a23 x2 x3 + 2a13 x1 x3 .
3.5 Complete os detalhes da demonstraca
o do Lema 3.7.3.
3.6 Para sistemas n
ao aut
onomos, o metodo de linearizaca
o n
ao pode, via de regra, ser utilizado na
an
alise de estabilidade. Tal fato se torna claro mesmo para sistemas lineares. Considere o sistema
z 0 = A(t) z, com


1 2 cos 4t 2 + 2 sin 4t
A(t) =
.
2 + 2 sin 4t 1 + 2 cos 4t
a) Calcule os autovalores de A(t);
b) Mostre que a origem e um ponto de equilbrio inst
avel;
(Dica: Observe que a equaca
o diferencial possui uma soluca
o da forma: e t+it .)
3.7 O que se pode afirmar, a partir do metodo de linearizaca
o, sobre a estabilidade do ponto de
equilbrio (0, 0, 0) do sistema no Exerccio 3.4?
3.8 Considere novamente o oscilador harm
oninco ( > 0, > 0)

, s > 0
x
+ F (x)
+ x = 0, com F (s) :=
, s < 0
a) Faca um esboco da famlia de soluco
es no plano (x, x);

b) Encontre os pontos de equilbrio (x, x)


do sistema.
57

3.9 Considere o sistema ( > 0, b > 0)


x
= U (t),

com U (t) :=

b, t > 0
b, t < 0

a) Faca um esboco da famlia de soluco


es no plano (x, x);

b) Mostre que existem soluco


es peri
odicas e calcule o perodo da o
rbita.
3.10 Mostre que a matriz

1 1 1
A = 1 1 1
1 1 0

e positiva indefinida, i.e. n


ao e nem positiva definida nem negativa definida.
3.11 Considere o sistema
x1 = 3x2 ,

x2 = x1 + 4x2 .

a) Mostre que o ponto de equilbrio (0, 0) e assintoticamente est


avel;
b) Prove que V (x1 , x2 ) := 35 x21 + 2x1 x2 + x22 e uma funca
o de Lyapunov estrita;
c) Considere a soluca
o correspondente a
` condica
o inicial x1 (0) = 0, x2 (0) = 2. Estime o tempo
ts > 0 em que a soluca
o (x1 , x2 ) alcanca a regi
ao x21 + x22 0.02.
(Dica: Encontre a > 0 com V (x) aV (x).)
3.12 Prove que o polin
omio p(t) = t3 + 6r2 + 12r + 9 possui somente raizes com parte real negativa.
3.13 Seja A IRn,n e IR. Prove a equivalencia das afirmaco
es abaixo:

a) max{ Re() | e autovalor de A} < ;

b) Para cada matriz positiva definida W IRn,n , a equaca


o matricial
A W + XA + 2X = W
possui uma u
nica soluca
o positiva definida X.

58

Captulo 4

Estabilizac
ao
Neste captulo utilizamos o conceito de estabilidade introduzido no Captulo 3 e analisamos a seguinte
quest
ao: Como e quando e possvel tornar est
avel um sistema de controle. Tal tarefa, denominada
de estabilizaca
o, tem se mostrado nos u
ltimos anos como uma das aplicaco
es mais importantes da
teoria de controle em problemas de engenharia e tecnologia. A forma cl
assica de realiz
a-la e obter
a entrada (ou controle) a partir do estado ou da sada do sistema. Falamos ent
ao de realimentaca
o
de estado ou de sada. A quest
ao da estabilizaca
o permite abordagens tanto qualitativas quanto
quantitativas, ambas aqui discutidas.
Na Secca
o 4.1, definimos os sistemas lineares estabiliz
aveis e discutimos um resultado sobre
estabilizaca
o de sistemas aut
onomos control
aveis. A seguir e analisada uma condica
o necess
aria
e suficiente para estabilizaca
o de sistemas aut
onomos. Na Secca
o 4.2, consideramos o problema
quantitativo relacionado a
` estabilizaca
o. O metodo de colocaca
o de p
olos nos fornece uma estratetiga
de estabilizaca
o, na qual e possvel escolher o grau de estabilidade do sistema estabilizado. Na
Secca
o 4.3 e apresentada a estrategia de Luenberger (observador din
amico), atraves da qual o estado
de um sistema paralelo e utilizado para estabilizar o sistema dado. Na Secca
o 4.4 e discutido
um metodo de estabilizaca
o que combina o observador din
amico com a realimentaca
o de sada. Na
Secca
o 4.5 consideramos o problema de estabilizar o ponto de operaca
o (desconhecido) de um sistema
linear.

4.1

Sistemas Lineares

Em aplicaco
es s
ao utilizadas essencialmente estrategias de realimentaca
o de sada e de realimentaca
o
de estado, com o objetivo de alterar a din
amica do sistema livre (sem controle) obtendo determinadas
propriedades, que podem ser:
BIBOestabilidade; (qualitativo)
Estabilidade assint
otica; (qualitativo)
Aceleraca
o do retorno ao ponto de equilbrio. (quantitativo)
No caso dos sistemas de controle lineares aut
onomos, as propriedades acima est
ao intrinsecamente
relacionadas com os autovalores da matriz do sistema. Dadas A IRn,n e B IRn,m , considere o
sistema de controle
z 0 = A z + B u.
(4.1)
59

Supondo que o controle u e obtido a partir do estado z por uma lei linear, escrevemos
u = F z,
onde F IRm,n . Substituindo em (4.1), obtemos
z 0 = (A + B F ) z.

(4.2)

A fim de tornar o ponto de equilbrio z = assintoticamente est


avel, devemos escolher F de modo
que A + BF seja uma matriz est
avel (veja Definica
o 3.2.6).
Defini
c
ao 4.1.1 O sistema de controle (A, B) e denominado estabiliz
avel quando existe F IR m,n
n,n
tal que a matriz A + BF IR
e est
avel.
2 2 2
O sistema (4.1), quando escrito com o controle de malha fechada, toma a forma (A + BF, B). A
controlabilidade de (A, B) implica na controlabilidade de (A + BF, B). Este argumento nos leva ao
seguinte teorema:
Teorema 4.1.2 Seja (A, B) e um sistema aut
onomo control
avel. Ent
ao (A, B) e estabiliz
avel pela
matriz de realimentaca
o
F := B WT1 ,
onde
WT :=

etA BB etA dt, T > 0.

Demonstraca
o: A ideia e uilizar o Teorema 3.6.5 com
(A, , C) = ((A + BF ) , , B )

e X = WT .

Para garantir a estabilidade de (A + BF ) ou equivalentemente de (A + BF ) basta verificar que:


(1)
(2)
(3)

WT e positiva definida;
((A + BF ) , , B ) e observ
avel;
W := (A + BF )WT WT (A + BF ) e tal que
W BB e positiva semi-definida.

(1) Por construca


o, WT e positiva semi-definida. Logo, WT e n
ao singular para T > 0 e, portanto,
WT e positiva definida.
(2) Como (A, B) e control
avel, (A, B) tambem o e. Dasegue a controlabilidade de ((A+BF ), B).
Por fim, segue a observabilidade de ((A + BF ) , , B ).
(3) Observe que
(A + BF )WT + WT (A + BF )

= AWT BB + WT A BB
Z T

d tA
(e
BB etA ) dt 2BB
=
dt
0

= eT A BB eT A + BB 2BB

= eT A BB eT A BB .
Chegamos assim a
` identidade

W = eT A BB eT A + BB ,

a qual nos permite concluir que W BB e positiva semi-definida.


60

Observa
c
ao 4.1.3 O Teorema 4.1.2 garante que sistemas aut
onomos control
aveis s
ao estabiliz
aveis
por realimentaca
o de estado. A recproca entretanto n
ao e verdadeira, conforme podemos verificar
no seguinte exemplo trivial:

A matriz est
avel, B =
z 0 = Az + Bu
2 2 2
A fim de esclarecer a quest
ao levantada na Observaca
o 4.1.3, investigamos condico
es suficientes
para garantir a controlabilidade de sistemas estabiliz
aveis. Este e o objetivo do teorema
Teorema 4.1.4 Seja (A, B) um sistema aut
onomo de controle. Ent
ao (A, B) e control
avel se e
somente se (A, B) e (A, B) s
ao ambos estabiliz
aveis.

Demonstraca
o: Seja (A, B) control
avel. Ent
ao (A, B) e control
avel e a estabilidade de (A, B)

e (A, B) segue do Teorema 4.1.2. Reciprocamente, sejam (A, B) e (A, B) estabiliz


aveis. E
possvel escrever os sistemas (A, B) na forma normal






B1
A11 A12
x1 0
u,

A22
x2 0
onde (A11 , B1 ) e control
avel. O sistema


A11

A12
A22


 
B1
,

e estabiliz
avel quando existe uma matriz F = (F1 , F2 ) tal que


A11 + B1 F1 A12 + B1 F2

A22
e uma matriz est
avel. Conclumos da que os blocos A22 possuem somente autovalores com parte
real estritamente menor que zero. Como essa condica
o n
ao pode ser satisfeita simulteneamente para
A22 e A22 , temos que o bloco A22 n
ao pode existir na forma normal. Temos ent
ao que
A = P 1 A11 P, B = P 1 B1 ,

onde P e n
ao singular. A controlabilidade de (A, B) segue agora da controlabilidade de (A 11 , B1 ).
Exemplo 4.1.5 Considere novamente o problema do equilbrio de um bast
ao vertical. A equaca
o
diferencial e
g = u(t),
que se escreve na forma do sistema

z 0 = Az + Bu com A =

0 1
g 0

, B=

0
1

O sistema (A, B) e control


avel devido a
` condica
o de posto. Logo, o Teorema 4.1.4 garante sua
estabilidade. O Teorema 4.1.2 nos permite ainda calcular a matriz de ganho F , isto porem exige
algumas contas longas.
2 2 2
O problema da estabilizaca
o de sistemas n
ao lineares e discutido em [Is]. Em particular os
sistemas Single-Input Single-Output (SISO) n
ao lineares s
ao tratados no Captulo 4, onde e possvel
identificar semelhancas com a abordagem aqui apresentada para sistemas lineares. Uma tecnica
baseada na utilizaca
o de series de Fourier (equilbrio harm
onico) pode ser encontrada em [F
o1,
Captulo 2].
61

4.2

Coloca
c
ao de P
olos

Uma vez esclarecida a quest


ao de que todo sistema control
avel pode ser estabilizado por uma estrategia de controle de realimentaca
o do tipo u = F z, concentra-mo-nos no problema de escolher a
posica
o no plano complexo dos autovalores da matriz do sistema
z 0 = (A + BF )z.
Esta tarefa e equivalente a
` de escolher os p
olos de uma funca
o racional colocaca
o de p
olos. Tratamos
nesta secca
o apenas de sistemas com controle escalar (m = 1), isto e, da forma
z 0 = Az + bu com A IRn,n , b IRn .
Investigamos a princpio um resultado do tipo formanormal.
Lema 4.2.1 Seja A IRn,n e b IRn . S
ao equivalentes as afirmaco
es:
a) (A, b) e control
avel;

b) Existe P IRn,n inversvel tal que o


+ bu com
x0 = Ax

0
1
0
0
0
1

..
..
..

.
.
A = .
0
0
0

0
0
0
a0 a1 a2

sistema (A, b) nas coordenadas x = P z tenha a forma

..
.

0
0
..
.

0
0
..
.

1
0
an2

0
1
an1

0
0
..
.

, b =
.
0

Os n
umeros a0 , . . . , an1 s
ao os coeficientes do polin
omio caracterstico p de A: p(r) = r n +
Pn1
i
i=0 ai r .

Demonstraca
o: a) = b) Basta encontrar uma base w 1 , . . . , wn para IRn , de modo que a matriz
n,n
P IR
definida pelas equaco
es
P wk = ek , 1 k n,
satisfaca

(i) P b = en ,

(ii) P AP 1 e1 = a0 en ,

(iii) P AP 1 ek+1 = ek ak en , 1 k < n.

Definimos wk recursivamente por


wn = b,

wk = Awk+1 + ak b, 1 k < n.

Temos ent
ao
wk = Ank b +

nk
X
j=1

anj Ankj b, 1 k n.

(4.3)

Como b, Ab, . . ., An1 b s


ao linearmente independentes (devido a
` controlabilidade de (A, b)), temos
de (4.3) que w1 , . . . , wn tambem o s
ao. Do teorema de CaleyHamilton, temos que p(A) = . Logo,
P b = P wn = en (provando (i)) ;
n1
X
1
n
Aw = A b +
anj Anj b a0 b = p(A)b a0 b = a0 b
j=1

= a0 wn (provando (ii)) ;

Awk+1 = wk ak en , 1 k n (provando (iii)).


62

b) satisfazendo as hip
b) = a) Seja agora o sistema (A,
oteses do item b). O criterio do posto nos
garante que esse sistema e control
avel. Logo, (A, b) e tambem control
avel.
O teorema a seguir esclarece o resultado principal sobre a colocaca
o de razes dos polin
omios
caractersticos de sistemas de controle.
r+1 , . . ., s ,
s
Teorema 4.2.2 Seja (A, b) um sistema control
avel e 1 , . . ., r IR, r+1 ,
n
umeros complexos dados, com r + 2(s r) = n. Ent
ao existe f IR tal que o polin
omio
C\IR n
r+1 , . . ., s ,
s .
caracterstico de A + bf possui como razes 1 , . . ., r , r+1 ,
Demonstraca
o: Seja f um vetor com componentes f0 , . . . , fn1 . O Lema 4.2.1 nos permite escrever
o sistema A + bf (a menos de uma mudanca de vari
aveis) na forma

0
1
0

0
0

0
0
1

0
0

..
..
..
.
.
..
..
..

.
.
.
.
A + bf =
,

0
0
0

1
0

0
0
0

0
1
f0 a0 f1 a1 f2 a2 fn2 an2 fn1 an1
onde a0 , . . . , an1 , 1 s
ao os coeficientes do polin
omio caracterstico de A. Logo, o polin
omio caracterstico p de A + bf satisfaz
n1
X
(fi ai )ri .
p(r) = rn +
i=0

Como os coeficientes fi ai , i = 0, . . . , n 1 s
ao determinados pelas razes do polin
omio, podemos
determinar f0 , . . . , fn1 (observe que e preciso resolver um sistema n
ao linear com n vari
aveis e n
equaco
es).
Exemplo 4.2.3 Considere novamente o sistema linear (veja Exemplo 4.1.5)




0 1
0
A =
, b =
.
g 0
1
 
` matriz
A estabilizaca
o com f = ff01 IR2 nos leva a
A + bf =

0
g f0

1
f1

cujo polin
omio caracterstico e: 2 + f1 + (f0 g). Se escolhemos os autovalores = 1, obtemos
os coeficientes f0 = g + 1, f1 = 2.
2 2 2
possvel obter um resultado semelhante ao apresentado no Teorema 4.2.2 para
Observa
c
ao 4.2.4 E
sistemas genericos (A, B) com m 1. Neste caso, a demonstraca
o baseia-se na forma normal.
Discutimos aqui o caso geral na forma de algoritmo.
Seja o sistema de controle
z 0 = Az + Bu,

com A IRn,n , B IRn,m .

Procuramos uma matriz F IRm,n tal que os autovalores de A+BF sejam os n


umeros 1 , . . . , n C
dados (note que os autovalores complexos aparecem com seus conjulgados).
Os autovetores de A + BF devem ser encontrados satisfazendo:
(A + BF ) v i = i v i , 1 i n.
63

Definindo q i := F v i , 1 i n, obtemos
(A i I)v i + Bq i = , 1 i n.
Portanto,


vi
qi

Ke(A i I|B), 1 i n,

F = (q 1 | |q n )(v 1 | |v n )1 ,

caso det(v 1 | |v n ) 6= 0. Essa u


ltima condica
o e satisfeita quando A + BF e diagonalis
avel, o que
por sua vez pode ser garantido pela escolha dos autovalores 1 , . . . , n C.
2 2 2
Exemplo 4.2.5 Considere o sistema de controle com matrizes

1 0
0 1
0
1 , B = 0 0 .
A = 0 0
0 1
4 4 1

Os autovalores do sistema livre (u = 0) s


ao 1, 2, 2. Escolhemos para novos autovalores os valores:
1 = 2, 2 = 3, 3 = 4. Calculamos a seguir o n
ucleo de (A i I | B) i = 1, 2, 3, onde

i
1
0
1 0
i
1
0 0 .
(A i I | B) = 0
4
4
i 1 0 1

Um simples c
alculo nos permite obter Ke(A i I | B), sendo estes para i = 1, 2, 3 respectivamente
span{(1, 2, 4, 0, 0), (1, 0, 0, 2, 4)}, span{(3, 2, 6, 5, 0), (2, 3, 9, 0, 26)},
Podemos escolher ent
ao:

span{(2, 1, 4, 9, 0), (2, 4, 16, 0, 36)}.






0
1
1
3
v1 = 1 , q1 =
, v2 = 0 , q2 =
,
52
2
5
2
0



0
1
v3 = 1 , q3 =
.
8
4

Obtemos assim a matriz de ganho

F =
e a matriz do sistema de malha fechada e

3
52
5

1
0
12 5

3
A + BF = 0
72
5

0
0
0
1 .
8 6

2 2 2

Uma interessante aplicaca


o da colocaca
o de p
olos para um modelo de um reator qumico e
discutida em [KnKw] (ver exemplo 5.5). Neste problema a vari
avel de estado (z IR 5 ) corresponde
a
` temperatura em diferentes partes do reator, enquanto que o controle (u IR 3 ) corresponde a
`
abertura de tres v
alvulas de refrigeraca
o disponveis.
64

4.3

Observador Din
amico

Dadas A IRn,n , B IRn,m , C IRl,n considere o sistema de controle (A, B, C). Na Secca
o 4.1,
vimos que para estabilizar um sistema utilizando uma estrategia de realimentaca
o de estado da
forma u = F z temos que encontrar F de modo a tornar a matriz (A + BF ) est
avel.
Fazemos agora o desenvolvimento equivalente para o problema de realimentaca
o de sada, quando
procuramos controladores da forma u = F y. Note que
u = F y = F Cz, F IRm,l .
O objetivo e ent
ao encontrar F de modo que o ponto de equilbrio z = do sistema z 0 = (A+BF C)z
seja assintoticamente est
avel. Tal abordagem encontra serios obst
aculos a
` sua realizaca
o, pois mesmo
as hip
oteses
(A, B) control
avel, (A, , C) observ
avel
n
ao s
ao suficientes para garantir a estabilidade da matriz (A + BF C). Tal fato pode ser comprovado
no simples exemplo a seguir.
Exemplo 4.3.1 Considere o problema de controle descrito por
x
+ x = u, y = x.
Na forma de sistema temos

z0 =

0 1
1 0

y = (1 0)

z +

z1
z2

0
1

f
E
acil verificar que os sistemas (A, B) e (A, , C) s
ao respectivamente control
avel e observ
avel. Escolhendo agora uma estrategia de controle linear de realimentaca
o de sada, temos
u := f y, com f IR1,1 .
Obtemos assim a equaca
o x
+ (1 f )x = 0, que corresponde ao sistema z 0 = (A + Bf C)z, com
(A + Bf C) =

0
1
f 1 0

Calculando o polin
omio caracterstico deste novo sistema, obtemos p(r) = r 2 + (1 f ) = 0, que
possui razes:
p
= f 1.

Obviamente e impossvel encontrar f IR que satisfaca Re(+ ) < 0 e Re( ) < 0 ao mesmo tempo.
Portanto, o sistema n
ao e estabiliz
avel.
2 2 2

Na Secca
o 4.4 e analisada uma alternativa para a estabilizaca
o por realimentaca
o de sada, que
consiste de duas etapas: inicialmente o estado e recontrudo a partir da sada; em um segundo passo
utiliza-se a aproximaca
o do estado na realimentaca
o.
A fim de reconstruir dinamicamente o estado z a partir da observaca
o y, utilizamos a seguinte
ideia:
65

O sistema (A, B, C) e simulado por outro com a mesma estrutura;


Seja x o estado desse sistema paralelo e w = Cx sua sada;
O controle do sistema paralelo e constitudo pelo controle do sistema usual adicionado de
uma componente da forma L(w y), com L IRn,l ;
Obtemos assim o sistema
x0 = Ax + Bu + L(Cx y), w = Cx,
que e denominado observador din
amico;1
A diferenca entre os estados do observador e do sistema original e definida por := z x
e satisfaz
0 = A L(Cx Cz) = (A + LC) ;
L e escolhido tal que (A + LC) seja est
avel, garantindo assim lim (t) = .
t

A an
alise da estabilidade de (A + LC) nos leva ao conceito de detectabilidade. O teorema a
seguir estabelece a equivalencia entre a detectabilidade de um sistema (A, , C) e a estabilidade da
matriz do observador din
amico (A + LC).
Teorema 4.3.2 Dadas A IRn,n e C IRl,n , s
ao equivalentes as afirmaco
es:
a) (A, , C) e detect
avel;

ao Cv 6= ;
b) Se v C n e autovetor de A e seu autovalor satisfaz Re() 0, ent

c) (A , C ) e estabiliz
avel;

d) Existe L IRn,l tal que a matriz (A + LC) e est


avel.

Demonstraca
o: a) = b) Sejam v e como em b). Considere as soluco
es especiais do problema de
valor inicial z 0 = Az, z(0) = v dadas por
zr (t) := Re(et v), zi (t) := Im(et v), t IR.
Note que, se Cv = , ent
ao v pertence ao subespaco n
ao observ
avel de (A, , C). Neste caso,
limt zr (t) 6= , contradizendo a detectabilidade de (A, , C).
b) = c) Note que e possvel escrever o sistema (A , C ) na forma normal




CI
AI

,
, C =
A =

AII
com (AI , CI ) control
avel. Analisamos separadamente as duas possveis situaco
es:
Se o bloco AII n
ao existir, temos (A , C ) = (P 1 AI P, P 1 CI ). Logo, (A , C ) e control
avel.
O item c) segue agora do Teorema 4.1.2.
Suponha que o bloco AII esteja presente na forma normal. Se e um autovalor de AII e w um
autovetor correspondente, temos para v = w que
= .
A v = v, Cv

uentemente AII ) e uma


Da hip
otese em b) segue que Re() < 0, provando assim que AII (e conseq
matriz est
avel. Da controlabilidade de (AI , CI ) segue sua estabilizabilidade, i.e. existe FI tal que
1A

escolha da letra L para o observador se deve a D.G. Luenberger, que introduziu esta ideia.

66

(AI + CI FI ) e est
avel. Temos ent
ao que a matriz

A I + C I FI

A + C (FI | ) =

AII

C)
e (P 1 AP,
P 1 C)
= (A , C ), ent
e est
avel. Como F = (FI |) estabiliza (A,
ao F = F P

estabiliza (A , C ).
c) = d) Por hip
otese, existe uma matriz D tal que a matriz A + (C )(D) e est
avel. Logo,
A + LC e est
avel com T
a escolha L := D .
n1
d) = a) Dado z0 k=0 Ke(CAk ) defina z(t) := etA z0 , t IR. Do teorema de CaleyHamilton
segue Cz(t) = , para t 0. Logo, z tambem e soluca
o de
z 0 = (A + LC) z.

Como os autovalores da matriz (A + LC) possuem parte real negativa, temos que lim z(t) = .
t

Exemplo 4.3.3 Vamos aplicar a ideia do observador din


amico ao sistema (A, B, C) com matrizes


 

1
3
1
A=
, B=
, C= 1 0 .
0 2
1

f
E
acil ver que (A, B) e control
avel, e portanto tambem detect
avel. Os autovel e (A, , C) observ
 a
l1
ao obtidos resolvendo-se a equaca
o
valores de A + LC com L = l2 s
0 = det(I (A + LC)) = 2 + (3 l1 ) + (2 2l1 3l2 ).

(4.4)

Escolhemos para a matriz A + LC os autovalores 1 = 9, 2 = 10. Resolvendo (4.4) para (l1 , l2 ),


obtemos l1 = 16, l2 = 56/3. O observador din
amico possui ent
ao a seguinte estrutura:
+ Bu Ly,
x0 = Ax

com
A =

17
3
56/3 2

, B=

1
1

, L=

16 56/3

O observador din
amico nos permite reconstruir a componente z2 do estado note que a componente z1 j
a e observada. Suponha que temos a seguinte situaca
o:
 
 
0
0
u(t) 1, z(0) =
, x(0) =
,

0
com IR. O erro de reconstruca
o := z x satisfaz

0 = (A + LC)
 
(0) = 0

Os autovalores de A + LC s
ao 1 = 9, 2 = 10 e os respectivos autovetores s
ao v1 =
 
1
v2 = 7/3
. Temos ent
ao


 9t

1 (t)
3e
3e10t
(t) =
=
.
2 (t)
8e9t 7e10t

1
8/3

Nos interessa saber o qu


ao r
apido 2 converge a zero. Para t = 0.5, temos e2 (t) = 0.041 (aproximadamente 4% do erro inicial) e para t = 0.9, temos e2 (t) = 0.015 (i.e. 0.1% do erro inicial).
2 2 2
67

possvel utilizar sistemas auxiliares observadores tambem para sistemas de controle n


E
ao lineares.
Para maiores detelhes, consulte [KIF], [Is]. Ainda no contexto de sistems aut
onomos, o leitor pode
encontrar em [KnKw] detalhes sobre o observador reduzido (semelhante ao observador discutido
nesta secca
o).

4.4

Estabiliza
c
ao por Realimenta
c
ao de Sada

O Exemplo 4.3.1 nos mostra que a forma cl


assica da estabilizaca
o por realimentaca
o de sada u =
F y = F Cx nem sempre e possvel. Uma alternativa e utilizar o observador din
amico para encontrar
uma aproximaca
o para o estado, e, a partir desta aproximaca
o, escolher o controle.
O observador din
amico e definido pelo sistema (veja Secca
o 4.3)
 0
x = Ax + Bu + L(w y)
(4.5)
w = Cx
A partir do estado x escolhemos um controle de realimentaca
o da forma u = F x. Substituindo esse
controlador no sistema (A, B), obtemos para (z, x) o sistema acoplado:
 0
z = Az + BF x
(4.6)
x0 = (A + BF + LC)x LCz
que est
a associado a
` matriz
A =

A
LC

BF
A + BF + LC

Se a matriz A for est


avel, conseguimos atingir o nosso objetivo inicial de estabilizar (A, B, C) atraves
do sistema acoplado (4.6) constitudo de processo mais observador. Note que esta abordagem nos
permite, alem de estabilizar o processo, reconstruir seu estado.
Defina agora w := z x. O sistema (4.6) se escreve nas novas vari
aveis (z, w) como
 0
z = (A + BF )z + BF w
(4.7)
w0 = (A + LC)w
Conclumos assim que a matriz A e semelhante a
` matriz


A + BF
BF
A =
.

A + LC
Note, porem, que a estrutura de
A tarefa de estabilizar A e portanto equivalente a
` de estabilizar A.
A nos permite escrever
pA = p(A+BF ) p(A+LC) ,
onde pM representa o polin
omio caracterstico da matriz M . Sendo assim, nossa tarefa se reduz a:
Determinar F tal que a matriz A + BF e est
avel;
Determinar L tal que a matriz A + LC e est
avel.
Conhecemos, entretanto, da Definica
o 4.1.1 e do Teorema 4.3.2 condico
es necess
arias e suficientes
para que os objetivos acima possam ser alcancados. S
ao essas respectivamente:
(A, B) estabiliz
avel,
(A, , C) detect
avel.
68

Exemplo 4.4.1 Considere o sistema (A, B, C) do Exemplo 4.3.3 com matrizes:







1
1
3
1 0 .
, C =
, B =
A =
1
0 2

Vimos naquele exemplo que a matriz

L =

16
56/3

e tal que A + LC possui autovalores 9 e 10. Se F =


dados pelas razes do polin
omio caracterstico


f1

f2

, os autovalores de A + BF s
ao

det(I (A + BF )) = 2 + (3 f1 f2 ) + (2 5f1 f2 ).
Escolhendo para A+BF os autovalores 1 = 5, 2 = 6, obtemos para F os coeficientes: f1 = 5,
f2 = 3. Portanto, a matriz do sistema (4.7) assume a forma

6
0
5
3
5 5
5
3
.
A =
0
0 17
3
0
0 56/3 2
2 2 2

A estabilizaca
o por realimentaca
o de sada para sistemas SISO n
ao lineares especiais e considerada
em [KIF].

4.5

Pontos de Opera
c
ao

Nesta secca
o consideramos os problemas de determinaca
o e estabilizaca
o de pontos de operaca
o.
Considere um sistema de controle (A, B), no qual a vari
avel de controle u se decomp
oe em uma
entrada fixa u
(desconhecida) e um sinal de controle v. O sistema se escreve ent
ao como
z 0 = Az + B(
u + v).

(4.8)

O ponto de operaca
o zo do sistema (4.8) corresponde ao ponto de equilbrio do sistema livre (i.e.
v 0). Temos assim
zo = A1 B u
.
O problema abordado nesta secca
o e o de encontrar uma estrategia de controle v que torne o ponto
de operaca
o assintoticamente est
avel e que, se possvel, nos permita identific
a-lo.
Note que se u
e conhecido, recamos no problema de estabilizaca
o do sistema (A, B). De fato,
uma vez calculado zo , basta fazer a mudanca de vari
avel x = z zo para que o estado x satisfaca a
din
amica x0 = Ax + Bv.
Utilizando uma abordagem semelhante a
` do observador din
amico, e possvel n
ao somente estabilizar o ponto de operaca
o, como tambem determin
a-lo. Vamos aproximar o estado z por x
satisfazendo a din
amica:
x0 = L(z x),
onde L IRn,n e n
ao singular. Escolhemos agora para (4.8) um controle da forma
v = F (z x).
69

Fazendo a mudanca de vari


aveis z = z zo , x = x zo , obtemos
x
0 = L(z x) = L(
zx
)

e ainda

z0 = z 0 = Az + B u
+ BF (z x) = A
z + BF z BF x
.

Temos ent
ao, para o par (
z x), o sistema

 0 
A + BF
z
=
L
x0

BF
L

 

z
x

(4.9)

Portanto, basta encontrar matrizes F e L, tais que a matriz do sistema (4.9) seja est
avel. Note que,
se A e est
avel, uma escolha possvel e F = , L = I.
Exemplo 4.5.1 Considere o sistema de controle (A, B) com matrizes:




1
1
3
.
, B =
A =
1
0 2
Supomos F e L da forma:
F =

f1
f2

, L =

l1
l2

l2
l1

A fim de torna a matriz A + BF est


avel, escolhemos f1 = f2 = 3, obtendo assim:


2
0
A + BF =
.
3 5
Temos ent
ao


A + BF
L

BF
L

cujo polin
omio caracterstico e:

2
0
3 5
=
l1
l2
l2
l1

3
3
3
3
,
l1 l2
l2 l1

p() = 4 + (7 + 2l1 ) 3 + (10 + 8l1 + l12 l22 6l2 ) 2 + (8l1 + l12 l22 12l2 ) + 2(l22 l12 ).
A observ
ancia do criterio de Hurwitz (veja Teorema 3.3.5) nos leva a escolher os coeficientes l 1 = 1,
l2 = 3. As razes obtidas s
ao
1 = 2 = 2, 3 = 1, 4 = 4.

1 3
Logo, F = 3 3 e L = 3
ca
o.
1 estabilizam o ponto de opera
Para
fins
de
c
a
lculo,
suponha
u

=
2.
O
ponto
de
opera
c
a

o
correspondente
e z o = A1 B u
=


5
5
co
es iniciais: z(0) = 0 e x(0) = . Temos ent
ao
1 . Suponha as condi

0


1
z(0)

=
5
x
(0)
1


e a soluca
o do sistema (
z0 x
0 ) e:


z(t)
x(t)

66et + 66e2t + 48te2t

33et 34e2t 48te2t

=
t
77e + 96te2t + 12e4t + 60e2t .
55et 44e2t 96te2t 12e4t
70

2 2 2

Exerccios
4.1 Considere o sistema SISO (A, b) com


1
6 1
1
1 , b = 1 .
A = 1 1
2
2
0
1
b) do sistema (b = (0, 0, 1)).
Encontre a forma normal (A,

4.2 Considere o sistema SISO (A, b) com


0
0 1 0
A = 0 0 1 , b = 0 .
1
2 3 0

Encontre uma estrategia de realimentaca


o de estado u = f x, com f = (f 1 , f2 , f3 ), tal que o sistema
de malha fechada A + bf possua autovalores 1 + i, 1 i, 4.
4.3 Considere o sistema (A, B) com

0 1
1 1 0
A = 1 0 1 , B = 1 0 .
0 1
0 0 1

a) Mostre que (A, B) e control


avel;

b) Encontre uma estrategia de realimentaca


o de estado u = F x, tal que o sistema de malha fechada
A + BF possua autovalores 4, 5, 6.
4.4 Construa um observador din
amico para o sistema

1
0
0
A = 2 2 2 , C =
1
0 3

1 1 1

tal que A + LC possua autovalores 8, 9, 10.

4.5 Encontre uma estrategia de realimentaca


o F e um observador L para o sistema (A, B, C) com

1
1
0
0

A = 2 2 2 , B = 0 , C = 1 1 1 ,
1
1
0 3

tal que A + BF possua autovalores 4, 5, 6 e A + LC possua autovalores 8, 9, 10.

71

72

Captulo 5

Princpio do M
aximo
Neste captulo e analisado um conjunto de condico
es necess
arias para otimalidade de soluco
es de
problemas de controle o
timo. Tal resultado e conhecido na literatura como princpio do m
aximo 1 e
muito se assemelha a um teorema de multiplicadores de Lagrange, formulado em espacos de dimens
ao
infinita.
Com hip
oteses adicionais de convexidade, o princpio do m
aximo pode ser demonstrado utilizandose argumentos elementares de an
alise. Em particular, a condica
o de m
aximo e obtida a partir da
equaca
o de EulerLagrange. No caso geral (sem a hip
otese de convexidade da Hamiltoniana), a
demonstraca
o da necessidade da condica
o de m
aximo e mais complicada e necessita de alguns resultados oriundos da teoria de otimizaca
o em espacos de dimens
ao infinita.
A autoria do princpio do m
aximo e controversa. A maioria dos autores credita a condica
o de
m
aximo ao grupo liderado pelo matem
atico russo L.S. Pontryagin (1956). Entretanto, tal condica
o
pode ser encontrada em um texto anterior, porem pouco divulgado, de M.R. Hestenes (1950). Para
maiores detalhes consulte [Hes], [PBG], assim como o artigo de Hestenes2 em [BaNe].
O captulo e organizado da seguinte forma: Na Secca
o 5.1 apresentamos o princpio do m
aximo
para problemas de controle o
timo com horizonte finito. Algumas variantes do resultado, correspondentes a diferentes condico
es de contorno, s
ao tambem analisadas nesta secca
o. Na Secca
o 5.2
consideramos o princpio do m
aximo para problemas com horizonte infinito. Na Secca
o 5.3 s
ao discutidas diversas aplicaco
es, nas quais o princpio do m
aximo e utilizado na identificaca
o de processos
o
timos.

5.1

Problemas com Horizonte Finito

Comecamos por discutir uma formulaca


o bastante geral para problemas de controle o
timo com
horizonte finito. Considere o problema de controle

Z t1

Minimizar
J(z,
u)
:=
L
(t
,
z(t
))
+
L(t, z(t), u(t)) dt
1 1
1

t0

sujeito a
P (t0 , z0 )
t1 t0 ; u L1 ([t0 , t1 ]; IRm ), u(t) q.s. em [t0 , t1 ] ;

Z t

f (s, z(s), u(s)) ds, t [t0 , t1 ] ; (t1 , z(t1 )) =


z(t) = z0 +
t0

1 Tamb
em

conhecido como princpio do mnimo, ou princpio de Pontryagin.


M.R., Variational theory and optimal control theory, 1 22

2 Hestenes,

73

onde

L : [t0 , ) IRn IRm IR, L1 : [t0 , ) IRn IR,


f : [t0 , ) IRn IRm IRn , : [t0 , ) IRn IRp

e IRm . O tempo inicial t0 e a condica


o inicial z0 s
ao fornecidos, enquanto que o tempo final t1
e a condica
o final s
ao, a princpio, desconhecidos.
Note que o fato da din
amica do sistema ser descrita por uma equaca
o integral ao inves de
diferencial, permite-nos considerar traje
orias admissveis menos regulares. O conjunto das estrategias
de controle admissveis e
Uad := L1loc ([0, ); IRm ).
Desta forma, as trajet
orias correspondentes s
ao funco
es absolutamente contnuas em [t 0 , t1 ].
Defini
c
ao 5.1.1 Sejam f , L as funco
es definidas acima. A aplicaca
o
H : [t0 , ) IRn IRn IRm IR,

(t, z, , u) 7 h, f (t, z, u)i + L(t, z, u)


e denominada funca
o de Hamilton (note que a origem da constante precisa ainda ser esclarecida).
2 2 2
No teorema a seguir apresentamos o princpio do m
aximo. Por ser longa e tecnica, a demonstraca
o
n
ao e apresentada nestas notas. A argumentaca
o utilizada na demontraca
o segue a linha das notas
de aula de M. Brokate (veja [Br]).
Como referencias auxiliares o leitor pode consultar [PBG], [Hes], [Ber], [Know], [MaSt], [Za],
entre outros. A obtenca
o do princpio do m
aximo para problemas com tempo final fixo (t 1 = T
conhecido) e mais simples, podendo ser encontrada em [FlRi, Captulo 2], [Ho, Captulo 9] ou [Tr,
Teorema 11.8].
Teorema 5.1.2 Suponha que L, f s
ao aplicaco
es C 2 e que L1 , s
ao C 1 . Se (
z, u
, t1 ) e uma soluca
o
do problema P (t0 , z0 ), tal que
z (t1 , z(t1 )) 6=

(L1 )z (t1 , z(t1 )) 6= ,

ent
ao existe uma funca
o : [t0 , t1 ] IRn e constantes 0, IRp que satisfazem:

i) Equaca
o de estado

z(t) = z0 +
ii) Equaca
o adjunta

(t) = 1 +

t
t0

f (s, z(s), u
(s)) ds, t [t0 , t1 ] ;

t1

H
(s, z(s), (s), u(s)) ds, t [t0 , t1 ],
z

:= L1 (t1 , z(t1 ))
(t , z(t1 )) ;
z
z 1
t

iii) Equaca
o de evoluca
o da funca
o de Hamilton

Z t1

H(t, z(t), (t), u


(s, z(s), (s), u
(s)) ds, t [t0 , t1 ],
(t)) = H1
t
t
D
E

H1 := L1 (t1 , z(t1 )) + (t1 , z(t1 )), ;


t
t
74

iv) Condica
o de otimalidade
H(t, z(t), (t), u(t)) = min H(t, z(t), (t), u), q.s. em [t0 , t1 ] ;
u

v) Condica
o de n
ao acoplamento + || 6= 0.
A demonstraca
o do Teorema 5.1.2 constitui-se na aplicaca
o de um teorema de multiplicadores a
um problema auxiliar, obtido de P (t0 , z0 ) por uma mudanca de vari
aveis denominada transformaca
o
no tempo e cuja solubilidade est
a relacionada a de P (t0 , z0 ). As constantes e surgem na demonstraca
o como componentes de um vetor normal a um hiperplano, que separa conjuntos de nvel
associados a
` funca
o objetivo J e a
` condica
o final (t, z(t)) = .
Observa
c
ao 5.1.3 A denominaca
o princpio do m
aximo e motivada pelo item iv) do Teorema 5.1.2,
que, entretanto, refere-se a
` determinaca
o de um mnimo. Note, porem, que a elementar substituica
o
de J por J permite-nos trocar o problema de minimizaca
o por um de maximizaca
o, alterando assim
o min da condica
o iv) para max. Sem d
uvida, as condico
es mais interessantes do Teorema 5.1.2 s
ao

z 0 = H (t, z, , u), z(t0 ) = z0 , (t1 , z(t1 )) = 0,

0 = Hz (t, z, , u), (t1 ) = L1 (t1 , z(t1 )) (t1 , z(t1 )) ;


z
z
H(t, z, , u) = min H(t, z(t), (t), w), q.s. em [t0 , t1 ] .
w

Note que o par (z, ) e soluca


o de um sistema hamiltoniano para a funca
o H.

2 2 2

Observa
c
ao 5.1.4 Analogamente aos problemas variacionais, os problemas de controle o
timo tambem
podem ser formulados com diferentes tipos de condico
es de contorno. A cada um destes tipos corresponde uma variante do Teorema 5.1.2, que se diferencia deste apenas pelas condico
es de contorno
da vari
avel adjunta e da funca
o de Hamilton. Enunciamos a seguir algumas variantes do problema
P (t0 , z0 ) que surgem com maior freq
uencia nas aplicaco
es. Apresentamos tambem as condico
es
necess
arias correspondentes para cada problema.
Considere o problema P (t0 , z0 ) com t1 fixo (t1 > t0 ) e L1 .
Se a condica
o final e fixada (z(t1 ) = z1 ), n
ao h
a nenhuma condica
o para (t1 ) (corresponde a
`
escolha (t, z) := (t t1 , z z1 ) IR2 ).
Se a condica
o final e livre (z(t1 ) qualquer), a vari
avel adjunta satisfaz (t1 ) = (corresponde a
`
escolha (t, z) := t t1 IR).
Se a condica
o final e da forma: z(t1 ) z1 (no caso escalar), a vari
avel adjunta satisfaz (t1 ) 0,
ocorrendo a igualdade quando z(t1 ) > z1 .
Considere o problema P (t0 , z0 ) com L1 . Neste caso, as condico
es para (t1 ) discutidas acima
n
ao se alteram e, alem disso,
H(t1 , z(t1 ), (t1 ), u(t1 )) = 0 .
Esta equaca
o extra corresponde a
` vari
avel adicional do problema, representada pelo tempo final
desconhecido t1 .
2 2 2
O princpio do m
aximo pode, em alguns casos, ser utilizado para efetivamente determinar uma
soluca
o do problema P (t0 , z0 ). Para tanto, aplica-se a seguinte estrategia: Inicialmente explicitamos
o controle u em funca
o das vari
aveis z e , obtendo assim
u() = U (, z(), ()) .
75

1. Estime 0 := (t0 ) e ;
2. Resolva o problema de valor inicial

z 0 = + H (t, z, , 1, U (t, z, )), z(t0 ) = z0 ,

0 = H (t, z, , 1, U (t, z, )), (t0 ) = 0 ;


z

3. Aprimore a estimativa (p.ex. atrav


es do m
etodo de Newton)
com o objetivo de satisfazer as equa
co
~es
(t1 , z(t1 )) = 0,

(t1 ) =

L1

(t1 , z(t1 ))
(t1 , z(t1 )) ;
z
z

4. Retorne ao passo 2.
Figura 5.1: Algoritmo do metodo de shooting para sistema hamiltoniano
O pr
oximo passo e substituir essa express
ao no problema de valor de contorno da Observaca
o 5.1.3
(eliminando a vari
avel u):
z0
0
H0

H (t, z, , U ), z(t0 ) = z0 , (t1 , z(t1 )) = 0 ;


L1

= Hz (t, z, , U ), (t1 ) =
(t1 , z(t1 ))
(t1 , z(t1 )) ;
z
z
H
=
(t, z, , U ) ,
t
D
E
L1
(t1 , z(t1 )) +
(t1 , z(t1 )),
H(t1 , z(t1 ), (t1 ), U (t1 )) =
t
t

(5.1)
(5.2)
(5.3)

Este sistema e ent


ao resolvido, com o intuito de obter um candidato a
` soluca
o do problema de
controle P (t0 , z0 ). Entretanto, nem sempre e possvel obter a representaca
o U (, z, ) e nesses casos
fala-se da existencia de uma estrategia de controle singular.
O sistema resultante de (5.1), (5.2), (5.3) pela substituica
o u() = U (, z, ) pode ser resolvido
por um metodo do tipo shooting, conforme mostra o esquema na Figura 5.1 (supomos = 1 no
Teorema 5.1.2).
Observa
c
ao 5.1.5 O problema de valor de contorno (5.1), (5.2), (5.3) possui, tomando o controle u
fixo, 2n+1 vari
aveis (z, , H) e p+1 par
ametros (, ). Temos assim 2n+p+2 graus de liberdade, os
quais est
ao sujeitos a 2n+p+1 equaco
es. Aparentemente, temos um grau de liberdade a mais. Note,
porem, que a condica
o de n
ao acoplamento v) garante que e n
ao s
ao ambos nulos, sendo portanto
sempre possvel simplificar o sistema (5.1), (5.2), (5.3) em relaca
o a ou a uma das componentes
de . Sendo assim, o Teorema 5.1.2 pode ser formulado alternativamente como:
. . . existem : [t0 , t1 ] IRn , = 0 ou = 1, IRp que satisfazem i), . . . , v).
2 2 2
simples verificar que a equaca
Observa
c
ao 5.1.6 E
o de EulerLagrange do c
alculo variacional
pode ser obtida do princpio do m
aximo. De fato, o problema de minimizaca
o cl
assico do c
alculo
76

variacional pode ser interpretado como

Z b

Minimizar J(z, u) :=
L(t, z(t), u(t)) dt
a

0
sujeito a z = u(t) .

Logo, a condica
o de m
aximo iv) do Teorema 5.1.2 implica em
0 =

H

u
+ L (t, z, u
) =
i + L(t, z, u
)] =
(t, z, ,
[h, u
)
u
u
u

e, portanto,

= L (t, z, u

) .
u
O sistema hamiltoniano para as vari
aveis de estado e adjunta se escreve

z = + H = u
d

dt

d = H = L (t, z, u
)
dt
z
z
De (5.4) e (5.5), temos

ou

5.2



L
L
d

(t, z, u
) =
(t, z, u
)
z
dt
u


L
d L
0
0
(t, z, (
z) )
(t, z, (
z) ) = 0 .
z
dt z 0

(5.4)

(5.5)

2 2 2

Problemas com Horizonte Infinito

Analisamos nesta secca


o condico
es necess
arias para problemas de controle o
timo com horizonte
infinito. Os problemas de controle dessa natureza tem ganho import
ancia nas u
ltimas decadas
devido aos modelos matem
aticos oriundos das ciencias econ
omicas e biol
ogicas que os utilizam.
Os primeiros trabalhos a tratar de problemas de otimizaca
o com horizonte infinito s
ao devidos
aos economistas. Uma referencia cl
assica e o artigo escrito em 1928 por F. Ramsey (veja [Ra]), que
trata de problemas do tipo consumo investimento (veja Aplicaca
o 5.3.5). A primeira extens ao
do princpio do m
aximo para problemas com horizonte infinito foi apresentada por H. Halkin em
1964 (veja [Ha]). Um apanhado do desenvolvimento da teoria pode ser encontrado em [CaHa]. Na
abordagem aqui apresentada, seguimos os passos descritos em [Leit], que utiliza um conceito de
otimalidade diferente dos encontrados em [Ha] e [CaHa].
In
umeros modelos econ
omicos (de horizonte finito e infinito) s
ao tratados, sob a o
tica do controle
o
timo e programaca
o din
amica, em [SeSy]. Nesta referencia tambem s
ao analisados problemas de
exploraca
o de recursos naturais. O leitor interessado em aplicaco
es desta natureza deve consultar
ainda [SeZh].
Aplicaco
es a modelos biol
ogicos podem ser encontradas em [Cl]. Um interessante problema
relacionado a
` exploraca
o o
tima de recursos biorenov
aveis (pescaria o
tima) e analisado em [CCM], e
[BaLe].
A seguir analisamos um caso particular do problema abordado na Secca
o 5.1. Trata-se de problemas de controle o
timo com tempo final fixo. A abordagem nesta secca
o de tais problemas (de
horizonte finito) e justificada pelo fato das condico
es necess
arias para estes problemas serem utilizadas na demonstraca
o do princpio do m
aximo para os problemas com horizonte infinito.
77

Suponha que no problema P (t0 , z0 ) o tempo final t1 = T e o estado final z1 = zT s


ao dados.
Temos assim o seguinte problema de controle o
timo:

Z T

L(t, z(t), u(t)) dt


Minimizar
J(z,
u)
:=

sujeito a
Z t
PT (z0 )

z(t) = z0 +
f (s, z(s), u(s)) ds, t [0, T ], z(T ) = zT ;

1
u L ([0, T ]; IRm ), u(t) q.s. em [0, T ] ;
Argumentando como na Observaca
o 5.1.4, obtemos um conjunto de condico
es necess
arias para otimalidade de uma soluca
o do problema PT (z0 ):

Corol
ario 5.2.1 Suponha que L, f s
ao aplicaco
es C 2 . Se (
z, u
) e uma soluca
o do problema PT (z0 ),
n
ent
ao existe uma funca
o : [0, T ] IR e = 1 ou = 0 que satisfazem
i) Sistema hamiltoniano

z )0 (t) = H (t, z, , u
), q.s. em [0, T ],
(
0 (t) = Hz (t, z, , u
), q.s. em [0, T ],

z(t0 ) = z0 , z(T ) = zT ;

ii) Condica
o de otimalidade

H(t, z(t), (t), u


(t)) = min H(t, z(t), (t), u), q.s. em [0, T ] ;
u

iii) Condica
o de n
ao acoplamento + kk 6= 0.

Demonstraca
o: Segue imediatamente do Teorema 5.1.2 e da Observaca
o 5.1.4.
Analisamos agora os problemas com horizonte infinito. Considere o seguinte problema de controle
o
timo:
Z

et L(z(t), u(t)) dt
Minimizar
J(z,
u)
:=

sujeito a

Z t
P (z0 )

z(t)
=
z
+
f (z(s), u(s)) ds, t [0, ) ;
0

u L1loc ([0, ); IRm ), u(t) q.s. em [0, ) ;

onde as funco
es L : Rn IRn IR, f : Rn IRn IRn , o conjunto IRm e a constante > 0
s
ao dados. Verificamos a seguir um resultado que fornece condico
es necess
arias para otimalidade de
uma soluca
o de P (z0 ).

Teorema 5.2.2 Suponha que L, f s


ao aplicaco
es C 2 . Se (
z, u
) e uma soluca
o de P (z0 ), ent
ao
n
existe uma aplicaca
o : [0, ) IR e constantes = 0 ou = 1, 0 IRn que satisfazem:

i) Equaca
o de estado

z(t) = z0 +

t
0

f (s, z(s), u
(s)) ds, t [0, ) ;

ii) Equaca
o adjunta
(t) = 0 +

t
0

H
(s, z(s), (s), u
(s)) ds, t [0, ) ;
z
78

iii) Condica
o de otimalidade
H(t, z(t), (t), u
(t)) = min H(t, z(t), (t), u), q.s. em [0, ) .
u

Demonstraca
o: Seja (
z, u
) um processo o
timo para P (z0 ). Dado T > 0, as funco
es et L :
n
m
n
m
[0, T ] IR IR e f : [0, T ] IR IR satisfazem as condico
es do Corol
ario 5.2.1. Logo, este
corol
ario nos fornece condico
es necess
arias para otimalidade de cada problema

Z Tk

Minimizar J(z, u) :=
et L(t, z(t), u(t)) dt

sujeito a
Z t
PTk (z0 )

z(t) = z0 +
f (s, z(s), u(s)) ds, t [0, Tk ], z(Tk ) = zk := z(Tk ) ;

1
u L ([0, Tk ]; IRm ), u(t) q.s. em [0, Tk ] ;

onde Tk . Como consequencia do princpio de otimalidade de Bellman, temos que (


z, u
)| [0,Tk ] e
uma soluca
o de PTk (z0 ). Juntando os fatos, podemos garantir a existencia de k 0, k : [0, Tk ]
IRn , tal que
kk k + k > 0 ;
(
z , k ) e soluca
o do sistema Hamiltoniano3
d
z (t)
dk (t)

H (t, z(t), k (t), u


(t)) dt, t [0, Tk ]

= Hx (t, z(t), k (t), u


(t)) dt, t [0, Tk ]
z(0) = z0 , z(Tk ) = zk ;

H(t, z(t), k (t), u


(t)) = max{H(t, z(t), k (t), u)}, q.s. in [0, Tk ].
u

Considere agora a seq


uencia {k (0), k }kIN . Normalizando os multiplicadores de Lagrange, podemos
supor que |k (0)| + k = 1, k IN. Tomando subseq
uencias (se necess
ario), podemos garantir a
existencia de 0 IRn e 0 satisfazendo
|0 | + = 1, lim k (0) = 0 , lim k = .
k

(5.6)

Seja agora T > 0 fixo. Logo Tk > T , para k > k0 e como o sistema Hamiltoniano desfruta da
propriedade de dependencia contnua das condico
es iniciais, podemos garantir que existe : [0, T ]
IRn , tal que k converge uniformemente para em [0, T ]. Essa convergencia implica nas desejadas
condico
es de otimalidade para o problema P (x0 ), uma vez que T > 0 e arbitr
ario.
Observa
c
ao 5.2.3 Duas diferencas b
asicas devem ser observadas na formulaca
o do Teorema 5.2.2
em relaca
o ao Teorema 5.1.2:
Falta uma condica
o de contorno final para a vari
avel adjunta (eventualmente uma condica
o de
decaimento do tipo lim (t) = );
t

Falta a condica
o de n
ao acoplamento (neste caso + |0 | 6= 0).

2 2 2

Uma an
alise para problemas do tipo linear-quadr
atico com horizonte infinito e tambem possvel
via programaca
o din
amica. Atraves de um processo de limite, e possvel obter a funca
o valor
resolvendo-se a equaca
o algebrica de Riccati (veja [So, Captulo 7]).
3 Note

que H(t, z, k , u) = hk , F (t, z, u)i + k L(t, z, u).

79

5.3

Aplica
co
es do Princpio do M
aximo

Nesta secca
o analisamos, a
` luz do princpio do m
aximo, alguns problemas de controle o
timo. Na
Aplicaca
o 5.3.1 e discutido formalmente um problema de tempo mnimo. A Aplicaca
o 5.3.2 e uma extens ao da primeira. Nela e analisada uma famlia maior de problemas, composta pelos denominados
problemas de tempo mnimo ate a origem.
Na Aplicaca
o 5.3.3 o princpio do m
aximo e utilizado para verificar que uma estrategia do tipo
bang-bang e a u
nica estrategia o
tima existente para um problema de alunissagem. Na Aplicaca
o 5.3.4
consideramos um problema com controle singular.
Na Aplicaca
o 5.3.5 consideramos um modelo econ
omico cl
assico, que foi formulado por F. Ramsey em 1928 (veja [Ra]). Utilizando a equaca
o de EulerLagrange, obtemos a poltica o
tima para
um problema de consumo investimento com horizonte infinito.
Em [BMS] podem ser encontradas diversas aplicaco
es do princpio do m
aximo a problemas aeroespaciais, dentre as quais citamos: Desenho o
timo de uma miss
ao a Netuno; Ascenss
ao o
tima de um
veculo espacial hipers
onico; Alcance m
aximo de v
oo para uma asa delta atravessando uma termica.
Em [Ho] s
ao discutidas (entre outras) as seguintes aplicaco
es: Oscilador harm
onico com custo de
combustvel; controle de epidemias; Pescaria o
tima; Contraca
o do ventrculo esquerdo do coraca
o;
Compra e venda de aco
es.
Aplica
c
ao 5.3.1 (Tempo mnimo I) Considere a tarefa de encontrar uma estrategia u
(aceleraca
o e frenagem) que permita levar, no menor tempo possvel, um carro que se encontra na
origem e em repouso, ate uma parede distante de uma unidade. Ao chegar na parede o carro deve
ter novamente velocidade nula.
Supondo que o carro de massa unit
aria e desprezando os atritos, temos o modelo:
x(t) = u(t), t [0, t],
onde x(t) representa o deslocamento, x(t)

a velocidade e x(t) a aceleraca


o do veculo no tempo t.
As condico
es de contorno s
ao:
x(0) = 0, x(0)

= 0;
x(t) = 1, x(
t) = 0 .
Podemos ent
ao escrever o problema na forma P (t0 , z0 ) como

RT
Minimizar 0 1 dt

sujeito a



z 0 = 00 10 z + 01 u, z(0) = ;

(T, z(T )) := 10 z(T ) =

onde T 0, u L1 [0, T ] e u(t) := [1, 1] q.s. em [0, T ]. Como o sistema e aut


onomo, a
aplicaca
o U = U (z, ) n
ao depende explicitamente do tempo. Do princpio do m
aximo, obtemos
as seguintes condico
es necess
arias:
 

z 0 = zu2 , z(0) = , z(T ) = 10 ;


0 = 01 , (T ) = 12 ;
H(t, z, , u) = z2 1 + u2 + ;
z2 1 + U (z, )2 + =

min {z2 1 + u2 + }, q.s. em [0, T ] ;

u[1,1]

+ |1 | + |2 | 6= 0 .
80

A condica
o de optimalidade nos permite encontrar

sign 2
U (z, ) =
?
Calculando agora z(t), (t) para t [0, T ], obtemos4
Z t
Z tZ
z2 (t) =
u(s) ds, z1 (t) =
0

, 2 6= 0
, 2 = 0

(5.7)

u(r) dr ds, t [0, T ] ;

(5.8)

s
0

1 (t) = 1 , 2 (t) = (T t)1 + 2 , t [0, T ] .

(5.9)

Analisando (5.7), conclumos que basta identificar o sinal e os zeros da funca


o 2 para obtermos a
estrategia o
tima de controle. Estudamos assim os seguintes casos:
2 n
ao possui zeros: de (5.7), segue que u(t) 1 ou u(t) 1. Entretanto, essas estrategias
n
ao s
ao admissveis, pois as respectivas trajet
orias n
ao alcancam o estado final;
2 possui zeros em [0, T ): de (5.9), temos que 2 e uma funca
o linear em t. Logo, 2 possui
apenas um zero em [0, T ), o qual denominamos .
Temos assim duas famlias de candidatos a controle o
timo:


1, t <
1, t <
u(t) =
e u(t) =
.
1, t >
1, t >
Note que com os controles da segunda famlia n
ao e possvel atingir o estado final z(T ) = ( 10 ) para
nenhum T > 0. Substituindo a express
ao restante em (5.8), temos
 1 2

 1 2 

2 T + 2 T 2
2
; z(T ) =
.
z( ) =

2 T
Da condica
o de contono z(T ) = (10 ), obtemos para o par (, T ) o sistema n
ao linear

1 = 12 T 2 + 2 T 2
0 = 2 T
cuja soluca
o e = 1, T = 2, como se verifica facilmente. Portanto, a soluca
o do problema de controle
e

1, 0 t < 1
T = 2, u
(t) =
1, 1 t 2
2 2 2
Aplica
c
ao 5.3.2 (Tempo mnimo II) Consideramos agora uma variante da aplicaca
o anterior.
Suponha que no tempo t = 0 nosso carro se encontra na posica
o a IR com velocidade b IR. Nosso
objetivo e lev
a-lo ate a origem no menor tempo possvel, de forma que ao chegar ao destino, o carro
tenha velocidade nula.
Temos agora o seguinte problema de controle
RT

Minimizar 0 1 dt

sujeito a



z 0 = 00 10 z + 01 u, z(0) = (ab ) ;

(T, z(T )) := z(T ) =


4 Note

que e calculado para tr


as no tempo.

81

z2
C

u1

z1
u1

Figura 5.2: Trajet


orias correspondentes aos controles o
timos u
1 ou u
1
onde T 0, u L1 [0, T ] e u(t) := [1, 1] q.s. em [0, T ]. As condico
es necess
arias fornecidas
pelo princpio do m
aximo s
ao as mesmas, com excess
ao das condico
es de contorno para a vari
avel
de estado
 
 
z 0 = zu2 , z(0) = a
b , z(T ) = .
U (z, ) e novamente dada pela equaca
o (5.7) e os multiplicadores de Lagrange por (5.9). Portanto,
2 e linear e muda de sinal no m
aximo uma vez em [0, T ]. Sendo assim, basta estudar os seguintes
casos:

1o Caso: u
n
ao muda de sinal em [0, T ].
Se u
1, temos

t2
, t [0, T ] .
2
Como z(T ) = , tais estrategias s
ao admissveis apenas para condico
es iniciais do tipo (a, b) =
(T 2 /2, T ), com T > 0.
Se u
1, temos
t2
z2 (t) = b t, z1 (t) = a + bt , t [0, T ] .
2
Como z(T ) = , tais estrategias s
ao admissveis apenas para condico
es iniciais do tipo (a, b) =
(T 2 /2, T ), com T > 0.
A curva C na Figura 5.2 e composta pelas condico
es iniciais (a, b), para as quais as estrategias
u
1 ou u
1 s
ao o
timas. As respectivas trajet
orias correspondem a
` parte da curva C limitada
por (a, b) e pela origem.
z2 (t) = b + t, z1 (t) = a + bt +

2o Caso: u
muda de sinal em (0, T ).
No caso anterior vimos que, se u
1, ent
ao z2 (t)2 = 2z1 (t) + const; enquanto que u
1 implica
2
em z2 (t) = 2z1 (t) + const. Portanto, as trajet
orias correspondentes a tais controles s
ao necessariamente paralelas a um dos arcos de par
abola mostrados na Figura 5.3. De onde conclumos que a
trajet
oria o
tima e necessariamente composta por dois arcos: cada um pertencente a uma das famlias
na Figura 5.3 (lembre que u
muda de sinal uma u
nica vez no intervalo [0, T ]).
Note que a parte final da trajet
oria o
tima e necessariamente como na Figura 5.2 (caso contr
ario a
trajet
oria n
ao seria admissvel). Para determinar a parte inicial da trajet
oria, observe que, dada uma
condica
o inicial (a, b) IR2 , existe uma u
nica curva pertencente a
`s famlias mostradas na Figura 5.3,
que intercepta tanto o ponto (a, b) quanto a curva C (o caso a > 0, b > 0 e mostrado na Figura 5.4).
O princpio do m
aximo nos permite concluir que existe uma u
nica trajet
oria associada a controles
do tipo


1, t <
1, t <
u
(t) =
ou u
(t) =
1, t >
1, t >
82

que e admissvel para a condica


o inicial (a, b). Tal trajet
oria e composta por dois arcos: um da
curva E limitado por (a, b) e pelo ponto P e outro da curva C limitado por P e pela origem.
Para calcular (instante em que trocamos o controle de 1 para 1) n
ao e necess
ario calcular as
constantes 1 , 2 na equaca
o (5.9). No caso a > 0, b > 0, basta descobrir para qual > 0 a curva
(z1 (t), z2 (t)) = (a + bt t2 /2, b t) satisfaz a condica
o
z2 ( ) < 0, z2 ( )2 = 2z1 ( ) .
Um c
alculo simples mostra que e dado por uma das razes b

b2 /2 a.

2 2 2

Aplica
c
ao 5.3.3 (Alunissagem) Considere o problema de controlar a descida de uma espaconave
na Lua, utilizando para isso a menor quantidade possvel de combustvel. Em um modelo simplificado, temos5
t
h(t)
v(t)
m(t)
u(t)

:
:
:
:
:

tempo;
altura da espaconave;
velocidade da espaconave;
massa da espaconave + combustvel;
empuxo dos motores da espaconave.

Seja M a massa da espaconave sem combustvel, F a quantidade inicial de combustvel, h 0 a altura


inicial, v0 a velocidade inicial, umax o empuxo m
aximo dos motores da nave (0 u(t) umax ,
t 0), g a constante gravitacional da Lua (considerada constante) e k a constante de proporcionalidade entre o empuxo e a taxa de queima do combustvel. As vari
aveis de estado (h, v, m) satisfazem
a seguinte din
amica:
0
h = v(t)
v 0 = g + u(t)/m(t)
0
m = ku(t)
Definindo z(t) = (h(t), v(t), m(t)), temos o sistema n
ao linear

z2

z 0 = g + u/z3 =: f (t, z, u)
ku

z(0) = (h0 , v0 , M + F ), z(T ) = (0, 0, ?) .

(5.10)

A condica
o final segue da hip
otese que um pouso suave ocorre quando h(T ) = 0 e v(T ) = 0, sendo
para m somente relevante que m(T ) M . Como o custo a ser minimizado corresponde ao gasto de
5 Este

modelo e tambem discutido em [FlRi], [Ho] e [Know].

z2

z2

z1

Figura 5.3: Trajet


orias correspondentes a controles constantes
83

z1

z2
E

u1

z1

a
u1

P
Figura 5.4: Trajet
oria o
tima para a condica
o inicial z(0) = (a, b)
combust vel, temos que maximizar
m(T ) = M + F k

u(t) dt .
0

O problema de controle o
timo pode ser escrito como:

Z T

Minimizar
J(T,
z,
u)
=
u(t) dt

sujeito a

u {L1 [0, T ] | u(t) := [0, umax ] q.s. em [0, T ]},

z 0 = f (z, u), z(0) = (h0 v0 M + F ) IR3 ,

(T, z(T )) = (z1 (T ) z2 (T )) = IR2

A funca
o de Hamilton e

H(t, z, , u) = h, ui + L(t, z, u) = 1 z2 + 2 (g + u/z3 ) 3 ku + u .


Minimizando a funca
o de Hamilton em relaca
o a

0
?
U (z, ) =

umax

u obtemos
, + 2 /z3 k3 > 0
, + 2 /z3 k3 = 0
, + 2 /z3 k3 < 0

(5.11)

Tomamos por simplicidade umax = 1. A fim de tornar o problema fisicamente coerente, supomos
ainda
1 = empuxo m
aximo > forca gravitacional = (M + F )g,

isto e 1/(M + F ) > g. E razo


avel considerar que existe uma estrategia o
tima do tipo bangbang,
i.e. da forma

0 , t [0, )
u
(t) =
(5.12)
1 , t [, T ]

Calculamos inicialmente a trajet


oria associada a
` estrategia u
. Como u
1 em [, T ], usamos o
sistema (5.10) e as condico
es de contorno z1 (T ) = z2 (T ) = 0 e z3 () = M + T a fim de determinar
z no instante t = . Obtemos assim



M +F k(T )
M +F
1
2

g(T

ln
T
z
()
=

2
k2
M +F
k



)
z2 () = g(T ) + k1 ln M +FMk(T
+F

z3 () = M + F
84

z1 = h

z2 = v
= T F/k

Figura 5.5: Condico


es iniciais (h, v) que s
ao levadas pelo controle u
1a
` condica
o final (0, 0, m(T ))
com m(T ) M .
(v0 ,h0 )

z1 = h

u
=0

u
=1

z2 = v

Figura 5.6: Trajet


oria correspondente a
` estrategia bang-bang u
.
Tracando o gr
afico de z1 () por z2 (), obtemos a curva da Figura 5.5, que e formada pelos estados
da forma z() = (h(), v(), M + F ) que s
ao levados pelo controle u
(t) = 1, t [, T ] no estado
final z(T ) = (0, 0, m(T )) com m(T ) M . Note que o comprimento dessa curva e limitado pois,
como u
1, temos m0 = k e o combustvel se esgotar
a ap
os F/k unidades de tempo. Temos assim
a limitaca
o T F/k (alem de T 0, obviamente).
Como inicialmente u
0, a nave se encontra em queda livre durante o intervalo de tempo [0, ].
A trajet
oria correspondente e

1 2

z1 (t) = 2 gt + v0 t + h0
z2 (t) = gt + v0

z3 (t) = M + F

t [0, ] .

Explicitando z1 (= h) em funca
o de z2 (= v), obtemos:
h(t) = h0

1 2
[v (t) v02 ], t [0, ] .
2g

A curva (v(t), h(t)) e uma par


abola no plano de fase v h. Unindo os dois trechos da trajet
oria
correspondente a u
, obtemos a curva mostrada na Figura 5.6. Segundo essa trajet
oria, a nave cai
em queda livre ate que o estado (v, h) alcance a curva da Figura 5.5. Nesse momento os motores s
ao
acionados na potencia m
axima ate um estado final admissvel ser atingido ((T, z(T )) = ).
Observe que se a intersecca
o das duas curvas na Figura 5.6 ocorre em um ponto (v(), h()) com
< T F/k, a quantidade de combustivel n
ao e suficiente para realizar um pouso suave. Enquanto
85

que se a condica
o inicial (v0 , h0 ) se encontra abaixo da curva na Figura 5.5, mesmo empregando
empuxo m
aximo u(t) = 1, t [0, T ], o solo lunar e atingido com v(T ) < 0.
Atraves do princpio do m
aximo verificamos agora que a estrategia de controle definida em (5.12)
e um candidato a controle o
timo. Suponha (0) = (l1 l2 l3 ). Substituindo na equaca
o adjunta
0
1 = 0
0 = 1
02
3 = 2 u/z32
temos:

1 (t) = l1 , t [0, T ] ;

2 (t) = l2 l1 t, t [0, T ] ;

3 (t) = l3 , t [0, ] .

Como z3 (t) = M + F k(t ), t [, T ], podemos calcular 3 no intervalo final de tempo, obtendo


3 (t) = l3 +

l2 l 1 s
ds, t [, T ] .
[k( s) + M + F ]2

Defina agora r(t) := + 2 (t)/z3 (t) k3 (t), t [0, T ]. De (5.11) sabemos que a escolha do controle
u
no tempo t depende de sign(r(t)). Portanto, como a estrategia de controle u
salta de 0 para 1 em
t = , temos obrigatoriamente
r() = +

2 ()
k3 () = 0 .
z3 ()

Escolhendo = 1 (que satisfaz condica


o de transversalidade), reescrevemos a equaca
o acima como
1 +

l2 l 1
k l3 = 0 .
M +F

A escolha de u
em (5.12) implica em r(t) > 0, t [0, ). Portanto, l1 > 0, necessariamente.
O princpio do m
aximo fornece-nos ainda uma condica
o inicial para a equaca
o adjunta:


 

1

1
0
0

1
(T ) =
(T, z(T )) =
= 2 ,
0 1 0
2
z
0

de onde conclumos que 3 (T ) = 0. Obtemos assim para l1 , l2 , l3 o sistema sub-determinado de


equaco
es lineares

1 + (M + F ) (l2 l1 ) k l3 = 0
Z T
l2 l 1 s

ds = 0
l3 +
[k( s) + M + F ]2

Considerando 2 como par


ametro, o sistema se reescreve como

(M + F )1 l1 + k l3 = 1 + l2 (M + F )1
P l1 l 3 = Q l 2

RT
RT
onde P = s[k( s) + M + F ]2 ds e Q = [k( s) + M + F ]2 ds s
ao constantes positivas.
Resolvendo o novo sistema obtemos:




l1
[1 + ((M + F )1 + kQ)l2 ] / [(M + F )1 + kP]
=
(5.13)
l3
P[1 + ((M + F )1 + kQ)l2 ] / [(M + F )1 + kP] Ql2
86

Note que para t [, T ), temos


r(t)

= 1 + (l2 l1 t)/z3 (t) k3 (t)

< 1 + l2 /M k l3 + (P /(M + F ))l1 .

(5.14)

Substituindo em (5.14) as express


oes encontradas em (5.13) para l1 e l3 , obtemos uma restrica
o
linear para escolha de l2 . Outra restrica
o (tambem linear) para l2 e dada por l1 > 0 e (5.13). Como
o problema assim colocado possui soluca
o n
ao u
nica, e possvel encontrar uma condica
o inicial
(l1 , l2 , l3 ), de forma que a funca
o r satisfaca

r(t) > 0, t [0, )
r(t) < 0, t (, T ]
provando que u
satisfaz as condico
es do princpio do m
aximo.
Verificamos agora que u
e o u
nico candidato fornecido pelo princpio de Pontryagin. A funca
o
r(t) obtida de (5.11) determina quando ocorrem saltos na estrategia de controle. Note ainda que,
como 1 l1 , ent
ao 02 l1 e temos
r0 (t)

= (02 z3 2 z30 )z32 k03

= 02 /z3 2 (ku)z32 k2 uz32


= l1 /z3 (t), t [0, T ] .

Analisamos separadamente as situaco


es possveis:
l1 6= 0: Como z3 (t) = m(t) > 0, ent
ao r e mon
otona. Se l1 > 0, obtemos um controle do tipo
u
. Se l1 < 0, obtemos uma estrategia oposta, i.e. inicialmente u = 1 e depois u = 0. Com essa
estrategia n
ao e possvel obter um pouso suave. De fato, ou (v0 , h0 ) se situa abaixo ou acima
do gr
afico na Figura 5.5. No primeiro caso, j
a vimos que v(T ) < 0. No segundo caso, como u
e da forma

1 , t [0, )
u(t) =
0 , t [, T ]
obtemos do sistema adjunto

v(T ) v( ) =

v (t) dt =

g dt = g(T ) .

Logo, uma condica


o necess
aria para v(T ) = 0 e que T = v( )/g + . Novamente do sistema
adjunto obtemos
h( ) = h(T ) h( ) =

h0 (t) dt =

v(t) dt

g(T t) dt =

g
(T )2 ,
2

isto e h( ) = v ( )/2g < 0. Portanto, a transica


o de 1 para 0 na estrategia de controle ocorre
abaixo da superfcie da Lua, e o pouso obviamente n
ao e suave.
l1 = 0: Neste caso, r 0 = 0 e r e constante. Se r 6= 0, os possveis candidatos s
ao u 0 e u 1.
O primeiro controle obviamente n
ao permite pouso suave. J
a o segundo ser
ao
timo somente
se (v0 , h0 ) pertence a
` curva na Figura 5.5, quando a estrategia se torna identica a u
. Por fim,
se r = 0, temos
1
1 + l2
+ k 3 (t) = 0, t [0, T ],
z3 (t)
87

isto e, as funco
es {1, z31 , 3 } s
ao linearmente dependentes. Mas isto e uma contradica
o pois
Z t
Z t
u(s) ds,
3 (t) = l2
z3 (t) = M + F k
u(s)z3 (s)2 ds .
0

Portanto, o u
nico controle admissvel que satisfaz as condico
es do princpio do m
aximo e u
definido
em (5.12).
2 2 2
Aplica
c
ao 5.3.4 (Controle singular) Considere o problema escalar de controle

Z 3

z(t)2 dt
Minimizar 2

sujeito a

u L1 [0, 3], u(t) := [1, 1] q.s. em [0, 3],

0
z = u, z(0) = z(3) = 1.

O tempo final T = 3 e a condica


o final para a trajet
oria z(T ) = 1 s
ao fixados atraves da condica
o:


1z
(T, z(T )) =
= IR2 .
T 3

Do princpio do m
aximo, obtemos as condico
es necess
arias:
z 0 = u, z(0) = z(3) = 1 ;
0 = z, 1 = 1 ;

H(t, z, , u) = u +

1
2
2 z ,

H1 = 2 ;

+ |1 | + |2 | 6= 0 .
A condica
o de m
aximo implica em U (z, ) = sign . Note que = 0 n
ao pode ocorrer, pois
implica em 0 = 0. Logo, u 1 ou u 1, mas ambas as estrategias n
ao s
ao admissveis. Suponha
ent
ao = 1. Logo 0 (0) = 1. Supondo (0) 0, temos:

Se (0) 0 e (t) < 0, t [0, 3], ent


ao u 1, o que implica em z(3) = 4 (contradizendo a
condica
o de contorno final).

Se (0) 0, (t1 ) = 0 para algum t1 > 0 e (t) < 0, t (0, t1 ), ent


ao 0 (t1 ) 0. Mas
u(t) 1, t (0, t1 ) z(t) > 0, t (0, t1 ] 0 (t) < 0, t (0, t1 ],

contradizendo a conclus
ao 0 (t1 ) 0.

Conclumos assim que (0) > 0. De forma an


aloga prova-se que (3) < 0. Portanto, a funca
o
possui pelo menos um zero em (0, 3). Seja t1 o menor e t2 o maior zero de em (0, 3). Provamos
agora que t1 = 1 e t2 = 2:
n
1t, t[0,3/2]
Note que t1 6= t2 , pois se possui apenas um zero, ent
ao z(t) = t2, t[3/2,3] , que obviamente
n
ao e uma trajet
oria o
tima;
Em [0, t1 ) temos: u(t) = 1, z(t) = 1 t, (t) = (0) t + 12 t2 .
p
Como (t1 ) = 0, ent
ao t1 = 1 1 2(0). Se t1 assume
o valor da maior raiz, temos t1 > 1
n
e a trajet
oria associada a n
ao e o
tima, pois z(t) :=

Logo, t1 = 1

z(t)2 dt <

1 2(0) 1.
88

z(t), z(t)0
0 , z(t)<0

z(t)2 dt .

satisfaz

Se t1 < 1, ent
ao 0 (t1 ) = z(t1 ) < 0. Seja t > 1, tal que (t) < 0, t (t1 , t) e (t) = 0. Logo,
0 (t) 0.
De (t) < 0, segue u(t) 1, t (t1 , t). Como z(t1 ) > 0 e z 0 (t) = u(t) = 1, t (t1 , t), temos
z(t) 1 t1 > 0, t [0, t]. Ent
ao 0 (t) = z(t) < 0 (contradica
o).
Conclumos assim que t1 = 1. De modo an
alogo, prova-se que t2 = 2. Provamos agora que (t) =
0, t (t1 , t2 ). De fato, se (t) > 0 (o caso < 0 e an
alogo) para algum t (t1 , t2 ), ent
ao existem
t1 , t2 [t1 , t2 ] tais que (t) > 0, t (t1 , t2 ) e (t1 ) = (t2 ) = 0. Logo, u(t) = 1, t (t1 , t2 ) e
portanto 00 (t) = (z(t))0 = u(t) = 1, t (t1 , t2 ), o que e claramente uma contradica
o. Portanto,
a estrategia o
tima de controle tem de ser

1 , t [0, 1]
0 , t (1, 2) .
u
(t) =

+1 , t [2, 3]

(Note que a trajet


oria z 0 e um extremal singular do problema e a trajet
oria o
tima z e do tipo:
bangsingularbang.)
2 2 2
Aplica
c
ao 5.3.5 (Consumo Investimento) Tratamos a seguir um problema cl
assico da economia, que foi um dos primeiros a ser considerado sob a o
tica do c
alculo variacional. Consideramos
o seguinte problema macroecon
omico: Como equacionar a relaca
o entre consumo e investimento, a
fim de otimizar o desenvolvimento econ
omico?
Suponha que a economia de uma naca
o e representada pelas vari
aveis
K(t) :

Capital no tempo t;

C(t) :

Consumo;

Y (t) :
K 0 (t) :

Produca
o (produto interno);
Investimento (variaca
o do Capital);

ao longo do intervalo de tempo t [0, ). Considere ainda o seguinte modelo simplificado:


i) Y = g(K), onde g 0 > 0 e g 00 0;
ii) C = Y K 0 (parte da produca
o e consumida e o restante e reinvestido);
iii) K(0) = K0 (o capital inicial e conhecido);
iv) U = U (C) e a utilidade do capital, onde U 0 > 0, U 00 < 0;
v) > 0 e o fator de desconto.
O objetivo e encontrar uma poltica o
tima de investimento para o problema:

Maximizar
et U (C(t))dt
0

sujeito a K 0 = g(K) C, K(0) = K0 .

Este problema foi originalmente formulado e resolvido por Ramsey em 1928 (veja [Ra]). A hip
otese
C = g(K)K 0 permite-nos analisar este problema utilizando c
alculo variacional. Note que a equaca
o
de EulerLagrange e dada por
K 00 g 0 (K)K 0 +

U 0 (g(K) K 0 )
( g 0 (K)) = 0 .
U 00 (g(K) K 0 )
89

No caso geral esta equaca


o n
ao pode ser resolvida analiticamente. Fazemos aqui a hip
otese simplificadora:
1 1q
U (r) =
r , g(r) = br,
1q

onde b > 0, q (0, 1). Neste caso particular a equaca


o de EulerLagrange fica simplificada, na forma
de uma equaca
o que sabemos resolver:
qK 00 + ( b qb)bK 0 + b(b )K = 0.

Calculando as razes do polin


omio caracterstico, temos 1 = b, 2 = a := q 1 (b ). Portanto, as
soluco
es que satisfazem a condica
o inicial K(0) = K0 s
ao da forma:

K(t)
= (K0 A)eat + Aebt , t 0,
onde A e um par
ametro livre. Suponha agora que b > a, i.e. > (1 q)b. Neste caso, as hip
oteses
do modelo:
C(t) = g(K(t)) K 0 (t) > 0, t 0 e
lim K(t) 0
t

s
ao satisfeitas respectivamente para A 0 e A < K0 . Para determinar o par
ametro A [0, K0 ) e
necess
aria uma condica
o de contorno para a equaca
o da din
amica por exemplo K 0 (0) ou K().
Como tal condica
o n
ao e explicitamente fornecida, e preciso analisar a equaca
o de HamiltonJacobi
Bellman, que para este problema aut
onomo se escreve como


V
1
, g(x) ui +
u1q = 0, x IRn
V (x) + min h
u
x
1q
f
(note que = b qa). E
acil verificar que V (x) := (1 q)/(b a)q x1q , x 0 e soluca
o da equaca
o
acima. Note ainda que se A = 0 a condica
o

lim inf et V (K(t))


=0
t

e satisfeita, pois a(1 q) < 0 por hip


otese. Portanto, V (x) e a trajet
oria K(t)
= K0 eat satisfazem
as condico
es do teorema , de onde conclumos que uma estrategia o
tima de consumo e dada por
= (b a)K0 eat , t 0.
C(t)
2 2 2

Exerccios
5.1 Considere o problema de Bolza

1 1

Minimizar
u(t)2 dt + z1 (1)2 + z2 (1)2

2 0
sujeito a

u L1 [0, 1], z 0 = z , z 0 = u, z (0) = z (0) = 0.


2
1
2
1
2

a) Formule o princpio do m
aximo para o problema acima.
b) Obtenha o processo o
timo.
90

5.2 Considere o problema de controle o


timo

Z T



z1 (t)2 + u(t)2 dt
Minimizar
0

sujeito a

u L1 [0, T ], z10 = z2 , z20 = z2 + u, z1 (0) = 1, z2 (0) = 0.

a) Formule o princpio do m
aximo para o problema acima.
b) Obtenha o processo o
timo.

5.3 Considere o problema de controle o


timo escalar

Z


1 1

3z(t)2 + u(t)2 dt
Minimizar 2
0
sujeito a

u L1 [0, 1], z 0 = z + u, z(0) = 1.

a) Formule o princpio do m
aximo para o problema acima.
b) Obtenha o processo o
timo.

5.4 (Problema de Investimento) Suponha que um determinado produto e fabricado com a taxa
z(t). No tempo t > 0 uma fraca
o u(t) da produca
o e reinvestida para aumentar a produca
o, sendo o
restante vendido para geraca
o de lucro. O objetivo e determinar uma poltica de investimento o
tima,
de forma a maximizar o lucro total no horizonte fixo de tempo [0, T ]. Temos assim o problema

Z T

Maximizar
(1 u(t))z(t)dt

sujeito a

0
T]
z = uz, z(0) = z0 > 0, z(t) 0, u C[0,

a) Reescreva o problema como um problema variacional com restrico


es lagrangeanas: y 0 (t) 0,
0
y (t) y(t).
b) Obtenha condico
es necess
arias para o novo problema.
c) Encontre a taxa o
tima de produca
o y.
5.5 (Problema do Caf
e) Uma xcara cheia de cafe a
` temperatura de 100 o C deve ser esfriada a
o
temperatura de 0 C por adica
o de uma quantidade fixa de creme de leite. Uma equaca
o aproximada
para evoluca
o da temperatura z da mistura e dada por
z 0 = z 25u uz/4.
As condico
es de contorno s
ao z(0) = 100, z(T ) = 0.
a) Obtenha condico
es necess
arias para o problema de tempo o
timo sujeito a
`s restrico
es 0 u(t) 1,
RT
t [0, T ], 0 u(t)dt = 1, impostas ao fluxo externo de lquido u.

b) Use o fato z 0 < 0 para obter um problema equivalente com intervalo de tempo fixo. O que se
pode afirmar sobre a unicidade da soluca
o obtida no item a).
(Sugest
ao: A nova vari
avel livre e s = z.)

91

92

Bibliografia
[Al]

Alt, W., Stabilit


at mengenwertiger Abbildungen mit Anwendungen auf nichtlineare Optimierungsprobleme, Bayreuther Mathematische Schriften, 3, 1979

[An]

Anand, D.K., Introduction to Control Systems. 2nd ed., Pergamon Press, Oxford, 1984

[AtFa] Athans, M. e Falb, P.L., Optimal Control, McGraw-Hill Book Company, New York, 1966
[BaNe] Balakrishnan, A.V. e Neustadt, L.W., eds., Computing Methods in Optimization
Problems, Proceedings of a conference held at University of California, Los Angeles, January
1964, Academic Press, London, 1964
[BaCa] Bardi, M. e CapuzzoDolcetta, I., Optimal Control and Viscosity Solutions of
HamiltonJacobiBellman Equations, Birkh
auser, Boston, 1997
[Bar]

Barnett, S., Matrices in Control Theory with Applications to Linear Programming, Van
Nostrand Reinhold Company, London, 1971

o, A., Optimal exploitation of renewable resource stocks: Neces[BaLe] Baumeister, J. e Leita


sary conditions, Optimal Control Appl. Meth., a ser publicado
o, A. e Silva, G.N., Optimal control problems with infinite hori[BLS1] Baumeister, J., Leita
zon whose control laws contain measures: Maximum principle, Proceedings of the 3rd International Conference on Nonlinear Dynamics, Campos do Jord
ao, Brazil, July 2000, a ser
publicado
o, A. e Silva, G.N., Value function for problems with infinite
[BLS2] Baumeister, J., Leita
horizon, J. Math. Anal. Appl., a ser publicado
[Be]

Bellman, R.E., Introduction to the Mathematical Theory of Control Process, Vol I: Linear
equations and quadratic criteria, Academic Press, New York, 1967

[BeDr] Bellman, R.E. e Dreyfus, S.E., Applied Dynamic Programming, Princeton University
Press, Princeton, 1962
[Ber]

Berkovitz, L.D., Optimal Control Theory, Springer Verlag, New York, 1974

[Bo]

Boltyanski, W.G., Mathematische Methoden der optimalen Steuerung, Carl Hanser Verlag, M
unchen, 1972

[Br]

Brokate, M., Kontrolltheorie, Vorlesungskript, Universit


at Hamburg, 1984

[Bro]

Bronson, R., Moderna Introduca


o a
`s Equaco
es Diferenciais, Coleca
o Schaum, Editora Mc
Graw Hill
93

[BD]

Boyce, E.A. e Diprima, R.C., Equaco


es Diferenciais Elementares e Problemas de Valores
de Contorno, Livros Tecnicos e Cientficos Editora, Rio de Janeiro, 1999

[BMS] Bulirsch, R., Miele, A., Stoer, J. e Well, K.H., eds., Optimal control: Calculus of Variations, Optimal Control Theory and Numerical Methods, International Series of
Numerical Mathematics, 111, Birkh
auser, Basel, 1993
[CaHa] Carlson, D.A. e Haurie, A.B., Infinite Horizon Optimal Control: Theory and Applications, Springer Verlag, Heidelberg, 1987
[Cl]

Clark, C.W., Mathematical Bioeconomics: The Optimal Management of Renewable Resources. 2nd ed., John Wiley and Sons, New York, 1990

[CCM] Clark, C.W., Clarke, F.H. e Munro, G.R. The optimal exploitation of renewable
resource stocks: Problems of irreversible investment, Econometrica, 47 (1979), 25 47
[CLSW] Clarke, F.H., Ledyaev, Yu.S., Stern, R.J. e Wolenski, P.R., Nonsmooth Analysis
and Control Theory, Springer Verlag, Berlin, 1998
[Cod]

Coddington, E.A., An Introduction to Ordinary Differential Equations, Englewood Cliffs,


N.J.: Prentice-Hall,1961; New York, Dover, 1989

[CrLi] Crandall, M.G. e Lions, P.L., Viscosity solutions of HamiltonJakobi Equations, Trans.
of the American Mathematical Society, 277 (1983), 1 42
[FlRi]

Fleming, W.H. e Rishel, R.W., Deterministic and Stochastic Optimal Control, Springer
Verlag, Berlin, 1975

[FlSo]

Fleming, W.H. e Soner, H.M., Controlled Markov Processes and Viscosity Solutions,
Springer Verlag, New York, 1993

[F
o1]

llinger, O., Nichtlineare Regelungen I: Grundlagen und harmonische Balance, OldenFo


bourg Verlag, M
unchen, 1969

[F
o2]

llinger, O., Nichtlineare Regelungen II: Anwendung der Zustandsebene, Oldenbourg


Fo
Verlag, M
unchen, 1970

[F
o3]

llinger, O., Nichtlineare Regelungen III: Ljapunow-Theorie und Popow-Kriterium, OldFo


enbourg Verlag, M
unchen, 1970

[Gan]

Gantmacher, F.R, Applications of the Theory of Matrices, Intersciences Publishers, New


York, 1959

[Gol]

Goldenstine, H., A History of the Calculus of Variations, from 17th through the 19th
Century, Springer Verlag, New York, 1980

[Gon]

Gonc
alves, A., Introduca
o a
` Algebra,
Projeto Euclides, 7, Instituto de Matem
atica Pura
e Aplicada, Rio de Janeiro, 1979

[Gr]

Groetsch, C.W., Generalized Inverses of Linear Operators, Dekkeric, New York, 1977

[Ha]

Halkin, H., Necessary conditions for optimal control problems with infinite horizons,
Econometrica 42 (1974), 267 272

[Hes]

Hestenes, M.R., Calculus of Variations and Optimal Control Theory, John Wiley and
Sons, London, 1966
94

[Heu]

Heuser, H., Funktionalanalysis. 3. Aufl., B.G. Teubner, Stuttgart, 1992

[HeLa] Hermes, H.R. e LaSalle, J.P., Functional Analysis and Time-Optimal Control, Academic Press, New York, 1969
[Ho]

Hocking, L.M., Optimal Control: An Introduction to the Theory with Applications, Clarendon Press, Oxford, 1991

[Hon]

Honig, C.S., Aplicaco


es da Topologia a
` An
alise, Projeto Euclides / IMPA, Rio de Janeiro,
1976

[Is]

Isidori, A., Nonlinear Control Systems: An Introduction. 2nd ed., Springer Verlag, Berlin,
1989

[Je]

Jetschke, G., Mathematik der Selbstorganisation: Qualitative Theorie nichtlinearer dynamischer Systeme und gleichgewichtsferner Strukturen in Physik, Chemie und Biologie,
Vieweg Verlag, Braunschweig, 1989

[KIF]

Knobloch, H.W., Isidori, A. e Flockerzi, D., Topics in Control Theory, DMV Seminar, 22, Birkh
auser, Basel, 1993

[KnKw] Knobloch, H.W. e Kwakernaak, H., Lineare Kontrolltheorie, Springer Verlag, Berlin,
1985
[Know] Knowles, G., An Introduction to Applied Optimal Control, Academic Press, San Francisco,
1981
[Kra]

Krabs, W., Einf


uhrung in die Kontrolltheorie, Wissenschaftliche Buchgesellschaft, Darmstadt, 1978

[Kre]

Kreyzig, R., Introductory Functional Analysis with Applications, John Wiley and Sons,
New York, 1978

[LeMa] Lee, E.B. e Markus, L., Foundations of Optimal Control Theory, John Wiley and Sons,
London, 1967
[Leig]

Leigh, J.R., Functional Analysis and Linear Control Theory, Academic Press, London,
1980

[Leit]

o, A., On optimal control problems with infinite horizon, Proceedings of the 3rd
Leita
International Conference on Nonlinear Dynamics, Campos do Jord
ao, Brazil, July 2000, a
ser publicado

[Lei]

Leitmann, G., The Calculus of Variations and Optimal Control: An Introduction, Plenum
Press, London, 1981

[Lim]

Lima, E.L., Algebra


Linear, Associaca
o Instituto de Matem
atica Pura e Aplicada, CNPq,
Rio de Janeiro, 2001

[Lio]

Lions, J.L., Optimal Control of Systems Governed by Partial Differential Equations,


Springer Verlag, Heidelberg 1971

[LiYo] Li, X. e Yong, J., Optimal control theory for infinite dimensional systems, Birkh
auser,
Basel, 1994
95

[MaSt] Macki, J. e Strauss, A., Introduction to Optimal Control Theory, Springer Verlag, Heidelberg, 1981
[Mo]

Morgan, F., Geometric Measure Theory: A Beginners guide, Academic Press, Boston,
1988

[Mu]

Murray, J.M., Existence theorems for optimal control and calculus of variations problems
where the state can jump, SIAM J. Control and Optimization, 24 (1986), 412 438

[Pi]

Piehler, J., Einf


uhrung in die dynamische Optimierung, B.G. Teubner, Leipzig, 1966

[Pin]

Pinch, E.R., Optimal Control and the Calculus of Variations, Oxford University Press,
New York, 1997

[PBG] Pontryagin, L.S., Boltyanskij, V.G., Gamkrelidze, R.V. e Mishchenko, E.F.,


The Mathematical Theory of Optimal Processes, Interscience Publishers, New York, 1962
(edica
o original em russo, 1961)
[Ra]

Ramsey, F.P., A mathematical theory of saving, Economic Journal, 38 (1928), 543 549

[Ri]

Rishel, R.W., An extended Pontryagin principle for control systems whose control laws
contain measures, SIAM J. Control, 3 (1965), 191 205

[Ru1]

Rudin, W., Functional Analysis, McGrawHill, New York, 1973

[Ru2]

Rudin, W., Real and Complex Analysis, McGrawHill, New York, 1966

[Sc]

Scheck, F., Mechanics: From Newtons Laws to Deterministic Chaos. 3rd ed., Springer
Verlag, Berlin, 1999

[SeSy] Seierstad, A. e Sydster, K., Optimal Control Theory with Economic Applications,
North-Holland, Amsterdam, 1987
[SeZh] Sethi, S.P. e Thompson, G.L., Optimal Control Theory: Applications to Management
Science, Martinus Nijhoff Publishing, Boston, 1981
[SHB] Schmidt, W.H., Heier, K., Bittner, L. e Bulirsch, R., eds., Variational Calculus,
Optimal Control and Applications, Proceedings of the 12th International Conference in Honour of L. Bittner and R. Kloetzler, Trassenheide, Germany, September, 1996, International
Series of Numerical Mathematics, 124, Birkh
auser, Basel, 1998
[SFG]

Skowronski, J.M., Flashner, H. e Guttalu, R.S., eds., Mechanics and control, Proceedings of the 3rd Workshop on Control Mechanics, in Honor of the 65th Birthday of George
Leitmann, January, 1990, Lecture Notes in Control and Information Sciences, 151, Springer
Verlag, Berlin, 1991

[SiVi]

Silva, G.N. e Vinter, R.B., Necessary conditions for optimal impulsive control problems,
SIAM J. Control Optimization, 35 (1997), 1829 1846

[So]

Sontag, E.D., Mathematical Control Theory: Deterministic Finite Dimensional Systems.


2nd ed., Springer Verlag, New York, 1998

[Sot]

Sotomayor, J., Lico


es de Equaco
es Diferenciais Ordin
arias, Projeto Euclides, 11, Instituto de Matem
atica Pura e Aplicada, Rio de Janeiro, 1979

[Sn]

Sniedovich, M., Dynamic Programming, Marcel Dekker, New York, 1992


96

[Tr]

Troutman, J.L., Variational Calculus and Optimal Control: Optimization with Elementary Convexity. 2nd ed., Springer Verlag, New York, 1996

[ViPe] Vinter, R.B. e Pereira, F.M.F.L., A maximum principle for optimal processes with
discontinuous trajectories, SIAM J. Control and Optimization, 26 (1988), 205 229
[Wa1]

Walter, W., Analysis II. 2. Aufl., Springer Verlag, Berlin, 1991

[Wa2]

Walter, W., Gew


ohnliche Differentialgleichungen. 6. Aufl., Springer Verlag, Berlin, 1996

[We]

Werner, J., Optimization: Theory and Applications, Vieweg Verlag, Wiesbaden, 1984

[Za]

Zabczyk, J., Mathematical Control Theory: An Introduction, Birkh


auser, Boston, 1992

[ZoKu] Zowe, J. e Kurcyusz, S., Regularity and stability for the mathematical programming
problem in Banach spaces, Appl. Math. Optimization, 5 (1979), 49 62

97

Você também pode gostar