Controt LQR

Controle Linear Quadratico
Caso Determinstico
Notas de aula para
um curso de
Otimizacao e Controle

Otimo
COPPE-UFRJ
esbocado em 1985
refeito e impresso no 2.o semestre de 1988
revisto, ampliado e ilustrado em fevereiro-marco de 1989
revisto e enriquecido em ns de 1991
aperfeicoado ainda uma vez em outubro de 1996
analise no IR
n
e otimiza cao em outubro-novembro de 1997
revisto, reformatado e enriquecido em 10,11/1999
Sumario
1 Problemas Tpicos de Controle 1
1.1 Problema das condi coes terminais . . . . . . . . . . . . . . . . 2
1.2 Anulando z(t
f
): Problema do Regulador Terminal . . . . . . . 3
1.3 Comportamento Funcional em um Intervalo . . . . . . . . . . 4
1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Problema do Regulador Funcional . . . . . . . . . . . . . . . . 7
1.6 Regulador Linear

Otimo Determinstico . . . . . . . . . . . . . 8

Otimo Determinstico Fixo . . . . . . . . . . 9
1.8 Exerccios, ainda . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Solucao do Problema do Regulador 15
2.1 Solucao pelo Calculo das Variacoes . . . . . . . . . . . . . . . 16
2.2 Equacoes Variacionais . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1 Em resumo: . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 Busca de Caminhos Mais Simples . . . . . . . . . . . . . . . . 27
2.4 Equacao de Riccati Matricial . . . . . . . . . . . . . . . . . . . 29
2.5 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Horizonte de Tempo Innito 35
3.1 Discussao do Problema . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Solucao Para o PRLOHTI . . . . . . . . . . . . . . . . . . . . 36
3.2.1 Solucao da ERM quando t
f
. . . . . . . . . . . . 37
3.2.2 Pequena Generalizacao . . . . . . . . . . . . . . . . . . 38
3.3 Um Pouco de Teoria . . . . . . . . . . . . . . . . . . . . . . . 39
3.4 Solucao para o PRLOHTI . . . . . . . . . . . . . . . . . . . . 42
3.5 Algoritmo para Solucao do PRLOHTI . . . . . . . . . . . . . 42
3.6 Que Acontece se a Condicao Falha? . . . . . . . . . . . . . . . 44
3.7 Controlabilidade e Observabilidade . . . . . . . . . . . . . . . 44
3.8 Comentarios e Referencias . . . . . . . . . . . . . . . . . . . . 44
i
SUM
ARIO ii
4 Outros caminhos. . . 46
4.1 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5 Propriedades da Solucao do PRLOHTI 47
5.1 Retomando o pe . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.2 Encontrando a solucao da ERMA . . . . . . . . . . . . . . . . 48
5.3 Um caminho alternativo . . . . . . . . . . . . . . . . . . . . . 50
5.4 Que Acontece aos P olos? . . . . . . . . . . . . . . . . . . . . . 58
5.5 Resumo Teorico . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.6 Discussao dos Resultados . . . . . . . . . . . . . . . . . . . . . 63
5.6.1 Caso do Controle Barato, r pequeno. . . . . . . . . . . 63
5.6.2 Caso do Controle Caro, r . . . . . . . . . . . . . . 65
6 Projeto

Otimo de Observadores 66
6.1 Observadores Assintoticos de Estados . . . . . . . . . . . . . . 66
6.2 Problema do estimador aberto . . . . . . . . . . . . . . . . . . 69
6.3 O verdadeiro problema . . . . . . . . . . . . . . . . . . . . . . 71
6.4 Estimadores e Filtros . . . . . . . . . . . . . . . . . . . . . . . 75
6.5 Medias e correla coes de sinais . . . . . . . . . . . . . . . . . . 77
6.5.1 Valor medio de um sinal . . . . . . . . . . . . . . . . . 77
6.5.2 Valor medio quadr atico de um sinal . . . . . . . . . . . 77
6.5.3 Variancia de um sinal . . . . . . . . . . . . . . . . . . . 77
6.5.4 Autocorrela cao de um sinal . . . . . . . . . . . . . . . 77
6.5.5 Correlacao cruzada entre dois sinais . . . . . . . . . . . 77
6.5.6 Densidade espectral de um sinal . . . . . . . . . . . . . 77
6.6 Variaveis aleat orias . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.1 Probabilidades . . . . . . . . . . . . . . . . . . . . . . 77
6.6.2 Valor medio . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.3 Variancia . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.4 Covariancia entre x e y . . . . . . . . . . . . . . . . . . 77
6.6.5 Funcao distribui cao de probabilidade . . . . . . . . . . 77
6.6.6 Funcao densidade de probabilidade . . . . . . . . . . . 77
6.6.7 Media . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.8 Valor medio quadr atico . . . . . . . . . . . . . . . . . . 77
6.6.9 Variancia e covariancia . . . . . . . . . . . . . . . . . . 77
6.6.10 Distribuicao uniforme . . . . . . . . . . . . . . . . . . . 77
6.6.11 Distribuicao normal . . . . . . . . . . . . . . . . . . . . 77
6.7 Processos aleat orios ou estocasticos . . . . . . . . . . . . . . . 77
6.7.1 Rudo branco . . . . . . . . . . . . . . . . . . . . . . . 77
6.7.2 Processo gaussiano . . . . . . . . . . . . . . . . . . . . 77
6.7.3 Processo estocastico estacion ario . . . . . . . . . . . . 77
SUM
ARIO iii
6.7.4 Processo estocastico ergodico . . . . . . . . . . . . . . 77
6.7.5 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . 77
6.7.6 Matriz de autocorrela cao . . . . . . . . . . . . . . . . . 77
6.8 Formulacao e solucao . . . . . . . . . . . . . . . . . . . . . . 77
A Formas Quadraticas 80
A.1 Formas Lineares e Quadr aticas . . . . . . . . . . . . . . . . . . 80
A.2 Sinal da Forma . . . . . . . . . . . . . . . . . . . . . . . . . . 84
A.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
A.4 Criterios de deni cao . . . . . . . . . . . . . . . . . . . . . . . 86
A.5 Normas, Metricas e Tamanho . . . . . . . . . . . . . . . . . 87
A.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
A.7 Visao Geometrica das Formas Quadr aticas . . . . . . . . . . . 89
A.8 Miscel anea de Formulas . . . . . . . . . . . . . . . . . . . . . 90
A.9 Matrizes Hamiltonianas . . . . . . . . . . . . . . . . . . . . . 92
A.10 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
B Analise no IR
n
101
B.1 Funcao Real de variavel vetorial . . . . . . . . . . . . . . . . . 101
B.2 Continuidade e Derivadas . . . . . . . . . . . . . . . . . . . . 102
B.3 Derivada: caso escalar . . . . . . . . . . . . . . . . . . . . . . 102
B.3.1 Derivadas laterais . . . . . . . . . . . . . . . . . . . . . 103
B.4 Derivada: caso vetorial . . . . . . . . . . . . . . . . . . . . . . 103
B.5 Derivadas de ordem superior . . . . . . . . . . . . . . . . . . . 104
B.6 Funcoes Vetoriais de Variaveis Vetoriais . . . . . . . . . . . . . 105
B.7 Pontos Estacionarios e Extremos . . . . . . . . . . . . . . . . 105
B.8 Otimiza cao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
B.9 PGO Problema Geral de Otimiza cao . . . . . . . . . . . . . 106
B.10 Pontos Viaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
B.11 Solucao do PGO . . . . . . . . . . . . . . . . . . . . . . . . . 106
B.12 Caso Escalar sem Restri coes . . . . . . . . . . . . . . . . . . . 107
B.13 Caso Vetorial sem Restri coes . . . . . . . . . . . . . . . . . . . 108
B.14 Funcoes Quadr aticas . . . . . . . . . . . . . . . . . . . . . . . 109
B.15 Restri coes Lineares . . . . . . . . . . . . . . . . . . . . . . . . 112
B.16 PGO com Restri coes Lineares de Igualdade . . . . . . . . . . . 113
B.17 PGO com Restri coes Lineares de Desigualdade . . . . . . . . . 117
B.17.1 Estudo da Regi ao Viavel . . . . . . . . . . . . . . . . . 118
B.18 Programacao Linear . . . . . . . . . . . . . . . . . . . . . . . 119
B.19 PGO com Restri coes Nao-Lineares de Igualdade . . . . . . . . 119
B.20 PGO com Restri coes Nao-Lineares de Desigualdade . . . . . . 120
B.21 Metodos Numericos . . . . . . . . . . . . . . . . . . . . . . . . 121
SUM
ARIO iv
B.22 Caso Escalar: Obtencao de Razes . . . . . . . . . . . . . . . . 121
B.22.1 Metodo da Biseccao . . . . . . . . . . . . . . . . . . . 121
B.22.2 Metodo de Newton . . . . . . . . . . . . . . . . . . . . 121
B.22.3 Metodo da Secante . . . . . . . . . . . . . . . . . . . . 121
B.22.4 Metodo da Regula Falsa . . . . . . . . . . . . . . . . . 122
B.22.5 Metodo de Interpolacoes Superiores . . . . . . . . . . . 122
B.22.6 Metodo Geral dos Intervalos . . . . . . . . . . . . . . . 122
B.22.7 Metodo Garantidos . . . . . . . . . . . . . . . . . . . . 122
B.23 Caso Escalar sem Restri coes: Obtencao de mnimos . . . . . . 122
B.23.1 Busca de Fibonacci . . . . . . . . . . . . . . . . . . . . 122
B.23.2 Busca

Aurea . . . . . . . . . . . . . . . . . . . . . . . . 122
B.23.3 Interpolacao Polinomial . . . . . . . . . . . . . . . . . 122
B.23.4 Aproximacoes C ubicas . . . . . . . . . . . . . . . . . . 122
B.23.5 Metodos Garantidos . . . . . . . . . . . . . . . . . . . 122
B.24 Caso Vetorial sem Restri coes: Obtencao de mnimos . . . . . . 122
B.24.1 Metodos de Busca Direta . . . . . . . . . . . . . . . . . 122
B.24.2 Algoritmo do Politopo . . . . . . . . . . . . . . . . . . 122
B.24.3 Algoritmo U . . . . . . . . . . . . . . . . . . . . . . . . 122
B.24.4 Metodos dp Gradiente e da Derivada Segunda . . . . . 122
B.24.5 Metodo de Newton . . . . . . . . . . . . . . . . . . . . 122
B.24.6 Metodos da Decomposicao Espectral . . . . . . . . . . 122
B.24.7 Metodos de Primeira Ordem . . . . . . . . . . . . . . . 122
B.24.8 Metodos Nao Derivativos . . . . . . . . . . . . . . . . . 123
B.24.9 Problema dos Mnimos Quadrados . . . . . . . . . . . 123
B.25 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Captulo 1
Problemas Tpicos de Controle
Consideremos inicialmente o sistema linear variante no tempo o descrito
pelas seguintes equa coes dinamicas, v alidas t IR:
o
_
_
x(t) = A(t)x(t) + B(t)u(t); x(t
0
) = x
0
z(t) = D(t)x(t)
y(t) = C(t)x(t)
onde x(t) e um vetor de dimens ao n representando o estado do sistema no
instante t; u(t) e a entrada, no instante t, com dimens ao m; z() representa a
particular combinacao das variaveis de estado que queremos controlar, com
z(t) IR
p
simbolizando o valor de z() em t. Finalmente, y() representa a
combinacao das variaveis de estado que podemos medir efetivamente e que
deve ser usada para implementar a lei de controle; o vetor r-dimensional y(t)
tem o signicado usual, exprimindo o valor em t da grandeza y().
SISTEMA o
CONTROLADOR
_
u
_
z
'
y
_
Esta formulacao e bastante geral pois, alem de condiderarmos sadas de
duas naturezas diferentes, o modelo empregado e variante no tempo. Ap os
este incio mais geral, logo recairemos no caso linear e invariante no tempo.
1
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 2
1.1 Problema das condic oes terminais
Este primeiro problema pode ser formulado da seguinte maneira:
Para o sistema o acima, sendo especicado um instante de tempo
t
f
> t
0
e um vetor z
IR
p
, gostaramos de fazer com que z(t
f
)
se aproximasse o maximo possvel de z
.
Para uma formulacao alternativa deste problema, usando smbolos ma-
tem aticos, devemos denir um sinal de erro e(t) que deve ser minimizado:
sendo e(t) = z(t) z
, encontrar u() de modo que e(t

f
) seja mnimo. Ou
seja, queremos minimizar e(t
f
), mas isto e um vetor! Podemos transformar
o problema em um problema de minimizar um escalar:
Encontrar u() |e(t
f
)| = e
T
(t
f
)e(t
f
) seja mnimo.
O smbolo deve ser entendido como tal que. Se ha mais interesse em
algumas componentes do que em outras podemos ponderar o vetor e(t
f
) por
meio de uma forma quadr atica:
Encontrar u() e
T
(t
f
)Qe(t
f
) seja mnimo, onde Q > 0.
E desta maneira o nosso problema esta formulado, de v arias maneiras
diversas. Mas e bom manter em mente que propor problemas e apenas uma
face da moeda. Muito mais importante e graticante do que isso e, quando
possvel, encontrar as solucoes dos problemas propostos . . . Chegaremos l a,
certamente, mas antes disso e necessario continuar acertando detalhes da
formulacao. O primeiro passo no ataque de problemas como o desta se cao,
por exemplo, e transforma-los em problemas de aproximar a sada de zero,
ao inves de um dado valor z
. Para entender como, seja uma variavel p(t)

denida por p(t) = z
t. Obviamente isto signica que p(t) = 0 t. Temos

assim mais uma equa cao dinamica para representar o sistema, e o modelo
global seria:
o
_
_
x(t) = A(t)x(t) + B(t)u(t) x(t
0
) = x
0
p(t) = 0 p(t
0
) = z
z(t) = D(t)x(t)
y(t) = C(t)x(t)
Para apresentar estas equa coes de maneira mais condensada podemos
considerar o estado expandido
x
e
(t) =
_
x(t)
p(t)
_
que permitir a escrever
o
_
_
x
e
(t) = A
e
(t)x
e
(t) + B
e
(t)u(t); x
e
(t
0
) = x
0
e
e(t) = D
e
(t)x
e
(t)
y(t) = C
e
(t)x
e
(t)
onde as matrizes expandidas A
e
, etc. sao dadas por
A
e
=
_
A 0
0 0
_
, B
e
=
_
B
0
_
, x
0
e
=
_
x
0
z
_
D
e
= [ D I ] C
e
= [ C 0 ]
Vemos assim que o problema de aproximar a sada de um dado valor
sempre pode ser substitudo pelo problema de aproxima-la de zero, desde
que facamos as necessarias substituicoes. Entao, ao inves de estudar este
problema das condi coes terminais na forma descrita acima, passaremos a
estudar um problema mais geral:
1.2 Anulando z(t
f
): Problema do Regulador
Terminal
Para o sistema com o qual estamos trabalhando, abaixo reescrito para a
comodidade do leitor, queremos fazer com que z(t
f
) assuma o menor valor
possvel:
o
_
x(t) = A(t)x(t) + B(t)u(t); x(t
0
) = x
0
z(t) = D(t)x(t)
Evitamos o problema de minimizacao vetorial procedendo como anteri-
ormente: procurando u() |z(t
f
)| = z
T
(t
f
)z(t
f
) seja mnimo. Para tornar
mais geral, podemos usar uma forma quadr atica positiva denida. Deste
modo, sendo Q uma matriz (p p) positiva denida, o problema ca
Encontrar u() J = z
T
(t
f
)Qz(t
f
) seja mnimo.
Lembrando que z(t) = D(t)x(t) podemos exprimir J em termos do estado
e nao da sada:
J = x
T
(t
f
)D
T
(t
f
)QD(t
f
)x(t
f
) = x
T
(t
f
)Px(t
f
)
onde P = D
T
(t
f
)QD(t
f
) e uma matriz (n n) positiva semidenida (por
que, leitores? talvez seja bom revisitar a se cao A.6). A partir deste ponto
podemos chegar à formulacao mais geral deste problema:
Encontrar u() J = x
T
(t
f
)Px(t
f
) seja mnimo, onde P 0.
E util notar que minimizar o estado terminal implica em minimizar a
sada terminal, mas a recproca nao e verdadeira, como mostra o
Exemplo 1.2.1 Para t
f
, sendo x(t) = [e
t
e
t
]
T
, e z(t) = [1 0]x(t),
vericamos que e impossvel minimizar x(t
f
), pois as trajetorias x() crescem
indenidamente, mas no entanto z(t
f
) = 0, pois z() tende à origem, e menor
do que isto nao da!
E bom manter sempre em mente esta diferenca. Vejamos o que se pode

dizer quanto à existencia de solucoes para o problema acima descrito.

E
l ogico que se ha controlabilidade conseguiremos fazer qualquer coisa com o
estado, inclusive lev a-lo ate a origem em t
f
. Assim,
o controlavel = existe solu cao com x(t
f
) = 0, ou seja, J
min
= 0.
Para o caso o incontrol avel devemos ter paciencia e esperar um pouco
mais pela solucao.
1.3 Comportamento Funcional em um Inter-
valo
Problemas terminais como os acima
descritos tem pouca utilidade na
pr atica: podemos ter z(t
f
) e x(t
f
)
aceitaveis mas comportamentos
transit orios ruins. No mundo
real, alem dos valores nais
ou terminais ou pontuais, o
que acontece antes deles,
ou seja, o comportamento
transit orio, e de crucial
importancia. Assim sendo
podemos denir este novo problema:
_
t
'
t
0
t
f
Para o sistema acima, sendo especicados t
0
0 e t
f
> t
0
, gos-
taramos de fazer com que z() tenha um comportamento tran-
sitorio adequado, isto e, z(t) satisfa ca certos requisitos em todos
os pontos t tais que t
0
t t
f
.
Na pr atica, a frase comportamento adequado signica que as variaveis
tem valores pequenos, estao o mais pr oximo possvel de zero. Deste modo
um enunciado alternativo para o problema seria
Encontrar u() z(t) esta proximo de 0 t [t
0
t
f
]
Para transformar em um problema escalar usamos a ideias de norma ou,
mais geral, uma forma quadr atica :
Encontrar u() z
T
(t)Q(t)z(t) esta proximo de 0 t [t
0
t
f
]
Temos agora a funcao escalar z
T
(t)Q(t)z(t) cujo comportamento deve
estar pr oximo de 0 em todos os instantes do intervalo [t
0
t
f
]. Esta coloca cao
ainda e bastante vaga e pode gerar d uvidas. Qual, por exemplo, dentre as
curvas abaixo seria considerada a melhor de acordo com este criterio?
_
t
'
t
0
t
f
A area sob uma curva da uma boa ideia da proximidade de 0 da funcao
durante o intervalo, e assim podemos escrever
Encontrar u() J =
_
t
f
t
0
z
T
(t)Q(t)z(t) dt seja mnimo.
Esta e a formulacao matem atica mais perfeita para este problema, res-
tando apenas um pequeno detalhe: como escolher Q?
Exemplo 1.3.1 Seja J =
_
t
f
t
0
z
T
(t)Q(t)z(t) dt, onde
Q(t) =
_
1 1
1 1
_
e
z(t) =
_
e
t
e
t
_
_
z
1
'
z
2
Z
Z
Z
Z
z
0
E facil ver que z

T
(t)Q(t)z(t) = 0 t, ou seja, J = 0 e e consequentemente
mnimo. E no entanto z(t) . Isto e algo que devemos evitar. Por
que ocorre? Porque a matriz Q escolhida e apenas semidenida positiva, e
podemos ter z
T
(t)Q(t)z(t) = 0 sem que z(t) = 0. No caso especco deste
exemplo, x
T
Qx = 0 sempre que as componentes x
1
e x
2
de x forem iguais.
Para matrizes Q 0 os movimentos em algumas dire coes serao repre-
sentados por 0: elas sao incapazes de traduzir movimentos ocorrendo nessas
regi oes. Com isto em mente ja temos algo util para a escolha da matriz Q
no problema em estudo. Ele caria:
Sendo Q(t) > 0 t [t
0
t
f
], minimizar J =
_
t
f
t
0
z
T
(t)Q(t)z(t) dt
Mais à frente veremos outros detalhes sobre como escolher a matriz de
pondera cao Q. Por ora, lembrando que z(t) = D(t)x(t) podemos expressar
o problema de minimizacao acima em termos do estado e nao da sada:
Com P(t) = D
T
(t)Q(t)D(t) 0 t [t
0
t
f
], min J =
_
t
f
t
0
x
T
(t)P(t)x(t) dt
Especulemos um pouco sobre a solucao deste problema. Se o e con-
trol avel deve haver solucao, pois podemos fazer qualquer coisa com o estado
e, consequentemente, podemos impor a x
T
(t)P(t)x(t) o comportamento que
quisermos. E assim e. Sendo o control avel a tarefa de minimizar J parece
f acil. Podemos ate pensar no seguinte:
_
t
'
'
t
0
t
f
_
Ou seja, entre t
0
e t
+
0
realizamos uma transferencia instantanea ate a
origem e depois l a mantemos o estado. Havendo controlabilidade ate isto e
possvel! Precisaramos entretanto de impulsos unitarios e suas derivadas na
entrada, e infelizmente isto e inviavel na pr atica.
1.4 Exerccios
1. Para o Sistema Linear Invariante no Tempo
.
x (t) = Ax(t) + Bu(t)
com rank(B) = m = n umero de colunas de B, seja x(0
) = x
0
. En-
contrar a entrada u que deve ser aplicada para que o estado seja ins-
tantaneamente transferido para a origem e l a permaneca: x(0
+
) = 0 e
x(t) = 0 t > 0
1.5 Problema do Regulador Funcional
Voltando ao problema anterior para um apanhado geral, e f acil ver que po-
demos associar o valor de J às amplitudes da sada, e tambem ` a rapidez com
que ela se aproxima de zero.
_
t
'
t
0
t
f
O ndice J mede duas coisas: o comportamento da sada z em termos de
amplitudes e a rapidez com que este sinal se aproxima de zero:
J pequeno =
_
amplitudes pequenas t
aproximacao rapida de zero
Desta maneira, minimizar J e uma tarefa duplamente benvinda. Ha no
entanto alguns perigos pois, como ja deve ter dado para perceber, quando
J diminui as amplitudes de u aumentam. Isto mostra que este problema,
como formulado ate agora, nao tem grande sentido pr atico, e deve ser refor-
mulado. Alem de minimizar J gostaramos tambem que u() fosse pequeno.
Ao trabalho pois, com vontade. A nova ideia pode ser resumida:
encontrar u() J e mnimo e u(t) e pequeno t [t
0
t
f
]
ou entao, tornando o segundo quesito mais preciso:
encontrar u()
_
J e mnimo
_
t
f
t
0
u
T
(t)R(t)u(t) dt e mnimo
Minimizar duas coisas separadamente e a mesma coisa que minimizar a
sua soma, desde que estas coisas sejam positivas. Como este e precisamente o
nosso caso, podemos reformular este problema de uma maneira mais simples
e direta:
Encontrar u() tal que
J =
_
t
f
t
0
[z
T
(t)Q(t)z(t) + u
T
(t)R(t)u(t)] dt e mnimo
onde Q(t) > 0 t [t
0
t
f
] e R(t) > 0 t [t
0
t
f
]
Esta e uma maneira comoda e elegante de impor comportamento aceit avel
e rapidez de convergencia tanto para z() como para u(), e formulacoes deste
tipo ja apresentam aplicabilidade pr atica muito grande. Como nos outros
casos da para perceber que tambem aqui a controlabilidade tem muito a ver
com a existencia de solucao. Mais tarde veremos isso. Por ora, um outro
aspecto precisa ser encarado:
Suponhamos que para um dado sistema
o uma entrada u
I
acarreta sada z
I
e ndice J
I
. Para uma outra en-
trada u
II
teramos z
II
e J
II
.
Suponhamos ainda que
|z
I
(t
f
)| < |z
II
(t
f
)|
Pode perfeitamente ser
que J
II
< J
I
e no entanto
as condi coes terminais sao piores.
Como nada foi dito a esse respeito, escolheramos J
II
e pronto. Este arrazo-
ado nos leva de maneira natural a estabelecer o seguinte
_
t
'
t
0
t
f
I
II
Fato 1.5.1 Melhorar o comportamento funcional das variaveis z e u nao
implica necessariamente em melhorar tambem o comportamento terminal.
Vemos assim que esta formulacao ainda admite aperfei coamento: ela deve
ser ampliada para levar em conta as condi coes terminais.

Otimo Determinstico
Alem de um bom comportamento funcional das variaveis z e u, desejamos
tambem boas propriedades terminais; a formulacao seria:
J =
_
t
f
t
0
[z
T
(t)Q(t)z(t) + u
T
(t)R(t)u(t)] dt + z
T
(t
f
)Tz(t
f
) e mnimo
onde Q(t) > 0 t [t
0
t
f
]; R(t) > 0 t [t
0
t
f
]; T > 0
Este problema tem sido um dos mais estudados pela comunidade cien-
tca de Controle. A analise de sua solucao e bem conhecida e, detalhe
importante, estas solucoes podem ser expressas como realimenta coes, como
veremos. Talvez por esta razao este problema e o de maior aplicabilidade
pr atica dentre todos os problemas de Controle

Otimo.

E um belo exemplo
onde o arsenal de recursos da teoria matem atica e posto a trabalhar para
resolver algo do mundo pr atico. Embora a teoria desenvolvida nos ultimos
30 anos, principalmente a partir dos trabalhos de Bellman e Kalman, seja
v alida para o caso linear geral vamos nos restringir aqui ao caso linear e
invariante no tempo, ou xo.

Otimo Determinstico
Fixo
Seja o sistema padrao
o
_
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
y(t) = Cx(t)
Como as matrizes representativas do sistema sao constantes, e razoavel
empregar matrizes tambem constantes nas formas quadr aticas do ndice a
ser minimizado, que passaria a ser
J = J(u) =
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Tz(t
f
)
onde Q > 0, R > 0 e T > 0. O Problema do Regulador Linear

Otimo
Determinstico e Invariante no Tempo, abreviadamente chamado de PRLO
a partir de agora, pode ser enunciado como
Encontrar u
(t), com t
0
t t
f
tal que J(u
) = J
e mnimo.
Lembrando que z(t) = Dx(t) temos z
T
(t)Qz(t) = x
T
(t)R
1
x(t), onde (vide
se cao A.6) R
1
= D
T
QD 0, e tambem z
T
(t
f
)Tz(t
f
) = x
T
(t
f
)P
f
x(t
f
), onde
P
f
= D
T
TD 0. Fazendo R = R
2
chegamos a outra formulacao equivalente
para o PRLO, agora em termos do estado e nao das sadas:
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
) e mnimo
onde R
1
0; P
f
0; R
2
> 0
Uma vez formulado o problema, pode-se pensar em resolve-lo: a partir
do conhecimento de A, B, C, D, Q, R, T devemos pesquisar a existencia de
solucoes. Intuitivamente percebe-se que controlabilidade deve desempenhar
um papel, mas veremos isso mais para a frente. Antes porem notemos que
A, B, C, D constituem o modelo matem atico do sistema que se quer con-
trolar, sendo portanto dados do problema. Como encontrar as matrizes de
pondera cao Q, R, T, e consequentemente as matrizes R
1
, R
2
e P
f
que delas
derivam? As regras gerais para esta escolha sao um tanto quanto vagas, e
muitas vezes o conhecimento do problema em estudo e do que se deseja fazer
com ele levar a à escolha.

E uma tarefa bastante dependente do sentimento
do projetista. Mesmo assim ha uma linha basica geral. Ela e vaga, como
dissemos, e ca mais claro apresenta-la por meio de um
Exemplo 1.7.1 Para um motor DC, seja (t) a posicao angular da carga,
e (t) a sua velocidade angular. A equa cao do modelo matematico para este
sistema e dada por:
(t) = a(t) + bu(t); onde
_
a = 0.5 s
1
b = 150 rd/(V s
2
)
A nalidade do problema e estabilizar a velocidade da maneira melhor
possvel em torno de um valor desejado
0
. Traduzir este objetivo, principal-
mente o trecho da melhor maneira possvel, em termos mais precisos e o
que se chama formulacao do problema. Vejamos em primeiro lugar que esta-
bilizar em torno de
0
e a mesma coisa que estabilizar em torno de 0, e isto se
chama regular. Supondo provisoriamente que a situacao ideal (t) =
0
t e
satisfeita, vejamos que entrada deveria ser aplicada ao sistema para mante-
la. Temos (t) = a
0
+ bu(t) = 0, donde u(t) = u
0
= (a/b)
0
. Denindo
agora uma nova variavel de estado como x(t) = (t)
0
teremos
x(t) = (t) = a(t) + bu(t)
= a(t) a
0
+ a
0
+ bu(t)
= ax(t) bu
0
+ bu(t)
Considerando entao a variavel v(t) = u(t)u
0
podemos escrever as novas
equa coes para o sistema:
_
x(t) = ax(t) + bv(t)
z(t) = x(t)
Assim vericamos, conforme o prometido, que estabilizar (t) em torno
de
0
equivale a estabilizar x(t) em torno de 0, ou seja, regular x(t). Como
todas as variaveis sao escalares podemos formular o nosso conhecido problema
de otimiza cao usando como ndice:
J =
_
t
f
t
0
[z
T
(t)qz(t) + v
T
(t)rv(t)] dt + z
T
(t
f
)pz(t
f
)
=
_
t
f
t
0
[qz
2
(t) + rv
2
(t)] dt + pz
2
(t
f
)
Como as matrizes de ponderacao sao tambem escalares podemos igualar
uma delas a 1 e mesmo assim ainda conseguiremos dar pesos relativos. Desta
maneira, sendo r > 0 e p > 0 o criterio a ser minimizado ca
J =
_
t
f
t
0
[z
2
(t) + rv
2
(t)] dt + pz
2
(t
f
)
Minimizar J garante tres coisas:
z() e pequeno (() proximo de w
0
)
v() e pequeno (u() proximo de u
0
)
z(t
f
) e pequeno
Situacoes onde e importante manter pequenas amplitudes da entrada sao
chamadas de situacoes de controle caro, e para que o ndice reita esta
condicao devemos usar um alto valor para r. Por outro lado, situacoes onde
podemos concentrar as aten coes na melhoria de z sem nos preocuparmos
com os gastos envolvidos (grandes amplitudes da entrada) caracterizam o
chamado controle barato. Estas instrucoes sao comunicadas ao ndice usando
um valor baixo para r. No caso limite teramos r = 0, signicando que os
valores assumidos pela entrada sao totalmente irrelevantes.
Para achar efetivamente bons valores numericos para r e p precisamos do
metodo de tentativa e erro. Depois, depois, e preciso antes saber a solu cao.
Exemplo 1.7.2 Para o mesmo sistema anterior, se quisermos controlar a
posicao e nao a velocidade precisaremos de um modelo mais completo. Sendo
agora a = 4.6s
1
e b = 0.787rd/(V s
2
) teremos:
_

_
=
_
0 1
0 a
_ _

_
+
_
0
b
_
u
O objetivo e estabilizar a posicao do melhor modo possvel em torno de
um valor desejado
0
. Denindo as variaveis de estado x
1
=
0
, e x
2
=
chegamos a
x =
_
0 1
0 a
_
x +
_
0
b
_
u; z = [ 1 0 ]x
Vemos que
0
se e somente se z 0. O ndice seria como acima:
J =
_
t
f
t
0
[z
2
(t) + ru
2
(t)] dt + z
2
(t
f
)
1.8 Exerccios, ainda
1. Mostrar que x
T
Qx = x
T
Q
T
x x
2. Se A = A
T
a matriz A sera chamada de antisimetrica. Sendo M uma
matriz (n n) qualquer mostrar que:
(a)
1
2
(M + M
T
) e simetrica.
(b)
1
2
(M M
T
) e antisimetrica.
3. Mostrar que qualquer matriz quadrada Q pode ser decomposta em
Q = Q
1
+ Q
2
onde Q
1
e simetrica e Q
2
e antisimetrica.
4. Mostrar que a forma quadr atica Q e identicamente nula (x
T
Qx = 0 x)
se e somente se Q e anti simetrica.
5. Sendo
.
x= Ax, x(0) = x
0
, tracar um gr aco para x
T
(t)Qx(t). A partir
deste gr aco e possvel dizer algo sobre a estabilidade do sistema?
A =
_
_
0 1 0
0 0 1
1 1 1
_
_ ; x
0
=
_
_
1
1
1
_
_ ; Q =
_
_
1 1 0
1 0 0
0 0 1
_
_
6. idem 5 para
Q =
_
_
1 1 1
1 1 1
1 1 1
_
_
7. Sendo Q simetrica e positiva denida e M inversvel, que se pode dizer
de P = M
1
QM? sera simetrica tambem? qual o sinal da forma
x
T
Px? sob que condi coes de M a matriz P e simetrica? anti simetrica?
positiva denida?
8. Sendo Q simetrica e p.d. (positiva denida) e D uma matriz (r n),
com r < n, que se pode dizer de P = D
T
QD? (repetir os quesitos do
exerccio anterior).
9. idem 8 para r = n.
10. idem 8 para r > n
11. A gura a seguir representa um pendulo invertido com base circular.
Ao eixo do disco e acoplado um motor que dever a ser acionado de forma
a equilibrar o pendulo na posicao vertical. Os dados numericos sao:
x =
_
_
0 1 0 0
56.56 0.09 42.42 0
0 0 0 1
28.28 0.045 71.21 0
_
_
x +
_
_
0
5.12
0
2.56
_
_
u; x
0
=
_
_
/36
0
/180
0
_
_
&%
'$
/
/
/
/
/
/
Considerando como sada a posicao angular do pendulo com rela cao ` a

vertical do seu ponto de apoio temos
z = [ 0 0 1 0 ]
Deseja-se equilibrar o pendulo na posicao vertical (
2
= z = 0) da
melhor maneira possvel. As principais restri coes fsicas do sistema
sao:
a tensao m axima admissvel pelo motor e [u[
max
= 10V
para a lineariza cao permanecer v alida e necessario que [x
3
[
max
=
[z[
max
= /18 = 10
Pede-se:
(a) Encontrar (A), o espectro de malha aberta.
(b) Supondo que t
0
= 0 e que temos um horizonte de tempo de 01
segundos, formular o problema como um problema de regulador
otimo.
(c) Escolher matrizes de pondera cao adequadas.
(d) Resolver o problema dando solucoes em MA (malha aberta) e MF
(malha fechada).
(e) Apresentar, se possvel, uma solucao em MF com F
= cte. En-
contrar
= (A + BF
).
(f) Embora nada se exija das variaveis x
1
, x
2
e x
4
, vericar o seu com-
portamento para cada uma das solucoes encontradas (elas tendem
para 0? quais sao seus valores m aximos?).
(g) Supondo que agora o horizonte de tempo e de 02 segundos, repetir
os itens b, c, d, e, f.
(h) idem g para 05 segundos.
(i) idem g para l0 segundos.
(j) idem g para horizonte de tempo ininito.
(k) Comparar e comentar todos os resultados obtidos ate agora.
(l) Repetir todos os itens acima, de b ate k, supondo que o interesse
passa a ser em todas as variaveis de estado: z = x. Supor tambem
que [x
1
[
max
= [x
3
[
max
= /18 e que x
2
e x
4
permanecem irrestritas.
Captulo 2
Solucao do Problema do
Regulador
Seja o sistema linear e invariante no tempo ao qual temos nos dedicado com
exclusividade quase total:
o
_
_
0
) = x
0
z(t) = Dx(t)
O PRLO, relembremos, signica minimizar o criterio quadr atico dado por
J = J(u) =
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Pz(t
f
)
onde as natrizes de pondera cao sao positivas denidas: Q > 0, R > 0 e
P > 0. Ou entao, em termos do estado, minimizar
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
onde R
1
= D
T
QD 0 R
2
= R > 0 P
f
= D
T
PD 0
Antes de estudar aspectos relativos à existencia de solucoes, sua unicidade
etc., vamos vericar que condi coes as solucoes se existirem dever ao sa-
tisfazer. Deste modo criaremos um conjunto onde as solucoes (se existirem)
dever ao ser buscadas. Muitas e muitas vezes este conjunto de possveis can-
didatos e composto de poucos ou ate mesmo de um unico elemento, e assim
a tarefa de checar a otimalidade dos candidatos ca bem mais suave. O co-
nhecimento a priori de que existem solucoes otimas tambem ajuda. Para este
caso linear pode-se provar que existe solucao e ela e unica. Maiores detalhes
vir ao depois.
15
CAPTULO 2. SOLUC

AO DO PROBLEMA DO REGULADOR 16
2.1 Solu cao pelo Calculo das Varia c oes
Supondo que a solucao existe, seja ela u
(t), t [t
0
t
f
], e sejam x
() e J
a
trajet oria acarretada por ela e o ndice correspondente:
u() = u
()
_
_
x = x
()
J = J(u
) = J
= mnimo
Isto signica que x
() e u
() satisfazem a equa cao basica do sistema, ou

seja, t [t
0
t
f
]:
x
(t) = Ax
(t) + Bu
(t) (2.1)
Vamos supor que agora a entrada aplicada ao sistema sofre uma pertur-
bacao, uma variacao, e passa a nao ser mais exatamente igual a u
:
u() = u
() + u()
onde e um escalar arbitrario e u() e uma funcao arbitraria do tempo,
denida em [t
0
t
f
]. Esta variacao na entrada afetar a o estado, e, considerando
a linearidade do sistema, a trajet oria passar a a ser x() = x
() + x(). Em
smbolos:
u() = u
() + u() x() = x
() + x()
Mas isto signica que, t [t
0
t
f
]:
x
(t) +
.
x (t) = Ax
(t) + A x(t) + Bu
(t) + B u(t) (2.2)

Aplicando (2.1) a equa cao dinamica relacionando o estado x(t) pode ser
deduzida:
.
x (t) = A x(t) + B u(t) (2.3)
Podemos supor que a condi cao inicial permanece inalterada quando a
entrada passa de u
() para u(), ou seja: x(t

0
) = x
0
= x
(t
0
). Conclui-se
que x(t
0
) = 0 e, usando a expressao classica para sistemas lineares xos:
x(t) =
_
t
t
0
(t, )B u() d =
_
t
f
t
0
(t, )B u() d (2.4)
onde a matriz de transicao de estados (t, ) e dada pela exponencial ma-
tricial e
(t)A
. Como o nosso sistema e causal temos (t, ) = 0 > t e a
integra cao pode ser encerrada em t ou em t
f
.
CAPTULO 2. SOLUC

Podemos agora usar esses resultados e calcular o valor assumido pelo
ndice J para u = u
+ u e x = x
+ x:
J =
_
t
f
t
0
_
(x
T
(t) + x
T
(t))R
1
(x
(t) + x(t))+
(u
T
(t) + u
T
(t))R
2
(u
(t) + u(t))
_
dt +
(x
T
(t
f
) + x
T
(t
f
))P
f
(x
(t
f
) + x(t
f
))
Desenvolvendo e reagrupando chega-se a
J =
_
t
f
t
0
_
x
T
(t)R
1
x
(t) + u
T
(t)R
2
u
(t)
_
dt + x
T
(t
f
)P
f
x
(t
f
) +
2
_
_
t
f
t
0
_
x
T
(t)R
1
x
(t) + u
T
(t)R
2
u
(t)
_
dt + x
T
(t
f
)P
f
x
(t
f
)
_
+
2
_
_
t
f
t
0
_
x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)
_
dt + x
T
(t
f
)P
f
x(t
f
)
_
Ufa! que trabalheira. Para colocar um pouco de simplicidade nesse
maci co formalismo basta observar que, dando nomes pequenos para ex-
press oes grandes, podemos escrever J = a
2
+ b + c. E agora a tarefa
de minimizar J em funcao do par ametro e bem simples, pois temos um
familiar trin omio do segundo grau. Sabemos que o mnimo J
min
ocorre para
2a + b = 0 ou, equivalentemente, para = b/2a, quando a > 0. Mas por
outro lado sabemos que J
min
= J
ocorre quando u = u
, ou seja, = 0.
Disto concluimos que
a > 0 e b = 0
e isto implica em
_
t
f
t
0
_
x
T
(t)R
1
x
(t) + u
T
(t)R
2
u
(t)
_
dt + x
T
(t
f
)P
f
x
(t
f
) = 0
Entrando com o valor encontrado anteriormente para x(t) na equa cao
(2.4) seremos levados a:
_
t
f
t
0
_
_
t
f
t
0
u
T
()B
T
T
(t, ) d
_
R
1
x
(t) dt +
_
t
f
t
0
u
T
(t)R
2
u
(t) dt
+
_
_
t
f
t
0
u
T
()B
T
T
(t
f
, ) d
_
P
f
x
(t
f
) = 0
CAPTULO 2. SOLUC

E tome de truques! Invertendo a ordem de integra cao na primeira parcela:
_
t
f
t
0
_
_
t
f
t
0
u
T
()B
T
T
(t, )R
1
x
(t) dt
_
d +
_
t
f
t
0
u
T
(t)R
2
u
(t) dt
+
_
t
f
t
0
u
T
()B
T
T
(t
f
, )P
f
x
(t
f
) d = 0
Mais um: trocando de posicao as variaveis t e no primeiro e no terceiro
termos:
_
t
f
t
0
_
_
t
f
t
0
u
T
(t)B
T
T
(, t)R
1
x
() d
_
dt +
_
t
f
t
0
u
T
(t)R
2
u
(t) dt
+
_
t
f
t
0
u
T
(t)B
T
T
(t
f
, t)P
f
x
(t
f
) dt = 0
Agrupando os termos vem
_
t
f
t
0
u
T
(t)
_
B
T
_
T
(t
f
, t)P
f
x
(t
f
) +
_
t
f
t
0
T
(, t)R
1
x
() d
_
+
R
2
u
(t) dt = 0
Ou, mais compactamente:
_
t
f
t
0
u
T
(t)
_
B
T
p(t) + R
2
u
(t)
_
dt = 0 (2.5)
onde novamente usamos um smbolo simples para designar uma express ao
longa:
p(t) =
T
(t
f
, t)P
f
x
(t
f
) +
_
t
f
t
0
T
(, t)R
1
x
() d (2.6)
Para a integral (2.5) se anular e necessario que
B
T
p(t) + R
2
u
(t) = 0 t [t
0
t
f
]
Como R
2
deve ser inversvel (ela e positiva denida), podemos, nalmente,
explicitar a entrada u
(t)
u
(t) = R
1
2
B
T
p(t) t [t
0
t
f
] (2.7)
Pela primeira vez encontramos uma expressao para u
, mas a sua apli-

cabilidade e problem atica, pois ela esta condicionada ao conhecimento da
variavel p, dada pela equa cao (2.6), e, convenhamos, o aspecto desta rela cao
e um tanto quanto intimidador. Um expediente muito usado para contornar
CAPTULO 2. SOLUC

diculdades decorrentes de expressoes complicadas e deriva-las e tentar en-
contrar uma equa cao diferencial da qual elas sejam solucao. Derivando entao
(2.6) em rela cao ao tempo:
p(t) =
d
dt
[
T
(t
f
, t)]P
f
x
(t
f
) +
d
dt
_
t
f
t
0
T
(, t)R
1
x
() d
Ap os um desenvolvimento, que pouco acrescentaria às nossas argucidades,
chegaramos nalmente a uma forma elegante e compacta:
_
_
p(t) = A
T
p(t) R
1
x
(t)
p(t
f
) = P
f
x
(t
f
)
Percebe-se que p e a solucao de um SLIT de dimens ao n, com entrada x
e cuja condi cao de contorno e uma condi cao terminal e nao inicial. Ainda
esta tudo embolado: para alcan carmos o nosso objetivo u
precisamos de p,
para conseguirmos este precisamos resolver a equa cao acima, o que faremos
apenas com o conhecimento de x
; e neste ponto precisamos de u
. . . Como
sair desta?
2.2 Equac oes Variacionais
Sendo u(t) = u
(t) = R
1
2
B
T
p(t), como deduzido acima, podemos reescre-
ver a equa cao (2.1):
x
(t) = Ax
(t)BR
1
2
B
T
p(t); x(t
0
) = x
0
(2.8)
A variavel p e normalmente conhecida como variavel adjunta ou entao
coestado; a equa cao diferencial que a origina pode ser apresentada como
p(t) = R
1
x
(t)A
T
p(t); p(t
f
) = P
f
x
(t
f
) (2.9)
Podemos fundir estas ultimas equa coes em uma unica:
_
x
(t)
p(t)
_
=
_
A BR
1
2
B
T
R
1
A
T
_ _
x
(t)
p(t)
_
(2.10)
Temos assim um sistema linear, xo, aut onomo, com dimens ao 2n, que
pode ser escrito em uma forma mais compacta:
_
x
e
(t) = A
e
x
e
(t)
x
(t
0
) = x
0
; p(t
f
) = P
f
x
(t
f
)
CAPTULO 2. SOLUC

onde o vetor x
e
(t) e a matriz A
e
sao dados por:
x
e
(t) =
_
x
(t)
p(t)
_
; A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
A novidade e que temos agora condi coes de contorno hbridas: iniciais
e terminais. Note-se tambem que A
e
e uma matriz Hamiltoniana (apendice
A, se cao A.9). Sendo
e
(t, ) a matriz de transicao de estados para este
sistema expandido, podemos escrever a expressao geral
x
e
(t) =
e
(t, )x
e
()
Considerando os casos = t
0
e = t
f
temos expressoes para o estado ex-
pandido x
e
em termos das condi coes iniciais e nais: x
e
(t) =
e
(t, t
0
)x
e
(t
0
) e
x
e
(t) =
e
(t, t
f
)x
e
(t
f
). Particionando a matriz
e
(t, t
f
) podemos desenvolver
esta ultima equa cao:
_
x
(t)
p(t)
_
=
_

11
(t, t
f
)
12
(t, t
f
)
21
(t, t
f
)
22
(t, t
f
)
_ _
x
(t
f
)
p(t
f
)
_
donde saem as equa coes individuais
x
(t) =
11
(t, t
f
)x
(t
f
) +
12
(t, t
f
)p(t
f
)
p(t) =
21
(t, t
f
)x
(t
f
) +
22
(t, t
f
)p(t
f
)
Mas p(t
f
) = P
f
x
(t
f
), e podemos entao escrever
x
(t) = [
11
(t, t
f
) +
12
(t, t
f
)P
f
]x
(t
f
) (2.11)
p(t) = [
21
(t, t
f
) +
22
(t, t
f
)P
f
]x
(t
f
) (2.12)
Fazendo t = t
0
na equa cao (2.11) pode-se relacionar x
(t
f
) e x
(t
0
) = x
0
:
x
(t
0
) = [
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]x
(t
f
) = x
0
o que leva, apos substituicao na equa cao (2.12), a
p(t) = [
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]
1
x
0
Esta expressao depende apenas de x
0
, (conhecido) e das matrizes
ij
,
parti coes de
e
, que podem ser calculadas (
e
e a exponencial matricial
associada à matriz A
e
). Tambem e preciso haver invertibilidade daquele
bloquinho, e para garantir isto necessitaramos que a matriz Hamiltoniana
A
e
apresentasse certas caractersticas. Depois veremos mais detalhes sobre
CAPTULO 2. SOLUC

estes problemas; por enquanto suporemos que o bloco e inversvel e podemos
exprimir p(t) como acima. E assim podemos nalmente apresentar a solucao:
u
(t) = R
1
2
B
T
[
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]
1
x
0
(2.13)
Esta entrada otima acarretaria uma trajet oria otima descrita por
x
(t) = [
11
(t, t
f
) +
12
(t, t
f
)P
f
][
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]
1
x
0
(2.14)
A expressao para o ndice otimo J
e um pouco trabalhosa, sera analisada

depois. Pronto, eis a uma solucao, uma funcao do tempo que, se calculada
previamente e depois colocada como entrada, minimizaria o nosso criterio. So
ha um inconveniente: ela e uma lei em malha aberta. Qualquer modica cao
em x
0
ou em par ametros do sistema e esta lei passa a ter seu funcionamento
amea cado. Em termos pr aticos isto e ruim, anal sabe-se que para controlar
ecientemente os sistemas do mundo real e necessario usar realimenta cao, ou
seja, controle em malha fechada. Mas e facil consertar as coisas: manipulando
mais uma vez as equa coes (2.11) e (2.12) substituindo t = t
f
em (2.11) e
colocando o resultado em (2.12) seramos levados a
p(t) = [
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t, t
f
) +
12
(t, t
f
)P
f
]
1
x
(t) (2.15)
Agora p(t) foi apresentado em termos de x
(t) e nao mais em funcao de

x
0
. Fazendo
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t, t
f
) +
12
(t, t
f
)P
f
]
1
= P
(t) (2.16)
poderemos economizar na notacao e colocar p(t) = P
(t)x
(t). Temos nal-

mente uma formula densa:
u
(t) = R
1
2
B
T
P
(t)x
(t)
= F
(t)x
(t)
Feito, a solucao pode ser expressa como uma realimenta cao de estados! O
ganho e variante no tempo, mas tudo bem, agora temos controle em malha
fechada
Planta o
F
(t)
'
E
x
(t)
u
(t)
Este fato e importante; a solucao otima pode ser implementada por meio
de realimenta cao de estados. A existencia ou nao de solucoes esta associada
à invertibilidade do bloco [
11
(t, t
f
) +
12
(t, t
f
)P
f
] e a propriedades da matriz
Hamiltoniana A
e
. Alguns detalhes serao vistos posteriormente.
CAPTULO 2. SOLUC

2.2.1 Em resumo:
Dado o sistema costumeiro
o
_
0
) = x
0
z(t) = Dx(t)
e o ndice quadr atico
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
com R
1
0, R
2
> 0, P
f
0, o procedimento basico para minimizar J esta
exposto a seguir:
1. Formar o sistema expandido x
e
(t) = A
e
x
e
(t) onde
A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
(2.17)
2. Encontrar e particionar a matriz de transicao de estados para o sistema
acima:
e
(t, ) = e
(t)Ae
=
_

11
(t, )
12
(t, )
21
(t, )
22
(t, )
_
(2.18)
3. Calcular P
(t) por meio da equa cao (2.16):

P
(t) = [
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t, t
f
) +
12
(t, t
f
)P
f
]
1
4. A solucao em malha fechada e:
u
(t) = F
(t)x
(t) onde F
(t) = R
1
2
B
T
P
(t) (2.19)
Para xar os conceitos, vejamos um
Exemplo 2.2.1 Estabilizacao da velocidade
Podemos pensar em um motor como o dos exemplos do captulo passado,
com posicao da carga medida por e velocidade angular w. O objetivo agora
e estabilizar w em torno de w
0
, partindo de t
0
= 0, em t
f
= 1. Um modelo
matematico para este sistema ja foi visto anteriormente:
_
_
z(t) = x(t)
CAPTULO 2. SOLUC

onde x(t) = (t)
0
, v(t) = u(t) + (a/b)
0
, a = 0, 5 e b = 150. O
problema e minimizar
J = J(v) =
_
1
0
[z
2
(t) + rv
2
(t)] dt + pz
2
(1)
onde os reais r e p sao positivos. Vejamos a solu cao, passo a passo. O
sistema expandido e:
_
x(t)
p(t)
_
=
_
a (b
2
/r)
1 a
_ _
x(t)
p(t)
_
Calculando e particionando a matriz
e
(t, ) = e
(t)Ae
chegaremos a
_
11
(t, ) = (1/4)
_
(2 1)e
(t)
+ (2 + 1)e
(t)
_
12
(t, ) = (b
2
/2r)
_
e
(t)
e
(t)
_
21
(t, ) = (1/2)
_
e
(t)
e
(t)
_
22
(t, ) = (1/4)
_
(2 + 1)e
(t)
+ (2 1)e
(t)
_
onde =
_
a
2
+ b
2
/r. As expressoes para a solu cao em malha aberta podem
ser obtidas por substituicao destes valores nas equa coes(2.13) e (2.14):
_
v
(t) = (b/r) [
21
(t, 1) + p
22
(t, 1)] [
11
(0, 1) + p
12
(0, 1)]
1
x
0
x
(t) = [
11
(t, 1) + p
12
(t, 1)] [
11
(0, 1) + p
12
(0, 1)]
1
x
0
As solu coes otimas dependerao dos parametros r e p; se eles sao conhe-
cidos poderemos, (apos contas brabas!) encontrar a entrada otima em malha
aberta v
e trajetoria otima x
. Vemos deste modo que e preciso enfrentar

o problema de escolher os parametros de ponderacao r e p. O metodo de
tentativa e erro e sempre uma boa pedida, a ele entao! Em primeiro lugar
devemos isolar o efeito dos parametros: xamos um deles e analisamos o
outro.
1.) Efeito do custo do controle para condicoes terminais
desimportantes
Isto signica usar p = 0 nas formulas acima, resultando em:
_
v
(t) = (b/r)
21
(t, 1)[
11
(0, 1)]
1
x
0
x
(t) =
11
(t, 1)[
11
(0, 1)]
1
x
0
Substituindo os valores e plotando para r = 100, r = 1000 e r = 10000
chega-se a
CAPTULO 2. SOLUC

_
t
1.0 0.5
'v
(t)
10
5
'
x
(t)
100
50
r=100
r=1000
r=10000
r=100
r=1000
r=10000
Alguns fatos se destacam. Para valores elevados do parametro r, ou seja,
nas chamadas situacoes de controle caro teramos
r v x
e fraco
mostrando que, quando a entrada e muito penalizada o desempenho sofre,
x
() e lento e impreciso. Ja em uma situacao de controle barato, ou seja,

valores baixos de r,
r v x
e bom
e o desempenho melhora pois podemos usar entradas u com amplitudes gran-
des. A partir deste ponto ja e possvel concluir algo. Supondo que conhecemos
a tensao maxima suportada pelo motor, poderemos limitar o valor de r. Para
o caso deste exemplo, [V [
max
= 3, donde r 1000.
2.) Efeito das condicoes terminais para custo xo
Para r = cte = 1000 podemos plotar curvas de x
(t) e v
(t) semelhantes
às precedentes, mas para diversos valores do parametro p. As curvas serao
praticamente coincidentes, e a inuencia de p apenas se faz sentir no nal
do intervalo: para valores elevados de p notamos que as condicoes terminais
melhoram. O reverso da medalha, o preco a se pagar por esse benefcio, se
reete no fato de que a amplitude de u tambem aumenta, mas pouca coisa,
e mesmo assim esse aumento se verica apenas nas proximidades de t = 1.
CAPTULO 2. SOLUC

Isto e otimo, porque signica que podemos melhorar o comportamento
terminal aumentando p e respeitando a restricao de voltagem maxima no
motor! Dependendo de quanto toleraramos de desvio em t = 1 podemos
balizar nossa escolha de p, sempre nos lembrando de vericar se tal valor
nao comprometeria demasiadamente as amplitudes da entrada u. Vamos
supor que neste exemplo [x
(t
f
)[ < 1 esta bom. Para isto as curvas diriam
que devemos usar p > 0.10
3.) Solucao em Malha Fechada
A solu cao apresentada ate agora e a de malha aberta. Ja vimos que
se o problema envolver aplicacoes praticas, ela e pouco conavel e deve-se
pensar em substitu-la por estrategias com realimenta cao. Podemos chegar
aos mesmos resultados otimos acima usando uma lei de controle em malha
fechada, do tipo u
(t) = F
(t)x
(t), visto na equa cao (2.19). Para o caso

presente:
F
(t) = r
1
bP
(t)
= r
1
b[
21
(t, 1) + p
22
(t, 1)][
11
(t, 1) + p
12
(t, 1)]
1
Um dos inconvenientes do metodo e que a solu cao em malha fechada e
variante no tempo. Mas o exemplo mostraria, pela elaborac ao das curvas
para diversos valores dos parametros r e p, que esta varia cao e pequena e
apenas perto do m do intervalo ela se manifesta: F
(t) e quase constante.

Em particular, se xarmos r = 1000 e p = 0.19 teremos
F
(t) F
= cte. = 0, 03
E isto pode ajudar na determinacao de p, pois a facilidade de imple-
menta cao de realimenta coes constantes as torna atraentes e desejaveis.

E
logico que se houver muita exigencia a respeito dos valores terminais esta
escolha de p pode nao servir.
Exemplo 2.2.2 Problema com restricao terminal
x(t) =
_
0 1
0 0
_
x(t) +
_
0
1
_
u; x(0) =
_

1
2
_
Nosso objetivo: em um tempo nito t
f
conduzir o estado ate a origem mi-
nimizando a energia gasta. Estes requisitos podem ser reescritos: encontrar
u() tal que em t
f
> 0, t
f
nito tenhamos
x(t
f
) = 0 e E = E(u) =
_
t
f
0
1
2
u
2
(t) dt seja minimizada
CAPTULO 2. SOLUC

A primeira restricao impede a aplicacao direta da teoria ja vista. Pre-
cisamos contornar este obstaculo. Este problema e chamado de problema
com restricao terminal e a teoria desenvolvida se aplica a problemas com
condicoes terminais livres:
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
onde P
f
e uma medida da import ancia do valor de x(t
f
). Vamos resolver o
PRLO para o caso R
1
= 0 e considerando
P
f
=
_
p 0
0 p
_
= pI
Se p estamos penalizando innitamente x(t
f
) e conseguiremos mi-
nimizar J apenas quando x(t
f
) = 0, como desejamos. Facamos entao R
1
=
0, R
2
= 1/2, P
f
= pI. O sistema adjunto e:
x
e
(t) =
_
A bR
1
2
b
T
0 A
T
_
x
e
(t) =
_
_
0 1 0 0
0 0 0 2
0 0 0 0
0 0 1 0
_
_
x
e
(t)
para o qual:
(t, ) = (t) =
_
_
1 t (t)
3
/3 (t)
2
0 1 (t)
2
2(t)
0 0 1 0
0 0 (t) 1
_
_
donde tiramos
21
(t, t
f
) = 0;
22
(t, t
f
) =
_
1 0
t
f
t 1
_
e, como podemos assumir t
0
=0,
11
(t
0
, t
f
) =
_
1 t
f
0 1
_
;
12
(t
0
, t
f
) =
_
t
3
f
/3 t
2
f
t
2
f
2t
f
_
A expressao para o controle em malha aberta sera
u
(t) = [0 2]p
_
1 0
t
f
t 1
_ __
1 t
f
0 1
_
+ p
_
t
3
f
/3 t
2
f
t
2
f
2t
f
__
1
x
0
= 2[tt
f
1]
_
p
1
_
1 t
f
0 1
_
+
_
t
3
f
/3 t
2
f
t
2
f
2t
f
__
1
x
0
CAPTULO 2. SOLUC

Mas p , como supusemos, logo p
1
0; considerando ainda, para
simplicar as manipula coes, que t
f
= 3, chega-se a
u
(t) =
2
3
[t3 1]
_
2/3 1
1 1
_ _

1
2
_
u
(t) =
2
3
__
2
1
3
+
2
_
t
1
2
2
_
2.3 Busca de Caminhos Mais Simples
Esbocemos mais uma vez, em breves palavras, o caminho que temos trilhado
para chegar à solucao do PRLO. A partir do sistema expandido calculamos
e
(t, ), a matriz de transicao de estados para A
e
; apos particiona-la conve-
nientemente obtemos P
(t), donde tiramos F
(t):
A
e

e
(t, ) P
(t) F
(t) u
(t)
A analise dos ultimos exemplos sugere que este caminho pode ser traba-
lhoso e demorado, e que seria interessante evitar o calculo de P
(t) a partir
de
e
(t, ). Ou seja, procura-se uma maneira alternativa de se obter P
(t).
Recordemos ainda uma vez a expressao (2.7), que fornece a solu cao otima:
u
(t) = R
1
2
B
T
p(t). O coestado pode ser obtido com o auxlio da express ao
(2.15), resultando em
p(t) = P
(t)x
(t) (2.20)
Derivando em rela cao ao tempo, e abandonando temporariamente a no-
ta cao P
(t) em favor de P(t), mais simples e geral, vem

p(t) =

P(t)x
(t) + P(t) x
(t) (2.21)
As equa coes variacionais sao
x
(t) = Ax
(t) BR
1
2
B
T
p(t) (2.22)
p(t) = R
1
x
(t) A
T
p(t) (2.23)
Entrando com (2.20) em (2.22) obteremos
x
(t) = [A BR
1
2
B
T
P(t)]x
(t)
a qual, substituda em (2.21), fornece
p(t) = [

P(t) + P(t)AP(t)BR
1
2
B
T
P(t)]x
(t) (2.24)
CAPTULO 2. SOLUC

Entrando agora com (2.20) em (2.23) somos levados a
p(t) = [R
1
A
T
P(t)]x
(t) (2.25)
Comparando estas duas ultimas equa coes, as de n umeros (2.24) e (2.25),
chegamos nalmente a
_

P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
Esta e a famosssima Equacao de Riccati Matricial, uma equa cao
diferencial matricial com condi coes de contorno terminais, e nao iniciais. Re-
solvendo-a teramos o metodo alternativo que and avamos procurando para
a obtencao de P
(t). A equa cao de Riccati tem esse nome por se tratar de

uma generaliza cao da equa cao escalar estudada pelo matem atico italiano do
mesmo nome:
d
dx
y(x) + (x)y(x) + (x)y
2
(x) = (x)
Deste modo, a solucao do PRLO esta intimamente ligada ` a solucao da
equa cao de Riccati matricial, que passaremos a designar por ERM. J a an-
teriormente para quem leu primeiro o apendice A, se cao A.9, l ogico!
associaramos matrizes Hamiltonianas ao nome Riccati. As conex oes v ao -
cando mais claras. Se existir uma solucao u
para o PRLO entao ela pode ser

expressa como u
(t) = R
1
2
B
T
p(t) = R
1
2
B
T
P
(t)x
(t) onde P
(t) e uma
solucao da ERM. Isto permite delimitar o universo dos possveis candidatos
a solucao do PRLO: o conjunto das solucoes da ERM. Aqui, mais uma vez,
a matem atica auxilia:
Teorema 2.3.1 A equa cao de Riccati matricial com condicao terminal
_

P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
sempre admite uma solu cao unica, normalmente designada por P
(t).
Pronto, estamos feitos: existe um candidato unico para ser testado, e
isto obviamente ira facilitar a tarefa de buscar a solucao. Ou a funcao u
=
R
1
2
B
T
P
(t)x
(t) e a solucao minimizadora ou tal solucao nao existe. Neste

novo problema a matem atica pode auxiliar, como sempre.
CAPTULO 2. SOLUC

Teorema 2.3.2 O PRLO, conforme formulado, sempre admite solu cao, ou
seja, certamente existe uma fun cao u
tal que J(u
) e mnimo.
Estes teoremas nao serao provados aqui. Mas deve car clara a sua enorme
importancia. Eles garantem a existencia de solucao para o PRLO, e ensinam
como calcula-la. O processo todo pode ser sintetizado no seguinte algoritmo:
1. Seja P
(t) a solucao da ERM

_

P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
2. F
(t) = R
1
2
B
T
P
(t)
3. u
(t) = F
(t)x(t)
Mostramos assim como a solucao do PRLO esta intimamente associada
à ERM. Percebemos deste modo a importancia desta equa cao, que j a a faz
merecer um estudo um pouco mais detalhado.
2.4 Equacao de Riccati Matricial
Em primeiro lugar vamos reescreve-la, como se ja nao o tivessemos feito
tantas vezes nestas ultimas linhas.
_

P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
Transpondo membro a membro as igualdades acima e lembrando que
R
1
, R
2
e P
f
sao matrizes simetricas teremos, apos os algebrismos de praxe:
_

P
T
(t) = A
T
P
T
(t) P
T
(t)A + P
T
(t)BR
1
2
B
T
P
T
(t) R
1
P
T
(t
f
) = P
f
Isto signica que se P(t) e solucao da ERM, P
T
(t) tambem o sera. Mas
a solucao e unica, logo
Teorema 2.4.1 A solu cao P
(t) da ERM e simetrica:

P
(t) = P
T
(t) t [t
0
t
f
]
CAPTULO 2. SOLUC

Este fato ajudara na busca de solucoes para a ERM. Antes de entrarmos
nestes topicos vejamos mais fatos gerais sobre ela.
Teorema 2.4.2 A solu cao P
(t) da ERM e positiva semidenida no inter-

valo em estudo:
P
(t) 0 t [t
0
t
f
]
Supondo que iniciamos o nosso processo em um instante generico t pode-
mos denir o custo parcial como
J
p
= J
p
(t, u) =
_
t
f
t
[x
T
()R
1
x() + u
T
()R
2
u()] d + x
T
(t
f
)P
f
x(t
f
)
A solucao P
(t) pode ser usada para calcular este ndice de desempenho

truncado:
Teorema 2.4.3 O controle otimo u
(t) acarretara um custo parcial otimo

dado por
J
p
= J
p
(t, u
) = x
T
(t)P
(t)x
(t)
Usando o teorema acima para t = t
0
encontraramos que o ndice total
mnimo para o intervalo de trabalho [t
0
t
f
] e dado por:
J
= J(u
) = J
p
(t
0
, u
) = x
T
0
P
(t
0
)x
0
Ainda um fato geral antes de discutirmos a busca de solucoes para a
ERM. Sendo X uma matriz (n n) podemos construir a seguinte equa cao:
A
T
X + XAXBR
1
2
B
T
X + R
1
= 0 (2.26)
Como esta equa cao pode ser obtida a partir da ERM ela recebe o nome
de Equacao de Riccati Matricial Algebrica ou simplesmente ERMA.

E
f acil notar que se a matriz de pondera cao P
f
for uma solucao para a ERMA
entao a ERM admitira uma solucao constante P
(t) = cte = P
f
. Como a
recproca tambem e verdadeira temos
Teorema 2.4.4 O PRLO admite uma solu cao invariante no tempo se e so-
mente se a matriz de pondera cao P
f
e uma solu cao para a ERMA:
F
(t) = F
= cte A
T
P
f
+ P
f
AP
f
BR
1
2
B
T
P
f
+ R
1
= 0
CAPTULO 2. SOLUC

Pronto, eis aqui resultados com bastante utilidade, e que justicam algo j a
visto nos exerccios: para determinadas escolhas das matrizes de pondera cao
a solucao pode se tornar mais simples.
Ja vimos (aquele de nos, sabios, que come caram a ler estas notas pelo
apendice A) na se cao A.9 como discutir a existencia de solucoes para uma
ERMAanalisando a matriz Hamiltoniana associada e tambem como efe-
tivamente obter uma solucao X atraves do subespaco espectral dos modos
estaveis. Se a ERMA admite uma solucao P
0 e se P
f
pode ser escolhida
igual a este valor entao a solucao do PRLO sera invariante no tempo. E
a volta tambem e v alida: se existe uma solucao invariante no tempo entao
etc. . .
Exemplo 2.4.1 Exemplo de ordem 1
Para o sistema escalar x(t) = ax(t) +bu(t); x(t
0
) = x
0
, sendo q 0, r >
0, p 0, minimizar
J = J(u) =
_
t
f
0
[qx
2
(t) + ru
2
(t)] dt + px
2
(t
f
)
A solu cao e: u
= r
1
bP
(t)x
(t) onde P
(t) e solu cao da ERM:
P(t) = 2aP(t) +
b
2
r
P
2
(t) q; P(t
f
) = p
Isto admite solu cao analtica. Integrando por separacao de variaveis che-
garamos a
P
(t) = r
+ a + ( a)
p r(a + )
p r(a )
e
2(tt
f
)
1
p r(a + )
p r(a )
e
2(tt
f
)
onde =
_
a
2
+ q/r. Fixando t
f
= 1, q = 1, p = 0, a = 1, b = 1, x
0
= 1,
podemos esbocar as curvas x(t), u(t), P
(t) parametrizadas em fun cao do

custo de controle r. Eis uma delas:
CAPTULO 2. SOLUC

_
t
0.5 1.0
'
P
(t)
.40
.20
r=1
r=0.2
r=0.02
P
(t) em fun cao do parametro r

A existencia de solu coes invariantes no tempo esta associada à ERMA:
b
2
r
P
2
2aP q = 0
A raiz positiva deste trin omio e P = (ar +
a
2
r
2
+ qrb
2
)/b
2
= P
. Se
este valor e atribudo ao peso terminal p entao a ERM admite uma solu cao
constante, e a lei otima em malha fechada e invariante no tempo:
u
(t) = F
(t) =
b
r
P
(t) =
a +
_
a
2
+ qb
2
/r
b
Usando a = 1, b = 1 e q = 1 pode-se avaliar a inuencia do peso r nas
solu coes:
u
(t) = F
(t) =
1
_
1 + 1/r
b
Plotando esta fun cao e tambem x
(t) para diversos valores de r:

CAPTULO 2. SOLUC

_
t
0.5 1.0
'
x
(t)
1.0
0.5
'
u
(t)
-5.0
-2.5
r=1
r=0.2
r=0.02
r=1
r=0.2
r=0.02
Desempenho em fun cao do parametro r
E poderamos continuar trabalhando neste problema, vendo por exemplo
a viabilidade da escolha das matrizes de ponderacao etc.
Exemplo 2.4.2 Estabilizacao da Velocidade
E o nosso conhecido de outros exemplos:

_
z(t) = x(t)
onde a = 0.5 e b = 150 e o objetivo e minimizar
J =
_
1
0
[z
2
(t) + rv
2
(t)] dt + pz
2
(1)
A solu cao e v
(t) = R
1
2
B
T
P
(t)x
(t) = (b/r)P
(t)x
(t), onde P
(t)
e solu cao da ERM
_
P(t) = A
T
P(t) P(t)A + P(t)Br
1
B
T
P(t) 1
=
b
2
r
P
2
(t) 2aP(t) 1
P(1) = P
f
= p
CAPTULO 2. SOLUC

A solu cao geral da ERM para um caso escalar como este pode ser vista no
exemplo anterior. Para pesquisar a existencia de uma solu cao F
(t) cons-
tante basta estudar a ERMA: 0 = aP Pa +Pbr
1
bP 1 ou, arrumando
direitinho,
P
2
2ar
b
2
P
r
b
2
= 0
cujas razes sao facilmente encontradas. Como a solu cao que nos interessa
deve ser positiva denida escolheremos
P
= r
a +
_
a
2
+ b
2
/r
b
2
Usando r = 1000 encontraramos P
0, 19. Isto signica que se -

zermos P
f
= P
= 0, 19 teremos F
(t) = cte. Ja havamos chegado a esta

mesma conclusao anteriormente, de uma maneira emprica.
Exemplo 2.4.3 Ainda um exemplo
Seja o PRLO tradicional, com
x =
_
0 1
0 0
_
x +
_
0
1
_
u; R
1
=
_
2 1
1 4
_
; R
2
= 1/2; P
f
=
_
1 0
0 2
_
O ndice a ser minimizado pode ser expresso como
J =
_
3
0
(2x
2
1
+ 2x
1
x
2
+ 4x
2
2
+
1
2
u
2
) d + x
2
1
(3) + 2x
2
2
(3)
Desenvolvendo a ERM para os elementos de P(t) teremos
_
_
p
11
(t) = 2p
2
12
(t) 2 p
11
(3) = 1
p
12
(t) = p
11
(t) + 2p
12
(t)p
22
(t) 1 p
12
(3) = 0
p
22
(t) = 2p
12
(t) + 2p
2
22
(t) 4 p
22
(3) = 2
E facil perceber que a solu cao da ERM e trabalhosa e problematica. Sem-

pre podemos resolve-la numericamente em um computador, fazendo uma in-
tegracao de t
f
ate t
0
, de tras para a frente. A nalidade de Riccati era evitar
os problemas de calculo da matriz
e
(t, ). Bem, temos agora algo com pro-
priedades teoricas interessantes e camaradas, mas na hora do vamos ver, na
hora de calcular mesmo ainda ha inconvenientes.
2.5 Referencias
O presente captulo segue com alguma proximidade os desenvolvimentos de
[6]. Este material tambem poderia ser encontrado em v arias outras fontes.
Captulo 3
Horizonte de Tempo Innito
Que acontece apos t
f
? Se o nosso interesse no sistema cessa, podemos des-
liga-lo e esta tudo resolvido. Mas na maioria das situa coes continuamos
precisando controlar o sistema, agir sobre ele mesmo apos o instante nal!
Podemos aplicar novamente a teoria precedente para um outro intervalo de
tempo [t
f
, t
f
+]. Ou entao usar outras taticas, nao necessariamente otimas,
para manter as variaveis xas em determinados valores, ou pr oximas deles.
Estas estrategias sao possveis, mas parecem desnecessariamente complica-
das, por causa da mudan ca da lei de controle. Por que nao projetar uma unica
lei de controle capaz de acionar o sistema de uma maneira otima ao longo
de um intervalo de tempo bastante grande? Em termos matem aticos isto
signica reformular o PRLO usando t
f
. Este novo problema se chama
Problema do Regulador Linear

Otimo com Horizonte de Tempo Innito ou,
abreviadamente, PRLOHTI. Para sistematiz a-lo, seja o sistema:
o
_
0
) = x
0
z(t) = Dx(t)
para o qual se deve minimizar o criterio I = I(u) = lim
t
f
J(t
f
, u) =
lim
t
f
_
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Pz(t
f
)
_
onde Q > 0 R > 0 P > 0
3.1 Discussao do Problema
Passaremos agora a analisar v arios aspectos do PRLOHTI.

E bastante sim-
ples vericar que se lim
t
u(t) ,= 0 entao a integral J(t
f
, u) do criterio acima
35
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 36
cresce indenidamente quando t
f
e, obviamente, o problema de mini-
mizar o ndice I(u) perde o sentido. O mesmo raciocnio se aplica para z(t)
e assim somos levados à conclusao de que para o PRLOHTI ter sentido e
absolutamente imprescindvel que as variaveis z() e u() tendam para zero
quando t . Diramos isso de uma maneira mais rigorosa armando que:
uma condi cao necessaria para haver solucao para o PRLOHTI e
lim
t
u(t) = lim
t
z(t) = 0
E obvio que se x(t) 0 quando t entao z(t) 0 tambem. Mas

podemos ter z(t) 0 mesmo quando x(t) , desde que haja mecanis-
mos de inobservabilidade envolvidos. Em suma, deve haver rela coes entre a
solucao deste problema e conceitos ja conhecidos como os de observabilidade,
estabilidade, etc. Mais tarde veremos isto com mais detalhes.
Vejamos agora o efeito das condi coes terminais e uma nova formulacao
para o problema. Como z(t) deve for cosamente se anular quando t
concluimos que lim
t
f
z
T
(t
f
)Pz(t
f
) = 0. Isto siginica que as condi coes
terminais nao afetam este problema e podem ser eliminadas do criterio.

E
possvel, assim, aperfei coar a formulacao do PRLOHTI: dado o sistema
o
_
_
0
) = x
0
z(t) = Dx(t)
minimizar o criterio
I = I(u) =
_

t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt
onde Q > 0 e R > 0. Ou entao, colocando z(t) = Dx(t), minimizar
I = I(u) =
_

t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt
onde R
1
= D
T
QD 0 e R
2
= R > 0.
3.2 Solu cao Para o PRLOHTI
Deduzimos a partir de agora o que acontece à solucao tradicional do PRLO
quando t
f
.

E bom lembrar, usando resultados do captulo passado, que
devemos minimizar
J = J(t
f
, u) =
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Pz(t
f
)
A solucao e conhecida:
u
(t) = F
(t)x
(t) = R
1
2
B
T
P
(t)x
(t)
onde P
(t) e uma solucao positiva semidenida da ERM.

_

P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
na qual usamos R
1
= D
T
QD 0, R
2
= R > 0 e P
f
= D
T
PD 0.
Aceita-se com naturalidade o fato de que a solucao do PRLO e sempre
dada por u
(t) = R
1
2
B
T
P
(t)x
(t) = F
(t)x
(t), mesmo quando t

f
cresce:
nao haveria razoes para esta estrutura mudar. Deste modo a solucao do
PRLOHTI esta associada ao limite
lim
t
f
(t)
Ou seja, para conhecer o PRLOHTI precisamos conhecer o comporta-
mento da equa cao de Riccati matricial quando t
f
.
3.2.1 Solucao da ERM quando t
f

Que acontece com a solucao P
() da ERM quando t
f
? Tudo nos leva
a crer que tal solucao continua existindo. Designando-a por P
(t) temos
P
(t) = lim
t
f
(t)
Alguns autores usam o nome solu cao em regime da ERM mas isto pode
levar a confusoes com valor de regime da solucao da ERM o qual e denido,
quando existe, como lim
t
P
(t)

E bom deixar bem claro que quem esta
tendendo a e o instante nal do intervalo, t
f
, e nao a variavel independente
t. O objetivo entao e o conhecimento de P
(t). Para ilustrar isso seja um

Exemplo 3.2.1 Seja a ERM

P(t) = 2P(t) +
1
r
P
2
(t) 1; P(t
f
) = p, obtida
de um exemplo anterior. A sua solu cao analtica e
P
(t) = r
1 + ( + 1)
p + r(1 )
p + r(1 + )
e
2(tt
f
)
1
p + r(1 )
p + r(1 + )
e
2(tt
f
)
onde =
_
1 + 1/r. Como o interesse se restringe às inuencias de t
f
e p
podemos simplicar fazendo r = 1/3 o que acarreta = 2:
P
(t) =
1
3
1 + 3
3p 1
3p + 3
e
4(tt
f
)
1
3p 1
3p + 3
e
4(tt
f
)
Pondo p = 0 o efeito de t
f
podera ser mais bem apreciado.
P
(t) =
1 e
4(tt
f
)
3 + e
4(tt
f
)
Na gura abaixo esbocamos alguns gracos para diferentes valores de t
f
.
_
t
5.0 10.0
'
0.1
0.2
0.3
0.4
P
(t)
t
f
= 1 t
f
= 5 t
f
= 9
Efeito de t
f
na solu cao da ERM
E imediato vericar que lim

t
f
e
2(tt
f
)
= 0, donde, para este caso,
lim
t
f
(t) = P
(t) = r( 1) = 1/3 t [0 )
3.2.2 Pequena Generaliza cao
No exemplo anterior a solucao P
(t) convergia, quando t

f
, para uma
solu cao de regime P
(t) constante:
lim
t
f
(t) = P
(t) = cte. = P
t [t
0
)
Isto acontecera sempre? Vejamos. Sejam a ERM
_

P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
e a ERMA associada
A
T
X XA + XBR
1
2
B
T
X R
1
= 0
Se X
e uma solucao positiva semidenida da ERMA e se pudermos

escolher P(t
f
) = P
f
= X
ja sabemos que a solucao da ERM sera constante:

P
(t) = X
t [t
0
t
f
]. Ou seja, em algumas situa coes a solucao P
(t) da
ERM e uma constante que depende apenas da ERMA e, consequentemente,
independe do instante terminal t
f
. Repetindo, se houver liberdade para se
escolher a condi cao terminal P
f
, podemos fazer
P
f
= solucao 0 da ERMA =P
(t) = P
f
t [t
0
t
f
] e, importante!, t
f
Assim, desde que P
f
possa ser escolhida à vontade, quando t
f
a
solucao da ERM tende a um valor constante que e solucao da ERMA:
lim
t
f
(t) = P
(t) = cte. = solucao 0 da ERMA

Lembremo-nos de algo bem recente. Para que o PRLOHTI tenha sentido
precisamos que lim
t
f
z
T
(t
f
)Pz(t
f
) = 0. Mas sendo z = Dx isto pode ser
escrito como
lim
t
f
x
T
(t
f
)D
T
PDx(t
f
) = lim
t
f
x
T
(t
f
)P
f
x(t
f
) = 0
Como, no limite, z(t
f
) 0 vemos que o valor de P e, consequentemente,
o de P
f
e irrelevante, e a solucao do PRLOHTI independe da condi cao ter-
minal P
f
, Isto, alias, ja podia ser pressentido anteriormente, quando a nova
formulacao do problema nao levava em conta essa matriz. Deste modo, se a
solucao do PRLOHTI pode ser obtida da equa cao de Riccati e se a condi cao
terminal P
f
e arbitraria sempre podemos fazer uma escolha inteligente de
P
f
, uma que acarrete solucao constante.
A abordagem vista neste item e supercial, embora seja boa para explicar
e fazer entender os mecanismos envolvidos neste problema. Precisamos de
mais rigor te orico para validar as coisas. Por exemplo, quem garante que a
ERMA tenha solucao? E se o tiver, sera ela positiva semidenida?
3.3 Um Pouco de Teoria
Temos constatado a existencia de in umeros vnculos entre as equa coes de
Riccati diferencial e algebrica e as solucoes do Problema do Regulador
Linear

Otimo, em horizonte de tempo nito ou innito. Nas se coes 2.3 e 2.4
do captulo anterior apresentamos alguns resultados basicos sobre a ERM.
Passamos agora a listar uma serie de propriedades a respeito das solucoes de
regime dessa equcao, e de seu relacionamento com a ERMA. Para isso, sejam
o sistema usual
o
_
_
0
) = x
0
z(t) = Dx(t)
com o criterio
J = J(t
f
, u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
onde R
1
0, R
2
> 0, P
f
0 e a Equacao de Riccati matricial
_
P(t) = A
T
P(t) P(t)A + P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
Seja ainda
lim
t
f
(t) = P
(t) onde
_
_
P
(t) solucao da ERM

P
(t) solucao de regime da ERM

Lema 3.3.1 Supondo P
f
=0, a solu cao P
(t) da ERM tende a uma solu cao

de regime constante se e somente se o sistema nao possui polos simultanea-
mente instaveis, incontrolaveis e observaveis.
O fato de haver uma solucao de regime constante para a ERM e assim
equivalente à inexistencia de modos inst aveis e incontrol aveis que sejam sen-
tidos pela sada.
Lema 3.3.2 Se o sistema em estudo e estabilizavel e detetavel entao a so-
lu cao P
(t) da ERM tende a uma solu cao de regime constante qualquer que
seja a condicao terminal P
f
0:
< A, B, D > estabilizavel e detetavel = lim
t
f
(t) = P
= cte. P
f
0
Este resultado e mais geral do que o anterior, embora forneca uma con-
di cao apenas suciente. Que podemos dizer da volta, do sentido inverso, ou
seja, que se pode garantir quando a solucao de regime e constante?
Lema 3.3.3 Se a solu cao P
(t) da ERM tende a uma solu cao de regime

constante P
entao esta P
e uma solu cao positiva semidenida da ERMA:

lim
t
f
(t) = P
= cte. = P
0, e solu cao da ERMA

Este lema fornece uma condi cao suciente para haver solucao para a
ERMA, mas esta condi cao nao e muito pr atica. Seria bom algo baseado
nas matrizes < A, B, D >.

constante P
e se o sistema e estabilizavel e detetavel entao P
sera a unica
solu cao positiva semidenida da ERMA:
lim
t
f
(t) = P
= cte.
< A, B, D >
_
estabilizavel
e detetavel
_
_
P
e a unica solu cao PSD da ERMA

Agora, pela primeira vez, algo sobre a unicidade. Combinando os lemas
3.3.2 e 3.3.4 podemos chegar a algo mais comodo:
Lema 3.3.5 Para haver uma unica solu cao PSD da ERMA e suciente que
o sistema seja estabilizavel e detetavel.
< A, B, D > estabilizavel e detetavel = [ solu cao P
0 da ERMA
Bem mais simples.

E conveniente lembrar que esta condi cao e apenas
suciente: a ERMA pode ter solucao unica e < A, B, D > pode ser inestabi-
liz avel ou indetet avel. Mais teoremas.

constante P
esta sera positiva denida se e somente se o sistema e comple-

tamente observavel.
lim
t
f
(t) = P
= cte. > 0 < A, D > e observ avel

Todos os resultados acima se referem a propriedades da Equacao de Ric-
cati, e em especial ao seu comportamento quando t
f
. Propriedades
especcas a respeito da ERMA podem ser encontradas na se cao A.9 Tudo
isto e muito interessante, e e basico para o que e mais importante para nos,
o problema de Controle

Otimo.
3.4 Solu cao para o PRLOHTI
Se P
(t) tende a uma solucao constante quando t

f
podemos esperar que
F
= R
1
2
B
T
P
seja uma solucao invariante no tempo para o PRLOHTI.

E assim e.
Teorema 3.4.1 Se a solu cao P

constante P
entao a lei de controle

u = R
1
2
B
T
P
x = F
x
estabiliza o sistema de malha fechada se e somente se o sistema de malha
aberta < A, B, D > for estabilizavel e detetavel.
A + BF
e estavel
com
F
= R
1
2
B
T
lim
t
f
(t)
_
_
< A, B, D > e
_
_
estabiliz avel
e
detet avel
A partir deste resultado vemos que se a solucao da ERM tende a uma
funcao constante podemos implementar uma realimenta cao de estados u =
F
x a partir dela. Esta lei de controle sera estabilizadora sob condi coes
bastante precisas. Nada se falou ainda sobre minimizacao.
Teorema 3.4.2 Se o sistema < A, B, D > e estabilizavel e detetavel entao
a lei de controle u = F
x = R
1
2
B
T
P
x minimiza o ndice
_

t
0
[z
T
(t)Qz(t) + u
T
(t)Pu(t)] dt
atribuindo-lhe o valor mnimo dado por x
T
0
P
x
0
Uma vez estabelecida a importancia de uma solucao de regime P
(t)
da ERM que seja constante, e tempo de sistematizar os conhecimentos j a
adquiridos. O roteiro para enfrentar um caso concreto e dado pelo
3.5 Algoritmo para Solu cao do PRLOHTI
Supondo que < A, B, D > e estabiliz avel e detet avel:
1. Calcule usando, por exemplo os resultados da se cao A.9 a solucao
P
para a ERMA:
A
T
X XA + XBR
1
2
B
T
X R
1
= 0
(P
e unica, e P
0)
2. u
= F
= R
1
2
B
T
P
e a solucao do PRLOHTI.
3. J
= x
T
0
P
x
0
Para ilustrar este algoritmo e bem chegada a hora de um
Exemplo 3.5.1 Seja o sistema dado por
x =
_
0 1
0 0
_
x +
_
0
1
_
u; z = [1 0]x
para o qual desejamos minimizar o ndice
J =
_

0
_
x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)
_
dt
onde
R
1
=
_
2 1
1 4
_
; e R
2
= 1/2
Facilmente vericaramos que este sistema e controlavel e observ avel; de
acordo com o algoritmo acima seja a ERMA (com o sinal trocado):
A
T
X + XAXBR
1
2
B
T
X + R
1
= 0
Lembrando a secao A.9 podemos encontrar a matriz Hamiltoniana asso-
ciada:
H =
_
A BR
1
2
B
T
R
1
A
T
_
=
_
_
0 1 0 0
0 0 0 2
2 1 0 0
1 4 1 0
_
_
Esta matriz possui autovalores reais nao nulos; seu subespaco dos modos
estaveis poderia ser descrito pelos autovetores associados aos autovalores es-
taveis de A:
A
(H) =
_
_
0, 2110 0, 4968
0, 5764 0, 3637
0, 0565 0, 8605
0, 7874 0, 1331
_
_
Seria simples vericar que H 1 e poderamos obter a solu cao da
ERMA:
X = Ric (H) =
_
0, 0565 0, 8605
0, 7874 0, 1331
_ _
0, 2110 0, 4968
0, 5764 0, 3637
_
1
=
_
2, 4641 1, 0000
1, 0000 1.7321
_
Deste ponto a realimenta cao de estados otima sai facilmente:
F
= R
1
2
B
T
X = [2, 0000 3, 4641]
3.6 Que Acontece se a Condicao Falha?
A condi cao de estabilizabilidade e detetabilidade de < A, B, D > e bastante
suave e razoavel. Se < A, B >, por exemplo, nao for estabiliz avel, pouco se
pode fazer por este caso. Minimizar entao, nem se fala. Se < A, B > for
estabiliz avel mas nao detet avel o problema aparecer a na impossibilidade de
se implementar a lei de controle. Entao, por estas razoes, a condi cao deve
ser aceita com naturalidade. Se ela falha e porque e mesmo difcil.
3.7 Controlabilidade e Observabilidade
OK, tudo bem, entao o sistema < A, B, D > e estabiliz avel e detet avel. Mas
pode haver modos incontrol aveis e/ou inobservaveis (eles serao for cosamente
estaveis). Que acontece com eles?

E l ogico que os modos incontrol aveis per-
manecem imut aveis apos realimenta cao de estado. Sem grandes agress oes
podemos raciocinar que os modos inobservaveis, como nao afetam z, e con-
sequentemente o ndice a ser minimizado, sao deixados exatamente no lugar
em que estavam, pois esta e a tatica mais economica. Assim, a solucao otima
u
= F
deixa xos os modos incontrol aveis e/ou inobservaveis, atuando

apenas sobre as partes control aveis e observaveis de < A, B, D >. E estas
partes observaveis e control aveis, as partes que sao efetivamente manipula-
das pela solucao otima, onde sao elas colocadas? Qual e a localizacao otima
dos polos no plano complexo C ? Logo logo veremos isso, antes porem . . .
3.8 Comentarios e Referencias
A aplicabilidade pr atica do Problema do Regulador Linear

Otimo com Ho-
rizonte de Tempo Innito e maior do que a do caso com Tempo Finito. Em
quase todos os casos de interesse, desejamos acompanhar um dado sistema
ao longo de um intervalo de tempo grande, durante o qual as variaveis se
aproximam assintoticamente de 0. A modelagem do PRLOHTI se adapta
melhor a estas necessidades do que a do PRLO.
O material apresentado neste captulo tambem deve ser considerado cl as-
sico, e faz parte da grande maioria dos textos devotados a Controle

Otimo.

E
mais facil encontrar consideracoes sobre o problema com horizonte de tempo
innito do que sobre o caso nito. As obras mais consultadas para elaborar
este captulo foram [6] e [1]
Captulo 4
Outros caminhos. . .
. . . podem levar a um mesmo lugar.
A aplicabilidade pr atica do Problema do Regulador Linear

Otimo com
Horizonte de Tempo Innito e maior do que a do caso com Tempo Finito.
No captulo precedente chegamos aos resultados relativos ao PRLOHTI a
partir de uma particulariza cao das formulas gerais obtidas anteriormente
pelo Calculo das Variacoes. A partir de agora deduziremos esses resultados
atraves de uma outra metodologia, o Princpio do Maximo.
4.1 Referencias
Este captulo foi inspirado em [8]
46
Captulo 5
Propriedades da Solucao do
PRLOHTI
Alguns aspectos importantes a respeito dos reguladores otimos ainda esperam
resposta. Por exemplo, qual e a localizacao dos autovalores da malha fechada
apos a realimenta cao otimizadora? qual e o efeito dos custos de controle sobre
estes autovalores otimos? A importancia te orica e pr atica destes topicos e
indiscutvel, e eles serao tratados com maior profundidade neste captulo.
Comecaremos com um resumo da situa cao, depois analisaremos com mais
detalhes o relacionamento das equa coes de Riccati com as solucoes otimas, e
nalmente estudaremos a localizacao otima dos polos.
5.1 Retomando o pe
A solucao do problema do regulador em tempo nito e u
(t) = R
1
2
B
T
p
(t),
que depende da trajet oria otima do coestado p(t). Lembrando que coestado
e estado sempre podem ser relacionados por p(t) = P
(t)x(t) chegaramos a
u
(t) = R
1
2
B
T
P
(t)x
(t)
que caracteriza a solucao otima como uma realimenta cao de estados. Estado
e coestado podem ser obtidos da equa cao variacional
_
x(t)
p(t)
_
=
_
A BR
1
2
B
T
R
1
A
T
_ _
x(t)
p(t)
_
A solucao desta equa cao homogenea dar a origem às trajet orias otimas x
(t)
e p
(t) desde que usemos as condi coes de contorno

x(t
0
) = x
0
e p(t
f
) = P
(t
f
)x(t
f
) = P
f
x(t
f
)
47
CAPTULO 5. PROPRIEDADES DA SOLUC

AO DO PRLOHTI 48
O carater hbrido destas condi coes de contorno algumas variaveis sao
iniciais, outras terminais e o principal obstaculo do caminho. Isto e con-
tornavel, conforme visto, mas para evitar estes inconvenientes das equa coes
variacionais podemos deduzir as solucoes a partir da equa cao de Riccatti: a
matriz P
(t) que relaciona as trajet orias do estado e do coestado e a solucao

da ERM
_
P(t) = A
T
P(t) P(t)A + P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
O fato de considerarmos um regulador em tempo innito traz simpli-
ca coes: para o PRLHOTI, a solucao procurada e a solu c ao de regime
P
(t) = cte. = P
t
que sera a solucao positiva semidenida da ERMA, a Equacao de Riccati
Matricial Algebrica associada:
A
T
X + XAXBR
1
2
B
T
X + R
1
= 0
Designando esta solucao por P
ou mesmo apenas X, ao inves de P
como antes, teremos p(t) = P
x(t) e a solucao do PRLOHTI pode ser obtida

atraves de simplicacao da equa cao original:
u
(t) = R
1
2
B
T
P
(t) = F
(t)
A realimenta cao de estado e agora xa, ou invariante no tempo, o que
simplica bastante a implementa cao pr atica.
5.2 Encontrando a solucao da ERMA
A equa cao variacional pode ser representada de forma compacta
x
e
(t) = A
e
x
e
(t)
onde, para simplicar a notacao, usou-se
x
e
(t) =
_
x(t)
p(t)
_
; A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
A matriz A
e
e Hamiltoniana. Para uniformizar a notacao com a da se cao
A.9 do Apendice A, consideremos S = BR
1
2
B
T
e T = R
1
:

AO DO PRLOHTI 49
A
e
=
_
A S
T A
T
_
1
Segundo a propriedade A.9.1, o polin omio caracterstico de A
e
, aqui de-
signado por (), e par, ou seja, satisfaz a seguinte propriedade
() = ()
Vemos assim que o espectro de A
e
e simetrico com rela cao ` a origem do
plano complexo: se
i
e um autovalor de A
e
certamente
i
tambem o sera.
Neste ponto precisaremos relembrar a propriedade A.9.4, aqui reescrita para
maior comodidade:
Propriedade 5.2.1 Se H dom(Ric) e X = Ric(H), entao
a.) X e simetrica
b.) A + SX e estavel
c.) X e solu cao da equa cao de Riccati matricial algebrica
A
T
X + XA + XSX T = 0
A conseq uencia pr atica mais importante deste resultado e a maneira de
se obter uma solucao para a ERMA. Quando a estrutura modal de A
e
e
camarada, isto pode ser feito a partir do calculo dos autovetores associados
a autovalores estaveis. Se este caminho for problem atico devemos fatorar o
polin omio mnimo, conforme discutido na se cao A.9.
Do ponto de vista te orico e preciso ressaltar a importancia do item (b).
Com efeito, dizer que A+SX e estavel signica dizer que ABR
1
2
B
T
X =
A+BF
e estavel e tem autovalores iguais aos autovalores estaveis da matriz

Hamiltoniana A
e
. Este fato e sucientemente importante para merecer uma
Propriedade 5.2.2 Os autovalores do sistema de malha fechada otimo sao
os autovalores estaveis da matriz variacional A
e
.
Para sistematizar o corpo de conhecimentos ja desenvolvidos:
Algoritmo para o PRLOHTI
1. Contruir a matriz variacional
A
e
=
_
A S
T A
T
_
=
_
A BR
1
2
B
T
R
1
A
T
_

AO DO PRLOHTI 50
2. Vericar se A
e
1 = dom (Ric)
3. Se sim, calcular uma base X
para o subespaco dos modos estaveis

A
(A
e
) e particiona-la em
X
=
_
X
1
X
2
_
4. Obter X = X
2
X
1
1
, solucao da ERMA
5. Sendo F
= R
1
2
B
T
X aplicar a lei de controle u
= F
x ao sistema.
6. Os autovalores otimos da malha fechada sao os autovalores estaveis de
A
e
5.3 Um caminho alternativo
Os aspectos basicos mais importantes, apresentados ao longo do texto, foram
recapitulados na se cao anterior. Passamos agora a reapresentar uma parte
desse material de maneira diferente, com um nvel de detalhamento maior
mas de modo ligeiramente menos geral. No restante desta se cao usaremos a
hip otese de que os autovalores de A
e
sao distintos. Com perdas irrisorias de
generalidade esta hipotese simplicara os desenvolvimentos, pois permitir a
exprimir os subespacos espectrais em termos dos autovetores, deixando assim
transparecer com mais clareza os fatos importantes. Como primeira aplicacao
redemonstraremos a propriedade A.9.4, com a hipotese adicional.
Demonstracao: Podemos ordenar o espectro de A
e
, colocando em pri-
meiro lugar os autovalores com parte real positiva:
(A
e
) =
1
,
2
, . . . ,
n
,
n+1
, . . . ,
2n
onde Re(
i
) 0 i = 1, 2, . . . , n e Re(
i
) 0 i = n+1, . . . , n.
Se algum autovalor
j
e imagin ario puro (Re(
j
) = 0), ele pode ser
colocado em qualquer uma das parti coes; seu conjugado deve ser colocado na
outra. Sejam w
i
, i = 1, 2, . . . , 2n os autovetores associados aos autovalores
i
: A
e
w
i
=
i
w
i
, i = 1, 2, . . . , 2n. Como por hipotese os
i
sao distintos os w
i
serao linearmente independentes e a matriz W = [w
i
w
2n
] sera inversvel.
Efetuando a munda ca de bases x
e
(t) = W x
e
(t) teremos
A
e
= W
1
A
e
W =
_

0
0
_
, onde

AO DO PRLOHTI 51
=
_
2
.
.
.
n
_
=
_
n+1
n+2
.
.
.
2n
_
_
Se os autovalores tiverem sido ordenados de uma maneira simetrica tere-
mos
i
+
i+n
= 0, i = 1, 2, . . . , n e, obviamente
= ;
= onde =
_
2
.
.
.
n
_
_
Particionando o vetor expandido x
e
como x
e
=
_
q
I
q
II
_
teremos
q
I
= q
I
e q
II
= q
II
Por outro lado, x
e
= W
1
x
e
, o que permite escrever
_
q
I
q
II
_
=
_
V
11
V
12
V
21
V
22
_ _
x
p
_
onde ja particionamos W
1
= V de maneira compatvel. A variavel q
I
(t)
pode ser obtida a partir de
q
I
(t) = V
11
x(t) + V
12
p(t)
= V
11
x(t) + V
12
P
x(t)
= (V
11
+ V
12
P
)x(t)
Se as condi coes iniciais foram colocadas corretamente o x(t) da express ao
acima deve ser substitudo por x
(t). Mas o controle otimo e sempre esta-

bilizador, e assim x
(t) 0 quando t . Consequentemente q

I
(t) 0
quando t . Mas
q
I
(t) = e
(tt
0
)
q
I
(t
0
)
Como os autovalores de tem partes reais positivas ou nulas, podemos
ter q
I
(t) 0 apenas quando q
I
(t
0
) = 0 ou seja: (V
11
+ V
12
P
)x
0
= 0. Todo
este arrazoado deve ser independente da condi cao inicial x
0
e assim podemos
colocar
V
11
+ V
12
P
= 0

AO DO PRLOHTI 52
Usando outra linha de argumenta cao provaramos que V
12
e inversvel, e
isto leva a
P
= V
1
12
V
11
Pronto, eis a um modo de exprimir P
em termos dos blocos da ma-

triz V = W
1
. Se particionassemos tambem a matriz W dos autovetores
encontraramos
P
= V
1
12
V
11
= W
22
W
1
12
Se a matriz A
e
for facilmente diagonalizavel as identidades acima podem
ser uteis para o calculo de P
.

E sempre util ter em mente que todos estes
aspectos ja foram vistos anteriormente, com uma abordagem mais geral,
concisa e elegante. Para ver onde cam os autovalores otimos, consideremos
a solucao x
e
(t) da equa cao variacional:
x
e
(t) = W x
e
(t)
= We
(tt
0
)

Ae
W
1
x
0
e
Desenvolvendo:
_
x
(t)
p
(t)
_
= W
_
_
e
(tt
0
)
0
0 e
(tt
0
)
_
_
_
V
11
V
12
V
21
V
22
_ _
x
0
P
x
0
_
_
x
(t)
p
(t)
_
=
_
W
11
W
12
W
21
W
22
_
_
_
e
(tt
0
)
0
0 e
(tt
0
)
_
_
_
(V
11
+ V
12
P
)x
0
(V
21
+ V
22
P
)x
0
_
Como V
11
+ V
12
P
= 0 temos
_
_
_
x
(t) = W
12
e
(tt
0
)
(V
21
+ V
22
P
)x
0
p
(t) = W
22
e
(tt
0
)
(V
21
+ V
22
P
)x
0
Para t = t
0
a primeira das igualdades acima se particulariza em
x
(t
0
) = x
0
= W
12
e
0
(V
21
+ V
22
P
)x
0
Como isto deve ser verdadeiro x
0
, teremos V
21
+V
22
P
= W
1
12
e pode-
mos escrever, nalmente,
x
(t) = W
12
e
(tt
0
)
W
1
12
x
0
Isto mostra claramente que os autovalores do sistema de malha fechada
otimo os modos respons aveis pelo comportamento dinamico da trajet oria

AO DO PRLOHTI 53
x
(t) sao exatamente os elementos de ! Como o sistema de malha

fechada otimo e sempre assintoticamente estavel concluimos que todos o au-
tovalores de tem partes estritamente negativas e, consequentemente, que
a matriz A
e
nao possui autovalores no eixo imagin ario. estes fatos podem ser
resumidos no
Teorema 5.3.1 Suponha que < A, B > e estabilizavel e que < D, A > e
detetavel; suponha tambem que a matriz
A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
possui 2n autovalores distintos. Nestas condicoes:
1. se (A
e
) entao (A
e
)
2. se (A
e
) entao Re() ,= 0
3. (A + BF
) (A
e
)
4. se A
e
e diagonalizada como
A
e
=
_
0
0
_
= W
1
A
e
W = V A
e
V
1
onde engloba os autovalores com parte real positiva entao a solu cao
de regime da ERMA sera
P
= V
1
12
V
11
= W
22
W
1
12
5. a trajetoria otima do regulador sera
x
(t) = W
12
e
(tt
0
)
W
1
12
x
0
Para concluir este enfoque,
Algoritmo para Solucao do PRLOHTI
1. Vericar se < A, B, D > e estabiliz avel e detet avel
2. Supondo que sim, construir
A
e
=
_
A BR
1
2
B
T
R
1
A
T
_

AO DO PRLOHTI 54
3. Diagonaliza-la separando os modos inst aveis dos estaveis:
W
1
A
e
W =
_
0
0
_
4. P
= W
22
W
1
12
5. u
= F
= R
1
2
B
T
P
Deve car bem claro que este algoritmo e absolutamente equivalente ao

da se cao anterior.
Exemplo 5.3.1 Seja o sistema
x(t) =
_
0 1
0 0
_
x(t) +
_
0
1
_
u(t); x(t
0
) = x
0
; z(t) = x(t)
com o objetivo de minimizar J = J(u) =
_
0
[x
T
(t)R
1
x(t) + ru
2
(t)] dt, onde
R
1
=
_
1 b
b a
_
; a b
2
> 0 (para que R
1
> 0); r = 1
A ERMA sera A
T
X + XAXBR
1
2
B
T
X + R
1
= 0. Usando os valores
dados somos levados a
_
0 0
1 0
_
X + X
_
0 1
0 0
_
X
_
0 0
0 1
_
X =
_
1 b
b a
_
Solucao frontal da ERMA
Para este caso, razoavelmente simples, resolveremos a ERMA na mar-
ra. A solu cao positiva denida X sera da forma
X =
_
x
11
x
12
x
12
x
22
_
Entrando com isto na ERMA obteremos
_
0 0
x
11
x
12
_
+
_
0 x
11
0 x
12
_
_
x
12
2
x
12
x
22
x
12
x
22
x
22
2
_
=
_
1 b
b a
_
donde tiramos as equa coes
_
_
x
12
2
= 1
2x
12
x
22
2
= a
x
11
x
12
x
22
= b

AO DO PRLOHTI 55
que podem ser resolvidas facilmente, dando origem a
_
_
x
12
= 1
x
22
=
a + 2x
12
x
11
= b + x
12
x
22
O teorema A.4.1, de Sylvester, garante que os menores principais de X
devem ser positivos
_
x
11
> 0
x
11
x
22
x
12
2
> 0
A segunda desigualdade acima pode se transformar em x
11
x
22
> x
12
2
= 1,
usando resultado imediatamente anterior. Como x
11
> 0 temos trivialmente
que x
22
> 1/x
11
donde x
22
> 0 tambem, e podemos escolher
x
22
= +
a + 2x
12
A tarefa agora e decidir sobre o sinal de x
12
. Vamos supor que x
12
= 1.
Com isto:
_
x
22
=
a 2
x
11
= b
a 2
Como X e uma matriz real devemos ter a 2 0, ou seja, a 2.
Estamos em condicoes de estabelecer a seguinte cadeia logica:
x
11
x
22
> 1 = (b +
a 2)
a 2 > 1
= b
a 2 + (a 2) < 1
= b
a 2 < 1 a
= b < (1 a)/
a 2
Mas (1a) < 0, pois a 2. Isto implica que b < (1 a)/(
a 2 ) < 0.
Quadrando teremos
b
2
>
(a 1)
2
a 2
=
a
2
2a + 1
a 2
= a +
1
a 2
Notemos para terminar (em boa hora!), que 1/(a2) 0, porque a2
0. Mas isto signica que
b
2
> a +
1
a 2
a
o que e um absurdo, pois R
1
> 0 e consequentemente ab
2
> 0 e b
2
< a. Esse
longo e articioso raciocnio chega nalmente a seu alvo, a determinacao de
X, solu cao da ERMA, em termos dos parametros de R
1
:
x
12
= 1
x
22
=
a + 2
x
11
= b +
a + 2
_
_
= X =
_
b +
a + 2 1
1
a + 2
_

AO DO PRLOHTI 56
Solucao por Diagonalizacao
Para evitar as delicadezas de um procedimento como este anterior, po-
demos usar a teoria precedente e seus metodos automatizados para obter
solu coes da ERMA. Uma simples substituicao dos dados do problema forne-
ceria a matriz
A
e
=
_
_
0 1 0 0
0 0 0 1
1 b 0 0
b a 1 0
_
_
cujo polinomio caracterstico e dado abaixo, juntamente com suas razes
() = det(I A
e
) =
4
a
2
+ 1 =
2
=
_
_
a +
a
2
4
2
= k
1
a
a
2
4
2
= k
2
A partir daqui temos o espectro de A
e
, seus autovetores e a matriz de
mudan ca de bases W:
(A
e
) =
_
k
1
,
_
k
2
,
_
k
1
,
_
k
2
=
1
,
2
,
3
,
4
W =
_
_
1 1 1 1
1

2

3

4
(
1
3
a
1
b) (
2
3
a
2
b) (
3
3
a
3
b) (
4
3
a
4
b)
1
2
2
2
3
2
4
2
_
_
donde podemos extrair, lembrando a recente teoria, P
= W
22
W
1
12
, resul-
tando
P
=
_

3
3
a
3
b
4
3
a
4
b
3
2
4
2
_ _
1 1
3

4
_
1
=
_

3
4
(
3
+
4
) + b
4
2
+
4
3
+
3
2
a
4
(
3
+
4
)
_
Pronto! Ufa . . .

E so efetuar os calculos e teremos
X =
_
b +
a + 2 1
1
a + 2
_

AO DO PRLOHTI 57
como anteriormente, e logico. Qual dos dois metodos e mais simples? Para
pegar a fera à unha, com a pura for ca das nossas munhecas, ambos pare-
cem desanimadoramente trabalhosos e a escolha mais razoavel seria pedir
um computador, pois anal e para isso mesmo que eles existem.
O controle otimo propriamente dito sera dado por u
(t) = F
(t)x(t), onde
F
(t) = R
1
2
B
T
X = [ 1
a + 2 ]
Com estes valores o sistema de malha fechada cara
A + BF
=
_
0 1
1
a + 2
_
com equa cao caracterstica e autovalores dados por
F
() =
2
+ (
a + 2) + 1 =
_
a + 2 +
a 2
2
a + 2
a 2
2
Discussao da Solucao
caso a = 0: isto signica nenhuma enfase na componente x
2
= x
1
. Nao
estamos interessados na derivada da sada ou seja, a velocidade pode
ser alta. Os autovalores seriam

2 j
2
2
e teramos uma solu cao os-
cilat oria.
caso a = 2: ja passamos a penalizar velocidades muito grandes, e os auto-
valores serao
20
2
= 1, reais e iguais signicando amortecimento
crtico. O sistema e mais lento mas oscila menos.
caso a > 2: agora e importante termos velocidades baixas. Os polos serao
reais e distintos e a resposta sera super amortecida, isto e, lenta mas
com derivada baixa.
ausencia de b: tanto a realimenta cao otima F
quanto os autovalores oti-

mos
i
dependem apenas do parametro a. Isto signica que os ter-
mos cruzados x
1
x
2
, ponderados pelo parametro b em R
1
, nao afetam a
solu cao otima. Fatos semelhantes acontecem com alguma freq uencia, e
sao, possivelmente, os responsaveis por uma pratica bastante comum:
o uso de matrizes de ponderacao diagonais.

AO DO PRLOHTI 58
5.4 Que Acontece aos Polos?
Veremos agora um enfoque frequencial da teoria do Regulador Linear Qua-
dr atico. Por enfoque frequencial entendemos a analise dos aspectos relacio-
nados às funcoes de transferencia e seus par ametros. Seja entao o sistema
usual
o
_
_
0
) = x
0
z(t) = Dx(t)
Podemos tambem representa-lo por meio de
o
_
_
Z(s) = G(s)U(s) + G
(s)x
0
, onde
G(s) = D(sI A)
1
B, e G
(S) = D(SI A)
1
Seja o PRLOHTI, onde, para Q > 0 e R > 0 devemos minimizar
J = J(u) =
_

t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt
Supondo que u
(t) = F
(t)+v(t) e a solucao otima, o sistema de malha

fechada cara
o
F
_
_
x(t) = (A + BF
)x(t) + Bv(t); x(t

0
) = x
0
z(t) = Dx(t)
ou entao
o
F
_
_
Z(s) = G
F
(s)U(s) + G
F
(s)x
0
, onde
G
F
(s) = D(sI ABF
)
1
B, e G
(s) = D(sI A BF
)
1
Qual e a localizacao otima no plano complexo C para os autovalores de
(A + BF
)? Ha lugares especiais para os polos da malha fechada? Come-

caremos esta analise estudando a inuencia das matrizes de pondera cao Q
e R sobre o posicionamento otimo dos polos da malha fechada. Veremos as
conseq uencias acarretadas por controles baratos e caros.
Antes de prosseguir, um aspecto simplicador. Temos apenas duas ma-
trizes de pondera cao: Q e R. A inuencia relativa delas pode ser medida
xando o valor de uma e fazendo a outra variar. Assim podemos escolher
_
_
Q = I = xa
R = rN onde r e um escalar variavel

AO DO PRLOHTI 59
Isto signica que todas as componentes da sada estao sendo igualmente
ponderadas. Outras matrizes nao tao triviais poderiam ter sido escolhidas
mas o algebrismo caria seriamente comprometido e as conclusoes qualita-
tivas seriam praticamente identicas. A escolha R = rN signica que todos
os elementos de R variar ao proporcionalmente. Isto e uma hip otese razoavel
e simplicara bastante as coisas. Valores elevados de r signicam controle
caro ou seja, os nveis de u() devem ser mantidos baixos. Valores pequenos
para r permitem grandes amplitudes da entrada, caracterizando o controle
barato.
Veremos agora a localizacao dos polos de malha fechada em funcao de r.
J a sabemos que os autovalores de A+BF
serao os autovalores estaveis de A

e
.
Para calcular o polin omio caracterstico (A
e
) usaramos desenvolvimentos
analogos aos feitos na se cao A.9 do Apendice A, resultando em
e
(s) =
det(sI A)det(sI + A)det
_
I R
1
2
B
T
[(sI + A)
T
]
1
D
T
D(sI A)
1
B
_
Como sI + A = I(sI A) e como
G
T
(s) = B
T
[(sI A)
1
]
T
D
T
= B
T
[(sI A)
T
]
1
D
T
vemos que:
e
(s) = det(sI A)det(I)det(sI A)det[I + R
1
2
G
T
(s)G(s)]
Finalmente, lembrando que det(sI A) = (s) e o polin omio carac-
terstico de A:
e
(s) = (1)
n
(s)(s)det
_
I +
1
r
N
1
G
T
(s)G(s)
_
As razes estaveis deste polin omio sao os polos do regulador otimo. Vamos
simplicar mais, considerando o caso monovariavel: G(s) e um escalar, o
quociente entre os polin omios n(s) e d(s):
G(s) =
n(s)
d(s)
G
T
(s) =
n(s)
d(s)
Como N = 1 para o caso escalar caremos com
e
(s) = (1)
n
d(s)d(s)
_
1 +
1
r
n(s)
d(s)
n(s)
d(s)
_
= (1)
n
_
d(s)d(s) +
1
r
n(s)n(s)
_

AO DO PRLOHTI 60
Supondo que
n(s) = k
0
p
i=1
(s
i
)
d(s) =

n
i=1
(s
i
)
_
_
onde
_
_
k
0
ganho de G(s)
i
zeros de G(s)
i
polos de G(s)
teremos
n(s) = k
0
(1)
p
p
i=1
(s +
i
)
d(s) = (1)
n
n
i=1
(s +
i
)
e entao
e
(s) = (1)
n
_
(1)
n
n
i=1
(s
i
)(s +
i
) +
k
2
0
r
(1)
p
p
i=1
(s
i
)(s +
i
)
_
= (1)
2n
_
n
i=1
(s
i
)(s +
i
) +
k
2
0
r
(1)
pn
p
i=1
(s
i
)(s +
i
)
_
Como (1)
2n
= 1 e (1)
pn
= (1)
np
temos que analisar as razes
estaveis do polin omio
e
(s) =
n
i=1
(s
i
)(s +
i
) +
k
2
0
r
(1)
np
p
i=1
(s
i
)(s +
i
)
Isto pode ser escrito de outro modo, mais propcio às tecnicas do metodo
do Lugar das Razes:
1 + (1)
np
K
p
i=1
(s
i
)(s +
i
)
n
i=1
(s
i
)(s +
i
)
= 0
Ja se pode tirar algumas conclusoes:
1. Quando K 0 (r ) as 2n razes se aproximam dos polos
i
e de
seus negativos
i
.
2. Quando K (r 0), entao 2p das 2n razes se aproximam dos
zeros
i
e de seus negativos
i

AO DO PRLOHTI 61
3. Quando K (r 0), as 2n 2p razes restantes convergem para
assntotas retas que se cruzam na origem e que fazem com o eixo real
positivo angulos de
_
_
j
n p
j = 0, 1, . . . , 2n 2p 1 para (n p) mpar
(j + 1/2)
n p
j = 0, 1, . . . , 2n 2p 1 para (n p) par
4. Quando K (r 0), as 2n 2p razes estao a uma dist ancia da
origem dada por (
k
2
0
r
)
1
2(np)
.
Uma simples aplicacao das regras basicas para construcao do Lugar das
Razes permite o estabelecimento dos fatos acima.
Exemplo 5.4.1 Para o sistema com n = 3 e p = 1 dado pela matriz de
transferencia G(s) = (s + 1)/s(s 2)(s + 3) devemos considerar a equa cao
1 + (1)
2
K
(s + 1)(s 1)
s(s 2)(s + 3)s(s + 2)(s 3)
= 0
O tracado do Lugar das Razes para este polinomio em termos do para-
metro r = 1/K pode ser visto na gura a seguir:
E
Re

e

e

T
Im
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
_ _ _ _ _ _
r0
r
r
Lugar das Razes para o exemplo

AO DO PRLOHTI 62
5.5 Resumo Teorico
Tendo em mente que os polos do regulador otimo sao os autovalores estaveis
de A
e
podemos resumir e legitimar as conclusoes atingidas acima. Para isso,
seja o sistema monovariavel, estabiliz avel e detet avel dado por
o
_
_
x(t) = Ax(t) + bu(t); x(t
0
) = x
0
z(t) = dx(t)
ou entao por
G(s) = d(sI A)
1
b = k
0
p
i=1
(s
i
)
n
i=1
(s
i
)
para o qual desejamos resolver o PRLOHTI, ou seja, para r > 0 minimizar
o criterio
J =
_

0
[z
2
(t) + ru
2
(t)] dt
Teorema 5.5.1 1. Quando r os n polos do regulador otimo se
aproximam dos valores
i
, i = 1, 2, . . . , n dados por
i
=
_
i
se Re(
i
) 0
i
se Re(
i
) > 0
2. Quando r 0, p dos n polos do regulador otimo se aproximam dos
valores
i
, i = 1, 2, . . . , p onde
i
=
_
i
se Re(
i
) 0
i
se Re(
i
) > 0
3. Quando r 0, os np polos restantes do regulador otimo aproximam-
se assintoticamente de linhas retas que se interceptam na origem e que
fazem com o eixo real positivo angulos de
_

n p
, = 0, 1, 2, . . . para n p mpar
( + 1/2)
n p
, = 0, 1, 2, . . . para n p par
Estes polos longnquos distam da origem

AO DO PRLOHTI 63
w
0
=
_
k
2
0
r
_ 1
2(np)
O posicionamento destes polos longnquos recebe o nome de Congu-
racao de Butterworth de ordem (n p) com raio w
0
Na pr oxima gura vemos esbocos para as conguracoes de Butterworth
de ordens 1, 2, 3, 4, 5.
ordem 1 ordem 2 ordem 3
ordem 4 ordem 5
`
`
`
`
`
Z
Z
Z
Z
Z
`
`
`
`
`
/
/
/
/
/
.
.
.
.
.
.
`
`
`
`
`
.
.
.
.
.
.
\
\
\
\
\
\
/
/
/
/
/
/
Congura coes de Butterworth
Para o caso de v arias entradas e v arias sadas podemos chegar a conclusoes
analogas desde que denamos a contento polos e zeros de um sistema. A
maior complicacao aparece no comportamento dos polos longnquos, quando
teramos conguracoes de Butterworth m ultiplas com raios distintos etc.
5.6 Discussao dos Resultados
5.6.1 Caso do Controle Barato, r pequeno.
Grandes amplitudes sao permitidas em u e por isso a resposta pode ser
rapida, ou seja, temos polos que podem se afastar bastante, podem se tornar
longquos. Eles serao respons aveis pelos movimentos rapidos, pelas amplitu-
des grandes em u. Mas nem todos os polos se afastam, alguns tendem aos
zeros estaveis de G(s). Isto e interessante pois indica que o cancelamento
de polos e zeros (no semiplano esquerdo!) esta embutido no mecanismo do

AO DO PRLOHTI 64
regulador otimo. Seja por exemplo um sistema com G(s) = n(s)/d(s). Ap os
a realimenta cao otima u = F
x + v teremos
G
F
(s) =
n
F
(s)
d
F
(s)
=
n(s)
d
F
(s)
=
p
i=1
(s
i
)
d
F
(s)
onde d
F
(s) e composta pelos autovalores de A
e
.i upondo controle barato
teremos r 0 e
d
F
(s)
p
i=1
(s
i
)
np
i=1
(s
i
w
0
)
onde

i
=
_
i
se Re(
i
) 0
i
se Re(
i
) > 0
e os termos (s
i
w
0
) representam os polos distantes.
Supondo que o sistema de malha aberta e de defasagem (ou fase) mnima
teremos que todos os zeros de G(s) estar ao localizados no semiplano esquerdo,
ou seja, Re(
i
) < 0, i = 1, 2, . . . , p e assim
G
F
(s) = T(s)
n
F
(s)
p
i=1
(s
i
)
np
i=1
(s
i
w
0
)
=
1
np
i=1
(s
i
w
0
)
Todos os zeros (est aveis) de G(s) sao cancelados pelo controle otimo. A
malha fechada passa a depender apenas dos polos distantes. O polin omio
np
i=1
(s
i
w
0
)
e chamado de polin omio de Butterworth de ordem (np) e seus coecientes
dependem apenas de (n p). Por exemplo, para
n p = 1 teremos s + 1
n p = 2 teremos s
2
+ 1, 414s + 1
n p = 3 teremos s
3
+ 2s
2
+ 2s + 1
n p = 4 teremos s
4
+ 2, 613s
3
+ 3, 414s
2
+ 2, 613s + 1
n p = 5 teremos s
5
+ 3, 236s
4
+ 5, 236s
3
+ 5, 236s
2
+ 3, 236s + 1
Se o sistema e de fase nao mnima, a funcao de transferencia de malha
fechada T(s) contera fatores do tipo
s +
i
s
i
e os polos pr oximos afetar ao a conguracao nal, nao sendo cancelados todos
como acontecia antes. Isto signica que a velocidade de sistemas de fase
nao mnima esta limitada pelos polos pr oximos de origem.

AO DO PRLOHTI 65
5.6.2 Caso do Controle Caro, r .
As amplitudes da entrada sao muito penalizados. Neste caso a melhor solucao
e deixar inalterados os polos estaveis de G(s) e trazer os inst aveis ate suas
imagens especulares. Intuitivamente poderamos pensar que seria mais eci-
ente, mais barato mexer nos polos inst aveis apenas o suciente para traze-
los ate a regi ao permitida, alocando-os bem pr oximos ao eixo imagin ario, j a
no semiplano esquerdo. A teoria mostra que este palpite e falso.
E muito mais coisas ainda se poderiam dizer, o campo e vasto e fascinante.
Paramos por aqui, com alguma pena. Mas o assunto se encontra em v arias
e v arias obras, e se os leitores e leitoras se sentirem motivados a procur a-las
entao estas notas terao cumprido sua missao.
Captulo 6
Projeto

Otimo de Observadores
Na teoria dos estimadores assintoticos de estado um aspecto e, normalmente,
tratado com alguma supercialidade: a escolha dos polos. Sao feitos comen-
tarios gerais no sentido de alocar os autovalores o mais à esquerda possvel
pois isso beneciaria a rapidez de convergencia; os inconvenientes seriam
problemas de amplicacao de rudos e satura cao de componentes. Algumas
regras empricas sao fornecidas, como por exemplo: colocar os polos de 5 a
10 vezes mais à esquerda do que os polos escolhidos para a planta.
Este importante problema mereceria um tratamento mais rigoroso e pre-
ciso, e a teoria de Controle

Otimo e, em particular, os resultados recem
estudados do Problema do Regulador Linear Quadr atico, sao sugest oes na-
turais para a empreitada. Trataremos dela neste captulo, come cando com
uma breve revis ao sobre
6.1 Observadores Assintoticos de Estados
Supomos, como sempre, que o sistema que se quer controlar a planta ou
processo admite o seguinte modelo linear e invariante no tempo:
o
_
_
0
) = x
0
z(t) = Dx(t)
y(t) = Cx(t)
onde x(t) IR
n
e o estado no instante t; u(t) IR
m
e a entrada em t; z()
representa a combinacao das variaveis de estado que queremos controlar, com
z(t) IR
p
e y() a combinacao das variaveis que podemos medir efetivamente
e que deve ser usada para implementar a lei de controle; y(t) IR
r
.
A esta planta acoplaremos um sistema O, tambem linear e invariante no
tempo descrito por
66
CAPTULO 6. PROJETO

OTIMO DE OBSERVADORES 67
O
_
_
v(t) = Gv(t) + Hu(t) + Jy(t); v(t
0
) = v
0
w(t) = Mv(t) + Ny(t)
onde v(t) IR
o
representa o estado deste sistema no instante t; as matrizes
G, H, J, M e N terao dimens oes o o, o m, o r, n o e n r, respecti-
vamente. O diagrama de blocos seguinte permite visualizar a situa cao:
E
u
o
E
z
y
H
E m E
_
+
M
E m E
+
H
'
T
c
J
c
E
E
c
N
c
E
v v w
Percebe-se que o sistema O funcionara como um estimador ou observador
assintotico do estado x(t) do sistema o se e somente se (t) 0 quando
t onde a grandeza erro de estimacao e denida como
(t) = w(t) x(t)
O resultado seguinte e classico da teoria dos sistema lineares:
Teorema 6.1.1 O sistema O e um observador assintotico do estado x(t) do
sistema o se e somente se existir uma matriz T o n, com o n tal que
TAGT = JC (6.1)
TB = H (6.2)
MT + NC = I
n
(6.3)
(G) C
(6.4)
O projeto dos observadores se resume assim a resolver as equa caos matri-
ciais acima, que sao chamadas de Rela coes Fundamentais dos Observadores,
as RFO.
Uma possvel solucao para as RFO seria escolher T = I
n
, M = I
n
e
N = 0. Isto faz com que w = v ou seja, o pr oprio estado do observador
CAPTULO 6. PROJETO

estima o estado da planta; faz tambem com que a escolha de H seja direta:
H = B. A equa cao 6.1 se reduz a
AG = JC
e o problema todo se resume a encontrar uma matriz J de tal modo que
(G) = (AJC) C
Mas este e um problema bem conhecido, e se houver observabilidade (ou

mesmo detetabilidade) do par < CA > pode ser facilmente resolvido. O
diagrama de blocos abaixo mostra essa possvel solucao:
E
u
o
E
z
y
B
E m E
_
+
AJC
T
c
J
c
E
v v = w
E
y
E
'
Seguindo regras simples de manipulacao de diagramas de blocos podemos
transformar este em um outro, equivalente:
E
u
o
E
z
y
B
E m E
_
+
c
J
c
E
v v = w
E
y
E
A
'
JC
m
+
'
T
'
T
Prosseguindo com as manipulacoes chegaramos a

CAPTULO 6. PROJETO

E
u
o
E
z
y
B
E m E
_
+
J
c
E
v v = w
E
y JCv
A
m
+
T
'
C
y = Cv E
E
T
c
'
e
Este e, muito possivelmente, o observador mais conhecido e estudado; ele

recebe, às vezes, o nome de observador identidade. Note-se que ele e com-
posto por uma copia identica da planta à qual se adiciona uma realimenta cao
do erro e = y y = Cx Cv, cuja nalidade e for car o sinal y a rastrear y.
Isto explicaria a razao de v ser um bom substituto para x.
Esta interpreta cao clara e intuitiva do mecanismo de funcionamento do
observador identidade e a respons avel pela sua popularidade. A grande
maioria dos textos sobre estimadores assintoticos usa-o para motivar as ex-
plicacoes, e, nao raro, ele e o unico tipo de observador estudado.
E interessante notar que quando o ganho matricial J aumenta os auto-

valores de G = AJC sao empurrados para a esquerda no plano complexo,
resultando em duas (pelo menos) conseq uencias:
1. o erro de estima cao (t) se aproxima de 0 mais rapidamente, o mesmo
acontecendo com e(t);
2. o sinal y JCv pode assumir valores elevados.
A primeira destas conseq uencias e beneca, signica uma maior rapidez
de convergencia para o estimador, e isto e sempre desejado. J a o fato de
o sinal y JCv crescer pode ser preocupador. Estes raciocnios mostram
que a escolha do ganho J deve ser feita com certos cuidados. Como faze-lo?
Ha certas diretrizes baseadas em consideracoes empricas, mas sao vagas e
insatisfatorias. Por que nao tentar algo mais profundo?
6.2 Problema do estimador aberto
Conforme visto acima, a estrutura de um observador identidade e composta
de uma copia do modelo da planta mais uma realimenta cao corretiva, e o seu
projeto se resume à determina cao da matriz de ganhos J.
CAPTULO 6. PROJETO

Para ajudar na escolha otima de J considere o seguinte estimador aberto:
E
u
o
E
z
y
B
E m E
_
+
c
E
v v = w
E
u
A
m
+
T
'
C
y = Cv E
E
T
c
'
e
O problema agora e achar u() tal que o sinal e() seja regulado de maneira
otima. Isto signca que e(t) 0 de tal modo que o ndice
_

0
_
e
T
(t)Qe(t) + u
T
(t)R u(t)
_
dt
onde Q > 0 e R > 0 seja minimizado.
Mas e(t) = y(t) y(t) = C(x(t) w(t)) = C(t), donde
e
T
(t)Qe(t) =
T
(t)C
T
QC(t) =
T
(t)R
1
(t)
e o ndice pode ser reescrito:
_

0
_
T
(t)R
1
(t) + u
T
(t)R u(t)
_
dt
onde R
1
= C
T
QC 0 e R > 0.
Para que a teoria precedente possa ser aplicada devemos encontrar um
sistema para o qual (t) seja o estado e u seja a entrada. Vejamos:
= w x = Aw + Bu + u Ax Bu
= A + u
Parece pronto. Seja entao o sistema
_
_
(t) = A(t) + u(t)
(0) =
0
= w(0) x(0)
para o qual desejamos encontrar uma entrada u() que minimiza o ndice
CAPTULO 6. PROJETO

_

0
_
T
(t)R
1
(t) + u
T
(t)R
2
u(t)
_
dt
onde R
1
= C
T
QC 0 e R
2
= R > 0.
A solucao e conhecida:
u(t) =

F(t) = R
1
2
I
T
P
(t)
onde P
0 e a solucao da ERMA
A
T
X + XAXR
1
2
X + R
1
= 0
O conceito de estimador de estados exige que a entrada u seja expressa
em termos do sinal e:
u(t) = Je(t) = JC(t)
donde conclumos que
JC =
F
Ha um pequeno problema aqui! Como o sinal u entra na equa cao de
atraves da matriz identidade I a solucao otima

F sera uma matriz quadrada.
Como

F = R
1
2
P
o posto de

F sera, muito provavelmente, completo, ou
seja: (

F) = n. Mas
(JC) (C) = r < n = (

F)
signicando que, em geral, a equa cao JC =
F nao pode ser satisfeita . . .

6.3 O verdadeiro problema
O impasse a que se chegou na se cao anterior pode levar à conclusao de que se
estava tentando resolver o problema errado. Pensemos novamente. Uma das
razoes para se minimizar o ndice e manter as amplitudes do sinal u baixas,
para evitar satura coes.
E claro que uma estima cao mais rapida (sempre desejavel) implica em
amplitudes elevadas para o sinal u = y JCv, mas . . . qual seria o problema
disto? Este e um sinal interno, nao ha qualquer atuador fsico cuja capacidade
seria excedida. Este sinal sera, muito provavelmente, representado por bytes
em um computador, e podera crescer sem perigo de satura coes. Os perigos
estao em outros lugares.
CAPTULO 6. PROJETO

O pior efeito possvel de se aumentar a velocidade de convergencia e per-
mitir que rudos presentes em y se propaguem por todo o sistema. Em outras
palavras, o aumento indiscriminado de J alargaria a banda de passagem do
estimador, e os rudos de y deixariam de ser bloqueados; ou, pior, poderiam
ser amplicados ate contaminar todo o sistema e tirar a validade de quaisquer
sinais obtidos como resposta deste.
Rudos existem, sao inevitaveis: podem ser introduzidos pelos instrumen-
tos de medida, podem estar presentes nos sinais de controle, podem entrar
no sistema em qualquer outro ponto ou por qualquer outro meio. Assim, o
verdadeiro problema a se resolver, o problema de importancia pr atica real, e
o de se evitar a propaga cao de rudos atraves da malha.
Consideremos entao uma situa cao bastante geral, de um sistema o com
entrada u, sada y
c
e sujeito à acao de outras entradas
E
o
E
u
y
c
c
Estamos considerando tipos diferente de outras entradas: o smbolo

representa os sinais esp urios adicionados às variaveis de sada pelos trans-
dutores e recebe o nome de rudo de sada ou de medida. O smbolo
engloba todos os outros sinais indesejaveis e recebe o nome de rudo de
entrada ou de sistema ou, simplesmente, dist urbio. Suporemos que os
rudos, de qualquer tipo, sao aditivos, ou seja, um sinal limpo e somado a um
rudo para gerar um sinal contaminado. Para explicitar a natureza aditiva
de o diagrama acima pode ser mais detalhado:
E
o
E j
+
u
y
c
E
y
c
O sinal y seria a sada pura ao passo que y
c
e a sada real ou conta-
minada. O verdadeiro problema de se projetar um dispositivo pr atico de
estima cao e o de recuperar o estado x da planta, de uma maneira otima
(em um sentido ainda a ser explicado), mesmo em presenca de rudos com
caractersticas conhecidas.
Esta mesma situa cao pode ser encarada em um outro contexto, onde es-
CAPTULO 6. PROJETO

taramos mais interessados em limpar o sinal y
c
. Diramos que o verdadeiro
problema de se projetar um dispositivo pr atico de ltragem e o de recuperar
as informacoes contidas na sada y do sistema o acionado apenas por u (sem
), a partir do sinal real y
c
.
Os problemas do observador otimo e do ltro otimo tem rela coes profun-
das, como veremos. A partir de agora, atencao apenas para o caso linear e
invariante no tempo. As equa coes dinamicas sao:
o
_
_
x(t) = Ax(t) + Bu(t) + B
(t)
y
c
(t) = Cx(t) + (t) = y(t) + (t)
O diagrama de blocos associado e
E
B
E j
+
E
_
E
C
E j
+
E
A
'
T
c c
B
E
u
x
y
y
c
Ha dois casos particulares de interesse. Quando B
= B o sinal tem
a mesma dimens ao de u e teremos x = Ax + B(u + ), ou seja, o rudo
contamina diretamente a entrada, sendo chamado de rudo ou dist urbio de
comando ou de entrada. Quando B = I o sinal tem dimens ao n e afeta
diretamente os estados. O diagrama abaixo ilustra estes casos.
E j
+
E
c
u
B
E . . . E
B
E j
+
E
c
u
Seja entao um observador do tipo identidade acoplado a um sistema

sujeito à acao de rudos, como ilustrado pelo pr oximo diagrama. As equa coes
din amicas sao
o
_
_
x = Ax + Bu + B
y
c
= Cx +
O
_
_
v = Av + Bu + J(Cx + Cv)
e = Cx + Cv
CAPTULO 6. PROJETO

E
u
B
E j
c
+
T
B
_
J
v v = w
E
A
j
+
'
C
y = Cv E
'
e
E
_
x x
E
A
'
C
E j
+
E
c
E
y
c
E j
+
E E
c
T
c
T
O projeto se resume a encontrar uma matriz J tal que (AJC) C
,
o que obrigaria o erro de estima cao a se aproximar assintoticamente de zero:
(t) 0. Escrevendo as equa coes para o sistema expandido obteremos
o +O
_
_
_
x

_
=
_
A 0
0 AJC
_ _
x
_
+
_
B
0
_
u +
_
B
_

_
0
J
_
e = [ 0 C ]
_
x
_
+
Para perceber os efeitos dos rudos de maneira mais clara e interessante
encontrar uma descricao freq uencial para o sistema acima: E(s) =
[ 0 C ]
_
sI A 0
0 sI G
_
1
__
B
0
_
u +
_
B
_

_
0
J
_
_
+ (s)
onde G = AJC. Desenvolvendo mais chegaramos a
E(s) = C(sI G)
1
B
(s) C(sI G)
1
J(s) (s)
ou, mais compactamente, denindo as matrizes de transferencia T
(s) e T
(s):
E(s) = T
(s)(s) + (s) T
(s)(s)
Conforme aumentamos os ganhos J os autovalores de G = A JC se
deslocam mais para a esquerda do plano complexo, tornando mais larga a
banda de passagem das matrizes T
(s) e T
(s).
CAPTULO 6. PROJETO

Suponhamos, para come car, que os rudos e sao, ambos, sinais com-
postos apenas por freq uencias baixas. Isto signica que eles atravessam os
sistemas T
e T
praticamente incolumes, sem sofrer distorcoes. A estrutura

do estimador garante que o rudo de medida nao contaminara o sinal e
neste caso, pois (s) T
(s)(s) (s) (s) = 0.

O raciocnio acima e independente de J, pois, qualquer que seja o espectro
de G as bandas de passagem envolvidas sao sucientemente amplas para
conter os rudos de baixa freq uencia. Em resumo:
Quando os rudos presentes sao de baixa freq uencia, os rudos de
medida serao ltrados e apenas os rudos de sistema conta-
minarao o sistema. E isto independe do projeto do estimador.
Suponhamos agora que os rudos e sao, ambos, sinais compostos
apenas por freq uencias altas. Se o observador foi projetado com ganhos
baixos as bandas de passagem dos sistemas T
e T
sao estreitas e bloquear ao

ambos os sinais. A estrutura do estimador garante que o rudo de medida
contaminara o sinal e, pois T
(s)(s)+(s)T
(s)(s) 0+(s)0 = (s).

O raciocnio acima depende de J para o caso de rudos de alta freq uencia:
se o espectro de G e tal que as bandas de passagem envolvidas sao sucien-
temente amplas para aceitar (s) e (s) sem distorcoes, o rudo de medida
(s) poderia ser bloqueado e o rudo de sistema poderia passar. Em resumo:
Quando os rudos presentes sao de alta freq uencia o projeto do
estimador tem importancia crucial. Para ganhos baixos de J ape-
nas os rudos de medida contaminar ao o sistema. Para ganhos
elevados de J o quadro acima pode se inverter.
Este sao apenas casos basicos. Pode-se imaginar situa coes em que os
rudos tem naturezas diferentes, e as analises correspondentes deveriam ser
feitas de acordo com as diretrizes acima. Pode-se ainda imaginar casos onde
os rudos tem caractersticas desconhecidas: como proceder?
Um fato parece claro: projetar observadores levando em conta os rudos
pode se tornar algo muito dependente da natureza deles, algo problem atico.
Assim, deve haver outros caminhos que propiciem um tratamento mais sim-
ples e direto ao projeto otimo de estimadores.
6.4 Estimadores e Filtros
Na se cao anterior foi mencionada a ntima rela cao entre o projeto de esti-
madores e o de ltros. Para enunciar o problema geral de ltragem, seja o
diagrama:
CAPTULO 6. PROJETO

E
o
E j
+
u
y
c
E
y
c
T
E
y
Devemos encontrar um ltro T capaz de gerar uma estimativa otima y
para o sinal y. Ou seja, o ltro deve anular os efeitos dos rudos e .
Os ltros tradicionais podem cumprir esta missao, desde que os sinais
sejam bem conhecidos, e seus espectros tenham caractersticas bem determi-
nadas. Quando, por exemplo, e sao sinais de baixa freq uencia o ltro T
deve ter caractersticas de passa-baixas; quando os rudos sao baseados em
uma unica freq uencia usa-se um ltro notch. E por a vai.
Estas hipoteses sao limitadoras, os problemas reais podem ser bem mais
complicados: os espectros dos sinais envolvidos y, e podem se so-
brepor, ou entao podem nao ser bem conhecidos. Temos aqui exatamente os
mesmos inconvenientes apontados anteriormente para os estimadores: o uso
da caracterizacao freq uencial classica de sinais por meio dos seus espectros
nao se presta bem para o estudo de ltros ou de estimadores otimos.
Norbert Wiener, por volta de 1938, propos o uso de sinais estocasticos
para caracterizar as grandezas envolvidas nestes problemas e conseguiu resol-
ver o problema geral de ltragem, dando origem ao que se costuma chamar
de ltro de Wiener: ele encontrou um ltro T, caracterizado por sua matriz
de transferencia F(s) capaz de gerar uma estimativa otima de y.
Trinta anos depois Robert Kalman, trabalhando com variaveis de estados
e com o conceito de sinais estocasticos, resolveu o problema do estimador
otimo. Ficou entao clara a identidade entre observadores e ltros: eles sao a
mesma coisa! Com efeito, se um observador recupera o estado x de maneira
otima, basta multiplicar por C e teremos uma estimativa otima para y. O
nome usado para o estimador otimo pasou entao a ser: ltro de Kalman.
CAPTULO 6. PROJETO

6.5 Medias e correla c oes de sinais
6.5.1 Valor medio de um sinal
6.5.2 Valor medio quadratico de um sinal
6.5.3 Variancia de um sinal
6.5.4 Autocorrelacao de um sinal
6.5.5 Correla cao cruzada entre dois sinais
6.5.6 Densidade espectral de um sinal
6.6 Variaveis aleatorias
6.6.1 Probabilidades
6.6.2 Valor medio
6.6.3 Variancia
6.6.4 Covariancia entre x e y
6.6.5 Funcao distribui cao de probabilidade
6.6.6 Funcao densidade de probabilidade
6.6.7 Media
6.6.8 Valor medio quadratico
6.6.9 Variancia e covariancia
6.6.10 Distribuicao uniforme
6.6.11 Distribuicao normal
6.7 Processos aleatorios ou estocasticos
6.7.1 Rudo branco
6.7.2 Processo gaussiano
6.7.3 Processo estocastico estacionario
6.7.4 Processo estocastico ergodico
6.7.5 Sistemas Lineares
6.7.6 Matriz de autocorrelacao
6.8 Formulacao e solucao
CAPTULO 6. PROJETO

E
o
E j
+
u
y
c
E
y
c
O
E
w
c
E
O sinal e um rudo branco com media 0 e autocorrela cao Q > 0; o sinal
e tambem um rudo branco, com media nula e autocorrela cao R > 0. O
erro de estima cao = x w e um sinal tal que (t) IR
n
e que apresenta
um erro medio quadr atico dado por
e(t) =
n
i=1
E[
2
i
(t)]
O problema e projetar um estimador O que minimize o erro medio qua-
dr atico acima. A solucao e um observador identidade:
E
o
E j
+
u
y
c
y
c
c
j
+
T
E
B
E j
+
E
_
E
C
E
E
y
J
'
c
A
T
'
v
A matriz de ganhos sera dada por
J = PC
T
R
1
onde P e a solucao de uma equa cao de Ricatti Matricial algebrica:
AP + PA
T
PC
T
R
1
CP + BQB
T
= 0
CAPTULO 6. PROJETO


E um observador de ordem completa

E um problema de otimizacao dual do LQR

E o famoso Filtro de Kalman

E um estimador otimo e tambem um ltro, pois y e o resultado da
ltragem otima de y.
Iniciada em out/nov/85;
tecada com poucos
detalhes a mais
em set/out/88
por
Afonso Celso Del Nero Gomes,
ajudado pela
Angela.
Revista,
ampliada
e ilustrada
em jan/fev/mar/90.
Enriquecida em ns de 1991,
e em outubro/novembro de 1996,
e em outubro de 1999,
Finalmente pronta em . . . . . .
Logicamente
tambem houve muita
ajuda
dos que
seguem:
Apendice A
Formas Quadraticas
Como sempre acontece, uma leve recordacao de ferramentas matem aticas
e a melhor maneira de se iniciar novos estudos. Nesta se cao apresentare-
mos de maneira rapida, suscinta e geralmente sem provas, alguns resultados
matem aticos basicos que serao uteis para os desenvolvimentos posteriores.
A.1 Formas Lineares e Quadraticas
As ideias abaixo sao provavelmente conhecidas da maioria dos leitores.
Denicao A.1.1 Por Forma, Combinacao ou Funcional Linear das
variaveis x
1
, x
2
, . . . , x
n
entenderemos a expressao
L(x
1
, x
2
, . . . , x
n
) = l
1
x
1
+ l
2
x
2
+ + l
n
x
n
=
n
i=1
l
i
x
i
onde, i = 1, 2, . . . n, l
i
IR (corpo dos reais).
Exemplo A.1.1
L
1
= x
1
+ x
2
x
3
L
2
= 0, 5x
1
7x
2
+ 0x
3
x
4
Lembrando as propriedades do produto matricial podemos escrever:
L(x
1
, x
2
, . . . , x
n
) = l
1
x
1
+ l
2
x
2
+ + l
n
x
n
= [ l
1
l
2
l
n
]
_
_
x
1
x
2
.
.
.
x
n
_
_
80
AP
ENDICE A. FORMAS QUADR
ATICAS 81
Agrupando as variaveis x
i
e os coecientes l
i
nos vetores x e L, como
abaixo,
L =
_
_
l
1
l
2
.
.
.
l
n
_
_
x =
_
_
x
1
x
2
.
.
.
x
n
_
_
podemos usar a compacta e economica notacao vetorial:
L(x
1
, x
2
, . . . , x
n
) = L(x) = L
T
x
onde o smbolo L
T
denota a transposta da matrix L. Supondo que as
variaveis x
1
, x
2
, . . . , x
n
sao variaveis reais podemos encarar L() como uma
transformacao linear
L : IR
n
IR
x L(x) = L
T
x
Dependendo dos valores das variaveis x
i
a forma linear L(x) pode assumir
valores positivos, negativos ou nulos. Deste modo podemos particionar IR
n
em tres regi oes: IR
n
= IR
n
IR
n
IR
n
0
para as quais
x IR
n
L(x) > 0
x IR
n
L(x) < 0
x IR
n
0
L(x) = 0
Exemplo A.1.2 Para a forma L(x) = x
1
+x
2
o plano e particionado como
na gura abaixo. A regiao IR
n
0
e sempre uma variedade linear: reta, plano,
etc.
d
d
d
d
d
d
d
d
d
d
_
'
IR
2
IR
2
x
2
x
1
IR
2
0
Mas isto tudo e terreno muitssimo conhecido, de usos e utilidades j a
sabidos, e bem sabidos (espera-se).
AP
ATICAS 82
Denicao A.1.2 Chamaremos de Forma ou Combinacao Quadratica
das variaveis x
1
, x
2
, . . . , x
n
a expressao
Q(x
1
, x
2
, . . . , x
n
) = q
11
x
1
x
1
+ q
12
x
1
x
2
+ + q
nn
x
n
x
n
=
n
i=1
n
j=1
q
ij
x
i
x
j
onde, i, j = 1, 2, . . . n, q
ij
IR.
Exemplo A.1.3
Q
1
= x
2
1
+ x
1
x
2
5x
2
2
Q
2
= x
1
x
3
x
2
x
3
+ 7x
3
x
1
x
2
4
Para obter uma notacao alternativa compacta e elegante, como foi feito no
caso anterior, deve-se desenvolver a expressao da forma quadr atica denida
acima e depois aplicar as regras do produto matricial. Ao trabalho.
Q(x
1
, x
2
, . . . , x
n
) = q
11
x
2
1
+ q
12
x
1
x
2
+ + q
1n
x
1
x
n
+
q
21
x
2
x
1
+ q
22
x
2
2
+ + q
2n
x
2
x
n
.
.
.
+q
n1
x
n
x
1
+ q
n2
x
n
x
2
+ + q
nn
x
2
n
Colocando em evidencia a variavel x
i
em cada uma das i linhas da ex-
press ao acima teremos:
Q(x
1
, x
2
, . . . , x
n
) = x
1
(q
11
x
1
+ q
12
x
2
+ + q
1n
x
n
) +
x
2
(q
21
x
1
+ q
22
x
2
+ + q
2n
x
n
) +
.
.
.
+x
n
(q
n1
x
1
+ q
n2
x
2
+ + q
nn
x
n
)
Observando que as expressoes entre parenteses sao funcionais lineares do
tipo Q
i
x = [q
i1
q
i2
q
in
]x onde x e o vetor com componentes x
i
podemos
escrever
Q(x
1
, x
2
, . . . , x
n
) = [ x
1
x
2
x
n
]
_
_
q
11
q
12
q
1n
q
21
q
22
q
2n
.
.
.
.
.
.
.
.
.
q
n1
q
n2
q
nn
_
_
_
_
x
1
x
2
.
.
.
x
n
_
_
E nalmente, chamando de Q a matriz quadrada trazida pelo desenvol-
vimento acima, podemos nalizar escrevendo a procurada notac ao vetorial:
AP
ATICAS 83
Q(x
1
, x
2
, . . . , x
n
) = Q(x) = x
T
Qx
onde, como ja deve ter dado para perceber, o smbolo M
T
denota a transposta
da matrix M.
Exemplo A.1.4
Q(x) = x
2
1
+ x
1
x
2
+ x
2
2
= [ x
1
x
2
]
_
1 1
0 1
_ _
x
1
x
2
_
Lembrando que o produto de reais e comutativo temos x
1
x
2
= x
2
x
1
e
tambem podemos exprimir a forma acima de outra maneira:
Q(x) = x
2
1
+ x
2
x
1
+ x
2
2
= [ x
1
x
2
]
_
1 0
1 1
_ _
x
1
x
2
_
Algo salta aos olhos no exemplo acima: o comportamento observado pode
perfeitamente ser encontrado em outras situa coes. Isto sugere uma genera-
liza cao, a qual, dada a sua trivialidade, sera apresentada sem provas:
Fato A.1.1 Uma forma quadratica Q(x) pode admitir varias representa coes
matriciais:
Q(x) = x
T
Q
1
x = x
T
Q
2
x =
E bom lembrar que, a partir disto:

x
T
Q
1
x = x
T
Q
2
x , =Q
1
= Q
2
Prosseguindo, seja a forma quadr atica:
Q(x) = q
11
x
2
1
+ + q
ij
x
i
x
j
+ + q
ji
x
j
x
i
+
Como estamos tratando de variaveis reais podemos escrever
q
ij
x
i
x
j
+ q
ji
x
j
x
i
=
q
ij
+ q
ji
2
x
i
x
j
+
q
ij
+ q
ji
2
x
j
x
i
donde, chamando
s
ij
= s
ji
=
q
ij
+ q
ji
2
s
ii
= q
ii
s
jj
= q
jj
teremos
Q(x) = s
11
x
2
1
+ + s
ij
x
i
x
j
+ + s
ji
x
j
x
i
+
AP
ATICAS 84
Propriedade A.1.1 A uma forma quadratica Q(x) pode-se associar uma
unica representa cao matricial x
T
Sx onde S e uma matriz simetrica.
A prova de que a representa cao simetrica e unica e razoavelmente simples.
Vemos deste modo que dentre as innitas representa coes matriciais para uma
dada forma quadr atica ha sempre uma unica muito particular, envolvendo
uma matriz simetrica.
A.2 Sinal da Forma
A situa cao agora e um pouco mais elaborada do que no caso das formas
lineares, onde o espaco IR
n
sempre podia ser decomposto em tres regi oes.
Para as formas quadr aticas a riqueza e maior, como pode ser visto no . . .
Exemplo A.2.1 Para a forma Q(x) = x
2
1
x
2
2
o plano e particionado como
na gura abaixo.
d
d
d
d
d
d
d
d
d
d
_
'
+
+ +
+

x
2
x
1
IR
2
0
IR
2
0
Para este exemplo a forma pode assumir valores positivos, negativos, ou
nulos dependendo de x.
As formas lineares tem sempre um comportamento como o do exemplo
acima: ha pontos x que as tornam positivas, ha pontos que as tornam nega-
tivas e ha pontos que as anulam. As parti coes IR
n
, IR
n
, IR
n
0
, do espaco IR
n
sao sempre nao vazias. No caso das formas quadr aticas podemos ter outras
situa coes. Consideremos por exemplo:
Q(x) = x
T
_
1 0
0 1
_
x = x
2
1
+ x
2
2
onde temos: Q(x) > 0 x ,= 0 e Q(x) = 0 para x = 0. Da para perceber o
seguinte
Fato A.2.1 Uma forma quadratica sempre se anula em x = 0:
Q(x) = 0 para x = 0
AP
ATICAS 85
Dependendo do comportamento da forma para x ,= 0 poderemos reco-
nhecer v arios casos:
Denicao A.2.1 A forma quadratica Q(x) e Identicamente Nula quando
Q(x)= 0 x ,= 0 e escreveremos Q(x) 0.
Denicao A.2.2 A forma quadratica Q(x) e Positiva Denida quando
Q(x) > 0 x ,= 0; escreveremos Q(x) > 0. Uma forma quadratica Q(x) e
Negativa Denida quando Q(x) < 0 x ,= 0; escreveremos Q(x) < 0.
Denicao A.2.3 A forma quadratica Q(x) e Positiva Semidenida ou,
semipositiva denida, quando Q(x) 0 x ,= 0; escreveremos Q(x) 0.
Uma forma quadratica Q(x) e Negativa Semidenida quando Q(x)
0 x ,= 0; escreveremos Q(x) 0.
Denicao A.2.4 A forma quadratica Q(x) e Indenida quando nao se
encaixar em uma das categorias acima.
A.3 Exerccios
1. As formas abaixo sao do tipo x
T
Qx. Classic a-las quanto ao sinal.
Indicar, quando for o caso, as regi oes IR
n
, IR
n
e IR
n
0
.
(a) Q =
_
1 1
1 0
_
(b) Q =
_
1 1
1 1
_
(c) Q =
_
1 1/2
1/2 1
_
(d) Q =
_
0 1
1 0
_
(e) Q =
_
_
1 1 0
1 1 1
0 1 0
_
_
2. Sendo M uma matriz quadrada qualquer mostrar que
1
2
(M +M
T
) sera
simetrica.
AP
ATICAS 86
A.4 Criterios de denicao
As formas quadr aticas denidas e semidenidas sao muito importantes em
um sem n umero de problemas, como teremos a oportunidade de ver. Desta
maneira, devemos procurar metodos pr aticos para descobrir o sinal de uma
forma quadr atica.
Teorema A.4.1 (Sylvester) Uma forma Q(x) = x
T
Sx , onde S e uma
matriz simetrica, sera positiva denida se e somente se todos os seus menores
principais forem positivos:
Q(x) > 0 s
11
> 0;
s
11
s
12
s
21
s
22
> 0;
s
11
s
1n
.
.
.
.
.
.
s
n1
s
nn
> 0;
Q(x) = x
T
Sx sera negativa denida se e somente se Q(x) for positiva
denida ou seja, os menores principais de S forem alternadamente positivos
e negativos:
Q(x) < 0 Q(x) = x
T
(S)x > 0
ou entao,
(menor de ordem k)(1)
k
> 0, k = 1, 2, . . . n
Se nenhuma das condicoes for satisfeita a forma sera indenida.
E bom notar que substituindo os sinais do teorema anterior por 0 nao

encontraremos condi coes para o caso semidenido. O pr oximo resultado,
tambem classico, relaciona o sinal de uma forma com os autovalores da matriz
simetrica associada; mostra ainda um pouco da estrutura que tal matriz deve
ter.
Teorema A.4.2 Cada uma das condicoes seguintes e necessaria e suciente
para que a forma Q(x) = x
T
Sx , onde S e uma matriz simetrica, seja positiva
denida:
1. Os autovalores de S sao reais e positivos.
2.

E possvel escrever S = C
T
C onde C e uma matriz com colunas line-
armente independentes.
Embora os conceitos acima sejam denidos para formas quadr aticas, como
a cada uma delas se pode associar uma unica matriz simetrica podemos falar,
com abuso de linguagem, em matrizes simetricas positivas denidas, semide-
nidas, etc. e, ao inves de escrevermos Q(x) > 0 ou o(x) > 0 poderamos
tambem usar Q > 0 ou S > 0, etc.
AP
ATICAS 87
A.5 Normas, Metricas e Tamanho
Apesar de um espaco vetorial nao ser ordenado podemos classicar seus ve-
tores de acordo com o tamanho. Para isso usamos as ideias de Norma ou
Modulo. Resumindo bastante uma teoria elaborada e bela, diramos que a
Norma Euclidiana, ou simplesmente Norma de um vetor x IR
n
e dada
por:
|x| = x
2
1
+ x
2
2
+ + x
2
n
Isto signica que a norma pode ser expressa como uma forma quadr atica:
|x| = x
T
x = x
T
Ix
onde I simboliza a matriz identidade. Aplicando o teorema de Sylvester ` a
matriz I vericaramos trivialmente ser ela positiva denida, donde se conclui
que |x| = x
T
x > 0 x IR
n
. Isto justica a deni cao de M odulo como
[x[ =
_
|x| =
_
x
2
1
+ x
2
2
+ + x
2
n
Nas aplicacoes pr aticas os elementos dos vetores sao grandezas fsicas,
e muitas vezes algumas destas grandezas sao mais importantes que outras.
Assim, seria interessante uma medida que evidenciasse isto, j a que a norma
atribui um peso igual às componentes do vetor, quando gostaramos de privi-
legiar algumas delas. Podemos associar a ideia de norma a media aritmetica
simples, e dizer que estamos interessados em algo parecido com uma media
ponderada. Em outras palavras, se o tamanho de um vetor nos interessa mais
em algumas componentes, ou dire coes, do que em outras podemos atribuir
pesos a essas dire coes usando x
T
Dx onde os elementos da matriz diagonal D
reetiriam a importancia que se quer atribuir ou retirar dos componentes de
x. De um modo mais geral temos o
Fato A.5.1 Toda forma Q(x) = x
T
Sx onde S > 0 ou S 0 permite asso-
ciar ao vetor x um escalar Q(x) que pode representar uma medida do tama-
nho do vetor x, da sua distancia ate a origem. Dependendo da escolha de
S pode-se medir esse tamanho com enfase especial em algumas direcoes.
AP
ATICAS 88
Consideremos agora uma funcao do tempo
designada por x() ou simplesmente x.
Deve car claro que o smbolo x(t)
representa um n umero real, o
valor assumido pela funcao
x no instante t. Podemos
visualizar a situa cao por
meio de um ponto se
movendo sobre uma
trajet oria no IR
n
Usando uma forma
quadr atica e possvel representar a funcao vetorial x() por meio da funcao
real Q() = x
T
()Sx() onde S 0.
Z
Z
Z
Z
Z
Z
_
'
rx(t
0
)
Desta maneira, a gura tridimensional acima poderia ser substituda
pelo gr aco da funcao escalar
_
'Q(t)
t
E l ogico que nessa representa cao unidimensional de algo multidimensi-

onal alguma coisa se perder a, mas de uma maneira geral alguns aspectos
importantes permanecem. Por exemplo, se S > 0 podemos garantir que
x 0 Q(x) 0
Em resumo: sendo S > 0, a forma Q(x) = x
T
Sx e uma maneira comoda
de representar x IR
n
por meio de um n umero real. Informa coes a respeito
da evolucao do vetor x(t) no IR
n
podem ser obtidas pela analise do gr aco
da grandeza escalar Q(x) em funcao do tempo.
Exemplo A.5.1 Podemos ter alguma ideia do comportamento ao longo do
tempo do vetor x(t) = [e
t
e
t
]
T
se analisarmos a fun cao real dada pela forma
quadratica x
T
(t)x(t) = e
2t
+ e
2t
_ _
' '
r
x
0
2
x
2
x
1
t
[[x(t)[[
AP
ATICAS 89
A.6 Exerccios
1. Sendo x = Ax, tracar um gr aco para x
T
(t)Qx(t). A partir deste
gr aco e possvel dizer algo sobre a estabilidade do sistema? Use
A =
_
_
0 1 0
0 0 1
1 1 1
_
_ , x(0) =
_
_
1
1
1
_
_ , Q =
_
_
1 1 0
1 0 0
0 0 1
_
_
2. Idem 1 para Q =
_
_
1 1 1
1 1 1
1 1 1
_
_
3. Seja a matriz simetrica Q > 0, com dimens ao n n. Sendo M uma
matriz inversvel, que se pode dizer de P = M
1
QM? sera simetrica?
e o seu sinal?
4. Seja a matriz simetrica Q > 0, com dimens ao n n. Sendo D uma
matriz (r n), com r < n, que se pode dizer de P = DQD
T
? sera
simetrica? e o seu sinal?
5. Idem 4 para r > n
6. Idem 4 para r = n
A.7 Visao Geometrica das Formas Quadrati-
cas
Lembremos que a operacao v
T
w pode representar o produto escalar entre os
vetores v, w IR
n
. Mas o produto escalar pode ser expresso em termos dos
m odulos dos vetores envolvidos e do angulo compreendido entre eles:
_
v
.
.
.
.
.
.
..
w
v
T
w = [v[ [w[ cos
Desta maneira o produto escalar carrega informacoes a respeito da po-
sicao relativa entre os dois vetores. Assim, se v
T
w = 0 sabemos que v e w
sao ortogonais. Se v
T
w > 0 teremos que o m odulo do angulo entre eles e
menor do que /2 e assim estes vetores apontam na mesma dire cao, estao
em um mesmo semiespaco. Para v
T
w < 0 teremos cos negativo, > /2
AP
ATICAS 90
e os vetores v e w tentam seguir dire coes opostas. A gura abaixo ilustra
bem a situa cao. Para um vetor v xo temos tres possibilidades para w:
dd
dd
dd
dd
dd
dd
dd
Z
Z
Z
Z
Z
E
d
d
d
'
v
v
T
w > 0
v
T
w = 0
v
T
w < 0
v
T
w > 0 : mesma dire cao, mesmo semiespaco
v
T
w = 0 : ortogonais
v
T
w > 0 : dire cao oposta, semiespaco complementar
Com isto em mente a forma quadr atica x
T
Qx pode ser encarada como o
produto escalar entre x e Qx e assim x
T
Qx mediria a deformacao angular
causada pela aplicacao de Q a x, a quantidade de rotacao sofrida por x ate
se obter Qx. Assim, se para uma dada transformacao linear A : IR
n
IR
n
temos x
T
Ax > 0 x IR
n
isto signica que A e um mapa que preserva
a dire cao, ou seja um vetor x qualquer e sua imagem Ax estao sempre no
mesmo semiplano. Se x
T
Ax = 0 x IR
n
entao cada elemento x e girado de
/2.
Neste ponto podemos estabelecer a rela cao entre duas formas quadr aticas
iguais. Sejam Q
1
e Q
2
tais que x
T
Q
1
x = x
T
Q
2
x x IR
n
. Chamando
Q
2
Q
1
= M temos x
T
Q
1
x = x
T
(Q
1
+ M)x = x
T
Q
1
x + x
T
Mx, donde
x
T
Mx = 0 e M e ortogonal.
A.8 Miscelanea de F ormulas
A cole cao de resultados abaixo pode ser util em um grande n umero de si-
tua coes. Eles vir ao sem provas. Os smbolos A 0 ou A > 0 signicam,
como ja vimos, que a forma quadr atica x
T
Ax e positiva semidenida ou
positiva denida respectivamente.
Fato A.8.1 Seja C uma matriz mn
A = C
T
C = A 0
Fato A.8.2 Seja C uma matriz mn com rank (C) n
A = C
T
C = A > 0
Fato A.8.3 Seja C uma matriz n n com det(C) ,= 0
A = C
T
C = A > 0
AP
ATICAS 91
Fato A.8.4 A B AB 0
Fato A.8.5 A 0, B 0 A + B 0
Fato A.8.6 A 0, B 0 , AB 0
Fato A.8.7 Sendo um autovalor generico de A(n n):
A 0 =Re() 0
A > 0 =Re() > 0
A simetrica = IR
A simetrica, A > 0 = IR, > 0
Fato A.8.8 Se A e simetrica seus autovetores sao ortogonais e assim:
A e simetrica =A=U
T
U onde U e unitaria (U
T
U =I) e = diag(
i
)
Denicao A.8.1 A raiz quadrada matricial simetrica de A 0, designada
por A
1/2
ou
A e tal que
A = A e
A = (
A)
T
Fato A.8.9
A = U
T
1/2
U. Como U e nao unica a raiz quadrada matricial
simetrica e tambem nao unica.
Fato A.8.10 A 0 e simetrica, B 0 e simetrica , =AB 0
A 0 e simetrica, B 0 e simetrica , = ABsimetrica
A 0 e simetrica, B 0 e simetrica = (AB) IR, (AB) 0
Fato A.8.11 Sendo o menor autovalor de uma matriz A 0 e simetrica
e o maior deles:
A 0 e simetrica =(A)[x[
2
x
T
Ax (A)[x[
2
, x
Fato A.8.12 Podemos denir norma de uma matriz A como
|A| = sup
|x|=1
[Ax[
Com isto:
A 0 e simetrica =|A| = (A)
A > 0 e simetrica =|A
1
| = ((A))
1
AP
ATICAS 92
A.9 Matrizes Hamiltonianas
Sendo A(n n) uma matriz real qualquer, S (n n) e T (n n) matrizes
reais e simetricas, diremos que
_
A S
T A
T
_
e uma Matriz Hamiltoniana. Nos desenvolvimentos posteriores teremos
oportunidades de vericar a importancia destas matrizes. O conjunto de
todas as matrizes Hamiltonianas sera designado por 1:
1 =
_
H IR
2n2n
[ H e Hamiltoniana
_
O espectro das matrizes Hamiltonianas e sempre simetrico com rela cao
ao eixo imagin ario; isto signica que, se +j e um dos autovalores de uma
matriz Hamiltoniana entao + j tambem sera um autovalor. Antes de
demonstrar esta propriedade apresentaremos dois resultados muito uteis no
manuseio de expressoes matriciais intrincadas.
Lema A.9.1 (Identidade de Sylvester) Sendo M e Q matrizes quadra-
das, com M inversvel, e N e P matrizes com dimensoes compatveis temos:
_
M N
P Q
_
=
_
M 0
P I
_ _
I M
1
N
0 QPM
1
N
_
Esta identidade permitir a fatorar matrizes particionadas em blocos. Sua
prova e simples, bastando desenvolver o produto do lado direito. Para o que
segue, o smbolo det(X) denotara o determinante da matriz X.
Lema A.9.2 Sendo B e C matrizes cujo produto e uma matriz quadrada,
temos
det(I BC) = det(I CB)
A demostracao deste resultado ja e mais elaborada, e sera omitida. Pa-
semos entao à
Propriedade A.9.1 O espectro de uma matriz Hamiltoniana e simetrico
com relacao à origem do plano complexo.
Demonstracao: Como as Hamiltonianas sao matrizes reais, os seus es-
pectros sao simetricos com rela cao ao eixo real; querer que haja simetria
tambem com rela cao ao eixo imagin ario signica dizer que se e autovalor
AP
ATICAS 93
de uma Hamiltoniana entao tambem deve ser, ou seja, existe simetria
com rela cao à origem do plano complexo. Seja entao H 1 para a qual
calculamos
I H =
_
I A S
T I + A
T
_
=
_
I A 0
T I
_ _
I (I A)
1
S
0 (I + A
T
) T(I A)
1
S
_
onde usamos a identidade de Sylvester. Chamando de
H
() o polin omio
caracterstico de H, e passando a usar () para denotar det(I A), temos:
H
() = det(I H)
= () det
_
(I + A
T
) T(I A)
1
S
_
= () det(I + A
T
) det
_
I T(I A)
1
S(I + A
T
)
1
_
onde colocamos em evidencia o termo I +A
T
na segunda parcela do segundo
termo. Mas I + A
T
= I
T
+ A
T
= (I + A)
T
, e ainda temos que a inversa
da transposta e a transposta da inversa. Com isto temos
H
() = () det(I + A) det
_
I T(I A)
1
S
_
(I + A)
1
_
T
_
= () det(I)() det
_
I + T(I A)
1
S
_
(I A)
1
_
T
_
onde usamos a identidade I +A = I(I A). Chamando agora o termo
(I A)
1
de M() temos:
H
() = (1)
n
()() det
_
I + TM()SM
T
()
_
(A.1)
= (1)
n
()() det
_
I + M()SM
T
()T
_
(A.2)
Nesta ultima passagem usamos o Lema A.9.2 acima. Notando nalmente
que det(I + X) = det(I + X)
T
= det(I + X
T
) obtemos
H
() = (1)
n
()() det
_
I + T
T
M()S
T
M
T
()
_
= (1)
n
()() det
_
I + TM()SM
T
()
_
pois T e S sao simetricas. Comparando esta expressao com a equa cao A.1
acima conclumos que
H
() =
H
(), completando a demonstracao.
Q.E.D.
AP
ATICAS 94
Polin omios p() para os quais p() = p() sao chamados de polinomios
pares. Vemos assim que os polin omios caractersticos das matrizes Hamil-
tonianas sao pares. Antes de prosseguir, e para xar os conceitos, vejamos
o
Exemplo A.9.1 Considere as matrizes Hamiltonianas:
H
1
=
_
_
0 1 0 0
0 0 0 1
1 0 0 0
0 2 1 0
_
_
H
2
=
_
_
0 1 0 0
0 0 0 1
1 0 0 0
0 4, 25 1 0
_
_
H
3
=
_
_
0 1 0 0
0 0 0 1
1 0 0 0
0 4, 25 1 0
_
_
O calculo dos autovalores forneceria os seguintes espectros:
(H
1
) = 1, 1, 1, 1 (H
2
) = 0.5j, 2.0j
(H
3
) = 2.0, 0.5, 0.5, 2.0
que sao simetricos com relacao ao eixo imaginario, como deveriam.
Trataremos agora de dois importantes subespacos associados a uma ma-
triz quadrada qualquer. Sendo m() o polin omio mnimo da matriz M (kk),
sempre podemos fatora-lo como
m() = m
()m
+
()
onde as razes de m
() tem partes reais estritamente negativas e as de m

+
()
tem partes reais positivas ou nulas. Usando outra terminologia, diramos
que m
() tem suas razes em C
, o semiplano esquerdo aberto do plano

complexo C, ao passo que m
+
() tem as suas em C
+
, o semiplano direito
fechado de C. Sendo X uma matriz real (mn) denotaremos por ker(X) o
seu espaco nulo (ou kernel, ou n ucleo): ker(X) = v IR
n
[Xv = 0.

E bem
sabido que este conjunto e um subespaco vetorial de IR
n
.
Denicao A.9.1 Chamaremos de subespaco dos modos estaveis de M,
designado por A
(M), e subespaco dos modos instaveis de M, designado

por A
+
(M), as expressoes
A
(M) = ker m
(M) e A
+
(M) = ker m
+
(M)
AP
ATICAS 95
E um exerccio simples de

Algebra Linear demonstrar que cada um dos
subespacos acima denidos e um subespaco invariante sob M, e que a soma
direta deles fornece o espaco todo:
MA
MA
+
A
+
A
A
+
= IR
k
Estes subespacos sao chamados de subespacos espectrais e admitem uma
interpreta cao geometrica muito util. Considere o sistema autonomo
_
p(t) = Mp(t)
p(0) = p
0
O conjunto de todas as condi coes iniciais das quais partem trajet orias
que tendem assintoticamente à origem e precisamente A
(M). Deste modo

poderamos escrever
A
(M) =
_
p
0
IR
k
[ lim
t
_
e
Mt
p
0
_
= 0
_
e o nome subespaco dos modos estaveis ca justicado. Trajet orias originadas
emA
+
(M) certamente tenderao a , mas neste caso nao poderemos exprimir
esse subespaco de maneira analoga ao de A
(M). Os leitores sao convidados

a reetir sobre o assunto.
Quando M possui autovalores reais e distintos a obtencao dos subespacos
espectrais acima e facilitada: os autovetores associados a autovalores em C
formarao uma base para A
(M) e os autovetores inst aveis, os de C

+
, serao
uma base para A
+
(M). Se M apresenta uma estrutura mais complicada
deveremos utilizar as expressoes da deni cao.
Exemplo A.9.2 Para a matriz H
1
do exemplo anterior teramos diculda-
des no calculo dos autovetores associados aos autovalores repetidos. Sendo os
polinomios caracterstico e mnimo dados por () = m() = (1)
2
(+1)
2
seria simples obter
m
(H
1
) = (H
1
+ I)
2
=
_
_
1 2 0 1
0 3 1 2
2 1 1 0
1 4 2 3
_
_
m
+
(H
1
) = (H
1
I)
2
=
_
_
1 2 0 1
0 3 1 2
2 1 1 0
1 4 2 3
_
_
AP
ATICAS 96
A partir destas matrizes a obten cao dos subespacos modais e simples:
A
(H
1
) = ker m
(H
1
) =
_
_
1 0
0 1
2 1
1 2
_
_
A
+
(H
1
) = ker m
+
(H
1
) =
_
_
1 0
0 1
2 1
1 2
_
_
O segundo caso do exemplo anterior e trivial:
A
(H
2
) = 0 e A
+
(H
2
) = IR
4
Para a matriz H
3
podemos calcular os subespacos espectrais ou pelos au-
tovetores ou pelo polinomio mnimo. Encontraramos
A
(H
3
) = ker m
(H
3
) =
_
_
2 4
4 2
1 8
8 1
_
_
A
+
(H
3
) = ker m
+
(H
3
) =
_
_
2 4
4 2
1 8
8 1
_
_
Alem da interpreta cao geometrica dos subespacos espectrais, vista acima,
eles tambem permitem a obtencao de mais informacoes sobre os autovalores
das matrizes Hamiltonianas:
Propriedade A.9.2 A matriz Hamiltoniana H nao possui autovalores sobre
o eixo imaginario se e somente se dimA
(H) = dimA
+
(H) = n
A demonstracao da validade deste resultado e simples, e sera omitida. De
agora em diante sempre suporemos que (H) jw = ou, equivalente-
mente, dimA
(H) = dimA
+
(H) = n.
AP
ATICAS 97
Dados os subespacos 1, J IR
2n
, quando 1 + J = IR
2n
e 1 J = 0
diremos que eles sao complementares e escreveremos 1 J = IR
2n
. Sendo
V e W matrizes cujas colunas formam bases para 1 e J, respectivamente,
a matriz [V W] tera posto completo (= 2n) quando 1 e J forem com-
plementares. Seja A
p
IR
2n
o subespaco gerado pelas colunas da matriz
(2n n)
_
0
I
n
_
Matrizes Hamiltonianas para as quais A
(H) e A
p
sao complementares
recebem um nome especial domnio de Riccati por apresentarem propri-
edades interessantes. Para entender estas propriedades, seja X
uma matriz
(2nn) cujas colunas formam uma base para A
(H); podemos particiona-la

em
X
=
_
X
1
X
2
_
(A.3)
onde X
1
e X
2
sao matrizes (n n). Se A
(H) e A
p
forem complementares,
entao a matriz X
1
da parti cao acima sera inversvel e poderemos considerar
o produto X
2
X
1
1
= X. Seja agora
K
=
_
K
1
K
2
_
outra matriz cujas colunas formam uma base para A
(H). Continuando
a supor complementaridade entre A
(H) e A
p
temos que K
1
e inversvel.
Mostraremos agora a rela cao entre K = K
2
K
1
1
e X = X
2
X
1
1
. Considere a
matriz
_
X
1
K
1
X
2
K
2
_
cujo posto e n; aplicando a identidade de Sylvester obtemos
_
X
1
K
1
X
2
K
2
_
=
_
X
1
0
X
2
I
_ _
I X
1
1
K
1
0 K
2
X
2
X
1
1
K
1
_
Como o primeiro fator do segundo membro e inversvel podemos escrever
_
I X
1
1
K
1
0 K
2
X
2
X
1
1
K
1
_
=
_
X
1
0
X
2
I
_
1
_
X
1
K
1
X
2
K
2
_
donde concluimos que o posto da matriz do lado esquerdo deve ser n.
Mas isto implica em K
2
X
2
X
1
1
K
1
= 0 ou seja, K
2
= X
2
X
1
1
K
1
ou,
AP
ATICAS 98
nalmente, K = K
2
K
1
1
= X
2
X
1
1
= X. O signicado disto e que a matriz
X obtida pelo procedimento acima independe da particular base escolhida
para A
(H), sendo determinada unicamente por H.

Denicao A.9.2 O conjunto de todas as matrizes Hamiltonianas com au-
tovalores fora do eixo imaginario e para as quais A
(H) A
p
= IR
2n
recebe
o nome de Domnio de Riccati, simbolizado por 1:
1 =
_
H 1 [ (H) jw = e A
(H) A
p
= IR
2n
_
Como demonstramos acima, a cada elemento H 1 podemos associar
uma unica matriz X (n n), que passaremos a designar por Ric(H), dada
por
X = Ric(H) = X
2
X
1
1
(A.4)
onde X
2
e X
1
sao obtidas a partir de uma base para A
(H) como indicado

na equa cao A.3. Usando uma linguagem mais formal poderamos denir uma
funcao, denominada Ric, entre 1 e o conjunto IR
nn
de todas as matrizes
quadradas reais n n:
Ric : 1 IR
nn
H Ric(H) = X
2
X
1
1
= X
Desta maneira se justica o nome domnio de Riccati para o conjunto 1,
e muitas vezes usamos o smbolo dom(Ric) para designa-lo.
Exemplo A.9.3 Considere novamente as matrizes dos exemplos anteriores.
Para o primeiro caso seria simples vericar que A
A
p
= 0, donde H
1
1.
E mais:
Ric (H
1
) = X
2
=
_
2 1
1 2
_
porque X
1
= I. Por ter autovalores no eixo imaginario, H
2
, 1. Para H
3
deixamos as conclusoes aos leitores.
Dada a importancia do domnio de Riccati, haveria interesse em esta-
belecer condi coes para que uma matriz Hamiltoniana H perten ca a 1 =
dom(Ric), sem o calculo de uma base para A
(H). Isto pode ser feito pela

Propriedade A.9.3 Se H 1 nao tem autovalores no eixo imaginario, S
e positiva semidenida ou negativa semidenida e < A, S > e estabilizavel
entao H dom(Ric)
O pr oximo resultado explicita importantes propriedades de X = X
2
X
1
1
.
AP
ATICAS 99
Propriedade A.9.4 Se H dom(Ric) e X = Ric(H), entao
a.) X e simetrica
b.) A + SX e estavel
c.) X e solu cao da equa cao de Riccati matricial algebrica
A
T
X + XA + XSX T = 0
Este resultado estabelece uma conexao entre as matrizes Hamiltonianas e
a equa cao de Riccati, de capital importancia na solucao de problemas lineares
quadr aticos, como se ver a em breve.
Demonstracao: Como H pertence ao domnio de Riccati 1, por hip o-
tese, temos dimA
(H) = n e A
(H) A
p
= IR
2n
. Escolhendo uma base
para A
(H) como em A.3 teremos X

1
inversvel e X = X
2
X
1
1
. Podemos
construir uma matriz (2n 2n) inversvel justapondo bases para A
(H) e
A
p
:
Q =
_
X
1
0
X
2
I
_
Uma transformacao de coordenadas conduz a uma matriz equivalente que
pode ser particionada em blocos (n n):
Q
1
HQ =
_
H
11
H
12
H
21
H
22
_
(A.5)
Como o subespaco A
(H) e invariante sob H temos HA
(H) A
(H)
e a matriz acima apresenta importantes particularidades estruturais: o bloco
superior esquerdo representa o mapa induzido por H em A
(H), e o bloco
inferior esquerdo e nulo. Ou seja, H
21
= 0 e os autovalores de H
11
estao em
C
. Isto mostra que os n autovalores estaveis de H sao os autovalores de

H
11
, que concentra assim toda a dinamica estavel de H. Usando a deni cao
de Q podemos explicitar os blocos H
ij
:
Q
1
HQ =
_
H
11
H
12
H
21
H
22
_
=
_
X
1
1
0
X I
_ _
A S
T A
T
_ _
X
1
0
X
2
I
_
(A.6)
Efetuando as multiplica coes chegamos a
H
11
= X
1
1
AX
1
+ X
1
1
SX
2
(A.7)
H
12
= X
1
1
S (A.8)
H
21
= XAX
1
+ TX
1
XSX
2
A
T
X
2
(A.9)
H
22
= XS A
T
(A.10)
AP
ATICAS 100
Lembrando que X
2
= XX
1
a equa cao A.7 acima mostra que A + SX e
equivalente a H
11
, sendo portanto estavel. A equa cao A.9 ca
H
21
= XAX
1
+ TX
1
XSX
2
A
T
X
2
= XAX
1
+ TX
1
XSXX
1
A
T
XX
1
= (XA + T XSX A
T
X)X
1
Mas X
1
e inversvel, e H
21
= 0, donde segue que
A
T
X + XA + XSX = T
o que mostra claramente a validade do item (c). A simetria de X cara para
os leitores. Q.E.D
Para terminar veremos as caratersticas adicionais advindas de estruturas
particulares de T e de S:
Propriedade A.9.5 Se H 1 e da forma
_
A BB
T
C
T
C A
T
_
com < A, B > estabilizavel e < C, A > detetavel, entao
a.) H dom(Ric)
b.) X = Ric(H) 0
c.) ker(X) J = subespaco inobservavel de < C, A >
Uma consequencia desta propriedade e que ker(X) J ker(C), donde
a equa cao XM = C
T
sempre admite solucao para M. Outra consequencia:
quando < C, A > e observavel teremos J = 0, logo ker(X) = 0 e X > 0.
A.10 Referencias
O material deste captulo pode ser considerado classico, e e encontr avel em
um grande n umero de textos e artigos, como por exemplo [7], [3], [5], [8], e
[2]. Muitos outros ha, mas estes foram os mais consultados.
Apendice B
Analise no IR
n
B.1 Funcao Real de variavel vetorial
ou funcao real de v arias variaveis reais:
f : IR
n
IR
x IR
n
y = f(x) IR
Quando n = 1 temos o conhecido caso escalar, ou seja, funcoes reais de
uma unica variavel real:
f : IR IR
x IR y = f(x) IR
Exemplo B.1.1 f(x) = x
2
+ 2x e
x
, para x IR
f(x
1
, x
2
) = x
1
x
2
para x
1
, x
2
IR
f(x
1
, x
2
, x
3
) = x
3
1
+ 3x
1
x
2
x
3
+ x
3
2
+
_
(x
3
) para x
1
, x
2
, x
3
IR
Quando n = 1 a funcao pode ser visualizada por meio dos gr acos tra-
dicionais; quando n = 2 a funcao f se associa a superfcies do IR
3
. Para
dimens oes maiores a visualizacao ca prejudicada. No caso de n = 2 o uso
das curvas de nvel permite a analise no plano de uma superfcie espacial e
facilita as coisas.
Curva de nvel =
_
x IR
2
[ f(x) = c = cte.
_
Exemplo B.1.2 f(x
1
, x
2
) = x
1
x
2
f(x
1
, x
2
) = x
2
1
+ x
2
2
101
AP
ENDICE B. AN
ALISE NO IR
N
102
B.2 Continuidade e Derivadas
A funcao real de variavel vetorial f e contnua no ponto x
0
quando
lim
xx
0
f(x) = f(x
0
)
ou entao, sem usar limites, quando
> 0 > 0 [ se |x x
0
| < entao [f(x) f(x
0
)[ <
Em outras palavras, e possvel chegar arbitrariamente pr oximo de f(x
0
)
desde que cheguemos sucientemente perto de x
0
B.3 Derivada: caso escalar
Dada a funcao
f : IR IR
x IR y = f(x) IR
chamaremos de primeira derivada, ou derivada primeira, ou gradiente
de f no ponto x
0
IR ao limite
lim
h0
f(x
0
+ h) f(x
0
)
h
Esta derivada e usualmente designada pelos smbolos
f
(x
0
) ou f
(1)
(x
0
) ou
df
dx
x
0
e e o valor numerico do coeciente angular da reta tangente ao gr aco de f
no ponto (x
0
, f(x
0
)).
Denicao B.3.1 Dizemos que f e diferenciavel em x
0
se f
(x
0
) existe
Quando f e diferenciavel em um intervalo, ou seja, quando
f
(x
0
) x
0
I IR
podemos falar na fun cao derivada:
f
: I IR
x IR y = f
(x) IR
Exemplo B.3.1 Seja f denida por f(x) = x
2
lim
h0
f(x + h) f(x)
h
= lim
h0
x
2
+ 2xh + h
2
x
2
h
= lim
h0
2xh + h
2
h
= 2x
Quando f
e diferenciavel em um intervalo podemos falar na funcao deri-

vada segunda, f
e da por diante.
AP
ENDICE B. AN
ALISE NO IR
N
103
B.3.1 Derivadas laterais
B.4 Derivada: caso vetorial
Dada a funcao
f : IR
n
IR
x IR
n
y = f(x) IR
chamaremos de primeira derivada parcial de f com rela cao a x
i
no ponto
x
0
IR
n
ao limite
lim
h0
f(x
0
1
, x
0
2
, . . . x
0
i
+ h, . . . x
0
n
) f(x
0
)
h
Esta derivada e usualmente designada pelos smbolos
f
x
i
(x
0
) ou
f
x
i
x
0
Denicao B.4.1 Dizemos que f e diferenciavel em x
0
quando
f
x
i
x
0
existe i = 1, 2, . . . n
Quando f e diferenciavel em um intervalo, as derivadas parciais
f
x
1
,
f
x
2
, . . .
f
x
n
podem ser consideradas funcoes de x.
O gradiente da funcao f no ponto x IR
n
e o vetor dado por
_
_
f
x
1
f
x
2
.
.
.
f
xn
_
_
= g(x) = f(x) IR
n
Exemplo B.4.1 Seja f denida por f(x) = f(x
1
, x
2
) = x
1
x
2
f(x) =
_
x
2
x
1
_
AP
ENDICE B. AN
ALISE NO IR
N
104
Denicao B.4.2 uma fun cao e linear quando
f(x) = c
T
x + b
onde c, b IR
n
.
O gradiente de uma funcao linear e dado trivialmente por f(x) = c.
Exemplo B.4.2 A fun cao f(x) = max[x
1
[, [x
2
[ tem problemas nos can-
tos.
B.5 Derivadas de ordem superior
Quando as derivadas parciais (f)/(x
1
) sao diferenciaveis podemos deriva-
las novamente:
x
j
_
f
x
i
_
=

2
f
x
i
x
j
A matriz nn cujo elemento (i, j) e dado pela expressao acima e chamada
de Hessiana de f:
_
2
f
x
2
1
. . . . . .

2
f
x
1
xn
.
.
.
.
.
.
2
f
x
2
n
_
_
=
2
f(x) = G(x)
As matrizes Hessianas sao sempre simetricas.
Exemplo B.5.1 A fun cao quadratica f(x) =
1
2
x
T
Ax + b
T
x + c pode ser
derivada:
f(x) = Ax + b, e
2
f(x) = A
Uma funcao e suave ou bem comportada quando e contnua e suas
derivadas tambem o sao. Nao existem cantos ou quebras abruptas de
curvatura. Diz-se que uma funcao e de classe C
k
se suas k primeiras derivadas
sao contnuas:
C
k
=
_
f [ f, f
(1)
, . . . f
(k)
sao contnuas
_
AP
ENDICE B. AN
ALISE NO IR
N
105
B.6 Func oes Vetoriais de Variaveis Vetoriais
Dada a funcao
f : IR
n
IR
m
x IR
n
y = f(x) IR
m
chamaremos de Jacobiana de f a matriz mn de suas derivadas parciais.
O elemento (i, j) da Jacobiana e
f
i
x
j
B.7 Pontos Estacionarios e Extremos
Dizemos que x
e
IR
n
e um ponto estacionario da funcao f quando o
gradiente se anula:
f(x
e
) = 0
Dizemos que x
IR
n
e um ponto de mnimo local forte da funcao f
quando existe > 0 tal que
1. f(x) e denida x tal que |x x
| <
2. f(x) < f(x
) x ,= x
tal que |x x
| <
Dizemos que x
IR
n
e um ponto de mnimo local fraco da funcao f
quando existe > 0 tal que
1. f(x) e denida x tal que |x x
| <
2. f(x) f(x
) x ,= x
tal que |x x
| <
3. x
nao e um mnimo local forte

Dizemos que x
IR
n
e um ponto de mnimo global da funcao f
quando . . .
B.8 Otimizacao
Em uma rela cao de causa e efeito, estamos sempre interessados em descobrir
efeitos nobres ou especiais: quem os causa? como sao caracterizados? Este
e um problema pr atico muito comum. Para os seres humanos, os efeitos
nobres ou especiais sao, em geral, os efeitos extremos: procura-se sempre
efeitos m aximos ou mnimos. Como em termos matem aticos as rela coes de
causa e efeito sao descritas por funcoes, percebe-se a enorme import ancia do
problema de se otimizar funcoes, ou seja, de se encontrar os seus extremos.
AP
ENDICE B. AN
ALISE NO IR
N
106
B.9 PGO Problema Geral de Otimizacao
Desejamos minimizar uma funcao real de variavel vetorial, sendo que a
variavel independente x IR
n
esta sujeita a determinadas restri coes, ou
seja, deve pertencer a determinadas regi oes do IR
n
. Este problema, tambem
chamado de Problema de Minimizacao Nao Linear Com Restricoes,
pode ser formulado como
minimizarf(x)
x IR
n
s.a.
c
i
(x) = 0 i = 1, 2, . . . k
c
i
(x) 0 i = k + 1, . . . m
A funcao f(x) que se deseja minimizar e chamada de funcao objetivo.
As k primeiras restri coes sao as restricoes de igualdade, e as outras, ob-
viamente, sao as de desigualdade.
Quando o extremo procurado e um m aximo, ou em outras palavras,
quando se deseja maximizar uma funcao h(x), a mesma estrutura acima
pode ser usada, desde que se use como funcao objetivo f(x) = h(x).
B.10 Pontos Viaveis
Sao os pontos que satisfazem as restri coes. A Regiao Viavel, RV, e o
conjunto destes pontos:
RV = v IR
n
[ c
i
(v) = 0i = 1, 2, . . . kec
j
(v) 0j = k + 1, . . . m
Exemplo B.10.1 Queremos minimizar f(x
1
, x
2
) = x
2
1
x
2
com as restricoes
_
x
1
+ x
2
= 0
x
2
1
+ x
2
2
0
B.11 Solu cao do PGO
Quando nao existem restri coes, os mnimos globais ou locais de f sao as
solucoes procuradas, mas quando as restri coes estao presentes os extremos
da funcao objetivo podem nao ser as solucoes do PGO.
AP
ENDICE B. AN
ALISE NO IR
N
107
A gura acima ilustra a situa cao. Torna-se necessario denir o que seriam
as solucoes do PGO em seu caso mais geral, com restri coes.
Denicao B.11.1 O ponto x
IR
n
e uma Solucao Local Forte do PGO
quando existir um real > 0 tal que
_
_
f(x) e denida x RV tal que |x x
| <
f(x) < f(x
)x RV, x ,= x
tal que |x x
| <
Ainda podem existir solucoes fracas:
Denicao B.11.2 O ponto x
IR
n
e uma Solucao Local Fraca do PGO
quando existir um real > 0 tal que
_
_
f(x) e denida x RV tal que |x x
| <
f(x) f(x
)x RV, x ,= x
tal que |x x
| <
x
nao e uma solu cao local forte

A busca de solucoes do PGO baseada apenas nas deni coes acima pode ser
impratic avel, a menos de casos muito especiais com Regi oes Vi aveis pequenas.
Precisamos de mais teoria. Esta teoria passa a ser apresentada agora, a
partir dos casos mais simples. De um modo geral ela se aplica quando as
funcoes objetivo e as restri coes sao sucientemente suaves. Entenderemos
que uma funcao e sucientemente suave quando for diferenci avel pelo menos
duas vezes.
B.12 Caso Escalar sem Restri c oes
O Problema Geral de Otimiza cao e particularizado para
minimizarf(x)
x IR
ou seja, nao existem restri coes e assim as solucoes serao os mnimos normais
da funcao escalar f.
Teorema B.12.1 Condicoes Necessarias de Otimalidade
Supondo f sucientemente suave e sendo x
IR um mnimo local de f
entao
AP
ENDICE B. AN
ALISE NO IR
N
108
1. f
(x
) = 0
2. f
(x
) 0
Este teorema diz que os mnimos locais de uma funcao sao pontos es-
tacionarios dela, e alem disso a derivada segunda e nao negativa neles. Se
procuramos as solucoes do PGO, este resultado restringe o universo da busca
aos pontos estacion arios com segundas derivadas nao negativas. Para efeti-
vamente garantir pontos deste universo solucionam o PGO precisamos de
outro resultado:
Teorema B.12.2 Condicoes Sucientes de Otimalidade
Supondo f sucientemente suave, seja x
IR tal que
1. f
(x
) = 0
2. f
(x
) > 0
Entao x
sera um mnimo local forte de f.

Usando primeiramente as CNO (condicoes necessarias de otimalidade) e
depois as CSO (condicoes sucientes de otimalidade) temos uma maneira
formal e correta de encontrar os mnimos de uma dada f. As demonstracoes
destes resultados podem ser feitas com o auxlio da expansao de f em serie
de Taylor, e serao omitidas. Sao estes os teormas que legitimam a conhecida
associacao entre mnimos e derivar e igualar a zero.
Quando f nao e sucientemente suave . . .
B.13 Caso Vetorial sem Restri c oes
O Problema Geral de Otimiza cao ca
minimizarf(x)
x IR
n
e os resultados basicos sao
IR
n
um mnimo local de f
entao
1. f(x
) = g(x
) = 0
2.
2
f(x
) = G(x
) 0
AP
ENDICE B. AN
ALISE NO IR
N
109
Mais uma vez os mnimos locais sao pontos estacion arios de uma funcao,
onde a derivada segunda e nao negativa. Como antes, as CNO restringem o
universo da busca de solucoes, mas para garantir que pontos deste universo
reduzido realmente solucionam o PGO precisamos das CSO:
IR
n
tal que
1. f(x
) = 0
2.
2
f(x
) > 0
Entao x
sera um mnimo local forte de f.

Exemplo B.13.1 Sendo f(x) = x
3
teremos f
(x) = 3x
2
e f
(x) = 6x, o
que garante que x
= 0 e um ponto estacionario onde f
(x
) 0, ou seja,
satisfaz as CNO. Mas as CSO nao sao satisfeitas e este nao e um mnimo
de f, mas um ponto de inexao.
Seja agora f(x
1
, x
2
) = x
1
x
2
.

E facil calcular
f
x
1
= x
2
;

2
f
x
2
1
= 0;

2
f
x
1
x
2
= 1
f
x
2
= x
1
;

2
f
x
2
2
= 0;

2
f
x
2
x
1
= 1
donde tiramos
f(x) = g(x
1
, x
2
) =
_
x
2
x
1
_
e
2
f(x) = G(x
1
, x
2
) =
_
0 1
1 0
_
O ponto x
= [0 0]
T
e estacionario, pois anula o gradiente, mas a Hessi-
ana G(x
) e indenida. Trata-se de um ponto de sela.

B.14 Func oes Quadraticas
A funcao real de variavel vetorial q e chamada de quadr atica quando
q(x) =
1
2
x
T
Ax + b
T
x
onde x, b IR
n
e A e uma matriz simetrica n n.
Propriedade 1: O gradiente de uma funcao quadr atica e dado por:
q(x) = Ax + b
AP
ENDICE B. AN
ALISE NO IR
N
110
Propriedade 2: A Hessiana de uma funcao quadr atica e dada por:
2
q(x) = A
Propriedade 3: Saindo de um ponto segundo uma dire cao. Sendo x, p
IR
n
e IR
q(x + p) = q(x) + p
T
(Ax + b) +
1
2
2
p
T
Ap
Propriedade 4: Os pontos estacion arios de uma funcao quadr atica sao:
q(x) = 0 Ax = b
A demonstracao da validade destas propriedades sera omitida. A partir
da ultima delas percebemos que quando a equa cao Ax = b nao admitir
solucoes a funcao nao tem pontos estacion arios nem mnimos, sendo portanto
ilimitada.
Propriedade 5: Comportamento de uma funcao quadr atica perto de um
ponto estacion ario. Seja um ponto x
tal que Ax
= b:
q(x
+ p) = q(x
) +
1
2
2
p
T
Ap
Vemos que o comportamento de uma funcao quadr atica nas vizinhancas
de um ponto estcion ario depende apenas da Hessiana A =
2
q(x). Como
A e simetrica seus autovalores sao reais, e os autovetores associados formam
uma base ortonormal. Vamos supor que samos de um ponto estacion ario
x
ao longo de uma dire cao dada pelo i-esimo autovetor de A: Usando a

propriedade 5 com p = v
i
temos
q(x
+ v
i
) = q(x
) +
1
2
i
v
T
i
v
i
= q(x
) +
1
2
i
donde vemos que
i
> 0 entao q e crescente com
i
< 0 entao q e decrescente com
i
= 0 entao q e constante e linear: q(x) = b
T
x
AP
ENDICE B. AN
ALISE NO IR
N
111
Propriedade 6: Comportamento de uma funcao quadr atica com Hessiana
positiva denida. Supondo
i
(A) > 0 i = 1, 2, . . . n o ponto esta-
cionario x
e o unico mnimo global da funcao.

Exemplo B.14.1 Seja a fun cao quadratica
q(x) =
1
2
x
T
_
5 3
3 2
_
x + [5, 5 3, 5]x
Como a Hessiana A e inversvel o ponto estacionario e dado trivialmente
por
x
= A
1
b =
_
0, 5
1, 0
_
Os autovalores e autovetores de A sao
1
= 6, 85 v
1
=
_
0, 85
0, 53
_

2
= 0, 15 v
2
=
_
0, 53
0, 85
_
A fun cao tem um mnimo global em x
e suas curvas de nvel sao elipses

cujos eixos principais sao os autovetores da Hessiana.
positiva semidenida. Supondo
i
(A) 0 i = 1, 2, . . . n o ponto
estacion ario x
, se existir, e um mnimo local fraco da funcao.

q(x) =
1
2
x
T
_
4 2
2 1
_
x + [4 2]x
A Hessiana A nao e inversvel, e a equa cao Ax
= b admite innitas
solu coes dadas por
x
=
_
0
2
_
+
_
1
2
_
Cada um dos pontos desta reta no IR
2
e um mnimo local fraco. Esta
reta e tambem a direcao dos autovetores associados ao autovalor
1
= 0. Ao
outro autovalor,
2
= 5, associa-se a direcao [2 1]
T
. A superfcie de q e do
tipo calha.
AP
ENDICE B. AN
ALISE NO IR
N
112
indenida. Supondo autovalores maiores, menores ou iguais a 0, o
ponto estacion ario x
e ponto de sela.
q(x) =
1
2
x
T
_
3 1
1 8
_
x + [0, 5 8, 5]x
Como a Hessiana A e inversvel o ponto estacionario e dado trivialmente
por
x
= A
1
b =
_
0, 5
1, 0
_
Os autovalores e autovetores de A sao
1
= 3, 09 v
1
=
_
1, 0
0, 1
_

2
= 8, 09 v
2
=
_
0, 1
1, 0
_
As curvas de nvel sao hiperboles cujos eixos principais estao associados
aos autovetores da Hessiana.
B.15 Restri c oes Lineares
Consideremos novamente o Problema Geral de Otimiza cao:
minimizarf(x)
x IR
n
s.a.
c
i
(x) = 0 i = 1, 2, . . . k
c
i
(x) 0 i = k + 1, . . . m
Quando as restri coes c
i
(x) sao funcoes lineares temos c
i
(x) = a
T
i
(x) +
i
,
onde a
i
IR
n
e
i
IR. As restri coes de igualdade cam
a
T
i
(x) +
i
= 0 a
T
i
(x) =
i
= b
i
e as de desiguldade:
a
T
i
(x) +
i
0 a
T
i
(x)
i
= b
i
AP
ENDICE B. AN
ALISE NO IR
N
113
B.16 PGO com Restri c oes Lineares de Igual-
dade
Temos o seguinte problema, abreviadamente chamado de PGORLI ou apenas
ORLI ou RLI:
minimizarf(x)
x IR
n
s.a.
Ax =

b
onde

A e uma matriz m n cujas linhas sao as restri coes a
T
i
e

b IR
m
tem como elementos os b
i
=
i
. Lembrando que x
e uma solucao do RLI

quando:
1. e viavel, ou seja,

Ax
=

b, e
2. f(x
) f(x) para qualquer vizinho viavel x de x
.
percebemos a necessidade de um estudo inicial da regi cao viavel RV.

E sim-
ples escrever
RV =
_
v IR
n
[

Av =

b
_
Dado um ponto viavel v RV, considere o problema de encontrar uma
dire cao ou vetor p tal que v+p RV. Em outras palavras, queremos condi coes
para partir de e permanecer em RV.

E facil deduzir que
v + p RV

Ap = 0
Direcoes p tais que

Ap = 0 sao chamadas de direcoes viaveis e sao as
dire coes que permitem que um movimento permaneca em RV.
Exemplo B.16.1 Seja um problema de minimizacao com uma restricao de
igualdade c(x
1
, x
2
) = x
1
+ x
2
= 1. A RV e a reta do IR
2
cujos pontos sao
[ 1 ]
T
. Uma vez sobre esta reta, as direcoes viaveis sao dadas por
x
2
= x
1
.
O conjunto de todas as dire coes viaveis e dado pelo espaco nulo ou n ucleo
de

A:
: = ker

A =
_
p IR
n
[

Ap = 0
_
AP
ENDICE B. AN
ALISE NO IR
N
114
Este conjunto e um subespaco vetorial do IR
n
, cuja dimens ao supomos
ser t (note que a RV pode nao ter uma estrutura de subespaco). Sendo Z
uma matriz t n cujas colunas formam uma base para : podemos exprimir
de maneira geral uma dire cao viavel qualquer
p = Zp
z
, onde p
z
IR
n
Supondo que x
e uma solucao para o RLI, vamos calcular o valor da

funcao objetivo em um vizinho viavel. Para isto usaremos Taylor:
f(x
+ p) = f(x
) + p
T
f(x
) +
1
2
2
p
T
2
f(x
)p +
= f(x
) + p
T
z
Z
T
g(x
) +
1
2
2
p
T
z
Z
T
G(x
)Zp
z
+
Considerando valores pequenos de poderamos estabelecer
IR
n
uma solu cao local do
RLI, entao
1.

Ax
=

b
2. Z
T
g(x
) = 0
3. Z
T
G(x
)Z 0
A primeira das condi coes acima, bastante obvia, diz que as solucoes devem
ser viaveis. A condi cao seguinte e a condi cao do gradiente, ou de primeira
ordem. A grandeza Z
T
g(x) e chamada de gradiente projetado de f em
x. Pontos nos quais o gradiente projetado se anula sao chamados de pontos
estacionarios com restricoes. Tambem neste caso com restri coes ha um
gradiente que deve se anular. Raciocinemos. A matriz Z, por deni cao, e tal
que

AZ = 0 ou, equivalentemente, Z
T

A
T
= 0. Como o gradiente projetado
se anula na solucao, devemos ter Z
T
g(x
) = 0 o que garante que o gradiente

simples g(x
) e uma combinacao linear das colunas de

A
T
:
Z
T
g(x
) = 0 =

A
T
_
2
.
.
.
m
_
_
Os coecientes
i
sao os multiplicadores de Lagrange. Estes multi-
plicadores permitem a formulacao do resultado acima de maneira diferente:
AP
ENDICE B. AN
ALISE NO IR
N
115
IR
n
RLI, entao
1.

Ax
=

b
2.
IR
m
[ g(x
) =

A
T
3. Z
T
G(x
)Z 0
A terceira das condi coes do teorema e a condi cao de segunda ordem, ou
condi cao da Hessiana. A grandeza Z
T
G(x
)Z e a Hessiana projetada. Assim

como antes, as condi coes necessarias permitem delimitar a busca de solucoes
aos pontos que as satisfazem. Para garantir que um deste pontas seja mesmo
solucao do RLI precisamos do
IR
n
tal que
1.

Ax
=

b
2. Z
T
g(x
) = 0 ou, equivalentemente,
IR
m
[ g(x
) =

A
T
3. Z
T
G(x
)Z > 0
Entao x
sera uma solu cao local do RLI.

Exemplo B.16.2 Considere o RLI com
_
_
f(x) =
1
2
x
T
_
5 3
3 2
_
x + [5, 5 3, 5]x
s.a. : ax = [1 1]x = 1
Conforme visto anteriormente, a fun cao objetivo f tem um mnimo global
em x
= [0, 5 1, 0]
T
e suas curvas de nvel sao elipses cujos eixos principais
sao os autovetores da Hessiana. Dada a encontraramos Z
T
= [1 1]; os
gradientes normal e projetado sao
g(x) =
_
5 3
3 2
_
x +
1
2
_
11
7
_
e Z
T
g(x) = [2 1]x + 2
Lembrando que a restricao e o gradiente projetado devem se anular no
ponto estacionario chegamos a
AP
ENDICE B. AN
ALISE NO IR
N
116
_
(1 1)x = 1
(2 1)x = 2
ou
_
1 1
2 1
_
x =
_
1
2
_
cuja unica solu cao e [3 4]
T
. Aplicando as CSO neste candidato (basta apli-
car a terceira delas, porque as outras automaticamente se vericam) temos
Z
T
G(x
)Z = [1 1]
_
5 3
3 2
_ _
1
1
_
= 1 > 0
donde se conclui que o ponto estacionario encontrado e uma solu cao local.
Seja agora o RLI com
_
_
f(x) =
1
2
x
T
_
4 2
2 1
_
x [4 2]x
s.a. : ax = [1 1]x = 0
A fun cao objetivo f e representada por uma superfcie tipo calha e tem
seus mnimos locais na reta dada por
x
=
_
0
2
_
+
_
1
2
_
A matriz Z e os gradientes normal e projetado sao
Z =
_
1
1
_
; g(x) =
_
4 2
2 1
_
x
_
4
2
_
e Z
T
g(x) = [6 3]x 6
_
(1 1)x = 0
(6 3)x = 6
ou
_
1 1
6 3
_
x =
_
0
6
_
cuja unica solu cao e [2/3 2/3]
T
. Aplicando as CSO neste candidato (basta
aplicar a terceira delas, porque as outras automaticamente se vericam) te-
mos
Z
T
G(x
)Z = [1 1]
_
4 2
2 1
_ _
1
1
_
= 9 > 0
donde se conclui que o ponto estacionario encontrado e uma solu cao local.
Seja agora o RLI com
AP
ENDICE B. AN
ALISE NO IR
N
117
_
_
f(x) =
1
2
x
T
_
3 1
1 8
_
x +
1
2
[1 17]x
s.a. : ax = [1 1]x = 1/2
A fun cao objetivo f e caracterizada por um ponto de sela e nao admite
mnimos ou maximos. A matriz Z e os gradientes normal e projetado sao
Z =
_
1
1
_
; g(x) =
_
3 1
1 8
_
x+
1
2
_
1
17
_
e Z
T
g(x) = [2 9]x+8
_
(1 1)x = 1/2
(2 9)x = 8
ou
_
1 1
2 9
_
x =
_
1/2
8
_
cuja unica solu cao e [1/2 1]
T
, exatamente o ponto de sela anterior. Apli-
cando as CSO neste candidato (basta aplicar a terceira delas, porque as outras
automaticamente se vericam) temos
Z
T
G(x
)Z = [1 1]
_
3 1
1 8
_ _
1
1
_
= 7 < 0
Nao se pode concluir que este ponto seja uma solu cao do problema. Na
realidade ele soluciona o problema de se encontrar o maximo de f com as
restricoes dadas. Os leitores sao convidados a repetir estes calculos (desta
ultima f) para as seguintes restricoes:
1. [1 2]x = 3/2
2. [1 2]x = 3/2
3. [1 2]x = 0
B.17 PGO com Restri c oes Lineares de Desi-
gualdade
Temos o seguinte problema, abreviadamente chamado de PGORLD ou ape-
nas ORLD ou RLD:
AP
ENDICE B. AN
ALISE NO IR
N
118
minimizarf(x)
x IR
n
s.a.
Ax b
onde A e uma matriz m n cujas linhas sao as restri coes a
T
i
e b IR
m
tem
como elementos os b
i
.
B.17.1 Estudo da Regiao Viavel
.
.
.
IR
n
RLD, entao
1. Ax
b;

Ax
=

b
2.
IR
m
[ g(x
) =

A
T
3.
i
0, i = 1, 2, . . . m
4. Z
T
G(x
)Z 0
IR
n
tal que
1. Ax
b;

Ax
=

b
2.
IR
m
[ g(x
) =

A
T
3.
i
0, i = 1, 2, . . . m
4. Z
T
G(x
)Z > 0
Entao x
sera uma solu cao local do RLI.

AP
ENDICE B. AN
ALISE NO IR
N
119
B.18 Programacao Linear
B.19 PGO com Restri c oes Nao-Lineares de
Igualdade
Temos o seguinte problema, abreviadamente chamado de PGORNI ou apenas
ORNI ou RNI:
minimizarf(x)
x IR
n
s.a.
c
i
(x) = 0; i = 1, 2, . . . t
.
.
.
IR
n
RNI, entao
1.

C(x) = 0
2.
IR
m
[ g(x
) =

A
T
(x
3. Z
T
(x
)W(x
)Z(x
) 0
IR
n
tal que
1.

C(x) = 0
2.
IR
m
[ g(x
) =

A
T
(x
3. Z
T
(x
)W(x
)Z(x
) > 0
Entao x
sera uma solu cao local do RNI.

AP
ENDICE B. AN
ALISE NO IR
N
120
B.20 PGO com Restri c oes Nao-Lineares de
Desigualdade
Temos o seguinte problema, abreviadamente chamado de PGORND ou ape-
nas ORND ou RND:
minimizarf(x)
x IR
n
s.a.
c
i
(x) 0; i = 1, 2, . . . m
.
.
.
IR
n
RND, entao
1. C(x
) 0;

C(x) = 0
2.
IR
m
[ g(x
) =

A
T
(x
3.
i
0; i = 1, 2, . . . t
4. Z
T
(x
)W(x
)Z(x
) 0
IR
n
tal que
1. C(x
) 0;

C(x) = 0
2.
IR
m
[ g(x
) =

A
T
(x
3.
i
> 0; i = 1, 2, . . . t
4. Z
T
(x
)W(x
)Z(x
) > 0
Entao x
sera uma solu cao local do RNI.

AP
ENDICE B. AN
ALISE NO IR
N
121
B.21 Metodos Numericos
B.22 Caso Escalar: Obtencao de Razes
B.22.1 Metodo da Bisec cao
B.22.2 Metodo de Newton
B.22.3 Metodo da Secante
ou da interpolacao linear.
AP
ENDICE B. AN
ALISE NO IR
N
122
B.22.4 Metodo da Regula Falsa
B.22.5 Metodo de Interpolacoes Superiores
B.22.6 Metodo Geral dos Intervalos
B.22.7 Metodo Garantidos
B.23 Caso Escalar sem Restri c oes: Obtencao
de mnimos
B.23.1 Busca de Fibonacci
B.23.2 Busca

Aurea
B.23.3 Interpolacao Polinomial
B.23.4 Aproximacoes C ubicas
B.23.5 Metodos Garantidos
B.24 Caso Vetorial sem Restri c oes: Obten-
cao de mnimos
B.24.1 Metodos de Busca Direta
B.24.2 Algoritmo do Politopo
B.24.3 Algoritmo U
B.24.4 Metodos dp Gradiente e da Derivada Segunda
B.24.5 Metodo de Newton
B.24.6 Metodos da Decomposi cao Espectral
B.24.7 Metodos de Primeira Ordem
Newton discreto, Quase Newton.
AP
ENDICE B. AN
ALISE NO IR
N
123
B.24.8 Metodos Nao Derivativos
B.24.9 Problema dos Mnimos Quadrados
Gauss-Newton, Levenberg-Marquardt, Quase Newton.
B.25 Referencias
O material deste captulo pode ser considerado classico, e e encontr avel em
um grande n umero de textos e artigos, como por exemplo [7], [3], [5], [8], [2]
e [4]. Muitos outros ha, mas estes foram os mais consultados.
Referencias Bibliogracas
[1] M. Athans and P. L. Falb. Optimal Control. McGraw-Hill, New York,
1966.
[2] J. C. Doyle, K. Glover, P. P. Khargonekar, and B. A. Francis. State
space solutions to standard h
2
and h
control problems. IEEE Trans.

Automat. Contr., AC-34(8):831 847, august 1989.
[3] B. A. Francis. A Course in H
Theory Lecture Notes in Control and

Info. Sciences, Vol 88. Springer-Verlag, New York, 1987.
[4] Philip E. Gill, Walter Murray, and Margaret H. Wright. Practical Opti-
mization. Academic Press, London, 1981.
[5] V. Kucera. A contribution to matrix quadratic equations. IEEE Trans.
Automat. Contr., AC-17(3):344 347, 1972.
[6] H. Kwakernaak and R. Sivan. Linear Optimal Control Systems. Wiley
Interscience, New York, 1972.
[7] Strang. Linear Algebra and its Applications. 1980.
[8] W. M. Wonham. Linear Multivariable Control: a Geometric Approach.
Springer-Verlag, New York, 1979.
124

Controt LQR

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Controt LQR

Enviado por

Direitos autorais:

Formatos disponíveis

Controle Linear Quadratico

, encontrar u() de modo que e(t

. Para entender como, seja uma variavel p(t)

t. Obviamente isto signica que p(t) = 0 t. Temos

E bom manter sempre em mente esta diferenca. Vejamos o que se pode

E facil ver que z

Considerando como sada a posicao angular do pendulo com rela cao ` a

() satisfazem a equa cao basica do sistema, ou

(t) + B u(t) (2.2)

() para u(), ou seja: x(t

, mas a sua apli-

; e neste ponto precisamos de u

e um pouco trabalhosa, sera analisada

(t) e nao mais em funcao de

(t). Temos nal-

(t) por meio da equa cao (2.16):

. Vemos deste modo que e preciso enfrentar

() e lento e impreciso. Ja em uma situacao de controle barato, ou seja,

(t), visto na equa cao (2.19). Para o caso

(t) e quase constante.

(t), donde tiramos F

(t) em favor de P(t), mais simples e geral, vem

(t). A equa cao de Riccati tem esse nome por se tratar de

para o PRLO entao ela pode ser

(t) e a solucao minimizadora ou tal solucao nao existe. Neste

tal que J(u

(t) a solucao da ERM

(t) da ERM e simetrica:

(t) da ERM e positiva semidenida no inter-

(t) pode ser usada para calcular este ndice de desempenho

(t) acarretara um custo parcial otimo

(t) e solu cao da ERM:

(t) parametrizadas em fun cao do

(t) em fun cao do parametro r

(t) para diversos valores de r:

E o nosso conhecido de outros exemplos:

0, 19. Isto signica que se -

(t) = cte. Ja havamos chegado a esta

E facil perceber que a solu cao da ERM e trabalhosa e problematica. Sem-

E obvio que se x(t) 0 quando t entao z(t) 0 tambem. Mas

(t) e uma solucao positiva semidenida da ERM.

(t), mesmo quando t

(t). Para ilustrar isso seja um

E imediato vericar que lim

(t) convergia, quando t

e uma solucao positiva semidenida da ERMA e se pudermos

ja sabemos que a solucao da ERM sera constante:

(t) = cte. = solucao 0 da ERMA

(t) solucao da ERM

(t) solucao de regime da ERM

(t) da ERM tende a uma solu cao

(t) da ERM tende a uma solu cao de regime

e uma solu cao positiva semidenida da ERMA:

0, e solu cao da ERMA

(t) da ERM tende a uma solu cao de regime

e se o sistema e estabilizavel e detetavel entao P

e a unica solu cao PSD da ERMA

(t) da ERM tende a uma solu cao de regime

esta sera positiva denida se e somente se o sistema e comple-

= cte. > 0 < A, D > e observ avel

(t) tende a uma solucao constante quando t

seja uma solucao invariante no tempo para o PRLOHTI.

(t) da ERM tende a uma solu cao de regime