Escolar Documentos
Profissional Documentos
Cultura Documentos
Caso Determinstico
Notas de aula para
um curso de
Otimizacao e Controle
Otimo
COPPE-UFRJ
esbocado em 1985
refeito e impresso no 2.o semestre de 1988
revisto, ampliado e ilustrado em fevereiro-marco de 1989
revisto e enriquecido em ns de 1991
aperfeicoado ainda uma vez em outubro de 1996
analise no IR
n
e otimiza cao em outubro-novembro de 1997
revisto, reformatado e enriquecido em 10,11/1999
Sumario
1 Problemas Tpicos de Controle 1
1.1 Problema das condi coes terminais . . . . . . . . . . . . . . . . 2
1.2 Anulando z(t
f
): Problema do Regulador Terminal . . . . . . . 3
1.3 Comportamento Funcional em um Intervalo . . . . . . . . . . 4
1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Problema do Regulador Funcional . . . . . . . . . . . . . . . . 7
1.6 Regulador Linear
Otimo Determinstico . . . . . . . . . . . . . 8
1.7 Regulador Linear
Otimo Determinstico Fixo . . . . . . . . . . 9
1.8 Exerccios, ainda . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Solucao do Problema do Regulador 15
2.1 Solucao pelo Calculo das Variacoes . . . . . . . . . . . . . . . 16
2.2 Equacoes Variacionais . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1 Em resumo: . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 Busca de Caminhos Mais Simples . . . . . . . . . . . . . . . . 27
2.4 Equacao de Riccati Matricial . . . . . . . . . . . . . . . . . . . 29
2.5 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Horizonte de Tempo Innito 35
3.1 Discussao do Problema . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Solucao Para o PRLOHTI . . . . . . . . . . . . . . . . . . . . 36
3.2.1 Solucao da ERM quando t
f
. . . . . . . . . . . . 37
3.2.2 Pequena Generalizacao . . . . . . . . . . . . . . . . . . 38
3.3 Um Pouco de Teoria . . . . . . . . . . . . . . . . . . . . . . . 39
3.4 Solucao para o PRLOHTI . . . . . . . . . . . . . . . . . . . . 42
3.5 Algoritmo para Solucao do PRLOHTI . . . . . . . . . . . . . 42
3.6 Que Acontece se a Condicao Falha? . . . . . . . . . . . . . . . 44
3.7 Controlabilidade e Observabilidade . . . . . . . . . . . . . . . 44
3.8 Comentarios e Referencias . . . . . . . . . . . . . . . . . . . . 44
i
SUM
ARIO ii
4 Outros caminhos. . . 46
4.1 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5 Propriedades da Solucao do PRLOHTI 47
5.1 Retomando o pe . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.2 Encontrando a solucao da ERMA . . . . . . . . . . . . . . . . 48
5.3 Um caminho alternativo . . . . . . . . . . . . . . . . . . . . . 50
5.4 Que Acontece aos P olos? . . . . . . . . . . . . . . . . . . . . . 58
5.5 Resumo Teorico . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.6 Discussao dos Resultados . . . . . . . . . . . . . . . . . . . . . 63
5.6.1 Caso do Controle Barato, r pequeno. . . . . . . . . . . 63
5.6.2 Caso do Controle Caro, r . . . . . . . . . . . . . . 65
6 Projeto
Otimo de Observadores 66
6.1 Observadores Assintoticos de Estados . . . . . . . . . . . . . . 66
6.2 Problema do estimador aberto . . . . . . . . . . . . . . . . . . 69
6.3 O verdadeiro problema . . . . . . . . . . . . . . . . . . . . . . 71
6.4 Estimadores e Filtros . . . . . . . . . . . . . . . . . . . . . . . 75
6.5 Medias e correla coes de sinais . . . . . . . . . . . . . . . . . . 77
6.5.1 Valor medio de um sinal . . . . . . . . . . . . . . . . . 77
6.5.2 Valor medio quadr atico de um sinal . . . . . . . . . . . 77
6.5.3 Variancia de um sinal . . . . . . . . . . . . . . . . . . . 77
6.5.4 Autocorrela cao de um sinal . . . . . . . . . . . . . . . 77
6.5.5 Correlacao cruzada entre dois sinais . . . . . . . . . . . 77
6.5.6 Densidade espectral de um sinal . . . . . . . . . . . . . 77
6.6 Variaveis aleat orias . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.1 Probabilidades . . . . . . . . . . . . . . . . . . . . . . 77
6.6.2 Valor medio . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.3 Variancia . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.4 Covariancia entre x e y . . . . . . . . . . . . . . . . . . 77
6.6.5 Funcao distribui cao de probabilidade . . . . . . . . . . 77
6.6.6 Funcao densidade de probabilidade . . . . . . . . . . . 77
6.6.7 Media . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.6.8 Valor medio quadr atico . . . . . . . . . . . . . . . . . . 77
6.6.9 Variancia e covariancia . . . . . . . . . . . . . . . . . . 77
6.6.10 Distribuicao uniforme . . . . . . . . . . . . . . . . . . . 77
6.6.11 Distribuicao normal . . . . . . . . . . . . . . . . . . . . 77
6.7 Processos aleat orios ou estocasticos . . . . . . . . . . . . . . . 77
6.7.1 Rudo branco . . . . . . . . . . . . . . . . . . . . . . . 77
6.7.2 Processo gaussiano . . . . . . . . . . . . . . . . . . . . 77
6.7.3 Processo estocastico estacion ario . . . . . . . . . . . . 77
SUM
ARIO iii
6.7.4 Processo estocastico ergodico . . . . . . . . . . . . . . 77
6.7.5 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . 77
6.7.6 Matriz de autocorrela cao . . . . . . . . . . . . . . . . . 77
6.8 Formulacao e solucao . . . . . . . . . . . . . . . . . . . . . . 77
A Formas Quadraticas 80
A.1 Formas Lineares e Quadr aticas . . . . . . . . . . . . . . . . . . 80
A.2 Sinal da Forma . . . . . . . . . . . . . . . . . . . . . . . . . . 84
A.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
A.4 Criterios de deni cao . . . . . . . . . . . . . . . . . . . . . . . 86
A.5 Normas, Metricas e Tamanho . . . . . . . . . . . . . . . . . 87
A.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
A.7 Visao Geometrica das Formas Quadr aticas . . . . . . . . . . . 89
A.8 Miscel anea de Formulas . . . . . . . . . . . . . . . . . . . . . 90
A.9 Matrizes Hamiltonianas . . . . . . . . . . . . . . . . . . . . . 92
A.10 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
B Analise no IR
n
101
B.1 Funcao Real de variavel vetorial . . . . . . . . . . . . . . . . . 101
B.2 Continuidade e Derivadas . . . . . . . . . . . . . . . . . . . . 102
B.3 Derivada: caso escalar . . . . . . . . . . . . . . . . . . . . . . 102
B.3.1 Derivadas laterais . . . . . . . . . . . . . . . . . . . . . 103
B.4 Derivada: caso vetorial . . . . . . . . . . . . . . . . . . . . . . 103
B.5 Derivadas de ordem superior . . . . . . . . . . . . . . . . . . . 104
B.6 Funcoes Vetoriais de Variaveis Vetoriais . . . . . . . . . . . . . 105
B.7 Pontos Estacionarios e Extremos . . . . . . . . . . . . . . . . 105
B.8 Otimiza cao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
B.9 PGO Problema Geral de Otimiza cao . . . . . . . . . . . . . 106
B.10 Pontos Viaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
B.11 Solucao do PGO . . . . . . . . . . . . . . . . . . . . . . . . . 106
B.12 Caso Escalar sem Restri coes . . . . . . . . . . . . . . . . . . . 107
B.13 Caso Vetorial sem Restri coes . . . . . . . . . . . . . . . . . . . 108
B.14 Funcoes Quadr aticas . . . . . . . . . . . . . . . . . . . . . . . 109
B.15 Restri coes Lineares . . . . . . . . . . . . . . . . . . . . . . . . 112
B.16 PGO com Restri coes Lineares de Igualdade . . . . . . . . . . . 113
B.17 PGO com Restri coes Lineares de Desigualdade . . . . . . . . . 117
B.17.1 Estudo da Regi ao Viavel . . . . . . . . . . . . . . . . . 118
B.18 Programacao Linear . . . . . . . . . . . . . . . . . . . . . . . 119
B.19 PGO com Restri coes Nao-Lineares de Igualdade . . . . . . . . 119
B.20 PGO com Restri coes Nao-Lineares de Desigualdade . . . . . . 120
B.21 Metodos Numericos . . . . . . . . . . . . . . . . . . . . . . . . 121
SUM
ARIO iv
B.22 Caso Escalar: Obtencao de Razes . . . . . . . . . . . . . . . . 121
B.22.1 Metodo da Biseccao . . . . . . . . . . . . . . . . . . . 121
B.22.2 Metodo de Newton . . . . . . . . . . . . . . . . . . . . 121
B.22.3 Metodo da Secante . . . . . . . . . . . . . . . . . . . . 121
B.22.4 Metodo da Regula Falsa . . . . . . . . . . . . . . . . . 122
B.22.5 Metodo de Interpolacoes Superiores . . . . . . . . . . . 122
B.22.6 Metodo Geral dos Intervalos . . . . . . . . . . . . . . . 122
B.22.7 Metodo Garantidos . . . . . . . . . . . . . . . . . . . . 122
B.23 Caso Escalar sem Restri coes: Obtencao de mnimos . . . . . . 122
B.23.1 Busca de Fibonacci . . . . . . . . . . . . . . . . . . . . 122
B.23.2 Busca
Aurea . . . . . . . . . . . . . . . . . . . . . . . . 122
B.23.3 Interpolacao Polinomial . . . . . . . . . . . . . . . . . 122
B.23.4 Aproximacoes C ubicas . . . . . . . . . . . . . . . . . . 122
B.23.5 Metodos Garantidos . . . . . . . . . . . . . . . . . . . 122
B.24 Caso Vetorial sem Restri coes: Obtencao de mnimos . . . . . . 122
B.24.1 Metodos de Busca Direta . . . . . . . . . . . . . . . . . 122
B.24.2 Algoritmo do Politopo . . . . . . . . . . . . . . . . . . 122
B.24.3 Algoritmo U . . . . . . . . . . . . . . . . . . . . . . . . 122
B.24.4 Metodos dp Gradiente e da Derivada Segunda . . . . . 122
B.24.5 Metodo de Newton . . . . . . . . . . . . . . . . . . . . 122
B.24.6 Metodos da Decomposicao Espectral . . . . . . . . . . 122
B.24.7 Metodos de Primeira Ordem . . . . . . . . . . . . . . . 122
B.24.8 Metodos Nao Derivativos . . . . . . . . . . . . . . . . . 123
B.24.9 Problema dos Mnimos Quadrados . . . . . . . . . . . 123
B.25 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Captulo 1
Problemas Tpicos de Controle
Consideremos inicialmente o sistema linear variante no tempo o descrito
pelas seguintes equa coes dinamicas, v alidas t IR:
o
_
_
x(t) = A(t)x(t) + B(t)u(t); x(t
0
) = x
0
z(t) = D(t)x(t)
y(t) = C(t)x(t)
onde x(t) e um vetor de dimens ao n representando o estado do sistema no
instante t; u(t) e a entrada, no instante t, com dimens ao m; z() representa a
particular combinacao das variaveis de estado que queremos controlar, com
z(t) IR
p
simbolizando o valor de z() em t. Finalmente, y() representa a
combinacao das variaveis de estado que podemos medir efetivamente e que
deve ser usada para implementar a lei de controle; o vetor r-dimensional y(t)
tem o signicado usual, exprimindo o valor em t da grandeza y().
SISTEMA o
CONTROLADOR
_
u
_
z
'
y
_
Esta formulacao e bastante geral pois, alem de condiderarmos sadas de
duas naturezas diferentes, o modelo empregado e variante no tempo. Ap os
este incio mais geral, logo recairemos no caso linear e invariante no tempo.
1
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 2
1.1 Problema das condic oes terminais
Este primeiro problema pode ser formulado da seguinte maneira:
Para o sistema o acima, sendo especicado um instante de tempo
t
f
> t
0
e um vetor z
IR
p
, gostaramos de fazer com que z(t
f
)
se aproximasse o maximo possvel de z
.
Para uma formulacao alternativa deste problema, usando smbolos ma-
tem aticos, devemos denir um sinal de erro e(t) que deve ser minimizado:
sendo e(t) = z(t) z
_
x(t) = A(t)x(t) + B(t)u(t) x(t
0
) = x
0
p(t) = 0 p(t
0
) = z
z(t) = D(t)x(t)
y(t) = C(t)x(t)
Para apresentar estas equa coes de maneira mais condensada podemos
considerar o estado expandido
x
e
(t) =
_
x(t)
p(t)
_
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 3
que permitir a escrever
o
_
_
x
e
(t) = A
e
(t)x
e
(t) + B
e
(t)u(t); x
e
(t
0
) = x
0
e
e(t) = D
e
(t)x
e
(t)
y(t) = C
e
(t)x
e
(t)
onde as matrizes expandidas A
e
, etc. sao dadas por
A
e
=
_
A 0
0 0
_
, B
e
=
_
B
0
_
, x
0
e
=
_
x
0
z
_
D
e
= [ D I ] C
e
= [ C 0 ]
Vemos assim que o problema de aproximar a sada de um dado valor
sempre pode ser substitudo pelo problema de aproxima-la de zero, desde
que facamos as necessarias substituicoes. Entao, ao inves de estudar este
problema das condi coes terminais na forma descrita acima, passaremos a
estudar um problema mais geral:
1.2 Anulando z(t
f
): Problema do Regulador
Terminal
Para o sistema com o qual estamos trabalhando, abaixo reescrito para a
comodidade do leitor, queremos fazer com que z(t
f
) assuma o menor valor
possvel:
o
_
x(t) = A(t)x(t) + B(t)u(t); x(t
0
) = x
0
z(t) = D(t)x(t)
Evitamos o problema de minimizacao vetorial procedendo como anteri-
ormente: procurando u() |z(t
f
)| = z
T
(t
f
)z(t
f
) seja mnimo. Para tornar
mais geral, podemos usar uma forma quadr atica positiva denida. Deste
modo, sendo Q uma matriz (p p) positiva denida, o problema ca
Encontrar u() J = z
T
(t
f
)Qz(t
f
) seja mnimo.
Lembrando que z(t) = D(t)x(t) podemos exprimir J em termos do estado
e nao da sada:
J = x
T
(t
f
)D
T
(t
f
)QD(t
f
)x(t
f
) = x
T
(t
f
)Px(t
f
)
onde P = D
T
(t
f
)QD(t
f
) e uma matriz (n n) positiva semidenida (por
que, leitores? talvez seja bom revisitar a se cao A.6). A partir deste ponto
podemos chegar `a formulacao mais geral deste problema:
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 4
Encontrar u() J = x
T
(t
f
)Px(t
f
) seja mnimo, onde P 0.
E util notar que minimizar o estado terminal implica em minimizar a
sada terminal, mas a recproca nao e verdadeira, como mostra o
Exemplo 1.2.1 Para t
f
, sendo x(t) = [e
t
e
t
]
T
, e z(t) = [1 0]x(t),
vericamos que e impossvel minimizar x(t
f
), pois as trajetorias x() crescem
indenidamente, mas no entanto z(t
f
) = 0, pois z() tende `a origem, e menor
do que isto nao da!
0
e t
+
0
realizamos uma transferencia instantanea ate a
origem e depois l a mantemos o estado. Havendo controlabilidade ate isto e
possvel! Precisaramos entretanto de impulsos unitarios e suas derivadas na
entrada, e infelizmente isto e inviavel na pr atica.
1.4 Exerccios
1. Para o Sistema Linear Invariante no Tempo
.
x (t) = Ax(t) + Bu(t)
com rank(B) = m = n umero de colunas de B, seja x(0
) = x
0
. En-
contrar a entrada u que deve ser aplicada para que o estado seja ins-
tantaneamente transferido para a origem e l a permaneca: x(0
+
) = 0 e
x(t) = 0 t > 0
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 7
1.5 Problema do Regulador Funcional
Voltando ao problema anterior para um apanhado geral, e f acil ver que po-
demos associar o valor de J `as amplitudes da sada, e tambem ` a rapidez com
que ela se aproxima de zero.
_
t
'
t
0
t
f
O ndice J mede duas coisas: o comportamento da sada z em termos de
amplitudes e a rapidez com que este sinal se aproxima de zero:
J pequeno =
_
amplitudes pequenas t
aproximacao rapida de zero
Desta maneira, minimizar J e uma tarefa duplamente benvinda. Ha no
entanto alguns perigos pois, como ja deve ter dado para perceber, quando
J diminui as amplitudes de u aumentam. Isto mostra que este problema,
como formulado ate agora, nao tem grande sentido pr atico, e deve ser refor-
mulado. Alem de minimizar J gostaramos tambem que u() fosse pequeno.
Ao trabalho pois, com vontade. A nova ideia pode ser resumida:
encontrar u() J e mnimo e u(t) e pequeno t [t
0
t
f
]
ou entao, tornando o segundo quesito mais preciso:
encontrar u()
_
J e mnimo
_
t
f
t
0
u
T
(t)R(t)u(t) dt e mnimo
Minimizar duas coisas separadamente e a mesma coisa que minimizar a
sua soma, desde que estas coisas sejam positivas. Como este e precisamente o
nosso caso, podemos reformular este problema de uma maneira mais simples
e direta:
Encontrar u() tal que
J =
_
t
f
t
0
[z
T
(t)Q(t)z(t) + u
T
(t)R(t)u(t)] dt e mnimo
onde Q(t) > 0 t [t
0
t
f
] e R(t) > 0 t [t
0
t
f
]
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 8
Esta e uma maneira comoda e elegante de impor comportamento aceit avel
e rapidez de convergencia tanto para z() como para u(), e formulacoes deste
tipo ja apresentam aplicabilidade pr atica muito grande. Como nos outros
casos da para perceber que tambem aqui a controlabilidade tem muito a ver
com a existencia de solucao. Mais tarde veremos isso. Por ora, um outro
aspecto precisa ser encarado:
Suponhamos que para um dado sistema
o uma entrada u
I
acarreta sada z
I
e ndice J
I
. Para uma outra en-
trada u
II
teramos z
II
e J
II
.
Suponhamos ainda que
|z
I
(t
f
)| < |z
II
(t
f
)|
Pode perfeitamente ser
que J
II
< J
I
e no entanto
as condi coes terminais sao piores.
Como nada foi dito a esse respeito, escolheramos J
II
e pronto. Este arrazo-
ado nos leva de maneira natural a estabelecer o seguinte
_
t
'
t
0
t
f
I
II
Fato 1.5.1 Melhorar o comportamento funcional das variaveis z e u nao
implica necessariamente em melhorar tambem o comportamento terminal.
Vemos assim que esta formulacao ainda admite aperfei coamento: ela deve
ser ampliada para levar em conta as condi coes terminais.
1.6 Regulador Linear
Otimo Determinstico
Alem de um bom comportamento funcional das variaveis z e u, desejamos
tambem boas propriedades terminais; a formulacao seria:
Encontrar u() tal que
J =
_
t
f
t
0
[z
T
(t)Q(t)z(t) + u
T
(t)R(t)u(t)] dt + z
T
(t
f
)Tz(t
f
) e mnimo
onde Q(t) > 0 t [t
0
t
f
]; R(t) > 0 t [t
0
t
f
]; T > 0
Este problema tem sido um dos mais estudados pela comunidade cien-
tca de Controle. A analise de sua solucao e bem conhecida e, detalhe
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 9
importante, estas solucoes podem ser expressas como realimenta coes, como
veremos. Talvez por esta razao este problema e o de maior aplicabilidade
pr atica dentre todos os problemas de Controle
Otimo.
E um belo exemplo
onde o arsenal de recursos da teoria matem atica e posto a trabalhar para
resolver algo do mundo pr atico. Embora a teoria desenvolvida nos ultimos
30 anos, principalmente a partir dos trabalhos de Bellman e Kalman, seja
v alida para o caso linear geral vamos nos restringir aqui ao caso linear e
invariante no tempo, ou xo.
1.7 Regulador Linear
Otimo Determinstico
Fixo
Seja o sistema padrao
o
_
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
y(t) = Cx(t)
Como as matrizes representativas do sistema sao constantes, e razoavel
empregar matrizes tambem constantes nas formas quadr aticas do ndice a
ser minimizado, que passaria a ser
J = J(u) =
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Tz(t
f
)
onde Q > 0, R > 0 e T > 0. O Problema do Regulador Linear
Otimo
Determinstico e Invariante no Tempo, abreviadamente chamado de PRLO
a partir de agora, pode ser enunciado como
Encontrar u
(t), com t
0
t t
f
tal que J(u
) = J
e mnimo.
Lembrando que z(t) = Dx(t) temos z
T
(t)Qz(t) = x
T
(t)R
1
x(t), onde (vide
se cao A.6) R
1
= D
T
QD 0, e tambem z
T
(t
f
)Tz(t
f
) = x
T
(t
f
)P
f
x(t
f
), onde
P
f
= D
T
TD 0. Fazendo R = R
2
chegamos a outra formulacao equivalente
para o PRLO, agora em termos do estado e nao das sadas:
Encontrar u() tal que
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
) e mnimo
onde R
1
0; P
f
0; R
2
> 0
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 10
Uma vez formulado o problema, pode-se pensar em resolve-lo: a partir
do conhecimento de A, B, C, D, Q, R, T devemos pesquisar a existencia de
solucoes. Intuitivamente percebe-se que controlabilidade deve desempenhar
um papel, mas veremos isso mais para a frente. Antes porem notemos que
A, B, C, D constituem o modelo matem atico do sistema que se quer con-
trolar, sendo portanto dados do problema. Como encontrar as matrizes de
pondera cao Q, R, T, e consequentemente as matrizes R
1
, R
2
e P
f
que delas
derivam? As regras gerais para esta escolha sao um tanto quanto vagas, e
muitas vezes o conhecimento do problema em estudo e do que se deseja fazer
com ele levar a `a escolha.
E uma tarefa bastante dependente do sentimento
do projetista. Mesmo assim ha uma linha basica geral. Ela e vaga, como
dissemos, e ca mais claro apresenta-la por meio de um
Exemplo 1.7.1 Para um motor DC, seja (t) a posicao angular da carga,
e (t) a sua velocidade angular. A equa cao do modelo matematico para este
sistema e dada por:
(t) = a(t) + bu(t); onde
_
a = 0.5 s
1
b = 150 rd/(V s
2
)
A nalidade do problema e estabilizar a velocidade da maneira melhor
possvel em torno de um valor desejado
0
. Traduzir este objetivo, principal-
mente o trecho da melhor maneira possvel, em termos mais precisos e o
que se chama formulacao do problema. Vejamos em primeiro lugar que esta-
bilizar em torno de
0
e a mesma coisa que estabilizar em torno de 0, e isto se
chama regular. Supondo provisoriamente que a situacao ideal (t) =
0
t e
satisfeita, vejamos que entrada deveria ser aplicada ao sistema para mante-
la. Temos (t) = a
0
+ bu(t) = 0, donde u(t) = u
0
= (a/b)
0
. Denindo
agora uma nova variavel de estado como x(t) = (t)
0
teremos
x(t) = (t) = a(t) + bu(t)
= a(t) a
0
+ a
0
+ bu(t)
= ax(t) bu
0
+ bu(t)
Considerando entao a variavel v(t) = u(t)u
0
podemos escrever as novas
equa coes para o sistema:
_
x(t) = ax(t) + bv(t)
z(t) = x(t)
Assim vericamos, conforme o prometido, que estabilizar (t) em torno
de
0
equivale a estabilizar x(t) em torno de 0, ou seja, regular x(t). Como
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 11
todas as variaveis sao escalares podemos formular o nosso conhecido problema
de otimiza cao usando como ndice:
J =
_
t
f
t
0
[z
T
(t)qz(t) + v
T
(t)rv(t)] dt + z
T
(t
f
)pz(t
f
)
=
_
t
f
t
0
[qz
2
(t) + rv
2
(t)] dt + pz
2
(t
f
)
Como as matrizes de ponderacao sao tambem escalares podemos igualar
uma delas a 1 e mesmo assim ainda conseguiremos dar pesos relativos. Desta
maneira, sendo r > 0 e p > 0 o criterio a ser minimizado ca
J =
_
t
f
t
0
[z
2
(t) + rv
2
(t)] dt + pz
2
(t
f
)
Minimizar J garante tres coisas:
z() e pequeno (() proximo de w
0
)
v() e pequeno (u() proximo de u
0
)
z(t
f
) e pequeno
Situacoes onde e importante manter pequenas amplitudes da entrada sao
chamadas de situacoes de controle caro, e para que o ndice reita esta
condicao devemos usar um alto valor para r. Por outro lado, situacoes onde
podemos concentrar as aten coes na melhoria de z sem nos preocuparmos
com os gastos envolvidos (grandes amplitudes da entrada) caracterizam o
chamado controle barato. Estas instrucoes sao comunicadas ao ndice usando
um valor baixo para r. No caso limite teramos r = 0, signicando que os
valores assumidos pela entrada sao totalmente irrelevantes.
Para achar efetivamente bons valores numericos para r e p precisamos do
metodo de tentativa e erro. Depois, depois, e preciso antes saber a solu cao.
Exemplo 1.7.2 Para o mesmo sistema anterior, se quisermos controlar a
posicao e nao a velocidade precisaremos de um modelo mais completo. Sendo
agora a = 4.6s
1
e b = 0.787rd/(V s
2
) teremos:
_
_
=
_
0 1
0 a
_ _
_
+
_
0
b
_
u
O objetivo e estabilizar a posicao do melhor modo possvel em torno de
um valor desejado
0
. Denindo as variaveis de estado x
1
=
0
, e x
2
=
chegamos a
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 12
x =
_
0 1
0 a
_
x +
_
0
b
_
u; z = [ 1 0 ]x
Vemos que
0
se e somente se z 0. O ndice seria como acima:
J =
_
t
f
t
0
[z
2
(t) + ru
2
(t)] dt + z
2
(t
f
)
1.8 Exerccios, ainda
1. Mostrar que x
T
Qx = x
T
Q
T
x x
2. Se A = A
T
a matriz A sera chamada de antisimetrica. Sendo M uma
matriz (n n) qualquer mostrar que:
(a)
1
2
(M + M
T
) e simetrica.
(b)
1
2
(M M
T
) e antisimetrica.
3. Mostrar que qualquer matriz quadrada Q pode ser decomposta em
Q = Q
1
+ Q
2
onde Q
1
e simetrica e Q
2
e antisimetrica.
4. Mostrar que a forma quadr atica Q e identicamente nula (x
T
Qx = 0 x)
se e somente se Q e anti simetrica.
5. Sendo
.
x= Ax, x(0) = x
0
, tracar um gr aco para x
T
(t)Qx(t). A partir
deste gr aco e possvel dizer algo sobre a estabilidade do sistema?
A =
_
_
0 1 0
0 0 1
1 1 1
_
_ ; x
0
=
_
_
1
1
1
_
_ ; Q =
_
_
1 1 0
1 0 0
0 0 1
_
_
6. idem 5 para
Q =
_
_
1 1 1
1 1 1
1 1 1
_
_
7. Sendo Q simetrica e positiva denida e M inversvel, que se pode dizer
de P = M
1
QM? sera simetrica tambem? qual o sinal da forma
x
T
Px? sob que condi coes de M a matriz P e simetrica? anti simetrica?
positiva denida?
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 13
8. Sendo Q simetrica e p.d. (positiva denida) e D uma matriz (r n),
com r < n, que se pode dizer de P = D
T
QD? (repetir os quesitos do
exerccio anterior).
9. idem 8 para r = n.
10. idem 8 para r > n
11. A gura a seguir representa um pendulo invertido com base circular.
Ao eixo do disco e acoplado um motor que dever a ser acionado de forma
a equilibrar o pendulo na posicao vertical. Os dados numericos sao:
x =
_
_
0 1 0 0
56.56 0.09 42.42 0
0 0 0 1
28.28 0.045 71.21 0
_
_
x +
_
_
0
5.12
0
2.56
_
_
u; x
0
=
_
_
/36
0
/180
0
_
_
&%
'$
/
/
/
/
/
/
Pede-se:
(a) Encontrar (A), o espectro de malha aberta.
CAPTULO 1. PROBLEMAS TPICOS DE CONTROLE 14
(b) Supondo que t
0
= 0 e que temos um horizonte de tempo de 01
segundos, formular o problema como um problema de regulador
otimo.
(c) Escolher matrizes de pondera cao adequadas.
(d) Resolver o problema dando solucoes em MA (malha aberta) e MF
(malha fechada).
(e) Apresentar, se possvel, uma solucao em MF com F
= cte. En-
contrar
= (A + BF
).
(f) Embora nada se exija das variaveis x
1
, x
2
e x
4
, vericar o seu com-
portamento para cada uma das solucoes encontradas (elas tendem
para 0? quais sao seus valores m aximos?).
(g) Supondo que agora o horizonte de tempo e de 02 segundos, repetir
os itens b, c, d, e, f.
(h) idem g para 05 segundos.
(i) idem g para l0 segundos.
(j) idem g para horizonte de tempo ininito.
(k) Comparar e comentar todos os resultados obtidos ate agora.
(l) Repetir todos os itens acima, de b ate k, supondo que o interesse
passa a ser em todas as variaveis de estado: z = x. Supor tambem
que [x
1
[
max
= [x
3
[
max
= /18 e que x
2
e x
4
permanecem irrestritas.
Captulo 2
Solucao do Problema do
Regulador
Seja o sistema linear e invariante no tempo ao qual temos nos dedicado com
exclusividade quase total:
o
_
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
O PRLO, relembremos, signica minimizar o criterio quadr atico dado por
J = J(u) =
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Pz(t
f
)
onde as natrizes de pondera cao sao positivas denidas: Q > 0, R > 0 e
P > 0. Ou entao, em termos do estado, minimizar
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
onde R
1
= D
T
QD 0 R
2
= R > 0 P
f
= D
T
PD 0
Antes de estudar aspectos relativos `a existencia de solucoes, sua unicidade
etc., vamos vericar que condi coes as solucoes se existirem dever ao sa-
tisfazer. Deste modo criaremos um conjunto onde as solucoes (se existirem)
dever ao ser buscadas. Muitas e muitas vezes este conjunto de possveis can-
didatos e composto de poucos ou ate mesmo de um unico elemento, e assim
a tarefa de checar a otimalidade dos candidatos ca bem mais suave. O co-
nhecimento a priori de que existem solucoes otimas tambem ajuda. Para este
caso linear pode-se provar que existe solucao e ela e unica. Maiores detalhes
vir ao depois.
15
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 16
2.1 Solu cao pelo Calculo das Varia c oes
Supondo que a solucao existe, seja ela u
(t), t [t
0
t
f
], e sejam x
() e J
a
trajet oria acarretada por ela e o ndice correspondente:
u() = u
()
_
_
x = x
()
J = J(u
) = J
= mnimo
Isto signica que x
() e u
(t) = Ax
(t) + Bu
(t) (2.1)
Vamos supor que agora a entrada aplicada ao sistema sofre uma pertur-
bacao, uma variacao, e passa a nao ser mais exatamente igual a u
:
u() = u
() + u()
onde e um escalar arbitrario e u() e uma funcao arbitraria do tempo,
denida em [t
0
t
f
]. Esta variacao na entrada afetar a o estado, e, considerando
a linearidade do sistema, a trajet oria passar a a ser x() = x
() + x(). Em
smbolos:
u() = u
() + u() x() = x
() + x()
Mas isto signica que, t [t
0
t
f
]:
x
(t) +
.
x (t) = Ax
(t) + A x(t) + Bu
(t
0
). Conclui-se
que x(t
0
) = 0 e, usando a expressao classica para sistemas lineares xos:
x(t) =
_
t
t
0
(t, )B u() d =
_
t
f
t
0
(t, )B u() d (2.4)
onde a matriz de transicao de estados (t, ) e dada pela exponencial ma-
tricial e
(t)A
. Como o nosso sistema e causal temos (t, ) = 0 > t e a
integra cao pode ser encerrada em t ou em t
f
.
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 17
Podemos agora usar esses resultados e calcular o valor assumido pelo
ndice J para u = u
+ u e x = x
+ x:
J =
_
t
f
t
0
_
(x
T
(t) + x
T
(t))R
1
(x
(t) + x(t))+
(u
T
(t) + u
T
(t))R
2
(u
(t) + u(t))
_
dt +
(x
T
(t
f
) + x
T
(t
f
))P
f
(x
(t
f
) + x(t
f
))
Desenvolvendo e reagrupando chega-se a
J =
_
t
f
t
0
_
x
T
(t)R
1
x
(t) + u
T
(t)R
2
u
(t)
_
dt + x
T
(t
f
)P
f
x
(t
f
) +
2
_
_
t
f
t
0
_
x
T
(t)R
1
x
(t) + u
T
(t)R
2
u
(t)
_
dt + x
T
(t
f
)P
f
x
(t
f
)
_
+
2
_
_
t
f
t
0
_
x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)
_
dt + x
T
(t
f
)P
f
x(t
f
)
_
Ufa! que trabalheira. Para colocar um pouco de simplicidade nesse
maci co formalismo basta observar que, dando nomes pequenos para ex-
press oes grandes, podemos escrever J = a
2
+ b + c. E agora a tarefa
de minimizar J em funcao do par ametro e bem simples, pois temos um
familiar trin omio do segundo grau. Sabemos que o mnimo J
min
ocorre para
2a + b = 0 ou, equivalentemente, para = b/2a, quando a > 0. Mas por
outro lado sabemos que J
min
= J
ocorre quando u = u
, ou seja, = 0.
Disto concluimos que
a > 0 e b = 0
e isto implica em
_
t
f
t
0
_
x
T
(t)R
1
x
(t) + u
T
(t)R
2
u
(t)
_
dt + x
T
(t
f
)P
f
x
(t
f
) = 0
Entrando com o valor encontrado anteriormente para x(t) na equa cao
(2.4) seremos levados a:
_
t
f
t
0
_
_
t
f
t
0
u
T
()B
T
T
(t, ) d
_
R
1
x
(t) dt +
_
t
f
t
0
u
T
(t)R
2
u
(t) dt
+
_
_
t
f
t
0
u
T
()B
T
T
(t
f
, ) d
_
P
f
x
(t
f
) = 0
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 18
E tome de truques! Invertendo a ordem de integra cao na primeira parcela:
_
t
f
t
0
_
_
t
f
t
0
u
T
()B
T
T
(t, )R
1
x
(t) dt
_
d +
_
t
f
t
0
u
T
(t)R
2
u
(t) dt
+
_
t
f
t
0
u
T
()B
T
T
(t
f
, )P
f
x
(t
f
) d = 0
Mais um: trocando de posicao as variaveis t e no primeiro e no terceiro
termos:
_
t
f
t
0
_
_
t
f
t
0
u
T
(t)B
T
T
(, t)R
1
x
() d
_
dt +
_
t
f
t
0
u
T
(t)R
2
u
(t) dt
+
_
t
f
t
0
u
T
(t)B
T
T
(t
f
, t)P
f
x
(t
f
) dt = 0
Agrupando os termos vem
_
t
f
t
0
u
T
(t)
_
B
T
_
T
(t
f
, t)P
f
x
(t
f
) +
_
t
f
t
0
T
(, t)R
1
x
() d
_
+
R
2
u
(t) dt = 0
Ou, mais compactamente:
_
t
f
t
0
u
T
(t)
_
B
T
p(t) + R
2
u
(t)
_
dt = 0 (2.5)
onde novamente usamos um smbolo simples para designar uma express ao
longa:
p(t) =
T
(t
f
, t)P
f
x
(t
f
) +
_
t
f
t
0
T
(, t)R
1
x
() d (2.6)
Para a integral (2.5) se anular e necessario que
B
T
p(t) + R
2
u
(t) = 0 t [t
0
t
f
]
Como R
2
deve ser inversvel (ela e positiva denida), podemos, nalmente,
explicitar a entrada u
(t)
u
(t) = R
1
2
B
T
p(t) t [t
0
t
f
] (2.7)
Pela primeira vez encontramos uma expressao para u
(t
f
) +
d
dt
_
t
f
t
0
T
(, t)R
1
x
() d
Ap os um desenvolvimento, que pouco acrescentaria `as nossas argucidades,
chegaramos nalmente a uma forma elegante e compacta:
_
_
p(t) = A
T
p(t) R
1
x
(t)
p(t
f
) = P
f
x
(t
f
)
Percebe-se que p e a solucao de um SLIT de dimens ao n, com entrada x
e cuja condi cao de contorno e uma condi cao terminal e nao inicial. Ainda
esta tudo embolado: para alcan carmos o nosso objetivo u
precisamos de p,
para conseguirmos este precisamos resolver a equa cao acima, o que faremos
apenas com o conhecimento de x
. . . Como
sair desta?
2.2 Equac oes Variacionais
Sendo u(t) = u
(t) = R
1
2
B
T
p(t), como deduzido acima, podemos reescre-
ver a equa cao (2.1):
x
(t) = Ax
(t)BR
1
2
B
T
p(t); x(t
0
) = x
0
(2.8)
A variavel p e normalmente conhecida como variavel adjunta ou entao
coestado; a equa cao diferencial que a origina pode ser apresentada como
p(t) = R
1
x
(t)A
T
p(t); p(t
f
) = P
f
x
(t
f
) (2.9)
Podemos fundir estas ultimas equa coes em uma unica:
_
x
(t)
p(t)
_
=
_
A BR
1
2
B
T
R
1
A
T
_ _
x
(t)
p(t)
_
(2.10)
Temos assim um sistema linear, xo, aut onomo, com dimens ao 2n, que
pode ser escrito em uma forma mais compacta:
_
x
e
(t) = A
e
x
e
(t)
x
(t
0
) = x
0
; p(t
f
) = P
f
x
(t
f
)
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 20
onde o vetor x
e
(t) e a matriz A
e
sao dados por:
x
e
(t) =
_
x
(t)
p(t)
_
; A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
A novidade e que temos agora condi coes de contorno hbridas: iniciais
e terminais. Note-se tambem que A
e
e uma matriz Hamiltoniana (apendice
A, se cao A.9). Sendo
e
(t, ) a matriz de transicao de estados para este
sistema expandido, podemos escrever a expressao geral
x
e
(t) =
e
(t, )x
e
()
Considerando os casos = t
0
e = t
f
temos expressoes para o estado ex-
pandido x
e
em termos das condi coes iniciais e nais: x
e
(t) =
e
(t, t
0
)x
e
(t
0
) e
x
e
(t) =
e
(t, t
f
)x
e
(t
f
). Particionando a matriz
e
(t, t
f
) podemos desenvolver
esta ultima equa cao:
_
x
(t)
p(t)
_
=
_
11
(t, t
f
)
12
(t, t
f
)
21
(t, t
f
)
22
(t, t
f
)
_ _
x
(t
f
)
p(t
f
)
_
donde saem as equa coes individuais
x
(t) =
11
(t, t
f
)x
(t
f
) +
12
(t, t
f
)p(t
f
)
p(t) =
21
(t, t
f
)x
(t
f
) +
22
(t, t
f
)p(t
f
)
Mas p(t
f
) = P
f
x
(t
f
), e podemos entao escrever
x
(t) = [
11
(t, t
f
) +
12
(t, t
f
)P
f
]x
(t
f
) (2.11)
p(t) = [
21
(t, t
f
) +
22
(t, t
f
)P
f
]x
(t
f
) (2.12)
Fazendo t = t
0
na equa cao (2.11) pode-se relacionar x
(t
f
) e x
(t
0
) = x
0
:
x
(t
0
) = [
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]x
(t
f
) = x
0
o que leva, apos substituicao na equa cao (2.12), a
p(t) = [
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]
1
x
0
Esta expressao depende apenas de x
0
, (conhecido) e das matrizes
ij
,
parti coes de
e
, que podem ser calculadas (
e
e a exponencial matricial
associada `a matriz A
e
). Tambem e preciso haver invertibilidade daquele
bloquinho, e para garantir isto necessitaramos que a matriz Hamiltoniana
A
e
apresentasse certas caractersticas. Depois veremos mais detalhes sobre
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 21
estes problemas; por enquanto suporemos que o bloco e inversvel e podemos
exprimir p(t) como acima. E assim podemos nalmente apresentar a solucao:
u
(t) = R
1
2
B
T
[
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]
1
x
0
(2.13)
Esta entrada otima acarretaria uma trajet oria otima descrita por
x
(t) = [
11
(t, t
f
) +
12
(t, t
f
)P
f
][
11
(t
0
, t
f
) +
12
(t
0
, t
f
)P
f
]
1
x
0
(2.14)
A expressao para o ndice otimo J
(t) (2.15)
Agora p(t) foi apresentado em termos de x
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t, t
f
) +
12
(t, t
f
)P
f
]
1
= P
(t) (2.16)
poderemos economizar na notacao e colocar p(t) = P
(t)x
(t) = R
1
2
B
T
P
(t)x
(t)
= F
(t)x
(t)
Feito, a solucao pode ser expressa como uma realimenta cao de estados! O
ganho e variante no tempo, mas tudo bem, agora temos controle em malha
fechada
Planta o
F
(t)
'
E
x
(t)
u
(t)
Este fato e importante; a solucao otima pode ser implementada por meio
de realimenta cao de estados. A existencia ou nao de solucoes esta associada
`a invertibilidade do bloco [
11
(t, t
f
) +
12
(t, t
f
)P
f
] e a propriedades da matriz
Hamiltoniana A
e
. Alguns detalhes serao vistos posteriormente.
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 22
2.2.1 Em resumo:
Dado o sistema costumeiro
o
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
e o ndice quadr atico
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
com R
1
0, R
2
> 0, P
f
0, o procedimento basico para minimizar J esta
exposto a seguir:
1. Formar o sistema expandido x
e
(t) = A
e
x
e
(t) onde
A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
(2.17)
2. Encontrar e particionar a matriz de transicao de estados para o sistema
acima:
e
(t, ) = e
(t)Ae
=
_
11
(t, )
12
(t, )
21
(t, )
22
(t, )
_
(2.18)
3. Calcular P
(t) = [
21
(t, t
f
) +
22
(t, t
f
)P
f
][
11
(t, t
f
) +
12
(t, t
f
)P
f
]
1
4. A solucao em malha fechada e:
u
(t) = F
(t)x
(t) onde F
(t) = R
1
2
B
T
P
(t) (2.19)
Para xar os conceitos, vejamos um
Exemplo 2.2.1 Estabilizacao da velocidade
Podemos pensar em um motor como o dos exemplos do captulo passado,
com posicao da carga medida por e velocidade angular w. O objetivo agora
e estabilizar w em torno de w
0
, partindo de t
0
= 0, em t
f
= 1. Um modelo
matematico para este sistema ja foi visto anteriormente:
_
_
x(t) = ax(t) + bv(t)
z(t) = x(t)
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 23
onde x(t) = (t)
0
, v(t) = u(t) + (a/b)
0
, a = 0, 5 e b = 150. O
problema e minimizar
J = J(v) =
_
1
0
[z
2
(t) + rv
2
(t)] dt + pz
2
(1)
onde os reais r e p sao positivos. Vejamos a solu cao, passo a passo. O
sistema expandido e:
_
x(t)
p(t)
_
=
_
a (b
2
/r)
1 a
_ _
x(t)
p(t)
_
Calculando e particionando a matriz
e
(t, ) = e
(t)Ae
chegaremos a
_
11
(t, ) = (1/4)
_
(2 1)e
(t)
+ (2 + 1)e
(t)
_
12
(t, ) = (b
2
/2r)
_
e
(t)
e
(t)
_
21
(t, ) = (1/2)
_
e
(t)
e
(t)
_
22
(t, ) = (1/4)
_
(2 + 1)e
(t)
+ (2 1)e
(t)
_
onde =
_
a
2
+ b
2
/r. As expressoes para a solu cao em malha aberta podem
ser obtidas por substituicao destes valores nas equa coes(2.13) e (2.14):
_
v
(t) = (b/r) [
21
(t, 1) + p
22
(t, 1)] [
11
(0, 1) + p
12
(0, 1)]
1
x
0
x
(t) = [
11
(t, 1) + p
12
(t, 1)] [
11
(0, 1) + p
12
(0, 1)]
1
x
0
As solu coes otimas dependerao dos parametros r e p; se eles sao conhe-
cidos poderemos, (apos contas brabas!) encontrar a entrada otima em malha
aberta v
e trajetoria otima x
(t) = (b/r)
21
(t, 1)[
11
(0, 1)]
1
x
0
x
(t) =
11
(t, 1)[
11
(0, 1)]
1
x
0
Substituindo os valores e plotando para r = 100, r = 1000 e r = 10000
chega-se a
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 24
_
t
1.0 0.5
'v
(t)
10
5
'
x
(t)
100
50
r=100
r=1000
r=10000
r=100
r=1000
r=10000
Alguns fatos se destacam. Para valores elevados do parametro r, ou seja,
nas chamadas situacoes de controle caro teramos
r v x
e fraco
mostrando que, quando a entrada e muito penalizada o desempenho sofre,
x
e bom
e o desempenho melhora pois podemos usar entradas u com amplitudes gran-
des. A partir deste ponto ja e possvel concluir algo. Supondo que conhecemos
a tensao maxima suportada pelo motor, poderemos limitar o valor de r. Para
o caso deste exemplo, [V [
max
= 3, donde r 1000.
2.) Efeito das condicoes terminais para custo xo
Para r = cte = 1000 podemos plotar curvas de x
(t) e v
(t) semelhantes
`as precedentes, mas para diversos valores do parametro p. As curvas serao
praticamente coincidentes, e a inuencia de p apenas se faz sentir no nal
do intervalo: para valores elevados de p notamos que as condicoes terminais
melhoram. O reverso da medalha, o preco a se pagar por esse benefcio, se
reete no fato de que a amplitude de u tambem aumenta, mas pouca coisa,
e mesmo assim esse aumento se verica apenas nas proximidades de t = 1.
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 25
Isto e otimo, porque signica que podemos melhorar o comportamento
terminal aumentando p e respeitando a restricao de voltagem maxima no
motor! Dependendo de quanto toleraramos de desvio em t = 1 podemos
balizar nossa escolha de p, sempre nos lembrando de vericar se tal valor
nao comprometeria demasiadamente as amplitudes da entrada u. Vamos
supor que neste exemplo [x
(t
f
)[ < 1 esta bom. Para isto as curvas diriam
que devemos usar p > 0.10
3.) Solucao em Malha Fechada
A solu cao apresentada ate agora e a de malha aberta. Ja vimos que
se o problema envolver aplicacoes praticas, ela e pouco conavel e deve-se
pensar em substitu-la por estrategias com realimenta cao. Podemos chegar
aos mesmos resultados otimos acima usando uma lei de controle em malha
fechada, do tipo u
(t) = F
(t)x
(t) = r
1
bP
(t)
= r
1
b[
21
(t, 1) + p
22
(t, 1)][
11
(t, 1) + p
12
(t, 1)]
1
Um dos inconvenientes do metodo e que a solu cao em malha fechada e
variante no tempo. Mas o exemplo mostraria, pela elaborac ao das curvas
para diversos valores dos parametros r e p, que esta varia cao e pequena e
apenas perto do m do intervalo ela se manifesta: F
(t) F
= cte. = 0, 03
E isto pode ajudar na determinacao de p, pois a facilidade de imple-
menta cao de realimenta coes constantes as torna atraentes e desejaveis.
E
logico que se houver muita exigencia a respeito dos valores terminais esta
escolha de p pode nao servir.
Exemplo 2.2.2 Problema com restricao terminal
x(t) =
_
0 1
0 0
_
x(t) +
_
0
1
_
u; x(0) =
_
1
2
_
Nosso objetivo: em um tempo nito t
f
conduzir o estado ate a origem mi-
nimizando a energia gasta. Estes requisitos podem ser reescritos: encontrar
u() tal que em t
f
> 0, t
f
nito tenhamos
x(t
f
) = 0 e E = E(u) =
_
t
f
0
1
2
u
2
(t) dt seja minimizada
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 26
A primeira restricao impede a aplicacao direta da teoria ja vista. Pre-
cisamos contornar este obstaculo. Este problema e chamado de problema
com restricao terminal e a teoria desenvolvida se aplica a problemas com
condicoes terminais livres:
J = J(u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
onde P
f
e uma medida da import ancia do valor de x(t
f
). Vamos resolver o
PRLO para o caso R
1
= 0 e considerando
P
f
=
_
p 0
0 p
_
= pI
Se p estamos penalizando innitamente x(t
f
) e conseguiremos mi-
nimizar J apenas quando x(t
f
) = 0, como desejamos. Facamos entao R
1
=
0, R
2
= 1/2, P
f
= pI. O sistema adjunto e:
x
e
(t) =
_
A bR
1
2
b
T
0 A
T
_
x
e
(t) =
_
_
0 1 0 0
0 0 0 2
0 0 0 0
0 0 1 0
_
_
x
e
(t)
para o qual:
(t, ) = (t) =
_
_
1 t (t)
3
/3 (t)
2
0 1 (t)
2
2(t)
0 0 1 0
0 0 (t) 1
_
_
donde tiramos
21
(t, t
f
) = 0;
22
(t, t
f
) =
_
1 0
t
f
t 1
_
e, como podemos assumir t
0
=0,
11
(t
0
, t
f
) =
_
1 t
f
0 1
_
;
12
(t
0
, t
f
) =
_
t
3
f
/3 t
2
f
t
2
f
2t
f
_
A expressao para o controle em malha aberta sera
u
(t) = [0 2]p
_
1 0
t
f
t 1
_ __
1 t
f
0 1
_
+ p
_
t
3
f
/3 t
2
f
t
2
f
2t
f
__
1
x
0
= 2[tt
f
1]
_
p
1
_
1 t
f
0 1
_
+
_
t
3
f
/3 t
2
f
t
2
f
2t
f
__
1
x
0
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 27
Mas p , como supusemos, logo p
1
0; considerando ainda, para
simplicar as manipula coes, que t
f
= 3, chega-se a
u
(t) =
2
3
[t3 1]
_
2/3 1
1 1
_ _
1
2
_
u
(t) =
2
3
__
2
1
3
+
2
_
t
1
2
2
_
2.3 Busca de Caminhos Mais Simples
Esbocemos mais uma vez, em breves palavras, o caminho que temos trilhado
para chegar `a solucao do PRLO. A partir do sistema expandido calculamos
e
(t, ), a matriz de transicao de estados para A
e
; apos particiona-la conve-
nientemente obtemos P
(t):
A
e
e
(t, ) P
(t) F
(t) u
(t)
A analise dos ultimos exemplos sugere que este caminho pode ser traba-
lhoso e demorado, e que seria interessante evitar o calculo de P
(t) a partir
de
e
(t, ). Ou seja, procura-se uma maneira alternativa de se obter P
(t).
Recordemos ainda uma vez a expressao (2.7), que fornece a solu cao otima:
u
(t) = R
1
2
B
T
p(t). O coestado pode ser obtido com o auxlio da express ao
(2.15), resultando em
p(t) = P
(t)x
(t) (2.20)
Derivando em rela cao ao tempo, e abandonando temporariamente a no-
ta cao P
(t) + P(t) x
(t) (2.21)
As equa coes variacionais sao
x
(t) = Ax
(t) BR
1
2
B
T
p(t) (2.22)
p(t) = R
1
x
(t) A
T
p(t) (2.23)
Entrando com (2.20) em (2.22) obteremos
x
(t) = [A BR
1
2
B
T
P(t)]x
(t)
a qual, substituda em (2.21), fornece
p(t) = [
P(t) + P(t)AP(t)BR
1
2
B
T
P(t)]x
(t) (2.24)
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 28
Entrando agora com (2.20) em (2.23) somos levados a
p(t) = [R
1
A
T
P(t)]x
(t) (2.25)
Comparando estas duas ultimas equa coes, as de n umeros (2.24) e (2.25),
chegamos nalmente a
_
P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
Esta e a famosssima Equacao de Riccati Matricial, uma equa cao
diferencial matricial com condi coes de contorno terminais, e nao iniciais. Re-
solvendo-a teramos o metodo alternativo que and avamos procurando para
a obtencao de P
(t) = R
1
2
B
T
p(t) = R
1
2
B
T
P
(t)x
(t) onde P
(t) e uma
solucao da ERM. Isto permite delimitar o universo dos possveis candidatos
a solucao do PRLO: o conjunto das solucoes da ERM. Aqui, mais uma vez,
a matem atica auxilia:
Teorema 2.3.1 A equa cao de Riccati matricial com condicao terminal
_
P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
sempre admite uma solu cao unica, normalmente designada por P
(t).
Pronto, estamos feitos: existe um candidato unico para ser testado, e
isto obviamente ira facilitar a tarefa de buscar a solucao. Ou a funcao u
=
R
1
2
B
T
P
(t)x
) e mnimo.
Estes teoremas nao serao provados aqui. Mas deve car clara a sua enorme
importancia. Eles garantem a existencia de solucao para o PRLO, e ensinam
como calcula-la. O processo todo pode ser sintetizado no seguinte algoritmo:
1. Seja P
(t) = R
1
2
B
T
P
(t)
3. u
(t) = F
(t)x(t)
Mostramos assim como a solucao do PRLO esta intimamente associada
`a ERM. Percebemos deste modo a importancia desta equa cao, que j a a faz
merecer um estudo um pouco mais detalhado.
2.4 Equacao de Riccati Matricial
Em primeiro lugar vamos reescreve-la, como se ja nao o tivessemos feito
tantas vezes nestas ultimas linhas.
_
P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
Transpondo membro a membro as igualdades acima e lembrando que
R
1
, R
2
e P
f
sao matrizes simetricas teremos, apos os algebrismos de praxe:
_
P
T
(t) = A
T
P
T
(t) P
T
(t)A + P
T
(t)BR
1
2
B
T
P
T
(t) R
1
P
T
(t
f
) = P
f
Isto signica que se P(t) e solucao da ERM, P
T
(t) tambem o sera. Mas
a solucao e unica, logo
Teorema 2.4.1 A solu cao P
(t) = P
T
(t) t [t
0
t
f
]
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 30
Este fato ajudara na busca de solucoes para a ERM. Antes de entrarmos
nestes topicos vejamos mais fatos gerais sobre ela.
Teorema 2.4.2 A solu cao P
(t) 0 t [t
0
t
f
]
Supondo que iniciamos o nosso processo em um instante generico t pode-
mos denir o custo parcial como
J
p
= J
p
(t, u) =
_
t
f
t
[x
T
()R
1
x() + u
T
()R
2
u()] d + x
T
(t
f
)P
f
x(t
f
)
A solucao P
p
= J
p
(t, u
) = x
T
(t)P
(t)x
(t)
Usando o teorema acima para t = t
0
encontraramos que o ndice total
mnimo para o intervalo de trabalho [t
0
t
f
] e dado por:
J
= J(u
) = J
p
(t
0
, u
) = x
T
0
P
(t
0
)x
0
Ainda um fato geral antes de discutirmos a busca de solucoes para a
ERM. Sendo X uma matriz (n n) podemos construir a seguinte equa cao:
A
T
X + XAXBR
1
2
B
T
X + R
1
= 0 (2.26)
Como esta equa cao pode ser obtida a partir da ERM ela recebe o nome
de Equacao de Riccati Matricial Algebrica ou simplesmente ERMA.
E
f acil notar que se a matriz de pondera cao P
f
for uma solucao para a ERMA
entao a ERM admitira uma solucao constante P
(t) = cte = P
f
. Como a
recproca tambem e verdadeira temos
Teorema 2.4.4 O PRLO admite uma solu cao invariante no tempo se e so-
mente se a matriz de pondera cao P
f
e uma solu cao para a ERMA:
F
(t) = F
= cte A
T
P
f
+ P
f
AP
f
BR
1
2
B
T
P
f
+ R
1
= 0
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 31
Pronto, eis aqui resultados com bastante utilidade, e que justicam algo j a
visto nos exerccios: para determinadas escolhas das matrizes de pondera cao
a solucao pode se tornar mais simples.
Ja vimos (aquele de nos, sabios, que come caram a ler estas notas pelo
apendice A) na se cao A.9 como discutir a existencia de solucoes para uma
ERMAanalisando a matriz Hamiltoniana associada e tambem como efe-
tivamente obter uma solucao X atraves do subespaco espectral dos modos
estaveis. Se a ERMA admite uma solucao P
0 e se P
f
pode ser escolhida
igual a este valor entao a solucao do PRLO sera invariante no tempo. E
a volta tambem e v alida: se existe uma solucao invariante no tempo entao
etc. . .
Exemplo 2.4.1 Exemplo de ordem 1
Para o sistema escalar x(t) = ax(t) +bu(t); x(t
0
) = x
0
, sendo q 0, r >
0, p 0, minimizar
J = J(u) =
_
t
f
0
[qx
2
(t) + ru
2
(t)] dt + px
2
(t
f
)
A solu cao e: u
= r
1
bP
(t)x
(t) onde P
P(t) = 2aP(t) +
b
2
r
P
2
(t) q; P(t
f
) = p
Isto admite solu cao analtica. Integrando por separacao de variaveis che-
garamos a
P
(t) = r
+ a + ( a)
p r(a + )
p r(a )
e
2(tt
f
)
1
p r(a + )
p r(a )
e
2(tt
f
)
onde =
_
a
2
+ q/r. Fixando t
f
= 1, q = 1, p = 0, a = 1, b = 1, x
0
= 1,
podemos esbocar as curvas x(t), u(t), P
(t)
.40
.20
r=1
r=0.2
r=0.02
P
a
2
r
2
+ qrb
2
)/b
2
= P
. Se
este valor e atribudo ao peso terminal p entao a ERM admite uma solu cao
constante, e a lei otima em malha fechada e invariante no tempo:
u
(t) = F
(t) =
b
r
P
(t) =
a +
_
a
2
+ qb
2
/r
b
Usando a = 1, b = 1 e q = 1 pode-se avaliar a inuencia do peso r nas
solu coes:
u
(t) = F
(t) =
1
_
1 + 1/r
b
Plotando esta fun cao e tambem x
(t)
1.0
0.5
'
u
(t)
-5.0
-2.5
r=1
r=0.2
r=0.02
r=1
r=0.2
r=0.02
Desempenho em fun cao do parametro r
E poderamos continuar trabalhando neste problema, vendo por exemplo
a viabilidade da escolha das matrizes de ponderacao etc.
Exemplo 2.4.2 Estabilizacao da Velocidade
(t) = R
1
2
B
T
P
(t)x
(t) = (b/r)P
(t)x
(t), onde P
(t)
e solu cao da ERM
_
P(t) = A
T
P(t) P(t)A + P(t)Br
1
B
T
P(t) 1
=
b
2
r
P
2
(t) 2aP(t) 1
P(1) = P
f
= p
CAPTULO 2. SOLUC
AO DO PROBLEMA DO REGULADOR 34
A solu cao geral da ERM para um caso escalar como este pode ser vista no
exemplo anterior. Para pesquisar a existencia de uma solu cao F
(t) cons-
tante basta estudar a ERMA: 0 = aP Pa +Pbr
1
bP 1 ou, arrumando
direitinho,
P
2
2ar
b
2
P
r
b
2
= 0
cujas razes sao facilmente encontradas. Como a solu cao que nos interessa
deve ser positiva denida escolheremos
P
= r
a +
_
a
2
+ b
2
/r
b
2
Usando r = 1000 encontraramos P
= 0, 19 teremos F
_
p
11
(t) = 2p
2
12
(t) 2 p
11
(3) = 1
p
12
(t) = p
11
(t) + 2p
12
(t)p
22
(t) 1 p
12
(3) = 0
p
22
(t) = 2p
12
(t) + 2p
2
22
(t) 4 p
22
(3) = 2
J(t
f
, u) =
lim
t
f
_
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Pz(t
f
)
_
onde Q > 0 R > 0 P > 0
3.1 Discussao do Problema
Passaremos agora a analisar v arios aspectos do PRLOHTI.
E bastante sim-
ples vericar que se lim
t
u(t) ,= 0 entao a integral J(t
f
, u) do criterio acima
35
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 36
cresce indenidamente quando t
f
e, obviamente, o problema de mini-
mizar o ndice I(u) perde o sentido. O mesmo raciocnio se aplica para z(t)
e assim somos levados `a conclusao de que para o PRLOHTI ter sentido e
absolutamente imprescindvel que as variaveis z() e u() tendam para zero
quando t . Diramos isso de uma maneira mais rigorosa armando que:
uma condi cao necessaria para haver solucao para o PRLOHTI e
lim
t
u(t) = lim
t
z(t) = 0
z
T
(t
f
)Pz(t
f
) = 0. Isto siginica que as condi coes
terminais nao afetam este problema e podem ser eliminadas do criterio.
E
possvel, assim, aperfei coar a formulacao do PRLOHTI: dado o sistema
o
_
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
minimizar o criterio
I = I(u) =
_
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt
onde Q > 0 e R > 0. Ou entao, colocando z(t) = Dx(t), minimizar
I = I(u) =
_
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt
onde R
1
= D
T
QD 0 e R
2
= R > 0.
3.2 Solu cao Para o PRLOHTI
Deduzimos a partir de agora o que acontece `a solucao tradicional do PRLO
quando t
f
.
E bom lembrar, usando resultados do captulo passado, que
devemos minimizar
J = J(t
f
, u) =
_
t
f
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt + z
T
(t
f
)Pz(t
f
)
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 37
A solucao e conhecida:
u
(t) = F
(t)x
(t) = R
1
2
B
T
P
(t)x
(t)
onde P
(t) = R
1
2
B
T
P
(t)x
(t) = F
(t)x
(t)
Ou seja, para conhecer o PRLOHTI precisamos conhecer o comporta-
mento da equa cao de Riccati matricial quando t
f
.
3.2.1 Solucao da ERM quando t
f
Que acontece com a solucao P
() da ERM quando t
f
? Tudo nos leva
a crer que tal solucao continua existindo. Designando-a por P
(t) temos
P
(t) = lim
t
f
(t)
Alguns autores usam o nome solu cao em regime da ERM mas isto pode
levar a confusoes com valor de regime da solucao da ERM o qual e denido,
quando existe, como lim
t
P
(t)
E bom deixar bem claro que quem esta
tendendo a e o instante nal do intervalo, t
f
, e nao a variavel independente
t. O objetivo entao e o conhecimento de P
(t) = r
1 + ( + 1)
p + r(1 )
p + r(1 + )
e
2(tt
f
)
1
p + r(1 )
p + r(1 + )
e
2(tt
f
)
onde =
_
1 + 1/r. Como o interesse se restringe `as inuencias de t
f
e p
podemos simplicar fazendo r = 1/3 o que acarreta = 2:
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 38
P
(t) =
1
3
1 + 3
3p 1
3p + 3
e
4(tt
f
)
1
3p 1
3p + 3
e
4(tt
f
)
Pondo p = 0 o efeito de t
f
podera ser mais bem apreciado.
P
(t) =
1 e
4(tt
f
)
3 + e
4(tt
f
)
Na gura abaixo esbocamos alguns gracos para diferentes valores de t
f
.
_
t
5.0 10.0
'
0.1
0.2
0.3
0.4
P
(t)
t
f
= 1 t
f
= 5 t
f
= 9
Efeito de t
f
na solu cao da ERM
e
2(tt
f
)
= 0, donde, para este caso,
lim
t
f
(t) = P
(t) = r( 1) = 1/3 t [0 )
3.2.2 Pequena Generaliza cao
No exemplo anterior a solucao P
(t) constante:
lim
t
f
(t) = P
(t) = cte. = P
t [t
0
)
Isto acontecera sempre? Vejamos. Sejam a ERM
_
P(t) = A
T
P(t) P(t)A+ P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
e a ERMA associada
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 39
A
T
X XA + XBR
1
2
B
T
X R
1
= 0
Se X
(t) = X
t [t
0
t
f
]. Ou seja, em algumas situa coes a solucao P
(t) da
ERM e uma constante que depende apenas da ERMA e, consequentemente,
independe do instante terminal t
f
. Repetindo, se houver liberdade para se
escolher a condi cao terminal P
f
, podemos fazer
P
f
= solucao 0 da ERMA =P
(t) = P
f
t [t
0
t
f
] e, importante!, t
f
Assim, desde que P
f
possa ser escolhida `a vontade, quando t
f
a
solucao da ERM tende a um valor constante que e solucao da ERMA:
lim
t
f
(t) = P
z
T
(t
f
)Pz(t
f
) = 0. Mas sendo z = Dx isto pode ser
escrito como
lim
t
f
x
T
(t
f
)D
T
PDx(t
f
) = lim
t
f
x
T
(t
f
)P
f
x(t
f
) = 0
Como, no limite, z(t
f
) 0 vemos que o valor de P e, consequentemente,
o de P
f
e irrelevante, e a solucao do PRLOHTI independe da condi cao ter-
minal P
f
, Isto, alias, ja podia ser pressentido anteriormente, quando a nova
formulacao do problema nao levava em conta essa matriz. Deste modo, se a
solucao do PRLOHTI pode ser obtida da equa cao de Riccati e se a condi cao
terminal P
f
e arbitraria sempre podemos fazer uma escolha inteligente de
P
f
, uma que acarrete solucao constante.
A abordagem vista neste item e supercial, embora seja boa para explicar
e fazer entender os mecanismos envolvidos neste problema. Precisamos de
mais rigor te orico para validar as coisas. Por exemplo, quem garante que a
ERMA tenha solucao? E se o tiver, sera ela positiva semidenida?
3.3 Um Pouco de Teoria
Temos constatado a existencia de in umeros vnculos entre as equa coes de
Riccati diferencial e algebrica e as solucoes do Problema do Regulador
Linear
Otimo, em horizonte de tempo nito ou innito. Nas se coes 2.3 e 2.4
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 40
do captulo anterior apresentamos alguns resultados basicos sobre a ERM.
Passamos agora a listar uma serie de propriedades a respeito das solucoes de
regime dessa equcao, e de seu relacionamento com a ERMA. Para isso, sejam
o sistema usual
o
_
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
com o criterio
J = J(t
f
, u) =
_
t
f
t
0
[x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)] dt + x
T
(t
f
)P
f
x(t
f
)
onde R
1
0, R
2
> 0, P
f
0 e a Equacao de Riccati matricial
_
P(t) = A
T
P(t) P(t)A + P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
Seja ainda
lim
t
f
(t) = P
(t) onde
_
_
P
(t) da ERM tende a uma solu cao de regime constante qualquer que
seja a condicao terminal P
f
0:
< A, B, D > estabilizavel e detetavel = lim
t
f
(t) = P
= cte. P
f
0
Este resultado e mais geral do que o anterior, embora forneca uma con-
di cao apenas suciente. Que podemos dizer da volta, do sentido inverso, ou
seja, que se pode garantir quando a solucao de regime e constante?
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 41
Lema 3.3.3 Se a solu cao P
entao esta P
(t) = P
= cte. = P
sera a unica
solu cao positiva semidenida da ERMA:
lim
t
f
(t) = P
= cte.
< A, B, D >
_
estabilizavel
e detetavel
_
_
P
0 da ERMA
Bem mais simples.
E conveniente lembrar que esta condi cao e apenas
suciente: a ERMA pode ter solucao unica e < A, B, D > pode ser inestabi-
liz avel ou indetet avel. Mais teoremas.
Lema 3.3.6 Se a solu cao P
(t) = P
= R
1
2
B
T
P
x = F
x
estabiliza o sistema de malha fechada se e somente se o sistema de malha
aberta < A, B, D > for estabilizavel e detetavel.
A + BF
e estavel
com
F
= R
1
2
B
T
lim
t
f
(t)
_
_
< A, B, D > e
_
_
estabiliz avel
e
detet avel
A partir deste resultado vemos que se a solucao da ERM tende a uma
funcao constante podemos implementar uma realimenta cao de estados u =
F
x a partir dela. Esta lei de controle sera estabilizadora sob condi coes
bastante precisas. Nada se falou ainda sobre minimizacao.
Teorema 3.4.2 Se o sistema < A, B, D > e estabilizavel e detetavel entao
a lei de controle u = F
x = R
1
2
B
T
P
x minimiza o ndice
_
t
0
[z
T
(t)Qz(t) + u
T
(t)Pu(t)] dt
atribuindo-lhe o valor mnimo dado por x
T
0
P
x
0
Uma vez estabelecida a importancia de uma solucao de regime P
(t)
da ERM que seja constante, e tempo de sistematizar os conhecimentos j a
adquiridos. O roteiro para enfrentar um caso concreto e dado pelo
3.5 Algoritmo para Solu cao do PRLOHTI
Supondo que < A, B, D > e estabiliz avel e detet avel:
1. Calcule usando, por exemplo os resultados da se cao A.9 a solucao
P
para a ERMA:
A
T
X XA + XBR
1
2
B
T
X R
1
= 0
(P
e unica, e P
0)
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 43
2. u
= F
= R
1
2
B
T
P
e a solucao do PRLOHTI.
3. J
= x
T
0
P
x
0
Para ilustrar este algoritmo e bem chegada a hora de um
Exemplo 3.5.1 Seja o sistema dado por
x =
_
0 1
0 0
_
x +
_
0
1
_
u; z = [1 0]x
para o qual desejamos minimizar o ndice
J =
_
0
_
x
T
(t)R
1
x(t) + u
T
(t)R
2
u(t)
_
dt
onde
R
1
=
_
2 1
1 4
_
; e R
2
= 1/2
Facilmente vericaramos que este sistema e controlavel e observ avel; de
acordo com o algoritmo acima seja a ERMA (com o sinal trocado):
A
T
X + XAXBR
1
2
B
T
X + R
1
= 0
Lembrando a secao A.9 podemos encontrar a matriz Hamiltoniana asso-
ciada:
H =
_
A BR
1
2
B
T
R
1
A
T
_
=
_
_
0 1 0 0
0 0 0 2
2 1 0 0
1 4 1 0
_
_
Esta matriz possui autovalores reais nao nulos; seu subespaco dos modos
estaveis poderia ser descrito pelos autovetores associados aos autovalores es-
taveis de A:
A
(H) =
_
_
0, 2110 0, 4968
0, 5764 0, 3637
0, 0565 0, 8605
0, 7874 0, 1331
_
_
Seria simples vericar que H 1 e poderamos obter a solu cao da
ERMA:
X = Ric (H) =
_
0, 0565 0, 8605
0, 7874 0, 1331
_ _
0, 2110 0, 4968
0, 5764 0, 3637
_
1
CAPTULO 3. HORIZONTE DE TEMPO INFINITO 44
=
_
2, 4641 1, 0000
1, 0000 1.7321
_
Deste ponto a realimenta cao de estados otima sai facilmente:
F
= R
1
2
B
T
X = [2, 0000 3, 4641]
3.6 Que Acontece se a Condicao Falha?
A condi cao de estabilizabilidade e detetabilidade de < A, B, D > e bastante
suave e razoavel. Se < A, B >, por exemplo, nao for estabiliz avel, pouco se
pode fazer por este caso. Minimizar entao, nem se fala. Se < A, B > for
estabiliz avel mas nao detet avel o problema aparecer a na impossibilidade de
se implementar a lei de controle. Entao, por estas razoes, a condi cao deve
ser aceita com naturalidade. Se ela falha e porque e mesmo difcil.
3.7 Controlabilidade e Observabilidade
OK, tudo bem, entao o sistema < A, B, D > e estabiliz avel e detet avel. Mas
pode haver modos incontrol aveis e/ou inobservaveis (eles serao for cosamente
estaveis). Que acontece com eles?
E l ogico que os modos incontrol aveis per-
manecem imut aveis apos realimenta cao de estado. Sem grandes agress oes
podemos raciocinar que os modos inobservaveis, como nao afetam z, e con-
sequentemente o ndice a ser minimizado, sao deixados exatamente no lugar
em que estavam, pois esta e a tatica mais economica. Assim, a solucao otima
u
= F
(t) = R
1
2
B
T
p
(t),
que depende da trajet oria otima do coestado p(t). Lembrando que coestado
e estado sempre podem ser relacionados por p(t) = P
(t)x(t) chegaramos a
u
(t) = R
1
2
B
T
P
(t)x
(t)
que caracteriza a solucao otima como uma realimenta cao de estados. Estado
e coestado podem ser obtidos da equa cao variacional
_
x(t)
p(t)
_
=
_
A BR
1
2
B
T
R
1
A
T
_ _
x(t)
p(t)
_
A solucao desta equa cao homogenea dar a origem `as trajet orias otimas x
(t)
e p
(t
f
)x(t
f
) = P
f
x(t
f
)
47
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 48
O carater hbrido destas condi coes de contorno algumas variaveis sao
iniciais, outras terminais e o principal obstaculo do caminho. Isto e con-
tornavel, conforme visto, mas para evitar estes inconvenientes das equa coes
variacionais podemos deduzir as solucoes a partir da equa cao de Riccatti: a
matriz P
P(t) = A
T
P(t) P(t)A + P(t)BR
1
2
B
T
P(t) R
1
P(t
f
) = P
f
O fato de considerarmos um regulador em tempo innito traz simpli-
ca coes: para o PRLHOTI, a solucao procurada e a solu c ao de regime
P
(t) = cte. = P
t
que sera a solucao positiva semidenida da ERMA, a Equacao de Riccati
Matricial Algebrica associada:
A
T
X + XAXBR
1
2
B
T
X + R
1
= 0
Designando esta solucao por P
(t) = R
1
2
B
T
P
(t) = F
(t)
A realimenta cao de estado e agora xa, ou invariante no tempo, o que
simplica bastante a implementa cao pr atica.
5.2 Encontrando a solucao da ERMA
A equa cao variacional pode ser representada de forma compacta
x
e
(t) = A
e
x
e
(t)
onde, para simplicar a notacao, usou-se
x
e
(t) =
_
x(t)
p(t)
_
; A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
A matriz A
e
e Hamiltoniana. Para uniformizar a notacao com a da se cao
A.9 do Apendice A, consideremos S = BR
1
2
B
T
e T = R
1
:
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 49
A
e
=
_
A S
T A
T
_
1
Segundo a propriedade A.9.1, o polin omio caracterstico de A
e
, aqui de-
signado por (), e par, ou seja, satisfaz a seguinte propriedade
() = ()
Vemos assim que o espectro de A
e
e simetrico com rela cao ` a origem do
plano complexo: se
i
e um autovalor de A
e
certamente
i
tambem o sera.
Neste ponto precisaremos relembrar a propriedade A.9.4, aqui reescrita para
maior comodidade:
Propriedade 5.2.1 Se H dom(Ric) e X = Ric(H), entao
a.) X e simetrica
b.) A + SX e estavel
c.) X e solu cao da equa cao de Riccati matricial algebrica
A
T
X + XA + XSX T = 0
A conseq uencia pr atica mais importante deste resultado e a maneira de
se obter uma solucao para a ERMA. Quando a estrutura modal de A
e
e
camarada, isto pode ser feito a partir do calculo dos autovetores associados
a autovalores estaveis. Se este caminho for problem atico devemos fatorar o
polin omio mnimo, conforme discutido na se cao A.9.
Do ponto de vista te orico e preciso ressaltar a importancia do item (b).
Com efeito, dizer que A+SX e estavel signica dizer que ABR
1
2
B
T
X =
A+BF
(A
e
) e particiona-la em
X
=
_
X
1
X
2
_
4. Obter X = X
2
X
1
1
, solucao da ERMA
5. Sendo F
= R
1
2
B
T
X aplicar a lei de controle u
= F
x ao sistema.
6. Os autovalores otimos da malha fechada sao os autovalores estaveis de
A
e
5.3 Um caminho alternativo
Os aspectos basicos mais importantes, apresentados ao longo do texto, foram
recapitulados na se cao anterior. Passamos agora a reapresentar uma parte
desse material de maneira diferente, com um nvel de detalhamento maior
mas de modo ligeiramente menos geral. No restante desta se cao usaremos a
hip otese de que os autovalores de A
e
sao distintos. Com perdas irrisorias de
generalidade esta hipotese simplicara os desenvolvimentos, pois permitir a
exprimir os subespacos espectrais em termos dos autovetores, deixando assim
transparecer com mais clareza os fatos importantes. Como primeira aplicacao
redemonstraremos a propriedade A.9.4, com a hipotese adicional.
Demonstracao: Podemos ordenar o espectro de A
e
, colocando em pri-
meiro lugar os autovalores com parte real positiva:
(A
e
) =
1
,
2
, . . . ,
n
,
n+1
, . . . ,
2n
onde Re(
i
) 0 i = 1, 2, . . . , n e Re(
i
) 0 i = n+1, . . . , n.
Se algum autovalor
j
e imagin ario puro (Re(
j
) = 0), ele pode ser
colocado em qualquer uma das parti coes; seu conjugado deve ser colocado na
outra. Sejam w
i
, i = 1, 2, . . . , 2n os autovetores associados aos autovalores
i
: A
e
w
i
=
i
w
i
, i = 1, 2, . . . , 2n. Como por hipotese os
i
sao distintos os w
i
serao linearmente independentes e a matriz W = [w
i
w
2n
] sera inversvel.
Efetuando a munda ca de bases x
e
(t) = W x
e
(t) teremos
A
e
= W
1
A
e
W =
_
0
0
_
, onde
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 51
=
_
2
.
.
.
n
_
=
_
n+1
n+2
.
.
.
2n
_
_
Se os autovalores tiverem sido ordenados de uma maneira simetrica tere-
mos
i
+
i+n
= 0, i = 1, 2, . . . , n e, obviamente
= ;
= onde =
_
2
.
.
.
n
_
_
Particionando o vetor expandido x
e
como x
e
=
_
q
I
q
II
_
teremos
q
I
= q
I
e q
II
= q
II
Por outro lado, x
e
= W
1
x
e
, o que permite escrever
_
q
I
q
II
_
=
_
V
11
V
12
V
21
V
22
_ _
x
p
_
onde ja particionamos W
1
= V de maneira compatvel. A variavel q
I
(t)
pode ser obtida a partir de
q
I
(t) = V
11
x(t) + V
12
p(t)
= V
11
x(t) + V
12
P
x(t)
= (V
11
+ V
12
P
)x(t)
Se as condi coes iniciais foram colocadas corretamente o x(t) da express ao
acima deve ser substitudo por x
)x
0
= 0. Todo
este arrazoado deve ser independente da condi cao inicial x
0
e assim podemos
colocar
V
11
+ V
12
P
= 0
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 52
Usando outra linha de argumenta cao provaramos que V
12
e inversvel, e
isto leva a
P
= V
1
12
V
11
Pronto, eis a um modo de exprimir P
= V
1
12
V
11
= W
22
W
1
12
Se a matriz A
e
for facilmente diagonalizavel as identidades acima podem
ser uteis para o calculo de P
.
E sempre util ter em mente que todos estes
aspectos ja foram vistos anteriormente, com uma abordagem mais geral,
concisa e elegante. Para ver onde cam os autovalores otimos, consideremos
a solucao x
e
(t) da equa cao variacional:
x
e
(t) = W x
e
(t)
= We
(tt
0
)
Ae
W
1
x
0
e
Desenvolvendo:
_
x
(t)
p
(t)
_
= W
_
_
e
(tt
0
)
0
0 e
(tt
0
)
_
_
_
V
11
V
12
V
21
V
22
_ _
x
0
P
x
0
_
_
x
(t)
p
(t)
_
=
_
W
11
W
12
W
21
W
22
_
_
_
e
(tt
0
)
0
0 e
(tt
0
)
_
_
_
(V
11
+ V
12
P
)x
0
(V
21
+ V
22
P
)x
0
_
Como V
11
+ V
12
P
= 0 temos
_
_
_
x
(t) = W
12
e
(tt
0
)
(V
21
+ V
22
P
)x
0
p
(t) = W
22
e
(tt
0
)
(V
21
+ V
22
P
)x
0
Para t = t
0
a primeira das igualdades acima se particulariza em
x
(t
0
) = x
0
= W
12
e
0
(V
21
+ V
22
P
)x
0
Como isto deve ser verdadeiro x
0
, teremos V
21
+V
22
P
= W
1
12
e pode-
mos escrever, nalmente,
x
(t) = W
12
e
(tt
0
)
W
1
12
x
0
Isto mostra claramente que os autovalores do sistema de malha fechada
otimo os modos respons aveis pelo comportamento dinamico da trajet oria
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 53
x
) (A
e
)
4. se A
e
e diagonalizada como
A
e
=
_
0
0
_
= W
1
A
e
W = V A
e
V
1
onde engloba os autovalores com parte real positiva entao a solu cao
de regime da ERMA sera
P
= V
1
12
V
11
= W
22
W
1
12
5. a trajetoria otima do regulador sera
x
(t) = W
12
e
(tt
0
)
W
1
12
x
0
Para concluir este enfoque,
Algoritmo para Solucao do PRLOHTI
1. Vericar se < A, B, D > e estabiliz avel e detet avel
2. Supondo que sim, construir
A
e
=
_
A BR
1
2
B
T
R
1
A
T
_
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 54
3. Diagonaliza-la separando os modos inst aveis dos estaveis:
W
1
A
e
W =
_
0
0
_
4. P
= W
22
W
1
12
5. u
= F
= R
1
2
B
T
P
0
[x
T
(t)R
1
x(t) + ru
2
(t)] dt, onde
R
1
=
_
1 b
b a
_
; a b
2
> 0 (para que R
1
> 0); r = 1
A ERMA sera A
T
X + XAXBR
1
2
B
T
X + R
1
= 0. Usando os valores
dados somos levados a
_
0 0
1 0
_
X + X
_
0 1
0 0
_
X
_
0 0
0 1
_
X =
_
1 b
b a
_
Solucao frontal da ERMA
Para este caso, razoavelmente simples, resolveremos a ERMA na mar-
ra. A solu cao positiva denida X sera da forma
X =
_
x
11
x
12
x
12
x
22
_
Entrando com isto na ERMA obteremos
_
0 0
x
11
x
12
_
+
_
0 x
11
0 x
12
_
_
x
12
2
x
12
x
22
x
12
x
22
x
22
2
_
=
_
1 b
b a
_
donde tiramos as equa coes
_
_
x
12
2
= 1
2x
12
x
22
2
= a
x
11
x
12
x
22
= b
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 55
que podem ser resolvidas facilmente, dando origem a
_
_
x
12
= 1
x
22
=
a + 2x
12
x
11
= b + x
12
x
22
O teorema A.4.1, de Sylvester, garante que os menores principais de X
devem ser positivos
_
x
11
> 0
x
11
x
22
x
12
2
> 0
A segunda desigualdade acima pode se transformar em x
11
x
22
> x
12
2
= 1,
usando resultado imediatamente anterior. Como x
11
> 0 temos trivialmente
que x
22
> 1/x
11
donde x
22
> 0 tambem, e podemos escolher
x
22
= +
a + 2x
12
A tarefa agora e decidir sobre o sinal de x
12
. Vamos supor que x
12
= 1.
Com isto:
_
x
22
=
a 2
x
11
= b
a 2
Como X e uma matriz real devemos ter a 2 0, ou seja, a 2.
Estamos em condicoes de estabelecer a seguinte cadeia logica:
x
11
x
22
> 1 = (b +
a 2)
a 2 > 1
= b
a 2 + (a 2) < 1
= b
a 2 < 1 a
= b < (1 a)/
a 2
Mas (1a) < 0, pois a 2. Isto implica que b < (1 a)/(
a 2 ) < 0.
Quadrando teremos
b
2
>
(a 1)
2
a 2
=
a
2
2a + 1
a 2
= a +
1
a 2
Notemos para terminar (em boa hora!), que 1/(a2) 0, porque a2
0. Mas isto signica que
b
2
> a +
1
a 2
a
o que e um absurdo, pois R
1
> 0 e consequentemente ab
2
> 0 e b
2
< a. Esse
longo e articioso raciocnio chega nalmente a seu alvo, a determinacao de
X, solu cao da ERMA, em termos dos parametros de R
1
:
x
12
= 1
x
22
=
a + 2
x
11
= b +
a + 2
_
_
= X =
_
b +
a + 2 1
1
a + 2
_
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 56
Solucao por Diagonalizacao
Para evitar as delicadezas de um procedimento como este anterior, po-
demos usar a teoria precedente e seus metodos automatizados para obter
solu coes da ERMA. Uma simples substituicao dos dados do problema forne-
ceria a matriz
A
e
=
_
_
0 1 0 0
0 0 0 1
1 b 0 0
b a 1 0
_
_
cujo polinomio caracterstico e dado abaixo, juntamente com suas razes
() = det(I A
e
) =
4
a
2
+ 1 =
2
=
_
_
a +
a
2
4
2
= k
1
a
a
2
4
2
= k
2
A partir daqui temos o espectro de A
e
, seus autovetores e a matriz de
mudan ca de bases W:
(A
e
) =
_
k
1
,
_
k
2
,
_
k
1
,
_
k
2
=
1
,
2
,
3
,
4
W =
_
_
1 1 1 1
1
2
3
4
(
1
3
a
1
b) (
2
3
a
2
b) (
3
3
a
3
b) (
4
3
a
4
b)
1
2
2
2
3
2
4
2
_
_
donde podemos extrair, lembrando a recente teoria, P
= W
22
W
1
12
, resul-
tando
P
=
_
3
3
a
3
b
4
3
a
4
b
3
2
4
2
_ _
1 1
3
4
_
1
=
_
3
4
(
3
+
4
) + b
4
2
+
4
3
+
3
2
a
4
(
3
+
4
)
_
Pronto! Ufa . . .
E so efetuar os calculos e teremos
X =
_
b +
a + 2 1
1
a + 2
_
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 57
como anteriormente, e logico. Qual dos dois metodos e mais simples? Para
pegar a fera `a unha, com a pura for ca das nossas munhecas, ambos pare-
cem desanimadoramente trabalhosos e a escolha mais razoavel seria pedir
um computador, pois anal e para isso mesmo que eles existem.
O controle otimo propriamente dito sera dado por u
(t) = F
(t)x(t), onde
F
(t) = R
1
2
B
T
X = [ 1
a + 2 ]
Com estes valores o sistema de malha fechada cara
A + BF
=
_
0 1
1
a + 2
_
com equa cao caracterstica e autovalores dados por
F
() =
2
+ (
a + 2) + 1 =
_
a + 2 +
a 2
2
a + 2
a 2
2
Discussao da Solucao
caso a = 0: isto signica nenhuma enfase na componente x
2
= x
1
. Nao
estamos interessados na derivada da sada ou seja, a velocidade pode
ser alta. Os autovalores seriam
2 j
2
2
e teramos uma solu cao os-
cilat oria.
caso a = 2: ja passamos a penalizar velocidades muito grandes, e os auto-
valores serao
20
2
= 1, reais e iguais signicando amortecimento
crtico. O sistema e mais lento mas oscila menos.
caso a > 2: agora e importante termos velocidades baixas. Os polos serao
reais e distintos e a resposta sera super amortecida, isto e, lenta mas
com derivada baixa.
ausencia de b: tanto a realimenta cao otima F
i
dependem apenas do parametro a. Isto signica que os ter-
mos cruzados x
1
x
2
, ponderados pelo parametro b em R
1
, nao afetam a
solu cao otima. Fatos semelhantes acontecem com alguma freq uencia, e
sao, possivelmente, os responsaveis por uma pratica bastante comum:
o uso de matrizes de ponderacao diagonais.
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 58
5.4 Que Acontece aos Polos?
Veremos agora um enfoque frequencial da teoria do Regulador Linear Qua-
dr atico. Por enfoque frequencial entendemos a analise dos aspectos relacio-
nados `as funcoes de transferencia e seus par ametros. Seja entao o sistema
usual
o
_
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
Podemos tambem representa-lo por meio de
o
_
_
Z(s) = G(s)U(s) + G
(s)x
0
, onde
G(s) = D(sI A)
1
B, e G
(S) = D(SI A)
1
Seja o PRLOHTI, onde, para Q > 0 e R > 0 devemos minimizar
J = J(u) =
_
t
0
[z
T
(t)Qz(t) + u
T
(t)Ru(t)] dt
Supondo que u
(t) = F
_
x(t) = (A + BF
_
Z(s) = G
F
(s)U(s) + G
F
(s)x
0
, onde
G
F
(s) = D(sI ABF
)
1
B, e G
(s) = D(sI A BF
)
1
Qual e a localizacao otima no plano complexo C para os autovalores de
(A + BF
_
Q = I = xa
R = rN onde r e um escalar variavel
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 59
Isto signica que todas as componentes da sada estao sendo igualmente
ponderadas. Outras matrizes nao tao triviais poderiam ter sido escolhidas
mas o algebrismo caria seriamente comprometido e as conclusoes qualita-
tivas seriam praticamente identicas. A escolha R = rN signica que todos
os elementos de R variar ao proporcionalmente. Isto e uma hip otese razoavel
e simplicara bastante as coisas. Valores elevados de r signicam controle
caro ou seja, os nveis de u() devem ser mantidos baixos. Valores pequenos
para r permitem grandes amplitudes da entrada, caracterizando o controle
barato.
Veremos agora a localizacao dos polos de malha fechada em funcao de r.
J a sabemos que os autovalores de A+BF
e
(s) = det(sI A)det(I)det(sI A)det[I + R
1
2
G
T
(s)G(s)]
Finalmente, lembrando que det(sI A) = (s) e o polin omio carac-
terstico de A:
e
(s) = (1)
n
(s)(s)det
_
I +
1
r
N
1
G
T
(s)G(s)
_
As razes estaveis deste polin omio sao os polos do regulador otimo. Vamos
simplicar mais, considerando o caso monovariavel: G(s) e um escalar, o
quociente entre os polin omios n(s) e d(s):
G(s) =
n(s)
d(s)
G
T
(s) =
n(s)
d(s)
Como N = 1 para o caso escalar caremos com
e
(s) = (1)
n
d(s)d(s)
_
1 +
1
r
n(s)
d(s)
n(s)
d(s)
_
= (1)
n
_
d(s)d(s) +
1
r
n(s)n(s)
_
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 60
Supondo que
n(s) = k
0
p
i=1
(s
i
)
d(s) =
n
i=1
(s
i
)
_
_
onde
_
_
k
0
ganho de G(s)
i
zeros de G(s)
i
polos de G(s)
teremos
n(s) = k
0
(1)
p
p
i=1
(s +
i
)
d(s) = (1)
n
n
i=1
(s +
i
)
e entao
e
(s) = (1)
n
_
(1)
n
n
i=1
(s
i
)(s +
i
) +
k
2
0
r
(1)
p
p
i=1
(s
i
)(s +
i
)
_
= (1)
2n
_
n
i=1
(s
i
)(s +
i
) +
k
2
0
r
(1)
pn
p
i=1
(s
i
)(s +
i
)
_
Como (1)
2n
= 1 e (1)
pn
= (1)
np
temos que analisar as razes
estaveis do polin omio
e
(s) =
n
i=1
(s
i
)(s +
i
) +
k
2
0
r
(1)
np
p
i=1
(s
i
)(s +
i
)
Isto pode ser escrito de outro modo, mais propcio `as tecnicas do metodo
do Lugar das Razes:
1 + (1)
np
K
p
i=1
(s
i
)(s +
i
)
n
i=1
(s
i
)(s +
i
)
= 0
Ja se pode tirar algumas conclusoes:
1. Quando K 0 (r ) as 2n razes se aproximam dos polos
i
e de
seus negativos
i
.
2. Quando K (r 0), entao 2p das 2n razes se aproximam dos
zeros
i
e de seus negativos
i
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 61
3. Quando K (r 0), as 2n 2p razes restantes convergem para
assntotas retas que se cruzam na origem e que fazem com o eixo real
positivo angulos de
_
_
j
n p
j = 0, 1, . . . , 2n 2p 1 para (n p) mpar
(j + 1/2)
n p
j = 0, 1, . . . , 2n 2p 1 para (n p) par
4. Quando K (r 0), as 2n 2p razes estao a uma dist ancia da
origem dada por (
k
2
0
r
)
1
2(np)
.
Uma simples aplicacao das regras basicas para construcao do Lugar das
Razes permite o estabelecimento dos fatos acima.
Exemplo 5.4.1 Para o sistema com n = 3 e p = 1 dado pela matriz de
transferencia G(s) = (s + 1)/s(s 2)(s + 3) devemos considerar a equa cao
1 + (1)
2
K
(s + 1)(s 1)
s(s 2)(s + 3)s(s + 2)(s 3)
= 0
O tracado do Lugar das Razes para este polinomio em termos do para-
metro r = 1/K pode ser visto na gura a seguir:
E
Re
e
e
T
Im
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
_ _ _ _ _ _
r0
r
r
Lugar das Razes para o exemplo
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 62
5.5 Resumo Teorico
Tendo em mente que os polos do regulador otimo sao os autovalores estaveis
de A
e
podemos resumir e legitimar as conclusoes atingidas acima. Para isso,
seja o sistema monovariavel, estabiliz avel e detet avel dado por
o
_
_
x(t) = Ax(t) + bu(t); x(t
0
) = x
0
z(t) = dx(t)
ou entao por
G(s) = d(sI A)
1
b = k
0
p
i=1
(s
i
)
n
i=1
(s
i
)
para o qual desejamos resolver o PRLOHTI, ou seja, para r > 0 minimizar
o criterio
J =
_
0
[z
2
(t) + ru
2
(t)] dt
Teorema 5.5.1 1. Quando r os n polos do regulador otimo se
aproximam dos valores
i
, i = 1, 2, . . . , n dados por
i
=
_
i
se Re(
i
) 0
i
se Re(
i
) > 0
2. Quando r 0, p dos n polos do regulador otimo se aproximam dos
valores
i
, i = 1, 2, . . . , p onde
i
=
_
i
se Re(
i
) 0
i
se Re(
i
) > 0
3. Quando r 0, os np polos restantes do regulador otimo aproximam-
se assintoticamente de linhas retas que se interceptam na origem e que
fazem com o eixo real positivo angulos de
_
n p
, = 0, 1, 2, . . . para n p mpar
( + 1/2)
n p
, = 0, 1, 2, . . . para n p par
Estes polos longnquos distam da origem
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 63
w
0
=
_
k
2
0
r
_ 1
2(np)
O posicionamento destes polos longnquos recebe o nome de Congu-
racao de Butterworth de ordem (n p) com raio w
0
Na pr oxima gura vemos esbocos para as conguracoes de Butterworth
de ordens 1, 2, 3, 4, 5.
ordem 1 ordem 2 ordem 3
ordem 4 ordem 5
`
`
`
`
`
Z
Z
Z
Z
Z
`
`
`
`
`
/
/
/
/
/
.
.
.
.
.
.
`
`
`
`
`
.
.
.
.
.
.
\
\
\
\
\
\
/
/
/
/
/
/
Congura coes de Butterworth
Para o caso de v arias entradas e v arias sadas podemos chegar a conclusoes
analogas desde que denamos a contento polos e zeros de um sistema. A
maior complicacao aparece no comportamento dos polos longnquos, quando
teramos conguracoes de Butterworth m ultiplas com raios distintos etc.
5.6 Discussao dos Resultados
5.6.1 Caso do Controle Barato, r pequeno.
Grandes amplitudes sao permitidas em u e por isso a resposta pode ser
rapida, ou seja, temos polos que podem se afastar bastante, podem se tornar
longquos. Eles serao respons aveis pelos movimentos rapidos, pelas amplitu-
des grandes em u. Mas nem todos os polos se afastam, alguns tendem aos
zeros estaveis de G(s). Isto e interessante pois indica que o cancelamento
de polos e zeros (no semiplano esquerdo!) esta embutido no mecanismo do
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 64
regulador otimo. Seja por exemplo um sistema com G(s) = n(s)/d(s). Ap os
a realimenta cao otima u = F
x + v teremos
G
F
(s) =
n
F
(s)
d
F
(s)
=
n(s)
d
F
(s)
=
p
i=1
(s
i
)
d
F
(s)
onde d
F
(s) e composta pelos autovalores de A
e
.i upondo controle barato
teremos r 0 e
d
F
(s)
p
i=1
(s
i
)
np
i=1
(s
i
w
0
)
onde
i
=
_
i
se Re(
i
) 0
i
se Re(
i
) > 0
e os termos (s
i
w
0
) representam os polos distantes.
Supondo que o sistema de malha aberta e de defasagem (ou fase) mnima
teremos que todos os zeros de G(s) estar ao localizados no semiplano esquerdo,
ou seja, Re(
i
) < 0, i = 1, 2, . . . , p e assim
G
F
(s) = T(s)
n
F
(s)
p
i=1
(s
i
)
np
i=1
(s
i
w
0
)
=
1
np
i=1
(s
i
w
0
)
Todos os zeros (est aveis) de G(s) sao cancelados pelo controle otimo. A
malha fechada passa a depender apenas dos polos distantes. O polin omio
np
i=1
(s
i
w
0
)
e chamado de polin omio de Butterworth de ordem (np) e seus coecientes
dependem apenas de (n p). Por exemplo, para
n p = 1 teremos s + 1
n p = 2 teremos s
2
+ 1, 414s + 1
n p = 3 teremos s
3
+ 2s
2
+ 2s + 1
n p = 4 teremos s
4
+ 2, 613s
3
+ 3, 414s
2
+ 2, 613s + 1
n p = 5 teremos s
5
+ 3, 236s
4
+ 5, 236s
3
+ 5, 236s
2
+ 3, 236s + 1
Se o sistema e de fase nao mnima, a funcao de transferencia de malha
fechada T(s) contera fatores do tipo
s +
i
s
i
e os polos pr oximos afetar ao a conguracao nal, nao sendo cancelados todos
como acontecia antes. Isto signica que a velocidade de sistemas de fase
nao mnima esta limitada pelos polos pr oximos de origem.
CAPTULO 5. PROPRIEDADES DA SOLUC
AO DO PRLOHTI 65
5.6.2 Caso do Controle Caro, r .
As amplitudes da entrada sao muito penalizados. Neste caso a melhor solucao
e deixar inalterados os polos estaveis de G(s) e trazer os inst aveis ate suas
imagens especulares. Intuitivamente poderamos pensar que seria mais eci-
ente, mais barato mexer nos polos inst aveis apenas o suciente para traze-
los ate a regi ao permitida, alocando-os bem pr oximos ao eixo imagin ario, j a
no semiplano esquerdo. A teoria mostra que este palpite e falso.
E muito mais coisas ainda se poderiam dizer, o campo e vasto e fascinante.
Paramos por aqui, com alguma pena. Mas o assunto se encontra em v arias
e v arias obras, e se os leitores e leitoras se sentirem motivados a procur a-las
entao estas notas terao cumprido sua missao.
Captulo 6
Projeto
Otimo de Observadores
Na teoria dos estimadores assintoticos de estado um aspecto e, normalmente,
tratado com alguma supercialidade: a escolha dos polos. Sao feitos comen-
tarios gerais no sentido de alocar os autovalores o mais `a esquerda possvel
pois isso beneciaria a rapidez de convergencia; os inconvenientes seriam
problemas de amplicacao de rudos e satura cao de componentes. Algumas
regras empricas sao fornecidas, como por exemplo: colocar os polos de 5 a
10 vezes mais `a esquerda do que os polos escolhidos para a planta.
Este importante problema mereceria um tratamento mais rigoroso e pre-
ciso, e a teoria de Controle
Otimo e, em particular, os resultados recem
estudados do Problema do Regulador Linear Quadr atico, sao sugest oes na-
turais para a empreitada. Trataremos dela neste captulo, come cando com
uma breve revis ao sobre
6.1 Observadores Assintoticos de Estados
Supomos, como sempre, que o sistema que se quer controlar a planta ou
processo admite o seguinte modelo linear e invariante no tempo:
o
_
_
x(t) = Ax(t) + Bu(t); x(t
0
) = x
0
z(t) = Dx(t)
y(t) = Cx(t)
onde x(t) IR
n
e o estado no instante t; u(t) IR
m
e a entrada em t; z()
representa a combinacao das variaveis de estado que queremos controlar, com
z(t) IR
p
e y() a combinacao das variaveis que podemos medir efetivamente
e que deve ser usada para implementar a lei de controle; y(t) IR
r
.
A esta planta acoplaremos um sistema O, tambem linear e invariante no
tempo descrito por
66
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 67
O
_
_
v(t) = Gv(t) + Hu(t) + Jy(t); v(t
0
) = v
0
w(t) = Mv(t) + Ny(t)
onde v(t) IR
o
representa o estado deste sistema no instante t; as matrizes
G, H, J, M e N terao dimens oes o o, o m, o r, n o e n r, respecti-
vamente. O diagrama de blocos seguinte permite visualizar a situa cao:
E
u
o
E
z
y
H
E m E
_
+
M
E m E
+
H
'
T
c
J
c
E
E
c
N
c
E
v v w
Percebe-se que o sistema O funcionara como um estimador ou observador
assintotico do estado x(t) do sistema o se e somente se (t) 0 quando
t onde a grandeza erro de estimacao e denida como
(t) = w(t) x(t)
O resultado seguinte e classico da teoria dos sistema lineares:
Teorema 6.1.1 O sistema O e um observador assintotico do estado x(t) do
sistema o se e somente se existir uma matriz T o n, com o n tal que
TAGT = JC (6.1)
TB = H (6.2)
MT + NC = I
n
(6.3)
(G) C
(6.4)
O projeto dos observadores se resume assim a resolver as equa caos matri-
ciais acima, que sao chamadas de Rela coes Fundamentais dos Observadores,
as RFO.
Uma possvel solucao para as RFO seria escolher T = I
n
, M = I
n
e
N = 0. Isto faz com que w = v ou seja, o pr oprio estado do observador
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 68
estima o estado da planta; faz tambem com que a escolha de H seja direta:
H = B. A equa cao 6.1 se reduz a
AG = JC
e o problema todo se resume a encontrar uma matriz J de tal modo que
(G) = (AJC) C
O problema agora e achar u() tal que o sinal e() seja regulado de maneira
otima. Isto signca que e(t) 0 de tal modo que o ndice
_
0
_
e
T
(t)Qe(t) + u
T
(t)R u(t)
_
dt
onde Q > 0 e R > 0 seja minimizado.
Mas e(t) = y(t) y(t) = C(x(t) w(t)) = C(t), donde
e
T
(t)Qe(t) =
T
(t)C
T
QC(t) =
T
(t)R
1
(t)
e o ndice pode ser reescrito:
_
0
_
T
(t)R
1
(t) + u
T
(t)R u(t)
_
dt
onde R
1
= C
T
QC 0 e R > 0.
Para que a teoria precedente possa ser aplicada devemos encontrar um
sistema para o qual (t) seja o estado e u seja a entrada. Vejamos:
= w x = Aw + Bu + u Ax Bu
= A + u
Parece pronto. Seja entao o sistema
_
_
(t) = A(t) + u(t)
(0) =
0
= w(0) x(0)
para o qual desejamos encontrar uma entrada u() que minimiza o ndice
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 71
_
0
_
T
(t)R
1
(t) + u
T
(t)R
2
u(t)
_
dt
onde R
1
= C
T
QC 0 e R
2
= R > 0.
A solucao e conhecida:
u(t) =
F(t) = R
1
2
I
T
P
(t)
onde P
0 e a solucao da ERMA
A
T
X + XAXR
1
2
X + R
1
= 0
O conceito de estimador de estados exige que a entrada u seja expressa
em termos do sinal e:
u(t) = Je(t) = JC(t)
donde conclumos que
JC =
F
Ha um pequeno problema aqui! Como o sinal u entra na equa cao de
atraves da matriz identidade I a solucao otima
F sera uma matriz quadrada.
Como
F = R
1
2
P
o posto de
F sera, muito provavelmente, completo, ou
seja: (
F) = n. Mas
(JC) (C) = r < n = (
F)
signicando que, em geral, a equa cao JC =
E claro que uma estima cao mais rapida (sempre desejavel) implica em
amplitudes elevadas para o sinal u = y JCv, mas . . . qual seria o problema
disto? Este e um sinal interno, nao ha qualquer atuador fsico cuja capacidade
seria excedida. Este sinal sera, muito provavelmente, representado por bytes
em um computador, e podera crescer sem perigo de satura coes. Os perigos
estao em outros lugares.
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 72
O pior efeito possvel de se aumentar a velocidade de convergencia e per-
mitir que rudos presentes em y se propaguem por todo o sistema. Em outras
palavras, o aumento indiscriminado de J alargaria a banda de passagem do
estimador, e os rudos de y deixariam de ser bloqueados; ou, pior, poderiam
ser amplicados ate contaminar todo o sistema e tirar a validade de quaisquer
sinais obtidos como resposta deste.
Rudos existem, sao inevitaveis: podem ser introduzidos pelos instrumen-
tos de medida, podem estar presentes nos sinais de controle, podem entrar
no sistema em qualquer outro ponto ou por qualquer outro meio. Assim, o
verdadeiro problema a se resolver, o problema de importancia pr atica real, e
o de se evitar a propaga cao de rudos atraves da malha.
Consideremos entao uma situa cao bastante geral, de um sistema o com
entrada u, sada y
c
e sujeito `a acao de outras entradas
E
o
E
u
y
c
c
E
y
c
O sinal y seria a sada pura ao passo que y
c
e a sada real ou conta-
minada. O verdadeiro problema de se projetar um dispositivo pr atico de
estima cao e o de recuperar o estado x da planta, de uma maneira otima
(em um sentido ainda a ser explicado), mesmo em presenca de rudos com
caractersticas conhecidas.
Esta mesma situa cao pode ser encarada em um outro contexto, onde es-
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 73
taramos mais interessados em limpar o sinal y
c
. Diramos que o verdadeiro
problema de se projetar um dispositivo pr atico de ltragem e o de recuperar
as informacoes contidas na sada y do sistema o acionado apenas por u (sem
), a partir do sinal real y
c
.
Os problemas do observador otimo e do ltro otimo tem rela coes profun-
das, como veremos. A partir de agora, atencao apenas para o caso linear e
invariante no tempo. As equa coes dinamicas sao:
o
_
_
x(t) = Ax(t) + Bu(t) + B
(t)
y
c
(t) = Cx(t) + (t) = y(t) + (t)
O diagrama de blocos associado e
E
B
E j
+
E
_
E
C
E j
+
E
A
'
T
c c
B
E
u
x
y
y
c
Ha dois casos particulares de interesse. Quando B
= B o sinal tem
a mesma dimens ao de u e teremos x = Ax + B(u + ), ou seja, o rudo
contamina diretamente a entrada, sendo chamado de rudo ou dist urbio de
comando ou de entrada. Quando B = I o sinal tem dimens ao n e afeta
diretamente os estados. O diagrama abaixo ilustra estes casos.
E j
+
E
c
u
B
E . . . E
B
E j
+
E
c
u
_
x = Ax + Bu + B
y
c
= Cx +
O
_
_
v = Av + Bu + J(Cx + Cv)
e = Cx + Cv
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 74
E
u
B
E j
c
+
T
B
_
J
v v = w
E
A
j
+
'
C
y = Cv E
'
e
E
_
x x
E
A
'
C
E j
+
E
c
E
y
c
E j
+
E E
c
T
c
T
O projeto se resume a encontrar uma matriz J tal que (AJC) C
,
o que obrigaria o erro de estima cao a se aproximar assintoticamente de zero:
(t) 0. Escrevendo as equa coes para o sistema expandido obteremos
o +O
_
_
_
x
_
=
_
A 0
0 AJC
_ _
x
_
+
_
B
0
_
u +
_
B
_
_
0
J
_
e = [ 0 C ]
_
x
_
+
Para perceber os efeitos dos rudos de maneira mais clara e interessante
encontrar uma descricao freq uencial para o sistema acima: E(s) =
[ 0 C ]
_
sI A 0
0 sI G
_
1
__
B
0
_
u +
_
B
_
_
0
J
_
_
+ (s)
onde G = AJC. Desenvolvendo mais chegaramos a
E(s) = C(sI G)
1
B
(s) C(sI G)
1
J(s) (s)
ou, mais compactamente, denindo as matrizes de transferencia T
(s) e T
(s):
E(s) = T
(s)(s) + (s) T
(s)(s)
Conforme aumentamos os ganhos J os autovalores de G = A JC se
deslocam mais para a esquerda do plano complexo, tornando mais larga a
banda de passagem das matrizes T
(s) e T
(s).
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 75
Suponhamos, para come car, que os rudos e sao, ambos, sinais com-
postos apenas por freq uencias baixas. Isto signica que eles atravessam os
sistemas T
e T
e T
(s)(s)+(s)T
E
y
c
T
E
y
Devemos encontrar um ltro T capaz de gerar uma estimativa otima y
para o sinal y. Ou seja, o ltro deve anular os efeitos dos rudos e .
Os ltros tradicionais podem cumprir esta missao, desde que os sinais
sejam bem conhecidos, e seus espectros tenham caractersticas bem determi-
nadas. Quando, por exemplo, e sao sinais de baixa freq uencia o ltro T
deve ter caractersticas de passa-baixas; quando os rudos sao baseados em
uma unica freq uencia usa-se um ltro notch. E por a vai.
Estas hipoteses sao limitadoras, os problemas reais podem ser bem mais
complicados: os espectros dos sinais envolvidos y, e podem se so-
brepor, ou entao podem nao ser bem conhecidos. Temos aqui exatamente os
mesmos inconvenientes apontados anteriormente para os estimadores: o uso
da caracterizacao freq uencial classica de sinais por meio dos seus espectros
nao se presta bem para o estudo de ltros ou de estimadores otimos.
Norbert Wiener, por volta de 1938, propos o uso de sinais estocasticos
para caracterizar as grandezas envolvidas nestes problemas e conseguiu resol-
ver o problema geral de ltragem, dando origem ao que se costuma chamar
de ltro de Wiener: ele encontrou um ltro T, caracterizado por sua matriz
de transferencia F(s) capaz de gerar uma estimativa otima de y.
Trinta anos depois Robert Kalman, trabalhando com variaveis de estados
e com o conceito de sinais estocasticos, resolveu o problema do estimador
otimo. Ficou entao clara a identidade entre observadores e ltros: eles sao a
mesma coisa! Com efeito, se um observador recupera o estado x de maneira
otima, basta multiplicar por C e teremos uma estimativa otima para y. O
nome usado para o estimador otimo pasou entao a ser: ltro de Kalman.
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 77
6.5 Medias e correla c oes de sinais
6.5.1 Valor medio de um sinal
6.5.2 Valor medio quadratico de um sinal
6.5.3 Variancia de um sinal
6.5.4 Autocorrelacao de um sinal
6.5.5 Correla cao cruzada entre dois sinais
6.5.6 Densidade espectral de um sinal
6.6 Variaveis aleatorias
6.6.1 Probabilidades
6.6.2 Valor medio
6.6.3 Variancia
6.6.4 Covariancia entre x e y
6.6.5 Funcao distribui cao de probabilidade
6.6.6 Funcao densidade de probabilidade
6.6.7 Media
6.6.8 Valor medio quadratico
6.6.9 Variancia e covariancia
6.6.10 Distribuicao uniforme
6.6.11 Distribuicao normal
6.7 Processos aleatorios ou estocasticos
6.7.1 Rudo branco
6.7.2 Processo gaussiano
6.7.3 Processo estocastico estacionario
6.7.4 Processo estocastico ergodico
6.7.5 Sistemas Lineares
6.7.6 Matriz de autocorrelacao
6.8 Formulacao e solucao
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 78
E
o
E j
+
u
y
c
E
y
c
O
E
w
c
E
O sinal e um rudo branco com media 0 e autocorrela cao Q > 0; o sinal
e tambem um rudo branco, com media nula e autocorrela cao R > 0. O
erro de estima cao = x w e um sinal tal que (t) IR
n
e que apresenta
um erro medio quadr atico dado por
e(t) =
n
i=1
E[
2
i
(t)]
O problema e projetar um estimador O que minimize o erro medio qua-
dr atico acima. A solucao e um observador identidade:
E
o
E j
+
u
y
c
y
c
c
j
+
T
E
B
E j
+
E
_
E
C
E
E
y
J
'
c
A
T
'
v
A matriz de ganhos sera dada por
J = PC
T
R
1
onde P e a solucao de uma equa cao de Ricatti Matricial algebrica:
AP + PA
T
PC
T
R
1
CP + BQB
T
= 0
CAPTULO 6. PROJETO
OTIMO DE OBSERVADORES 79
E um observador de ordem completa
E um problema de otimizacao dual do LQR
E o famoso Filtro de Kalman
E um estimador otimo e tambem um ltro, pois y e o resultado da
ltragem otima de y.
Iniciada em out/nov/85;
tecada com poucos
detalhes a mais
em set/out/88
por
Afonso Celso Del Nero Gomes,
ajudado pela
Angela.
Revista,
ampliada
e ilustrada
em jan/fev/mar/90.
Enriquecida em ns de 1991,
e em outubro/novembro de 1996,
e em outubro de 1999,
Finalmente pronta em . . . . . .
Logicamente
tambem houve muita
ajuda
dos que
seguem:
Apendice A
Formas Quadraticas
Como sempre acontece, uma leve recordacao de ferramentas matem aticas
e a melhor maneira de se iniciar novos estudos. Nesta se cao apresentare-
mos de maneira rapida, suscinta e geralmente sem provas, alguns resultados
matem aticos basicos que serao uteis para os desenvolvimentos posteriores.
A.1 Formas Lineares e Quadraticas
As ideias abaixo sao provavelmente conhecidas da maioria dos leitores.
Denicao A.1.1 Por Forma, Combinacao ou Funcional Linear das
variaveis x
1
, x
2
, . . . , x
n
entenderemos a expressao
L(x
1
, x
2
, . . . , x
n
) = l
1
x
1
+ l
2
x
2
+ + l
n
x
n
=
n
i=1
l
i
x
i
onde, i = 1, 2, . . . n, l
i
IR (corpo dos reais).
Exemplo A.1.1
L
1
= x
1
+ x
2
x
3
L
2
= 0, 5x
1
7x
2
+ 0x
3
x
4
Lembrando as propriedades do produto matricial podemos escrever:
L(x
1
, x
2
, . . . , x
n
) = l
1
x
1
+ l
2
x
2
+ + l
n
x
n
= [ l
1
l
2
l
n
]
_
_
x
1
x
2
.
.
.
x
n
_
_
80
AP
ATICAS 81
Agrupando as variaveis x
i
e os coecientes l
i
nos vetores x e L, como
abaixo,
L =
_
_
l
1
l
2
.
.
.
l
n
_
_
x =
_
_
x
1
x
2
.
.
.
x
n
_
_
podemos usar a compacta e economica notacao vetorial:
L(x
1
, x
2
, . . . , x
n
) = L(x) = L
T
x
onde o smbolo L
T
denota a transposta da matrix L. Supondo que as
variaveis x
1
, x
2
, . . . , x
n
sao variaveis reais podemos encarar L() como uma
transformacao linear
L : IR
n
IR
x L(x) = L
T
x
Dependendo dos valores das variaveis x
i
a forma linear L(x) pode assumir
valores positivos, negativos ou nulos. Deste modo podemos particionar IR
n
em tres regi oes: IR
n
= IR
n
IR
n
IR
n
0
para as quais
x IR
n
L(x) > 0
x IR
n
L(x) < 0
x IR
n
0
L(x) = 0
Exemplo A.1.2 Para a forma L(x) = x
1
+x
2
o plano e particionado como
na gura abaixo. A regiao IR
n
0
e sempre uma variedade linear: reta, plano,
etc.
d
d
d
d
d
d
d
d
d
d
_
'
IR
2
IR
2
x
2
x
1
IR
2
0
Mas isto tudo e terreno muitssimo conhecido, de usos e utilidades j a
sabidos, e bem sabidos (espera-se).
AP
ATICAS 82
Denicao A.1.2 Chamaremos de Forma ou Combinacao Quadratica
das variaveis x
1
, x
2
, . . . , x
n
a expressao
Q(x
1
, x
2
, . . . , x
n
) = q
11
x
1
x
1
+ q
12
x
1
x
2
+ + q
nn
x
n
x
n
=
n
i=1
n
j=1
q
ij
x
i
x
j
onde, i, j = 1, 2, . . . n, q
ij
IR.
Exemplo A.1.3
Q
1
= x
2
1
+ x
1
x
2
5x
2
2
Q
2
= x
1
x
3
x
2
x
3
+ 7x
3
x
1
x
2
4
Para obter uma notacao alternativa compacta e elegante, como foi feito no
caso anterior, deve-se desenvolver a expressao da forma quadr atica denida
acima e depois aplicar as regras do produto matricial. Ao trabalho.
Q(x
1
, x
2
, . . . , x
n
) = q
11
x
2
1
+ q
12
x
1
x
2
+ + q
1n
x
1
x
n
+
q
21
x
2
x
1
+ q
22
x
2
2
+ + q
2n
x
2
x
n
.
.
.
+q
n1
x
n
x
1
+ q
n2
x
n
x
2
+ + q
nn
x
2
n
Colocando em evidencia a variavel x
i
em cada uma das i linhas da ex-
press ao acima teremos:
Q(x
1
, x
2
, . . . , x
n
) = x
1
(q
11
x
1
+ q
12
x
2
+ + q
1n
x
n
) +
x
2
(q
21
x
1
+ q
22
x
2
+ + q
2n
x
n
) +
.
.
.
+x
n
(q
n1
x
1
+ q
n2
x
2
+ + q
nn
x
n
)
Observando que as expressoes entre parenteses sao funcionais lineares do
tipo Q
i
x = [q
i1
q
i2
q
in
]x onde x e o vetor com componentes x
i
podemos
escrever
Q(x
1
, x
2
, . . . , x
n
) = [ x
1
x
2
x
n
]
_
_
q
11
q
12
q
1n
q
21
q
22
q
2n
.
.
.
.
.
.
.
.
.
q
n1
q
n2
q
nn
_
_
_
_
x
1
x
2
.
.
.
x
n
_
_
E nalmente, chamando de Q a matriz quadrada trazida pelo desenvol-
vimento acima, podemos nalizar escrevendo a procurada notac ao vetorial:
AP
ATICAS 83
Q(x
1
, x
2
, . . . , x
n
) = Q(x) = x
T
Qx
onde, como ja deve ter dado para perceber, o smbolo M
T
denota a transposta
da matrix M.
Exemplo A.1.4
Q(x) = x
2
1
+ x
1
x
2
+ x
2
2
= [ x
1
x
2
]
_
1 1
0 1
_ _
x
1
x
2
_
Lembrando que o produto de reais e comutativo temos x
1
x
2
= x
2
x
1
e
tambem podemos exprimir a forma acima de outra maneira:
Q(x) = x
2
1
+ x
2
x
1
+ x
2
2
= [ x
1
x
2
]
_
1 0
1 1
_ _
x
1
x
2
_
Algo salta aos olhos no exemplo acima: o comportamento observado pode
perfeitamente ser encontrado em outras situa coes. Isto sugere uma genera-
liza cao, a qual, dada a sua trivialidade, sera apresentada sem provas:
Fato A.1.1 Uma forma quadratica Q(x) pode admitir varias representa coes
matriciais:
Q(x) = x
T
Q
1
x = x
T
Q
2
x =
ATICAS 84
Propriedade A.1.1 A uma forma quadratica Q(x) pode-se associar uma
unica representa cao matricial x
T
Sx onde S e uma matriz simetrica.
A prova de que a representa cao simetrica e unica e razoavelmente simples.
Vemos deste modo que dentre as innitas representa coes matriciais para uma
dada forma quadr atica ha sempre uma unica muito particular, envolvendo
uma matriz simetrica.
A.2 Sinal da Forma
A situa cao agora e um pouco mais elaborada do que no caso das formas
lineares, onde o espaco IR
n
sempre podia ser decomposto em tres regi oes.
Para as formas quadr aticas a riqueza e maior, como pode ser visto no . . .
Exemplo A.2.1 Para a forma Q(x) = x
2
1
x
2
2
o plano e particionado como
na gura abaixo.
d
d
d
d
d
d
d
d
d
d
_
'
+
+ +
+
x
2
x
1
IR
2
0
IR
2
0
Para este exemplo a forma pode assumir valores positivos, negativos, ou
nulos dependendo de x.
As formas lineares tem sempre um comportamento como o do exemplo
acima: ha pontos x que as tornam positivas, ha pontos que as tornam nega-
tivas e ha pontos que as anulam. As parti coes IR
n
, IR
n
, IR
n
0
, do espaco IR
n
sao sempre nao vazias. No caso das formas quadr aticas podemos ter outras
situa coes. Consideremos por exemplo:
Q(x) = x
T
_
1 0
0 1
_
x = x
2
1
+ x
2
2
onde temos: Q(x) > 0 x ,= 0 e Q(x) = 0 para x = 0. Da para perceber o
seguinte
Fato A.2.1 Uma forma quadratica sempre se anula em x = 0:
Q(x) = 0 para x = 0
AP
ATICAS 85
Dependendo do comportamento da forma para x ,= 0 poderemos reco-
nhecer v arios casos:
Denicao A.2.1 A forma quadratica Q(x) e Identicamente Nula quando
Q(x)= 0 x ,= 0 e escreveremos Q(x) 0.
Denicao A.2.2 A forma quadratica Q(x) e Positiva Denida quando
Q(x) > 0 x ,= 0; escreveremos Q(x) > 0. Uma forma quadratica Q(x) e
Negativa Denida quando Q(x) < 0 x ,= 0; escreveremos Q(x) < 0.
Denicao A.2.3 A forma quadratica Q(x) e Positiva Semidenida ou,
semipositiva denida, quando Q(x) 0 x ,= 0; escreveremos Q(x) 0.
Uma forma quadratica Q(x) e Negativa Semidenida quando Q(x)
0 x ,= 0; escreveremos Q(x) 0.
Denicao A.2.4 A forma quadratica Q(x) e Indenida quando nao se
encaixar em uma das categorias acima.
A.3 Exerccios
1. As formas abaixo sao do tipo x
T
Qx. Classic a-las quanto ao sinal.
Indicar, quando for o caso, as regi oes IR
n
, IR
n
e IR
n
0
.
(a) Q =
_
1 1
1 0
_
(b) Q =
_
1 1
1 1
_
(c) Q =
_
1 1/2
1/2 1
_
(d) Q =
_
0 1
1 0
_
(e) Q =
_
_
1 1 0
1 1 1
0 1 0
_
_
2. Sendo M uma matriz quadrada qualquer mostrar que
1
2
(M +M
T
) sera
simetrica.
AP
ATICAS 86
A.4 Criterios de denicao
As formas quadr aticas denidas e semidenidas sao muito importantes em
um sem n umero de problemas, como teremos a oportunidade de ver. Desta
maneira, devemos procurar metodos pr aticos para descobrir o sinal de uma
forma quadr atica.
Teorema A.4.1 (Sylvester) Uma forma Q(x) = x
T
Sx , onde S e uma
matriz simetrica, sera positiva denida se e somente se todos os seus menores
principais forem positivos:
Q(x) > 0 s
11
> 0;
s
11
s
12
s
21
s
22
> 0;
s
11
s
1n
.
.
.
.
.
.
s
n1
s
nn
> 0;
Q(x) = x
T
Sx sera negativa denida se e somente se Q(x) for positiva
denida ou seja, os menores principais de S forem alternadamente positivos
e negativos:
Q(x) < 0 Q(x) = x
T
(S)x > 0
ou entao,
(menor de ordem k)(1)
k
> 0, k = 1, 2, . . . n
Se nenhuma das condicoes for satisfeita a forma sera indenida.
ATICAS 87
A.5 Normas, Metricas e Tamanho
Apesar de um espaco vetorial nao ser ordenado podemos classicar seus ve-
tores de acordo com o tamanho. Para isso usamos as ideias de Norma ou
Modulo. Resumindo bastante uma teoria elaborada e bela, diramos que a
Norma Euclidiana, ou simplesmente Norma de um vetor x IR
n
e dada
por:
|x| = x
2
1
+ x
2
2
+ + x
2
n
Isto signica que a norma pode ser expressa como uma forma quadr atica:
|x| = x
T
x = x
T
Ix
onde I simboliza a matriz identidade. Aplicando o teorema de Sylvester ` a
matriz I vericaramos trivialmente ser ela positiva denida, donde se conclui
que |x| = x
T
x > 0 x IR
n
. Isto justica a deni cao de M odulo como
[x[ =
_
|x| =
_
x
2
1
+ x
2
2
+ + x
2
n
Nas aplicacoes pr aticas os elementos dos vetores sao grandezas fsicas,
e muitas vezes algumas destas grandezas sao mais importantes que outras.
Assim, seria interessante uma medida que evidenciasse isto, j a que a norma
atribui um peso igual `as componentes do vetor, quando gostaramos de privi-
legiar algumas delas. Podemos associar a ideia de norma a media aritmetica
simples, e dizer que estamos interessados em algo parecido com uma media
ponderada. Em outras palavras, se o tamanho de um vetor nos interessa mais
em algumas componentes, ou dire coes, do que em outras podemos atribuir
pesos a essas dire coes usando x
T
Dx onde os elementos da matriz diagonal D
reetiriam a importancia que se quer atribuir ou retirar dos componentes de
x. De um modo mais geral temos o
Fato A.5.1 Toda forma Q(x) = x
T
Sx onde S > 0 ou S 0 permite asso-
ciar ao vetor x um escalar Q(x) que pode representar uma medida do tama-
nho do vetor x, da sua distancia ate a origem. Dependendo da escolha de
S pode-se medir esse tamanho com enfase especial em algumas direcoes.
AP
ATICAS 88
Consideremos agora uma funcao do tempo
designada por x() ou simplesmente x.
Deve car claro que o smbolo x(t)
representa um n umero real, o
valor assumido pela funcao
x no instante t. Podemos
visualizar a situa cao por
meio de um ponto se
movendo sobre uma
trajet oria no IR
n
Usando uma forma
quadr atica e possvel representar a funcao vetorial x() por meio da funcao
real Q() = x
T
()Sx() onde S 0.
Z
Z
Z
Z
Z
Z
_
'
rx(t
0
)
Desta maneira, a gura tridimensional acima poderia ser substituda
pelo gr aco da funcao escalar
_
'Q(t)
t
ATICAS 89
A.6 Exerccios
1. Sendo x = Ax, tracar um gr aco para x
T
(t)Qx(t). A partir deste
gr aco e possvel dizer algo sobre a estabilidade do sistema? Use
A =
_
_
0 1 0
0 0 1
1 1 1
_
_ , x(0) =
_
_
1
1
1
_
_ , Q =
_
_
1 1 0
1 0 0
0 0 1
_
_
2. Idem 1 para Q =
_
_
1 1 1
1 1 1
1 1 1
_
_
3. Seja a matriz simetrica Q > 0, com dimens ao n n. Sendo M uma
matriz inversvel, que se pode dizer de P = M
1
QM? sera simetrica?
e o seu sinal?
4. Seja a matriz simetrica Q > 0, com dimens ao n n. Sendo D uma
matriz (r n), com r < n, que se pode dizer de P = DQD
T
? sera
simetrica? e o seu sinal?
5. Idem 4 para r > n
6. Idem 4 para r = n
A.7 Visao Geometrica das Formas Quadrati-
cas
Lembremos que a operacao v
T
w pode representar o produto escalar entre os
vetores v, w IR
n
. Mas o produto escalar pode ser expresso em termos dos
m odulos dos vetores envolvidos e do angulo compreendido entre eles:
_
v
.
.
.
.
.
.
..
w
v
T
w = [v[ [w[ cos
Desta maneira o produto escalar carrega informacoes a respeito da po-
sicao relativa entre os dois vetores. Assim, se v
T
w = 0 sabemos que v e w
sao ortogonais. Se v
T
w > 0 teremos que o m odulo do angulo entre eles e
menor do que /2 e assim estes vetores apontam na mesma dire cao, estao
em um mesmo semiespaco. Para v
T
w < 0 teremos cos negativo, > /2
AP
ATICAS 90
e os vetores v e w tentam seguir dire coes opostas. A gura abaixo ilustra
bem a situa cao. Para um vetor v xo temos tres possibilidades para w:
dd
dd
dd
dd
dd
dd
dd
Z
Z
Z
Z
Z
E
d
d
d
'
v
v
T
w > 0
v
T
w = 0
v
T
w < 0
v
T
w > 0 : mesma dire cao, mesmo semiespaco
v
T
w = 0 : ortogonais
v
T
w > 0 : dire cao oposta, semiespaco complementar
Com isto em mente a forma quadr atica x
T
Qx pode ser encarada como o
produto escalar entre x e Qx e assim x
T
Qx mediria a deformacao angular
causada pela aplicacao de Q a x, a quantidade de rotacao sofrida por x ate
se obter Qx. Assim, se para uma dada transformacao linear A : IR
n
IR
n
temos x
T
Ax > 0 x IR
n
isto signica que A e um mapa que preserva
a dire cao, ou seja um vetor x qualquer e sua imagem Ax estao sempre no
mesmo semiplano. Se x
T
Ax = 0 x IR
n
entao cada elemento x e girado de
/2.
Neste ponto podemos estabelecer a rela cao entre duas formas quadr aticas
iguais. Sejam Q
1
e Q
2
tais que x
T
Q
1
x = x
T
Q
2
x x IR
n
. Chamando
Q
2
Q
1
= M temos x
T
Q
1
x = x
T
(Q
1
+ M)x = x
T
Q
1
x + x
T
Mx, donde
x
T
Mx = 0 e M e ortogonal.
A.8 Miscelanea de F ormulas
A cole cao de resultados abaixo pode ser util em um grande n umero de si-
tua coes. Eles vir ao sem provas. Os smbolos A 0 ou A > 0 signicam,
como ja vimos, que a forma quadr atica x
T
Ax e positiva semidenida ou
positiva denida respectivamente.
Fato A.8.1 Seja C uma matriz mn
A = C
T
C = A 0
Fato A.8.2 Seja C uma matriz mn com rank (C) n
A = C
T
C = A > 0
Fato A.8.3 Seja C uma matriz n n com det(C) ,= 0
A = C
T
C = A > 0
AP
ATICAS 91
Fato A.8.4 A B AB 0
Fato A.8.5 A 0, B 0 A + B 0
Fato A.8.6 A 0, B 0 , AB 0
Fato A.8.7 Sendo um autovalor generico de A(n n):
A 0 =Re() 0
A > 0 =Re() > 0
A simetrica = IR
A simetrica, A > 0 = IR, > 0
Fato A.8.8 Se A e simetrica seus autovetores sao ortogonais e assim:
A e simetrica =A=U
T
U onde U e unitaria (U
T
U =I) e = diag(
i
)
Denicao A.8.1 A raiz quadrada matricial simetrica de A 0, designada
por A
1/2
ou
A e tal que
A = A e
A = (
A)
T
Fato A.8.9
A = U
T
1/2
U. Como U e nao unica a raiz quadrada matricial
simetrica e tambem nao unica.
Fato A.8.10 A 0 e simetrica, B 0 e simetrica , =AB 0
A 0 e simetrica, B 0 e simetrica , = ABsimetrica
A 0 e simetrica, B 0 e simetrica = (AB) IR, (AB) 0
Fato A.8.11 Sendo o menor autovalor de uma matriz A 0 e simetrica
e o maior deles:
A 0 e simetrica =(A)[x[
2
x
T
Ax (A)[x[
2
, x
Fato A.8.12 Podemos denir norma de uma matriz A como
|A| = sup
|x|=1
[Ax[
Com isto:
A 0 e simetrica =|A| = (A)
A > 0 e simetrica =|A
1
| = ((A))
1
AP
ATICAS 92
A.9 Matrizes Hamiltonianas
Sendo A(n n) uma matriz real qualquer, S (n n) e T (n n) matrizes
reais e simetricas, diremos que
_
A S
T A
T
_
e uma Matriz Hamiltoniana. Nos desenvolvimentos posteriores teremos
oportunidades de vericar a importancia destas matrizes. O conjunto de
todas as matrizes Hamiltonianas sera designado por 1:
1 =
_
H IR
2n2n
[ H e Hamiltoniana
_
O espectro das matrizes Hamiltonianas e sempre simetrico com rela cao
ao eixo imagin ario; isto signica que, se +j e um dos autovalores de uma
matriz Hamiltoniana entao + j tambem sera um autovalor. Antes de
demonstrar esta propriedade apresentaremos dois resultados muito uteis no
manuseio de expressoes matriciais intrincadas.
Lema A.9.1 (Identidade de Sylvester) Sendo M e Q matrizes quadra-
das, com M inversvel, e N e P matrizes com dimensoes compatveis temos:
_
M N
P Q
_
=
_
M 0
P I
_ _
I M
1
N
0 QPM
1
N
_
Esta identidade permitir a fatorar matrizes particionadas em blocos. Sua
prova e simples, bastando desenvolver o produto do lado direito. Para o que
segue, o smbolo det(X) denotara o determinante da matriz X.
Lema A.9.2 Sendo B e C matrizes cujo produto e uma matriz quadrada,
temos
det(I BC) = det(I CB)
A demostracao deste resultado ja e mais elaborada, e sera omitida. Pa-
semos entao `a
Propriedade A.9.1 O espectro de uma matriz Hamiltoniana e simetrico
com relacao `a origem do plano complexo.
Demonstracao: Como as Hamiltonianas sao matrizes reais, os seus es-
pectros sao simetricos com rela cao ao eixo real; querer que haja simetria
tambem com rela cao ao eixo imagin ario signica dizer que se e autovalor
AP
ATICAS 93
de uma Hamiltoniana entao tambem deve ser, ou seja, existe simetria
com rela cao `a origem do plano complexo. Seja entao H 1 para a qual
calculamos
I H =
_
I A S
T I + A
T
_
=
_
I A 0
T I
_ _
I (I A)
1
S
0 (I + A
T
) T(I A)
1
S
_
onde usamos a identidade de Sylvester. Chamando de
H
() o polin omio
caracterstico de H, e passando a usar () para denotar det(I A), temos:
H
() = det(I H)
= () det
_
(I + A
T
) T(I A)
1
S
_
= () det(I + A
T
) det
_
I T(I A)
1
S(I + A
T
)
1
_
onde colocamos em evidencia o termo I +A
T
na segunda parcela do segundo
termo. Mas I + A
T
= I
T
+ A
T
= (I + A)
T
, e ainda temos que a inversa
da transposta e a transposta da inversa. Com isto temos
H
() = () det(I + A) det
_
I T(I A)
1
S
_
(I + A)
1
_
T
_
= () det(I)() det
_
I + T(I A)
1
S
_
(I A)
1
_
T
_
onde usamos a identidade I +A = I(I A). Chamando agora o termo
(I A)
1
de M() temos:
H
() = (1)
n
()() det
_
I + TM()SM
T
()
_
(A.1)
= (1)
n
()() det
_
I + M()SM
T
()T
_
(A.2)
Nesta ultima passagem usamos o Lema A.9.2 acima. Notando nalmente
que det(I + X) = det(I + X)
T
= det(I + X
T
) obtemos
H
() = (1)
n
()() det
_
I + T
T
M()S
T
M
T
()
_
= (1)
n
()() det
_
I + TM()SM
T
()
_
pois T e S sao simetricas. Comparando esta expressao com a equa cao A.1
acima conclumos que
H
() =
H
(), completando a demonstracao.
Q.E.D.
AP
ATICAS 94
Polin omios p() para os quais p() = p() sao chamados de polinomios
pares. Vemos assim que os polin omios caractersticos das matrizes Hamil-
tonianas sao pares. Antes de prosseguir, e para xar os conceitos, vejamos
o
Exemplo A.9.1 Considere as matrizes Hamiltonianas:
H
1
=
_
_
0 1 0 0
0 0 0 1
1 0 0 0
0 2 1 0
_
_
H
2
=
_
_
0 1 0 0
0 0 0 1
1 0 0 0
0 4, 25 1 0
_
_
H
3
=
_
_
0 1 0 0
0 0 0 1
1 0 0 0
0 4, 25 1 0
_
_
O calculo dos autovalores forneceria os seguintes espectros:
(H
1
) = 1, 1, 1, 1 (H
2
) = 0.5j, 2.0j
(H
3
) = 2.0, 0.5, 0.5, 2.0
que sao simetricos com relacao ao eixo imaginario, como deveriam.
Trataremos agora de dois importantes subespacos associados a uma ma-
triz quadrada qualquer. Sendo m() o polin omio mnimo da matriz M (kk),
sempre podemos fatora-lo como
m() = m
()m
+
()
onde as razes de m
(M) = ker m
(M) e A
+
(M) = ker m
+
(M)
AP
ATICAS 95
E um exerccio simples de
Algebra Linear demonstrar que cada um dos
subespacos acima denidos e um subespaco invariante sob M, e que a soma
direta deles fornece o espaco todo:
MA
MA
+
A
+
A
A
+
= IR
k
Estes subespacos sao chamados de subespacos espectrais e admitem uma
interpreta cao geometrica muito util. Considere o sistema autonomo
_
p(t) = Mp(t)
p(0) = p
0
O conjunto de todas as condi coes iniciais das quais partem trajet orias
que tendem assintoticamente `a origem e precisamente A
(M) =
_
p
0
IR
k
[ lim
t
_
e
Mt
p
0
_
= 0
_
e o nome subespaco dos modos estaveis ca justicado. Trajet orias originadas
emA
+
(M) certamente tenderao a , mas neste caso nao poderemos exprimir
esse subespaco de maneira analoga ao de A
(H
1
) = (H
1
+ I)
2
=
_
_
1 2 0 1
0 3 1 2
2 1 1 0
1 4 2 3
_
_
m
+
(H
1
) = (H
1
I)
2
=
_
_
1 2 0 1
0 3 1 2
2 1 1 0
1 4 2 3
_
_
AP
ATICAS 96
A partir destas matrizes a obten cao dos subespacos modais e simples:
A
(H
1
) = ker m
(H
1
) =
_
_
1 0
0 1
2 1
1 2
_
_
A
+
(H
1
) = ker m
+
(H
1
) =
_
_
1 0
0 1
2 1
1 2
_
_
O segundo caso do exemplo anterior e trivial:
A
(H
2
) = 0 e A
+
(H
2
) = IR
4
Para a matriz H
3
podemos calcular os subespacos espectrais ou pelos au-
tovetores ou pelo polinomio mnimo. Encontraramos
A
(H
3
) = ker m
(H
3
) =
_
_
2 4
4 2
1 8
8 1
_
_
A
+
(H
3
) = ker m
+
(H
3
) =
_
_
2 4
4 2
1 8
8 1
_
_
Alem da interpreta cao geometrica dos subespacos espectrais, vista acima,
eles tambem permitem a obtencao de mais informacoes sobre os autovalores
das matrizes Hamiltonianas:
Propriedade A.9.2 A matriz Hamiltoniana H nao possui autovalores sobre
o eixo imaginario se e somente se dimA
(H) = dimA
+
(H) = n
A demonstracao da validade deste resultado e simples, e sera omitida. De
agora em diante sempre suporemos que (H) jw = ou, equivalente-
mente, dimA
(H) = dimA
+
(H) = n.
AP
ATICAS 97
Dados os subespacos 1, J IR
2n
, quando 1 + J = IR
2n
e 1 J = 0
diremos que eles sao complementares e escreveremos 1 J = IR
2n
. Sendo
V e W matrizes cujas colunas formam bases para 1 e J, respectivamente,
a matriz [V W] tera posto completo (= 2n) quando 1 e J forem com-
plementares. Seja A
p
IR
2n
o subespaco gerado pelas colunas da matriz
(2n n)
_
0
I
n
_
Matrizes Hamiltonianas para as quais A
(H) e A
p
sao complementares
recebem um nome especial domnio de Riccati por apresentarem propri-
edades interessantes. Para entender estas propriedades, seja X
uma matriz
(2nn) cujas colunas formam uma base para A
=
_
X
1
X
2
_
(A.3)
onde X
1
e X
2
sao matrizes (n n). Se A
(H) e A
p
forem complementares,
entao a matriz X
1
da parti cao acima sera inversvel e poderemos considerar
o produto X
2
X
1
1
= X. Seja agora
K
=
_
K
1
K
2
_
outra matriz cujas colunas formam uma base para A
(H). Continuando
a supor complementaridade entre A
(H) e A
p
temos que K
1
e inversvel.
Mostraremos agora a rela cao entre K = K
2
K
1
1
e X = X
2
X
1
1
. Considere a
matriz
_
X
1
K
1
X
2
K
2
_
cujo posto e n; aplicando a identidade de Sylvester obtemos
_
X
1
K
1
X
2
K
2
_
=
_
X
1
0
X
2
I
_ _
I X
1
1
K
1
0 K
2
X
2
X
1
1
K
1
_
Como o primeiro fator do segundo membro e inversvel podemos escrever
_
I X
1
1
K
1
0 K
2
X
2
X
1
1
K
1
_
=
_
X
1
0
X
2
I
_
1
_
X
1
K
1
X
2
K
2
_
donde concluimos que o posto da matriz do lado esquerdo deve ser n.
Mas isto implica em K
2
X
2
X
1
1
K
1
= 0 ou seja, K
2
= X
2
X
1
1
K
1
ou,
AP
ATICAS 98
nalmente, K = K
2
K
1
1
= X
2
X
1
1
= X. O signicado disto e que a matriz
X obtida pelo procedimento acima independe da particular base escolhida
para A
(H) A
p
= IR
2n
recebe
o nome de Domnio de Riccati, simbolizado por 1:
1 =
_
H 1 [ (H) jw = e A
(H) A
p
= IR
2n
_
Como demonstramos acima, a cada elemento H 1 podemos associar
uma unica matriz X (n n), que passaremos a designar por Ric(H), dada
por
X = Ric(H) = X
2
X
1
1
(A.4)
onde X
2
e X
1
sao obtidas a partir de uma base para A
A
p
= 0, donde H
1
1.
E mais:
Ric (H
1
) = X
2
=
_
2 1
1 2
_
porque X
1
= I. Por ter autovalores no eixo imaginario, H
2
, 1. Para H
3
deixamos as conclusoes aos leitores.
Dada a importancia do domnio de Riccati, haveria interesse em esta-
belecer condi coes para que uma matriz Hamiltoniana H perten ca a 1 =
dom(Ric), sem o calculo de uma base para A
ATICAS 99
Propriedade A.9.4 Se H dom(Ric) e X = Ric(H), entao
a.) X e simetrica
b.) A + SX e estavel
c.) X e solu cao da equa cao de Riccati matricial algebrica
A
T
X + XA + XSX T = 0
Este resultado estabelece uma conexao entre as matrizes Hamiltonianas e
a equa cao de Riccati, de capital importancia na solucao de problemas lineares
quadr aticos, como se ver a em breve.
Demonstracao: Como H pertence ao domnio de Riccati 1, por hip o-
tese, temos dimA
(H) = n e A
(H) A
p
= IR
2n
. Escolhendo uma base
para A
(H) e
A
p
:
Q =
_
X
1
0
X
2
I
_
Uma transformacao de coordenadas conduz a uma matriz equivalente que
pode ser particionada em blocos (n n):
Q
1
HQ =
_
H
11
H
12
H
21
H
22
_
(A.5)
Como o subespaco A
(H) A
(H)
e a matriz acima apresenta importantes particularidades estruturais: o bloco
superior esquerdo representa o mapa induzido por H em A
(H), e o bloco
inferior esquerdo e nulo. Ou seja, H
21
= 0 e os autovalores de H
11
estao em
C
ATICAS 100
Lembrando que X
2
= XX
1
a equa cao A.7 acima mostra que A + SX e
equivalente a H
11
, sendo portanto estavel. A equa cao A.9 ca
H
21
= XAX
1
+ TX
1
XSX
2
A
T
X
2
= XAX
1
+ TX
1
XSXX
1
A
T
XX
1
= (XA + T XSX A
T
X)X
1
Mas X
1
e inversvel, e H
21
= 0, donde segue que
A
T
X + XA + XSX = T
o que mostra claramente a validade do item (c). A simetria de X cara para
os leitores. Q.E.D
Para terminar veremos as caratersticas adicionais advindas de estruturas
particulares de T e de S:
Propriedade A.9.5 Se H 1 e da forma
_
A BB
T
C
T
C A
T
_
com < A, B > estabilizavel e < C, A > detetavel, entao
a.) H dom(Ric)
b.) X = Ric(H) 0
c.) ker(X) J = subespaco inobservavel de < C, A >
Uma consequencia desta propriedade e que ker(X) J ker(C), donde
a equa cao XM = C
T
sempre admite solucao para M. Outra consequencia:
quando < C, A > e observavel teremos J = 0, logo ker(X) = 0 e X > 0.
A.10 Referencias
O material deste captulo pode ser considerado classico, e e encontr avel em
um grande n umero de textos e artigos, como por exemplo [7], [3], [5], [8], e
[2]. Muitos outros ha, mas estes foram os mais consultados.
Apendice B
Analise no IR
n
B.1 Funcao Real de variavel vetorial
ou funcao real de v arias variaveis reais:
f : IR
n
IR
x IR
n
y = f(x) IR
Quando n = 1 temos o conhecido caso escalar, ou seja, funcoes reais de
uma unica variavel real:
f : IR IR
x IR y = f(x) IR
Exemplo B.1.1 f(x) = x
2
+ 2x e
x
, para x IR
f(x
1
, x
2
) = x
1
x
2
para x
1
, x
2
IR
f(x
1
, x
2
, x
3
) = x
3
1
+ 3x
1
x
2
x
3
+ x
3
2
+
_
(x
3
) para x
1
, x
2
, x
3
IR
Quando n = 1 a funcao pode ser visualizada por meio dos gr acos tra-
dicionais; quando n = 2 a funcao f se associa a superfcies do IR
3
. Para
dimens oes maiores a visualizacao ca prejudicada. No caso de n = 2 o uso
das curvas de nvel permite a analise no plano de uma superfcie espacial e
facilita as coisas.
Curva de nvel =
_
x IR
2
[ f(x) = c = cte.
_
Exemplo B.1.2 f(x
1
, x
2
) = x
1
x
2
f(x
1
, x
2
) = x
2
1
+ x
2
2
101
AP
ENDICE B. AN
ALISE NO IR
N
102
B.2 Continuidade e Derivadas
A funcao real de variavel vetorial f e contnua no ponto x
0
quando
lim
xx
0
f(x) = f(x
0
)
ou entao, sem usar limites, quando
> 0 > 0 [ se |x x
0
| < entao [f(x) f(x
0
)[ <
Em outras palavras, e possvel chegar arbitrariamente pr oximo de f(x
0
)
desde que cheguemos sucientemente perto de x
0
B.3 Derivada: caso escalar
Dada a funcao
f : IR IR
x IR y = f(x) IR
chamaremos de primeira derivada, ou derivada primeira, ou gradiente
de f no ponto x
0
IR ao limite
lim
h0
f(x
0
+ h) f(x
0
)
h
Esta derivada e usualmente designada pelos smbolos
f
(x
0
) ou f
(1)
(x
0
) ou
df
dx
x
0
e e o valor numerico do coeciente angular da reta tangente ao gr aco de f
no ponto (x
0
, f(x
0
)).
Denicao B.3.1 Dizemos que f e diferenciavel em x
0
se f
(x
0
) existe
Quando f e diferenciavel em um intervalo, ou seja, quando
f
(x
0
) x
0
I IR
podemos falar na fun cao derivada:
f
: I IR
x IR y = f
(x) IR
Exemplo B.3.1 Seja f denida por f(x) = x
2
lim
h0
f(x + h) f(x)
h
= lim
h0
x
2
+ 2xh + h
2
x
2
h
= lim
h0
2xh + h
2
h
= 2x
Quando f
e da por diante.
AP
ENDICE B. AN
ALISE NO IR
N
103
B.3.1 Derivadas laterais
B.4 Derivada: caso vetorial
Dada a funcao
f : IR
n
IR
x IR
n
y = f(x) IR
chamaremos de primeira derivada parcial de f com rela cao a x
i
no ponto
x
0
IR
n
ao limite
lim
h0
f(x
0
1
, x
0
2
, . . . x
0
i
+ h, . . . x
0
n
) f(x
0
)
h
Esta derivada e usualmente designada pelos smbolos
f
x
i
(x
0
) ou
f
x
i
x
0
Denicao B.4.1 Dizemos que f e diferenciavel em x
0
quando
f
x
i
x
0
existe i = 1, 2, . . . n
Quando f e diferenciavel em um intervalo, as derivadas parciais
f
x
1
,
f
x
2
, . . .
f
x
n
podem ser consideradas funcoes de x.
O gradiente da funcao f no ponto x IR
n
e o vetor dado por
_
_
f
x
1
f
x
2
.
.
.
f
xn
_
_
= g(x) = f(x) IR
n
Exemplo B.4.1 Seja f denida por f(x) = f(x
1
, x
2
) = x
1
x
2
f(x) =
_
x
2
x
1
_
AP
ENDICE B. AN
ALISE NO IR
N
104
Denicao B.4.2 uma fun cao e linear quando
f(x) = c
T
x + b
onde c, b IR
n
.
O gradiente de uma funcao linear e dado trivialmente por f(x) = c.
Exemplo B.4.2 A fun cao f(x) = max[x
1
[, [x
2
[ tem problemas nos can-
tos.
B.5 Derivadas de ordem superior
Quando as derivadas parciais (f)/(x
1
) sao diferenciaveis podemos deriva-
las novamente:
x
j
_
f
x
i
_
=
2
f
x
i
x
j
A matriz nn cujo elemento (i, j) e dado pela expressao acima e chamada
de Hessiana de f:
_
2
f
x
2
1
. . . . . .
2
f
x
1
xn
.
.
.
.
.
.
2
f
x
2
n
_
_
=
2
f(x) = G(x)
As matrizes Hessianas sao sempre simetricas.
Exemplo B.5.1 A fun cao quadratica f(x) =
1
2
x
T
Ax + b
T
x + c pode ser
derivada:
f(x) = Ax + b, e
2
f(x) = A
Uma funcao e suave ou bem comportada quando e contnua e suas
derivadas tambem o sao. Nao existem cantos ou quebras abruptas de
curvatura. Diz-se que uma funcao e de classe C
k
se suas k primeiras derivadas
sao contnuas:
C
k
=
_
f [ f, f
(1)
, . . . f
(k)
sao contnuas
_
AP
ENDICE B. AN
ALISE NO IR
N
105
B.6 Func oes Vetoriais de Variaveis Vetoriais
Dada a funcao
f : IR
n
IR
m
x IR
n
y = f(x) IR
m
chamaremos de Jacobiana de f a matriz mn de suas derivadas parciais.
O elemento (i, j) da Jacobiana e
f
i
x
j
B.7 Pontos Estacionarios e Extremos
Dizemos que x
e
IR
n
e um ponto estacionario da funcao f quando o
gradiente se anula:
f(x
e
) = 0
Dizemos que x
IR
n
e um ponto de mnimo local forte da funcao f
quando existe > 0 tal que
1. f(x) e denida x tal que |x x
| <
2. f(x) < f(x
) x ,= x
tal que |x x
| <
Dizemos que x
IR
n
e um ponto de mnimo local fraco da funcao f
quando existe > 0 tal que
1. f(x) e denida x tal que |x x
| <
2. f(x) f(x
) x ,= x
tal que |x x
| <
3. x
IR
n
e um ponto de mnimo global da funcao f
quando . . .
B.8 Otimizacao
Em uma rela cao de causa e efeito, estamos sempre interessados em descobrir
efeitos nobres ou especiais: quem os causa? como sao caracterizados? Este
e um problema pr atico muito comum. Para os seres humanos, os efeitos
nobres ou especiais sao, em geral, os efeitos extremos: procura-se sempre
efeitos m aximos ou mnimos. Como em termos matem aticos as rela coes de
causa e efeito sao descritas por funcoes, percebe-se a enorme import ancia do
problema de se otimizar funcoes, ou seja, de se encontrar os seus extremos.
AP
ENDICE B. AN
ALISE NO IR
N
106
B.9 PGO Problema Geral de Otimizacao
Desejamos minimizar uma funcao real de variavel vetorial, sendo que a
variavel independente x IR
n
esta sujeita a determinadas restri coes, ou
seja, deve pertencer a determinadas regi oes do IR
n
. Este problema, tambem
chamado de Problema de Minimizacao Nao Linear Com Restricoes,
pode ser formulado como
minimizarf(x)
x IR
n
s.a.
c
i
(x) = 0 i = 1, 2, . . . k
c
i
(x) 0 i = k + 1, . . . m
A funcao f(x) que se deseja minimizar e chamada de funcao objetivo.
As k primeiras restri coes sao as restricoes de igualdade, e as outras, ob-
viamente, sao as de desigualdade.
Quando o extremo procurado e um m aximo, ou em outras palavras,
quando se deseja maximizar uma funcao h(x), a mesma estrutura acima
pode ser usada, desde que se use como funcao objetivo f(x) = h(x).
B.10 Pontos Viaveis
Sao os pontos que satisfazem as restri coes. A Regiao Viavel, RV, e o
conjunto destes pontos:
RV = v IR
n
[ c
i
(v) = 0i = 1, 2, . . . kec
j
(v) 0j = k + 1, . . . m
Exemplo B.10.1 Queremos minimizar f(x
1
, x
2
) = x
2
1
x
2
com as restricoes
_
x
1
+ x
2
= 0
x
2
1
+ x
2
2
0
B.11 Solu cao do PGO
Quando nao existem restri coes, os mnimos globais ou locais de f sao as
solucoes procuradas, mas quando as restri coes estao presentes os extremos
da funcao objetivo podem nao ser as solucoes do PGO.
AP
ENDICE B. AN
ALISE NO IR
N
107
A gura acima ilustra a situa cao. Torna-se necessario denir o que seriam
as solucoes do PGO em seu caso mais geral, com restri coes.
Denicao B.11.1 O ponto x
IR
n
e uma Solucao Local Forte do PGO
quando existir um real > 0 tal que
_
_
f(x) e denida x RV tal que |x x
| <
f(x) < f(x
)x RV, x ,= x
tal que |x x
| <
Ainda podem existir solucoes fracas:
Denicao B.11.2 O ponto x
IR
n
e uma Solucao Local Fraca do PGO
quando existir um real > 0 tal que
_
_
f(x) e denida x RV tal que |x x
| <
f(x) f(x
)x RV, x ,= x
tal que |x x
| <
x
IR um mnimo local de f
entao
AP
ENDICE B. AN
ALISE NO IR
N
108
1. f
(x
) = 0
2. f
(x
) 0
Este teorema diz que os mnimos locais de uma funcao sao pontos es-
tacionarios dela, e alem disso a derivada segunda e nao negativa neles. Se
procuramos as solucoes do PGO, este resultado restringe o universo da busca
aos pontos estacion arios com segundas derivadas nao negativas. Para efeti-
vamente garantir pontos deste universo solucionam o PGO precisamos de
outro resultado:
Teorema B.12.2 Condicoes Sucientes de Otimalidade
Supondo f sucientemente suave, seja x
IR tal que
1. f
(x
) = 0
2. f
(x
) > 0
Entao x
IR
n
um mnimo local de f
entao
1. f(x
) = g(x
) = 0
2.
2
f(x
) = G(x
) 0
AP
ENDICE B. AN
ALISE NO IR
N
109
Mais uma vez os mnimos locais sao pontos estacion arios de uma funcao,
onde a derivada segunda e nao negativa. Como antes, as CNO restringem o
universo da busca de solucoes, mas para garantir que pontos deste universo
reduzido realmente solucionam o PGO precisamos das CSO:
Teorema B.13.2 Condicoes Sucientes de Otimalidade
Supondo f sucientemente suave, seja x
IR
n
tal que
1. f(x
) = 0
2.
2
f(x
) > 0
Entao x
(x) = 3x
2
e f
(x) = 6x, o
que garante que x
(x
) 0, ou seja,
satisfaz as CNO. Mas as CSO nao sao satisfeitas e este nao e um mnimo
de f, mas um ponto de inexao.
Seja agora f(x
1
, x
2
) = x
1
x
2
.
E facil calcular
f
x
1
= x
2
;
2
f
x
2
1
= 0;
2
f
x
1
x
2
= 1
f
x
2
= x
1
;
2
f
x
2
2
= 0;
2
f
x
2
x
1
= 1
donde tiramos
f(x) = g(x
1
, x
2
) =
_
x
2
x
1
_
e
2
f(x) = G(x
1
, x
2
) =
_
0 1
1 0
_
O ponto x
= [0 0]
T
e estacionario, pois anula o gradiente, mas a Hessi-
ana G(x
ENDICE B. AN
ALISE NO IR
N
110
Propriedade 2: A Hessiana de uma funcao quadr atica e dada por:
2
q(x) = A
Propriedade 3: Saindo de um ponto segundo uma dire cao. Sendo x, p
IR
n
e IR
q(x + p) = q(x) + p
T
(Ax + b) +
1
2
2
p
T
Ap
Propriedade 4: Os pontos estacion arios de uma funcao quadr atica sao:
q(x) = 0 Ax = b
A demonstracao da validade destas propriedades sera omitida. A partir
da ultima delas percebemos que quando a equa cao Ax = b nao admitir
solucoes a funcao nao tem pontos estacion arios nem mnimos, sendo portanto
ilimitada.
Propriedade 5: Comportamento de uma funcao quadr atica perto de um
ponto estacion ario. Seja um ponto x
tal que Ax
= b:
q(x
+ p) = q(x
) +
1
2
2
p
T
Ap
Vemos que o comportamento de uma funcao quadr atica nas vizinhancas
de um ponto estcion ario depende apenas da Hessiana A =
2
q(x). Como
A e simetrica seus autovalores sao reais, e os autovetores associados formam
uma base ortonormal. Vamos supor que samos de um ponto estacion ario
x
+ v
i
) = q(x
) +
1
2
i
v
T
i
v
i
= q(x
) +
1
2
i
donde vemos que
i
> 0 entao q e crescente com
i
< 0 entao q e decrescente com
i
= 0 entao q e constante e linear: q(x) = b
T
x
AP
ENDICE B. AN
ALISE NO IR
N
111
Propriedade 6: Comportamento de uma funcao quadr atica com Hessiana
positiva denida. Supondo
i
(A) > 0 i = 1, 2, . . . n o ponto esta-
cionario x
= A
1
b =
_
0, 5
1, 0
_
Os autovalores e autovetores de A sao
1
= 6, 85 v
1
=
_
0, 85
0, 53
_
2
= 0, 15 v
2
=
_
0, 53
0, 85
_
A fun cao tem um mnimo global em x
= b admite innitas
solu coes dadas por
x
=
_
0
2
_
+
_
1
2
_
Cada um dos pontos desta reta no IR
2
e um mnimo local fraco. Esta
reta e tambem a direcao dos autovetores associados ao autovalor
1
= 0. Ao
outro autovalor,
2
= 5, associa-se a direcao [2 1]
T
. A superfcie de q e do
tipo calha.
AP
ENDICE B. AN
ALISE NO IR
N
112
Propriedade 8: Comportamento de uma funcao quadr atica com Hessiana
indenida. Supondo autovalores maiores, menores ou iguais a 0, o
ponto estacion ario x
e ponto de sela.
Exemplo B.14.3 Seja a fun cao quadratica
q(x) =
1
2
x
T
_
3 1
1 8
_
x + [0, 5 8, 5]x
Como a Hessiana A e inversvel o ponto estacionario e dado trivialmente
por
x
= A
1
b =
_
0, 5
1, 0
_
Os autovalores e autovetores de A sao
1
= 3, 09 v
1
=
_
1, 0
0, 1
_
2
= 8, 09 v
2
=
_
0, 1
1, 0
_
As curvas de nvel sao hiperboles cujos eixos principais estao associados
aos autovetores da Hessiana.
B.15 Restri c oes Lineares
Consideremos novamente o Problema Geral de Otimiza cao:
minimizarf(x)
x IR
n
s.a.
c
i
(x) = 0 i = 1, 2, . . . k
c
i
(x) 0 i = k + 1, . . . m
Quando as restri coes c
i
(x) sao funcoes lineares temos c
i
(x) = a
T
i
(x) +
i
,
onde a
i
IR
n
e
i
IR. As restri coes de igualdade cam
a
T
i
(x) +
i
= 0 a
T
i
(x) =
i
= b
i
e as de desiguldade:
a
T
i
(x) +
i
0 a
T
i
(x)
i
= b
i
AP
ENDICE B. AN
ALISE NO IR
N
113
B.16 PGO com Restri c oes Lineares de Igual-
dade
Temos o seguinte problema, abreviadamente chamado de PGORLI ou apenas
ORLI ou RLI:
minimizarf(x)
x IR
n
s.a.
Ax =
b
onde
A e uma matriz m n cujas linhas sao as restri coes a
T
i
e
b IR
m
tem como elementos os b
i
=
i
. Lembrando que x
=
b, e
2. f(x
.
percebemos a necessidade de um estudo inicial da regi cao viavel RV.
E sim-
ples escrever
RV =
_
v IR
n
[
Av =
b
_
Dado um ponto viavel v RV, considere o problema de encontrar uma
dire cao ou vetor p tal que v+p RV. Em outras palavras, queremos condi coes
para partir de e permanecer em RV.
E facil deduzir que
v + p RV
Ap = 0
Direcoes p tais que
Ap = 0 sao chamadas de direcoes viaveis e sao as
dire coes que permitem que um movimento permaneca em RV.
Exemplo B.16.1 Seja um problema de minimizacao com uma restricao de
igualdade c(x
1
, x
2
) = x
1
+ x
2
= 1. A RV e a reta do IR
2
cujos pontos sao
[ 1 ]
T
. Uma vez sobre esta reta, as direcoes viaveis sao dadas por
x
2
= x
1
.
O conjunto de todas as dire coes viaveis e dado pelo espaco nulo ou n ucleo
de
A:
: = ker
A =
_
p IR
n
[
Ap = 0
_
AP
ENDICE B. AN
ALISE NO IR
N
114
Este conjunto e um subespaco vetorial do IR
n
, cuja dimens ao supomos
ser t (note que a RV pode nao ter uma estrutura de subespaco). Sendo Z
uma matriz t n cujas colunas formam uma base para : podemos exprimir
de maneira geral uma dire cao viavel qualquer
p = Zp
z
, onde p
z
IR
n
Supondo que x
+ p) = f(x
) + p
T
f(x
) +
1
2
2
p
T
2
f(x
)p +
= f(x
) + p
T
z
Z
T
g(x
) +
1
2
2
p
T
z
Z
T
G(x
)Zp
z
+
Considerando valores pequenos de poderamos estabelecer
Teorema B.16.1 Condicoes Necessarias de Otimalidade
Supondo f sucientemente suave e sendo x
IR
n
uma solu cao local do
RLI, entao
1.
Ax
=
b
2. Z
T
g(x
) = 0
3. Z
T
G(x
)Z 0
A primeira das condi coes acima, bastante obvia, diz que as solucoes devem
ser viaveis. A condi cao seguinte e a condi cao do gradiente, ou de primeira
ordem. A grandeza Z
T
g(x) e chamada de gradiente projetado de f em
x. Pontos nos quais o gradiente projetado se anula sao chamados de pontos
estacionarios com restricoes. Tambem neste caso com restri coes ha um
gradiente que deve se anular. Raciocinemos. A matriz Z, por deni cao, e tal
que
AZ = 0 ou, equivalentemente, Z
T
A
T
= 0. Como o gradiente projetado
se anula na solucao, devemos ter Z
T
g(x
) = 0 =
A
T
_
2
.
.
.
m
_
_
Os coecientes
i
sao os multiplicadores de Lagrange. Estes multi-
plicadores permitem a formulacao do resultado acima de maneira diferente:
AP
ENDICE B. AN
ALISE NO IR
N
115
Teorema B.16.2 Condicoes Necessarias de Otimalidade
Supondo f sucientemente suave e sendo x
IR
n
uma solu cao local do
RLI, entao
1.
Ax
=
b
2.
IR
m
[ g(x
) =
A
T
3. Z
T
G(x
)Z 0
A terceira das condi coes do teorema e a condi cao de segunda ordem, ou
condi cao da Hessiana. A grandeza Z
T
G(x
IR
n
tal que
1.
Ax
=
b
2. Z
T
g(x
) = 0 ou, equivalentemente,
IR
m
[ g(x
) =
A
T
3. Z
T
G(x
)Z > 0
Entao x
_
f(x) =
1
2
x
T
_
5 3
3 2
_
x + [5, 5 3, 5]x
s.a. : ax = [1 1]x = 1
Conforme visto anteriormente, a fun cao objetivo f tem um mnimo global
em x
= [0, 5 1, 0]
T
e suas curvas de nvel sao elipses cujos eixos principais
sao os autovetores da Hessiana. Dada a encontraramos Z
T
= [1 1]; os
gradientes normal e projetado sao
g(x) =
_
5 3
3 2
_
x +
1
2
_
11
7
_
e Z
T
g(x) = [2 1]x + 2
Lembrando que a restricao e o gradiente projetado devem se anular no
ponto estacionario chegamos a
AP
ENDICE B. AN
ALISE NO IR
N
116
_
(1 1)x = 1
(2 1)x = 2
ou
_
1 1
2 1
_
x =
_
1
2
_
cuja unica solu cao e [3 4]
T
. Aplicando as CSO neste candidato (basta apli-
car a terceira delas, porque as outras automaticamente se vericam) temos
Z
T
G(x
)Z = [1 1]
_
5 3
3 2
_ _
1
1
_
= 1 > 0
donde se conclui que o ponto estacionario encontrado e uma solu cao local.
Seja agora o RLI com
_
_
f(x) =
1
2
x
T
_
4 2
2 1
_
x [4 2]x
s.a. : ax = [1 1]x = 0
A fun cao objetivo f e representada por uma superfcie tipo calha e tem
seus mnimos locais na reta dada por
x
=
_
0
2
_
+
_
1
2
_
A matriz Z e os gradientes normal e projetado sao
Z =
_
1
1
_
; g(x) =
_
4 2
2 1
_
x
_
4
2
_
e Z
T
g(x) = [6 3]x 6
Lembrando que a restricao e o gradiente projetado devem se anular no
ponto estacionario chegamos a
_
(1 1)x = 0
(6 3)x = 6
ou
_
1 1
6 3
_
x =
_
0
6
_
cuja unica solu cao e [2/3 2/3]
T
. Aplicando as CSO neste candidato (basta
aplicar a terceira delas, porque as outras automaticamente se vericam) te-
mos
Z
T
G(x
)Z = [1 1]
_
4 2
2 1
_ _
1
1
_
= 9 > 0
donde se conclui que o ponto estacionario encontrado e uma solu cao local.
Seja agora o RLI com
AP
ENDICE B. AN
ALISE NO IR
N
117
_
_
f(x) =
1
2
x
T
_
3 1
1 8
_
x +
1
2
[1 17]x
s.a. : ax = [1 1]x = 1/2
A fun cao objetivo f e caracterizada por um ponto de sela e nao admite
mnimos ou maximos. A matriz Z e os gradientes normal e projetado sao
Z =
_
1
1
_
; g(x) =
_
3 1
1 8
_
x+
1
2
_
1
17
_
e Z
T
g(x) = [2 9]x+8
Lembrando que a restricao e o gradiente projetado devem se anular no
ponto estacionario chegamos a
_
(1 1)x = 1/2
(2 9)x = 8
ou
_
1 1
2 9
_
x =
_
1/2
8
_
cuja unica solu cao e [1/2 1]
T
, exatamente o ponto de sela anterior. Apli-
cando as CSO neste candidato (basta aplicar a terceira delas, porque as outras
automaticamente se vericam) temos
Z
T
G(x
)Z = [1 1]
_
3 1
1 8
_ _
1
1
_
= 7 < 0
Nao se pode concluir que este ponto seja uma solu cao do problema. Na
realidade ele soluciona o problema de se encontrar o maximo de f com as
restricoes dadas. Os leitores sao convidados a repetir estes calculos (desta
ultima f) para as seguintes restricoes:
1. [1 2]x = 3/2
2. [1 2]x = 3/2
3. [1 2]x = 0
B.17 PGO com Restri c oes Lineares de Desi-
gualdade
Temos o seguinte problema, abreviadamente chamado de PGORLD ou ape-
nas ORLD ou RLD:
AP
ENDICE B. AN
ALISE NO IR
N
118
minimizarf(x)
x IR
n
s.a.
Ax b
onde A e uma matriz m n cujas linhas sao as restri coes a
T
i
e b IR
m
tem
como elementos os b
i
.
B.17.1 Estudo da Regiao Viavel
.
.
.
Teorema B.17.1 Condicoes Necessarias de Otimalidade
Supondo f sucientemente suave e sendo x
IR
n
uma solu cao local do
RLD, entao
1. Ax
b;
Ax
=
b
2.
IR
m
[ g(x
) =
A
T
3.
i
0, i = 1, 2, . . . m
4. Z
T
G(x
)Z 0
Teorema B.17.2 Condicoes Sucientes de Otimalidade
Supondo f sucientemente suave, seja x
IR
n
tal que
1. Ax
b;
Ax
=
b
2.
IR
m
[ g(x
) =
A
T
3.
i
0, i = 1, 2, . . . m
4. Z
T
G(x
)Z > 0
Entao x
ENDICE B. AN
ALISE NO IR
N
119
B.18 Programacao Linear
B.19 PGO com Restri c oes Nao-Lineares de
Igualdade
Temos o seguinte problema, abreviadamente chamado de PGORNI ou apenas
ORNI ou RNI:
minimizarf(x)
x IR
n
s.a.
c
i
(x) = 0; i = 1, 2, . . . t
.
.
.
Teorema B.19.1 Condicoes Necessarias de Otimalidade
Supondo f sucientemente suave e sendo x
IR
n
uma solu cao local do
RNI, entao
1.
C(x) = 0
2.
IR
m
[ g(x
) =
A
T
(x
3. Z
T
(x
)W(x
)Z(x
) 0
Teorema B.19.2 Condicoes Sucientes de Otimalidade
Supondo f sucientemente suave, seja x
IR
n
tal que
1.
C(x) = 0
2.
IR
m
[ g(x
) =
A
T
(x
3. Z
T
(x
)W(x
)Z(x
) > 0
Entao x
ENDICE B. AN
ALISE NO IR
N
120
B.20 PGO com Restri c oes Nao-Lineares de
Desigualdade
Temos o seguinte problema, abreviadamente chamado de PGORND ou ape-
nas ORND ou RND:
minimizarf(x)
x IR
n
s.a.
c
i
(x) 0; i = 1, 2, . . . m
.
.
.
Teorema B.20.1 Condicoes Necessarias de Otimalidade
Supondo f sucientemente suave e sendo x
IR
n
uma solu cao local do
RND, entao
1. C(x
) 0;
C(x) = 0
2.
IR
m
[ g(x
) =
A
T
(x
3.
i
0; i = 1, 2, . . . t
4. Z
T
(x
)W(x
)Z(x
) 0
Teorema B.20.2 Condicoes Sucientes de Otimalidade
Supondo f sucientemente suave, seja x
IR
n
tal que
1. C(x
) 0;
C(x) = 0
2.
IR
m
[ g(x
) =
A
T
(x
3.
i
> 0; i = 1, 2, . . . t
4. Z
T
(x
)W(x
)Z(x
) > 0
Entao x
ENDICE B. AN
ALISE NO IR
N
121
B.21 Metodos Numericos
B.22 Caso Escalar: Obtencao de Razes
B.22.1 Metodo da Bisec cao
B.22.2 Metodo de Newton
B.22.3 Metodo da Secante
ou da interpolacao linear.
AP
ENDICE B. AN
ALISE NO IR
N
122
B.22.4 Metodo da Regula Falsa
B.22.5 Metodo de Interpolacoes Superiores
B.22.6 Metodo Geral dos Intervalos
B.22.7 Metodo Garantidos
B.23 Caso Escalar sem Restri c oes: Obtencao
de mnimos
B.23.1 Busca de Fibonacci
B.23.2 Busca
Aurea
B.23.3 Interpolacao Polinomial
B.23.4 Aproximacoes C ubicas
B.23.5 Metodos Garantidos
B.24 Caso Vetorial sem Restri c oes: Obten-
cao de mnimos
B.24.1 Metodos de Busca Direta
B.24.2 Algoritmo do Politopo
B.24.3 Algoritmo U
B.24.4 Metodos dp Gradiente e da Derivada Segunda
B.24.5 Metodo de Newton
B.24.6 Metodos da Decomposi cao Espectral
B.24.7 Metodos de Primeira Ordem
Newton discreto, Quase Newton.
AP
ENDICE B. AN
ALISE NO IR
N
123
B.24.8 Metodos Nao Derivativos
B.24.9 Problema dos Mnimos Quadrados
Gauss-Newton, Levenberg-Marquardt, Quase Newton.
B.25 Referencias
O material deste captulo pode ser considerado classico, e e encontr avel em
um grande n umero de textos e artigos, como por exemplo [7], [3], [5], [8], [2]
e [4]. Muitos outros ha, mas estes foram os mais consultados.
Referencias Bibliogracas
[1] M. Athans and P. L. Falb. Optimal Control. McGraw-Hill, New York,
1966.
[2] J. C. Doyle, K. Glover, P. P. Khargonekar, and B. A. Francis. State
space solutions to standard h
2
and h