Escolar Documentos
Profissional Documentos
Cultura Documentos
Escola de Engenharia
Departamento de Engenharia Eltrica
Programa de Ps-Graduao em Engenharia Eltrica
ELE00071 Tpicos Especiais em Automao e Controle II
Controle Adaptativo de Sistemas Estocsticos
Prof. Walter Fetter Lages
18 de dezembro de 2007
1 Introduo
O termo adaptao denido na biologia como uma conformao vantajosa de
um organismo mudanas no seu ambiente. Inspirados por esta denio [5]
introduziram o termo sistema adaptativo na teoria de controle, para representar
sistemas de controle que monitoram o seu prprio desempenho e ajustam seus
parmetros de forma a melhora-lo.
Esta denio baseada na biologia imprecisa e, dependendo da interpreta-
o, engloba sistemas realimentados convencionais. Assim, ao longo do tempo
diversas denies de controle adaptativo foram propostas [7, 13, 4, 23, 21]. Ape-
sar destas diversas denies, amplamente aceito que um sistema de controle
adaptativo uma classe especial de sistemas no lineares que surge ao se tentar
controlar plantas com parmetros desconhecidos atravs da variao automtica
dos parmetros do controlador [17], como mostra a gura 1. importante res-
saltar que um sistema de controle adaptativo um sistema no linear ainda que
tanto a planta quanto o controlador sejam sistemas lineares. Ou seja, a adaptao
dos parmetros em malha fechada faz com que o sistema resultante torne-se no
linear.
A histria dos controladores adaptativos remonta dcada de 1950, especial-
mente com o objetivo de projetar pilotos automticos. Como os avies enfrentam
condies muito diferentes entre as diversas fases do voo, o controle adaptativo
parecia ser uma alternativa atraente. No entanto, na poca os computadores digi-
tais no estavam to desenvolvidos e as implementaes de controladores adapta-
tivos no obtiveram muito sucesso. Durante a dcada de 1960, houveram grandes
desenvolvimentos na teoria de identicao de sistemas e na teoria de controle
(surgimento do controle moderno), levando um melhor entendimento do proble-
1
PSfrag replacements
lei de
adaptao
controlador planta
y
ref
u y
Figura 1: Diagrama de blocos genrico de um controle adaptativo.
ma de controle adaptativo em geral. Nas dcadas de 1970 e 1980, com o desenvol-
vimento dos microprocessadores, o controle adaptativo ganhou um novo impulso,
devido possibilidade de implementao umcusto razovel. Odesenvolvimento
de controle adaptativo para sistemas no lineares deu-se principalmente na dcada
de 1990, assim como estudos abordando a robustez de controladores adaptativos.
Controle adaptativo particularmente interessante para sistemas cujos par-
metros da planta so desconhecidos ou variam com o tempo. Ou seja, assume-se
que a estrutura da planta conhecida, mas os valores dos parmetros no o so.
O enfoque usualmente adotado combinar tcnicas de estimao de parmetros
com tcnicas de projeto de sistemas de controle. Assim, pode-se imaginar di-
versas estratgias de controle adaptativo combinando-se cada uma das possveis
tcnicas de estimao de parmetros com cada uma das tcnicas de projeto de
controladores.
2 Paradigmas para Controle Adaptativo
Diferentes enfoques para o controle adaptativo foram propostos na literatura, mas
trs esquemas so os mais utilizados: Escalonamento de Ganho (Gain Schedule
GS), Controle Adaptativo por Modelo de Referncia (Model-Reference Adaptive
Control MRAC) e Regulador Auto-Sintonizvel (Self-Tuning Regulator STR).
2.1 Escalonamento de Ganho
Escalonamento de ganho o enfoque mais antigo e mais intuitivo para controle
adaptativo. A idia consiste em utilizar alguma varivel auxiliar, que seja correla-
cionada com as alteraes na dinmica da planta, em funo da qual os parmetros
do controlador so ajustados, como mostra a gura 2. Tipicamente os parmetros
do controlador so variados de forma discreta dentro de um conjunto pr-denido.
2
Ou seja, so projetados controladores xos para diversas regies de operao da
planta e o algoritmo de controle adaptativo consiste em selecionar, em funo das
variveis auxiliares, qual destes controladores o mais adequado em um dado
instante de tempo.
variveis
auxiliares
PSfrag replacements
escalonamento
de ganho
controlador planta
y
ref
u y
PSfrag replacements
lei de
adaptao
controlador planta
modelo de
referncia
y
ref
u y
y
m
e
Figura 3: Diagrama de blocos de umcontrole adaptativo por modelo de referncia.
Assim, a escolha do modelo de referncia est sujeita a restries emsua estrutura,
como ordem e grau relativo, que dependem da estrutura do modelo da planta.
O controlador parametrizado em funo de um conjunto de parmetros ajus-
tveis a serem determinados pelo mecanismo de adaptao e deve possuir a ca-
pacidade de rastreamento prefeito. Ou seja, se os parmetros da planta forem
conhecidos exatamente, os parmetros correspondentes do controlador devem ser
tais que fazem a sada da planta convergir para a sada do modelo de referncia.
Usualmente, para que se possa obter provas de estabilidade e convergncia, os
mtodos de controle adaptativo exigem que o controlador possa ser parametriza-
do linearmente, ou seja, que a lei de controle seja linear com relao aos seus
parmetros.
O problema principal no projeto de um MRAC obter um mecanismo de
ajuste dos parmetros do controlador que faa com que o erro de sada e = y y
m
convirja para zero. Nas primeiras verses do MRAC era utilizado um mecanismo
de adaptao baseado no gradiente. Supondo que seja o vetor de parmetros do
controlador, a idia reduzir e
2
() atravs do ajuste de de forma a causar a sua
maior reduo, ou seja
d
dt
= K
e
2
()
= 2Ke()
(e()) (1)
onde K uma constante positiva denominada ganho de adaptao.
A varivel e() o erro de sada obtido supondo-se que os parmetros do
controlador so . Como o gradiente de e() igual ao gradiente de y(), j que
y
m
independente de , pode-se escrever:
4
d
dt
= 2Ke()
(y()) (2)
A funo de sensitividade
y()
n1
t=0
y
2
(t + 1)
8
com u(t) = f (y(t), y(t + 1), . . . ) e sendo a funo valor dada por
V (t, y) = min
u(t)
E
n1
k=t
y
2
(k + 1)
Y
t
com Y
t
= (y(0), y(1), . . . , y(t)).
Logo,
V (t, y) = min
u(t)
E
y
2
(t + 1) +
n1
k=t+1
y
2
(k + 1)
Y
t
e como E[X|Y
t
] = E [ E[X|Y
t+1
]| Y
t
] j que Y
t+1
Y
t
, tem-se
V (t, y) = min
u(t)
E
y
2
(t + 1) +E
n1
k=t+1
y
2
(k + 1)
Y
t+1
Y
t
= min
u(t)
E
y
2
(t + 1) +V (t + 1, y)
Y
t
(5)
O clculo de u(t) em (5) difcil, pois o controle tem que satisfazer um com-
promisso entre o objetivo imediato, representado por y
2
(t +1) e o objetivo futuro,
representado por V (t + 1, y).
Denindo-se
b(t + 1)
b(t + 1|t)
Y
t
De (3) tem-se
E
y
2
(t + 1)|Y
t
= E
Y
t
= y
2
(t) + 2y(t)u(t)E[ b(t + 1)| Y
t
] +u
2
(t)E
b
2
(t + 1)|Y
t
+
2
w
=
y(t) +
b(t + 1|t)u(t)
2
+P
b
(t + 1|t)u
2
(t) +
2
w
e portanto (5) pode ser reescrita na forma
V (t, y) = min
u(t)
y(t) +
b(t + 1|t)u(t)
2
+P
b
(t + 1|t)u
2
(t) +
2
w
+E [V (t + 1, y)|Y
t
]
(6)
9
Obs 1 : Pode-se escrever (3) e (4) na forma de variveis de estado:
x(k + 1) = x(k) +v(k)
y(k) y(k 1)
. .. .
y(k)
= u(k 1)
. .. .
C(k)
x(k) +w(k)
logo
x(k + 1|k) = x(k|k 1) +K(k) (y(k) C(k) x(k|k 1))
P(k + 1|k) =
2
P(k|k 1)
2
w
u
2
(k 1)P(k|k 1) +
2
w
+
2
v
y(n 1) +
b(n|n 1)u(n 1)
2
+P
b
(n|n 1)u
2
(n 1) +
2
w
. .. .
(7)
sendo minimizado para
u(n 1)
= 0
2
y(n 1) +
b(n|n 1)u(n 1)
b(n|n 1) + 2P
b
(n|n 1)u(n 1) = 0
Assim
u
(n 1) =
b(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
(8)
e substituindo-se (8) em (7) decorre
V (n 1, y) =
P
b
(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
+
2
w
(9)
Para t = n 2, de (6) e (9) tem-se
10
V (n 2, y) = min
u(n2)
y(n 2) +
b(n 1|n 2)u(n 2)
2
+ P
b
(n 1|n 2)u
2
(n 2) +
2
w
+ E
P
b
(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
+
2
w
Y
n2
(10)
Considere o cenrio mostrado na gura 7. O valor de u(n 2) obviamente
afeta a estimativa
y(n 2) +
2
considera o desempenho do sistema como se no existisse incerteza paramtrica.
O termo P
b
(n 1|n 2)u
2
(n 2) considera a incerteza atual e o termo
E
P
b
(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
+
2
w
Y
n2
(11)
considera o efeito de incertezas futuras. Por exemplo, se u(n2) for alto, conclui-
se que P
b
(n|n 1) pequeno, o mesmo ocorrendo com (11). Porm, isto conita
com a minimizao do termo P
b
(n 1|n 2)u
2
(n 2). Conclui-se ento que o
controle timo faz um compromisso entre:
Regulao: representado por
y(n 2) +
2
Prudncia: representado por P
b
(n 1|n 2)u
2
(n 2)
11
Aprendizado: representado por (11)
Regulao e aprendizagem so caractersticas duais do controle e so automa-
ticamente exibidas pela estratgia tima.
Caso a incerteza das estimativas paramtricas em (10) seja ignorada, resulta
V (n 2, y) = min
u(n2)
y(n 2) +
b(n 1|n 2)u(n 2)
2
+
2
w
de onde
u
(n 2) =
y(n 2)
b(n 1|n 2)
Neste caso tem-se um Certainty Equivalence Controller, pois no se considera
a incerteza paramtrica.
Obs 2 : Para = 1 e
v
= 0, isto , o parmetro b(t +1) constante, tem-se
P
1
b
(t + 1|t) = P
1
b
(t|t 1) +
u
2
(t 1)
2
w
e portanto P
1
b
(t + 1|t)
t=
, se u(0) = 0. Logo
b(t + 1) b. Nesta circuns-
tncia, a lei de controle baseada na equivalncia certeza assintoticamente
tima.
(y(t +d) y
ref
(t +d))
2
(17)
onde y
ref
(t +d) a referncia a ser seguida.
Na verso no adaptativa, u(t) dado por
u(t) =
y
ref
(t +d) G(q
1
)y(t) + (C(q
1
) 1) y
0
(t +d|t)
F(q
1
)B(q
1
)
(18)
onde y
ref
(t+d) a referncia, y
0
(t+d|t) o valor predito no instante t de y(t+d)
e os polinmios F(q
1
) e G(q
1
) so tais que
C(q
1
) = F(q
1
)A(q
1
) +q
d
G(q
1
) (19)
com
F(q
1
) = 1 +f
1
q
1
+ +f
k1
q
d+1
(20)
G(q
1
) = g
0
+g
1
q
1
+ +g
p
0
1
q
p
0
+1
(21)
5.1.1 Forma Indireta (Explcita)
A verso adaptativa da lei de controle (18) pode ser obtida estimando-se os coe-
cientes dos polinmios A(q
1
), B(q
1
) e C(q
1
) e resolvendo-se a verso adap-
tativa de (19):
C(q
1
, t) =
F(q
1
, t)
A(q
1
, t) +q
d
G(q
1
, t) (22)
Fazendo-se y
0
(t + d|t) = y
ref
(t + d), pode-se obter de (18) a lei de controle
adaptativo:
u(t) =
C(q
1
, t)y
ref
(t +d)
G(q
1
, t)y(t)
F(q
1
, t)
B(q
1
, t)
(23)
13
5.1.2 Forma Direta (Implcita)
Na forma implcita estima-se diretamente os parmetros do controlador. Mais
especicamente, pode-se escrever (18) na forma:
y
ref
(t +d) = G(q
1
)y(t) +F(q
1
)B(q
1
)u(t)
C(q
1
) 1
y
0
(t +d|t) (24)
ou ainda
y
ref
(t +d) =
T
(t) (25)
com
=
y(t)
.
.
.
y(t p
0
+ 1)
u(t)
.
.
.
u(t d +q
0
+ 2)
y
0
(t +d 1|t 1)
.
.
.
y
0
(t +d r
0
|t r
0
)
e
=
g
0
.
.
.
g
p
0
1
fb
0
.
.
.
fb
k+p
0
2
c
1
.
.
.
c
r
0
(t) (26)
Fazendo-se y
0
(t + d|t) = y
ref
(t + d), tem-se que a predio a posteriori de
y(t)
14
y(t) =
T
(t d)
(t 1) (27)
e a predio da sada
y(t +d 1|t 1) =
T
(t 1)
(t 1) (28)
Caso seja utilizado como estimador o mtodo dos mnimos quadrados, tem-se
K(t 1) =
P(t 2)(t d)
1 +
T
(t d)P(t 2)(t d)
(29)
(t) =
(t 1) +K(t 1) (y(t) y(t)) (30)
P(t 1) =
I K(t 1)
T
(t d)
P(t 2) (31)
sendo o controle u(k) obtido resolvendo-se (26).
6 Controle Adaptativo por Modelo de Referncia
A sada desejada especicada por um modelo de referncia linear com funo
de transferncia dada por:
G(z) =
z
d
H(z
1
)g
E(z
1
)
onde g um ganho constante e
H(z
1
) = 1 +h
1
z
1
+ +h
l
z
l
E(z
1
) = 1 +e
1
z
1
+ +e
l
z
l
com E(z
1
) estvel (sem zeros fora do crculo unitrio).
Assim, a sada do modelo de referncia dada por
E(q
1
)y
m
(t) = q
d
gH(q
1
)r(t)
onde r(t) a referncia.
Tal como no controlador de varincia mnima, a predio tima d passos a
frente y
0
f
(t +d|t) de y
f
(t +d) = E(q
1
)y(t +d) dada por
C(q
1
)y
0
f
(t +d|t) = G(q
1
)y(t) +F(q
1
)B(q
1
)u(t)
Sendo F(q
1
) e G(q
1
) os polinmios que satisfazem
15
C(q
1
)E(q
1
) = F(q
1
)A(q
1
) +q
d
G(q
1
)
Pode-se ento obter uma predio adaptativa y
f
(t) para y
f
(t) e fazer com que
esta predio seja igual a q
d
gH(q
1
)r(t), como sugerido pelo modelo de refe-
rncia. Isto leva ao seguinte algoritmo:
(t) =
(t 1) +P(t 1)(t d)
y
f
(t)
T
(t d)
(t 1)
P(t 1) = P(t 2)
P(t 2)(t d)
T
(t d)P(t 2)
1 +
T
(t d)P(t 2)(t d)
(t) =
y(t)
.
.
.
u(t)
.
.
.
y
f
(t +d 1)
.
.
.
y
f
(t) =
T
(t d)
(t d)
e o controle obtido de
(t)
(t) = gH(q
1
)r(t)
Referncias
[1] L. A. Aguirre. Introduo Identicao de Sistemas: Tcnicas Lineares e
No Lineares Aplicadas a Sistemas Reais. Editora UFMG, Belo Horizonte,
MG, 2000.
[2] K. J. strm and B. Wittenmark. On self tuning regulators. Automatica,
9:185199, 1973.
[3] K. J. strm and B. Wittenmark. Adaptive Control. Addison-Wesley Pu-
blishing Company, Reading, MA, 1989.
[4] R. Bellman and R. Kalaba. On adaptive control processes. IRE Transactions
on Automatic Control, 4:19, Nov 1959.
[5] R. F. Drenick and R. A. Shahbender. Adaptive servomechanisms. AIEE
Transactions, 76:286292, Nov 1957.
16
[6] B. Egardt. Stability of Adaptive Controllers. Springer-Verlag, New York,
1979.
[7] V. W. Eveleigh. Adaptive Control and Optimization Techniques. McGraw-
Hill Book Company, New York, 1967.
[8] G. C. Goodwin and K. S. Sin. Adaptive Filtering, Prediction and Control.
Prentice-Hall Information and System Sciences Series. Prentice-Hall, Inc.,
Englewood Cliffs, NJ, 1984.
[9] L. Guo and H.-F. Chen. strm-Wittenmak self-tuning regulator revisited
and ELS-based adaptive trackers. IEEE Transactions on Automatic Control,
36(7):802812, Jul 1991.
[10] P. A. Ioannou and K. S. Tsakalis. A robust direct adaptive controller. IEEE
Transactions on Automatic Control, 31(11):10331043, Nov 1986.
[11] R. E. Kalman. Design of self-optimizing control systems. Transactions of
ASME, 80:468478, 1958.
[12] Y. D. Landau. Adaptive ControlThe Model Reference Approach. Marcel
Dekker, New York, 1979.
[13] M. Margolis and C. T. Leondes. A parameter tracking servo for adaptive
control systems. IRE Transactions on Automatic Control, 4:100111, Nov
1959.
[14] I. M. Y. Marrels, B. D. O. Anderson, R. R. Bitmead, M. Bodson, and S. S.
Sastry. Revisition the mit rule for adaptive control. In Proceedings of the
2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing,
Lund, Sweden, 1986. International Federation of Automatic Control.
[15] R. H. Middleton, G. C. Goodwin, D. J. Hill, and D. Q. Mayne. Design issues
in adaptive control. IEEE Transactions on Automatic Control, 33(1):5058,
Jan 1988.
[16] A. S. Morse. Global stability of parameter-adaptive control systems. IEEE
Transactions on Automatic Control, 25:433439, 1980.
[17] K. S. Narendra and A. M. Annaswamy. Stable Adaptive Systems. Prentice-
Hall, Inc., Englewood Cliffs, NJ, 1989.
[18] K. S. Narendra, Y.-H. Lin, and L. S. Valavani. Stable adaptive controller
design, part II: Proof of stability. IEEE Transactions on Automatic Control,
24:440448, 1980.
17
[19] V. M. Popov. Hyperstability of Control Systems, volume 204 of Die Grun-
dlehren der matematischen Wissenshaften. Springer-Verlag, Berlin, Hidel-
berg, New York, 1973.
[20] S. Sastry and M. Bodson. Adaptive Control: Stability, Convergence and
Robustness. Prentice Hall Information and SystemSciences Series. Prentice-
Hall, Inc., Englewood Cliffs, NJ, 1989.
[21] J. G. Tuxal. Adaptive control. In Proceedings of the 2nd IFAC, Basle, Swit-
zerland, 1963. International Federation of Automatic Control.
[22] B. Wittenmark and P. O. Klln. Identication and design for robust adaptive
control. In Proceedings of the European Control Conference, pages 1390
1395, Grenoble, France, 1991.
[23] L. A. Zadeh. On the denition of adaptativity. Proceedings of the IEEE,
51:569570, Mar 1963.
18