Adaptivo

Universidade Federal do Rio Grande do Sul
Escola de Engenharia
Departamento de Engenharia Eltrica
Programa de Ps-Graduao em Engenharia Eltrica
ELE00071 Tpicos Especiais em Automao e Controle II
Controle Adaptativo de Sistemas Estocsticos
Prof. Walter Fetter Lages
18 de dezembro de 2007
1 Introduo
O termo adaptao denido na biologia como uma conformao vantajosa de
um organismo mudanas no seu ambiente. Inspirados por esta denio [5]
introduziram o termo sistema adaptativo na teoria de controle, para representar
sistemas de controle que monitoram o seu prprio desempenho e ajustam seus
parmetros de forma a melhora-lo.
Esta denio baseada na biologia imprecisa e, dependendo da interpreta-
o, engloba sistemas realimentados convencionais. Assim, ao longo do tempo
diversas denies de controle adaptativo foram propostas [7, 13, 4, 23, 21]. Ape-
sar destas diversas denies, amplamente aceito que um sistema de controle
adaptativo uma classe especial de sistemas no lineares que surge ao se tentar
controlar plantas com parmetros desconhecidos atravs da variao automtica
dos parmetros do controlador [17], como mostra a gura 1. importante res-
saltar que um sistema de controle adaptativo um sistema no linear ainda que
tanto a planta quanto o controlador sejam sistemas lineares. Ou seja, a adaptao
dos parmetros em malha fechada faz com que o sistema resultante torne-se no
linear.
A histria dos controladores adaptativos remonta dcada de 1950, especial-
mente com o objetivo de projetar pilotos automticos. Como os avies enfrentam
condies muito diferentes entre as diversas fases do voo, o controle adaptativo
parecia ser uma alternativa atraente. No entanto, na poca os computadores digi-
tais no estavam to desenvolvidos e as implementaes de controladores adapta-
tivos no obtiveram muito sucesso. Durante a dcada de 1960, houveram grandes
desenvolvimentos na teoria de identicao de sistemas e na teoria de controle
(surgimento do controle moderno), levando um melhor entendimento do proble-
1
PSfrag replacements
lei de
adaptao
controlador planta
y
ref
u y
Figura 1: Diagrama de blocos genrico de um controle adaptativo.
ma de controle adaptativo em geral. Nas dcadas de 1970 e 1980, com o desenvol-
vimento dos microprocessadores, o controle adaptativo ganhou um novo impulso,
devido possibilidade de implementao umcusto razovel. Odesenvolvimento
de controle adaptativo para sistemas no lineares deu-se principalmente na dcada
de 1990, assim como estudos abordando a robustez de controladores adaptativos.
Controle adaptativo particularmente interessante para sistemas cujos par-
metros da planta so desconhecidos ou variam com o tempo. Ou seja, assume-se
que a estrutura da planta conhecida, mas os valores dos parmetros no o so.
O enfoque usualmente adotado combinar tcnicas de estimao de parmetros
com tcnicas de projeto de sistemas de controle. Assim, pode-se imaginar di-
versas estratgias de controle adaptativo combinando-se cada uma das possveis
tcnicas de estimao de parmetros com cada uma das tcnicas de projeto de
controladores.
2 Paradigmas para Controle Adaptativo
Diferentes enfoques para o controle adaptativo foram propostos na literatura, mas
trs esquemas so os mais utilizados: Escalonamento de Ganho (Gain Schedule
GS), Controle Adaptativo por Modelo de Referncia (Model-Reference Adaptive
Control MRAC) e Regulador Auto-Sintonizvel (Self-Tuning Regulator STR).
2.1 Escalonamento de Ganho
Escalonamento de ganho o enfoque mais antigo e mais intuitivo para controle
adaptativo. A idia consiste em utilizar alguma varivel auxiliar, que seja correla-
cionada com as alteraes na dinmica da planta, em funo da qual os parmetros
do controlador so ajustados, como mostra a gura 2. Tipicamente os parmetros
do controlador so variados de forma discreta dentro de um conjunto pr-denido.
2
Ou seja, so projetados controladores xos para diversas regies de operao da
planta e o algoritmo de controle adaptativo consiste em selecionar, em funo das
variveis auxiliares, qual destes controladores o mais adequado em um dado
instante de tempo.
variveis
auxiliares
PSfrag replacements
escalonamento
de ganho
controlador planta
y
ref
u y
Figura 2: Diagrama de blocos de um controle adaptativo por escalonamento de

ganho.
O GS um mtodo conveniente apenas se a dinmica da planta varia de forma
bem conhecida em funo de poucas variveis facilmente medidas. No entanto, a
pesar de ser um mtodo bastante utilizado na prtica, o escalonamento de ganho
tem a desvantagem de ser um mecanismo de adaptao em malha aberta. Adici-
onalmente, se o nmero de regies de operao da planta for elevado, o esforo
necessrio para projeto pode ser muito grande, pois necessrio projetar-se um
controlador para cada uma destas regies. Outra diculdade inerente a este mto-
do a prova de estabilidade do controlador resultante. Mesmo que se possa provar
a estabilidade para todos os controladores associados a cada uma das regies de
operao, no h garantias de que ao se chavear entre eles o sistema resultante
continuar estvel.
2.2 Controle Adaptativo por Modelo de Referncia
No MRAC a idia bsica fazer com que o sistema sob controle comporte-se
como um dado modelo de referncia, como mostra a gura 3. O modelo de re-
ferncia representa a dinmica desejada para a planta, e o objetivo do controle
adaptativo neste caso fazer com que a sada da planta convirja assintoticamente
para a sada do modelo de referncia.
A escolha do modelo de referncia parte do projeto do MRAC e deve por
um lado reetir as especicaes de desempenho do sistema de controle, como
tempo de subida, tempo de acomodao, overshoot, etc. e por outro lado, deve ser
tal que exiba um comportamento possvel de ser atingido pelo sistema de controle.
3
+
PSfrag replacements
lei de
adaptao
controlador planta
modelo de
referncia
y
ref
u y
y
m
e
Figura 3: Diagrama de blocos de umcontrole adaptativo por modelo de referncia.
Assim, a escolha do modelo de referncia est sujeita a restries emsua estrutura,
como ordem e grau relativo, que dependem da estrutura do modelo da planta.
O controlador parametrizado em funo de um conjunto de parmetros ajus-
tveis a serem determinados pelo mecanismo de adaptao e deve possuir a ca-
pacidade de rastreamento prefeito. Ou seja, se os parmetros da planta forem
conhecidos exatamente, os parmetros correspondentes do controlador devem ser
tais que fazem a sada da planta convergir para a sada do modelo de referncia.
Usualmente, para que se possa obter provas de estabilidade e convergncia, os
mtodos de controle adaptativo exigem que o controlador possa ser parametriza-
do linearmente, ou seja, que a lei de controle seja linear com relao aos seus
parmetros.
O problema principal no projeto de um MRAC obter um mecanismo de
ajuste dos parmetros do controlador que faa com que o erro de sada e = y y
m
convirja para zero. Nas primeiras verses do MRAC era utilizado um mecanismo
de adaptao baseado no gradiente. Supondo que seja o vetor de parmetros do
controlador, a idia reduzir e
2
() atravs do ajuste de de forma a causar a sua
maior reduo, ou seja
d
dt
= K

e
2
()
= 2Ke()

(e()) (1)
onde K uma constante positiva denominada ganho de adaptao.
A varivel e() o erro de sada obtido supondo-se que os parmetros do
controlador so . Como o gradiente de e() igual ao gradiente de y(), j que
y
m
independente de , pode-se escrever:
4
d
dt
= 2Ke()

(y()) (2)
A funo de sensitividade
y()
usualmente depende dos parmetros da planta,

que so desconhecidos. Para resolver este problema foi proposta a chamada regra
do M.I.T., que consiste em utilizar ao invs dos parmetros desconhecidos as suas
estimativas no instante t. Infelizmente, para os esquemas baseados na regra do
M.I.T. no possvel, em geral, obter-se uma prova da estabilidade em malha
fechada ou da convergncia do erro de sada para zero [20]. No entanto, quando o
ganho de adaptao e a amplitude entrada de referncia so pequenas, o esquema
apresenta um bom desempenho, o que foi comprovado analiticamente por [14].
A substituio da funo de sensitividade
y()
por outras funes permite

que se obtenha a prova de estabilidade e propriedades de convergncia atravs da
teoria de Lyapunov [18, 16]. Provas de estabilidade BIBO utilizando o conceito
de hiperestabilidade [19] foram propostas por [6] e por [12].
A possibilidade de se ter uma prova de estabilidade e das propriedades de
convergncia do controlador tornam o MRAC bastante atraente. Como se pode
perceber pelos comentrios anteriores, o MRAC um esquema tipicamente de-
senvolvido em tempo contnuo, embora a implementao em geral seja realizada
em um computador digital, devido a complexidade dos clculos necessrios. A
suposio neste caso, a de que a taxa de amostragem elevada o suciente para
que a implementao discreta seja uma boa aproximao para o projeto contnuo.
2.3 Controle Adaptativo Auto-Sintonizado
Em controladores convencionais (no adaptativos), os parmetros do controlador
so computados a partir dos parmetros da planta. Se os parmetros da planta
no so conhecidos, intuitivo substitui-los pelas suas estimativas determinadas
por algum estimador (on-line) de parmetros. O controlador obtido desta forma,
isto , combinando-se um esquema de identicao on-line de parmetros com
um controlador convencional denominado STR e foi proposto originalmente
por [11] e posteriormente analisado por [2].
Os controladores STR so tipicamente desenvolvidos em tempo discreto. A
cada instante de amostragem os parmetros da planta () so identicados com
base nas entradas (u) e sadas (y) passadas, os parmetros do controlador () so
determinados e o sinal de controle (u) gerado.
Note que no STR os parmetros so determinados de forma a ajustar-se aos
dados de entrada e sada da planta, enquanto que no MRAC os parmetros so
ajustados de forma a fazer o erro de rastreamento convergir para zero. Pode ser
mostrado [3], que a abordagem MRAC um caso particular do STR com uma
reparametrizao adequada.
5
O enfoque STR baseia-se na variao dos parmetros do controlador de forma
otimizar algum ndice de desempenho. Pode-se mostrar que um estimador de
parmetros da planta tipo mnimos quadrados combinado com um controlador
de varincia mnima uma tcnica tima um-passo--frente. Combinando-se os
possveis mtodos de estimao e de controle tem-se diversas variantes de STR.
A estabilidade e a convergncia de controladores STR so geralmente mais
difceis de se garantir do que controladores MRAC, frequentemente exigindo su-
posies sobre as propriedades dos sinais envolvidos, de forma a garantir a con-
vergncia dos parmetros estimados para os seus valores reais. Vide [9], por
exemplo. Se os sinais no forem ricos o suciente, as estimativas dos parme-
tros podem no estar prximas dos valores reais e a estabilidade e convergncia
do sistema de controle pode no ser garantida. Nestes casos, deve-se introduzir
sinais de perturbao nas entradas, para garantir a sua riqueza ou modicar a lei
de controle [10, 15, 20, 22].
Sob determinadas condies no necessrio identicar os parmetros do pro-
cesso, sendo suciente identicar-se diretamente os parmetros do controlador.
Assim, os controladores STR podem ser classicados em direto e indireto.
2.3.1 Controle Adaptativo Indireto
O diagrama de blocos de um controlador genrico mostrado na gura 1. De-
pendendo da complexidade do bloco da lei de adaptao pode-se ter duas grandes
classes de algoritmos STR. O esquema conceitualmente mais simples quando o
sistema parametrizado de uma forma natural e o projeto do controlador feito
com base no modelo estimado do sistema, como mostra a gura 4. Esta classe
de algoritmos denominada indireta, pois a lei de controle obtida indiretamente
atravs do modelo do sistema. Estes esquemas tambm so denominados explci-
tos pois o projeto baseado em um modelo explcito do processo.
PSfrag replacements
estimador de
parmetros
sntese do
controlador
controlador planta
y
ref
u y
Figura 4: Diagrama de blocos de um controle adaptativo indireto.

6
2.3.2 Controle Adaptativo Direto
Em alguns casos possvel parametrizar o sistema diretamente em termos dos
parmetros da lei de controle, tornando o projeto da lei de controle trivial. Esta
classe da algoritmos denominada direta j que a lei de controle diretamente
estimada, como mostra a gura 5. Estes esquemas so denominados implcitos
pois o projeto baseado em uma estimao implcita do modelo do processo.
estimador de
parmetros
PSfrag replacements
sntese do
controlador planta
y
ref
u y
Figura 5: Diagrama de blocos de um controle adaptativo direto.

3 Controle Adaptativo Auto-sintonizado
Controladores STR so obtidos combinando-se uma tcnica de estimao de pa-
rmetros com uma tcnica de controle. As tcnicas de controle mais utilizadas so
Varincia Mnima (MV), Varincia Mnima Generalizada (GMV), Controle Pre-
ditivo Generalizado (GPC), Alocao de Plos (PP) e controle Linear Quadrtico
Gaussiano (LQG). Para possibilitar a implementao do controlador em tempo re-
al, utiliza-se tcnicas de estimao de parmetros recursivas, principalmente M-
nimos Quadrados Recursivo (RLS), Mnimos Quadrados Extendido (ELS), Mto-
dos de Erro de Predio (PEM) e Variveis Instrumentais (IV). Em [1] encontra-se
uma abordagem detalhada destes mtodos de identicao, de forma que aqui se-
ro abordados apenas os mtodos de controle.
Esta idia de utilizar as estimativas como se fossemos parmetros reais deno-
minada Princpio da Equivalncia Certeza e pode ser demonstrado que vlida
para o caso LQG [8]. Com este enfoque pode-se obter uma grande quantidade
de algoritmos, dependendo de qual tcnica de estimao combinada com qual
tcnica de controle. Obviamente, algumas combinaes funcionaro melhor do
que outras e algumas simplesmente no funcionaro. Por outro lado, para alguns
esquemas ser possvel obter provas de estabilidade e convergncia.
Assim, o procedimento Bsico resolver o problema de controle supondo
parmetros conhecidos e a seguir substituir tais parmetros pelas suas estimativas.
7
O diagrama de blocos correspondente mostrado na gura 6.
da planta
PSfrag replacements
estimador de
parmetros
parmetros
sntese do
controlador
controlador
planta
parmetros do
perturbaes
controle em
tempo real
RLS, ELS, etc
MV, GMV, LQG, PP, etc
(t)
(t)
Figura 6: Diagrama de blocos do controle adaptativo baseado na equivalncia
certeza.
4 Controle Adaptativo Estocstico
Considere o sistema
y(t + 1) = y(t) +b(t + 1)u(t) +w(t + 1) (3)
com w(t + 1) N(0,
2
w
), e
b(t + 1) = b(t) +v(t) (4)
onde || < 1 (conhecido), v(t) N(0,
2
v
), b(0) N(b
0
,
2
b
).
O custo a ser minimizado :
J
0,n
(U
0,n
) = E
n1
t=0
y
2
(t + 1)
8
com u(t) = f (y(t), y(t + 1), . . . ) e sendo a funo valor dada por
V (t, y) = min
u(t)
E
n1
k=t
y
2
(k + 1)
Y
t
com Y
t
= (y(0), y(1), . . . , y(t)).
Logo,
V (t, y) = min
u(t)
E
y
2
(t + 1) +
n1
k=t+1
y
2
(k + 1)
Y
t
e como E[X|Y
t
] = E [ E[X|Y
t+1
]| Y
t
] j que Y
t+1
Y
t
, tem-se
V (t, y) = min
u(t)
E
y
2
(t + 1) +E
n1
k=t+1
y
2
(k + 1)
Y
t+1
Y
t
= min
u(t)
E
y
2
(t + 1) +V (t + 1, y)
Y
t
(5)
O clculo de u(t) em (5) difcil, pois o controle tem que satisfazer um com-
promisso entre o objetivo imediato, representado por y
2
(t +1) e o objetivo futuro,
representado por V (t + 1, y).
Denindo-se
b(t + 1|t) = E [b(t + 1)|Y

t
]
P
b
(t + 1|t) = E
b(t + 1)
b(t + 1|t)
Y
t
De (3) tem-se
E
y
2
(t + 1)|Y
t
= E
(y(t) +b(t + 1)u(t))

2
+ 0 + w
2
(t + 1)
Y
t
= y
2
(t) + 2y(t)u(t)E[ b(t + 1)| Y
t
] +u
2
(t)E
b
2
(t + 1)|Y
t
+
2
w
=
y(t) +
b(t + 1|t)u(t)
2
+P
b
(t + 1|t)u
2
(t) +
2
w
e portanto (5) pode ser reescrita na forma
V (t, y) = min
u(t)
y(t) +
b(t + 1|t)u(t)
2
+P
b
(t + 1|t)u
2
(t) +
2
w
+E [V (t + 1, y)|Y
t
]
(6)
9
Obs 1 : Pode-se escrever (3) e (4) na forma de variveis de estado:
x(k + 1) = x(k) +v(k)
y(k) y(k 1)
. .. .
y(k)
= u(k 1)
. .. .
C(k)
x(k) +w(k)
logo
x(k + 1|k) = x(k|k 1) +K(k) (y(k) C(k) x(k|k 1))
P(k + 1|k) =

2
P(k|k 1)
2
w
u
2
(k 1)P(k|k 1) +
2
w
+
2
v
Para o instante nal t = n 1, de (6) tem-se

V (n1, y) = min
u(n1)
y(n 1) +
b(n|n 1)u(n 1)
2
+P
b
(n|n 1)u
2
(n 1) +
2
w
. .. .
(7)
sendo minimizado para
u(n 1)
= 0
2
y(n 1) +
b(n|n 1)u(n 1)
b(n|n 1) + 2P
b
(n|n 1)u(n 1) = 0
Assim
u
(n 1) =
b(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
(8)
e substituindo-se (8) em (7) decorre
V (n 1, y) =
P
b
(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
+
2
w
(9)
Para t = n 2, de (6) e (9) tem-se
10
V (n 2, y) = min
u(n2)
y(n 2) +

b(n 1|n 2)u(n 2)
2
+ P
b
(n 1|n 2)u
2
(n 2) +
2
w
+ E
P
b
(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
+
2
w
Y
n2
(10)
Considere o cenrio mostrado na gura 7. O valor de u(n 2) obviamente
afeta a estimativa
b(n|n 1) e portanto u(n 1) no pode ser calculador por (8),

idem par u(n 2), etc.
PSfrag replacements
y(n)
n n 1 n 2
u(n 1)
u(n 2)
Figura 7: ltimo valor de y() no custo.
Se t < n 1, isto se o controlador sabe que mais observaes sero feitas, o
sistema pode ser excitado (probed) de modo a melhorar as estimativas. Portanto, o
controle pode sacricar o objetivo imediato em benefcio da reduo da incerteza
paramtrica. Na expresso (10), o termo
y(n 2) +
b(n 1|n 2)u(n 2)
2
considera o desempenho do sistema como se no existisse incerteza paramtrica.
O termo P
b
(n 1|n 2)u
2
(n 2) considera a incerteza atual e o termo
E
P
b
(n|n 1)y(n 1)
P
b
(n|n 1) +
b
2
(n|n 1)
+
2
w
Y
n2
(11)
considera o efeito de incertezas futuras. Por exemplo, se u(n2) for alto, conclui-
se que P
b
(n|n 1) pequeno, o mesmo ocorrendo com (11). Porm, isto conita
com a minimizao do termo P
b
(n 1|n 2)u
2
(n 2). Conclui-se ento que o
controle timo faz um compromisso entre:
Regulao: representado por
y(n 2) +
b(n 1|n 2)u(n 2)
2
Prudncia: representado por P
b
(n 1|n 2)u
2
(n 2)
11
Aprendizado: representado por (11)
Regulao e aprendizagem so caractersticas duais do controle e so automa-
ticamente exibidas pela estratgia tima.
Caso a incerteza das estimativas paramtricas em (10) seja ignorada, resulta
V (n 2, y) = min
u(n2)
y(n 2) +

b(n 1|n 2)u(n 2)
2
+
2
w
de onde
u
(n 2) =
y(n 2)
b(n 1|n 2)
Neste caso tem-se um Certainty Equivalence Controller, pois no se considera
a incerteza paramtrica.
Obs 2 : Para = 1 e
v
= 0, isto , o parmetro b(t +1) constante, tem-se
P
1
b
(t + 1|t) = P
1
b
(t|t 1) +
u
2
(t 1)
2
w
e portanto P
1
b
(t + 1|t)
t=
, se u(0) = 0. Logo

b(t + 1) b. Nesta circuns-
tncia, a lei de controle baseada na equivalncia certeza assintoticamente
tima.
5 Controladores Adaptativos Baseados no Mnimo

Erro de predio
5.1 Controle Adaptativo de Varincia Mnima
Considere o sistema representado pelo modelo ARMAX:
y(t + 1) = a
1
y(t) + +a
p
0
y(t p
0
+ 1)
+ b
1
u(t d + 1) + +b
q
0
u(t q
0
d + 2) (12)
+ w(t + 1) +c
1
w(t) + +c
r
0
w(t r
0
+ 1)
com E[w(t + 1)|F
t
] = 0, E[w
2
(t + 1)|F
t
] =
2
e F
t
= {y(i), i t}.
12
ou ainda
A(q
1
)y(t + 1) = q
d
B(q
1
)u(t + 1) +C(q
1
)w(t + 1) (13)
com
A(q
1
) = 1 a
1
q
1
a
p
0
q
p
0
(14)
B(q
1
) = b
1
+b
2
q
1
+ +b
q
0
q
q
0
+1
(15)
C(q
1
) = 1 + c
1
q
1
+ +c
r
0
q
r
0
(16)
Deseja-se determinar u(t) emfuno de y(t), y(t+1), . . . , u(t1), u(t2),. . . ,
de modo a minimizar o custo:
J(t +k) = E
(y(t +d) y
ref
(t +d))
2
(17)
onde y
ref
(t +d) a referncia a ser seguida.
Na verso no adaptativa, u(t) dado por
u(t) =
y
ref
(t +d) G(q
1
)y(t) + (C(q
1
) 1) y
0
(t +d|t)
F(q
1
)B(q
1
)
(18)
onde y
ref
(t+d) a referncia, y
0
(t+d|t) o valor predito no instante t de y(t+d)
e os polinmios F(q
1
) e G(q
1
) so tais que
C(q
1
) = F(q
1
)A(q
1
) +q
d
G(q
1
) (19)
com
F(q
1
) = 1 +f
1
q
1
+ +f
k1
q
d+1
(20)
G(q
1
) = g
0
+g
1
q
1
+ +g
p
0
1
q
p
0
+1
(21)
5.1.1 Forma Indireta (Explcita)
A verso adaptativa da lei de controle (18) pode ser obtida estimando-se os coe-
cientes dos polinmios A(q
1
), B(q
1
) e C(q
1
) e resolvendo-se a verso adap-
tativa de (19):
C(q
1
, t) =

F(q
1
, t)

A(q
1
, t) +q
d
G(q
1
, t) (22)
Fazendo-se y
0
(t + d|t) = y
ref
(t + d), pode-se obter de (18) a lei de controle
adaptativo:
u(t) =
C(q
1
, t)y
ref
(t +d)

G(q
1
, t)y(t)
F(q
1
, t)

B(q
1
, t)
(23)
13
5.1.2 Forma Direta (Implcita)
Na forma implcita estima-se diretamente os parmetros do controlador. Mais
especicamente, pode-se escrever (18) na forma:
y
ref
(t +d) = G(q
1
)y(t) +F(q
1
)B(q
1
)u(t)
C(q
1
) 1
y
0
(t +d|t) (24)
ou ainda
y
ref
(t +d) =
T
(t) (25)
com
=
y(t)
.
.
.
y(t p
0
+ 1)
u(t)
.
.
.
u(t d +q
0
+ 2)
y
0
(t +d 1|t 1)
.
.
.
y
0
(t +d r
0
|t r
0
)
e
=
g
0
.
.
.
g
p
0
1
fb
0
.
.
.
fb
k+p
0
2
c
1
.
.
.
c
r
0
Considerando que ser estimado, a verso adaptativa de (25)

y
ref
(t +d) =
T
(t)
(t) (26)
Fazendo-se y
0
(t + d|t) = y
ref
(t + d), tem-se que a predio a posteriori de
y(t)
14
y(t) =
T
(t d)
(t 1) (27)
e a predio da sada
y(t +d 1|t 1) =
T
(t 1)
(t 1) (28)
Caso seja utilizado como estimador o mtodo dos mnimos quadrados, tem-se
K(t 1) =
P(t 2)(t d)
1 +
T
(t d)P(t 2)(t d)
(29)
(t) =

(t 1) +K(t 1) (y(t) y(t)) (30)
P(t 1) =
I K(t 1)
T
(t d)
P(t 2) (31)
sendo o controle u(k) obtido resolvendo-se (26).
6 Controle Adaptativo por Modelo de Referncia
A sada desejada especicada por um modelo de referncia linear com funo
de transferncia dada por:
G(z) =
z
d
H(z
1
)g
E(z
1
)
onde g um ganho constante e
H(z
1
) = 1 +h
1
z
1
+ +h
l
z
l
E(z
1
) = 1 +e
1
z
1
+ +e
l
z
l
com E(z
1
) estvel (sem zeros fora do crculo unitrio).
Assim, a sada do modelo de referncia dada por
E(q
1
)y
m
(t) = q
d
gH(q
1
)r(t)
onde r(t) a referncia.
Tal como no controlador de varincia mnima, a predio tima d passos a
frente y
0
f
(t +d|t) de y
f
(t +d) = E(q
1
)y(t +d) dada por
C(q
1
)y
0
f
(t +d|t) = G(q
1
)y(t) +F(q
1
)B(q
1
)u(t)
Sendo F(q
1
) e G(q
1
) os polinmios que satisfazem
15
C(q
1
)E(q
1
) = F(q
1
)A(q
1
) +q
d
G(q
1
)
Pode-se ento obter uma predio adaptativa y
f
(t) para y
f
(t) e fazer com que
esta predio seja igual a q
d
gH(q
1
)r(t), como sugerido pelo modelo de refe-
rncia. Isto leva ao seguinte algoritmo:
(t) =

(t 1) +P(t 1)(t d)
y
f
(t)
T
(t d)
(t 1)
P(t 1) = P(t 2)
P(t 2)(t d)
T
(t d)P(t 2)
1 +
T
(t d)P(t 2)(t d)
(t) =
y(t)
.
.
.
u(t)
.
.
.
y
f
(t +d 1)
.
.
.
y
f
(t) =
T
(t d)
(t d)
e o controle obtido de
(t)
(t) = gH(q
1
)r(t)
Referncias
[1] L. A. Aguirre. Introduo Identicao de Sistemas: Tcnicas Lineares e
No Lineares Aplicadas a Sistemas Reais. Editora UFMG, Belo Horizonte,
MG, 2000.
[2] K. J. strm and B. Wittenmark. On self tuning regulators. Automatica,
9:185199, 1973.
[3] K. J. strm and B. Wittenmark. Adaptive Control. Addison-Wesley Pu-
blishing Company, Reading, MA, 1989.
[4] R. Bellman and R. Kalaba. On adaptive control processes. IRE Transactions
on Automatic Control, 4:19, Nov 1959.
[5] R. F. Drenick and R. A. Shahbender. Adaptive servomechanisms. AIEE
Transactions, 76:286292, Nov 1957.
16
[6] B. Egardt. Stability of Adaptive Controllers. Springer-Verlag, New York,
1979.
[7] V. W. Eveleigh. Adaptive Control and Optimization Techniques. McGraw-
Hill Book Company, New York, 1967.
[8] G. C. Goodwin and K. S. Sin. Adaptive Filtering, Prediction and Control.
Prentice-Hall Information and System Sciences Series. Prentice-Hall, Inc.,
Englewood Cliffs, NJ, 1984.
[9] L. Guo and H.-F. Chen. strm-Wittenmak self-tuning regulator revisited
and ELS-based adaptive trackers. IEEE Transactions on Automatic Control,
36(7):802812, Jul 1991.
[10] P. A. Ioannou and K. S. Tsakalis. A robust direct adaptive controller. IEEE
Transactions on Automatic Control, 31(11):10331043, Nov 1986.
[11] R. E. Kalman. Design of self-optimizing control systems. Transactions of
ASME, 80:468478, 1958.
[12] Y. D. Landau. Adaptive ControlThe Model Reference Approach. Marcel
Dekker, New York, 1979.
[13] M. Margolis and C. T. Leondes. A parameter tracking servo for adaptive
control systems. IRE Transactions on Automatic Control, 4:100111, Nov
1959.
[14] I. M. Y. Marrels, B. D. O. Anderson, R. R. Bitmead, M. Bodson, and S. S.
Sastry. Revisition the mit rule for adaptive control. In Proceedings of the
2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing,
Lund, Sweden, 1986. International Federation of Automatic Control.
[15] R. H. Middleton, G. C. Goodwin, D. J. Hill, and D. Q. Mayne. Design issues
in adaptive control. IEEE Transactions on Automatic Control, 33(1):5058,
Jan 1988.
[16] A. S. Morse. Global stability of parameter-adaptive control systems. IEEE
Transactions on Automatic Control, 25:433439, 1980.
[17] K. S. Narendra and A. M. Annaswamy. Stable Adaptive Systems. Prentice-
Hall, Inc., Englewood Cliffs, NJ, 1989.
[18] K. S. Narendra, Y.-H. Lin, and L. S. Valavani. Stable adaptive controller
design, part II: Proof of stability. IEEE Transactions on Automatic Control,
24:440448, 1980.
17
[19] V. M. Popov. Hyperstability of Control Systems, volume 204 of Die Grun-
dlehren der matematischen Wissenshaften. Springer-Verlag, Berlin, Hidel-
berg, New York, 1973.
[20] S. Sastry and M. Bodson. Adaptive Control: Stability, Convergence and
Robustness. Prentice Hall Information and SystemSciences Series. Prentice-
Hall, Inc., Englewood Cliffs, NJ, 1989.
[21] J. G. Tuxal. Adaptive control. In Proceedings of the 2nd IFAC, Basle, Swit-
zerland, 1963. International Federation of Automatic Control.
[22] B. Wittenmark and P. O. Klln. Identication and design for robust adaptive
control. In Proceedings of the European Control Conference, pages 1390
1395, Grenoble, France, 1991.
[23] L. A. Zadeh. On the denition of adaptativity. Proceedings of the IEEE,
51:569570, Mar 1963.
18

Adaptivo

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Adaptivo

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade Federal do Rio Grande do Sul

Figura 2: Diagrama de blocos de um controle adaptativo por escalonamento de

usualmente depende dos parmetros da planta,

por outras funes permite

Figura 4: Diagrama de blocos de um controle adaptativo indireto.

Figura 5: Diagrama de blocos de um controle adaptativo direto.

b(t + 1|t) = E [b(t + 1)|Y

(y(t) +b(t + 1)u(t))

Para o instante nal t = n 1, de (6) tem-se

b(n|n 1) e portanto u(n 1) no pode ser calculador por (8),

b(n 1|n 2)u(n 2)

b(n 1|n 2)u(n 2)

5 Controladores Adaptativos Baseados no Mnimo

Considerando que ser estimado, a verso adaptativa de (25)

Você também pode gostar