Escolar Documentos
Profissional Documentos
Cultura Documentos
Marco Antonio Leite Beteto∗, Emerson R. P. da Silva∗, Luiz F. S. Buzachero∗, Edvaldo Assunção†,
Marcelo C. M. Teixeira†, Rodrigo P. Caun‡
∗
Lab de Controle e Otimização de Sistemas, Departamento Acadêmico de Elétrica, Univ Tecnol Federal do Paraná
Av. Alberto Carazzai, no 1640, 86300-000 - Cornélio Procópio, PR, Brasil
†
Lab de Pesquisa em Controle, Departamento de Engenharia Elétrica, Univ Estadual Paulista
Av. José Carlos Rossi, no 1370, 15385-000 - Ilha Solteira, SP, Brasil
‡
Coordenação de Engenharia Eletrônica, Universidade Tecnológica Federal do Paraná
Rua Cristo Rei, 19, 85902-490, Toledo, Paraná, Brasil
Abstract— In this paper, the resolution of the problem of the linear quadratic regulator (LQR) approached via linear matrix
inequalities (LMIs) for linear time-invariant systems is proposed, in which the weighting matrices the vector of state-derivative
and the signal vector of control are obtained by a genetic algorithm (GA). The controllers designs are based in the state-
derivative feedback. The factor to the choice of the state-derivative feedback is your easy implementation in certain mechanical
systems, such as in vibrations control, for example. To ilustrate the efficiency of the proposed theorems, simulations considering
the model of an active suspension system manufactured by Quanser
R
are performed.
Keywords— Linear Quadratic Regulator, Linear Matrix Inequalities, State-Derivative Feedback, Robust Stability, Structural
Failures.
Resumo— Neste trabalho é proposta a resolução do problema do regulador linear quadrático (LQR) por aproximação via
desigualdades matriciais lineares (LMIs) para sistemas lineares e invariantes no tempo, no qual as matrizes de ponderação
do vetor da derivada dos estados e do vetor do sinal de controle são obtidas por meio de um algoritmo genético (GA). Os
projetos dos controladores são baseados na realimentação derivativa. Um fator para a escolha de realimentar a derivada do
vetor de estados é sua fácil implementação em determinados sistemas mecânicos, como no controle de vibrações, por exemplo.
Como forma de ilustrar a eficiência dos teoremas propostos, são realizadas simulações considerando o modelo de um sistema de
suspensão ativa, fabricado pela Quanser
R
.
Palavras-chave— Regulador Linear Quadrático (LQR), Desigualdades Matriciais Lineares (LMI), Realimentação Derivativa,
Estabilidade Robusta, Falhas Estruturais.
ẋ(t) = Ax(t) − BK ẋ(t) ⇔ ẋ(t) = (I + BK)−1 Ax(t), (3) Levando em consideração que o sistema em malha fe-
chada é assintoticamente estável, isto é, todos os autova-
sendo I ∈ Rn×n a matriz identidade. Para maiores deta- lores de (3) possuem parte real negativa, então x(∞) → 0.
lhes vide (Abdelaziz and Valášek, 2004). Assim, o ı́ndice converge para o valor ótimo quando
Considere o sistema controlável, linear invariante no O ı́ndice J pode ser obtido por meio das condições
tempo descrito por (1). iniciais x(0) e pela matriz P . O LQR-derivativo pode ser
O controle LQR-derivativo com desempenho dinâmico visto com maiores detalhes em (Abdelaziz and Valášek,
especificado pode ser alcançado por meio do projeto do 2005).
controlador que minimize a função quadrática ou ı́ndice de
desempenho do tipo: 4 Controlador LQR-Derivativo via LMI
Z ∞
Fundamentalmente o problema LQR consiste na reso-
J(ẋ(t), u(t)) = min (ẋ(t)T Qẋ(t) + u(t)T Ru(t))dt, (4) lução da ARE e, levando em conta sua natureza matricial,
u 0 pode ser resolvido utilizando LMIs.
sendo Q uma matriz simétrica n × n definida positiva e R Para a demonstração do controlador LQR-derivativo
uma matriz simétrica m×m definida positiva. As matrizes em termos de LMI, o Lema 1 e a Propriedade 1 são utili-
Q e R são as matrizes de ponderação da derivada dos es- zados.
tados e do sinal de controle, respectivamente. Nota-se que
essa formulação é semelhante ao LQR original, porém o Lema 1 (Complemento de Schur) Considere a LMI
ı́ndice é baseado na derivada dos estados, não nos estados.
M1 (x) M2 (x)
A lei de controle que soluciona o problema do LQR é > 0, (11)
M2 (x)T M3 (x)
dada por,
sendo M1 (x) = M1 (x)T , M3 (x) = M3 (x)T e M2 (x) depen-
u(t) = −K ẋ(t) = −R−1 B T A−T P ẋ(t), (5) dem de modo afim de x, é equivalente a
ISSN 2525-8311 1417
XXI Congresso Brasileiro de Automática - CBA2016
UFES, Vitória - ES, 3 a 7 de outubro
M3 (x) > 0, M1 (x) − M2 (x)(M3 (x))−1 M2 (x)T > 0. (12) A−1 X + XA−T + A−1 BY + Y T B T A−T + Y T RY + XQX < 0,
(21)
ou ainda, Considerando a mudança de variável Y = KX e mul-
tiplicando a direita e a esquerda por X −1 = P , tem-se:
X = X T > 0, Y
Sujeito a x(t)T ATcl P x(t) + x(t)T P Acl x(t)
T
µ x(0)
≥ 0, (14) + x(t)T ATcl K T RKAcl x(t)
x(0) X
+ x(t)T ATcl QAcl x(t) < 0. (25)
YT
V X
X −Q−1 0 < 0, (15) Substituindo ẋ(t) = Acl x(t) = (I + BK)−1 Ax(t), tem-
Y 0 −R−1 se:
sendo V = A−1 X + XA−T + A−1 BY + Y T B T A−T . O
ganho de realimentação da derivada dos estados pode ser ẋ(t)T P x(t) + x(t)T P ẋ(t) ≤ −ẋ(t)T (K T RK + Q)ẋ(t). (26)
dado por
Assim,
K = Y X −1 , (16)
V̇ (x(t)) ≤ 0. (27)
com X −1 = P .
A prova do Teorema 1 está concluı́da. 2
Prova: Aplicando o complemento de Schur na LMI (14),
tem-se
5 Controlador LQR-Derivativo via LMI para
x(0) X T −1
x(0) ≤ µ. (17) sistemas incertos invariantes no tempo
Em muitas situações práticas, o objetivo (10) pode ser Considere o sistema linear incerto e invariante no
modificado por (17), onde µ é o limite superior especificado. tempo descrito como uma combinação convexa dos vértices
Separando a LMI (15) em blocos matriciais: do politopo:
r s
YT
V X X X
X −Q−1 0 < 0. (18) ẋ(t) = αi Ai x(t) + βj Bj u(t), (28)
Y 0 −R−1 i=1 j=1
r
! s
r
! s
s
r
! r
!
s
X X X X X X X X
=X αi ATi βj + αi Ai βj X + βj Bj Y αi ATi + αi Ai YT βj BjT
i=1 j=1 i=1 j=1 j=1 i=1 i=1 j=1
! ! ! !
r
X r
X Xs r
X r
X Xs
=X αi ATi + αi Ai X + βj Bj Y αi ATi + αi Ai YT βj BjT < 0.
i=1 i=1 j=1 i=1 i=1 j=1
a solução de (3). 2
0
1
Ms
+ u(t). (33)
0
− M1us
6 Exemplo Ilustrativo com
x3 (t) − x1 (t)
Conside um modelo de suspensão ativa de um auto- ẋ3 (t)
R
x1 (t) − zr (0) e u(t) = Fc .
x(t) =
móvel, produzido pela Quanser , cujo esquemático está
presente na Figura 1. O sistema é composto por duas mas- ẋ1 (t)
sas, Ms e Mus , duas molas, ks e kus , dois amortecedores,
bs e bus , e um atuador (motor), controlado pela força Fc
(da Silva et al., 2013). Tabela 1: Parâmetros suspensão ativa.
Parâmetros Sı́mbolo Valor
Massa de 1
4
do corpo total do veı́culo (kg) Ms 2, 45
Massa do conjunto do pneu (kg) Mus 1
Acelerômetro (⇒ ẍ3 (t)) Constante de rigidez da mola (N/m) ks 900
x3 (t) 1
Ms → da massa do veı́culo Constante de rigidez da mola (N/m) kus 2500
4 Coeficiente de amortecimento (N s/m) bs 7, 5
Suspensão ativa Coeficiente de amortecimento (N s/m) bus 5
ks Fc bs
x1 (t) Acelerômetro (⇒ ẍ1 (t)) Considerando o modelo fı́sico da suspensão ativa, é
Mus → Massa do conjunto do pneu visto que o sistema possui duas cargas iguais, as quais com-
kus
põe a massa Ms . Cada uma dessas cargas possui um peso
bus
de 0, 4975 kg, sendo que a soma das cargas com a estru-
pneu tura resulta no valor mostrado na Tabela 1, 2, 45 kg. Dessa
zr (t)
(pista) forma, a massa Ms pode ser considerada uma incerteza do
sistema, já que pode assumir valores entre 1, 455 kg (massa
da estrutura) e 2, 45 kg (massa da estrutura mais as duas
Figura 1: Modelo suspensão ativa de um veı́culo. cargas). Isso significa que a massa Ms pode pertencer ao
intervalo 1, 455 ≤ Ms ≤ 2, 45 (kg) (da Silva et al., 2013).
Neste trabalho, além de considerar a massa Ms in-
A dinâmica do sistema é dada pelas equações descritas certa, consideramos a ocorrência de uma eventual falha
em (33): ISSN 2525-8311 no amortecedor bus . Caso ocorra a falha, implicará
1419
em
XXI Congresso Brasileiro de Automática - CBA2016
UFES, Vitória - ES, 3 a 7 de outubro
Deslocamento (m)
bus = 0, neste caso bus é incerto e irá pertencer ao inter- 0.02 x1 - sem falha
x1 - com falha
valo 0 ≤ bus ≤ 5 (Ns/m). 0
Para a resolução das LMIs foi utilizado o software -0.02
MatLab
R
, juntamente com o solver ”SeDuMi
c
(Sturm, 0 1 2 3 4 5 6
1999). As matrizes de ponderação, Q e R, foram obti-
Deslocamento (m)
0.02
das por meio de um algoritmo genético (GA), cuja função x3 - sem falha
x3 - com falha
objetivo é minimizar o critério de desempenho IT AE (do 0
inglês, Integral of Time-weight Absolute Error ), o qual re-
presenta a integral do erro absoluto entre a entrada e a -0.02
0 1 2 3 4 5 6
saı́da, e(t), vezes o tempo, t: Tempo (s)
Deslocamento (m)
0.03
A Figura (2) apresenta um fluxograma explicando o 0.02
x1 - sem falha
x1 - com falha
funcionamento do GA. Informações adicionais podem ser 0.01
vistas em (Konak et al., 2006). 0
-0.01
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
Início Fim
Deslocamento (m)
0.02
x3 - sem falha
0.01 x3 - com falha
-0.01
Não 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
Avalia População Deve Parar? Tempo (s)
0.03
x1 - sem falha
0.02 x1 - com falha
Após a execução do GA, as matrizes de ponderação 0.01
que obtiveram o melhor critério de desempenho foram: 0
-0.01
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
814, 4588 0 0 0
Deslocamento (m)
0.02
0 0, 8336 0 0 x3 - sem falha
Q=
, (35) 0.01 x3 - com falha
0 0 328, 6466 0
0 0 0 0, 3996 0
-0.01
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
R = [0, 2105]. (36)
Tempo (s)
Por meio das matrizes de ponderação, Q e R, e das
Figura 5: Comportamento do sistema considerando a
LMIs (30) e (31), projetou-se o seguinte controlador Ro-
massa da estrutura (1, 455 kg) mais a massa das duas car-
busto:
gas (0, 995 kg).
KR = [161, 6209 6, 8789 − 101, 5929 − 0, 5946]. (37) Por meio da análise de ambas as Figuras, 4 e 5,
Para a realização da simulação foi utilizada a função observa-se que o controlador LQR-derivativo robusto, KR ,
ODE45 do software MatLab
R
, considerando a condição minimizou as oscilações e levou o sistema ao setpoint (ori-
inicial x(0) = [0, 02 0 0, 02 0]T , que é a mesma con- gem) em um menor tempo, comparado com a Figura 3.
dição inicial usada na LMI (30). Nas Figuras 3, 4 e 5, x1 (t) A Figura 6 exibe o sinal de controle para a situação na
é o deslocamento da massa Mus e x3 (t) o deslocamento da qual se considera apenas a massa da estrutura e o sinal de
massa Ms . controle para a situação na qual se considera a massa da
Como é possı́vel observar na Figura 3, e mesmo o sis- estrutura e a massa das duas cargas. Analisando ambos os
tema sendo estável por natureza, o tempo de acomodação gráficos, observa-se que mesmo com a matriz de pondera-
é elevado. Ainda, possui oscilações abruptas, o que pode ção R não sendo tão elevada, o sinal de controle apresentou
causar desconforto aos passageiros e motorista no interior baixa amplitude para ambos os casos, com e sem falha, di-
do veı́culo, bem como gerar danos ao sistema de suspensão. minuindo o tempo de acomodação do sistema. Essa é uma
Tais oscilações podem ser minimizadas através da técnica importante caracterı́stica da realimentação derivativa.
proposta.
A Figura 4 mostra o comportamento do sistema con- 7 Conclusões
siderando apenas a massa da estrutura (1, 455 kg), junta-
mente com a ocorrência de falha no amortecedor bus e sem Neste trabalho são propostas novas condições para a
a ocorrência de falha. sı́ntese de controladores ótimos de sistemas lineares incer-
ISSN 2525-8311 1420
XXI Congresso Brasileiro de Automática - CBA2016
UFES, Vitória - ES, 3 a 7 de outubro
Sinal de Controle (N) Sinal de Controle (N) 20 Lei de Controle - sem falha Choi, J. W., See, Y. B., Yoo, W. S. and Lee, M. H. (1998).
10 Lei de Controle - com falha
LQR approach using eigenstructure assignment with
0
-10
an active suspension control application, Proceedings
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
(a)
of the 1998 IEEE International Conference on Control
Applications, Trieste, pp. 1235-1239 vol.2.
20 Lei de Controle - sem falha
10 Lei de Controle - com falha da Silva, E. R. P., Fazzolari, H. A., de Oliveira, P. C., As-
0 sunção, E., Teixeira, M. C. M. and Lordelo, A. D. S.
-10
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 (2013). Implementação prática da D-estabilidade ro-
(b) busta via realimentação derivativa em um sistema de
Tempo (s)
suspensão ativa, XI SBAI - XI Simpósio Brasileiro de
Figura 6: (a)Sinal de controle considerando apenas a massa Automática Inteligente.
da estrutura (1, 455 kg); (b)Sinal de controle considerando
a massa da estrutura (1, 455 kg) mais a massa das duas Das, S., Pan, I., Halder, K., Das, S. and Gupta, A. (2013).
cargas (0, 995 kg). LQR Based Improved Discrete PID Controller Design
Via Optimum Selection of Weighting Matrices Using
Fractional Order Integral Performance Index, Applied
tos e sujeitos a falhas estruturais. No projeto foi utilizada Mathematical Modelling, Vol. 37, pp. 4253-4268.
a realimentação derivativa, tal técnica se mostra eficiente
em sistemas que dispõem de sensores do tipo acelerôme- Gahinet, P., Nemirovski, A., Laub, A. and Chilali, M.
tros. Ainda, técnicas de controle fundamentadas em LMIs (1995). LMI control toolbox - For use with MATLAB,
possuem a vantagem de permitir a inclusão de incertezas The Math Works Inc.
do tipo politópicas no sistema, bem como o projeto de con- Ge, M., Chiu, M.-S. and Wang, Q.-G. (2002). Robust PID
troladores se torna relativamente simples. O projeto por controller design via LMI approach, Journal of Process
meio do LQR-derivativo se mostrou uma importante ferra- Control, Vol. 12, pp. 3-13.
menta no controle de sistemas mecânicos, uma vez que é
possı́vel ponderar o vetor da derivada dos estados e o vetor Kanieski, J. M., ndling, H. A. G. and Cardoso, R. (2010). A
do sinal de controle, sendo estes escolhidos por meio de um New LQR Modeling Approach for Power Quality Con-
GA baseado no ı́ndice de desempenho IT AE, de acordo ditioning Devices, IECON 2010-36th Annual Confe-
com as especificações do projeto. rence on IEEE Industrial Electronics Society, p. 2001-
2006.
Agradecimentos Konak, A., Coit, D. W. and Smith, A. E. (2006). Multi-
objective optimization using genetic algorithms: A tu-
Os autores agradecem a UTFPR-CP pelo apoio a este
torial, Reliability Engineering & System Safety, Else-
trabalho e ao CNPq e a FAPESP (Proc. n. 2011/17610-0)
vier, Vol. 91, (9):992-1007.
pelo apoio financeiro.
Kwak, S. K., Washington, G. and Yedavalli, R. K. (2002).
Referências Aceleration Feedback-based Active and Passive Vibra-
tion Control of Landing Gear Components, Journal of
Abdelaziz, T. H. S. (2010). Optimal Control Using Deriva- Aerospace Engineering, New York, v. 15, n.1, p. 1-9,
tive Feedback for Linear Systems, Proceedings of the Jan.
Institution of Mechanical Engineers, Part I: Journal of
Lewis, F. L. and Syrmos, V. L. (1991). A Geometric Theory
Systems and Control Engineering March 1, 224:185-
for Derivative Feedback, IEEE Transactions on Auto-
202.
matic Control, New York, v. 36, n. 9, p. 1111-1116.
Abdelaziz, T. H. S. and Valášek, M. (2004). Pole place-
Reithmeier, E. and Leitmann, G. (2003). Robust Vibra-
ment for SISO linear systems by state-derivative feed-
tion Control of Dynamical Systems Based on the De-
back, IEE Proceedings-Control Theory Applications.
rivative of the State, Archive of Applied Mechanics,
151(4):377-385.
Heidelberg, v. 72, n. 11-12, p. 856-864, June.
Abdelaziz, T. H. S. and Valášek, M. (2005). State deriva-
Robandi, I., Nishimorib, K., Nishimurab, R. and Ishiharab,
tive Feedback by LQR for Linear Time-Invariant Sys-
N. (2001). Optimal Feedback Control Design Using
tems, International Federation of Automatic Control.
Genetic Algorithm in Multimachine Power System,
IFAC.
Electrical Power and Energy Systems, Vol. 23, pp.
Boyd, S., Ghaoui, L. E., Feron, E. and Balakrishnan, V. 263-271.
(1994). Linear Matrix Inequalities in Systems and
Slotine, J.-J. E. and Li, W. (1991). Applied Nonlinear Con-
Control Theory, Studies in Applied Mathematics, 15,
trol, Englewood Cliffs, NJ: Prentice Hall. 460 p.
2 edn, SIAM Studies in Applied Mathematics.
Sturm, J. (1999). Using SeDuMi 1.02, a MATLAB toolbox
Burns, R. S. (2001). Advanced Control Engineerig, 1st ed.
for optimization over symmetric cones, Optimization
London, UK: Butterworth.
Methods and Software 11-12: 625-653.
Caun, R. P., Assunção, E., LLins, L. I. H. and Teixeira, M. Zhai, J., Shenb, B., Feng, E. and Yin, H. (2014). Opti-
C. M. (2015). Controlador LQR via aproximação LMI mal Control of Switched Systems and its Parallel Op-
com restrição de taxa de decaimento aplicado ao he- timization Algorithm, Journal of Computational and
licótero 3-DOF de bancada, XII SBAI - XII Simpósio Applied Mathematics, Vol. 261, pp. 287-298.
Brasileiro de Automática Inteligente, pp 49 a 54.
ISSN 2525-8311 1421