Você está na página 1de 41

Controle de Sistemas Não Lineares

César Daltoé Berci

10 de Outubro de 2007

Resumo
Sistemas não lineares representam um grande desao na area de
controle, este documento trata desta classe de sistemas e de técnicas
utilizadas no controle dos mesmos.

Sumário

1 Introdução 1
2 Sistemas de Erro 1
3 Lyapunov Candidates 6
4 Sistemas Linearizáveis por State-Feedback 7
4.1 Problema do Regulador . . . . . . . . . . . . . . . . . . . . . . 7
4.2 Problema do Servomecanismo . . . . . . . . . . . . . . . . . . 10

5 Sistemas Linearizáveis Por Input-Output Feedback 21


5.1 Sistemas Strict-Feedback . . . . . . . . . . . . . . . . . . . . . 36

1 Introdução

Neste documento, serão apresentados algumas técnicas de controle, aplicados


a sistemas não lineares. Essa classe de sistemas exclui métodos tradicionais
como Bode e Nyquist, assim é preciso adotar meios alternativos de controle
e analise. Com esse objetivo, foram desenvolvidas varias técnicas, baseadas

1
em métodos como o critério de Lyapunov, que provem ferramentas para a
realização de controladores para essa classe de sistemas. Essas ferramentas
serão o objetivo de estudo deste documento.

2 Sistemas de Erro

Geralmente, atribui-se ao sinal de erro, a diferença entre o comportamento


de uma determinada dinâmica, e o que é desejado dela, a titulo de exemplo,
consideremos o seguinte sistema.
ẋ = f (x, u)
y = h(x) (1)
O erro para esse sistema, pode ser adotado como sendo e = y − r, onde
r(t) é o sinal de referência, o qual se espera que o sistema seja capaz de
seguir. Esta escolha pode muitas vezes levar a resultados inconsistentes,
devido ao comportamento dinâmico do sistema original, e do sistema de erro
e = X (t, x) = y − r. O exemplo que segue ilustra esse comportamento.

Exemplo 2.1 Consideremos o seguinte sistema:


ẋ1 = −x1 + u
ẋ2 = x2 − u
y = x1 (2)
Espera-se que o sistema 2 seja capaz de seguir uma referência
r(t) dada por r = sin t. Adotando um erro e = y − r, obtem-se o
seguinte resultado:
e = X (t, x) = y − r(t) (3)
Que resulta em:
e = x1 − sin t
ė = ẋ1 − cos t
= −x1 + u − cos t
= −x1 + sin t − sin t + u − cos t
= −e + u − (sin t + cos t) (4)

2
Escolhendo uma entrada u = sin t + cos t obtem-se os seguintes
resultados:
Sistema de Erro
ė = −e (5)
O sistema de erro é linear e assintoticamente estável.
Subsistema x2
ẋ2 = x2 − 2 = x2 − cos t − sin t (6)

O subsistema x2 é um sistema linear porém instável, o que indica


que mesmo o erro permanecendo limitado, o estado do sistema
pode não o ser, em um tempo nito, indicando desta forma, que
a tentativa de controle foi mal sucedida. Escolhendo agora um
outro sistema de erro, mais indicado para o sistema em questão,
é obtido o resultado que segue.
" #
x1 − sin t
e= (7)
x2 − cos t

Essa escolha resulta no seguinte sistema.

ė1 = ẋ1 − cos t


= −x1 − cos t + u
= −e1 + u − (sin t + cos t)
ė2 = ẋ2 + sin t − u
= e2 − u + (sin t + cos t)

Escolhendo agora uma entrada u = sin t + cost − e1 + e2 tem-se:

ė1 = −2e1 + e2
ė = −e1
" 2 #
−2 1
ė = e (8)
−1 0

O sistema anterior é linear e tem pólos em λ = −1, portanto,


assintoticamente estável.

3
Subsistema x1
ẋ1 = −x1 + sin t + cost − e1 + e2
= −x1 + sin t + cos t − x1 + sin t + x2 − cos t
= −2x1 + x2 + 2 sin t (9)

Subsistema x2
ẋ2 = x2 − sin t − cos t + e1 − e2
= x2 − sin t − cos t + x1 − sin t − x − 2 + cos t
= x1 − 2 sin t (10)

O dinâmica do sistema pode ser descrita pela seguinte equação.


" # " #
−2 1 2
ẋ = x+ sin t (11)
1 0 −2

O sistema 11 é linear e tem polos em λ1 = −2.4142 e λ2 =


0.4142 portanto o sistema é instável. A escolha do sistema de
erro porém, garante que para e = 0, x1 = sin t e x2 = cos t, o
que representa uma solução estável. Portanto, é possível através
da escolha apropriada do sistema de erro, garantir que além de
seguir a referência, o estado do sistema irá permanecer limitado.

Com base nos resultados do exemplo anterior, ca claro que uma escolha
aprimorada do sistema de erro torna-se necessária. A suposição que segue,
estabelece critérios para garantir a limitação do estado x.
Suposição 2.1 Supões-se que o sistema de erro e = X (t, x) possuí a propri-
edade e → 0 ⇒ y(t) → r(t) e a função X satisfaz a condição |x| ≤ ψx (t, |e|)
garantindo que o estado do sistema será limitado para todo erro também li-
mitado.
Um sistema de erro que satisfaça à suposição 2.1, pode ser encontrado de-
nindo o Stable Inverse do sistema, como segue.

4
Denição 2.2 Dada uma referência limitada r(t), as funções xr (t) e cr (t)
são ditas Stable Inverse do sistema se para todo t ≥ 0, xr (t) e cr (t) são
limitadas, xr (t) é diferenciável e:
ẋr = f (xr , cr )
r = h(xr ) (12)
O sistema de erro pode então ser escolhido como sendo:
e = X (t, x) = x − xr (13)
Este sistema agora satisfaz a suposição 2.1
A título de exemplo, será estudado um caso onde o Stable Inverse, é utilizado
para encontrar um sistema de erro que satisfaça à suposição 2.1.

Exemplo 2.2 Considerando o sistema do exemplo anterior, com


a referencia r = sin t, de acordo com a denição 2.2 é necessário
encontrar duas funções xr (t) e cr (t), o que pode ser feito como
segue.
ẋr1 = −xr1 + cr
ẋr2 = xr2 − cr
sin t = xr1 (14)
De acordo com a denição, o sistema de erro deve ser escolhido
com base na equação 13, o que gera o seguinte resultado:
xr1 = sin t
ẋr1 = −xr1 + cr
cr = ẋr1 + xr1 = sin t + cos t
ẋr2 = xr2 − sin t cos t
ẋr2 − xr2 = − sin t − cos t
xr2 = cos t
(15)
Portanto: " #
x1 − sin t
e= (16)
x2 − cos t

5
É importante notar que o sistema de erro encontrado nos exemplos anteriores,
tem dimensão n, muitas vezes porém, é possível encontrar um sistema de erro
de dimensão menor, que satisfaça a suposição 2.1. Uma vez determinado
o sinal de erro, a sistema em estudo, pode ser utilizado para encontrar a
dinâmica do erro. Para tanto consideremos o seguinte sistema.

ẋ = f (x) + g(x)u (17)

A dinâmica do erro pode então ser descrita por:

e = X (t, x)
∂X
ė =
∂t
x = f (t) ⇒
∂X ∂X
ė = + ẋ
∂t ∂x
∂X ∂X
= + (f (x) + g(x)u)
∂t ∂x
∂X ∂X ∂X
= + f (x) + g(x)u
∂t ∂x ∂x
= α(t, x) + β(x)u (18)

Onde:
∂X ∂X
α = + f (x)
∂t ∂x
∂X
β = g(x)
∂x

3 Lyapunov Candidates

Para estudar a trajetória da dinâmica do erro para uma dado sistema, seria
necessário encontrar uma solução fechada para este, como foi feito nos exem-
plos anteriores, isto é possível somente para um número limitado de sistemas
simples, os quais adimitem solução análitica. Esta condição é bastante limi-
tante, e existem alguns métodos que provem ferramentas para contorna-la,
sendo um deles o método de Lyapunov.
Uma função de Lyaponuv candidata escalar, é uma função do tipo <q → <
semi-denida positiva e com a propriedade V (e) = 0 se e somente se e = 0.

6
Isto garante que a função de Lyapunov decresce a medida que decresce a
energia do erro e ainda V → 0 ⇒ e → 0. Uma escolha usual para a função
de Lyapunov é a seguinte.
V = eT P e (19)
Onde P ∈ <qxq é uma matriz denida positiva. Assumindo que é escolhida
uma lei de controle u = ν(z) e que V̇ = −k1 V + k2 onde k1 > 0 e k2 ≤ 0 são
constantes limitadas. Tem-se:
!
k2 k2 −k1 t
V ≤ + V (0) − e (20)
k1 k1

Utilizando a inigualdade de Rayleigh-Ritz1 obtem-se:


V
|e|2 ≤
λmin (P )
!
k2 V (0) k2
≤ + − e−k1 t (21)
k! λmin (P ) λmin (P ) k1 λmin (P )

Assim é possivel estudar a trajetória da função de Lyapunov V a m de


garantir que a norma do erro |e| seja limitada, e se for atendida a suposição
2.1,a norma dos estados também o será.

4 Sistemas Linearizáveis por State-Feedback

Um sistema é dito linearizável por State-Feedback, se existir um difeomor-


smo2 x = T (ξ), com T (0) = 0 tal que:

ẋ = Ax + B(f (x) + g(x)u) (22)

Onde x ∈ <n são os estados do sistema, u ∈ <m é a entrada do sistema,


(A, B) á um par controlável, as funções f : <n → <m e g : <n → <mxm
são Lipschit e g(x) é invertível. Serão apresentados meios para escolher a
função de Lyapunov e o sistema de erro, para o problema de controle por
realimentação de estados, para sistemas que satisfazem a equação 22.
1A inigualdade de Rayligh-Ritz arma que: λmin (P )xT x ≤ xT P x ≤ λmax (P )xT x,
desde que P ≥ 0.
2 Difeomorsmo pode ser denido a grosso modo, como uma transformação entres espa-
ços homeomorfos, desde que está seja derivável, invertível, e sua derivada seja invertível.

7
4.1 Problema do Regulador

Consideremos o sistema 22, e o estado desejado r ∈ <n , o erro pode ser


tomado como sendo:
e=x−r (23)
A dinâmica do erro pode então ser expressa como segue:
ė = ẋ − ṙ
= Ax + B(f (x) + g(x)u) − ṙ
ṙ = 0 (regulador)
Ae = Ax − Ar
Ax = Ae + Ar ⇒
ė = Ae + B (f (x) + g(x)u) + Ar (24)
A função de Lyapunov pode ser escolhida V = eT P e, onde P é simétrica e
denida positiva. Uma escolha apropriada para a lei de controle, é adotar
u = ν(x) denida por:
ν(x) = g −1 (x)(−f (x) + Ke) (25)
A aplicação desta lei de controle gera o resultado que segue.
ẋ = Ax + B(f (x) + g(x)u)
 
= Ax + B f (x) + g(x)g −1 (x)(−f (x) + Ke)
= Ax + B (Ke) (26)
A dinâmica do erro pode ser então reescrita como segue:
ė = Ae + BKe + Ar
= (A + BK)e + Ar
= Ak e + Ar (27)
Assim a dinâmica do erro pode ser escolhida arbitrariamente dado que (A, B)
é um par controlável. Escolhendo r = 0, a dinâmica da função de Lyapunov,
assume a seguinte forma.
∂  T 
V̇ = e Pe
∂t
= eT P Ak e + ATk eT P e
 
= eT P Ak + ATk P e
V̇ = −eT Qe (28)

8
Onde P A − k + ATk P = −Q é a equação de Lyapunov, e a matriz Q é
denida positiva. É possível agora, através da inigualdade de Rayleigh-Ritz,
encontrar limites explícitos para |e|.
V̇ ≤ −λmin (Q) |e|2
λmin (Q)
≤ − V (29)
λmax (P )
Apesar de estar de fora do escopo deste documento, é possível mostrar que:
v
V (0) − ct
u
(30)
u
|e| ≤ t e 2
λmin (P )
Onde c = λmin (Q)/λmax (P ). É possivel então, desenvolver controlador as-
sintoticamente estáveis, quando as funções f (x) e g(x) são conhecidas.

Exemplo 4.1 A título de exemplo, consideremos o projeto do


sistema de controle de um satélite, de massa m e energia potencial
kg /r, com a dinâmica denida a seguir.
ż = ν
kg u1
ν̇ = zω 2 − 2
+
mz m
2νω u2
ω̇ = − + (31)
z mz
O objetivo deste exemplo, é desenvolver um controlador para este
sistema, tal que z → zd e ω → ωd , para tanto é necessário repre-
sentar o sistema na forma 22. Denindo x = [z, ν, ω]T temos.
ẋ = Ax + B(f (x) + g(x)u)
 
0 1 0
A =  0 0 0 

0 0 0
 
0 0
B =  1 0 
 

0 1
kg
" #
zω 2 − mz 2
f (x) = 2νω
− z
" #
1
0
g(x) = m
1 (32)
0 mz

9
O sinal de erro é e = x − r onde r = [zd , 0, ωd ]T . Como Ar = 0,
pode-se escolher uma lei de controle como aquele apresentada na
equação 25. O restante é escolher uma matriz K , que garanta
que Ak = A + BK tenha apenas polos estáveis, para tanto consi-
deremos a seguinte matriz de ganho.
" #
−λ2r −2λr 0
K= (33)
0 0 λω
Com essa matriz K obtemos o seguinte resultado.
u = v(x) = g −1 (x)(−f (x) + Ke)
ė = (A + BK)e
= Ak e
   
0 1 0 0 0 " #
−λ2r −2λr 0
Ak =  0 0 0  +  1 0  ∗
   
0 0 λω
0 0 0 0 1
 
0 1 0
Ak  −λ2r −2λr
=  0 
0 0 −λω
(34)
A matriz Ak será estavel, para quaisquer λr e λω maiores que
zero, assim o erro do controlador tenderá assintoticamente para
a origem.

4.2 Problema do Servomecanismo

Para este problema, consideremos a transformação x = T (ξ), que leva o


sistema para a seguinte forma.
ẋ = Ac x + bc (f (x) + g(x)u)
y = x (35)
Onde (Ac , bc ) formam um par controlável. A título de simplicidade, será
estudado aqui o sistema SISO, logo:
" #
0 I
Ac =
0 0

10
 
0
..
.
 
 
bc =  
0
 
 
1
ẋ1 = x2
..
.
ẋn−1 = xn
ẋn = f (x) + g(x)u (36)
Supondo ξ˙ = fξ + gξ (ξ)u, temos:
∂T (ξ)
ẋ =
∂t
∂T (ξ) ∂ξ
= (regra da cadeia)
∂ξ ∂t
∂T
= (fξ + gξ (ξ)u)
∂ξ
= Ac x + bc (f (x) + g(x)u)
logo :
∂T
(fξ + gξ (ξ)u) = Ac x + bc (f (x) + g(x)u) (37)
∂ξ
Usando a denição das matrizes Ac e bc é obtido o seguinte resultado:
∂T
fξ = Ac T (ξ) + bc f (T (ξ))
∂ξ
 
0
 .
 ..
" #
0 I


= T (ξ) +  f (T (ξ))
0 0  0
 

1
 
T2
..
.
 
(38)
 
=  
Tn
 
 
f (T (ξ))
Igualando os termos restantes da equação 37 temos:
∂T
gξ = bc g(x)
∂ξ

11
 
0
..
.
 
 
=   g(ξ)
0
 
 
1
 
0
..
.
 
(39)
 
=  
0
 
 
g (T (ξ))

É possível então, reescrever a dinâmica do sistema como segue.


∂T ∂T
ẋ = fξ + gξ u
∂ξ ∂ξ
ẋ1 = T2
ẋ2 = T3
..
.
ẋn = f (T (ξ)) + g (T (ξ)) u (40)

A expressão ∂T
f
∂ξ ξ
, pode ser representada da seguinte forma:
 
fξ1
∂T ∂T 

fξ2 
 .. 

fξ =  
∂ξ ∂ξ  . 
fξn
 ∂T ∂T1 ∂T1

1
···

∂ξ1 ∂ξ2 ∂ξn fξ1
 ∂T ∂T2 ∂T2
···
2


 ∂ξ1 ∂ξ2 ∂ξn
 fξ2 
 . .. .. ..

=

 ..

. . .

···  
  
∂Tn ∂Tn ∂Tn fξn
∂ξ1 ∂ξ2
··· ∂ξn
(41)

Logo, a i-ésima componente do vetor ∂T f , é dada por


∂ξ ξ
∂Ti
∂ξ ξ
f . Conclui-se
assim que a seguinte condição deve ser satisfeita.
∂Ti
Ti+1 = fξ (42)
∂ξ

12
para i = 1 . . . n − 1, pois x = T e xi+1 = ẋi para i = 1 . . . n − 1, como ca
evidente na equação 40 .
De forma análoga, é possível vericar as seguintes condições.
∂Ti
gξ = 0
∂ξ
∂Tn
gξ 6= 0 (43)
∂ξ
para i = 1 . . . n − 1. Novamente recorrendo à equação 40 chegamos aos
seguintes resultados.
∂Tn
f = fξ (44)
∂ξ
∂Tn
g = gξ (45)
∂ξ
O exemplo que segue, demonstra como o difeomorsmo proposto pode ser
denido, de forma a levar o sistema para a forma canônica 35 .

Exemplo 4.2 Consideremos o seguinte sistema:


ξ˙1 = ξ12 + ξ2
ξ˙2 = ξ1 ξ2 + u (46)
Então:
" #
ξ12 + ξ2
fξ =
ξ1 ξ2
" #
0
gξ = (47)
1

É preciso escolher um difeomorsmo T (ξ) = [T1 (ξ), T2 (ξ)]T tal


que:
∂T1 ∂T2
gξ = 0 gξ 6= 0 (48)
∂ξ ∂ξ
Como foi visto anteriormente, T2 = ∂T1
f
∂ξ ξ
, e pela denição do
sistema temos:
" #
∂T1 ∂T1 0
gξ =
∂ξ ∂ξ 1

13
" #
h
∂T1 ∂T1
i 0
= ∂ξ1 ∂ξ2 1
∂T1
= (49)
∂ξ2
Logo:
∂T1 ∂T1
gξ = =0 (50)
∂ξ ∂ξ2
Pode-se agora calcular T2 = ∂T1
f
∂ξ ξ
como segue.
" #
h
∂T1 ∂T1
i ξ12 + ξ2
T2 = ∂ξ1 ∂ξ2 ξ1 ξ2
" #
h
∂T1
i ξ12 + ξ2
= ∂ξ1
0
ξ1 ξ2
∂T1  2
(51)

= ξ1 + ξ2
∂ξ1
Escolhendo T1 (ξ) = ξ1 temos:
" #
∂T1 0
(52)
h i
gξ = 1 0 =0
∂ξ 1

Logo esta escolha satisfaz a condição proposta na equação 43 .


Pela equação 51 é possivel calcular T2 dado que ∂T
∂ξ1
1
= 1, logo T2
será dado por:
(53)
 
T2 = ξ12 + ξ2
O difeomorsmo pode agora ser escrito como segue.
" #
ξ1
x = T (ξ) = (54)
ξ12 + ξ2

A transformação inversa T − 1(x) é dada por:


" # " #
x1 ξ1
= 2
x2 ξ1 + ξ2
x1 = ξ1
x2 = ξ12 + ξ2
x2 = x21 + ξ2

14
ξ2 = x2 − x21
" # P ortanto : " #
ξ1 x1
= (55)
ξ2 x2 − x21
Aplicando esse difeomorsmo ao sistema 46, obtemos o seguinte
resultado.
ẋ1 = x21 − x21 + x2
x˙2 − 2x1 ẋ1 = x1 (x2 − x21 ) + u
ẋ2 = x1 (x2 − x21 ) + 2x1 x2 + u (56)
As funções f (x) e g(x) são mostradas a seguir.
f (x) = 2x1 x2 + x1 (x2 − x21 )
g(x) = 1 (57)

Portanto, o difeomorsmo proposto, prove a transformação necessária, para


levar o sistema à forma canônica 35 . O exemplo seguinte, ilustra o controle
de um sistema com a dinâmica dada por 35 .

Exemplo 4.3 Considerando o sistema 35, uma possível escolha


para o sistema de erro é a seguinte.
 
r

ṙ 
.. (58)
 
e=x− 
.
 
 
rn−1

Considerando [r, ṙ, · · · , rn−1 ]T ≤ r então é possível armar que


|x| ≤ |e|+r, garantindo que os estados do sistema serão limitados,


para todo erro limitado. Com base na equação 58, dinâmica do
erro pode agora ser expressa como segue.
 
r

ṙ 
..
 
ρ =  
.
 
 
rn−1

15
e = x−ρ
ė = ẋ − ρ̇
= Ac x + bc (f (x) + g(x)u) − ρ̇
Ac x = Ac e + Ac ρ
Então :
ė = Ac e + bc (f (x) + g(x)u) + Ac ρ − ρ̇
 

 r̈ 
 
ρ̇ =  .. 
.
 
 
r(n)
 

 r̈ 
 
Ac ρ =  .. 
.
 
 
0
   
ṙ ṙ
 r̈   r̈ 
   
Ac ρ − ρ̇ =  .. − .. 
. .
   
   
0 r(n)
 
0

0 
..
 
=  
.
 
 
−r(n)
= −bc r(n)
P ortanto :
Ac e + bc −r(n) + f (x) + g(x)u (59)
 
ė =
Escolhendo a função de Lyapunov V = eT P e, onde P é simétrica
e denida positiva(P = P T e P ≥ 0), e uma lei de controle
u = ν(z) tal que:
r(n) − f (x) − k T e
ν= (60)
g(x)
Com essa lei de controle é obtido o resultado que segue.
 
ė = Ac e + bc −r(n) + f (x) + g(x)u

16
= A
c
e − bc k T e
= Ac − bc k T
= Ak e (61)
A equação de Lyapunov pode então ser reescrita como segue.
V = eT P e
V̇ = eT P ė + ėT P T e
= eT P Ak e + eT Ak P e
= eT (P Ak + ATk P )e (62)
Desde que Ak seja estável, é possível escolher uma matriz P tal
que P Ak + ATk P = −Q, onde Q é denida positiva, logo o sistema
de erro sera estável, dado:
V̇ = −eT Qe (63)

Uma abordagem alternativa para o problema do servomecanismo, é denir


um sinal de erro escalar, através de uma variedade, conhecida como "Stable
Mainfold", esse procedimento será tratado no próximo exemplo.

Exemplo 4.4 Novamente considerando o sistema 35, o sistema


de erro e = X (t, x) será agora denido pela variedade que segue.
X (t, x) = k1 (x1 − r) + · · · + kn−1 (xn−1 − rn−2 ) + xn − rn−1 (64)
Ondo o polinômio formado pelos coecientes ki é Hurwitz.
Tomando a derivada do erro:
ė = k1 (x2 − ṙ) + · · · + kn−1 (xn − rn−1 ) − rn + f (x) + g(x)u
= α(t, x) + β(x)u
Onde :
α(t, x) = k1 (x2 − ṙ) + · · · + kn−1 (xn − rn−1 ) − rn + f (x)
β(x) = g(x) (65)
Considerando a função de Lyapunov V = 12 e2 , sua derivada pode
então ser calculada como segue.
V̇ = eė
= e(α(x, t) + β(x)u) (66)

17
A lei de controle u = ν(z) é escolhida como segue.
−α(t, x) − κe
ν(z) = (67)
β(x)
Fazendo κ0 é obtido V̇ = −κe2 = −2κV Assim, e = 0 é um ponto
de equilibro estável. A m de validar o controlador, é preciso
comprovar que o sistema de erro proposto, satisfaz à suposição
2.1, ou seja, os estados devem permanecer limitados para todo
erro também limitado. Considerando o sistema de erro proposto,
é possível desenvolver a equação que segue.
e = k1 (x1 − r) + · · · + kn−1 (xn−1 − r(n−2) ) + xn − r(n−1)
ė = k1 (ẋ1 − ṙ) + · · · + kn−1 (ẋn−1 − r(n−1) ) + ẋn − r(n)
L {ė} = L{k1 (ẋ1 − ṙ) + · · · + kn−1 (ẋn−1 − r(n−1) ) + ẋn − r(n) }
sE(s) = k1 (sX1 (s) − sR(s)) + · · · +
+ kn−1 (sXn−1 (s) − sn−1 R(s)) + sXn (s) − sn R(s)
xi = ẋi−1 para i = 1 . . . n − 1
⇒ Xi (s) = sXi−1
Então :
sE(s) = sk1 (X1 (s) − R(s)) + · · · +
+ sn−1 kn−1 (X1 (s) − R(s)) + sn (X1 (s) − R(s))
E(s) = (k1 + k2 s + · · · + kn−1 sn−2 + sn−1 )(X1 (s) − R(s))
Def inindo : Z(s) = X1 (s) − R(s)
1
Z(s) = E(s) (68)
k1 + k2 s + · · · + kn−1 sn−2 + sn−1
Como o denominador da equação 68 é Hurwitz, é possível ar-
mar que Z(s) será limitado, para todo E(s) também limitado.
A m de encontrar limites para todos os estados xi da planta,
consideremos o seguinte sistema.
µ̇ = Lµ + be
Onde :
x1 − r
 

x2 − ṙ 
..
 
µ =  
.
 
 
xn−1 − r(n−2)

18
Derivando µ e comparando o resultado com a equação anterior
obtem-se:
x2 − ṙ
 

x3 − r̈ 
..
 
µ̇ =  
.
 
 
xn − r(n−1)
Então :
µ̇1 = µ2
µ̇2 = µ3
..
.
µ̇n = xn − r(n−1) 
= e − k1 (x1 − r) + · · · + kn−1 (xn−1 − r(n−2) )

Em notação matricial é possível reescrever o sistema como segue.


   
0 0
.. ..
. .
   

µ̇ =  I  
µ + 

e (69)
0 0
   
   
−k1 · · · −kn−1 1

Portanto, conclui-se que:


 
0
..
.
 
L =

 I 

0
 
 
−k1 · · · −kn−1
 
0
..
.
 
 
b =  
0
 
 
1

A solução fechada do sistema 69 pode ser calculada, e esta será


estável, dado que L é Hurwitz pela denição dos coecientes ki .
Z t
µ(t) = e µ(0) +Lt
eL(t−τ ) be(τ ) dτ (70)
0

19
Como L é Hurwitz, é valida a seguinte inigualdade, |eLt | ≤ c1 e−c2 t ,
para alguma combinação de constantes positivas escalares c1 e c2 .
Com isso, pode-se reescrever a equação 70 como segue.
Z t
|µ(t)| ≤ c1 e −c2 t
|µ(0)| + c1 e−c2 (t−τ ) |e(τ )| dτ (71)
0

Para um sinal e(t) limitado, é possível então, calcular o limitante


superior do sinal µ(t), que é dado pela seguinte equação.
Z t
ψµ = c1 e −c2 t
|µ(0)| + c1 e−c2 (t−τ ) |e(τ )| dτ (72)
0
Pela denição do sistema de erro, e de µ, é possível escrever:
   
x1 r
.. ..
" #
µ
. . (73)
   
  = + 
  ς 
(n−1)

xn r
Onde ς é dado por:
(74)
 
ς = e − k1 (x1 − r) + · · · + kn−1 (xn−1 − r(n−2) )
A norma de ς pode ser encontrada da seguinte forma.
ς = e − k1 µ1 − · · · − kn−1 µn−1
= e − [k1 , . . . , kn−1 ]µ
= e − Kµ
|ς| ≤ |e| + |K||µ| (75)
Utilizando este resultado, e considerando r, ṙ, . . . , r(n−1) ≤ r̄,
h i

pode-se agora escrever o limitante superior dos estados x como


segue.
" #
|µ|
|x| ≤ + r̄
|ς|
" #
|µ|
|x| ≤
|e| + |K||µ|
Então " #
ψµ (t, |e|)
ψx (t, |e|) = (76)
|e| + |K|ψµ (t, |e|)
Logo o sistema de erro, dado pela variedade proposta, atende à
suposição 2.1 .

20
O exemplo anterior, ilustra como é possível controlar o sistema proposto,
utilizando uma variedade estável, o que reduz a dimensão do sistema de erro
de n para 1, porém torna-se impossível estabelecer uma relação estática entre
o limite do erro e o limite dos estados, como cou claro devido ao limite dos
estados estar relacionado com a dinâmica de µ. Este fenômeno pode ser
atribuído ao fato de que, mesmo o erro sendo zero, é possível que não se
tenha y = r(t).

5 Sistemas Linearizáveis Por Input-Output Fe-


edback

Na seção anterior, foram tratados sistemas linearizáveis pela realimentação


dos estados, em contra partida, a intensão agora é prover a linearização do
sistema, por meio de uma realimentação da saída. A m de atingir o objetivo
proposto, será necessario empregar alguns conceitos de geometria diferencial,
como a derivada de Lie denida a seguir.
Denição 5.1 Derivada de Lie
Dada uma função escalar h(x), tal que: h : <n → <, e um campo vetorial
f (x) | f : <n → <n , a Derivada de Lie, de h com relação a f , será um
escalar denido por:
∂h(x)
Lf h(x) = f (x) = ∇h(x)f (x) (77)
∂x
A derivada de Lie, é a derivada de h(x) na direção do campo vetorial f (x)
Consideremos agora o seguinte sistema.
ξ˙ = fξ (ξ) + gξ (ξ)u
y = h(ξ) (78)
Onde ξ ∈ <n+d com d ≥ 0. Com base no conceito de derivada de Lie, é
possível denir o grau relativo do sistema como segue.
Denição 5.2 Um sistema ξ , denido em 78, possui um grau relativo forte
n se:
Lgξ = Lgξ Lgξ h(ξ) = · · · = Lgξ Ln−2
fξ h(ξ) = 0
e
n−1
Lgξ Lfξ h(ξ) 6= 0 (79)

21
De forma prática, dizer que um sistema tem um grau relativo n, implica em
que para se obter uma relação explicita entre a entrada e a saída, esta tiver
que ser derivada n vezes.
A denição 5.2, prove uma ferramenta essencial para a análise proposta,
assim o próximo exemplo visa esclarecer o conceito de grau relativo forte de
um sistema.

Exemplo 5.1 Consideremos o seguinte sistema.


ξ˙1 = ξ12 + ξ 2
ξ˙2 = ξ1 ξ2 + u
y = ξ1 (80)

As funções fξ gξ e h são denidas como segue.


" #
ξ12 + ξ2
fξ (ξ) =
ξ1 ξ2
" #
0
gξ (ξ) =
1
h = ξ1

De acordo com a denição 5.2, é preciso calcular as derivadas de


Lie de h ao longo de fξ e gξ , até ser obtido um resultado diferente
de zero.
Lgξ h:

∂h
Lgξ h = gξ
∂ξ
" #
h i 0
= 1 0
1
= 0

Como Lgξ h = 0, é preciso calcular o próximo termo.


Lgξ Lfξ h:
n o
Lgξ Lfξ h = Lgξ Lfξ h

22
( " #)
h i ξ12 + ξ2
= L gξ 1 0
ξ1 ξ2
n o
= Lgξ ξ12 + ξ2
∂ (ξ12 + ξ2 )
= gξ
∂ξ
" #
h i 0
= 2ξ1 1
1
Logo :
Lgξ Lfξ h = 1
Como temos Lgξ L1fξ h 6= 0 então, n − 1 = 1 e assim tem-se um
grau relativo forte n = 2 para o sistema em questão. Escrevendo
as duas primeiras derivadas da saída do sistema obtemos:
ẏ = ξ˙1
= ξ12 + ξ2
ÿ = 2ξ1 ξ˙1 + ξ˙2
= 2ξ1 (ξ12 + ξ2 ) + ξ1 ξ2 + u
Assim é comprovado de forma explicita, que o grau relativo do
sistema 80 é n = 2.

Como foi visto no exemplo anterior, é possível encontrar um grau relativo n,


para um sistema qualquer na forma 78, onde ξ ∈h <d+n . Éi possível então,
prover uma transformação de coordenas, tal que q T xT = T (ξ), tendo
q ∈ <q e x ∈ <n . O difeomorsmo T (ξ), com T (0) = 0, pode ser calculado
da seguinte maneira:
∂Ti (ξ)
gξ (ξ) = 0 (81)
∂ξ
Para i = 1, . . . , d e:
Td+1 = h(ξ)
Td+2 = Lfξ h(ξ)
..
.
Tn+d = Lfn−1
ξ
h(ξ)
(82)

23
Para i = d + 1, . . . , d + n.
É obtida a seguinte representação da dinâmica do sistema.

q̇ = φ (q, x)
ẋ1 = x2
..
.
ẋn−1 = xn
ẋn = f (q, x) + g (q, x) u
y = x1 (83)

O sistema 83 esta em sua forma linearizável por input-output feedback. Os


estados do desse sistema são representados pelos vetores x e q , sendo q o
estado da dinâmica zero. A seguir será tratado um exemplo de aplicação
desse difeomorsmo.

Exemplo 5.2 Consideremos o sistema 75, tratado no exemplo


anterior, que possuí um grau relativo n = 2, iremos encontrar o
difeomorsmo T (ξ), que leve o sistema para a forma canônica 83.
Como d = 0, resta apenas encontrar T1 (ξ) e T2 (ξ) de forma que
x = T (ξ).
T1 (ξ):

T1 (ξ) = h(ξ)
= ξ1

T2 (ξ):

T2 (ξ) = Lfξ h(ξ)


= ξ12 + ξ2

O difeomorsmo assume então a seguinte forma:


" #
ξ1
x = T (ξ) = (84)
ξ12 + ξ2

Que é o mesmo encontrado anteriormente, para o problema de li-


nearização por realimentação de estados. Neste caso, como d = 0,

24
disse que o sistema é simultaneamente linearizável por realimen-
tação de saída e de estados. As funções f e g para o sistema na
forma canônica 83, são dadas a seguir:
f (x) = 2x1 x2 + x1 (x2 − x21 )
g(x) = 1 (85)
É importante notar ainda, que essas funções são dadas pelas se-
guinte derivadas de Lie.
f (q, x) = Lnfξ h(ξ)
g(q, x) = Lgξ Lfn−1
ξ
h(ξ)
Essas igualdade podem facilmente ser comprovadas para o sis-
tema em análise.
Lnfξ h(ξ) = L2fξ h(ξ)
n o
= Lfξ ξ12 + ξ2
" #
h i ξ12 + ξ2
= 2ξ1 1
ξ1 ξ2
 
= 2ξ1 ξ12 + ξ2 + ξ1 ξ2
Dado :
ξ1 = x1
ξ2 = x2 − x21
Então :    
Lnfξ h(ξ) = 2x1 x21 + x2 − x21 + x1 x2 − x21
 
= 2x1 x2 + x1 x2 − x21
= f (q, x)
Lgξ Lfξ = 1
= g(x, q)

O sistema tratado nos exemplos anteriores, possuía dois estados, e um grau


relativo n = 2, este fenômeno nem sempre é observável em sistemas não
lineares. Tomando o exemplo que segue, veremos um caso de dinâmica que
apresenta um comportamento diferente do anterior.

25
Exemplo 5.3 A m de ilustrar um caso onde o grau relativo
difere da dimensão do sistema, iremos considerar o seguinte sis-
tema.
ξ˙1 = sin ξ2 + (ξ2 − 3)ξ3
ξ˙2 = ξ1 ξ22 + ξ3
ξ˙3 = ξ12 + u
y = ξ1 (86)
As função fξ gξ e h, são:
 
sin ξ2 + (ξ2 − 3)ξ3
fξ = 

ξ1 ξ22 + ξ3 

2
ξ1 + u
 
0
gξ =  0 
 

1
h = ξ1 (87)
A derivada de Lie Lgξ h é então calculada como segue.
 
h 0 i
Lgξ h = 1 0 0  0 


1
= 0 (88)
A próxima derivada é Lgξ Lfξ h:
  

h sin ξ2 + (ξ2 − 3)ξ3 
i 
Lgξ Lfξ h = Lgξ  1 0 0 

ξ1 ξ22 + ξ3 

ξ12 + u
 

= Lgξ {sin ξ2 + (ξ2 − 3)ξ3 }


 
h i0
= 0 cos ξ2 + ξ3 −3 
 0 

1
= −3 (89)
Como Lgξ Lfξ h 6= 0, então o grau relativo deste sistema será n =
2, mesmo o sistema tendo dimensão três. O próximo passo é

26
encontrar um difeomorsmo apropriado, e como neste caso tem-
se d = 1, é preciso escolher T1 , talque:
∂T1
gξ = 0 (90)
∂ξ
Uma possível escolha seria T1 = ξ2 . Restam agora os dois últimos
componentes do difeomorsmo, que são dados pelas derivadas de
Lie ja calculadas.

T2 = h
= ξ1
T3 = Lfξ h
= sin ξ2 + (ξ2 − 3)ξ3 (91)
O difeomorsmo pode ser completamente descrito como segue.
   
ξ2 q
T = 

ξ1  =  x1 
  

sin ξ2 + (ξ2 − 3)ξ3 x2


   
x1 ξ1
T −1 = 

q  =  ξ2 
  
(92)
x2 −sin q
q−3 ξ3

Ainda por meio das derivadas de Lie, podemos encontrar as fun-


ções f e g da forma canônica como segue:
f = L2fξ h
= Lfξ {sin ξ2 + (ξ2 − 3)ξ3 }
 
h isin ξ2 + (ξ2 − 3)ξ3
= 0 cos ξ2 + ξ3 −3 
 ξ1 ξ22 + ξ3 

2
ξ1 + u
= (cos ξ2 + ξ3 )(ξ1 ξ22 + ξ3 ) − 3ξ12
Aplicando T
x2 − sin q x2 − sin q
= (cos q + )(x1 q22 + ) − 3x21
q−3 q−3
g = Lgξ Lfξ h
= Lgξ {sin ξ2 + (ξ2 − 3)ξ3 }

27
 
h i0
= 0 cos ξ2 + ξ3 −3  0 


1
= −3

A função φ, pode ser encontrada como segue.

q̇ = φ(q, x)
= ξ˙2
= ξ1 ξ22 + ξ3
Aplicando T
x2 − sin q
φ(q, x) = x1 q 2 +
q−3
O sistema agora pode ser representado completamente em sua
forma canônica 83 como segue.
x2 − sin q
q̇ = x1 q 2 +
q−3
ẋ1 = x2
x2 − sin q x2 − sin q
ẋ2 = (cos q + )(x1 q22 + ) − 3x21 − 3u
q−3 q−3
y = x1 (93)

Ficou evidende neste ultimo exemplo que é possível ter um grau relativo
menor que a dimensão do sistema, isto decorre do fato da dinâmica interna
do sistema, representada por q ser não observável. A dinâmica q , é referida
como dinâmica zero do sistema, sendo esta dada pela seguinte denição.
Denição 5.3 Dinâmica Zero, é a dinâmica interna de um sistema, que
atuada pela entrada, mantém a saída zero.
Os conceitos de dinâmica zero e observabilidade, são mais sensíveis em sis-
temas lineares, pois para casos não-lineares, essas características se tornam
muito complexas de serem observadas, assim o exemplo que segue ilustra a
dinâmica zero de um sistema linear, a m de esclarecer esse conceito.

28
Exemplo 5.4 Consideremos o caso em que x e q representam
um sistema linear com a dinâmica dada pela seguinte função de
transferência.
sd + bd−1 sd−1 + . . . + b0
G(S) = k (94)
sn+d + an+d−1 sn+d−1 + . . . + a0
A realização minima desse sistema no espaço de estados é dada
a seguir.
ξ˙ = Aξ + Bu
y = Cξ (95)
Onde:
 
0
..
.
 
 I 
A =
 
0
 
 
.
−a0 .. −an+d−1
 

B = [0, · · · , 0, k]T
C = [b0 , · · · , bd−1 , 1, 0, · · · , 0]
Uma vez que y = x1 é possível averiguar as seguintes igualdades.
x1 = Cξ = b0 ξ1 + · · · + bd−1 ξd + ξd+1
x2 = ẋ1
= b0 ξ2 + · · · + bd−1 ξd+1 + ξd + 2
= CAξ
x3 = ẋ2
= b0 ξ3 + · · · + bd−1 ξd+2 + ξd + 3
= CA2 ξ
..
.
xn = CAn−1 ξ = b0 ξn + · · · + bd−1 ξn + d − 1 + ξn + d
Denindo os q estados restantes como segue.
q1 = ξ1
..
.
qd = ξd

29
É obtida a seguinte transformação.
 

q
 I 0
  
C 
.. (96)
 
= ξ
 
x .
   
   
CAn−1

Podemos então representar o sistema q , da seguinte forma.

q̇1 = ξ2 = q2
..
.
q̇d = ξd+1
= x1 − (b0 ξ1 + · · · + bd−1 ξd )
(97)

O subsistema q , pode então ser reescrito como segue.


   
0 0
.. ..
. .
   
q̇ =

 I 
q

+ 0 
x (98)
0 0
   
   
−b0 . . . −bd−1 1 0 ... 0

É possível notar que o subsistema q̇ = Aq q + Bq x possui polos


coincidentes com os zeros da função de transferência 94. Portanto,
os estados q são referidos como dinâmica zero do sistema.

O sistema agora possui duas classes de estados distintas x e q , e pelo que foi
abordado no exemplo anterior, um controlador com a capacidade de manter
limitados os estados x, através de um sistema de erro apropriado, pode per-
mitir que os estados q aumentem indenidamente, dependendo da dinâmica
de q̇ = Aq . Uma forma menos restritiva que impor estabilidade ao subsis-
tema q , para garantir a estabilidade do controlador, é dada no teorema que
segue.
Teorema 5.4 Seja e = X (t, x) um sistema que satisfaz a suposição 2.1, se
o subsistema q , que tem x como entrada, for input-to-state estável, então o
controlador u = ν(z) será uniformemente limitado.

30
Com isso, basta garantir que o subsistema q seja input-to-state estável, con-
dição esta dada na denição que segue.
Denição 5.5 Um sistema q, tendo x como entrada, será input-to-state es-
tável, se existir uma função Vq tal que se observe:
γq1 ≤ Vq (q) ≤ γq2 (|q|)
V̇q ≤ −γq3 (|q|), ∀|q| ≥ ψ(|x|) > 0
Ou :
V̇ ≤ −cV + ψ(|x|) + d (99)
Onde as funções γq1 e γq2 são classe K, e as funções γq3 e ψ são classe K∞ ,
c é uma constante positiva e d é uma constante não negativa.
O teorema 5.4, proporciona um meio de garantir a estabilidade do controla-
dor, caso o sistema de erro satisfaça a suposição 2.1. O exemplo que segue,
ilustra a aplicação desse teorema para um sistema com não linearidades, na
dinâmica do subsistema q .

Exemplo 5.5 Consideremos o seguinte sistema.


q̇ = 1 − q1 − q13 + q1 x21
ẋ1 = q12 + u
y = x1 (100)
Supondo agora que se deseja controlar o sistema, de forma que
x1 → 0. Um sistema de erro que satisfaz a suposição 2.1 pode
ser escolhido como sendo e = x1 , a função de Lyapunov V = 21 e2 .
Um controlado apropriado para este sistema, segundo os conceitos
anteriormente expostos, é adotar u = ν(z) onde:
ν(z) = ν(q, x) = −q12 − κe (101)
O sistema resultante tera a seguinte dinâmica.
q̇ = 1 − q1 − q13 + q1 x21
ẋ1 = −κe (102)
Pelo teorema 5.4 o sistema 102 será uniformemente limitado, se
o subsistema q for inupt-to-state estável, ou seja, se o estado q

31
obedecer as restrições 99. Pode-se então escolher Vq = 21 q12 , o
que satisfaz γq1 (|q|) ≤ 12 q12 (q) ≤ γq2 , com isso tem-se a seguinte
representação para a derivada de Vq .
V̇q = q1 q̇1
= q1 (1 − q1 − q13 + q1 x21 )
= q1 − q12 − q14 + q12 x21
≤ −q12 + |q1 | − q14 + q12 |x1 |2

V̇q = q1 q̇1
= q1 (1 − q1 − q13 + q1 x21 )
= q1 − q12 − q14 + q12 x21
≤ −q12 + |q1 | − q14 + q12 |x1 |2 (103)
Como −2x2 ± 2xy ≤ −x2 + y 2 , tem-se:
− q12 + |q1 | = −2x2 ± 2xy

x = q1 / 2
2
2xy = √ q1 y
2

2
y = ±
2
Então :
q2 1
−q12 + |q| ≤ 1 +
2 2
4 2 2 2
−q1 + q1 |x1 | = −2x ± 2xy
x2 = q14 /2
q2
x = √1
2
2xy = q1 |x1 |2
2

2
= √ q12 y
2

2
y = |x1 |2
2
Então :
−q14 + |x1 |4
−q14 + q12 |x1 |2 ≤
2
32
É possível agora reescrever V̇ como segue.
−q14 + q12 |x1 |4 − q12 + 1
V˙q ≤
2
−q1 − q1 + 1 + |x1 |4
4 2

2
1 2 2 1 1
≤ − q1 (q1 + 1) + |x1 |4 + (104)
2 2 2
A equação 104 não pode ser representada na forma 99, pois não
existe constante c tal que cVq = − 12 Vq (Vq + 1). Uma outra forma
de comprovar o resultado, é tomando q1 = |x1 | na equação 103, o
que atende à restrição |q| ≥ ψ(|x|), assim tem-se:
V̇q ≤ −q12 + |q1 | − q14 + q12 q12
≤ −q12 + |q1 | − q14 + q14
≤ −q12 + |q1 |
≤ −|q1 |(|q1 | − 1) (105)
Portanto, pode-se denir γq3 = |q1 |(|q1 | − 1), e como γq3 não é
uma função classe K, conclui-se que o subsistema q , não é input-
to-state stable.

O exemplo que segue ilustra um caso oposto, onde o subsistema q é input-


to-state stable.

Exemplo 5.6 Consideremos o seguinte sistema dinâmico não-


linear.
ξ˙1 = ξ12 + ξ1 ξ3
ξ˙2 = −ξ1
ξ˙3 = ξ12 + u
y = ξ1 (106)
As funções fξ gξ e h são denidas como segue.
ξ12 + ξ1 ξ3
 

fξ =  −ξ1
 

2
ξ1

33
 
0
gξ =  0 
 

1
h = ξ1

As derivadas de Lie necessárias à análise são calculadas a seguir.


 
h 0 i
Lqξ h = 1 0 0  0 


1
ξ12 + ξ1 ξ3
 
h i
Lfξ h = 1 0 0  −ξ1
 

ξ12
= ξ12 + ξ1 ξ3
 
h i 0
Lqξ Lfξ h = ξ3 2ξ2 ξ1  0 
 

1
= ξ1

É possível averiguar, pelo resultado anterior, que o grau relativo


do sistema será n = 2, portanto a representação canônica do sis-
tema será da nas variaveis [q, x1 , x2 ]T . O difeomorsmo T (ξ), que
leva o sistema para a forma canônica desejada, pode ser encon-
trado denindo T1 (ξ) = ξ2 e calculando T2 e T3 com base nas
derivadas de Lie.
T −2 = h
= ξ1
T3 = L fξ h
= ξ12 + ξ1 ξ3
(107)
O difeomorsmo é então obtido, e sua inversa pode ser facilmente
encontrada igualando os estados ξ e [q, x]T .
   
q ξ2
 x1  = T (ξ) =  ξ1
   

2
x2 ξ2 + ξ1 ξ3

34
 
x1
 
ξ1
−1 q
 
 ξ2  = T (q, x) = 
  
x1 −ξ22
 
ξ3 x1
x1
 

= 
 q 

x2−q 2
x1

O subsistema q , dado por q̇ = φ(q, x), pode então ser denido


com base no difeomorsmo T (ξ).
q = ξ2
q̇ = ξ˙2
= −ξ1
P ortanto :
q̇ = −x1 (108)
Denindo Vq = 12 q 2 , é encontrado o seguinte resultado.
V̇q = q q̇
= −qx1
V̇q ≤ −|q||x1 |
Def inindo :
|q| = |x1 | = ψ(|x1 |)
Então :
V̇q ≤ −|q|2
(109)
Dessa forma, é comprovado que o subsistema q é input-to-state
stable, portanto, um controlador denido com base nos conceitos
de linearização por Input-Output Feedback, aqui discutidos, será
globalmente, assintoticamente estável.

O sistema do exemplo anterior, possui não linearidades que são facilmente


canceladas pela realimentação apropriada, esta propriedade porém, é bas-
tante restritiva. Nos próximos parágrafos será estudada uma classe de siste-
mas denominada strict-feedback, onde é possível garantir a estabilidade sem
a necessidade de se cancelar as não linearidades do sistema.

35
5.1 Sistemas Strict-Feedback

Considerado como uma classe especial de sistemas pure-feedback, os sistemas


strict-feedbcak tem o seguinte formato.

ẋ1 = f1 (x1 ) + g1 (x1 )x2


..
.
ẋn−1 = fn−1 (x1 , . . . , xn−1 ) + gn−1 (x1 , . . . , xn−1 )xn
ẋn = fn (x) + gn (x)u (110)

É possivel vericar que a entrada de um subsistema xi qualquer será xi+1 , e


que as funções fi (z) e gi (z) dependem das variaveis de estado z = [x1 , x2 , . . . , xi ].
A m de denir um controlador para o sistema 110 será esxposto o conceito
de integrator backstepping.
Teorema 5.6 Seja e = X (t, x) um sistema de erro que atenda a suposição
2.1.
ė = α(t, x) + β(x)u (111)
E u = ν(z), uma lei de controle globalmente estabilizante. A função de
Lyapunov possue a dinâmica V̇ ≤ −k1 V + k2 , onde k1 e k2 são constantes
positivas. Então existirá um controlador v = ν(z, q) para o seguinte sistema
composto.

ė = α(t, x) + β(x)q
q̇ = v (112)

Onde q ∈ < e v será a nova entrada.


Para provar esse teorema, consideremos o novo sistema de erro, dado por
eq = q − ν(z), e a nova função de Lyapunov Vc , para o sistema composto
e = [eT , eq ]T .
1
Vc = V (e) + e2q (113)
2
Encontramos a seguinte expressão para a derivada da equação 113.
˙ + eq e˙q
V̇c = V (e)
∂V ∂e
= + eq (q̇ − ν̇)
∂e ∂t

36
∂V
= (α(t, x) + β(x)q) + eq (q̇ − ν̇)
∂e
q = eq + ν
Então :
∂V
V̇c = (α(t, x) + β(x)(eq + ν)) + eq (q̇ − ν̇)
∂e
∂V
= (α(t, x)(eq + ν) + β(x)(eq + ν)) +
∂e
+ eq (q̇ − ν̇)
= (114)

Exemplo 5.7 Consideremos o sistema 110, a analise ira iniciar-


se pelo subsistema x1 .
Subsistema x1 O subsistema x1 será dado por:
ẋ1 = f1 (x1 ) + g1 (x1 )v (115)

Onde v é uma entrada virtual. É necessário agora fazer com que


o estado x1 siga a referencia r(t), para tanto é denida a primeira
componente do sistema de erro e1 como segue.

e 1 = x1 − r (116)

A dinâmica do sistema de erro e − 1, assume então a seguinte


forma.
ė1 = −ṙ + f1 (x1 ) + g1 (x1 )v (117)
A função de Lyapunov é então escolhida como sendo V1 = 21 e21 e
sua dinâmica dada por:

V̇1 = e1 ė1
= e1 (−ṙ + f1 (x1 ) + g1 (x1 )v) (118)

A lei de controle para este subsistema será:


ṙ − f1 (x1 ) − κe1
v = ν(z1 ) = (119)
g1 (x1 )

37
Onde z1 = [x1 , r, ṙ]. A dinâmica da função de Lyapunov será
dada por:
V̇1 = −κe21 = −2κV1 (120)
Logo o subsistema x1 será estável.
Subsistema x2 Consideremos agora o seguinte sistema.
ẋ1 = f1 (x1 ) + g1 (x1 )x2
ẋ2 = v (121)
Onde v é a nova entrada virtual. O erro agora é denido como
sendo e2 = x2 − v1 (z1 ), oque resulta na seguinte dinâmica.
ė2 = v − ν̇1 (122)
A componente e1 do sistema de erro pode então ser obtida da
seguinte forma.
e2 = x2 − ν1
x2 = e2 + ν1
ė1 = f1 + g1 x2 − ṙ
= f1 + g1 (e2 + ν1 ) − ṙ
= f1 + g1 ν1 − ṙ + g1 e2
ṙ − f1 (x1 ) − κe1
Como : ν(z1 ) =
g1 (x1 )
e: f1 + g1 ν1 − ṙ = −κe1
Então :
ė1 = −κe1 + g1 e2 (123)
A dinâmica do sistema de erro é descrita aseguir.
" #
−κe1 + g1 e2
ė = (124)
v − ν̇1
E nova função de Lyapunov é então denida com base na função
V1 e no erro e2 , resultando em V2 = V1 + 21 e22 .
1 ∂e22
V̇2 = V̇1 +
2 ∂t
= e1 ė1 + e2 ė2
= e1 (−κe1 + g1 e2 ) + e2 (v − ν̇1 )
= −κe21 + e1 g1 e2 + e2 (v − ν̇1 ) (125)

38
Escolhendo uma lei de controle v = ν̄2 (z2 ), onde z2 = [x1 , x2 , r, ṙ, r̈]T
tal que:
ν̄2 = ν̇1 − e1 g1 − κe2 (126)
Obtem-se:
V̇2 = −κ(e21 + e22 ) = −2κV2 (127)
Considerando agora o subsistema x2 completo.
ẋ1 = f1 (x1 ) + g1 (x1 )x2
ẋ2 = f2 (x1 , x2 ) + g2 (x1 , x2 )u (128)
A lei de controle u = ν2 , onde ν2 = (−f2 + ν̄2 )/g2 garante que
V̇2 = −2κV2 .
Subsistema x3 Inserindo a variavel de estado x3 ao subsistema
anterior, obtem-se o seguinte sistema.
ẋ1 = f1 + g1 x2
ẋ2 = f2 + g2 x3
ẋ3 = v (129)
O nova componente do erro é então escolhida como segue.
e 3 = x 3 − ν2
x3 = e3 + ν2
ė3 = ẋ3 − ν̇2
= v − ν̇2 (130)
Aplicando a equação anterior ao sistema 129.
e 2 = x 2 − ν1
ė2 = ẋ2 − ν˙1
= f2 + g2 x3 − ν̇1
= f2 + g2 (e3 + ν2 ) − ν̇1
= f2 + g2 ν2 + g2 e3 − ν̇1
= ν̄2 + g2 e3 − ν̇1
= (ν̇1 − e1 g1 − κe2 ) + g2 e3 − ν̇1
= −e1 g1 − κe2 + g2 e3
(131)

39
O sistema de erro resultante terá a seguinte dinâmica.
 
−κe1 + g1 e2
ė =  −κe2 − e1 g1 + e3 g2 
 
(132)
v − ν̇2

A nova função de Lyapunov será V3 = V2 + 21 e23 e sua dinâmica


sera dada por:
V̇3 = e1 ė1 + e2 e˙2 + e2 e˙3
= e1 (−κe1 + g1 e2 ) + e2 (−κe2 − e1 g1 + e3 g2 ) + e3 (v − ν̇2 )
= −κe21 − κe22 + e1 e2 g1 − e1 e2 g1 + e2 e3 g2 + e3 (v − ν̇2 )
= −κ(e21 + e22 ) + e2 e3 g2 + e3 (v − ν̇2 )

Aplicando uma lei de controle v = ν̄3 (z3 ), onde z3 = [x1 , x2 , x3 , r, ṙ, r̈, ∂∂t3r ]T
3

e ν̄3 = ν̇2 − e2 g2 − κe3 é obtido o resultado que segue.


V̇3 = −κ(e21 + e22 ) + e2 e3 g2 + e3 (ν̇2 − e2 g2 − κe3 − ν̇2 )
= −κ(e21 + e22 + e23 )
= −2κV3 (133)
Considerando agora o subsistema completo.
ẋ1 = f1 + g1 x2
ẋ2 = f2 + g2 x3
ẋ3 = f3 + g3 u (134)
A lei de controle u = ν3 onde νe = (−f3 + ν̄3 )/g3 , irá garantir que
V̇3 = −2κV3 , logo o subsistema será estável.
Subsistema xn O mesmo procedimento deve ser repetido até a n-
ésima variável de estado. quanto o controlador estará concluído.
por analogia aos subsistemas anteriores, pode-se denir a lei de
controle de um estado xi como segue.
−fi + ν̇i−1 − ei−1 gi−1 − κei
νi = (135)
gi
É facil perceber atravéz da analise anterior, que esta escolha da
lei de controle garante que o sistema de erro será assintoticamente
estável e tenterá a e = 0.

40
O exemplo anterior,mostra como é possível desenvolver um controlador capaz
de conduzir o erro a um ponto de equilibro estável, onde e = 0, de forma
que o erro permaneça limitado, utilizando o integrator backstepping. Nada
foi dito porém, a respeito dos limites do estado x, assim como é exigido na
suposição 2.1. O lema que segue, prove uma ferramenta para comprovar
que, para o integrator backstepping, se o sistema de erro for limitado, então
o estado também o será.
Lema 5.7 Seja, f localmente Lipschitz, com constalte L, então existirá uma
função γ e um escalar d tal que, f (x) ≤ d + γ(|x|).
É imediato comprovar que x1 será limitado caso o erro e1 e a referência r(t)
também o forem, e com base no limite de x1 , e no lema anterior, é possível
averiguar a limitação de x2 e assim sucessivamente até xn .

41