Escolar Documentos
Profissional Documentos
Cultura Documentos
Centro de Tecnologia
Centro de Tecnologia
Natal - RN
2019
Universidade Federal do Rio Grande do Norte - UFRN
Sistema de Bibliotecas - SISBI
Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede
Ao Prof. D.Sc. Wallace Moreira Bessa, pela confiança depositada, pelos ensi-
namentos passados e, além das inúmeras outras contribuições, pela amizade (líder do
RoboTeAM ).
Ao Prof. D.Sc. João Deodato Batista dos Santos, pelas mais diversas contribuições,
ensinamentos passados e pela amizade (membro RoboTeAM ).
Aos amigos e membros do Laboratório de Manufatura por todo o apoio, que cito
em ordem alfabética: Enga . Dávila, B.Sc. Diego Porto, B.Sc. Jonas, Enga . M.Sc. Kaciê
Trindade, Eng. M.Sc. Marcos Vinícius, Enga . B.Sc. Maria Augusta.
Aos amigos Eng. B.Sc. Daniel Vitorino, Eng. B.Sc. Ewerton Cordeiro, Eng. B.Sc.
Felipe Maia, Eng. M.Sc. José Lopes, Eng. B.Sc. Matheus Protásio e Eng. M.Sc. Nícolas
Araújo por todo o apoio.
Aos primos(as) João Esdras, Louise Melo, Tatianny e Thalis, a toda minha família,
em especial, Lousange, Miguel, Miriam, Pascoal, Bibia e Elidney pelo imenso apoio e por
terem me acompanhado até aqui.
Resumo
Abstract
There are many techniques that may be employed in the design of control systems. PID
controllers, for example, are widely used in the industry, but have some disadvantages,
including instability issues when the system does not operate under design conditions.
Regarding the model-based controllers, the great difficulty is to determine the dynamics
of the system and the values of its parameters. In this work, a stochastic compensator is
proposed to estimate not only parametric uncertainties, but also the unmodeled dynamics.
The compensation scheme is based on Gaussian Process Regression (GPR) and embedded
within the control law to enhance tracking performance. On this basis, Feedback Lin-
earization and Sliding Modes are used to develop control laws that accommodate the GPR
based compensator. The resulting controllers are applied to an electro-hydraulic actuator
(EHA) and evaluated by means of both simulation and experiment procedures. Changes
in compensator parameters are also tested in order to assess their effects on controllers’
efficacy. Performance metrics are used for comparison purposes. It can be observed, in
all evaluated cases, that the proposed compensation scheme, when combined with the
adopted nonlinear controllers, are able of improve trajectory tracking without increasing
the overall control effort.
𝐶𝑑 coeficiente de descarga
C parâmetro do derivador
𝑑 zona morta
D conjunto de treinamento
𝑒 erro de rastreamento
𝑓 dinâmica do sistema
𝐹𝑓 força de atrito
𝑔 função arbitrária
GP processo gaussiano
ℎ perturbação do sistema
^
ℎ perturbação estimada do sistema
𝑘 kernel da distribuição
L espaço de Lebesgue
𝐾 constante de mola
𝐾 matriz de covariância
𝑚 métrica de desempenho
𝑀 massa do carregamento
N distribuição normal
𝑃𝑠 pressão de alimentação
P parâmetro do derivador
𝑢 sinal de controle
𝑣𝑠 coeficiente de Stribeck
𝑤 vetor de pesos
𝑥 estado do sistema
𝑥𝑑 estado desejado
𝑦 função de saída
𝑡 tempo
𝛼 parâmetro do filtro
𝜖 erro de aproximação
𝜀 ruído gaussiano
𝜇 média a priori
𝜙 função arbitrária
𝜃 vetor de hiper-parâmetros
𝜉 observador de estado
Sumário
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1 Organização do trabalho . . . . . . . . . . . . . . . . . . . . . . . . 20
6 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . 69
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
APÊNDICES 76
1 Introdução
Entretanto, o controle não linear convencional ainda é insuficiente para lidar com
problemas com elevado grau de incertezas. No caso do controlador por linearização por
realimentação, as dificuldades atreladas a essa técnica estão em obter um modelo preciso
do sistema a ser controlado(TANAKA; FERNANDES; BESSA, 2013). No controlador por
Modos Deslizantes, essa dificuldade é contornada pelo uso de um termo de descontinuidade
capaz de compensar as incertezas do sistema (SLOTINE; LI, 1991, pp. 288). Entretanto,
o uso desse termo em uma abordagem convencional provoca o indesejável efeito de
chaveamento da lei de controle (chattering) no controlador. Slotine e Li (1991) sugerem
então o uso de funções que suavizem esse efeito. Nesse caso, o rastreamento perfeito é
substituido pelo rastreamento com certo grau de precisão e o uso dessas funções tem sido
bem útil conforme mostrado por Bessa, Dutra e Kreuzer (2008), Bessa, Dutra e Kreuzer
Capítulo 1. Introdução 19
Termos adicionais têm sido acrescentados as leis de controle acima citadas para
compensar as incertezas dinâmicas e paramétricas associadas aos modelos do sistema e,
assim, deixar o controlador estável e também minimizar o erro de regime. Tais compensa-
dores têm sido aplicados no contexto direcionado a controladores inteligentes. Segundo
Bessa et al. (2018), um controlador pode ser dito inteligente se ele for capaz de prever as
incertezas do sistema com base em um conhecimento a priori, de se adaptar às mudanças
do sistema e do ambiente, de aprender com base em experiências passadas ao mesmo
tempo que adquire conhecimento através da interação com o seu meio e de ser robusto
face às perturbações externas e que permita operar sob condições seguras.
O GP tem sido aplicado nas mais diversas situações. Por exemplo, dentro de
Aprendizado de Máquina, Doerr et al. (2017) tem utilizado GP para aprender a dinâmica
Capítulo 1. Introdução 20
Esse trabalho foi estruturado numa sequência que apresentasse de forma lógica e
compreensível suas devidas contribuições no campo da ciência na qual se insere: controle
não linear de sistemas dinâmicos.
xd u x
Controlador Atuador Sistema
xd − e u x
+
Controlador Atuador Sistema
Realimentação
(𝑛)
𝑢 = 𝑏−1 (−𝑓 + 𝑥𝑑 − 𝑎0 𝑒 − 𝑎1 𝑒˙ − . . . − 𝑎𝑛−1 𝑒(𝑛−1) ) (2.3)
a resposta do sistema dinâmico em malha fechada, neste caso, terá uma convergência linear
em zero caso os coeficientes 𝑎𝑖 (𝑖 = 0, 1, . . . , 𝑛 − 1) forem de um polinômio de Hurwitz1 .
Contanto que os coeficientes da Eq. 2.4 satisfaçam a Definição 2.1, então a dinâmica
do erro terá convergência para zero. Uma forma simples de obter esses coeficientes é
através do Binômio de Newton2 utilizando a equação abaixo:
⎛ ⎞
𝑛
𝑎𝑖 = ⎝ ⎠ 𝜆𝑛−𝑖 (2.5)
𝑖
...
𝑒 + 3𝜆2 𝑒˙ + 𝜆3 𝑒 = 0
𝑒 + 3𝜆¨ (2.6)
onde 𝐴, 𝐵 e 𝐶 são constantes obtidas a partir das condições iniciais. Note que a resposta
1
Adolf Hurwitz (1859-1919) - Matemático alemão.
2
Sir Isaac Newton (1623-1662) - Físico e matemático inglês.
3
Blaise Pascal (1623-1662) - Matemático e físico francês.
Capítulo 2. Estratégias de Controle para Sistemas Não Lineares 25
apresentada pela Eq. 2.7 possui convergência exponencial (estabilidade exponencial) para
zero quando 𝑡 → ∞ e isso foi garantido justamente por conta de as raízes idênticas do
polinômio característico, relacionado a Eq. 2.6, possuirem parte real negativa.
0,0
ėβ [rad/s]
-10,0
-20,0
-30,0 ×10−1
-2,0 0,0 2,0 4,0 6,0
eβ [rad]
Fonte: Adaptado de Lima, Bessa e Trimpe (2019).
Por conta disso, quando o sistema a lidar é incerto, é interessante utilizar estra-
tégias robustas ou compensadores que melhorem a performance do controlador e evitem
comportamentos indesejáveis. O controlador por Modos Deslizantes apresentado na pró-
xima seção é uma técnica de controle robusto bastante utilizada para lidar com esse tipo
de problemas.
Capítulo 2. Estratégias de Controle para Sistemas Não Lineares 26
𝑠˙ + 𝜆𝑠 = 0 (2.9)
Note que para 𝑠 = 0 obtem-se uma EDO cuja solução converge assintoticamente
para zero, conforme já foi discutido, pois a expressão 𝑠 = 0 gera uma equação aos moldes
da Eq. 2.4 com coeficientes dados pela Eq. 2.5 e, portanto, coeficientes de um polinômio
de Hurwitz.
𝑠(𝑥, 𝑡) = C ⊤ 𝑒 (2.10)
⊤
˙
𝑠(𝑥, 𝑡) = C ⊤ 𝑒˙ = 𝑒(𝑛) + C̄ 𝑒 (2.11)
(𝑛) ⊤
𝑢 = 𝑏−1 (−𝑓 + 𝑥𝑑 − C̄ 𝑒) (2.12)
É dito que a lei de controle da Eq. 2.12 deixa o sistema no seu modo deslizante
(SLOTINE; LI, 1991, p. 281). Nesse modo, a dinâmica do sistema em malha fechada é
mantida sobre a superfície de deslizamento. Para o caso que 𝑥0 ̸= 𝑥𝑑 é necessário levar o
estado inicial para a superfície de deslizamento. Esse é o modo de aproximação. A Fig. 4
mostra de forma gráfica o plano de fase do erro para um sistema de ordem 𝑛 = 2, ou seja,
𝑠 = 𝑒˙ + 𝜆𝑒. Nessa figura é possível visualizar os modos de aproximação e de deslizamento.
s(x, t) = 0 ė
−λ
e
Modo
deslizante
e0
Modo de
aproximação
Pode-se constatar então que a técnica de controle por modos deslizantes é dividida
em duas etapas ou modos: o de aproximação, que leva o estado inicial do erro à superfície
de deslizamento, e o deslizante que leva os estados que estão sobre a superfície 𝑆 para o
estado desejado. A Eq. 2.12 é para o caso deslizante, mas como definir a lei de controle
que atenda o modo de aproximação? Para isso, considere o problema na qual o estado
̸ 𝑥𝑑 ) e que, além disso, as funções 𝑓 e 𝑏 não são
inicial é diferente do estado desejado (𝑥0 =
conhecidas com exatidão e que podem ser representadas na forma 𝑓 = 𝑓^+ Δ𝑓 e 𝑏 = ^𝑏 + Δ𝑏,
onde Δ𝑓 e Δ𝑏 são as incertezas associadas a esses termos. Logo, o sistema representado
Capítulo 2. Estratégias de Controle para Sistemas Não Lineares 28
onde ℎ = Δ𝑓 + Δ𝑏𝑢 é o termo que agrupa as incertezas do sistema. Como esse termo
também leva em conta também efeitos externos não considerados na modelagem, ℎ será
chamado daqui em diante de perturbação.
(𝑛) ⊤
𝑢 = ^𝑏−1 (−𝑓^ + 𝑥𝑑 − C̄ 𝑒 − Ksgn(𝑠)) (2.14)
O ganho K deve ser obtido de tal forma que possa garantir a estabilidade do
sistema. Para isso considere a seguinte função, definida em relação ao quadrado da
distância 𝑠 até a superfície de deslizamento,
1
𝑉 (𝑡) = 𝑠2 (2.16)
2
Fazendo,
K ≥𝛿+𝜂 (2.18)
1 𝑑𝑠2
𝑉˙ (𝑡) = ≤ −𝜂|𝑠| (2.19)
2 𝑑𝑡
Diz-se que a Eq. 2.19 denota a condição de deslizamento. Essa equação traz a
informação que o quadrado da distância até a superfície 𝑆(𝑡) decresce ao longo de toda
a trajetória (SLOTINE; LI, 1991, p. 280). Também, através dessa equação, é possível
assegurar que dentro de um tempo finito a superfície de deslizamento será alcançada e,
portanto, garantirá a estabilidade exponencial do sistema em malha fechada (BESSA,
2009).
𝑠 𝑑𝑠
𝑠˙ = sgn(𝑠) ≤ −𝜂 (2.20)
|𝑠| 𝑑𝜏
Pela teoria apresentada, sabe-se que não é necessário avaliar para 𝑡 → ∞, porque
o controlador por SMC tem como primeira tarefa levar o estado inicial para a superfície
de deslizamento dentro de um tempo finito, 𝑡𝑎𝑙𝑐 , onde 𝑠(𝑡 ≥ 𝑡𝑎𝑙𝑐 ) = 0. Portanto, a Eq. 2.21
pode ser utilizada para chegar na seguinte expressão,
|𝑠(0)|
𝑡𝑎𝑙𝑐 ≤ (2.22)
𝜂
Entretanto, o uso da função sinal na lei de controle 2.14 pode causar o efeito
Capítulo 2. Estratégias de Controle para Sistemas Não Lineares 30
de chaveamento no sistema e deve ser evitado, pois pode provocar vibrações de nível
indesejado na estrutura do equipamento, por exemplo. Slotine e Li (1991) sugerem que
para evitar esse problema seja utilizada uma função de saturação, definida da seguinte
forma:
⎧
⎨ sgn(𝑥), |𝑥| ≥ 1
sat(𝑥) = ⎩ (2.23)
𝑥, |𝑥| < 1
⊤
(︁ )︁
(𝑛)
𝑢 = ^𝑏−1 −𝑓^ + 𝑥𝑑 − C̄ 𝑒 − Ksat (𝑠/𝜑) (2.24)
onde 𝜑 é uma constate estritamente positiva e denota a espessura da camada limite. Esse
parâmetro pode ser ajustado de acordo com precisão de rastreamento desejada, já que dessa
vez o controlador não irá garantir um rastreamento perfeito (com erro de rastreamento
desprezível).
Teorema 2.1. Dada uma função 𝑉 definida positiva, o sistema será assintoticamente
estável (no sentido Lyapunov) se 𝑉˙ for definida negativa.
Definição 2.2. Uma função 𝑉 (𝑥) é dita definida positiva se, em uma região Ω, 𝑉 (𝑥) >
0 ∀ 𝑥 ̸= 0 ∈ Ω e 𝑉 (0) = 0.
Definição 2.3. Uma função 𝑉 (𝑥) é dita definida negativa se −𝑉 (𝑥) for definida positiva.
A função 𝑉 (𝑥) pode ser interpretada como uma função de energia do sistema cujo
objetivo é trazê-la para seu ponto de mínimo, um estado de equilíbrio.
1
𝑉𝜑 (𝑡) = 𝑠2𝜑 (2.25)
2
Pode-se verificar que, fora da camada limite, ou seja, quando 𝑠 > 𝜑, sat(𝑠/𝜑) =
sgn(𝑠𝜑 ), logo que 𝑠˙ 𝜑 = 𝑠,
˙ e isso implica na mesma abordagem feita anteriormente. Logo,
que é uma função definida negativa, pois 𝑉˙ 𝜑 (𝑡) é nula somente na origem 𝜑. Observa-se, a
partir da Eq. 2.26, que 𝑉𝜑 (𝑡) ≤ 𝑉𝜑 (0) e, portanto, os estados serão atraídos para a camada
limite, ou seja, que 𝑠𝜑 → 0 quando 𝑡 → ∞.
Uma vez dentro da camada limite pode-se demonstrar que o erro de rastreamento
ficará contido dentro de uma região delimitada segundo o teorema abaixo:
4,0
Φ
0,0
ė [m/s]
-4,0
-8,0
-12,0
-16,0 ×10−1
-1,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0
e [m]
Fonte: Adaptado de Lima, Bessa e Trimpe (2018).
32
𝑓 (𝑥) = 𝑥⊤ 𝑤 (3.1)
A saída real de um sistema pode não ser determinística aos moldes da Eq. 3.1.
Então considere que essa saída real seja dada pela saída da função 𝑓 da Eq. 3.1 acrescentada
de um ruído que possui uma distribuição gaussiana com média nula e variância 𝜎𝑛2 :
possível considerando uma relação de verossimilhança (do inglês, likelihood) cuja função
densidade de probabilidades condicional é dada na seguinte forma, supondo uma relação
de independência:
𝑛 𝑛
(𝑦𝑖 − 𝑥⊤
(︃ )︃
2
∏︁ ∏︁ 1 𝑖 𝑤)
𝑝(𝑦 | 𝑋, 𝑤) = 𝑝(𝑦𝑖 | 𝑥𝑖 , 𝑤) = √ exp −
𝑖=1 𝑖=1 2𝜋𝜎𝑛 2𝜎𝑛2
(︃ )︃ (3.3)
1 1
= exp − ‖ 𝑦 − 𝑋 ⊤ 𝑤 ‖2 = N (𝑋 ⊤ 𝑤, 𝜎𝑛2 𝐼)
(2𝜋𝜎𝑛2 )𝑛/2 𝜎𝑛2
verossimilhança × priori
posteriori = (3.4)
verossimilhança marginal
Notar que a Eq. 3.4 pode ser o instrumento capaz de retornar uma distribuição dos
parâmetros da função de mapeamento quando são dadas como entradas a distribuição dos
conjuntos entrada-saída de acordo com a crença inicial de como esses mesmos parâmetros
estão distribuídos sobre a distribuição total do conjunto de treinamento. Em linguagem
matemática,
𝑝(𝑦 | 𝑋, 𝑤)𝑝(𝑤)
𝑝(𝑤 | 𝑦, 𝑋) = (3.5)
𝑝(𝑦 | 𝑋)
Consideração 3.1. A distribuição a priori dos pesos 𝑤 é tida com média nula e matriz
de covariância Σ𝑝 , ou seja,
𝑤 ∼ N (0, Σ𝑝 ) (3.6)
Pela Eq. 3.9 é observável que a média da distribuição passa a variar de forma linear
com os dados de entrada e a variância de forma quadrática, o que leva a pensar na limitação
da sua capacidade de predição. Se os dados de entrada apresentarem um comportamento
muito disperso em relação ao conjunto de treinamento então sua distribuição correspondente
poderá apresentar muitas incertezas em relação ao conjunto global de dados. Se todos
os dados forem (quase) linearmente distribuídos, esse problema é minimizado, pois a
tendência de predição permacerá inalterada, entretanto, para casos diferentes o modelo
linear passa a ser ineficaz para o problema de regressão.
Capítulo 3. Regressão por Processo Gaussiano 35
A análise anterior pode ser estendida para espaços de dimensões maiores. Isso é
feito utilizando uma transformação de base, 𝑇 (𝑥) = 𝜓(𝑥), onde os dados de entrada que
antes não possuiam um comportamento linear passam a tê-lo. Após essa transformação, o
modelo linear dado pela Eq. 3.1 pode ser aplicado normalmente na seguinte forma:
Essa base pode ser, por exemplo, do tipo polinomial, 𝜓(𝑥) = [1, 𝑥, 𝑥2 , . . .]⊤ (WIL-
LIAMS; RASMUSSEN, 2006, p. 11), ou trigonométrica, 𝜓(𝑥) = [sin 𝑥, cos 𝑥, sin 2𝑥, . . .]⊤ ,
entre outras.
onde 𝜓* = 𝜓(𝑥* ), Ψ = Ψ(𝑋) e 𝐴 = 𝜎𝑛−2 ΨΨ⊤ + Σ−1𝑝 . O termo Ψ agrupa todos os vetores
do conjunto treinamento de entrada após a mudança de base (𝜓(𝑥)).
Williams e Rasmussen (2006) mostram que a Eq. 3.11 pode ser modificada para
ficar na forma abaixo:
2018):
⎡ ⎤
𝑘(𝑥1 , 𝑥′1 ) 𝑘(𝑥1 , 𝑥′2 ) . . . 𝑘(𝑥1 , 𝑥′𝑁 )
⎢ ⎥
⎢
𝑘(𝑥2 , 𝑥′1 ) 𝑘(𝑥2 , 𝑥′2 ) . . . 𝑘(𝑥2 , 𝑥′𝑁 ) ⎥
𝐾(𝑋, 𝑋 ′ ) =
⎢ ⎥
⎢
.. .. ... .. ⎥ (3.14)
. . .
⎢ ⎥
⎢ ⎥
⎣ ⎦
𝑘(𝑥𝑁 , 𝑥′1 ) 𝑘(𝑥𝑁 , 𝑥′2 ) . . . 𝑘(𝑥𝑁 , 𝑥′𝑁 )
Portanto, uma função ℎ é dita um Processo Gaussiano se dois pares (ou mais) de
entrada-saída seguirem uma distribuição Gaussiana. Assim como na distribuição Gaussiana
é necessário fornecer uma informação de média e de variância dos dados, o GP também
necessita disso (DOERR et al., 2018). Pode-se definir então que uma função ℎ(𝑥) pode
ser escrita como um GP se,
onde 𝐾𝑁 é definida pela Eq. 3.14 e ℎ̃(𝑥) = [ℎ̄(𝑥1 ) − 𝜇(𝑥1 ), ℎ̄(𝑥2 ) − 𝜇(𝑥2 ), . . . , ℎ̄(𝑥𝑁 ) −
𝜇(𝑥𝑁 )]⊤ . ℎ̄(𝑥𝑖−1 ) é a variável medida em relação à entrada 𝑥𝑖−1 que pertence ao conjunto
de treinamento e é utilizada para calcular a média a posteriori no passo 𝑖. Dentre as
possibilidades disponíveis, Williams e Rasmussen (2006) sugerem utilizar como função de
covariância o kernel da Função de Base Radial (RBF, do inglês Radial Basis Function)
também chamada de exponencial quadrática, definida abaixo:
‖ 𝑥 − 𝑥′ ‖2
(︃ )︃
′
𝑘(𝑥, 𝑥 ) = 𝜎𝑓2 exp − (3.19)
2𝛾 2
Considere que foram coletados 20 pontos da função ℎ̄(𝑥) definida conforme a Eq.
3.15 onde a função ℎ(𝑥) = 1,9 sin(2,3𝑥) − 2,3 sin(1,4𝑥) + 1,9 cos(0,5𝑥) e o desvio-padrão
do ruído gaussiano é 𝜎𝑛 = 0,1. Definindo o vetor de hiper-parâmetros do GP como
𝜃 = [𝜎𝑛 , 𝜎𝑓 , 𝛾]⊤ foi realizada a simulação da regressão utilizando 𝜃 = [0,1, 1, 1]⊤ . O
resultado pode ser visto na Fig. 6. O parâmetro 𝜎𝑓2 corresponde a variância da função
ℎ(𝑥) enquanto 𝛾 é a escala de distância entre os pontos do conjunto de treinamento e a
entrada, correspondente a variância do kernel.
Pode-se observar que a média calculada pela Eq. 3.18a (curva azul) interpola
todos os pontos do conjunto de treinamento, fato esse constatado pela região de 95% de
confiança (área verde), calculada pela Eq. 3.18b, diminuta em torno desses pontos. Em
Capítulo 3. Regressão por Processo Gaussiano 38
2,5
Saída, h̄
0,0
-2,5
-5,0
-6,0 -3,0 0,0 3,0 6,0
Entrada, x
Fonte: Elaborada pelo autor.
locais mais afastados do conjunto de treinamento, observa-se um aumento da variância da
regressão realizada.
2,5 2,5
Saída, h̄
Saída, h̄
0,0 0,0
-2,5 -2,5
Agora fazendo com que 𝛾 = 5, é esperado que a saída do GP seja mais suave já
que um 𝛾 muito grande introduz uma noção de distância bem menor à medida que se
afasta do conjunto de treinamento. Em outras palavras, o Processo Gaussiano é levado a
acreditar que a entrada posta ainda está próxima do conjunto de treinamento reduzindo
não só a expectativa de sua sáida, a média, assim como o grau de incerteza relacionado, a
variância. Esse fato é o oposto do resultado mostrado na Fig. 7! Os resultados para 𝛾 = 5
são mostrados na Fig. 8.
6,0 2,5
Saída, h̄
Saída, h̄
0,0 0,0
-6,0 -2,5
-12,0 -5,0
-15,0 -7,5 0,0 7,5 15,0 -15,0 -7,5 0,0 7,5 15,0
Entrada, x Entrada, x
(a) 𝜃 = [0,1, 1, 5]⊤ . (b) 𝜃 = [0,8, 1, 5]⊤ .
Como esperado, o aumento do 𝛾 produziu uma saída bem mais suave que o
mostrado na Fig. 6 e com dispersão mínima, principalmente nas redondezas dos pontos
do conjunto de treinamento. Na Fig. 8a, somente o 𝛾 foi alterado. Já para o resultado
mostrado na Fig. 8b, também foi alterado o hiper-parâmetro 𝜎𝑛 para 0,8. Essa variável
representa o grau de dispersão entre o que é desejável aproximar, ℎ, e o que é realmente
observado, ℎ̄. Por essa figura, observa-se que o aumento no valor de 𝜎𝑛 elevou a dispersão da
aproximação já que o aumento desse parâmetro levou o GP a ter menos confiança nos dados
disponíveis, conforme notado pela variância já relativamente elevada nas proximidades do
conjunto de dados a priori e cada vez maior à medida que a entrada se distanciou desses
dados em comparação com a regressão mostrada na Fig. 8a.
Dentro da área de controle, o interesse por GPR está em utilizá-lo como uma
ferramenta com a finalidade de compensar as incertezas e perturbações do sistema. Com
isso, partindo de um conjunto prévio de informações, a GPR irá aprender como esses
efeitos desconhecidos se comportam e assim prever seu valor para uma nova entrada.
Capítulo 3. Regressão por Processo Gaussiano 40
Lema 3.1. Considerando que o GPR aproxime a perturbação ℎ com um certo grau de
^ ≤ 𝜖, então a lei de controle dada pela Eq. 3.20 fará com que o
precisão 𝜖, ou seja, |ℎ − ℎ| {︃ }︃
𝑛 (𝑖) (𝑖 + 1)!
erro convirja para um região fechada 𝐸 = 𝑒 ∈ R | |𝑒 | ≤ 𝜖, 𝑖 = 0, . . . , 𝑛 − 1 .
𝜆𝑛−𝑖
0,0
ėβ [rad/s]
-10,0
-20,0
-30,0 ×10−1
-2,0 0,0 2,0 4,0 6,0
eβ [rad]
Fonte: Adaptado de Lima, Bessa e Trimpe (2019).
⊤
(︁ )︁
(𝑛)
𝑢 = ^𝑏−1 −𝑓^ − ℎ
^ + 𝑥 − C̄ 𝑒 − Ksat (𝑠/𝜑)
𝑑 (3.21)
^ +𝛿
K ≥ 𝜂 + |ℎ| (3.23)
14 Aplicar 𝑢 no sistema
15 Atualizar os estados: 𝑥
16 Cálculo do GP a posteriori: E(ℎ(𝑥* ) | D𝑖 ), V(ℎ(𝑥* ) | D𝑖 )
17 𝑡 ← 𝑡 + Δ𝑡
18 fim
Exemplo 3.3. Controle por Modos Deslizantes de um ROV com compensação por Processo
Gaussiano.
Pela Fig. 10, pode-se verificar novamente que com a utilização da lei de controle
3.21, que leva em conta o compensador GP, foi possível melhorar a performance do
controlador SMC, fato esse atestado pela convergência do erro de rastreamento para a
origem do plano de fase.
4,0
Φ
0,0
ė [m/s]
-4,0
-8,0
-12,0
-16,0 ×10−1
-1,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0
e [m]
Fonte: Adaptado de Lima, Bessa e Trimpe (2018).
45
Por conta das vantagens mecionadas dos AEH, em aplicações que exigem alta
precisão de operação faz-se necessário desenvolver um controlador capaz de fornecer uma
boa performance. Entretanto, os AEH possuem um alto grau de não linearidade por conta
dos efeitos da compressibilidade do fluido, atuação da válvula, atrito, saturação, zona
morta, entre outros (BESSA; DUTRA; KREUZER, 2010a;BESSA; DUTRA; KREUZER,
2010b; YIM; KIM; CHOI, 2014). Em relação aos controladores já implementados para
sistemas eletro-hidráulicos a literatura apresenta diversos exemplos com técnicas de controle
e compensadores para lidar com as não linearidades presentes nos atuadores. Liu e Alleyne
(1999) desenvolveram um algoritmo baseado na Teoria da Estabilidade de Lyapunov para
rastreamento de força de um AEH. Já Sun e Chiu (1999) apresentaram um controlador
utilizando SMC com compensador Proporcional-Integrativo (PI) projetado com base na
informação das pressões atuantes no atuador. Bonchis, Corke e Rye (2002) compararam
experimentalmente diversas técnicas de controle, entre elas o Proporcional-Derivativo
(PD) e controle preditivo. Yanada e Furuta (2007) aliaram controle adaptativo e um
compensador feedforward para estimar a frequência natural de um AEH. Guan e Pan
(2008a) e Guan e Pan (2008b) também utilizaram uma abordagem adaptativa com base
nas variações ocorrentes no volume de controle, mas dessa vez utilizando um controlador
por SMC e controle adaptativo convencional, respectivamente. Bessa, Dutra e Kreuzer
(2010b) utilizaram Lógica Fuzzy como estratégia adaptativa, dentro de um controlador
por SMC, para estimar as incertezas devido ao efeito de uma zona morta desconhecida no
esforço de controle. Skarpetis e Koumboulis (2013) aplicaram uma estratégia robusta a um
controlador Proporcional-Integral-Derivativo (PID). E Liem et al. (2016) também usaram
PID como controlador, aliado dessa vez a Redes Neurais em um contexto feedforward para
melhorar a performance do controlador.
Capítulo 4. Controle de um atuador eletro-hidráulico: Implementação Numérica 46
Um atuador eletro-hidráulico representado pela Fig. 11, pode ser descrito pelo
conjunto de equações 4.1. Esse sistema de equações diferenciais ordinárias consiste em
uma equação de 2a ordem que governa o movimento da carga submetida (4.1a) e uma
equação de 1a ordem para a variação da queda de pressão (4.1b).
𝐴𝑝 𝑃𝑞 − 𝐹𝑓 − 𝐾𝑥
𝑥¨ = (4.1a)
𝑀
⎛ √︃ ⎞
4𝛽𝑒 ⎝ 𝑃𝑠 − 𝑃𝑞 sgn(𝑢)
𝑃˙𝑞 = 𝐶𝑑 𝜔¯
𝑥𝑠𝑝 − 𝐴𝑝 𝑥˙ − 𝐶𝑡𝑝 𝑃𝑞 ⎠ (4.1b)
𝑉𝑐 𝜌
onde 𝐴𝑝 é a área da seção transversal de cada câmara, supondo que a haste seja passante
no pistão, 𝑃𝑞 é a diferença de pressão no cilindro, 𝐹𝑓 é a força de atrito atuante, 𝐾 é
a rigidez da mola, 𝑀 é a massa total do pistão e da carga submetida, 𝛽𝑒 é o fator de
compressibilidade do fluido, 𝑉𝑐 é o volume total das câmaras, 𝐶𝑑 é o coeficiente de descarga,
𝜔 é o gradiente de área do orifício da válvula, 𝑥¯𝑠𝑝 é o deslocamento efetivo da válvula,
𝑃𝑠 é a pressão de alimentação, 𝜌 é a massa específica do fluido e 𝐶𝑡𝑝 é o coeficiente de
vazamento do fluido que ocorre devido à folga entre o pistão e o cilindro.
Bessa, Dutra e Kreuzer (2010b) adicionam como não linearidade ao AEH o efeito
de zona morta. Santos (2018) justifica essa zona morta pelo fato dela permitir que a
posição do cilindro seja mantida constante devido ao não vazamento do fluido durante
a mudança de posição da válvula. Dito isso, o deslocamento efetivo da válvula pode ser
Capítulo 4. Controle de um atuador eletro-hidráulico: Implementação Numérica 47
onde,
⎧
⎨ 𝑘𝑙 , 𝑢 ≤ 0
𝑘𝑣 (𝑢) = (4.3)
⎩ 𝑘𝑟 , 𝑢 > 0
e,
⎧
⎪
⎪
⎪
⎨
𝛿𝑙 , 𝑢 ≤ 𝛿𝑙
𝑑(𝑢) = 𝑢, 𝛿𝑙 < 𝑢 < 𝛿𝑟 (4.4)
⎪
⎪
𝛿𝑟 𝑢 ≥ 𝛿𝑟
⎪
⎩
Graficamente a zona morta pode ser visualizada pela Fig. 12. Fica claro que essa
não linearidade implica em uma região de tensão de controle que não produz abertura na
válvula impedindo o fluxo do fluido hidráulico.
Também, Xiwei, Fei e Wei (2017) e Santos (2018) sugerem utilizar o modelo de
atrito de Stribeck1 . Segundo Santos (2018), esse modelo é adequado quando o movimento
1
Richard Stribeck (1861-1950) - Engenheiro mecânico alemão.
Capítulo 4. Controle de um atuador eletro-hidráulico: Implementação Numérica 48
Ff [N]
0.0
0.0
ẋ [m/s]
...
𝑥 = 𝑓 (𝑥) + 𝑏(𝑥)[𝑢 − 𝑑(𝑢)] (4.6)
Essa técnica consiste em estimar o sinal 𝜉˙0 de um sinal 𝑥 = 𝑓 (𝑡) de modo que a
igualdade 𝜉0 − 𝑥 = 0 seja válida ∀𝑡 ≥ 𝑡𝜉0 dentro de um intervalo de convergência 0 ≤ 𝑡 ≤ 𝑡𝜉0 .
Assim sendo, definindo o erro 𝜉˜ = 𝜉0 − 𝑥, a derivada de 𝑓 (𝑡) pode ser estimada através
das seguintes equações:
˜ 12 sgn(𝜉)
𝜉˙0 = 𝜉1 − P0 |𝜉| ˜ (4.7a)
P1 > C (4.8a)
P1 + C
P02 > 4C (4.8b)
P1 − C
Definição 4.1. Uma função 𝑓 : X → R é dita de Lipschitz se existir uma constante C > 0,
tal que 𝑥, 𝑦 ∈ X ⇒ |𝑓 (𝑥) − 𝑓 (𝑦)| ≤ C |𝑥 − 𝑦| (LIMA, 2004, pp. 83).
f˙2, ξ˙0
0,5
f˙1, ξ˙0
0,0
0,0
-0,5
-0,5
-1,0
-1,0 0 5 10 15 20 25 30
0 5 10 15 20 25 30
t [s]
t [s]
(b) 𝑓˙2 (𝑡) = 4𝜋/15 sin(2𝜋𝑡/15) +
(a) 𝑓˙1 (𝑡) = 4𝜋/15 sin(2𝜋𝑡/15)
0,008𝜋 cos(4𝜋𝑡)
^ + ...
𝑢 = ^𝑏−1 (−𝑓^ − ℎ 𝑒 − 3𝜆2 𝑒˙ − 𝜆3 𝑒)
𝑥 − 3𝜆¨ (4.9)
Os parâmetros utilizados do modelo apresentado pelas Eq. 4.1, 4.2 e 4.5 foram:
𝐴𝑝 = 1,13 · 10−3 m2 , 𝐹𝑠 = 400 N, 𝜇𝑐 = 0,8, 𝐹𝑛 = 100 N, 𝑣𝑠 = 0,07 m/s, 𝐵 = 1000 Ns/m,
𝐾 = 0, 𝑀 = 250 kg, 𝛽𝑒 = 700 MPa, 𝑉𝑐 = 2,26 · 10−3 m3 , 𝐶𝑑 = 0,6, 𝜔 = 2,5 · 10−2 m,
𝑘𝑙 = 𝑘𝑟 = 2·10−6 m/V, 𝛿𝑙 = −1,2 V, 𝛿𝑟 = 1 V, 𝑃𝑠 = 7 MPa, 𝜌 = 850 kg/m3 e 𝐶𝑡𝑝 = 2·10−12 .
Também foi considerado que o sinal enviado para a válvula não poderia ultrapassar ±10 V.
A trajetória desejada para o atuador foi posta da seguinte forma, para um tempo
total de simulação de 150 s:
⎧
⎪
⎪
⎪
⎪
0,04, 0 ≤ 𝑡 ≤ 30
⎪
0,16, 30 ≤ 𝑡 ≤ 60
⎪
⎪
⎪
⎪
⎨
𝑥𝑑 [𝑚] =
⎪
0,08, 60 ≤ 𝑡 ≤ 90 (4.10)
⎪
0,12, 90 ≤ 𝑡 ≤ 120
⎪
⎪
⎪
⎪
⎪
⎪
0,06, 120 ≤ 𝑡 ≤ 150
⎪
⎩
Figura 15 – Resultados para simulação utilizando FBL e FBL com compensação GPR utilizando
entrada 𝑢
^ e 𝜃 = [1; 1; 0,15].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
Como pode-se notar pela Fig. 15a, a inclusão do compensador melhorou a perfor-
mance do controlador por linearização por realimentação no que se refere ao rastreamento
de trajetória conduzindo, inclusive a uma convergência mais rápida se comparado ao uso
do controlador FBL puro. Entretanto, a inclusão do compensador por GPR levou a pontos
de saturação no atuador durante os breves períodos de convergência à posição desejada,
como mostrado pela Fig. 15b. Além disso houve dois momentos de oscilação no esforço de
controle, em períodos que o atuador já se encontrava na posição desejada. Esse fenômeno
é reflexo da saída da regressão por GP, conforme mostrado pela Fig. 15c.
Além da entrada 𝑢^ foi testada como entrada uma variável de erro combinada
Capítulo 4. Controle de um atuador eletro-hidráulico: Implementação Numérica 52
inspirada no controlador por modos deslizantes, a variável 𝑠, que para o sistema em questão
pode ser calculada por 𝑠 = 𝑒¨ + 2𝜆𝑒˙ + 𝜆2 𝑒. Os parâmetros do controlador foram idênticos
aos da simulação passada com exceção dos hiperparâmetros 𝜃 = [0,8; 1; 0,1]. Os resultados
para essa nova simulação são mostrados na Fig. 16.
Figura 16 – Resultados para simulação utilizando FBL e FBL com compensação GPR utilizando
entrada 𝑠 e 𝜃 = [0,8; 1; 0,1].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
Como novamente verifica-se pela Fig. 16a, a inclusão do compensador GPR com
entrada 𝑠 melhorou a performance do controlador em relação ao FBL puro. Contudo,
diferentemente do que foi observado no caso anterior, não houve oscilações excessivas no
esforço de controle. Além disso, no rastreamento de trajetória, houve a ocorrência de
pequenos overshoots de aproximadamente 4% em relação a posição de estabilização.
Por último, para o controlador FBL, foi testado também o caso das entradas
simultâneas 𝑠 e 𝑢^. Para esse caso, novamente, a única modificação em relação aos
parâmetros utilizados foram em 𝜃 = [0,8; 1; 0,15]. Os resultados para esse caso estão
contidos na Fig. 17.
Como é possível verificar pela Fig. 17a, o compensador com entrada 𝑠 e 𝑢^ melhorou
a performance do controlador FBL, conduzindo a uma notável melhora no rastreamento de
Capítulo 4. Controle de um atuador eletro-hidráulico: Implementação Numérica 53
Figura 17 – Resultados para simulação utilizando FBL e FBL com compensação GPR utilizando
entrada (𝑠, 𝑢
^) e 𝜃 = [0,8; 1; 0,15].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
^ + ...
(︁ )︁
𝑢 = ^𝑏−1 −𝑓^ − ℎ 𝑒 − 𝜆2 𝑒˙ − Ksat (𝑠/𝜑)
𝑥 𝑑 − 2𝜆¨ (4.11)
^ + ...
Os resultados para a simulação considerando a entrada 𝑢^ = ^𝑏−1 (−𝑓^ − ℎ 𝑥𝑑 −
2
𝑒 − 𝜆 𝑒)
2𝜆¨ ˙ e os hiper-parâmetros 𝜃 = [1; 1; 0,15] são mostrados na Fig. 18.
Figura 18 – Resultados para simulação utilizando SMC e SMC com compensação GPR utilizando
entrada 𝑢
^ e 𝜃 = [1; 1; 0,15].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
Agora considerando a entrada 𝑠, foi realizada uma nova simulação com os pa-
râmetros GP definidos como 𝜃 = [0,8; 1; 0,1]. Os resultados podem ser vistos na Fig.
19.
Como observado pela Fig. 19a, o rastreamento foi melhorado por conta da inclusão
do compensador. Assim como no caso do controlador por linearização por realimentação,
o controle ocorreu mais suavemente que o correspondente com entrada 𝑢^.
Por fim, para a entrada combinada (𝑠, 𝑢^) e parâmetros do GP 𝜃 = [0,8; 1; 0,15] os
resultados são mostrados na Fig. 20.
Capítulo 4. Controle de um atuador eletro-hidráulico: Implementação Numérica 55
Figura 19 – Resultados para simulação utilizando SMC e SMC com compensação GPR utilizando
entrada 𝑠 e 𝜃 = [0,8; 1; 0,1].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
Figura 20 – Resultados para simulação utilizando SMC e SMC com compensação GPR utilizando
entrada (𝑠, 𝑢
^) e 𝜃 = [0,8; 1; 0,15].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
∫︁ 𝑡𝑓 𝑖𝑚
𝑚4 = 𝑒2 𝑑𝑡 (4.12d)
0
∫︁ 𝑡𝑓 𝑖𝑚
𝑚5 = |𝑢|𝑑𝑡 (4.12e)
0
𝑛
1 ∑︁
𝑚6 = |𝑢˙ 𝑖 | (4.12f)
𝑛 𝑖=1
∫︁ 𝑡𝑓 𝑖𝑚
𝑚7 = 𝑡2 |𝑒|𝑑𝑡 (4.12g)
0
∙ Em todas as×10
simulações
2 foi considerado 𝜎𝑓 = 1;
3,0
1,50
2,5
1,25
|u|dt [Vs]
2,0
1,00 ×103
1,40 1,65 1,90 2,15 2,40
1,5
R
1,0
Sim. 1 Sim. 5a,b,c,d,e
f,g,h,i
Sim. 2 Sim. 6a,b,c,d,e
f,g,h,i
0,5 Sim. 3a,b,c,d,e Sim. 7a,b,c,d,e
f,g,h,i f,g,h,i
Sim. 4a,b,c,d,e Sim. 8a,b,c,d,e
f,g,h,i f,g,h,i
0,0 ×103
1,0 2,0 3,0
R 4,0 5,0 6,0
t |e|dt [m·s ]
2 3
Como observado pela Fig. 21, todas as simulações realizadas podem ser vistas
graficamente à esquerda das técnicas convencionais, caracterizando que em relação a esses
controladores, para as variações dos parâmetros do Processo Gaussiano e das entradas
do processo de regressão, os resultados obtidos conseguiram ser superiores. Além disso,
pode-se observar que, para pequenas variações nos parâmetros do compensador, houve
uma dispersão razoável dos rastreamentos e do esforço de controle. Pode-se também
concluir a partir desse gráfico que os resultados referentes à entrada 𝑠 para o controlador
FBL foram melhores em relação as demais entradas por eles ficarem bem concentrados
numa região de menor esforço de controle e menor erro de rastreamento. Em relação ao
controlador SMC, a princípio pode-se inferir que os resultados com entrada 𝑠 e (𝑠, 𝑢^) foram
melhores em aspectos distintos. Os resultados da Sim. 7 foram os que apresentaram a
menor métrica de esforço de controle em relação a todos os demais (incluindo o FBL)
enquanto os da Sim. 8 teve alguns resultados com o menor erro de rastreamento em relação
a todos os demais. Entretanto, ainda vê-se que os resultados com entrada combinada,
no geral, ficaram dispersos em relação aos demais, inclusive com alguns deles tendo os
maiores valores de 𝑚5 , enquanto os de entrada 𝑠 ficarem mais concentrados e conseguindo
ainda bons resultados (em comparação aos demais) com respeito a métrica 𝑚7 .
59
7 4
5 6 8
servo-válvula. Esta, por sua vez, é atuada através de solenoides que promovem o movimento
de seu carretel. O cilindro hidráulico possui um curso máximo de 20 cm e possui conexões
com a servo-válvula. O cartão de amplificação, responsável por transformar a tensão
fornecida na corrente necessária para o controle, recebe o sinal da placa de aquisição de
sinais. O potenciômetro linear, que recebe uma tensão máxima de 10 V do regulador
de tensão, envia o seu sinal para a placa ADVANTECH. Este por sua vez conectado ao
computador por uma conexão USB. Através de um código computacional implementado
em C++, a tensão obtida pela lei de controle é enviada para a placa de aquisição e dele
para o amplificador de sinal.
𝑥˙ 𝑓 = 𝛼0 𝑥 − 𝛼1 𝑥𝑓 (5.1)
Para avaliar o desempenho desse filtro foi feita uma simulação em C++. A função
a ser derivada foi 𝑥(𝑡) = 2(1 − cos(2𝜋𝑡/15)) + 𝜎, onde 𝜎 representa o ruído de média nula
e desvio-padrão de 0,4. A taxa de amostragem foi de 100 Hz com tempo de simulação
de 30 s. As constantes utilizadas foram 𝛼0 = 𝛼1 = 3,3. O Método de Runge-Kutta de 4a
ordem foi utilizado para reolver a Eq. 5.1. O resultado é mostrado na Fig. 23.
Pode-se observar que o filtro aplicado desempenha bem seu papel em relação a
redução do nível de ruído, entretanto produziu um leve atraso (delay) no sinal. Portanto,
o uso desse filtro deve ser bem moderado buscando sempre uma redução do ruído com o
menor atraso possível.
3,0
x, xf
2,0
1,0
0,0
0 5 10 15 20 25 30
t [s]
xd e u Planta x
Controlador Servo-válvula
eletro-hidráulica
xf
Filtro Potenciômetro
ẋf d
Filtro dt
ẍf d
dt
Figura 25 – Resultados para o experimento utilizando FBL e FBL com compensação GPR
utilizando entrada 𝑢
^ e 𝜃 = [1; 1; 0,15].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
O resultado obtido neste caso foi bem similar ao anterior. A inclusão do compen-
sador cumpriu seu objetivo de melhorar a performance do controlador, conforme pode ser
obervado pela Fig. 26a. Ocorreram curtos períodos de saturação no esforço de controle,
Fig 26b, e pequenas oscilações após o momento esse momento de pico no sinal de tensão
enviado, reflexo da saída do GP, Fig. 26c.
Já para a entrada combinada (𝑠, 𝑢^), cujos os resultados são mostrados na Fig. 27,
os parâmetros do GP utilizados foram 𝜃 = [0,8; 1; 0,1].
Figura 26 – Resultados para o experimento utilizando FBL e FBL com compensação GPR
utilizando entrada 𝑠 e 𝜃 = [0,8; 1; 0,05].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
No caso do controlador por Modos Deslizantes, cuja lei de controle é dada pela
Eq. 4.11 e o ganho pela Eq. 3.2, os parâmetros utilizados foram ^𝑏 = 1, 𝑓^ = 0 e 𝜆 = 5,
𝜂 =0,1, 𝜑 = 1 e 𝛿 = 6.
Como é possível observar pela Fig. 28a, a inclusão do compensador GPR melhorou
Capítulo 5. Controle de um atuador eletro-hidráulico: Implementação Experimental 64
Figura 27 – Resultados para o experimento utilizando FBL e FBL com compensação GPR
utilizando a entrada (𝑠, 𝑢
^) e 𝜃 = [0,8; 1; 0,1].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
Como pode ser visto pela Fig. 29a, a performance do controlador, em relação ao
rastreamento, foi melhorada graças a inclusão do compensador gaussiano. Pode-se notar
Capítulo 5. Controle de um atuador eletro-hidráulico: Implementação Experimental 65
Figura 28 – Resultados para o experimento utilizando SMC e SMC com compensação GPR
utilizando a entrada 𝑢
^ e 𝜃 = [1,2; 1; 0,1].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
Já para a entrada conjunta (𝑠, 𝑢^) foram considerados os parâmetros 𝜃 = [1,2; 1; 0,05].
Os resultados podem ser visualizados na Fig. 30.
Como pode ser visto na Fig. 30a e como já também foi observado nos experimen-
tos passados, a posição do atuador atingiu os estados desejados devido a influência do
compensador GPR no controlador. Entretanto, dos resultados obtidos até agora com o
SMC, o esforço de controle enviado durante o regime transitório foi o que aparentou ter
mais oscilações, como pode ser observado na Fig. 30b. Essas oscilações são reflexo da
saída do compensador mostrada na Fig. 30c.
Capítulo 5. Controle de um atuador eletro-hidráulico: Implementação Experimental 66
Figura 29 – Resultados para o experimento utilizando SMC e SMC com compensação GPR
utilizando a entrada 𝑠 e 𝜃 = [1,2; 1; 0,1].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
Figura 30 – Resultados para o experimento utilizando SMC e SMC com compensação GPR
utilizando a entrada (𝑠, 𝑢
^) e 𝜃 = [1,2; 1; 0,05].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
Os valores das métricas obtidas para cada experimento estão nas tabelas contidas
no Apêndice D. Para visualizar a diferença entre cada um dos experimentos realizados
foram plotadas as métricas 𝑚7 (eixo x) por 𝑚5 (eixo y). Foram consideradas essas duas
medidas por elas indicarem o quanto foi gasto em energia durante todo o experimento, no
caso de 𝑚5 , e o erro absoluto total ponderado pelo instante de tempo para realçar o efeito
do regime permanente sobre o transiente. Essa representação está mostrada na Fig. 31.
50
16
|u|dt [Vs]
40
12
30
R
8 ×102
20 1,8 2,2 2,6 3,0
10
0 ×102
1,0 2,0 3,0 4,0 R 5,0 6,0 7,0 8,0 9,0 10,0
t |e|dt [m·s ]
2 3
6 Considerações finais
Controle de sistemas dinâmicos não lineares têm se mostrado cada vez mais um
desafio de engenharia devido à alta complexidade dos processos envolvidos e, conquente-
mente, dos sistemas operados. Técnicas de controle linear vêm cada vez mais perdendo
espaço por conta de sua baixa performance em ocasiões fora de seu padrão de operação.
Técnicas robustas e capazes de estimar ou até prever a dinâmica não modelada de sistemas
com não linearidades de ordem elevada têm sido preferidas por elas expandirem o alcance
de operação.
Através das simulações e dos experiementos, pode-se fazer a seguinte síntese das
conclusões dos resultados observados:
Referências
ALTARE, G.; VACCA, A. A design solution for efficient and compact electro-hydraulic
actuators. Procedia Engineering, Elsevier, v. 106, p. 8–16, 2015. Citado na página 45.
ARAN, V.; UNEL, M. Gaussian process regression feedforward controller for diesel engine
airpath. International Journal of Automotive Technology, v. 19, n. 1, p. 635–642, 2018.
ISSN 01252208. Citado na página 20.
BAPIN, Y.; ZARIKAS, V. Smart Building’s Elevator with Intelligent Control Algorithm
based on Bayesian Networks. International Journal of Advanced Computer Science and
Applications, v. 10, n. 2, p. 16–24, 2019. ISSN 2158107X. Citado na página 19.
BESSA, W. M. Controle por modos deslizantes de sistemas dinâmicos com zona morta
aplicado ao posicionamento de ROV’s. Tese (Doutorado) — Universidade Federal do Rio
de Janeiro, 2005. Citado na página 48.
BESSA, W. M.; DUTRA, M. S.; KREUZER, E. Sliding mode control with adaptive fuzzy
dead-zone compensation of an electro-hydraulic servo-system. Journal of Intelligent and
Robotic Systems, Springer, v. 58, n. 1, p. 3–16, 2010b. Citado nas páginas 19, 45, 46 e 51.
BESSA, W. M. et al. Design and adaptive depth control of a micro diving agent. IEEE
Robotics and Automation Letters, IEEE, v. 2, n. 4, p. 1871–1877, 2017. Citado nas
páginas 18 e 19.
BONFIGLIO, A. et al. A Sliding Mode Control Approach for Gas Turbine Power
Generators. IEEE Transactions on Energy Conversion, IEEE, v. 34, n. 2, p. 921–932,
2019. ISSN 08858969. Citado na página 18.
CHEN, K.; YI, J.; LIU, T. Modeling and Control of Robotic Systems Modeling and
control of robotic systems. In: 13th IEEE Conference on Automation Science and
Engineering (CASE). Xi’an: [s.n.], 2017. p. 1118–1123. ISBN 9781509067817. Citado na
página 19.
CHU, D. et al. Smooth Sliding Mode Control for Vehicle Rollover Prevention Using Active
Antiroll Suspension. Mathematical Problems in Engineering, v. 2015, p. 1–8, 2015. ISSN
1024-123X. Citado na página 19.
DOERR, A. et al. Optimizing long-term predictions for model-based policy search. In:
Conference on Robot Learning. [S.l.: s.n.], 2017. p. 227–238. Citado na página 19.
Referências 73
DOERR, A. et al. Probabilistic Recurrent State-Space Models. In: Proceedings of the 35th
International Conference on Machine Learning. Stockholm: [s.n.], 2018. p. 1280–1289.
ISSN 0004-8666 1479-828X. Disponível em: <http://arxiv.org/abs/1801.10395>. Citado
nas páginas 20 e 36.
GUAN, C.; PAN, S. Adaptive sliding mode control of electro-hydraulic system with
nonlinear unknown parameters. Control Engineering Practice, Elsevier, v. 16, n. 11, p.
1275–1284, 2008. Citado na página 45.
GUO, Y. et al. Composite learning adaptive sliding mode control for AUV target tracking.
Neurocomputing, Elsevier B.V., v. 351, p. 180–186, 2019. ISSN 18728286. Disponível em:
<https://doi.org/10.1016/j.neucom.2019.03.033>. Citado na página 18.
HIGHAM, N. J. Accuracy and stability of numerical algorithms. [S.l.]: Siam, 2002. v. 80.
Citado na página 40.
JARDINE, P. T. et al. Adaptive predictive control of a differential drive robot tuned with
reinforcement learning. International Journal of Adaptive Control and Signal Processing,
v. 33, n. 2, p. 410–423, 2019. ISSN 10991115. Citado na página 19.
LANG, M.; HIRCHE, S. Computationally efficient rigid-body gaussian process for motion
dynamics. IEEE Robotics and Automation Letters, v. 2, n. 3, p. 1601–1608, 2017. Citado
na página 20.
LEE, J. Y.; YEON, J. S.; PARK, J. H. Robust nonlinear control for flexible joint robot
manipulators. In: IEEE. SICE, 2007 Annual Conference. [S.l.], 2007. p. 440–445. Citado
na página 18.
LIMA, E. L. Curso de análise, Volume 1. 11th. ed. [S.l.]: Projeto Euclides, IMPA, 2004.
Citado na página 49.
Referências 74
LIMA, G. S.; BESSA, W. M.; TRIMPE, S. Depth control of underwater robots using
sliding modes and gaussian process regression. In: IEEE LARS 2018 - 15th Latin
American Robotics Symposium. João Pessoa: IEEE, 2018. Citado nas páginas 31 e 44.
LIMA, G. S.; BESSA, W. M.; TRIMPE, S. Control ff Flexible Joint Manipulator with
Feedback Linearization and Compensation by Gaussian Process. In: Aceito para os Anais
do COBEM 2019. [S.l.: s.n.], 2019. Citado nas páginas 25 e 42.
SLOTINE, J.-J. E.; LI, W. Applied Nonlinear Control. 1. ed. Englewood Cliffs:
Prentice-Hall, Inc., 1991. ISBN 0130408905. Citado nas páginas 18, 27, 29 e 30.
Referências 75
SUN, H.; CHIU, G.-C. Nonlinear observer based force control of electro-hydraulic
actuators. In: IEEE. American Control Conference, 1999. Proceedings of the 1999. [S.l.],
1999. v. 2, p. 764–768. Citado na página 45.
UMLAUFT, J. et al. Feedback linearization using Gaussian processes. 2017 IEEE 56th
Annual Conference on Decision and Control, CDC 2017, v. 2018-Janua, n. Cdc, p.
5249–5255, 2018. Citado na página 20.
XIWEI, P.; FEI, L.; WEI, M. Modelling the electro-hydraulic position servo system based
on disturbance observer. Proceedings - 2017 32nd Youth Academic Annual Conference
of Chinese Association of Automation, YAC 2017, IEEE, p. 687–692, 2017. Citado na
página 47.
YANG, Y.; HUANG, D.; DONG, X. Robust repetitive learning control of lower limb
exoskeleton with hybrid electro-hydraulic system. In: IEEE. 2018 IEEE 7th Data Driven
Control and Learning Systems Conference (DDCLS). [S.l.], 2018. p. 718–723. Citado na
página 45.
YIM, J.; KIM, S.; CHOI, Y. Adaptive torque control of hydraulic actuators based on
dynamic compensation. In: IEEE. Ubiquitous Robots and Ambient Intelligence (URAI),
2014 11th International Conference on. [S.l.], 2014. p. 448–451. Citado na página 45.
Apêndices
77
APÊNDICE A – Região de
convergência dentro da camada limite
Agora considere 𝑛 = 3:
(︁ )︁ )︃2
𝑑2 𝑒𝜆𝑡 𝑥˜
(︃
𝑑
= 𝑒 (𝑥¨˜ + 2𝜆𝑥˜˙ + 𝜆 𝑥˜) = 𝑒
𝜆𝑡 2 𝜆𝑡
+𝜆 𝑥˜ (A.3)
𝑑𝑡2 𝑑𝑡
Pode-se constatar pelas Eqs. A.2 e A.3 que o lado direito poderia ser obtido
utilizando a Eq. 2.8. Portanto, por indução, é possível mostrar que a Eq. A.1 é verdadeira.
−𝜑 ≤ 𝑠(𝑥, 𝑡) ≤ 𝜑 (A.4)
⎛ (︁ )︁ ⎞ ⎛ (︁ )︁ ⎞ ⃒
𝑛−2
−𝜑 𝜆𝑡 𝜑 ⎝ 𝑑 𝑒𝜆𝑡 𝑥˜ 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒⃒ 𝜑 𝜆𝑡 𝜑
𝑒 + ≤ ⎠−⎝ ⎠⃒ ≤ 𝑒 −
𝜆 𝜆 𝑑𝑡𝑛−2 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
𝜆 𝜆
⎛ (︁ )︁ ⎞ ⃒ ⎛ (︁ )︁ ⎞ ⎛ (︁ )︁ ⎞ ⃒
𝜑 𝜑 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒⃒ 𝑑𝑛−2 𝑒𝜆𝑡 𝑥˜ 𝜑 𝜑 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒⃒
− 𝑒𝜆𝑡 + +⎝ ⎠⃒ ≤ ⎝ ⎠ ≤ 𝑒𝜆𝑡 − +⎝ ⎠⃒ (A.6)
𝜆 𝜆 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
𝑑𝑡𝑛−2 𝜆 𝜆 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
⎛ (︁
)︁ ⎞ ⃒ ⎛ (︁ )︁ ⎞ ⃒
𝜑 ⎝ 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒ 𝜑 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒
Chamando 𝑘1 = + ⎠ ⃒⃒ e 𝑘1′ = − + ⎝ ⎠ ⃒⃒ , a Eq. A.6 fica
𝜆 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
𝜆 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
da seguinte forma:
(︁ )︁
𝜑 𝑑𝑛−2 𝑒𝜆𝑡 𝑥˜ 𝜑 𝜆𝑡
− 𝑒𝜆𝑡 + 𝑘1 ≤ ≤ 𝑒 + 𝑘1′ (A.7)
𝜆 𝑑𝑡𝑛−2 𝜆
⎛ (︁ )︁ ⎞ ⎛ (︁ )︁ ⎞ ⃒
𝜑 𝜆𝑡 𝜑 𝑑𝑛−3 𝑒𝜆𝑡 𝑥˜ 𝑑𝑛−3 𝑒𝜆𝜏 𝑥˜ ⃒ 𝜑 𝜆𝑡 𝜑
− 𝑒 + 2 + 𝑘1 𝑡 ≤ ⎝ ⎠−⎝ ⎠ ⃒⃒ ≤ 𝑒 − 2 + 𝑘1′ 𝑡 (A.8)
𝜆 2 𝜆 𝑑𝑡𝑛−3 𝑑𝜏 𝑛−3 ⃒
𝜏 =0
𝜆2 𝜆
⎛ (︁ )︁ ⎞ ⃒ ⎛ (︁ )︁ ⎞ ⃒
𝜑 𝑑𝑛−3 𝑒𝜆𝜏 𝑥˜ ⃒⃒ 𝜑 𝑑𝑛−3 𝑒𝜆𝜏 𝑥˜ ⃒⃒
′ ′
onde 𝑘2 = 2 + 𝑘1 𝑡 + ⎝ ⎠⃒ e 𝑘2 = − + 𝑘1 𝑡 + ⎝ ⎠⃒ .
𝜆 𝑑𝜏 𝑛−3 ⃒
𝜏 =0
𝜆2 𝑑𝜏 𝑛−3 ⃒
𝜏 =0
O mesmo procedimento pode ser repetido mais 𝑛 − 3 vezes até ser reduzida a
seguinte expressão:
𝜑 𝜑 ′
− 𝑛−1
𝑒𝜆𝑡 + 𝑘𝑛−1 ≤ 𝑒𝜆𝑡 𝑥˜ ≤ 𝑒𝜆𝑡 + 𝑘𝑛−1 (A.10)
𝜆 𝜆𝑛−1
onde,
⎛ (︁
)︁ ⎞ ⃒
𝜑 𝑑𝑛−𝑖−1 𝑒𝜆𝜏 𝑥˜ ⃒
𝑘𝑖 = + 𝑘𝑖−1 𝑡 + ⎝ ⎠ ⃒⃒ (A.11)
𝜆𝑖 𝑑𝜏 𝑛−𝑖−1 ⃒
𝜏 =0
APÊNDICE A. Região de convergência dentro da camada limite 79
e,
⎛ (︁
)︁ ⎞ ⃒
𝜑 𝑑𝑛−𝑖−1 𝑒𝜆𝜏 𝑥˜ ⃒
𝑘𝑖′ = − + 𝑘𝑖−1 𝑡 + ⎝ ⎠ ⃒⃒ (A.12)
𝜆𝑖 𝑑𝜏 𝑛−𝑖−1 ⃒
𝜏 =0
𝜑 𝜑
− ≤ 𝑥˜ ≤ (A.13)
𝜆𝑛−1 𝜆𝑛−1
𝜑 𝜑 ′
− 𝑥 + 𝑥˜˙ ) ≤
𝑒𝜆𝑡 + 𝑘𝑛−2 ≤ 𝑒𝜆𝑡 (𝜆˜ 𝑒𝜆𝑡 + 𝑘𝑛−2
𝜆𝑛−2 𝜆𝑛−2
𝜑 𝜑
− + 𝑒−𝜆𝑡 𝑘𝑛−2 − 𝜆˜
𝑥 ≤ 𝑥˜˙ ≤ + 𝑒−𝜆𝑡 𝑘𝑛−2
′
− 𝜆˜
𝑥 (A.15)
𝜆𝑛−2 𝜆𝑛−2
−2𝜑 2𝜑
𝑛−2
≤ 𝑥˜˙ ≤ 𝑛−2 (A.16)
𝜆 𝜆
𝜑 𝜑 ′
− 𝑒𝜆𝑡 + 𝑘𝑛−3 ≤ 𝑒𝜆𝑡 (𝜆2 𝑥˜ + 2𝜆𝑥˜˙ + 𝑥¨˜) ≤ 𝑒𝜆𝑡 + 𝑘𝑛−3
𝜆𝑛−3 𝜆𝑛−3
APÊNDICE A. Região de convergência dentro da camada limite 80
𝜑 𝜑
− + 𝑒−𝜆𝑡 𝑘𝑛−3 − 𝜆2 𝑥˜ − 2𝜆𝑥˜˙ ≤ 𝑥¨˜ ≤ + 𝑒−𝜆𝑡 𝑘𝑛−3
′
− 𝜆2 𝑥˜ − 2𝜆𝑥˜˙ (A.18)
𝜆𝑛−3 𝜆𝑛−3
−6𝜑 6𝜑
𝑛−3
≤ 𝑥¨˜ ≤ 𝑛−3 (A.19)
𝜆 𝜆
(𝑗 + 1)!
𝑥(𝑗) | ≤
|˜ 𝜑 (A.20)
𝜆𝑛−𝑗−1
APÊNDICE B – Região de
convergência para Linearização por
Realimentação
1
𝑉 (𝑡) = 𝑠2 (B.1)
2
...
𝑉˙ (𝑡) = 𝑠𝑠˙ = 𝑠(𝑓^ + ^𝑏𝑢 + ℎ − 𝑥 𝑑 + 2𝜆¨
𝑒 + 𝜆2 𝑒)
˙ (B.2)
^ − 𝜆𝑠)
𝑉˙ (𝑡) = 𝑠(ℎ − ℎ (B.3)
^ ≤ 𝜖, então
Considerando que |ℎ − ℎ|
𝜖 𝜖
− ≤𝑠≤ (B.5)
𝜆 𝜆
chega-se em uma expressão bastante similar à Eq. A.4. Logo, repetindo-se o mesmo
procedimento presente no Apêndice A, pode-se chegar na seguinte lei de recorrência:
(𝑗 + 1)!
|𝑒(𝑗) | ≤ 𝜖 (B.6)
𝜆𝑛−𝑗
Tabela 4 – Métricas para comparação usando controlador FBL+GPR com entrada (𝑠, 𝑢
^).
Tabela 7 – Métricas para comparação usando controlador SMC+GPR com entrada (𝑠, 𝑢
^).
Tabela 11 – Métricas para comparação usando controlador FBL+GPR com entrada (𝑠, 𝑢
^).
Tabela 14 – Métricas para comparação usando controlador SMC+GPR com entrada (𝑠, 𝑢
^).