Controlesistemasdinâmicos Lima 2019

Universidade Federal do Rio Grande do Norte
Centro de Tecnologia
Programa de Pós-Graduação em Engenharia Mecânica
Controle de Sistemas Dinâmicos Não

Lineares com Compensação por Processo
Gaussiano
Gabriel da Silva Lima

Natal - RN, 2019
Universidade Federal do Rio Grande do Norte
Centro de Tecnologia
Programa de Pós-Graduação em Engenharia Mecânica
Controle de Sistemas Dinâmicos Não

Lineares com Compensação por Processo
Gaussiano
Gabriel da Silva Lima
Dissertação de Mestrado apresentada

ao Programa de Pós-Graduação em
Engenharia Mecânica (PPGEM) da
Universidade Federal do Rio Grande
do Norte como parte dos requisitos
para a obtenção do título de Mestre
em Engenharia Mecânica, orien-
tado pelo Prof. D.Sc. Wallace Mo-
reira Bessa.
Natal - RN
2019
Universidade Federal do Rio Grande do Norte - UFRN
Sistema de Bibliotecas - SISBI
Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede
Lima, Gabriel da Silva.

Controle de sistemas dinâmicos não lineares com compensação
por Processo Gaussiano / Gabriel da Silva Lima. - 621, 2019.
88f.: il.
Dissertação (Mestrado)-Universidade Federal do Rio Grande do

Norte, Centro de Tecnologia, Programa de Pós-Graduação em
Engenharia Mecânica, Natal, 2019.
Orientador: D.Sc. Wallace Moreira Bessa.
1. Controle Não Linear - Dissertação. 2. Compensador

Estocástico - Dissertação. 3. Regressão por Processo Gaussiano -
Dissertação. 4. Linearização por Realimentação - Dissertação. 5.
Modos Deslizantes - Dissertação. I. Bessa, Wallace Moreira. II.
Título.
RN/UF/BCZM CDU 621
Elaborado por Raimundo Muniz de Oliveira - CRB-15/429

Aos meus pais Ivete Vitoriano e José Siqueira (Filho), à minha irmã Gabriela Lima, à
minha tia Neuma Silveira e aos meus avós (in memorian) Neuza Maria e José Siqueira.
Agradecimentos
Ao Prof. D.Sc. Wallace Moreira Bessa, pela confiança depositada, pelos ensi-
namentos passados e, além das inúmeras outras contribuições, pela amizade (líder do
RoboTeAM ).
Ao Prof. D.Sc. João Deodato Batista dos Santos, pelas mais diversas contribuições,
ensinamentos passados e pela amizade (membro RoboTeAM ).
Ao D.Sc. Sebastian Trimpe, do Instituto Max-Planck para Sistemas Inteligentes

(Stuttgart, Alemanha), por suas contribuições.
Ao amigo e Eng. B.Sc. Gabriel de Albuquerque Barbosa Baumann, pela revisão

deste texto, pelas diversas sugestões e conselhos, por todo o apoio, pela motivação constante
e tantas outras contribuições (membro RoboTeAM ).
Aos amigos e membros do Grupo de Estudos em Robótica e Aprendizado de

Máquina (RoboTeAM ) por todo o apoio irrestrito e constante motivação. Cito, em ordem
alfabética: B.Sc. Aissa Cavalcante, Eng. B.Sc. Diago Xavier, Eng. B.Sc. Fernando
Fernandes, Eng. B.Sc. João Lucas (Jota), B.Sc. Lucas Solano, Prof. M.Sc. Philippe
Medeiros, B.Sc. Samuel Amico, Eng. B.Sc. Victor Ramon, Eng. Vítor Vala.
Ao Prof. D.Sc. Adilson José de Oliveira, pelas mais diversas contribuições.
Aos amigos e membros do Laboratório de Manufatura por todo o apoio, que cito
em ordem alfabética: Enga . Dávila, B.Sc. Diego Porto, B.Sc. Jonas, Enga . M.Sc. Kaciê
Trindade, Eng. M.Sc. Marcos Vinícius, Enga . B.Sc. Maria Augusta.
Ao Prof. D.Sc. Gabriel Ivan Medina Tapia, por todo o apoio.
Aos amigos Eng. B.Sc. Daniel Vitorino, Eng. B.Sc. Ewerton Cordeiro, Eng. B.Sc.
Felipe Maia, Eng. M.Sc. José Lopes, Eng. B.Sc. Matheus Protásio e Eng. M.Sc. Nícolas
Araújo por todo o apoio.
Aos Mecânicos Lamentáveis por todo o apoio e constante motivação. Cito, em

ordem alfabética: Eng. M.Sc. Adeilson, Eng. M.Sc. Antônio Adalberto, Eng. B.Sc. Felipe
Trigueiro, Eng. B.Sc. Gabriel Bernardino, Eng. B.Sc. Gabriel Dantas, Eng. B.Sc. Ivson,
Eng. B.Sc. Jonatha, B.Sc. Jonatas, Eng. M.Sc. Matheus Emmanuel, Eng. B.Sc. Pedro
Fragoso, Eng. B.Sc. Pedro Vitor, Eng. B.Sc. Vinícius.
Aos amigos Ellian, Leanderson, Luis Felipe e Micael Jordan pela motivação
constante.
Aos primos(as) João Esdras, Louise Melo, Tatianny e Thalis, a toda minha família,
em especial, Lousange, Miguel, Miriam, Pascoal, Bibia e Elidney pelo imenso apoio e por
terem me acompanhado até aqui.
A Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES),

ao Laboratório de Manufatura (LabMan-UFRN) e ao Programa de Pós-Graduação em
Engenharia Mecânica (PPGEM-UFRN) por todo o suporte.
(...) a vida está cheia de possibilidades.
Tyrion Lannister.
Lima, G. S. Controle de Sistemas Dinâmicos Não Lineares com Compensação
por Processo Gaussiano. 2019. 87 p. Dissertação de Mestrado (Programa de Pós-
Graduação em Engenharia Mecânica) - Universidade Federal do Rio Grande do Norte,
Natal-RN, 2019.
Resumo
Em projetos de controladores, diversas são as técnicas possíveis de serem empregadas.

Controladores lineares, da família PID - Proporcional-Integral-Derivativo, por exemplo,
são largamente utilizados na indústria, mas possuem como desvantagem problemas de
instabilidade se o sistema passar a operar distante de suas condições padrões ou se houver
influências externas não previstas. Já em relação aos controladores baseados em modelos,
a grande dificuldade está em determinar de forma razoável não apenas a dinâmica do
sistema, mas também os valores dos seus parâmetros. Nesse trabalho é apresentado um
compensador de natureza estocástica para estimar não só as incertezas associadas aos
parâmetros do sistema a ser controlado como também a dinâmica não modelada. Esse
compensador baseia-se na Regressão por Processo Gaussiano (GPR). Para isso, antes
mesmo do compensador, as técnicas de Linearização por Realimentação e Controle por
Modos Deslizantes, aplicadas a sistemas não lineares, são apresentadas. Logo em seguida,
é discutida como a técnica de GPR pode ser combinada com os controladores mencionados.
Depois, os controladores desenvolvidos são aplicados ao problema de controle de um atuador
eletro-hidráulico (AEH) através de simulação e de experimentos. São testadas também
mudanças nos parâmetros do compensador a fim de avaliar seus efeitos sobre o controle
do sistema. Diversas métricas são utilizadas para fins de comparação. Em todos os casos
avaliados, constata-se que a compensação obtida pela GPR dentro dos controladores não
linares testados consiste em uma técnica capaz de melhorar o rastreamento de trajetória
sem mudanças significativas no esforço de controle.
Palavras-chave: Controle Não Linear, Compensador Estocástico, Regressão por Processo

Gaussiano, Linearização por Realimentação, Modos Deslizantes.
Lima, G. S. Control of Nonlinear Dynamic Systems with Gaussian Process
Compensation. 2019. 87 p. Master’s Thesis in Mechanical Engineering - Federal
University of Rio Grande do Norte, Natal-RN, 2019.
Abstract
There are many techniques that may be employed in the design of control systems. PID
controllers, for example, are widely used in the industry, but have some disadvantages,
including instability issues when the system does not operate under design conditions.
Regarding the model-based controllers, the great difficulty is to determine the dynamics
of the system and the values of its parameters. In this work, a stochastic compensator is
proposed to estimate not only parametric uncertainties, but also the unmodeled dynamics.
The compensation scheme is based on Gaussian Process Regression (GPR) and embedded
within the control law to enhance tracking performance. On this basis, Feedback Lin-
earization and Sliding Modes are used to develop control laws that accommodate the GPR
based compensator. The resulting controllers are applied to an electro-hydraulic actuator
(EHA) and evaluated by means of both simulation and experiment procedures. Changes
in compensator parameters are also tested in order to assess their effects on controllers’
efficacy. Performance metrics are used for comparison purposes. It can be observed, in
all evaluated cases, that the proposed compensation scheme, when combined with the
adopted nonlinear controllers, are able of improve trajectory tracking without increasing
the overall control effort.
Keywords: nonlinear control, stochastic compensator, Gaussian Process Regression, Feed-

back Linearization, Sliding Mode Control.
Lista de ilustrações
Figura 1 – Diagrama de blocos - sistema em malha aberta. . . . . . . . . . . . . . 22

Figura 2 – Diagrama de blocos - sistema em malha fechada. . . . . . . . . . . . . 23
Figura 3 – Plano de fase para o problema de rastreamento de trajetória de um
manipulador de junta flexível utilizando FBL. . . . . . . . . . . . . . . 25
Figura 4 – Plano de fase do erro para um sistema de 2a ordem. . . . . . . . . . . . 27
ROV utilizando SMC. . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Figura 6 – Regressão por GP para 𝜃 = [0,1, 1, 1]⊤ . . . . . . . . . . . . . . . . . . 38
Figura 7 – Regressão por GP para 𝜃 = [0,1, 1, 0,2]⊤ . . . . . . . . . . . . . . . . . . 38
Figura 8 – Regressão por GP para 𝛾 = 5. . . . . . . . . . . . . . . . . . . . . . . . 39
manipulador de junta flexível utilizando FBL+GPR. . . . . . . . . . . 42
ROV utilizando SMC+GPR. . . . . . . . . . . . . . . . . . . . . . . . 44
Figura 11 – Representação esquemática do atuador eletro-hidráulico. . . . . . . . . 46
Figura 12 – Zona Morta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Figura 13 – Modelo de atrito de Stribeck. . . . . . . . . . . . . . . . . . . . . . . . 48
Figura 14 – Resultados para simulação do 2-SMD. . . . . . . . . . . . . . . . . . . 50
Figura 15 – Resultados para simulação utilizando FBL e FBL com compensação
GPR utilizando entrada 𝑢^ e 𝜃 = [1; 1; 0,15]. . . . . . . . . . . . . . . . 51
GPR utilizando entrada 𝑠 e 𝜃 = [0,8; 1; 0,1]. . . . . . . . . . . . . . . . 52
GPR utilizando entrada (𝑠, 𝑢^) e 𝜃 = [0,8; 1; 0,15]. . . . . . . . . . . . . 53
Figura 18 – Resultados para simulação utilizando SMC e SMC com compensação
GPR utilizando entrada (𝑠, 𝑢^) e 𝜃 = [0,8; 1; 0,15]. . . . . . . . . . . . . 56
Figura 21 – Representação gráfica das métricas 𝑚7 e 𝑚5 para as simulações. . . . . 57
Figura 22 – Bancada experimental. . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Figura 23 – Resultados para simulação de um filtro passa-baixa. . . . . . . . . . . . 61
Figura 24 – Diagrama de blocos simplificado do procedimento experimental. . . . . 61
Figura 25 – Resultados para o experimento utilizando FBL e FBL com compensação
GPR utilizando a entrada (𝑠, 𝑢^) e 𝜃 = [0,8; 1; 0,1]. . . . . . . . . . . . . 64
Figura 28 – Resultados para o experimento utilizando SMC e SMC com compensação
GPR utilizando a entrada 𝑢^ e 𝜃 = [1,2; 1; 0,1]. . . . . . . . . . . . . . . 65
GPR utilizando a entrada 𝑠 e 𝜃 = [1,2; 1; 0,1]. . . . . . . . . . . . . . . 66
GPR utilizando a entrada (𝑠, 𝑢^) e 𝜃 = [1,2; 1; 0,05]. . . . . . . . . . . . 67
Figura 31 – Representação gráfica das métricas 𝑚7 e 𝑚5 para os experimentos. . . . 68
Lista de símbolos
𝑎 coeficiente do polinômio de Hurwitz
𝐴𝑝 área da seção transversal do cilindro
𝑏 ganho do sinal de controle
𝐵 coeficiente de amortecimento viscoso
^𝑏 ganho aproximado do sinal de controle
C vetor de coeficientes do polinômio de Hurwitz
C̄ vetor modificado de coeficientes do polinômio de Hurwitz
𝐶𝑡𝑝 coeficiente de vazamento do fluido
𝐶𝑑 coeficiente de descarga
C parâmetro do derivador
𝑑 zona morta
D conjunto de treinamento
𝑒 erro de rastreamento
𝑒 vetor formado pelo erro de rastreamento e suas derivadas
E operador de esperança matemática
𝑓 dinâmica do sistema
𝑓^ dinâmica aproximada do sistema
𝐹𝑛 força normal dentre superfícies
𝐹𝑠 força de atrito estático
𝐹𝑓 força de atrito
𝑔 função arbitrária
GP processo gaussiano
ℎ perturbação do sistema
^
ℎ perturbação estimada do sistema
𝑘 kernel da distribuição
𝑘𝑣 proporcionalidade entre tensão e deslocamento efetivo de válvula
𝑘𝑙 proporcionalidade inferior entre tensão e deslocamento efetivo de válvula
𝑘𝑟 proporcionalidade superior entre tensão e deslocamento efetivo de vál-

vula
K ganho do controlador SMC
L espaço de Lebesgue
𝐾 constante de mola
𝐾 matriz de covariância
𝑚 métrica de desempenho
𝑀 massa do carregamento
𝑁 tamanho do conjunto de treinamento
N distribuição normal
𝑝 ordem da matriz de covariância
𝑃𝑠 pressão de alimentação
𝑃𝑞 queda de pressão no cilindro
P parâmetro do derivador
𝑠 distância até a superfície de deslizamento
𝑠𝜑 distância até a camada limite
𝑢 sinal de controle
𝑢^ sinal de controle equivalente
𝑣𝑠 coeficiente de Stribeck
𝑉 função candidata de Lyapunov
𝑉𝜑 função candidata de Lyapunov modificada
𝑉𝑐 volume do câmara do cilindro

V variância
𝑤 vetor de pesos
𝑥 estado do sistema
𝑥 vetor de estados do sistema
𝑥𝑑 estado desejado
𝑥𝑑 vetor de estados desejados
𝑥¯𝑠𝑝 deslocamento efetivo da válvula
𝑋 vetor com entradas do processo gaussiano
𝑦 função de saída
𝑦 vetor com saídas do processo gaussiano
𝑡 tempo
𝑡𝑎𝑙𝑐 tempo de alcance
𝛼 parâmetro do filtro
𝛽𝑒 fator de compressibilidade do fluido
𝛿 limitante da perturbação do sistema
𝛿𝑙 zona morta inferior
𝛿𝑟 zona morta superior
Δ𝑓 incerteza da dinâmica do sistema
Δ𝑏 incerteza do ganho do sinal de controle
𝜂 parâmetro da condição de deslizamento
𝜖 erro de aproximação
𝜀 ruído gaussiano
𝛾 hiper-parâmetro do processo gaussiano
𝜆 parâmetro de convergência do controlador
𝜇 média a priori
𝜇𝑐 coeficiente de atrito de Coulomb

𝜔 gradiente de área do orifício da válvula
𝜎𝑛 desvio-padrão do ruído gaussiano
𝜎𝑓 hiper-parâmetro do processo gaussiano
Σ𝑝 matriz de covariância dos pesos
𝜌 massa específica do fluido
𝜑 espessura da camada limite
𝜙 função arbitrária
𝜓 vetor de função de alta dimensão
Ψ matriz de função de alta dimensão
𝜃 vetor de hiper-parâmetros
𝜉 observador de estado
Sumário
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1 Organização do trabalho . . . . . . . . . . . . . . . . . . . . . . . . 20
2 ESTRATÉGIAS DE CONTROLE PARA SISTEMAS NÃO LI-

NEARES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1 Linearização por Realimentação . . . . . . . . . . . . . . . . . . . . 23
2.2 Controle por Modos Deslizantes . . . . . . . . . . . . . . . . . . . . 26
3 REGRESSÃO POR PROCESSO GAUSSIANO . . . . . . . . . 32

3.1 Modelo linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Modelos de alta dimensão . . . . . . . . . . . . . . . . . . . . . . . 35
3.3 Espaço de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Considerações de Ordem Computacional . . . . . . . . . . . . . . 40
3.5 Controle de Sistemas Dinâmicos e Regressão por Processo
Gaussiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.5.1 Linearização por Realimentação e GPR . . . . . . . . . . . . . . . . . 40
3.5.2 Controle por Modos Deslizantes e GPR . . . . . . . . . . . . . . . . . 42
4 CONTROLE DE UM ATUADOR ELETRO-HIDRÁULICO:

IMPLEMENTAÇÃO NUMÉRICA . . . . . . . . . . . . . . . . 45
4.1 Modelo do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2 Derivador por Modos Deslizantes . . . . . . . . . . . . . . . . . . . 48
4.3 Controle utilizando FBL+GPR . . . . . . . . . . . . . . . . . . . . 50
4.4 Controle utilizando SMC+GPR . . . . . . . . . . . . . . . . . . . . 53
4.5 Análise comparativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5 CONTROLE DE UM ATUADOR ELETRO-HIDRÁULICO:

IMPLEMENTAÇÃO EXPERIMENTAL . . . . . . . . . . . . . 59
5.1 Descrição da bancada . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.2 Filtro passa-baixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.3 Controle utilizando FBL+GPR . . . . . . . . . . . . . . . . . . . . 61
5.4 Controle utilizando SMC+GPR . . . . . . . . . . . . . . . . . . . . 63
5.5 Análise Comparativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . 69
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
APÊNDICES 76
APÊNDICE A – REGIÃO DE CONVERGÊNCIA DENTRO

DA CAMADA LIMITE . . . . . . . . . . . . 77
APÊNDICE B – REGIÃO DE CONVERGÊNCIA PARA LI-

NEARIZAÇÃO POR REALIMENTAÇÃO . 81
APÊNDICE C – MÉTRICAS DAS SIMULAÇÕES . . . . . . 82
APÊNDICE D – MÉTRICAS DOS EXPERIMENTOS . . . . 85

18
1 Introdução
Desde a manipulação da temperatura de um ambiente refrigerado até operações

complexas de fabricação em um centro de usinagem, controle tem sido a chave para que
diversos processos operassem de forma esperada. Além disso, os sistemas físicos reais a
serem controlados não são lineares. Sejam o atrito, arrasto, efeitos aerodinâmicos, zona
morta, saturação e até aspectos constitutivos, como elasticidade, todos esses fenômenos
são não lineares e presentes nos sistemas dinâmicos em maior ou menor grau. Logo, os
controladores lineares passam a ser ineficientes se os sistemas operarem ou estiverem
sujeitos a condições fora do seu padrão de operação (FARREL; POLYCARPOU, 2006, pp.
3).
Yazdanpanah, Khorasani e Patel (1998), Boukhezzar e Siguerdidjane (2010) e

Krauze e Kasprzyk (2016) apontam melhorias significativas ao substituírem um controlador
linear por um não linear. Desde manipuladores robóticos de juntas flexíveis (LEE; YEON;
PARK, 2007) até veículos subaquáticos autônomos (GUO et al., 2019), as aplicações de
controladores não lineares têm-se expandido cada vez mais ao longo dos anos.
Dentre as técnicas de controle não linear, destacam-se a técnica de Linearização

por Realimentação e o Controle por Modos Deslizantes. O primeiro além de se destacar
por sua simplicidade, possui aplicações relevantes tais como utilizadas por Bessa et al.
(2017) e Montoya-Cháirez, Santibáñez e Moreno-Valenzuela (2019). Já o controle por
Modos Deslizantes tem como vantagem ser uma técnica de controle robusta, ou seja, capaz
de operar dentro de um certo limite de incerteza (SLOTINE; LI, 1991, pp. 277), e tem
sido aplicado para diversas finalidades (BONFIGLIO et al., 2019; CORTAJARENA et al.,
2019; ALIPOUR; ROBAT; TARVIRDIZADEH, 2019).
Entretanto, o controle não linear convencional ainda é insuficiente para lidar com
problemas com elevado grau de incertezas. No caso do controlador por linearização por
realimentação, as dificuldades atreladas a essa técnica estão em obter um modelo preciso
do sistema a ser controlado(TANAKA; FERNANDES; BESSA, 2013). No controlador por
Modos Deslizantes, essa dificuldade é contornada pelo uso de um termo de descontinuidade
capaz de compensar as incertezas do sistema (SLOTINE; LI, 1991, pp. 288). Entretanto,
o uso desse termo em uma abordagem convencional provoca o indesejável efeito de
chaveamento da lei de controle (chattering) no controlador. Slotine e Li (1991) sugerem
então o uso de funções que suavizem esse efeito. Nesse caso, o rastreamento perfeito é
substituido pelo rastreamento com certo grau de precisão e o uso dessas funções tem sido
bem útil conforme mostrado por Bessa, Dutra e Kreuzer (2008), Bessa, Dutra e Kreuzer
Capítulo 1. Introdução 19
(2010b), Chu et al. (2015) e Tran, Truong e Ahn (2019).
Termos adicionais têm sido acrescentados as leis de controle acima citadas para
compensar as incertezas dinâmicas e paramétricas associadas aos modelos do sistema e,
assim, deixar o controlador estável e também minimizar o erro de regime. Tais compensa-
dores têm sido aplicados no contexto direcionado a controladores inteligentes. Segundo
Bessa et al. (2018), um controlador pode ser dito inteligente se ele for capaz de prever as
incertezas do sistema com base em um conhecimento a priori, de se adaptar às mudanças
do sistema e do ambiente, de aprender com base em experiências passadas ao mesmo
tempo que adquire conhecimento através da interação com o seu meio e de ser robusto
face às perturbações externas e que permita operar sob condições seguras.
Em se tratando de controle inteligente, a área de Aprendizado de Máquina

(Machine Learning) tem muitas contribuições a dar por conta de sua variedade de algoritmos
baseados em processos de tomada de decisão de acordo com as informações prévias que se
tem do sistema, capacidade de realizar inferências e possibilidade de atribuir recompensas
de acordo com a resposta obtida do sistema. Seguindo por esse caminho, muitos autores
têm realizado pesquisas no tocante à utilização dos algoritmos de Aprendizado de Máquina
no controle de certos sistemas: Chen, Yi e Liu (2017), Brinkmann et al. (2018), Bapin
e Zarikas (2019), Sangiovanni et al. (2019), Cui et al. (2019) e Jardine et al. (2019).
Entretanto, o uso de algoritmos puros de Aprendizagem de Máquina para controle não
garantem necessariamente a estabilidade do sistema. Por isso, técnicas como a Lógica Fuzzy
(BESSA; DUTRA; KREUZER, 2010a; BESSA; DUTRA; KREUZER, 2010b; BESSA;
DUTRA; KREUZER, 2013; BESSA et al., 2017) e as Redes Neurais Artificiais (SANTOS;
BESSA, 2018; BESSA et al., 2018) têm sido utilizadas na forma de compensadores
colocadas dentro de leis de controle já consolidadas (Linearização por Realimentação e
Modos Deslizantes, por exemplo), onde a Teoria da Estabilidade de Lyapunov tem sido
útil até em estabelecer uma forma de atualização dos pesos que garantam a estabilidade
do sistema.
Nesse trabalho, um novo tipo de compensador, baseado em algoritmo de Aprendi-

zado de Máquina com aprendizagem supervisionada, é apresentado dentro de controladores
não lineares do tipo Linearização por Realimentação e Modos Deslizantes. Esse compen-
sador vem do Processo Gaussiano (GP, do inglês Gaussian Process), este por sua vez
originário da lógica de inferência bayesiana. O compensador GP surge dentro do contexto
do problema de regressão (GPR, do inglês Guassian Process Regression) de funções, no
caso da dinâmica desconhecida do sistema e das perturbações externas.
O GP tem sido aplicado nas mais diversas situações. Por exemplo, dentro de
Aprendizado de Máquina, Doerr et al. (2017) tem utilizado GP para aprender a dinâmica
do sistema aplicando-o ao problema de aperfeiçoamento de robustez de um modelo baseado

em aprendizagem por reforço. Xiloyannis et al. (2017) também têm usado GP para
substituir a relação entre atividade muscular e movimento pretendido de uma mão por
uma abordagem que leva em conta movimentos prévios e ação muscular instântanea da
mão para prever movimentos futuros. Já GPR tem sido aplicado para modelar a dinâmica
de corpo rígido utilizando como dados de entrada os ângulos de Euler (LANG; HIRCHE,
2017). Doerr et al. (2018) mostram como a GPR pode ser adotada como um modelo
não-paramétrico para estimar as incertezas da planta. Pode-se citar também o uso do GP
como ferramenta de monitoramento da integridade de aerogeradores (PANDIT; INFIELD,
2018). Em controle, a GPR tem sido utilizada com controle PID para manipuladores
robóticos (BECKERS; UMLAUFT; HIRCHE, 2017), Umlauft et al. (2018) aplicaram a
regressão por GP junto a técnica de Linearização por Realimentação para controle de um
pêndulo e Aran e Unel (2018) utilizaram um controlador por Modos Deslizantes aplicado
a um motor a diesel. Em todas as aplicações supracitadas a GPR tem sido utilizada
sobre um conjunto prévio de dados obtidos de forma offline e cujos os parâmetros foram
previamente ajustados sobre essas informações coletadas.
Em todos os casos citados acima, o GP foi utilizado não só como um estimador,

mas também como uma ferramenta para prever a dinâmica não-conhecida dado um
conjunto de treinamento. Portanto, além de apresentar duas técnicas de controle não
linear bastante usadas na literatura, Linearização por Realimentação e Controle por Modos
Deslizantes, o Processo Gaussiano será formalmente apresentado partindo do simples
problema de regressão linear. Exemplos de aplicação foram postos a partir de resultados de
artigos já publicados para apresentar tanto as técnicas de controle estabelecidas quanto sua
combinação com o GP utilizando uma forma de aprendizado em tempo real. Resultados
obtidos através de simulação e de experimentos aplicados ao sistema de um atuador
eletro-hidráulico foram utilizados para validar a eficácia do método. Os resultados obtidos
comprovam a eficácia da combinação das técnicas de controle não linear e o Processo
Gaussiano.
1.1 Organização do trabalho
Esse trabalho foi estruturado numa sequência que apresentasse de forma lógica e
compreensível suas devidas contribuições no campo da ciência na qual se insere: controle
não linear de sistemas dinâmicos.
O primeiro capítulo destina-se a situar o leitor na problemática presente em relação

aos controladores não lineares, onde o Processo Gaussiano tem sido aplicado e onde ele
pode ser encaixado dentro dos controladores.
O segundo capítulo trata das técnicas-base de controladores não lineares já

bem difundidas na literatura e utilizadas nesse trabalho: o Método de Linearização por
Realimentação e o Controlador por Modos Deslizantes. Resultados extraídos de artigos
são utilizados como exemplos para demonstrar a aplicação das técnicas convencionais.
No terceiro capítulo é apresentado o Processo Gaussiano como ferramenta de

compensação estocástica. Para tanto, no início desse capítulo é feita uma breve revisão
dos fundamentos presentes na regressão de funções utilizando distribuições gaussianas.
Depois, formalmente o GP é definido além de serem postas considerações de forma que
reduzam a complexidade computacional relativa a sua implementação online. Em seguida,
o problema de GPR é apresentado no âmbito das técnicas de controle apresentadas no
segundo capítulo além de serem mostrados os exemplos utilizados no capítulo anterior
com a diferença obtida quando a técnica proposta é posta em prática.
No quarto capítulo, é apresentada uma aplicação, em simulação, do GPR com as

técnicas de controle não lineares para o caso do atuador eletro-hidráulico. Esse capítulo é
dedicado a apresentar as potencialidades do controlador proposto para posterior aplicação
experimental.
No quinto capítulo são mostrados os resultados referentes a aplicação experimental

das técnicas propostas.
Os resultados mostrados tanto no quarto quanto no quinto capítulos são discutidos,

não só de forma individual e comparados com os das técnicas convencionais, como também
são analisadas entre suas variantes à luz de métricas que levam em conta não só o erro de
rastreamento como também o sinal de controle utilizado.
No sexto capítulo, são apresentadas as conclusões finais desse trabalho e as

sugestões para trabalhos futuros. As conclusões representam uma síntese do que foi
observado a partir dos resultados obtidos pelas técnias propostas e as sugestões futuras não
falam só sobre a proposta desse trabalho em si como também dão margem para expansão
das técnicas de Aprendizado de Máquina dentro da área de controle não linear.
O primeiro e segundo apêndices são dedicados a apresentar uma dedução mate-

mática acerca dos limites dos erros de convergência em relação à aplicação do Método de
Linearização por Realimentação e do Controlador por Modos Deslizantes com função de
saturação, respectivamente.
O terceiro e quarto apêndices reunem os valores numéricos das métricas utilizadas

nas simulações e nos experimentos.
22
2 Estratégias de Controle para Sistemas

Não Lineares
De forma geral, controle consiste em fazer com que determinado sistema se

comporte de forma desejada. Conhecendo-se o sistema que se deseja controlar, pode-se
projetar uma função de controle tal que a saída seja uma resposta esperada. Um sistema
de controle em malha aberta é definido como aquele cuja entrada no sistema é calculada
sem ter informação alguma da saída gerada ou dos seus estados. Esse tipo de sistema,
mostrado na Fig. 1, apesar de ser bastante simples, demanda que o projetista conheça
detalhadamente sua planta. Além disso, esses controladores são projetados para atender
determinadas especificações dentro de um regime de operação formulado de acordo com um
comportamento previsto do sistema. Entretanto, caso a planta seja sujeita a uma condição
adversa tal que sua dinâmica seja bem distinta da prevista, o controlador não conseguirá
desempenhar sua devida função, podendo inclusive piorar o seu comportamento.
Figura 1 – Diagrama de blocos - sistema em malha aberta.
xd u x
Controlador Atuador Sistema
Fonte: Elaborada pelo autor.
Esses problemas podem ser solucionados caso um laço de realimentação entre a

saída do sistema e o controlador seja estabelecido. Essa realimentação consiste na instalação
de sensores/transdutores que realizem a medição dos estados na saída do sistema, os quais
são utilizados para comparar com um sinal de referência e gerar uma informação de erro
que o controlador utilize para computar uma entrada para a planta. Apesar dos custos
adicionais de instrumentação de sistemas realimentados, poder alterar o esforço de controle
de acordo com um sinal de erro se torna bastante útil no que se refere a poder contornar
as dificuldades vinculadas a diversas oscilações ou mudanças no comportamento dinâmico
do sistema. Um sistema com laço de realimentação é dito um sistema em malha fechada,
representado na Fig. 2, e é a base para o desenvolvimento das técnicas de controle não
linear apresentadas a seguir.
Capítulo 2. Estratégias de Controle para Sistemas Não Lineares 23
Figura 2 – Diagrama de blocos - sistema em malha fechada.
xd − e u x
+
Controlador Atuador Sistema
Realimentação

2.1 Linearização por Realimentação
O termo linearização por realimentação (FBL, do inglês feedback linearization)

pode dar a ideia de que o modelo do sistema a ser controlador precise ser linearizado,
fugindo assim da proposta dos controladores não lineares. Entretanto, contrariando essa
sugestão, o método não consiste em linearizar a dinâmica do sistema, mas na verdade em
fazer com que o sistema em malha fechada apresente um comportamento dinâmico linear.
Isso pode ser melhor compreendido no desenvolvimento abaixo.
Considere a seguinte Equação Diferencial Ordinária (EDO) para um sistema

dinâmico não linear, SISO (do inglês Single Input-Single Output) e não-autônomo, ou seja,
dependente do tempo 𝑡:
𝑥(𝑛) (𝑡) = 𝑓 (𝑡, 𝑥(𝑡), 𝑥(𝑡),

˙ . . . , 𝑥(𝑛−1) (𝑡)) + 𝑏(𝑡, 𝑥(𝑡), 𝑥(𝑡),
˙ . . . , 𝑥(𝑛−1) (𝑡))𝑢(𝑡) (2.1)
onde 𝑥(𝑛) representa a 𝑛-ésima derivada em relação ao tempo da variável de estado 𝑥 e 𝑢

a variável de entrada. As funções 𝑓 , 𝑏 : R𝑛 → R são funções não lineares. A Eq. 2.1 pode
ser escrita de forma reduzida assim,
𝑥(𝑛) (𝑡) = 𝑓 (𝑥, 𝑡) + 𝑏(𝑥, 𝑡)𝑢(𝑡) (2.2)
˙ . . . , 𝑥(𝑛−1) ]⊤ cuja dependência explícita com o tempo foi removida para

onde, 𝑥 = [𝑥, 𝑥,
simplificar a notação.
Sejam feitas as seguintes considerações,
Consideração 2.1. Os estados 𝑥 são mensuráveis.
Consideração 2.2. A trajetória desejada 𝑥𝑑 é diferenciável com respeito ao tempo. Além

disso, cada componente é conhecida e limitada.
Agora considere que a variável de entrada seja projetada para um problema

de rastreamento de trajetória, ou seja, 𝑥 → 𝑥𝑑 a medida que 𝑡 → ∞, onde 𝑥𝑑 =
(𝑛−1) ⊤
[𝑥𝑑 , 𝑥˙ 𝑑 , . . . , 𝑥𝑑 ] é a trajetória (estado) desejada. Isso significa fazer com que 𝑒 → 0,
(𝑛−1) ⊤
onde 𝑒 = 𝑥 − 𝑥𝑑 = [𝑒, 𝑒, ˙ . . . , 𝑒𝑑 ] é o erro de rastreamento. Pode-se atingir esse objetivo
se a lei de controle do sistema, ou seja, a expressão matemática da variável de entrada 𝑢

que permita cumprir a tarefa proposta, for modelada da seguinte forma,
(𝑛)
𝑢 = 𝑏−1 (−𝑓 + 𝑥𝑑 − 𝑎0 𝑒 − 𝑎1 𝑒˙ − . . . − 𝑎𝑛−1 𝑒(𝑛−1) ) (2.3)
a resposta do sistema dinâmico em malha fechada, neste caso, terá uma convergência linear
em zero caso os coeficientes 𝑎𝑖 (𝑖 = 0, 1, . . . , 𝑛 − 1) forem de um polinômio de Hurwitz1 .
Seja a seguinte definição:
Definição 2.1. Um polinômio de Hurwitz na forma 𝑝𝑛 + 𝑎𝑛−1 𝑝𝑛−1 + . . . + 𝑎1 𝑝 + 𝑎0 é um

polinômio cujos coeficientes são números reais positivos e cujas raízes estão localizadas na
metade esquerda do plano complexo, ou seja, a parte real de cada raiz é negativa.
Substituindo a Eq. 2.3 na Eq. 2.2 é possível obter,
𝑒(𝑛) + 𝑎𝑛−1 𝑒(𝑛−1) + . . . + 𝑎1 𝑒˙ + 𝑎0 𝑒 = 0 (2.4)
Contanto que os coeficientes da Eq. 2.4 satisfaçam a Definição 2.1, então a dinâmica
do erro terá convergência para zero. Uma forma simples de obter esses coeficientes é
através do Binômio de Newton2 utilizando a equação abaixo:
⎛ ⎞
𝑛
𝑎𝑖 = ⎝ ⎠ 𝜆𝑛−𝑖 (2.5)
𝑖
onde 𝑖 = {0, 1, . . . , 𝑛 − 1} e 𝜆 ∈ R+ . O primeiro termo do produto da equação acima gera

o Triângulo de Pascal3 . Por exemplo, considere o seguinte sistema da Eq. 2.4 para um
problema de 3a ordem (𝑛 = 3):
...
𝑒 + 3𝜆2 𝑒˙ + 𝜆3 𝑒 = 0
𝑒 + 3𝜆¨ (2.6)
Da teoria desenvolvida para solução de EDOs lineares, homogêneas e com coefici-

entes constantes, sabe-se que a Eq. 2.6 possui três raízes iguais. A solução dessa equação
será dada por:
𝑒 = (𝐴𝑡2 + 𝐵𝑡 + 𝐶) exp (−𝜆𝑡) (2.7)
onde 𝐴, 𝐵 e 𝐶 são constantes obtidas a partir das condições iniciais. Note que a resposta
1
Adolf Hurwitz (1859-1919) - Matemático alemão.
2
Sir Isaac Newton (1623-1662) - Físico e matemático inglês.
3
Blaise Pascal (1623-1662) - Matemático e físico francês.
apresentada pela Eq. 2.7 possui convergência exponencial (estabilidade exponencial) para
zero quando 𝑡 → ∞ e isso foi garantido justamente por conta de as raízes idênticas do
polinômio característico, relacionado a Eq. 2.6, possuirem parte real negativa.
Contudo, a técnica de linearização por realimentação exige não só que o sistema

esteja bem representado por um modelo adequado como também que os parâmetros
utilizados sejam plenamente conhecidos. O Exemplo 2.1 ilustra esse problema.
Exemplo 2.1. Controle utilizando Linearização por Realimentação para um manipulador

de junta flexível.
Lima, Bessa e Trimpe (2019) utilizaram um controlador por Linearização por

Realimentação obedecendo uma lei de controle similar à Eq. 2.3. Pela Fig. 3 é possível
visualizar como o controlador não consegue fazer com que o erro de rastreamento convirja
para a origem do plano de fase, estabelecendo apenas um ciclo limite em torno da origem.
Figura 3 – Plano de fase para o problema de rastreamento de trajetória de um manipulador de

junta flexível utilizando FBL.
×10−2
10,0
0,0
ėβ [rad/s]
-10,0
-20,0
-30,0 ×10−1
-2,0 0,0 2,0 4,0 6,0
eβ [rad]
Fonte: Adaptado de Lima, Bessa e Trimpe (2019).
Por conta disso, quando o sistema a lidar é incerto, é interessante utilizar estra-
tégias robustas ou compensadores que melhorem a performance do controlador e evitem
comportamentos indesejáveis. O controlador por Modos Deslizantes apresentado na pró-
xima seção é uma técnica de controle robusto bastante utilizada para lidar com esse tipo
de problemas.
2.2 Controle por Modos Deslizantes
Voltando ao problema do rastreamento de trajetória, o objetivo é desenvolver

um controlador que faça com que 𝑥 → 𝑥𝑑 ou, de maneira equivalente, faça com que
𝑒 → 0 quando 𝑡 → ∞. O controlador por Modos Deslzantes (SMC, do inglês Sliding Mode
Control) consiste em transformar o problema de rastreamento de trajetória de ordem 𝑛 em
uma estabilização de primeira ordem. Para isso considere a equação abaixo que descreve
uma superfície 𝑆(𝑡):
(︃ )︃𝑛−1
𝑑
𝑠(𝑥, 𝑡) = +𝜆 𝑒 (2.8)
𝑑𝑡
com 𝜆 ∈ R+ e 𝑛 a n-ésima ordem do sistema dinâmico. Essa superfície, dita de deslizamento,

é definida no espaço de estado R𝑛 pela equação 𝑠(𝑥, 𝑡) = 0, sendo 𝑠 : R𝑛 → R.
Partindo da expressão da dinâmica do sistema em malha fechada representada

pela Eq. 2.4 e utilizando a Eq. 2.8 é possível mostrar que,
𝑠˙ + 𝜆𝑠 = 0 (2.9)
Note que para 𝑠 = 0 obtem-se uma EDO cuja solução converge assintoticamente
para zero, conforme já foi discutido, pois a expressão 𝑠 = 0 gera uma equação aos moldes
da Eq. 2.4 com coeficientes dados pela Eq. 2.5 e, portanto, coeficientes de um polinômio
de Hurwitz.
Considerando que o sistema já inicia na condição ou trajetória desejada, ou seja,

𝑥0 = 𝑥𝑑 , então basta garantir que a dinâmica de 𝑠 seja zero para fazer com que o sistema
permaneça na superfície de deslizamento 𝑆, ou seja, 𝑠˙ = 0.
A Eq. 2.8 pode ser reescrita da seguinte forma,
𝑠(𝑥, 𝑡) = C ⊤ 𝑒 (2.10)
onde C = [𝜆𝑛−1 , 𝑎𝑛−2 𝜆𝑛−2 , . . . , 𝑎1 𝜆, 1]⊤ e os coeficientes 𝑎𝑖 (𝑖 = 1, 2, . . . , 𝑛 − 2) definem

um polinômio de Hurwitz na forma 𝜆𝑛−1 + 𝑎𝑛−2 𝜆𝑛−2 + . . . + 𝑎1 𝜆 + 1. Derivando a Eq. 2.10
tem-se,
⊤
˙
𝑠(𝑥, 𝑡) = C ⊤ 𝑒˙ = 𝑒(𝑛) + C̄ 𝑒 (2.11)
onde C̄ = [0, 𝜆𝑛−1 , 𝑎𝑛−2 𝜆𝑛−2 , . . . , 𝑎1 𝜆]⊤ .

Agora o objetivo é desenvolver um controlador capaz de deixar o sistema na

superfície 𝑆 dado que 𝑥0 = 𝑥𝑑 . Na mesma forma que foi feita na linearização por
realimentação, a lei de controle para um sistema descrito na forma da Eq. 2.2 pode ser
escrita da seguinte maneira:
(𝑛) ⊤
𝑢 = 𝑏−1 (−𝑓 + 𝑥𝑑 − C̄ 𝑒) (2.12)
É dito que a lei de controle da Eq. 2.12 deixa o sistema no seu modo deslizante
(SLOTINE; LI, 1991, p. 281). Nesse modo, a dinâmica do sistema em malha fechada é
mantida sobre a superfície de deslizamento. Para o caso que 𝑥0 ̸= 𝑥𝑑 é necessário levar o
estado inicial para a superfície de deslizamento. Esse é o modo de aproximação. A Fig. 4
mostra de forma gráfica o plano de fase do erro para um sistema de ordem 𝑛 = 2, ou seja,
𝑠 = 𝑒˙ + 𝜆𝑒. Nessa figura é possível visualizar os modos de aproximação e de deslizamento.
Figura 4 – Plano de fase do erro para um sistema de 2a ordem.
s(x, t) = 0 ė
−λ
e
Modo
deslizante
e0
Modo de
aproximação
Pode-se constatar então que a técnica de controle por modos deslizantes é dividida
em duas etapas ou modos: o de aproximação, que leva o estado inicial do erro à superfície
de deslizamento, e o deslizante que leva os estados que estão sobre a superfície 𝑆 para o
estado desejado. A Eq. 2.12 é para o caso deslizante, mas como definir a lei de controle
que atenda o modo de aproximação? Para isso, considere o problema na qual o estado
̸ 𝑥𝑑 ) e que, além disso, as funções 𝑓 e 𝑏 não são
inicial é diferente do estado desejado (𝑥0 =
conhecidas com exatidão e que podem ser representadas na forma 𝑓 = 𝑓^+ Δ𝑓 e 𝑏 = ^𝑏 + Δ𝑏,
onde Δ𝑓 e Δ𝑏 são as incertezas associadas a esses termos. Logo, o sistema representado
na forma da Eq. 2.2, pode ser reescrito por,
𝑥(𝑛) = 𝑓^ + ^𝑏𝑢 + ℎ (2.13)
onde ℎ = Δ𝑓 + Δ𝑏𝑢 é o termo que agrupa as incertezas do sistema. Como esse termo
também leva em conta também efeitos externos não considerados na modelagem, ℎ será
chamado daqui em diante de perturbação.
Seja então feita a seguinte consideração:
Consideração 2.3. O termo ℎ é desconhecido, mas limitado, i.e, |ℎ| ≤ 𝛿.
Como o estado inicial não coincide com o estado desejado, ou seja, 𝑥0 ̸= 𝑥𝑑 ,

considere então a seguinte lei de controle:
(𝑛) ⊤
𝑢 = ^𝑏−1 (−𝑓^ + 𝑥𝑑 − C̄ 𝑒 − Ksgn(𝑠)) (2.14)
onde Ksgn(𝑠) é um compensador capaz de levar a dinâmica do sistema até a superfície de

deslizamento na qual K é denominado o ganho do controlador. A função sgn(𝑥) é chamada
função sinal e é definida da seguinte forma:
⎧
⎪
⎪
⎪
⎨
−1, 𝑥 < 0
sgn(𝑥) = 0, 𝑥 = 0 (2.15)
⎪
⎪
⎩ 1, 𝑥 > 0
⎪
O ganho K deve ser obtido de tal forma que possa garantir a estabilidade do
sistema. Para isso considere a seguinte função, definida em relação ao quadrado da
distância 𝑠 até a superfície de deslizamento,
1
𝑉 (𝑡) = 𝑠2 (2.16)
2
Diferenciando-se a Eq. 2.16 em relação ao tempo,

⊤ (𝑛) ⊤
𝑉˙ (𝑡) = 𝑠𝑠˙ = 𝑠(𝑒(𝑛) + C̄ 𝑒) = 𝑠(𝑓^ + ^𝑏𝑢 + ℎ − 𝑥𝑑 + C̄ 𝑒)
= 𝑠(ℎ − Ksgn(𝑠))
Utilizando a Consideração 2.3, pode-se chegar em
𝑉˙ (𝑡) ≤ 𝑠(𝛿 − Ksgn(𝑠)) (2.17)

Fazendo,
K ≥𝛿+𝜂 (2.18)
pode-se mostrar que,
1 𝑑𝑠2
𝑉˙ (𝑡) = ≤ −𝜂|𝑠| (2.19)
2 𝑑𝑡
Diz-se que a Eq. 2.19 denota a condição de deslizamento. Essa equação traz a
informação que o quadrado da distância até a superfície 𝑆(𝑡) decresce ao longo de toda
a trajetória (SLOTINE; LI, 1991, p. 280). Também, através dessa equação, é possível
assegurar que dentro de um tempo finito a superfície de deslizamento será alcançada e,
portanto, garantirá a estabilidade exponencial do sistema em malha fechada (BESSA,
2009).
A Eq. 2.19 pode ser arrumada da seguinte forma:
𝑠 𝑑𝑠
𝑠˙ = sgn(𝑠) ≤ −𝜂 (2.20)
|𝑠| 𝑑𝜏
Integrando de 0 a 𝑡 em relação a 𝜏 ambos os lados a expressão acima:

∫︁ 𝑡 ∫︁ 𝑡 ⃒𝑡 ∫︁ 𝑡
𝑑|𝑠| ≤ −𝜂 𝑑𝜏 |𝑠|⃒ ≤ −𝜂 𝑑𝜏
⃒
0 0 0 0
Logo, chega-se na expressão,

⃒𝑡
|𝑠|⃒⃒ ≤ −𝜂𝑡 (2.21)
0
Pela teoria apresentada, sabe-se que não é necessário avaliar para 𝑡 → ∞, porque
o controlador por SMC tem como primeira tarefa levar o estado inicial para a superfície
de deslizamento dentro de um tempo finito, 𝑡𝑎𝑙𝑐 , onde 𝑠(𝑡 ≥ 𝑡𝑎𝑙𝑐 ) = 0. Portanto, a Eq. 2.21
pode ser utilizada para chegar na seguinte expressão,
|𝑠(0)|
𝑡𝑎𝑙𝑐 ≤ (2.22)
𝜂
Logo, a imposição do termo 𝜂 serve para garantir que a superfície de deslizamento

seja alcançada dentro de um tempo finito.
Entretanto, o uso da função sinal na lei de controle 2.14 pode causar o efeito
de chaveamento no sistema e deve ser evitado, pois pode provocar vibrações de nível
indesejado na estrutura do equipamento, por exemplo. Slotine e Li (1991) sugerem que
para evitar esse problema seja utilizada uma função de saturação, definida da seguinte
forma:
⎧
⎨ sgn(𝑥), |𝑥| ≥ 1
sat(𝑥) = ⎩ (2.23)
𝑥, |𝑥| < 1
Portanto, o controlador modificado para utilização da função de saturação fica da

seguinte maneira:
⊤
(︁ )︁
(𝑛)
𝑢 = ^𝑏−1 −𝑓^ + 𝑥𝑑 − C̄ 𝑒 − Ksat (𝑠/𝜑) (2.24)
onde 𝜑 é uma constate estritamente positiva e denota a espessura da camada limite. Esse
parâmetro pode ser ajustado de acordo com precisão de rastreamento desejada, já que dessa
vez o controlador não irá garantir um rastreamento perfeito (com erro de rastreamento
desprezível).
Para essa modificação no controlador, a análise de estabilidade será feita de acordo

com o Teorema da Estabilidade Assintótica de Lyapunov (SLOTINE; LI, 1991)4 .
Teorema 2.1. Dada uma função 𝑉 definida positiva, o sistema será assintoticamente
estável (no sentido Lyapunov) se 𝑉˙ for definida negativa.
Para compreender o teorema acima é necessário conhecer as seguintes definições:
Definição 2.2. Uma função 𝑉 (𝑥) é dita definida positiva se, em uma região Ω, 𝑉 (𝑥) >
0 ∀ 𝑥 ̸= 0 ∈ Ω e 𝑉 (0) = 0.
Definição 2.3. Uma função 𝑉 (𝑥) é dita definida negativa se −𝑉 (𝑥) for definida positiva.
A função 𝑉 (𝑥) pode ser interpretada como uma função de energia do sistema cujo
objetivo é trazê-la para seu ponto de mínimo, um estado de equilíbrio.
Para tanto, considere a seguinte função candidata de Lyapunov:
1
𝑉𝜑 (𝑡) = 𝑠2𝜑 (2.25)
2
onde 𝑠𝜑 = 𝑠 − 𝜑sat (𝑠/𝜑) é uma mudança de variável em relação a 𝑠 e que denota a

distância do estado atual até a camada limite.
4
Aleksandr Mikhailovich Lyapunov (1857-1918) - Matemático e físico russo.
Pode-se verificar que, fora da camada limite, ou seja, quando 𝑠 > 𝜑, sat(𝑠/𝜑) =
sgn(𝑠𝜑 ), logo que 𝑠˙ 𝜑 = 𝑠,
˙ e isso implica na mesma abordagem feita anteriormente. Logo,
𝑉˙ 𝜑 (𝑡) ≤ −𝜂|𝑠𝜑 | (2.26)
que é uma função definida negativa, pois 𝑉˙ 𝜑 (𝑡) é nula somente na origem 𝜑. Observa-se, a
partir da Eq. 2.26, que 𝑉𝜑 (𝑡) ≤ 𝑉𝜑 (0) e, portanto, os estados serão atraídos para a camada
limite, ou seja, que 𝑠𝜑 → 0 quando 𝑡 → ∞.
Uma vez dentro da camada limite pode-se demonstrar que o erro de rastreamento
ficará contido dentro de uma região delimitada segundo o teorema abaixo:
Teorema 2.2. Seja a camada limite de um sistema de ordem 𝑛 definido na forma

𝑆𝜑 = {𝑒 ∈ R𝑛 | |𝑠(𝑒, 𝑡)| ≤ 𝜑}. Qualquer{︃trajetória iniciada dentro da camada limite }︃ irá
(𝑖 + 1)!
convergir para uma região fechada Φ = 𝑒 ∈ R𝑛 | |𝑒(𝑖) | ≤ 𝑛−𝑖−1 𝜑, 𝑖 = 0, . . . , 𝑛 − 1 .
𝜆
Uma prova detalhada do Teorema 2.2, baseado no trabalho de Bessa (2009),

encontra-se no Apêndice A.
Exemplo 2.2. Controle por Modos Deslizantes de um ROV.
Lima, Bessa e Trimpe (2018) apresentam um controlador por SMC convencional,

ou seja, obedecendo a lei de controle 2.24. Pela Fig. 5 é possível visualizar como a lei de
controle consegue estabelecer a convergência do erro de rastreamento para um ciclo limite
contido dentro da camada limite Φ.
Figura 5 – Plano de fase para o problema de rastreamento de trajetória de um ROV utilizando
SMC.
×10−2
8,0
4,0
Φ
0,0
ė [m/s]
-4,0
-8,0
-12,0
-16,0 ×10−1
-1,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0
e [m]

32
3 Regressão por Processo Gaussiano
O Processo Gaussiano será formulado partindo do problema de regressão linear e

sendo expandido aumentando sua complexidade e capacidade de generalização.
3.1 Modelo linear
O simples caso de regressão linear vem sendo estudado extensivamente (WIL-

LIAMS; RASMUSSEN, 2006, p. 7). Tem como virtudes sua fácil implementação e
interpretação. Um modelo linear padrão pode ser descrito como:
𝑓 (𝑥) = 𝑥⊤ 𝑤 (3.1)
onde 𝑥 é o vetor de entrada e 𝑤 é o vetor de parâmetros (pesos) do modelo. Ou seja, uma

função 𝑓 de um conjunto de entrada é representada por uma simples combinação linear
dessa entrada e de seus respectivos parâmetros.
A saída real de um sistema pode não ser determinística aos moldes da Eq. 3.1.
Então considere que essa saída real seja dada pela saída da função 𝑓 da Eq. 3.1 acrescentada
de um ruído que possui uma distribuição gaussiana com média nula e variância 𝜎𝑛2 :
𝑦 = 𝑓 (𝑥) + 𝜀, 𝜀 ∼ N (0, 𝜎𝑛2 ) (3.2)
Considere um conjunto de treinamento D composto por 𝑛 observações de entradas

e suas respectivas saídas, D = {(𝑥𝑖 , 𝑦𝑖 ) | 𝑖 = 1, . . . , 𝑛}, onde a entrada 𝑥𝑖 é um vetor de
dimensão 𝑚 e 𝑦 é uma saída escalar. Considere que todas as entradas estejam agrupadas na
matriz 𝑋 de ordem 𝑚 × 𝑛 e saída no vetor 𝑦 de ordem 𝑛. Logo o conjunto de treinameto
pode ser retratado como D = (𝑋, 𝑦). O objetivo aqui é traçar uma relação entre o
conjunto entrada-saída e assim poder fazer inferências ou até mesmo predições acerca do
sistema. A relação que interessa aqui é do tipo condicional, ou seja, dado um conjunto de
entrada 𝑋 e de parâmetros 𝑤 qual seria a saída 𝑦 esperada?
A pergunta pode ser reformulada na seguinte: dado o conjunto D existe uma

função capaz de relacionar as saídas do sistema dadas suas entradas (e seus respectivos
parâmetros)? A presença do ruído gaussiano não torna a tarefa factível de resolver
de forma analítica, entretanto pode ser admitido que essa relação entrada-saída seja
Capítulo 3. Regressão por Processo Gaussiano 33
possível considerando uma relação de verossimilhança (do inglês, likelihood) cuja função
densidade de probabilidades condicional é dada na seguinte forma, supondo uma relação
de independência:
𝑛 𝑛
(𝑦𝑖 − 𝑥⊤
(︃ )︃
2
∏︁ ∏︁ 1 𝑖 𝑤)
𝑝(𝑦 | 𝑋, 𝑤) = 𝑝(𝑦𝑖 | 𝑥𝑖 , 𝑤) = √ exp −
𝑖=1 𝑖=1 2𝜋𝜎𝑛 2𝜎𝑛2
(︃ )︃ (3.3)
1 1
= exp − ‖ 𝑦 − 𝑋 ⊤ 𝑤 ‖2 = N (𝑋 ⊤ 𝑤, 𝜎𝑛2 𝐼)
(2𝜋𝜎𝑛2 )𝑛/2 𝜎𝑛2
Determinar a função que relaciona os dados de entrada e suas respectivas saídas

é equivalente a determinar os parâmetros, ou pesos, 𝑤 que realizam esse mapeamento.
Para tanto, Williams e Rasmussen (2006) sugerem uma abordagem Bayesiana1 para poder
realizar inferências sobre o conjunto de dados disponíveis.
A Regra de Bayes pode ser enunciada através da seguinte equação:
verossimilhança × priori
posteriori = (3.4)
verossimilhança marginal
Notar que a Eq. 3.4 pode ser o instrumento capaz de retornar uma distribuição dos
parâmetros da função de mapeamento quando são dadas como entradas a distribuição dos
conjuntos entrada-saída de acordo com a crença inicial de como esses mesmos parâmetros
estão distribuídos sobre a distribuição total do conjunto de treinamento. Em linguagem
matemática,
𝑝(𝑦 | 𝑋, 𝑤)𝑝(𝑤)
𝑝(𝑤 | 𝑦, 𝑋) = (3.5)
𝑝(𝑦 | 𝑋)
Consideração 3.1. A distribuição a priori dos pesos 𝑤 é tida com média nula e matriz
de covariância Σ𝑝 , ou seja,
𝑤 ∼ N (0, Σ𝑝 ) (3.6)
A verosimilhança marginal é obtida pela distribuição total do conjunto entrada-

saída realizada independentemente dos pesos, ou seja,
∫︁
𝑝(𝑦 | 𝑋) = 𝑝(𝑦 | 𝑋, 𝑤)𝑝(𝑤)𝑑𝑤 (3.7)
Pode-se dizer que a presença da verossimilhança marginal no denominador da

1
Thomas Bayes (1701-1761) - matemático e filósofo inglês.
Eq. 3.5 consiste em um processo de normalização para obter a distribuição a posteriori

(WILLIAMS; RASMUSSEN, 2006, p. 9). Tendo em mente isto, pode-se verificar que o
denominador possui apenas a função de um fator de escala em relação a 𝑝(𝑤 | 𝑦, 𝑋). Por
conta disso, considere o desenvolvimento abaixo do numerador da Eq. 3.5.
(︃ )︃
1 1
(︂ )︂
𝑝(𝑤 | 𝑦, 𝑋) ∝ exp − 2 (𝑦 − 𝑋 ⊤ 𝑤)⊤ (𝑦 − 𝑋 ⊤ 𝑤) exp − 𝑤⊤ Σ−1
𝑝 𝑤
(︂ 2𝜎𝑛 2)︂
1
¯ ⊤ (𝜎𝑛−2 𝑋𝑋 ⊤ + Σ−1
∝ exp − (𝑤 − 𝑤) 𝑝 )(𝑤 − 𝑤)
¯
2
¯ = 𝜎𝑛−2 (𝜎𝑛−2 𝑋𝑋 ⊤ + Σ−1

onde, 𝑤 −1 −2 ⊤ −1
𝑝 ) 𝑋𝑦. Chamando 𝐴 = 𝜎𝑛 𝑋𝑋 + Σ𝑝 pode-se verificar
que o desenvolvimento acima resulta em,
(︃ )︃
1
¯ = 2 𝐴−1 𝑋𝑦, 𝐴−1
𝑝(𝑤 | 𝑦, 𝑋) ∼ N 𝑤 (3.8)
𝜎𝑛
A Eq. 3.8 é chamada de Posteriori Máxima (MAP, do inglês maximum a posteriori)

e serve de estimativa para a densidade de probabibilidades posteriori.
A Eq. 3.8 é obtida quando o conjunto de treinamento D já é conhecido. O desafio

agora é poder ainda fazer o mapeamento entrada-saída dada uma nova entrada, ou teste,
𝑥* . Schulz, Speekenbrink e Krause (2018) definem a distribuição preditiva para 𝑓* ≡ 𝑓 (𝑥* )
da seguinte forma:
∫︁
𝑝(𝑓* | 𝑥* , 𝑋, 𝑦) = 𝑝(𝑓* | 𝑥* , 𝑤)𝑝(𝑤 | 𝑦, 𝑋)𝑑𝑤
(3.9)
(︃ )︃
1 ⊤ −1 ⊤ −1
= N 𝑥 𝐴 𝑋𝑦, 𝑥* 𝐴 𝑥*
𝜎𝑛2 *
Pela Eq. 3.9 é observável que a média da distribuição passa a variar de forma linear
com os dados de entrada e a variância de forma quadrática, o que leva a pensar na limitação
da sua capacidade de predição. Se os dados de entrada apresentarem um comportamento
muito disperso em relação ao conjunto de treinamento então sua distribuição correspondente
poderá apresentar muitas incertezas em relação ao conjunto global de dados. Se todos
os dados forem (quase) linearmente distribuídos, esse problema é minimizado, pois a
tendência de predição permacerá inalterada, entretanto, para casos diferentes o modelo
linear passa a ser ineficaz para o problema de regressão.
3.2 Modelos de alta dimensão
A análise anterior pode ser estendida para espaços de dimensões maiores. Isso é
feito utilizando uma transformação de base, 𝑇 (𝑥) = 𝜓(𝑥), onde os dados de entrada que
antes não possuiam um comportamento linear passam a tê-lo. Após essa transformação, o
modelo linear dado pela Eq. 3.1 pode ser aplicado normalmente na seguinte forma:
𝑓 (𝑥) = 𝜓(𝑥)⊤ 𝑤 (3.10)
Essa base pode ser, por exemplo, do tipo polinomial, 𝜓(𝑥) = [1, 𝑥, 𝑥2 , . . .]⊤ (WIL-
LIAMS; RASMUSSEN, 2006, p. 11), ou trigonométrica, 𝜓(𝑥) = [sin 𝑥, cos 𝑥, sin 2𝑥, . . .]⊤ ,
entre outras.
Analogamente ao que foi realizado anteriormente para entradas linearmente

comportadas, a distribuição preditiva pode ser dada através da seguinte distribuição
normal:
(︃ )︃
1 ⊤ −1
𝑝(𝑓* | 𝑥* , 𝑋, 𝑦) ∼ N 2
𝜓* 𝐴 Ψ𝑦, 𝜓*⊤ 𝐴−1 𝜓* (3.11)
𝜎𝑛
onde 𝜓* = 𝜓(𝑥* ), Ψ = Ψ(𝑋) e 𝐴 = 𝜎𝑛−2 ΨΨ⊤ + Σ−1𝑝 . O termo Ψ agrupa todos os vetores
do conjunto treinamento de entrada após a mudança de base (𝜓(𝑥)).
Williams e Rasmussen (2006) mostram que a Eq. 3.11 pode ser modificada para
ficar na forma abaixo:
𝑝(𝑓* | 𝑥* , 𝑋, 𝑦) ∼ N (𝜓*⊤ Σ𝑝 Ψ(𝐾 + 𝜎𝑛2 𝐼)−1 𝑦,

(3.12)
𝜓*⊤ Σ𝑝 𝜓* − 𝜓*⊤ Σ𝑝 Ψ(𝐾 + 𝜎𝑛2 𝐼)−1 Ψ⊤ Σ𝑝 𝜓* )
onde 𝐾 = Ψ⊤ Σ𝑝 Ψ. A Eq. 3.12 permite visualizar um padrão de multiplicação matricial

na forma 𝜓(𝑥)⊤ Σ𝑝 𝜓(𝑥′ ) onde 𝑥 e 𝑥′ podem ser vetores do conjunto treinamento e do
conjunto teste. Pode-se definir, portanto a seguinte operação:
𝑘(𝑥, 𝑥′ ) = 𝜓(𝑥)⊤ Σ𝑝 𝜓(𝑥′ ) (3.13)
A Eq. 3.13 é chamada de função de covariância ou kernel. Logo, pode-se definir

a matriz de covariância 𝐾 da seguinte forma (SCHULZ; SPEEKENBRINK; KRAUSE,
2018):
⎡ ⎤
𝑘(𝑥1 , 𝑥′1 ) 𝑘(𝑥1 , 𝑥′2 ) . . . 𝑘(𝑥1 , 𝑥′𝑁 )
⎢ ⎥
⎢
𝑘(𝑥2 , 𝑥′1 ) 𝑘(𝑥2 , 𝑥′2 ) . . . 𝑘(𝑥2 , 𝑥′𝑁 ) ⎥
𝐾(𝑋, 𝑋 ′ ) =
⎢ ⎥
⎢
.. .. ... .. ⎥ (3.14)
. . .
⎢ ⎥
⎢ ⎥
⎣ ⎦
𝑘(𝑥𝑁 , 𝑥′1 ) 𝑘(𝑥𝑁 , 𝑥′2 ) . . . 𝑘(𝑥𝑁 , 𝑥′𝑁 )
3.3 Espaço de funções
Na seção anterior foi mostrado como, a partir de um conjunto de treinamento,

é possível prever o comportamento de uma determinada função dada uma nova entrada.
Essa relação entrada-saída ou, em outras palavras, esse problema de regressão foi resolvido
utilizando distribuições de probabilidades do tipo normal (Gaussianas). Esse problema
agora pode ser generalizado para estimar uma função ℎ(𝑥) qualquer utilizando Processo
Gaussiano. Essa função relaciona-se com a saída observada (medida) na seguinte forma:
ℎ̄(𝑥) = ℎ(𝑥) + 𝜀, 𝜀 ∼ N (0, 𝜎𝑛2 ) (3.15)
similar a Eq. 3.2.
Williams e Rasmussen (2006) apresenta a seguinte definição:
Definição 3.1. Um Processo Gaussiano é um conjunto de variavéis aleatórias de tamanho

finito que possuem uma distribuição Gaussiana conjunta.
Portanto, uma função ℎ é dita um Processo Gaussiano se dois pares (ou mais) de
entrada-saída seguirem uma distribuição Gaussiana. Assim como na distribuição Gaussiana
é necessário fornecer uma informação de média e de variância dos dados, o GP também
necessita disso (DOERR et al., 2018). Pode-se definir então que uma função ℎ(𝑥) pode
ser escrita como um GP se,
ℎ(𝑥) ∼ GP (𝜇(𝑥), 𝑘(𝑥, 𝑥′ )) (3.16)
onde, a média e variância a priori são definidas como,
𝜇(𝑥) = E[ℎ(𝑥)] (3.17a)
𝑘(𝑥, 𝑥′ ) = V(𝑥, 𝑥′ ) = E[(ℎ(𝑥) − 𝜇(𝑥))(ℎ(𝑥′ ) − 𝜇(𝑥′ ))] (3.17b)

O processo de aprendizagem através da Regressão por Processo Gaussiano (GPR)

consiste em, dado um conjunto de treinamento D𝑁 = {𝑥𝑖 , ℎ𝑖 }𝑁
𝑖=1 , estimar o valor da função
ℎ(𝑥* ) para entradas arbitrárias 𝑥* . Williams e Rasmussen (2006) sugerem que tanto a
média quanto a variância a posteriori sejam calculadas com base nas seguintes equações:
E(ℎ(𝑥* ) | D𝑁 ) = 𝜇(𝑥* ) + 𝑘(𝑥* , 𝑥)(𝐾𝑁 + 𝜎𝑛2 𝐼)−1 ℎ̃(𝑥) (3.18a)
V(ℎ(𝑥* ) | D𝑁 ) = 𝑘(𝑥* , 𝑥* ) − 𝑘(𝑥* , 𝑥)(𝐾𝑁 + 𝜎𝑛2 𝐼)−1 𝑘(𝑥, 𝑥* ) (3.18b)
onde 𝐾𝑁 é definida pela Eq. 3.14 e ℎ̃(𝑥) = [ℎ̄(𝑥1 ) − 𝜇(𝑥1 ), ℎ̄(𝑥2 ) − 𝜇(𝑥2 ), . . . , ℎ̄(𝑥𝑁 ) −
𝜇(𝑥𝑁 )]⊤ . ℎ̄(𝑥𝑖−1 ) é a variável medida em relação à entrada 𝑥𝑖−1 que pertence ao conjunto
de treinamento e é utilizada para calcular a média a posteriori no passo 𝑖. Dentre as
possibilidades disponíveis, Williams e Rasmussen (2006) sugerem utilizar como função de
covariância o kernel da Função de Base Radial (RBF, do inglês Radial Basis Function)
também chamada de exponencial quadrática, definida abaixo:
‖ 𝑥 − 𝑥′ ‖2
(︃ )︃
′
𝑘(𝑥, 𝑥 ) = 𝜎𝑓2 exp − (3.19)
2𝛾 2
onde 𝜎𝑓 e 𝛾 são hiper-parâmetros do GP.
O termo aprendizagem vem do contexto do mapeamento presente entre o domínio

e a imagem de uma função desconhecida. O GPR, utilizando as informações prévias (a
priori), aprende como a função deve se comportar e, assim, torna-se útil para estimar
(ou prever) o comportamento no instante seguinte (a posteriori). O exemplo a seguir
serve para ajudar na compreensão de como funciona a técnica de regressão por Processo
Gaussiano.
Exemplo 3.1. Processo Gaussiano para regressão de funções.
Considere que foram coletados 20 pontos da função ℎ̄(𝑥) definida conforme a Eq.
3.15 onde a função ℎ(𝑥) = 1,9 sin(2,3𝑥) − 2,3 sin(1,4𝑥) + 1,9 cos(0,5𝑥) e o desvio-padrão
do ruído gaussiano é 𝜎𝑛 = 0,1. Definindo o vetor de hiper-parâmetros do GP como
𝜃 = [𝜎𝑛 , 𝜎𝑓 , 𝛾]⊤ foi realizada a simulação da regressão utilizando 𝜃 = [0,1, 1, 1]⊤ . O
resultado pode ser visto na Fig. 6. O parâmetro 𝜎𝑓2 corresponde a variância da função
ℎ(𝑥) enquanto 𝛾 é a escala de distância entre os pontos do conjunto de treinamento e a
entrada, correspondente a variância do kernel.
Pode-se observar que a média calculada pela Eq. 3.18a (curva azul) interpola
todos os pontos do conjunto de treinamento, fato esse constatado pela região de 95% de
confiança (área verde), calculada pela Eq. 3.18b, diminuta em torno desses pontos. Em
Figura 6 – Regressão por GP para 𝜃 = [0,1, 1, 1]⊤ .

5,0
2,5
Saída, h̄
0,0
-2,5
-5,0
-6,0 -3,0 0,0 3,0 6,0
Entrada, x
locais mais afastados do conjunto de treinamento, observa-se um aumento da variância da
regressão realizada.
O parâmetro 𝛾 indica o quão amplo é o kernel da distribuição. Se essa variável

assumir um valor muito pequeno, maiores serão as variações da regressão. Entretanto, se o
conjunto de entrada for re-escalado de acordo com a mudança do 𝛾, a aproximação obtida
será idêntica. Para mostrar isso, considere agora que 𝛾 = 0,2 e os resultados mostrados na
Fig. 7. Na Fig. 7a o eixo das entradas foi re-escalado por um fator 0,2, enquanto na Fig.
7b o eixo foi não foi alterado.
Figura 7 – Regressão por GP para 𝜃 = [0,1, 1, 0,2]⊤ .
5,0 5,0
2,5 2,5
Saída, h̄
Saída, h̄
0,0 0,0
-2,5 -2,5
-5,0 ×0,2 -5,0

-6,0 -3,0 0,0 3,0 6,0 -6,0 -3,0 0,0 3,0 6,0
Entrada, x Entrada, x
(a) Eixo 𝑥 re-escalado. (b) Eixo 𝑥 original.
Novamente, em ambos os casos, a média do GP interpola todos os pontos. Como

esperado, enquanto que para obter a mesma resposta mostrada na Fig. 6 foi necessário
multiplicar a entrada por 0,2, no caso em que a entrada não foi modificada, a curva
apresentou bem mais oscilações e, nas regiões mais afastadas dos pontos do conjunto
de treinamento, a variância assumiu valores superiores aos registrados no caso anterior.

Ademais, ainda é possível observar que essa variância em maior escala atingiu valores
máximos correspondentes a 2𝜎𝑓 que representa justamente a variância máxima, calculada
pela Eq. 3.18b, da função de regressão.
Agora fazendo com que 𝛾 = 5, é esperado que a saída do GP seja mais suave já
que um 𝛾 muito grande introduz uma noção de distância bem menor à medida que se
afasta do conjunto de treinamento. Em outras palavras, o Processo Gaussiano é levado a
acreditar que a entrada posta ainda está próxima do conjunto de treinamento reduzindo
não só a expectativa de sua sáida, a média, assim como o grau de incerteza relacionado, a
variância. Esse fato é o oposto do resultado mostrado na Fig. 7! Os resultados para 𝛾 = 5
são mostrados na Fig. 8.
Figura 8 – Regressão por GP para 𝛾 = 5.

12,0 5,0
6,0 2,5
Saída, h̄
Saída, h̄
0,0 0,0
-6,0 -2,5
-12,0 -5,0
-15,0 -7,5 0,0 7,5 15,0 -15,0 -7,5 0,0 7,5 15,0
Entrada, x Entrada, x
(a) 𝜃 = [0,1, 1, 5]⊤ . (b) 𝜃 = [0,8, 1, 5]⊤ .
Como esperado, o aumento do 𝛾 produziu uma saída bem mais suave que o
mostrado na Fig. 6 e com dispersão mínima, principalmente nas redondezas dos pontos
do conjunto de treinamento. Na Fig. 8a, somente o 𝛾 foi alterado. Já para o resultado
mostrado na Fig. 8b, também foi alterado o hiper-parâmetro 𝜎𝑛 para 0,8. Essa variável
representa o grau de dispersão entre o que é desejável aproximar, ℎ, e o que é realmente
observado, ℎ̄. Por essa figura, observa-se que o aumento no valor de 𝜎𝑛 elevou a dispersão da
aproximação já que o aumento desse parâmetro levou o GP a ter menos confiança nos dados
disponíveis, conforme notado pela variância já relativamente elevada nas proximidades do
conjunto de dados a priori e cada vez maior à medida que a entrada se distanciou desses
dados em comparação com a regressão mostrada na Fig. 8a.
Dentro da área de controle, o interesse por GPR está em utilizá-lo como uma
ferramenta com a finalidade de compensar as incertezas e perturbações do sistema. Com
isso, partindo de um conjunto prévio de informações, a GPR irá aprender como esses
efeitos desconhecidos se comportam e assim prever seu valor para uma nova entrada.
3.4 Considerações de Ordem Computacional
Tanto a média quanto a variância a posteriori se baseiam, entre outras operações,

no cálculo da inversa da matriz 𝐵 = 𝐾𝑁 + 𝜎𝑛2 𝐼. Dependendo do tamanho do conjunto de
treinamento D𝑁 , o custo computacional do cálculo da inversa de 𝐵 pode se tornar muito
elevado impossibilitando sua implementação em conjunto com as técnicas de controle
já vistas no capítulo anterior de forma online. A saber, a complexidade computacional
para inversão de uma matriz de ordem 𝑁 calculada pelo Método de Gauss-Jordan2,3 é
de ordem 𝑂(𝑁 3 ) (HIGHAM, 2002, p. 158). A notação 𝑂(.) inicialmente proposta por
Paul Bachmann4 em seu livro Analytische Zahlentheorie (1894) é utilizada não só para
quantificar o grau de precisão de uma função (UTH, 1973, p. 107) como também a ordem
de grandeza da quantidade de operações necessárias (complexidade computacional) de
determinado algoritmo (CHAPRA; CANALE, 2008, p. 209).
Para contornar o problema relacionado à dimensão do conjunto de treinamento,

nesse trabalho foi adotada uma técnica de janelamento da matriz 𝐵. Essa técnica consiste
em ignorar, ou esquecer, todas as entradas de índice menor que 𝑗 − 𝑝, onde 𝑗 é o índice
correspondente ao passo atual e 𝑝 é a ordem da janela de 𝐵 tal que 𝑝 ≤ 𝑁 . Com isso,
percebe-se então que o cálculo da inversa de 𝐵 passa a ser sempre executado com uma
matriz de tamanho constante em 𝑝. Uma das consequências dessa opção é que apenas os
𝑝-termos do conjunto de treinamento D𝑝 mais próximos do passo 𝑗 passam a ser levados
em consideração no cálculo da posteriori.
3.5 Controle de Sistemas Dinâmicos e Regressão por Pro-

cesso Gaussiano
3.5.1 Linearização por Realimentação e GPR
Como mencionado no capítulo anterior, a dificuldade presente no Método de

Linearização por Realimentação está na necessidade de utilizar um modelo muito preciso
no controlador para cancelar as não linearidades presentes no sistema. Foi mencionado
também que modelar com exatidão um sistema real poderia ser um trabalho muito custoso
e até inviável de ser executado. Para o sistema dado pela Eq. 2.13, considere a lei de
controle para o Método de Linearização por Realimentação seguindo a mesma estrutura
2
Wilhelm Jordan (1842-1899) - matemático alemão.
3
Foi citado esse método por ele ser o utilizado nas implementações computacionais com GPR.
4
Paul Gustav Heinrich Bachmann (1837-1920) - matemático alemão.
presente na Eq. 2.3:
^ + 𝑥(𝑛) − 𝑎0 𝑒 − 𝑎1 𝑒˙ − . . . − 𝑎𝑛−1 𝑒(𝑛−1) )

𝑢 = ^𝑏−1 (−𝑓^ − ℎ (3.20)
𝑑
onde ℎ ^ é uma estimativa da perturbação ℎ e cujos coeficientes 𝑎𝑖 podem ser obtidos

utilizando a Eq. 2.5.
A estimativa da perturbação será calculada com base no GPR. Mais precisamente,

será considerado que ℎ^ seja dada (predita) pela média a posteriori definida pela Eq. 3.18a.
Logo, é possível verificar o seguinte lema:
Lema 3.1. Considerando que o GPR aproxime a perturbação ℎ com um certo grau de
^ ≤ 𝜖, então a lei de controle dada pela Eq. 3.20 fará com que o
precisão 𝜖, ou seja, |ℎ − ℎ| {︃ }︃
𝑛 (𝑖) (𝑖 + 1)!
erro convirja para um região fechada 𝐸 = 𝑒 ∈ R | |𝑒 | ≤ 𝜖, 𝑖 = 0, . . . , 𝑛 − 1 .
𝜆𝑛−𝑖
A prova do Lema 3.1 é mostrada no Apêndice B, baseado no trabalho de Tanaka,

Fernandes e Bessa (2013).
O algoritmo 1 mostra como conciliar a técnica de controle por Linearização por

Realimentação com o GPR.
Algoritmo 1: Linearização por Realimentaçao e GPR.

1 Definição das variáveis
2 Especificação do GP a priori (média 𝜇, kernel 𝑘)
3 Definição dos estados iniciais: 𝑥0
4 Inicialização do conjunto de treinamento: D0
5 enquanto 𝑡 ≤ 𝑡𝑓 𝑖𝑚 faça
6 Cálculo da trajetória desejada: 𝑥𝑑
7 Cálculo do erro: 𝑒 = 𝑥 − 𝑥𝑑
8 ^ ← E(ℎ(𝑥* ) | D𝑖−1 )
ℎ
9 Cálculo de ^𝑏, 𝑓^
10 𝑢 ← ^𝑏−1 (−𝑓^ − ℎ ^ + 𝑥(𝑛) − 𝑎0 𝑒 − 𝑎1 𝑒˙ − . . . − 𝑎𝑛−1 𝑒(𝑛−1) )
𝑑
11 Aplicar 𝑢 no sistema
12 Atualizar os estados: 𝑥
13 Cálculo do GP a posteriori: E(ℎ(𝑥* ) | D𝑖 ), V(ℎ(𝑥* ) | D𝑖 )
14 𝑡 ← 𝑡 + Δ𝑡
15 fim
Para demonstrar o efeito da inclusão do compensador por Processo Gaussiano no

controlador por Linearização por Realimentação considere a continução do Exemplo 2.1:
Exemplo 3.2. Controle utilizando Linearização por Realimentação para um manipulador

de junta flexível com compensação por Processo Gaussiano.
Pela Fig. 9, pode-se verificar a convergência do erro de rastreamento para a origem

do plano de fase, o que atesta a melhora na performance do controlador por Linearização
por Realimentação com a inclusão do compensador GPR.
Figura 9 – Plano de fase para o problema de rastreamento de trajetória de um manipulador de

junta flexível utilizando FBL+GPR.
×10−2
10,0
0,0
ėβ [rad/s]
-10,0
-20,0
-30,0 ×10−1
-2,0 0,0 2,0 4,0 6,0
eβ [rad]
Entretanto, como visto no capítulo anterior, o Método de Linearização por Reali-

mentação não traz robustez ao sistema por si só. Um controlador por Modos Deslizantes é
projetado para dar robustez e por isso será o assunto da próxima subseção.
3.5.2 Controle por Modos Deslizantes e GPR
De início, considere que o compensador GPR seja adicionado ao controlador por

SMC para a lei de controle dada pela Eq. 2.24 com o objetivo de minimizar o erro presente
dentro da camada limite:
⊤
(︁ )︁
(𝑛)
𝑢 = ^𝑏−1 −𝑓^ − ℎ
^ + 𝑥 − C̄ 𝑒 − Ksat (𝑠/𝜑)
𝑑 (3.21)
Para isso, que seja feita antes a seguinte consideração:

Consideração 3.2. A perturbação é uma função desconhecida, mas limitada, ou seja,

|ℎ| ≤ 𝛿.
Da Consideração 3.2, pode-se definir um 𝛿 tal que a perturbação esteja contida

dentro de uma região com 95% de confiança. Logo,
√︁
^ + 2 V(ℎ | D)
𝛿 = |ℎ| (3.22)
Aproveitando a dedução já feita no capítulo anterior para a lei de controle por

SMC, pode-se chegar na seguinte expressão para o ganho do controlador:
^ +𝛿
K ≥ 𝜂 + |ℎ| (3.23)
Feitas as definições acima, é possível estabelecer um algoritmo para implementação

do Controlador por Modos Deslizantes com compensação por GP:
Algoritmo 2: Controlador por Modos Deslizantes e GPR.

1 Definição das variáveis
2 Especificação do GP a priori (média 𝜇, kernel 𝑘)
3 Definição dos estados iniciais: 𝑥0
4 Inicialização do conjunto de treinamento: D0
5 enquanto 𝑡 ≤ 𝑡𝑓 𝑖𝑚 faça
6 Cálculo da trajetória desejada: 𝑥𝑑
7 Cálculo do erro: 𝑒 = 𝑥 − 𝑥𝑑
8 ^ ← E(ℎ(𝑥* ) | D𝑖−1 )
ℎ
9 𝑠 ← C⊤𝑒
√︁
10 ^ + 2 V(ℎ(𝑥* ) | D𝑖−1 )
𝛿 ← |ℎ|
11 ^ +𝛿
K ← 𝜂 + |ℎ|
12 Cálculo de ^𝑏, 𝑓^
^ + 𝑥(𝑛) − C̄ ⊤ 𝑒 − Ksat (𝑠/𝜑)
(︁ )︁
13 𝑢 ← ^𝑏−1 −𝑓^ − ℎ 𝑑
14 Aplicar 𝑢 no sistema
15 Atualizar os estados: 𝑥
16 Cálculo do GP a posteriori: E(ℎ(𝑥* ) | D𝑖 ), V(ℎ(𝑥* ) | D𝑖 )
17 𝑡 ← 𝑡 + Δ𝑡
18 fim
Considere a continução do Exemplo 2.2, que leva em conta o controlador SMC

com compensação GPR:
Exemplo 3.3. Controle por Modos Deslizantes de um ROV com compensação por Processo
Gaussiano.
Pela Fig. 10, pode-se verificar novamente que com a utilização da lei de controle
3.21, que leva em conta o compensador GP, foi possível melhorar a performance do
controlador SMC, fato esse atestado pela convergência do erro de rastreamento para a
origem do plano de fase.
Figura 10 – Plano de fase para o problema de rastreamento de trajetória de um ROV utilizando

SMC+GPR.
×10−2
8,0
4,0
Φ
0,0
ė [m/s]
-4,0
-8,0
-12,0
-16,0 ×10−1
-1,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0
e [m]

45
4 Controle de um atuador eletro-

hidráulico: Implementação Numérica
Os atuadores eletro-hidráulicos (AEH) tem sido utilizados em inúmeras aplicações

em virtude de não só poder aplicar forças e torques elevados, mas de também possuir uma
alta razão potência/peso (LIU; ALLEYNE, 1999; SUN; CHIU, 1999; YIM; KIM; CHOI,
2014). Esses dispositivos podem tanto estar incorporados a sistemas automotivos (BALAU;
CARUNTU; LAZAR, 2011) quanto aplicados em exoesquelestos (YANG; HUANG; DONG,
2018) ou no campo aeroespacial (ALTARE; VACCA, 2015).
Por conta das vantagens mecionadas dos AEH, em aplicações que exigem alta
precisão de operação faz-se necessário desenvolver um controlador capaz de fornecer uma
boa performance. Entretanto, os AEH possuem um alto grau de não linearidade por conta
dos efeitos da compressibilidade do fluido, atuação da válvula, atrito, saturação, zona
morta, entre outros (BESSA; DUTRA; KREUZER, 2010a;BESSA; DUTRA; KREUZER,
2010b; YIM; KIM; CHOI, 2014). Em relação aos controladores já implementados para
sistemas eletro-hidráulicos a literatura apresenta diversos exemplos com técnicas de controle
e compensadores para lidar com as não linearidades presentes nos atuadores. Liu e Alleyne
(1999) desenvolveram um algoritmo baseado na Teoria da Estabilidade de Lyapunov para
rastreamento de força de um AEH. Já Sun e Chiu (1999) apresentaram um controlador
utilizando SMC com compensador Proporcional-Integrativo (PI) projetado com base na
informação das pressões atuantes no atuador. Bonchis, Corke e Rye (2002) compararam
experimentalmente diversas técnicas de controle, entre elas o Proporcional-Derivativo
(PD) e controle preditivo. Yanada e Furuta (2007) aliaram controle adaptativo e um
compensador feedforward para estimar a frequência natural de um AEH. Guan e Pan
(2008a) e Guan e Pan (2008b) também utilizaram uma abordagem adaptativa com base
nas variações ocorrentes no volume de controle, mas dessa vez utilizando um controlador
por SMC e controle adaptativo convencional, respectivamente. Bessa, Dutra e Kreuzer
(2010b) utilizaram Lógica Fuzzy como estratégia adaptativa, dentro de um controlador
por SMC, para estimar as incertezas devido ao efeito de uma zona morta desconhecida no
esforço de controle. Skarpetis e Koumboulis (2013) aplicaram uma estratégia robusta a um
controlador Proporcional-Integral-Derivativo (PID). E Liem et al. (2016) também usaram
PID como controlador, aliado dessa vez a Redes Neurais em um contexto feedforward para
melhorar a performance do controlador.
Capítulo 4. Controle de um atuador eletro-hidráulico: Implementação Numérica 46
4.1 Modelo do sistema
Um atuador eletro-hidráulico representado pela Fig. 11, pode ser descrito pelo
conjunto de equações 4.1. Esse sistema de equações diferenciais ordinárias consiste em
uma equação de 2a ordem que governa o movimento da carga submetida (4.1a) e uma
equação de 1a ordem para a variação da queda de pressão (4.1b).
𝐴𝑝 𝑃𝑞 − 𝐹𝑓 − 𝐾𝑥
𝑥¨ = (4.1a)
𝑀
⎛ √︃ ⎞
4𝛽𝑒 ⎝ 𝑃𝑠 − 𝑃𝑞 sgn(𝑢)
𝑃˙𝑞 = 𝐶𝑑 𝜔¯
𝑥𝑠𝑝 − 𝐴𝑝 𝑥˙ − 𝐶𝑡𝑝 𝑃𝑞 ⎠ (4.1b)
𝑉𝑐 𝜌
onde 𝐴𝑝 é a área da seção transversal de cada câmara, supondo que a haste seja passante
no pistão, 𝑃𝑞 é a diferença de pressão no cilindro, 𝐹𝑓 é a força de atrito atuante, 𝐾 é
a rigidez da mola, 𝑀 é a massa total do pistão e da carga submetida, 𝛽𝑒 é o fator de
compressibilidade do fluido, 𝑉𝑐 é o volume total das câmaras, 𝐶𝑑 é o coeficiente de descarga,
𝜔 é o gradiente de área do orifício da válvula, 𝑥¯𝑠𝑝 é o deslocamento efetivo da válvula,
𝑃𝑠 é a pressão de alimentação, 𝜌 é a massa específica do fluido e 𝐶𝑡𝑝 é o coeficiente de
vazamento do fluido que ocorre devido à folga entre o pistão e o cilindro.
Figura 11 – Representação esquemática do atuador eletro-hidráulico.
Fonte: Adaptado de Bessa, Dutra e Kreuzer (2010b).
Pode-se considerar que a tensão de controle (𝑢) é proporcional a 𝑥¯𝑠𝑝 assumindo

que a dinâmica da válvula é tão rápida a ponto de ser desprezada.
Bessa, Dutra e Kreuzer (2010b) adicionam como não linearidade ao AEH o efeito
de zona morta. Santos (2018) justifica essa zona morta pelo fato dela permitir que a
posição do cilindro seja mantida constante devido ao não vazamento do fluido durante
a mudança de posição da válvula. Dito isso, o deslocamento efetivo da válvula pode ser
representado pela seguinte expressão, considerando o efeito de zona morta,
𝑥¯𝑠𝑝 = 𝑘𝑣 (𝑢)[𝑢 − 𝑑(𝑢)] (4.2)
onde,
⎧
⎨ 𝑘𝑙 , 𝑢 ≤ 0
𝑘𝑣 (𝑢) = (4.3)
⎩ 𝑘𝑟 , 𝑢 > 0
e,
⎧
⎪
⎪
⎪
⎨
𝛿𝑙 , 𝑢 ≤ 𝛿𝑙
𝑑(𝑢) = 𝑢, 𝛿𝑙 < 𝑢 < 𝛿𝑟 (4.4)
⎪
⎪
𝛿𝑟 𝑢 ≥ 𝛿𝑟
⎪
⎩
Graficamente a zona morta pode ser visualizada pela Fig. 12. Fica claro que essa
não linearidade implica em uma região de tensão de controle que não produz abertura na
válvula impedindo o fluxo do fluido hidráulico.
Figura 12 – Zona Morta.
Também, Xiwei, Fei e Wei (2017) e Santos (2018) sugerem utilizar o modelo de
atrito de Stribeck1 . Segundo Santos (2018), esse modelo é adequado quando o movimento
1
Richard Stribeck (1861-1950) - Engenheiro mecânico alemão.
é realizado em velocidades baixas. A representação desse efeito pode ser visualizada na

Fig. 13.
Figura 13 – Modelo de atrito de Stribeck.
Ff [N]
0.0
0.0
ẋ [m/s]
O modelo de Stribeck é representado pela equação

⎧
⎨ min(|𝐴𝑝 𝑃𝑞 |, 𝐹𝑠 )sgn(𝐴𝑝 𝑃𝑞 ) 𝑥˙ = 0
𝐹𝑓 = −( − 𝑥˙ 2 (4.5)
⎩ (𝜇𝑐 𝐹𝑛 + (𝐹𝑠 − 𝜇𝑐 𝐹𝑛 )𝑒 𝑣𝑠 ) )sgn(𝑥) ̸ 0
˙ + 𝐵 𝑥˙ 𝑥˙ =
onde 𝜇𝑐 é o coefiente de atrito de Coulomb2 , 𝐹𝑛 é a força normal entre as superfícies, 𝐹𝑠 é a

força de atrito estático, 𝑣𝑠 é o coeficiente de Stribeck e 𝐵 é o coeficiente de amortecimento
viscoso.
O conjunto de equações 4.1 caracteriza um sistema de 3a ordem que pode ser

escrito genericamente na forma
...
𝑥 = 𝑓 (𝑥) + 𝑏(𝑥)[𝑢 − 𝑑(𝑢)] (4.6)
4.2 Derivador por Modos Deslizantes
Na simulação realizada foi considerado que apenas a posição do atuador seria

mensurável diretamente. Entretanto, para o desenvolvimento do controlador, foi con-
siderado que todos os estados 𝑥 são conhecidos (Consideração 2.1). Para isso, Bessa
(2005) e Santos (2018) têm utilizado um método de derivação por modos deslizantes de
segunda ordem (2-SMD, do inglês Second-order Sliding Mode Differentiator) para obter os
2
Charles-Augustin de Coulomb (1763-1806) - Físico e engenheiro militar francês.
estados necessários a partir de um determinado dado. Tanto do ponto de vista teórico

(LEVANT, 2003) quanto experimental (PISANO; USAI, 2004) essa técnica de diferenciação
dos estados apresentou ótimo desempenho.
Essa técnica consiste em estimar o sinal 𝜉˙0 de um sinal 𝑥 = 𝑓 (𝑡) de modo que a
igualdade 𝜉0 − 𝑥 = 0 seja válida ∀𝑡 ≥ 𝑡𝜉0 dentro de um intervalo de convergência 0 ≤ 𝑡 ≤ 𝑡𝜉0 .
Assim sendo, definindo o erro 𝜉˜ = 𝜉0 − 𝑥, a derivada de 𝑓 (𝑡) pode ser estimada através
das seguintes equações:
˜ 12 sgn(𝜉)
𝜉˙0 = 𝜉1 − P0 |𝜉| ˜ (4.7a)
𝜉˙1 = −P1 sgn(𝜉)

˜ (4.7b)
onde a convergência do algoritmo será dada quando,
P1 > C (4.8a)
P1 + C
P02 > 4C (4.8b)
P1 − C
onde C é uma constante associada à função de Lipschitz3 𝑓˙.
Definição 4.1. Uma função 𝑓 : X → R é dita de Lipschitz se existir uma constante C > 0,
tal que 𝑥, 𝑦 ∈ X ⇒ |𝑓 (𝑥) − 𝑓 (𝑦)| ≤ C |𝑥 − 𝑦| (LIMA, 2004, pp. 83).
Exemplo 4.1. Aplicação do método de diferenciação numérica.
Para mostrar a aplicação do método considere que se deseja estimar a derivada

de duas funções utilizando 2-SMD. As funções são 𝑓1 (𝑡) = 2(1 − cos(2𝜋𝑡/15)) e 𝑓2 (𝑡) =
2(1 − cos(2𝜋𝑡/15)) + 0,002 sin(4𝜋𝑡). O Método de Runge-Kutta de 4a ordem foi utilizado
para resolver a Eq. 4.7. A linguagem C++ foi utilizada para computar as simulações com
uma taxa de amostragem de 10 kHz e um tempo de simulaçao de 30 s. Os parâmetros
adotados foram C = 0,3, P1 = 0,301 e P0 = 214,84.
Para todas simulações realizadas nesse capítulo foram considerados os seguintes

parâmetros no derivador da posição: C = 0,15, P1 = 0,16 e P0 = 8,625. Para o derivador da
velocidade: C = 0,1, P1 = 0,2 e P0 = 4,929. E para o derivador da aceleração: C = 0,0009,
P1 = 0,0019 e P0 = 0,401.
3
Rudolf Otto Sigismund Lipschitz (1832–1903) – Matemático alemão.
Figura 14 – Resultados para simulação do 2-SMD.

1,5
1,5 Desejado
Desejado Obtido
Obtido 1,0
1,0
0,5
f˙2, ξ˙0
0,5
f˙1, ξ˙0
0,0
0,0
-0,5
-0,5
-1,0
-1,0 0 5 10 15 20 25 30
0 5 10 15 20 25 30
t [s]
t [s]
(b) 𝑓˙2 (𝑡) = 4𝜋/15 sin(2𝜋𝑡/15) +
(a) 𝑓˙1 (𝑡) = 4𝜋/15 sin(2𝜋𝑡/15)
0,008𝜋 cos(4𝜋𝑡)

4.3 Controle utilizando FBL+GPR
Para um sistema de 3a ordem, a lei de controle pelo método de Linearização

por Realimentação com compensação por processo gaussiano, baseando-se na Eq. 3.20 é
apresentada na seguinte forma:
^ + ...
𝑢 = ^𝑏−1 (−𝑓^ − ℎ 𝑒 − 3𝜆2 𝑒˙ − 𝜆3 𝑒)
𝑥 − 3𝜆¨ (4.9)
Os parâmetros utilizados do modelo apresentado pelas Eq. 4.1, 4.2 e 4.5 foram:
𝐴𝑝 = 1,13 · 10−3 m2 , 𝐹𝑠 = 400 N, 𝜇𝑐 = 0,8, 𝐹𝑛 = 100 N, 𝑣𝑠 = 0,07 m/s, 𝐵 = 1000 Ns/m,
𝐾 = 0, 𝑀 = 250 kg, 𝛽𝑒 = 700 MPa, 𝑉𝑐 = 2,26 · 10−3 m3 , 𝐶𝑑 = 0,6, 𝜔 = 2,5 · 10−2 m,
𝑘𝑙 = 𝑘𝑟 = 2·10−6 m/V, 𝛿𝑙 = −1,2 V, 𝛿𝑟 = 1 V, 𝑃𝑠 = 7 MPa, 𝜌 = 850 kg/m3 e 𝐶𝑡𝑝 = 2·10−12 .
Também foi considerado que o sinal enviado para a válvula não poderia ultrapassar ±10 V.
A trajetória desejada para o atuador foi posta da seguinte forma, para um tempo
total de simulação de 150 s:
⎧
⎪
⎪
⎪
⎪
0,04, 0 ≤ 𝑡 ≤ 30
⎪
0,16, 30 ≤ 𝑡 ≤ 60
⎪
⎪
⎪
⎪
⎨
𝑥𝑑 [𝑚] =
⎪
0,08, 60 ≤ 𝑡 ≤ 90 (4.10)
⎪
0,12, 90 ≤ 𝑡 ≤ 120
⎪
⎪
⎪
⎪
⎪
⎪
0,06, 120 ≤ 𝑡 ≤ 150
⎪
⎩
Assumindo que seja total o desconhecimento acerca do comportamento dinâmico

do sistema, foi posto que 𝑓^ = 0. Além disso, foi considerado ^𝑏 = 1 e 𝜆 = 5 na lei de
controle. Na simulação foi considerada uma taxa de amostragem do controlador de 35 Hz
e do simulador de 1 kHz. Essa diferença de frequências tem o objetivo de simular o tempo
gasto entre o envio do sinal de controle e a leitura da posição.
Na implementação do GPR foi considerado que a janela da matriz de covariância

...
tem dimensão 𝑝 = 20. Como entrada foi inicialmente utilizada a variável 𝑢^ = ^𝑏−1 (−𝑓^+ 𝑥 −
𝑒 − 3𝜆2 𝑒˙ − 𝜆3 𝑒), similar ao utilizado por Bessa, Dutra e Kreuzer (2010a) e Bessa, Dutra
3𝜆¨
e Kreuzer (2010b) como entrada no compensador fuzzy. Para esse caso, os hiperparâmetros
utilizados foram 𝜃 = [1; 1; 0,15]. Os dessa simulação são apresentados na Fig. 15.
Figura 15 – Resultados para simulação utilizando FBL e FBL com compensação GPR utilizando
entrada 𝑢
^ e 𝜃 = [1; 1; 0,15].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
(a) Rastreamento de Trajetória. (b) Esforço de controle.
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
(c) Compensador obtido pela GPR com in-
tervalo de confiança de 95%.
Como pode-se notar pela Fig. 15a, a inclusão do compensador melhorou a perfor-
mance do controlador por linearização por realimentação no que se refere ao rastreamento
de trajetória conduzindo, inclusive a uma convergência mais rápida se comparado ao uso
do controlador FBL puro. Entretanto, a inclusão do compensador por GPR levou a pontos
de saturação no atuador durante os breves períodos de convergência à posição desejada,
como mostrado pela Fig. 15b. Além disso houve dois momentos de oscilação no esforço de
controle, em períodos que o atuador já se encontrava na posição desejada. Esse fenômeno
é reflexo da saída da regressão por GP, conforme mostrado pela Fig. 15c.
Além da entrada 𝑢^ foi testada como entrada uma variável de erro combinada
inspirada no controlador por modos deslizantes, a variável 𝑠, que para o sistema em questão
pode ser calculada por 𝑠 = 𝑒¨ + 2𝜆𝑒˙ + 𝜆2 𝑒. Os parâmetros do controlador foram idênticos
aos da simulação passada com exceção dos hiperparâmetros 𝜃 = [0,8; 1; 0,1]. Os resultados
para essa nova simulação são mostrados na Fig. 16.
entrada 𝑠 e 𝜃 = [0,8; 1; 0,1].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]
Como novamente verifica-se pela Fig. 16a, a inclusão do compensador GPR com
entrada 𝑠 melhorou a performance do controlador em relação ao FBL puro. Contudo,
diferentemente do que foi observado no caso anterior, não houve oscilações excessivas no
esforço de controle. Além disso, no rastreamento de trajetória, houve a ocorrência de
pequenos overshoots de aproximadamente 4% em relação a posição de estabilização.
Por último, para o controlador FBL, foi testado também o caso das entradas
simultâneas 𝑠 e 𝑢^. Para esse caso, novamente, a única modificação em relação aos
parâmetros utilizados foram em 𝜃 = [0,8; 1; 0,15]. Os resultados para esse caso estão
contidos na Fig. 17.
Como é possível verificar pela Fig. 17a, o compensador com entrada 𝑠 e 𝑢^ melhorou
a performance do controlador FBL, conduzindo a uma notável melhora no rastreamento de
entrada (𝑠, 𝑢
^) e 𝜃 = [0,8; 1; 0,15].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

trajetória e, repetindo o que ocorreu com entrada 𝑢^, sem overshoot em relação a posição
desejada. Assim como também foi percebido no caso com entrada 𝑢^, o compensador GPR,
mostrado na Fig. 17b, induziu oscilações no esforço de controle.
4.4 Controle utilizando SMC+GPR
No caso do controlador SMC para um sistema de 3a ordem, pode-se utilizar a Eq.

3.21 na seguinte forma:
^ + ...
(︁ )︁
𝑢 = ^𝑏−1 −𝑓^ − ℎ 𝑒 − 𝜆2 𝑒˙ − Ksat (𝑠/𝜑)
𝑥 𝑑 − 2𝜆¨ (4.11)
com o ganho K sendo obtido pela Eq. 3.2.
Os valores das variáveis do modelo foram os mesmos da seção anterior, assim

como a trajetória desejada. No controlador foi também utilizado o valor de 𝜆 = 5. Além
disso foi colocado que 𝜂 =0,1 e 𝜑 = 1. Para o SMC convencional foi utilizado também
𝛿 = 6.
^ + ...
Os resultados para a simulação considerando a entrada 𝑢^ = ^𝑏−1 (−𝑓^ − ℎ 𝑥𝑑 −
2
𝑒 − 𝜆 𝑒)
2𝜆¨ ˙ e os hiper-parâmetros 𝜃 = [1; 1; 0,15] são mostrados na Fig. 18.
Figura 18 – Resultados para simulação utilizando SMC e SMC com compensação GPR utilizando
entrada 𝑢
^ e 𝜃 = [1; 1; 0,15].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

Como observado pela Fig. 18a, a inclusão do compensador melhorou consideravel-

mente o rastreamento do controlador. E, diferentemente do que ocorreu no caso anterior,
o SMC produziu um sinal de controle com menos oscilações, Fig. 18b. Na Fig. 18c é
mostrada a saída do compensador GPR e o seu respectivo desvio.
Agora considerando a entrada 𝑠, foi realizada uma nova simulação com os pa-
râmetros GP definidos como 𝜃 = [0,8; 1; 0,1]. Os resultados podem ser vistos na Fig.
19.
Como observado pela Fig. 19a, o rastreamento foi melhorado por conta da inclusão
do compensador. Assim como no caso do controlador por linearização por realimentação,
o controle ocorreu mais suavemente que o correspondente com entrada 𝑢^.
Por fim, para a entrada combinada (𝑠, 𝑢^) e parâmetros do GP 𝜃 = [0,8; 1; 0,15] os
resultados são mostrados na Fig. 20.
entrada 𝑠 e 𝜃 = [0,8; 1; 0,1].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

Constata-se novamente a melhora da performance do controlador por conta da
inclusão do compensador GP com entrada (𝑠, 𝑢^), Fig. 20a. A diferença desse resultado em
relação aos demais foi o aumento do chattering no esforço de controle, Fig. 20b, reflexo da
saída do GPR mostrada na Fig. 20c.
4.5 Análise comparativa
As simulações realizadas nas duas seções anteriores foram representativas para

demonstrar o efeito do compensador obtido pela regressão por Processo Gaussiano com as
lei de controle FBL e SMC. De forma gráfica foram realizadas análises das propostas de
controles feitas em comparação com os controladores convencionais. Entretanto, pode-se
também recorrer a métricas de cálculo de erro médio e de esforço de controle para fins de
comparação entre as distinstas abordagens utilizadas. Para isso foram utilizadas um total
de 7 métricas apresentadas abaixo:
𝑛
1 ∑︁
𝑚1 = |𝑒𝑖 | (4.12a)
𝑛 𝑖=1
entrada (𝑠, 𝑢
^) e 𝜃 = [0,8; 1; 0,15].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

⎯
𝑛
⎸ 1 ∑︁
⎸
𝑚2 = ⎷ 𝑒2 𝑖 (4.12b)
𝑛 𝑖=1
∫︁ 𝑡𝑓 𝑖𝑚
𝑚3 = |𝑒|𝑑𝑡 (4.12c)
0
𝑚4 = 𝑒2 𝑑𝑡 (4.12d)
0
𝑚5 = |𝑢|𝑑𝑡 (4.12e)
0
𝑛
1 ∑︁
𝑚6 = |𝑢˙ 𝑖 | (4.12f)
𝑛 𝑖=1
𝑚7 = 𝑡2 |𝑒|𝑑𝑡 (4.12g)
0
Também foram feitas simulações alterando os parâmetros do GP juntamente com

as entradas. Para isso foi utilizada a seguinte estrutura:
∙ Sim. 1 - Controlador FBL convencional;
∙ Sim. 2 - Controlador SMC convencional;
∙ Sim. 3, 4 e 5 - Controlador FBL+GPR com entradas 𝑢^, 𝑠 e (𝑠, 𝑢^), respectivamente;
∙ Sim. 6, 7 e 8 - Controlador SMC+GPR com entradas 𝑢^, 𝑠 e (𝑠, 𝑢^), respectivamente;
∙ Em todas as×10
simulações
2 foi considerado 𝜎𝑓 = 1;
∙ 𝜎𝑛 =0,8 para simulações de índice 𝑎, 𝑏, e 𝑐, 𝜎𝑛 =1 para simulações de índice 𝑑, 𝑒, e ×10

𝑓 e 𝜎𝑛 =1,2 para simulações de índice 𝑔, ℎ, e 𝑖;
∙ 𝛾 =0,05 para simulações de índice 𝑎, 𝑑, e 𝑔, 𝛾 =0,1 para simulações de índice 𝑏, 𝑒, e

ℎ e 𝛾 =0,15 para simulações de índice 𝑐, 𝑓 , e 𝑖.
Os parâmetros do controlador utilizados foram idênticos aos casos mostrados

nas seções anteriores. Para avaliar a proposta de controlador em relação ao esforço de
controle e erro de rastreamento foram plotadas as métricas 𝑚7 (eixo 𝑥) por 𝑚5 (eixo 𝑦).
O resultado disso pode ser visualizado na Fig. 21. Os valores númericos de cada métrica
para cada simulação encontram-se no Apêndice C.
Figura 21 – Representação gráfica das métricas 𝑚7 e 𝑚5 para as simulações.

2
3,5 ×10
2
1,75 ×10
3,0
1,50
2,5
1,25
|u|dt [Vs]
2,0
1,00 ×103
1,40 1,65 1,90 2,15 2,40
1,5
R
1,0
Sim. 1 Sim. 5a,b,c,d,e
f,g,h,i
Sim. 2 Sim. 6a,b,c,d,e
f,g,h,i
0,5 Sim. 3a,b,c,d,e Sim. 7a,b,c,d,e
f,g,h,i f,g,h,i
Sim. 4a,b,c,d,e Sim. 8a,b,c,d,e
f,g,h,i f,g,h,i
0,0 ×103
1,0 2,0 3,0
R 4,0 5,0 6,0
t |e|dt [m·s ]
2 3

Como observado pela Fig. 21, todas as simulações realizadas podem ser vistas
graficamente à esquerda das técnicas convencionais, caracterizando que em relação a esses
controladores, para as variações dos parâmetros do Processo Gaussiano e das entradas
do processo de regressão, os resultados obtidos conseguiram ser superiores. Além disso,
pode-se observar que, para pequenas variações nos parâmetros do compensador, houve
uma dispersão razoável dos rastreamentos e do esforço de controle. Pode-se também
concluir a partir desse gráfico que os resultados referentes à entrada 𝑠 para o controlador
FBL foram melhores em relação as demais entradas por eles ficarem bem concentrados
numa região de menor esforço de controle e menor erro de rastreamento. Em relação ao
controlador SMC, a princípio pode-se inferir que os resultados com entrada 𝑠 e (𝑠, 𝑢^) foram
melhores em aspectos distintos. Os resultados da Sim. 7 foram os que apresentaram a
menor métrica de esforço de controle em relação a todos os demais (incluindo o FBL)
enquanto os da Sim. 8 teve alguns resultados com o menor erro de rastreamento em relação
a todos os demais. Entretanto, ainda vê-se que os resultados com entrada combinada,
no geral, ficaram dispersos em relação aos demais, inclusive com alguns deles tendo os
maiores valores de 𝑚5 , enquanto os de entrada 𝑠 ficarem mais concentrados e conseguindo
ainda bons resultados (em comparação aos demais) com respeito a métrica 𝑚7 .
59
5 Controle de um atuador eletro-

hidráulico: Implementação Experi-
mental
5.1 Descrição da bancada
A plataforma experimental utilizada, mostrada na Fig. 22 é composta por: (1)

unidade hidráulica, (2) cilindro hidráulico de dupla ação, (3) potenciômetro linear, (4)
servo-válvula proporcional de quatro vias e três posições, (5) placa de aquisição de dados
da ADVANTECH, modelo USB-4711A, (6) regulador de tensão, (7) fonte de tensão e (8)
amplificador de tensão. Com exceção ao item (5), todos os demais equipamentos fazem
parte da linha didática da FESTO.
Figura 22 – Bancada experimental.

3
7 4
5 6 8
A unidade hidráulica bombeia o fluido (ISO VG 46) através de conexões ligadas à

Capítulo 5. Controle de um atuador eletro-hidráulico: Implementação Experimental 60
servo-válvula. Esta, por sua vez, é atuada através de solenoides que promovem o movimento
de seu carretel. O cilindro hidráulico possui um curso máximo de 20 cm e possui conexões
com a servo-válvula. O cartão de amplificação, responsável por transformar a tensão
fornecida na corrente necessária para o controle, recebe o sinal da placa de aquisição de
sinais. O potenciômetro linear, que recebe uma tensão máxima de 10 V do regulador
de tensão, envia o seu sinal para a placa ADVANTECH. Este por sua vez conectado ao
computador por uma conexão USB. Através de um código computacional implementado
em C++, a tensão obtida pela lei de controle é enviada para a placa de aquisição e dele
para o amplificador de sinal.
Com o potenciômetro linear é possível apenas medir a posição do atuador. Para

obter os demais estados foi utilizado o Derivador por Modos Deslizantes apresentado no
capítulo anterior. Além disso, como o sinal obtido pelo potenciômetro possui um ruído
capaz de prejudicar o processo de derivação e até mesmo de interferir na ação de controle,
foi utilizado um filtro passa-baixas de primeira ordem para poder atenuar esse efeito.
5.2 Filtro passa-baixa
É comum que os sistemas de instrumentação utilizados para obter determinado

estado forneçam suas medidas acrescidas de ruído de alta-frequência. Santos (2018) sugere
a utilização de um filtro passa-baixas para eliminar ou minimizar esse ruído. A expressão
para esse filtro é dada por:
𝑥˙ 𝑓 = 𝛼0 𝑥 − 𝛼1 𝑥𝑓 (5.1)
onde 𝑥𝑓 é o sinal filtrado de 𝑥 e 𝛼0 e 𝛼1 são constantes positivas.
Para avaliar o desempenho desse filtro foi feita uma simulação em C++. A função
a ser derivada foi 𝑥(𝑡) = 2(1 − cos(2𝜋𝑡/15)) + 𝜎, onde 𝜎 representa o ruído de média nula
e desvio-padrão de 0,4. A taxa de amostragem foi de 100 Hz com tempo de simulação
de 30 s. As constantes utilizadas foram 𝛼0 = 𝛼1 = 3,3. O Método de Runge-Kutta de 4a
ordem foi utilizado para reolver a Eq. 5.1. O resultado é mostrado na Fig. 23.
Pode-se observar que o filtro aplicado desempenha bem seu papel em relação a
redução do nível de ruído, entretanto produziu um leve atraso (delay) no sinal. Portanto,
o uso desse filtro deve ser bem moderado buscando sempre uma redução do ruído com o
menor atraso possível.
A Fig. 24 mostra um esquema geral da implementação do controlador no sistema

Figura 23 – Resultados para simulação de um filtro passa-baixa.

5,0
Sinal ruidoso
Sinal filtrado
4,0
3,0
x, xf
2,0
1,0
0,0
0 5 10 15 20 25 30
t [s]

do atuador eletro-hidráulico.
Figura 24 – Diagrama de blocos simplificado do procedimento experimental.
xd e u Planta x
Controlador Servo-válvula
eletro-hidráulica
xf
Filtro Potenciômetro
ẋf d
Filtro dt
ẍf d
dt
5.3 Controle utilizando FBL+GPR
Primeiramente foi testado o controlador por Linearização por Realimentação

cuja lei de controle é dada pela Eq. 4.9. A trajetória desejada foi a mesma utilizada
na simulação dada pela Eq. 4.10. Foram novamente testadas três tipos de entradas
distintas no compensador obtido pelo Processo Gaussiano: 𝑢^, 𝑠 e (𝑠, 𝑢^). Os parâmetros do
controlador utilizados em todos os casos foram ^𝑏 = 1, 𝑓^ = 0 e 𝜆 = 5.
...
Para o primeiro caso, com entrada 𝑢^ = ^𝑏−1 (−𝑓^ + 𝑥 − 3𝜆¨ 𝑒 − 3𝜆2 𝑒˙ − 𝜆3 𝑒), foi no
GP os parâmetros 𝜃 = [𝜎𝑛 , 𝜎𝑓 , 𝛾]⊤ = [1; 1; 0,15]. Os resultados são mostrados na Fig. 25.
Como constatado pela Fig. 25a, a inclusão do compensador GPR melhorou

Figura 25 – Resultados para o experimento utilizando FBL e FBL com compensação GPR
utilizando entrada 𝑢
^ e 𝜃 = [1; 1; 0,15].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

consideravelmente o rastreamento de trajetória fazendo convergir a posição do atuador
para as posições desejadas. Pela Fig. 25b, observa-se que durante breves momentos houve
saturação no esforço de controle seguido por curtos momentos de chattering. Essa oscilação
no esforço de controle se reflete na saída do GP, mostrada na Fig. 25c, juntamente com a
região de variância de 95%.
Já para o caso com entrada 𝑠, os resultados são mostrados na Fig. 26. Os

parâmetros do GP utilizados aqui foram 𝜃 = [0,8; 1; 0,05].
O resultado obtido neste caso foi bem similar ao anterior. A inclusão do compen-
sador cumpriu seu objetivo de melhorar a performance do controlador, conforme pode ser
obervado pela Fig. 26a. Ocorreram curtos períodos de saturação no esforço de controle,
Fig 26b, e pequenas oscilações após o momento esse momento de pico no sinal de tensão
enviado, reflexo da saída do GP, Fig. 26c.
Já para a entrada combinada (𝑠, 𝑢^), cujos os resultados são mostrados na Fig. 27,
os parâmetros do GP utilizados foram 𝜃 = [0,8; 1; 0,1].
Repete-se a melhora no rastreamento de trajetória observada também nos dois

utilizando entrada 𝑠 e 𝜃 = [0,8; 1; 0,05].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

casos anteriores por conta da inclusão do compensador GP, conforme pode ser visto na Fig.
27a. Ao efetuar o movimento de aproximação do estado desejado, o atuador alcança picos
de tensão, saturados em ±10 V, conforme pode ser observado pela Fig. 27b. Sem contar
também os momentos de oscilação no sinal de controle, que também pode ser observado
no gráfico da saída do GP (Fig. 27c).
5.4 Controle utilizando SMC+GPR
No caso do controlador por Modos Deslizantes, cuja lei de controle é dada pela
Eq. 4.11 e o ganho pela Eq. 3.2, os parâmetros utilizados foram ^𝑏 = 1, 𝑓^ = 0 e 𝜆 = 5,
𝜂 =0,1, 𝜑 = 1 e 𝛿 = 6.
Para o primeiro experimento com esse controlador, utilizando entrada 𝑢^ =

^ + ...
^𝑏−1 (−𝑓^ − ℎ 𝑒 − 𝜆2 𝑒),
𝑥 𝑑 − 2𝜆¨ ˙ foram utilizados os hiper-parâmetros 𝜃 = [1,2; 1; 0,1].
Os resultados estão na Fig. 28.
Como é possível observar pela Fig. 28a, a inclusão do compensador GPR melhorou
utilizando a entrada (𝑠, 𝑢
^) e 𝜃 = [0,8; 1; 0,1].
−2 15,0
20,0 ×10 FBL
Desejado FBL+GPR
FBL 10,0
16,0 FBL+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

a performance do controlador SMC fazendo com que o atuador atingisse o estado desejado.
Pode-se notar também que no regime transitório o atuador ou oscila por um breve momento
ou faz uma pequena parada antes de atingir o estado desejado. A provável causa para essa
oscilação é o efeito windup presente na tensão enviada para o atuador, como observado
pela Fig. 28b onde nos instantes imediamente posteriores a 30 s e 60 s a tensão de entrada
fica saturada por tempo superior aos demais momentos similares. Já o atraso em relação
a convergência ao estado desejado em outros momentos pode relacionado a zona morta do
atuador. Por exemplo, por volta do instante de 100 s pode ser observado que existe um
pico local na saída do GP, Fig. 28c, que por sua vez se reflete no esforço de controle, onde
justamente por volta desse tempo, a tensão enviada passa do sinal obtido pelo controlador
SMC convencional, em que este último provavelmente não foi sido capaz de superar a zona
morta.
Os resultados considerando a entrada 𝑠 são mostrados na Fig. 29. Os parâmetros

do GP dessa vez utilizados foram 𝜃 = [1,2; 1; 0,1].
Como pode ser visto pela Fig. 29a, a performance do controlador, em relação ao
rastreamento, foi melhorada graças a inclusão do compensador gaussiano. Pode-se notar
Figura 28 – Resultados para o experimento utilizando SMC e SMC com compensação GPR
utilizando a entrada 𝑢
^ e 𝜃 = [1,2; 1; 0,1].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]

também que a convergência não ocorreu de forma suave, mas através de pequenos saltos
até atingir o estado desejado. Isso deve ser por conta do controlador passar repetidamente
pela zona morta e, devido a participação do compensador GPR cuja saída é mostrada na
Fig. 29c, oscilar para fora dessa zona de não atuação no sistema, conforme observado pela
Fig. 29b.
Já para a entrada conjunta (𝑠, 𝑢^) foram considerados os parâmetros 𝜃 = [1,2; 1; 0,05].
Os resultados podem ser visualizados na Fig. 30.
Como pode ser visto na Fig. 30a e como já também foi observado nos experimen-
tos passados, a posição do atuador atingiu os estados desejados devido a influência do
compensador GPR no controlador. Entretanto, dos resultados obtidos até agora com o
SMC, o esforço de controle enviado durante o regime transitório foi o que aparentou ter
mais oscilações, como pode ser observado na Fig. 30b. Essas oscilações são reflexo da
saída do compensador mostrada na Fig. 30c.
utilizando a entrada 𝑠 e 𝜃 = [1,2; 1; 0,1].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]


5.5 Análise Comparativa
Os experimentos mostrados até agora tiverem caráter representativo para mostrar

a influência do compensador gaussiano nas técnicas de controle mostradas. A análise
até agora foi feita de forma separada entre os resultados em si com apontamentos feitos
sobre as mudanças mais significativas entre as respostas obtidas. Pode ser feita também
uma análise comparativa entre os controladores e diferentes entradas e parâmetros na
compensação por GP utilizando métricas relacionadas ao erro de rastreamento e esforço de
controle. Para isso foram utilizadas as métricas dadas pelas Eqs. 4.12. Para a variação dos
parâmetros e entradas do GP foi utilizada a seguinte nomenclatura para os experimentos
realizados:
∙ Exp. 1 - Controlador FBL convencional;
∙ Exp. 2 - Controlador SMC convencional;
∙ Exp. 3, 4 e 5 - Controlador FBL+GPR com entradas 𝑢^, 𝑠 e (𝑠, 𝑢^), respectivamente;
∙ Exp. 6, 7 e 8 - Controlador SMC+GPR com entradas 𝑢^, 𝑠 e (𝑠, 𝑢^), respectivamente;

utilizando a entrada (𝑠, 𝑢
^) e 𝜃 = [1,2; 1; 0,05].
−2 15,0
20,0 ×10 SMC
Desejado SMC+GPR
SMC 10,0
16,0 SMC+GPR
5,0
12,0
u [V]
x [m]
0,0
8,0
-5,0
4,0 -10,0
0,0 -15,0
0 30 60 90 120 150 0 30 60 90 120 150
t [s] t [s]
10,0
5,0
ĥ [m/s3]
0,0
-5,0
-10,0
0 30 60 90 120 150
t [s]


∙ Em todos os experimentos foi considerado 𝜎𝑓 = 1;
∙ 𝜎𝑛 =0,8 para os experimentos de índice 𝑎, 𝑏, e 𝑐, 𝜎𝑛 =1 para os experimentos de

índice 𝑑, 𝑒, e 𝑓 e 𝜎𝑛 =1,2 para os experimentos de índice 𝑔, ℎ, e 𝑖;
∙ 𝛾 =0,05 para os experimentos de índice 𝑎, 𝑑, e 𝑔, 𝛾 =0,1 para os experimentos de

índice 𝑏, 𝑒, e ℎ e 𝛾 =0,15 para os experimentos de índice 𝑐, 𝑓 , e 𝑖.
Os valores das métricas obtidas para cada experimento estão nas tabelas contidas
no Apêndice D. Para visualizar a diferença entre cada um dos experimentos realizados
foram plotadas as métricas 𝑚7 (eixo x) por 𝑚5 (eixo y). Foram consideradas essas duas
medidas por elas indicarem o quanto foi gasto em energia durante todo o experimento, no
caso de 𝑚5 , e o erro absoluto total ponderado pelo instante de tempo para realçar o efeito
do regime permanente sobre o transiente. Essa representação está mostrada na Fig. 31.
Pela Fig. 31, primeiramente observa-se que a inclusão do compensador, em relação

ao erro de rastreamento, foi benéfica em todos os experimentos deixando os resultados
obtidos pelos controladores convencionais à direita do gráfico. Inclusive, observa-se que,
para o mesmo nível de esforço de controle, o SMC convencional conseguiu ser superior
Figura 31 – Representação gráfica das métricas 𝑚7 e 𝑚5 para os experimentos.

70
Exp. 1 Exp. 3a,b,c,d,e Exp. 5a,b,c,d,e Exp. 7a,b,c,d,e
f,g,h,i f,g,h,i f,g,h,i
Exp. 2 Exp. 4a,b,c,d,e Exp. 6a,b,c,d,e Exp. 8a,b,c,d,e
60 f,g,h,i f,g,h,i f,g,h,i
50
16
|u|dt [Vs]
40
12
30
R
8 ×102
20 1,8 2,2 2,6 3,0
10
0 ×102
1,0 2,0 3,0 4,0 R 5,0 6,0 7,0 8,0 9,0 10,0
t |e|dt [m·s ]
2 3

ao FBL. Agora vendo pelos resultados com a proposta de controlador, foi observada uma
distribuição similar aos obtidos computacionalmente. Por exemplo, para o caso FBL,
nota-se que os resultados considerando a entrada 𝑠 ficaram mais concentrados à esquerda
dos demais, caracterizando menor erro total de rastreamento, e também que os resultados
com entrada 𝑢^ e (𝑠, 𝑢^) estarem bem próximos uns dos outros. Já para os resultados com
SMC, foi observado algo diferente. Quando na simulação foi apontado que a entrada 𝑠
minimizou o esforço de controle, aqui a entrada 𝑢^ conseguiu esse resultado. Além disso,
para o caso do experimento Exp. 7c foi obtido um valor de 𝑚5 de aproximadamente 5
vezes os demais resultados. Para esse caso a métrica 𝑚6 , que indica o nível de chattering
no esforço de controle, foi cerca de 30 vezes maior que seus pares, como observado pela
Tab. 13. Esse resultado indica o quão sensível a regressão pelo Processo Gaussiano pode se
tornar com as mudanças de seus hiper-parâmetros e seu consequente impacto no controle.
69
6 Considerações finais
Controle de sistemas dinâmicos não lineares têm se mostrado cada vez mais um
desafio de engenharia devido à alta complexidade dos processos envolvidos e, conquente-
mente, dos sistemas operados. Técnicas de controle linear vêm cada vez mais perdendo
espaço por conta de sua baixa performance em ocasiões fora de seu padrão de operação.
Técnicas robustas e capazes de estimar ou até prever a dinâmica não modelada de sistemas
com não linearidades de ordem elevada têm sido preferidas por elas expandirem o alcance
de operação.
Esse trabalho se insere dentro desse contexto apresentando uma abordagem

inédita através da implementação de um compensador obtido pela Regressão por Processo
Gaussino dentro de controlares não lineares do tipo Linearização por Realimentação e
Modos Deslizantes. Para esse último, uma análise via Teorema de Lyapunov foi utilizada
para demonstrar a estabilidade do sistema controlado por esse método.
Simulações com o modelo de um atuador eletro-hidráulico foram feitas para

avaliar a implementação computacional da técnica proposta. Experimentos em um atuador
eletro-hidráulico também foram realizados para testar a potencialidade dos controladores
projetados.
Através das simulações e dos experiementos, pode-se fazer a seguinte síntese das
conclusões dos resultados observados:
∙ Computacionalmente e experimentalmente foi observado que o compensador obtido

através da Regressão por Processo Gaussiano, tanto para o controlador por Lineari-
zação por Realimentação quanto por Modos Deslizantes, melhorou a performance
das técnicas de controle não linear utilizadas;
∙ De maneira geral, a melhora na performance em relação ao rastreamento não trouxe

um consumo de energia muito maior que o obtido pelas técnicas convencionais, salvo
o mostrado pelo Exp. 7c;
∙ Observou-se que com mudanças em relação a entrada no GP houve ganhos ou perdas

em relação ao rastreamento e esforço de controle quando comparado entre seus pares;
∙ Constatou-se que pequenas mudanças nos parâmetros do GP levaram a resultados

distintos no rastreamento e, especialemnte, no esforço de controle.
Capítulo 6. Considerações finais 70
Tendo em vista que o compensador obtido pela GPR melhorou a performance

das técnicas de controle implementadas para um sistema monovariável (SISO) atuado,
sugere-se para trabalhos posteriores a sua implementação para sistemas multivariáveis
(MIMO, do inglês Multiple Input-Multiple Output) atuados e subatuados.
Além disso, por esse trabalho se encaixar dentro do escopo de aplicações de

Aprendizado de Máquina, sugere-se também avaliar outras técnicas dessa área, não
necessariamente as que sejam de treinamento supervisionado, como também, por exemplo,
as obtidas através da aprendizagem por reforço (Reinforcement Learning).
Seguindo nessa direção, espera-se que no horizonte possam ser consolidadas

técnicas pensadas no desenvolvimento não só de controladores inteligentes, mas de agentes
inteligentes. Combinar a abordagem já estabelecida das técnicas de controle não linear
com a filosofia presente nas técnias de Aprendizado de Máquina é um caminho promissor.
71
Referências
ALIPOUR, K.; ROBAT, A. B.; TARVIRDIZADEH, B. Dynamics modeling and sliding

mode control of tractor-trailer wheeled mobile robots subject to wheels slip. Mechanism
and Machine Theory, Elsevier Ltd, v. 138, p. 16–37, 2019. ISSN 0094114X. Citado na
página 18.
ALTARE, G.; VACCA, A. A design solution for efficient and compact electro-hydraulic
actuators. Procedia Engineering, Elsevier, v. 106, p. 8–16, 2015. Citado na página 45.
ARAN, V.; UNEL, M. Gaussian process regression feedforward controller for diesel engine
airpath. International Journal of Automotive Technology, v. 19, n. 1, p. 635–642, 2018.
ISSN 01252208. Citado na página 20.
BALAU, A.-E.; CARUNTU, C.-F.; LAZAR, C. Simulation and control of an

electro-hydraulic actuated clutch. Mechanical Systems and Signal Processing, Elsevier,
v. 25, n. 6, p. 1911–1922, 2011. Citado na página 45.
BAPIN, Y.; ZARIKAS, V. Smart Building’s Elevator with Intelligent Control Algorithm
based on Bayesian Networks. International Journal of Advanced Computer Science and
Applications, v. 10, n. 2, p. 16–24, 2019. ISSN 2158107X. Citado na página 19.
BECKERS, T.; UMLAUFT, J.; HIRCHE, S. Stable Model-based Control with

Gaussian Process Regression for Robot Manipulators. In: IFAC-PapersOnLine.
Elsevier B.V., 2017. v. 50, n. 1, p. 3877–3884. ISSN 24058963. Disponível em:
<https://doi.org/10.1016/j.ifacol.2017.08.359>. Citado na página 20.
BESSA, W. M. Controle por modos deslizantes de sistemas dinâmicos com zona morta
aplicado ao posicionamento de ROV’s. Tese (Doutorado) — Universidade Federal do Rio
de Janeiro, 2005. Citado na página 48.
BESSA, W. M. Some remarks on the boundedness and convergence properties of smooth

sliding mode controllers. International Journal of Automation and Computing, v. 6, n. 2,
p. 154–158, 2009. ISSN 14768186. Citado nas páginas 29 e 31.
BESSA, W. M. et al. A Biologically Inspired Framework for the Intelligent Control

of Mechatronic Systems and Its Application to a Micro Diving Agent. Mathematical
Problems in Engineering, v. 2018, p. 1–16, 2018. ISSN 1024-123X. Citado na página 19.
BESSA, W. M.; DUTRA, M. S.; KREUZER, E. Depth control of remotely operated

underwater vehicles using an adaptive fuzzy sliding mode controller. Robotics and
Autonomous Systems, v. 56, n. 8, p. 670–677, 2008. ISSN 09218890. Citado na página 18.
BESSA, W. M.; DUTRA, M. S.; KREUZER, E. An adaptive fuzzy dead-zone

compensation scheme and its application to electro-hydraulic systems. Journal of the
Brazilian Society of Mech. Sci. & Eng., v. 32, n. 1, p. 1–7, 2010a. ISSN 1678-5878. Citado
nas páginas 19, 45 e 51.
Referências 72
BESSA, W. M.; DUTRA, M. S.; KREUZER, E. Sliding mode control with adaptive fuzzy
dead-zone compensation of an electro-hydraulic servo-system. Journal of Intelligent and
Robotic Systems, Springer, v. 58, n. 1, p. 3–16, 2010b. Citado nas páginas 19, 45, 46 e 51.
BESSA, W. M.; DUTRA, M. S.; KREUZER, E. Dynamic positioning of underwater

robotic vehicles with thruster dynamics compensation. International Journal of Advanced
Robotic Systems, v. 10, 2013. ISSN 17298806. Citado na página 19.
BESSA, W. M. et al. Design and adaptive depth control of a micro diving agent. IEEE
Robotics and Automation Letters, IEEE, v. 2, n. 4, p. 1871–1877, 2017. Citado nas
páginas 18 e 19.
BONCHIS, A.; CORKE, P. I.; RYE, D. C. Experimental evaluation of position control

methods for hydraulic systems. IEEE Transactions on Control Systems Technology, IEEE,
BONFIGLIO, A. et al. A Sliding Mode Control Approach for Gas Turbine Power
Generators. IEEE Transactions on Energy Conversion, IEEE, v. 34, n. 2, p. 921–932,
2019. ISSN 08858969. Citado na página 18.
BOUKHEZZAR, B.; SIGUERDIDJANE, H. Comparison between linear and nonlinear

control strategies for variable speed wind turbines. Control Engineering Practice, Elsevier,
BRINKMANN, G. et al. Reinforcement learning of depth stabilization with a micro diving

agent. Proceedings - IEEE International Conference on Robotics and Automation, IEEE,
V, p. 6197–6203, 2018. ISSN 10504729. Citado na página 19.
CHAPRA, S. C.; CANALE, R. P. Métodos numéricos para engenharia. [S.l.]: McGraw-Hill,

2008. Citado na página 40.
CHEN, K.; YI, J.; LIU, T. Modeling and Control of Robotic Systems Modeling and
control of robotic systems. In: 13th IEEE Conference on Automation Science and
Engineering (CASE). Xi’an: [s.n.], 2017. p. 1118–1123. ISBN 9781509067817. Citado na
página 19.
CHU, D. et al. Smooth Sliding Mode Control for Vehicle Rollover Prevention Using Active
Antiroll Suspension. Mathematical Problems in Engineering, v. 2015, p. 1–8, 2015. ISSN
1024-123X. Citado na página 19.
CORTAJARENA, J. A. et al. Sliding mode control of an active power filter with

photovoltaic maximum power tracking. International Journal of Electrical Power and
Energy Systems, Elsevier, v. 110, n. March, p. 747–758, 2019. ISSN 01420615. Disponível
em: <https://doi.org/10.1016/j.ijepes.2019.03.070>. Citado na página 18.
CUI, L. et al. Control of Flexible Manipulator Based on Reinforcement Learning.

Proceedings 2018 Chinese Automation Congress, CAC 2018, IEEE, p. 2744–2749, 2019.
Citado na página 19.
DOERR, A. et al. Optimizing long-term predictions for model-based policy search. In:
Conference on Robot Learning. [S.l.: s.n.], 2017. p. 227–238. Citado na página 19.
Referências 73
DOERR, A. et al. Probabilistic Recurrent State-Space Models. In: Proceedings of the 35th
International Conference on Machine Learning. Stockholm: [s.n.], 2018. p. 1280–1289.
ISSN 0004-8666 1479-828X. Disponível em: <http://arxiv.org/abs/1801.10395>. Citado
nas páginas 20 e 36.
FARREL, J. A.; POLYCARPOU, M. M. Adaptative approximation based control. New

Jersey: John Wiley & Sons, Inc., 2006. ISBN 9780471727880. Citado na página 18.
GUAN, C.; PAN, S. Adaptive sliding mode control of electro-hydraulic system with
nonlinear unknown parameters. Control Engineering Practice, Elsevier, v. 16, n. 11, p.
1275–1284, 2008. Citado na página 45.
GUAN, C.; PAN, S. Nonlinear adaptive robust control of single-rod electro-hydraulic

actuator with unknown nonlinear parameters. IEEE Transactions on Control Systems
Technology, IEEE, v. 16, n. 3, p. 434–445, 2008. Citado na página 45.
GUO, Y. et al. Composite learning adaptive sliding mode control for AUV target tracking.
Neurocomputing, Elsevier B.V., v. 351, p. 180–186, 2019. ISSN 18728286. Disponível em:
<https://doi.org/10.1016/j.neucom.2019.03.033>. Citado na página 18.
HIGHAM, N. J. Accuracy and stability of numerical algorithms. [S.l.]: Siam, 2002. v. 80.
JARDINE, P. T. et al. Adaptive predictive control of a differential drive robot tuned with
reinforcement learning. International Journal of Adaptive Control and Signal Processing,
v. 33, n. 2, p. 410–423, 2019. ISSN 10991115. Citado na página 19.
KRAUZE, P.; KASPRZYK, J. Comparison of linear and nonlinear feedback control

for a half-car model with mr dampers. In: IEEE. Methods and Models in Automation
and Robotics (MMAR), 2016 21st International Conference on. [S.l.], 2016. p. 965–970.
LANG, M.; HIRCHE, S. Computationally efficient rigid-body gaussian process for motion
dynamics. IEEE Robotics and Automation Letters, v. 2, n. 3, p. 1601–1608, 2017. Citado
na página 20.
LEE, J. Y.; YEON, J. S.; PARK, J. H. Robust nonlinear control for flexible joint robot
manipulators. In: IEEE. SICE, 2007 Annual Conference. [S.l.], 2007. p. 440–445. Citado
na página 18.
LEVANT, A. Higher-order sliding modes, differentiation and output-feedback control.

International journal of Control, Taylor & Francis, v. 76, n. 9-10, p. 924–941, 2003.
LIEM, D. T. et al. A feedforward neural network fuzzy grey predictor-based controller

for force control of an electro-hydraulic actuator. International Journal of Precision
Engineering and Manufacturing, Springer, v. 17, n. 3, p. 309–321, 2016. Citado na página
45.
LIMA, E. L. Curso de análise, Volume 1. 11th. ed. [S.l.]: Projeto Euclides, IMPA, 2004.
Referências 74
LIMA, G. S.; BESSA, W. M.; TRIMPE, S. Depth control of underwater robots using
sliding modes and gaussian process regression. In: IEEE LARS 2018 - 15th Latin
American Robotics Symposium. João Pessoa: IEEE, 2018. Citado nas páginas 31 e 44.
LIMA, G. S.; BESSA, W. M.; TRIMPE, S. Control ff Flexible Joint Manipulator with
Feedback Linearization and Compensation by Gaussian Process. In: Aceito para os Anais
do COBEM 2019. [S.l.: s.n.], 2019. Citado nas páginas 25 e 42.
LIU, R.; ALLEYNE, A. Nonlinear force/pressure tracking of an electro-hydraulic actuator.

IFAC Proceedings Volumes, Elsevier, v. 32, n. 2, p. 952–957, 1999. Citado na página 45.
MONTOYA-CHÁIREZ, J.; SANTIBÁÑEZ, V.; MORENO-VALENZUELA, J. Adaptive

control schemes applied to a control moment gyroscope of 2 degrees of freedom.
Mechatronics, v. 57, n. November 2018, p. 73–85, 2019. ISSN 09574158. Citado na página
18.
PANDIT, R. K.; INFIELD, D. SCADA-based wind turbine anomaly detection using

Gaussian process models for wind turbine condition monitoring purposes. IET Renewable
Power Generation, v. 12, n. 11, p. 1249–1255, 2018. ISSN 1752-1416. Disponível em:
<http://digital-library.theiet.org/content/journals/10.1049/iet-rpg.2018.0156>. Citado
na página 20.
PISANO, A.; USAI, E. Output-feedback control of an underwater vehicle prototype by

higher-order sliding modes. Automatica, Elsevier, v. 40, n. 9, p. 1525–1531, 2004. Citado
na página 49.
SANGIOVANNI, B. et al. Deep Reinforcement Learning Based Self-Configuring Integral

Sliding Mode Control Scheme for Robot Manipulators. Proceedings of the IEEE
Conference on Decision and Control, IEEE, v. 2018-Decem, n. Cdc, p. 5969–5974, 2019.
ISSN 07431546. Citado na página 19.
SANTOS, J.; BESSA, W. Intelligent control for accurate position tracking of

electrohydraulic actuators. Electronics Letters, Institution of Engineering and Technology,
2018. Disponível em: <http://digital-library.theiet.org/content/journals/10.1049/el.2018.
7218>. Citado na página 19.
SANTOS, J. D. B. Compensação de atrito no controle de sistemas mecânicos : Uma

abordagem utilizando estratégias inteligentes. Tese (Doutorado) — Universidade Federal
do Rio Grande do Norte, Natal, 2018. Citado nas páginas 46, 47, 48 e 60.
SCHULZ, E.; SPEEKENBRINK, M.; KRAUSE, A. A tutorial on gaussian process

regression: Modelling, exploring, and exploiting functions. Journal of Mathematical
Psychology, Elsevier, v. 85, p. 1–16, 2018. Citado nas páginas 34, 35 e 36.
SKARPETIS, M. G.; KOUMBOULIS, F. N. Robust pid controller for electro—hydraulic

actuators. In: IEEE. Emerging Technologies & Factory Automation (ETFA), 2013 IEEE
18th Conference on. [S.l.], 2013. p. 1–5. Citado na página 45.
SLOTINE, J.-J. E.; LI, W. Applied Nonlinear Control. 1. ed. Englewood Cliffs:
Prentice-Hall, Inc., 1991. ISBN 0130408905. Citado nas páginas 18, 27, 29 e 30.
Referências 75
SUN, H.; CHIU, G.-C. Nonlinear observer based force control of electro-hydraulic
actuators. In: IEEE. American Control Conference, 1999. Proceedings of the 1999. [S.l.],
1999. v. 2, p. 764–768. Citado na página 45.
TANAKA, M. C.; FERNANDES, J. M.; BESSA, W. M. Feedback linearization with

fuzzy compensation for uncertain nonlinear systems. International Journal of Computers,
Communications and Control, v. 8, n. 5, p. 736–743, 2013. ISSN 18419844. Citado nas
páginas 18 e 41.
TRAN, D.-T.; TRUONG, H.-V.-A.; AHN, K. K. Adaptive Backstepping Sliding Mode

Control Based RBFNN for a Hydraulic Manipulator Including Actuator Dynamics.
Applied Sciences, v. 9, n. 6, p. 1265, 2019. Citado na página 19.
UMLAUFT, J. et al. Feedback linearization using Gaussian processes. 2017 IEEE 56th
Annual Conference on Decision and Control, CDC 2017, v. 2018-Janua, n. Cdc, p.
5249–5255, 2018. Citado na página 20.
UTH, D. The art of computer programming, vol 1: Fundamental algorithms. [S.l.]:

Addison-Wesley, Reading, MA.(1973), The Art of Computer Programming, 1973. Citado
na página 40.
WILLIAMS, C. K.; RASMUSSEN, C. E. Gaussian processes for machine learning. the

MIT Press, v. 2, n. 3, p. 4, 2006. Citado nas páginas 32, 33, 34, 35, 36 e 37.
XILOYANNIS, M. et al. Gaussian Process Autoregression for Simultaneous Proportional

Multi-Modal Prosthetic Control with Natural Hand Kinematics. IEEE Transactions on
Neural Systems and Rehabilitation Engineering, v. 25, n. 10, p. 1785–1801, 2017. ISSN
XIWEI, P.; FEI, L.; WEI, M. Modelling the electro-hydraulic position servo system based
on disturbance observer. Proceedings - 2017 32nd Youth Academic Annual Conference
of Chinese Association of Automation, YAC 2017, IEEE, p. 687–692, 2017. Citado na
página 47.
YANADA, H.; FURUTA, K. Adaptive control of an electrohydraulic servo system utilizing

online estimate of its natural frequency. Mechatronics, Elsevier, v. 17, n. 6, p. 337–343,
YANG, Y.; HUANG, D.; DONG, X. Robust repetitive learning control of lower limb
exoskeleton with hybrid electro-hydraulic system. In: IEEE. 2018 IEEE 7th Data Driven
Control and Learning Systems Conference (DDCLS). [S.l.], 2018. p. 718–723. Citado na
página 45.
YAZDANPANAH, M. J.; KHORASANI, K.; PATEL, R. V. Comparison of linear and

nonlinear h∞ control for a flexible-link manipulator. In: AACC. Proceedings of the
American Control Conference. [S.l.], 1998. Citado na página 18.
YIM, J.; KIM, S.; CHOI, Y. Adaptive torque control of hydraulic actuators based on
dynamic compensation. In: IEEE. Ubiquitous Robots and Ambient Intelligence (URAI),
2014 11th International Conference on. [S.l.], 2014. p. 448–451. Citado na página 45.
Apêndices
77
APÊNDICE A – Região de
convergência dentro da camada limite
Antes de mais nada é necessário mostrar que,

(︁ )︁
𝑑𝑛−1 𝑒𝜆𝑡 𝑥˜
𝑒𝜆𝑡 𝑠 = (A.1)
𝑑𝑡𝑛−1
admtindo neste apêndice a notação 𝑥˜ para o erro de rastreamento.
Para tanto considere 𝑛 = 2. Assim tem-se,

(︁ )︁
𝑑 𝑒𝜆𝑡 𝑥˜
(︃ )︃
𝑑
= 𝑒 (𝑥˜˙ + 𝜆˜
𝜆𝑡
𝑥) = 𝑒𝜆𝑡 + 𝜆 𝑥˜ (A.2)
𝑑𝑡 𝑑𝑡
Agora considere 𝑛 = 3:
(︁ )︁ )︃2
𝑑2 𝑒𝜆𝑡 𝑥˜
(︃
𝑑
= 𝑒 (𝑥¨˜ + 2𝜆𝑥˜˙ + 𝜆 𝑥˜) = 𝑒
𝜆𝑡 2 𝜆𝑡
+𝜆 𝑥˜ (A.3)
𝑑𝑡2 𝑑𝑡
Pode-se constatar pelas Eqs. A.2 e A.3 que o lado direito poderia ser obtido
utilizando a Eq. 2.8. Portanto, por indução, é possível mostrar que a Eq. A.1 é verdadeira.
Partindo da definição que |𝑠(𝑥, 𝑡)| ≤ 𝜑,
−𝜑 ≤ 𝑠(𝑥, 𝑡) ≤ 𝜑 (A.4)
Multiplicando ambos os lados por 𝑒𝜆𝑡 e utilizando a Eq. A.1:

(︁ )︁
𝑑𝑛−1 𝑒𝜆𝑡 𝑥˜
−𝜑𝑒𝜆𝑡 ≤ ≤ 𝜑𝑒𝜆𝑡 (A.5)
𝑑𝑡𝑛−1
Integrando de 0 a 𝑡 ambos os lados da Eq. A.5:

⎛ (︁ )︁ ⎞
∫︁ 𝑡
𝜆𝜏
∫︁ 𝑡
𝑑 ⎝ 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ∫︁ 𝑡
−𝜑 𝑒 𝑑𝜏 ≤ ⎠ 𝑑𝜏 ≤𝜑 𝑒𝜆𝜏 𝑑𝜏
0 0 𝑑𝜏 𝑑𝜏 𝑛−2 0
APÊNDICE A. Região de convergência dentro da camada limite 78
⎛ (︁ )︁ ⎞ ⎛ (︁ )︁ ⎞ ⃒
𝑛−2
−𝜑 𝜆𝑡 𝜑 ⎝ 𝑑 𝑒𝜆𝑡 𝑥˜ 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒⃒ 𝜑 𝜆𝑡 𝜑
𝑒 + ≤ ⎠−⎝ ⎠⃒ ≤ 𝑒 −
𝜆 𝜆 𝑑𝑡𝑛−2 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
𝜆 𝜆
⎛ (︁ )︁ ⎞ ⃒ ⎛ (︁ )︁ ⎞ ⎛ (︁ )︁ ⎞ ⃒
𝜑 𝜑 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒⃒ 𝑑𝑛−2 𝑒𝜆𝑡 𝑥˜ 𝜑 𝜑 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒⃒
− 𝑒𝜆𝑡 + +⎝ ⎠⃒ ≤ ⎝ ⎠ ≤ 𝑒𝜆𝑡 − +⎝ ⎠⃒ (A.6)
𝜆 𝜆 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
𝑑𝑡𝑛−2 𝜆 𝜆 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
⎛ (︁
)︁ ⎞ ⃒ ⎛ (︁ )︁ ⎞ ⃒
𝜑 ⎝ 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒ 𝜑 𝑑𝑛−2 𝑒𝜆𝜏 𝑥˜ ⃒
Chamando 𝑘1 = + ⎠ ⃒⃒ e 𝑘1′ = − + ⎝ ⎠ ⃒⃒ , a Eq. A.6 fica
𝜆 𝑑𝜏 𝑛−2 ⃒
𝜏 =0
𝜏 =0
da seguinte forma:
(︁ )︁
𝜑 𝑑𝑛−2 𝑒𝜆𝑡 𝑥˜ 𝜑 𝜆𝑡
− 𝑒𝜆𝑡 + 𝑘1 ≤ ≤ 𝑒 + 𝑘1′ (A.7)
𝜆 𝑑𝑡𝑛−2 𝜆
Integrando de 0 a 𝑡 ambos os lados da Eq. A.7:

⎛ (︁ )︁ ⎞
𝑛−3
∫︁ 𝑡 (︃
𝑑 ⎝𝑑 𝑒𝜆𝜏 𝑥˜
∫︁ 𝑡)︃ ∫︁ 𝑡 (︃ )︃
𝜑 𝜆𝜏 𝜑 𝜆𝜏
− 𝑒 + 𝑘1 𝑑𝜏 ≤ 𝑛−3
⎠ 𝑑𝜏 ≤ 𝑒 + 𝑘1′ 𝑑𝜏
0 𝜆 0 𝑑𝜏 𝑑𝜏 0 𝜆
⎛ (︁ )︁ ⎞ ⎛ (︁ )︁ ⎞ ⃒
𝜑 𝜆𝑡 𝜑 𝑑𝑛−3 𝑒𝜆𝑡 𝑥˜ 𝑑𝑛−3 𝑒𝜆𝜏 𝑥˜ ⃒ 𝜑 𝜆𝑡 𝜑
− 𝑒 + 2 + 𝑘1 𝑡 ≤ ⎝ ⎠−⎝ ⎠ ⃒⃒ ≤ 𝑒 − 2 + 𝑘1′ 𝑡 (A.8)
𝜆 2 𝜆 𝑑𝑡𝑛−3 𝑑𝜏 𝑛−3 ⃒
𝜏 =0
𝜆2 𝜆
A Eq. A.8 pode ser simplificada e ficar da seguinte forma:

(︁ )︁
𝜑 𝜆𝑡 𝑑𝑛−3 𝑒𝜆𝑡 𝑥˜ 𝜑 𝜆𝑡
− 𝑒 + 𝑘2 ≤ ≤ 𝑒 + 𝑘2′ (A.9)
𝜆2 𝑑𝑡𝑛−3 𝜆 2
⎛ (︁ )︁ ⎞ ⃒ ⎛ (︁ )︁ ⎞ ⃒
𝜑 𝑑𝑛−3 𝑒𝜆𝜏 𝑥˜ ⃒⃒ 𝜑 𝑑𝑛−3 𝑒𝜆𝜏 𝑥˜ ⃒⃒
′ ′
onde 𝑘2 = 2 + 𝑘1 𝑡 + ⎝ ⎠⃒ e 𝑘2 = − + 𝑘1 𝑡 + ⎝ ⎠⃒ .
𝜏 =0
𝜆2 𝑑𝜏 𝑛−3 ⃒
𝜏 =0
O mesmo procedimento pode ser repetido mais 𝑛 − 3 vezes até ser reduzida a
seguinte expressão:
𝜑 𝜑 ′
− 𝑛−1
𝑒𝜆𝑡 + 𝑘𝑛−1 ≤ 𝑒𝜆𝑡 𝑥˜ ≤ 𝑒𝜆𝑡 + 𝑘𝑛−1 (A.10)
𝜆 𝜆𝑛−1
onde,
⎛ (︁
)︁ ⎞ ⃒
𝜑 𝑑𝑛−𝑖−1 𝑒𝜆𝜏 𝑥˜ ⃒
𝑘𝑖 = + 𝑘𝑖−1 𝑡 + ⎝ ⎠ ⃒⃒ (A.11)
𝜆𝑖 𝑑𝜏 𝑛−𝑖−1 ⃒
𝜏 =0
e,
⎛ (︁
)︁ ⎞ ⃒
𝜑 𝑑𝑛−𝑖−1 𝑒𝜆𝜏 𝑥˜ ⃒
𝑘𝑖′ = − + 𝑘𝑖−1 𝑡 + ⎝ ⎠ ⃒⃒ (A.12)
𝜆𝑖 𝑑𝜏 𝑛−𝑖−1 ⃒
𝜏 =0
para 𝑖 = {1, . . . , 𝑛 − 1}, sendo 𝑘0 = 𝑘0′ = 0.
Multiplicando a Eq. A.10 por 𝑒−𝜆𝑡 e tomando o limite de 𝑡 → ∞,
𝜑 𝜑
− ≤ 𝑥˜ ≤ (A.13)
𝜆𝑛−1 𝜆𝑛−1
Agora considere que a Eq. A.5 seja integrada 𝑛 − 2 vezes de 0 a 𝑡:

(︁ )︁
𝜑 𝑑 𝑒𝜆𝑡 𝑥˜ 𝜑 ′
− 𝑒𝜆𝑡 + 𝑘𝑛−2 ≤ ≤ 𝑒𝜆𝑡 + 𝑘𝑛−2 (A.14)
𝜆𝑛−2 𝑑𝑡 𝜆𝑛−2
Desenvolvendo a Eq. A.14,
𝜑 𝜑 ′
− 𝑥 + 𝑥˜˙ ) ≤
𝑒𝜆𝑡 + 𝑘𝑛−2 ≤ 𝑒𝜆𝑡 (𝜆˜ 𝑒𝜆𝑡 + 𝑘𝑛−2
Multiplicando ambos os lados da expressão acima por 𝑒−𝜆𝑡 e arrumando os termos:
𝜑 𝜑
− + 𝑒−𝜆𝑡 𝑘𝑛−2 − 𝜆˜
𝑥 ≤ 𝑥˜˙ ≤ + 𝑒−𝜆𝑡 𝑘𝑛−2
′
− 𝜆˜
𝑥 (A.15)
Utilizando a Eq. A.13 na Eq. A.15 e tomando o limite de 𝑡 → ∞,
−2𝜑 2𝜑
𝑛−2
≤ 𝑥˜˙ ≤ 𝑛−2 (A.16)
𝜆 𝜆
Dessa vez considere que a Eq. A.5 seja integrada 𝑛 − 3 vezes de 0 a 𝑡:

(︁ )︁
𝜑 𝑑2 𝑒𝜆𝑡 𝑥˜ 𝜑 ′
− 𝑒𝜆𝑡 + 𝑘𝑛−3 ≤ ≤ 𝑒𝜆𝑡 + 𝑘𝑛−3 (A.17)
𝜆𝑛−3 𝑑𝑡2 𝜆𝑛−3
Desenvolvendo a Eq. A.17,
𝜑 𝜑 ′
− 𝑒𝜆𝑡 + 𝑘𝑛−3 ≤ 𝑒𝜆𝑡 (𝜆2 𝑥˜ + 2𝜆𝑥˜˙ + 𝑥¨˜) ≤ 𝑒𝜆𝑡 + 𝑘𝑛−3
Novamente, multiplicando ambos os lados da expressão acima por 𝑒−𝜆𝑡 e arrumando

os termos:
𝜑 𝜑
− + 𝑒−𝜆𝑡 𝑘𝑛−3 − 𝜆2 𝑥˜ − 2𝜆𝑥˜˙ ≤ 𝑥¨˜ ≤ + 𝑒−𝜆𝑡 𝑘𝑛−3
′
− 𝜆2 𝑥˜ − 2𝜆𝑥˜˙ (A.18)
Utilizando as Eqs. A.13 e A.16 na Eq. A.18 e tomando o limite de 𝑡 → ∞,
−6𝜑 6𝜑
𝑛−3
≤ 𝑥¨˜ ≤ 𝑛−3 (A.19)
𝜆 𝜆
Pode-se portanto encontrar uma lei de recorrência para determinar os limites de

𝑥˜(𝑗) . Essa lei é dada pela equação abaixo:
(𝑗 + 1)!
𝑥(𝑗) | ≤
|˜ 𝜑 (A.20)
𝜆𝑛−𝑗−1
para 𝑗 = {0, . . . , 𝑛 − 1}.

81
APÊNDICE B – Região de
convergência para Linearização por
Realimentação
Considere a variável de erro combinado inspirada no controlador por Modos

Deslizantes para um sistema de 3a ordem dada por 𝑠(𝑥, 𝑡) = 𝑒¨ + 2𝜆𝑒˙ + 𝜆2 𝑒. Também
considere a seguinte função definida positiva:
1
𝑉 (𝑡) = 𝑠2 (B.1)
2
Realizando a derivação com respeito ao tempo de B.1 e sabendo da Eq. 2.13:
...
𝑉˙ (𝑡) = 𝑠𝑠˙ = 𝑠(𝑓^ + ^𝑏𝑢 + ℎ − 𝑥 𝑑 + 2𝜆¨
𝑒 + 𝜆2 𝑒)
˙ (B.2)
Substituindo a Eq. 3.20 na Eq. B.2 é possível verificar que
^ − 𝜆𝑠)
𝑉˙ (𝑡) = 𝑠(ℎ − ℎ (B.3)
^ ≤ 𝜖, então
Considerando que |ℎ − ℎ|
𝑉˙ (𝑡) ≤ −|𝑠|(𝜆𝑠 − 𝜖) (B.4)
Logo, 𝑉˙ será definida negativa se 𝜖

𝜆
≤ |𝑠|. Para o caso contrário, ou seja, 𝜖
𝜆
≥ |𝑠|:
𝜖 𝜖
− ≤𝑠≤ (B.5)
𝜆 𝜆
chega-se em uma expressão bastante similar à Eq. A.4. Logo, repetindo-se o mesmo
procedimento presente no Apêndice A, pode-se chegar na seguinte lei de recorrência:
(𝑗 + 1)!
|𝑒(𝑗) | ≤ 𝜖 (B.6)
𝜆𝑛−𝑗
para 𝑗 = {0, . . . , 𝑛 − 1}.

82
APÊNDICE C – Métricas das

simulações
Tabela 1 – Métricas para comparação usando controlador FBL e SMC convencionais.
Simulação 𝑚1 [m] 𝑚2 [m] 𝑚3 [ms] 𝑚4 [m2 s] 𝑚5 [Vs] 𝑚6 V/s 𝑚7 [ms3 ]

Sim. 1 0,0152 0,0222 1,1225 0,0363 131,0860 0,6149 5871,1616
Sim. 2 0,0149 0,0249 1,1023 0,0458 130,2289 0,5532 5103,3718
Tabela 2 – Métricas para comparação usando controlador FBL+GPR com entrada 𝑢

^.
Simulação 𝑚1 [m] 𝑚2 [m] 𝑚3 [ms] 𝑚4 [m2 s] 𝑚5 [Vs] 𝑚6 V/s 𝑚7 [ms3 ]

Sim. 3a 0,0068 0,0185 0,5048 0,0254 130,3185 2,9083 2198,5190
Sim. 3b 0,0059 0,0177 0,4339 0,0232 140,8000 2,5662 1804,9250
Sim. 3c 0,0056 0,0175 0,4100 0,0225 136,6420 2,5958 1710,3280
Sim. 3d 0,0071 0,0187 0,5232 0,0259 136,1530 2,6077 2231,6049
Sim. 3e 0,0061 0,0180 0,4535 0,0238 136,4335 2,3758 1885,2219
Sim. 3f 0,0056 0,0176 0,4160 0,0228 140,3986 1,8438 1695,1697
Sim. 3g 0,0075 0,0189 0,5516 0,0264 134,5830 2,4312 1948,6649
Sim. 3h 0,0064 0,0181 0,4748 0,0243 135,4175 1,7592 2381,6822
Sim. 3i 0,0060 0,0177 0,4404 0,0232 111,7129 1,6045 1984,1221
Tabela 3 – Métricas para comparação usando controlador FBL+GPR com entrada 𝑠.
Simulação 𝑚1 [m] 𝑚2 [m] 𝑚3 [ms] 𝑚4 [m2 s] 𝑚5 [Vs] 𝑚6 [V/s] 𝑚7 [ms3 ]

Sim. 4a 0,0053 0,0171 0,3943 0,0216 123,0787 1,3380 1586,2230
Sim. 4b 0,0053 0,0170 0,3879 0,0214 130,1501 1,0597 1536,3257
Sim. 4c 0,0053 0,0170 0,3902 0,0213 131,8870 1,0625 1574,0466
Sim. 4d 0,0056 0,0172 0,4099 0,0219 115,4826 1,0816 1705,5895
Sim. 4e 0,0054 0,0171 0,3957 0,0217 120,6333 1,0602 1549,2271
Sim. 4f 0,0053 0,0170 0,3940 0,0215 131,6869 1,0249 1606,4706
Sim. 4g 0,0058 0,0175 0,4251 0,0225 119,3279 0,9811 1770,3154
Sim. 4h 0,0054 0,0171 0,3972 0,0217 116,3019 1,0247 1617,1642
Sim. 4i 0,0054 0,0169 0,3963 0,0212 131,8587 1,0484 1636,5889
APÊNDICE C. Métricas das simulações 83
Tabela 4 – Métricas para comparação usando controlador FBL+GPR com entrada (𝑠, 𝑢
^).

Sim. 5a 0,0069 0,0186 0,5071 0,0254 129,4906 2,6364 2213,2060
Sim. 5b 0,0059 0,0178 0,4380 0,0234 135,6785 2,5000 1873,1109
Sim. 5c 0,0055 0,0174 0,4064 0,0224 142,9752 2,3889 1651,4791
Sim. 5d 0,0071 0,0187 0,5273 0,0259 129,1123 2,9025 2246,7753
Sim. 5e 0,0062 0,0180 0,4553 0,0239 139,4931 2,2980 1894,5638
Sim. 5f 0,0056 0,0175 0,4162 0,0227 135,1465 1,8782 1694,3243
Sim. 5g 0,0075 0,0190 0,5542 0,0266 134,4148 2,4045 2395,3003
Sim. 5h 0,0065 0,0182 0,4782 0,0244 133,5528 1,8328 1998,9621
Sim. 5i 0,0060 0,0177 0,4425 0,0233 127,5582 1,6627 1838,2668
Tabela 5 – Métricas para comparação usando controlador SMC+GPR com entrada 𝑢

^.

Sim. 6a 0,0054 0,0173 0,4011 0,0221 150,5773 4,1652 1565,9322
Sim. 6b 0,0056 0,0176 0,4153 0,0230 138,5751 2,3367 1816,9931
Sim. 6c 0,0062 0,0194 0,4559 0,0277 133,0941 2,3565 1859,7110
Sim. 6d 0,0056 0,0174 0,4127 0,0223 137,1832 3,8782 1575,9840
Sim. 6e 0,0061 0,0189 0,4485 0,0264 136,3098 1,4153 1941,8319
Sim. 6f 0,0059 0,0187 0,4343 0,0257 131,6399 1,4670 1833,3048
Sim. 6g 0,0059 0,0183 0,4384 0,0248 124,4422 1,8375 1851,9161
Sim. 6h 0,0064 0,0190 0,4697 0,0267 128,2196 1,2809 2148,6816
Sim. 6i 0,0061 0,0182 0,4472 0,0245 132,7622 1,2213 1995,3888
Tabela 6 – Métricas para comparação usando controlador SMC+GPR com entrada 𝑠.

Sim. 7a 0,0055 0,0172 0,4057 0,0219 109,5254 1,1961 1648,3502
Sim. 7b 0,0057 0,0171 0,4200 0,0217 123,4667 1,0103 1771,0961
Sim. 7c 0,0060 0,0172 0,4412 0,0218 109,0891 0,9965 1974,1143
Sim. 7d 0,0055 0,0173 0,4048 0,0220 103,4547 1,0052 1663,0646
Sim. 7e 0,0057 0,0172 0,4196 0,0218 115,2843 0,9622 1786,0795
Sim. 7f 0,0057 0,0172 0,4202 0,0217 114,7885 0,9840 1779,2593
Sim. 7g 0,0056 0,0174 0,4152 0,0224 103,6724 0,9821 1822,9711
Sim. 7h 0,0057 0,0172 0,4225 0,0218 110,9691 0,9399 1753,6719
Sim. 7i 0,0058 0,0172 0,4254 0,0219 122,2820 0,9845 1820,1516
APÊNDICE C. Métricas das simulações 84
Tabela 7 – Métricas para comparação usando controlador SMC+GPR com entrada (𝑠, 𝑢
^).

Sim. 8a 0,0057 0,0177 0,4247 0,0231 139,7431 4,7182 1743,1805
Sim. 8b 0,0052 0,0171 0,3831 0,0217 160,1674 2,7884 1483,2962
Sim. 8c 0,0052 0,0172 0,3862 0,0219 115,6131 2,5264 1452,1686
Sim. 8d 0,0058 0,0178 0,4299 0,0233 122,8176 2,6151 1730,5964
Sim. 8e 0,0054 0,0173 0,4013 0,0221 117,8297 1,6959 1665,0051
Sim. 8f 0,0054 0,0173 0,3969 0,0221 115,9049 1,8462 1570,8388
Sim. 8g 0,0062 0,0180 0,4607 0,0240 108,6813 2,3249 2003,0270
Sim. 8h 0,0058 0,0175 0,4297 0,0226 104,7660 1,1104 1901,8954
Sim. 8i 0,0057 0,0174 0,4210 0,0224 112,5458 1,5522 1804,3021
85
APÊNDICE D – Métricas dos

experimentos
Tabela 8 – Métricas para comparação usando controlador FBL e SMC convencionais.
Experimento 𝑚1 [m] 𝑚2 [m] 𝑚3 [ms] 𝑚4 [m2 s] 𝑚5 [Vs] 𝑚6 V/s 𝑚7 [ms3 ]

Exp. 1 0,0159 0,0211 0,1276 0,0036 14,6817 0,4402 896,7984
Exp. 2 0,0140 0,0199 0,1122 0,0032 14,7586 0,4014 760,1272
Tabela 9 – Métricas para comparação usando controlador FBL+GPR com entrada 𝑢

^.
Experimento 𝑚1 [m] 𝑚2 [m] 𝑚3 [ms] 𝑚4 [m2 s] 𝑚5 [Vs] 𝑚6 [V/s] 𝑚7 [ms3 ]

Exp. 3a 0,0071 0,0177 0,0569 0,0025 15,3431 1,3202 236,2222
Exp. 3b 0,0067 0,0175 0,0535 0,0024 13,4514 1,2549 203,2858
Exp. 3c 0,0066 0,0173 0,0528 0,0024 13,7768 1,2412 202,3583
Exp. 3d 0,0073 0,0177 0,0588 0,0025 14,9813 1,2757 252,7599
Exp. 3e 0,0068 0,0175 0,0542 0,0025 13,2188 1,1733 211,4974
Exp. 3f 0,0066 0,0174 0,0531 0,0024 12,9340 1,1703 203,5600
Exp. 3g 0,0076 0,0177 0,0606 0,0025 14,7157 1,1948 270,3767
Exp. 3h 0,0069 0,0175 0,0556 0,0025 13,1750 1,1121 225,4967
Exp. 3i 0,0067 0,0174 0,0535 0,0024 12,4723 1,1034 206,0670
Tabela 10 – Métricas para comparação usando controlador FBL+GPR com entrada 𝑠.

Exp. 4a 0,0066 0,0172 0,0525 0,0024 13,0175 1,0873 199,1183
Exp. 4b 0,0067 0,0171 0,0532 0,0023 15,1955 1,0944 209,7414
Exp. 4c 0,0066 0,0171 0,0528 0,0023 16,6556 1,0871 202,2962
Exp. 4d 0,0066 0,0173 0,0527 0,0024 12,4821 1,0421 196,9147
Exp. 4e 0,0066 0,0172 0,0528 0,0024 13,6132 1,0153 205,4487
Exp. 4f 0,0067 0,0171 0,0533 0,0023 15,7322 0,9832 206,3339
Exp. 4g 0,0066 0,0173 0,0526 0,0024 12,1376 0,9609 198,7714
Exp. 4h 0,0064 0,0172 0,0516 0,0024 11,8420 0,9519 189,9527
Exp. 4i 0,0066 0,0171 0,0527 0,0023 13,7516 0,9501 203,0537
APÊNDICE D. Métricas dos experimentos 86
Tabela 11 – Métricas para comparação usando controlador FBL+GPR com entrada (𝑠, 𝑢
^).

Exp. 5a 0,0071 0,0176 0,0566 0,0025 14,0033 1,3111 232,4991
Exp. 5b 0,0067 0,0174 0,0536 0,0024 12,9312 1,2675 205,0894
Exp. 5c 0,0066 0,0173 0,0530 0,0024 13,1191 1,2626 205,0080
Exp. 5d 0,0073 0,0176 0,0584 0,0025 14,2820 1,2343 250,8092
Exp. 5e 0,0068 0,0175 0,0544 0,0024 12,7541 1,1898 212,8301
Exp. 5f 0,0067 0,0174 0,0533 0,0024 12,4717 1,1785 204,4677
Exp. 5g 0,0076 0,0177 0,0606 0,0025 14,2904 1,1792 269,4425
Exp. 5h 0,0070 0,0176 0,0557 0,0025 12,7832 1,1112 226,1510
Exp. 5i 0,0067 0,0174 0,0536 0,0024 12,1512 1,0961 206,2374
Tabela 12 – Métricas para comparação usando controlador SMC+GPR com entrada 𝑢

^.

Exp. 6a 0,0082 0,0207 0,0655 0,0034 10,6768 1,4341 273,8261
Exp. 6b 0,0076 0,0202 0,0608 0,0033 9,3209 1,4476 247,7196
Exp. 6c 0,0073 0,0198 0,0588 0,0031 9,2895 1,4752 237,4664
Exp. 6d 0,0083 0,0205 0,0660 0,0034 9,4214 1,4446 275,3705
Exp. 6e 0,0072 0,0189 0,0579 0,0029 9,2039 1,2369 241,6205
Exp. 6f 0,0079 0,0201 0,0630 0,0032 12,7707 1,3192 244,8273
Exp. 6g 0,0080 0,0201 0,0642 0,0032 9,3209 1,3990 294,6967
Exp. 6h 0,0075 0,0199 0,0603 0,0032 10,2484 1,1630 249,5517
Exp. 6i 0,0075 0,0197 0,0601 0,0031 9,5090 1,1219 220,0628
Tabela 13 – Métricas para comparação usando controlador SMC+GPR com entrada 𝑠.

Exp. 7a 0,0075 0,0178 0,0600 0,0025 14,1901 1,5358 240,2634
Exp. 7b 0,0072 0,0173 0,0573 0,0024 13,7496 1,3539 241,4701
Exp. 7c 0,0073 0,0168 0,0586 0,0023 52,6249 30,8843 279,6557
Exp. 7d 0,0076 0,0180 0,0607 0,0026 13,3494 1,5025 245,4892
Exp. 7e 0,0070 0,0175 0,0561 0,0024 13,6511 1,1331 223,7438
Exp. 7f 0,0069 0,0173 0,0552 0,0024 12,6195 1,1713 225,7746
Exp. 7g 0,0075 0,0180 0,0602 0,0026 12,7682 1,3846 241,8649
Exp. 7h 0,0072 0,0176 0,0572 0,0025 12,5222 1,0946 227,9734
Exp. 7i 0,0068 0,0173 0,0548 0,0024 13,4177 1,0049 211,0160
APÊNDICE D. Métricas dos experimentos 87
Tabela 14 – Métricas para comparação usando controlador SMC+GPR com entrada (𝑠, 𝑢
^).

Exp. 8a 0,0074 0,0178 0,0593 0,0025 13,2381 1,7039 245,9781
Exp. 8b 0,0069 0,0173 0,0554 0,0024 12,8808 1,3228 221,8888
Exp. 8c 0,0068 0,0173 0,0548 0,0024 14,1274 1,4128 227,1036
Exp. 8d 0,0075 0,0181 0,0604 0,0026 12,5885 1,7351 250,6586
Exp. 8e 0,0070 0,0175 0,0559 0,0024 12,0622 1,2024 227,6523
Exp. 8f 0,0068 0,0173 0,0540 0,0024 12,2670 1,1783 215,2958
Exp. 8g 0,0079 0,0185 0,0629 0,0027 12,4927 1,6886 269,8300
Exp. 8h 0,0071 0,0178 0,0568 0,0025 12,0968 1,2031 225,5805
Exp. 8i 0,0068 0,0176 0,0546 0,0025 11,9612 1,0354 214,1211

Controlesistemasdinâmicos Lima 2019

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Controlesistemasdinâmicos Lima 2019

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade Federal do Rio Grande do Norte

Programa de Pós-Graduação em Engenharia Mecânica

Controle de Sistemas Dinâmicos Não

Gabriel da Silva Lima

Programa de Pós-Graduação em Engenharia Mecânica

Controle de Sistemas Dinâmicos Não

Gabriel da Silva Lima

Dissertação de Mestrado apresentada

Lima, Gabriel da Silva.

Dissertação (Mestrado)-Universidade Federal do Rio Grande do

1. Controle Não Linear - Dissertação. 2. Compensador

RN/UF/BCZM CDU 621

Elaborado por Raimundo Muniz de Oliveira - CRB-15/429

Ao D.Sc. Sebastian Trimpe, do Instituto Max-Planck para Sistemas Inteligentes

Ao amigo e Eng. B.Sc. Gabriel de Albuquerque Barbosa Baumann, pela revisão

Aos amigos e membros do Grupo de Estudos em Robótica e Aprendizado de

Ao Prof. D.Sc. Adilson José de Oliveira, pelas mais diversas contribuições.

Ao Prof. D.Sc. Gabriel Ivan Medina Tapia, por todo o apoio.

Aos Mecânicos Lamentáveis por todo o apoio e constante motivação. Cito, em

A Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES),

Em projetos de controladores, diversas são as técnicas possíveis de serem empregadas.

Palavras-chave: Controle Não Linear, Compensador Estocástico, Regressão por Processo

Keywords: nonlinear control, stochastic compensator, Gaussian Process Regression, Feed-

Figura 1 – Diagrama de blocos - sistema em malha aberta. . . . . . . . . . . . . . 22

𝑎 coeficiente do polinômio de Hurwitz

𝐴𝑝 área da seção transversal do cilindro

𝑏 ganho do sinal de controle

𝐵 coeficiente de amortecimento viscoso

^𝑏 ganho aproximado do sinal de controle

C vetor de coeficientes do polinômio de Hurwitz

C̄ vetor modificado de coeficientes do polinômio de Hurwitz

𝐶𝑡𝑝 coeficiente de vazamento do fluido

𝑒 vetor formado pelo erro de rastreamento e suas derivadas

E operador de esperança matemática

𝑓^ dinâmica aproximada do sistema

𝐹𝑛 força normal dentre superfícies

𝐹𝑠 força de atrito estático

𝑘𝑣 proporcionalidade entre tensão e deslocamento efetivo de válvula

𝑘𝑙 proporcionalidade inferior entre tensão e deslocamento efetivo de válvula

𝑘𝑟 proporcionalidade superior entre tensão e deslocamento efetivo de vál-

K ganho do controlador SMC

𝑁 tamanho do conjunto de treinamento

𝑝 ordem da matriz de covariância

𝑃𝑞 queda de pressão no cilindro

𝑠 distância até a superfície de deslizamento

𝑠𝜑 distância até a camada limite

𝑢^ sinal de controle equivalente

𝑉 função candidata de Lyapunov

𝑉𝜑 função candidata de Lyapunov modificada

𝑉𝑐 volume do câmara do cilindro

𝑥 vetor de estados do sistema

𝑥𝑑 vetor de estados desejados

𝑥¯𝑠𝑝 deslocamento efetivo da válvula

𝑋 vetor com entradas do processo gaussiano

𝑦 vetor com saídas do processo gaussiano

𝑡𝑎𝑙𝑐 tempo de alcance

𝛽𝑒 fator de compressibilidade do fluido

𝛿 limitante da perturbação do sistema

𝛿𝑙 zona morta inferior

𝛿𝑟 zona morta superior

Δ𝑓 incerteza da dinâmica do sistema

Δ𝑏 incerteza do ganho do sinal de controle

𝜂 parâmetro da condição de deslizamento