Você está na página 1de 97

Universidade Federal de Ouro Preto

Instituto de Ciências Exatas e Aplicadas


Departamento de Engenharia Elétrica

Trabalho de Conclusão de Curso

Análise do desempenho de técnicas de controle


aplicadas a quadrotores

Luiz Marques Júnior

João Monlevade, MG
2020
Luiz Marques Júnior

Análise do desempenho de técnicas de controle


aplicadas a quadrotores

Trabalho de Conclusão de curso apresentado à Univer-


sidade Federal de Ouro Preto como parte dos requisitos
para obtenção do Título de Bacharel em Engenharia
Elétrica pelo Instituto de Ciências Exatas e Aplicadas
da Universidade Federal de Ouro Preto.
Orientador: Prof. Pablo Henrique Gonçalves

Universidade Federal de Ouro Preto


João Monlevade
2020
SISBIN - SISTEMA DE BIBLIOTECAS E INFORMAÇÃO

M357a Marques Junior, Luiz .


MarAnálise do desempenho de técnicas de controle aplicadas a
quadrotores. [manuscrito] / Luiz Marques Junior. - 2020.
Mar83 f.: il.: color., gráf., tab., mapa.

MarOrientador: Prof. Pablo Henrique Gonçalves.


MarMonografia (Bacharelado). Universidade Federal de Ouro Preto.
Instituto de Ciências Exatas e Aplicadas. Graduação em Engenharia
Elétrica .

Mar1. Controladores PID. 2. Desempenho. 3. Veículos a motor. 4. Veículos


autônomos. I. Gonçalves, Pablo Henrique. II. Universidade Federal de
Ouro Preto. III. Título.

CDU 681.51

Bibliotecário(a) Responsável: Flavia Reis - CRB6-2431


06/10/2020 SEI/UFOP - 0089501 - Folha de aprovação do TCC

MINISTÉRIO DA EDUCAÇÃO
UNIVERSIDADE FEDERAL DE OURO PRETO
REITORIA
INSTITUTO DE CIENCIAS EXATAS E APLICADAS
DEPARTAMENTO DE ENGENHARIA ELETRICA

FOLHA DE APROVAÇÃO

Luiz Marques Junior

Análise do desempenho de técnicas de controle aplicados a quadrotores

Membros da banca

Profa. Wendy Yadira Eras Herrera - Doutora - UFOP


Prof. Rodrigo Augusto Ricco - Doutor - UFOP

Versão final
Aprovado em 23 de Setembro de 2020

De acordo

Professor (a) Orientador (a) - UFOP


Pablo Henrique Gonçalves

Documento assinado eletronicamente por Edgard Gregory Torres Saravia, COORDENADOR DO CURSO DE ENGENHARIA ELETRICA, em 02/10/2020,
às 19:08, conforme horário oficial de Brasília, com fundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de 2015.

A auten cidade deste documento pode ser conferida no site h p://sei.ufop.br/sei/controlador_externo.php?


acao=documento_conferir&id_orgao_acesso_externo=0 , informando o código verificador 0089501 e o código CRC 3951285A.

Referência: Caso responda este documento, indicar expressamente o Processo nº 23109.007304/2020-47 SEI nº 0089501

R. Diogo de Vasconcelos, 122, - Bairro Pilar Ouro Preto/MG, CEP 35400-000


Telefone: - www.ufop.br

https://sei.ufop.br/sei/controlador.php?acao=documento_imprimir_web&acao_origem=arvore_visualizar&id_documento=102642&infra_sistema=1… 1/1
Agradecimentos

Quando desistir não é uma opção, o sucesso é inevitável! Muitas vezes pensei em
desistir devido a inúmeras dificuldades encontradas durante todo curso, porém através de
todo apoio recebido pelos familiares e amigos, hoje eu posso dizer que atingi o sucesso
nessa fase da minha vida. Não é possível alcançar os objetivos sozinhos, logo, nada mais
justo do que agradecer a todos que estiveram e estão junto a mim.
Agradeço de forma especial ao meu orientador Pablo Henrique Gonçalves por
aceitar conduzir o meu trabalho de pesquisa. Agradeço também a Deus, aos meus pais
Luiz e Maria e a minha irmã Marina por estarem comigo em todos os momentos, me
amparando e aconselhando.
Gostaria de agradecer aos meus amigos, pelas noites de sono perdidas para estudar,
pela união nos trabalhos e estudos, e principalmente pelas cervejas pós-provas no Clube
da Cerveja, fato que nunca falhou, pois se tais momentos não tivessem existido, hoje não
estaria carregando o título de Engenheiro Eletricista. Por fim, agradeço aos que estiveram
junto comigo no Diretório Acadêmico Consolidar, na Bateria Desgoverna e na República
Black Jack, uma vez que estes locais me proporcionaram um enorme crescimento pessoal e
profissional.
"A pergunta que em certas ocasiões me deixa confuso: Sou eu ou os demais que estão
loucos?"
– Albert Einsten
Resumo
Os VAANTs, Veículos Aéreos Autônomos Não Tripulados, estão sendo alvo de estudo e
de desenvolvimento em expansão. Com diversas aplicações, como por exemplo, aquisição
de imagens aéreas, monitoramento, inspeção de dutos e linhas de transmissão de energia,
mapeamento e pulverização de plantações, os VAANTs vêm em uma crescente com
objetivos na redução de custos e realização de missões perigosas. Para que os VAANTs
possam operar satisfatoriamente, robustos métodos de controle devem ser empregados.
Este trabalho apresenta uma análise de cinco técnicas de controle aplicadas a quadrotores.
A metodologia consiste em avaliar parâmetros de desempenho como máximo sobressinal,
erro em regime permanente e velocidade da resposta, analisando-os na planta linearizada
com a presença do controlador e verificando qual possui um melhor resultado. O controle
PID, com sintonia de ganhos pelo método Twiddle, visa encontrar uma melhor resposta
que garanta a minimização do erro médio da planta. O controle PID, com sintonia de
ganhos pelo método Successive Loop Closure, atua de forma que a resposta seja obtida a
partir da saturação dos atuadores. O controle via LQR busca a minimização da função de
custo para otimizar o sistema garantindo a estabilidade. O controle via LQG visa garantir
a atenuação de ruídos presentes no sistema. A técnica de controle via Lyapunov, garante
a estabilidade dos sistemas, lineares e não lineares. Após realizar as simulações em dois
cenários, na presença e na ausência de um ruído, aplicados em quadrotores de dimensões
distintas, as técnicas de controle estudadas apresentam bons resultados, sendo o LQG com
o melhor desempenho.

Palavras-chave: Quadrotor; Desempenho; PID; método Twiddle; método Successive Loop


Closure; LQR; LQG; Lyapunov.
Abstract
UAAVs, Unmanned Autonomous Aerial Vehicles, have been studied and expanded. With
a variety of applications, such as aerial imaging, monitoring, inspection of pipelines and
power transmission lines, crop mapping and spraying, VAANTs are on the rise with the
goal of reducing costs and accomplishing dangerous missions. In order for UAAVs to
be able to operate satisfactorily, robust control methods must be employed. This paper
presents an analysis of five controller techniques applied to quadrotors. The methodology
consists of evaluating performance parameters such overshoot, steady-state error and
system speed, that were analyzed in our mathematical model linearized with the presence
of the controller and acknowledge which one has the best result for UAAVs. The developers
of a PID control method, tuned by the Twiddle, to obtain the best answer with the
minimization of the average error. The PID control, with tuning of gains by the Successive
Loop Closure method, acts so that the response is obtained from the saturation of the
actuators. The LQR control seeks to minimize the cost function to optimize the system
ensuring stability. The LQG control has the purpose to certify the attenuation of the
present noise in the system. The Lyapunov control techniques ensure the stability of the
mathematical models linear or non-linear. Evaluated in two scenarios, in the presence and
absence of a noise, applied to quadrotors of different dimensions, the control techniques
studied show good results, with the LQG having the best performance.

Keywords: Quadrotor; Performance; PID; Twiddle method; Successive Loop Closure


method; LQR; LQG; Lyapunov
Lista de ilustrações

Figura 1 – Exemplo de um drone a jato destinado a servir como alvo aéreo. . . . . 1


Figura 2 – Exemplo de topologias de aeronaves com asa fixa. . . . . . . . . . . . . 2
Figura 3 – Exemplo de topologias de aeronaves com asas rotativas. . . . . . . . . . 3
Figura 4 – O vôo real do UAV durante a inspeção. . . . . . . . . . . . . . . . . . . 4
Figura 5 – Diversos exemplos de aplicações de VAANTs no ramo de busca e salva-
mento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Figura 6 – Foto tirada da posição (latitude, longitude e altura) do ponto PS
selecionado para validação da técnica PSI. . . . . . . . . . . . . . . . . 6
Figura 7 – VAANTs para monitoramento. . . . . . . . . . . . . . . . . . . . . . . 6
Figura 8 – Escala cinzenta definindo os diferentes níveis de informação auxiliar na
modelagem caixa cinza. . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Figura 9 – Diagrama de blocos da fórmula geral da função de transferência para
sistemas contínuos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Figura 10 – Sistema de controle em malha aberta. . . . . . . . . . . . . . . . . . . . 13
Figura 11 – Sistema de controle em malha fechada. . . . . . . . . . . . . . . . . . . 14
Figura 12 – Procedimento de projeto de sistemas de controle - Adaptado. . . . . . . 15
Figura 13 – Curva de resposta em degrau unitário. . . . . . . . . . . . . . . . . . . 16
Figura 14 – Processo de controle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Figura 15 – Rotação em 2D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Figura 16 – Rotação horária de um vetor p ao redor do vetor unitário n b de um
ângulo µ para obter um vetor q. . . . . . . . . . . . . . . . . . . . . . 22
Figura 17 – Rotação de p ao redor do eixo z. . . . . . . . . . . . . . . . . . . . . . 23
Figura 18 – Referencial inercial. O eixo x aponta para o Norte, enquanto o eixo y
aponta para o Leste e o eixo z aponta para o centro da terra . . . . . . 24
Figura 19 – Referencial do veículo. O eixo x aponta para o Norte, enquanto o eixo
y aponta para o Leste e o eixo z aponta para o centro da terra . . . . . 25
Figura 20 – Definição dos eixos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Figura 21 – Esquema assumido para se calcular os momentos de inércia do quadrotor. 29
Figura 22 – Esquema das forças e momentos existentes no quadrotor. . . . . . . . . 30
Figura 23 – Esquema de forças e torques que atuam no quadrotor. . . . . . . . . . 31
Figura 24 – Sistema com o estado de equilíbrio estável. . . . . . . . . . . . . . . . . 41
Figura 25 – Sistema com o estado de equilíbrio assintoticamente estável. . . . . . . 41
Figura 26 – Sistema com o estado de equilíbrio instável. . . . . . . . . . . . . . . . 42
Figura 27 – Sinal de referência e ruído. . . . . . . . . . . . . . . . . . . . . . . . . . 48
Figura 28 – Lugar geométrico das raízes via MATLAB. . . . . . . . . . . . . . . . . 49
Figura 29 – Diagrama de blocos do sistema de controle PID. . . . . . . . . . . . . . 50
Figura 30 – Controle PID via SLC do VAANT 1. . . . . . . . . . . . . . . . . . . . 51
Figura 31 – Esforço de controle de cada VAANT referente ao eixo x. . . . . . . . . 52
Figura 32 – Esforço de controle de cada VAANT referente ao eixo z. . . . . . . . . 52
Figura 33 – Controle PID via twiddle do VAANT 1. . . . . . . . . . . . . . . . . . 54
Figura 34 – Diagrama de blocos do sistema de controle LQR. . . . . . . . . . . . . 57
Figura 35 – Controle LQR do VAANT 1. . . . . . . . . . . . . . . . . . . . . . . . 57
Figura 36 – Diagrama de blocos do sistema de controle LQG. . . . . . . . . . . . . 59
Figura 37 – Controle LQG do VAANT 1. . . . . . . . . . . . . . . . . . . . . . . . 60
Figura 38 – Diagrama de blocos do sistema de controle por Lyapunov. . . . . . . . 63
Figura 39 – Controle Lyapunov do VAANT 1. . . . . . . . . . . . . . . . . . . . . . 63
Figura 40 – Índices de desempenho do VAANT 1. . . . . . . . . . . . . . . . . . . . 65
Figura 41 – IAE dos VAANTs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Figura 42 – Controle PID via SLC do VAANT 2. . . . . . . . . . . . . . . . . . . . 69
Figura 43 – Controle PID via SLC do VAANT 3. . . . . . . . . . . . . . . . . . . . 70
Figura 44 – Controle PID via SLC do VAANT 4. . . . . . . . . . . . . . . . . . . . 70
Figura 45 – Controle PID via twiddle do VAANT 2. . . . . . . . . . . . . . . . . . 71
Figura 46 – Controle PID via twiddle do VAANT 3. . . . . . . . . . . . . . . . . . 71
Figura 47 – Controle PID via twiddle do VAANT 4. . . . . . . . . . . . . . . . . . 72
Figura 48 – Controle LQR do VAANT 2. . . . . . . . . . . . . . . . . . . . . . . . 73
Figura 49 – Controle LQR do VAANT 3. . . . . . . . . . . . . . . . . . . . . . . . 73
Figura 50 – Controle LQR do VAANT 4. . . . . . . . . . . . . . . . . . . . . . . . 74
Figura 51 – Controle LQG do VAANT 2. . . . . . . . . . . . . . . . . . . . . . . . 75
Figura 52 – Controle LQG do VAANT 3. . . . . . . . . . . . . . . . . . . . . . . . 75
Figura 53 – Controle LQG do VAANT 4. . . . . . . . . . . . . . . . . . . . . . . . 76
Figura 54 – Controle Lyapunov do VAANT 2. . . . . . . . . . . . . . . . . . . . . . 77
Figura 55 – Controle Lyapunov do VAANT 3. . . . . . . . . . . . . . . . . . . . . . 77
Figura 56 – Controle Lyapunov do VAANT 4. . . . . . . . . . . . . . . . . . . . . . 78
Figura 57 – Índices de desempenho do VAANT 2. . . . . . . . . . . . . . . . . . . . 78
Figura 58 – Índices de desempenho do VAANT 3. . . . . . . . . . . . . . . . . . . . 79
Figura 59 – Índices de desempenho do VAANT 4. . . . . . . . . . . . . . . . . . . . 79
Sumário

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Histórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Classificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2 Aplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2.1 Inspeção em linhas de transmissão de energia . . . . . . . . . . . . . . . . . . 3
1.1.2.2 Busca e salvamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.2.3 Mapeamento de ambientes . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2.4 Monitoramento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Estrutura do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 REVISÃO BIBLIOGRÁFICA . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Representações de sistemas . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.1 Função de transferência . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.2 Espaço de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Sistemas de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.1 Sistema em malha aberta . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2 Sistema em malha fechada . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Projeto de sistemas de controle . . . . . . . . . . . . . . . . . . . . . 14
2.3.1 Especificações de desempenho . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4 Técnicas de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Controle de estabilidade de quadotores . . . . . . . . . . . . . . . . . . . . 17

3 CONTEXTUALIZAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . 20
3.1 Modelagem matemática do VAANT . . . . . . . . . . . . . . . . . . . 20
3.1.1 Matrizes de rotação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.2 Sistema de coordenadas do quadrotor . . . . . . . . . . . . . . . . . . . . 24
3.1.2.1 Referencial inercial F i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.1.2.2 Referencial inercial F v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.1.2.3 Referencial inercial F v1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.2.4 Referencial inercial F v2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.2.5 O referencial fixo ao corpo F b . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.3 Equação de Coriolis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.4 Cinemática e dinâmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.4.1 Variáveis de estado do quadrotor . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.4.2 Cinemática do quadrotor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.4.3 Dinâmica dos corpos rígidos . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.4.4 Forças e momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.5 Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.1.6 Modelo matemático simplificado . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Técnicas de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.1 Controle PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.1.1 Sintonia do controlador PID por Successive Loop Closure . . . . . . . . . . . . 34
3.2.1.2 Sintonia do controlador PID pelo método Twiddle . . . . . . . . . . . . . . . 35
3.2.2 Sintonia do controladorLQR . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2.3 Sintonia do controladorLQG . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.3.1 Filtro de Kalman . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.4 Sintonia do controladorLyapunov . . . . . . . . . . . . . . . . . . . . . . 40
3.2.4.1 Definições matemáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.4.1.1 Funções escalares definida e semi-definida positivas . . . . . . . . . . . . . . . . . 42
3.2.4.1.2 Funções escalares definida e semi-definida negativas . . . . . . . . . . . . . . . . . 43
3.2.4.1.3 Funções escalares indefinidas . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.4.1.4 Forma hermitiana e quadrática . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.4.2 Segundo método de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.4.2.1 Teorema central da estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2.4.3 Verificação da estabilidade de Lyapunov para sistemas lineares e invariante no tempo 44

4 RESULTADOS E DISCUSSÕES . . . . . . . . . . . . . . . . . . . . 46
4.1 Controle PID via Successive Loop Closure . . . . . . . . . . . . . . . 48
4.2 Controle PID via Twiddle . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3 Controle via LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4 Controle via LQG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 Controle via Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.6 Análise comparativa entre as técnicas de controle . . . . . . . . . . . 64

5 CONCLUSÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.1 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

APÊNDICE A – RESULTADOS SIMULADOS . . . . . . . . . . . . 69


A.1 PID - Successive Loop Closure . . . . . . . . . . . . . . . . . . . . . . 69
A.2 PID - Twiddle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
A.3 LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
A.4 LQG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
A.5 Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
A.6 Comparação entre as técnicas . . . . . . . . . . . . . . . . . . . . . . 78
SUMÁRIO 12

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
1

1 Introdução

1.1 Histórico
Os quadrotores, apesar de serem um assunto relativamente recente, sua aplicação
teve início no século XIX. Os chamados Veículos Aéreos Autônomos Não-Tripulados
(VAANTs), do inglês Autonomous Unmanned Aerial Vehicles (AUAVs), foram usados
primeiramente pelos austríacos, no qual balões sem tripulantes, carregados com explosivos
atacavam alvos em Veneza.
Antes das Grandes Guerras Mundiais, estudantes de engenharia pesquisavam um
método para transportar objetos explosivos pelo ar, surgindo assim os primeiros mísseis.
O engenheiro Nikola Tesla, no ano de 1915, desenvolveu uma análise da capacidade bélica
que uma frota de veículos denominados VAANTs possuíam (UBIRATAN, 2015).
Em 1951, a Ryan Aeronautical Company (construtora do monomotor “Spirit of
St. Louis”, que cruzou o Atlântico Norte em 1927), começou a desenvolver o Firebee, um
drone a jato, indicado na Figura 1, considerado o primeiro drone moderno, designado a
atuar como alvo aéreo (UBIRATAN, 2015).

Figura 1 – Exemplo de um drone a jato destinado a servir como alvo aéreo.

Fonte: (UBIRATAN, 2015)

Os militares norte-americanos tinham como propósito habilitar seus pilotos de caça


para essa geração de aeronaves que surgiam, pois exigia, aos profissionais envolvidos, muita
competência para manipular aeronaves com inexistência de misseis precisos e o elevado
desempenho (UBIRATAN, 2015).
Contudo a era dos VAANTS modernos surgiu na década de 70, onde foram desen-
volvidos para serem mais eficientes, baratos e menores. As Guerras do Vietnã e Guerra
Capítulo 1. Introdução 2

Fria incentivaram a criação de diversos programas de desenvolvimento de VAANTs. Desde


então, são criados inúmeros outros projetos de veículos aéreos.
Em detrimento do vasto campo de aplicação, seja em mercados civis e militares,
além da possibilidade de redução dos custos operacionais, esse cenário, atualmente, atrai
financiamento de projetos relacionados com VAANTs. Embora a origem de aplicações de
VAANTs ser no âmbito militar, atualmente, outras aplicações de maior interesse para
o setor civil vêm sendo alvo de pesquisa e desenvolvimento, possibilitando a utilização
industrial e comercial desses veículos (NETO, 2008).

1.1.1 Classificação
Veículos aéreos no geral, são classificados de acordo com sua topologia como
aeronaves de asas fixas (aviões), asa rotativa (helicóptero e multicópteros), entre outras
(balões, dirigíveis, entre outros). Cada topologia possui determinadas características
que apresentam vantagens diferenciadas em relação a sua aplicação. As Figuras 2 e
3 exemplificam configurações de aeronaves de asa fixa e asa rotativa respectivamente.

Figura 2 – Exemplo de topologias de aeronaves com asa fixa.

Fonte: (AUSTIN, 2010)


Capítulo 1. Introdução 3

Figura 3 – Exemplo de topologias de aeronaves com asas rotativas.

Fonte: (AUSTIN, 2010)

1.1.2 Aplicação
Os VAANTs podem ser utilizados em diversas aplicações onde a presença de
seres humanos são dispensáveis, possibilitando reduzir custos, ou desejável, como missões
perigosas, eliminando o risco de acidentes com o piloto. Algumas das aplicações já realizadas
utilizando VAANTs são: Aquisição de imagens aéreas, monitoramento, mapeamento em
ambientes, inspeção de dutos e linhas de transmissão energizadas, busca e resgate em
áreas perigosas, pulverização de plantações, entre outros. Será detalhado algumas de suas
aplicações no decorrer desta seção.

1.1.2.1 Inspeção em linhas de transmissão de energia

Atualmente, as inspeções em linhas de transmissão de alta tensão constituem uma


tarefa de alta periculosidade, pois é feita através de helicópteros tripulados voando em
baixa altitude. A aplicação dos VAANTs neste caso tende a diminuir riscos atenuando
a exposição de vidas humanas e tornar menor os custos financeiros dessa operação. Um
exemplo dessa aplicação pode ser visto em (FILHO e PINTO (2014);LI (2015); HE, ZENG
e HU (2019) ), em que um helicóptero tripulado é substituído por um quadrotor equipado
com uma câmera fotográfica e sensores, como o sensor de temperatura para inspecionar
uma linha de transmissão de alta tensão como visto na Figura 4.
Capítulo 1. Introdução 4

Figura 4 – O vôo real do UAV durante a inspeção.

Fonte: (HE; ZENG; HU, 2019)

1.1.2.2 Busca e salvamento

VAANTs podem ser muito úteis em operações de busca e salvamento, sendo


utilizados para examinar o ambiente, transportar equipamentos, recolher dados como a
localização da vítima e até mesmo realizar o transporte da vítima até um local mais seguro.
No cenário de busca e salvamento o tempo é o fator mais crítico e qualquer atraso pode
resultar em perdas humanas. Em ambientes hostis, a periculosidade, cautela e precisão
aumentam significativamente, como salvamentos marítimos ou durante nevascas.
Exemplos destas aplicações podem ser encontrados em (GHAZALI et al. (2016);
DU et al. (2019)), nos quais multirotores são utilizados para realizar a busca e salvamento
de pessoas e ou animais, como ilustrado a Figura 5.
Capítulo 1. Introdução 5

Figura 5 – Diversos exemplos de aplicações de VAANTs no ramo de busca e salvamento.

Fonte: (DU et al., 2019)

1.1.2.3 Mapeamento de ambientes

VAANTs também podem ser utilizados para explorar e mapear ambientes fecha-
dos e desconhecidos. Em ambientes perigosos também são utilizados os VAANTs para
identificação e mapeamento, como por exemplo quando se deseja mapear um vulcão.
A Figura 6 é um exemplo de um mapeamento realizado por um VAANT onde a linha
preta é uma estrada em Kelok Sembilan, a linha azul é o rio Sanipan em um vale, que
atravessa a área de pesquisa e os círculos amarelos marcam a área de interesse da pesquisa.
Para este mapeamento foi utilizado a técnica persistent scatterer interferometry (PSI)
(ROKHMANA; ANDARU, 2016).
Capítulo 1. Introdução 6

Figura 6 – Foto tirada da posição (latitude, longitude e altura) do ponto PS selecionado


para validação da técnica PSI.

Fonte: (RAZI et al., 2018)

1.1.2.4 Monitoramento

Outra aplicação possível é utilizar VAANTs para monitoramento de determinadas


áreas. Normalmente eles são equipados com uma câmera e um GPS (Sistema de Posiciona-
mento Global), utilizados para percorrer uma trajetória demarcada e capturar imagens da
região, possuindo como um exemplo, o monitoramento de queimadas ou desmatamento de
florestas.
Exemplos desta aplicação podem ser vistos em ISOCOLD, PEREIRA e TORRES
(2010), onde um VAANT de asa fixa (avião) é usado para realizar um reconhecimento de
solo. Em MERINO et al. (2012) é apresentado um VAANT, mostrado na Figura 7, que é
utilizado para monitorar queimadas.

Figura 7 – VAANTs para monitoramento.

Fonte: (MERINO et al., 2012)


Capítulo 1. Introdução 7

1.2 Motivação
Com o passar dos anos, o uso dos veículos aéreos autônomos não tripulados
(VAANTs) vem sendo descentralizado dos campos de guerra, abordando áreas comerciais
e industriais. Hoje em dia, a variação de suas aplicações se equivalem a variação de seus
modelos nos quais alguns impasses são encontrados. De acordo com sua aplicação, os
VAANTs necessitam do acréscimo de acessórios como sensores, câmeras e até mesmo trem
de pouso, fazendo com que suas dimensões sejam diferentes em determinadas aplicações.
Técnicas de controle são incorporadas para atenuar ações indesejadas porém, nem
sempre é simples escolher a melhor técnica. Cada técnica possui suas especificações,
tanto com relação aos resultados atingidos, quanto ao suporte para sua implementação.
Entretanto, depara-se com outra dificuldade que é o fato do modelo matemático dos
VAANTs possuir características não lineares e requerer técnicas de controle com maior
complexidade.
Atualmente vem sendo feitas diversas pesquisas para o desenvolvimento dos VA-
ANTs em busca de um desempenho satisfatório e de baixo custo.

1.3 Objetivos
Este trabalho tem como finalidade avaliar o desempenho das aeronaves autônomas
a fim de obter uma melhor técnica de controle a ser aplicada aos VAANTs. Para isto
deve-se cumprir algumas etapas

• Obter a modelagem matemática do veículo aéreo, utilizando referências encontradas


na literatura;

• Definir as técnicas de controle a serem aplicadas, considerando os diferentes conjuntos


de técnicas comumente utilizadas;

• Estabelecer as dimensões dos quadrotores utilizados, para obter uma base de dados
para as análises;

• Realizar as simulações empregando as técnicas de controle escolhidas nos quadrotores


determinados.

1.4 Estrutura do trabalho


Este trabalho está organizado nos seguintes capítulos:
O Capítulo 1 contém uma introdução do trabalho, com um breve histórico, clas-
sificação e aplicações dos veículos aéreos autônomos. Além de abordar a motivação e os
objetivos do trabalho.
Capítulo 1. Introdução 8

No Capítulo 2 os conceitos teóricos sobre identificação de sistemas, sistemas de


controle e técnicas de controle são apresentados. Desde a introdução ao sistemas de controle,
formas de representação dos sistemas até o projeto e técnicas de controle aplicadas a
quadrotores.
No Capítulo 3 é apresentada a metodologia para o trabalho, realizando a modelagem
matemática do veículo aéreo em questão, definindo e descrevendo as técnicas de controle
abordadas neste trabalho.
No Capítulo 4 é feita a caracterização dos quadrotores, a parametrização das
técnicas de controle em estudo e apresenta os resultados obtidos com as simulações com
suas respectivas comparações e análises.
Por fim, as conclusões e algumas sugestões para trabalhos futuros são indicadas no
Capítulo 5.
9

2 Revisão bibliográfica

Para AGUIRRE (2004), ”percebendo ou não, o ser humano funciona baseado


em modelos de forma que a maioria destes modelos são mentais. Infelizmente estes
modelos, além de levar muito tempo para serem formados e serem fundamentais para
o nosso dia-a-dia, tem suas limitações”. Existe uma certa semelhança entre os modelos
mentais, que são criados a partir de dados obtidos por observações e experiência, e
modelos matemáticos, que também podem ser construídos a partir de dados observados
que descrevam o comportamento do sistema em estudo. Muitos desses modelos mentais
podem ser representados por relações matemáticas.
A equação matemática que descreve o comportamento do sistema em estudo é
representada pela equação diferencial, quando se trata de um sistema contínuo, ou equação
a diferença, quando se trata de um sistema discreto. No cotidiano nos deparamos com
sistemas contínuos a todo instante, porém, para facilitar ou tornar possível os cálculos
matemáticos, é necessário discretiza-los para a análise computacional (AGUIRRE, 2004).
Existem diversas maneiras de classificar as técnicas utilizadas para a construção
das equações diferenciais, uma destas é agrupar em três métodos de modelagem: mode-
lagem caixa branca, modelagem caixa preta e modelagem caixa cinza. Na Figura 8 está
apresentado de forma esquemática tais classificações (AGUIRRE, 2004).
A modelagem caixa branca baseia-se em compreender todas as variáveis referentes
ao sistema em estudo, bem como as leis e princípios físicos devidamente aplicados. Sendo
assim, este tipo de modelagem também é conhecida como modelagem pela física ou da
natureza ou modelagem conceitual. Este tipo de modelagem não é sempre viável, levando
em consideração à dificuldade de equacionamentos de fenômenos envolvidos e o tempo
necessário para modelar estes tipos de sistemas (AGUIRRE, 2004).
A modelagem caixa preta, também conhecida como modelagem empírica, baseia-se
em técnicas de identificações de sistemas, as quais procuram descrever as relações de causa
e efeito entre as variáveis de entrada e saída. Este tipo de modelagem é aplicada quando o
sistema dinâmico em estudo é muito complexo ou quando não é possível obter os dados de
respostas relacionando a evolução temporal das variáveis em estudo (KARPLUS, 1977).
Estas duas técnicas podem ser consideradas como os extremos das técnicas de
modelagem. Teoricamente, qualquer procedimento que não esteja nesses extremos pode
ser denominado em modelagem caixa cinza. Neste caso, a modelagem utiliza algumas
informações auxiliares, conhecidas do sistema, e dados de entrada e saída obtidos. Essa
combinação visa agregar as vantagens dos procedimentos de modelagem caixa branca e
caixa preta (KARPLUS, 1977).
Capítulo 2. Revisão bibliográfica 10

Figura 8 – Escala cinzenta definindo os diferentes níveis de informação auxiliar na mode-


lagem caixa cinza.

Fonte: (KARPLUS, 1977)

2.1 Representações de sistemas


Existem diversas maneiras de representar os sistemas, além das equações a diferen-
ças, tais como: função de transferência e a representação em espaço de estados.
Uma das representações mais usadas é a função de transferência, definida como a
transformada da resposta ao impulso h(t) do sistema para condições iniciais nulas. Se a
resposta ao impulso for contínua no tempo h(t), utiliza-se a transformada de Laplace para
representar a função de transferência H(s). Porém se a resposta ao impulso for discreta
no tempo h(k), utiliza-se a transformada Z para obter a função de transferência H(z)
(OPPENHEIM; SCHAFER, 2013).
Outra representação muito usada é a representação em espaço de estados. Esta
representação facilita a visualização da dinâmica de um sistema de ordem n usando n
equações diferenciais de primeira ordem. O sistema é escrito em função de vetores, sendo
eles denominados: vetor de estados, vetor de entradas e vetor de saídas (OPPENHEIM;
SCHAFER, 2013).
Os sistemas em estudo tem como classificação serem lineares e invariantes no
tempo (SLIT), para simplificar o equacionamento destes. Sendo assim, a representação
matemática do SLIT é representado pela Equação 2.1

an y[n] + an−1 y[n − 1] + · · · + a1 y[1] + a0 y[0] = bm x[m] + bm−1 x[m − 1] + · · · + b1 x[n] + b0 x[n].
(2.1)
Uma representação da Equação 2.1 de forma simplificada é expressada pela Equação
2.2.
N
X M
X
ak y[n − k] = bk x[n − k]. (2.2)
k=0 k=0

A solução da equação de diferenças é composta por duas partes, a parte homogênea


(ou complementar) e a parte particular. A representação matemática dessa solução é
expressa pela Equação 2.3 onde yh [n] é a parte homogênea e yp [n] é a parte particular.

y[n] = yh [n] + yp [n]. (2.3)


Capítulo 2. Revisão bibliográfica 11

É viável utilizar este método para as equações de diferenças de ordens pequenas,


se tornando mais complexa a solução quando a ordem da equação aumenta. Para reverter
este problema é utilizado outras formas de representações como função de transferência
ou espaço de estados.
Para expressar uma equação de diferenças em formato de função de transferência,
utiliza-se a transformada z, que é correspondente a transformada de Laplace para sinais
contínuos. A transformada z e a transformada de Laplace tem uma relação análoga com a
transformada de Fourier correspondente.

2.1.1 Função de transferência


A função de transferência é uma função que relaciona algebricamente a saída de um
sistema com a sua entrada. Esta função permite separar a entrada, do sistema e da saída
em partes diferentes e distintas, diferentemente do que ocorre com a equação diferencial
(NISE, 2012).
A função de transferência do sistema referente a Equação 2.1 é a relação entre a
transformada de Laplace da saída e a transformada de Laplace da entrada, quando todas
as condições iniciais são nulas, ou

£[saída]
G(s) = £[entrada] condições iniciais
=
(2.4)
Y (s) bm sm +bm−1 sm−1 +···+b1 s1 +b0 s0
= X(s)
= an sn +an−1 sn−1 +···+a1 s1 +a0 s0
.
Utilizando o conceito de função de transferência, pode-se representar a dinâmica
de um sistema de uma equação em s. A ondem do sistema é dado pela maior potência
expressa no denominador da função de transferência (OGATA, 2011).
Em OGATA (2011), algumas características da função de transferência são aponta-
das

• A função de um sistema é um modelo matemático que constitui em um método


operacional para expressar a equação diferencial que relaciona a variável de saída à
variável de entrada;

• A função de transferência é uma propriedade inerente ao sistema, independentemente


da magnitude e da natureza da função de entrada ou de excitação;

• A função de transferência inclui as unidades necessárias para relacionar a entrada


à saída, entretanto, não fornece nenhuma informação relativa à estrutura física do
sistema;

• Se a função de transferência de um sistema for conhecida, a saída ou a resposta


poderá ser estudada para várias maneiras de entrada, visando ao entendimento da
natureza do sistema;
Capítulo 2. Revisão bibliográfica 12

• Se a função de transferência de um sistema não for conhecida, ela pode ser de-
terminada experimentalmente com o auxílio de entradas conhecidas e do estudo
das respectivas respostas do sistema. Uma vez determinada, a função de transfe-
rência fornece uma descrição completa das características dinâmicas do sistema,
independentemente de sua descrição física.

É possível representar a função em diagrama de blocos, como é mostrado na Figura


9, com a entrada à esquerda, a saída à direita e a função de transferência no interior do
bloco.

Figura 9 – Diagrama de blocos da fórmula geral da função de transferência para sistemas


contínuos.

Fonte: (NISE, 2012)

2.1.2 Espaço de estados


Na Subseção 2.1.1, foi apresentada a definição de função de transferência. Uma
característica básica dessa representação, é que ela descreve a dinâmica entre duas (ou
mais, no caso de multivariáveis) variáveis, denominadas entradas e saídas. Portanto, a
função de transferência fornece informações de forma detalhada sobre o comportamento
do sistema, entre a entrada e a saída.
A representação em espaço de estados também é utilizada para modelar um sistema
relacionando suas variáveis internas. Este tipo de representação descreve o sistema no
domínio do tempo e, é mais adequado para representar sistemas não lineares e multivariáveis
do que a função ou matriz de transferência. Para descrever um modelo linear típico em
espaço de estados utiliza-se a Equação 2.5 (AGUIRRE, 2004).

ẋ = Ax + Bu
. (2.5)
y = Cx + Du
Tratando-se x ∈ Rn o vetor de estado n-dimensional, o ponto indica a derivada
temporal, u ∈ Rr é o vetor de entradas formado por r funções temporais, y ∈ Rm é o vetor
de m-dimensões de saída medidas e A,B,C e D são matrizes contantes.
É importante ressaltar duas observações sobre a representação em espaço de estado,
são elas (AGUIRRE, 2004).

• O conhecimento do vetor de estado em qualquer instante t0 especifica o estado ou


condição do sistema nesse instante.
Capítulo 2. Revisão bibliográfica 13

• A representação em espaço de estados não é única, ou seja, é possível representar o


mesmo sistema com mais de um modelo.

2.2 Sistemas de controle


Para NISE (2012), ”Um sistema de controle consiste em subsistema e processo,
construídos com o objetivo de se obter uma saída desejada com um desempenho desejado,
dada uma entrada específica”. Para alcançar a saída desejada, é adicionado um componente,
ou um conjunto de componentes que irá manipular a entrada e/ou a saída.
Através do uso de controladores tornou-se possível melhorar a precisão de algumas
aplicações nas quais, manipular certos equipamentos e acertar tal precisão de forma manual,
seria quase impossível. Os sistemas de controle de controle podem ser classificados conforme
sua configuração: Sistema em malha aberta e sistema em malha fechada.

2.2.1 Sistema em malha aberta


Um sistema de controle em malha aberta utiliza um controlador ou atuador de
controle diretamente no processo, sem utilizar realimentação para obter a resposta desejada.
A grande desvantagem desse tipo de controle é a não compensação de perturbações adicio-
nadas ao sistema, tanto antes quanto depois do controlador. Na Figura 10 é apresentado
um sistema de controle em malha aberta de forma genérica. Nota-se que o dispositivo
de atuação (controlador) possui apenas a capacidade de manipular a variável de entrada,
sendo sensível a qualquer perturbação (DORF; BISHOP, 2001).

Figura 10 – Sistema de controle em malha aberta.

Fonte: (DORF; BISHOP, 2001)

As principais vantagens do sistema de controle de malha aberta são

• Simples de ser construídos e têm fácil manutenção;

• Menos dispendiosos que um sistema correspondente de malha fechada;

• Adota-se que a estabilidade é uma característica existente no sistema;

• Adequados quando existem dificuldades de medição da saída ou quando a medição


precisa da saída não é economicamente possível.
Capítulo 2. Revisão bibliográfica 14

As principais desvantagens do sistema de controle de malha aberta são: distúrbios


e mudanças na calibração causam erros, e a saída pode apresentar diferenças em relação
ao padrão desejado. Para que a saída mantenha a qualidade requerida, é necessária uma
regulagem periódica (OGATA, 2011).

2.2.2 Sistema em malha fechada


Um sistema de controle em malha fechada tem como função principal corrigir a
falta de sensibilidade contra perturbações e os possíveis erros causados por elas. Na Figura
11 está esquematizado um sistema de controle em malha fechada de forma genérica (DORF;
BISHOP, 2001).

Figura 11 – Sistema de controle em malha fechada.

Fonte: (DORF; BISHOP, 2001)

O sistema em malha fechada compensa os efeitos das perturbações aferindo a


resposta da saída, realimentando essa aferição através da malha de realimentação e
comparando essa resposta com a entrada. Caso exista uma discrepância entre as respostas,
o controlador envia um sinal de atenuação para fazer a correção necessária.

2.3 Projeto de sistemas de controle


O objetivo do projeto de sistemas de controle é obter a configuração, as especificações
e a identificação dos principais parâmetros do sistema proposto (DORF; BISHOP, 2001).
O primeiro passo no procedimento de projeto consiste em estabelecer a finalidade do
sistema. Em seguida, é necessário identificar as variáveis a serem controladas e determinar
as especificações em termos de exatidão que se deve alcançar. O próximo passo é seleção
do controlador e por último, é o ajuste dos parâmetros, a fim de se obter o desempenho
desejado.
Na Figura 12, um fluxograma de forma resumida do projeto de um controlador
em malha fechada está representado. Dado um modelo de sistema para ser controlado
(contendo sensores e atuadores) e um conjunto de objetivos de projeto, basta seguir esta
metodologia passo a passo para obter sucesso no projeto do controlador.
Capítulo 2. Revisão bibliográfica 15

Figura 12 – Procedimento de projeto de sistemas de controle - Adaptado.

Fonte: (DORF; BISHOP, 2001)

2.3.1 Especificações de desempenho


Sistemas de controle são arquitetados a fim de realizar funções específicas. As condi-
ções necessárias de um sistema de controle são comumente apresentadas como especificações
de desempenho, indicadas geralmente em termos de resposta transitória e estacionária,
geralmente a uma entrada em degrau unitário. Para comparar as características da resposta
transitória, utiliza-se condições iniciais nulas (OGATA, 2011).
Sob estas condições, é comum especificar os seguintes parâmetros

• Mp - Máximo sobressinal (em porcentagem): é o valor máximo de pico da curva de


resposta mensurado a partir do valor unitário, para entrada padronizada. É comum
utilizar máximo de sobressinal percentual, dado por

c(tp ) − c(∞)
M áximo sobressinal percentual = ∗ 100%.
c(∞)

Sendo que este valor indica diretamente a estabilidade relativa do sistema.

• ess - Erro em regime permanente: mede a capacidade do sistema em acompanhar o


sinal de referência em regime permanente. Para encontrar o erro utiliza-se o teorema
do valor final calculado por

e(t → ∞) = lim sH(s).


s→0
Capítulo 2. Revisão bibliográfica 16

Dado H(s) como a função de transferência do modelo em questão.

• td - Tempo de atraso: tempo necessário para que a resposta alcance metade de seu
valor final pela primeira vez.

• tr - Tempo de subida: tempo necessário para que a resposta passe de 10% a 90%, ou
de 5% a 95%, ou de 0% a 100%. Este trabalho usa de 0% a 100%.

• tp - Tempo de pico: tempo necessário para que a resposta atinja o primeiro pico de
sobressinal.

• ts - Tempo de acomodação: tempo para que a resposta alcance valores em uma faixa
( geralmente de 2% ou de 5%) em torno do valor final, permanecendo indefinidamente.
A faixa escolhida para este estudo foi de 2%.

Na Figura 13 estão indicados os parâmetros de desempenho citados acima, dado


uma entrada em degrau unitário.

Figura 13 – Curva de resposta em degrau unitário.

Fonte: (OGATA, 2011)

Um índice de desempenho quantitativo utilizado neste trabalho é o IAE - Integral


do erro absoluto, dado por
Z T
IAE = |e(t)| dt. (2.6)
0

O IAE é a integral do valor absoluto do sinal de erro no tempo. É equivalente à


soma das áreas acima e abaixo do valor de referência. Vale ressaltar que a construção de
um projeto visando a minimização deste índice gera uma resposta mais lenta do sistema
(SILVA et al., 2016).
Capítulo 2. Revisão bibliográfica 17

2.4 Técnicas de controle


O processo de desenvolvimento de um VAANT está diretamente relacionado ao
sistema de controle da aeronave. A decolagem, a estabilidade durante o voo, a realização
de manobras e o pouso são dependentes de um bom projeto de um controlador de voo.
Para PAW e BALAS (2011), um dos principais desafios do projeto de controladores
é a identificação da dinâmica de voo com o propósito de ser usado em diferentes estágios
de desenvolvimento do controlador. Modelos matemáticos são apenas uma aproximação da
dinâmica do veículo e o uso destes servem para descrever matematicamente a complexa
dinâmica de voos reais.
Na Figura 14 estão representados os diferentes processos de desenvolvimento dos
VAANTs que são rigorosamente conectados e, o processo de desenvolvimento pode ser
seriamente prejudicado se cada processo for abordado de forma individual. Dessa forma,
o desenvolvimento do controlador de voo deve ser abordado conjuntamente no contexto
da modelagem dinâmica, controle e análise do modelo, simulação, projeto do controlador,
implementação e testes de voo (PAW; BALAS, 2011).

Figura 14 – Processo de controle.

Fonte: (PAW; BALAS, 2011)

2.4.1 Controle de estabilidade de quadotores


As características não lineares e multivariáveis fazem com que o quadrotor seja
difícil de se controlar. Técnicas tradicionalmente usadas no controle adaptativo para
atualizações robustas de parâmetros podem não ser suficientes para esquemas difusos
(COZA; MACNAB, 2006). Para desenvolver um controle confiável e para garantir um voo
estável, torna-se importante o desenvolvimento de novas técnicas de controle simples e
robustas (ADIGBLI; MOURET; DONCIEUX, 2007).
Capítulo 2. Revisão bibliográfica 18

É possível encontrar, na literatura, variadas técnicas de controle utilizadas para


estabilização de quadrotores, tais como:

• Técnicas de controle clássico


PD (SHI et al., 2018);
PID (HOFFMAN et al., 2007), (RAWASHDEH et al., 2009);

• Técnicas de controle ótimo


LQR (DOMINGUES, 2009);
LGR (MINH; HA, 2010);

• Técnicas de controle não linear


Lyapunov (BOAUBDALLAH; SIEGWART, 2005);
Backstepping (DIKMEN; ARISOY; TEMELTAS, 2009), (BOAUBDALLAH;
SIEGWART, 2005), (AL-YOUNES; JARRAH, 2008);
Sliding Mode (DIKMEN; ARISOY; TEMELTAS, 2009), (WASLANDER et al.,
2005), (ADIGBLI; MOURET; DONCIEUX, 2007);

• Técnicas de controle inteligente e adaptativo


Fuzzy (RABHI; CHADLI; PÉGARD, 2011), (COZA; MACNAB, 2006);
Redes neuronais (NICOL; MACNAB; RAMIREZ-SERRANO, 2008);
Reinforcement Learning (WASLANDER et al., 2005);

O trabalho de SHI et al. (2018) aponta uma comparação entre as técnicas de


controle PD, Backstepping e Sliding Mode. A comparação dessas técnicas são realizadas
através de simulações utilizando o modelo dinâmico do quadrotor. Os autores afirmam
que, pelo trabalho apresentado, pode-se observar vantagens e desvantagens básicas de cada
técnica e indica a técnica de Sliding Mode como o melhor resultado obtido.
Em HOFFMAN et al. (2007) é utilizado a técnica de controle PID. De acordo
com os autores, em baixas velocidades e com pequenas perturbações aerodinâmicas, um
controlador PID é suficiente para o controle de estabilidade do quadrotor, desde que a
dinâmica do veículo seja aproximada de um duplo integrador através da linearização do
sistema. A princípio, um controlador PID é suficiente para levar o veículo para o comando
inicial, contudo com o aumento da velocidade, o erro entre o ângulo desejado e o ângulo
medido aumenta. Para minimizar este erro, é possível aplicar o controle integral.
No trabalho SOUSA (2011) o cálculo dos parâmetros dos controles PID é realizado
por meio da alocação dos polos e zeros obtendo o valor de margem de fase e ganho desejado.
Existem vários métodos para ajustar esses parâmetros.
Capítulo 2. Revisão bibliográfica 19

Através dos resultados experimentais obtidos em HOFFMAN et al. (2007), os


autores concluem que apesar do controlador PID apresentar bons resultados, a maioria dos
trabalhos têm como foco principal as trajetórias simples, de baixas velocidades, e realizados
em ambientes fechados. Atentando o funcionamento dos quadrotores em velocidades mais
altas e na presença de perturbações causadas pelo vento, os resultados mostram que os
modelos existentes e as técnicas de controle PID são inadequados para o acompanhamento
de trajetórias exatas em ambientes não controlados
As técnicas de controle ótimo LQR e LGR descritas em DOMINGUES (2009) e
MINH e HA (2010), são utilizadas para encontrar um controlador que forneça o melhor
desempenho possível em relação a alguma medida específica de desempenho, por exemplo,
uma função de energia, em qual se deseja minimizar o gasto de energia para controlar o
sistema. A energia do sinal de controle é mensurada por uma função de custo que contém
fatores de ponderação fornecido pelo projetista. Para aplicar essas técnicas de controle é
necessário utilizar o modelo do sistema linearizado.
Os trabalhos DOMINGUES (2009) e MINH e HA (2010) apresentam bons resultados
simulados quando se aplicam os controladores LQR e LQG. Contudo, DOMINGUES (2009)
mostra que os resultados experimentais apresentam um comportamento instável, atribuído
aos sensores utilizados.
As obras de BOAUBDALLAH e SIEGWART (2005) e ADIGBLI, MOURET e
DONCIEUX (2007) mostram uma comparação entre as técnicas de controle não lineares
Backstepping e Sliding Mode. Em BOAUBDALLAH e SIEGWART (2005) a comparação
entre as técnicas são feitas através de simulações e experimentos. Em ADIGBLI, MOURET
e DONCIEUX (2007) os resultados simulados mostram um comportamento robusto dos
dois controladores em relação a estabilidade da aeronave.
Existem diferentes métodos para calcular os parâmetros dos controladores Backs-
tepping, alguns desses métodos foram propostos em ADIGBLI, MOURET e DONCIEUX
(2007). Os controles não lineares apresentam maior robustez em sistemas não lineares com
incertezas ADIGBLI, MOURET e DONCIEUX (2007), entretanto as técnicas de controle
não linear necessitam de um maior poder computacional (SOUSA, 2011).
As técnicas de controle lineares e não lineares são dependentes de um modelo
preciso da dinâmica do quadrotor. Assim, os algoritmos de controle adaptativos são de
extremo interesse no projeto do sistema de controle para voo, não só pela sua capacidade
de otimizar o desempenho e confiabilidade, como também lidar com as incertezas de
parâmetros aerodinâmicos, perturbações externas e imprecisões de modelagem.
20

3 Contextualização teórica

Neste capítulo é debatido o referencial teórico necessário para o desenvolvimento


deste trabalho, abordando a modelagem matemática de um quadrotor e as técnicas de
controle utilizadas.

3.1 Modelagem matemática do VAANT


Segundo BEARD (2008), é necessário descrever vários sistemas de coordenadas
para apresentar a posição e a orientação da aeronave. Com a utilização de sistemas
de coordenadas variáveis, se torna relevante a transformação entre eles através de duas
operações básicas, rotação e translação. O uso de vários sistemas de coordenadas é
importante pelos seguintes motivos:

• As equações de movimento Newtoniana recebem o sistema de coordenadas referentes


ao quadrotor;

• Forças e torques aerodinâmicos são aplicados em um referencial fixo ao corpo;

• Sensores como acelerômetros e giroscópio medem informações referentes a estrutura.


O GPS é uma forma alternativa de mensurar a posição, velocidade referenciada ao
solo e o ângulo do percurso em relação a estrutura inercial.

• Quando se tem missões, as informações referentes ao mapa, ponto de espera e


trajetória do voo são especificados no referencial inercial.

3.1.1 Matrizes de rotação


Considere o sistema de coordenadas apresentados pela Figura 15

Figura 15 – Rotação em 2D.

Fonte: (BEARD, 2008)


Capítulo 3. Contextualização teórica 21

O vetor p pode ser expresso tanto no referencial F 0 (representado por (bi0 , bj 0 , kb 0 )),
quanto no referencial F 1 (representado por (bi1 , bj 1 , kb 1 )). No referencial F 0 tem-se

P = p0xbi0 + p0y bj 0 + p0z kb 0 . (3.1)

De mesmo modo, no referencial F 1 tem-se

P = p1xbi1 + p1y bj 1 + p1z kb 1 . (3.2)

Igualando as duas expressões obtém-se

p0xbi0 + p0y bj 0 + p0z kb 0 = p1xbi1 + p1y bj 1 + p1z kb 1 . (3.3)

Realizando manipulações algébricas e colocando em foma matricial tem-se


    
p1
 x 
bi1 .bi0 bi1 .b
j0 bi1 .k
b0 p0
  x
P1 = p1y  =  bj 1 .bi0 j 1 .bj 0 j 1 .kb 0 
  0
p  . (3.4)
   b b
     y
p1z kb 1 .bi0 kb 1 .bj 0 1 b0
k .k
b p0z
Analisando geometricamente através da Figura 15 tem-se

P1 = R10 .P0 . (3.5)

onde
 

cos(θ) sen(θ) 0
R10 = −sen(θ) cos(θ) 0 . (3.6)
 
 
0 0 1
É utilizado R10 para denotar uma matriz rotação de coordenadas do referencial F 0
para as coordenadas do referencial F 1 . De modo semelhante, utilizando a regra da mão
direita, uma rotação sobre o eixo y se dá
 

cos(θ) 0 −sen(θ)
0
R1 =  0 1 0 . (3.7)
 
 
sen(θ) 0 cos(θ)
De mesmo modo, a rotação sobre o eixo x se dá
 

1 0 0 
0
R1 = 0 cos(θ) sen(θ) . (3.8)
 
 
0 −sen(θ) cos(θ)
A matriz R10 das equações acima são exemplos de uma classe mais geral de matrizes
de rotação que possuem as seguintes propriedades:
Capítulo 3. Contextualização teórica 22

Definição 1
(Rab )−1 = (Rab )T = (Rba ).

Definição 2
Rbc Rab = Rac .

Definição 3
det.Rab = 1.

Observa-se que, na Equação 3.5, o vetor p permanece constante mesmo mudando


as coordenadas. Foi obtida a coordenada F 1 através da rotação de F 0 em um ângulo θ. É
possível construir uma fórmula que desempenha uma rotação contrária à regra da mão
direita no vetor p ao redor de um vetor n
b com um ângulo µ.
Considere a Figura 16

Figura 16 – Rotação horária de um vetor p ao redor do vetor unitário n


b de um ângulo µ
para obter um vetor q.

Fonte: (BEARD, 2008)

O vetor p é rotacionado seguindo a regra da mão esquerda, sobre o vetor unitário


b com um ângulo µ para produzir um novo vetor q (BEARD, 2008). Sendo ϕ o ângulo
n
entre p e q, por geometria tem-se

~ + N~W + W~Q.
q = ON (3.9)

O vetor ON ~ pode ser encontrado através da projeção p sobre o vetor unitário n


b, e
na direção de n
b , então

~ = (p.n
ON b )n
b. (3.10)
Capítulo 3. Contextualização teórica 23

O vetor N~W está na direção de p - ON


~ , como o comprimento N Q cosµ. Observa-se
que o comprimento N Q, N P e p − ON ~ são equivalentes, então

p − (p.n
b )n
N~W =
b
N Qcosµ. (3.11)
kp − (p.n bk
b )n
Assim

N~W = ((kpk .n
b )n
b )cosµ. (3.12)

O vetor W~Q é perpendicular a p e n


b e tem o comprimento N Qsenµ. Note que
N Q = kpk senϕ, então

p×n
W~Q =
b
N Qsenµ. (3.13)
kpk senϕ
Assim

N~W = −n
b × psenµ. (3.14)

Logo, a Equação 3.9 torna-se

q = (1 − cosµ)(p.n b + cosµp − senµ(n


b ).n b × p). (3.15)

que é conhecida como Fórmula de Rotação.


De forma geral, a Equação 3.15 pode ser vista na Figura 17 considerando uma
rotação no sentido oposto a regra da mão direita de um vetor p0 , em um referencial F 0 ,
ao redor do eixo z.

Figura 17 – Rotação de p ao redor do eixo z.

Fonte: (BEARD, 2008)


Capítulo 3. Contextualização teórica 24

Usando a fórmula de rotação, tem-se

q0 = (1 − cosθ)(p.
 
n b + cosφp − senφ(n
b ).n
 
b × p),
 
 
0  x
p0 
−p0y 
= (1 − cosθ)p0z 0 + cosφ p0y  − senφ p0x  ,
     
     
1 p0z  0
 (3.16)

cosφ senφ 0
= −senφ cosφ 0  p0 ,

 
0 0 1
= R01 p0 .

3.1.2 Sistema de coordenadas do quadrotor


Por convenção, adotam-se os seguintes referenciais: referencial inercial, referencial
do veículo, referencial do veículo 1, referencial do veículo 2 e referencial fixo ao corpo.
Supõe-se a Terra plana e estacionária, ou seja, considera-se que a aceleração da rotação e
translação da terra são nulas. Suposição válida para quadrotores (BEARD, 2008).

3.1.2.1 Referencial inercial F i

O sistema de coordenadas inercial é um sistema de coordenadas fixo a Terra,


definindo a origem no local da partida. Como apresentado na Figura 18, o vetor unitário
bii aponta para o Norte, b
j i aponta para o Leste e o kb i aponta para o centro da Terra.

Figura 18 – Referencial inercial. O eixo x aponta para o Norte, enquanto o eixo y aponta
para o Leste e o eixo z aponta para o centro da terra .

Fonte: (BEARD, 2008)

3.1.2.2 Referencial inercial F v

A origem da estrutura do veículo está no centro de massa do quadrotor. Contudo,


os eixos de F v estão alinhados com o eixo da estrutura inercial F i como mostra a Figura
19. O vetor unitário biv aponta para o Norte, bj v aponta para o Leste e o kb v aponta para o
centro da Terra, sendo as coordenadas do F v idênticas às coordenadas do F i .
Capítulo 3. Contextualização teórica 25

Figura 19 – Referencial do veículo. O eixo x aponta para o Norte, enquanto o eixo y


aponta para o Leste e o eixo z aponta para o centro da terra .

Fonte: (ALVES, 2012)

3.1.2.3 Referencial inercial F v1

A origem do referencial do veículo 1 é idêntica ao do referencial do veículo, isto é,


o centro de gravidade, ou centro de massa. É positivamente rotacionado ao redor do eixo
k̂ v de um ângulo ψ (yaw), tal que, se o referencial da aeronave não se movimenta em φ
(roll) ou em θ (pitch).
A transformação entre o referencial do veículo e do referencial do veículo 1 é dada
por:

pv1 = Rvv1 (ψ) pv . (3.17)

 

cosψ senψ 0
v1
Rv (ψ) = −senψ cosψ 0

. (3.18)
 
0 0 1

3.1.2.4 Referencial inercial F v2

A origem desta referência também é o centro de gravidade, ou centro de massa.


É obtida rotacionando o referencial do veículo 2 ao redor de ĵ v1 de um ângulo θ (pitch).
Sendo o ângulo φ (roll) nulo, então îv2 aponta para o "nariz"da aeronave, ĵ v2 aponta para
a asa direita e k̂ v2 aponta para a "barriga"da aeronave.
A transformação entre o referencial do veículo 1 e o referencial do veículo 2, é dada
por:

pv2 = Rv1
v2
(θ) pv1 . (3.19)
Capítulo 3. Contextualização teórica 26

 

cosθ 0 −senθ
v2
Rv1 (θ) =  0

1 0 

. (3.20)
 
senθ 0 cosθ

3.1.2.5 O referencial fixo ao corpo F b

De mesmo modo, a origem é o centro de gravidade. Este referencial é obtido


rotacionando o referencial do veículo 2 em um ângulo de φ (roll), no sentido da regra da
mão direita, ao redor de îv2 . Assim, îv2 aponta para o "nariz"da aeronave, ĵ v2 aponta para
a asa direita e k̂ v2 aponta para a "barriga"da aeronave.
A transformação entre o referencial do veículo 1 e o referencial fixo ao corpo, é
dada por:

pb = Rv2
b
(φ) pv2 . (3.21)

 

1 0 0 
b
Rv2 (φ) = 0 cosφ senφ . (3.22)
 
 
0 −senφ cosφ

3.1.3 Equação de Coriolis


Esta equação tem como objetivo determinar a derivada temporal de p vista pelo
referencial inercial, para isso, deve-se inicialmente assumir que o referencial fixo ao corpo
não esteja rotacionando em relação ao referencial inercial. Em seguida p é fixado no
referencial fixo ao corpo, porém esse referencial rotaciona em relação ao referencial inercial.
Sendo ŝ o eixo instantâneo de rotação e δφ o ângulo de rotação no sentido horário, através
de simplificações matemáticas, obtém-se a equação de Coriolis, dada por:

d d
p= p + ωb × p . (3.23)
dti dtb i

No qual, ω b é a velocidade angular do referencial fixo ao corpo em relação ao


i
referencial inercial.

3.1.4 Cinemática e dinâmica


3.1.4.1 Variáveis de estado do quadrotor

As variáveis de estado do quadrotor são

• pn = posição inercial (norte) do quadricóptero ao longo de îi em F i ;

• pe = posição inercial (leste) do quadricóptero ao longo de ĵ i em F i ;


Capítulo 3. Contextualização teórica 27

• h = altitude medida ao longo de −k̂ i em F i ;

• u = velocidade do quadricóptero medida ao longo de îb em F b ;

• v = velocidade do quadricóptero medida ao longo de ĵ b em F b ;

• w = velocidade do quadricóptero medida ao longo de k̂ b em F b ;

• φ = ângulo de rolagem definido em relação a F v2 ;

• θ = ângulo de arfagem definido em relação a F v1 ;

• ψ = ângulo de guinada definido em relação a F v ;

• p = taxa de rolagem (roll) medida ao longo de îb em F b ;

• q = taxa de arfagem (pitch) medida ao longo de ĵ b em F b ;

• r = taxa de guinada (yaw) medida ao longo de k̂ b em F b .

As variáveis de estado estão representadas, esquematicamente, na Figura 20 abaixo.

Figura 20 – Definição dos eixos.

Fonte: (ALVES, 2012)

3.1.4.2 Cinemática do quadrotor

A relação entre posição e velocidade do quadrotor é dada por:


     
pn  u u
d     
 pe  = Rb  v  = (Rbv )T
v 
v  . (3.24)
   
dti      
−h w w
 

cθcψ sφsθcψ − cφsψ sφsψ 
v T
(Rb ) = cθsψ sφsθsψ − cφcψ cφsθsψ − sφcψ  . (3.25)
 
 
−sθ sφcθ cφcθ
Capítulo 3. Contextualização teórica 28

As variáveis pn , pe e −h são quantidades no referencial inercial, ao passo que


as velocidades u, v e w são quantidades no referencial fixo ao corpo. A variável c é a
representação de cosseno enquanto s é a representação de seno.
É importante relacionar p, q, r a φ̇, θ̇, ψ̇, uma vez que tais ângulos são pequenos e
notando que:

b v2
Rv2 (φ̇)Rv1 (θ̇)Rvv1 (ψ̇) = I. (3.26)

    
φ̇
  
1 sφtgθ cφtgθ  p
 θ̇  = 0 cφ −sφ  q  . (3.27)
    
    
ψ̇ 0 sφsecθ cφsecθ r
Na Equação 3.27, c = cosseno, s = seno, tg = tangente e sec = secante.

3.1.4.3 Dinâmica dos corpos rígidos

A Lei de Newton aplicada ao movimento translacional é dada por:

dv
m = f. (3.28)
dti
Na Equação 3.28

• m é a massa do quadrotor;

• v é a velocidade do quadrotor;

• f é a força total aplicada ao quadrotor;


dv
• dti
é a derivada no tempo, no referencial inercial.

A partir da Equação de Coriolis (Equação 3.23), obtém-se


!
dv dv
m =m + ω b × v = f. (3.29)
dti dtb i

Após calcular a força de controle e aplicar nas coordenadas do corpo, uma vez que
ω é medida também nessas coordenadas, reduz-se a Equação 3.29 em função do referencial
∆ ∆
fixo ao corpo, em que vb = (u,v,w)T e vbb/i = (p,q,r)T .
Portanto, em coordenadas do corpo, a Equação 3.28 torna-se
     
u̇ rv − qw  fx 
   1 
 v̇  = pw − rv  + f  . (3.30)
     
    m  y
ẇ qu − pv fz
Capítulo 3. Contextualização teórica 29

Em relação ao movimento de rotação, a 2a Lei de Newton diz

dhb
= m. (3.31)
dti
Em que m é o torque aplicado e h é o movimento angular. Usando a Equação de
Coriolis obtém-se

dh dh
= + ω b × h = m. (3.32)
dti dtb i

Nas coordenadas do corpo: hb = Jω bb , em que J é dado por


i
 
 x
J −Jxy −Jxz 
J = −Jxy Jy −Jyz  . (3.33)
 
 
−Jxz −Jyz Jz
Os momentos de inércia do quadrotor são calculados assumindo uma esfera maciça
no centro com massa M , raio R e massas pontuais de tamanho m, localizados a uma
distância l do centro como visto a Figura 21.

Figura 21 – Esquema assumido para se calcular os momentos de inércia do quadrotor.

Fonte: (ALVES, 2012)

Tomando como modelo representado na Figura 20, nota-se que o modelo é simétrico
em relação aos eixos, logo, Jxy = Jxz = Jyz = 0, assim
 
J
 x
0 0
J =  0 Jy 0  . (3.34)
 
 
0 0 Jz
 
1
 Jx
0 0
J −1 =  0 1
0 . (3.35)
 
 Jy 
1
0 0 Jz
Capítulo 3. Contextualização teórica 30

2M R2
Assumindo que a inércia da esfera sólida é J = 5
,obtém-se

2M R2
Jx = + 2l2 m ; (3.36)
5

2M R2
Jy = + 2l2 m ; (3.37)
5

2M R2
Jz = + 4l2 m . (3.38)
5

Definindo mb = (τφ , τθ , τψ ) é possível escreve a Equação 3.32 nas coordenadas do
corpo como
     
Jy −Jz

   Jx
qr   J1x τφ 
q̇  =  JzJ−Jx pr  +  J1 τθ  . (3.39)
     
   y   y 
Jx −Jy 1
ṙ Jz
pq τ
Jz ψ

3.1.4.4 Forças e momentos

Este tópico descreve forças e torques que agem sobre o quadrotor. Uma vez que
não há superfícies de elevação (aerodynamics lifting surfaces), as forças e movimentos
aerodinâmicos são desprezíveis. As forças e momentos são ocasionados principalmente
devido a gravidade e aos quatro propulsores, como apresentado na Figura 22.

Figura 22 – Esquema das forças e momentos existentes no quadrotor.

Fonte: (ALVES, 2012)

Como visto na Figura 22, os motores dianteiro e traseiro giram no sentido horário
e os motores esquerdo e direito giram em sentido anti-horário. A força total é apresentada
na Equação 3.40, observando a Figura 23
Capítulo 3. Contextualização teórica 31

Figura 23 – Esquema de forças e torques que atuam no quadrotor.

Fonte: (BEARD, 2008)

F = Ff + Fr + Fb + Fl . (3.40)

O torque de rolamento (roll) é produzido pelas forças dos motores da direita e da


esquerda, como apresentado pela Equação 3.41

τφ = l (Fl − Fr ) . (3.41)

Já o torque de guinada (yaw) é produzido pelo arrasto dos propulsores. Direção


oposta à direção de movimento do propulsor, como apresentado pela Equação 3.42

τψ = τr + τl − τf − τb . (3.42)

A sustentação e arrasto produzidos pelos propulsores é proporcional ao quadrado


da velocidade angular. Assume-se que a velocidade angular é diretamente proporcional ao
comando de largura de modulação de pulso (PWM) enviado ao motor.
A força e o torque exercidos em cada motor são definidos como

F∗ = k1 δ∗ . (3.43)

τ∗ = k2 δ∗ . (3.44)

Na qual k1 , k2 são constantes determinadas experimentalmente, δ∗ é o sinal de


comando do motor e o ∗ representa f, r, b, l. De forma que:
    
 
F  1
k k1 k1 k1  δf 
 τφ   0 −lk1 0 lk1  δ 
    
  =    r . (3.45)
 τθ   lk1 0 −lk1 0  δ 
    
     b
τψ −k2 k2 −k2 k2 δl
Capítulo 3. Contextualização teórica 32

No referencial F v , a força da gravidade é exercida no centro de massa do quadrotor


é dada por
 

0 
v
fg =  0  . (3.46)
 
 
mg
Deve-se transformar a força da gravidade para o referencial fixo ao corpo:
   

0   −mg sin θ 
b b
fg = Rv  0  =  mg cos θ sin φ  . (3.47)
  
   
mg mg cos θ cos φ

3.1.5 Modelo matemático


O modelo matemático está descrito nas equações abaixo
    

 n 
cθcψ sφsθcψ − cφsψ cφsθcψ + sφsψ   u 
 ṗe  = cθsψ sφsθsψ + cφcψ cφsθsψ − sφcψ   v  , (3.48)
    
    
ḣ sθ −sφcθ −cφcθ w
       
u̇ rv − qw   −g sin θ  0 
   1 
 v̇  = pw − ru +  g cos θ sin φ  +  0 , (3.49)
       
      m  
ẇ qu − pv g cos θ cos φ −F
    
φ̇
  
1 sin φ tan θ cos φ tan θ p
 θ̇  = 0 cos φ − sin φ  q  , (3.50)
    
    
sin φ cos φ
ψ̇ 0 cos θ cos θ
r
     
Jy −Jz 1

   Jx
qr  τ
 Jx φ 
 Jz −Jx   1 
q̇  =  J pr  +  J τθ  . (3.51)
 
   y   y 
Jx −Jy 1
ṙ Jz
pq τ
Jz ψ

Nota-se a presença de funções não lineares neste modelo revelando que o sistema
é não linear. Para a aplicação de técnicas de controle destinadas a sistemas lineares é
necessário a simplificação deste modelo.

3.1.6 Modelo matemático simplificado


As equações de movimento do quadrotor descritas ao longo do tópico de modelagem
podem ser simplificadas, como vista em BEARD (2008). Sendo assim, o modelo simplificado
do quadrotor é dado por

F
p̈n = − cos φ sin θ ; (3.52)
m
Capítulo 3. Contextualização teórica 33

F
p̈e = sin φ ; (3.53)
m

F
ḧ = g − cos φ cos θ ; (3.54)
m

1
φ̈ = τφ ; (3.55)
Jx

1
θ̈ = τθ ; (3.56)
Jy

1
ψ̈ =
τψ . (3.57)
Jz
Observa-se que as variáveis angulares a serem controladas, roll, pitch e yaw não
possuem funções não lineares.

3.2 Técnicas de controle


A escolha do tipo de controlador a ser utilizado deve ser decidida com base na
natureza da planta e nas condições de operação, incluindo certas considerações como
segurança, custo, disponibilidade, confiabilidade, precisão, peso e tamanho (OGATA, 2011).
Para o quadrotor em questão, serão aplicadas as técnicas de controle PID, LQR,
LQG e Lyapunov, técnicas estas que são amplamente encontradas na literatura e possuem
bons resultados aplicados em outros trabalhos.

3.2.1 Controle PID


A técnica de controle PID é a combinação das ações de controle proporcional,
integral e derivativo. Esta ação combinada tem as vantagens individuais de cada uma das
três ações de controle (OGATA, 2011). A equação de um controlador PID é dada por:

Kp Z t de (t)
u (t) = Kp e (t) + e (t) dt + Kp Td . (3.58)
Ti 0 dt
Existem diversos métodos de sintonia para o controlador PID, através do ajuste de
seus parâmetros. Dois destes serão aplicados para o controle dos quadrotores, Successive
Loop Closure (SLC) e Twiddle. O primeiro método se baseia na saturação dos atuadores do
sistema, fazendo com que o desempenho não seja limitado por tais restrições, facilitando a
aplicação para o quadrotor que possui limitações em relação aos ângulos de inclinação em
cada eixo. O segundo, é baseado em estratégia de sintonia fina e visa encontrar a melhor
resposta com o menor erro médio possível, sua versatilidade trás uma vantagem ao ser
aplicado em quadrotores, como já encontrado em trabalhos.
Capítulo 3. Contextualização teórica 34

3.2.1.1 Sintonia do controlador PID por Successive Loop Closure

O projeto do controlador por Successive Loop Closure (BEARD (2008)) implica


que o desempenho do sistema é, algumas vezes, limitado por restrições de saturação dos
atuadores. Conhecendo essas restrições, é possível utilizá-las para desenvolver especificações
de desempenho para o controlador. Nesse contexto, considerando que é um sistema estável,
o maior esforço de controle à uma resposta ao degrau ocorre imediatamente após o degrau,
em que umax = kp emax . Manipulando matematicamente essa expressão, pode-se obter o
ganho de controle proporcional (kp ) através do erro máximo antecipado, e o limite de
atuação do atuador como

umax
kp =
. (3.59)
emax
Considerando um sistema de segunda ordem com realimentação proporcional ao
erro e realimentação derivativa na saída, a função de transferência em malha fechada é
dada por

φ bx kp (s + kkpi )
= 3 . (3.60)
φd s + bx Kd s2 + bx kp s + bx ki
Para selecionar kd , fixa-se o valor de kp e considera-se ki = 0, a função de transfe-
rência em malha fechada do sistema da Equação 3.60 torma-se

φ bx kp
d
= 2 . (3.61)
φ s + bx K d s + bx k p
O modelo do sistema que se deseja controlar é dado pela Equação 3.55 que representa
a equação de movimento para o ângulo φ. O torque é dado por τφ = l(Fl + Fr ) e a força é
diretamente proporcional ao comando PWM tal que F = k1 δ, assim

τφ = l(k1 δl − k1 δr ) = 2lk1 4δφ . (3.62)

No qual 4δφ = (δl − δr )/2 é a variação de comando calculada pelo controlador que
será somada ao motor esquerdo e diminuirá no motor direito. Analisando essa condição de
acordo com a Equação 3.55, bx é dado por

2lk1
bx = . (3.63)
Jx
É importante também, conhecer a forma canônica da função de transferência de
segunda ordem com zeros inexistentes que é dada pela forma padrão

Y (s) ωn2
H(s) = = 2 . (3.64)
X(s) s + 2ζωn s + ωn2
Capítulo 3. Contextualização teórica 35

Em que ζ é o coeficiente de amortecimento e ωn é a frequência natural. Caso


0 ≤ ζ ≤ 1, o sistema é dito subamortecido, e seus polos complexos são dados por
q
polos = −ζωn ± 1 − ζ 2. (3.65)

Comparando os coeficientes do polinômio do denominador da função de transferência


de malha fechada do sistema da Equação 3.60 com os coeficientes da função de transferência
canônica do sistema de segunda ordem da Equação 3.64, levando em consideração os
limites de saturação do atuador, pode-se derivar uma expressão para a largura de banda
realizável para o sistema em malha fechada.
Equacionando os coeficientes dos termos s0 , tem-se
q
ωn = bx kp . (3.66)

Para selecionar ki , a equação característica do sistema em malha fechada é escrita


como

bx
1 + ki = 0. (3.67)
s3 + bx kd s2 + kp bx s
Utilizando o método lugar das raízes é possível encontrar um valor para ki de forma
que o coeficiente de amortecimento do sistema permaneça próximo a 0,8.
O projeto feito para o controle do ângulo φ pode ser refeito o controle do ângulo θ
mudando apenas a constante bx para by = 2lk1 /Jy e alterando as respectivas nomenclaturas.
De forma semelhante, para realizar o controle do ângulo ψ pode ser utilizado o mesmo
projeto realizado para o controle do ângulo φ alterando o bx por bz com bz = 4k2 /Jz .

3.2.1.2 Sintonia do controlador PID pelo método Twiddle

O método Twiddle possui grande versatilidade, podendo ser aplicado aos mais
diversos processos, tendo sido aplicado inclusive em quadrotores (GOLDSTEIN, 2012). O
método foi criado baseado em estratégia de sintonia fina e nos critérios de desempenho de
integrais de erro, para gerar uma técnica que minimize o erro médio medido na resposta
da planta. Para executar o método, é importante conseguir reproduzir a performance da
planta a ser controlada em uma simulação, pois para atingir a minimização do erro podem
ser necessárias muitas iterações.
O método tem como parâmetros um vetor P de ganhos a serem inseridos no
controlador PID (P = [Kp , Ti , Td ]), um vetor dP de variação diferencial para os ganhos
de P , e uma porcentagem de variação ξ para os parâmetros do vetor dP . Inicialmente,
os valores de P são inseridos no controlador PID, e a simulação executa um teste com
estes valores, medindo o erro total E obtido. A seguir, o primeiro parâmetro de P (Kp )
é acrescido de dP e o teste é refeito. Caso o valor de E seja menor do que na iteração
anterior, o que indica que a variação feita foi na direção certa, o valor de Kp continua sendo
Capítulo 3. Contextualização teórica 36

acrescido de dP . Caso contrário, tenta-se variar Kp na direção contrária, decrescendo este


por dP . Obtendo piora de resultado em ambas as direções, tenta-se novamente reduzindo o
valor de dP por ξ, e assim sucessivamente até que a variação de resultado seja desprezível,
passando então para o próximo parâmetro (Ti ). Após executar o processo por todos os
parâmetros, são obtidos os valores de Kp , Ti e Td para os quais são obtidos os menores
valores de erro atingidos. O método não garante atingir precisamente o mínimo global do
sistema, porém se mostra altamente eficiente para a grande maioria dos casos (NORVIG
P.; THRUN, 2019).

3.2.2 Sintonia do controlador LQR


Um sistema contínuo controlável pode ser enunciado no seguinte formato de variáveis
de estado

ẋ = Ax + Bu. (3.68)

Em que x(t) ∈ <n e u(t) ∈ <n . Deseja-se encontrar a lei de controle que minimiza
o índice de desempenho J, como visto em DOMINGUES (2009)

1Z ∞ T
min J = (x Qx + uT Ru)dt. (3.69)
u 2 0
Sendo Q(n x n) uma matriz de tamanho, em que n corresponde ao número de estados
a serem controlados, semidefinida positiva, e R(m x m) uma matriz, em que m corresponde ao
número de entradas do processo, maior que zero. Considerando que x(0) é a condição inicial
e assumindo-se que todos os estados são observáveis busca-se encontrar um controlador
que atenda

u = −Kx. (3.70)

Utilizando este controle em um sistema de malha fechada têm-se

ẋ = (A − BK)x = Ac x. (3.71)

sendo Ac a matriz da planta de malha fechada. Substituindo a Equação 3.70 na


Equação 3.69 tem-se

1Z ∞ T
J= (x (Q + K T RK)x) dt. (3.72)
2 0
Espera-se encontrar um vetor K que minimize o índice de desempenho J para
otimizar o sistema. Percebe-se que a entrada de controle u(t) e o estado x(t) são diretamente
proporcionais a J, sendo assim, o fato de encontrar um J simplificado implica que x(t) vai
a zero quando o t tende ao infinito, garantindo a estabilidade do sistema de malha fechada.
Capítulo 3. Contextualização teórica 37

As matrizes Q(n x n) e R(m x m) são definidas pelo projetista. Durante o projeto, é


necessário levar em conta a proporcionalidade entre elas para minimizar J, isso significa
que se os valores de Q forem altos, os valores de R necessariamente devem ser baixos ou
vice-versa. Caso o projetista escolha valores altos para Q, terá como consequência que os
polos da matriz Ac estejam situados mais a esquerda do plano S, ou seja, o sistema irá
decair mais rapidamente para zero. Em contrapartida, caso seja escolhidos valores altos
para R a consequência será um menor esforço do controle, dado que os polos são mais
lentos.
Regulador linear-quadrático (LQR) é o nome dado à questão de determinar um
vetor de ganhos K para minimizar a função custo J, considerando a planta linear e o
índice de desempenho quadrático. O intuito do controle é reduzir o estado x(t) a zero,
com o mínimo de gasto energético.
Para descobrir o K ótimo, parte do princípio que exista uma matriz P tal que
d T
(x P x) = −xT (Q + K T RK)x. (3.73)
dx
Substituindo o controle de realimentação de estados na Equação 3.72 tem-se

1Z ∞ d T 1
J= (x P x) = xT (0)P x(0). (3.74)
2 0 dx 2
Admitindo que o sistema de malha fechada é estável, quando x(t) tende a zero com
t tendendo ao infinito, a Equação 3.74 evidencia que J é dependente da matriz P e das
condições iniciais, não da matriz K como visto anteriormente.
Sendo assim, é possível obter o ganho K considerando a suposição feita na Equação
3.73. Diferenciando-se a Equação 3.73 e substituindo a equação do sistema de malha
fechada (Equação 3.71) tem-se:

ẋT P x + xT P ẋ + xT Qx + xT K T RKx = 0,
xT ATc P x + xT P Ac x + xT Qx + xT K T RKx = 0, (3.75)
xT (ATc P + P Ac + Q + K T RK)x = 0.
Percebe-se que a última equação foi mantida para todos os valores de x(t), logo, o
tempo entre parênteses deve ser nulo. Dessa forma tem-se a equação quadrática da matriz
(Equação 3.76)

ATc P + P Ac + Q + K T RK = 0,
(A − BK)T P + P (A − BK) + Q + K T RK = 0, (3.76)
AT P + P A + Q + K T RK − K T B T P − P BK = 0.
De forma equivalente a uma equação escalar, é possível completar quadrado na
equação acima. Tal procedimento é mais complicado, e para que seja possível, supõe-se
que

K = R−1 B T P. (3.77)
Capítulo 3. Contextualização teórica 38

Substituindo a Equação 3.77 na Equação 3.76 resulta

AT P +P A+Q+(R−1 B T P )T R(R−1 B T P )−(R−1 B T P )T B T P −P B(R−1 B T P ) = 0. (3.78)

Simplificando, tem-se

AT P + P A + Q − P BR−1 B T P = 0. (3.79)

A Equação 3.79 é conhecida como equação algébrica de Riccati (DOMINGUES


(2009) e GIESBRECHT (2012)). Essa equação quadrática de matriz pode ser resolvida
pela matriz auxiliar P , dados (A, B, Q, R), solucionando assim o ganho ótimo K através
da Equação 3.77. Observa-se também que o valor mínimo do índice de desempenho é dado
pela Equação 3.74, que é dependente da matriz auxiliar P e das condições iniciais.

3.2.3 Sintonia do controlador LQG


O controle Linear-Quadrático Gaussiano (LQG) está inserido nas principais áreas
de pesquisas para um sistema de controle primário. Compreende em um sistema linear
incerto que sofre perturbações sob a forma de ruído branco gaussiano, de custo quadrático
e não possui todas as informações sob os estados (isto é, não tem-se acesso a todas as
variáveis de estado) (AZAM, 2017).
O controlador LQG é uma combinação do filtro de Kalman, do Estimador Qua-
drático Linear (LQE) com o Controlador Linear Quadrático (LQR) que visa otimizar
o controle de sistemas lineares. Levando em consideração o princípio da separação, o
qual permite que o controlador possa ser calculado e projetado de forma independente,
é possível aplicar o controle LQR à sistemas Lineares e invariantes no Tempo (LTI) e à
sistemas Lineares e Variantes no Tempo (LTV).
O controlador LQG é constituído pela conexão em cascata de um filtro de Kalman
e a matriz de ganhos ótimos de um regulador linear quadrático. Como a matriz de ganhos
foi calculada na Subseção 3.2.2, é preciso encontrar os parâmetros referentes ao filtro de
Kalman.

3.2.3.1 Filtro de Kalman

O filtro de Kalman é uma ferramenta matemática desenvolvida por Rudolph Emil


Kalman cujo sua principal função é estimar os estados de processos lineares. Entre os
estimadores lineares existentes, este filtro possui um destaque especial por possuir o menor
erro em relação aos estados estimados (AZAM, 2017).
Para projetar o filtro de Kalman, presume-se que o sistema a ser estimado é linear
e assume a presença de ruídos de processo e medição gaussianos. O modelo geral de um
processo linear pode ser visto por meio da Equação 3.80, no qual as variáveis A, B e C
Capítulo 3. Contextualização teórica 39

são as matrizes do espaço de estados do sistema a ser controlado e Bw é a matriz que


relaciona o ruído de processo com o estado ẋ.

ẋ(t)= Ax(t) + Bu(t) + Bw w
. (3.80)
y(t) = Cx(t) + v

O ruído de processo é a expressão utilizada para destacar as dinâmicas do sistemas


que não foram previstas em seu modelo, já o ruído de medição, são as perturbações nos
sensores do sistema impedindo a medição exata e precisa. Os termos w e v presentes na
Equação 3.80 representam o ruído de processo e de medição, respectivamente, ambos
gaussianos com a covariância dadas pelas Matrizes Qk e Rk .
O filtro de Kalman analisa os valores lidos pelos sensores e o valores calculados
pela dinâmica do sistema, tal análise é mediada por uma matriz de ganho nomeada por
ganho de Kalman. Os ruídos de processo e de medição são inversamente proporcionais aos
estados estimados em relação aos estados medidos, ou seja, quanto maior a relação entre
o ruído de medição e o ruído do processo, os estados estimados terão seus valores mais
próximos aos previstos pela dinâmica do processo.
Para este estudo, será utilizado o filtro de Kalman recursivo, considerado um método
tradicional que, para cada leitura dos sensores, uma matriz de ganho é calculada. Este
modelo é embasado na discretização do modelo apresentado na Equação 3.80, assumindo
Ts como tempo de amostragem, o novo modelo é expressado pela Equação 3.81.

x
k+1 = Ad xk + Bd uk + Bw,d wd
. (3.81)
 yk = Cd xk + vd
Em que Ad , Bd , Cd e Bw,d são representações discretizadas das matrizes A, B, C e
Bw do sistema apresentado na Equação 3.80. O projeto deste filtro inicia-se com a predição
dos estados, onde os estados do próximo instante são calculados baseados nas matrizes A
e B, que descrevem o processo, nos estados e entradas atuais do sistema.

xpred
k = Ad x̂k−1 + Bd uk . (3.82)

Logo após, calcula-se a predição da matriz de covariância do erro de estimação


para o instante k

Pkpred = Ad Pk−1
pred T
Ad + Qd . (3.83)

Concluindo esta etapa, realiza-se a etapa de correção, onde é feita uma ponderação
dos estados preditos com valores lidos pelos sensores. Esta ponderação é realizada pela
matriz de ganho calculada por

Kk = Pkpred CdT (Cd Pkpred CdT + Rd )−1 . (3.84)


Capítulo 3. Contextualização teórica 40

A estimação dos estados do sistema é calculada usando a Equação 3.85

x̂k = xpred
k + Kk (yk − Cd xpred
k ). (3.85)
Finalmente a matriz de covariância do erro de estimação é feita a partir de

Pk = (I − Kk Cd )Pkpred . (3.86)

3.2.4 Sintonia do controlador Lyapunov


Em muitos sistemas controláveis, a estabilidade é geralmente a principal caracterís-
tica a ser definida. Para sistemas lineares e invariantes no tempo, critérios de estabilidade
como de Nyquist ou de Routh são os mais usados porém, para sistemas não lineares ou
variantes no tempo, tais critérios não são aplicáveis (COSTA, 2012). Sendo assim Lyapunov
concentrou seu estudos na resolução da Equação 3.87 para a construção de uma teoria
de estabilidade, composta por dois métodos que não se encontram limitados a sistemas
lineares e invariantes no tempo.

ẋ = f (x, t) com f (0, t) = 0. (3.87)


O primeiro método exige a resolução da equação diferencial, ao passo que o segundo
método, nomeado Segundo Método de Lyapunov ou Método Direto não requer tal
esforço. O Segundo Método é aplicado de forma geral, ou seja, tanto para sistemas lineares
quanto para sistemas não lineares, de mesmo modo para sistemas variantes ou invariantes
no tempo.
Dado um sistema descrito pela Equação 3.87, em que x é um vetor de n estados e
f (x, t) é um conjunto no qual seus n elementos são funções dependentes de x e t. Imputa-
se que o sistema tenha apenas uma solução dada uma condição inicial expressada por
Φ(t, x0 , t0 ), ou seja, a trajetória é composta por todos os pontos do espaço de estados que
são resposta do sistema temporal. Define-se um ponto de equilíbrio o estado xe onde

f (xe , t) = 0 para todo t. (3.88)


Lyapunov trata de sistemas f (0, t) = 0, como o estado de 0 sendo o ponto de
equilíbrio, o que pode ser feito com sistemas com pontos de equilíbrio isolados, transladando-
os para origem por simples transformações lineares de forma conveniente.
Seja uma região esférica de raio k em torno de um estado de equilíbrio xe

kx − xe k ≤ k. (3.89)
sendo kx − xe k é a norma Euclidiana estipulada por:

1
kx − xe k = [(x1 − x1e )2 + (x2 − x2e )2 + (x3 − x3e )2 + · · · + (xn − xne )2 ] 2 . (3.90)
Capítulo 3. Contextualização teórica 41

Considerando S(δ) como uma parcela dos pontos pertencentes ao espaço

kx − xe k ≤ δ. (3.91)

e S(ε) outra parcela

kΦ(t, x0 , t0 ) − xe k ≤ ε. (3.92)

Um sistema é considerado estável se sua trajetória iniciada em S(δ) não ultrapasse


os limites delimitados por S(ε) conforme t → ∞. O valor de δ depende de ε e, quase
sempre, de t0 também (vide a Figura 24). Quando δ não depende de t0 significa que o
estado de equilíbrio é uniformemente estável.

Figura 24 – Sistema com o estado de equilíbrio estável.

Fonte: (COSTA, 2012)

Na escala de estabilidade em relação a Lyapunov existe também a estabilidade


assintótica, em que para qualquer x0 o sistema for estável (a trajetória se mantém dentro
de S(ε)) convergindo para xe com t → ∞, como pode ser visto na Figura 25

Figura 25 – Sistema com o estado de equilíbrio assintoticamente estável.

Fonte: (COSTA, 2012)


Capítulo 3. Contextualização teórica 42

Para analisar a estabilidade de um sistema considerando os métodos de Lyapunov,


é preciso definir o domínio de atração (tamanho do S(ε)), região do espaço onde se
iniciam as trajetórias assintoticamente estáveis. Um estado de equilíbrio xe é chamado
de assintoticamente estável global, conceito mais desejável, se e somente se, toda solução
converge para xe quando t → ∞. Para isto acontecer, é necessário que haja apenas um
estado de equilíbrio em todo espaço de estados.
Se o comportamento do sistema não reage como mencionado acima, o sistema é
considerado instável, ou seja, se para algum número real ε > 0 e qualquer número real
δ > 0 sempre há um estado x0 em S(δ) de maneira que a trajetória parte deste estado e
abandona S(ε) como visto na Figura 26.

Figura 26 – Sistema com o estado de equilíbrio instável.

Fonte: (COSTA, 2012)

Observe que a teoria de Lyapunov é analisada em pequenas regiões, em torno do


ponto de equilíbrio xe . Sendo assim, é preciso estruturar as definições algébricas lineares
para desenvolver essas teorias matematicamente. Posto isto, é necessário considerar algumas
definições, tais como:

• Funções escalares definida e semi-definida positivas (Seção 3.2.4.1.1);

• Funções escalares definida e semi-definida negativas (Seção 3.2.4.1.2);

• Funções escalares indefinidas (Seção 3.2.4.1.3);

• Forma hermitiana e quadrática (Seção 3.2.4.1.4).

3.2.4.1 Definições matemáticas

3.2.4.1.1 Funções escalares definida e semi-definida positivas

Uma função f (x) é definida positiva em uma região incluindo a origem se

f (x) > 0 se x 6= 0, f (0) = 0. (3.93)


Capítulo 3. Contextualização teórica 43

e ela é semi-definida positiva quando

f (x) ≥ 0 se x 6= 0, f (0) = 0. (3.94)

3.2.4.1.2 Funções escalares definida e semi-definida negativas

Uma função f (x) é definida negativa se −f (x) é definida positiva. De forma análoga,
a função f (x) é semi-definida negativa se −f (x) é semi-definida positiva.

3.2.4.1.3 Funções escalares indefinidas

Uma função f (x) é dita indefinida se em uma região assume valores positivos e
negativos simultaneamente.

3.2.4.1.4 Forma hermitiana e quadrática

A Forma Hermitiana, e sua generalização, a forma quadrática, são muito úteis


para analisar a estabilidade. A forma Hermitiana é uma função obtida através da seguinte
operação

f (x) = x∗ P x. (3.95)

sendo x∗ o conjugado de x e P é a matriz hermítica. Uma matriz é dita hermítica se


for quadrada e Pij = Pij∗ (simétrica com autovalores positivos). Uma condição para a forma
hermitiana ser positiva pode ser verificada pelo critério de Sylvester: Os determinantes
menores de P sejam sucessivamente positivos é uma condição necessária e suficiente para
que a forma hermitiana seja definida positiva, ou seja

p11 p12 · · · p1n


p11 p12 p21 p22 · · · p2n
p11 > 0, > 0, · · · , . .. .. .. > 0. (3.96)
p21 p22 .. . . .
pn1 pn2 pn3 pnn

3.2.4.2 Segundo método de Lyapunov

Lyapunov definiu a sua função como uma representação algébrica da energia, dado
que, em sistemas assintoticamente estáveis a energia armazenada dentro do domínio de
atração decai com o passar do tempo, até assumir um valor mínimo no estado de equilíbrio.
A função de lyapunov busca encontrar funções dependentes dos estados e do tempo, sendo
descrita como f (x1 , x2 , x3 , ..., xn , t) ou simplesmente f (x, t) de forma que tal função seja
definida positiva e sua derivada seja definida negativa, isto é, funções assintoticamente
estáveis.
Capítulo 3. Contextualização teórica 44

3.2.4.2.1 Teorema central da estabilidade

Teorema 1 Seja um sistema descrito por

ẋ = f (x, t). (3.97)

no qual

f (0, t) = 0. (3.98)

Se houver uma função escalar V (x, t) contínua, sua primeira derivada contínua, e
satisfaça as seguintes condições

1. V (x, t) é definida positiva;

2. V̇ (x, t) é definida negativa.

então o equilíbrio na origem é uniformemente assintoticamente estável.


Caso também V (x, t) → ∞ para kxk → ∞, então o sistema será uniformemente
assintoticamente estável e de forma global, com o ponto de equilíbrio na origem.

Entretanto, a condição de V̇ (x, t) pode ser flexibilizada mantendo a estabilidade


atendendo aos seguintes quesitos

1. V (x, t) é definida positiva;

2. V̇ (x, t) é semi-definida negativa;

3. V̇ (Φ(t, x0 , t0 )) 6= 0 se x 6= 0.

3.2.4.3 Verificação da estabilidade de Lyapunov para sistemas lineares e invariante no tempo

Seja um sistema descrito por

ẋ = Ax. (3.99)

Em que x é o vetor de estado n − dimensional e A uma matriz quadrada constante


de ordem n. Considera-se A uma matriz não singular, então o único estado de equilíbrio é
a origem. Para este sistema adotasse a seguinte função de Lyapunov

V (x) = x∗ P x. (3.100)

No qual P é uma matriz definida positiva, real e simétrica para um vetor de estado
x real. A derivada de V (x) em relação ao tempo durante toda sua trajetória é
Capítulo 3. Contextualização teórica 45

V̇ = ẋ∗ P x + x∗ P ẋ, (3.101)


= (Ax)∗ P x + x∗ P (Ax), (3.102)
= x∗ A∗ P x + x∗ P Ax, (3.103)
= x∗ (A∗ P + P A)x. (3.104)

Sendo V (x) definida positiva, é necessário que V̇ (x) seja definida negativa, para
cumprir as condições de estabilidade assintótica, portanto

V̇ = x∗ Qx. (3.105)

uma vez que

Q = −(A∗ P + P A). (3.106)

logo, para garantir a estabilidade assintótica do sistema é suficiente e necessário


que Q seja definida positiva. De forma a facilitar o projeto, inicialmente define uma matriz
Q definida positiva e logo em seguinte, verifica se P também é definida positiva.
46

4 Resultados e discussões

Para construir um controlador adequado são levantados alguns parâmetros como:


massa da esfera central (M ), comprimento da haste que liga o centro à hélice (l), massa
da estrutura que comporta a hélice (m) e o raio da esfera central (R) como apresentado
na Figura 21. Foram utilizados quatro quadrotores com dimensões distintas na intenção
de encontrar algum resultado que mostre a influencia dos tamanhos na decisão de qual
controlador utilizar para determinado VAANT.
O quadrotor arquitetado em ALVES (2012) é denominado de VAANT 1, o Matrice
210 RTK produzido pela empresa Dji é o VAANT 2, o Syma X5sw Explorers fabricado
pela empresa Syma Solutions é o VAANT 3 e por fim, o YMFC-3D com o tutorial de
seu confeccionamento no site Brokking.net é o VAANT 4. Os parâmetros ponderados são
exibidos na Tabela 1

Tabela 1 – Medidas dos quadrotores.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


m 0,1050 kg 0,1447 kg 0,1349 kg 0,1050 kg
l 0,3500 m 0,6554 m 0,2313 m 0,3182 m
M 0,8500 kg 5,0983 kg 1,0384 kg 0,6000 kg
R 0,1000 m 0,3562 m 0,0618 m 0,0742 m

A metodologia utilizada Sub-Optimal Excitation Signal Generation and Optimal


Parameter Estimation (SOESGOPE), encontrada em GONÇALVES, CERQUEIRA e
COSTA (2020), é composta por dois algoritmos de otimização arranjados em uma con-
figuração de camada dupla, sendo a camada externa responsável por gerar e avaliar os
sinais utilizados na camada interna, camada qual que utiliza estes sinais para estipular a
estimativa ótima do conjunto. Os parâmetros k1 e k2 são obtidos por meio de testes práticos,
sendo impossível a realizações destes testes, emprega-se metodologia (SOESGOPE) que,
recorrendo a simulação, efetua a cotação de k1 e k2 , valores tais dispostos na Tabela 2

Tabela 2 – Constantes dos quadrotores.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


k1 0,0320 0,0875 0,0291 0,0252
k2 0,0147 0,0516 0,0208 0,0130

Os momentos de inércia são calculados a partir das Equações 3.36, 3.37 e 3.38
utilizando os parâmetros dos VAANTs. Os resultados estão apresentados na Tabela 3,
Capítulo 4. Resultados e discussões 47

ressalta-se que os cálculos para os eixos φ e θ são idênticos, devido a simetria entre os
eixos, então Jx = Jy .

Tabela 3 – Momento de inércia dos quadrotores.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Jx = Jy 0,0291 0,3831 0,0160 0,0226
Jz 0,0549 0,5074 0,0305 0,0438

De modo a facilitar a apresentação de dados, utiliza-se os termos bx ,by e bz (expostos


na Seção 3.2.1.1), calculados a partir de bx = by = 2lk1 /Jy e bz = 4k2 /Jz , cujo seus valores
calculados são expostos na Tabela 4.

Tabela 4 – Parâmetros dos quadrotores.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


bx = by 0,7691 0,2994 0,8403 0,7101
bz 1,0720 0,4068 2,7319 1,1859

Com estes valores definidos, é possível continuar os projetos dos controladores


buscando agora os ganhos de cada controlador. Com o intuito de aferir qual das técnicas
de controle possui um melhor desempenho quando aplicado a quadrotores de tamanhos
distintos, realiza-se simulações, na plataforma do MATLAB, para cada controlador sob
as mesmas circunstâncias. Deste modo, emprega-se uma entrada em degrau de 10o de
amplitude para cada eixo, durante o intervalo de t = 10s a t = 30s com o tempo total da
simulação igual a 50 segundos. Os testes foram executados em dois cenários, um sem ruído
e outro com um ruído gaussiano branco, N (0, σ 2 ) sendo σ 2 = 0, 1, adicionado na saída do
sistema. Na Figura 27 estão exibidos dois gráficos, sendo o sinal de entrada utilizado em
todos os testes no gráfico superior e o ruído aplicado ao processo no inferior.
A análise dos resultados obtidos, a partir das simulações das técnicas de controle
estudadas, é feita para o VAANT 1, considerando o eixo x. Para os outros VAANTs e
para o eixo z as análises são feitas de forma análoga, tais resultados estão apresentados no
Apêndice A.
Capítulo 4. Resultados e discussões 48

Figura 27 – Sinal de referência e ruído.

Referência
15

10

Ângulo (º) 5

-5
0 5 10 15 20 25 30 35 40 45 50
Tempo (s)
Ruido
2

1
Ângulo (º)

-1

-2
0 5 10 15 20 25 30 35 40 45 50
Tempo (s)

Fonte: Do autor

4.1 Controle PID via Successive Loop Closure


O controle PID consiste em mensurar os ganhos kp , ki e kd cujo o processo está
descrito na Seção 3.2.1.1.
Para definir o valor de kp utiliza-se a Equação 3.59, sendo umax correspondente ao
maior valor possível de ∆δφ e emax referente ao valor máximo do erro. O valor do PWM,
que comanda os motores, varia entre 1150µs e 1850µs, característica física dos motores
obtido através de seus datasheets, isso significa que ∆δφ consiste em umax = 700µs. O
ângulo de trabalho dos quadrotores no eixo x encontra-se entre os ângulos −50o e 50o
portanto emax = 100o , logo

700
= 7. kp = (4.1)
100
Para determinar o kd , fixa-se o valor de kp e considera-se ki = 0. Sendo a função
de transferência de malha fechada do sistema igual a

φ kp bx
d
= 2 . (4.2)
φ s + kd bx s + kp bx
Ao comparar os coeficientes do polinômio do denominador da Equação 4.2 com a
função de transferência canônica do sistema de segundo ordem, tem-se
q
ωn = k p bx . (4.3)
Capítulo 4. Resultados e discussões 49

2ζωn
kd = . (4.4)
bx
Utiliza-se o coeficiente de amortecimento ζ igual a 0, 8, uma vez que um valor
menor do que 0, 4 produz uma máximo sobressinal excessivo no sistema e acima de 0, 8
o sistema responde de forma lenta, encontrando um kd correspondente. É realizado um
cálculo computacional para descobrir o valor ki através do software MATLAB, por meio
da função rlocus, aplicando a Equação 3.67. Diante disso, o valor de ki é determinado
quando o coeficiente de amortecimento ζ seja igual ou o mais próximo possível de 0, 8.
Observa-se a Figura 28, que os ganhos de todos os VAANTs são iguais a 0 (zero),
no instante que o coeficiente de amortecimento é igual a 0, 8.

Figura 28 – Lugar geométrico das raízes via MATLAB.

Fonte: Do autor

A Tabela 5 exibe os resultados de todos os ganhos estimados após seguir esse


procedimento.

Tabela 5 – Ganhos obtidos pelo SLC referente ao eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


kp 7,0000 7,0000 7,0000 7,0000
ki 0,0000 0,0000 0,0000 0,0000
kd 4,8270 5,1525 4,6181 5,0235

Para o eixo z os cálculos são realizados de forma semelhante aos do eixo x, sendo
que o novo ângulo de trabalho é entre −180o a 180o e substitui-se bx por bz nas equações
do modelo. Realizando estes cálculos, encontra-se os ganhos kp , ki e kd dispostos na Tabela
6, calculados para os quatro VAANTs.
Capítulo 4. Resultados e discussões 50

Tabela 6 – Ganhos obtidos pelo SLC referente ao eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


kp 1,9444 1,9444 1,9444 1,9444
ki 0,0000 0,0000 0,0000 0,0000
kd 2,1549 1,7950 1,2195 3,5064

Através da ferramenta Simulink, é possível desenvolver um diagrama de blocos do


circuito de controle PID, apresentado na Figura 29, no qual serão aplicados os parâmetros
dos quadrotores para analisar o comportamento de cada um sob os dois cenários.

Figura 29 – Diagrama de blocos do sistema de controle PID.

Fonte: Do autor

A partir deste esquemático é possível observar os ganhos kp, ki e kd aplicados ao


modelo e o numerador da função de transferência é a variável B, a qual será substituída
por bx ou bz de acordo com o eixo a ser analisado. Empregam-se os ganhos exibidos nas
Tabelas 5 e 6 em suas respectivas posições, obtendo as saídas a serem estudadas.
A resposta obtida para o VAANT 1 pode ser observada pela Figura 30, no qual
os gráficos superiores mostram o comportamento do sistema sem a interferência do ruído
enquanto os inferiores encontram-se na presença do ruído. Já os da esquerda representam
o comportamento dos sistemas atuando no eixo x, analogamente ao eixo y, ao passo que
os da direita atuam sob o eixo z.
Capítulo 4. Resultados e discussões 51

Figura 30 – Controle PID via SLC do VAANT 1.

PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)
5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)
5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

A partir das respostas obtidas, ressaltam-se os parâmetros de desempenho conside-


rados na Seção 2.3.1, exibidos na Tabela 7.

Tabela 7 – Parâmetros de desempenho do controle PID via SLC referente ao eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 1,3000 13,6000 1,4000 1,4000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0000 0,0000
Tempo de atraso (s) 0,6600 0,9000 0,6300 0,6500
Tempo de subida (s) 1,8000 0,7800 1,7290 1,8000
Tempo de pico (s) 2,5320 2,4380 2,0000 2,5450
Tempo de acomodação (s) 4,0000 9,7000 3,8150 4,0000
IAE (o ) 141,9594 121,9737 131,2332 139,8966

Como este método de sintonia é realizado a partir dos limites de saturação dos
atuadores, um aspecto importante a considerar no projeto é o esforço de controle necessário,
o qual irá indicar se o sistema poderá, ou não, atingir especificações rigorosas, exigindo
muito do desempenhos com relação à resposta dinâmica do sistemas.
O esforço de controle está exibido nas Figuras 31 e 32. sendo que cada gráfico
representa o esforço de cada quadrotor.
Capítulo 4. Resultados e discussões 52

Figura 31 – Esforço de controle de cada VAANT referente ao eixo x.

Esforço de controle do eixo X


VAANT 1 VAANT 2

Tamanho do PWM ( s)

Tamanho do PWM ( s)
500 500

0 0

-500 -500

0 10 20 30 40 50 0 10 20 30 40 50
Tempo (s) Tempo (s)
VAANT 3 VAANT 4
Tamanho do PWM ( s)

Tamanho do PWM ( s)
500 500

0 0

-500 -500

0 10 20 30 40 50 0 10 20 30 40 50
Tempo (s) Tempo (s)

Fonte: Do autor

Figura 32 – Esforço de controle de cada VAANT referente ao eixo z.

Esforço de controle do eixo Z


VAANT 1 VAANT 2
Tamanho do PWM ( s)

Tamanho do PWM ( s)

500 500

0 0

-500 -500

0 10 20 30 40 50 0 10 20 30 40 50
Tempo (s) Tempo (s)
VAANT 3 VAANT 4
Tamanho do PWM ( s)

Tamanho do PWM ( s)

500 500

0 0

-500 -500

0 10 20 30 40 50 0 10 20 30 40 50
Tempo (s) Tempo (s)

Fonte: Do autor

Nesta análise, o ponto importante a ser observado é a amplitude dos picos, que
ocorre no instante da mudança de estado. Com base nos gráficos acima, de forma a facilitar
a análise, a amplitude do pico está disponível na Tabela 8.
Capítulo 4. Resultados e discussões 53

Tabela 8 – Esforço de controle no eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Esforço no eixo x (µs) 700 700 700 700
Esforço no eixo z (µs) 700 700 700 700

Como visto, no projeto do controlador, os limites dos atuadores foram pré-estabelecidos


para calcular os ganhos desta técnica de controle. Sabe-se que o ângulo da movimentação
no eixo x é até 100o , e para isto, é necessário que o atuador receba um sinal PWM de
entrada com a variação de até 700µs. Este sinal permanece inalterado para o eixo z, porém
os limites da movimentação deste eixo é de 360o . Para validar estas informações, utiliza-se
o esforço de controle para constatar se os atuadores realmente são saturados. Para isto,
avaliando o eixo x inicialmente, utiliza-se o mesmo sinal de entrada padrão deste trabalho
porém com a amplitude igual a 100o , valor referente a máxima variação permitida, e
atentando a resposta do esforço de controle desses quatro VAANTs pode-se afirmar que
o controle não irá saturar o atuador, como visto na Figura 31. O teste para o eixo z foi
realizado de forma análoga, porém o sinal de entrada teve como amplitude o valor de 360o
e, a resposta, exibida na Figura 32, também apresenta um comportamento que leve a não
saturação dos atuadores.
A respeito do máximo sobressinal percebe-se que existe uma diferença discrepante
entre o VAANT 2 e os demais quadrotores, uma vez que ele ultrapassa 13% enquanto
os demais possuem valores mais baixos. Esta característica é fundamental para saber
o comportamento dos atuadores quando aplicados comandos mais próximos aos seus
limites, constatando-se que, os atuadores do VAANT 2 podem ser danificados. Em todos
os VAANTs o erro em regime permanente foram nulos, indicando que o sistema alcança e
permanece a resposta desejada. Em relação aos tempos de atuação, os quadrotores tiveram
seu desempenho de forma rápida com exceção do VAANT 2, que demora mais para atingir
o regime permanente, tais características são fundamentais quando se busca uma rápida
execução dos atuadores. Por fim, o IAE tem valores muito altos, indicando que existe uma
diferença significativa entre o sinal de saída e da referência.

4.2 Controle PID via Twiddle


O método Twiddle é um método de otimização que visa encontrar os valores para
os ganhos kp , ki e kd através de iterações que buscam encontrar o erro médio mínimo entre
os sinais de entrada e saídas aplicados ao sistema. O procedimento encontra-se descrito na
Seção 3.2.1.2.
Utiliza-se o algorítimo para encontrar os ganhos do controlador. Esse processo é
executado para o eixo x cujo os resultados obtidos estão indicados na Tabela 9. O número
de iterações realizadas pelo método também se encontra na tabela.
Capítulo 4. Resultados e discussões 54

Tabela 9 – Ganhos obtidos através no método Twiddle para o eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


kp 1,9611 1,9573 1,0000 3,4611
ki 0,0000 0,0000 0,0000 0,0000
kd 1,7070 3,1100 1,7143 2,1487
Iterações 119 121 114 130

Vale salientar que os ganhos de controle para o eixo y é equipolente aos ganhos
do eixo x. O procedimento é novamente executado para o eixo z, e os resultados obtidos
estão apontados na Tabela 10.

Tabela 10 – Ganhos obtidos através no método Twiddle para o eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


kp 2,6742 3,8270 1,3704 2,5081
ki 0,0000 0,0000 0,0000 0,0000
kd 1,4160 3,5290 0,7082 1,4324
Iterações 118 120 134 117

Utiliza-se o mesmo diagrama de blocos, visto na Figura 29, aplicando os novos


ganhos calculados e exibidos nas Tabelas 9 e 10, encontra-se as respostas que estão dispostas
na Figura 33.

Figura 33 – Controle PID via twiddle do VAANT 1.

PID por Twiddle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Twiddle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Com base nas respostas apresentadas acima, é possível quantizar alguns parâmetros
de desempenho expostos na Tabela 11.
Capítulo 4. Resultados e discussões 55

Tabela 11 – Parâmetros de desempenho do controle PID via twiddle referente ao eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 13,6000 8,9000 1,7000 15,2000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0000 0,0000
Tempo de atraso (s) 2,1000 1,7000 1,7000 0,8000
Tempo de subida (s) 1,3000 3,8000 4,5000 1,5000
Tempo de pico (s) 3,0000 5,0000 6,0000 2,0000
Tempo de acomodação (s) 5,0000 9,0000 10,000 4,0000
IAE (o ) 101,0795 77,6899 83,6355 106,8338

Analisando o máximo sobressinal, nota-se que o VAANT 3 atinge uma baixa


amplitude, diferença significativa quando comparados com os demais. Tal comportamento
é muito bom para garantir a integridade física dos atuadores, o mesmo não se pode dizer
para os outros. O erro em regime permanente de todos quadrotores são nulos, isto implica
que, com o tempo, a saída atinge e permanece na mesma amplitude que o sinal de entrada.
De forma geral, o tempo de resposta dos quadrotres são bons, sendo o VAANT 4 com o
melhor desempenho, fator vantajoso quando se deseja uma resposta mais rápida do sistema,
considerando todos os parâmetros de desempenho relacionados ao tempo de atuação. Por
fim, o IAE é a área da diferença entre o sinal de saída e de entrada, então quanto menor
o valor, mais se assemelha a saída do sinal de entrada, neste caso, os quadrotores não
tiveram índices baixos, conforme o esperado, quando comparado com as demais técnicas,
afinal vale salientar que este método tem a finalidade de minimizar o valor de IAE para a
obtenção dos ganhos do controlador.

4.3 Controle via LQR


A técnica de controle LQR busca encontrar um vetor K, composto por [k1 k2 ],
que minimize a função de custo (J) como visto na Seção 3.2.2. Para o eixo x espera-se
controlar o modelo dado pela Equação 3.55 que representa o movimento para o ângulo φ.
A representação desse sistema em Laplace é dada por

1
Jx
φ(s) = τφ (s). (4.5)
s2
Reescrevendo essa equação na forma de espaço de estados, substituindo o torque
do sistema pelo calculado na Seção 3.1.4.4 tem-se
      
φ̇ 0 1 φ  0 
f (x, u) =   =  + ∆δφ . (4.6)
φ̈ 0 0 φ̇ bx
Capítulo 4. Resultados e discussões 56

2lk1
no qual bx = Jx
, então
   
0 1 0
A= e B =  . (4.7)
0 0 bx
O objetivo principal do controlador a ser projetado é determinar a variação de
comando do PWM necessário para regular o ângulo φ em seu estado atual para o desejado.
Projetar um controlador linear quadrático (LQR) implica em determinar a matriz
K, tal que u = −Kx conforme visto na Seção 3.2.2, sendo assim, deve-se escolher as
matrizes Q e R definidas positivas. Um modo para definir essas matrizes é utilizando a
regra de Bryson (ORAL, ÇETIN e UYAR (2010)) de forma que

1
Qii = i ∈ {1, 2, · · · , n}. (4.8)
(maximo valor de xi )2

1
Rjj = j ∈ {1, 2, · · · , m}. (4.9)
(maximo valor de ui )2
sendo Q e R diagonais.
Desse modo, as matrizes Q e R escolhidas são
 
1
 1002
0  h
1
i
Q= 1
e R= 7002
. (4.10)
0 10002

Em que xmax
1 = (50◦ − (−50◦ )) = 100◦ , xmax
2 = (500◦ /s − (−500◦ /s)) = 1000◦ /s e
umax = 700.
Com essas matrizes, é possível encontrar a matriz K composta por [k1 k2 ] através
do software MATLAB usando a função lqr que recebe como parâmetros as matrizes
A, B, Q e R. Sendo assim, a Tabela 12 exibe os valores dos ganhos calculado para todos
os VAANTs que estão sob estudos.

Tabela 12 – Ganhos obtidos através no método LQR para o eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


k1 7,0000 7,0000 7,0000 7,0000
k2 4,3236 6,8737 4,1414 4,4950

No eixo z, o processo é análogo ao realizado no eixo x, em que a única diferença


entre eles é a substituição do jx pelo jz , consequentemente utiliza-se o bz no lugar de bx
nas equações do modelo. Estão dispostos na Tabela 13 os ganhos k1 e k2 encontrados para
este eixo.
Capítulo 4. Resultados e discussões 57

Tabela 13 – Ganhos obtidos através no método LQR para o eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


k1 7,0000 7,0000 7,0000 7,0000
k2 3,6810 5,9080 2,3695 3,5064

Para esta técnica é desenvolvido o circuito em diagrama de blocos, como visto em


Figura 34, para aplicar os parâmetros dos quadrotores em estudo com seus respectivos
ganhos, a fim de analisar seus comportamentos.

Figura 34 – Diagrama de blocos do sistema de controle LQR.

Fonte: Do autor

Observando este diagrama, percebe-se que existem dois ganhos, K1 e K2 , e o


modelo em estudo, dado por uma função de transferência cujo o numerador é a variável B
que será substituída pelas variáveis bx ou bz de acordo com o eixo em estudo. Utiliza-se os
ganhos K1 e K2 , dispostos nas Tabelas 12 e 13, e as saídas encontradas estão expostas na
Figura 35.

Figura 35 – Controle LQR do VAANT 1.

Regulador Linear-Quadrático (LQR)

Referência
10 Saída
Ângulo (º)

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)
Regulador Linear-Quadrático (LQR)

Referência
10 Saída
Ângulo (º)

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Baseados nestas respostas, é possível ressaltar os seguintes parâmetros de desempe-


nho dos sistemas exibidos na Tabela 14.
Capítulo 4. Resultados e discussões 58

Tabela 14 – Parâmetros de desempenho do controle LQR referente ao eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 3,8000 3,8000 3,7000 3,8000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0000 0,0000
Tempo de atraso (s) 0,6000 1,0000 0,6040 0,6600
Tempo de subida (s) 1,5310 2,4400 1,4700 1,5920
Tempo de pico (s) 2,0730 3,3480 2,0020 2,1650
Tempo de acomodação (s) 3,5910 5,7350 3,5170 3,7910
IAE (o ) 58,6513 56,7471 58,6761 57,6039

A princípio observa-se que os quadrotores possuem um baixo valor de máximo


sobressinal, isto implica que os VAANTs suportam comandos mais próximos aos limites dos
atuadores sem danificá-los nem alterar sua performance. Todos possuem erro em regime
permanente igual a 0o , ou seja, em regime estacionário, a saída atinge a mesma amplitude
da referência. A respeito dos tempos de atraso, subida, pico e acomodação, os VAANTs
possuem valores baixos, ou seja, eles alcançam a resposta desejada de forma mais rápida,
com exceção do VAANT 2, que demora mais para atingir o regime permanente. O IAE é
baixo para os quadrotores, mostrando que a saída deste quadrotor mais se assemelha ao
sinal de referência.

4.4 Controle via LQG


Este controle foi executado a partir da combinação do controle via LQR com o
filtro de Kalman. Como visto na Seção 3.2.3, tendo em mãos os ganhos do controle via
LQR, para realizar o controle via LQG, basta calcular as matrizes de covariância e os
ganhos utilizados no filtro de Kalman.
Para o eixo x, o modelo a ser controlado tem como sua representação a Equação
4.11

1
Jx
φ(s) = τφ (s). (4.11)
s2
cujo sua representação matemática em espaço de estados é
   
0 1 0
A= , B =  , (4.12)
0 0 bx
h i
C= 1 0 e D = 0.

Para realizar o controle via LQG utiliza-se uma ferramenta do software MATLAB,
o Simulink, nesta ferramenta se aplica o bloco denominado Kalman Filter que realiza os
cálculos descritos na Seção 3.2.3 facilitando o projeto deste controlador. Este bloco exige
Capítulo 4. Resultados e discussões 59

como parâmetros as matrizes A, B, C e D do modelo a ser controlado, dados na equação


4.12, e as matrizes de covariância Qk e Rk .
Uma grande questão discutida nos projetos de controle via LQR são as matrizes Qk
e Rk , pois ela são as matrizes de covariância do ruído implantado no sistema, porém estes
valores são desconhecidos na prática. Uma técnica utilizada para reverter esta situação é,
fixar o valor de uma dessas matrizes e variar a outra até se obter uma resposta otimizada.
É importante ressaltar que a escolha de uma matriz Qk com o valor elevado e uma
matriz Rk com o valor reduzido significa que o projetista confia mais na resposta medida
do que no modelo do sistema, em contrapartida, a escolha de um valor reduzido para Qk e
um valor elevado para Rk o projetista tem maior confiança no modelo do sistema, do que
na resposta medida.
Neste projeto, utiliza-se o projeto via controle LQR com seus respectivos ganhos,
apresentados na Tabela 12, em conjunto com o filtro de Kalman. Com o intuito de aproximar
o projeto a realidade, fixa-se o valor de Qk em identidade e varia-se o valor de Rk de forma
a reduzir o mesmo até que a resposta obtenha um valor mais próximo ao valor desejado.
Nos experimentos realizados, utiliza-se um ruído gaussiano branco N (0, σ 2 ) sendo
σ 2 = 0, 1. No filtro, fixa-se Qk = 1 e a melhor saída obtida ocorreu quando Rk = 10−5 ,
estes parâmetros foram impostos para todos os quadrotores em estudo. Para o eixo z, o
projeto do controlador é feito de forma análoga.
Uma vez que, o sistema de controle LQG é um aprimoramento do sistema LQR,
em que o propósito é atenuar a interferência do ruído no sistema, o diagrama de blocos do
controle LQG e o LQR são semelhantes, sendo que a diferença é o acréscimo do filtro de
kalman. É possível perceber essa paridade observando a Figura 36.

Figura 36 – Diagrama de blocos do sistema de controle LQG.

Fonte: Do autor

Os ganhos k1 e k2 são os mesmos utilizados no controle LQR, o diferencial são os


parâmetros do bloco Fiter Kalman, que exige as matrizes do espaço de estados do modelo
e as matrizes Qk e Rk . Aplicadas estas matrizes no diagrama de blocos, obtém-se como
respostas os gráficos exibidos na Figura 37.
Capítulo 4. Resultados e discussões 60

Figura 37 – Controle LQG do VAANT 1.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

A partir destas respostas, destaca-se os seguintes parâmetros de desempenhos que


são exibidos na Tabela 15.

Tabela 15 – Parâmetros de desempenho do controle LQG referente ao eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 4,3000 4,5000 4,3000 4,3000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0030 0,0030
Tempo de atraso (s) 0,6200 1,0000 0,6100 0,6600
Tempo de subida (s) 1,4450 2,3090 1,3920 1,5000
Tempo de pico (s) 1,8960 3,0420 1,8610 1,9660
Tempo de acomodação (s) 3,6000 5,5220 4,9900 4,9370
IAE (o ) 21,5398 39,4168 25,5141 23,4844

Pode-se observar que o índice de máximo sobressinal dos quatro VAANTs tiveram
seus valores semelhantes e relativamente pequenos, inferindo que em nenhum dos casos a
aplicação de ações próximas ao limite de saturação poderá danificar o atuador. O Erro
em regime permanente foi desprezível para este estudo, sendo assim a saída é equivalente
ao sinal de entrada, em regime permanente. Com relação a velocidade de resposta do
sistema, o comportamento é rápido quando se analisa os índices de desempenho do tempo
de atraso, subida, pico e acomodação, tornando esta técnica eficiente quanto se objetiva
velocidade de resposta. Para o IAE os valores encontrados são baixos, isso significa que o
comportamento da saída mais se assemelha ao sinal de entrada.
É necessário ressaltar que, em todos os casos, o ruído foi atenuado com sua nova
variância em torno de 0, 001, lembrando que a variância do ruído é de 0, 1. Ou seja, nesta
técnica o sinal de saída mal sofre a interferência do ruído, graças ao filtro implementado
ao controlador.
Capítulo 4. Resultados e discussões 61

4.5 Controle via Lyapunov


Esta técnica de controle visa encontrar dois ganhos (K1 e K2 ) considerando as
características apresentadas na Seção 3.2.4. No eixo x modelo do sistema que se deseja
controlar está representado na Equação 4.6. Sendo as variáveis de estado do sistema

x1 = φ,
x2 = φ̇.
e a entrada de controle

u = ∆δφ .

logo
 
x2
f (x, u) =   . (4.13)
bx u
O objetivo do controlador utilizando a teoria de estabilidade de Lyapunov é deslocar
o estado inicial x0 para o estado de equilíbrio xe . Para isto, é preciso escolher uma função
de Lyapunov que seja definida positiva dado o estado desejado xd = (xd1 , 0). Nesse caso,
pretende-se alcançar a posição xd1 com velocidade nula, para garantir o equilíbrio nesta
posição. Desta forma, a função de Lyapunov escolhida é

V (x) = xT P x. (4.14)

em que P é uma matriz definida positiva, Considerando


   
xd − x 1  p11 0 
x= 1 e P = .
0 − x2 0 p22
onde p11 , p22 > 0, a Função 4.14 fica

V (x) = p11 (xd1 − x1 )2 + p22 (0 − x2 )2 . (4.15)

e sua derivada no tempo é

V̇ (x) = −2p11 (xd1 − x1 )ẋ1 + 2p22 x2 ẋ2 ,


(4.16)
V̇ (x) = −2p11 (xd1 − x1 )x2 + 2p22 x2 bx u.

Veja que

ẋ1 = x2 ,
ẋ2 = bx u.
Capítulo 4. Resultados e discussões 62

É necessário que V̇ (x) seja definida negativa para garantir a estabilidade assintótica
do sistema, para isso, a entrada de controle é escolhida como

p11 (xd1 − x1 ) − x2
u= . (4.17)
p22 bx
Então a Equação 4.16 torna-se

V̇ (x) = −2x22 . (4.18)

De acordo com o projeto, é preciso encontrar os ganhos k1 e k2 sendo

p11
k1 = p22 bx
,

1
k2 = p22 bx
.
Substituindo a entrada de controle (u) encontrada, a função de transferência do
sistema resulta-se em

φ k1 bx
d
= 2 . (4.19)
φ s + k 2 bx s + 1
Nota-se que a função de transferência de malha fechada do sistema, vista na
Equação 4.19 é semelhante a uma função de transferência canônica de segundo ordem.
Comparando as duas funções de transferência tem-se

wn2 = k1 bx ,

2ζwn = k2 bx .
Conforme visto em (OGATA (2011)), para satisfazer a velocidade e o amortecimento
na resposta transitória, ζ deve se encontrar entre 0, 4 a 0, 8. Para este caso, adota-se ζ = 0, 8
e um tempo de acomodação (ts ) de 2 segundos (usando o critério de 2%). A frequência
natural do sistema é dada por

4 4
wn = = = 2, 5Hz. (4.20)
ζts 0, 82
Aplicando o wn nas equações acima, constata-se os ganhos k1 e k2 para todos os
quadrotores em estudo. Sendo assim, a Tabela 16 exibe os valores obtidos dos ganhos para
cada VAANT.

Tabela 16 – Ganhos obtidos através no método Lyapunov para o eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


k1 8,1264 9,2592 7,4381 8,8014
k2 5,2009 5,9259 4,7604 5,6329
Capítulo 4. Resultados e discussões 63

A análise no eixo z é semelhante ao eixo x. Realizando o mesmo procedimento os


ganhos k1 e k2 , referentes a cada VAANT, estão exibidos na Tabela 17.

Tabela 17 – Ganhos obtidos através no método Lyapunov para o eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


k1 5,8301 4,0454 2,2878 5,2701
k2 3,7313 2,5890 1,4642 3,3728

Para realizar o controle por meio da técnica de controle através da estabilidade de


Lyapunov, utiliza-se o diagrama de blocos mostrado na Figura 38.

Figura 38 – Diagrama de blocos do sistema de controle por Lyapunov.

Fonte: Do autor

Efetua-se a simulação, para cada eixo, empregando o vetor de ganhos k1 e k2


indicados nas Tabelas 16 e 17. A saída obtida para o VAANT 1 é exibida na Figura 39.

Figura 39 – Controle Lyapunov do VAANT 1.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Dado as respostas acima, é possível destacar os parâmetros de desempenho exibidos


na Tabela 18.
Capítulo 4. Resultados e discussões 64

Tabela 18 – Parâmetros de desempenho do controle Lyapunov referente ao eixo x.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 1,4000 13,2000 1,2000 1,4000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0000 0,0000
Tempo de atraso (s) 0,6000 0,7500 0,6200 0,6500
Tempo de subida (s) 1,7330 1,5700 1,7520 1,7400
Tempo de pico (s) 2,2620 2,3910 2,3810 2,2650
Tempo de acomodação (s) 3,5970 8,1100 3,6120 3,6200
IAE (o ) 58,4643 54,0996 53,4642 58,4643

Examinando o máximo sobressinal, nota-se que os valores são baixos com exceção
do VAANT 2, que possui uma grande discrepância com relação aos demais. Este valor
muito alto impossibilita o uso dos atuadores próximos aos seus limites de trabalho, por
questões de segurança do experimento. O erro em regime permanente é nulo, a vista disto,
a resposta atinge a mesma amplitude do sinal de referência ao decorrer do tempo. A
velocidade de resposta do sistema é rápida, quando se analisa os tempos de atraso, subida,
pico e acomodação, exceto o tempo de acomodação do VAANT 2, que é consideravelmente
maior que os demais, implicando em um atraso para entrar em regime permanente. O
valor de IAE são baixos, isto significa que o comportamento da saída se assemelha ao
valor de referência.

4.6 Análise comparativa entre as técnicas de controle


Nesta seção será comparada a influência de cada técnica de controle nos quadrotores
para avaliar seus respectivos desempenhos. De forma a contribuir com a avaliação das
técnicas, utiliza-se gráficos em que o eixo horizontal são os parâmetros de desempenho
com suas respectivas unidades de medidas, o eixo vertical é a amplitude e o eixo de
profundidade é composto pelas técnicas de controle que foram estudadas neste trabalho.
Para identificar qual é a melhor técnica de controle a ser utilizada é necessário
avaliar os parâmetros de desempenho obtidos nos eixos x e z simultaneamente. A Figura
40 mostra, a esquerda, o gráfico referente ao desempenho do VAANT 1 sob o eixo x e a
direita, o gráfico é relativo ao eixo z. Os valores estão normalizados utilizando média nula
e desvio padrão unitário. De forma análoga foram feitas estas comparações para os demais
quadrotores cujo os gráficos estão dispostos no Apêndice A.
Capítulo 4. Resultados e discussões 65

Figura 40 – Índices de desempenho do VAANT 1.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Para a escolha da técnica a ser aplicada no quadrotor, é preciso definir a prioridade


do projeto, caso seu propósito seja a minimização do erro em regime permanente, obtendo
assim uma maior precisão da resposta do seu sistema em regime permanente, qualquer
técnica atenderia pois possuem seu valor igual a 0o , caso seja a performance no quadrotor,
escolhe-se a técnica com o menor máximo sobressinal, para assegurar que o quadrotor não
ultrapasse o limite operacional admitido, é apropriado o uso da técnica PID via Successive
Loop Closure ou Lyapunov, agora caso a velocidade da resposta seja fundamental, é
conveniente o uso da técnica LQR ou LQG, pois estas levam menos tempo no estado
transitório do sistema tornando o sistema mais rápido.
Analogamente, a análise é feita para os outros veículos aéreos. Em relação a precisão
da resposta em regime permantente, todas as técnicas mantém o erro nulo em todos os
quadrotores. Em relação a velocidade de resposta, para os VAANT 2 e 3, as técnicas
LQR e LQG atingiram melhores resultados enquanto para o VAANT 4 a técnica de
controle baseada na estabilidade de Lyapunov obteve melhor desempenho. Em relação a
performance do sistema, o VAANT 2 obteve um melhor resultado com a técnica LQR e os
VAANTs 3 e 4 obtiveram melhores resultados para o máximo sobressinal nas técnicas PID
via SLC ou Lyapunov.
Conforme visto anteriormente, um índice de desempenho quantitativo é o IAE
(Integral do Erro Absoluto), que quantifica o tamanho da área entre o sinal de saída e a
referência, permitindo visualizar o quão semelhante estão estes sinais. A Figura 41 exibe a
amplitude do IAE de todas as técnicas de controle dos quadrotores em questão. A partir
deste gráfico, pode-se obter algumas conclusões, dentre elas, é que a técnica cujo a resposta
mais se aproxima da referência é a LQG, logo, a técnica de controle PID via Twiddle não se
comporta conforme projetado, uma vez que sua principal característica seria encontrar os
ganhos que obtivessem a saída de forma mais semelhante possível com o sinal de entrada.
Capítulo 4. Resultados e discussões 66

Figura 41 – IAE dos VAANTs.

Fonte: Do autor
67

5 Conclusões

A comparação entre cinco diferentes técnicas de controle, aplicadas em quatro


quadrotores de tamanhos distintos é realizada ao longo do trabalho a fim de atestar o
desempenho dos mesmos. No conjunto de técnicas de controle clássico, emprega-se o
controle PID com duas abordagens de sintonia, o método Sucessive Loop Closure, em
que seus ganhos são calculados a partir da saturação dos atuadores e, o método Twiddle
que visa a minimização do erro médio obtido pela resposta do sistema. No conjunto de
técnicas de controle ótimo, utiliza-se a técnica LQR, que visa reduzir a função de custo
para otimizar o sistema garantindo a sua estabilidade e a técnica LQG, que visa atenuar a
interferência de ruídos no sistema. Por fim, uma técnica de controle não linear utilizada
foi a de Lyapunov, com o objetivo de garantir a estabilidade de sistemas lineares e não
lineares.
Para se aplicar as técnicas de controle em estudo realizar a modelagem matemá-
tica do quadrotor é fundamental. Neste processo, depara-se com o impasse da alta não
linearidade deste modelo e, comportamentos e características difíceis de se prever, visto
que é um sistema altamente propício a sofrer interferências externas e ruídos. A fim de
contornar este problema, o modelo matemático é simplificado possibilitando o uso das
técnicas estudadas e, simulações com adições de ruído ao sistema foram realizadas para
tentar emular o processo real.
Realizando as simulações em dois cenários, com e sem ruído, são observados se as
técnicas de controle atingem os objetivos que cada técnica propõe. A técnica de controle
PID via Sucessive Loop Closure atua de acordo como projetado, os quadrotores tem
suas performances limitadas à saturação dos atuadores, em contrapartida a sintonia pelo
método Twiddle não produz o menor erro médio absoluto quando comparada com as
demais técnicas, não atingindo a sua minimização conforme previsto pelo método. O
controle LQR garantiu a estabilidade do sistema através da redução da função de custo, já
o controle LQG atenua de forma significativa a interferência do ruído no sistema. A técnica
de controle por Lyapunov apresentou um desempenho satisfatório em todos os VAANTs,
levando-os à estabilidade conforme seu propósito, utilizando o modelo simplificado do
quadrotor.
Na busca de encontrar a melhor técnica a ser utilizada, o estudo segue em três
vertentes: a precisão, a performance dos atuadores, de maneira geral e, a velocidade
da resposta. Em relação as técnicas de controle aplicadas, todas elas obtiveram bons
resultados, uma vez que os sistemas convergiram a estabilidade em todos os casos. Em
relação a velocidade da resposta, a melhor técnica utilizada foi a LQR, visto que o sistema
respondeu mais rapidamente quando aplicada esta técnica. Em relação a precisão da
saída, todas as técnicas obtiveram bons resultados, obtendo em regime permanente valores
Capítulo 5. Conclusões 68

nulos ou mínimos para o erro. Em relação a performance dos atuadores, a técnica que
obteve melhores resultados garantindo uma segurança em relação aos valores operacionais
máximos e mínimos admitidos, foram as técnicas PID pela sintonia Successive Loop Closure
e a Lyapunov, ambas tiveram seus valores muito semelhantes. A escolha da técnica a ser
aplicada depende do desempenho desejado para o sistema, de modo geral, analisando os
parâmetros de desempenho presentes no texto, e a aplicação do quadrotor à ambientes
ruidosos, a melhor técnica analisada nos quatro VAANTs foi a técnica de controle LQG
que, além de possuir o menor erro médio da resposta, índices de desempenho satisfatórios,
é ainda responsável pela atenuação da interferência dos ruídos de forma significativa.

5.1 Trabalhos futuros


Como indicação de continuidade a este trabalho, é sugerida a realização de testes
práticos das técnicas de controle estudadas, principalmente em ambientes instáveis, a fim
de comparar os resultados simulados com os resultados práticos. Outra linha de pesquisa
para dar prosseguimento a este estudo é o uso de aperfeiçoamento para estas técnicas ou
mesmo explorar novas técnicas a procura de melhores desempenhos. Por fim, sugere-se um
estudo da influência das dimensões dos quadrotores sob cada técnica de controle estudada
visto que, em alguns casos abordados, houve uma discrepância significativa entre os índices
de desempenho.
69

APÊNDICE A – Resultados Simulados

As simulações referentes aos outros VAANTs, para cada técnica de controle utilizada,
bem como os critérios de desempenho atingidos em cada veículo aéreo para o eixo yaw
estão representados a seguir.

A.1 PID - Successive Loop Closure


Para o eixo z, os parâmetros de desempenho atingidos pela técnica estão dispostos
na Tabela 19.

Tabela 19 – Parâmetros de desempenho do controle PID via SLC referente ao eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 1,5000 24,2000 3,8000 1,4000
Erro em Regime Permanente (o ) 0,0000 0,0150 0,0000 0,0000
Tempo de atraso (s) 1,1000 1,4500 0,6500 2,0000
Tempo de subida (s) 2,9000 2,5500 1,5500 2,8000
Tempo de pico (s) 3,7840 4,0000 2,0000 3,7670
Tempo de acomodação (s) 6,7000 10,5000 6,0000 6,0000
IAE (o ) 95,6206 88,3420 131,8886 115,9338

As respostas obtidas na planta com o controlador PID sintonizado pelo método


Successive Loop Closure para os outros três veículos aéreos estão representadas nas Figuras
42, 43 e 44.

Figura 42 – Controle PID via SLC do VAANT 2.

PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor
APÊNDICE A. Resultados Simulados 70

Figura 43 – Controle PID via SLC do VAANT 3.

PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)
5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)
5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Figura 44 – Controle PID via SLC do VAANT 4.

PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Successive Loop Closure PID por Successive Loop Closure

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

A.2 PID - Twiddle


Para o eixo z, os parâmetros de desempenho atingidos pela técnica estão dispostos
na Tabela 20.
APÊNDICE A. Resultados Simulados 71

Tabela 20 – Parâmetros de desempenho do controle PID via twiddle referente ao eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 20,4000 10,9000 16,2000 16,6000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0000 0,0000
Tempo de atraso (s) 0,7000 1,1000 0,6700 0,7500
Tempo de subida (s) 1,6000 2,4000 1,3000 1,4000
Tempo de pico (s) 2,0000 3,0000 1,9050 2,0000
Tempo de acomodação (s) 5,6000 5,5000 7,0000 5,5000
IAE (o ) 131,5046 100,3100 169,0853 128,6109

As respostas obtidas na planta com o controlador PID sintonizado pelo método


Twiddle para os outros três veículos aéreos estão representadas nas Figuras 45, 46 e 47.

Figura 45 – Controle PID via twiddle do VAANT 2.

PID por Twiddle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Twiddle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Figura 46 – Controle PID via twiddle do VAANT 3.

PID por Twiddle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Twiddle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)

5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor
APÊNDICE A. Resultados Simulados 72

Figura 47 – Controle PID via twiddle do VAANT 4.

PID por Twiddle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)
5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)
PID por Twidlle PID por Twiddle

Referência Referência
10 Saída 10 Saída
Ângulo (º)

Ângulo (º)
5 5

0 0

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
Tempo (s) Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

A.3 LQR
Para o eixo z, os parâmetros de desempenho atingidos pela técnica estão dispostos
na Tabela 21

Tabela 21 – Parâmetros de desempenho do controle LQR referente ao eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 3,6000 3,8000 3,1000 3,5000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0000 0,0000
Tempo de atraso (s) 0,5300 0,8200 0,3500 0,5200
Tempo de subida (s) 1,3100 2,1000 0,8360 1,2470
Tempo de pico (s) 1,7940 2,8970 1,0140 1,7090
Tempo de acomodação (s) 4,8090 4,8270 1,9320 2,2990
IAE (o ) 57,6523 57,4065 59,1762 65,6185

As respostas obtidas na planta com o controlador LQR para os outros três veículos
aéreos estão representadas nas Figuras 48, 49 e 50.
APÊNDICE A. Resultados Simulados 73

Figura 48 – Controle LQR do VAANT 2.

Regulador Linear-Quadrático (LQR)

Referência
10 Saída

Ângulo (º)
5

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)
Regulador Linear-Quadrático (LQR)

Referência
10 Saída

Ângulo (º)
5

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Figura 49 – Controle LQR do VAANT 3.

Regulador Linear-Quadrático (LQR)

Referência
10 Saída
Ângulo (º)

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)
Regulador Linear-Quadrático (LQR)

Referência
10 Saída
Ângulo (º)

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor
APÊNDICE A. Resultados Simulados 74

Figura 50 – Controle LQR do VAANT 4.

Regulador Linear-Quadrático (LQR)

Referência
10 Saída

Ângulo (º)
5

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)
Regulador Linear-Quadrático (LQR)

Referência
10 Saída

Ângulo (º)
5

0 5 10 15 20 25 30 35 40 45 50
Tempo (s)

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

A.4 LQG
Para o eixo z, os parâmetros de desempenho atingidos pela técnica estão dispostos
na Tabela 22.

Tabela 22 – Parâmetros de desempenho do controle LQG referente ao eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 4,1000 4,4000 3,4000 4,1000
Erro em Regime Permanente (o ) 0,0030 0,0030 0,0030 0,0030
Tempo de atraso (s) 1,2360 0,8700 0,3500 0,5060
Tempo de subida (s) 0,5500 2,0000 0,8000 1,1840
Tempo de pico (s) 1,6530 2,2390 1,0270 1,5480
Tempo de acomodação (s) 4,0510 6,3970 1,8610 2,7480
IAE (o ) 16,7089 33,4700 18,2044 17,7468

As respostas obtidas na planta com o controlador LQG para os outros três veículos
aéreos estão representadas nas Figuras 51, 52 e 53.
APÊNDICE A. Resultados Simulados 75

Figura 51 – Controle LQG do VAANT 2.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Figura 52 – Controle LQG do VAANT 3.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor
APÊNDICE A. Resultados Simulados 76

Figura 53 – Controle LQG do VAANT 4.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

A.5 Lyapunov
Para o eixo z, os parâmetros de desempenho atingidos pela técnica estão dispostos
na Tabela 23.

Tabela 23 – Parâmetros de desempenho do controle Lyapunov referente ao eixo z.

Parâmetros VAANT 1 VAANT 2 VAANT 3 VAANT 4


Máximo sobressinal (%) 1,4000 22,4000 1,4000 1,4000
Erro em Regime Permanente (o ) 0,0000 0,0000 0,0000 0,0000
Tempo de atraso (s) 0,6000 0,9500 0,5800 0,6200
Tempo de subida (s) 0,5500 2,0000 0,8000 1,1840
Tempo de pico (s) 1,8200 1,7100 1,7200 1,8000
Tempo de acomodação (s) 3,6120 9,8900 3,5650 3,8500
IAE (o ) 58,4643 55,8677 58,4641 58,4645

As respostas obtidas na planta com o controlador utilizando a técnica baseada


na estabilidade de Lyapunov para os outros três veículos aéreos estão representadas nas
Figuras 54, 55 e 56.
APÊNDICE A. Resultados Simulados 77

Figura 54 – Controle Lyapunov do VAANT 2.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Figura 55 – Controle Lyapunov do VAANT 3.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor
APÊNDICE A. Resultados Simulados 78

Figura 56 – Controle Lyapunov do VAANT 4.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

A.6 Comparação entre as técnicas


A comparação dos critérios de desempenho nos últimos três veículos aéreos estão
indicadas nas Figuras 57, 58 e 59.

Figura 57 – Índices de desempenho do VAANT 2.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor
APÊNDICE A. Resultados Simulados 79

Figura 58 – Índices de desempenho do VAANT 3.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor

Figura 59 – Índices de desempenho do VAANT 4.

(a) Eixo X/Y (b) Eixo Z

Fonte: Do autor
80

Referências

ADIGBLI, P.; MOURET, J.-B.; DONCIEUX, S. Nonlinear attitude and position control
of a micro quadrotor using sliding mode and backstepping techniques. Citeseer, 2007. 17,
18, 19

AGUIRRE, L. A. Introdução a Identificação de Sistemas. 2. ed. [S.l.]: Belo


Horizonte: UFMG, 2004. 9, 12

AL-YOUNES, Y.; JARRAH, M. A. Attitude stabilization of quadrotor uav using


backstepping fuzzy logic & backstepping least-mean-square controllers. In: IEEE. 2008 5th
International Symposium on Mechatronics and Its Applications. [S.l.], 2008. p. 1–11. 18

ALVES, A. S. C. Estudo e aplicação de técnicas de controle embarcadas para estabilização


de voo de quadricópteros. Tese (Mestrado) - Universidade Federal de Juiz de Fora, p.
33–51, 2012. 25, 27, 29, 30, 46

AUSTIN, R. Unmanned aircraft systems: UAVS design, development and


deployment. 3. ed. [S.l.]: John Wiley & Sons, 2010. 2, 3

AZAM, S. N. Linear discrete-time state space realization of a modified quadruple tank


system with state estimation using kalman filter. In: IOP PUBLISHING. Journal of
Physics: Conference Series. [S.l.], 2017. p. 012–013. 38

BEARD, R. W. Quadrotor dynamics and control. Brigham Young University, v. 19, n. 3,


p. 46–56, 2008. 20, 22, 23, 24, 31, 32, 34

BOAUBDALLAH, S.; SIEGWART, R. Backstepping and sliding-mode techniques applied


to an indoor micro quadrotor. In: IEEE. Proceedings of the 2005 IEEE international
conference on robotics and automation. [S.l.], 2005. p. 2247–2252. 18, 19

COSTA, E. B. Algoritmos de controle aplicados a estabilização do voo de um quadrotor.


Tese (Doutorado) — Universidade Federal de Juiz de Fora, 2012. 40, 41, 42

COZA, C.; MACNAB, C. J. A new robust adaptive-fuzzy control method applied to


quadrotor helicopter stabilization. In: IEEE. NAFIPS 2006-2006 Annual Meeting of the
North American Fuzzy Information Processing Society. [S.l.], 2006. p. 454–458. 17, 18

DIKMEN, İ. C.; ARISOY, A.; TEMELTAS, H. Attitude control of a quadrotor. In: IEEE.
2009 4th International Conference on Recent Advances in Space Technologies. [S.l.], 2009.
p. 722–727. 18

DOMINGUES, J. M. B. Quadrotor prototype. Instituto Superior Técnico, Universidade


Técnica de Lisboa, p. 60–73, 2009. 18, 19, 36, 38

DORF, R. C.; BISHOP, R. H. Sistemas de Controle Moderno. 8. ed. [S.l.]:


LTC-Livros Técnicos e Científicos Editora S.A., 2001. 13, 14, 15

DU, Y. et al. Evolutionary planning of multi-uav search for missing tourists. IEEE Access,
IEEE, v. 7, p. 73480–73492, 2019. 4, 5
Referências 81

FILHO, W. d. B. V.; PINTO, A. M. d. A. Vtol aerial robot for inspection of transmission


line. In: Proceedings of the 2014 3rd International Conference on Applied Robotics for the
Power Industry. [S.l.: s.n.], 2014. p. 1–4. 3

GHAZALI, S. N. A. M. et al. Determining position of target subjects in maritime search


and rescue (msar) operations using rotary wing unmanned aerial vehicles (uavs). In: 2016
International Conference on Information and Communication Technology (ICICTM). [S.l.:
s.n.], 2016. p. 1–4. 4

GIESBRECHT, M. Propostas imuno-inspiradas para identificação de sistemas


e realização de séries temporais multivariáveis no espaço de estado. 2012.
219 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de
Engenharia Eletrica e de Computação, Campinas, SP, 2012. Disponível em:
<http://www.repositorio.unicamp.br/handle/REPOSIP/260671>. Acesso em: 22 de
agosto de 2018. 38

GOLDSTEIN, R. e. a. Beohawk: Autonomous quadrotor. In: Symposium on Indoor Flight


Issue. [S.l.: s.n.], 2012. p. 1–11. 35

GONÇALVES, P. H.; CERQUEIRA, A.; COSTA, E. B. Análise da Meto-


dologia SOESGOPE aplicada a um Quadrotor para Estimação Ótima de
Parametros. In: em Anais do 14o Simpósio Brasileiro de Automação Inte-
ligente, 2020. Disponível em: <https://proceedings.science/sbai-2019/papers/
analise-da-metodologia-soesgope-aplicada-a-um-quadrotor-para-estimacao-otima-de-parametros>.
Acesso em: 04 maio 2020. 46

HE, T.; ZENG, Y.; HU, Z. Research of multi-rotor uavs detailed autonomous inspection
technology of transmission lines based on route planning. IEEE Access, IEEE, v. 7, p.
114955–114965, 2019. 3, 4

HOFFMAN, G. et al. Quadrotor helicopter flight dynamics and control: Theory and
experiment. In: AIAA guidance, navigation and control conference and exhibit. [S.l.: s.n.],
2007. p. 6461. 18, 19

ISOCOLD, P.; PEREIRA, G. A.; TORRES, L. A. Development of a hand-launched small


uav for ground reconnaissance. IEEE Transactions on Aerospace and Electronic Systems,
IEEE, v. 46, n. 1, p. 335–348, 2010. 6

KARPLUS, W. J. The spectrum of mathematical modeling and systems simulation.


Mathematics and Computers in Simulation, Elsevier, v. 19, n. 1, p. 3–10, 1977. 9, 10

LI, L. The uav intelligent inspection of transmission lines. In: Proceedings of the
2015 International Conference on Advances in Mechanical Engineering and Industrial
Informatics. [S.l.: s.n.], 2015. p. 1542–1545. 3

MERINO, L. et al. An unmanned aircraft system for automatic forest fire monitoring and
measurement. Journal of Intelligent & Robotic Systems, v. 65, n. 1, p. 533–548, Jan 2012.
Disponível em: <https://doi.org/10.1007/s10846-011-9560-x>. 6

MINH, L. D.; HA, C. Modeling and control of quadrotor mav using vision-based
measurement. In: IEEE. International Forum on Strategic Technology 2010. [S.l.], 2010. p.
70–75. 18, 19
Referências 82

NETO, A. A. Geração de trajetórias para veículos aéreos autônomos não-tripulados. Tese


(Mestrado) - Universidade Federal de Minas Gerais., p. 23–63, 2008. 2

NICOL, C.; MACNAB, C.; RAMIREZ-SERRANO, A. Robust neural network control of a


quadrotor helicopter. In: IEEE. 2008 Canadian Conference on Electrical and Computer
Engineering. [S.l.], 2008. p. 001233–001238. 18

NISE, N. S. Engenharia de Sistemas de Controle. 6. ed. [S.l.]: LTC-Livros Técnicos


e Científicos Editora S.A., 2012. 11, 12, 13

NORVIG P.; THRUN, S. Udacity - intro to artificial intelligence. Fevereiro 2019.


Disponível em: <https://www.udacity.com/course/intro-to-artificial-intelligence--cs271>.
36

OGATA, K. Engenharia de Controle Moderno. 5. ed. [S.l.]: São Paulo: Pearson


Education do Brasil, 2011. 11, 14, 15, 16, 33, 62

OPPENHEIM, A. V.; SCHAFER, R. W. Processamento em tempo discreto de


sinais. 3. ed. [S.l.]: Pearson Education, 2013. 10

ORAL, Ö.; ÇETIN, L.; UYAR, E. A novel method on selection of q and r matrices in the
theory of optimal control. International Journal of Systems Control, v. 1, n. 2, 2010. 56

PAW, Y. C.; BALAS, G. J. Development and application of an integrated framework for


small uav flight control development. Mechatronics, Elsevier, v. 21, p. 789–802, 2011. 17

RABHI, A.; CHADLI, M.; PÉGARD, C. Robust fuzzy control for stabilization of a
quadrotor. In: IEEE. 2011 15th International Conference on Advanced Robotics (ICAR).
[S.l.], 2011. p. 471–475. 18

RAWASHDEH, O. A. et al. Microraptor: A low-cost autonomous quadrotor system. In:


CITESEER. ASME 2009 International Design Engineering Technical Conferences and
Computers and Information in Engineering Conference. [S.l.], 2009. p. 567–574. 18

RAZI, P. et al. 3d land mapping and land deformation monitoring using persistent
scatterer interferometry (psi) alos palsar: Validated by geodetic gps and uav. IEEE Access,
v. 6, p. 12395–12404, 2018. 6

ROKHMANA, C. A.; ANDARU, R. Utilizing uav-based mapping in post disaster volcano


eruption. In: 2016 6th International Annual Engineering Seminar (InAES). [S.l.: s.n.],
2016. p. 202–205. 5

SHI, W. et al. The start-up dynamic analysis and one cycle control-pd control combined
strategy for primary-side controlled wireless power transfer system. IEEE Access, v. 6, p.
14439–14450, 2018. 18

SILVA, M. F. et al. Design of angular pid controllers for quadcopters built with low
cost equipment. In: 2016 20th International Conference on System Theory, Control and
Computing (ICSTCC). [S.l.: s.n.], 2016. p. 216–221. 16

SOUSA, J. D. A. d. Simulação e desenvolvimento de um veículo aéreo autónomo de


quatro rotores. Faculdade de Engenharia da Universidade do Porto, p. 83–88, 2011. 18, 19
Referências 83

UBIRATAN, E. A origem dos vant. v. 248, Janeiro 2015. Disponível em:


<https://aeromagazine.uol.com.br/artigo/origem-dos-vant_1907.html>. Acesso em: 25 de
outubro de 2019. 1

WASLANDER, S. L. et al. Multi-agent quadrotor testbed control design: Integral sliding


mode vs. reinforcement learning. In: IEEE. 2005 IEEE/RSJ International Conference on
Intelligent Robots and Systems. [S.l.], 2005. p. 3712–3717. 18
MINISTÉRIO DA EDUCAÇÃO
Universidade Federal de Ouro Preto – UFOP
Instituto de Ciências Exatas e Aplicadas
Colegiado do Curso de Engenharia de Elétrica

TERMO DE RESPONSABILIDADE

O texto do trabalho de conclusão de curso intitulado “Análise do desempenho


de técnicas de controle aplicadas a quadrotores” é de minha inteira
responsabilidade. Declaro que não há utilização indevida de texto, material fotográfico
ou qualquer outro material pertencente a terceiros sem a devida citação ou
consentimento dos referidos autores.

João Monlevade, 02 de outubro de 2020.

______________________________________
Luiz Marques Junior

Você também pode gostar