Escolar Documentos
Profissional Documentos
Cultura Documentos
MEDIANTE A UTILIZAO DO
FILTRO DE KALMAN VARIANTE NO TEMPO
FACULDADE DE TECNOLOGIA
UNIVERSIDADE DE BRASLIA
UNIVERSIDADE DE BRASLIA
FACULDADE DE TECNOLOGIA
DEPARTAMENTO DE ENGENHARIA MECNICA
CONTROLE DE SISTEMAS ADAPTATIVOS
MEDIANTE A UTILIZAO DO
FILTRO DE KALMAN VARIANTE NO TEMPO
APROVADA POR:
BRASLIA, 12 DE 11 DE 2014.
FICHA CATALOGRFICA
PARRA MUOZ,MIGUEL ENRIQUE
CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAO DO FILTRO
DE KALMAN VARIANTE NO TEMPO [Distrito Federal] 2014.
xvi, Xp., 210 x 297 mm (ENM/FT/UnB, Mestre, Sistemas Mecatrnicos, 2014).
Tese de Mestrado Universidade de Braslia, Faculdade de Tecnologia.
Departamento de Engenharia Mecnica
1. Modelagem e controle
2. Filtro de Kalman
3. Controle de sistemas
4. Controle de varincia
I. ENM/FT/UnB
II. Ttulo (srie)
REFERNCIA BIBLIOGRFICA
PARRA, M. E. (2014). CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A
UTILIZAO DO FILTRO DE KALMAN VARIANTE NO TEMPO , Dissertao de
Mestrado em Sistemas Mecatrnicos, Publicao PPGENE.TD-X/X, Departamento de
Engenharia Mecnica, Universidade de Braslia, Braslia, DF, Xp.
CESSO DE DIREITOS
AUTOR: Miguel Enrique Parra Muoz
TTULO: CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAO
DO FILTRO DE KALMAN VARIANTE NO TEMPO .
GRAU: Mestre
ANO: 2014
concedida Universidade de Braslia permisso para reproduzir cpias desta dissertao
de mestrado e para emprestar ou vender tais cpias somente para propsitos acadmicos e
cientficos. O autor reserva outros direitos de publicao e nenhuma parte dessa dissertao
de mestrado pode ser reproduzida sem autorizao por escrito do autor.
AGRADECIMENTOS
***
RESUMO
CONTROLE DE SISTEMAS ADAPTATIVOS MEDIANTE A UTILIZAO DO FILTRO DE KALMAN VARIANTE NO TEMPO
Autor: Miguel Enrique Parra Muoz
Orientador: Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB
Programa de Ps-graduao em Sistemas Mecatrnicos
Braslia, 11 de 2014
Este documento apresenta o trabalho desenvolvido nos ltimos dois anos, para permitir
desenvolver a pesquisa na realizagco do doutorado, o capitulo um, mostra os objetivos,
definigco do problema e introdugco, o capitulo dois mostra algumas tlcnicas de
controle que serco usados no desenvolvimento do problema, enfatizando-se diretamente
no filtro de Kalman e as diferentes configuragtes variante e invariante no tempo que
serco analisadas, dado que sera desenvolvido um controle que tera uma parte estocas
tica modificando diretamente a varicncia do sistema, razco pela qual no capitulo trs
l mostrado um suporte estocastico
onde sco mostrados trabalhos que apresentam diferentes tlcnicas de controle para estes sistemas feitos por outros autores no Brasil, allm disso
o capitulo quatro, mostra uma descrigco matematica
ABSTRACT
CONTROL SYSTEMS BY ADAPTIVE KALMAN FILTER VARIABLE IN TIME
Author: Miguel Enrique Parra Muoz
Supervisor: Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB
Programa de Ps-graduao em Sistemas Mecatrnicos
Este documento apresenta o trabalho desenvolvido nos ltimos dois anos, para permitir
desenvolver a pesquisa na realizagco do doutorado, o capitulo um, mostra os objetivos,
definigco do problema e introdugco, o capitulo dois mostra algumas tlcnicas de
controle que serco usados no desenvolvimento do problema, enfatizando-se diretamente
no filtro de Kalman e as diferentes configuragtes variante e invariante no tempo que
serco analisadas, dado que sera desenvolvido um controle que tera uma parte estocas
tica modificando diretamente a varicncia do sistema, razco pela qual no capitulo trs
l mostrado um suporte estocastico
onde sco mostrados trabalhos que apresentam diferentes tlcnicas de controle para estes sistemas feitos por outros autores no Brasil, allm disso
o capitulo quatro, mostra uma descrigco matematica
SUMRIO
INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.0.1 O BJETIVO GERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.0.2 O BJETIVOS ESPECFICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
1
3
3
3
4
5
5
6
7
7
8
9
10
11
11
12
12
13
14
15
19
20
22
24
25
26
27
28
28
28
30
31
33
35
37
38
40
42
43
44
48
48
VARIVEIS ALETRIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 M DIA ARITMTICA , VARINCIA E DESVIO PADRO . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 M DIA A RITMTICA .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 VARINCIA .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.3 D ESVIO PADRO .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 F UNDAMENTOS BSICOS DOS PROCESSOS ESTOCSTICOS . . . . . . . . . . . . . . . . . . . .
3.3 VARIVEL ALEATRIA DISCRETA E FUNO DE PROBABILIDADE . . . . . . . . . . . .
3.3.1 VARIVEL A LEATRIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2 F UNO D ENSIDADE P ROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3 P ROBABILIDADE CONDICIONAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.4 P ROBABILIDADE TOTAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.5 F UNO DE DISTRIBUIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 F UNO DISTRIBUIO DE PROBABILIDADE N ORMAL . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 R EGRA DE BAYES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 AUTOCORRELAO : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.1 P ROPRIEDADES DA FUNO DE AUTOCORRELAO . . . . . . . . . . . . . . . . . . . .
3.6 RUDO BRANCO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 I NTRODUO AOS PROCESSOS DE M ARKOV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7.1 C LASSIFICAO DOS ESTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
51
51
52
53
53
54
54
54
54
54
55
56
57
57
58
59
60
62
64
65
69
70
72
72
73
73
74
LISTA DE FIGURAS
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20
2.21
2.22
2.23
2.24
2.25
2.26
2.27
2.28
2.29
5
6
7
9
13
14
16
18
19
21
21
22
23
23
24
25
29
32
33
35
38
39
42
44
44
45
45
46
47
48
49
3.2
3.3
4.1
4.2
4.3
5.1
5.2
5.3
5.4
1/ 2 e = 0.2 . ...............................................................................
Comparao da sada dos estados do FK com um filtro Butterworth = 0.2 .
Comparao da sada do controlador PID com FK com um filtro Butterworth
= 0.2. ..........................................................................................
5.5
5.6
5.7
5.8
5.9
5.10
5.11
5.12
5.13
5.14
5.15
5.16
5.17
5.18
5.19
5.20
5.21
5.22
5.23
5.24
5.25
5.26
5.27
77
79
80
81
81
83
84
84
85
86
87
88
88
89
90
91
92
92
93
93
94
94
95
96
96
97
97
5.28 comparao das sadas dos filtros com varincia 0.25 ................................ 98
5.29 diagrama de blocos dos filtros .............................................................. 98
5.30 Comparao da sada do Q varivel para sistemas com filtros diferntes ........ 99
LISTA DE TABELAS
4.1
LISTA DE SMBOLOS
P (A)
fk (n)
Nk (n)
Xk
Wk
Vk
Q
R
E(xk )
Yt
N (0, )
K
e
e+
Nef f
ik1
Vi
dHoHi
wi
HO:k
HM P :k
Hwi .X
Nf
A(GT, ST )
SP E
SP D
M IM O
SISO
LQR
EAR
FK
LQG
FB
F KV T
RGB
HSV
LBP
MB-ELBP
EBIM
Ars
SIR
MB
FPAD
Probabilidade do evento A
Frequncia relativa do evento k
Nmero de ocorrncias do evento K
Vetor de estados do sistema no instante k
Rudo de processo no instante de tempo k
Rudo de medio no instante de tempo k
Matriz de covarincia do rudo de processo
Matriz de covarincia do rudo de medio
Valor Esperado do vetor de estados x no instante de tempo k
Vetor de medies no instante de tempo t
Distribuio normal com media 0 e desvio padro
Ganho de Kalman
Erro a priori
Erro a posteriori
Tamanho efetivo de amostragem
Componente inercial no instante k 1
Matriz de variao de estados
Distncia Bathacharyya entre os histogramas Ho e Hi
Peso da partcula i-sima
Histograma do objeto no instante k
Histograma da melhor partcula no instante k
Histograma da melhor partcula no instante k
Nmero de frames onde o alvo est presente
Relao entra a sobreposio da rea do ground truth e a rea de sada
sistema
Semiplano esquerdo
Semiplano direito
Sistema multiplas entradas multiplas sadas
Sistema unica entrada unica sada
Regulador Linear Quadrtico
Equao Algbrica de Riccati
Filtro de Kalman
Regulador Quadrtico Gaussiano
Filtro Butterworth
Filtro de Kalaman Varivel no tempo
Red Blue Green
Hue Saturation Value
Local Binary Patterns
Block Multiescale Enchanced Local Binary Patterns
Enchanced Biologically Inspired Model
Attentional regions
Sampling Importance Resampling
Medida Bathacharyya
Filtro de Partculas com Amostragem Dupla
1 INTRODUO
Nas dcadas dos anos 60 e 70, com o surgimento dos computadores digitais que foram
as ferramentas para trabalhar para o desenvolvimento do controle em tempo real, e com a
introduo da modelagem atravs da formulao mediante as equaes de estados, surgiram tcnicas de controles timos, utilizando os critrios quadrticos LQR (Linear Quadratic
Regulator) e LQG (Linear Quadratic Gaussian) [18]. A tcnica que utiliza a estrutura do
regulador linear quadrtico (LQR), til quando os estados esto disponveis para realimentao, a qual possui excelentes margens de ganho e de fase, mas nada pode ser concludo
a respeito de sua robustez paramtrica [18]. A estrutura LQG, por outro lado, no tem o
vetor de estados completo para a realimentao, ento este vetor obtido mediante aplicaes de observao aplicando o Filtro de Kalman (FK), sendo por esta razo muito sensvel
a variaes paramtricas na planta [18].
A razo fundamental pela que surgem o controle robusto e adaptativo, porque normalmente quando se tem um sistema em malha fechada ele resulta insensvel a pequenas imprecises do modelo do sistema, como s variaes pequenas da planta, o que pode ser
ocasionado porque muitos sistemas apresentam no linearidades e normalmente tornam os
sistemas vulnerveis a todo tipo de perturbaes, capazes de conduzi-los instabilidade a
perca do desempenho. As snteses de controle robusto surgem exatamente para preencher
esta lacuna dentro da teoria de controle timo. [18].
O desenvolvimento de tcnicas de controle, fundamental para representar modelos fsicos reais, permitindo assim desenvolver controladores e testar-los mediante simulao de
maneira real, diminuindo a probabilidade de erros nos testes, evitando o uso desnecessrio
de recursos que possam ser onerosos.
1.0.1
Objetivo geral
1.0.2
Objetivos especficos
Este captulo vai mostrar alguns conceitos fundamentais que sero usados no desenvolvimento do projeto. O captulo inicia mostrando a definio de controlabilidade e observabilidade de sistemas contnuos e discretos, e continua mostrando de maneira bsica os diferentes
controladores timos como, controle LQR e LQG, e mostra uma comparao do Filtro de
Kalman variante e invariante no tempo para sistemas simples.
2.1
CONTROLABILIDADE
Um sistema linear, contnuo no tempo, dito controlvel, se para qualquer estado inicial
x(0) e tempo final t > 0, existe um controle que transfere o estado para qualquer valor desejado no tempo t. Um sistema linear, discreto no tempo, dito controlvel se para qualquer
estado inicial x0 e tempo final k, existe um controle que transfere o estado para qualquer
valor desejado no tempo k. A diferena nas definies para o tempo contnuo e o discreto,
que no contnuo a transferncia para qualquer tempo final e no discreto para algum tempo
final [19].
Outra maneira de verificar a controlabilidade de um sistema, estudando o rango da
matriz de controlabilidade M . Se o rango da matriz igual ordem do sistema, o sistema
controlvel de estado completo. Usando MATLAB pode ser verificada a controlabilidade da
seguinte maneira [20]:
M = (BAB...An1 B)
(2.1)
M = ctrb(A; B)
(2.2)
rank(M )
(2.3)
Em matlab se tem:
2.2
OBSERVABILIDADE
Um sistema contnuo no tempo dito observvel se para qualquer estado inicial x(0) e
tempo final t > 0 o estado inicial x(0) puder ser unicamente determinado pelo conhecimento
de entradas u( ) e sadas y( ) para todo [0, t]. J um sistema linear, discreto no tempo,
dito observvel se para qualquer estado inicial x(0) e tempo final k o estado inicial x(0)
puder ser unicamente determinado pelo conhecimento de entradas ui e sadas y i para todo
3
i[0, k]. Novamente, a diferena nas definies para o tempo contnuo e o discreto, que no
contnuo a transferncia para qualquer tempo final e no discreto para algum tempo final.
Se o sistema observvel, o estado inicial pode ser determinado e todos os estados entre o
inicial e o final tambm podem ser determinados [19].
Outra maneira de verificar a observabilidade de um sistema, estudando o rango da
matriz de observabilidade N . Se o rango da matriz igual ordem do sistema, o sistema
observvel de estado completo. Usando MATLAB, pode ser verificada a observabilidade da
seguinte maneira [20]:
N = [C T AT C T ...(AT )n1 C T ]
(2.4)
N = obsv(A; C)
(2.5)
Rank(N )
(2.6)
Em matlab se tem:
2.3
O controle timo uma tcnica matemtica usada para resolver problemas de otimizao
em sistemas que evoluem no tempo, e que so suscetveis a perturbaes por foras externas.
Uma vez o problema tenha sido, resolvido o controle timo define o comportamento para
as variveis de controle, indicando as aes que devero ser tomadas para poder levar
totalidade dos sistemas de um estado inicial a um estado final de forma tima [1].
A teoria de controle timo o conjunto de tcnicas para determinar o controle e as trajetrias de um sistema dinmico que minimiza uma funo sobre um intervalo de tempo
[1].
H diversas formulaes para um problema de controle timo, as quais mudam dependendo do critrio de otimizao, do tipo de domnio de tempo (contnuo ou discreto), da
presena de diversos tipos de restries, e das variveis que esto livres. A formulao de
um problema de controle timo requer em geral de:
Definir o modelo matemtico do sistema controlado;
Especificar o critrio de contorno para o estado;
Descreve as restries sobre o estado e o controle;
Descrever as variveis do problema que esto livres.
Quase a totalidade dos problemas de controle timo no pode ser resolvido analiticamente pelo fato de ser necessrio a aplicao de tcnicas adequadas em procura da resposta
adequada [1].
4
2.4
So processos nos quais a sada varivel controlada, est controlada por uma entrada
varivel manipulada; e classificada como sistemas de uma entrada e uma sada SISO.
Mas a maioria dos processos na engenharia tem mais de um lao de controle, onde normalmente cada processo tem pelo menos duas variveis para ser controladas. Os sistemas com
mais de um lao so classificados como sistemas de mltiplas entradas e mltiplas sadas
M IM O ou sistemas multivariveis.Um sistema multivarivel M IM O permite alcanar o
objetivo de manter um conjunto de variveis em um valor desejado. A diferena do controle
SISO que s permite controlar uma varivel no tempo [1].
2.4.1
Sistemas SISO
Os sistemas SISO so aqueles que tm simplesmente uma entrada e uma nica sada.
Desta maneira lgico pensar que para manter a sada desejada do sistema deve ser feito
ajustes necessrios entrada e desta forma vai ser obtido o propsito de controle, mas existe
a necessidade de observar constantemente como a resposta ante as variaes da entrada.
Por essa razo surge a necessidade de fechar a malha de controle para monitorar de maneira
permanente a sada do sistema e compar-la com um sinal de referncia a sada desejada [1].
Na engenharia de controle, geralmente se faz referncia a uma nica entrada e uma nica
sada. Os sistemas SISO so menos complexos que os sistema M IM O M ultipleInput
M ultipleOutput, onde geralmente mais simples projetar a ordem da magnitude. A figura
2.1 representa um sistema SISO [1]
y(k) = f (y(k 1), y(k 2), ...y(k n), u(k 1), u(k 2), ...u(k m))
(2.7)
2.4.2
Sistemas MIMO
y1 (s)
.
.
yn (s)
2.5
nx1
22
2m
=
.
.
.
.
Gn1 (s) Gn2 (s) .... Gnm (s) nxm un (s) mx1
(2.8)
ESPAO DE ESTADOS
Os mtodos convencionais para projetar um controle so normalmente aplicveis a sistemas lineares, mas estes mtodos no so eficientes ou no so aplicveis a sistemas de
controle timo e adaptativo. Se estes sistemas apresentam mltiplas entradas e mltiplas
sadas sistemasM IM O conveniente fazer uma representao em variveis de estados, e o
projeto realizado pelos mtodos modernos para projetar controladores. A figura 2.3 representa um diagrama de blocos do sistema SISO com representao em variveis de estados
[2]:
2.5.1
(2.9)
(2.10)
X(t) so os estados, u(t) a referncia e y(t) a sada, A, B, C, D so matrizes constantes. A matriz A chamada matriz dinmica, a matriz B chamada matriz de controle, a
matriz C chamada matriz de sensores e a matriz D de termos independentes. A funo de
transferncia do sistema contnuo calculado usando a expresso que representa a equao
2.11
G(s) = Cc [sI Ac ]1 Bc + Dc
(2.11)
(2.12)
(2.13)
C = Cc
(2.14)
D=D
(2.15)
(2.16)
(2.17)
Partindo desse modelo pode-se obter a funo de transferncia do sistema equivalente discreto [2]:
G(z) = C[zI A]1 B + D
(2.18)
Normalmente, em sistemas fsicos lineares e invariantes D = 0, para realizar os clculos
utilizado programas como MATLAB [2].
2.5.2
Um sistema dinmico pode ser tambm escrito por um modelo de espao de estados de
ordem n de mltiplas entradas e mltiplas sadas M IM O, no-linear e invariante no tempo,
tem a forma representado pela equao 2.19 [21]:
x(k + 1) = (x(k), u(k))
(2.19)
y(k) = (x(k))
(2.20)
x(k), u(k), ey(k) so o vetor de estados, vetor de entradas e o vetor de sadas, respectivamente. Si, o sistema linear, ele representado pela equao:
2.5.3
gN (s)k(s)
1 + gN (s)k(s)
9
(2.22)
Esto localizados no semiplano esquerdo (SPE) aberto [3]. Uma das maneiras de se
estudar a estabilidade do sistema atravs do Critriode Nyquist, que pode ser enunciado
da seguinte forma: Uma condio necessria e suficiente para a estabilidade do sistema em
malha fechada ocorre quando o nmero de voltas do diagrama de Nyquist de gN (s)k(s) em
torno do ponto 1 + j0, no sentido anti-horrio, seja igual ao nmero de polos instveis de
malha aberta [22]
Note que tanto a planta gN (s), quanto o compensador k(s), podem ter polos no semiplano
direito (SPD) [3]. Para o sistema representado, a funo de transferncia :
y(s) =
1
gN (s)k(s)
gN (s)k(s)
r(s) +
d(s)
n(s)
1 + gN (s)k(s)
1 + gN (s)k(s)
1 + gN (s)k(s)
(2.23)
e(s) =
1
1
1
r(s) +
d(s)
n(s)
1 + gN (s)k(s)
1 + gN (s)k(s)
1 + gN (s)k(s)
(2.24)
Nas equaes anteriores pode-se observar que a sada do sistema e o erro dependem das trs
entradas (referncia, distrbio e o erro), o qual representa um sistema M IM O.
2.6
A metodologia do controle LQR pode ser visualizada como uma aplicao particular de
um problema de otimizao. Este problema de otimizao e caracterizado pela busca de um
vetor de entrada u que minimiza a funo J(.) como mostra a equao 2.25, mas tem como
restrio o modelo do sistema descrito no espao de estados representado na equao 2.26
[23]:
mimu J(x, Q, u, R)
(2.25)
x = Ax + Bu
(2.26)
10
2.6.1
(2.28)
2.6.2
(2.30)
0
0
x (t)Q(t)x(t) + u (t)R(t)u(t) dt
(2.31)
(2.32)
(2.33)
2.6.3
No existem regras que possam ser utilizadas de forma geral para a eleio das matrizes Q
e R. Uma forma simples escolher Q e R diagonais, adicionando valores grandes aos valores
que se desejam minimizar. Mas sempre os valores das matrizes Q e R devem ser positivos ou
zero [25]. A informao conhecida do sistema torna-se fundamental na eleio das matrizes;
mesmo assim necessrio calcular diferentes controladores, baseados nos distintos valores
assumidos nas matrizes Q e R verificando sua efetividade mediante simulao. [25] Uma
vantagem importante do projeto LQR que, independentemente da eleio das matrizes Q e
R, mantido a estabilidade assinttica e robustez do controle. [25]
2.6.4
2.6.5
NO pndulo invertido pode-se considerar um corpo slido, onde seu movimento limitado em duas dimenses. A figura 2.6 representa o modelo do corpo livre do sistema, e
s equaes fundamentais do movimento no plano do corpo slido so representadas pelas
equaes 2.36, 2.37 e 2.38: [4]:
Fi = mai
(2.36)
Fj = maj
(2.37)
FG = mi
(2.38)
i=0
X
j=0
X
i=0
13
(2.39)
(2.40)
F = (M + m)
x + bx + mlcos
ml2 sin
(2.41)
(2.42)
(2.43)
(2.44)
2.6.6
(2.46)
Funo de transferncia
(2.48)
(2.49)
(2.50)
Onde o sistema geral de sada, em funo da entrada, representado pela equao 2.52:
(s)[(M + m)(I + ml2 )s4 mgl(M + m)s2 + b(I + ml2 )s3 mglbs (ml)2 s4 ]
= mls2 U (s)
(2.51)
(s)[(M + m)(I + ml2 )s4 mgl(M + m)s2 + b(I + ml2 )s3 mglbs (ml)2 s4 ]
= mls2 U (s)
(2.52)
Com:
q = ((M + m)(I + ml2 ) (ml)2 )
(2.53)
Ento a funo de transferncia representada pela equao 2.55, onde ela mostra a sada do
sistema em malha aberta para uma entrada impulso como apresenta a figura 2.7.
(s)
=
U (s)
[s4 +
b(I+ml2 )s3
q
(s)
=
U (s)
[s3 +
2.6.7
mls2
q
mgl(M +m)s2
mglbs
]
q
mls
q
mgl(Mq +m)
mglb
]
q
b(I+ml2 )s3
q
(2.54)
(2.55)
(2.56)
y = Cx + Du
(2.57)
onde:
x o estado do sistema de ordem n;
15
(2.58)
(2.59)
q
q
q
(2.60)
Fazendo o mesmo procedimento para a outra equao, substituindo a equao 2.46 na equao 2.45 tem-se a equao 2.64:
(I + ml2 )
((M + m)
x) + bx u) mgl = ml
x
ml
16
(2.61)
(I + ml2 )(M + m)
x + b(I + ml2 )x (I + ml2 )u (ml)2 g = (ml)2 x
(2.62)
(2.63)
Ento:
x =
q
q
q
(2.64)
x 2 =
(ml)2 gu
q
x 4 =
(ml)u
q
x = x2
2
2 )x
2
+ (ml)q gx3 b(I+ml
q
x 3 = x4
2
+ mgl(Mq+m)x3 mlbx
q
0
1
0
0
0
x1
x 1
g(ml)
b(I+ml2 )
(ml)2 g
x
x2 q
0
0
2
q
q
+
u
=
x 3 0
0
0
1
x3 0
mgl(M +m)
ml
x 4
0
mlb
0 x4
q
q
q
"
# x1
1 0 0 0
x2
y=
0 0 1 0 x3
x4
(2.65)
(2.66)
I = 0.006kgm2
g = 9.8m/s2
obtido o sistema em espao de estados de forma numrica o qual representado pelas
equaes 2.67 e 2.68:
x 1
0
1
0
0 x1
0
x 0 0.1818 2.6727 0 x 1.8182
2
2
(2.67)
=
+
u
x 3 0
0
0
1 x3 0
x 4
0 0.4545 31.1818 0
x4
"
# x1
1 0 0 0
x2
y=
0 0 1 0 x3
x4
4.5455
(2.68)
Como o sistema tem mltiplas sadas, o objetivo controlar o ngulo do pndulo e a posio
do carro, baseados nos seguintes requerimentos do desenho [4]:
Tempo de estabilizao de x e menor a 5s.
Tempo de impulso mximo menor aos 0.5s.
Sobre sinal de menor aos 20 graus.
Para uma entrada degrau de 0.2m tem-se:
Figura 2.8: Sada do sistema em funo do espao de estados para o carro e o pndulo. [4]
Na figura 2.8 , os asteriscos representam a posio do carro. A figura representada por
crculos mostra o ngulo. Ento pode-se analisar que para melhorar a dinmica do sistema
tem que se projetar um controle, neste caso, ser projetado um controle LQR[4].
18
2.6.8
Regulador LQR
N
X
(2.69)
k=0
J uma funo que geralmente est associada com a energia do sistema. O controle
timo porque o objetivo minimizar a energia. A expresso XnT (k)QXn (k) representa
a energia aportada para cada estado Q uma matriz no negativa definida. A importncia
de Q que permite a eleio do peso que tem cada estado da funo J. Como o estado
u(k) tem um s elemento,R 0 um elemento que indica o peso que deseja-se dar
19
energia associada com o sinal de controle, se por exemplo, a funo tem as caractersticas
representada na equao 2.70:
Xn (k + 1) = Ad Xn (k) + Bd u(k)
(2.70)
Para dar soluo a equao anterior, preciso de mtodos numricos. A soluo resultante uma lei de controle varivel no tempo como apresenta a equao 2.71:
u(k) K(k)Xn (k)
(2.71)
2.6.9
1 0 0 0
0 0 0 0
(2.72)
Q=
0 0 1 0
0 0 0 0
k = 1.0000 1.6567 18.6854 3.4594
Mediante a utilizao de MATLAB, fazendo a representao do sistema, obtida a sada
como mostrado na figura 2.10:
Na figura 2.10, a figura representada pelos asteriscos mostra o ngulo do pndulo em
radiais, e a figura dos crculos representa a posio do carro em metros. Como pode-se observar os resultados obtidos representados pela figura 2.10 no so timos, Adicionalmente,
pode-se observar que o carro no esta prximo da posio desejada, dado que est se movimentado na direo oposta [4], o que faz que no sistema, em malha fechada, no possa ser
20
5000
0
Q=
0
0
0 0 0
0 0 0
0 100 0
0 0 0
21
(2.73)
k = 70.7107 37.8345 105.5298 20.9238
2.6.10
Projeo do observador
23
2.6.11
Dado que o controle LQR tem o problema de no ser robusto quando o sistema tem
perturbaes, para dar soluo ao problema e conseguir um controlador que rejeite perturbaes, necessrio adicionar ao projeto LQR um efeito integral que afete o erro das variveis
do modelo. O efeito integral tem como funcionalidade integrar o erro dos estados afetados
pelas perturbaes [26]; as razes so:
A lei de controle LQR U = kx, responde essencialmente a um controle proporcional,
dado que o controle proporcional origina efeitos do erro estacionrio no caso de existir
perturbaes no sistema de controle [26].
O modelo do sistema utiliza clculo dos valores do ponto do trabalho (X, U ), onde o
sistema pode apresentar desvios importantes com relao planta ( quedas de tenso em
semi-condutores, desvio dos valores de componentes passivos, etc) [26]. Estes desvios
geram perturbaes no sistema de controle e erro estacionrio [26].
Qual quer perturbao existente na planta gera erro estacionrio que o controle proporcional no pode corrigir [26].
Para o projeto LQR deve ser corrigidos os erros em estado permanente e estacionrio,
como conhecido da teoria de controle clssico, incorporando ao sistema uma parte integral,
permitindo rechaar assintoticamente as perturbaes [26], como apresenta a figura 2.15 [7]:
24
x 1
a11 a12 a13
x1
b11 b12 b13
u1
x 2 = a21 a22 a23 x2 + b21 b22 b23 u2
x 3
a31 a32 a33
x3
b31 b32 b33
u3
(2.74)
A parte integral pode ser implementada para eliminar o erro estacionrio em todas ou s
algumas variveis de estado. Por exemplo, deseja-se adicionar parte integral aos estados x1
e x2 . necessrio incrementar a ordem com dois novos estados Ix1 , Ix2 que so as integrais
dos estados sobre os que deseja-se adicionar ao integral, [27] [28].
Z
dIx1
= x1
dt
Z
dIx2
Ix2 = x2
= x2
dt
a12 a13 0 0
x1
b11 b12 b13
a22 a23 0 0 x2 b21 b22 b23 u1
a32 a33 0 0
x3 + b31 b32 b33 u2
0
0 0 0 Ix1 0
0
0 u3
1
0 0 0
Ix2
0
0
0
Ix1 =
x 1
a11
x 2 a21
x 3 = a31
Ix1 1
2
Ix
0
x1
(2.75)
(2.76)
(2.77)
2.6.12
cente de 0.5 . O que garante que o sistema em malha fechada com controle LQR seja estvel
para qualquer incremento no ganho, e para todos os ganhos superiores metade do valor
nominal do projeto. [27]
A adio da parte integral elimina os erros de regime permanente ocasionado pelas perturbaes, adicionalmente proporciona robustez frente s variaes dos parmetros do modelo do sistema.
A parte integral importante nos casos que o modelo precise de pequenos sinais no clculo do controlador LQR, onde o modelo depende do ponto de trabalho, o erro causado ao
projetar um controle longe do ponto do trabalho pode ser cancelado mediante a implementao da ao integral, se analisada a robustez do projeto LQR a ao integral permite obter
erro estacionrio nulo, mesmo o modelo apresente erros grandes [29].
Outra vantagem do controle LQR em relao a sua robustez que apresenta uma sensibilidade inferior ou igual a unidade para toda o margem de frequncias. Assim supor que a
funo de transferncia do sistema completo tem uma variao mnima em relao variao
dos elementos do sistema, para qualquer frequncia [29].
2.7
FILTRO DE KALMAN FK
No ano de 1960, Rudolph. E. Kalman publicou um trabalho que descreve uma soluo
de maneira recursiva para o problema de filtragem de dados discretos em sistemas lineares.
O trabalho mostra que partindo de alguns valores iniciais, pode ser predito e ajustados os
parmetros de modelos atravs de cada nova medio, obtendo a estimativa do erro em cada
atualizao. A sua habilidade para incorporar os efeitos de erros e sua estrutura computacional fez com que o FK tivesse um amplo campo de aplicaes, especialmente no que se
refere anlise de trajetrias em viso computacional, controle de sistemas dinmicos devido a que o filtro permite analisar sistemas que esto expostos a rudos e perturbaes que
so analisadas de maneira estocstica, por isso teoricamente, o filtro de Kalman conhecido
como um estimador para o que chamado Problema Quadrtico Linear, que o problema
de estimar o estado instantneo de um sistema linear perturbado por um rudo branco [10].
Existem muitas definies do FK, mas basicamente um algoritmo recursivo muito eficiente. E sua utilizao baseada na estimativa das variveis de estado de sistemas representados por equaes de estado lineares. Quase sempre considerado que o sistema perturbado
por rudos brancos e Gaussianos, de forma que os estados possam ser tratados como variveis
aleatrias Gaussianas.
Os mtodos de resoluo mediante a teria do FK permitem a utilizao de uma estimativa recursiva na qual a informao a priori sobre o estado estimado se combina com as
medida para atualizar o parmetro estimado [30]. O FK pode-se estimar de forma continua
26
ou discreta.
O FK comunmente aplicado para dar soluo aos problemas em filtragem e estimao
de sistemas M IM O, pelo fato que ele tem mltiplas entradas e mltiplas sadas quando
se esta usado como um observador de estados, o F K um algoritmo de processamento
de dados timos recursivos, timo porque minimiza um critrio e porque incorpora toda a
informao que subministrada para determinar a filtragem, e recursivo porque no precisa
manter os dados prvios, o que facilita sua implementao em sistemas de processamento
em tempo real. Este algoritmo de processamento de dados pelo fato que foi projetado para
ser usado em sistemas discretos o objetivo do F K estimar o estado de maneira tima, de
maneira que possa ser minimizado o ndice de erro quadrtico meio [1].
2.7.1
O Filtro projetado supondo que o sistema pode ser descrito por meio de um modelo
estocstico linear, onde o erro associado tanto ao sistema como informao adicional que
incorporado em ele mesmo, tem uma distribuio normal com mdia zero e varincia
determinada [1].
A soluo tima pelo fato que o filtro combina toda a informao observada e o conhecimento prvio do comportamento do sistema para produzir uma estimativa do estado de
maneira que o erro minimizado estatisticamente. O termo recursivo faz referncia a que o
filtro recalcula a soluo a cada nova observao ou medida incorporada ao sistema [1].
O F K o principal algoritmo para estimar sistema dinmico representado em forma de
espao de estados, em este representao o sistema descrito pelo conjunto de variveis denominadas de estados. Os estados contem toda a informao relativa ao sistema em instantes
especficos de tempo. Esta informao deve permitir a inferncia do comportamento passado
do sistema, com o objetivo de predizer seu comportamento futuro [1].
O que faz o filtro interessante precisamente a habilidade para predizer o estado de um
sistema no passado, presente e futuro, mesmo quando a natureza do sistema modelado seja
desconhecida. Na pratica, as variveis do estado individual de um sistema dinmico no
pode ser exatamente determinadas pela medio direta. Pelo qual sua medio feita pelos
processos estocsticos que envolvem algum grau de incerteza na medio [1].
Os modelos em forma de espao de estados de processos aleatrios esto baseados na
chamada propriedade de Markov, segundo esta propriedade, o futuro do processo com
respeito ao passado independente, sempre que no seja conhecido o estado presente. Em
um sistema deste tipo o estado do processo resume toda a informao relativa ao passado
que resulta relevante para predizer o futuro[1].
O F K o principal algoritmo para estimar sistemas dinmicos especificados em forma
de espao de estados. Estes modelos so essencialmente uma notao conveniente para abor27
2.7.2
O algoritmo do FK pode ser explicado como uma forma de controle realimentado [31],
onde a funcionalidade do filtro baseada estimando o estado de um processo em algum
instante de tempo k, assim o sistema realimentado obtm uma resposta medidaruidosa,
desta maneira, as equaes do FK podem ser divididas em dois grupos:
Equaes para a atualizao do tempo ;
Equaes para a atualizao da medida.
As equaes para a atualizao do tempo projetam no tempo o estado atual e a varincia
do erro para obter a estimativa a priori para o seguinte estado k + 1. As equaes para a atualizao da medida so responsveis da realimentao, ou seja, incorporam a nova medio
e a estimativa a priori usada para obter uma estimativa a posteriori melhorada [32].
2.7.3
2.7.4
x(t)
(2.78)
(2.79)
(2.81)
(2.82)
E {v(t)w(t)0 } = 0
(2.83)
Figura 2.17: Diagrama de Blocos do sistema com rudo de estado e medida [8]
O problema a ser resolvido consiste em:
Obter-se uma estimativa x0 (t) do estado x(t), partindo da observao da sada y(t) [8].
29
(2.84)
(2.85)
(2.88)
n
X
E {[xi (t) x
b(t)]}
(2.89)
i=1
2.7.5
Seja o sistema descrito em espao de estado representado pelas equaes 2.90 e 2.91
"
#
" #
4 2
1
x =
x+
v
(2.90)
2 4
1
h
i
y = 1 0 x+w
(2.91)
Onde o termo do rudo v(t) tem mdia zero e covarincia V = 0.09. O rudo da medio
assumido com mdia zero e covarincia W = 0.025. O objetivo encontrar a matriz de ganho otimo baseada na matriz que minimiza a equao de Riccati 2.91 [34]. Se o estado inicial
h
iT
da planta x(0) = 0.5 05 , com covarincia de estado inicial S0 = I2x2 . Baseando-se no
30
(0.09)
1 0 (0.25)
1 0
S2 S3
S2 S3
1
1
"
(2.94)
Para dar soluo equao 2.94, a qual uma soluo numrica foi utilizado como
ferramenta o software MATLAB. Obtendo assim a soluo da equao de Riccati como
representam a equao 2.95:
"
#
0.0066 0.0088
S=
(2.95)
0.0088 0.0153
Ento o ganho timo dado pela equao 2.96.
"
#
"
#
iT
0.0066 0.0088 h
0.264
1
L(t) =
1 0 (0.25) =
0.0088 0.0153
0.352
2.7.6
(2.96)
Seja o seguinte sistema discreto representado pelas equaes 2.97 e 2.98 [35]:
xk+1 = Axk + Buk + Gvk
(2.97)
yk = Cxk + wk
(2.98)
As novas sinais de entrada vk e wk , so processos aleatrias considerados rudos brancoS estacionrio com mdia zero e no correlacionados entre si, pelo qual apresentam as seguintes
propriedades [34]:
E {vk } = E {wk } = 0, j, k
E vkT vk = Q
E vkT vj = 0
E vjT wk = 0, j, k
E vjT wk = 0, j, k
E wkT wj = 0, k 6= j
E wkT wk = R
31
Assim a matriz de covarincia conjunta pode ser expresada como mostra a equao 2.99:
!
wk
Qk 0
T
T
E[
(2.99)
wk vk ] =
0 Rk
vk
Assim que o problema pode ser abordado de trs formas diferentes:
Predio obtida a estimativa x(k+1) conhecendo as medidas y(0), y(1), y(2), ..., y(k)
Filtragem Se obter a estimativa x(k) conhecendo as medidas y(0), y(1), y(2), ..., y(k)
Alisado obtida a estimativa x(k1) conhecendo as medidas y(0), y(1), y(2), ..., y(k)
(2.100)
(2.101)
(2.102)
minimizada sendo um vetor arbitrrio de ordem nx1. assumido que o estado inicial
X(0) se conhece seu valor esperado ou valor mdio.
E [x(0)] = x(0)
(2.103)
(2.104)
(2.105)
2.7.7
x
b(k + 1) = A(k)b
x(k) + B(k)u(k) + K(k)[y(k) yb(k)] = A(k)b
x(k) + B(k)u(k) (2.106)
E o digrama de blocos representado na figura.
e(k + 1) = x(k + 1) x
b(k + 1) = [A(k) K(k)C(k)]e(k) K(k)(k) + v(k) (2.107)
O qual representado como:
b
e(k + 1) = A(k)e(k)
K(k)(k) + v(k)
33
(2.108)
cT (k) (k)T K T (k) + v T (k)
eT (k + 1) = eT (k)A
(2.109)
(2.110)
E no o ndice escalar
1
J = eT (k + 1)e(k + 1)
2
Substituindo as equaes do erro e erro transposto tem-se.
(2.111)
T
cT (k)A
cT (k)E[e(k)wT (k)]K T (k)+A(k)E[e(k)v
b
b
P (k+1) = E e(k + 1)eT (k + 1) = A(k)P
(k)A
(k)]
E como:
cT (k + 1)E[e(k 1)wT (k)]
E[e(k)wT (k)] = A
(2.112)
Assim que o valor esperado pode se expressar como mostra a seguinte equao:
T
T
b
b
b
b
b
b
E[e(k)w(k)] = A(k1)E[e(k1)w
(k)] = A(k1)
A(k2)E[e(k2)w
(k)] = A(k1)
A(k2)...
A(0
Como:
E[[x(0) x
b(0)]wT (k)] = 0
(2.113)
(2.114)
Os termos:
Ento
(2.117)
(2.118)
(2.119)
(2.120)
(2.121)
Que a equao de Riccati,em resumo este procedimento pode ser visualizado no seguinte
diagrama
2.7.8
(2.122)
Bd = A1 (A I)B
(2.123)
Gd = A1 (A I)G
(2.124)
x
bk+1
#
"
#
"
#
0.8146 0.08173
0.002188
0.043
=
xk +
uk +
vk
0.08173 0.8146
0.045245
0.0447
h
i
y k = 1 0 xk + w k
(2.125)
(2.126)
#
"
#
0.8146 0.08173
0.002188
x
bk =
xk +
uk
0.08173 0.8146
0.045245
(2.127)
(2.128)
Assim a estimativa a posteriori, corregida com a sada y(k+1) dada pela equao 2.129
*"
#+
"
#
h
i
0.8146 0.08173
0.002188
x
bk+1 = (I Lk+1 1 0 )
xbk +
uk + Lk+1 (2.129)
0.08173 0.8146
0.045245
E a matriz de covarincia para prxima iterao representada na equao2.130.
Sk+1
"
h
i
= (I Lk+1 1 0 )
"
# "
#T
0.8146 0.08173
0.8146 0.08173
Sk
0.08173 0.8146
0.08173 0.8146
#
"
#T
h
i
h
i
0.002188
0.002188
(0.09)
(I Lk+1 1 0 ) + Lk+1 (0.025)LTk+1 (I Lk+1 1 0 )
0.045245
0.045245
(2.130)
36
A soluo das equaes anteriores feita mediante a ajuda do software MATLAB, onde
foram obtidas a matriz de covarincia para prxima iterao e o ganho do Kalman como
apresentam as equaes 2.131 e 2.132
"
#
0.0130
L=
0.0174
"
#
0.3260 0.4352
3
S=1
0.4352 0.7580
2.7.9
(2.131)
(2.132)
Seja o sistema em espao de estados dado pelas equaes 2.97 e 2.98. Onde as matrizes
discretas tm a forma que apresentam as equaes 2.133 e 2.134.
x
bk+1 = 1.000
(2.133)
0
0 xk + 0.5919 uk + vk
0
1
0
0.5191
h
i
y k = 1 0 0 xk + w k
(2.134)
Projetar um FK baseados nas medies de rudo y[n] = Cx[n] + v[n] Pode-se utilizar
a funo de KALMAN de Matlab para projetar o FK estacionrio,esta funo determina
o timo estado para o filtro estacionrio com ganho K baseado no processo de ruido de
covarincia Q e o rudo do sensor de covarincia R. Para desenvolver o exemplo vai se
tomar como covarincia para do rudo e do sensor respetivamente:
Q = 2.3 um valor diferente de zero;
R = 1.0 Um valor diferente de zero.
Assim o FK en estado estacionrio que ser projetado tem as equaes 2.135 e 2.136
x[ n + 1|n] = Ax[ n|n 1] + Bu[ n]
(2.135)
(2.136)
(2.138)
0.5345
L = 0.0101
0.4776
(2.139)
2.8
39
(2.140)
P [n + 1|n] = AP [n|n]A0 + B Q B
(2.141)
(2.142)
(2.143)
(2.144)
BILBLIOGRAFIA MATLAB
O procedimento para obter o FKVT em matlab o mesmo utilizado para FK discreto,
com a diferena que aqui pode ser atualizado tanto o tempo como a covarincia Q.
2.9
CONTROLE LQG
Como o controlador LQR projetado para sistemas que no tem rudo nem perturbaes, para superar o problema de certas variveis de estados que no podem ser medidas, ou so muito ruidosas, ento a analises feita usando teoria de processos estocsticos
[2].Considerando os fatos anteriormente ditos necessrio adicionar um observador estocstico ao projeto LQR, normalmente este observador um FK, o qual resolve o problema de
estimao timo dos valores das variveis de estado do sistema conhecido em presena de
rudo nas prprias variveis e medidas, onde o observado de estados considera os componentes aleatrias do sistema [2]. Depois da estimao dos valores das variveis dos estados,
pode ser feita a realimentao tima das variveis de estado para projetar um regulador linear
timo quadrtico (LQG), onde normalmente o projeto desenvolvido em duas etapas [2].
1. Determinar a matriz de ganho do filtro de Kalman [2];
2. Determinar a matriz de ganho de realimentao tima [2].
Com isto pode ser considerado como vantagens do uso de projetos de controladores LQG:
Ao integral que pode ser introduzida facilmente [33];
Sinais de referncia estocsticos podem ser includos [33];
40
Sistemas multivariveis no quadrados, com atraso nas diferentes malhas, podem ser controlados [33].
Mas o controlador LQG tambm apresenta desvantagens, entre elas esto a perda da robustez
devido incluso do estimador e ao tempo gasto com a estimao [33], No controlador LQG,
a dinmica da planta linear e conhecida , e as perturbaes presentes so estocsticas com
as propriedades estatsticas conhecidas [33] Seja o sistema a ser controlado representado
pelas equaes 2.145 e 2.146 [37]:
x(t)
(2.145)
(2.146)
Onde:
x Rn o estado do sistema [37];
y Rq o vetor de medidas contaminado pelo rudo v Rq [37];
u Rm o vetor do controle a ser determinado [37];
v Rn o vetor de perturbao [37];
w Rn o vetor rudo que afeita a sada [37].
v(t) E w(t) so sinais estocsticas com mdia e varincia conhecidos [37] Em relao ao
sistema, pode-se assumir as seguintes caractersticas de v(t) e w(t):
v(t) e w(t) so rudos brancos, isto variveis estocsticas de mdia nula, o seja E {w(t)0 } =
0,E {v(t)0 } = 0 e no correlacionadas no tempo, o que igual a ter E {w(t)w()0 } = 0,
E {v(t)v()0 } = 0 para t [4];
v(t) e w(t) so no correlacionadas entre s, E {v(t)vw()0 } = 0;
v(t) e w(t) possuem matriz de covarincia conhecida e so E {w(t)w()0 } = Qw 0 e
E {v(t)v()0 } = Rv 0.
A parte fundamental do controle LQG encontrar uma lei de controle u(t) que ao ser
aplicado no sistema possa minimiza a funo 2.147 [33].
Z
1 T T
x (t)Q(t)x(t) + uT (t)R(t)u(t) dt
J(t0 ) = lim
T T 0
Sendo Q e R matrizes de ponderao como mostram as equaes 2.9 e 2.9 :
Q QT 0
41
(2.147)
R RT 0
A soluo para o problema LQG pode ser apresentada em duas etapas:
1 Projeta-se um controle LQR com u(t) = Kx(t), sendo K uma matriz de realimentao
de estados que no depende de V e W ;
2. Projeta-se um observador onde a varincia do erro de estimao E {(x xf )(x xf )}
minimizada mediante o FK.
Assim a soluo do problema LQG pode-se ser representada como apresenta a figura 2.23
2.9.1
Propriedades do LQG
Para a anlise do controlador LQR, substituindo a equao 2.32 na equao 2.30 obtmse a equao do sistema de malha fechada dada pela equao 2.148:
x(t)
= (A BK)x(t)
(2.148)
(2.149)
(2.150)
(2.151)
(2.152)
2.9.2
Para o pndulo invertido, do item 2, onde foi projetado um controle LQR representado
pelas equaes 2.67 2.69, ser projetado um controle LQG, dado que o sistema requer
do modelo discreto, a discretizao do modelo feita em MATLAB mediante o comando
c2d, onde necessrio um tempo de amostragem para o caso ser T = 1/100; o sistema
discretizado representado pelas equaes 2.153 e 2.154 [11].
0.0001
x1
0.01
0.0001
0
0.9982 0.0267 0.0001
x2 0.0182
u
+
0
0
0.01 x3 0.0002
0.0454
0 0.0045 0.3119 1.0016 x4
1
x 1
x 0
2
=
x 3 0
x 4
"
# x1
1 0 0 0
x2
y=
0 0 1 0 x3
x4
(2.153)
(2.154)
As condies de desenho para uma entrada degrau de 0.2m a posio desejada tem as seguintes caractersticas:
Tempo de estabilizao de x e menor a 5s;
Tempo de impulso mximo menor aos 0.5s;
Sobre sinal de menor aos 20 graus;
Erro de estado estacionrio menor ao 2 cento para x e .
43
2.9.3
1 0 0 0
0 0 0 0
Q=
(2.155)
0 0 1 0
0 0 0 0
necessrio especificar dois parmetros, o ndice de desempenho os quais sero ajustados por tentativa e erro para obter a melhor resposta. [11]. Para o caso mais simples tem-se
o ganho de valor igual:
k = 0.9384 1.5656 18.0351 3.3368
Ento o sistema de forma matricial representado pela figura 2.24 . Do sistema apresentado
Figura 2.25: Sada do sistema para R=1, caso mais simples [11]
44
ficao apresentada para o pndulo invertido continuo, a nova matriz Q representada pela
equao 2.156:
5000 0 0 0
0
0 0 0
Q=
(2.156)
0
0 100 0
0
a sada, o valor calculado para , N foi -61.55 , obtendo assim a resposta apresentada na figura
2.28.
#
0.9998 0.0013
0
0.0031
S=
0
0.0074 0.9002 0.0192
46
(a)
(b)
(c)
(d)
Figura 2.29: (a) Sistema geral (b) Sistema interno (c) Representao da planta do sistema (d)
Modelo do filtro de Kalman.
47
Figura 2.30: Sada do sistema com controle LQG e filtro de Kalman [11]
Substitudo os ganhos no sistema geral mostrada na figura 2.23, o sistema em Simulink
apresentado na figura 2.29: Pode-se perceber que o controle projetado pelo mtodo LQR
muito similar na sua resposta ao controle projetado LQG com FK, mas o figura 2.30 mostra
a sada do processo com efeitos do rudo no sistema, o qual obtido na realidade em quase
todos os sistemas.
2.9.4
Para desenvolver o seguinte exemplo foi usado o exemplo dos tanques apresentado na
subseo 2.7.9, onde foi obtido o FK como contralador, ser aproveitados os estados do FK
como observador para conseguir projetatar um controle LQG, seguindo o diagrama de blocos
apresentado na figura 2.31,
A figura 2.31 mostra o comportamento do controlador LQG usando um observador de
estados de ordem dois e um observador de estados de ordem quatro, nos dois casos o controlador frente a um rudo no processo e na medida tem um comportamento bom, conseguindo
fazer o seguimento do sinal de referncia, se o rudo no processo for zero os dois controladores sero superpostos ao sinal de referncia.
2.10
CONTROLADOR PID.
48
e(t)dt + Kp Td
de(t)
dt
(2.157)
(a)
(b)
(c)
(d)
Figura 2.31: (a) Diagrama de blocos do contole LQG de ordem dois (b) Sada do controlador
LQG de ordem dois. (c) Diagrama de blocos do contole LQG de ordem quatro (d) Sada do
controlador LQG de ordem quatro.
49
onde:
Kp constante proprocional;
Ti Tempo integral;
Td Tempo derivativo;
e(t) erro na medida.
A funo de transferncia de este controlador representada pela equao 2.158
Gc (s) = U (s)/E(s) = Kp (1 +
1
+ Td s)
sTi
(2.158)
Td s
1 + Td s
(2.159)
Onde o valor normalmente um valor pequeno, por volta de 1/8, o qual permite que o
numerador predomine, que a ao derivativa desejada [novo].
50
3 VARIVEIS ALETRIAS
Dado um fenmeno aleatrio qualquer, com um certo espao de probabilidade, desejase estudar a estrutura probabilstica de quantidades associadas a esse fenmeno [12]. seja
(, F, P ) um espao de probabilidade. Denomina-se varivel aleatria, qualquer funo
X : R tal que X 1 = : X()IF Para todo intervalo ICR Em palavras, C
tal que sua imagem inversa de intervalos I R pertencem a F . Uma varivel aleatria
, portanto, uma funo do espao amostral () nos reais, para a qual possvel calcular a
probabilidade de ocorrncia de seus valores [12].
3.1
3.1.1
Mdia Aritmtica.
A mdia de uma varivel aleatria X uma medida de tendncia central, tambm denominada valore esperado de X e representado por E(X). definida como a mdia aritmtica
dos valores de X isto como mostra a equao 3.1:
x=
N
x1 + x2 + x3 + ......xn
1 X
=
x( i)
N
N i=1
Onde:
N o nmero de elementos [39];
xi a amostra.
A equao anterior pode-se escrever como mostra a equao 3.2 [40]:
51
(3.1)
N
1 X
xi
E(x) =
N i=1
(3.2)
3.1.2
Varincia.
A varincia de uma varivel aleatria X uma medida de disperso dos valores da varivel em torno da sua mdia. Ela definida como a mdia aritmtica dos quadrados dos
desvios dos valores de X em relao mdia dos prprios valores de X. Em uma populao
de tamanho N, a varincia de uma varivel aleatria denotada por V ar(x) [40], e dada
pela equao 3.3
N
1 X
V ar(X) =
(xi )2
N i=1
(3.3)
52
3.1.3
Desvio padro.
1
N 1
v
u
N
N
u
X
X
(
x2i (
xi )2 /N ) = t
i=1
i=1
N
X
1
(
x2 N x2 )
N 1 i=1 i
(3.5)
Deve-se notar que alguns autores para o calculo da varincia e o desvio padro empregam
N em vez de N 1 no denominador, o qual no faz muita diferena se o numero de amostras
grande mas se o nmero de amostras pequeno si, pelo qual N 1 Fornece uma melhor
estimativa da varincia da populao da qual a amostra tomada [39].
3.2
Objetivando a realizao um estudo sobre um fenmeno real, surge o problema relacionado obteno de modelos que se aproximem ao mxima do comportamento real. Devido
elevada complexidade para obter modelos fiis que representam o sistema a ser estudado,
faz-se o uso de modelos matemticos simplificados. procurando fazer uma quantificao
dos fenmenos de estudo. Em diversas situaes estes modelos matemticos no conseguem
refletir este comportamento, sendo necessrio o emprego de mtodos mais detalhados, muitas das vezes com elevado grau de complexidade. Uma destas modalidades de modelagem
detalhado pode ser expressa a partir de uma soluo probabilstica de modelagem utilizando
uma representao por processos estocsticos. Os processos estocsticos so representados
por variveis aleatrias e funes destas variveis aleatrias.
Diferente dos mtodos estatsticos amostrais, a resposta de um processo estocstico ser
uma funo ou uma sequncia de valores e no apenas um nmero [41]. Essa funo em
geral representa a densidade de probabilidade de um conjunto de resultados possveis para
uma determinada varivel aleatria.
53
3.3
Uma varivel aleatria classifica como discreta se assume somente um nmero de valores finitos. A funo de probabilidade de uma varivel discreta uma funo que atribui
probabilidade a cada um dos possveis valores assumidos pela varivel. Isto , sendo X uma
varivel com valores X1 , X2 , ...., para i = 1, 2, .... [12].
3.3.1
Varivel Aleatria.
Uma varivel aleatria uma varivel cujo valor igual ao resultado de um experimento
aleatrio, ou seja, representa todo o espao amostral da experincia realizada. Dependendo
do tipo de experimento, esta varivel pode ser de natureza continua ou discreta[41].
3.3.2
Para uma varivel aleatria continua, a funo densidade probabilidade descreve a probabilidade de uma a varivel aleatria assumir um determinado valor dentro de um conjunto
dado. Em outras palavras, a funo densidade probabilidade uma expresso matemtica
que representa o comportamento provvel de um conjunto de resultados possveis da varivel
aleatria [41].
3.3.3
Probabilidade condicional.
Supondo que temos dos eventos A e B, e desejamos conhecer como eles esto relacionados entre si, de tal maneira que o conhecimento sobre o evento B nos d uma informao
sobre o evento A. Para conseguir isso, temos que empregar a probabilidade condicional
P (A|B). A probabilidade condicional pode ser definida como:
P (B|A) =
3.3.4
P (B A)
P (B)
(3.6)
Probabilidade total.
Seja S o espao amostral de um dado experimento que foi divido em pi partes. Define-se
A um evento contido no espao amostral, ento pode-se definir que:
A = (A S)
(3.7)
e que:
S=
n
X
i
54
pi .
(3.8)
(3.9)
P (A) =
n
X
P (A pi ).
(3.10)
P (A) =
n
X
P (A|pi )P (pi )
(3.11)
3.3.5
Funo de distribuio.
3.3.5.1
e
limx F (x) = 1
(3.14)
3.3.5.2
p(xi ) = 1.
55
3.4
Uma varivel X segue o modelo normal se sua densidade representada pela equao
3.15:
1
f (x) =
2
2
(x)2
2 2
dx
(3.15)
Z z+
(x)2
1
2 2 dx
f (x) =
e
2
Z z
z2
1
e 2 dx
f (x) =
2
P(
56
(3.16)
(3.17)
(3.18)
P (a < X < b) = P (
b
b
a
a
<Z<
) = (
) (
)
(3.19)
Cujo valor numrico pode ser obtido por uso de tabelas [12].
3.4.1
Regra de Bayes.
P (B|A)p(A)
P (B)
(3.20)
Em que p(A|B) a probabilidade a posteriori, p(B|A) a probabilidade de verosimilhana, p(A) e p(B) so as probabilidades a priori dos eventos. Com a regra de Bayes e
possvel conhecer o comportamento de A, tendo como base o comportamento individuais de
A e B anteriores e sua probabilidade conjunta para obter uma estimao resultante.
3.5
AUTOCORRELAO:
(3.21)
Onde fx(t1 ),x(t2 ) (X1 X2) uma funo de densidade de probabilidade de segunda ordem
do processo. Ento pode-se falar que um processo aleatrio estritamente estacionrio se
fx(t1 ),x(t2 ) (X1 X 2) depende somente da diferena entre os tempos de observao t1 e t2 o
que significa que uma funo de autorcorrelao de um processo estritamente estacionrio
dependo somente da diferena de tempos t2 t1 como mostra a equao 3.22:
57
(3.22)
(3.23)
A equao anterior a semelhana ente a funo de autocorrelao e funo de autocovarincia de um processo estritamente estacionrio X(t) depende somente da diferena de
tempos t2 t1 , a equao anterior mostra que se conhecida a media e a funo de autocorrelao do processo pode ser determinada de maneira nica a funo de autocovarincia
[13].
3.5.1
(3.26)
(3.27)
(3.28)
3.6
RUDO BRANCO.
59
N0 = KTe
(3.30)
Figura 3.3: Caractersticas do rudo branco (A) Densidade espectral de potncia. (B) Funo
de autocorrelao [13]
3.7
Considerando um processo que pode ser descrito em cada passo por um dos N estados distintos i1 , i2 , ....in . Em cada caso o sistema pode mudar de estado (o permanecer no
mesmo) de acordo com um conjunto de probabilidades de transio. Quando estas probabilidades s dependem do estado de partida e de chegada e no dos estados anteriores, se diz
que o processo de Markov [21].
Definio: um processo estocstico Xk . k = 1, 2....com um espao de estados S =
i1 , i2 , i3 , ....iN . um processo (cadeia) de Markov se para cada n todos os estados i1 , i2 , i3 , ....iN .
60
certo que:
p(Xn = in |Xn1 = in1 , ....X1 = i1 ) = p(Xn = in |Xn1 = in1 )
(3.32)
(3.34)
(3.35)
Onde Xt , a varivel aleatria da cadeia de Markov. Os valores Pi,j (t) define a matriz
Pi,j (t) de probabilidade de transio de um estado a outro no percorrer do tempo [21].
Definio: A probabilidade para se movimentar de um estado i at o estado j no percorrer de t, chamada de probabilidade de transio Pi,j (t). Si, a probabilidade de transio
Independente de t, a cadeia de Markov chamada de homognea. Se a cadeia de Markov homognea o espao S = i1 , i2 , i3 , ....iN . finito, por tanto, as probabilidades de
transio so dadas por uma matriz de transio P = Pi,j (t) que verifica Pi,j 0, i =
1, 2, .....n, j = 1, 2, .....n As matrizes com estas propriedades so chamadas estocsticas
[21].
A matriz de transio de n passos a ensima potencia de P definida por:
(n)
(n)
(3.36)
Verifica-se a equao:
(n+m)
Pi,j
(n)
(m)
Pi,k Pk,j , n 0, m 0
(3.37)
Que chamada de equao de Markov. Tambm pode ser escrita de forma matricial como
mostra a seguinte equao:
P (m+n) = P m P n
(3.38)
61
3.7.1
fijn
(3.40)
n=1
ui =
nfijn
(3.41)
n=1
Definio 11: um estado absorvente quando Pij = 1 claro que se o estado absorvente, ento ele recorrente [21].
63
Na atualidade, o oceano tem um papel fundamental na economia mundial, principalmente fundamentada na indstria de extrao de petrleo. Alem disso, grande parte do meio
subaqutico ainda desconhecida pelo homem, normalmente por sua dimenso, condies
adversas do ambiente (correntes ocenicas, elevadas presses, etc.). Nesta situao os veculos subaquticos no tripulados so importantes ferramentas, pois permitem realizar inspees, coletar dados, efetuar trabalhos de construo e instalao de estruturas subaquticas,
etc. [43]
Por esta razo a robtica subaqutica nos ltimos anos de gro interesse, o qual tem
como motivao o desejo do ser humano de conquistar o fundo marino. O entorno subaqutico um ambiente hostil onde um rob pode aportar importantes vantagens, evitando riscos
a seres humanos e cumprindo seu trabalho e as misses para as que foram projetadas. [44]
O rob subaqutico ao igual que outras operaes podem operar de maneira tele operado
ROV ou de maneira autnoma AU V . No primeiro caso, o rob tele operado com controle
remoto chamado ROV , o qual fica permanentemente unido, mediante um cavo a um navio ou
plataforma. O cavo permite a transmisso de sinais de controle, e das medidas e observaes
captadas por sensores dispostos no rob, a transmisso eltrica para os sistemas dispor de
um cavo que permite sua recuperao mediante trao. O operrio desde seu local de mando
remoto controla os movimentos do rob, alem disso recebe as informaes coletadas pelos
sensores.[44]
Os AU V podem desenvolver uma tarefa programada ou planejada, interatuando a seu
redor, cumprindo com o objetivo, e voltado para um ponto desejado, sem interao do operrio. A diferena fundamental com um ROV , que no precisam de um cavo umbilical,
pelo qual necessita de um importante componente de hardware e software destinado a sua
navegao totalmente autnoma. [44]
Alm disso, estes equipamentos possuem a capacidade de realizar toda essa gama de
atividades a altas profundidades e sem colocar em risco ou perigo vidas humanas. No Brasil,
existem poucos trabalhos e pesquisas na rea de Robtica subaqutica fundamentada em
ROV e(AU V ), e de uma forma geral, a pesquisa nessa rea ainda pequena, comparada ao
nvel mundial. Existem alguns trabalhos brasileiros representativos reportados na literatura,
entre estes esto:
Barros e Soares (2002) [45] Apresentaram uma proposta de um veculo subaqutico de
baixo custo que pode operar como ROV Remotely Operated Vehicle ou AUV AutonomousUnderwater Vehicle
Souza e Maruyama (2002)[46] trabalham e investigaram em diferentes tcnicas de con64
4.1
para um sistema submarino no ser uma grande contribuio pesquisa, dado que h muitos
anos se esta trabalhando na modelagem destes sistemas,e atualmente se conta com modelos
que apresentam resultados muito bons, ento este trabalho vai ser direcionado diretamente
em projetar estratgias e tcnicas de controle que permitam ter um bom comportamento do
veculo submarino,partindo dos resultados obtidos no trabalho de mestrado de (M E Parra
,2012), [56], onde foi feita a modelagem matemtica e controle de um quadrimotor, e projetado um controle para este sistema baseado no conhecimento das varincias, dado que
este sistema apresenta 6 graus de liberdade, de igual maneira que os veculos subaquticos,
vai ser projetado um controle do mesmo jeito, adicionalmente se trabalhara com controle
estocstico, controle LQG, FK para controlar as perturbaes do sistema e assim obter o
melhor comportamento possvel na funcionalidade do veculo subaqutico, este trabalho foi
desenvolvido usando o ROV modelo xxxx. O qual vai ser caracterizado para encontrar as respectivas constantes e variveis para projetar as diferentes tcnicas de controle anteriormente
mencionadas, que possam ter um comportamento timo comprovado mediante simulao
por meio de software como MATLAB e SIMULINK, e os respectivos testes que sero feitos
no veculo subaqutico com o que o se conta para trabalhar."
Ento o propsito de apresentar um modelo matemtico de um veculo submarino fundamentado na necessidade de obter um modelo que descreva com exatido o movimento de
um veculo robtico submarino, que compreenda tanto a dinmica de corpo rgido referente
ao veculo em si, como a representao da dinmica do fluido de um sistema contnuo, no
qual o veculo est imerso. Enquanto a dinmica de corpo rgido do veculo pode ser representada por equaes diferencias ordinria (EDO), o meio fluido deve ser representado
por um sistema de equaes diferenciais parciais (EDP ). [14] Para dar soluo analtica
ou numrica de um modelo com esse grau de complexidade, os modelos so baseados em
parmetros concentrados para representar de forma aproximada o comportamento dinmico
do veculo [14].
As equaes de movimento do veculo robtico submarino podem ser representadas em
relao a um sistema de referncia inercial ou a um sistema fixo ao corpo do veculo, como
apresenta a Figura 4.1. Com base nesse fato, as equaes de movimento do veculo podem
ser expressas em relao ao corpo rgido, da seguinte forma vetorial [57]:
M v + C(v)v + D(v)v + g() =
(4.1)
Figura 4.1: veculo submarino co sistemas de coordenadas inercial e de corpo rigido. [14].
De acordo com os trabalhos desenvolvidos por diferentes autores como Fossen [15], do
qual foi baseado o trabalho apresentado por [17], um veculo martimo se movimenta com
seis graus de liberdade, por tanto so definidas seis coordenadas independentes requeridas
para determinar a posio e orientao do veculo. As primeiras trs coordenadas (x, y, z)
e suas primeiras derivadas temporais correspondem respectivamente posio e ao movimento translacional ao longo dos eixos X, Y eZ. As ltimas trs coordenadas (, , ) e
suas primeiras derivadas temporais descrevem respectivamente a orientao e o movimento
rotacional.
Segundo a notao definida pela SNAME [58], as componentes do movimento do veculo martimo so convencionalmente definidos como Avano, Deriva, Afundamento, Jogo,
Arfagem e Guinada do ingls surge, sway, heave, roll, pitch e yaw, respectivamente, como
mostra a Tabela 4.1.
Para determinar as equaes de movimento, dois sistemas de coordenadas so empregados o modelo mostrado na figura 4.2
67
Graus de
Foras e
Velocidade
liberdade
momentos linear
liberdade
e angular
1
Movimento na direo X (avano)
X
u
2
Movimento na direo Y (Deriva)
Y
v
3
Movimento na direo Z (afundamento) Z
w
4
Rotao sobre o eixo X
(Jogo)
K
p
5
Rotao sobre o eixo Y
(Arfagem)
M
q
6
Rotao sobre o eixo Z
(Guinada)
N
r
Tabela 4.1: sistema de referncia. Retirado de [17]
68
Posies e
ngulos
de Euler
x
y
z
= [1 2 ]T
v = [v1 v2 ]T
= [1 2 ]T
1 = [xyz]T
v1 = [uvw]T
1 = [XY Z]T
2 = []T
v2 = [pqr]T
2 = [KM N ]T
Posio
velocidade
fora
4.2
CINEMTICA
(4.2)
cc sc + ssc ss + scc
J1 (2 ) = sc cc + sss cs + ssc
s
sc
cc
(4.3)
2 = J2 (2 )v2
(4.4)
1 sen()tan() cos()tan()
J2 (2 ) = 0
cos()
sen()
0 sen()/cos() cos()/cos()
(4.5)
4.3
(4.6)
DINMICA
como um corpo rgido. Dessa forma, a sua dinmica apresenta componentes relacionados
com o movimento de rotao do corpo em torno dos seus eixos, as quais correspondem
fora de Coriolis e fora Centrpeta, as quais surgem porque veculo submarino um referencial no-inercial. Ento se deve ressaltar tambm que conveniente escrever as equaes
da dinmica do movimento do corpo rgido segundo uma parametrizao no sistema E, visto
a ao dos agentes externos e a inrcia do veculo ser constantes em relao a este sistema
de coordenadas [55].
A partir de uma formulao Newton-Euler para um corpo rgido de massa m, as expresses que representam sua dinmica, definidos em relao ao sistema E,[15], podem ser
escritas como apresentam as equaes 4.7 e 4.8:
m[v1 + v2 Xv1 + v2 XrOB + (v2 XrOB )] = 1
(4.7)
(4.8)
(4.9)
71
(4.10)
Onde:
H representa as foras e os momentos devidos aos esforos hidrodinmicos.
E representa as foras e os momentos devidos aos esforos ambientais.
representa as foras e os momentos devidos aos propulsores conectados ao veculo martimo.
4.4
PERTURBAES EXTERNAS
De acordo com Faltinsen [59], a maioria das aplicaes de controle em veculos martimos, o princpio da superposio considerado uma boa aproximao para acrescentar a
influncia das perturbaes externas nas equaes de movimento do veculo martimo, os
detalhes sobre a modelagem matemtica podem ser encontrados em [16],[15].
4.5
EFEITOS HIDRODINMICOS
Considerando que as velocidades de operao dos veculos submarinos de operao remota raramente excedem 2 m/s, os efeitos hidrodinmicos (Fh ) podem ser representados
usando a forma aproximada pela equao de Morison [60] representada na equao 4.11.
1
Fh = CD Av |v| + CM 5 v + 5 vw
2
(4.11)
Onde:
v e vso,
dos veculos submarinos, a acelerao da correnteza pode ser desprezada. Desta forma, o
coeficiente do segundo termo pode ento ser chamado de massa adicional hidrodinmica. O
primeiro termo da equao representa o amortecimento quadrtico hidrodinmico. Avaliaes experimentais [61] mostram que a equao de Morison descreve com boa preciso os
efeitos hidrodinmicos pelo movimento relativo de um corpo rgido em relao a gua.
4.6
ESFOROS AMBIENTAIS
Como foi apresentado em [15], a ao das ondas, dos ventos e das correntes martimas
constituem os agentes de distrbios ambientais mais importantes quando se considera embarcaes de superfcie, como navios ou plataformas martimas. Dessa forma, o vetor pode
ser expresso como mostra a equao 4.12.
E = Ecm + Eonda + Evento
(4.12)
4.7
73
4.8
(4.13)
M = MRB + MA
(4.14)
(4.15)
Onde:
Assumindo que o corpo est em repouso (ou na maioria das vezes est se movendo em
baixa velocidade) em um fluido ideal, matriz M sempre simtrica positiva, ou seja
M = MT > 0
(4.16)
Em um corpo rgido que se movimente em um fluido, a matriz C(v) pode ser sempre
parametrizada de tal forma que ela seja anti-simtrica, enquanto que a matriz D(v) real,
no-simtrica e estritamente positiva [16], ou seja:
= J()v
(4.17)
(4.18)
(4.19)
(4.20)
(4.21)
(4.22)
cos() sen() 0
(4.23)
m11 0
0
M = 0 m22 0
0
0 m33
(4.24)
0
0
m22 v
C(v) = 0
0
m11 u
m22 v m11 u
0
(4.25)
d11 0
0
D = 0 d22 0
0
0 d33
(4.26)
m11 = m Xu
d11 = Xu
m = m Y
22
v
d22 = Yv
m33 = Iz Nr
d = N
33
r
(4.27)
75
x = ucos () vsen ()
y = usen () + vcos ()
= r
m11
vr md1111 u + m111 1
u = m
22
m11
v = m
ur md2222 v
22
76
(4.28)
m33 3
Este captulo tem como objetivo comparar as diferentes tecnicas de controles e deixar os
diferentes controladores projetados prontos para iniciar testes com sistemas reais, como sero
feito numa etapa posterior no desenvolvimento da teses do dotorado que inclui aplicao
de sistemas subquticos. O captulo incia mostrado os resultados obtidos at o momento
com as diferentes tecnicas de controle para analisar sistemas, primeramente ser mostrado o
comportamento do FK quando este usado como controlador, posteriormente ser mostrado
a analises feita para obter um filtro Butterwoth F B de segunda ordem baseado na varincia
desejada para um sistema, seguidamente ser mostrado a obteo do controladores tipo PID e
LQG, para analisar um sistema de ordem seis, e finalmente ser observado o comporatamento
do FK com o controlador PID e um FB frente a uma entrada rudosa.
5.0.1
A continuao apresentado um exemplo onde pode-se controlar o fluxo da gua mediante um FK de segunda e quarta ordem, o qual est sendo perturbado por um rudo no
Gaussiano.
Este sistema pode ser representado em funo da vazo volumtrica como apresenta a
seguinte equao:
q1 = h1h2
R1
q q1 = C1 dh1
dt
(5.1)
h2
R2
q2 =
q1 q2 = C2 dh2
dt
e suas respectivas transformadas de Laplace so representadas por:
Q1 = HAH2
R1
Q Q1 = SC1H1
(5.2)
Q2 = H2
R2
Q1 Q2 = SC2H2
Das equaes anteriores obtido:
= q h1 + h2
h1
C1 R1C1 R1C1
=
h2
h1
C2R2
1
1
+
R1C2 R2C2
(5.3)
h2
(5.4)
(5.5)
= h2 2h2
h2
(5.6)
h1
1 1
h1
1
=
+
u
h2
1 2
h2
0
!
h1
y= 1 0
h2
78
(5.7)
(5.8)
79
80
Figura 5.4: Sada do sistema controlado mediante o FK de segunda e quarta ordem com
rudo no processo
Para a figura 5.4 foi calculado o desvio padro do sinal de referncia com relao ao
FK de ordem dois e ordem quatro, o valor obtido um valor de 7.96 e 8, 146 respeitivamente,assim pode-se analisar que o comportamento dos filtros tanto de ordem dois como de
ordem quatro tem um comportamento bom, alem disso foi calculado o valor da varincia
com relao ao sinal de referncia obtendo um valor de 0.0064 e 0.0066 para cada filtro e
mostrado na figura 5.5.
81
5.0.2
Para calcular a varincia de um sistema de segunda ordem usada a funo de transferncia mostrada na equao 5.9:
G(s) =
s2
K
+ as + b
(5.9)
G(s) =
2
s2 + 2s + 2
1 ,
2
(5.10)
assim a funo de transferncia
s2 + 2bs + b
(5.11)
Onde sero encontradas as constantes K e b, para que o sistema consiga atingir uma
varincia desejada; para tal fim ser discretizado o sistema e representado como mostra a
equao 5.12, e como foi desenvolvido no anexo e representado na equao A.26:
G(z) =
z 2 fd
z 2 fg z +
h
f
kz 2
(z + a)(z + a
)
(5.12)
var[y(n)] =
f
(a a
)2
1 (a 2 a
2 )
(5.13)
Onde a e a
so os polos do sistema discreto, como conhecido o amortecimento do sistema assumido um polo que represente este amortecimento, e encontrado o polo faltante,
82
z2
0.03473
1.627z + 0.6617
(5.14)
s2
5.249
+ 4.588s + 5.249
(5.15)
Comparando a resposta do sistema discreto e continuo para uma entrada degrau, pode-se
observar que estes apresentam um ganho esttico unitrio como mostrado na figura 5.6
83
(a)
(b)
Figura 5.8: (a)Diagrama de blocos para os filtros (b) Degrau dos Sistemas.
84
Pode-se observar que este sistema de maneira discreta para uma entrada degrau apresenta
o mesmo ganho esttico, como esperado, depois foi usado como entrada um rudo branco
Gaussiano de varincia unitria e meda zero, e a resposta para esta entrada mostrada na
figura 5.9:
85
5.0.3
O controlador PID projetado foi sintonizado por diferentes mtodos entre estes mtodos
esto:
Ziegler-Nichols;
Cohen e Coon;
CHR.
A escolha do mtodo de sintonizao foi baseado na resposta que estes controladores
apresentam funo do ruido, a figura 5.11, mostra os diferentes controladores obtidos.
86
(5.16)
87
5.0.4
Controlador LQG.
5.0.5
0.0002
0.0007
L=
0.0012
0.0006
0.0005
(5.17)
h
i
Kkalman = 4.3800 33.7203 46.1124 50.1177 36.8886
(5.18)
Para obter o parmetro Q que o ruido no sistema, foi desenvolvido no software SIMULINK, o diagrma de blocos apresentado na figura 5.14, onde este mostra a funo de
transferncia do sistema e o FB obtido neste captulo, o qual apresenta uma varincia de
0.25, para obter o valor do Q varivel no tempo foi usado um rudo branco com media zero
e varincia unitaria, como ruido na medida, e como ruido no sistema, foi usado um ruido
com caracteristicas diferentes conformado pela multiplicao de um ruido branco com uma
funo sinoidal, o sinal sai do sistema e entra a um filtro digital de ordem cincuenta, este
filtro digital tem varincia 0.25 e limitada por um bloco de saturao para obter o valor
positivo, a ordem do sistema foi escolhida para conseguir minimizar no mximo o nvel do
ruido inserido no sistema.
89
A figura 5.15, apresenta a sada no sistema, esta figura apresenta grficos em trs cores
diferntes, a cor vermelha apresenta a sada do sistema do valor mdio da funo sinosoidal,
a cor verde representa a sada do sistema, e a cor azul esta apresentando a sada do filtro
digital, ste grfico representa a varincia do sistema, pode-se observar que esta prxima a
0.015.
5.0.6
Inicialmente foram projetados diferentes FK de ordem inferior, mas os sistemas maritimos normalmente so sistemas de ordem seis, pelo qual foi projetado um filtro desta ordem,
com a finalidade de ter um modelo pronto para ser testado com sistemas reais, a figura 5.16
est representado dois sistemas com FK diferentes, o primeiro um FK variante no tempo
e o segundo un FK invariante no tempo, para cada um desse filtros foram feitas diferentes
testes como sero apresentados acontinuao.
90
91
Figura 5.20: Comparao da sada com varincia para o sistema com ruido.
Finalmente foi comparada a sada do sistema do sistema sem rudo, comparada com a
varincia do sistema, como mostra a figura 5.21, pode-se observar na figura 5.20 e 5.21 que
o valor mdio da varincia est sendo prximo do valor mdio da sada do sistema.
93
Figura 5.21: Comparao da sada com varincia para o sistema sem ruido.
Depois de analisar a relao Q variante no tempo, foi inserido no sistema apresentado na
figura 5.16, este valor e foi comparado a resposta de um FK variante no tempo com um FK
invariante no tempo para um valor de Q varivel, os resultados obtidos so apresentado nas
figuras 5.22 3 5.23.
FK, pode-se observar que estes tem a mesma resposta, com isto pode-se concluir que o FK
projetado tanto variante como invariante apresenta o mesmo comportamento, isto muito
importante, pelo fato os sistemas reais o tempo varivel, consiguendo-se assim fazer uma
melhor simulao e analises de sistemas reais.
95
Figura 5.24: Comparao do diagrama de bode filtro Butterworth com = 1/ 2 e = 0.2 .
A figura 5.25, mostra a sada dos estados do FK usando um FB com valores de amortecimento diferntes, pode-se observar que estas sadas so iguais, e que o sistema apresenta
o mesmo comportamento. As figuras 5.26 e 5.27 representam o comportamento da sada
do comando que no controlador PID e no FK quando usado o novo FB para gerar um
novo FK,e realizar o novo teste, pode-se observar que estas figuras tem o mesmo formato e
96
Figura 5.26: Comparao da sada dos estados do FK com um filtro Butterworth = 0.2 .
Figura 5.27: Comparao da sada do controlador PID com FK com um filtro Butterworth
= 0.2.
Foi feita uma comparao do sistema obtido inicialmente para calcular a varincia em
relao ao ruido branco, comparando um sistema digital de ordem trs e um sistema digital
de ordem um, com relao ao FB encontrado com varincia desejada, a figura 5.28 mostra a comparao do rudo de entrada, para os trs sistemas foi encontradas varincias de
0.25 como foi desejado, para obter estes grficos foi implementado o sistema de blocos em
SIMULINK como mostra a figura 5.29.
97
Figura 5.28: comparao das sadas dos filtros com varincia 0.25
98
Figura 5.30: Comparao da sada do Q varivel para sistemas com filtros diferntes
A figura mostra quatro grficos, o grfico azul claro, representa o valor terico da varincia, o grafico da cor azul representa a sada do filtro digital de ordem 50, o grfico da
cor verde representa a sada do filtro digital de ordem unitaria e o grfico da cor vermelha
representa a sida do sistema sem o ruido na sada, pode-se observar que a nica mudana
nestes grficos relacionada ao filtro digital, dado que o filtro de ordem 50 consegue fazer
uma melohor filtragem do ruido em comparao ao filtro de ordem unitrio, por em os custos computacionais so bem maiores, a ideia implementar um filtro digital que consega
fazer uma filtragem boa, e que seja de ordem inferior para falicitar sua programao em um
sistema real.
99
100
REFERNCIAS BIBLIOGRFICAS
101
[11] Inverted Pendulum: Digital Controller Design,control tutorials for matlab & simulink,http://ctms.engin.umich.edu/CTMS/index.php?example=InvertedPendulum§ion
=ControlDigital.
[12] Probabilidade e variveis aleatrias.
Inc,Publication,
[20] A. Mansilla J, Gacia J, Control de velocidad de un motor dc, usando filtros de kalman
en tiempo continuo, 2002.
[21] S. Garrido, Identificacin, estimacin y control de sistemas no-lineales mediante rgo,
Ph.D. dissertation, Universidad Carlos III de Madrid, Departamento de ingeniera de
sistemas y automtica, 1999.
[22] Modern Control Engineering.
[23] J. Gomes, Controle robusto lqg/ltr com recuperao do ganho da malha de transferncia, Masters thesis, Universidade Federal do Maranho, Centro de Cincias Exatas e
Tecnologia, Programa de Ps-graduao em Engenharia de Eletricidade, 2006.
[24] J. M. D. Cano, Modelo y control lqr de una aeronave de cuatro rotores, 2007.
[25] S. Menndez, Aportacion al control del convertidor cc/ca de tres niveles, Ph.D. dissertation, universitat politectinca de catalunya,departamento de ingenieria electronica,
2004.
102
[26] J. M. D. Cano, Modelo y control lqr de una aeronave de cuatro rotores. Masters thesis, Universidad de Sevilla Escuela Superior de Ingenieros Departamento de Ingeniera
de Sistemas y Automtica., 2007.
[27] Modern Control Theory.
Brogan, 1991.
publisher, 1996.
[40] C. D. Silva, Pensamento estatstico e raciocnio sobre variao: um estudo com professores de matemticas. doutorado, Ph.D. dissertation, Pontifcia Universidade Cattilica,So Paulo, 2007.
[41] A. Zylberberg, Probabilidad y Estadistica.
103
[42] C. M. Bishop, Pattern Recognition and Machine Learning, Springer, Ed., 2006.
[43] K. V, P. L. J, D. JR2, G. S, C. M, and B. S, Controle automtico de umrov para
inspeo de estruturas submersas, 2011.
[44] G. N. J. A. J. S. P. C. Garcia D, Morales R, Efectos de la no linealidad del modelo
dinmico em el control de un robot subacutico, 2007.
[45] S. F. J. A. Barros, E. A., Desenvolvimento de um rob submarino de baixo custo,
Congresso Brasileiro de Automtica, pp. 2121212, 2002.
[46] M. N. Souza, E., An investigation of dynamic positioning strategies for unmanned
underwater vehicles, Congresso Brasileiro de Automtica, pp. 12731278., 2002.
[47] C. E. R. Moraes, Projeto e construo de um veculo subaqutico no tripulado de
baixo custo, Masters thesis, Fundao Universidade Federal de Rio Grande, 2005.
[48] M. L. R.-I. Centeno, Projeto e construo de um veculo subaqutico no tripulado de
baixo custo, Masters thesis, Fundao Universidade Federal de Rio Grande, 2007.
[49] P. H. V. Magalhes, Desenvolvimento de um submersvel remotamente operado de
baixo custo e caracterizao dos sistemas de propulso e vetorizao de empuxo por hlice. belo horizonte, Ph.D. dissertation, Universidade Federal de Minas Gerais., 2007.
[50] J. C. C. Luque, Controle robusto multivarivel para um veculo submersvel autnomo, Masters thesis, Escola Politcnica da Universidade de So Paul, 2007.
[51] L. L. P. Aguilar, Controle inteligente para a navegao de veculos submarinos semiautnomos, Masters thesis, Escola Politcnica da Universidade de So Paul, 2007.
[52] P. H. Buscariollo, Sistema de posicionamento dinmico baseado em viso computacional e laser, Ph.D. dissertation, Escola Politcnica da Universidade de So Paulo.,
2008.
[53] J. J. d. B. Dantas, J. L. D.; Cruz, Controle longitudinal do veculo autnomo submarino pirajuba, utilizando tcnicas de controle robusto lqg/ltr, Congresso Brasileiro de
Automtica, XVIII, 2010.
[54] S. e. a. Gomes, Controle de um veculo subaqutico baseado em estrutura varivel,
Seminrio e Workshop em Engenharia Ocenica, IV, 2010.
[55] E. C. SOUZA, Modelagem e controle de veculos submarinos no tripulados. Masters thesis, Escola Politcnica da Universidade de So Paulo, 2003.
[56] M. Parra., Modelagem matemtica e controle de um quadrimotor, Masters thesis, UNIVERSIDADE DE BRASLIA, FACULDADE DE TECNOLOGIA,DEPARTAMENTO DE ENGENHARIA MECNICA, 2012.
104
[57] Garcia, Morales, and azorin, Efectos de la no linealidad del modelo dinmico en el
control de un robot subacutico, Universidad Miguel Hernndez, Alicante Espaa,
2010.
[58] SNAME, Nomenclature for treating the motion of a submerged body through a fluid,
Technical and Research Bulletin, 1950.
[59] F. O., Sea loads on ships and offshore structures, Cambridge University,Cambridge
Ocean Technology Series, 1993.
[60] Marine Hydrodynamics.
[61] K. E. Kleczka, W. and F. Pinto, Analytic-numeric study of a submerged double pendulum, In M.P. Paido ussis and M.K. Au-Yang, eds., Internetional Symposium on FlowInduced Vibration and Noise. Anaheim, USA., 1992.
105
APNDICES
106
A. EXPRESSES MATEMTICAS DA
CINEMTICA EDINMICA DE UM VECULO
MARTIMO
Este anexo tem como objetivo fornecer mais detalhes das expresses que descrevem o
modelo geral de um veculo martimo. Como ponto de partida, descreve-se o desenvolvimento das matrizes de transformao que relacionam os sistemas de coordenadas utilizados
na modelagem. Em seguida, demonstra-se como obter a forma matricial que representa o
comportamento dinmico do sistema. Finalmente, apresenta-se as matrizes que representam
os esforos hidrodinmicos do sistema. No objetivo deste anexo realizar o desenvolvimento completo do modelo, mas fornecer um apoio ao leitor de forma que ele possa melhorar sua compreenso global das equaes que representam o modelo. Para maiores detalhes,
recomenda-se a leitura da tese de mestrado Modelagem e Controle de Veculos Submarinos
No Tripulados de Eric Conrado de Souza [55], juntamente com o livro Guidance and
Control of Ocean Vehicles de Fossen [15]
A.1
CINEMTICA
Na cinemtica J1 (2 ) obtido atravs das trs rotaes fundamentais do sistema com relao aos eixos, estas rotaes normalmente so representada de forma matricial e descrevem
os ngulos de Euler [15],como apresenta as equaes A.1,A.2 e A.3:
Cx,
1
0
0
= 0 cos () sen ()
0 sen () sen ()
Cy,
cos () 0 sen ()
= 0
1
0
sen () 0 cos ()
(A.1)
(A.2)
Cz,
cos () sen () 0
= sen () cos () 0
0
0
1
(A.3)
A notao Ci, denota o nguo de rotao em relao ao eixo i. Alem disso, ibserva-se
1
T
que todas as matrizes apresentam a propriedade de serem ortogonais, ou seja Ci,
= Ci,
.
107
Das equaes anteriores citar elas obtida a sequencia de rotao da matriz de transformao
J1 (2 ), como representa a equao A.4:
T
T
T
J1 (2 ) = Cz,
Cy,
Cx,
(A.4)
A equao A.2 foi expandida por mdio das multiplicao matricial e finalmente obter a
equao A.4 apresentada no capitulo 4. De acordo com Fossen [15], a matriz de transformao J2 (2 obtida inspecionando a expresso da orientao do Sistema B com respeito ao
Sistema E, como pode ser vista na equao A.5.
v2 = Cz,
0
0
= 0 + Cx, + Cx, Cy, 0
0
0
(A.5)
1 sen()tan() cos()tan()
1
0
sen()
A.2
(A.7)
DINMICA
Todas as equaes matemticas que representam o comportamento dinmico de um veculo martimo como foi apresentado no capitulo 4 pelas equaes 4.7 e 4.8, esto sob as
seguintes hipteses:
A massa est distribuda uniformemente.
A massa constante e a posio do centro de massa considerado invariante.
A origem do Sistema B no coincide com o centro de gravidade do veculo, para o caso
mais geral. [55]
108
m [u vr + wq xG (q 2 + r2 ) + yG (pq r)
+ zG (pr q)]
=X
m [v wp + ur yG (r2 + p2 ) + xG (qr p)
+ xG (qp r)]
=Y
m [w uq + vp z (p2 + q 2 ) + z (rp q)
+ yG (rq p)]
=Z
G
G
m
0
0
0
mzg myg
m
0
mzg
0
mxg
0
0
0
m
myg mxg
0
0
mz
my
I
I
I
g
g
x
xy
xz
mzg
0
mxg Iyx
Iy
Iyz
myg mxg
0
Izx Izy
Iz
MRB
(A.9)
A2 = Iyz q + Ixz p Iz r
0
Ixz r + Ixy p Ix p
Iyz r + Ixy p Iy q Ixz r + Ixy q Ix p
0
A.3
(A.11)
(A.12)
ESFOROS HIDRODINMICOS
Como foi descrito na equao 4.11, os esforos hidrodinmicos podem ser expressados
atravs de um conjunto de matrizes. Os esforos devido massa adicional so expressos
109
Xu Xv Xw Xp Xq Xr
Yu Yv Yw Yp Yq Yr
Zu Zv Zw Zp Zq Zr
MA =
(A.13)
K
K
K
K
K
K
v
w
p
q
r
u
Mu Mv Mw Mp Mq Mr
Nu Nv Nw Np Nq Nr
0
0
0
0
a3
a2
0
0
a3
0 a1
0
0
0
a
a
0
2
1
CA =
(A.14)
0 a
a2
0 b3 b2
3
a3
0 a1 b3
0 b1
a2 a1
0 b2 b1
0
onde:
a1 = Xu u + Xv v + Xw w + Xp p + Xq q + Xr r
a2 = Yu u + Yv v + Yw w + Yp p + Yq q + Yr r
a = Z u + Z v + Z w + Z p + Z q + Z r
3
u
v
w
p
q
r
b1 = Ku u + Kv v + Kw w + Kp p + Kq q + Kr r
b2 = Mu u + Mv v + Mw w + Mp p + Mq q + Mr r
b = N u + N v + N w + N p + N q + N r
3
u
v
w
p
q
r
(A.15)
Xu Xv Xw Xp Xq X r
Yu Yv Yw Yp Yq Yr
Zu Zv Zw Zp Zq Zr
D=
(A.17)
K K K
K
K
K
u
v
w
p
q
r
Mu Mv Mw Mp Mq Mr
Nu Nv Nw Np Nq Nr
YA = Yu u,
Yu =
resulta no aparecimento de termos no-lineares. Nesse trabalho, ignorou-se a influncia desses termos no desenvolvimento do modelo. porque os esforos devido as foras restauradoras
so modelados atravs da matriz g [55]:
(W B)sen()
(W B)cos()sen()
(W
B)cos()cos()
g =
(y W y B)cos()cos() + (z W z B)cos()sen()
g
b
g
b
(A.18)
Onde o empuxo hidrosttico e o peso so dados respectivamente pelas equaes A.19 e A.20:
W = MG
(A.19)
B = a g5
(A.20)
Nas equaes acima, o smbolo 5 representa o volume de fluido deslocado pelo corpo,
g a acelerao da gravidade, ea a densidade
A.4
z2
k
k
2
+ 2n z + n
(z + a)(z + a
)
(A.21)
Onde a relao de s e z esta relacionada com a equao seguinte, a qual mostra como
pode ser discretizado um sistema.
z1
s=
(A.22)
zT
G(z) =
z2d
f z 2 gz + h
(A.23)
G(s) =
s2
k
+ as + b
(A.24)
k
z1 2
zT
+a
z1
zT
=
+b
z 2 (kT 2 )
z 2 (bT 2 + aT + 1) (2 + aT )z + 1
(A.25)
Onde:
d = kT 2
f = bT 2 + aT + 1
g = 2 + aT
h=1
T = 0.1
K=1
b=1
a= 2
assim o sistema pode ser escrito como apresenta a equao A.26
G(z) =
z 2 fd
z 2 fg z +
h
f
kz 2
(z + a)(z + a
)
(A.26)
Seguindo o procedimento apresentado por Miguel, esta equao discretizada pode ser
representada mediante somatrias como apresenta a equao A.27 e A.28:
y(n) =
i
d XX a
j a (ij) X(n i)
f i=0 j=0
X(n)
(A.27)
i
d XX a
( )j a i X(n i)
f i=0 j=0 a
(A.28)
y(n) =
(l)j =
(1 l)i+1
1l
112
(A.29)
i
X
(l)j =
j=0
1
1l
(A.30)
Aplicando estas propriedades e manipulando matemticamente a equao A.28, a somatria pode ser representada pela equao A.31:
y(n) =
i
dX j
bi
(l) =
f j=0
a a
(A.31)
Onde:
bi = a (i+1) a
(i+1)
(A.32)
Que relaciona os polos do sistemas,ento o sistema fica representado pela equao A.33:
#
"X
1
d
y(n) =
bi X(n i)
(A.33)
a a
f i=0
Assim a equao anterior apresenta o sistema em funo dos estados futuros em base dos
estados atuais,de maneira que o calculo da varincia representada pela equao A.34
"
var[y(n)] = var
1
a a
"
##
d X i
b X(n i)
f i=0
(A.34)
Como a equao A.34 apresenta propriedades de Markov, pelo fato que os instantes
futuros so independetes dos estados passados, a varincia pode ser calculada de maneira
independente para cada um destes estados e representada como apresenta a equao A.35:
var[y(n)] =
2 2
1
d
2
f
a a
!2
bi
(A.35)
i=0
como:
b0 = a a
b1 = a (2) a
(2)
b2 = a (3) a
(3)
usando a propriedade A.29 e A.30.
X
i=0
bi =
1
1 (a 2 a
2 )
(A.36)
2
2
d
1
1
2
var[y(n)] =
f
(a a)2
1 (a 2 a
2 )
(A.37)
Onde esta equao programada em MATLAB para obter o valor da varincia de entrada
ao filtro Butterworth.
114