Você está na página 1de 131

CONTROLE DE SISTEMAS ADAPTATIVOS

MEDIANTE A UTILIZAO DO
FILTRO DE KALMAN VARIANTE NO TEMPO

MIGUEL ENRIQUE PARRA MUOZ

TESES DE DOUTORADO EM SISTEMAS MECATRNICOS


DEPARTAMENTO DE ENGENHARIA MECNICA

FACULDADE DE TECNOLOGIA

UNIVERSIDADE DE BRASLIA

UNIVERSIDADE DE BRASLIA
FACULDADE DE TECNOLOGIA
DEPARTAMENTO DE ENGENHARIA MECNICA
CONTROLE DE SISTEMAS ADAPTATIVOS
MEDIANTE A UTILIZAO DO
FILTRO DE KALMAN VARIANTE NO TEMPO

MIGUEL ENRIQUE PARRA MUOZ

DISSERTAO DE MESTRADO ACADMICO SUBMETIDA AO DEPARTAMENTO


DE ENGENHARIA MECNICA DA FACULDADE DE TECNOLOGIA DA UNIVERSIDADE DE BRASLIA COMO PARTE DOS REQUISITOS NECESSRIOS
PARA A OBTENO DO GRAU DE MESTRE EM SISTEMAS MECATRNICOS.

APROVADA POR:

Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB


(Orientador)

Prof. Dr. nome professor, X/X


Co-Orientador

Prof. ************, CIC/UnB


Membro Externo

Prof. ********************, Ph.D., ENM/UnB


Membro Externo

Prof. ****************, DSc., ENE/UnB


Membro Interno

BRASLIA, 12 DE 11 DE 2014.

FICHA CATALOGRFICA
PARRA MUOZ,MIGUEL ENRIQUE
CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAO DO FILTRO
DE KALMAN VARIANTE NO TEMPO [Distrito Federal] 2014.
xvi, Xp., 210 x 297 mm (ENM/FT/UnB, Mestre, Sistemas Mecatrnicos, 2014).
Tese de Mestrado Universidade de Braslia, Faculdade de Tecnologia.
Departamento de Engenharia Mecnica
1. Modelagem e controle
2. Filtro de Kalman
3. Controle de sistemas
4. Controle de varincia
I. ENM/FT/UnB
II. Ttulo (srie)
REFERNCIA BIBLIOGRFICA
PARRA, M. E. (2014). CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A
UTILIZAO DO FILTRO DE KALMAN VARIANTE NO TEMPO , Dissertao de
Mestrado em Sistemas Mecatrnicos, Publicao PPGENE.TD-X/X, Departamento de
Engenharia Mecnica, Universidade de Braslia, Braslia, DF, Xp.
CESSO DE DIREITOS
AUTOR: Miguel Enrique Parra Muoz
TTULO: CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAO
DO FILTRO DE KALMAN VARIANTE NO TEMPO .
GRAU: Mestre
ANO: 2014
concedida Universidade de Braslia permisso para reproduzir cpias desta dissertao
de mestrado e para emprestar ou vender tais cpias somente para propsitos acadmicos e
cientficos. O autor reserva outros direitos de publicao e nenhuma parte dessa dissertao
de mestrado pode ser reproduzida sem autorizao por escrito do autor.

Miguel Enrique Parra Muoz


Departamento de Eng. Mecnica (ENM) - FT
Universidade de Braslia (UnB)
Campus Darcy Ribeiro
CEP 70919-970 - Braslia - DF - Brasil

AGRADECIMENTOS

***

RESUMO
CONTROLE DE SISTEMAS ADAPTATIVOS MEDIANTE A UTILIZAO DO FILTRO DE KALMAN VARIANTE NO TEMPO
Autor: Miguel Enrique Parra Muoz
Orientador: Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB
Programa de Ps-graduao em Sistemas Mecatrnicos
Braslia, 11 de 2014
Este documento apresenta o trabalho desenvolvido nos ltimos dois anos, para permitir
desenvolver a pesquisa na realizagco do doutorado, o capitulo um, mostra os objetivos,
definigco do problema e introdugco, o capitulo dois mostra algumas tlcnicas de
controle que serco usados no desenvolvimento do problema, enfatizando-se diretamente
no filtro de Kalman e as diferentes configuragtes variante e invariante no tempo que
serco analisadas, dado que sera desenvolvido um controle que tera uma parte estocas
tica modificando diretamente a varicncia do sistema, razco pela qual no capitulo trs
l mostrado um suporte estocastico

onde se mostram diferentes aspectos dos processos


estocasticos

e l analisada a varicncia que sera fundamental no desenvolvimento do


trabalho. O capitulo quatro inicia com a busca na literatura de trabalhos relacionados de
controle de sistemas subaquatico

onde sco mostrados trabalhos que apresentam diferentes tlcnicas de controle para estes sistemas feitos por outros autores no Brasil, allm disso
o capitulo quatro, mostra uma descrigco matematica

de um sistema submarino ROV,


este sistema sera analisado detalhadamente na prsxima etapa da pesquisa, neste n vel a
parte fundamente l se enfocar em conhecer e desenvolver tlcnicas de controle estocas
tico adaptativo com filtro de Kalman, que possa ser atualizado no tempo, e que permitira
ser aplicado em diferentes sistemas na realizagco de teste, esta parte l fundamental
e l mostrada no capitulo 5 na parte dos resultados obtidos, aqui l detalhado a analises
de um sistema de tanques, para o qual foi criado diferentes controladores baseados em uma
varicncia desejada finalizando com uma analises do filtro de Kalman variante e invariante
no tempo.

ABSTRACT
CONTROL SYSTEMS BY ADAPTIVE KALMAN FILTER VARIABLE IN TIME
Author: Miguel Enrique Parra Muoz
Supervisor: Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB
Programa de Ps-graduao em Sistemas Mecatrnicos
Este documento apresenta o trabalho desenvolvido nos ltimos dois anos, para permitir
desenvolver a pesquisa na realizagco do doutorado, o capitulo um, mostra os objetivos,
definigco do problema e introdugco, o capitulo dois mostra algumas tlcnicas de
controle que serco usados no desenvolvimento do problema, enfatizando-se diretamente
no filtro de Kalman e as diferentes configuragtes variante e invariante no tempo que
serco analisadas, dado que sera desenvolvido um controle que tera uma parte estocas
tica modificando diretamente a varicncia do sistema, razco pela qual no capitulo trs
l mostrado um suporte estocastico

onde se mostram diferentes aspectos dos processos


estocasticos

e l analisada a varicncia que sera fundamental no desenvolvimento do


trabalho. O capitulo quatro inicia com a busca na literatura de trabalhos relacionados de
controle de sistemas subaquatico

onde sco mostrados trabalhos que apresentam diferentes tlcnicas de controle para estes sistemas feitos por outros autores no Brasil, allm disso
o capitulo quatro, mostra uma descrigco matematica

de um sistema submarino ROV,


este sistema sera analisado detalhadamente na prsxima etapa da pesquisa, neste n vel a
parte fundamente l se enfocar em conhecer e desenvolver tlcnicas de controle estocas
tico adaptativo com filtro de Kalman, que possa ser atualizado no tempo, e que permitira
ser aplicado em diferentes sistemas na realizagco de teste, esta parte l fundamental
e l mostrada no capitulo 5 na parte dos resultados obtidos, aqui l detalhado a analises
de um sistema de tanques, para o qual foi criado diferentes controladores baseados em uma
varicncia desejada finalizando com uma analises do filtro de Kalman variante e invariante
no tempo.

SUMRIO

INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.0.1 O BJETIVO GERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.0.2 O BJETIVOS ESPECFICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1
1
1

CONCEITOS DE CONTROLE TIMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


2.1 CONTROLABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 OBSERVABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 S ISTEMAS DE CONTROLE TIMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 S ISTEMAS DE CONTROLE MULTIVARIVEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 S ISTEMAS SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.2 S ISTEMAS MIMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 E SPAO DE ESTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 D ESCRIO INTERNA DE SISTEMAS LINEARES CONTNUOS AMOS TRADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.2 M ODELO EM E SPAO DE E STADOS PARA SISTEMAS MIMO . . . . . . . . . . .
2.5.3 D IAGRAMA DE BLOCOS DE UM SISTEMA MIMO . . . . . . . . . . . . . . . . . . . . . . . .
2.6 METODOLOGIA DE CONTROLE LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.1 P ROBLEMAS DO CONTROLE LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.2 S OLUO DO CONTROLE LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.3 E LEIO DAS MATRIZES Q E R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.4 E XEMPLO DA PROJEO DO CONTROLE LQR . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.5 M ODELAGEM MATEMTICA DO PNDULO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.6 F UNO DE TRANSFERNCIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.7 M ODELO EM ESPAO DE ESTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.8 R EGULADOR LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.9 P ROJEO DO CONTROLADOR EM ESPAO DE ESTADOS . . . . . . . . . . . . . . .
2.6.10P ROJEO DO OBSERVADOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.11LQR COM AO INTEGRAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.12ROBUSTEZ DO CONTROLE LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7 FILTRO DE KALMAN FK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7.1 A LGORITMO DISCRETO DO FILTRO DE K ALMAN . . . . . . . . . . . . . . . . . . . . . . . .
2.7.2 A LGORITMO DO FILTRO DE K ALMAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7.3 C ARACTERSTICAS DO FILTRO DE K ALMAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7.4 F ILTRO DE K ALMAN C ONTINUA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7.5 E XEMPLO FILTRO DE K ALMAN CONTINUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7.6 F ILTRO DE K ALMAN DISCRETRO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3
3
3
4
5
5
6
7
7
8
9
10
11
11
12
12
13
14
15
19
20
22
24
25
26
27
28
28
28
30
31

2.7.7 F ILTRO DE KALMAN ( PREDIO ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


2.7.8 E XEMPLO FILTRO DE K ALMAN DISCRETO : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7.9 E XEMPLO 2 FILTRO DE K ALMAN DISCRETO : . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8 FILTRO DE KALMAN VARIVEL NO TEMPO FKVT . . . . . . . . . . . . . . . . . . . .
2.9 CONTROLE LQG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.9.1 P ROPRIEDADES DO LQG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.9.2 E XEMPLO DO CONTROLE LQG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.9.3 C ONTROLE ATRAVS DE ALOCAO DE PLOS . . . . . . . . . . . . . . . . . . . . . . . . . .
2.9.4 E XEMPLO 2 DO CONTROLE LQG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.10CONTROLADOR PID. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33
35
37
38
40
42
43
44
48
48

VARIVEIS ALETRIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 M DIA ARITMTICA , VARINCIA E DESVIO PADRO . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 M DIA A RITMTICA .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 VARINCIA .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.3 D ESVIO PADRO .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 F UNDAMENTOS BSICOS DOS PROCESSOS ESTOCSTICOS . . . . . . . . . . . . . . . . . . . .
3.3 VARIVEL ALEATRIA DISCRETA E FUNO DE PROBABILIDADE . . . . . . . . . . . .
3.3.1 VARIVEL A LEATRIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2 F UNO D ENSIDADE P ROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3 P ROBABILIDADE CONDICIONAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.4 P ROBABILIDADE TOTAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.5 F UNO DE DISTRIBUIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 F UNO DISTRIBUIO DE PROBABILIDADE N ORMAL . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 R EGRA DE BAYES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 AUTOCORRELAO : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.1 P ROPRIEDADES DA FUNO DE AUTOCORRELAO . . . . . . . . . . . . . . . . . . . .
3.6 RUDO BRANCO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 I NTRODUO AOS PROCESSOS DE M ARKOV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7.1 C LASSIFICAO DOS ESTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51
51
51
52
53
53
54
54
54
54
54
55
56
57
57
58
59
60
62

DESCRIO DO SISTEMA SUBAQUTICO (ROV) . . . . . . . . . . . . . . . . . . . .


4.1 M ODELO DINMICO DO VECULO ROBTICO SUBMARINO . . . . . . . . . . . . . . . . . . . .
4.2 C INEMTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 D INMICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 P ERTURBAES E XTERNAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5 E FEITOS HIDRODINMICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6 E SFOROS A MBIENTAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7 F ORAS E M OMENTOS DE P ROPULSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.8 M ODELO DO NAVIO DE S UPERFCIE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

64
65
69
70
72
72
73
73
74

RESULTADOS OBTIDOS COM AS DIFERENTES TCNICAS DE CONTROLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77


5.0.1 FILTRO DE K ALMAN DISCRETO COMO CONTROLADOR .. . . . . . . . . . . . . . . . . 77
5.0.2 C LCULO DA VARINCIA PARA UM SISTEMA DE SEGUNDA ORDEM . . 82
5.0.3 O BTENO DO C ONTROLADOR PID. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.0.4 C ONTROLADOR LQG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.0.5 O BTENO DO PARMETRO Q VARIANTE NO TEMPO . . . . . . . . . . . . . . . . . . . 89
5.0.6 A NALISES DO FILTRO DE K ALAM DE ORDEM SEIS . . . . . . . . . . . . . . . . . . . . . . 90

CONCLUSES E TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

REFERNCIAS BIBLIOGRFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .101


ANEXOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
A EXPRESSES MATEMTICAS DA CINEMTICA EDINMICA DE
UM VECULO MARTIMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
A.1 C INEMTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
A.2 D INMICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
A.3 E SFOROS H IDRODINMICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
A.4 C ALCULO DA VARINCIA DE UM SISTEMA DISCRETO . . . . . . . . . . . . . . . . . . . . . . . . . . 111

LISTA DE FIGURAS

2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20
2.21
2.22
2.23
2.24
2.25
2.26
2.27
2.28
2.29

Sistema SISO. [1]...............................................................................


Sistema MIMO. [1]. ...........................................................................
Diagrama de blocos de um sistema em varivel de estados [2]. ....................
Diagrama de blocos do sistema nominal [3]. ............................................
Diagrama do pndulo invertido. [4]........................................................
Diagrama do corpo livre do sistema [4] ..................................................
Sada do sistema em malha aberta. ........................................................
Sada do sistema em funo do espao de estados para o carro e o pndulo. [4]
Regulador LQR [?] ............................................................................
Sada do sistema para o caso mais simples R=1. ......................................
Modificao da entra de referncia [5] ....................................................
Regulador LQR [5] ............................................................................
Projeo do observador [6]...................................................................
Sada do sistema para o controle LQR modificando a entrada. .....................
Projeto LQR com efeito integral. [7] ......................................................
Lei de controle, Ganho proporcional e integral. .......................................
Diagrama de Blocos do sistema com rudo de estado e medida [8] ................
Estados de um filtro de Kalman.............................................................
Filtro de Kalman com Predio .............................................................
Passos para obter o Filtro de Kalman com Predio ...................................
Comparao de dados com o filtro de kalman...........................................
Resposta obtida usando o filtro de kalman ...............................................
Controle LQG [8] ..............................................................................
Controle LQR discreto [11] ..................................................................
Sada do sistema para R=1, caso mais simples [11] ...................................
Sada do sistema com a matriz Q modificada [11] .....................................
Esquema com a entrada de referencia modificada [11] ...............................
Sada do controle LQR. [11] ................................................................
(a) Sistema geral (b) Sistema interno (c) Representao da planta do sistema
(d) Modelo do filtro de Kalman. ............................................................
2.30 Sada do sistema com controle LQG e filtro de Kalman [11]........................
2.31 (a) Diagrama de blocos do contole LQG de ordem dois (b) Sada do controlador LQG de ordem dois. (c) Diagrama de blocos do contole LQG de
ordem quatro (d) Sada do controlador LQG de ordem quatro. .....................
3.1

5
6
7
9
13
14
16
18
19
21
21
22
23
23
24
25
29
32
33
35
38
39
42
44
44
45
45
46
47
48

49

Densidade normal N (, 2 ) [12] ........................................................... 56

3.2
3.3

Ilustrao de funo de autocorrelao de processos aleatrios com flutuao


mas lenta e mais rpida [13] ................................................................. 59
Caractersticas do rudo branco (A) Densidade espectral de potncia. (B)
Funo de autocorrelao [13] .............................................................. 60

4.1
4.2
4.3

veculo submarino co sistemas de coordenadas inercial e de corpo rigido. [14]. 67


Sistemas de coordenadas de referncia. Retirado de [15] ........................... 68
Foras restauradoras do sistema B [16] ................................................... 73

5.1
5.2
5.3
5.4

Sistema de tanques em serie .................................................................


Modelo do sistema de tanques a ser controlado.........................................
Sada do sistema controlado mediante o FK de segunda e quarta ordem .........
Sada do sistema controlado mediante o FK de segunda e quarta ordem com
rudo no processo ...............................................................................
Comparao dos ruidos dos FK de ordem dois e quatro ..............................
Comparao do sistema continuo e discreto. ...........................................
Varincia do sistema. .........................................................................
(a)Diagrama de blocos para os filtros (b) Degrau dos Sistemas. ....................
Comparao dos ruidos com relao aos filtros. .......................................
Comparao dos diagrmas de Bode dos sistemas. ...................................
Comparao dos diferentes controladores. ..............................................
Resposta do controlador PID. ...............................................................
Resposta do controlador LQG. .............................................................
Diagrama de blocos para obter a covarincia. ..........................................
Covarincia Q variavel no tempo. .........................................................
Sistema variante e invariante no tempo. ..................................................
Comparao da sada do sistema sem ruido relao 6x. .............................
Comparao da sada do comando relao 15x. .......................................
Comparao da sada do sistema com ruido e sem ruido. ...........................
Comparao da sada com varincia para o sistema com ruido. ...................
Comparao da sada com varincia para o sistema sem ruido. ....................
Comparao dos estados do FK variante e invariante no tempo. ..................
Comparao da sada do controlador PID com FK variante e invariante no
tempo. ............................................................................................

Comparao do diagrama de bode filtro Butterworth com = 1/ 2 e =


0.2 . ...............................................................................................
Comparao da sada dos estados do FK com um filtro Butterworth =

1/ 2 e = 0.2 . ...............................................................................
Comparao da sada dos estados do FK com um filtro Butterworth = 0.2 .
Comparao da sada do controlador PID com FK com um filtro Butterworth
= 0.2. ..........................................................................................

5.5
5.6
5.7
5.8
5.9
5.10
5.11
5.12
5.13
5.14
5.15
5.16
5.17
5.18
5.19
5.20
5.21
5.22
5.23
5.24
5.25
5.26
5.27

77
79
80
81
81
83
84
84
85
86
87
88
88
89
90
91
92
92
93
93
94
94
95
96
96
97
97

5.28 comparao das sadas dos filtros com varincia 0.25 ................................ 98
5.29 diagrama de blocos dos filtros .............................................................. 98
5.30 Comparao da sada do Q varivel para sistemas com filtros diferntes ........ 99

LISTA DE TABELAS

4.1

sistema de referncia. Retirado de [17] .................................................. 68

LISTA DE SMBOLOS

P (A)
fk (n)
Nk (n)
Xk
Wk
Vk
Q
R
E(xk )
Yt
N (0, )
K
e
e+
Nef f
ik1
Vi
dHoHi
wi
HO:k
HM P :k
Hwi .X
Nf
A(GT, ST )
SP E
SP D
M IM O
SISO
LQR
EAR
FK
LQG
FB
F KV T
RGB
HSV
LBP
MB-ELBP
EBIM
Ars
SIR
MB
FPAD

Probabilidade do evento A
Frequncia relativa do evento k
Nmero de ocorrncias do evento K
Vetor de estados do sistema no instante k
Rudo de processo no instante de tempo k
Rudo de medio no instante de tempo k
Matriz de covarincia do rudo de processo
Matriz de covarincia do rudo de medio
Valor Esperado do vetor de estados x no instante de tempo k
Vetor de medies no instante de tempo t
Distribuio normal com media 0 e desvio padro
Ganho de Kalman
Erro a priori
Erro a posteriori
Tamanho efetivo de amostragem
Componente inercial no instante k 1
Matriz de variao de estados
Distncia Bathacharyya entre os histogramas Ho e Hi
Peso da partcula i-sima
Histograma do objeto no instante k
Histograma da melhor partcula no instante k
Histograma da melhor partcula no instante k
Nmero de frames onde o alvo est presente
Relao entra a sobreposio da rea do ground truth e a rea de sada
sistema
Semiplano esquerdo
Semiplano direito
Sistema multiplas entradas multiplas sadas
Sistema unica entrada unica sada
Regulador Linear Quadrtico
Equao Algbrica de Riccati
Filtro de Kalman
Regulador Quadrtico Gaussiano
Filtro Butterworth
Filtro de Kalaman Varivel no tempo
Red Blue Green
Hue Saturation Value
Local Binary Patterns
Block Multiescale Enchanced Local Binary Patterns
Enchanced Biologically Inspired Model
Attentional regions
Sampling Importance Resampling
Medida Bathacharyya
Filtro de Partculas com Amostragem Dupla

1 INTRODUO

Nas dcadas dos anos 60 e 70, com o surgimento dos computadores digitais que foram
as ferramentas para trabalhar para o desenvolvimento do controle em tempo real, e com a
introduo da modelagem atravs da formulao mediante as equaes de estados, surgiram tcnicas de controles timos, utilizando os critrios quadrticos LQR (Linear Quadratic
Regulator) e LQG (Linear Quadratic Gaussian) [18]. A tcnica que utiliza a estrutura do
regulador linear quadrtico (LQR), til quando os estados esto disponveis para realimentao, a qual possui excelentes margens de ganho e de fase, mas nada pode ser concludo
a respeito de sua robustez paramtrica [18]. A estrutura LQG, por outro lado, no tem o
vetor de estados completo para a realimentao, ento este vetor obtido mediante aplicaes de observao aplicando o Filtro de Kalman (FK), sendo por esta razo muito sensvel
a variaes paramtricas na planta [18].
A razo fundamental pela que surgem o controle robusto e adaptativo, porque normalmente quando se tem um sistema em malha fechada ele resulta insensvel a pequenas imprecises do modelo do sistema, como s variaes pequenas da planta, o que pode ser
ocasionado porque muitos sistemas apresentam no linearidades e normalmente tornam os
sistemas vulnerveis a todo tipo de perturbaes, capazes de conduzi-los instabilidade a
perca do desempenho. As snteses de controle robusto surgem exatamente para preencher
esta lacuna dentro da teoria de controle timo. [18].
O desenvolvimento de tcnicas de controle, fundamental para representar modelos fsicos reais, permitindo assim desenvolver controladores e testar-los mediante simulao de
maneira real, diminuindo a probabilidade de erros nos testes, evitando o uso desnecessrio
de recursos que possam ser onerosos.

1.0.1

Objetivo geral

Desenvolver estratgias de controle adaptativos no tempo que possa associar diferentes


tcnicas de controle, relacionando o Filtro de Kalman e sistemas estocsticos de maneira
que seja possvel representar o mais aproximado possvel a um sistema real, e que permita
gerar diferentes controladores que possam ser adaptados no tempo e que permita controlar
sistemas reais.

1.0.2

Objetivos especficos

Resolver estratgias de controle do Filtro de Kalman adaptativo no tempo associando a


um controle PID;

Desenvolver teoria de controle associada ao filtro de Kalman adaptativo;


Controlar sistemas que apresentem rudos que tenham comportamento Gaussianos e rudos com mdia diferente de zero e varincia diferente ao valor unitrio, de maneira que
possa ser projetados controladores baseados na varincia desejada dos sistemas, envolvendo diferentes filtros e controladores como PID, LQG e Filtro Butterworth.

2 CONCEITOS DE CONTROLE TIMO

Este captulo vai mostrar alguns conceitos fundamentais que sero usados no desenvolvimento do projeto. O captulo inicia mostrando a definio de controlabilidade e observabilidade de sistemas contnuos e discretos, e continua mostrando de maneira bsica os diferentes
controladores timos como, controle LQR e LQG, e mostra uma comparao do Filtro de
Kalman variante e invariante no tempo para sistemas simples.

2.1

CONTROLABILIDADE

Um sistema linear, contnuo no tempo, dito controlvel, se para qualquer estado inicial
x(0) e tempo final t > 0, existe um controle que transfere o estado para qualquer valor desejado no tempo t. Um sistema linear, discreto no tempo, dito controlvel se para qualquer
estado inicial x0 e tempo final k, existe um controle que transfere o estado para qualquer
valor desejado no tempo k. A diferena nas definies para o tempo contnuo e o discreto,
que no contnuo a transferncia para qualquer tempo final e no discreto para algum tempo
final [19].
Outra maneira de verificar a controlabilidade de um sistema, estudando o rango da
matriz de controlabilidade M . Se o rango da matriz igual ordem do sistema, o sistema
controlvel de estado completo. Usando MATLAB pode ser verificada a controlabilidade da
seguinte maneira [20]:
M = (BAB...An1 B)

(2.1)

M = ctrb(A; B)

(2.2)

rank(M )

(2.3)

Em matlab se tem:

2.2

OBSERVABILIDADE

Um sistema contnuo no tempo dito observvel se para qualquer estado inicial x(0) e
tempo final t > 0 o estado inicial x(0) puder ser unicamente determinado pelo conhecimento
de entradas u( ) e sadas y( ) para todo [0, t]. J um sistema linear, discreto no tempo,
dito observvel se para qualquer estado inicial x(0) e tempo final k o estado inicial x(0)
puder ser unicamente determinado pelo conhecimento de entradas ui e sadas y i para todo
3

i[0, k]. Novamente, a diferena nas definies para o tempo contnuo e o discreto, que no
contnuo a transferncia para qualquer tempo final e no discreto para algum tempo final.
Se o sistema observvel, o estado inicial pode ser determinado e todos os estados entre o
inicial e o final tambm podem ser determinados [19].
Outra maneira de verificar a observabilidade de um sistema, estudando o rango da
matriz de observabilidade N . Se o rango da matriz igual ordem do sistema, o sistema
observvel de estado completo. Usando MATLAB, pode ser verificada a observabilidade da
seguinte maneira [20]:
N = [C T AT C T ...(AT )n1 C T ]

(2.4)

N = obsv(A; C)

(2.5)

Rank(N )

(2.6)

Em matlab se tem:

2.3

SISTEMAS DE CONTROLE TIMO

O controle timo uma tcnica matemtica usada para resolver problemas de otimizao
em sistemas que evoluem no tempo, e que so suscetveis a perturbaes por foras externas.
Uma vez o problema tenha sido, resolvido o controle timo define o comportamento para
as variveis de controle, indicando as aes que devero ser tomadas para poder levar
totalidade dos sistemas de um estado inicial a um estado final de forma tima [1].
A teoria de controle timo o conjunto de tcnicas para determinar o controle e as trajetrias de um sistema dinmico que minimiza uma funo sobre um intervalo de tempo
[1].
H diversas formulaes para um problema de controle timo, as quais mudam dependendo do critrio de otimizao, do tipo de domnio de tempo (contnuo ou discreto), da
presena de diversos tipos de restries, e das variveis que esto livres. A formulao de
um problema de controle timo requer em geral de:
Definir o modelo matemtico do sistema controlado;
Especificar o critrio de contorno para o estado;
Descreve as restries sobre o estado e o controle;
Descrever as variveis do problema que esto livres.
Quase a totalidade dos problemas de controle timo no pode ser resolvido analiticamente pelo fato de ser necessrio a aplicao de tcnicas adequadas em procura da resposta
adequada [1].
4

2.4

SISTEMAS DE CONTROLE MULTIVARIVEL

So processos nos quais a sada varivel controlada, est controlada por uma entrada
varivel manipulada; e classificada como sistemas de uma entrada e uma sada SISO.
Mas a maioria dos processos na engenharia tem mais de um lao de controle, onde normalmente cada processo tem pelo menos duas variveis para ser controladas. Os sistemas com
mais de um lao so classificados como sistemas de mltiplas entradas e mltiplas sadas
M IM O ou sistemas multivariveis.Um sistema multivarivel M IM O permite alcanar o
objetivo de manter um conjunto de variveis em um valor desejado. A diferena do controle
SISO que s permite controlar uma varivel no tempo [1].

2.4.1

Sistemas SISO

Os sistemas SISO so aqueles que tm simplesmente uma entrada e uma nica sada.
Desta maneira lgico pensar que para manter a sada desejada do sistema deve ser feito
ajustes necessrios entrada e desta forma vai ser obtido o propsito de controle, mas existe
a necessidade de observar constantemente como a resposta ante as variaes da entrada.
Por essa razo surge a necessidade de fechar a malha de controle para monitorar de maneira
permanente a sada do sistema e compar-la com um sinal de referncia a sada desejada [1].
Na engenharia de controle, geralmente se faz referncia a uma nica entrada e uma nica
sada. Os sistemas SISO so menos complexos que os sistema M IM O M ultipleInput
M ultipleOutput, onde geralmente mais simples projetar a ordem da magnitude. A figura
2.1 representa um sistema SISO [1]

Figura 2.1: Sistema SISO. [1].


Se,alm disso o sistema se mostrar determinista, invariante no tempo, de uma entrada e
uma sada (SISO), o modelo de entrada sada ser:

y(k) = f (y(k 1), y(k 2), ...y(k n), u(k 1), u(k 2), ...u(k m))

(2.7)

Onde u(k), y(k) representam o par de entrada-sada no tempo k. O inteiro positivo n


e m so o nmero de sadas passadas, tambm chamado ordem do sistema, e o nmero de
entradas passadas. Na prtica m , normalmente, menor ou igual ao n. f pode ser qualquer
funo no-linear definida do espao de entradas e sadas passadas at o espao de sadas
futuras [1]

2.4.2

Sistemas MIMO

At o momento, s tem se referenciado um sistema de controle simples, o que implica


que so utilizados em processos de menor complexidade, razo pela qual necessrio falar
que, na realidade, devem ser usados sistemas mais complexos os quais so denominados
sistemas M IM O, onde tem mais de duas entradas, por tanto, diversas sadas, o que faz
possvel controlar diversas variveis [1].

Figura 2.2: Sistema MIMO. [1].


A maioria das tcnicas para projetar sistemas de controle se baseia em um bom entendimento da planta. Porm, em um nmero de tarefas, a planta a ser controlada muito
complexa e os processos bsicos internos nela no so compreensveis totalmente. Devido
ao pouco conhecimento que se pode ter do sistema, se faz necessrio o uso de tcnicas adaptativas que permitem controlar o sistema[1].[Gonzales,Bucheli,2011]. A maioria dos processos na engenharia tem mais de um malha de controle. Cada controle requer, normalmente,
controlar duas variveis [1].
Considerando um sistema M IM O com m entradas e n sadas, o qual representado
pelo modelo bsico de funo de transferncia y(s) = G(s) u(s), onde y(s) o vetor de
variveis controladas de dimenso n1, u(s) o vetor de variveis manipuladas de dimenso
6

m1 e G(s) a matriz funes de transferncia de dimenso nxm, ou em forma matricial se


tem [1].

y1 (s)
.

.
yn (s)

2.5

nx1

G11 (s) G12 (s) .... G1m (s)


u1 (s)
G (s) G (s) .... G (s)
.
21

22
2m
=

.
.
.
.
Gn1 (s) Gn2 (s) .... Gnm (s) nxm un (s) mx1

(2.8)

ESPAO DE ESTADOS

Os mtodos convencionais para projetar um controle so normalmente aplicveis a sistemas lineares, mas estes mtodos no so eficientes ou no so aplicveis a sistemas de
controle timo e adaptativo. Se estes sistemas apresentam mltiplas entradas e mltiplas
sadas sistemasM IM O conveniente fazer uma representao em variveis de estados, e o
projeto realizado pelos mtodos modernos para projetar controladores. A figura 2.3 representa um diagrama de blocos do sistema SISO com representao em variveis de estados
[2]:

Figura 2.3: Diagrama de blocos de um sistema em varivel de estados [2].

2.5.1

Descrio interna de sistemas lineares contnuos amostrados

A descrio em variveis de estados de um sistema continuo linear de entra e sada nica


SISO [2] :

x(t) = Ac x(t) + Bc u(t)

(2.9)

y(t) = Cc x(t) + Dc u(t)

(2.10)

X(t) so os estados, u(t) a referncia e y(t) a sada, A, B, C, D so matrizes constantes. A matriz A chamada matriz dinmica, a matriz B chamada matriz de controle, a
matriz C chamada matriz de sensores e a matriz D de termos independentes. A funo de
transferncia do sistema contnuo calculado usando a expresso que representa a equao
2.11
G(s) = Cc [sI Ac ]1 Bc + Dc

(2.11)

As matrizes do equivalente discreto, no espao de estados com perodo de amostragem T ,


so:
A = I + Ac T + A2c T 2 /2! + ... = eT
Z t
2
2 3
B = (IT + Ac T /2! + Ac T /3! + ...)Bc =
eT dt

(2.12)
(2.13)

C = Cc

(2.14)

D=D

(2.15)

A descrio de um sistema discreto equivalente definida como:


x(k + 1) = Ax(k) + Bu(k)

(2.16)

y(k) = Cx(k) + Du(k)

(2.17)

Partindo desse modelo pode-se obter a funo de transferncia do sistema equivalente discreto [2]:
G(z) = C[zI A]1 B + D
(2.18)
Normalmente, em sistemas fsicos lineares e invariantes D = 0, para realizar os clculos
utilizado programas como MATLAB [2].

2.5.2

Modelo em Espao de Estados para sistemas MIMO

Um sistema dinmico pode ser tambm escrito por um modelo de espao de estados de
ordem n de mltiplas entradas e mltiplas sadas M IM O, no-linear e invariante no tempo,
tem a forma representado pela equao 2.19 [21]:


x(k + 1) = (x(k), u(k))

(2.19)

y(k) = (x(k))

x(k) = (x1 (k), x2 (k)....xn (k))


u(k) = (u1 (k), u2 (k)....un (k))T

y(k) = (y1 (k), y2 (k)....yl (k))T

(2.20)

x(k), u(k), ey(k) so o vetor de estados, vetor de entradas e o vetor de sadas, respectivamente. Si, o sistema linear, ele representado pela equao:

x(k + 1) = Ax(k) + Bu(k)


(2.21)
y(k) = cx(k) + Du(k)
Onde A, B, C, D so matrizes (nxn), (mxn), (nxl)e(mxl) respectivamente. Estas estruturas
so teis para projetar sistemas lineares e no lineares [21]

2.5.3

Diagrama de blocos de um sistema MIMO

Seja o sistema representado pelo seguinte diagrama de blocos:

Figura 2.4: Diagrama de blocos do sistema nominal [3].


Onde ele tem mltiplas entradas e uma s sada, este sistema em malha fechada estvel
se, e somente se, os polos de
CN (s) =

gN (s)k(s)
1 + gN (s)k(s)
9

(2.22)

Esto localizados no semiplano esquerdo (SPE) aberto [3]. Uma das maneiras de se
estudar a estabilidade do sistema atravs do Critriode Nyquist, que pode ser enunciado
da seguinte forma: Uma condio necessria e suficiente para a estabilidade do sistema em
malha fechada ocorre quando o nmero de voltas do diagrama de Nyquist de gN (s)k(s) em
torno do ponto 1 + j0, no sentido anti-horrio, seja igual ao nmero de polos instveis de
malha aberta [22]
Note que tanto a planta gN (s), quanto o compensador k(s), podem ter polos no semiplano
direito (SPD) [3]. Para o sistema representado, a funo de transferncia :

y(s) =

1
gN (s)k(s)
gN (s)k(s)
r(s) +
d(s)
n(s)
1 + gN (s)k(s)
1 + gN (s)k(s)
1 + gN (s)k(s)

(2.23)

e(s) =

1
1
1
r(s) +
d(s)
n(s)
1 + gN (s)k(s)
1 + gN (s)k(s)
1 + gN (s)k(s)

(2.24)

Nas equaes anteriores pode-se observar que a sada do sistema e o erro dependem das trs
entradas (referncia, distrbio e o erro), o qual representa um sistema M IM O.

2.6

METODOLOGIA DE CONTROLE LQR

A metodologia do controle LQR pode ser visualizada como uma aplicao particular de
um problema de otimizao. Este problema de otimizao e caracterizado pela busca de um
vetor de entrada u que minimiza a funo J(.) como mostra a equao 2.25, mas tem como
restrio o modelo do sistema descrito no espao de estados representado na equao 2.26
[23]:
mimu J(x, Q, u, R)

(2.25)

x = Ax + Bu

(2.26)

Esta formulao chamada de problema de controle timo. No caso do Regulador Linear


Quadrtico, o ndice de desempenho J um mapeamento dos espaos dos vetores de estado
e de controle que so ponderados pelas matrizes constantes Q e R, respectivamente [23].As
vantagens do controlador LQR so:
Obter uma lei de controle em malha fechada [24];
Os custos de computao so baixos [24];
Controle robusto com margem de estabilidade garantido e margem de fase grande [24].

10

Como desvantagens da metodologia LQR, est a necessidade de disponibilizao dos estados


para medies da realimentao do sinal de controle, o que normalmente no possvel.
Outra desvantagem forte que, para aplicar a tcnica, o sistema no pode ter nem rudo nem
perturbaes externas [23].

2.6.1

Problemas do controle LQR

O problema do controle LQR em relao a equao algbrica de Riccati (EAR), a


escolha das matrizes de ponderao e suas relaes com os mtodos de busca tima. A
(EAR) normalmente estvel, pois as matrizes de ponderao e suas condies obedecem
rigorosamente as restries que garantem a existncia de uma soluo tima.[23] O LQR
formulado por meio de um ndice de desempenho quadrtico e tem como restrio a equao
de estado linear invariante no tempo como apresenta a equao 2.27 [23].
Z

1 T T
1 T
x (t)Q(t)x(t) + uT R(t)u dt
(2.27)
J(t0 ) = x (t)P (t)x(t) +
2
2 t0
x = Ax + Bu

(2.28)

Sendo x Rn , e u Rm , o par A, B controlvel, o par A, C observvel, P (T )


0,Q(T ) 0, e R > 0. Todas simtricas Q Rnxn , e R Rnxm ,so matrizes definidas e
semidefinidas, positivas respectivamente.[t0 , T ], sendo o intervalo de tempo de interesse do
problema [23].

2.6.2

Soluo do controle LQR

O propsito do projeto LQR estabelecer uma relao entre as energias do vetor de


estado x(t) e do vetor de controle u(t), sendo o sistema em espao de estados representado
nas equaes 2.29 e 2.30 [8]:
X = Ax + Bu
(2.29)
y = Cx + Du

(2.30)

O objetivo do trabalho e a determinao da lei de controle u(t) que minimiza a funo de


custo quadrtica, tambm conhecida como ndice de desempenho quadrtico a ser minimizada, com os limites de integrao entre 0 e representada pela equao 2.31 [8]:
Z
J = mimu(t)
0



0
0

x (t)Q(t)x(t) + u (t)R(t)u(t) dt

(2.31)

A lei de controle estabelecida tem como parmetros as matrizes de ponderao Q Rnxn


de estado simtrica, semi-definida positiva (Q 0) e de controle Q Rmxm simtrica e
definida positiva (R > 0) [8].Se o sistema estvel, a lei de controle que estabiliza o sistema
e minimiza o critrio, dada pela equao 2.32:
u(t) = kx(t)
11

(2.32)

Sendo K uma matriz de tamanho rxn, como apresenta a equao 2.33:




u1
k1 k12 . . . k1n
x1


u2 k21 k22 . . . k2n x2
.= .

..
. .
..
.
.
.

.
ur
kr1 kr2 . . . krn
xn

(2.33)

Assim, o projeto de controle timo se reduz determinao dos elementos da matriz de


realimentao de estado K tima, qualquer que seja o estado inicial [8], representado pela
equao 2.34:
K = R1 B T P
(2.34)
Sendo P uma matriz definida positiva obtida da soluo da equao de Ricatti, representada
pela equao 2.35:
A0 P + AP P BR1 B 0 P + Q = 0
(2.35)

2.6.3

Eleio das matrizes Q e R.

No existem regras que possam ser utilizadas de forma geral para a eleio das matrizes Q
e R. Uma forma simples escolher Q e R diagonais, adicionando valores grandes aos valores
que se desejam minimizar. Mas sempre os valores das matrizes Q e R devem ser positivos ou
zero [25]. A informao conhecida do sistema torna-se fundamental na eleio das matrizes;
mesmo assim necessrio calcular diferentes controladores, baseados nos distintos valores
assumidos nas matrizes Q e R verificando sua efetividade mediante simulao. [25] Uma
vantagem importante do projeto LQR que, independentemente da eleio das matrizes Q e
R, mantido a estabilidade assinttica e robustez do controle. [25]

2.6.4

Exemplo da projeo do controle LQR

Deseja-se controlar a posio de um carro e o ngulo de um pndulo invertido, como


apresenta a figura 2.5. [4]:
Onde:
M Massa do carro.
m Massa de pndulo
b Atrito do carro
l Comprimento do centro do massa ao pndulo
I Inrcia do pndulo
F Fora aplicada ao carro
12

Figura 2.5: Diagrama do pndulo invertido. [4]


x Coordenadas da posio do carro
ngulo do pndulo em relao vertical.
O exemplo apresentado permite a simulao do comportamento fsico de um sistema
dinmico que evolui no tempo. O objetivo projetar um sistema de controle timo que
permita a estabilizao do pndulo invertido, o qual esta localizado na parte superior do
carro, como apresenta a figura 2.5 [4].

2.6.5

Modelagem matemtica do pndulo

NO pndulo invertido pode-se considerar um corpo slido, onde seu movimento limitado em duas dimenses. A figura 2.6 representa o modelo do corpo livre do sistema, e
s equaes fundamentais do movimento no plano do corpo slido so representadas pelas
equaes 2.36, 2.37 e 2.38: [4]:

Fi = mai

(2.36)

Fj = maj

(2.37)

FG = mi

(2.38)

i=0

X
j=0

X
i=0

Somando as foras do corpo livre do carro, horizontalmente, a equao de movimento


representada pela equao 2.39:
M x + bx + N = F

13

(2.39)

Figura 2.6: Diagrama do corpo livre do sistema [4]


Do diagrama do corpo livre do pndulo, tem-se a equao 2.40:
N = m
x + ml cos ml2 sin

(2.40)

Substituindo a equao 2.39, na equao 2.40 tem-se a equao 2.41:

F = (M + m)
x + bx + mlcos
ml2 sin

(2.41)

Somando as foras perpendiculares do pndulo, tem-se a equao 2.42:


P l sin + N l cos mg sin = ml + m
xcos

(2.42)

Dos momentos do centroide do pndulo so obtidas as equaes 2.43 e 2.44:


P l sin N l cos = I

(2.43)

(I + ml2 ) + mgl sin = ml


x cos

(2.44)

Linearizando os termos, as equaes do movimento so representadas nas equaes 2.45 e


2.46:
(I + ml2 ) mgl = ml
x
(2.45)
(M + m)
x + bx ml = u

2.6.6

(2.46)

Funo de transferncia

O objetivo da representao da funo de transferncia do sistema, obter o sistema


em relao da entrada e sada do sistema, isto feito mediante aplicao a transformada de
Laplace as equaes 2.45 e 2.46 linearizadas, assim as equaes 2.47 e 2.48 representam o
sistema:
(I + ml2 )(s)s2 mg(s) = mlX(s)s2
(2.47)
14

(M + m)X(s)s2 + bX(s)s ml(s)s2 = U (s)

(2.48)

Da equao 2.47, tem-se a equao 2.49:


X(s) =

[(I + ml2 )s2 mgl](s)


mls2

(2.49)

Substituindo a 2.49, na equao 2.48 tem-se a equao 2.50:


[(M + m)s2 + bs]

[(I + ml2 )s2 mgl](s)


ml(s)s2 = U (s)
mls2

(2.50)

Onde o sistema geral de sada, em funo da entrada, representado pela equao 2.52:

(s)[(M + m)(I + ml2 )s4 mgl(M + m)s2 + b(I + ml2 )s3 mglbs (ml)2 s4 ]
= mls2 U (s)
(2.51)

(s)[(M + m)(I + ml2 )s4 mgl(M + m)s2 + b(I + ml2 )s3 mglbs (ml)2 s4 ]
= mls2 U (s)
(2.52)
Com:
q = ((M + m)(I + ml2 ) (ml)2 )

(2.53)

Ento a funo de transferncia representada pela equao 2.55, onde ela mostra a sada do
sistema em malha aberta para uma entrada impulso como apresenta a figura 2.7.
(s)
=
U (s)
[s4 +

b(I+ml2 )s3
q

(s)
=
U (s)
[s3 +

2.6.7

mls2
q
mgl(M +m)s2

mglbs
]
q

mls
q
mgl(Mq +m)

mglb
]
q

b(I+ml2 )s3
q

(2.54)

(2.55)

Modelo em espao de estados

Como a representao de um sistema em espao dada pelas equaes 2.56 e 2.57:


X = Ax + Bu

(2.56)

y = Cx + Du

(2.57)

onde:
x o estado do sistema de ordem n;
15

Figura 2.7: Sada do sistema em malha aberta.


u o vetor de entradas dos m elementos;
y o vetor de sadas dos p elementos;
A a matriz do sistema de tamanho nxn;
B a matriz de entradas de tamanho nxm;
C a matriz sadas de tamanho pxn;
D uma matriz tamanho pxm.
A vantagem da representao de espao de estados fundamentada em conhecer o comportamento interno do sistema, alm de isso, permite trabalhar com condies iniciais diferente de zero e facilitar o desenho e representao do sistema mediante software[4]. Das
equaes 2.45 e 2.46, substituindo a equao 2.45 na equao 2.46, tem-se a equao 2.59:
(M + m)
((I + ml2 )
x mgl) + bx ml = u
ml
((M + m)(I + ml2 ) (ml)2 ) mgl(M + m) + mlbx = mlu

(2.58)
(2.59)

Substituindo a equao 2.53 na equao 2.59: tem-se a equao 2.60:


mlu mgl(M + m) mlbx
=
+

q
q
q

(2.60)

Fazendo o mesmo procedimento para a outra equao, substituindo a equao 2.46 na equao 2.45 tem-se a equao 2.64:
(I + ml2 )
((M + m)
x) + bx u) mgl = ml
x
ml
16

(2.61)

(I + ml2 )(M + m)
x + b(I + ml2 )x (I + ml2 )u (ml)2 g = (ml)2 x

(2.62)

((I + ml2 )(M + m) (ml)2 )


x = (I + ml2 )u + (ml)2 g b(I + ml2 )x

(2.63)

Ento:
x =

(I + ml2 ) (ml)2 g b(I + ml2 )x


+

q
q
q

(2.64)

Mediante as transformaes seguintes obtido o modelo de espao de estados:


x1 = x
x2 = x 1 = x
x2 = x 1 = x
x3 =
x4 = x 3 =
x 4 =
Ento:

x 2 =

(ml)2 gu
q

x 4 =

(ml)u
q

x = x2
2
2 )x
2
+ (ml)q gx3 b(I+ml
q
x 3 = x4
2
+ mgl(Mq+m)x3 mlbx
q

Assim, a representao em espao de estados mostrada nas equaes 2.65 e 2.66:



0
1
0
0
0
x1
x 1
g(ml)
b(I+ml2 )
(ml)2 g
x
x2 q
0
0

2
q
q
+
u
=

x 3 0
0
0
1
x3 0
mgl(M +m)
ml
x 4
0
mlb
0 x4
q
q
q

"
# x1

1 0 0 0
x2
y=

0 0 1 0 x3
x4

(2.65)

(2.66)

Substituindo os seguintes parmetros numricos para a realizao das simulaes do sistema:


M = 0.5kg
m = 0.2kg
b = N s/m
l = 0.3m
17

I = 0.006kgm2
g = 9.8m/s2
obtido o sistema em espao de estados de forma numrica o qual representado pelas
equaes 2.67 e 2.68:

x 1
0
1
0
0 x1
0
x 0 0.1818 2.6727 0 x 1.8182
2
2

(2.67)
=
+
u
x 3 0
0
0
1 x3 0
x 4

0 0.4545 31.1818 0

x4


"
# x1

1 0 0 0
x2
y=

0 0 1 0 x3
x4

4.5455

(2.68)

Como o sistema tem mltiplas sadas, o objetivo controlar o ngulo do pndulo e a posio
do carro, baseados nos seguintes requerimentos do desenho [4]:
Tempo de estabilizao de x e menor a 5s.
Tempo de impulso mximo menor aos 0.5s.
Sobre sinal de menor aos 20 graus.
Para uma entrada degrau de 0.2m tem-se:

Figura 2.8: Sada do sistema em funo do espao de estados para o carro e o pndulo. [4]
Na figura 2.8 , os asteriscos representam a posio do carro. A figura representada por
crculos mostra o ngulo. Ento pode-se analisar que para melhorar a dinmica do sistema
tem que se projetar um controle, neste caso, ser projetado um controle LQR[4].
18

2.6.8

Regulador LQR

A vantagem de ter um sistema representado em espao de estados que a projeo de


um controlador LQR resulta simples. A ideia estabelecer uma retroalimentao completa
mediante uma combinao linear das variveis de estado. Para o caso ideal, a realidade
que o estado medido no completo, pelo qual necessria a utilizao de um observador
de ordem reduzido para fazer a estimao da parte do estado. Para este caso assumido que
todos os estados so medveis [4], ento a representao a mostrada na figura 2.9:

Figura 2.9: Regulador LQR [?]


Na figura 2.9 pode-se observar uma representao do algoritmo de controle. K a matriz de retroalimentao para obter o sinal de controle, onde u(k) = Kx(k). Precisa-se
encontrar o valor de K que determina o valor da lei de controle de realimentao o qual pode
ser feito de muitas formas [4]:
A primeira opo inserir arbitrariamente o valor dos plos que deseja-se que o sistema
tenha, em malha fechada.
A segunda opo fazer um controle timo varivel no tempo.
Para a segunda opo trata-se de minimizar a funo representada pela equao 2.69
J=

N
X

[xT (k)Q(t)x(k) + uT (k)R(x)u(x)]

(2.69)

k=0

J uma funo que geralmente est associada com a energia do sistema. O controle
timo porque o objetivo minimizar a energia. A expresso XnT (k)QXn (k) representa
a energia aportada para cada estado Q uma matriz no negativa definida. A importncia
de Q que permite a eleio do peso que tem cada estado da funo J. Como o estado
u(k) tem um s elemento,R 0 um elemento que indica o peso que deseja-se dar
19

energia associada com o sinal de controle, se por exemplo, a funo tem as caractersticas
representada na equao 2.70:
Xn (k + 1) = Ad Xn (k) + Bd u(k)

(2.70)

Para dar soluo a equao anterior, preciso de mtodos numricos. A soluo resultante uma lei de controle varivel no tempo como apresenta a equao 2.71:
u(k) K(k)Xn (k)

(2.71)

Se o sistema tem coeficientes constantes, K(k) fixado durante o perodo de tempo e


posteriormente converge para zero [4]. O valor exato de J no relevante, s pretendido
encontrar um valor de K que permita obter o mnimo valor para J. A importncia est no
valor relativo que tem os elementos Q e R entre eles. Estes parmetros so os encarregados
de balancear a importncia relativa da entrada e os estados em relao ao sistema que se
pretende otimizar. O caso mais simples para um valor de R = 1 obter um valor de Q, em
relao ao valor de R [4].

2.6.9

Projeo do controlador em espao de estados

Baseados nas condies de desenho apresentadas anteriormente, adicionando o erro em


estado estacionrio, que menor ao 2 por cento. [4]. Para projetar o regulador utilizada a
funo LQR que produz um controlador timo, isso feito mediante MATLAB, onde pode
ser escolhidos os parmetros R e Q. Para o caso mais simples as escolhas so: R = 1, onde
Q = C 0 C. O mtodo LQR vai permitir encontrar as duas sadas, para obter uma resposta
desejvel, permitindo que o controle possa ser sintonizado mudando os elementos no nulos
da matriz Q [4]. Para esta condio o valor da matriz Q, mostrada na equao 2.72:

1 0 0 0
0 0 0 0

(2.72)
Q=

0 0 1 0
0 0 0 0




k = 1.0000 1.6567 18.6854 3.4594
Mediante a utilizao de MATLAB, fazendo a representao do sistema, obtida a sada
como mostrado na figura 2.10:
Na figura 2.10, a figura representada pelos asteriscos mostra o ngulo do pndulo em
radiais, e a figura dos crculos representa a posio do carro em metros. Como pode-se observar os resultados obtidos representados pela figura 2.10 no so timos, Adicionalmente,
pode-se observar que o carro no esta prximo da posio desejada, dado que est se movimentado na direo oposta [4], o que faz que no sistema, em malha fechada, no possa ser
20

Figura 2.10: Sada do sistema para o caso mais simples R=1.


realizada a comparao da sada diretamente com a referncia para obter o resultado desejado,neste caso necessrio dimensionar a entrada de referncia, de modo que a sada seja
igual referncia. Isso pode ser feito atravs da introduo de um fator de escala N , na
entrada de referncia do sistema [5], como apresenta figura2.27:

Figura 2.11: Modificao da entra de referncia [5]


Agora, com o tempo de subida e estabilizao pode ser resolvido mudando os valores
das variveis no nulas da matriz Q. Com isso pode-se melhorar os tempos de estabilizao,
[4], por exemplo para a matriz representada pela equao 2.73:

5000
0

Q=
0
0

0 0 0
0 0 0

0 100 0
0 0 0

21

(2.73)





k = 70.7107 37.8345 105.5298 20.9238

Figura 2.12: Regulador LQR [5]


A figura 2.12 mostra o incremento dos valores da matriz Q, onde a resposta melhorada,
e ainda pode ser melhorar, mas os esforos vo ser maiores do controle projetado, assim
pode-se cumprir com o objetivo desejado que obter um tempo de estabilizao menor aos
2s para a posio do carro e o ngulo do pndulo [4].

2.6.10

Projeo do observador

Para a implementao da realimentao completa de estados, necessrio adicionar um


dispositivo dinmico, chamado observador, o estimador de estados, onde a sada um estimador do vetor de estados, pelo qual a ordem do observador completo tem a mesma ordem
da planta [4], ou seja, estimado todo o vetor de estados, para o sistema representado nas
equaes (espao de estados), onde A, B, C so conhecidas e a entrada u(t) e a sada y(t)
so medveis, mas no o estado x(t), como mostra a figura 2.13 [6]:
Assim, para iniciar o trabalho, preciso conhecer os polos do sistema controlado. Para
este exemplo, os polos mudam os parmetros da matriz Q, como foi dito anteriormente,ento
eles so [4]:
p = 8.491 + 7.9283i 8.491 7.9283i 4.7592 + 0.839i 4.7592 0.839i
Pode se perceber que os polos do sistema so diferentes. Deseja-se projetar um estimador que
seja 10 vezes mais rpido que o menor dos polos. Como existem quatro polos, com a ajuda
do MATLAB, mediante o comando PLACE, pode-se obter o observador. Este comando
precisa de polos diferentes, ento:
P = [40 41 42 43]
22

Figura 2.13: Projeo do observador [6]


L = place(A0 , C 0 , P )0
Onde: L o observador e P os polos inseridos ao sistema. Mediante a combinao do
controlador e observador, obtida a resposta que apresenta a figura 2.14:

Figura 2.14: Sada do sistema para o controle LQR modificando a entrada.


Na figura 2.14 pode-se observar que o erro esttico fica dentro dos limites esperados,
obtendo a amplitude desejada mediante a utilizao da matriz de pr-compensao, satisfazendo os requisitos de desenho impostos [4].

23

2.6.11

LQR com ao integral

Dado que o controle LQR tem o problema de no ser robusto quando o sistema tem
perturbaes, para dar soluo ao problema e conseguir um controlador que rejeite perturbaes, necessrio adicionar ao projeto LQR um efeito integral que afete o erro das variveis
do modelo. O efeito integral tem como funcionalidade integrar o erro dos estados afetados
pelas perturbaes [26]; as razes so:
A lei de controle LQR U = kx, responde essencialmente a um controle proporcional,
dado que o controle proporcional origina efeitos do erro estacionrio no caso de existir
perturbaes no sistema de controle [26].
O modelo do sistema utiliza clculo dos valores do ponto do trabalho (X, U ), onde o
sistema pode apresentar desvios importantes com relao planta ( quedas de tenso em
semi-condutores, desvio dos valores de componentes passivos, etc) [26]. Estes desvios
geram perturbaes no sistema de controle e erro estacionrio [26].
Qual quer perturbao existente na planta gera erro estacionrio que o controle proporcional no pode corrigir [26].
Para o projeto LQR deve ser corrigidos os erros em estado permanente e estacionrio,
como conhecido da teoria de controle clssico, incorporando ao sistema uma parte integral,
permitindo rechaar assintoticamente as perturbaes [26], como apresenta a figura 2.15 [7]:

Figura 2.15: Projeto LQR com efeito integral. [7]


Seja o sistema apresentado nas equaes 2.29 e 2.30, com C = I, considerando um
sistema de ordem trs, pode-se representar como apresenta a equao 2.74

24




x 1
a11 a12 a13
x1
b11 b12 b13
u1



x 2 = a21 a22 a23 x2 + b21 b22 b23 u2
x 3
a31 a32 a33
x3
b31 b32 b33
u3

(2.74)

A parte integral pode ser implementada para eliminar o erro estacionrio em todas ou s
algumas variveis de estado. Por exemplo, deseja-se adicionar parte integral aos estados x1
e x2 . necessrio incrementar a ordem com dois novos estados Ix1 , Ix2 que so as integrais
dos estados sobre os que deseja-se adicionar ao integral, [27] [28].
Z

dIx1
= x1
dt
Z
dIx2
Ix2 = x2
= x2
dt

a12 a13 0 0
x1
b11 b12 b13


a22 a23 0 0 x2 b21 b22 b23 u1


a32 a33 0 0
x3 + b31 b32 b33 u2

0
0 0 0 Ix1 0
0
0 u3
1
0 0 0
Ix2
0
0
0
Ix1 =


x 1
a11

x 2 a21

x 3 = a31


Ix1 1
2
Ix
0

x1

(2.75)
(2.76)

(2.77)

Baseados no novo sistema necessrio definir as novas matrizes Q e R da funo de


custe, a qual tambm aumenta sua dimenso.Os termos das matrizes relacionadas com os
estados originais condicionam a parte proporcional do controlador [26], o clculo da matriz
LQR desenvolvido no MATLAB.
Para o exemplo proposto a matriz de controle que resultaria ao aplicar a lei de controle
LQR tem a forma apresentada na figura 2.16.

Figura 2.16: Lei de controle, Ganho proporcional e integral.

2.6.12

Robustez do controle LQR

O controle LQR garante estabilidade, um controle robusto, apresenta um margem de


fase mnimo de 60, um margem de ganho crescente infinito, e um margem de ganho decres25

cente de 0.5 . O que garante que o sistema em malha fechada com controle LQR seja estvel
para qualquer incremento no ganho, e para todos os ganhos superiores metade do valor
nominal do projeto. [27]
A adio da parte integral elimina os erros de regime permanente ocasionado pelas perturbaes, adicionalmente proporciona robustez frente s variaes dos parmetros do modelo do sistema.
A parte integral importante nos casos que o modelo precise de pequenos sinais no clculo do controlador LQR, onde o modelo depende do ponto de trabalho, o erro causado ao
projetar um controle longe do ponto do trabalho pode ser cancelado mediante a implementao da ao integral, se analisada a robustez do projeto LQR a ao integral permite obter
erro estacionrio nulo, mesmo o modelo apresente erros grandes [29].
Outra vantagem do controle LQR em relao a sua robustez que apresenta uma sensibilidade inferior ou igual a unidade para toda o margem de frequncias. Assim supor que a
funo de transferncia do sistema completo tem uma variao mnima em relao variao
dos elementos do sistema, para qualquer frequncia [29].

2.7

FILTRO DE KALMAN FK

No ano de 1960, Rudolph. E. Kalman publicou um trabalho que descreve uma soluo
de maneira recursiva para o problema de filtragem de dados discretos em sistemas lineares.
O trabalho mostra que partindo de alguns valores iniciais, pode ser predito e ajustados os
parmetros de modelos atravs de cada nova medio, obtendo a estimativa do erro em cada
atualizao. A sua habilidade para incorporar os efeitos de erros e sua estrutura computacional fez com que o FK tivesse um amplo campo de aplicaes, especialmente no que se
refere anlise de trajetrias em viso computacional, controle de sistemas dinmicos devido a que o filtro permite analisar sistemas que esto expostos a rudos e perturbaes que
so analisadas de maneira estocstica, por isso teoricamente, o filtro de Kalman conhecido
como um estimador para o que chamado Problema Quadrtico Linear, que o problema
de estimar o estado instantneo de um sistema linear perturbado por um rudo branco [10].
Existem muitas definies do FK, mas basicamente um algoritmo recursivo muito eficiente. E sua utilizao baseada na estimativa das variveis de estado de sistemas representados por equaes de estado lineares. Quase sempre considerado que o sistema perturbado
por rudos brancos e Gaussianos, de forma que os estados possam ser tratados como variveis
aleatrias Gaussianas.
Os mtodos de resoluo mediante a teria do FK permitem a utilizao de uma estimativa recursiva na qual a informao a priori sobre o estado estimado se combina com as
medida para atualizar o parmetro estimado [30]. O FK pode-se estimar de forma continua

26

ou discreta.
O FK comunmente aplicado para dar soluo aos problemas em filtragem e estimao
de sistemas M IM O, pelo fato que ele tem mltiplas entradas e mltiplas sadas quando
se esta usado como um observador de estados, o F K um algoritmo de processamento
de dados timos recursivos, timo porque minimiza um critrio e porque incorpora toda a
informao que subministrada para determinar a filtragem, e recursivo porque no precisa
manter os dados prvios, o que facilita sua implementao em sistemas de processamento
em tempo real. Este algoritmo de processamento de dados pelo fato que foi projetado para
ser usado em sistemas discretos o objetivo do F K estimar o estado de maneira tima, de
maneira que possa ser minimizado o ndice de erro quadrtico meio [1].

2.7.1

Algoritmo discreto do filtro de Kalman

O Filtro projetado supondo que o sistema pode ser descrito por meio de um modelo
estocstico linear, onde o erro associado tanto ao sistema como informao adicional que
incorporado em ele mesmo, tem uma distribuio normal com mdia zero e varincia
determinada [1].
A soluo tima pelo fato que o filtro combina toda a informao observada e o conhecimento prvio do comportamento do sistema para produzir uma estimativa do estado de
maneira que o erro minimizado estatisticamente. O termo recursivo faz referncia a que o
filtro recalcula a soluo a cada nova observao ou medida incorporada ao sistema [1].
O F K o principal algoritmo para estimar sistema dinmico representado em forma de
espao de estados, em este representao o sistema descrito pelo conjunto de variveis denominadas de estados. Os estados contem toda a informao relativa ao sistema em instantes
especficos de tempo. Esta informao deve permitir a inferncia do comportamento passado
do sistema, com o objetivo de predizer seu comportamento futuro [1].
O que faz o filtro interessante precisamente a habilidade para predizer o estado de um
sistema no passado, presente e futuro, mesmo quando a natureza do sistema modelado seja
desconhecida. Na pratica, as variveis do estado individual de um sistema dinmico no
pode ser exatamente determinadas pela medio direta. Pelo qual sua medio feita pelos
processos estocsticos que envolvem algum grau de incerteza na medio [1].
Os modelos em forma de espao de estados de processos aleatrios esto baseados na
chamada propriedade de Markov, segundo esta propriedade, o futuro do processo com
respeito ao passado independente, sempre que no seja conhecido o estado presente. Em
um sistema deste tipo o estado do processo resume toda a informao relativa ao passado
que resulta relevante para predizer o futuro[1].
O F K o principal algoritmo para estimar sistemas dinmicos especificados em forma
de espao de estados. Estes modelos so essencialmente uma notao conveniente para abor27

dar a manipulao de um amplo rango de modelos. Na estimao e controle de problemas,


esta metodologia baseada em modelos estocsticos, dado o suposto da natureza errada das
medies [1].

2.7.2

Algoritmo do filtro de Kalman

O algoritmo do FK pode ser explicado como uma forma de controle realimentado [31],
onde a funcionalidade do filtro baseada estimando o estado de um processo em algum
instante de tempo k, assim o sistema realimentado obtm uma resposta medidaruidosa,
desta maneira, as equaes do FK podem ser divididas em dois grupos:
Equaes para a atualizao do tempo ;
Equaes para a atualizao da medida.
As equaes para a atualizao do tempo projetam no tempo o estado atual e a varincia
do erro para obter a estimativa a priori para o seguinte estado k + 1. As equaes para a atualizao da medida so responsveis da realimentao, ou seja, incorporam a nova medio
e a estimativa a priori usada para obter uma estimativa a posteriori melhorada [32].

2.7.3

Caractersticas do filtro de Kalman

O FK implementvel, na forma discreta em um um computador digital, permitindo


economizar recursos e uma melhor resposta que a obtida com um filtro analgico [10].
O FK no exige o conhecimento da dinmicas determinsticas de um sistema, normalmente os processos aleatrios so analisados de maneira estacionria, e muitas aplicaes de
importncia incluem processos estocsticos no estacionrios[10].
O FK compatvel com a formulao matemticas de sistemas dinmicos em espao de
estados, assim permite a implementao de controladores opcionais para sistemas dinmicos.[10].
A descrio matemtica do FK apresenta a vantagem sob outros filtros como o filtro de
Wiener , que sua representao matemtica mais simples, obtendo assim timos resultados
pelo qual sua implementao superior no maior dos casos e uma ferramenta muito utilizada para estudantes de engenharia [10]. o FK fornece as informaes matemtica necessria
para detectar estatisticamente e rejeitar medies anmalas [10].

2.7.4

Filtro de Kalman Continua

O FK um mtodo de estimao utilizado para obter estimativas timas das variveis de


estado de um sistema dinmico, de maneira que o erro minimizado estatisticamente. Seja
a planta definida como apresentam as equaes 2.78 e 2.79 [8]:
28

x(t)

= Ax(t) + Bu(t) + Gv(t)

(2.78)

y(t) = Cx(t) + w(t)

(2.79)

Sendo x(t) Rn o vetor de estados, u(t) Rm e y(t) Rq so os vetores de entrada e


de sada, respectivamente, A Rnxn , B Rnxm e C Rqxn , so matrizes que representam
o modelo do sistema, w(t) Rn o rudo do processo, v(t) Rq o rudo de medida, que so
sinais no correlacionados, ambos so rudos brancos Gaussianos com mdia zero e matrizes
de covarincias W e V , respectivamente [8], como mostram as equaes 2.80 e 2.81:
n
o
0
E w(t)w(t) = W 0
(2.80)
n
o
0
E v(t)v(t) = V > 0

(2.81)

Sendo W a matriz de covarincia do rudo no estado positiva semi-definida, V a matriz de


covarincia do rudo de medida positiva definida. Adicionalmente assumido o rudo dos
sinais como no correlacionado entre si, como apresenta a equao 2.83 [8].
E {w(t)v(t)0 } = 0

(2.82)

E {v(t)w(t)0 } = 0

(2.83)

O sistema anterior pode ser representado no diagrama de blocos da Figura 2.17.

Figura 2.17: Diagrama de Blocos do sistema com rudo de estado e medida [8]
O problema a ser resolvido consiste em:
Obter-se uma estimativa x0 (t) do estado x(t), partindo da observao da sada y(t) [8].
29

A estrutura de um FK semelhante ao de um observador de estados [8].


A dinmica do FK dada pela equao 2.84 [8]:
c = Ab
x (t)
x(t) + Bu(t) + L(t)(y(t) Cb
x(t))

(2.84)

O erro entre x(t), e x0 (t) dado pela equao 2.85 [33]:


e(t) = x(t) x
b(t)

(2.85)

Substituindo a equao 2.79 na equao 2.84 o FK pode-se representar como apresenta a


equao 2.86 [8]:
c = (A L(t)C)b
x (t)
x(t) + wu(t) L(t)v(t)
(2.86)
Assim o FK um sistema dinmico, onde a matriz de ganho timo L(t) representada pela
equao 2.87 [8].
L(t) = SC 0 V 1
(2.87)
Sendo S a nica soluo simtrica definida positiva da equao Algbrica de Riccati, a qual
representada pela equao 2.88 [8].
SA0 + AS SC 0 V 1 CS + W = 0

(2.88)

Onde o FK deve cumprir que [8]:


Re [1 (A L(t))] < 0, (i = 1, 2, ..., n)
Ento a estimativa gerada pelo filtro e tima no sentido que a varincia do erro de estimao
seja mnima, como apresenta a equao 2.89 [8]:
min

n
X

E {[xi (t) x
b(t)]}

(2.89)

i=1

2.7.5

Exemplo filtro de Kalman continuo

Seja o sistema descrito em espao de estado representado pelas equaes 2.90 e 2.91
"
#
" #
4 2
1
x =
x+
v
(2.90)
2 4
1
h
i
y = 1 0 x+w

(2.91)

Onde o termo do rudo v(t) tem mdia zero e covarincia V = 0.09. O rudo da medio
assumido com mdia zero e covarincia W = 0.025. O objetivo encontrar a matriz de ganho otimo baseada na matriz que minimiza a equao de Riccati 2.91 [34]. Se o estado inicial
h
iT
da planta x(0) = 0.5 05 , com covarincia de estado inicial S0 = I2x2 . Baseando-se no
30

modelo de espao de estado apresentado na equao 2.78, para descrever o comportamento


do FK do sistema, como foi mostrado nas equaes 2.86 2.88, Substituindo os parmetros
das matrizes do sistema em espao de estado tem-se as equaes 2.92 2.94.
"
#
" #
h
i
4 2
1
x =
x+
v + L(t)(y(t) 1 0 x
b(t))
(2.92)
2 4
1
"
#
iT
S1 S2 h
L(t) =
(2.93)
1 0 (0.25)1
S2 S3
# "
#"
# "
#"
#T
S1 S2
4 2
P1 P2
S1 S2 4 2
=
+
S2 S3
2 4 P 2 S3
S2 S3 2 4
"
#
"
# " #
" #T
iT
h
i S1 S2
S1 S2 h
1
1
1

(0.09)
1 0 (0.25)
1 0
S2 S3
S2 S3
1
1
"

(2.94)

Para dar soluo equao 2.94, a qual uma soluo numrica foi utilizado como
ferramenta o software MATLAB. Obtendo assim a soluo da equao de Riccati como
representam a equao 2.95:
"
#
0.0066 0.0088
S=
(2.95)
0.0088 0.0153
Ento o ganho timo dado pela equao 2.96.
"
#
"
#
iT
0.0066 0.0088 h
0.264
1
L(t) =
1 0 (0.25) =
0.0088 0.0153
0.352
2.7.6

(2.96)

Filtro de Kalman discretro

Seja o seguinte sistema discreto representado pelas equaes 2.97 e 2.98 [35]:
xk+1 = Axk + Buk + Gvk

(2.97)

yk = Cxk + wk

(2.98)

As novas sinais de entrada vk e wk , so processos aleatrias considerados rudos brancoS estacionrio com mdia zero e no correlacionados entre si, pelo qual apresentam as seguintes
propriedades [34]:
E {vk } = E {wk } = 0, j, k


E vkT vk = Q


E vkT vj = 0


E vjT wk = 0, j, k


E vjT wk = 0, j, k


E wkT wj = 0, k 6= j


E wkT wk = R
31

Assim a matriz de covarincia conjunta pode ser expresada como mostra a equao 2.99:


!




wk
Qk 0
T
T
E[
(2.99)
wk vk ] =

0 Rk
vk
Assim que o problema pode ser abordado de trs formas diferentes:
Predio obtida a estimativa x(k+1) conhecendo as medidas y(0), y(1), y(2), ..., y(k)
Filtragem Se obter a estimativa x(k) conhecendo as medidas y(0), y(1), y(2), ..., y(k)
Alisado obtida a estimativa x(k1) conhecendo as medidas y(0), y(1), y(2), ..., y(k)

Figura 2.18: Estados de um filtro de Kalman


O critrio para obter o timo minimizar o ndice de comportamento


P (n) = E e(n)eT (n)

(2.100)

Com n = k + 1, n = k e n = k 1, independente da etapa de filtragem, predio ou alisado,


a matriz de covarincia do erro e(k) minimizada.
e(k) = x(k) x(k)

(2.101)

Quando a matriz de covarincia P (k) minimizada, qualquer forma quadrtica


T P (k)

(2.102)

minimizada sendo um vetor arbitrrio de ordem nx1. assumido que o estado inicial
X(0) se conhece seu valor esperado ou valor mdio.
E [x(0)] = x(0)

(2.103)

Que um valor determinstico, alm disso, se conhece a matriz de covarincia do estado


inicial
h
i
T
E [x(0) x(0)] [x(0) x(0)] = P0
32

(2.104)

O estado inicial e o rudo cumprem






E [x(0) x(0)] v T (k) = E [x(0) x(0)] wT (k) = 0

(2.105)

Onde so independentes, brancos e de media zero.

2.7.7

Filtro de kalman (predio)

Assumidas todas as condies anteriores, o objetivo determinar a estimao x


b(k + 1) ,
conhecendo as medias contaminadas pelo y(0), y(1), y(2), ..., y(k), para quea matriz P (k +
1) de covarincia do erro, no instante k + 1, seja mnima. A soluo encontrada por Kalman
e Bucy, foium estimador ptimo dos estados que tem por equao:

x
b(k + 1) = A(k)b
x(k) + B(k)u(k) + K(k)[y(k) yb(k)] = A(k)b
x(k) + B(k)u(k) (2.106)
E o digrama de blocos representado na figura.

Figura 2.19: Filtro de Kalman com Predio


O erro do sistema no instante k + 1 :

e(k + 1) = x(k + 1) x
b(k + 1) = [A(k) K(k)C(k)]e(k) K(k)(k) + v(k) (2.107)
O qual representado como:
b
e(k + 1) = A(k)e(k)
K(k)(k) + v(k)
33

(2.108)


cT (k) (k)T K T (k) + v T (k)
eT (k + 1) = eT (k)A

(2.109)

Onde a matriz A(k) determinstica. O objetivo minimizar a matriz de covarincia do erro




P (k + 1) = E e(k + 1)eT (k + 1)

(2.110)

E no o ndice escalar

1
J = eT (k + 1)e(k + 1)
2
Substituindo as equaes do erro e erro transposto tem-se.

(2.111)



T
cT (k)A
cT (k)E[e(k)wT (k)]K T (k)+A(k)E[e(k)v
b
b
P (k+1) = E e(k + 1)eT (k + 1) = A(k)P
(k)A
(k)]
E como:
cT (k + 1)E[e(k 1)wT (k)]
E[e(k)wT (k)] = A

(2.112)

Assim que o valor esperado pode se expressar como mostra a seguinte equao:

T
T
b
b
b
b
b
b
E[e(k)w(k)] = A(k1)E[e(k1)w
(k)] = A(k1)
A(k2)E[e(k2)w
(k)] = A(k1)
A(k2)...
A(0

Como:
E[[x(0) x
b(0)]wT (k)] = 0

(2.113)

E[e(k)v T (k)] = E[w(k)eT (k)] = 0

(2.114)

Os termos:

Ento

cT (k)+K(k)R(k)K T (k)+Q(k) = [A(k)K(k)C(k)]P (k)[A(k)K(k)C(k)]T +


b
P (k+1) = A(k)P
(k)A
(2.115)
Para minimizar P (k + 1), derivada a equao kkkk em funo de K(k) obtendo o valor
mnimo da funo.
dP (k + 1)
= 0 = 2A(k)P (k)C T (k) + 2K(k)C(k)P (k)C T (k) + 2K(k)R(k) (2.116)
dK(k)
Manipulando a equao anterior obtida
K(k) = A(k)P (k)C T (k)[R(k) + C(k)P (k)C T (k)]1
34

(2.117)

K(k) o valor que faz mmima a forma quadratica T P (k + 1)


K(k) A(k)P (k)C T (k)D1 (k) = 0

(2.118)

K(k) = A(k)P (k)C T (k)[R(k) + C(k)P (k)C T (k)]1

(2.119)

importante notar que


e(0) = x(0) x(0) = x(0) x(0)

(2.120)

Assim avaliando a equao anterior na matriz de covarincia do erro representada como:


P (k + 1) = Q(k) + [A(k) K(k)C(k)]P (k)AT (k)

(2.121)

Que a equao de Riccati,em resumo este procedimento pode ser visualizado no seguinte
diagrama

Figura 2.20: Passos para obter o Filtro de Kalman com Predio

2.7.8

Exemplo filtro de Kalman discreto:

Para o sistema representado nas equaes 2.90, a discretizao do sistema em espao de


estados pode ser feita mediante as equaes 2.122 at 2.124 [36].
Ad = eAT
35

(2.122)

Bd = A1 (A I)B

(2.123)

Gd = A1 (A I)G

(2.124)

Baseado nas equaes anteriores discretizado o sistema para um tempo de amostragem


T = 0.05s. onde a discretizao feita mediante a utilizao das equaes 2.90 e 2.91,
obtendo assim as equaes 2.125 e 2.126 [34].
"

x
bk+1

#
"
#
"
#
0.8146 0.08173
0.002188
0.043
=
xk +
uk +
vk
0.08173 0.8146
0.045245
0.0447
h
i
y k = 1 0 xk + w k

(2.125)
(2.126)

O termo do rudo v tem mdia zero e covarincia V = 0.09. e o rudo de medio


assumido com mdia zero e covarincia W = 0.25. Aplicando uma entrada
h
iu = sin(kt),
com um periodo de amostragem T = 0.05s, para um intervalo KT 0 1 s e condio
inicial x0 . Substituindo o sistema discreto nas equaes 2.128 a 2.131 tem-se: Estimativa a
priori do estado.
"

#
"
#
0.8146 0.08173
0.002188
x
bk =
xk +
uk
0.08173 0.8146
0.045245

(2.127)

Ento o ganho de Kalman definido pela equao 2.128.


# "
#T
0.8146 0.08173
0.8146 0.08173
Lk+1 =
Sk
0.08173 0.8146
0.08173 0.8146
"
#
"
#"
#T
0.043
0.8146 0.08173
0.043
+
(0.09)
0.0447
0.08173 0.8146
0.0447
"
#
"
#T
h
i
0.043
0.043
+
(0.09)
1 0 + (0.25)1
0.0447
0.0447
"

(2.128)

Assim a estimativa a posteriori, corregida com a sada y(k+1) dada pela equao 2.129
*"
#+
"
#
h
i
0.8146 0.08173
0.002188
x
bk+1 = (I Lk+1 1 0 )
xbk +
uk + Lk+1 (2.129)
0.08173 0.8146
0.045245
E a matriz de covarincia para prxima iterao representada na equao2.130.

Sk+1
"

h
i
= (I Lk+1 1 0 )

"

# "
#T
0.8146 0.08173
0.8146 0.08173
Sk
0.08173 0.8146
0.08173 0.8146

#
"
#T
h
i
h
i
0.002188
0.002188
(0.09)
(I Lk+1 1 0 ) + Lk+1 (0.025)LTk+1 (I Lk+1 1 0 )
0.045245
0.045245
(2.130)
36

A soluo das equaes anteriores feita mediante a ajuda do software MATLAB, onde
foram obtidas a matriz de covarincia para prxima iterao e o ganho do Kalman como
apresentam as equaes 2.131 e 2.132
"

#
0.0130
L=
0.0174
"
#
0.3260 0.4352
3
S=1
0.4352 0.7580
2.7.9

(2.131)

(2.132)

Exemplo 2 filtro de Kalman discreto:

Seja o sistema em espao de estados dado pelas equaes 2.97 e 2.98. Onde as matrizes
discretas tm a forma que apresentam as equaes 2.133 e 2.134.

1.1269 0.4940 0.1129


0.3832

x
bk+1 = 1.000
(2.133)
0
0 xk + 0.5919 uk + vk
0
1
0
0.5191
h
i
y k = 1 0 0 xk + w k
(2.134)
Projetar um FK baseados nas medies de rudo y[n] = Cx[n] + v[n] Pode-se utilizar
a funo de KALMAN de Matlab para projetar o FK estacionrio,esta funo determina
o timo estado para o filtro estacionrio com ganho K baseado no processo de ruido de
covarincia Q e o rudo do sensor de covarincia R. Para desenvolver o exemplo vai se
tomar como covarincia para do rudo e do sensor respetivamente:
Q = 2.3 um valor diferente de zero;
R = 1.0 Um valor diferente de zero.
Assim o FK en estado estacionrio que ser projetado tem as equaes 2.135 e 2.136
x[ n + 1|n] = Ax[ n|n 1] + Bu[ n]

(2.135)

x[n|n] = x[n|n 1] + K(yv[n] Cx[n|n 1])

(2.136)

Sendo que L um ganho timo de inovao. Ento em Matlab a planta representada


pela equao 2.137:
P lant = ss(A, [BB], C, 0, 1,0 y 0 )
(2.137)
A primeira sada do FK a planta de sada estimativa ye = Cx[n|n], e as sadas restantes
so as estimativas de estado, assim o ganho timo do FK dado pela equao 2.138:
[kalmf, L, , K, Z] = kalman(P lant, Q, R)
37

(2.138)

0.5345

L = 0.0101
0.4776

(2.139)

O funcionamento do FK pode ser representado como mostra a figura 2.21.

Figura 2.21: Comparao de dados com o filtro de kalman


A figura 2.21. mostra como os dados que entram no filtro so comparados com verdadeira
resposta da planta. Como entrada no sistema ser usada uma funo senoidal e gerados os
rudos w e v, partindo dos valores das varincias Q e R, obtendo assim a saida mostrada na
figura 2.22.
Onde a segunda parte da figura 2.22, da cor vermelha, mostra que a reduo do erro
mediante a implementao do FK, o qual verificado observando sua varincia, onde se
mostra que antes da filtragem a covarincia de erro tinha um valor de 0, 9871 , e aps da
filtragem a covarincia de erro tem um valor de 0.3479

2.8

FILTRO DE KALMAN VARIVEL NO TEMPO FKVT

A definio de um FK varivel no tempo feita da mesma maneira como foi apresentada


para um FK invariante no tempo, com a diferena que o tempo esta sendo atualizado em
cada um dos instantes onde so calculados os estados que definem o FK. O FKVT pode ser
determinado de duas maneiras diferentes:
Deixando constante a matriz de covarincias e modificando s o tempo para cada parmetro considerando as matrizes do sistema varivel;
Modificando o tempo ao igual que a matriz de covariana para calcular cada um dos estados.
Para obter um FKVT deve-se primeiro atualizar o tempo como mostra as equaes 2.140
e 2.141, e depois atualizar as medies baseados na atualizao do tempo, como mostrado
38

Figura 2.22: Resposta obtida usando o filtro de kalman

39

nas equaes 2.142 at 2.144.


x[n + 1|n] = Ax[n|n] + Bu[n]

(2.140)

P [n + 1|n] = AP [n|n]A0 + B Q B

(2.141)

x[n|n] = x[n|n 1] + M [n](yv[n] Cx[n|n 1])

(2.142)

M [n] = P [n|n 1]C 0 (CP [n|n 1]1 C 0 + R)

(2.143)

P [n|n] = (IM [n]C)P [n|n 1]

(2.144)

BILBLIOGRAFIA MATLAB
O procedimento para obter o FKVT em matlab o mesmo utilizado para FK discreto,
com a diferena que aqui pode ser atualizado tanto o tempo como a covarincia Q.

2.9

CONTROLE LQG

Como o controlador LQR projetado para sistemas que no tem rudo nem perturbaes, para superar o problema de certas variveis de estados que no podem ser medidas, ou so muito ruidosas, ento a analises feita usando teoria de processos estocsticos
[2].Considerando os fatos anteriormente ditos necessrio adicionar um observador estocstico ao projeto LQR, normalmente este observador um FK, o qual resolve o problema de
estimao timo dos valores das variveis de estado do sistema conhecido em presena de
rudo nas prprias variveis e medidas, onde o observado de estados considera os componentes aleatrias do sistema [2]. Depois da estimao dos valores das variveis dos estados,
pode ser feita a realimentao tima das variveis de estado para projetar um regulador linear
timo quadrtico (LQG), onde normalmente o projeto desenvolvido em duas etapas [2].
1. Determinar a matriz de ganho do filtro de Kalman [2];
2. Determinar a matriz de ganho de realimentao tima [2].
Com isto pode ser considerado como vantagens do uso de projetos de controladores LQG:
Ao integral que pode ser introduzida facilmente [33];
Sinais de referncia estocsticos podem ser includos [33];
40

Sistemas multivariveis no quadrados, com atraso nas diferentes malhas, podem ser controlados [33].
Mas o controlador LQG tambm apresenta desvantagens, entre elas esto a perda da robustez
devido incluso do estimador e ao tempo gasto com a estimao [33], No controlador LQG,
a dinmica da planta linear e conhecida , e as perturbaes presentes so estocsticas com
as propriedades estatsticas conhecidas [33] Seja o sistema a ser controlado representado
pelas equaes 2.145 e 2.146 [37]:
x(t)

= Ax(t) + Bu(t) + Gv(t)

(2.145)

y(t) = Cx(t) + w(t)

(2.146)

Onde:
x Rn o estado do sistema [37];
y Rq o vetor de medidas contaminado pelo rudo v Rq [37];
u Rm o vetor do controle a ser determinado [37];
v Rn o vetor de perturbao [37];
w Rn o vetor rudo que afeita a sada [37].
v(t) E w(t) so sinais estocsticas com mdia e varincia conhecidos [37] Em relao ao
sistema, pode-se assumir as seguintes caractersticas de v(t) e w(t):
v(t) e w(t) so rudos brancos, isto variveis estocsticas de mdia nula, o seja E {w(t)0 } =
0,E {v(t)0 } = 0 e no correlacionadas no tempo, o que igual a ter E {w(t)w()0 } = 0,
E {v(t)v()0 } = 0 para t [4];
v(t) e w(t) so no correlacionadas entre s, E {v(t)vw()0 } = 0;
v(t) e w(t) possuem matriz de covarincia conhecida e so E {w(t)w()0 } = Qw 0 e
E {v(t)v()0 } = Rv 0.
A parte fundamental do controle LQG encontrar uma lei de controle u(t) que ao ser
aplicado no sistema possa minimiza a funo 2.147 [33].
Z

1 T T
x (t)Q(t)x(t) + uT (t)R(t)u(t) dt
J(t0 ) = lim
T T 0
Sendo Q e R matrizes de ponderao como mostram as equaes 2.9 e 2.9 :
Q QT 0
41

(2.147)

R RT 0
A soluo para o problema LQG pode ser apresentada em duas etapas:
1 Projeta-se um controle LQR com u(t) = Kx(t), sendo K uma matriz de realimentao
de estados que no depende de V e W ;
2. Projeta-se um observador onde a varincia do erro de estimao E {(x xf )(x xf )}
minimizada mediante o FK.
Assim a soluo do problema LQG pode-se ser representada como apresenta a figura 2.23

Figura 2.23: Controle LQG [8]

2.9.1

Propriedades do LQG

Para a anlise do controlador LQR, substituindo a equao 2.32 na equao 2.30 obtmse a equao do sistema de malha fechada dada pela equao 2.148:
x(t)

= (A BK)x(t)

(2.148)

Os autovalores (A BK) esto no semi-plano esquerdo, caracterizando o sistema LQR


como assintoticamente estvel. A representao do FK um observador de estados do tipo
Luenberger [33], representado pela equao 2.149.
c + Bu(t) + Ly(t)
x b
t = (A LC)x(t)

(2.149)

Os autovalores de (ALC) esto no semi-plano esquerdo, caracterizando o filtro de Kalman


como assintoticamente estvel. Sendo L o ganho do observador projetado para minimizar
a varincia do erro estimado [33]. A determinao do filtro de Kalman feita buscando um
valor de L tal que possa minimizar a equao 2.150
minL E {e(t)0 , e(t)} = x(t) xf (t)
42

(2.150)

Onde a determinao de L obtida da equao de Riccati como mostra a equao 2.151.


SA0 + AS AC 0 Rv1 CS + Qw = 0

(2.151)

E o ganho do estado dado pela equao 2.152.


L(t) = SC 0 Rv1

(2.152)

O LQR e o FK possuem excelentes propriedades de robustez, margem de fase de 60 graus e


margem de ganho infinita, quando analisados isoladamente. Seria de se esperar que o sistema
formado pela juno destes dois projetos tambm apresentassem as mesmas propriedades de
robustez. Entretanto, a incluso do FK pode resultar da degradao das propriedades do
LQR, de forma que no Projeto LQG as propriedades de robustez no so garantidas [38].

2.9.2

Exemplo do controle LQG

Para o pndulo invertido, do item 2, onde foi projetado um controle LQR representado
pelas equaes 2.67 2.69, ser projetado um controle LQG, dado que o sistema requer
do modelo discreto, a discretizao do modelo feita em MATLAB mediante o comando
c2d, onde necessrio um tempo de amostragem para o caso ser T = 1/100; o sistema
discretizado representado pelas equaes 2.153 e 2.154 [11].


0.0001
x1
0.01
0.0001
0


0.9982 0.0267 0.0001
x2 0.0182
u
+
0
0
0.01 x3 0.0002
0.0454
0 0.0045 0.3119 1.0016 x4


1
x 1
x 0
2
=
x 3 0
x 4


"
# x1

1 0 0 0
x2
y=

0 0 1 0 x3
x4

(2.153)

(2.154)

As condies de desenho para uma entrada degrau de 0.2m a posio desejada tem as seguintes caractersticas:
Tempo de estabilizao de x e menor a 5s;
Tempo de impulso mximo menor aos 0.5s;
Sobre sinal de menor aos 20 graus;
Erro de estado estacionrio menor ao 2 cento para x e .

43

2.9.3

Controle atravs de alocao de plos

O prximo passo assumir que todos os quatro estados so mensurveis e projetar a


matriz de ganho de controle, como foi feito no controle LQR para o pndulo invertido em
tempo continuo. Para o caso mais simples onde R = 1, onde Q = C 0 C, obtendo a equao
2.155:

1 0 0 0
0 0 0 0

Q=
(2.155)

0 0 1 0
0 0 0 0
necessrio especificar dois parmetros, o ndice de desempenho os quais sero ajustados por tentativa e erro para obter a melhor resposta. [11]. Para o caso mais simples tem-se
o ganho de valor igual:




k = 0.9384 1.5656 18.0351 3.3368
Ento o sistema de forma matricial representado pela figura 2.24 . Do sistema apresentado

Figura 2.24: Controle LQR discreto [11]


na figura 2.24 obtida a seguinte resposta mostrada na figura 2.25 Fazendo a mesma modi-

Figura 2.25: Sada do sistema para R=1, caso mais simples [11]
44

ficao apresentada para o pndulo invertido continuo, a nova matriz Q representada pela
equao 2.156:

5000 0 0 0
0
0 0 0

Q=
(2.156)

0
0 100 0
0

Obtendo o seguinte ganho:






k = 61.9933 33.5040 95.0597 18.8300

Figura 2.26: Sada do sistema com a matriz Q modificada [11]


Na figura 2.26 pode-se observar que o sistema em malha fechada no pode ser comparado a sada diretamente com a referncia, em vez disso, ele compara o vetor de estado
multiplicado pela matriz de controle com a referencia como mostra a figura 2.24. Assim,
no deve-se esperar que a sada possa convergir para a referncia. Para obter o resultado
desejado, necessrio dimensionar a entrada de referncia, de modo que a sada seja igual
referncia. Isso pode ser feito atravs da introduo de um fator N de escala feedforward.
Como mostra a figura 2.27. Mediante a incorporao do termo N , como mostra a figura

Figura 2.27: Esquema com a entrada de referencia modificada [11]


2.27, que faz o ajuste do ganho para poder fazer a comparao da entrada de referncia com
45

a sada, o valor calculado para , N foi -61.55 , obtendo assim a resposta apresentada na figura
2.28.

Figura 2.28: Sada do controle LQR. [11]


Note-se que o erro de estado estacionrio da posio do carrinho foi eliminada. Agora o
sistema que satisfaz todos os requisitos do projeto. Esta resposta quase idntica resposta
obtida quando foi assumido que teve acesso total s variveis de estado. Isto porque os
polos do observador so rpidos, e porque o modelo assumimos para o observador idntico ao modelo da planta real (incluindo as mesmas condies iniciais). Portanto, todos os
requisitos de projeto foram atendidas com o esforo de controle mnimo. O controle LQG
obtido mediante a combinao da projeo LQR e o observador projetado partido do FK,
ento mediante o comando
L = dlqe(Ac , Gd , Cc , Qn , R, N )
Onde:
Ac = [(Ad Bd K)]; Bc = [Bd ]; Cc = [Cd ]; Dc = [Dd ];
E
L = dlqr(Ad , Bd , Q1, 1)
O qual obtido partindo das equao que representam o sistema discretizado mostrado nas
equaes 2.153 e 2.154, obtida o ganho do controlador e o ganho do observador o qual foi:




L = 19.3710 11.7568 41.2684 8.0706
"

#
0.9998 0.0013
0
0.0031
S=
0
0.0074 0.9002 0.0192

46

(a)

(b)

(c)

(d)

Figura 2.29: (a) Sistema geral (b) Sistema interno (c) Representao da planta do sistema (d)
Modelo do filtro de Kalman.
47

Figura 2.30: Sada do sistema com controle LQG e filtro de Kalman [11]
Substitudo os ganhos no sistema geral mostrada na figura 2.23, o sistema em Simulink
apresentado na figura 2.29: Pode-se perceber que o controle projetado pelo mtodo LQR
muito similar na sua resposta ao controle projetado LQG com FK, mas o figura 2.30 mostra
a sada do processo com efeitos do rudo no sistema, o qual obtido na realidade em quase
todos os sistemas.

2.9.4

Exemplo 2 do controle LQG

Para desenvolver o seguinte exemplo foi usado o exemplo dos tanques apresentado na
subseo 2.7.9, onde foi obtido o FK como contralador, ser aproveitados os estados do FK
como observador para conseguir projetatar um controle LQG, seguindo o diagrama de blocos
apresentado na figura 2.31,
A figura 2.31 mostra o comportamento do controlador LQG usando um observador de
estados de ordem dois e um observador de estados de ordem quatro, nos dois casos o controlador frente a um rudo no processo e na medida tem um comportamento bom, conseguindo
fazer o seguimento do sinal de referncia, se o rudo no processo for zero os dois controladores sero superpostos ao sinal de referncia.

2.10

CONTROLADOR PID.

O controlador proporcional, integral e derivativo (PID) gera sua sada proporcionalmente


ao erro, proporcionalmente integral do erro e proporcionalmente derivada do erro, a continuao na equao 2.157, mostrado o algoritmo de posio do controlador PID paralelo
clssico, onde o ganho proporcional tambm multiplica o termo integral e o termo derivativo.[novo].
1
u(t) = Kp e(t) + Kp
Ti

48

e(t)dt + Kp Td

de(t)
dt

(2.157)

(a)

(b)

(c)

(d)

Figura 2.31: (a) Diagrama de blocos do contole LQG de ordem dois (b) Sada do controlador
LQG de ordem dois. (c) Diagrama de blocos do contole LQG de ordem quatro (d) Sada do
controlador LQG de ordem quatro.

49

onde:
Kp constante proprocional;
Ti Tempo integral;
Td Tempo derivativo;
e(t) erro na medida.
A funo de transferncia de este controlador representada pela equao 2.158
Gc (s) = U (s)/E(s) = Kp (1 +

1
+ Td s)
sTi

(2.158)

A implementao da equao2.158 em um equipamento fsico (neumtico ou eletronico)


mo possivel em funo da variavel derivativa Td s, este termo no realisavel pelo fato
da funo de transferncia possuir um grao maior no numerador que no denominador,alem
disso este trmno tem um ganho que cresce sem limite, quando a frequncia do sinal aumenta, uma soluo muito usada implementar um filtro na parte derivativa como mostra a
equao 2.159[novo].
D(s) =

Td s
1 + Td s

(2.159)

Onde o valor normalmente um valor pequeno, por volta de 1/8, o qual permite que o
numerador predomine, que a ao derivativa desejada [novo].

50

3 VARIVEIS ALETRIAS

Dado um fenmeno aleatrio qualquer, com um certo espao de probabilidade, desejase estudar a estrutura probabilstica de quantidades associadas a esse fenmeno [12]. seja
(, F, P ) um espao de probabilidade. Denomina-se varivel aleatria, qualquer funo
X : R tal que X 1 =  : X()IF Para todo intervalo ICR Em palavras, C
tal que sua imagem inversa de intervalos I R pertencem a F . Uma varivel aleatria
, portanto, uma funo do espao amostral () nos reais, para a qual possvel calcular a
probabilidade de ocorrncia de seus valores [12].

3.1

MDIA ARITMTICA, VARINCIA E DESVIO PADRO.

Ao estudar as variaes nas propriedades mecnicas e as caractersticas dos elementos


mecnicos esta na realidade trabalhando com um fenmenos de elementos finitos, onde o
numero total desses elementos denominado como populao, a qual em alguns casos pode
ser muito grande, assim pode ser definidos [39]:
Mdia Aritmtica;
Varincia;
Desvio padro.

3.1.1

Mdia Aritmtica.

A mdia de uma varivel aleatria X uma medida de tendncia central, tambm denominada valore esperado de X e representado por E(X). definida como a mdia aritmtica
dos valores de X isto como mostra a equao 3.1:
x=

N
x1 + x2 + x3 + ......xn
1 X
=
x( i)
N
N i=1

Onde:
N o nmero de elementos [39];
xi a amostra.
A equao anterior pode-se escrever como mostra a equao 3.2 [40]:

51

(3.1)

N
1 X
xi
E(x) =
N i=1

(3.2)

A mdia aritmtica apresenta algumas propriedades [40], entre elas esto:


E(k) = k;
E(kX) = kE(X);
E(k + X) = E(X) + k;
E(Y + X) = E(X) + k;
E(X Y ) = E(X) E(Y );
E(XY ) = E(X)E(Y ).

3.1.2

Varincia.

A varincia de uma varivel aleatria X uma medida de disperso dos valores da varivel em torno da sua mdia. Ela definida como a mdia aritmtica dos quadrados dos
desvios dos valores de X em relao mdia dos prprios valores de X. Em uma populao
de tamanho N, a varincia de uma varivel aleatria denotada por V ar(x) [40], e dada
pela equao 3.3
N
1 X
V ar(X) =
(xi )2
N i=1

(3.3)

Onde a mdia da varivel X [40].


importante notar que a varincia mede a distncia entorno da mdia e no em torno de
outra medida-resumo. A varincia apresenta as seguintes propriedades [40]:
V ar(K) = 0 ;
V ar(kX) = k 2 V ar(X);
V ar(X + k) = V ar(X);
V ar(X Y ) = V ar(X) + V ar(Y );
E(X Y ) = E(X) E(Y );
E(XY ) = E(X)E(Y ).

52

3.1.3

Desvio padro.

O desvio padro da amostra, definido como a raiz quadrada da varincia da amostra e


representado pela equao 3.4:
v
u
N
u 1 X
S( x) = t
(3.4)
(x( i) x)
N 1 i=1
A equao anterior no muito conveniente para realizar clculos em calculador, para tais
propsitos utiliza-se a equao 3.5:
v
u
u
S( x) = t

1
N 1

v
u
N
N
u
X
X
(
x2i (
xi )2 /N ) = t
i=1

i=1

N
X
1
(
x2 N x2 )
N 1 i=1 i

(3.5)

Deve-se notar que alguns autores para o calculo da varincia e o desvio padro empregam
N em vez de N 1 no denominador, o qual no faz muita diferena se o numero de amostras
grande mas se o nmero de amostras pequeno si, pelo qual N 1 Fornece uma melhor
estimativa da varincia da populao da qual a amostra tomada [39].

3.2

FUNDAMENTOS BSICOS DOS PROCESSOS ESTOCSTICOS.

Objetivando a realizao um estudo sobre um fenmeno real, surge o problema relacionado obteno de modelos que se aproximem ao mxima do comportamento real. Devido
elevada complexidade para obter modelos fiis que representam o sistema a ser estudado,
faz-se o uso de modelos matemticos simplificados. procurando fazer uma quantificao
dos fenmenos de estudo. Em diversas situaes estes modelos matemticos no conseguem
refletir este comportamento, sendo necessrio o emprego de mtodos mais detalhados, muitas das vezes com elevado grau de complexidade. Uma destas modalidades de modelagem
detalhado pode ser expressa a partir de uma soluo probabilstica de modelagem utilizando
uma representao por processos estocsticos. Os processos estocsticos so representados
por variveis aleatrias e funes destas variveis aleatrias.
Diferente dos mtodos estatsticos amostrais, a resposta de um processo estocstico ser
uma funo ou uma sequncia de valores e no apenas um nmero [41]. Essa funo em
geral representa a densidade de probabilidade de um conjunto de resultados possveis para
uma determinada varivel aleatria.

53

3.3

VARIVEL ALEATRIA DISCRETA E FUNO DE PROBABILIDADE.

Uma varivel aleatria classifica como discreta se assume somente um nmero de valores finitos. A funo de probabilidade de uma varivel discreta uma funo que atribui
probabilidade a cada um dos possveis valores assumidos pela varivel. Isto , sendo X uma
varivel com valores X1 , X2 , ...., para i = 1, 2, .... [12].
3.3.1

Varivel Aleatria.

Uma varivel aleatria uma varivel cujo valor igual ao resultado de um experimento
aleatrio, ou seja, representa todo o espao amostral da experincia realizada. Dependendo
do tipo de experimento, esta varivel pode ser de natureza continua ou discreta[41].

3.3.2

Funo Densidade Probabilidade.

Para uma varivel aleatria continua, a funo densidade probabilidade descreve a probabilidade de uma a varivel aleatria assumir um determinado valor dentro de um conjunto
dado. Em outras palavras, a funo densidade probabilidade uma expresso matemtica
que representa o comportamento provvel de um conjunto de resultados possveis da varivel
aleatria [41].

3.3.3

Probabilidade condicional.

Supondo que temos dos eventos A e B, e desejamos conhecer como eles esto relacionados entre si, de tal maneira que o conhecimento sobre o evento B nos d uma informao
sobre o evento A. Para conseguir isso, temos que empregar a probabilidade condicional
P (A|B). A probabilidade condicional pode ser definida como:
P (B|A) =

3.3.4

P (B A)
P (B)

(3.6)

Probabilidade total.

Seja S o espao amostral de um dado experimento que foi divido em pi partes. Define-se
A um evento contido no espao amostral, ento pode-se definir que:
A = (A S)

(3.7)

e que:
S=

n
X
i

54

pi .

(3.8)

Ento a probabilidade de P (A) pode ser extendida como:


P (A) = P (A S).

(3.9)

Substituindo S e aplicando a regra de distribuio tem-se:

P (A) =

n
X

P (A pi ).

(3.10)

Manipulando a equao anterior, temos que:

P (A) =

n
X

P (A|pi )P (pi )

(3.11)

3.3.5

Funo de distribuio.

Sendo X uma varivel aleatria em (, F, P ) , sua funo de distribuio definida pela


equao 3.12:
FX (x) = P (x(, x |)) = P (X x)
(3.12)
Com x percorrendo todos os reais.
O conhecimento da funo de distribuio permite obter qualquer informao sobre a
varivel.Mesmo que a varivel s assuma valores num subconjunto dos reais, a funo de
distribuio definida em toda reta [12].

3.3.5.1

Propriedades da funo da distribuio.

Uma funo de distribuio de uma varivel X em (, F, P ) obedece s seguintes propriedades:


lim F (x) = 0
(3.13)
x

e
limx F (x) = 1

(3.14)

F continua direita e mo decrescente, isto F (x) F (y) sempre que x y, x, yR


[12].

3.3.5.2

Propriedades da funo de probabilidade.

A funo de probabilidade de X em (, F, P ) satisfaz:


0 p(xi ) 1, i = 1, 2, ....;
P

p(xi ) = 1.
55

Com a soma percorrem a todos os possveis valores (eventualmente infinitos)

3.4

FUNO DISTRIBUIO DE PROBABILIDADE NORMAL.

Uma varivel X segue o modelo normal se sua densidade representada pela equao
3.15:
1
f (x) =
2
2

(x)2
2 2

dx

(3.15)

com , R, > 0. usada a notao X N (, 2 )


Onde , 2 so respectivamente a mdia e a varincia da varivel e a quantidade
conhecida como desvio padro, o grfico da densidade de probabilidade N (, 2 ) apresentado na figura seguinte:

Figura 3.1: Densidade normal N (, 2 ) [12]


A funo de distribuio de probabilidade N (, 2 ) ,no tem uma forma fechada, pelo
qual o clculo de probabilidade com a densidade Normal no pode ser feito pela integral
pois esta no possui primitiva. Assim, valores de probabilidade so obtidos por integrao
numrica e apresentados em tabelas, o qual facilita o trabalho porque no necessrio fazer
uma tabela por cada par de valores dos parmetros em que se tenha interesse. Basta, apenas
tabelar as probabilidades para = 0e 2 = 1 tal como mostra a seguinte proposio [12].
Demostrao.
X
z) = P (X z + )

Z z+
(x)2
1
2 2 dx

f (x) =
e
2

Z z
z2
1
e 2 dx
f (x) =
2

P(

56

(3.16)
(3.17)
(3.18)

Em que usado y = (x )/ Observe-se que o ultimo integrando uma funo de


densidade de uma N (0, 1) e , portanto, o resultado est verificado. A Distribuio N (0, 1)
denominada Normal Padro ou Normal Reduzida. Assim por exemplo a probabilidade de X
estar em duas constantes aeb, a < b pode-se expressar como apresenta a equao 3.19:

P (a < X < b) = P (

b
b
a
a
<Z<
) = (
) (
)

(3.19)

Cujo valor numrico pode ser obtido por uso de tabelas [12].

3.4.1

Regra de Bayes.

A regra de Bayes considera a relao entre incerteza do conhecimento da ocorrncia de


um evento. De acordo com [42] a partir de dois eventos mutuamente dependentes A e B,
pode-se escrever uma expresso para a probabilidade condicional seguindo a regra de Bayes
como apresentado na Equao 3.20.
P (A|B) =

P (B|A)p(A)
P (B)

(3.20)

Em que p(A|B) a probabilidade a posteriori, p(B|A) a probabilidade de verosimilhana, p(A) e p(B) so as probabilidades a priori dos eventos. Com a regra de Bayes e
possvel conhecer o comportamento de A, tendo como base o comportamento individuais de
A e B anteriores e sua probabilidade conjunta para obter uma estimao resultante.

3.5

AUTOCORRELAO:

A autocorrelao do processo X(t) definida como a expectativa do produto de duas


variveis aleatrias X(t1 ) e X(t2 ), obtidas observando-se o processo X(t) nos tempos t1 )
e t2 ), respectivamente. [13] De maneira mas especfica pode-se escrever como apresenta a
equao 3.21:

Rx (t1 , t2 ) = E[X(t1 ), X(t2 )] =

x1 x2 fx(t1 ),x(t2 ) (X1 , X2 )dx1 dx2

(3.21)

Onde fx(t1 ),x(t2 ) (X1 X2) uma funo de densidade de probabilidade de segunda ordem
do processo. Ento pode-se falar que um processo aleatrio estritamente estacionrio se
fx(t1 ),x(t2 ) (X1 X 2) depende somente da diferena entre os tempos de observao t1 e t2 o
que significa que uma funo de autorcorrelao de um processo estritamente estacionrio
dependo somente da diferena de tempos t2 t1 como mostra a equao 3.22:
57

Rx (t1 , t1 ) = Rx (t2 t1 )t1 et2 )

(3.22)

Assim a funo de autocorrelao de um processo estritamente estacionrio x(t) escrita


como mostra a equao 3.23:
Cx (t1 , t2 ) = E[(X(t1 ) x )(X(t2 ) x )] = Rx (t2 t1 ) 2x

(3.23)

A equao anterior a semelhana ente a funo de autocorrelao e funo de autocovarincia de um processo estritamente estacionrio X(t) depende somente da diferena de
tempos t2 t1 , a equao anterior mostra que se conhecida a media e a funo de autocorrelao do processo pode ser determinada de maneira nica a funo de autocovarincia
[13].

3.5.1

Propriedades da funo de autocorrelao.

A autocorrelao de um processo estacionrio X(t) definida como mostra a equao


3.24.
Rx ( ) = E[X(t + )X(t)]
(3.24)
Essa funo tem diversas propriedades [13]:
O valor mdio quadrtico do processo pode ser obtido de Rx ( ) simplesmente quando
=0
Rx (0) = E[X 2 (t)]
(3.25)
A funo de autocorrelao Rx ( ) uma funo par de .
Rx ( ) = Rx ( )

(3.26)

O qual permite escrever a funo de autocorrelao como apresenta a seguinte equao:


Rx ( ) = E[X(t)X(t )]

(3.27)

A funo de autocorrelao Rx ( ) tem uma magnitude mxima em = 0, ou seja


|Rx ( )| Rx (0)

(3.28)

A importncia fsica da funo de autocorrelao Rx ( ) qua ela constitui um meio de


descrever a interdependncia de duas variveis aleatrias obtidas observando-se um processo
aleatrio X(t)em tempo segundos separados. Torna-se claro, portanto , que quanto mais
rapidamente o processo aleatrio X(t) se modifica com o tempo, mais rapidamente a funo
58

Figura 3.2: Ilustrao de funo de autocorrelao de processos aleatrios com flutuao


mas lenta e mais rpida [13]
de autocorrelao Rx ( ) decrescer a partir de seu mximo Rx (0) medida que se eleva
como mostra a figura seguinte:
Esse decrscimo pode ser causado por um tempo de decorrelao 0 de forma que > 0 ,
a magnitude da funo de autorrelao Rx ( ) permanecer abaixo de um algum valor prescrito.Dessa forma pode-se definir o tempo de decorrelao 0 de um processo estacionrio
X(t) de valor mdio igual a zero como tempo necessrio para que a magnitude da funo de
autocorrelao Rx ( ) decresa at, um valor mximo Rx (0) [13].

3.6

RUDO BRANCO.

A anlises de rudo de sistema de comunicao geralmente fundamentada em uma


forma idealizada de rudo chamada de rudo branco, cuja densidade espectral de potncia
independente da frequncia de operao. O adjetivo branco utilizado no sentido de que
a luz branca contm intensidades iguais de todas as frequncias dentro da banda visvel de
radiao eletromagntica [13]. Assim a densidade espectral de potncia de um rudo branco
com uma funo amostral indicada por w(t) e representado pela equao 3.29:
N0
(3.29)
2
A qual ilustrada na figura SA, as dimenses de N0 so expressadas em watts por hertz. O
parmetro N0 geralmente referenciado ao estgio de entrada do receptor de um sistema de
comunicao, ele pode ser expresso como:
Sw (f ) =

59

N0 = KTe

(3.30)

Onde K constante de Boltzmann e Te a temperatura equivalente de rudo do receptor,


a caracterstica importante da temperatura equivalente de rudo que ela depende somente
dos parmetros do sistema [13]. Como a funo de autocorrelao a transformada de
Furier inversa da densidade espectral de potncia o rudo branco pode ser expressado como
apresenta a equao 3.31:
N0
(t)
(3.31)
2
Ou seja, a funo de autocorrelao de um rudo branco consiste em uma funo delta ponderada pelo fator N20 e que ocorre em = 0, como mostra a figura ??correla2) observa-se
que Rw ( ) igual a zero para 6= 0. Consequentemente, duas amostras diferentes qualquer
de rudo branco, no importando o quanto prximas no tempo elas sejam tomadas, no so
correlacionas. Se o rudo branco w(t) tambm for gaussiano, ento as duas amostras sero
estaticamente independentes. Em certo sentido um rudo branco gaussiano representa o que
h definitivo em alietoriedade [13].
Sw (f ) =

Figura 3.3: Caractersticas do rudo branco (A) Densidade espectral de potncia. (B) Funo
de autocorrelao [13]

3.7

INTRODUO AOS PROCESSOS DE MARKOV.

Considerando um processo que pode ser descrito em cada passo por um dos N estados distintos i1 , i2 , ....in . Em cada caso o sistema pode mudar de estado (o permanecer no
mesmo) de acordo com um conjunto de probabilidades de transio. Quando estas probabilidades s dependem do estado de partida e de chegada e no dos estados anteriores, se diz
que o processo de Markov [21].
Definio: um processo estocstico Xk . k = 1, 2....com um espao de estados S =
i1 , i2 , i3 , ....iN . um processo (cadeia) de Markov se para cada n todos os estados i1 , i2 , i3 , ....iN .
60

certo que:
p(Xn = in |Xn1 = in1 , ....X1 = i1 ) = p(Xn = in |Xn1 = in1 )

(3.32)

Esta propriedade equivalente equao

p(X0 = i0 ......Xn = in ) = p(X0 = i0 )p(X1 = i1 |X0 = i0 )...p(Xn = in |Xn1 = in1 )


(3.33)
E tambm a equao:
p(AB|Xn = j) = p(A|Xn = j)p(B|Xn = j)

(3.34)

Onde A um sucesso arbitrrio definido pelos resultados dos passos 0, 1, ?.., N 1, e B


um sucesso definido pelos resultados dos passos n + 1, n + 2, ....... Esta equao descreve
normalmente a independncia entre futuro e passado, s o presente conhecido. No caso
das cadeias de Markov, o sistema esta descrito por uma matriz P de dimenso N xN onde a
probabilidade de transitar do estado i no tempo t 1 at o estado j no tempo t [21].
P (i, j)(t) = Pi,j (t) = P (Xt = j|Xt1 = i)

(3.35)

Onde Xt , a varivel aleatria da cadeia de Markov. Os valores Pi,j (t) define a matriz
Pi,j (t) de probabilidade de transio de um estado a outro no percorrer do tempo [21].
Definio: A probabilidade para se movimentar de um estado i at o estado j no percorrer de t, chamada de probabilidade de transio Pi,j (t). Si, a probabilidade de transio
Independente de t, a cadeia de Markov chamada de homognea. Se a cadeia de Markov homognea o espao S = i1 , i2 , i3 , ....iN . finito, por tanto, as probabilidades de
transio so dadas por uma matriz de transio P = Pi,j (t) que verifica Pi,j 0, i =
1, 2, .....n, j = 1, 2, .....n As matrizes com estas propriedades so chamadas estocsticas
[21].
A matriz de transio de n passos a ensima potencia de P definida por:
(n)

(n)

Pi,j = pi,j = P (Xt = j|Xtn = i)

(3.36)

Verifica-se a equao:
(n+m)

Pi,j

(n)

(m)

Pi,k Pk,j , n 0, m 0

(3.37)

Que chamada de equao de Markov. Tambm pode ser escrita de forma matricial como
mostra a seguinte equao:
P (m+n) = P m P n
(3.38)
61

tambm possvel calcular as probabilidades condicionais sobre um conjunto de estados J.


X (n)
(n)
Pi,j = p(Xt J|Xtn = i) =
Pi,j
(3.39)
jJ

3.7.1

Classificao dos estados.

Definio 2: um estado j acessvel a partir de um estado i quando se pode ir de i at j


em um nmero finito de passos. Desde o ponto de vista da matriz de transio esta definio
implica [21]
i j, se para algum n Pijn > 0;
i j, se para algum n e algum m, Pijn > 0ePijm > 0.
Em este ltimo caso se diz que os estados i e j se comunicam [21]
Proposio: a relao de comunicao uma relao de equivalncia [21]
(0)

Reflebidade:i j, j que Pij = ij ;


Simetria: se i j ento j i. imediato a partir da definio;
Transitibidade: Se i j e j k ento i k. Tambm uma aplicao imediata da
definio.
Definio 3: se uma cadeia de Markov tem todos seus estados na mesma classe de equivalncia se diz que irreduzvel. Em uma cadeia de Makov irreduzvel h uma probabilidade
positiva e um estado a qualquer outro estado [21]
Definio 4: Uma cadeia de Marvok aperidica se o mximo comum divisor de m para
P (i, j) > 0.x1 . O complementrio chamado de cadeia de Markov peridica, e em tais
processos existem estados que no comunicam para certos nmeros de passos [21]
m

Definio 5: uma cadeia que aperidica e irreduzvel chamada regular [21].


Definio 6: Um estado se chama transitrio se h uma probabilidade positiva para que
o processo volte para o estado i[21].
Definio 7: fijn =probabilidade de inicio no estado i, o processo volta para i pela primeira vez em n passos [21].
Definio 8:
fij

fijn

(3.40)

n=1

Definio 9: um estado chamado de recorrente quando o retorno a ele sucesso seguro


[21].
62

Definio 10: o valor esperado matemtico do numero de passos que so necessrios


para voltar ao mesmo estado chamado de tempo recorrente [21].

ui =

nfijn

(3.41)

n=1

Definio 11: um estado absorvente quando Pij = 1 claro que se o estado absorvente, ento ele recorrente [21].

63

4 DESCRIO DO SISTEMA SUBAQUTICO (ROV)

Na atualidade, o oceano tem um papel fundamental na economia mundial, principalmente fundamentada na indstria de extrao de petrleo. Alem disso, grande parte do meio
subaqutico ainda desconhecida pelo homem, normalmente por sua dimenso, condies
adversas do ambiente (correntes ocenicas, elevadas presses, etc.). Nesta situao os veculos subaquticos no tripulados so importantes ferramentas, pois permitem realizar inspees, coletar dados, efetuar trabalhos de construo e instalao de estruturas subaquticas,
etc. [43]
Por esta razo a robtica subaqutica nos ltimos anos de gro interesse, o qual tem
como motivao o desejo do ser humano de conquistar o fundo marino. O entorno subaqutico um ambiente hostil onde um rob pode aportar importantes vantagens, evitando riscos
a seres humanos e cumprindo seu trabalho e as misses para as que foram projetadas. [44]
O rob subaqutico ao igual que outras operaes podem operar de maneira tele operado
ROV ou de maneira autnoma AU V . No primeiro caso, o rob tele operado com controle
remoto chamado ROV , o qual fica permanentemente unido, mediante um cavo a um navio ou
plataforma. O cavo permite a transmisso de sinais de controle, e das medidas e observaes
captadas por sensores dispostos no rob, a transmisso eltrica para os sistemas dispor de
um cavo que permite sua recuperao mediante trao. O operrio desde seu local de mando
remoto controla os movimentos do rob, alem disso recebe as informaes coletadas pelos
sensores.[44]
Os AU V podem desenvolver uma tarefa programada ou planejada, interatuando a seu
redor, cumprindo com o objetivo, e voltado para um ponto desejado, sem interao do operrio. A diferena fundamental com um ROV , que no precisam de um cavo umbilical,
pelo qual necessita de um importante componente de hardware e software destinado a sua
navegao totalmente autnoma. [44]
Alm disso, estes equipamentos possuem a capacidade de realizar toda essa gama de
atividades a altas profundidades e sem colocar em risco ou perigo vidas humanas. No Brasil,
existem poucos trabalhos e pesquisas na rea de Robtica subaqutica fundamentada em
ROV e(AU V ), e de uma forma geral, a pesquisa nessa rea ainda pequena, comparada ao
nvel mundial. Existem alguns trabalhos brasileiros representativos reportados na literatura,
entre estes esto:
Barros e Soares (2002) [45] Apresentaram uma proposta de um veculo subaqutico de
baixo custo que pode operar como ROV Remotely Operated Vehicle ou AUV AutonomousUnderwater Vehicle
Souza e Maruyama (2002)[46] trabalham e investigaram em diferentes tcnicas de con64

trole para posicionamento de veculos.


Moraes (2005) e Centeno (2007)[47],[48] trataram no projeto e construo de um ROV de
baixo custo,
Magalhes (2007) [49] Fundamentou seu trabalho projetando e construindo um ROV de
baixo custo com caracterizao dos sistemas de propulso.
Luque (2007) [50]apresentou resultados de simulaes do controle de um AUV utilizando
tcnicas para sistemas multi-variveis.
Aguilar (2007) [51] Trabalharam propondo um sistema de controle inteligente e adaptativo
para veculos submarinos semi-autnimos utilizando tcnicas F uzzy.
Buscariollo (2008) [52] desenvolveu um sistema de posicionamento dinmico baseado em
viso computacional auxiliado por ponteiros laser,
Dantas, Cruz e Barros (2010) [53]trabalharam no controle longitudinal de um AUV utilizando tcnicas de controle robusto.
Gomes et al (2010) [54] apresentam estudos tericos do controle de um ROV baseado em
estrutura varivel.
Tanaka [14], fernandez bessa, trabalharam em estratgias de controle baseada na tcnica
de controle no linear de linearizao pela realimentao com compensao por lgica
fuzzy para posicionamento dinmico de um veculo robtico submarino.
O trabalho de projetar leis de controle para veculos subaquticos no-tripulados constitui
uma difcil tarefa, principalmente pela dificuldade na determinao de um modelo dinmico
realista que represente o veculo. A existncia de distrbios externos, como correntes martimas, tambm acrescenta dificuldade extra ao desempenho do sistema de controle. Os
veculos subaquticos, alm das dificuldades naturais na determinao de um modelo dinmico confivel, tambm se caracterizam por possuir uma difcil instrumentao, ou seja, a
determinao com preciso, a posio e a orientao inerciais do veculo a partir de sensores
uma tarefa complicada que pode ter um custo muito elevado. [43]

4.1

MODELO DINMICO DO VECULO ROBTICO SUBMARINO

"A modelagem matemtica do veculo subaqutica mostrada neste trabalho baseada em


trabalhos previamente apresentados por outros autores,como foi mostrado na reviso bibliogrfica, fundamentalmente pelo trabalho apresentado pelo: Eric Conrado de Souza, quem
fundamento seu estudo na Modelagem e Controle de Veculos Submarinos No Tripulados
[55], a razo principal para fazer isto, pelo fato que projetar um novo modelo matemtico
65

para um sistema submarino no ser uma grande contribuio pesquisa, dado que h muitos
anos se esta trabalhando na modelagem destes sistemas,e atualmente se conta com modelos
que apresentam resultados muito bons, ento este trabalho vai ser direcionado diretamente
em projetar estratgias e tcnicas de controle que permitam ter um bom comportamento do
veculo submarino,partindo dos resultados obtidos no trabalho de mestrado de (M E Parra
,2012), [56], onde foi feita a modelagem matemtica e controle de um quadrimotor, e projetado um controle para este sistema baseado no conhecimento das varincias, dado que
este sistema apresenta 6 graus de liberdade, de igual maneira que os veculos subaquticos,
vai ser projetado um controle do mesmo jeito, adicionalmente se trabalhara com controle
estocstico, controle LQG, FK para controlar as perturbaes do sistema e assim obter o
melhor comportamento possvel na funcionalidade do veculo subaqutico, este trabalho foi
desenvolvido usando o ROV modelo xxxx. O qual vai ser caracterizado para encontrar as respectivas constantes e variveis para projetar as diferentes tcnicas de controle anteriormente
mencionadas, que possam ter um comportamento timo comprovado mediante simulao
por meio de software como MATLAB e SIMULINK, e os respectivos testes que sero feitos
no veculo subaqutico com o que o se conta para trabalhar."
Ento o propsito de apresentar um modelo matemtico de um veculo submarino fundamentado na necessidade de obter um modelo que descreva com exatido o movimento de
um veculo robtico submarino, que compreenda tanto a dinmica de corpo rgido referente
ao veculo em si, como a representao da dinmica do fluido de um sistema contnuo, no
qual o veculo est imerso. Enquanto a dinmica de corpo rgido do veculo pode ser representada por equaes diferencias ordinria (EDO), o meio fluido deve ser representado
por um sistema de equaes diferenciais parciais (EDP ). [14] Para dar soluo analtica
ou numrica de um modelo com esse grau de complexidade, os modelos so baseados em
parmetros concentrados para representar de forma aproximada o comportamento dinmico
do veculo [14].
As equaes de movimento do veculo robtico submarino podem ser representadas em
relao a um sistema de referncia inercial ou a um sistema fixo ao corpo do veculo, como
apresenta a Figura 4.1. Com base nesse fato, as equaes de movimento do veculo podem
ser expressas em relao ao corpo rgido, da seguinte forma vetorial [57]:
M v + C(v)v + D(v)v + g() =

(4.1)

Onde : v = [vx , vy , vz , x , y , z ] vetor de velocidades linear e angular em relao ao


sistema fixo do corpo do veculo [57].
E:
M a matriz de massa total (inrcia do corpo rgido e massa adicional hidrodinmica)
x = [x, y, z, , , ] Representa a posio e orientao em relao ao sistema inercial
66

C(v) representa as foras de Coriolis e centrfugas


D(V ) so as foras decorrentes do amortecimento quadrtico hidrodinmico,
g() o vetor com as foras de restaurao (gravidade e flutuao)
d representa eventuais perturbaes provocadas pelas correntes marinhas
o vetor de forcas de controle gerada pelo sistema de propulso.
O submarino pode ser representado pela figura 4.1 :

Figura 4.1: veculo submarino co sistemas de coordenadas inercial e de corpo rigido. [14].
De acordo com os trabalhos desenvolvidos por diferentes autores como Fossen [15], do
qual foi baseado o trabalho apresentado por [17], um veculo martimo se movimenta com
seis graus de liberdade, por tanto so definidas seis coordenadas independentes requeridas
para determinar a posio e orientao do veculo. As primeiras trs coordenadas (x, y, z)
e suas primeiras derivadas temporais correspondem respectivamente posio e ao movimento translacional ao longo dos eixos X, Y eZ. As ltimas trs coordenadas (, , ) e
suas primeiras derivadas temporais descrevem respectivamente a orientao e o movimento
rotacional.
Segundo a notao definida pela SNAME [58], as componentes do movimento do veculo martimo so convencionalmente definidos como Avano, Deriva, Afundamento, Jogo,
Arfagem e Guinada do ingls surge, sway, heave, roll, pitch e yaw, respectivamente, como
mostra a Tabela 4.1.
Para determinar as equaes de movimento, dois sistemas de coordenadas so empregados o modelo mostrado na figura 4.2
67

Graus de
Foras e
Velocidade
liberdade
momentos linear
liberdade
e angular
1
Movimento na direo X (avano)
X
u
2
Movimento na direo Y (Deriva)
Y
v
3
Movimento na direo Z (afundamento) Z
w
4
Rotao sobre o eixo X
(Jogo)
K
p
5
Rotao sobre o eixo Y
(Arfagem)
M
q
6
Rotao sobre o eixo Z
(Guinada)
N
r
Tabela 4.1: sistema de referncia. Retirado de [17]

Figura 4.2: Sistemas de coordenadas de referncia. Retirado de [15]

68

Posies e
ngulos
de Euler
x
y
z

= [1 2 ]T
v = [v1 v2 ]T
= [1 2 ]T

1 = [xyz]T
v1 = [uvw]T
1 = [XY Z]T

2 = []T
v2 = [pqr]T
2 = [KM N ]T

Posio
velocidade
fora

O sistema E, pode coincidir com o sistema de coordenadas fixo ao navio em algumas


condies iniciais. Geralmente se assume que as aceleraes de um ponto na superfcie da
Terra podem ser desconsideradas, j que o movimento da Terra dificilmente vai afetar a baixa
velocidade dos veculos martimos (diferentemente dos veculos areos). Como resultado
disso, esse sistema de coordenadas pode ser considerado como inercial.
Sistema de coordenadas fixo ao Corpo OB XB YB ZB O sistema B, tem sua origem em
OB normalmente escolhida para coincidir com o centro de gravidade (CG), quando o CG
coincide com o plano principal de simetria [15]. Os eixos OB XB , OB YB eOB ZB coincidem
com os eixos principais de inrcia e so geralmente definidos como:
OB XB o eixo longitudinal (direcionado da popa proa)
OB YB o eixo transversal (direcionado a estibordo)
OB ZB o eixo normal (direcionado de cima para baixo)
Baseado na notao da Tabela 4.1, a movimentao do veculo martimo em seis graus
de liberdade pode ser descrito a partir dos seguintes vetores:
Onde denota o vetor posio e orientao com coordenadas no Sistema E, v denota o
vetor velocidade linear e angular com coordenadas no Sistemas B, e denota as foras e os
momentos atuantes sobre o navio no Sistema B.
A partir dos vetores anteriores, pode ser feita a descrio do modelo a qual dividida
em duas partes: Cinemtica que trata somente dos aspectos geomtrica do movimento, e
Dinmica que feita partindo da anlise das foras resultantes no movimento. Dessa forma,
apresentado o modelo do sistema martimo [17].

4.2

CINEMTICA

O interesse fundamental em caracterizar o movimento de um corpo no espao de estados


resulta na necessidade de estabelecer as relaes entre os diferentes sistemas de coordenadas.
Assim a primeira derivada do vetor posio 1 se relaciona com o vetor velocidade linear v1
atravs do operador de transformao no-linear J1 como definido pela equao 4.2:
1 = J1 (2 )v1
69

(4.2)

Onde J1 (2 ) uma matriz de transformao definida em relao aos ngulos de Euler:


Jogo () Arfagem () e Guinada (). Devido ao tamanho da matriz que descreve a rotao
do sistema nas coordenas de Euler, foi necessrio adotar a notao s = sen() e c = cos(),
logo essa matriz dada pelas equaes 4.3,4.4 e 4.5:

cc sc + ssc ss + scc

J1 (2 ) = sc cc + sss cs + ssc
s
sc
cc

(4.3)

2 = J2 (2 )v2

(4.4)

Onde a matriz de transformao J2 (2 ) dada por:

1 sen()tan() cos()tan()

J2 (2 ) = 0
cos()
sen()
0 sen()/cos() cos()/cos()

(4.5)

importante notar que a matriz J2 (2 ) indefinida para = /2 o que acarreta,


consequentemente, em J21 (2 ) 6= J2T (2 ). No entanto, sabe-se que, durante a maioria das
operaes prticas, os veculos martimos no so susceptveis a entrar na vizinhana de
= /2 ou podem operar sem problemas prximos a essa regio. Para os casos em que
seja essencial considerar a regio contendo = /2, as equaes cinemticas podem ser
descritas atravs de uma representao com quatro parmetros ou quatrnions. O leitor pode
obter mais detalhes sobre uma representao por quatrnions em [15].
As matrizes J1 (2 ) e J2 (2 ) podem ser obtidas atravs da composio de movimentos
de rotao do sistema B em relao a cada um dos eixos do sistema E, os detalhes so
apresentado no apndice. Assim as equaes cinemticas para um veculo martimo podem
ser expressas como representa a equao 4.6:
" # "
#" #
1
J1 (2 ) 03x3
v1
=
= J()v
2
03x3 J2 (2 ) v2

4.3

(4.6)

DINMICA

A caracterizao da dinmica do sistema consiste em estabelecer relaes entre causa e


efeito para o movimento de um corpo material. Este pode ser interpretado como corpo rgido
dependendo das dimenses e da sua distribuio de massa. Inicialmente, so definidos os
vetores seguintes, respeitado a notao definida na Tabela 4.3:
Como o veculo martimo possui dimenses no desprezveis, sua massa no est concentrada em um nico ponto, mas, sim, distribuda pela sua estrutura, portanto, deve ser tratado
70

fOB = 1 = [XY Z]T


mOB = 2 = [KM N ]T
VOB = V1 = [uvw]T
wOB = v2 = [pqr]T
rOB = [xg yg zg ]T

Vetor foras externas em relao ao sistema B


Vetor momentos externos em relao ao sistema B
Vetor velocidade linear em relao ao sistema B
Vetor velocidade linear em relao ao sistema B
Vetor de origem OB at CG em relao ao sistema B

como um corpo rgido. Dessa forma, a sua dinmica apresenta componentes relacionados
com o movimento de rotao do corpo em torno dos seus eixos, as quais correspondem
fora de Coriolis e fora Centrpeta, as quais surgem porque veculo submarino um referencial no-inercial. Ento se deve ressaltar tambm que conveniente escrever as equaes
da dinmica do movimento do corpo rgido segundo uma parametrizao no sistema E, visto
a ao dos agentes externos e a inrcia do veculo ser constantes em relao a este sistema
de coordenadas [55].
A partir de uma formulao Newton-Euler para um corpo rgido de massa m, as expresses que representam sua dinmica, definidos em relao ao sistema E,[15], podem ser
escritas como apresentam as equaes 4.7 e 4.8:
m[v1 + v2 Xv1 + v2 XrOB + (v2 XrOB )] = 1

(4.7)

I0 v2 + mrOB X(v1 + v2 Xv1 ) = 2

(4.8)

Onde I0 o tensor de inrcia em relao a OB e contm os momentos e os produtos de


inrcia do corpo rgido. Para simplificar a representao do modelo no-linear do comportamento dinmico do veculo martimo, so manipuladas as equaes 4.7 e 4.8 de maneira que
possam ser agrupadas em uma forma matricial, como se observa na equao 4.9. Os detalhes
desse desenvolvimento matemtico podem ser encontrados no apndice.
MRB v + CRB (v)v = RB

(4.9)

Onde v = [uvwpqr]T o vetor velocidade linear e angular em relao ao Sistema B


e RB = [XY ZKM N ] o vetor generalizado para as foras e os momentos externos que
agem sobre o veculo. A matriz MRB corresponde matriz de inrcia do sistema e apresenta
a caracterstica de ser nica. A matriz CRB corresponde matriz de foras centrpetas e
de Coriolis do sistema e pode ser parametrizada de diferentes maneiras. Assim o vetor
RB corresponde as perturbaes externas ao sistema e so representadas pela soma de trs
vetores, como se observa na equao 4.10.
RB = H + E +

71

(4.10)

Onde:
H representa as foras e os momentos devidos aos esforos hidrodinmicos.
E representa as foras e os momentos devidos aos esforos ambientais.
representa as foras e os momentos devidos aos propulsores conectados ao veculo martimo.

4.4

PERTURBAES EXTERNAS

De acordo com Faltinsen [59], a maioria das aplicaes de controle em veculos martimos, o princpio da superposio considerado uma boa aproximao para acrescentar a
influncia das perturbaes externas nas equaes de movimento do veculo martimo, os
detalhes sobre a modelagem matemtica podem ser encontrados em [16],[15].

4.5

EFEITOS HIDRODINMICOS

Considerando que as velocidades de operao dos veculos submarinos de operao remota raramente excedem 2 m/s, os efeitos hidrodinmicos (Fh ) podem ser representados
usando a forma aproximada pela equao de Morison [60] representada na equao 4.11.
1
Fh = CD Av |v| + CM 5 v + 5 vw
2

(4.11)

Onde:
v e vso,

respectivamente, a velocidade relativa e a acelerao relativa entre o corpo rgido


e o fluido.
vw a acelerao da correnteza marina.
A representa a superfcie de referncia.
a densidade do fluido.
5 o volume de gua deslocado pelo veculo
CD e CM so coeficientes a serem obtidos experimentalmente (os quais esto definidos
para algum alguns materiais e geometrias definidas).
O ultimo termo da 4.11 conhecido como fora de Froude-Krylov e no ser levado
em considerao neste trabalho devido ao fato que nas profundidades normais de operao
72

dos veculos submarinos, a acelerao da correnteza pode ser desprezada. Desta forma, o
coeficiente do segundo termo pode ento ser chamado de massa adicional hidrodinmica. O
primeiro termo da equao representa o amortecimento quadrtico hidrodinmico. Avaliaes experimentais [61] mostram que a equao de Morison descreve com boa preciso os
efeitos hidrodinmicos pelo movimento relativo de um corpo rgido em relao a gua.

4.6

ESFOROS AMBIENTAIS

Como foi apresentado em [15], a ao das ondas, dos ventos e das correntes martimas
constituem os agentes de distrbios ambientais mais importantes quando se considera embarcaes de superfcie, como navios ou plataformas martimas. Dessa forma, o vetor pode
ser expresso como mostra a equao 4.12.
E = Ecm + Eonda + Evento

(4.12)

, Evento correspondem aos vetores de foras e momentos induzidos


Onde Ecm , tauonda
E
pelas correntes martimas, ondas e vento, respetivamente.

Figura 4.3: Foras restauradoras do sistema B [16]

4.7

FORAS E MOMENTOS DE PROPULSO

O vetor depende da configurao especfica dos atuadores do sistema como sohlices


e lemes instalados no submarino, estas foras foram despresivas em [17], e sero analisadas
dependendo do modelo fsico usado para o desenvolvimento do projeto, no momento so
desconsideradas a dinmica dos atuadores que provm as foras e os momentos de propulso.

73

4.8

MODELO DO NAVIO DE SUPERFCIE


Assim o modelo do navio pode ser representado pelas equaes:
= J()v

(4.13)

M = MRB + MA

(4.14)

C(v) = CRB (v) + CA (v)

(4.15)

Onde:

Assumindo que o corpo est em repouso (ou na maioria das vezes est se movendo em
baixa velocidade) em um fluido ideal, matriz M sempre simtrica positiva, ou seja
M = MT > 0

(4.16)

Em um corpo rgido que se movimente em um fluido, a matriz C(v) pode ser sempre
parametrizada de tal forma que ela seja anti-simtrica, enquanto que a matriz D(v) real,
no-simtrica e estritamente positiva [16], ou seja:
= J()v

(4.17)

M v = C(v)v D(v)v g() + + E

(4.18)

c(v) = C(v)T , v<6

(4.19)

D(v) > 0, v<6

(4.20)

A partir da equao 4.18, derivado um modelo geral para a dinmica de um navio


de superfcie que se movimenta em um plano horizontal [16]. Para isso, assumem-se trs
hipteses iniciais:
1. A dinmica associada com o movimento nas direes Afundamento, Jogo e Arfagem
so ignoradas, ou seja, z = 0, w = 0, = 0, p = 0, = 0 e q = 0. Isso se deve ao
fato que o movimento na horizontal descrito somente pelas componentes nas direes
Avano, Deriva e Guinada.
74

2. O corpo apresenta uma distribuio de massa homognea e um plano de simetria em


XZ, fazendo que os momentos de inrcia Ix e Iyz so nulos.
Alm das hipteses acima apresentada, pode-se obter um modelo simplificado ao ignorar
os termos no diagonais das matrizes M e D, alm de todos os elementos da matriz Dn (v).
Essas consideraes so importantes quando o corpo apresenta trs planos de simetria e os
eixos do Sistema B so escolhidos para serem paralelos ao eixo principal do fluido deslocado, os quais so iguais ao eixo principal do corpo. Finalmente, as perturbaes induzidas
por ondas, ventos ou correntes martimas tambm so ignoradas. Assim, o modelo simplificado que representa a dinmica de um navio de superfcie que se movimenta em um plano
horizontal descrito pelas equaes 4.21 e 4.22:
= J()v

(4.21)

M v = C(v)v D(v) g() +

(4.22)

Onde as matrizes J(),M , C(v) e D so dadas por:

cos() sen() 0

J() = sen() cos() 0


0
0
1

(4.23)

m11 0
0

M = 0 m22 0
0
0 m33

(4.24)

0
0
m22 v

C(v) = 0
0
m11 u
m22 v m11 u
0

(4.25)

d11 0
0

D = 0 d22 0
0
0 d33

(4.26)

m11 = m Xu

d11 = Xu

m = m Y
22
v

d22 = Yv

m33 = Iz Nr

d = N
33
r

(4.27)

75

A configurao do vetor = [1 , 0, 3 ]T implica que o navio de superfcie no apresenta


um atuador independente na direo Deriva, ou seja, tem-se um sistema subatuado. As
componentes 1 ,e 3 correspondem a uma fora aplicada na direo Avano e um momento
aplicado na direo Guinada, respectivamente.
Por ltimo, a equao 4.22 pode ser reorganizada a fim de facilitar sua visualizao como
apresenta a equao 4.28:

x = ucos () vsen ()

y = usen () + vcos ()

= r
m11

vr md1111 u + m111 1
u = m

22

m11

v = m
ur md2222 v

22

r = (m11 m22 ) uv (d33 ) r +


m33
m33

76

(4.28)

m33 3

5 RESULTADOS OBTIDOS COM AS DIFERENTES TCNICAS DE CONTROLE

Este captulo tem como objetivo comparar as diferentes tecnicas de controles e deixar os
diferentes controladores projetados prontos para iniciar testes com sistemas reais, como sero
feito numa etapa posterior no desenvolvimento da teses do dotorado que inclui aplicao
de sistemas subquticos. O captulo incia mostrado os resultados obtidos at o momento
com as diferentes tecnicas de controle para analisar sistemas, primeramente ser mostrado o
comportamento do FK quando este usado como controlador, posteriormente ser mostrado
a analises feita para obter um filtro Butterwoth F B de segunda ordem baseado na varincia
desejada para um sistema, seguidamente ser mostrado a obteo do controladores tipo PID e
LQG, para analisar um sistema de ordem seis, e finalmente ser observado o comporatamento
do FK com o controlador PID e um FB frente a uma entrada rudosa.

5.0.1

filtro de Kalman discreto como controlador.

A continuao apresentado um exemplo onde pode-se controlar o fluxo da gua mediante um FK de segunda e quarta ordem, o qual est sendo perturbado por um rudo no
Gaussiano.

Figura 5.1: Sistema de tanques em serie


Onde:
Q a vazo volumettrica
H a altura
R resistncia ao fluxo
C capacitncia
77

Este sistema pode ser representado em funo da vazo volumtrica como apresenta a
seguinte equao:

q1 = h1h2

R1

q q1 = C1 dh1
dt

(5.1)

h2
R2

q2 =

q1 q2 = C2 dh2
dt
e suas respectivas transformadas de Laplace so representadas por:

Q1 = HAH2

R1

Q Q1 = SC1H1

(5.2)

Q2 = H2

R2

Q1 Q2 = SC2H2
Das equaes anteriores obtido:
= q h1 + h2
h1
C1 R1C1 R1C1
=
h2

h1

C2R2

1
1
+
R1C2 R2C2

(5.3)

h2

(5.4)

Para R1 = R2 = 1 e C1 = C2 = 1 o sistema de equaes fica como apresenta as


equaes 5.5 e 5.6.
= h2 h1 + u
h1

(5.5)

= h2 2h2
h2

(5.6)

Assim o sistema em espao de estados representado pela equao 5.7 e 5.8:


!
!
!
!

h1
1 1
h1
1
=
+
u

h2
1 2
h2
0
!
 h1
y= 1 0
h2


O sistema vai ser controlado como apresenta a figura 5.2

78

(5.7)

(5.8)

Figura 5.2: Modelo do sistema de tanques a ser controlado


Na figura 5.2 pode-se persever que o sistema apresenta um rudo branco e um rudo que
no Gaussiano, o rudo no Gaussiano modelado usando um FB de segunda ordem, de
maneira que o rudo tem varincia diferente de um e media diferente de zero. Inicialmente
foi projetado um controle mediante um FK discreto de segunda ordem, analisando assim o
sistema separadamente da perturbao no Gaussina, posteriormente foi projetado um controle mediante a incorporao do rudo no Gaussino( FB), obtendo assim dois sistemas de
ordem dois em serie, formando para eles um FK discreto de quarta ordem como aprenta a
figura 5.2.
O sistema anterior sem rudo no processo representado pela figura.5.3

79

Figura 5.3: Sada do sistema controlado mediante o FK de segunda e quarta ordem


Na figura 5.3 se apresenta um sistema sem rudo no processo, pode-se observar que que
assim os dois FK fazem um seguimento da sinal de entrada. O sinal de referncia do sistema
de segunda ordem, e representada pela cor verde, O FK de ordem dois,e representado
pela cor azul e o FK de ordem quatro e representada pela cor vermelha.
Pode-se observar na figura 5.3,que efetivamente o sistema esta sendo controlado e o
sinal de refncia esta seguido adequadamente, mesmo seja o FK de ordem dois ou FK de
ordem quatro, podendo-se concluir assim que o FK pode ser projetado por mio de seus
estados como um sistema de controle, a figura 5.4 representa o comportanmento dos filtros
projetados quando o sistema aprenta um rudo no processo.

80

Figura 5.4: Sada do sistema controlado mediante o FK de segunda e quarta ordem com
rudo no processo
Para a figura 5.4 foi calculado o desvio padro do sinal de referncia com relao ao
FK de ordem dois e ordem quatro, o valor obtido um valor de 7.96 e 8, 146 respeitivamente,assim pode-se analisar que o comportamento dos filtros tanto de ordem dois como de
ordem quatro tem um comportamento bom, alem disso foi calculado o valor da varincia
com relao ao sinal de referncia obtendo um valor de 0.0064 e 0.0066 para cada filtro e
mostrado na figura 5.5.

Figura 5.5: Comparao dos ruidos dos FK de ordem dois e quatro

81

5.0.2

Clculo da varincia para um sistema de segunda ordem.

Para calcular a varincia de um sistema de segunda ordem usada a funo de transferncia mostrada na equao 5.9:
G(s) =

s2

K
+ as + b

(5.9)

Onde: a,b e K So parmetros de um FB de segunda ordem, o qual comparado com


um sistema de segunda ordem como apresenta a equao 5.10:

G(s) =

2
s2 + 2s + 2

Para o sistema desajado um amortecimento =


analizada :
G(s) =

1 ,
2

(5.10)
assim a funo de transferncia

s2 + 2bs + b

(5.11)

Onde sero encontradas as constantes K e b, para que o sistema consiga atingir uma
varincia desejada; para tal fim ser discretizado o sistema e representado como mostra a
equao 5.12, e como foi desenvolvido no anexo e representado na equao A.26:

G(z) =

z 2 fd
z 2 fg z +

h
f

kz 2
(z + a)(z + a
)

(5.12)

Onde: d,f ,g e h so os parmetros correspondentes ao sistema discretizado para um


tempo de amostragem T , definidos como:
d = kT 2 ;
f = bT 2 + aT + 1;
g = 2 + aT ;
h = 1.
Para o sistema anterior deseja-se uma varincia V ar = 0.25, para obter esta varincia foi
usada a equao A.37 representada no anexo e amostrada a continuao.
 2

2
d
1
1
2

var[y(n)] =
f
(a a
)2
1 (a 2 a
2 )

(5.13)

Onde a e a
so os polos do sistema discreto, como conhecido o amortecimento do sistema assumido um polo que represente este amortecimento, e encontrado o polo faltante,
82

assim pode ser calculadas as constantes d, f, g com um tempo de amostragem T = 0.1s, e


conseguir representar o sistema discreto, mostrado na equao 5.12
G(z) =

z2

0.03473
1.627z + 0.6617

(5.14)

Partindo da equao ?? foi encontrada a expresso que representa o sistema continuo de


segunda ordem como mostra a equao ??.
G(s) =

s2

5.249
+ 4.588s + 5.249

(5.15)

Comparando a resposta do sistema discreto e continuo para uma entrada degrau, pode-se
observar que estes apresentam um ganho esttico unitrio como mostrado na figura 5.6

Figura 5.6: Comparao do sistema continuo e discreto.


O sistema discreto obtido apresenta a varincia desejada, como foi comprovado para uma
entrada de rudo branco com mdia zero e variancia unitaria, a qual representada na figura
5.7
Posteriormente foi usando o filtro digital que tem uma varincia de 0.25 e comparado
com o filtro o obtido, para comparar sua resposta frente a uma entrada degrau e a um ruido
Gausiano, este procedimento foi feito em SIMULINK como mostra a figura 5.8

83

Figura 5.7: Varincia do sistema.

(a)

(b)

Figura 5.8: (a)Diagrama de blocos para os filtros (b) Degrau dos Sistemas.
84

Pode-se observar que este sistema de maneira discreta para uma entrada degrau apresenta
o mesmo ganho esttico, como esperado, depois foi usado como entrada um rudo branco
Gaussiano de varincia unitria e meda zero, e a resposta para esta entrada mostrada na
figura 5.9:

Figura 5.9: Comparao dos ruidos com relao aos filtros.


A figura 5.9 (a), mostra o rudo nos sistemas de filtros, exportando os dados para MATLAB foi obtido um valor de variancia V ar = 0.25 para o filtro obtido, e para o fitro digital
0.2495, apresentado uma diferncia pequena em sua varincia, verificando que em efeito os
dois filtros apresentam a varincia desejada, a diferncia existente entre os dois filtros pode
ser observada na figura 5.9 onde mostrado que o comportamento do filtro digital em relao
resposta degrau bem mais rpida que a resposta obtida com o FB obtido e discretizado.
Alm disso foi trabalhado com as funes de transferncia continuas tanto para o filtro digital como para o filtro Butterworth, para comparar seu comportamento mediante o
diagrama de bode, a respostas para cada um dos sistemas como apresenta a figura 5.10:

85

Figura 5.10: Comparao dos diagrmas de Bode dos sistemas.


Para analisar os diagramas de Bode importante saber que segundo o critrio de estabilidade de Bode, um sistema estvel se, a margem de fase M F > 0 e a margem do ganho
M G > 1, assim nos diagramas de bode apresentados na figura 5.10, pode-se observar que
estes apresentam margem de ganho M G infinito, nos dois casos, no caso da margem de fase
M F , para o filtro Butterworth esta 75 e para o filtro digital 180 obtendo assim que o filtro
Butterworth estvel e o filtro digital instvel.

5.0.3

Obteno do Controlador PID.

O controlador PID projetado foi sintonizado por diferentes mtodos entre estes mtodos
esto:
Ziegler-Nichols;
Cohen e Coon;
CHR.
A escolha do mtodo de sintonizao foi baseado na resposta que estes controladores
apresentam funo do ruido, a figura 5.11, mostra os diferentes controladores obtidos.

86

Figura 5.11: Comparao dos diferentes controladores.


Na figura 5.11 pode-se observar que as piores respostas foram obtidas com os controladores sintonizados pelos mtodos de CoheneCooneCHR, para a funo de transferncia analisada, por tanto foi considerado o controlador sintonizado pelo mtodo de ZieglereN ichols.
Aqui foram feitos duas sintonizaes uma sem limitar a parte derivativa com um filtro de
primeira ordem, e outra aplicando um filtro na parte derivativa, a figura 5.11 mostra uma
resposta semelhante com estes controladores mesmo quando ele no foi sintonizado, mas a
escolha foi feita baseados na capacidade que eles tem para rejeitar o ruido no sistema quando
no se tem nenhuma entrada e mantida a perturbao no sistema e na medio, por tanto
foi escolhido o controlador representado na figura de cor vermelha que representa um controlador PID sintonizado com limite na componente derivativa, a funo de transferncia que
representa este controlador mostrada na equao 5.16.
0.4355s2 + 1.224s + 1.847
G(s) =
0.06069s2 + s

(5.16)

A figura 5.12 representa o controlador obtido mediante o mtodo de Ziegler e Nichols


sintonizado limitando a parte derivativa com um filtro de primeira ordem.

87

Figura 5.12: Resposta do controlador PID.

5.0.4

Controlador LQG.

Baseados na teora apresentada no capitulo 2, foi projetado um controlador LQG para o


sistema, pode-se observar que este controlador apresenta bom resultado, mesmo na sada do
sistema inserido o ruido na medida, como mostra a figura 5.13.

Figura 5.13: Resposta do controlador LQG.


Este controlador apresentou o ganho do sistema mostrada na equao 5.17 e o ganho de
kalman mostrado na equao 5.18. a figura 5.13 foi obtida siguindo o diagrama de blocos
paresentado na figura 2.27 para um ganho de a.juste N = 0.1928.
88

5.0.5

0.0002

0.0007

L=
0.0012

0.0006

0.0005

(5.17)

h
i
Kkalman = 4.3800 33.7203 46.1124 50.1177 36.8886

(5.18)

Obteno do parmetro Q variante no tempo

Para obter o parmetro Q que o ruido no sistema, foi desenvolvido no software SIMULINK, o diagrma de blocos apresentado na figura 5.14, onde este mostra a funo de
transferncia do sistema e o FB obtido neste captulo, o qual apresenta uma varincia de
0.25, para obter o valor do Q varivel no tempo foi usado um rudo branco com media zero
e varincia unitaria, como ruido na medida, e como ruido no sistema, foi usado um ruido
com caracteristicas diferentes conformado pela multiplicao de um ruido branco com uma
funo sinoidal, o sinal sai do sistema e entra a um filtro digital de ordem cincuenta, este
filtro digital tem varincia 0.25 e limitada por um bloco de saturao para obter o valor
positivo, a ordem do sistema foi escolhida para conseguir minimizar no mximo o nvel do
ruido inserido no sistema.

Figura 5.14: Diagrama de blocos para obter a covarincia.

89

A figura 5.15, apresenta a sada no sistema, esta figura apresenta grficos em trs cores
diferntes, a cor vermelha apresenta a sada do sistema do valor mdio da funo sinosoidal,
a cor verde representa a sada do sistema, e a cor azul esta apresentando a sada do filtro
digital, ste grfico representa a varincia do sistema, pode-se observar que esta prxima a
0.015.

Figura 5.15: Covarincia Q variavel no tempo.

5.0.6

Analises do filtro de Kalam de ordem seis

Inicialmente foram projetados diferentes FK de ordem inferior, mas os sistemas maritimos normalmente so sistemas de ordem seis, pelo qual foi projetado um filtro desta ordem,
com a finalidade de ter um modelo pronto para ser testado com sistemas reais, a figura 5.16
est representado dois sistemas com FK diferentes, o primeiro um FK variante no tempo
e o segundo un FK invariante no tempo, para cada um desse filtros foram feitas diferentes
testes como sero apresentados acontinuao.

90

Figura 5.16: Sistema variante e invariante no tempo.


Entre os testes feitos, foi inicialmente testado o FK invariante no tempo, para um valor
do Q fixo de valor 0.25 e 5 respetivamente, a figura 5.17 representa a sada do sistema sem
rudo, pode-se observar duas figuras que paresentam o mesmo formato, mas sua amplitude
diferente, isso por causa do valor do Q, a relao que eles apresentam de seia a um.

91

Figura 5.17: Comparao da sada do sistema sem ruido relao 6x.


Posteriormente foram comparados os comandos, os comandos so a sada do controlador
PID, estes apresentam ruido no proceso, a figura 5.18 mostra que o comportamento igual,
mas a amplitude das duas saidas diferente, estas tem uma relao de quince a um.

Figura 5.18: Comparao da sada do comando relao 15x.


Seguidamente foram comparadas as sadas quando considerado o ruido na medida, a
figura 5.19 mostra a saida, a cor verde mostra a sada sem ruido e a cor azul representa a
sada do sistema com rudo, pode-se observar que mesmo com rudo ela consegue seguir a
sada do sistema.
92

Figura 5.19: Comparao da sada do sistema com ruido e sem ruido.


Posterioremente foi analizado o valor do Q varivel no tempo e comparada com a sada
do sistema com ruido como mostra a figura 5.20.

Figura 5.20: Comparao da sada com varincia para o sistema com ruido.
Finalmente foi comparada a sada do sistema do sistema sem rudo, comparada com a
varincia do sistema, como mostra a figura 5.21, pode-se observar na figura 5.20 e 5.21 que
o valor mdio da varincia est sendo prximo do valor mdio da sada do sistema.

93

Figura 5.21: Comparao da sada com varincia para o sistema sem ruido.
Depois de analisar a relao Q variante no tempo, foi inserido no sistema apresentado na
figura 5.16, este valor e foi comparado a resposta de um FK variante no tempo com um FK
invariante no tempo para um valor de Q varivel, os resultados obtidos so apresentado nas
figuras 5.22 3 5.23.

Figura 5.22: Comparao dos estados do FK variante e invariante no tempo.


A figura 5.22, mostra a sada dos dois FK comparando os estados do sistema, podese observar que estes dois filtros apresentam o mesmo comportamento j que eles esto
superpostos, a figura 5.23 compara a sada no controle PID para o sistema com os dois
94

FK, pode-se observar que estes tem a mesma resposta, com isto pode-se concluir que o FK
projetado tanto variante como invariante apresenta o mesmo comportamento, isto muito
importante, pelo fato os sistemas reais o tempo varivel, consiguendo-se assim fazer uma
melhor simulao e analises de sistemas reais.

Figura 5.23: Comparao da sada do controlador PID com FK variante e invariante no


tempo.
A continuao apresentado o diagrama de Bode, para o FB com amortecimento diferente, como representa a figura 5.24, a figura verde mostra o comportamento do FB com
amortecimento 0.2, este filtro foi projetado para simular o comportamento de um filtro real,

e foi comparado com um FB com amortecimento = 1/ 2 que seria um filtro clssico.

95


Figura 5.24: Comparao do diagrama de bode filtro Butterworth com = 1/ 2 e = 0.2 .
A figura 5.25, mostra a sada dos estados do FK usando um FB com valores de amortecimento diferntes, pode-se observar que estas sadas so iguais, e que o sistema apresenta
o mesmo comportamento. As figuras 5.26 e 5.27 representam o comportamento da sada
do comando que no controlador PID e no FK quando usado o novo FB para gerar um
novo FK,e realizar o novo teste, pode-se observar que estas figuras tem o mesmo formato e

a mesma amplitude que foi obtida quando o FK foi projetado com o = 1/ 2.

Figura 5.25: Comparao da sada dos estados do FK com um filtro Butterworth = 1/ 2


e = 0.2 .

96

Figura 5.26: Comparao da sada dos estados do FK com um filtro Butterworth = 0.2 .

Figura 5.27: Comparao da sada do controlador PID com FK com um filtro Butterworth
= 0.2.
Foi feita uma comparao do sistema obtido inicialmente para calcular a varincia em
relao ao ruido branco, comparando um sistema digital de ordem trs e um sistema digital
de ordem um, com relao ao FB encontrado com varincia desejada, a figura 5.28 mostra a comparao do rudo de entrada, para os trs sistemas foi encontradas varincias de
0.25 como foi desejado, para obter estes grficos foi implementado o sistema de blocos em
SIMULINK como mostra a figura 5.29.

97

Figura 5.28: comparao das sadas dos filtros com varincia 0.25

Figura 5.29: diagrama de blocos dos filtros


Finalmente foi feita uma comparao da varincia do sistema, para diferentes filtros, um
digital de ordem 50 um digital de ordem um com varincia 0.25,a comparao mostrada
na figura 5.30, a razo pela qual foi feita a comparao do filtro digital de ordem 50 com
relao ao filtro digital de ordem unitrio, porque em recursos computacionais mais facil
fazer a programao de um sistema de ordem unitrio que um sistema de odem 50, por em a
filtragem com o filtro maior muito melhor que a obtida com o filtro de ordem inferior.

98

Figura 5.30: Comparao da sada do Q varivel para sistemas com filtros diferntes
A figura mostra quatro grficos, o grfico azul claro, representa o valor terico da varincia, o grafico da cor azul representa a sada do filtro digital de ordem 50, o grfico da
cor verde representa a sada do filtro digital de ordem unitaria e o grfico da cor vermelha
representa a sida do sistema sem o ruido na sada, pode-se observar que a nica mudana
nestes grficos relacionada ao filtro digital, dado que o filtro de ordem 50 consegue fazer
uma melohor filtragem do ruido em comparao ao filtro de ordem unitrio, por em os custos computacionais so bem maiores, a ideia implementar um filtro digital que consega
fazer uma filtragem boa, e que seja de ordem inferior para falicitar sua programao em um
sistema real.

99

6 CONCLUSES E TRABALHOS FUTUROS

100

REFERNCIAS BIBLIOGRFICAS

[1] G. T. G. A and B. G. M. A, Aplicacin de tcnicas de control ptimo usando filtro


de kalman sobre un modelo de generador elico, Masters thesis, Universidad Tecnolgica de Pereira Facultad de Ingenieras,Programa de Ingeniera Elctrica,Pereira,
2011.
[2] J. S. Golmayo, Bsqueda de estructuras de reguladores en sistemas de control discreto
que minimicen los efectos debidos a la utilizacin de aritmtica de precisin finita,
Ph.D. dissertation, UNIVERSIDAD DE ALCAL ESCUELA POLITCTICA SUPERIOR, 2007.
[3] M. Domingues, Modelo de controlador lqg/ltr com filtro de kalman com dinmica
aumentada aplicado a sistemas de posicionamento dinmico de estruturas ocenicas,
Masters thesis, Universidade Federal do Rio de Janeiro,2007, RIO DE JANEIRO, RJ
? BRASIL, 2007.
[4] J. L. Beltran, Simulacin de un pndulo invertido, Masters thesis, Universidad de
Sevilla,Escuela Superior de Ingenieros, Departamento de Ingeniera de Sistemas y Automtica,Valencia Espaa, 2010.

[5] ejemplos de tutoriales de control, http://www.eng.newcastle.edu.au/ jhb519/teaching/caut2/etc/InvPe


[6] A. S. H. C.
[7] E. V. Gonzalez., Control del helicoptero 2d usando metodos de control robusto h1,
Masters thesis, UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE INGENIERIA DEPARTAMENTO DE ELECTRICA Y ELECTRONICA, 2011.
[8] V. P. Pinto, Controladores robustos lqg-ltr com ao integral aplicados ao controle
de geradores elicos interligados ao sistema de distribuio de energia eltrica baseados em mquina de induo duplamente alimentada, Masters thesis, Universidade
federal do Cear, Centro de tecnologia,programa de ps-graduao em engenharia eltrica,Fortaleza,Brasil, 2012.
[9] B. A. D. B. Vieria, Aplicao de filtro de kalman para um problema inverso de localizao e deteco de dano em problema 2-d, Masters thesis, UNIVERSIDADE
FEDERAL DE ITAJUB, INSTITUTO DE ENGENHARIA MECNICA, 2011.
[10] Kalman Filtering Theory and Practice Using Matlab. John Wiley and Sons. publisher,
2001.

101

[11] Inverted Pendulum: Digital Controller Design,control tutorials for matlab & simulink,http://ctms.engin.umich.edu/CTMS/index.php?example=InvertedPendulum&section
=ControlDigital.
[12] Probabilidade e variveis aleatrias.

Editorial da universidade de so Paulo, 2006.

[13] Sistemas de comunicao analgicos e digitais.

Ed. Bookman, 2001.

[14] M. C. Tanaka, J. M. de Macedo Fernandes, and W. M. Bessa, Utilizao da lgica


fuzzy no posicionamento dinmico de um veculo robtico submarino, Universidade
Federal do Rio Grande do Norte, Centro de Tecnologia, Departamento de Engenharia
Mecnica, Campus Universitrio Lago a Nova, pp. 11001109., 2010.
[15]
[16] J. PAN and K. D. DO, Control of ships and underwater vehicles: Design for underactuated and nonlinear marine systems, Crawley, Australia: Springer, 2009. (Advances
in Industrial Control), 2009.
[17] L. FILHO and J. O. A., Controle por planejamento de trajetria para hovercraft,
Masters thesis, Faculdade de Tecnologia, Universidade de Braslia, 2012.
[18] E. C. Real, Dessensibilizao da estrutura de controle lqg aplicada ao modelo de uma
suspenso ativa utilizando a tcnica prabi, Masters thesis, instituto militar de engenharia de rio de janeiro, 2012.
[19] Optimal State Estimation: Kalman, H?, and Nonlinear Approaches.
2006.

Inc,Publication,

[20] A. Mansilla J, Gacia J, Control de velocidad de un motor dc, usando filtros de kalman
en tiempo continuo, 2002.
[21] S. Garrido, Identificacin, estimacin y control de sistemas no-lineales mediante rgo,
Ph.D. dissertation, Universidad Carlos III de Madrid, Departamento de ingeniera de
sistemas y automtica, 1999.
[22] Modern Control Engineering.

Ed. Prentice Hall 2ra ed., 1990.

[23] J. Gomes, Controle robusto lqg/ltr com recuperao do ganho da malha de transferncia, Masters thesis, Universidade Federal do Maranho, Centro de Cincias Exatas e
Tecnologia, Programa de Ps-graduao em Engenharia de Eletricidade, 2006.
[24] J. M. D. Cano, Modelo y control lqr de una aeronave de cuatro rotores, 2007.
[25] S. Menndez, Aportacion al control del convertidor cc/ca de tres niveles, Ph.D. dissertation, universitat politectinca de catalunya,departamento de ingenieria electronica,
2004.
102

[26] J. M. D. Cano, Modelo y control lqr de una aeronave de cuatro rotores. Masters thesis, Universidad de Sevilla Escuela Superior de Ingenieros Departamento de Ingeniera
de Sistemas y Automtica., 2007.
[27] Modern Control Theory.

Brogan, 1991.

[28] Discrete-Time Control systems.

Ed. Prentice Hall 3ra ed., 1997.

[29] Multivariable Feedback Control anaysis and Design.

publisher, 1996.

[30] A. G. P. J. Zarco, Estimacin de estados y parmetros en redes electicas, Masters


thesis, Universitat Politcnica de Valencia,Escuela Tcnica Superior. de Ingeniera Informtica, Sevilla Espaa, 1999.
[31] An Introduction to the Kalman Filter.

Chapel Hill, 2001.

[32] R. H. H. Velasco, Deteco on-line de descontinuidades no processo de soldagem gtaw


usando sensoriamento infravermelho e fpgas, Masters thesis, UNIVERSIDADE DE
BRASLIA,FACULDADE DE TECNOLOGIA,DEPARTAMENTO DE ENGENHARIA MECNICA, 2010.
[33] D. Coutinho, Controle multivarivel mdulo 10, Universidade Federal de Santa Catarina,Departamento de Automao e Sistemas, Tech. Rep., 2010.
[34] F. B. Ortega, Modelo y contol del pndulo invertido sobre carro mediante sistemas
hbridos, Masters thesis, Universidad de Sevilla, Escuela tcnica Superior de ingenieros, 2012.
[35] F.Castellanos, Levantamiento y estabilizacin del pndulo invertido, Masters thesis,
Facultad de Ingeniera, UNAM, Mxico, 2003.
[36] F. Fajardo, Simulaciton de sistemas dinmicos mediante discretizacin en espacio de
estados, Revista Sigma, 2010.
[37] B. Sinopoli, L. Schenato, M. Franceschetti, K. Poolla, and S. Sastry, Lqg control with
missing observation and control packets.
[38] J. MACIEJOWSKI, Multivariable feedback design, Addison-Wesley Publishing
Company, 1989.
[39] Projeto de engenharia mecnica.

McGraw-Hill ,NY EUA, Ed 7,editorial., 2004.

[40] C. D. Silva, Pensamento estatstico e raciocnio sobre variao: um estudo com professores de matemticas. doutorado, Ph.D. dissertation, Pontifcia Universidade Cattilica,So Paulo, 2007.
[41] A. Zylberberg, Probabilidad y Estadistica.
103

Nueva Libreria, 2005.

[42] C. M. Bishop, Pattern Recognition and Machine Learning, Springer, Ed., 2006.
[43] K. V, P. L. J, D. JR2, G. S, C. M, and B. S, Controle automtico de umrov para
inspeo de estruturas submersas, 2011.
[44] G. N. J. A. J. S. P. C. Garcia D, Morales R, Efectos de la no linealidad del modelo
dinmico em el control de un robot subacutico, 2007.
[45] S. F. J. A. Barros, E. A., Desenvolvimento de um rob submarino de baixo custo,
Congresso Brasileiro de Automtica, pp. 2121212, 2002.
[46] M. N. Souza, E., An investigation of dynamic positioning strategies for unmanned
underwater vehicles, Congresso Brasileiro de Automtica, pp. 12731278., 2002.
[47] C. E. R. Moraes, Projeto e construo de um veculo subaqutico no tripulado de
baixo custo, Masters thesis, Fundao Universidade Federal de Rio Grande, 2005.
[48] M. L. R.-I. Centeno, Projeto e construo de um veculo subaqutico no tripulado de
baixo custo, Masters thesis, Fundao Universidade Federal de Rio Grande, 2007.
[49] P. H. V. Magalhes, Desenvolvimento de um submersvel remotamente operado de
baixo custo e caracterizao dos sistemas de propulso e vetorizao de empuxo por hlice. belo horizonte, Ph.D. dissertation, Universidade Federal de Minas Gerais., 2007.
[50] J. C. C. Luque, Controle robusto multivarivel para um veculo submersvel autnomo, Masters thesis, Escola Politcnica da Universidade de So Paul, 2007.
[51] L. L. P. Aguilar, Controle inteligente para a navegao de veculos submarinos semiautnomos, Masters thesis, Escola Politcnica da Universidade de So Paul, 2007.
[52] P. H. Buscariollo, Sistema de posicionamento dinmico baseado em viso computacional e laser, Ph.D. dissertation, Escola Politcnica da Universidade de So Paulo.,
2008.
[53] J. J. d. B. Dantas, J. L. D.; Cruz, Controle longitudinal do veculo autnomo submarino pirajuba, utilizando tcnicas de controle robusto lqg/ltr, Congresso Brasileiro de
Automtica, XVIII, 2010.
[54] S. e. a. Gomes, Controle de um veculo subaqutico baseado em estrutura varivel,
Seminrio e Workshop em Engenharia Ocenica, IV, 2010.
[55] E. C. SOUZA, Modelagem e controle de veculos submarinos no tripulados. Masters thesis, Escola Politcnica da Universidade de So Paulo, 2003.
[56] M. Parra., Modelagem matemtica e controle de um quadrimotor, Masters thesis, UNIVERSIDADE DE BRASLIA, FACULDADE DE TECNOLOGIA,DEPARTAMENTO DE ENGENHARIA MECNICA, 2012.
104

[57] Garcia, Morales, and azorin, Efectos de la no linealidad del modelo dinmico en el
control de un robot subacutico, Universidad Miguel Hernndez, Alicante Espaa,
2010.
[58] SNAME, Nomenclature for treating the motion of a submerged body through a fluid,
Technical and Research Bulletin, 1950.
[59] F. O., Sea loads on ships and offshore structures, Cambridge University,Cambridge
Ocean Technology Series, 1993.
[60] Marine Hydrodynamics.

MIT Press, 1986.

[61] K. E. Kleczka, W. and F. Pinto, Analytic-numeric study of a submerged double pendulum, In M.P. Paido ussis and M.K. Au-Yang, eds., Internetional Symposium on FlowInduced Vibration and Noise. Anaheim, USA., 1992.

105

APNDICES

106

A. EXPRESSES MATEMTICAS DA
CINEMTICA EDINMICA DE UM VECULO
MARTIMO
Este anexo tem como objetivo fornecer mais detalhes das expresses que descrevem o
modelo geral de um veculo martimo. Como ponto de partida, descreve-se o desenvolvimento das matrizes de transformao que relacionam os sistemas de coordenadas utilizados
na modelagem. Em seguida, demonstra-se como obter a forma matricial que representa o
comportamento dinmico do sistema. Finalmente, apresenta-se as matrizes que representam
os esforos hidrodinmicos do sistema. No objetivo deste anexo realizar o desenvolvimento completo do modelo, mas fornecer um apoio ao leitor de forma que ele possa melhorar sua compreenso global das equaes que representam o modelo. Para maiores detalhes,
recomenda-se a leitura da tese de mestrado Modelagem e Controle de Veculos Submarinos
No Tripulados de Eric Conrado de Souza [55], juntamente com o livro Guidance and
Control of Ocean Vehicles de Fossen [15]

A.1

CINEMTICA

Na cinemtica J1 (2 ) obtido atravs das trs rotaes fundamentais do sistema com relao aos eixos, estas rotaes normalmente so representada de forma matricial e descrevem
os ngulos de Euler [15],como apresenta as equaes A.1,A.2 e A.3:

Cx,

1
0
0

= 0 cos () sen ()
0 sen () sen ()

Cy,

cos () 0 sen ()

= 0
1
0

sen () 0 cos ()

(A.1)

(A.2)

Cz,

cos () sen () 0

= sen () cos () 0
0
0
1

(A.3)

A notao Ci, denota o nguo de rotao em relao ao eixo i. Alem disso, ibserva-se
1
T
que todas as matrizes apresentam a propriedade de serem ortogonais, ou seja Ci,
= Ci,
.
107

Das equaes anteriores citar elas obtida a sequencia de rotao da matriz de transformao
J1 (2 ), como representa a equao A.4:
T
T
T
J1 (2 ) = Cz,
Cy,
Cx,

(A.4)

A equao A.2 foi expandida por mdio das multiplicao matricial e finalmente obter a
equao A.4 apresentada no capitulo 4. De acordo com Fossen [15], a matriz de transformao J2 (2 obtida inspecionando a expresso da orientao do Sistema B com respeito ao
Sistema E, como pode ser vista na equao A.5.

v2 = Cz,

0
0



= 0 + Cx, + Cx, Cy, 0
0
0

(A.5)

Alm disso, partindo da equao A.5 ver pode-se expressar v2 como:

1 sen()tan() cos()tan()
1
0
sen()

J21 (2 ) = 0 cos() cos()sen() J2 (2 ) = 0


cos()
sen()
0 sen()/cos() cos()/cos()
0 sen() cos()cos()
(A.6)
dessa forma, expandido a equao A.3 pode se mostrar que
J2T (2 ) 6= J21 (2 )

A.2

(A.7)

DINMICA

Todas as equaes matemticas que representam o comportamento dinmico de um veculo martimo como foi apresentado no capitulo 4 pelas equaes 4.7 e 4.8, esto sob as
seguintes hipteses:
A massa est distribuda uniformemente.
A massa constante e a posio do centro de massa considerado invariante.
A origem do Sistema B no coincide com o centro de gravidade do veculo, para o caso
mais geral. [55]

108

Expandido as equaes 4.7 e 4.8 chega-se em 6 equaes utilizando os vetores definidos na


seo 4.3

m [u vr + wq xG (q 2 + r2 ) + yG (pq r)
+ zG (pr q)]
=X

m [v wp + ur yG (r2 + p2 ) + xG (qr p)
+ xG (qp r)]
=Y

m [w uq + vp z (p2 + q 2 ) + z (rp q)
+ yG (rq p)]
=Z
G
G

Ix p + (Iz Iy )qr (r + pq)Ixz + (r2 q 2 )Iyz + (pr q)I


xy + m[yG (w uq + vp) zG (v wp +

Iy q + (Ix Iz )rp (p + qr)Ixy + (p2 r2 )Izx + (qp r)I


yz + m[zG (u vr + wq) xG (w uq +

I r + (I I )pq (q + rp)I + (q 2 p2)I + (rq p)I


zx + m[xG(v wp + ur) yG (r vr +
z
y
x
yz
xy
(A.8)
Das equaes anteriores pode ser identificado que, as trs primeiras equaes representam o
movimento translacional, e as trs ltimas representam o movimento rotacional. Estas equaes podem ser representadas de forma matricial para obter a forma matricial representada
pela equao 4.9. Assim m representa a massa do veculo, ento a matriz de inrciaMRB
[55] :

m
0
0
0
mzg myg

m
0
mzg
0
mxg
0

0
0
m
myg mxg
0

0
mz
my
I
I
I
g
g
x
xy
xz

mzg
0
mxg Iyx
Iy
Iyz
myg mxg
0
Izx Izy
Iz

MRB

(A.9)

Em relao a matriz de foras centrpetas e de coriolis CRB , a parametrizao escolhida


nesse trabalho de tal forma a obter uma representao anti-simtrica [55]:
#
"
03x3 A1
(A.10)
CRB =
AT1 A2

m(yg q + zg r) m(xg q w) m(xg r + v)

A1 = m(yg p + w) m(zg q + xg p) m(yg r u)


m(zg p v) m(zg q + u) m(xg p + yg q)

Iyz q Ixz p + Iz r Iyz r + Ixy p + Iy q

A2 = Iyz q + Ixz p Iz r
0
Ixz r + Ixy p Ix p
Iyz r + Ixy p Iy q Ixz r + Ixy q Ix p
0

A.3

(A.11)

(A.12)

ESFOROS HIDRODINMICOS

Como foi descrito na equao 4.11, os esforos hidrodinmicos podem ser expressados
atravs de um conjunto de matrizes. Os esforos devido massa adicional so expressos
109

em funo da matriz de inrcia MA e da matriz de foras centrpetas e de coriolis da massa


adicional [55]:

Xu Xv Xw Xp Xq Xr

Yu Yv Yw Yp Yq Yr

Zu Zv Zw Zp Zq Zr

MA =
(A.13)

K
K
K
K
K
K
v
w
p
q
r
u

Mu Mv Mw Mp Mq Mr
Nu Nv Nw Np Nq Nr

0
0
0
0
a3
a2

0
0
a3
0 a1
0

0
0
a
a
0
2
1

CA =
(A.14)
0 a
a2
0 b3 b2
3

a3
0 a1 b3
0 b1
a2 a1
0 b2 b1
0
onde:

a1 = Xu u + Xv v + Xw w + Xp p + Xq q + Xr r

a2 = Yu u + Yv v + Yw w + Yp p + Yq q + Yr r

a = Z u + Z v + Z w + Z p + Z q + Z r
3
u
v
w
p
q
r

b1 = Ku u + Kv v + Kw w + Kp p + Kq q + Kr r

b2 = Mu u + Mv v + Mw w + Mp p + Mq q + Mr r

b = N u + N v + N w + N p + N q + N r
3
u
v
w
p
q
r

(A.15)

Se o veiculo possue planos de simetria a matriz MA considerada como diagonal. [55]


Nas equaes 4.13 e 4.14, utilizou-se a notao definida por [58] para representar, por exemplo, a fora hidrodinmica YA ao longo do eixo Y devido a uma acelerao u na direo X
dada por:
Y
(A.16)
u
Na subseo 4.3, os esforos devido ao arrasto hidrodinmico foram expressos atravs de
duas matrizes DeDn (v). A primeira composta por elementos lineares representados na
equao A.17:

Xu Xv Xw Xp Xq X r

Yu Yv Yw Yp Yq Yr

Zu Zv Zw Zp Zq Zr

D=
(A.17)
K K K

K
K
K
u
v
w
p
q
r

Mu Mv Mw Mp Mq Mr
Nu Nv Nw Np Nq Nr
YA = Yu u,
Yu =

A segunda dissipao hidrodinmica geralmente esta aproximao feita utilizando


uma expanso de terceira ordem da srie de Taylor ou atravs de funes modulares, o que
110

resulta no aparecimento de termos no-lineares. Nesse trabalho, ignorou-se a influncia desses termos no desenvolvimento do modelo. porque os esforos devido as foras restauradoras
so modelados atravs da matriz g [55]:

(W B)sen()

(W B)cos()sen()

(W

B)cos()cos()

g =
(y W y B)cos()cos() + (z W z B)cos()sen()
g
b
g
b

(zg W zb B)sen() + (xg W xb B)cos()cos()


(xg W xb B)cos()sen() (yg W yb B)sen()

(A.18)

Onde o empuxo hidrosttico e o peso so dados respectivamente pelas equaes A.19 e A.20:
W = MG

(A.19)

B = a g5

(A.20)

Nas equaes acima, o smbolo 5 representa o volume de fluido deslocado pelo corpo,
g a acelerao da gravidade, ea a densidade

A.4

CALCULO DA VARINCIA DE UM SISTEMA DISCRETO

O calculo da varincia do sistema analisado relacionando o sistema com uma cadeia


de Markov, Para realizar este calculo e obter uma expresso que represente a varincia em
funo dos polos do sistema foi seguida a metodologia apresentada no trabalho de mestrado
do Miguel Parra [56]. Onde se mostra detalhadamente o procedimento para um sistema de
segunda ordem utilizando processos Markovianos.
Para um sistema de segunda ordem discreto, pode-se fazer a seguinte aproximao:
G(z)

z2

k
k

2
+ 2n z + n
(z + a)(z + a
)

(A.21)

Onde a relao de s e z esta relacionada com a equao seguinte, a qual mostra como
pode ser discretizado um sistema.
z1
s=
(A.22)
zT
G(z) =

z2d
f z 2 gz + h

Seja o sistema de segunda ordem continuo representado por A.24:


111

(A.23)

G(s) =

s2

k
+ as + b

(A.24)

Substituindo a equao A.22 na equao A.24 tem-se a equao A.25.


G(Z) =

k

z1 2
zT

+a

z1
zT

=
+b

z 2 (kT 2 )
z 2 (bT 2 + aT + 1) (2 + aT )z + 1

(A.25)

Onde:
d = kT 2
f = bT 2 + aT + 1
g = 2 + aT
h=1
T = 0.1
K=1
b=1

a= 2
assim o sistema pode ser escrito como apresenta a equao A.26
G(z) =

z 2 fd
z 2 fg z +

h
f

kz 2
(z + a)(z + a
)

(A.26)

Seguindo o procedimento apresentado por Miguel, esta equao discretizada pode ser
representada mediante somatrias como apresenta a equao A.27 e A.28:

y(n) =

i
d XX a
j a (ij) X(n i)
f i=0 j=0
X(n)

(A.27)

i
d XX a

( )j a i X(n i)
f i=0 j=0 a

(A.28)

y(n) =

Usando algumas propriedades dos somatrios


i
X
j=0

(l)j =

(1 l)i+1
1l

112

(A.29)

i
X
(l)j =
j=0

1
1l

(A.30)

Aplicando estas propriedades e manipulando matemticamente a equao A.28, a somatria pode ser representada pela equao A.31:
y(n) =

i
dX j
bi
(l) =
f j=0
a a

(A.31)

Onde:
bi = a (i+1) a
(i+1)

(A.32)

Que relaciona os polos do sistemas,ento o sistema fica representado pela equao A.33:
#

 "X

1
d
y(n) =
bi X(n i)
(A.33)
a a
f i=0
Assim a equao anterior apresenta o sistema em funo dos estados futuros em base dos
estados atuais,de maneira que o calculo da varincia representada pela equao A.34
"
var[y(n)] = var

1
a a

"
##
d X i
b X(n i)
f i=0

(A.34)

Como a equao A.34 apresenta propriedades de Markov, pelo fato que os instantes
futuros so independetes dos estados passados, a varincia pode ser calculada de maneira
independente para cada um destes estados e representada como apresenta a equao A.35:

var[y(n)] =

2  2
1
d
2

f
a a

!2
bi

(A.35)

i=0

como:
b0 = a a

b1 = a (2) a
(2)
b2 = a (3) a
(3)
usando a propriedade A.29 e A.30.

X
i=0

bi =

1
1 (a 2 a
2 )

Ento a varincia representada pela equao A.37:


113

(A.36)

 2

2
d
1
1
2
var[y(n)] =

f
(a a)2
1 (a 2 a
2 )

(A.37)

Onde esta equao programada em MATLAB para obter o valor da varincia de entrada
ao filtro Butterworth.

114