Projeto Pesquisa Edital 5 2013

Jos Mrio Arajo
Aplicao de Redes Neurais Articiais em

Mapas Complexos de Controle e Estimao de
Estados: Conjuntos Invariantes para Controle
sob Restries, Controle Preditivo e
Observadores de Estado
Salvador-BA
Junho de 2013
Jos Mrio Arajo
Aplicao de Redes Neurais Articiais em Mapas

Complexos de Controle e Estimao de Estados:
Conjuntos Invariantes para Controle sob Restries,
Controle Preditivo e Observadores de Estado
Projeto de pesquisa apresentado

PRPGI/IFBA em atendimento ao Edital
05/2013.
Instituto Federal de Educao, Cincia e Tecnologia da Bahia

Departamento de Tecnologia em Eletro-Eletrnica
Salvador-BA
Junho de 2013
Introduo
Tcnicas baseadas em conjuntos invariantes so bastante atrativas, pois
possibilitam, em muitos casos, o uso de leis de controle ou injeo de sada do tipo
o-line (analticos), sendo uma caracterstica inerente destas leis serem do tipo am
por partes. Porm, em situaes em que os conjuntos invariantes polidricos tm uma
grande quantidade de faces/vrtices e para sistemas de ordem elevada, o nmero de
regies do espao de estados que dene a lei de controle /injeo cresce de maneira
aprecivel, e utiliza-se programao multiparamtrica para determinao destas leis. Uma
forma de contornar tal complexidade da lei o-line utilizar uma lei online, calculada
a cada passo k; este procedimento interessante para sistemas com dinmica lenta,
mas pode torna-se infactvel no caso de sistemas rpidos, como sistemas robticos. Este
projeto tem como objetivo demonstrar a utilidade de redes neurais articiais (RNAs) na
concepo de leis de controle o-line, utilizando como conjunto de aprendizado dados de
simulao do sistema de controle ou observador de estado, que no possuem limitao
de tempo computacional. A partir de informaes obtidas de simulao em ambiente
MATLAB/SIMULINK, pretende-se realizar o treinamento de RNAs do tipo avano e
com retro propagao. Tais redes devero ser capazes de emular o mapa entrada-sada de
uma lei de controle/estimao online, oferecendo ento leis o-line do tipo estticas ou
dinmicas, estas ltimas bastante utilizadas no caso de realimentao de sada. Estudos
de simulao e experimentais conduzidos em uma planta de nvel ou em um pndulo
invertido sero utilizados a m de demonstrar a eccia dos resultados obtidos.
Justicativa
O desenvolvimento de tcnicas de controle que levam em considerao restries
nos estados, sadas e esforos de controle tem recebido crescente ateno nos ltimos
anos. Da mesma maneira, o problema dual, de limitar erros de estimao, quando, por
exemplo, do uso de observadores de estado, ganha tambm espao, dado que informaes
ao mximo verossmeis devem ser utilizadas em realimentao por observadores. A
importncia e motivao de tais estudos podem ser encontradas em uma vasta literatura,
e compreende, por exemplo, operao segura de processos (BLANCHINI; MIANI,
2008);(GOODWIN; SERON; DON, 2005), estabilidade garantida em controle preditivo
baseado em modelo ((MAYNE et al., 2000)) e o problema de saturao de sensores a
atuadores ((TARBOURIECH; QUEINNEC; GARCIA, 2007)). De particular interesse
so as tcnicas baseadas em invarincia de conjuntos, para os quais merecem
destaque invarincia positiva (BADDOU et al., 2006),(RAMI; AYAD; MESQUINE,
2007),(VASSILAKI; HENNET; BITSORIS, 1988), invarincia controlada (BLANCHINI,
1994),(DREA; HENNET,
1999b),(DREA; HENNET,
1999a)
e
invarincia
condicionada (DOREA, 2006),(ARAUJO; BARROS; DOREA, 2010). Nos trs casos, o

problema da invarincia resumidamente pode ser descrito como: dado um sistema linear
e um conjunto que caracteriza as restries do problema de controle ou estimao, obter
um conjunto invariante que, uma vez que a condio inicial pertena a este conjunto,
sua trajetria possa ser connada ao mesmo por meio de uma lei de controle ou de
injeo de sada. A invarincia positiva pode ser considerada a tcnica mais conservadora,
pois em geral utiliza leis do tipo lineares, e.g. realimentao de estados com lei u
= kx ou estimadores lineares com lei de injeo de sada l = Ly. Em contraponto,
as tcnicas de invarincia controlada e condicionada, alm de apresentar resultados
menos conservadores, permitem em diversas situaes que os conjuntos invariantes
os maiores possveis, no caso de controle, e to menores quanto possvel, no caso de
estimao possam ser calculados atravs de algoritmos robustos. Trabalhos recentes do
proponente e de colaboradores, alm de propor uma extenso de tcnicas de invarincia
controlada e condicionada de sistemas lineares na forma padro para sistemas descritores
singulares, mostram aplicaes experimentais ou baseadas em situaes reais da
aplicao de tais tcnicas em sistemas de controle de nvel (ARAUJO; DOREA,
2010),(ARAUJO; BARROS; DOREA,
2010),(ARAUJO; BARROS; DOREA,
2012),(ARAUJO et al., 2012),(ARAUJO; BARROS; DOREA, 2013).
O controle preditivo baseado em modelo (MPC) (CAMACHO; BORDONS,
2004),(RAWLINGS; MAYNE, 2009) uma tcnica moderna e de alta aceitao e
utilizao na indstria, mesmo sendo de arrojado desenvolvimento matemtico. Diversos
so os relatos de diminuio de custos de produo pelo uso de programao de set-points
timos via MPC (ZHENG, 2010). Uma das maiores diculdades em se utilizar o MPC
em aplicaes em que o comportamento dinmico da planta rpido seu elevado custo
computacional e tempo de processamento no clculo da lei de controle, que exige a soluo
de um problema de otimizao cuja complexidade cresce rapidamente com a ordem do
modelo da planta, com restries e com o horizonte de predio. Diversos tem sido os
esforos para tornar mais rpido o processamento na tcnica MPC de modo a permitir
seu uso em sistemas mais crticos do ponto de vista de tempo de processamento, como
por exemplo no trabalho de (WANG; BOYD, 2010).
As redes neurais articiais (RNA) formam uma classe de sistemas do domnio
conhecido como inteligncia articial. As RNAs tem sido aplicadas com enorme sucesso em
problemas de controle, otimizao, identicao de sistemas, dentre outras, apresentando
excelente capacidade de aproximao do comportamento real de sistemas, mesmo na
presena de rudo, no-linearidades e outras caractersticas de abordagem mais complexa
no estudo de sistemas (NARENDRA; PARTHASARATHY, 1990). Trata-se de uma
estrutura matemtica que mimetiza, a grosso modo, o funcionamento de neurnios
cerebrais, uma busca de modelar um mapa entrada-sada. Seu elemento bsico um
neurnio, que composto de pesos sinpticos, bias (polarizao) e uma funo de
ativao, sendo a mais apreciada para captura de caratersticas no-lineares funes do

tipo sigmides (forma de s). Diversas so as possibilidade de estruturas para as redes
neurais, que o agrupamento de vrios neurnios. As mais utilizadas so as tipo feedfoward
(sem retroalimentao) e do tipo backpropagation (com retroalimentao). As primeiras
so bastante teis, por exemplo, em sistemas de controle, enquanto as ltimas encontra
grande aplicabilidade em problemas de otimizao. Neste projeto, pretende-se utilizar
redes neurais articiais para emular o mapa entrada-sada da lei de controle/injeo de
sada online, que consiste na soluo de problemas de programao linear (PLs) que visam
minimizar a taxa de contrao do estado/erro de estimao ou determinar a sequncia
tima de controle dentro do horizonte de predio. A partir de um conjunto de treinamento
obtido via simulao de leis online, sero realizados projetos de RNAs que aproximem estas
leis, de forma a se obter um projeto o-line like, ou seja, as RNAs fornecendo, de maneira
similar s leis explcitas, os sinais de controle e de injeo de sada em sistemas de controle
e observao de estado.
Objetivos
O objetivo deste projeto utilizar RNAs para emular o mapa entrada-sada da
lei de controle/injeo de sada online em sistemas de controle sob restries e MPC,
que consiste na soluo de problemas de programao linear (PLs). A quantidade de PLs
a serem resolvidas a cada passo depende da complexidade do poliedro invariante, que
pode ser traduzida pelo seu nmero de faces, e tambm, no caso de MPC, do horizonte
de predio. Espera-se como principais resultados a reduo de custo computacional em
relao ao clculo online, permitindo com isso a implementao destas tcnicas de controle
em sistemas de dinmica rpida, como o pndulo invertido.
Como objetivos especcos, so listados:
Propor o uso de RNAs para emular o mapa entrada-sada de leis de controle online
que asseguram o respeito s restries, reduzindo o tempo de computao desta lei;
Propor o uso de RNAs para emular o mapa entrada-sada de leis de injeo de sada
online que asseguram o respeito limitao de erro de estimao, reduzindo o tempo
de computao desta lei;
Propor o uso de RNAs para a emulao de leis de controle online em controle pela
tcnica MPC;
Aplicar RNAs por meio de tcnicas de agrupamento (clustering) para a reduo de
complexidade de regies polidricas no clculo hbrido (explcito+online) de leis de
controle utilizando a tcnica MPC;
Implementar as RNAs obtidas em um esquema de controle e estimao em tempo

real para um sistema fsico (planta).
Metodologia
Estudos computacionais (simulao) e experimentais utilizando uma planta
didtica de uso e aceitao amplos, o pndulo invertido, sero conduzidos pela equipe
executora e outros colaboradores. A metodologia a ser empregada na execuo do projeto
envolve o desenvolvimento dos seguintes itens:
Estudo de alternativas de RNAs arquitetura, nmero de camadas e treinamento
para aplicao em controle por realimentao dinmica de sada sob restries, com
as RNAs emulando as superfcies de controle a partir de conjuntos de treinamento
obtidos por leis online. Exemplos de simulao sero explorados am de investigar o
esforo computacional de leis explcitas, leis online e leis dadas por relao entradasada das RNAs resultantes.
Estudo de alternativas de RNAs arquitetura, nmero de camadas e treinamento
para aplicao em observadores de estado com limitao de erro. Novamente sero
explorados exemplos numricos para instigao e esforo computacional.
Estudo de alternativas de RNAs arquitetura, nmero de camadas e treinamento para
aplicaes em MPC. Sero investigadas duas possibilidades: o uso de RNAs para
emulao completa de uma lei de controle online e tambm seu uso para reduo
de complexidade da regio polidrica das restries, o que permite a determinao
de leis explicitas subtimas.
Implementao experimental das RNAs em problemas de realimentao dinmica
de sada, utilizando uma planta de nvel ou pndulo invertido;
Implementao experimental das RNAs em problemas de observao de estados,
utilizando o pndulo invertido;
Implementao experimental das RNAs para MPC, utilizando o pndulo invertido.
Resultados esperados
O desenvolvimento da proposta resultar em novas tcnicas no domnio de
controle sob restries e de MPC, e o envolvimento de estudantes de graduao prev
tambm a qualicao de recursos humanos em alto nvel. Espera-se ainda a divulgao
dos resultados obtidos em eventos e peridicos especializados de elevado impacto nas
comunidade de controle e automao e inteligncia articial.
Viabilidade de execuo
A execuo do projeto, nos itens concernentes estudos de simulao, conta
com infraestrutura adequada no Laboratrio de Processamento Digital de Sinais do
Instituto Federal da Bahia. Para execuo das etapas experimentais, a aquisio de uma
planta didtica do pndulo invertido j foi solicitada em uma proposta submetida
agncia de fomento. Existe ainda a possibilidade de se utilizar a infraestrutura de plantas
experimentais em instituies parceiras, como a UFBA e a UFCG, que possuem palntas
de controle de nvel, prontas para utilizao em testes dos programas obtidos dos estudos
de simulao.
Mecanismos de Transferncia de Resultados

Alm das maneiras tradicionais, que inclui publicao de artigos em eventos e
peridicos, publicao de dissertaes e monograas, valorizar-se- a disponibilizao dos
cdigos e toolboxes produzidos em repositrios pblicos e centrais de trocas de arquivos.
A capacidade de reproduo dos resultados alcanados de grande valor, pois permite o
desenvolvimento mais gil de outros projetos que possam se beneciar das informaes,
bem como o aprimoramento e comparao entre tcnicas por desenvolvedores, com a
possibilidade de utilizao das tcnicas desenvolvidas em produtos nais.
Referncias
ARAUJO, J. M.; BARROS, P. R.; DOREA, C. E. T. Conditioned-invariant polyhedral
sets for observers with error limitation in discrete-time descriptor systems. In: Proceedings
of the 19th International Symposium on Mathematical Theory of Networks and Systems.
[S.l.: s.n.], 2010. p. 6569. Citado na pgina 3.
ARAUJO, J. M.; BARROS, P. R.; DOREA, C. E. T. Design of observers with error
limitation in discrete-time descriptor systems: A case study of a hydraulic tank system.
IEEE Transactions on Control Systems Technology, v. 20, n. 4, p. 1041 1047, july 2012.
Citado na pgina 3.
ARAUJO, J. M.; BARROS, P. R.; DOREA, C. E. T. Dynamic output feedback control
of constrained descriptor systems. Transactions of the Institute of Measurement and
Control, 2013. Citado na pgina 3.
ARAUJO, J. M. et al. Output feedback control of constrained descriptor systems: a case
study of a hydraulic tank system. Proceedings of the Institution of Mechanical Engineers,
Part I: Journal of Systems and Control Engineering, v. 226, n. 3, p. 429436, 2012.
Citado na pgina 3.
ARAUJO, J. M.; DOREA, C. E. T. Controlled-invariant polyhedral sets for constrained
discrete-time descriptor systems. In: CAMARINHA-MATOS, P. P. L.; RIBEIRO, L.
(Ed.). Emerging Trends in Technological Innovation. Lisbon, Protugal: [s.n.], 2010. (IFIP
AICT, 384), p. 385392. Citado na pgina 3.
BADDOU, A. et al. On improving the convergence rate of linear continuous-time systems
subject to asymmetrically constrained control. Mathematical Problems in Engineering,
v. 2006, 2006. Citado na pgina 2.
BLANCHINI, F. Ultimate boundedness control for uncertain discrete-time systems via
set-induced lyapunov functions. IEEE Transactions on Automatic Control, v. 39, n. 2, p.
428433, 1994. Citado na pgina 2.
BLANCHINI, F.; MIANI, S. Set-Theoretic Methods in Control. [S.l.]: Birkhuser, 2008.
(Systems & control). Citado na pgina 2.
CAMACHO, E.; BORDONS, C. Model predictive control. Springer-Verlag GmbH, 2004.
(Advanced textbooks in control and signal processing). ISBN 9781852336943. Disponvel
em: <http://books.google.com.br/books?id=Sc1H3f3E8CQC>. Citado na pgina 3.
DOREA, C. Set-invariant estimators for multiple-output discrete-time systems. In:
Decision and Control, 2006 45th IEEE Conference on. [S.l.: s.n.], 2006. p. 4538 4543.
Citado na pgina 3.
DREA, C. E. T.; HENNET, J. C. (a,b)-invariance conditions of polyhedral domains
for continuous-time systems. European Journal of Control, v. 5, n. 1, p. 7081, 1999.
Citado na pgina 2.
Referncias
DREA, C. E. T.; HENNET, J. C. (a,b)-invariant polyhedral sets of linear discrete-time

systems. Journal of Optimization Theory and Applications, v. 103, n. 3, p. 521542,
1999. Citado na pgina 2.
GOODWIN, G.; SERON, M.; DON, J. D. Constrained Control and Estimation: And
Optimization Approach. [S.l.]: Springer-Verlag London Limited, 2005. (Communications
and control engineering). Citado na pgina 2.
MAYNE, D. et al. Constrained model predictive control: Stability and optimality.
Automatica, v. 36, n. 6, p. 789 814, 2000. Citado na pgina 2.
NARENDRA, K.; PARTHASARATHY, K. Identication and control of dynamical
systems using neural networks. Neural Networks, IEEE Transactions on, v. 1, n. 1, p.
427, 1990. ISSN 1045-9227. Citado na pgina 3.
RAMI, M. A.; AYAD, H.; MESQUINE, F. Enlarging ellipsoidal invariant sets for
constrained linear systems. International Journal of Innovative Computing, Information
and Control, v. 3, n. 5, p. 10971108, 2007. Citado na pgina 2.
RAWLINGS, J.; MAYNE, D. Model Predictive Control: Theory and
Design. Nob Hill Publishing, 2009. ISBN 9780975937709. Disponvel em:
<http://books.google.com.br/books?id=3\ rfQQAACAAJ>. Citado na pgina
3.
TARBOURIECH, S.; QUEINNEC, I.; GARCIA, G. Anti-windup strategy for systems
subject to actuator and sensor saturations. In: TARBOURIECH, S.; GARCIA, G.;
GLATTFELDER, A. (Ed.). Advanced Strategies in Control Systems with Input and
Output Constraints. [S.l.]: Springer Berlin Heidelberg, 2007, (Lecture Notes in Control
and Information Sciences, v. 346). p. 173205. Citado na pgina 2.
VASSILAKI, M.; HENNET, J.; BITSORIS, G. Feedback control in linear discrete-time
systems under state and control constraints. International Journal of Control, v. 47,
n. 6, p. 17271735, 1988. Citado na pgina 2.
WANG, Y.; BOYD, S. Fast model predictive control using online optimization. Control
Systems Technology, IEEE Transactions on, v. 18, n. 2, p. 267278, 2010. ISSN
1063-6536. Citado na pgina 3.
ZHENG, T. (Ed.). Advanced Model Predictive Control. [S.l.]: InTech, 2010. Citado na
pgina 3.

Projeto Pesquisa Edital 5 2013

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Projeto Pesquisa Edital 5 2013

Enviado por

Direitos autorais:

Formatos disponíveis

Jos Mrio Arajo

Aplicao de Redes Neurais Articiais em

Jos Mrio Arajo

Aplicao de Redes Neurais Articiais em Mapas

Projeto de pesquisa apresentado

Instituto Federal de Educao, Cincia e Tecnologia da Bahia

condicionada (DOREA, 2006),(ARAUJO; BARROS; DOREA, 2010). Nos trs casos, o

ativao, sendo a mais apreciada para captura de caratersticas no-lineares funes do

Implementar as RNAs obtidas em um esquema de controle e estimao em tempo

Mecanismos de Transferncia de Resultados

DREA, C. E. T.; HENNET, J. C. (a,b)-invariant polyhedral sets of linear discrete-time

Você também pode gostar