Escolar Documentos
Profissional Documentos
Cultura Documentos
Controle de Posicao de um Rob Manipulador SCARA utilizando Redes o Neurais Articiais com Treinamento On-Line
Sandro Battistella Edson R. De Pieri Marcelo R. Stemmer Laborat rio de Controle e Microinform tica - LCMI o a Departamento de Automacao e Sistemas - DAS Universidade Federal de Santa Catarina - UFSC Florian polis - Brasil o E-mails: sandro@lcmi.ufsc.br, edson@lcmi.ufsc.br, marcelo@lcmi.ufsc.br
Abstract
The objetive of this work is the evaluation of the employment of articial neural networks in position control of robot manipulators. Employing a on-line training method with MLP networks, it is possible to obtain more compact structures, avoiding the need for a training set to train the neural network. Acting in a parallel structure together with a classical PD controler, the neural network is capable to compensate the non-linearities, disturbances and non-modelled dynamics existing on the robot structure. The neural controller performance is compared with the classical PD control in the joint space. Numerical simulations of the whole structure of a SCARA robot are shown.
Introducao
No contexto da teoria de controle, as RNAs s o visa tas como um formalismo para modelagem de processos, empregadas como estruturas para representacao do co nhecimento da planta e para o mapeamento de suas caractersticas que s o armazenadas na RNA [1]. A pro a priedade de mapeamento funcional n o-linear fornece as a ` RNAs uma forte capacidade de representacao interna de problemas, tornando-as atrativas para o seu emprego em controle de processos [2], [1], [3], [4], [5]. As t cnicas cl ssicas de controle de rob s manie a o puladores ou aquelas baseadas em modelo (controle de posicao e/ou forca) envolvem o conhecimento das equacoes que descrevem o comportamento din mico do a manipulador. Nesses casos, existe uma certa diculdade inerente ao processo de levantamento desse modelo din mico devido as incertezas a respeito dos par metros a ` a do manipulador, estando esse comportamento tamb m e sujeito as inu ncias externas como perturbacoes e ` e variacoes param tricas [6], [7], [8] e [9]. e A diculdade na modelagem da equacao din mica a do manipulador vem motivando o emprego de RNAs
Este trabalho foi realizado com apoio do CNPq
no controle de rob s. Uma rede neural pode ter uma o performance melhor quando n o precisa aprender muia ta informacao a respeito do processo [10]. Em estruturas em que a rede neural assume um papel auxiliar ao controlador do manipulador (compensacao de n o-linearidades, a minimizar esforco de controle, corrigir um modelo pa ram trico xo, estimar valores para controladores adape tativos, etc.), a complexidade na sua utilizacao diminui, dispensando, muitas vezes, o treinamento off-line. Al m e disso, a diculdade em se levantar um conjunto de exemplos adequado n o se constitui de tarefa f cil, uma vez a a que a din mica do manipulador e descrita por equacoes a n o-lineares, acopladas e multivari veis, exigindo redes a a com um n mero elevado de neur nios [11], [12] e [4]. u o Nesse artigo ser o vistos os problemas envolvidos no a controle de posicao no espaco livre (sem restricao ao mo vimento do manipulador). Simulacoes num ricas para o e caso do controle de um manipulador SCARA s o realizaa das, com o objetivo de comparar a performance do controlador cl ssico de juntas PD e do o controlador neural a proposto.
Uma rede neural articial consiste de um conjunto de unidades de processamento, chamadas de neur onios, interligadas atrav s de conex es, ou pesos. Uma RNA e o busca aproximar o funcionamento real de uma rede de neur nios. O neur nio articial apresenta n terminais o o de entrada, que representam os dendritos, respons veis a por receber os sinais provenientes dos outros neur nios, o e um terminal de sada, que representa o ax nio, res o pons vel por transmitir os impulsos eletroqumicos aos a demais neur nios. A cada um dos terminais de entrao da est associado um peso, que representa o valor da coa nex o entre as sinapses dos neur nios. a o Uma topologia muito empregada consiste das redes Multilayer Perceptrons, ou simplesmente, redes MLP. As redes MLP tem a capacidade de realizar mapeamentos n o-lineares complexos, sendo, portanto, muito uteis em a aplicacoes como reconhecimento de padr es e controle o de processos. Elas ser o adotadas nesse trabalho devido a 338
2 6 H q = 6 4
A forma construtiva de um rob manipulador do tipo o SCARA, do ingl s Selective Compliant Articulated Roe bot for Assembly pode ser vista na g. 1.
q1
I4
m3 + m4
0
I4 I4 7 7 I4
0
3 5
(2)
h11
q2
d3
2 6 C q; q_q_ = 6 4
0 0 0
0 0 0 0
(4)
0
= = =
O modelo do manipulador, bem como seus par metros, correspondem ao rob manipulador a o SCARA, que se encontra disponvel no Laborat rio de o Rob tica da Universidade Federal de Santa Catarina. o Os deslocamentos i correspondem aos deslocamentos angulares nas juntas de rotacao do manipulador, en quanto que a vari vel de junta d3 representa o deslocaa mento linear na junta vertical de translacao. Os valores nominais de massa dos elos mi , momentos de in rcia Ii , e comprimentos dos elos li e centros de massa lci s o gea ralmente obtidos em cat logos ou atrav s de estimacoes. a e O modelo adotado n o considera o atrito e a exibilidade a existente nas juntas. A equacao din mica para um manipulador rgido ob a tida pelo m todo de Lagrange, e desprezando-se o atrito e nas suas juntas, e denida pela equacao 1 [9], [8] e [7]:
m2
, m k
m , k
k
+ +
mA l1 l2
_ sin2 2
mA l1 l2 sin2 _1 + _2
(5)
mA l1 l2 sin2 _1 : m3 + m4 g 0 T
Gq =
00
(6)
onde g e o valor da aceleracao da gravidade (g = 9.81 m/s2 ). Os valores dos par metros e coecientes do manipua lador SCARA utilizados nesse trabalho encontram-se listados na tabela 1.
Controle de Posicao
(1)
onde q e o vetor n 1 de coordenadas generalizadas das juntas, H q e a matriz de in rcia n n positiva e denida e sim trica, C q; q e a matrizr n n de forcas e _ e torques centrfugos e de Coriolis, Gq e o vetor n 1 de forcas gravitacionais, e e o vetor n 1 de torque de controle sobre as juntas. Para um manipulador rob tico o do tipo SCARA, as matrizes para a equacao 1 s o apre a sentadas a seguir. 339
Quando o rob desempenha tarefas que n o geram o a interacoes entre a din mica do meio e do pr prio manipu a o lador - manipulador no espaco de tarefa livre - o objetivo do sistema de controle consiste basicamente em comandar a posicao, a velocidade, e eventualmente, a aceleracao nas juntas do manipulador. 4.1 Controle PD/PID Dois dos controladores mais simples inicialmente utilizados para o controle de posicao, constituem-se dos controladores cl ssicos PD e PID (equacoes 7 e 8): a
A/D
Par metro a Massa do elo 1 (m1 ) Massa do elo 2 (m2 ) Massa do elo 3 (m3 ) Massa do elo 4 (m4 ) In rcia do elo 1 (I1 ) e In rcia do elo 2 (I2 ) e In rcia do elo 3 (I3 ) e In rcia do elo 4 (I4 ) e Comprimento do elo 1 (l1 ) Comprimento do elo 2 (l2 ) Centro de massa do elo 1 (lc1 ) Centro de massa do elo 2 (lc2 ) Origem do sistema de coordenadas da terceira junta d0
Valor 11.4 Kg 19.5 Kg 2 Kg 1.5 Kg 0.23 Kg m2 0.16 Kg m2 0.1 Kg m2 0.1 Kg m2 0.25 m 0.25 m 0.118 m 0.116 m 0.678 m
qd
Gerador de Trajet rias o +
n e
PD Digital
q q _ q
D/A Dinamica do Manipulador
qd qd _
uc
A/D
As trajet rias de refer ncia empregadas constituemo e se de curvas do tipo spline e s o apresentadas na gura a 3.
Referncias de Posio 1 0.8
Kpqd , q , Kdq_
Zt
0
(7)
Posio [rad,m]
0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 0 junta1 junta2 junta3 junta4 1 2 3 Tempo [s] 4 5 6
,Kdq_ + Kp qd , q + Ki
qd , q@
(8)
onde K: s o as matrizes de ganho dos controladores, de a ordem nxn, positivas e geralmente diagonais, e qd e o valor de refer ncia para o deslocamento nas juntas q . e 4.2 Controle Neural
Figura 3: Refer ncia de posicao nas juntas e A lei de controle neural adotada nesse trabalho, consiste basicamente em um controlador cl ssico do tipo PD a e uma rede neural sendo empregada para compensar as n o-linearidades e as perturbacoes sobre o sistema. Difea rente de muitas abordagens propostas de controle neural de posicao de rob s manipuladores [13], [14], [10], [15] o [16], [17], a estrutura de controle no necessita de fase a de treinamento pr vio, sendo o treinamento realizado de e forma on-line, ou seja, atuando sobre o processo. O objetivo da estrutura de controle proposta consiste em gerar o sinal atrav s da equacao e
=
onde uc e o sinal de controle proveniente de um PD di gital, empregado para estabilizar o processo durante o regime transit rio. A gura 2 apresenta a estrutura de cono trole proposta. A rede neural utiliza o sinal de controle uc para o seu treinamento. Intepretando esse sinal como o erro de treinamento, a rede neural busca ajustar seus pesos de forma a minimizar esse erro, fornecendo um valor de torque n nas suas sadas (uma para cada junta). Dessa forma, obt m-se, indiretamente, a minimizacao do erro e de posicao e velocidade, pois o controlador PD consiste da soma do produto dos ganhos pelos erros de posic ao e velocidade. 340
uc + n
(9)
Os desempenhos dos controladores PD e Neural s o a analisados em tr s situacoes distintas: condicoes nomie nais de operacao; variacoes e incertezas param tricas e e perturbacoes; e movimentacao de uma carga desconheci da acoplada ao efetuador nal. O perodo de amostragem empregado foi de 2.5 ms. As simulacoes foram feitas nos softwares MATLAB 4.2 e SIMULINK 1.3c. Os controladores implementados s o digitais. a Todos os controladores foram projetados levando em consideracao somente as condicoes nominais de operacao.
Na estrutura de controle neural, foi empregada uma rede MLP, com quatro camadas de neur onios. A camada de entrada cont m 12 neur nios - quatro para aos vae o lores de posicao q , quatro para os valores de velocida de nas juntas q , e mais quatro neur nios para os valores _ o de aceleracao desejadas qd . As duas camadas escondi das possuem, respectivamente, oito e cinco neur nios. A o ultima, apresenta quatro neur nios, um para cada junta do o manipulador. Foi escolhida como funcao de ativacao dos
neur nios a funcao tangente hiperb lica, com inclinacao o o igual a um. Para o treinamento da rede neural utilizou-se o algoritmo backpropagation. As matrizes de pesos e bias foram inicializadas com valores rand micos 0.05. A taxa o de aprendizado empregada e da ordem de 0.001. 6.1 Condicoes Nominais Considerando o manipulador livre de perturbacoes externas e sem imprecis es na sua modelagem, observouo se o desempenho dos controladores para o seguimento da trajet ria da gura 3. o As guras 4 e 5 apresentam a performance dos controladores de juntas.
Controle PD 1.5 junta 1 1 junta 2
6.2 Variacao Param trica e Perturbacoes e Aqui considera-se a exist ncia de imprecis es no coe o nhecimento dos par metros, decorrente de possveis era ros de estimacao ou variacoes param tricas devido as in e ` u ncias do meio. As variacoes consideradas s o: + 20% e a para m1 e m4 , - 20% para m3 , + 10% para I1 e I4 , - 10% para I3 , + 15% para l1 e - 15% para l2 . De forma a vericar o comportamento dos controladores frente a exist ncia de perturbacoes, foram aplie cados torques contr rios ao movimento do manipulaa dor. No instante 3 segundos foi aplicada na junta 1 uma perturbacao de 20% do valor m ximo permitido para es a sa junta, e outro sinal no instante 4 segundos na junta 3, tamb m com valor de 20% do m ximo torque permitido. e a As guras 6 e 7 apresentam a performance dos controladores para os casos de perturbacao e variacao de par metros. a
Controle PD 1.5
0.5
Posio [rad,m]
junta 1 junta 3 1
junta 2
junta 3 0
1.5 0
3 Tempo [s]
0.5 junta 4 1
Posio [rad,m]
0.5 junta 3 0
1.5 0
A exist ncia de um erro em regime permanente do e posicionamento da terceira junta, ocorre em funcao da n o compensacao do termo de gravidade pelo controlador a PD (gura 4). Por sua vez, o controlador neural apresenta um seguimento com um erro muito pequeno, em comparacao ao controle PD (gura 5). Observa-se que a capacidade de compensacao que a rede oferece ao sistema de controle, no caso, contrabalanca o efeito gravitacional existente na terceira junta do manipulador. 341
Figura 7: Controle Neural: Variacao param trica e e perturbacao O controlador PD n o sofre muita inu ncia das a e variacoes param tricas. Essa caracterstica pode ser vista e nos primeiros 3 segundos do seguimento de trajet ria (o gura 6). Nesse caso, os ganhos do controlador ainda s o a sucientes para manter uma boa performance de controle frente as variacoes param tricas. Entretanto, observa-se e
que o erro devido ao efeito de gravidade e agravado pela perturbacao existente na terceira junta. Na estrat gia de controle neural, a rede e capaz de e compensar as variacoes param tricas e as perturbacoes e atuando sobre o manipulador. No caso simulado (gura 7) a inu ncia da perturbacao n o chega a ser visvel, e a garantindo um seguimento de trajet ria similar ao do cao so nominal. Isso ocorre, uma vez que a rede atua nas situacoes em que o controlador PD n o consegue garan a tir uma boa performance de controle, como e o caso da exist ncia de perturbacoes e incertezas ou variacoes pae ram tricas. e 6.3 Variacao de Carga Procurando executar a trajet ria da gura 3, observao se a performance dos controladores para o caso em que e considerado o transporte de uma carga desconhecida. O valor da carga n o se encontra includo no modelo a din mico do manipulador. A carga possui uma massa de a 5 Kg, e encontra-se acoplada ao manipulador nos primeiros 4 segundos da trajet ria. o As guras 8 e 9 apresentam o desempenho dos controladores para o caso de variacao de carga.
Controle PD 1.5 junta 1 1 junta 2
Dessa forma, os efeitos dos torques gravitacionais s o a mais relevantes, como pode ser visto na gura 8. Novamente a estrutura de controle neural foi capaz de satisfazer os requisitos de controle. A rede, nesse caso, funciona como um compensador de gravidade. O torque provido pela rede e capaz de suprir a deci ncia da es e trutura de controle do tipo PD, que n o apresenta a capaa cidade de compensacao dos termos de gravidade (gura 9). 6.4 An lise do Esforco de Controle a As guras 10 e 11 apresentam as acoes de contro le para o caso onde existem variacoes param tricas e e perturbacoes atuando sobre o manipulador. Observa-se que o controlador neural apresenta uma acao de controle mais oscilat ria. Esse inconveniente o acontece devido a dois fatores. A primeira inu ncia e ` e decorrente da necessidade de ajuste dos pesos da rede frente as mudancas de refer ncia ou a exist ncia de uma ` e ` e perturbacao. O segundo fator prov m da falta de conhe e cimento sobre a interacao entre o controlador cl ssico e a a rede neural, n o sendo conhecida uma forma de estaa belecer crit rios de projeto e an lise de estabilidade do e a sistema manipulador/controlador + rede neural, de forma a incluir a otimizacao da lei de controle durante a fase de projeto do controlador. Al m disso, o treinamento da e rede neural encontra-se baseado somente no erro de posicionamento, e n o leva em conta o esforco da acao de a controle.
Controle PD 100
0.5
Posio [rad,m]
junta 3 0
0.5 junta 4 1 60
Ao de Controle [N.m]
80
1.5 0
3 Tempo [s]
40
20
0.5
Conclus es o
1.5 0
3 Tempo [s]
Figura 9: Controle Neural: Variacao de carga O acoplamento de uma carga no efetuador nal, corresponde em um acr scimo de massa na terceira junta. e 342
O emprego de estruturas adaptativas em controle de rob s e uma alternativa as t cnicas de controle conveno ` e cional que necessitam do conhecimento analtico do mo delo do manipulador. A vantagem do emprego de redes neurais reside justamente na n o necessidade do conhea cimento da planta, sendo capaz de aprender o modelo din mico do manipulador, incluindo as n o-linearidades, a a e tamb m as incertezas. e
80
Laborat rio de Rob tica da UFSC. A estrat gia est o o e a tamb m sendo alterada de forma a permitir o controle de e forca, que ser tema de outro artigo em futuro pr ximo. a o
60
Ao de Controle [N.m]
40
Refer ncias e
[1] K. J. Hunt, D. Sbarbaro, R. Zbikowski, and P. J. Ganthrop. Neural networks for control systems - a survey. Automatic, 28(6):13851406, 1992. [2] I. H. S. Filho and M. R. Stemmer. Redes Neurais. LCMI - UFSC - Florian polis, 1993. o [3] K. S. Narendra. Neural networks for control: Theory and practice. Proceedings of IEEE, 84(10):13851406, October 1996. [4] T. Fukuda and T. Shibata. Theory and applications of neural networks for industrial control systems. IEEE Transactions on Industrial Electronics, 39(6):472489, December 1992. [5] M. Agarwal. A systematic classication of neural network-based control. IEEE Control Systems, pages 75 93, April 1997. [6] L. S. Wilnger. A comparison of force control algoritms for robots in contact with exible environments. Masters thesis, Rensselaer - Polytechnic Institute, Troy, New York, 1992. [7] C. C. de Wit, B. Siciliano, and G. Bastin. Theory of Robot Control. Springer-Verlag, 1996. [8] F. L. Lewis, C. T. Abdallah, and D. M. Dawson. Control of Robot Manipulators. MacMillan Publishing Co., 1993. [9] H. Asada and J. J. E. Slotine. Robot Analysis and Control. John Wiley and Sons, 1986. [10] A. Ishiguro, T. Furuhashi, S. Okuma, and Y. Uchikawa. A neural network compensation for uncertainties of robotics manipulators. IEEE Transactions on Industrial Electronics, 39(6):565569, December 1992. [11] D. Katic and M. Vukobratovic. Connectionist based robot control: An overview. IFAC - 13th Triennial World Congress, pages 169174, 1996. [12] S. M. Zlauddin and A. M. S. Zalzala. Model-based neural network compensantion for uncertainties of robot arms. IFAC - 13th Triennial World Congress, pages 157162, 1996. [13] A. M. S. Zalzala and A. S. Morris. Neural Networks for Robotic Control - Theory and Applications. Ellis Horwood, 1996. [14] M. J. Er and K. C. Liew. Control of adept one scara robot using neural networks. IEEE Transactions on Industrial Electronics, 44(6):762768, December 1997. [15] A. A. Neto and L. C. S. Goes. Projeto de um controlador neural para o rob ita-iemp. III Congresso Brasileiro o de Redes Neurais - IV Escola de Redes Neurais - Florian polis, pages 384389, Julho 1997. o [16] M. R. Stemmer, E. R. de Pieri, and F. A. P. Borges. Um controlador neural adaptativo para o rob manipulador o puma 560. Proceedings of XIII Brazilian Automatic Control Conference - XII CBA, 5:16331638, Setembro 1998. [17] M. R. Stemmer, E. R. de Pieri, and F. A. P. Borges. Comparacao de performance entre controladores cl ssicos e um controlador torque computado neural aplia cados ao rob puma 560. III Congresso Brasileiro de Reo des Neurais - IV Escola de Redes Neurais - Florian polis, o pages 390395, Julho 1997.
20
20
40 0
3 Tempo [s]
Figura 11: Controle Neural: Acao de controle Entretanto, a necessidade de um treinamento prvio e off-line, com o emprego de um conjunto de exemplos obtidos do sistema real, pode ser um entrave a sua utilizacao em rob tica. Primeiro porque, de acordo com a qualidade o do conjunto de exemplos utilizado e com a forma de treinamento empregada, n o e possvel prever o comportaa mento da rede para situacoes em que ela n o foi treinada. a Isto e, a capacidade de generalizacao da rede pode n o ser a suciente para garantir uma performance satisfat ria do o sistema de controle. Segundo, o processo de treinamento geralmente e lento e exige um custo computacional ele vado. Em manipuladores rob ticos de mais de tr s graus o e de liberdade, a quantidade de dados e relativamente alta, aumentando o tempo de treinamento. Nas tarefas de seguimento de trajet oria de posicao os controladores cl ssicos do tipo PD/PID n o s o sua a a cientes pois n o apresentam boas propriedades frente a a ` exist ncia de perturbacoes e variacoes param tricas. Ese e trat gias de controle que incluem um modelo param trico e e do rob em sua estrutura, como o controle inverso de o juntas ou o controle hbrido de forca/posicao, procuram aumentar a performance da sua estrutura de controle. Por m, essas estrat gias necessitam de um conhecimene e to mais preciso sobre os par metros do modelo do maa nipulador. A falta de precis o no modelo estimado ema pregado na lei de controle, pode levar o sistema a apresentar um desempenho fora das especicacoes. Dessa forma, uma rede neural que complemente o acao de um controlador principal, assumindo o papel de compensar n o-linearidades e perturbacoes n o-modeladas atuantes a a sobre a din mica do manipulador, apresentou-se como a uma solucao adequada a falta de conhecimento sobre essa ` din mica. a Entretanto, as estruturas de controle neural apresentaram acoes de controle mais oscilat rias, em comparacao o com as estrat gias convencionais de controle de posicao e e controle hbrido forca/posicao. Outra desvantagem, con siste na necessidade de existir um controlador principal (controlador PD). Al m disso, ainda n o se encontram e a estabelecidas provas e crit rios de estabilidade para o sise tema rob /controlador + rede neural. o A estrat gia de controle aqui apresentada dever ser e a implementada a seguir em um rob real disponvel no o 343