Você está na página 1de 6

Proceedings of the IV Brazilian Conference on Neural Networks - IV Congresso Brasileiro de Redes Neurais pp.

338-343, July 20-22, 1999 - ITA, S o Jos dos Campos - SP - Brazil a e

Controle de Posicao de um Rob Manipulador SCARA utilizando Redes o Neurais Articiais com Treinamento On-Line
Sandro Battistella Edson R. De Pieri Marcelo R. Stemmer Laborat rio de Controle e Microinform tica - LCMI o a Departamento de Automacao e Sistemas - DAS Universidade Federal de Santa Catarina - UFSC Florian polis - Brasil o E-mails: sandro@lcmi.ufsc.br, edson@lcmi.ufsc.br, marcelo@lcmi.ufsc.br

Abstract
The objetive of this work is the evaluation of the employment of articial neural networks in position control of robot manipulators. Employing a on-line training method with MLP networks, it is possible to obtain more compact structures, avoiding the need for a training set to train the neural network. Acting in a parallel structure together with a classical PD controler, the neural network is capable to compensate the non-linearities, disturbances and non-modelled dynamics existing on the robot structure. The neural controller performance is compared with the classical PD control in the joint space. Numerical simulations of the whole structure of a SCARA robot are shown.

Introducao

No contexto da teoria de controle, as RNAs s o visa tas como um formalismo para modelagem de processos, empregadas como estruturas para representacao do co nhecimento da planta e para o mapeamento de suas caractersticas que s o armazenadas na RNA [1]. A pro a priedade de mapeamento funcional n o-linear fornece as a ` RNAs uma forte capacidade de representacao interna de problemas, tornando-as atrativas para o seu emprego em controle de processos [2], [1], [3], [4], [5]. As t cnicas cl ssicas de controle de rob s manie a o puladores ou aquelas baseadas em modelo (controle de posicao e/ou forca) envolvem o conhecimento das equacoes que descrevem o comportamento din mico do a manipulador. Nesses casos, existe uma certa diculdade inerente ao processo de levantamento desse modelo din mico devido as incertezas a respeito dos par metros a ` a do manipulador, estando esse comportamento tamb m e sujeito as inu ncias externas como perturbacoes e ` e variacoes param tricas [6], [7], [8] e [9]. e A diculdade na modelagem da equacao din mica a do manipulador vem motivando o emprego de RNAs
 Este trabalho foi realizado com apoio do CNPq

no controle de rob s. Uma rede neural pode ter uma o performance melhor quando n o precisa aprender muia ta informacao a respeito do processo [10]. Em estruturas em que a rede neural assume um papel auxiliar ao controlador do manipulador (compensacao de n o-linearidades, a minimizar esforco de controle, corrigir um modelo pa ram trico xo, estimar valores para controladores adape tativos, etc.), a complexidade na sua utilizacao diminui, dispensando, muitas vezes, o treinamento off-line. Al m e disso, a diculdade em se levantar um conjunto de exemplos adequado n o se constitui de tarefa f cil, uma vez a a que a din mica do manipulador e descrita por equacoes a n o-lineares, acopladas e multivari veis, exigindo redes a a com um n mero elevado de neur nios [11], [12] e [4]. u o Nesse artigo ser o vistos os problemas envolvidos no a controle de posicao no espaco livre (sem restricao ao mo vimento do manipulador). Simulacoes num ricas para o e caso do controle de um manipulador SCARA s o realizaa das, com o objetivo de comparar a performance do controlador cl ssico de juntas PD e do o controlador neural a proposto.

Redes Multilayer Perceptrons - MLP

Uma rede neural articial consiste de um conjunto de unidades de processamento, chamadas de neur onios, interligadas atrav s de conex es, ou pesos. Uma RNA e o busca aproximar o funcionamento real de uma rede de neur nios. O neur nio articial apresenta n terminais o o de entrada, que representam os dendritos, respons veis a por receber os sinais provenientes dos outros neur nios, o e um terminal de sada, que representa o ax nio, res o pons vel por transmitir os impulsos eletroqumicos aos a demais neur nios. A cada um dos terminais de entrao da est associado um peso, que representa o valor da coa nex o entre as sinapses dos neur nios. a o Uma topologia muito empregada consiste das redes Multilayer Perceptrons, ou simplesmente, redes MLP. As redes MLP tem a capacidade de realizar mapeamentos n o-lineares complexos, sendo, portanto, muito uteis em a aplicacoes como reconhecimento de padr es e controle o de processos. Elas ser o adotadas nesse trabalho devido a 338

a simplicidade de implementacao e treinamento.

A matriz de in rcia H q  e dada por: e

Din mica do Manipulador SCARA a

2 6 H q = 6 4

h11 h12 h21 h22 I4


0

A forma construtiva de um rob manipulador do tipo o SCARA, do ingl s Selective Compliant Articulated Roe bot for Assembly pode ser vista na g. 1.
q1

I4

m3 + m4
0

I4 I4 7 7 I4
0

3 5
(2)

onde os termos hij valem


2 I1
IA + m1 l 1 + m2 + mA 
1 + l2 c m2 + m 2l l cos  + m2 + m l2 + 2 A 1 2 A 2 k
k2 m2 + m l l cos +
m2 + m l2 h12 = IA + k 2 A 12 A 2 k2
m2
m2 2 h21 = IA + k + mA l1 l2 cos 2 + k2 + mA l2
2 (3) h22 = IA + m22 + mA l2 k 2 com IA = I2 + I3 + I4 , k = llc2 e mA = m3 + m4 .

h11

q2

d3

C q; q_ e dada pela seguinte relacao:


q4

A matriz de torques de Coriols e torques centrfugos

2 6 C q; q_q_ = 6 4

c11 c12 c21 0


0

0 0 0

0 0 0 0

(4)
0

Figura 1: Rob SCARA o

onde os coecientes cij da matriz s o dados por a

c11 c12 c21

= = =

O modelo do manipulador, bem como seus par metros, correspondem ao rob manipulador a o SCARA, que se encontra disponvel no Laborat rio de o Rob tica da Universidade Federal de Santa Catarina. o Os deslocamentos i correspondem aos deslocamentos angulares nas juntas de rotacao do manipulador, en quanto que a vari vel de junta d3 representa o deslocaa mento linear na junta vertical de translacao. Os valores nominais de massa dos elos mi , momentos de in rcia Ii , e comprimentos dos elos li e centros de massa lci s o gea ralmente obtidos em cat logos ou atrav s de estimacoes. a e O modelo adotado n o considera o atrito e a exibilidade a existente nas juntas. A equacao din mica para um manipulador rgido ob a tida pelo m todo de Lagrange, e desprezando-se o atrito e nas suas juntas, e denida pela equacao 1 [9], [8] e [7]:

m2

, m k
m , k
k

+ +

mA l1 l2

_ sin 2 2

mA l1 l2 sin 2 _1 + _2


(5)

mA l1 l2 sin 2 _1 : m3 + m4 g 0 T

O vetor de torques gravitacionais, por sua vez, e de nido como sendo

Gq =

00

(6)

onde g e o valor da aceleracao da gravidade (g = 9.81 m/s2 ). Os valores dos par metros e coecientes do manipua lador SCARA utilizados nesse trabalho encontram-se listados na tabela 1.

Controle de Posicao

H qq + C q; q_q_ + Gq =

(1)

onde q e o vetor n  1 de coordenadas generalizadas das juntas, H q  e a matriz de in rcia n  n positiva e denida e sim trica, C q; q  e a matrizr n  n de forcas e _ e torques centrfugos e de Coriolis, Gq  e o vetor n  1 de forcas gravitacionais, e e o vetor n  1 de torque de controle sobre as juntas. Para um manipulador rob tico o do tipo SCARA, as matrizes para a equacao 1 s o apre a sentadas a seguir. 339

Quando o rob desempenha tarefas que n o geram o a interacoes entre a din mica do meio e do pr prio manipu a o lador - manipulador no espaco de tarefa livre - o objetivo do sistema de controle consiste basicamente em comandar a posicao, a velocidade, e eventualmente, a aceleracao nas juntas do manipulador. 4.1 Controle PD/PID Dois dos controladores mais simples inicialmente utilizados para o controle de posicao, constituem-se dos controladores cl ssicos PD e PID (equacoes 7 e 8): a

Tabela 1: Par metros do manipulador a


RNA

A/D

Par metro a Massa do elo 1 (m1 ) Massa do elo 2 (m2 ) Massa do elo 3 (m3 ) Massa do elo 4 (m4 ) In rcia do elo 1 (I1 ) e In rcia do elo 2 (I2 ) e In rcia do elo 3 (I3 ) e In rcia do elo 4 (I4 ) e Comprimento do elo 1 (l1 ) Comprimento do elo 2 (l2 ) Centro de massa do elo 1 (lc1 ) Centro de massa do elo 2 (lc2 ) Origem do sistema de coordenadas da terceira junta d0

Valor 11.4 Kg 19.5 Kg 2 Kg 1.5 Kg 0.23 Kg m2 0.16 Kg m2 0.1 Kg m2 0.1 Kg m2 0.25 m 0.25 m 0.118 m 0.116 m 0.678 m

qd
Gerador de Trajet rias o +

n e
PD Digital

q q _ q
D/A Dinamica do Manipulador

qd qd _

uc

A/D

Figura 2: Proposta de Controle Neural para Juntas

Objetivo das Simulacoes

As trajet rias de refer ncia empregadas constituemo e se de curvas do tipo spline e s o apresentadas na gura a 3.
Referncias de Posio 1 0.8

Kpqd , q , Kdq_
Zt
0

(7)
Posio [rad,m]

0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 0 junta1 junta2 junta3 junta4 1 2 3 Tempo [s] 4 5 6

,Kdq_ + Kp qd , q + Ki

qd , q@

(8)

onde K: s o as matrizes de ganho dos controladores, de a ordem nxn, positivas e geralmente diagonais, e qd e o valor de refer ncia para o deslocamento nas juntas q . e 4.2 Controle Neural

Figura 3: Refer ncia de posicao nas juntas e A lei de controle neural adotada nesse trabalho, consiste basicamente em um controlador cl ssico do tipo PD a e uma rede neural sendo empregada para compensar as n o-linearidades e as perturbacoes sobre o sistema. Difea rente de muitas abordagens propostas de controle neural de posicao de rob s manipuladores [13], [14], [10], [15] o [16], [17], a estrutura de controle no necessita de fase a de treinamento pr vio, sendo o treinamento realizado de e forma on-line, ou seja, atuando sobre o processo. O objetivo da estrutura de controle proposta consiste em gerar o sinal atrav s da equacao e
=

onde uc e o sinal de controle proveniente de um PD di gital, empregado para estabilizar o processo durante o regime transit rio. A gura 2 apresenta a estrutura de cono trole proposta. A rede neural utiliza o sinal de controle uc para o seu treinamento. Intepretando esse sinal como o erro de treinamento, a rede neural busca ajustar seus pesos de forma a minimizar esse erro, fornecendo um valor de torque n nas suas sadas (uma para cada junta). Dessa forma, obt m-se, indiretamente, a minimizacao do erro e de posicao e velocidade, pois o controlador PD consiste da soma do produto dos ganhos pelos erros de posic ao e velocidade. 340

uc + n

(9)

Os desempenhos dos controladores PD e Neural s o a analisados em tr s situacoes distintas: condicoes nomie nais de operacao; variacoes e incertezas param tricas e e perturbacoes; e movimentacao de uma carga desconheci da acoplada ao efetuador nal. O perodo de amostragem empregado foi de 2.5 ms. As simulacoes foram feitas nos softwares MATLAB 4.2 e SIMULINK 1.3c. Os controladores implementados s o digitais. a Todos os controladores foram projetados levando em consideracao somente as condicoes nominais de operacao.

Resultado das Simulacoes

Na estrutura de controle neural, foi empregada uma rede MLP, com quatro camadas de neur onios. A camada de entrada cont m 12 neur nios - quatro para aos vae o lores de posicao q , quatro para os valores de velocida de nas juntas q , e mais quatro neur nios para os valores _ o de aceleracao desejadas qd . As duas camadas escondi das possuem, respectivamente, oito e cinco neur nios. A o ultima, apresenta quatro neur nios, um para cada junta do o manipulador. Foi escolhida como funcao de ativacao dos

neur nios a funcao tangente hiperb lica, com inclinacao o o igual a um. Para o treinamento da rede neural utilizou-se o algoritmo backpropagation. As matrizes de pesos e bias foram inicializadas com valores rand micos  0.05. A taxa o de aprendizado empregada e da ordem de 0.001. 6.1 Condicoes Nominais Considerando o manipulador livre de perturbacoes externas e sem imprecis es na sua modelagem, observouo se o desempenho dos controladores para o seguimento da trajet ria da gura 3. o As guras 4 e 5 apresentam a performance dos controladores de juntas.
Controle PD 1.5 junta 1 1 junta 2

6.2 Variacao Param trica e Perturbacoes e Aqui considera-se a exist ncia de imprecis es no coe o nhecimento dos par metros, decorrente de possveis era ros de estimacao ou variacoes param tricas devido as in e ` u ncias do meio. As variacoes consideradas s o: + 20% e a para m1 e m4 , - 20% para m3 , + 10% para I1 e I4 , - 10% para I3 , + 15% para l1 e - 15% para l2 . De forma a vericar o comportamento dos controladores frente a exist ncia de perturbacoes, foram aplie cados torques contr rios ao movimento do manipulaa dor. No instante 3 segundos foi aplicada na junta 1 uma perturbacao de 20% do valor m ximo permitido para es a sa junta, e outro sinal no instante 4 segundos na junta 3, tamb m com valor de 20% do m ximo torque permitido. e a As guras 6 e 7 apresentam a performance dos controladores para os casos de perturbacao e variacao de par metros. a
Controle PD 1.5

0.5
Posio [rad,m]

junta 1 junta 3 1

junta 2

0 0.5 0.5 junta 4 1


Posio [rad,m]

junta 3 0

0.5 junta 4 1.5 0 1 2 3 Tempo [s] 4 5 6 1

Figura 4: Controle PD: Caso nominal

1.5 0

3 Tempo [s]

Controle Neural 1.5 junta 1 1 junta 2

Figura 6: Controle PD: Variacao param trica e e perturbacao

Controle Neural 0.5


Posio [rad,m]

1.5 junta 3 junta 1 1 junta 2

0.5 junta 4 1
Posio [rad,m]

0.5 junta 3 0

1.5 0

0.5 1 2 3 Tempo [s] 4 5 6 1 junta 4

Figura 5: Controle Neural: Caso nominal


1.5 0 1 2 3 Tempo [s] 4 5 6

A exist ncia de um erro em regime permanente do e posicionamento da terceira junta, ocorre em funcao da n o compensacao do termo de gravidade pelo controlador a PD (gura 4). Por sua vez, o controlador neural apresenta um seguimento com um erro muito pequeno, em comparacao ao controle PD (gura 5). Observa-se que a capacidade de compensacao que a rede oferece ao sistema de controle, no caso, contrabalanca o efeito gravitacional existente na terceira junta do manipulador. 341

Figura 7: Controle Neural: Variacao param trica e e perturbacao O controlador PD n o sofre muita inu ncia das a e variacoes param tricas. Essa caracterstica pode ser vista e nos primeiros 3 segundos do seguimento de trajet ria (o gura 6). Nesse caso, os ganhos do controlador ainda s o a sucientes para manter uma boa performance de controle frente as variacoes param tricas. Entretanto, observa-se e

que o erro devido ao efeito de gravidade e agravado pela perturbacao existente na terceira junta. Na estrat gia de controle neural, a rede e capaz de e compensar as variacoes param tricas e as perturbacoes e atuando sobre o manipulador. No caso simulado (gura 7) a inu ncia da perturbacao n o chega a ser visvel, e a garantindo um seguimento de trajet ria similar ao do cao so nominal. Isso ocorre, uma vez que a rede atua nas situacoes em que o controlador PD n o consegue garan a tir uma boa performance de controle, como e o caso da exist ncia de perturbacoes e incertezas ou variacoes pae ram tricas. e 6.3 Variacao de Carga Procurando executar a trajet ria da gura 3, observao se a performance dos controladores para o caso em que e considerado o transporte de uma carga desconhecida. O valor da carga n o se encontra includo no modelo a din mico do manipulador. A carga possui uma massa de a 5 Kg, e encontra-se acoplada ao manipulador nos primeiros 4 segundos da trajet ria. o As guras 8 e 9 apresentam o desempenho dos controladores para o caso de variacao de carga.
Controle PD 1.5 junta 1 1 junta 2

Dessa forma, os efeitos dos torques gravitacionais s o a mais relevantes, como pode ser visto na gura 8. Novamente a estrutura de controle neural foi capaz de satisfazer os requisitos de controle. A rede, nesse caso, funciona como um compensador de gravidade. O torque provido pela rede e capaz de suprir a deci ncia da es e trutura de controle do tipo PD, que n o apresenta a capaa cidade de compensacao dos termos de gravidade (gura 9). 6.4 An lise do Esforco de Controle a As guras 10 e 11 apresentam as acoes de contro le para o caso onde existem variacoes param tricas e e perturbacoes atuando sobre o manipulador. Observa-se que o controlador neural apresenta uma acao de controle mais oscilat ria. Esse inconveniente o acontece devido a dois fatores. A primeira inu ncia e ` e decorrente da necessidade de ajuste dos pesos da rede frente as mudancas de refer ncia ou a exist ncia de uma ` e ` e perturbacao. O segundo fator prov m da falta de conhe e cimento sobre a interacao entre o controlador cl ssico e a a rede neural, n o sendo conhecida uma forma de estaa belecer crit rios de projeto e an lise de estabilidade do e a sistema manipulador/controlador + rede neural, de forma a incluir a otimizacao da lei de controle durante a fase de projeto do controlador. Al m disso, o treinamento da e rede neural encontra-se baseado somente no erro de posicionamento, e n o leva em conta o esforco da acao de a controle.
Controle PD 100

0.5
Posio [rad,m]

junta 3 0

0.5 junta 4 1 60
Ao de Controle [N.m]

80

junta1 junta2 junta3 junta4

1.5 0

3 Tempo [s]

40

20

Figura 8: Controle PD: Variacao de carga

20 Controle Neural 1.5 40 0 1 2 3 Tempo [s] 4 5 6

Figura 10: Controle PD: Acao de controle


0.5
Posio [m]

0.5

Conclus es o

1.5 0

3 Tempo [s]

Figura 9: Controle Neural: Variacao de carga O acoplamento de uma carga no efetuador nal, corresponde em um acr scimo de massa na terceira junta. e 342

O emprego de estruturas adaptativas em controle de rob s e uma alternativa as t cnicas de controle conveno ` e cional que necessitam do conhecimento analtico do mo delo do manipulador. A vantagem do emprego de redes neurais reside justamente na n o necessidade do conhea cimento da planta, sendo capaz de aprender o modelo din mico do manipulador, incluindo as n o-linearidades, a a e tamb m as incertezas. e

Controle Neural 100 junta1 junta2 junta3 junta4

80

Laborat rio de Rob tica da UFSC. A estrat gia est o o e a tamb m sendo alterada de forma a permitir o controle de e forca, que ser tema de outro artigo em futuro pr ximo. a o

60
Ao de Controle [N.m]

40

Refer ncias e
[1] K. J. Hunt, D. Sbarbaro, R. Zbikowski, and P. J. Ganthrop. Neural networks for control systems - a survey. Automatic, 28(6):13851406, 1992. [2] I. H. S. Filho and M. R. Stemmer. Redes Neurais. LCMI - UFSC - Florian polis, 1993. o [3] K. S. Narendra. Neural networks for control: Theory and practice. Proceedings of IEEE, 84(10):13851406, October 1996. [4] T. Fukuda and T. Shibata. Theory and applications of neural networks for industrial control systems. IEEE Transactions on Industrial Electronics, 39(6):472489, December 1992. [5] M. Agarwal. A systematic classication of neural network-based control. IEEE Control Systems, pages 75 93, April 1997. [6] L. S. Wilnger. A comparison of force control algoritms for robots in contact with exible environments. Masters thesis, Rensselaer - Polytechnic Institute, Troy, New York, 1992. [7] C. C. de Wit, B. Siciliano, and G. Bastin. Theory of Robot Control. Springer-Verlag, 1996. [8] F. L. Lewis, C. T. Abdallah, and D. M. Dawson. Control of Robot Manipulators. MacMillan Publishing Co., 1993. [9] H. Asada and J. J. E. Slotine. Robot Analysis and Control. John Wiley and Sons, 1986. [10] A. Ishiguro, T. Furuhashi, S. Okuma, and Y. Uchikawa. A neural network compensation for uncertainties of robotics manipulators. IEEE Transactions on Industrial Electronics, 39(6):565569, December 1992. [11] D. Katic and M. Vukobratovic. Connectionist based robot control: An overview. IFAC - 13th Triennial World Congress, pages 169174, 1996. [12] S. M. Zlauddin and A. M. S. Zalzala. Model-based neural network compensantion for uncertainties of robot arms. IFAC - 13th Triennial World Congress, pages 157162, 1996. [13] A. M. S. Zalzala and A. S. Morris. Neural Networks for Robotic Control - Theory and Applications. Ellis Horwood, 1996. [14] M. J. Er and K. C. Liew. Control of adept one scara robot using neural networks. IEEE Transactions on Industrial Electronics, 44(6):762768, December 1997. [15] A. A. Neto and L. C. S. Goes. Projeto de um controlador neural para o rob ita-iemp. III Congresso Brasileiro o de Redes Neurais - IV Escola de Redes Neurais - Florian polis, pages 384389, Julho 1997. o [16] M. R. Stemmer, E. R. de Pieri, and F. A. P. Borges. Um controlador neural adaptativo para o rob manipulador o puma 560. Proceedings of XIII Brazilian Automatic Control Conference - XII CBA, 5:16331638, Setembro 1998. [17] M. R. Stemmer, E. R. de Pieri, and F. A. P. Borges. Comparacao de performance entre controladores cl ssicos e um controlador torque computado neural aplia cados ao rob puma 560. III Congresso Brasileiro de Reo des Neurais - IV Escola de Redes Neurais - Florian polis, o pages 390395, Julho 1997.

20

20

40 0

3 Tempo [s]

Figura 11: Controle Neural: Acao de controle Entretanto, a necessidade de um treinamento prvio e off-line, com o emprego de um conjunto de exemplos obtidos do sistema real, pode ser um entrave a sua utilizacao em rob tica. Primeiro porque, de acordo com a qualidade o do conjunto de exemplos utilizado e com a forma de treinamento empregada, n o e possvel prever o comportaa mento da rede para situacoes em que ela n o foi treinada. a Isto e, a capacidade de generalizacao da rede pode n o ser a suciente para garantir uma performance satisfat ria do o sistema de controle. Segundo, o processo de treinamento geralmente e lento e exige um custo computacional ele vado. Em manipuladores rob ticos de mais de tr s graus o e de liberdade, a quantidade de dados e relativamente alta, aumentando o tempo de treinamento. Nas tarefas de seguimento de trajet oria de posicao os controladores cl ssicos do tipo PD/PID n o s o sua a a cientes pois n o apresentam boas propriedades frente a a ` exist ncia de perturbacoes e variacoes param tricas. Ese e trat gias de controle que incluem um modelo param trico e e do rob em sua estrutura, como o controle inverso de o juntas ou o controle hbrido de forca/posicao, procuram aumentar a performance da sua estrutura de controle. Por m, essas estrat gias necessitam de um conhecimene e to mais preciso sobre os par metros do modelo do maa nipulador. A falta de precis o no modelo estimado ema pregado na lei de controle, pode levar o sistema a apresentar um desempenho fora das especicacoes. Dessa forma, uma rede neural que complemente o acao de um controlador principal, assumindo o papel de compensar n o-linearidades e perturbacoes n o-modeladas atuantes a a sobre a din mica do manipulador, apresentou-se como a uma solucao adequada a falta de conhecimento sobre essa ` din mica. a Entretanto, as estruturas de controle neural apresentaram acoes de controle mais oscilat rias, em comparacao o com as estrat gias convencionais de controle de posicao e e controle hbrido forca/posicao. Outra desvantagem, con siste na necessidade de existir um controlador principal (controlador PD). Al m disso, ainda n o se encontram e a estabelecidas provas e crit rios de estabilidade para o sise tema rob /controlador + rede neural. o A estrat gia de controle aqui apresentada dever ser e a implementada a seguir em um rob real disponvel no o 343

Você também pode gostar