Você está na página 1de 6

ADAPTATIVA DE ATRITO PARA ROBOS

CONTROLE COM COMPENSAC


AO

MOVEIS COM RODAS DIFERENCIAIS


s J. F. Cerqueira Pablo J. Alsina
Armando S. Sanca Je

Departamento de Computaca
o e Automaca
o da Universidade Federal do Rio Grande do Norte
Caixa Postal 1524, Campus Universit
ario Lagoa Nova, CEP: 59072-970,
Natal, Rio Grande do Norte, Brasil
Departamento de Engenharia Eletrica da Escola Politecnica da Universidade Federal da Bahia
Rua Aristides Novis, 02, Federaca
o, CEP:40210-630, Salvador, Bahia, Brasil
Telefone: +55-71-3203-9776
Email: armando@dca.ufrn.br,jes@ufba.br,pablo@dca.ufrn.br

Abstract In this paper is presented the application of a local velocity control with adaptive friction compensation for a mobile robot with two-wheel differential drive. A model known as LuGre friction model has
been used for estimation of the phenomenon reflected in the actuators that drive the wheels. A cascade control
structure has been used for the system. Some experimental and simulation results are presented.
Mobile robot, Modeling, Friction, Adaptive Compensation and Control.

Keywords

Resumo Neste artigo


e apresentada a aplicaca
o de um esquema de controle local de velocidade com compensaca
o adaptativa de atrito para um rob
o m
ovel com duas rodas diferenciais. Um modelo conhecido como
LuGre
e usado para estimaca
o do fen
omeno de atrito refletidos nos atuadores de corrente contnua que acionam
as rodas. A estrutura de controle em cascata para o sistema
e usada. Alguns resultados experimentais e de
simulaca
o s
ao apresentados neste trabalho.
Palavras-chave

Rob
o m
ovel, Atrito, Compensaca
o Adaptativa e Controle.

Introdu
c
ao

O atrito e uma nao linearidade inerente em


sistemas mecanicos com movimento relativo e desempenha um papel importante em muitos servo um fenomeno natural que dificilmecanismos. E
mente pode ser ignorado no projeto de sistema de
controle.
Particularmente, os robos que utilizam veculos autonomos com rodas como base movel, muitas vezes sao projetados a partir de modelos que
desconsideram as nao-linearidades de entrada em
tais sistemas (Tao e Kokotovic, 1996). Estas naolinearidades provocam desempenho pobre, e alguns levam a instabilidade, se uma estrategia de
controle apropriada nao for adotada. Uma destas nao linearidades, a zona morta, e associada
ao fenomeno de atrito, que e um fenomeno causado por nao linearidades como: stiction; histerese; efeito de stribeck ; stick-slip e viscosidade.
Em sistemas mecanicos, todas as superfcies
sao irregulares no nvel microscopico, e quando
em contato uma com a outra geram algumas asperezas que podem se comportar como deformacoes elasticas ou plasticas, causando erros de posicionamento em regime permanente e ciclo limite a baixas velocidades (Armstrong-Helouvry et
al., 1994). Em veculos com rodas, o movimento
relativo ocorre entre diferentes tipos de superfcie e com variacoes na forca normal, ocasionando
mudancas na forca de ruptura, que e a forca requerida para vencer o regime estatico e iniciar o
movimento. Assim, a forca de ruptura pode ser

comparada com o valor de limiar da zona morta.


A mudanca do valor limiar da zona morta pode
levar a que os atuadores entrem em saturacao. A
compensacao destas variacoes, causadas pelas deformacoes e as mudancas na forca normal, e importante do ponto de vista de controle de sistemas
mecanicos.
O objetivo deste trabalho e apresentar um esquema de controle com compensacao adaptativa
de atrito para um veculo com duas rodas ativas.
O projeto e analise dos controladores serao desenvolvidos com base nos trabalhos apresentados em
Laura et al. (2006), Sanca et al. (2007) e em um
modelo de atrito conhecido como LuGre, que foi
apresentado em Canudas de Wit et al. (1995) e
em Canudas de Wit (1998). A estrutura do texto
e como segue: na secao 2 apresentam-se alguns
conceitos preliminares necessarios para a compreensao do conte
udo do artigo; na secao 3 a compensacao adaptativa de atrito e o esquema de controle
com compensacao de atrito para um veculo com
duas rodas ativas diferenciais sao desenvolvidos;
por fim, os resultados obtidos em testes experimentais e simulacoes sao apresentados na secao 4
e as conclusoes na secao 5.
2

Preliminares Te
oricas

O atrito e uma forca de reacao tangencial que


ocorre entre superfcies em contato. Fisicamente,
esta forca de reacao e o resultado de muitos diferentes fenomenos que podem depender da topologia e geometria do contato, das propriedades dos

M
J

PSfrag replacements

YI
XR

F, v

YR

re

me

md
l

Figura 1: Deflexao da cerda entre duas superfcies


para o modelo de LuGre.
materiais, dos volumes e das superfcies dos corpos, das velocidades relativas entre os corpos e dos
regimes de lubrificacao.
No modelo de LuGre, apresentado em Canudas de Wit et al. (1995), o atrito e modelado
como a forca media de deflexao de cerdas elasticas, como e ilustrado na figura 1. Este e um
modelo muito apropriado para aplicacoes de controle devido a sua simplicidade e integracao entre
os regimes conhecidos como pre-escorregamento e
escorregamento.
Quando uma forca tangencial e aplicada ao
corpo, as cerdas deflexionam como molas. Se a deflexao z for suficientemente grande as cerdas comecam a deslizar. A deflexao media das cerdas
para um movimento e determinante para velocidade relativa entre os corpos (Canudas de Wit et
al., 1995; Canudas de Wit, 1998).
A zona morta e uma nao linearidade, considerada como a faixa operacional de entrada que
nao produz resposta na dinamica da sada de um
sistema, podendo ser variante no tempo, caracterstica comum em todos os tipos de atuadores
(Tao e Kokotovic, 1996).
3

rd

XI

Figura 2: Diagrama das forcas e torques que


atuam sobre um veculo com duas rodas ativas
acionado por atuadores eletricos.
al., 2006; Sanca et al., 2007).
Inicialmente, como descrito em Sanca et al.
(2007), o modelo matematico da dinamica do veculo, sem inclusao dos fenomenos que se opoem ao
movimento, e descrito na forma

md (t) = k1 md (t) + k2 me (t)


(1)

me (t) = k3 md (t) + k4 me (t)


As constantes k1 , k2 , k3 e k4 sao definidos como:


rd2
J
M
+
+ Jmd
4d Nd2
l2


J
re rd
M 2
k2 =
4d Ne Nd
l


J
re rd
M 2
k3 =
4e Ne Nd
l


2
re
J
k4 =
M + 2 + Jme ,
4e Ne2
l

k1 =

Compensa
c
ao Adaptativa de Atrito da
Base M
ovel

Os diferentes fenomenos que constituem o


atrito podem variar por diferentes razoes, como
mudancas de temperatura, desgaste dos atuadores, entre outras. A variacao em algum desses
fatores pode afetar seriamente os parametros do
modelo de atrito (Lischinsky et al., 1999). O apropriado e dispor de um mecanismo adaptativo que
possa ser ajustado a`s variacoes de todo o conjunto
de fatores que constituem o atrito. Em Canudas
de Wit e Lischinsky (1997), sao apresentados dois
esquemas de compensacao adaptativa baseadas na
adaptacao de parametros.
A base movel considerada neste artigo e um
veculo com duas rodas como mostrado na figura
2. As duas rodas sao acionadas por motores eletricos de corrente contnua (CC) com comandos independentes. Dois elementos de apoio equilibram
o veculo sobre a superfcie de movimento. Este e
um sistema com dois graus de liberdade (GDL)
cujas sadas serao representadas pelas velocidades
dos motores direito md e esquerdo me (Laura et

md

me
l

onde mi , mi sao as aceleracoes angulares e os


torques aplicados nos motores i [direito, esquerdo];
M e J representam a massa e o momento de inercia do veculo respectivamente; l e a distancia entre roda e o centro de massa do veculo; ri , i ,
Ni e Jmi representam o raio da roda, a eficiencia
mecanica do acoplamento, o fator de reducao de
velocidade e o momento de inercia do motor nas
rodas i respectivamente.
Do modelo do veculo em (1), supondo o
sistema desacoplando e considerando a forca de
atrito como fenomeno principal que se opoe ao
movimento no sistema veculo, refletido nos atuadores i, por ser equacoes identicas podem ser expressas da seguinte forma
ri2
4i Ni2

M+

J
l2

+ Jmi mi (t) = mi (t) ami (t),




onde ami (t) sao os torques de reacao que modelam o atrito no veculo vistos pelos motores.

Utilizando o modelo de LuGre para ambos atuadores teremos


J mi mi (t) = mi (t) ami (t),

(2)

onde:
J mi
ami (t)
dzi (t)
dt
g(mi (t))

ri2
4i Ni2


J
+ Jmi ;
l2
dzi (t)
= 0i zi (t) + 1i
+ 2i mi (t);
dt
0i |mi (t)|
= mi (t) i (t)
zi (t);
g(mi (t))
=

M+

com ki > 0, onde zi (t) e o estado estimado do estado interno zi (t), nao mensuravel. ami (t) e o torque de atrito estimado e mi (t) = mi (t)rmi (t)
e o erro de velocidade e rmi (t) e a velocidade de
referencia desejada do motor i que e assumida diferenciavel, e o termo ki mi (t) no estimador e um
termo de correcao em funcao do erro de velocidade.
O estimador que observa as mudancas nos parametros estaticos e expresso da seguinte forma
(Canudas de Wit e Lischinsky, 1997)

= 0i + 1i e(mi (t)/mSi ) .

Em (2), zi (t) representa a dinamica de um


estado interno para o atrito que descreve a deflexao media das superfcies em contato durante a
fase chamada de stiction, sendo este estado nao
mensuravel, e g(mi (t)) e a funcao decrescente
para velocidade limitada que descreve parte das
caractersticas do modelo em regime permanente,
com { > 0i + 1i g(mi (t)) 0i > 0}
e incluindo mSi que e uma constante chamada
de velocidade de stribeck. O coeficiente de atrito
estatico e dado por 0i + 1i , e o coeficiente de
atrito de Coulomb e dado por 0i . O parametro
0i e o coeficiente de rigidez das deformacoes microscopicas de zi (t) durante o regime chamado de
pre-escorregamento, o parametro 1i e o coeficiente de amortecimento associado com dzi (t)/dt e
o parametro 2i e o coeficiente de atrito viscoso.
Assume-se que os parametros estaticos 0i ,
1i , 2i e mSi e os parametros dinamicos 0i e
1i foram previamente definidos para os motores
i.
A variavel i (t) e desconhecida, limitada {0 <
i (t) < } e com valor nominal {i = 1} que
captura as mudancas e variacoes na forca normal.
Considerando os parametros estaticos 0i e 1i
[com excecao do atrito viscoso], estes sao assumidos variantes; e os parametros dinamicos 0i e 1i
sao assumidos invariantes no tempo. O raciocnio da suposicao para i (t), e que variacoes na
forca normal podem ter um substancial impacto
nos parametros estaticos, em particular, na funcao g(mi (t)) que inclui o atrito de Coulomb e a
forca de ruptura. Em comparacao, os parametros
dinamicos sao considerados invariantes desde que
o lubrificante entre as superfcies em contato e o
tipo de material destas nao dependa da forca normal. A possvel dependencia de 2i , e assumida
neste caso para ser tratado com o compensador
linear (Canudas de Wit e Lischinsky, 1997).
Considerando o esquema para o estimador de
atrito na forma
ami (t) = 0i zi (t) + 1i

d
zi (t)
0i |mi (t)|
= mi (t) i (t)
zi (t)ki mi (t);
dt
g(mi (t))

d
zi (t)
+ 2i mi (t), (3)
dt

0i |mi (t)|
di (t)
=
zi (t)(zmi (t) zi (t)), (4)
dt
g(mi (t))
onde zmi (t) := uf (t) af (t), sao sinais filtrados a`
velocidade e o torque aplicado nos motores i, e
af (s) ,

J mi s
mi (s);
1i s + 0i

1
mi (s).
1i s + 0i
Considerando a seguinte lei de controle


mi (t) = L 1 J mi Hmi (s)mi (s) +
uf (s) ,

+ J mi

drmi (t)
+ ami (t),
dt

(5)

Hmi (s) pode ser obtido para que Gi (s) satisfaca a


condicao de uma funcao estritamente real positiva
(SPR) (Canudas de Wit et al., 1995), onde
Gi (s) =

1i s + 0i
.
J mi s + J mi Hmi (s)

(6)

A condicao suficiente de estabilidade para o


sistema na escolha de Hmi (s) de (6), foi provado
em Canudas de Wit (1998).
4

Resultados Experimentais

A determinacao dos parametros estaticos e


dinamicos e tratada em Canudas de Wit e Lischinsky (1997). O Robo Movel Khepera II r da
K-Team S. A. foi usado como modulo experimental para as aplicacoes de controle. Os parametros
do robo estao resumidos na tabela 1. Os quatro
primeiros parametros foram obtidos experimentalmente e os restantes a partir de dados do atuador
CC da serie 1212-N004-G da Faulhaber Minimotor S.A.
No inicio, experimentos foram feitos no robo
Khepera II, com os diferentes modulos adicionais
[veculo, garra e camera], cada um destes, feitos de forma individual, objetivando a determinacao dos parametros nominais do modelo de LuGre, com os motores eletricos sendo comandados
por sinais modulados por larguras de pulso digital (DPWM). A deteccao da velocidade em cada

150

150

100

PSfrag replacements

Torque mi (n)[N m]

Torque mi (n)[N m]

100

50

-50

-50

PSfrag replacements

-100

-150
-200

50

-150

-100

-50

50

100

150

-100

-150
-200

200

-150

-100

-50

50

100

150

200

Velocidade mi (n)[rad/s]

Velocidade mi (n)[rad/s]

Figura 3: Valores obtidos no experimento para a forca de atrito do Robo Khepera II em funcao da
velocidade, pontos coletados em regime permanente com tempo de estabilizacao de um segundo para os
motores esquerdo [] e direito [] respectivamente, em ambos sentidos.

Tabela 1: Parametros obtidos por medicao direta


do sistema fsico Robo Khepera II.
Massa do veculo [M ]
Diametro do veculo
Distancia entre as rodas [2 l]
Raio da cada roda [rd e re ]
Ktd e Kte
Nd e N e
Rd e R e
Jmd e Jme
J

108,146 g
70,0 mm
53,0 mm
7,5 mm
1,66 mNm/A
25
21,5
0,02 kgm2
66,15 kgm2
0,94

Tabela 2:

Par
ametros est
aticos da for
ca de atrito para o
Rob
o Khepera II ; V:veculo, G:com a garra e C:com a c
amera.

V
G
C

0i ( Nm)
esquerdo
direito
72, 595
70, 123
77, 166
77, 724
139, 538
144, 828
133, 279 135, 644
160, 274
159, 988
175, 358 180, 983

2i ( Nms/rad)
esquerdo direito
0, 104
0, 115
0, 055
0, 056
0, 022
0, 052
0, 010
0, 007
0, 012
0, 012
0, 068
0, 022

motor e feita a partir do encoder incremental localizado no eixo de cada motor, com perodo de
amostragem de 10ms.
Na Figura 3 sao mostradas a curvas de torque motor em funcao da velocidade angular para
ambos os sentidos de movimento para motores esquerdo [] e direito [] respectivamente. Os pontos
foram coletados com perodos de estabilizacao de
um segundo, garantindo assim leituras de velocidade e o torque de atrito em regime permanente
para o sistema.
Na figura 3 os componentes de atrito de Coulomb e o atrito viscoso podem ser observados, embora a baixa resolucao de velocidade dada pelo encoder incremental, resultando apenas na observa-

cao de componentes com incrementos de 26, 6667


rad/s, nao permita a ntida observacao destes
fenomenos de atrito em baixas velocidades. A tabela 2 ilustra os parametros estaticos identificados para o veculo e os modulos adicionais identificados nos motores direito e esquerdo do robo
Khepera II. Os parametros dinamicos 0i = 1
nNm/rad e 1i = 10 nNms/rad foram determinados heuristicamente.
Das caractersticas dos testes feitos, os parametros 1i = mSi = 0 foram considerados, resultando a funcao g(mi ) diretamente proporcional
a 0i .
O esquema de controle do veculo e ilustrado
na figura 4, a estrategia de controle em cascata,
desacoplada para ambos atuadores e usada. Primeiramente, o laco interno de torque e resolvido
com um controlador linear PI discreto, a partir
de uma referencia fornecida do controlador de velocidade e da estimacao do torque com a deteccao
media de velocidade no motor. O efeito causado,
como as forcas de reacao, sao observadas com o
modelo de atrito de LuGre e inseridos para a compensacao do fenomeno. O Laco externo e resolvido
com o controlador PID sintonizados garantindo a
equacao (6), condicao de uma funcao (SPR).
Para implementacao computacional, o observador de atrito (3) e o estimador que observa as
mudancas nos parametros estaticos (4), podem ser
expressos na forma discreta da seguinte forma


1i 0i
ami (n) = 01
i (n)|mi (n)| zi (n)+
0i
+ (1i + 2i )mi (n) 1i ki mi (n),
(7)
com ki > 0 e i (n) e o observador de mudancas
dos parametros estaticos
zi (n) =

zi (n 1) + Ts mi (n) ki Ts mi (n)
, (8)
0i
1+
Ts i (n)|mi (n)|
0i

Deteco mdia
de velocidade

Estimador de
Torque
Motor direito
rmd

Controlador
PID

rme

Controlador
PID

md
me

Controlador
PI

Controlador
PI

md

PWMd
d

Driver
dos
Motores

me

PWMe

Estimador de
Torque
Motor esquerdo

ame

Velocidade
Linear

Observador de
Atrito
Motor direito

Observador de
Atrito
Motor esquerdo

Velocidade
Angular

amd

PSfrag replacements

Modelo do veculo
incluindo os atuadores

Deteco mdia
de velocidade

Figura 4: Esquema de controle proposto para o robo movel com duas rodas ativas acionados por atuadores
eletricos CC, com inclusao da nao linearidade de entrada inerente de tipo atrito.
onde:

Sinal de refer
encia de velocidade do motor mi
600
400

mi (rad/s)

0i
|mi (n)|
zi (n)(zm (n)
i (n) =i (n 1) Ts
0 i
zi (n));
zm (n) = uf (n) af (n),

0
-200
-400
-600

sendo

10

12

14

16

18

20

J mi
(mi (n) mi (n 1))+
1i + 0i Ts
1i
+
af (n 1);
1i + 0i Ts

mi (rad/s)

erro de seguimento de mi com controle PID

af (n) =

uf (n) =

200

1i
Ts
uf (n1)+
(mi (n)).
1i + 0i Ts
1i + 0i Ts

erro de seguimento de mi com compensa


ca
o fixa de atrito

mi (rad/s)

mi (rad/s)

Ainda temos que 0 < < , tempo de amostragem Ts = 10ms e foi escolhido o fator = 0.1.
Com o objeto de obter o desempenho do comPSfrag replacements
pensador adaptativo, adicionalmente, foram implementadas estrategias de controle com controerro de seguimento de mi com compensa
ca
o adaptativa de atrito
lador linear PID e controlador com compensador
de atrito com parametros fixos. A figura 5, ilustra os resultados obtidos em simulacao, dos erros
de seguimento de uma referencia de velocidade senoidal com amplitude de 500 rad/s. A figura 5,
ilustra o comportamento frente as mudancas dos
parametros 0i escolhidos da tabela 2 e intencitempo (s)
onalmente variadas na zona morta nos intervalos
de 8s e 14s.
Os ganhos do controlador linear Hmi , sao
Figura 5: Controle a uma referencia de velocidade
Kp = 20, Ki = 50 e Kd = 0, 001, ajustados para
senoidal com amplitude de 500 rad/s, ilustra o
evitar um sobre sinal no seguimento de trajetoria
erro de desempenho do compensador adaptativo
e garantir que o sinal de controle i nao entre em
frente a um controlador linear PID de velocidade
saturacao (Sanca et al., 2007).
e um controle com compensacao de atrito com paA figura 6 ilustra os resultados obtidos por sirametros nominais fixos.
mulacao para o seguimento de velocidade a uma

mi (rad/s)
zi (rad)

md
me

Agradecimentos

zd

Os autores deste artigo agradecem a`s instituicoes a seguir pelo apoio dado ao desenvolvimento
desta pesquisa: CNPq - Conselho Nacional de
Desenvolvimento cientfico e Tecnologico e ANP
- Agencia Nacional do Petroleo.

mi (Nm)

md

forma eficiente para a compensacao de atrito em


um sistema robotico movel. Esta abordagem possibilita atenuar o efeito indesejavel do ciclo limite
em baixas velocidades em bases moveis de robos.

ze

Refer
encias

me

Armstrong-Helouvry, B., P. Dupont e C. Canudas


de Wit (1994). A survey of models, analysis tools and compensation methods for the
control of machines with friction. Automatica
30(7), 10831138. Elsevier Sience Ltd.

d
e

v(m/s)

Canudas de Wit, C. (1998). Comments on: A


new model for control of systems with friction. IEEE Transactions on Automatic Control 43(8), 11891190.

(rad/s)

rag replacements

Sinal de refer
encia de velocidade dos motores mi

tempo (s)

Figura 6: Controle de velocidade a uma referencia


degrau nas duas rodas do veculo com perturbacoes em 6s, 12s e 16s.
referencia degrau de md = 500 rad/s e me =
500 rad/s, com perturbacoes intencionais na
zona morta escolhidos da tabela 2 em 6s e 12s.
A perturbacao intencional em 16s e o resultado
da diminuicao dos valores limiares da zona morta
em li = [0, 15; 0, 14] e l+i = [0, 12; 0, 13], com
li e l+i sao os limites inferior e superior da zona
morta para os motores direito e esquerdo respectivamente. Pode-se observar o comportamento dos
estados internos, o observador das mudancas nos
parametros estaticos, o torque, a largura de pulso
e as velocidades linear e angular do veculo.
5

Conclus
oes

Neste artigo foram apresentados resultados


que permitem comprovar a eficiencia do metodo
de compensacao adaptativo de atrito no controle
no espaco de atuadores para um veculo com duas
rodas diferenciais. Os efeitos indesejaveis de mudancas dos valores limiares da zona morta podem
assim serem compensados.
Os resultados obtidos permitem comprovar
que o modelo de LuGre pode ser utilizado de

om e
Canudas de Wit, C., H. Olsson, K. J. Astr
P. Lischinsky (1995). A new model for control
of systems with friction. IEEE Transactions
on Automatic Control 40(3), 419425.
Canudas de Wit, C. e P. Lischinsky (1997).
Adaptive friction compensation with partially known dynamic friction model. International Journal of Adaptive Control and Signal
Processing 11, 6580.
Laura, T. L., J. J. F. Cerqueira, C. C. Paim,
J. A. Pomlio e M. K. Madrid (2006). Modelo dinamico da estrutura de base de robos
moveis com inclusao de nao linearidades - o
desenvolvimento do modelo. Em: Anais do
XVI Congresso Brasileiro de Autom
atica. Sociedade Brasileira de Automatica. Salvador,
Bahia. pp. 28792884.
Lischinsky, P., C. Canudas-de-Wit e G. Morel
(1999). Friction compensation for an industrial hydraulic robot. IEEE Control Systems
Magazine 19(1), 2532.
Sanca, A. S., J. J. F. Cerqueira e C. E. T. Dorea
(2007). Controle com compensacao de atrito
para estruturas de base moveis de robos manipuladores. Em: Anais do VIII Simp
osio
Brasileiro de Automaca
o Inteligente. Sociedade Brasileira de Automatica. Florianopolis, SC. pp. 16.
Tao, G. e P. V. Kokotovic (1996). Adaptive Control of Systems with Actuator and Sensor
Nonlinearities. John Wiley & Sons, Inc.