Escolar Documentos
Profissional Documentos
Cultura Documentos
net/publication/303564921
CITATIONS READS
2 58
4 authors, including:
Samuel Bueno
Centro de Tecnologia da Informação Renato Archer
45 PUBLICATIONS 752 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Project VERDE - Veículo Elétrico Robótico com Diferencial Eletrônico View project
All content following this page was uploaded by Rafael De Angelis Cordeiro on 27 May 2016.
Abstract— The paper addresses the analysis and modelling for an all-terrain robotic vehicle, incorporating
wheel slips and three dimensional motion. Two different LQR path tracking controllers are proposed and com-
pared through the simulation in a complex test circuit. The influence of the 3D dynamics on the path following
performance is analysed, namely due to the weight distribution, and different longitudinal slipping and side slip
for the 4 wheels.
Keywords— Outdoor robotics, dynamic vehicle models, Ackerman steering, trajectory control, LQR
Resumo— Este artigo apresenta o desenvolvimento e análise de um modelo dinâmico tridimensional para um
veı́culo robótico de exterior de quatro rodas, incorporando modelos de derrapagem ou escorregamento e pisos
com cotas variáveis. Dois controladores de trajetória do tipo LQR são propostos e os resultados comparados
em simulação em um circuito de alta complexidade. Os efeitos da dinâmica tridimensional sobre o desempenho
do seguimento de trajetória são analisados, nomeadamente devido a valores de derrapagem e escorregamento
diferentes nas 4 rodas.
Palavras-chave— Robótica de exterior, modelos dinâmicos, direção Ackerman, controle de trajetória, LQR
delo dinâmico é utilizado tanto para a concepção Evoluiu-se, portanto, o modelo proposto. O
de modelos simplificados utilizados na sı́ntese de novo modelo é composto de um corpo rı́gido com
controladores quanto para a criação de um simula- uma determinada massa m e quatro rodas, que são
dor completo do veı́culo. Em termos de controle, o conectadas ao corpo rı́gido por suspensões do tipo
artigo aborda uma análise comparativa entre duas mola-amortecedor, independentes entre si (Figura
diferentes estratégias baseadas na técnica LQR, 2). Os pontos que representam as rodas estão em
onde uma delas busca incluir o efeito da derrapa- contato com o terreno, onde cada um dos conta-
gem. Além disso, uma análise é feita usando um tos é representado por uma função interpolada a
dos controladores para evidenciar os efeitos do mo- partir de um grid que representa a cota do terreno
delo dinâmico tridimensional no controle de traje- por onde o veı́culo se locomove. Além disso, a cada
tória do veı́culo. Todos os resultados apresentados ponto do grid associa-se, também, um valor para
foram obtidos a partir do simulador desenvolvido o coeficiente de atrito µ do pneu com o solo. As-
com o modelo dinâmico aqui proposto. sim, interpola-se o coeficiente de atrito para cada
A motivação e contexto desse artigo é o Pro- roda, permitindo que o veı́culo encontre diferentes
jeto VERO – Veı́culo Robótico de Exterior, de- tipos de aderência em seu trajeto.
senvolvido pelo Centro de Tecnologia da Infor-
mação Renato Archer (CTI) e seus colaborado-
res. O veı́culo a ser utilizado no projeto VERO
é apresentado na Figura 1 e será utilizado futura-
mente para implementação e validação dos resul-
tados aqui apresentados.
J ω̇ = −ω × Jω + Tw − Ta (2)
onde m é a massa total do veı́culo, ω é a velocidade
de rotação, VCG é sua velocidade linear, F e T são
as forças e torque aplicadas no veı́culo, sendo que
os subı́ndices w e a representam grandezas prove-
nientes das rodas e de atritos, respectivamente, e
J corresponde ao tensor de inércia.
Figura 4: Forças e torques entre solo e pneu.
Apesar das rodas serem tratadas como pontu-
ais, a sua dinâmica de rotação é responsável pela
Fx , Fy ou Mz
criação das forças (Fw ) e torques (Tw ) utilizados Ym
fornece uma relação de acoplamento entre as for- veı́culo, bem como no modelo cinemático dos er-
ças Fx e Fy (Bakker et al., 1987; Pacejka, 2002). ros de trajetória. Inicialmente, o modelo comu-
A força Fz , devido ao movimento tri- mente usado em seguimento e tracking, denomi-
dimensional do veı́culo e à suspensão, varia en- nado “modelo bicicleta” é apresentado (Figura 6),
tre as rodas. Para estimar tal força, dado que a onde as duas rodas de cada eixo são representadas
suspensão do veı́culo é do tipo mola-amortecedor, apenas por uma roda “central” equivalente, o que
tem-se: supõe um veı́culo simétrico, com movimento em
um plano (2D) (Lenain et al., 2005; Snider, 2009).
Fz = − ks dz − bs d˙z (8) Nesse caso, para o propósito de navegação, duas
variáveis importantes são definidas que são o erro
onde ks e bs são os coeficientes de mola e de amor- de distância lateral à trajetória, denotado por ye ,
tecimento, respectivamente, e dz é a deformação e o erro angular em relação à orientação da traje-
da mola. tória denotado por ψe .
A partir do modelo dinâmico tridimensional Além disso, na mesma figura, T representa a
aqui descrito, um simulador do veı́culo foi de- trajetória a ser seguida, P indica o CG do carro
senvolvido em ambiente MATLAB/SIMULINK
.
R
e V indica a sua velocidade. Assim, o objetivo
Para os parâmetros do modelo, foram utilizados final do controlador é minimizar os erros de traje-
valores tı́picos de veı́culos encontrados na litera- tória, utilizando como saı́da de controle o ângulo
tura. de esterçamento da direção δ.
x [m]
da direção (10), obtém-se: 50
ẏ 0 vx0 0 y 0 0
ψ̇ = 0 0 1 ψ + 0 δ (12)
0 50 100
ṙ 0 0 ar r br y [m]
onde x = [y ψ r]T .
Figura 7: Circuito para testes.
Lembramos ainda que os estados y e ψ do mo-
delo são de fato os erros de trajetória ye e ψe re-
lativos à trajetória seguida. metade do diâmetro para verificar a resposta do
Os valores do modelo podem ser obtidos nu- carro em curvas contı́nuas mais fechadas. Além
mericamente a partir do simulador descrito na se- disso, a transição do “oito” evidencia a resposta do
ção 2 e a partir desse modelo foi projetado um controlador para uma brusca mudança de sentido
controlador utilizando a técnica LQR. da direção. Na saı́da do “oito”, a trajetória segue
em uma linha reta de forma a se manter alinhado
3.3 Sı́ntese de controladores por projeto LQR com a pista e, então, realiza uma curva fechada à
com derrapagem – LQRdin direita (um quarto de circunferência com raio de
8m), evidenciando sua resposta a situações de alta
Combinando-se a equação do erro de trajetória
derrapagem. Segue-se em linha reta e retorna-se
lateral linearizado (9) e o modelo lateral lineari-
ao ponto inicial com uma segunda curva fechada,
zado de segunda ordem (11), obtém-se o modelo
igual à anterior.
cinemático com derrapagens para os erros de tra-
jetória: O veı́culo inicia com um erro lateral de 5m,
evidenciando sua qualidade de realinhar a traje-
tória. O coeficiente de atrito entre pneu e solo
ẏ 0 vx0 1 0 y 0 foi ajustado para 0,34 – pista de paralelepı́pedos
ψ̇ 0 0 0 1 ψ 0
v̇y =
vy +
δ (13) molhados (De Paiva et al., 2010).
0 0 al11 al12 bl1
ṙ 0 0 al21 al22 r bl2
4.1 Comparação entre LQRcin e LQRdin
onde x = [y ψ vy r]T e al11 , al12 , al21 , al22 e bl1 ,
bl2 são os elementos das matrizes dinâmicas Al e Antes de abordar os aspectos tridimensionais no
Bl em (11) e seus valores são obtidos numerica- controle, faz-se uma comparação, em simulação,
mente, como no caso anterior. entre os dois controladores propostos e discute-se
Um novo controlador foi obtido através deste a eficácia do acréscimo da inclusão da velocidade
modelo de quarta ordem, de novo, utilizando a lateral como parâmetro de controle de derrapa-
técnica LQR. gens. Para tal, executou-se o circuito proposto an-
Com a introdução da velocidade lateral ao teriormente a velocidades de 4m/s e 10m/s tanto
modelo, espera-se uma melhor resposta as curvas para o LQRcin quanto para o LQRdin. A Figura
fechadas, dado que essa velocidade é uma repre- 8 apresenta os trajetos realizados por ambos e o
sentação do transiente do erro lateral. erro lateral obtido.
Da figura, constata-se que os controladores
4 Resultados e Discussões são capazes de executar o trajeto e que mesmo a
velocidades altas, com altos escorregamentos, am-
Tendo sido tratado os aspectos de modelagem, bos conseguem se ater à trajetória desejada.
tanto do simulador como dos controladores pro- Comparando os dois controladores vê-se que,
postos, resultados em simulação são apresentados apesar da inclusão de um parâmetro que deveria
para possibilitar uma análise do que foi desenvol- adicionar um controle às derrapagens devido à di-
vido. nâmica incorporada, a resposta obtida por ambos
Para tal, foi concebido um circuito em que é muito semelhante, não evidenciando um ganho
tenta-se criar diversas situações para o controle desse acréscimo, mesmo em uma situação de altas
do veı́culo. O circuito que pode ser visto na Fi- derrapagens.
gura 7 é plano e inicia-se com uma reta, seguida A utilização da velocidade lateral no controle
por uma trajetória em “oito” onde o veı́culo rea- insere uma derrapagem equivalente (no CG do veı́-
−V
liza um cı́rculo de 50m de diâmetro, verificando culo) ao modelo da bicicleta dada por β = Vxy .
se este consegue manter um baixo erro durante Assim, a Figura 9 apresenta uma comparação
uma curva contı́nua, e um segundo cı́rculo com a dessa derrapagem equivalente com as derrapagens
x (m)
50 50 rodas. O circuito é realizado a uma velocidade de
0 0
10m/s, onde os efeitos tridimensionais ficam mais
acentuados. O trajeto obtido é apresentado na
−50 0 50 100 −50 0 50 100
y (m) y (m)
Figura 10.
150
(a) (b)
10 10
100
ye (m)
ye (m)
0 0
x (m)
−10 −10
50
0 50 100 150 0 20 40 60 80
t(s) t(s)
(c) (d) 0
−50 0 50 100
Figura 8: Comparação entre LQRcin (azul) e
y (m)
LQRdin (verde): (a) Trajeto à 4m/s. (b) Tra-
jeto à 10m/s. (c) Erro lateral à 4m/s. (d) Erro
lateral à 10m/s. Figura 10: Trajetos usando LQRdin à 10m/s.
0
Analisando os parâmetros relacionados ao
−20 controle lateral (11(a)–(d)), vê-se que o erro la-
0 20 40 60 80 teral é mais acentuado nas situações onde o ân-
t(s)
gulo de derrapagem é maior, que ocorre nas cur-
(a) vas bruscas (δ elevado). Além disso, nas figuras
10 11(c) e 11(d) são destacados os pontos onde o ân-
5 gulo de derrapagem ultrapassa o valor de força
máxima definido no modelo de Pacejka, ou seja,
[deg]
−5
os instantes onde o veı́culo perde a aderência ao
solo. Observa-se que nesses momentos o ângulo
−10
0 20 40 60 80 de esterçamento da direção é muito elevado e os
t(s)
casos de maiores derrapagens surgem durante os
(b) momentos de saturação da direção (δ).
Já olhando para as figuras 11(e)–(g), é pos-
Figura 9: Comparação das derrapagens das ro- sı́vel analisar o efeito do regulador longitudinal.
das com a derrapoagem equivalente (vermelho) do Nela, destaca-se que, a baixas velocidades – com
modelo bicicleta. (a) Rodas dianteiras esquerda baixos escorregamentos, o erro da velocidade é
(azul) e direita (verde). (b) Rodas traseiras es- quase nulo. Já para velocidades elevadas, o veı́-
querda (azul) e direita (verde). culo por várias vezes perde a aderência ao solo,
onde os escorregamentos ultrapassam diversas ve-
zes o valor de máximo da curva de Pacejka (pon-
4.2 Efeitos tridimensionais tos em destaque nas figuras 11(f) e 11(g)), a velo-
cidade longitudinal cai bruscamente, sendo reto-
Para abordar os efeitos tridimensionais no con- mada apenas nas retas. Além disso, observando
trole do veı́culo, um dos método de controle foi as curvas de derrapagem nas rodas (11(c) e (d)),
utilizado (no caso, o LQRdin) para analisar o com- repara-se que o efeito de queda da velocidade é
portamento do veı́culo simulado durante a execu- acentuado com a presença de altas derrapagens.
ção do trajeto. Apesar do circuito planar, é pos- Para melhor observar o efeito, as figuras 12(a)
sı́vel analisar os efeitos tridimensionais do veı́culo, e 12(b) comparam a velocidade linear do veı́culo
10
10
ye (m)
0
[m/s]
8
−10
6
0 20 40 60 80
t(s) 0 20 40 60 80
t(s)
(a)
(a)
20
14
δ (deg)
0
12
[m/s]
−20 10
0 20 40 60 80
8
t(s)
6
(b) 0 20 40 60 80
t(s)
20
(b)
α (deg)
5
α (deg)
−5
2,000
−10
0 20 40 60 80
Fy (N)
t(s)
0
(f)
−2,000
40 −20 0 20
σ (%)
α (deg)
20
0
(a)
0 20 40 60 80 2,000
t(s)
1,000
Fy (N)
(g) 0
−1,000
Figura 11: Curvas dos parâmetros ye , δ, α, ue e σ −2,000
para velocidade de 10m/s. −20 0 20
α (deg)
(b)
com aquela obtida pela rotação da roda (Rw Ω).
Desta figura pode-se verificar que a velocidade Figura 13: Curvas de Fy (α) para as rodas es-
do veı́culo é equivalente àquela vista nas rodas da querda (azul) e direita (verde). (a) Dianteiras.
frente já que esta não tem atuadores acoplados e (b) Traseiras.
são apenas “levadas” pelo movimento do veı́culo.
Analisando mais precisamente o perı́odo de tempo Para avaliar o comportamento da força late-
que vai de 25s a 55s, tem-se que a velocidade de ro- ral, a Figura 13 apresenta os valores de Fy (α) du-