Você está na página 1de 5

UERJ UNIVERSIDADE DO ESTADO DE RIO DE JANEIRO, BRASIL, DECEMBRO 2020 1

Aplicão de Controle Extremal em Carrinho lineal


Jose Luis Huayanay Villar, UERJ, Delcinho , UERJ,
Prf: Tiago Roux Oliveira,UERJ

Abstract—Para este trabalho que desenvolve um novo método II. M ODELAGEM M ATEM ÁTICA
de busca extrema (ES), que tem uma longa história como
um esquema de otimização, para estabilização de ciclo aberto
,possivelmente desconhecido sistemas dinâmicos instáveis.A busca dia
extrema é usada para encontrar a fonte de um sinal (carrinho ) u = Km Kg ω + La + Ra i a (1)
dt
cuja força decai com a distância.Isso é alcançado sem a medição
do vetor de posição e usando apenas a medição do sinal escalar na qual u e a tensão de armadura (sinal de controle),Km e Kg
Index Terms—controle extremal,optimizacion
são as constantes contra eletromotrizes do motor.para

ω̇ = (2)
I. I NTRODUÇ ÃO r
por tanto
T HE Controle Extremal ( ESC Extremum Seeking
Control) é uma forma de controle adaptativo onde a
função objetivo é otimizada, sem a necessidade explı́cita do ia = −
Km Kg
rRa
ẋ +
1
Ra
u (3)
conhecimento da planta, exceto a existência de um ponto de
Uma analise mecânica no eixo do motor.
extremo máximo ou mı́nimo ( Tan et al., 2010). Este método
lida com o problema de otimização em tempo real, podendo T = Tcarga − Tperda = Ja ω̈ (4)
o mapeamento não-linear ser escalar ou multivariável. Uma
abordagem multivariável detalhada pode ser encontrada em sabendo-se que T = Km Kg ia e o torque resultante da corrente
( Rotea, 2000; Krstic and Wang, 2000; Ariyur and Krstic, de armadura, Tcarga = rF e o torque aplicado ao carrinho,
2003; Tan et al., 2010). Esta trabalho desenvolve um novo desprezando-se as perdas no eixo (Tperda = 0).
método de busca extrema (ES), que tem uma longa história
Km Kg
como um esquema de otimização, para estabilização de F = ia (5)
ciclo aberto possivelmente desconhecido sistemas dinâmicos r
instáveis. Nesse trabalho será considerado Um controle Substituindo-se (44) em (46) obtém-se
Extremal aplicado a um carrinho. Km Kg Km Kg 1
Finalmente, são desenvolvidos controladores extremos não F = (− ẋ + u) (6)
r rRa Ra
suaves que têm a vantagem de que seus os esforços de
controle se aproximam de zero quando a trajetória do sistema Então, substituição de (47) em (40) e (41).
ocorre, diferentemente da persistente oscilação presente no bm Km Kg Km Kg 1
ẍ = − ẋ + (− ẋ + u) (7)
tı́pico de busca extrema. m mr rRa Ra
para coeficiente de atrito viscoso do carrinho bm = 0

x1 = x (8)

ẋ1 = ẋ = x2 (9)
Km Kg 2 1 Km Kg
ẋ2 = ẍ = −x2 [( ) ]+ u (10)
r mRa mrRa
para o sistema linear

ẋ = Ax + Bu (11)

y = Cx + Du (12)

Formula Matricial:
" # " #" # " #
ẋ1 0 1 x1 0
= K K 1 + Km Kg u (13)
ẋ2 0 −( mr g )2 mR a
x2 mrRa

Fig 02 :optimização móvel. PEL-UERJ para valores A tabela abaixo apresenta ps parâmetros utilizados
na modelagem do sistema.
UERJ UNIVERSIDADE DO ESTADO DE RIO DE JANEIRO, BRASIL, DECEMBRO 2020 2

Km 0.00767 constante relacionada ao torque do motor


Kg 3.7 relação de transmissão das engrenagens motor onde my ∈ R é uma onda quadrada gerada pelo modelo de
Rm 2.6 resistência da armadura [Ω] referência.
r 0.635x 10− 2 raio da roda do carrinho [m] portanto, assumimos que o mapa não linear J = f (θ)
m 0.455 massa do carrinho [kg]
tenha um máximo local e busque o rastreamento local desse
TABLE I máximo. Para maior clareza, assumimos que o mapa não
TABLE TO TEST CAPTIONS AND LABELS linear é quadrático e que seu hessiano é diagonal.

J = f (u) = f ∗ − qu (u − u∗ )2 (24)

" # " #" # " # onde (u∗ ) e o maximizador desconhecido ,f ∗ = f (u∗ ) é o


ẋ1 0 1 x1 0
= + u (14) máximo desconhecido,e q são algum positivo desconhecidos
ẋ2 0 −16.8835 x2 3.7778 constantes.
" # Isso corresponde ao problema da localização da fonte em
h i x1 um campo de concentração desconhecido. designa escolhe os
y= 1 0 (15) parâmetros α, ω, h, k
x2
Considerando que o busca de extremo automaticamente ajusta
função de transparência ue para levar o carrinho ao pico de f (u) A análise a seguir
emprega o método da média.seja.
G(S) = C(SI − A)−1 B + D (16)
h
ss2tf(A,B,C,D) e Seguindo o script calculou-se a função de e= [J] − f ∗ (25)
s+h
transferência do carrinho em malha usando-se o comando
então o sinal após o filtro de lavagem pode ser expresso como
[num,den]=ss2tf(A,B,C,D) e a seguinte função de transferência
foi obtida: s h
3.778 [J] = J − [J] = J − f ∗ − e (26)
G(S) = 2 (17) s+h s+h
s + 16.88s
Agora, vamos apresentar as novas coordenadas.
a impulso resposta para e sistema e
ũ = u − u∗ − αsin(ωt)
 
−1 0, 223 0, 223 (27)
g(t) = L [G(S)] = L
−1
− (18)
s s + 16, 88
Então, na escala de tempo τ = ωt nos definimos.

g(t) = 0, 2223 − 0, 233e−16,88t (19) 4 = (J − f ∗ − e) = −[qu (ũ + αsin(ωt))2 + e] (28)


logo por convolução
Então, resumimos o sistema na Fig. 2 como
Z t
y(t) = g(t − τ )u(τ ) dτ (20)
0
então saı́da de sistema dũ 1
Z t = cu 4sinτ (29)
dτ ω
y(t) = 0, 2223 − 0, 233e−16,88t(t−τ ) u(τ ) dτ (21)
0
ésimismo incluı́mos um degrau . de 1
Z t = .4 (30)
dτ ω
y(t) = 0, 2223 − 0, 233e−16,88t(t−τ ) u(τ ) dτ (22)
0 O sistema (28) - (29) está na forma em que o método de
ym média é aplicável,desde que ω seja pequeno.ω seja grande
em relação aos parâmetros no objetivo não linear.
a modelo media de (28) e ( 29) .
III. A I DEIA B ÁSICA DE C ONTROLE E XTREMAL
Para entender a ideia básica de busca extremal, é melhor dũmed 1
= − .αcu qu ũmed (31)
considerar primeiro o caso de um mapa estático de entrada dτ ω
única do quadrática, como mostra a figura .
otimização e controle são ferramentas fundamentais para en-
α2
 
demed 1 2
frentar essas plantas desconhecidas. = − .h qθ θ̃med + emed + qθ (32)
enquanto o sinal de erro de saı́da a foi calculado usando a dτ ω 2
diferença entre o sinal de referência ym e a saı́da de a planta Então o equilı́brio do modelo médio (30) -(31)
y [1] [2]
e α2
e = y(t) − ym (23) θ̃medi = 0, eemed = − (qθ ) (33)
2
UERJ UNIVERSIDADE DO ESTADO DE RIO DE JANEIRO, BRASIL, DECEMBRO 2020 3

então o sinal após o filtro de lavagem pode ser expresso caracteriza o desempenho assintótico do controle extremo em
como Fig 2. Desde que escolhemos α como pequeno e ω como
grande, o erro de rastreamento é muito pequeno. considere
J = f ∗ − q(u − u∗ )2 (34) um movimento do objetivo está na forma do . Definimos os
parâmetros do alvo
Então, na escala de tempo τ = ωt nos definimos.
u∗ = am sin(ωm t) (45)
s
4= J = −[qu (ũ + αsin(ωt))2 ] + e] (35)
s+h
IV. E XPERIMENTAÇ ÃO
como:
Primeiramente, ilustramos os resultados da simulação de
u = ωcos(ωt) + û (36) busca de um objetivo.

de 1
= .4 (37)
dτ ω
O sistema (28) - (29) está na forma em que o método de
média é aplicável,desde que ω seja pequeno.ω seja grande
em relação aos parâmetros no objetivo não linear.
a modelo media de [3] .
dũmed 1
= − .αcu qu ũmed (38)
dτ ω

α2
 
demed 1 2
= − .h qu ũmed + emed + qu (39)
dτ ω 2
Então o equilı́brio do modelo médio (30) -(31)

α2
ũemedi = 0, eemed = − (qu ) (40)
2
o jacobiano com respeito (uemedi , eemed ) sera :
" #
1 −αcu qu 0
J= (41)
ω 0 −h

Dado o conhecimento de que o extremo é máximo, qu e


positivo, Portanto, se escolhermos α > 0, cu > 0 e h > 0, o
jacobiano (34) é Hurwitz eo equilı́brio (31)e (33) do sistema
médio (31) é localmente exponencialmente estável.Então, de
acordo com a média teorema (Khalil, 2001), temos o seguinte
resultado.
teorema 1:Existe ω̄ tal que para todos ω1 ∈ (0, ω̄1 ) o sistema
na fig 2 com e mapa não linear da forma possui uma solução
2π 2π
periódica exponencialmente estável única (ũ ω , e ω ) para o

per iodo ω esta solução satisfaz .
" 2π #
ũ ω
≤ O(1/ω), ∀τ ≥ 0 (42)

2π 2
e ω + α2 (qu )
2π 2π
Desde a u − u∗ = ũ + αsin(ωt) = (ũ − ũ ω ) + (ũ ω − 0) +
αsinτ, , o teorema implica que o primeiro termo converge
para zero,e o segundo termo é O(α)

∗ 1
lim sup u − u = O(α + ) (43)

τ →∞ ω
Da mesma forma, podemos obter

∗ 1
lim sup f − f = O(α2 + ( )2 ) (44)

τ →∞ ω
UERJ UNIVERSIDADE DO ESTADO DE RIO DE JANEIRO, BRASIL, DECEMBRO 2020 4

Fig 02 :diagrama de control. PEL-UERJ


sinal de referencia :
onda quadrada
fequencia =0.5 ,Amplitude=0.15 u∗ = 0,f ∗ = 0,qu = O.5 e
ω = 0.5 ,α = 0.6 , ,h=1
a posição inicial do carrinho é u(0)=0 o carrinho começa em 1 sondando para subir o gradiente do mapa desconhecido,
eventualmente circulando muito próximo ao maximizador -1 a saı́da do sinal desconhecido J é mostrado em a grafica.
enquanto o sinal de erro de saı́da a ser diminuı́do foi calculado usando a diferença entre o sinal de referência ym e a saı́da
de a planta y [2]

Fig 02 :resultado. PEL-UERJ


UERJ UNIVERSIDADE DO ESTADO DE RIO DE JANEIRO, BRASIL, DECEMBRO 2020 5

V. C ONCLUSION
En este trabajo se realisaron varias pruevas ,incluyendo PID para el ratreamiento de de señal de referencia

R EFERENCES
[1] M. G. M. Titica, D. Dochain, “Adaptive extremum seeking control of fed-batch bioreactors,” Broadcasting, IEEE Transactions on, vol. 9, pp. 618–631,
2003.
[2] N. O. Aminde, “Controle extremal via funções de monitoração e realimentação de saı́da,” peridico.
[3] M. K. Chunlei Zhang, Antranik Siranosian, “Extremum seeking for moderately unstable systems and for autonomous vehicle target tracking without
position measurements,” Automatica, vol. 43, no. 10, pp. 1832–1839, 2007.