Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstract— O processo de revisao do CBA 2014 sera DOUBLE BLIND, portanto NAO inclua autores na
versão que será submetida para revisão. Leve isso em consideração ao citar seus próprios trabalhos.
Keywords— Template, Example.
Resumo— O processo de revisão do CBA 2014 será DOUBLE BLIND, portanto NÃO inclua autores na versão
que será submetida para revisão. Leve isso em consideração ao citar seus próprios trabalhos.
com Referências
2
γ
a1 γc1 g4
Aguirre, L. A., Bruciapaglia, A. H., Miyagi, P. E.
a22 = − g14 − 1 W1∗T ω1 ω1T W1∗ S̄1
2 2 32 and Piqueira, J. R. C. (2007). Enciclopédia
γ 1 ∗T
a33 = c1
c1
− W1 S̄1 W1∗ ω1 ω1T (38) de automática: controle e automação, Blu-
2 32 cher, São Paulo. OCLC: 246910304.
Para que a matriz A1 possa ser feita positiva Al-Tamimi, A., Lewis, F. and Abu-Khalaf, M.
definida, uma condição necessária é que ω1 ω1T seja (2008). Discrete-Time Nonlinear HJB Solu-
persistentemente excitante, com isso, assume-se a tion Using Approximate Dynamic Program-
seguinte hipótese: ming: Convergence Proof, IEEE Transacti-
ons on Systems, Man, and Cybernetics, Part
Hipótese 1 (Persistência de Excitação) B (Cybernetics) 38(4): 943–949.
Os sinais ωi , com i = 1, 2, . . . , n, satisfazem a
seguinte condição de persistência de excitação Bai, Y., Cao, Y. and Li, T. (2019). Optimi-
(PE) sobre o intervalo [t, t + T ]: zed Backstepping Design for Ship Course fol-
lowing Control Based on Actor-Critic Archi-
Z t+T tecture with Input Saturation, IEEE Access
ηi Ini ≤ ωi (τ )ωiT (τ )dτ ≤ ζi Ini 7: 73516–73528.
t
Ainda falta sendo ηi > 0, ζi > 0, T > 0, e Ini ∈ Rni ×ni Ge, S. S. and Wang, C. (2004). Adaptive
olhar a ques- a matriz de identidade (Vamvoudakis and Lewis, neural control of uncertain MIMO nonli-
tão das nor-
2010). near systems, IEEE Transactions on Neural
mas. A prin- Networks 15(3): 674–692.
cı́pio acho
que deveria Além de satisfazer a Hipótese 1, as as seguin-
Khalil, H. K. (2002). Nonlinear Systems, 3rd ed
tê-las. tes condições também devem ser satisfeitas, como
edn, Prentice Hall, Upper Saddle River, N.J.
condição suficiente para que A1 seja definida po-
Tenho que sitiva: Kirk, D. E. (2004). Optimal Control Theory:
trabalhar
mais nessas 13
ζ2 ∗T ∗
An Introduction, Dover Publications, Mine-
2
condições. β1 > , γa1 > γc1 + W1 W1 ζ3 ola, N.Y.
Pelo jeito,
8ζ1 16
pelo menos 1 Lewis, F. L., Vrabie, D. and Vamvoudakis, K. G.
sup W1∗T S̄1 W1∗
o β1 terá γc1 ≥ (39)
16 t≥0 (2012). Reinforcement learning and feed-
que ficar em
função de back control: Using natural decision methods
g1 (x̄1 ). A em que ζ1 = inf t≥0 {g12 (x̄1 )}, ζ2 = supt≥0 {ω1 ω1T } to design optimal adaptive controllers, IEEE
princı́pio isso e ζ3 = supt≥0 {g14 (x̄1 )}. Control Systems Magazine 32(6): 76–105.
não parece
“muito” pro-
Com isso a desigualdade (37) pode ser rescrita
blema. como Raffo, G. V., Ortega, M. G. and Rubio,
F. R. (2008). Backstepping/nonlinear
L̇1 ≤ −ā1 ||ξ1 ||2 + c̄1 + g12 z22 (40) $\mathcal{H} \infty$ control for path trac-
king of a quadrotor unmanned aerial vehicle,
sendo ā1 = inf t≥0 {λmin {A1 (t)}}, c̄1 = Proceedings of the American Control Confe-
supt≥0 {C1 (t)} e λmin {·} o mı́nimo autovalor. rence pp. 3356–3361.
Sutton, R. S. and Barto, A. G. (2018). Reinfor-
cement Learning: An Introduction, Adaptive
Computation and Machine Learning Series,
second edition edn, The MIT Press, Cam-
bridge, Massachusetts.