Escolar Documentos
Profissional Documentos
Cultura Documentos
Aspectos Práticos Sobre o Desenvolvimento de Um Pêndulo Invertido Com Roda de Reação
Aspectos Práticos Sobre o Desenvolvimento de Um Pêndulo Invertido Com Roda de Reação
net/publication/346697098
CITATIONS READS
0 18
4 authors, including:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
QUALITY ASSESSMENT GENERATED IN THE LASER MARKING PROCESS FOR THE TRACEABILITY OF COMPONENTS IN THE INDUSTRY View project
All content following this page was uploaded by Manoel Kolling Dutra on 08 December 2020.
Abstract:
The control of non-linear systems can become a complex task, depending on the difficulty of
the system to be controlled. The non-linear model of the Inverted Pendulum is an example of
relatively complex non-linearity, and the implementation of a controller for this system requires
a series of considerations and simplifications. Thus this work, investigates how to build, model
and control an inverted pendulum with a reaction wheel, with emphasis on procedures and
methodologies. Thus was built a prototype of the Pendulum, its mathematical model developed
and parameterized, as well as all the necessary hardware for its operation. Two linear control
architectures were also implemented, one PID and the other by Arbitrary Pole Allocation in the
state space, which meet the basic requirements of the linearized model regulation at the point
of operation. As a result, there is a functional prototype, its model, controllers that stabilize it
and a brief evaluation of them.
Resumo: O controle de sistemas não lineares pode se tornar uma tarefa complexa, dependendo
da dificuldade do sistema a ser controlado. O modelo não linear do Pêndulo Invertido é um
exemplo de não linearidade relativamente complexo, e a implementação de um controlador
para este sistema requer uma série de considerações e simplificações. Desta forma este trabalho
investiga como construir, modelar e controlar um pêndulo invertido com roda de reação, com
ênfase em procedimentos e metodologias. Sendo assim foi construı́do um protótipo do Pêndulo,
seu modelo matemático desenvolvido e parametrizado, assim como todo o hardware necessário
ao seu funcionamento. Foram também implementadas duas arquiteturas de controle linear, uma
PID e outra por Alocação Arbitrária de Polos no espaço de estados, que atendem a requisitos
básicos de regulação do modelo linearizado no ponto de operação. Como resultado têm-se um
protótipo funcional, seu modelo, controladores que o estabilizam e uma breve avaliação deles.
Keywords: Inverted Pendulum; Reaction Wheel; Space State; Linear Control; Applied Control.
Palavras-chaves: Pendulo Invertido; Roda de Reação; Espaço de Estados; Controle Linear;
Controle Aplicado.
ẋ1 = x2
B mgl ηkt η 2 kt ke + Ra Beq Figura 5. Ensaio da resposta em frequência para a posição
ẋ2 = − x2 + x1 − Vin + x4 do pêndulo.
J J JRa JRa
ẋ3 = x4
ηkt η 2 kt ke − Ra Beq
ẋ4 = Vin − x4 , (26)
Jeq Ra Jeq Ra
que pode ser representado na forma
ẋ = Ax + Bu
y = Cx + Du, (27)
onde: x é o vetor de estados e ẋ sua derivada, u é o
vetor de entrada e y a saı́da do sistema. A ∈ Rn×n é
a matriz associada aos estados do sistema, B ∈ Rn×m
às entradas, C ∈ Rw×n a matriz associada as saı́das, e
D ∈ Rm×w a matriz de transmissão direta. A partir dos Figura 6. Em sentido horário, fragmentos inicial, central e
valores numéricos apresentados na Tabela 2, e colocando final do ensaio para o ângulo do pêndulo.
as equações (26) sob a forma de (27), obtendo-se
utilizado o teste estatı́stico de Theil H, que permite avaliar
0 1 0 0
0 a similaridade entre dados reais e simulados (Alvarado,
ẋ1
mgl −B η 2 kt ke + Ra Beq x1 −ηkt 2017). O valor de H varia entre 0 (para predições perfeitas)
0
ẋ2 J x2 JRa e 1 (para piores predições). Um modelo é aceitável quando
J JRa
ẋ = 0 0 0 1 + u,
x3 0 H é menor que 0, 4; é razoavelmente aceitável quando o
3
2 ηk
ẋ4 η kt ke + Ra Beq x4 t valor de H está entre 0, 4 e 0, 7 e deve ser rejeitado quando
0 0 0− for maior que 0, 7 (Rowland and Holmes, 1978). Busca-se
Jeq Ra Jeq Ra
neste trabalho modelos com H ≤ 0, 4.
(28)
sendo C escolhida de acordo com as saı́das desejadas e D =
0. Observa-se que o sistema é de estado completamente
controlável, possibilitando o projeto de um controlador
que aloque arbitrariamente os polos de malha fechada do
modelo a partir de um vetor de ganho (Ogata and Severo,
1998).
Figura 7. Ensaio para a posição da roda.
3.4 Validação do modelo
O teste estatı́stico de Theil, é expresso pela equação (29),
Para validar o modelo numérico e capturar uma maior em que ρ são os dados do fenômeno real e ρ̂ são os dados
quantidade de dinâmicas importantes foi utilizado um en- do modelo investigado.
saio de resposta em frequência, que consiste no envio de um q P
1 n 2
sinal de onda quadrada simétrica com frequência crescente n t=1 (ρ − ρ̂)
e na observação do seu comportamento (Coelho and dos H = q Pn q . (29)
1 2 1
Pn 2
Santos Coelho, 2004). Assim, um sinal com amplitude de n t=1 (ρ) + n t=1 (ρ̂)
±10V e frequência variando de 0, 1 a 7, 5rad/s em sentido Os resultados entre os dados reais e simulados são: modelo
crescente (com amostragem de 100Hz) foi enviado ao atua- linear do pêndulo H = 0, 208; modelo não linear do
dor, provocando mudanças de velocidade e sentido da roda pêndulo H = 0, 091; modelo da roda H = 0, 0125. Que
de reação, que por sua vez atua sobre o pêndulo. No mesmo implica na aceitação de todos os modelos, pelos critérios
ensaio foram colhidas a posição do pêndulo e da roda, de estabelecidos.
maneira que se possa avaliar os modelos individualmente
e a interação do conjunto. O modelo não linear para o
4. PROJETO DOS CONTROLADORES
pêndulo corresponde à equação (11) e seu correspondente
linear a equação (13), a relação do motor/roda corresponde
à equação (24). A Fig. 5 mostra a forma geral assumida As Equações (9) e (10) mostram que o problema de regula-
pelo ângulo do pêndulo, sendo que a Fig. 6 mostra seus ção do PIRR envolve o controle de duas variáveis: o ângulo
fragmentos inicial, central e final, respectivamente. Já a do pêndulo e o torque da roda. O torque é diretamente pro-
Fig. 7 mostra os valores assumidos pela posição da roda. porcional à variação na velocidade do motor. Esse fato gera
um problema conhecido, que é a possibilidade de saturação
Para oferecer maior robustez à tomada de decisão sobre do atuador mesmo na ausência de perturbação, quando já
aceitação ou rejeição dos modelos matemáticos obtidos, foi houve uma perturbação anterior (Block et al., 2007; Jepsen
et al., 2009). Para contornar este problema, foram imple- u [k] é a ação de controle e x [k] o vetor de estados
mentados dois controladores PID (Proporcional Integral discretizados, respectivamente, K ∈ Rn×1 a matriz de
Derivativo) independentes e em paralelo, um para regular ganhos de realimentação. Buscando um comportamento
o ângulo do pêndulo e outro para a velocidade da roda. subamortecido que atenda aos requisitos de desempenho,
Também será apresentado o projeto de um controlador os autovalores de malha fechada foram alocados com polos
por alocação arbitrária de polos (AAP) e comparados seus dominantes em λ1,2 = [−6, 72 ± 12, 9j]. A Tabela 3 resume
desempenhos, sob condições especı́ficas. Os controladores os ganhos projetados inicialmente para os controladores.
PID e AAP foram projetados buscando como critérios de
desempenho estabilidade local e tempo de convergência Tabela 3. Ganhos Projetados para os Contro-
tc ≤ 5s para a posição do pêndulo. A partir dos modelos ladores
da Eq.(28), escolhendo como saı́das os estados x1 e x4 , PID Posição Kp1 Ki1 Kd1
projetou-se os seguintes controladores PID, no dominio do 967 6861 33,89
tempo discreto: PID Velocidade Kp2 Ki2 Kd2
1,321 6,01 -1,52
Ci (z) = T pi + T ii + T di (30) Alocação de Polos K1 K2 K3 K4
T p i = Kp i , -387,18 -80,93 0 -1,513
Ts z + 1
T ii = Kii , (31)
2 z−1 5. RESULTADOS E DISCUSSÕES
1 z − 1
T di = Kdi
,
Ts z
A construção do PIRR foi baseada em alguns preceitos
onde i = 1, 2, sendo C1 e C2 controladores de posição metodológicos para facilitar as etapas, do esboço mecânico
do pêndulo e velocidade da roda, e T pi /Kpi , T ii /Kii e a implementação das estratégias de controle. Apesar de
T di /Kdi seus respectivos ganhos proporcional, integral e ter embasamento nas práticas e observações relatadas em
derivativo; Ts representa o perı́odo de amostragem, ado- outros trabalhos, com bons resultados para os autores,
tado como Ts = 0, 01s. Os controladores foram implemen- alguns pressupostos, não necessariamente foram dados,
tados através de equações à diferenças (32) mas presumidos, a saber:
ei [k] − ei [k − 1]
Ci [k] = Kpi · ei [k] + Kdi · + (1) Não haver fios conectados: condição onde a fonte de
Ts (32) alimentação estará embarcada, o que pode aumentar
Kii · Ts as dimensões e massa do pêndulo que irá requerer um
(ei [k] + ei [k − 1]) + T ii [k − 1]
2 atuador que gere torques maiores. No entanto, se o
sendo ei [k] o erro de posição/velocidade, referente a en- pêndulo não for uma aplicação móvel os problemas
trada dos controladores C1 e C2 , k = δ.T s e δ a variável relacionados aos momentos assimétricos de elementos
discreta que assume valores inteiros. Uma vez que as velo- móveis, alimentação e instrumentação da junta rota-
cidades do pêndulo e da roda não são diretamente medidas, tiva podem ser resolvidos por conectores com anéis
é necessário o uso de técnica de estimação que forneça tais deslizantes ou arranjos que minimizem esse efeito.
estados. Foi adotada a aproximação Backward-Euler para (2) Baseada na robustez requerida pelo porte do PIRR
a derivada da posição, e um filtro passa baixa de primeira e da roda, a ideia de acoplamentos rı́gidos coaxiais
ordem. O filtro é utilizado para suavizar os valores da mostrou-se de execução muito complexa, sempre res-
derivada do erro nos controladores PID. O diferenciador tando algum nı́vel de desalinhamento, que introduz
é representado por assimetrias no atuador, vibrações e ruı́dos. Podendo
ud [k] − ud [k − 1] ser substituindo por: correias, engrenagens, acopla-
yd [k] = (33) mentos flexı́veis ou acoplamento direto no eixo do
Ts
motor/redutor como em Block et al. (2007); Spong
onde yd [k] é a velocidade ud [k] a posição. O filtro pode ser et al. (2001); Lemos (2007); Aguilar-Avelar et al.
representado por (Block et al., 2007): (2017); Mayr et al. (2015) .
Ts Ts
yf [k] = 1 − yf [k − 1] + yd [k] (34)
Tf + Ts Tf + Ts 5.1 Do Controle Projetado e Implementado
onde yf [k] é a velocidade filtrada, e Tf = 0, 05s.
A avaliação dos controladores se deu em dois cenários:
Para evitar o fenômeno de Windup, define-se rejeição à perturbação, quando o PIRR está em repouso
y [k] = kb Ts (Cs [k − 1] + Cs [k − 2]) , (35) no ponto de operação instável e deve rejeitar uma per-
turbação interna, introduzida por um pulso de tensão no
sendo Cs é o sinal do controlador quando saturado e kb o
motor no valor de 10V com duração de 0, 1s ; condição
ganho da realimentação. Após a adoção do anti-windup, a
inicial não nula, quando o controle é iniciado estando o
ação de controle integral é modificada para:
PIRR distante 0, 086 rad do seu ponto de operação e deve
Kii · Ts alcançalo de forma autônoma. As Figs. 8 e 9 mostram as
T ii = (ei [k] + ei [k − 1]) +
2 (36) respostas dos controladores PID e AAP reais, para o ensaio
T ii [k − 1] + kb Ts (Cs [k − 1] + Cs [k − 2]) . de rejeição à perturbação. A Fig. 10 mostra as respostas
dos controladores PID e AAP baseados no modelo, para
Para implementar o regulador por alocação de polos se o mesmo ensaio. Ambos atenderam requisitos de desem-
multiplica uma matriz de ganhos K pelo vetor de estados, penho, levando a posição do pêndulo para o entorno do
sendo definido por: ponto de equilı́brio em menos de 5s, com uma excursão
u [k] = −K · x [k] , (37) máxima de −0, 0069 rad e erro máximo de 0, 0003 rad a
partir de 2, 2s para o PID, e uma excursão máxima de distintos, apresentam comportamento similar. Tais fatos
0, 0035 rad com erro máximo de −0, 0003 rad a partir ocorrem pois os ganhos de ambos os controladores foram,
de 1, 8s para o AAP, onde as respostas dos controladores após a implementação, modificados para obter um desem-
podem ser consideradas equivalentes, com uma vantagem penho mais satisfatório. Esse fenômeno pode ser explicado
para o PID por apresentar uma menor quantidade de osci- através das simplificações na elaboração do modelo, negli-
lações em torno do equilı́brio. Embora exista uma diferença gência de fatores como a existência de uma zona morta
nas respostas em relação ao modelo ser linear ou não linear, no atuador e ruı́dos na estimação dos estados. Os ganhos
essa diferença é de apenas 0, 0009 rad. Tal fenômeno pode implementados são resumidos na Tabela 4.
ser explicado pela existência das forças de atrito estático
assimétricas no modelo não linear. Essas forças fazem com Tabela 4. Ganhos Implementados nos Contro-
que o ponto de equilı́brio instável não linear seja diferente ladores
do modelo linear.
PID Posição Kp1 Ki1 Kd1
1576 5638 41,58
PID Velocidade Kp2 Ki2 Kd2
0,5 0 0
Alocação de Polos K1 K2 K3 K4
-2484,3 -262,1 0 -0,1
Observa-se uma diferença significativa entre as respos- Figura 12. Resposta do controlador AAP - Condição inicial
tas projetadas e implementadas, os controladores, embora não nula
no desenvolvimento de sistemas de controle de processos
industriais. Ph.D. thesis, Universidade de São Paulo.
Block, D.J., Åström, K.J., and Spong, M.W. (2007). The
reaction wheel pendulum. Synthesis Lectures on Control
and mechatronics, 1(1), 1–105.
Coelho, A.A.R. and dos Santos Coelho, L. (2004). Identi-
ficação de sistemas dinâmicos lineares.
Craig, J.J. (2006). Robótica, 3ra edición. sl.
Heffernan, K.J., Foutain, G.H., Tossman, B.E., and Mo-
bley, F.F. (1980). The magsat attitude control system.
Johns Hopkins APL, 188.
Higdon, D.T. and Cannon, R. (1963). On the control of
unstable multiple-output mechanical systems. In ASME
Winter Annual Meeting.
Figura 13. Resposta dos controladores PID e AAP aplica- Jepsen, F., Soborg, A., Pedersen, A.R., and Yang, Z.
dos aos modelos linear e não linear - Condição inicial (2009). Development and control of an inverted pen-
não nula. dulum driven by a reaction wheel. In 2009 Internatio-
nal Conference on Mechatronics and Automation, 2829–
6. CONCLUSÃO 2834. IEEE.
Kuo, A.D. (1999). Stabilization of lateral motion in passive
O trabalho teve como objetivo apresentar os aspectos de dynamic walking. The International journal of robotics
projeto, construção, modelagem e controle de um PIRR, research, 18(9), 917–930.
investigando a influência das caracterı́sticas fı́sicas elemen- Lemos, N.A. (2007). Mecânica analı́tica. Editora Livraria
tares em cada uma dessas etapas. Além disso, buscou-se da Fı́sica. 2.ed. São Paulo.
apresentar, brevemente, os pressupostos para construção Lidström, N., Pacheco, M.P.E.V., Everitt, M.N., and
de um protótipo funcional, os procedimentos experimen- Blomberg, M.N. (2013). Development of a control sys-
tais e os aspectos práticos envolvidos na construção desse tem for stabilizing a lego segway model.
tipo de sistema, relacionando a forma didática e prática Lundberg, K.H. and Barton, T.W. (2010). History of
que os objetivos propostos foram encontrados, de forma a inverted-pendulum systems. In IFAC Proceedings Vo-
oferecer subsı́dios para outros pesquisadores e estudantes lumes, volume 42, 131–135. Elsevier.
no que se refere a metodologias e procedimentos, em espe- Mayr, J., Spanlang, F., and Gattringer, H. (2015). Me-
cial para a modelagem e validação de modelo, material que chatronic design of a self-balancing three-dimensional
em geral encontra-se disperso pela bibliografia da área. inertia wheel pendulum. Mechatronics, 30, 1–10.
Merlo-Zapata, C., Antonio-Cruz, M., Silva-Ortigoza, R.,
A partir dos resultados apresentados, conside-ra-se que Taud, H., Rivera-Zárate, I., Munoz-Carrillo, D., and
os objetivos foram alcançados de forma satisfatória, pois Hernández-Guzmán, V. (2014). Modeling and construc-
o pêndulo foi projetado, construı́do, modelado e teve o tion of an inertia wheel pendulum test-bed. In 2014
seu modelo validado, apesar de serem desconsideradas International Conference on Mechatronics, Electronics
algumas dinâmicas no processo. Dois controladores foram and Automotive Engineering, 116–121. IEEE.
projetados e tiveram um bom desempenho, com ambos Ogata, K. and Severo, B. (1998). Engenharia de controle
cumprindo os critérios estipulados após ajustes realizados moderno. Prentice Hall do Brasil.
no modelo real. Pretende-se, em trabalhos futuros, realizar Oliveira, Tiago de. Ladeira, D.G. (2016). Princı́pio de
uma melhoria no acoplamento da roda de reação e do mo- d’Alembert e Equações de Lagrange. Master’s thesis,
tor, no intuito de diminuir vibrações mecânicas e reavaliar Universidade Federal de São João del-Rei.
o modelo que representa esta dinâmica. Rowland, J.R. and Holmes, W.M. (1978). Simulation
A aplicação do protótipo em aulas e treinamentos insere- validation with sparse random data. Computers &
se em uma vertente bem expressiva da área de controle e Electrical Engineering, 5(1), 37–49.
automação, devido as caracterı́sticas não lineares e mul- Schaefer, I. and Cannon, R. (1966). On the control of
tivariáveis, naturais do sistema. Como trabalhos futuros unstable mechanical systems. Research Review, 5(5),
sugere-se o uso de um controlador não linear que seja 11.
capaz de compensar a perturbação na posição do pêndulo Silva, E.A.d. (2013). Construção, modelagem e controle
causado pelas forças de atrito estático e que seja capaz de um pêndulo invertido com clp e software scada.
elevar o pêndulo a partir da posição inferior (swingup). Spong, M.W., Corke, P., and Lozano, R. (2001). Nonlinear
control of the reaction wheel pendulum. Automatica,
37(11), 1845–1851.
REFERÊNCIAS Truxal, J.G. (1965). State models, transfer functions, and
simulation. Polytechnic Institute of Brooklyn. Lecture
Aguilar-Avelar, C., Rodrı́guez-Calderón, R., Puga- Notes.
Guzmán, S., and Moreno-Valenzuela, J. (2017). Effects
of nonlinear friction compensation in the inertia
wheel pendulum. Journal of Mechanical Science and
Technology, 31(9), 4425–4433.
Alvarado, C.S.M. (2017). Estudo e implementação de
métodos de validação de modelos matemáticos aplicados