Você está na página 1de 10

CONTROLE DE UM PNDULO INVERTIDO SOBRE UMA PLATAFORMA MVEL

UTILIZANDO PID E MFAC (MODEL-FREE ADAPTIVE CONTROL)


Gabriel Vendramini 1, Paulo Srgio da Silva 2
1

DEE FEB UNESP, Bauru, Brasil, gabrielvendramini@gmail.com


2
DEE FEB UNESP, Bauru, Brasil, pss@feb.unesp.br

Resumo: O sistema de um pndulo invertido, por apresentar


caractersticas dinmicas intrinsecamente instveis, tem sido
estudado como planta alvo para avaliar o desempenho de
diferentes tcnicas de controle. O presente trabalho
apresenta a modelagem, a simulao e o controle de um
sistema composto de um pndulo invertido sobre uma
plataforma mvel descrevendo trajetria unidimensional, em
que o objetivo consiste em controlar duas variveis
simultaneamente: o deslocamento angular do pndulo e o
deslocamento linear da plataforma. Para isso, utiliza-se
tcnicas clssicas e desenvolve-se um controle inteligente
adaptativo, chamado MFA (Model-Free Adaptive).
Keywords: Pndulo invertido mvel, sistema no-linear,
controle adaptativo, MFAC (Model-Free Adaptive Control).
1. INTRODUO
O problema do pndulo invertido, apesar de se tratar um
sistema mecnico bastante simples, representa vrias
situaes prticas que podem ser analisadas a partir dos
conceitos envolvidos em seu estudo. Particularmente, o
conceito de pndulo invertido mvel tem sido utilizado em
vrias aplicaes como, por exemplo, veculo de transporte
humano, o que futuramente pode se apresentar como
alternativa de transporte automtico para reas urbanas [1],
incluindo sua utilizao por deficientes fsicos.
Alm disso, estudos de robs autnomos baseados nesse
conceito tm sido realizados pela NASA, apresentando
resultados significativos, como os encontrados em [2].
Segundo [3], o sistema do pndulo invertido possui
caractersticas dinmicas intrinsecamente instveis, o que
possibilita o estudo de diversas arquiteturas e tipos de
controladores, desde as clssicas at controladores hbridos
e/ou baseados em Inteligncia Artificial (IA), servindo
assim, de sistema alvo para que tais tcnicas possam ser
colocadas prova.
No tocante ao controle clssico, os compensadores PID
(Proporcional-Integral-Derivativo) ainda se apresentam
como uma primeira alternativa para o controle de sistemas
SISO (Single Input Single Output). No entanto, esses
controladores se baseiam em modelos linearizados da planta
a ser controlada, o que, segundo [4], pode representar perda
de informaes importantes para sistemas com altos nveis
de exigncias.

Normalmente, tal controlador projetado para trabalhar


em certo ponto de operao (set point) atravs do ajuste de
seus parmetros (ganhos proporcional, integral e derivativo).
Por conseguinte, se ocorrer mudanas que modifiquem o
ponto de operao do sistema, como alterao da condio
inicial, variaes de parmetros fsicos da planta e
perturbaes externas, o controlador PID pode no mais
apresentar desempenho satisfatrio.
Dessa forma, [5] destaca que a utilizao de redes
neurais bastante promissora e atraente em casos que
apresentam no-linearidade, incertezas, variaes de
parmetros ou at mesmo quando se desconhece a dinmica
da planta.
Nesse contexto, o controle adaptativo MFA (ModelFree Adaptive) apresentado em duas patentes por Cheng em
[6] e [7], utiliza as redes neurais como elemento chave e tem
se apresentado como uma nova tecnologia na rea de
controle e automao. O objetivo desse controlador ajustar
automaticamente seus parmetros internos, ou seja, se
adaptar continuamente, para garantir que o sistema opere
com desempenho satisfatrio em vrios pontos de operao
e sob diversas condies. Adicionalmente, apesar de ser
baseado em uma RNA, [8] enfatizam que no h a
necessidade de serem aplicados sinais de testes para um
processo de treinamento antes da sua validao como em
uma RNA convencional, ou seja, o controlador pode ser
inserido diretamente em um processo em funcionamento.
Contudo, apesar de se mostrar bastante promissora, a
aplicao bem sucedida dessa tecnologia requer que sejam
satisfeitas algumas condies. A primeira delas e a mais
simples que o sistema seja controlvel. A segunda
condio, de maior relevncia, estabelece que a planta seja
estvel em malha aberta, o que no muito comum em
sistemas dinmicos complexos no-lineares. Por esse
motivo, [9] explica que no caso dessa condio no ser
satisfeita, faz-se necessrio inserir previamente algum tipo
de controlador ou atuar de alguma maneira para garantir
essa condio.
Dessa forma, frente aos prs e contras do controle MFA,
pode-se questionar a respeito da aplicabilidade dessa
tecnologia. Ao mesmo tempo em que no necessrio
nenhum processo de identificao e o controle possui fcil
adaptao, tem-se um fator principal que limita sua vasta
aplicao, que a necessidade de estabilidade da planta em
malha aberta.

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

405

Controle de um Pndulo Invertido sobre uma Plataforma Mvel Utilizando PID e MFAC (Model-Free Adaptive Control)
Gabriel Vendramini, Paulo Srgio da Silva

2. OBJETIVO
Para o presente trabalho, o objetivo a modelagem,
simulao e controle de um sistema composto de um
pndulo invertido sobre uma plataforma mvel, que deve
descrever uma trajetria unidimensional.
Como a planta em anlise instvel, projeta-se
inicialmente dois compensadores lineares PID para
estabilizar previamente o sistema e em seguida, como
enfoque principal, desenvolve-se um controle MFA
adaptativo, o qual atua de maneira complementar.
Dessa forma, o objetivo avaliar a resposta do sistema,
submetido s tcnicas de controle mencionadas, atravs de
alguns critrios de desempenho pr-definidos, como tempos
de pico e de assentamento. Alm disso, o objetivo verificar
qual tcnica (isolada ou em conjunto) apresenta melhor
sensibilidade e robustez a variaes de parmetros e a
condies iniciais que podem ocorrer no sistema.

Figura. 1. Sistema proposto

Onde:
Tabela 1. Dados do sistema proposto na Figura 1

Smbolo

Descrio

CG

Centro de gravidade do
pndulo
Distncia
entre
uma
extremidade e o centro de
gravidade do pndulo
Massa da plataforma

l
3. MTODOS

M
m

Para desenvolver os algoritmos de controle e realizar as


anlises necessrias do sistema, faz-se uso do software
MatLab e do seu ambiente de simulao Simulink.
O sistema proposto envolve uma plataforma com
liberdade de movimento paralelo ao eixo x de um plano
cartesiano. Sobre a plataforma, o pndulo fixado pela sua
extremidade inferior em um ponto de articulao, obtendo
assim, uma liberdade de movimento angular no plano xOy
em torno desse ponto.
O deslocamento do conjunto para frente ou para trs
proporcionado pela intensidade e sentido de uma fora, u(t),
aplicada na direo do movimento, por um motor DC cujo
eixo est acoplado plataforma. Essa fora tambm
responsvel por manter o equilbrio do pndulo na posio
vertical, contrabalanceando a sua dinmica natural.
Com base em artigos de outros autores, particularmente
os apresentados por [10] e [11], foram definidos os
seguintes critrios de desempenho:

J
u (t )

Valor

Massa
do
pndulo,
uniformemente distribuda
Momento de inrcia do
pndulo em relao ao CG
Fora externa, contnua no
tempo, aplicada pelo motor
plataforma

0,3 m
0,8 kg
0,2 kg
0,006
kg.m2
(N)

3.1.1. Modelo no-linear


Utilizando-se da mecnica Newtoniana, a modelagem do
sistema resulta em um sistema de duas equaes
diferenciais:

( M + m ) x(t ) = u(t ) mlsen( (t )) 2 (t ) + ml cos( (t ))(t ) bx(t )

( J + ml )(t ) = ml cos( (t ))x(t ) + mglsen( (t )) c(t )


2

(1)
Pndulo:
tempo de assentamento mximo: 5s;
mxima deflexo angular do pndulo: 3;
tempo de pico mximo: 1s;
coeficiente de amortecimento ( ) elevado, para se
evitar oscilaes excessivas: 0,8 < < 1

Os parmetros correspondentes ao sistema de equao


(1) so apresentados na Tabela 2.
Tabela 2. Dados do sistema de equaes (1).

Plataforma:
tempo de assentamento mximo: 5s;
erro mximo em regime: 2%.

Smbolo

Descrio

Valor

Coeficiente de atrito entre


plataforma e a superfcie
Coeficiente de atrito do entre
pndulo e seu eixo de fixao

0,15
N.s/m
0,002
N.m.s

Acelerao da gravidade
do

9,81
m/s2
(rad)

angular

do

(rad/s)

angular

do

(rad/s2 )

linear

da

(m/s)

linear

da

(m/s2)

c
g

3.1. Modelagem do Sistema


A estrutura e os parmetros fsicos do sistema do
pndulo invertido sobre uma plataforma mvel, propostos
neste projeto, esto mostrados na Figura 1 e na Tabela 1.

(t )

Deslocamento
pndulo

(t )

Velocidade
pndulo
Acelerao
pndulo
Velocidade
plataforma
Acelerao
plataforma

(t )
x (t )
x(t )

angular

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

406

3.1.2. Modelo linear


Como o intuito inicial consiste em projetar
compensadores clssicos, faz-se necessrio obter um modelo
linearizado da planta. Dessa forma, assumindo que a mesma
encontra-se na posio de equilbrio estvel desejado, em
que a deflexo angular do pndulo muito pequena
( (t ) 0 ), a linearizao das equaes diferenciais permite
obter as seguintes relaes:
sen( (t )) (t ) e
cos( (t )) 1 .
Dessa forma, o sistema de equaes (1) se resume a:

( J + ml )(t ) = mlx(t ) + mgl (t ) c(t )

Figura 2. Sistema de Controle proposto

Cada malha possui um sinal de realimentao (H1 e


H2), que pode ser a prpria sada ou uma funo dela. No
caso, a realimentao tida como unitria.
O sistema ainda apresenta um sinal D(t) que representa
a ao de distrbios externos atuando como uma fora
aplicada planta (pndulo e plataforma).
A arquitetura apresentada baseada nos artigos
apresentados por [12] e [13], os quais utilizam uma malha
de controle para cada sada desejada. Observa-se que o sinal
de atuao de u(t) regulado pela ao de dois
compensadores atuando de forma conjunta.

( M + m ) x(t ) = u (t ) + ml(t ) bx (t )

(2)

Aplicando a Transformada de Laplace ao sistema de


equaes diferenciais (2), possvel identificar duas funes
em s da planta, convenientes para o estudo do sistema de
controle:
(s)
( ml ) s
=
U ( s ) ( a1) s 3 + [b ( a 2 ) + c ( a 3)]s 2 + [bc ( a 3) mgl ]s bmgl

(3)

X ( s)
( a 2) s 2 + (c ) s mgl
=
U ( s ) ( a1) s 4 + [b ( a 2 ) + c ( a 3)]s 3 + [bc ( a 3) mgl ]s 2 (bmgl ) s

(4)

3.3. Projeto dos Compensadores Lineares


Inicialmente utiliza-se dois compensadores lineares PID
para o controle das duas variveis de interesse,
deslocamento angular e linear. No entanto, por se tratar de
compensadores normalmente aplicados a sistemas SISO, a
proposta de soluo consiste em dividir o problema em dois
subsistemas especficos de controle, um para cada sada
desejada.
Inicialmente, analisa-se a malha superior para sintonizar
o controlador 01 (C1), que responsvel pelo equilbrio do
pndulo.

Onde:
a1 = [( M + m )( J + ml 2 ) ( ml ) 2 ]

2
a 2 = ( J + ml )
a 3 = ( M + m )

Com o intuito de tornar o estudo e o projeto mais


prximo do real, optou-se por utilizar um modelo de
atuador, no caso, um motor DC para compor o sistema,
sendo que este se mantm fixo durante todo o estudo.
3.2. Arquitetura do Sistema de Controle Proposto
A Figura 2 apresenta o sistema de controle proposto para
o problema em questo, o qual composto por duas malhas,
uma para o controle do pndulo (malha superior), por meio
de seu deslocamento angular (t ) , e outra (malha inferior)
para controlar a posio linear da plataforma x(t).

Figura 3. Malha para sintonia de C1

Aps o ajuste de C1, ajusta-se o controlador 02 (C2),


responsvel pelo deslocamento da plataforma X (t ) , dada
uma trajetria de referncia Xr (t ) = vt , onde v a
velocidade constante de deslocamento.

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

407

Controle de um Pndulo Invertido sobre uma Plataforma Mvel Utilizando PID e MFAC (Model-Free Adaptive Control)
Gabriel Vendramini, Paulo Srgio da Silva

3.4.2. Arquitetura
Conforme citado anteriormente, como o sistema do
pndulo invertido dinmico, faz-se necessrio a utilizao
de uma rede neural tambm dinmica, pois estas permitem
que caractersticas temporais do sistema sejam adicionadas e
memorizadas.
Sendo assim, a maneira adotada para conferir memria e
consequentemente dinamismo rede neural com a
introduo de uma linha de atraso no tempo na entrada de
uma rede direta, geralmente de multicamadas (MLP Multi
Layer Perceptron).
A Figura 5 mostra uma rede neural temporal TDNN
(Time Delay Neural Network), elemento principal da rede
MFA.

Figura 4. Malha para sintonia de C2

Nota-se que o projeto de C2, designado para controlar a


plataforma, est diretamente ligado C1, pois a metodologia
de soluo prope um encadeamento das aes, ou seja,
primeiramente deve-se equilibrar o pndulo e em seguida
deslocar o conjunto a partir de uma referncia. Dessa forma,
a ao de controle final resulta em uma atuao conjunta dos
dois compensadores.
Sendo assim, aps diversos estudos e ajustes finos,
encontrou-se, dentro das especificaes pr-estabelecidas de
desemenho, os seguintes controladores:

3,36

C1( s ) = 1,161 +
+ (0,074) s
s

(5)
Figura 5. Rede Neural Temporal

( s + 1,2)
C 2( s) = 0,6
s

(6)

Onde a entrada x(n) que sucessivamente atrasada no


tempo pela estrutura z-1 (atrasadores discretos).
Uma vez que o objetivo do projeto controlar tanto a
deflexo angular como o deslocamento linear, ou seja, o
sistema de controle do tipo MIMO, no possvel utilizar
somente uma MFA no molde apresentado, a menos que
sejam utilizadas duas MFAs, uma auxiliando cada
controlador clssico e ao final sejam somados os dois sinais
de controle.
Essa possibilidade de controle MIMO apresentada nas
patentes [6] e [7]. Contudo, nessa proposta as informaes
so processadas separadamente, ou seja, os pesos sinpticos
das conexes no guardam informaes das duas variveis
juntas, o que poderia ser mais interessante do ponto de vista
de conhecimento distribudo e consequentemente robustez.
Dessa forma, criou-se uma configurao diferente,
apresentada na Figura 6.

3.4. Desenvolvimento da Rede MFA


Em linhas gerais, o cerne da MFA consiste em uma
rede neural artificial dinmica, expandida para o processo
em questo que necessita realizar uma ao de controle dado
a realimentao de duas variveis de interesse, constituindo
assim um compensador MIMO (Multiple Input Multiple
Output).
3.4.1. Aspectos Gerais
Acerca de toda literatura cientfica e consideraes
empricas que envolvem o uso de Redes Neurais Artificiais
(RNAs) em problemas de controle e automao, de
extrema importncia o estudo sobre o tipo mais adequado de
rede neural que deve ser aplicada ao problema em questo.
Segundo [14] cita que muito comum encontrar em
trabalhos cientficos o uso de redes neurais diretas e
estticas para solucionar problemas dinmicos. Segundo o
autor, esta abordagem causa dois inconvenientes:
primeiramente, uma rede neural direta no consegue cobrir
todos os diferentes estados de um sistema dinmico,
realizando um mapeamento dinmico e, alm disso, para
cobrir todos os estados seria necessrio utilizar uma rede
direta muito grande, o que dificulta ou at impossibilita
alcanar uma soluo. De fato, as redes estticas somente
realizam um mapeamento esttico, enquanto que os sistemas
dinmicos so sensitveis seqncia de apresentao.
Dessa forma, a utilizao de uma rede neural,
principalmente em problemas de controle, requer um estudo
e um entendimento da dinmica envolvida no sistema para
que as aes de soluo sejam direcionadas.

Figura 6. Arquitetura da Rede MFA

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

408

Novamente o processo se repete, ou seja, esses dados


resultantes so multiplicados por uma matriz de pesos h j .

Em suma, essa configurao permite que haja


interligao entre as duas entradas, conferindo a toda rede
informaes combinadas das duas entradas. Nota-se que a
rede MFA consiste em um controlador PI, em que os ganhos
da parcela integral so constantemente ajustados a cada
iterao n.

No entanto, o valor de bias no adicionado, resultando em:

r ( n) = (h j (n) * q j ( n))
i =1

Adicionalmente, o elemento r ( n) passa por uma

3.4.3. Algoritmo de Adaptao

segunda funo de ativao :

Uma vantagem da utilizao de uma MLP com atrasos


que podem ser utilizados, de maneira aproximada, os
mesmos algoritmos utilizados no treinamento de uma RNA
direta (esttica). Dessa forma, o algoritmo apresentado
baseado no algoritmo descrito por Cheng, que consiste no
algoritmo backpropagation. Contudo, algumas modificaes
foram acrescentadas com o intuito de melhorar o
desempenho da rede.
Na primeira fase do algoritmo, cada elemento de
entrada do erro ( e(t ) ) convertido em um sinal de erro

s (n) = ( r ( n))

y ( n) = e1 (n) + e2 (n) + s (n)

(11)

Uma vez calculado o valor de sada na iterao n,


inicia-se a segunda fase, na qual os pesos sinapticos so
ajustados da seguinte forma:
N

wij = * a * b * Sf (n) * e(n) * q j (n) * (1 q j (n)) * Ei (n) * hk (n)

Como o papel da MFA neste sistema em particular


auxiliar um outro controlador, os erros no so inseridos
diretamente na rede e, portanto, pode-se entender que
ei (n) = xi (n) . Alm disso, como no se sabe a faixa de
valores em que a entrada da rede pode variar, pode-se
entender o processo de normalizao realizado como uma
atenuao no sinal de entrada, como forma de garantir que a
rede no sature no incio de sua atuao, pois em outras
situaes os pesos so ajustados.
Dessa forma, cada elemento se conecta com todos os
neurnios da camada seguinte atravs de uma matriz de
pesos sinapticos, com elementos wij , sendo i = 1,..., N e

k =1

(12)

h j = * Sf (n) * e(n) * q j (n)

(13)

Onde a taxa de aprendizado e Sf ( n ) uma


funo que consiste no gradiente da sada do sistema y(n)
em relao ao sinal de controle da MFA v(n), e representa a
sensibilidade do processo em relao ao controle.
Teoricamente, tem-se que Sf (n) = y (n)
. No
v ( n )
entanto, segundo [6], uma vez que o processo
desconhecido, essa funo tambm . Isso conhecido
como caixa preta e deve ser resolvido para que o
algoritmo se torne vivel. Porm, segundo estudos
realizados pelo autor da patente, se o sistema for estvel em
malha aberta, controlvel e o tipo de ao de controle
requerido no muda ao longo do sistema, a funo Sf pode
ser substituda por uma constante diferente de zero, o que
tornar o sistema estvel, com sinais de atuao e sada
limitados (BIBO Bounded Input, Bounded Output).
Isso significa que, se o sistema satisfizer essas
condies, no necessrio conhecimento de sua dinmica,
justificando o controle MFA sem obter o modelo do
processo. Dessa forma, as equaes de ajuste que realmente
so utilizadas se resumem a:

j = 1,..., N . Nota-se que adicionado um valor de bias


constante em 1, resultando em um vetor p j dado por:
N

(07)

i =1

sima

Onde n denota a n
iterao.
Uma vez calculado, esse vetor filtrado por uma funo
de ativao , da seguinte forma:

q j ( n) = a * (b * p j ( n))

(10)

Finalmente, a sada da rede calculada da seguinte


maneira:

normalizado ( E1 ), atravs da unidade N(). Cada sinal de


erro normalizado flui atravs dos delays, constituindo um
conjunto de E N elementos discretos.

p j ( n) = ( wij (n) * Ei (n)) + 1

(09)

(08)

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

409

Controle de um Pndulo Invertido sobre uma Plataforma Mvel Utilizando PID e MFAC (Model-Free Adaptive Control)
Gabriel Vendramini, Paulo Srgio da Silva
N

wij (n) = * a * b * e(n) * q j (n) * (1 q j (n))* Ei (n) * hk (n)


k =1

(14)

h j (n) = * e(n) * q j (n)

(15)

Alm desse ajuste, lana-se mo da utilizao do


momento, muito utilizado em algoritmos de aprendizado de
redes neurais. Este termo, representado por m , consiste em
uma porcentagem da atualizao dos pesos (iterao n-1)
anterior que somado atualizao atual (iterao n). Dessa
forma, adiciona-se respectivamente s equaes anteriores
os seguintes fatores:

w ' ij (n) = m * wij (n 1)

(16)

h ' j (n) = m * h j (n 1)

(17)

Figura 8. Resposta a um degrau de referncia aplicado plataforma

Destaca-se o valor do erro necessrio para realizar a


atualizao dos pesos da rede. Como h dois erros, utiliza-se
a mdia entre eles. Alm disso, importante observar que as
funes de ativao utilizadas interferem nas equaes de
ajuste dos pesos e portanto devem ser cuidadosamente
escolhidas. Neste trabalho, utilizou-se a funo de ativao
como sendo a tipo sigmide unipolar com a = 1,7159
e

b = 2 / 3 e a funo como sendo do tipo linear.

4. RESULTADOS
Inicialmente, apresenta-se as simulaes do sistema
controlado somente pelos compensadores clssicos. A
Figura 10 apresenta o respectivo diagrama de blocos, no
qual utilizado o conjunto de equaes no-lineares
apresentadas em (1). O intuito de se utilizar essas equaes
verificar a dinmica de uma planta mais realista, descrita
pelo modelo no-linear, compensada por controladores
clssicos, os quais so baseados no modelo linearizado.
As Figuras de 7 a 9 apresentam as respostas do sistema
(pndulo e plataforma) em diferentes condies de
operao.

Figura 9. Resposta a um impulso de distrbio aplicado em D(t) durante


a trajetria

Dessa forma, verifica-se que o sistema apresentado


cumpre sua funo de descrever uma trajetria
unidimensional, mantendo o pndulo equilibrado na posio
vertical.
No entanto, conforme estudos apresentados por [1],
possvel utilizar um sistema baseado em um pndulo
invertido automtico mvel para transporte urbano de
pessoas. Neste caso, no se tem certeza de alguns
parmetros como altura, peso e centro de massa do
ocupante.
Tendo em vista essa possvel aplicao prtica,
verificou-se de que maneira o sistema se comporta quando
se muda o peso e a altura (associados, respectivamente, ao
peso e altura do ocupante), mantendo, contudo, o seu
centro de massa.
A Figura 11 apresenta a mesma situao da Figura 7,
mas com as seguintes alteraes nos parmetros do pndulo:
massa m = 1,0 kg e metade do comprimento da haste l =
0,75 m.

Figura 7. Resposta a uma rampa de referncia aplicada plataforma

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

410

Figura 10. Diagrama de blocos do sistema simulado no ambiente Simulink com somente os compensadores clssicos

Figura 12. Resposta a uma rampa de referncia aplicada plataforma,


com variao dos parmetros do pndulo e na condio inicial de
deslocamento angular (5)

Figura 11. Resposta a uma rampa de referncia aplicada plataforma,


com variao dos parmetros do pndulo

Depois de obtidos os resultados do sistema somente


controlado pelos compensadores lineares, avalia-se os
mesmos desempenhos com o rede MFA inserida no sistema,
e forma a atuar como controle auxiliar, uma vez que o
sistema precisa ser estvel para sua aplicao. A Figura 13
apresenta o diagrama de blocos do sistema e as Figuras de
14 a 16 apresentam as respostas do sistema (pndulo e
plataforma) em diferentes condies de operao

Adicionalmente, acrescentou-se um deslocamento


angular inicial de 5 no pndulo e verificou-se a resposta,
apresentada na Figura 12.

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

411

Controle de um Pndulo Invertido sobre uma Plataforma Mvel Utilizando PID e MFAC (Model-Free Adaptive Control)
Gabriel Vendramini, Paulo Srgio da Silva

Figura 13. Diagrama de blocos do sistema simulado no ambiente Simulink com a rede MFA

Figura 14 Resposta do sistema a uma rampa de referncia aplicada


plataforma, com variao dos parmetros do pndulo

Figura 16 Resposta do sistema a uma rampa de referncia aplicada


plataforma, com variao dos parmetros do pndulo e na condio
inicial de deslocamento angular (10)

Alm disso, outra variao dos parmetros foi feita, da


seguinte forma: altura do pndulo: de 0,6 para 2,0 m e massa
do pndulo: de 0,2 para 1,2 kg. O resultado apresentado na
Figura 17.

Figura 15 Resposta do sistema a uma rampa de referncia aplicada


plataform a, com variao dos parmetros do pndulo e na condio
inicial de deslocamento angular (5)

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

412

Atravs dos resultados apresentados, percebe-se que a


MFA atuando como controlador auxiliar, mesmo em
condies adversas daquelas projetadas, conferiu maior
robustez planta, como mostrado nas Figuras 11 e 14, 12
e 15. O fato da MFA se apresentar neste projeto como
controlador complementar se d pelo motivo da planta ser
instvel e, nesta condio, somente o controlador MFA no
aplicvel.
6. CONCLUSO
Conclui-se que a modelagem, a metodologia e o projeto
dos controladores foram eficientes.
Em relao ao controle clssico, principalmente os
compensadores PID, verificou-se que o processo de
desenvolvimento requer que seja conhecido tanto o modelo
quando os valores dos parmetros correspondentes. Dessa
forma, qualquer variao que possa ocorrer, como analisado
anteriormente, requer uma nova anlise.
Contudo, os resultados obtidos com a insero da MFA
foram totalmente satisfatrios, pois o controle MFA
conseguiu ajustar a ao de controle mesmo quando os
parmetros da planta foram variados, o que no era possvel
somente com o controle clssico.
Isso mostra que estruturas adaptativas so eficazes e
promissoras dentro do escopo de controle e automao de
sistemas.

Figura 17 Resposta do sistema a uma rampa de referncia aplicada


plataforma, com variao dos parmetros do pndulo e na condio
inicial de deslocamento angular (5)

5. DISCUSSO
Inicialmente, no que diz respeito aos controladores
clssicos, sabe-se que a utilizao de controladores PID
implica que um sistema de controle possua basicamente trs
condies: o sistema analisado deve ser do tipo SISO
(Single Input Single Output), apresentar um ponto de
operao (set-point) definido e possuir um modelo linear.
No entanto, para o problema estudado de um pndulo
invertido sobre uma plataforma mvel descrevendo
trajetria unidimensional, apesar de o sistema estudado ser
do tipo MIMO (Multiple Input Multiple Output), a
metodologia adotada para o projeto dos controladores
decomps o problema total em dois subproblemas SISO
interligados. Dentro das condies de projeto, os resultados
mostraram que essa metodologia foi eficiente.
Numa primeira anlise, as simulaes do sistema
indicaram que o objetivo de descrever uma trajetria
unidimensional mantendo o pndulo estvel foi alcanado.
A plataforma apresentou erro estacionrio nulo e a deflexo
angular, bem como o sobressinal, os tempos de
assentamento e de pico do pndulo, atenderam os critrios
pr-estabelecidos.
J numa segunda anlise, verificou-se que o sistema de
controle no robusto somente controlado com PID e
apresenta uma sensibilidade muito grande quando alguns
parmetros e as condies iniciais so alterados, e o setpoint redefinido, no atingindo assim os critrios de
desempenho pr-estabelecidos. Percebe-se que pelo menos
os tempos de assentamento, sobressinal e amortecimento
podem ser significativamente alterados quando se tem
variaes desse tipo.
Dessa forma, o objetivo da insero da rede neural
adaptativa foi que ela conseguisse responder de maneira
adequada mesmo quando h variaes de parmetros da
planta, o que se fez.

AGRADECIMENTOS
Os autores deste artigo expressam seus agradecimentos
FAPESP (Fundao de Amparo Pesquisa do Estado de So
Paulo) pelo apoio e fomento concedidos pesquisa, na
forma de bolsa de Iniciao Cientfica.
REFERNCIAS
[1] Tirmant, H., Baloh, M., Vermeiren, L., Guerra, T. M.
and Parent, M. (2002). B2, an alternative two wheeled
vehicle for an automated urban transportation system.
IEEE Intelligent Vehicle Symposium, 2: 594-603.
[2] Ambrose, R. O., Savely, R. T., Goza, S. M., et alii
(2004). Mobile manipulation using NASA's Robonaut.
IEEE Conference on Robotics and Automation, 2:
2104-2109.
[3] Miller III, W. T., Sutton, R. S. and Werbos, P. J. (1995).
Neural Networks for Control.
[4] Drummond, A. D. C., Oliveira, K. C. D. and
Bauchspiess, A. (1999). Estudo do Controle de Pndulo
Inverso sobre Carro utilizando Rede Neural de Base
Radial. IV Brazilian Conference on Neural Networks,
320-325.
[5] Yoneyama, Y. e Nascimento Jr., C. L. (2000).
Inteligncia Artificial em Atomao e Controle, So

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

413

Controle de um Pndulo Invertido sobre uma Plataforma Mvel Utilizando PID e MFAC (Model-Free Adaptive Control)
Gabriel Vendramini, Paulo Srgio da Silva

Paulo: Edgard Blcher (co-edio FAPESP).


[6] Cheng, S. G. Model-free adaptive process control.
Washington: United States Patent and Trademark
Office of the United States Department of Commerce.,
2000, Abril 25.
[7] Cheng, S. G. Model-free adaptive control for industrial
processes. Washington: United States Patent and
Trademark Office of the United States Department of
Commerce., 2003, Abril 29.
[8] Hou, Z.; Huang, W. The model-free learning adaptive
control of a class of SISO nonlinear systems. In:
American Control Conference, 1997. Proceedings of the
1997. Anais... . v. 1, p.343-344 vol.1.
[9] Cheng. CyboSoft - MFA in Control, 2006. Disponvel
em <http://www.cybosoft.com>. Acessado em 15 Ago.
2009.
[10] Sultan, K. (2003). Inverted Pendulum: Analysis, Design
and Implementation. IIEE Visionaries, 2003.
Disponvel
em
<http://anadrasis.web.auth.gr/pendulum/Inverted
Pendulum.pdf>. Acessado em 07 jan. 2009.
[11] Carnegie Mellon. Control Tutorials for MATLAB and
Simulink.
Disponvel
em
<http://www.engin.umich.edu/class/ctms/>. Acessado
em 10 fev. 2009.
[12] Jung, S. and Kim, S. S. (2008). Control Experiment of a
Wheel-Driven Mobile Inverted Pendulum Using
Neural Network. IEEE Transactions on Control
Systems Technology, 16: 297-303.
[13] Cho, H. and Jung, S. (2003). Neural network position
tracking control of an inverted pendulum an X-Y table
robot. IEEE/RSJ Conference on Intelligent Robots and
Systems, 2: 1210-1215.
[14] Francheschi, A. S. M. D.; Barreto, J. M.; Roinsenberg,
M. Desenvolvimento de Agentes Autnomos em
gerncia de Redes de Computadores. SBrT 2000 XVIII Simpsio Brasileiro de Telecomunicaes,
2000.

10

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications
Serra Negra, SP - ISSN 2178-3667

414

Você também pode gostar