Hilton Iara Cap4

Captulo 3.
Controle Adaptativo e RNA 50
E por conseguinte tem-se a atualizao dos raios, consideramos que os trs parmetros so
atualizados. A adaptao do raio, da matriz i1 ,
E (n) 1 2

= e (n)
1
i (n) i (n) 2
1

= wi (n)e(n) 1 G ku(n) ci (n)k2ri (n) 1 G ku(n) ci (n)k2ri (n)
i (n) i (n)

= G ku(n) ci (n)k2ri (n) 1 ku(n) ci (n)k2ri (n) (3.46)
i (n)
para,
E (n)
ku(n) c i (n)k2
ri (n) = (u(n) ci (n)) (u(n) ci (n))T = Qi (n), (3.47)
i1 (n)
com derivao da Eq. (3.47),
E (n)
1 = wi (k)e(n)G ku(n) ci (n)k2ri (n) Qi (k)
i (n)
Os raios so atualizados, i = 1, ..., m, para
E (n)
i1 (n + 1) = i1 (n) . (3.48)
i1 (n)
Nota-se que E convexo apenas em relao a wi . Geralmente a seguinte relao

selecionada,
< r < w .
Desta forma, o passo de interao da descida dos pesos maior do que os centros, e
este ltimo passo maior do que o raio. A adaptao de pesos ajuda a minimizar o erro
entre a sada da rede e a sada desejada. Adaptar os centros assegura o agrupamento das
informaes de entrada. Os raios so adaptados para atingir um certo grau de sobreposio
entre as funes de base radial.
3.4 Comentrios
Apresentou os conceitos e formulao matemtica das abordagens de controle
adaptativo associados com otimalidade e redes neurais. Especificamente, tratou-se das
redes RBF e a metodologia do sistema de controle MPC.
51
4 Sintonia RNA-Preditiva de Controladores

PID
Neste captulo apresenta-se o modelo e algoritmos para sintonia de controladores

PID. Os modelos permitem a insero de estratgias para ajustes dos ganhos do controlador.
Aborda-se uma estratgia fundamentada em redes neurais RBF que est associada com o
sistema de predio da sada da planta.
O captulo organizado em cinco sees que descrevem os mtodos e procedimentos
para sintonia online RNA-preditiva de controladores PID. A arquitetura do sistema de
predio da proposta apresentado na Seo 4.1. O modelo do controle preditivo e da
RNA apresentado na Seco 4.2., discute-se a arquitetura do MPC direto baseado em
RNAs com preditores recursivo e no-recursivo d step frente.
Modelos para predio de sistemas e RNA-RBF so apresentados na Seo 4.3,
associando o esquema de controle adaptativo direto com a RBF. Na Seco 4.4 a arquitetura
da proposta sintonia RNA-RBF de Controlador PID no contexto de controle adaptativo
apresentada por meio de expresses matemticas que expresso os parmetros do
referido controlador, aborda-se a estrutura do controlador PID-RBF neural e os passos
para elaborao do procedimento para atualizao dos parmetros da rede. Na Seo 4.5
apresenta-se os principais comentrios a respeito da origem da proposta e suas principais
caractersticas.
4.1 Arquitetura do Sistema de Predio

A maneira pela qual os elementos das RNAs esto interligados descrevem a arquite-
tura de um preditor. A arquitetura, ou estrutura, de um preditor suporta sua capacidade
de representar as propriedades dinmicas do sinal de entrada em tempo discreto estatisti-
camente no estacionrio e, portanto, sua capacidade de prever algum valor futuro. Os
blocos de construes bsicas do preditores de tempo discretos so os somadores, retarda-
dores, multiplicadores. Os fundamentos de preditores lineares para sinais estatisticamente
estacionrios so encontradas no trabalho de WIENER (1950). Os estudos posteriores de
Christofides et al. (2013b) e Box et al. (2015) foram construdos sobre estes fundamentos.
Tais estruturas lineares esto muito bem estabelecidas no processamento de sinais digitais
e so classificadas como filtros digitais de resposta ao impulso finito (FIR - Finite Impulse
Response) ou de resposta de impulso infinita (IIR - Infinite Impulse Response) (KAY,
2013).
Um sinal aleatrio em tempo real discreto {y(k)}, onde k o ndice de tempo
Captulo 4. Sintonia RNA-Preditiva de Controladores PID 52
discreto e{} denota o conjunto de valores, sendo comumente obtido por amostragem de
alguma medida analgica. Tais sinais aleatrios em tempo discreto tm estatsticas que
variam no tempo, mas em curto prazo, elas podem ser assumidas como sendo invariantes
no tempo.O princpio da previso de um sinal em tempo discreto representado na Fig. 13.
o valor do sinal y(k) predito com base na soma dos valores de p passado, isto , y(k 1),
Figura 13 Resposta livre e forada
Fonte: Elaborado pelo autor
y(k 2), ,y(k p), ponderado pelos coeficientes ai , com i = 1, 2, ..., p para formar uma
previso, y(k). O erro de previso, ep (K), torna-se,
p
ep (k) = y(k) y(k) = y(k) a1 y(k 1). (4.1)
X
i=1
A estimativa do parmetro ai baseia-se na minimizao da funo do erro, e o erro

quadrtico mdio E [e2 (k)], em que E [] denota o operador de esperana e {y(k)}, assume
como estatisticamente estvel, com mdia zero (ATHANASIOS, 2017). Uma vantagem
fundamental do critrio de erro quadrtico mdio a chamada condio de ortogonalidade,
que implica em:
E [e(k)y(k j)] = 0, (4.2)
em que j = 1, 2, ..., p e, satisfeito somente quando ai = 1, 2, ..., p, assumir valores timos.

Como consequncia da Eq.(4.2) e da estrutura linear do preditor, os parmetros de peso
timos podem ser encontrados a partir de um conjunto de equaes lineares, denominadas
equaes de Box et al. (2015),

ryy (0) ryy (1) ryy (p 1) a1 ryy (1)

ryy (1) ryy (0) ryy (p 2)
a2
ryy (2)
= (4.3)

.. .. .. ..
..
..
. . . . . .

ryy (p 1) ryy (p 2) ryy (0) ap ryy (p)
em que ryy ( ) = E [y(k)y(k + )] um valor da funo de autocorrelao de y(k)

defasagem . Estas equaes podem ser escritas em forma vetorial como,
Ryy a = ryy (4.4)
com Ryy Rpp a matriz de autocorrelao e a, ryy R so o vetores de parmetro do

preditor e correlao cruzada, respectivamente.
A qualidade da previso julgada pelo erro quadrtico mdio mnimo (MMSE
- Minimum Mean Square Error), calculado a partir de E[e2 (k)] quando os parmetros
dos peso do preditor assumem valores timos. O MMSE calculado a partir de ryy (0)
Pp
i1 ai ryy (i).
As medidas reais s podem ser assumidas como sendo localmente de sentido amplo
e, portanto na prtica, os valores da funo de autocorrelao devem ser estimados a partir
da medida de comprimento finito para empregar Eq. (4.3), aplicando a uma medida N de
comprimento finito, {y(G), y(l), ....y(N 1)},
N
X1
1
ryy ( ) = y(k)y(k + ) (4.5)
N k=0
em que = 0, 1, 2, ..., p.
A estimativa dos parmetros de peso so refinadas em cada nmero de amostras,
k, com base na nova amostra y(k), com erro de previso ep (k). A atualizao dos pesos,
a(k + 1) = a(k) + f (ep (k), y(k)) (4.6)
em que , f () so o ganho de adaptao e uma funo dependente do algoritmo de
Figura 14 Blocos para construo de preditores: (a) deformador, (b) adicionador, (c)
multiplicador
aprendizagem, perspetivante. O a(k) o estimador e y(k) o vetor preditor.

Sem conhecimento prvio adicional, zero ou valores aleatrios so escolhidos para
condies iniciais dos parmetros de peso em Eq. (4.6), ou seja,ai , ou ni , i = 1, 2, ..., p, em
que ni uma varivel aleatria extrada de uma distribuio adequada.
A abordagem sequencial da estimao paramtrica dos peso particularmente

adequada para o funcionamento de preditores em ambientes estatisticamente no estacio-
nrios. A abordagem de bloco como a tratativa sequencial para a estimao paramtrica
dos peso dos preditores so aplicadas a preditores das estrutura linear e no-linear.
4.2 Controle Preditivo e RNA

A modelagem no sentido de aplicaes em MPC so bem reconhecidos. Ao contrrio
do controle tradicional, em que a modelagem e anlise representam uma pequena parte do
esforo no desenvolvimento de aplicativos, pois em projeto de controle que a maior parte
do tempo , gasto, atribudo modelagem e identificao do sistema. A estruturao do
controle MPC do posicionamento do painel fotovoltaico esquematizada na Figura. (15).
Figura 15 Sequncia de tarefas envolvidas na aplicao genrica de sistema MPC.
Otimizao Realimentao
da da
Dinmica Sada
Entrada/Sada
MPC Entrada/Sada
Varivel Manipulada Leitura VM e VC
Um problema que ocorre durante o treinamento de rede neural denominado

overfitting. O erro no conjunto de treinamento direcionado para um valor muito pequeno,
mas quando novos dados so apresentados rede, o erro grande. A rede memoriza os
exemplos de treinamento, mas no aprendeu a generalizar as novas situaes. Um mtodo
para melhorar a generalizao da rede us-la grande o suficiente para proporcionar um
ajuste adequado. Quanto maior a rede utilizada, mais complexas so as funes que a rede
pode criar. Se for utilizada uma rede suficientemente pequena, no ter energia suficiente
para sobrecarregar os dados.
Um dos algoritmos mais avanados da segunda abordagem a chamada regula-

rizao. Este algoritmo envolve a modificao da funo de desempenho, normalmente
escolhido para ser a soma dos quadrados dos erros.
O uso da funo de desempenho far com que a RNA tenha pesos e bias menores,
forando a sua resposta ser suave e menos provvel o overfit. O problema com a regularizao
mostra ser difcil determinar o valor timo para o parmetro do desempenho. Para
parmetros muito grande, pode haver overfitting, enquanto que se a proporo for muito
pequena, a RNA no ir ajustar adequadamente os dados de treinamento. desejvel
determinar os parmetros de regularizao timos da forma online.
4.2.1 MPC direto baseado em RNAs

Existem vrias maneiras de usar RNAs no controle. Na descrio dos algoritmos
de controle baseados em modelos RNA, considera-se que o modelo do processo possa ser
expresso na forma discreta:
y(k + 1) = f (y(k), ..., y(k n + 1), u(k), ..., u(k m + 1)) , (4.7)
em que u(k) e y(k), k = 0, 1, ..., so vetores de entradas e sadas no instante de tempo.

k, n e m esto relacionados com a ordem de {y(k)}. A funo f no linear que se pensa
ser conhecida, embora alguma ideia de sua estrutura seja provavelmente aparente.
Considerando o tempo de atraso do processo, pode ser crucial para a obteno do
modelo baseado em RNA adequadamente. O tempo de atraso (d, d 0) do processo pode
ser introduzido na seguinte maneira:
y(k + 1) = f (y(k), ..., y(k n + 1), u(k d), ..., u(k d m + 1)) . (4.8)
O controle MPC baseado em RNA confia nas consideraes da funo aproximada

de f expressa por uma RNA. Para isso, considera-se que y(k), ..., y(k n + 1), u(k
d), ..., u(k d m + 1), so as entradas e y(k + 1) a sada, respectivamente, de forma
que um modelo dinmico aproximado construdo ajustando um conjunto de pesos de
conexo e bias (W ) por meio do treinamento, usando dados passados,
y(k + 1) = fAN N (y(k), ..., y(k n + 1), u(k d), ..., u(k d m + 1)) (4.9)
Esta RNA recursiva por sucessiva utilizada na estrutura MPC, para obter a predio do
modelo, de maneira que se possa usar a previso de vrias maneiras.
Descreve-se dois tipos de preditores com estrutura d-step frente para compensar
a influncia do tempo de atraso.
4.2.2 Preditor recursivo d-Step frente

Com base no modelo da Eq. (4.9), pode-se usar uma tcnica recursiva sucessiva
para obter o preditor d-step frente expresso,
y(k + d + 1) = fAN N (y(k + d), ..., y(k + d n + 1), u(k d), ..., u(k d m + 1))
(4.10)
Esse preditor depende das previses nas etapas anteriores, dentro do horizonte de
previso. A propriedade recursiva do preditor habilita a extenso para previso de longo
alcance. Suponha que o horizonte de previso P , o preditor de longo alcance pode ser
descrito como,
y(k + i|k) = fAN N (y(k + i 1), ..., y(k + i min(i, n)), y(k), ...
..., y(k max(n i, 0)), u(k + i d), ..., u(k + i d m + 1)) , (4.11)
em que y(k + i|k) o valor de predio y para o momento k + i obtido no em k com base
nas informaes disponveis at k.
4.2.2.1 Preditor no recursivo d-Step frente
O preditor no-recursivo d-step frete usa as sequncias de ambas as entradas

e sadas passadas do processo at o tempo de amostragem k para construir o modelo
preditivo,
y(k + d + 1) = gAN N (y(k), ..., y(k n + 1), u(k), ..., u(k d m + 1)) . (4.12)
Comparado com o preditor recursivo d-step frente, o preditor no-recursivo simples,

pois no requer o procedimento recursivo. No entanto, um banco de preditores deve ser
usado em um horizonte preditivo se houver qualquer inteno de usar esse tipo de preditor
para a previso de longo alcance. A previso de longo alcance usando o preditor d-step
frente no-recursivo ,
y(k + i) = gAN
id
N (y(k), ..., y(k n + 1), u(k + i d), ..., u(k d m + 1)) . (4.13)
A seguir, deriva-se as formas explcitas do preditor neurais acima mencionados (forma no

recursiva). O modelo neural feedforward, com q camadas para representar o processo, pode
ser expresso de forma,

y(k + i) = tqf Wiq tfq1 Wiq1 ... t1f Wi1 I(k + i) . (4.14)
Em que I(k+i) = {y(k), ..., y(k + 1 n), u(k + i d), ..., u(k + 1 d m)}. Deve-
se notar que, em contraste com o preditor neural recursivo, para os diferentes passos de
predio dentro do horizonte de previso, os valores dos pesos dos preditores neurais no
recursivos so diferentes.
Usando as predies obtidas dos procedimentos descritos acima, o movimento de
controle determinado solucionando o seguinte problema de otimizao,
(P M
)
2 2
min = k Qi (r(k + i) y(k + i) k + k Ri u(k + i 1) k . (4.15)
X X
u(k)...u(k+M 1)
i=1 i=1
Isso leva a um problema de otimizao no-linear e no-convexo , para o qual a soluo

global difcil de encontrar. Portanto, algoritmos de otimizao especiais devem ser usados.
A representao esquemtica do MPC baseado em RNAs so apresentados na Figura(16).
Figura 16 MPC direto baseado em RNAs com de otimizao iterativo.
4.3 Predio de Sistemas e RNA-RBF

A base na previso de sries temporais foram explorados para identificao de
sistemas dinmicos no-lineares usando RNA parcialmente recorrentes (NARENDRA;
PARTHASARATHY, 1990). De forma, existem vrias maneiras de us-las em controle.
Na descrio dos algoritmos de controle com base em modelos de RNA, considera-se
que o processo pode ser escrito na forma discreta (HUNT et al., 1992) (ANILKUMAR;
PADHIYAR; MOUDGALYA, 2016). A dinmica da plantas no-lineares dada por
y(k + 1) = f (y(k), ..., y(k n + 1)..., u(k), ..., u(k m + 1)), (4.16)
em que u(k) e y(k), k=0,1,... so vetores de entrada e sada no instante de tempo k, n e

m so as ordens de y(k) e u(k) respectivamente. A funo f representa um padro no
linear,considerada desconhecida, embora alguma ideia da sua estrutura provavelmente
evidenciada.
Considerando o sistema de segunda ordem dado por,
y(k) = a1 y(k 1) a2 y(k 2) + b0 u(k) + b1 u(k 1) + b2 u(k 2).. (4.17)

A RNA para previso da sada do sistema dinmico baseado em uma RBF de

treinamento online com a caracterstica na Eq.(4.16),
yp (k + 1) = f (y(k), y(k 1), y(k 2), u(k), u(k 1) + u(k 2)). (4.18)
Para a predio da sada do sistema dinmico no instante de (k + 1) adquirida, utilizando

a propriedade de aproximao de funes por meio de RNA - RBF, j descrita na Seo
(3.3).
A entrada da RNA - RBF composta por seis unidades sensoriais, a sada atual
do sistema e duas atrasadas, as outras trs formada pela entrada atual do sistema com
as duas atrasadas, representada por, y(k), y(k 1), y(k 2), u(k), u(k 1) e u(k 2).
O esquema do mecanismo de predio neural mostrado na Figura 17.
Figura 17 Esquema do mecanismo de predio baseado na RNA - RBF.
A entrada da camada da rede neural RBF composta de unidades sensoriais dado

por X = [x1 x2 x3 x4 x5 x6 ]T . A entrada da camada oculta de j neurnios pode ser escrito
como
Ih1 = c11 x1 + ... + c41 x4 + c51 x5 + c61 x6

Ih2 = c12 x1 + ... + c42 x4 + c52 x5 + c62 x6
.. .. (4.19)
. = .
Ih8 = c18 x1 + ... + c48 x4 + c58 x5 + c68 x6
A sada de cada neurnio da camada oculta

Oh1 = fRBF (Ih1 )
Oh2 = fRBF (Ih2 )
.. .. (4.20)
. = .
Oh8 = fRBF (Ih8 )
em que cij o centro que ligam j (j = 1, 2...8) neurnio na camada oculta (i = 1, 2, 3, ..., 6),
as unidades sensoriais da camada de entrada. Onde fRBF uma funo gaussiana dada
por

fRBFhj = exp ||Xc
2b2
jn ||
, (4.21)
j
em que n e j so os nmeros de unidades sensoriais e de neurnios ocultos, respectivamente.

E b o vetor de largura da funo gaussiana,
b = [b1 b2 b3 ... b7 b8 ] (4.22)
Com bj > 0. E o vetor peso sendo, w = [w1 , w2 , w3 , ... w7 , w8 ]. Entrada do neurnio na

camada de sada
IO1 = w11 fRBF (Ih1 ) + w21 fRBF (Ih2 ) + ...... + w81 fRBF (Ih8 ). (4.23)
A sada do neurnio da camada de sada da rede
yp (k + 1) = fO (IO1 ). (4.24)
Para o ndice de performance da funo da RBF,
E(k) = 21 (y(k) ) (4.25)
em que a predio da sada atrasada. A atualizao dos pesos wij e centros cjn da
rede neural RBF, realizada conforme,
= yp (k + 1) q 1 . (4.26)
O mtodo do gradiente descendente usado para a atualizao dos parmetros da rede

neural RBF.
wj (k) = w
E
j
= (y(k) yp (k + 1) q 1 ) (4.27)
Em que se substituindo e se obtm,
wj (k) = w
E
j
= (y(k) ) (4.28)
Considerando os pesos anteriores e fazendo as devidas manipulaes algbricas,
wj (k) = wj (k 1) + wj (k) + .... + (wj (k 1) wj (k 2). (4.29)

Para a largura da funo gaussiana,
bj (k) = b
E
j
(4.30)
2
bj (k) = (y(k) )wj fRBF ( kxcb3jn k ). (4.31)
j
Para atualizao de bj (k)
bj (k) = bj (k 1) + bj (k) + .... + (bj (k 1) bj (k 2)) (4.32)
Por fim, as atualizaes dos centros cji
cj (k) = c
E
ji
(4.33)
2
cji (k) = (y(k) )wj ( kxcb2jn k ) (4.34)
j
em que as atualizaes dos centros, dados por
cji (k) = cji (k 1) + cji (k) + .... + (cji (k 1) cji (k 2)) (4.35)
sendo (0, 1) a taxa de aprendizagem e (0, 1) o momento. No caso de aplicaes

para aproximaes de funes com rede neurais RBF, os parmetros de bi e ci devem ser
escolhidos de acordo com o valor de entrada. Esse procedimento foi o mesmo adotado
para o procedimento de ajustes da rede neural RBF. Se os valores dos parmetros so
escolhidos de forma inadequada, a funo de gaussiana no vai ser efetivamente mapeados
e a rede RBF ser invlido. O mtodo de gradiente descendente um mtodo eficaz para
ajustar ci e bi em aproximaes de funes com rede neural RBF.
4.4 Sintonia RNA-RBF de Controlador PID

O controlador PID um componente bsico na hierarquia multinvel moderno de
controle, que funcionam como controladores de regulamentao segundo uma abordagem
em Chan, Chen e Chen (2016).
Apesar da vasta literatura sobre sintonia do controlador PID, uma porcentagem
significante em modo automtico so mal sintonizado, segundo Ender (1993). Por con-
seguinte, o desempenho timo nem sempre alcanada. A necessidade de produtos de
alta qualidade, reduo do consumo de energia (combustvel e eletricidade), o aumento da
concorrncia de mercado cria uma necessidade, indiscutvel, de melhorar o desempenho do
controle no processo.
4.4.1 Estrutura do controlador PID-RBF neural

Os modos tradicionais do controlador PID so dois, o modo de localizao e
incremental. A realizao da estrutura da RNA - RBF no modo PID localizado mostrado
em detalhe pelas Eq. ( 5.5) e Eq. (5.5) para uma combinao linear.
A estrutura do controlador PID neural desenvolvida pelo mtodo direto, no sentido
de obter a sada do controlador por meio das entradas da rede neural RBF, mostrada na
Figura (18).
Figura 18 Esquema do controlador PID Neural RBF
Fonte: Produzido pelo autor
A RNA composta por trs unidades sensoriais nas entradas, oito neurnios na
camada oculta e um neurnio na camada de sada,(3-5-1). Onde a entrada da rede X,
x1 = e(k)
k
x2 = T e(k) (4.36)
P
i=0
e(k)
x3 = T
.
A estrutura da rede neural pode ser escrita em funo de J,
J = 12 [yd (k) y(k)]2 . (4.37)
O mtodo da descida mas ngreme usado para os ajustes dos pesos da rede para atingir
o objetivo de J. Em que o erro dado por,
e(k) = yd y, (4.38)
sendo que o critrio da Eq. (5.8), a sada do controlador u(k) j definido o vetor de entrada
da rede neural RBF, tem-se a entrada da camada oculta, que dado por,
Ihu1 = c11 x1 + c21 x2 + c31 x3

Ihu2 = c12 x1 + c22 x2 + c32 x3
Ihu3 = c13 x1 + c23 x2 + c33 x3 (4.39)
Ihu3 = c13 x1 + c23 x2 + c33 x3
Ihu5 = c15 x1 + c25 x2 + c35 x3
k
e(k)
em que x1 = e(k), x2 = T e(k) e x3 = . Definindo em Ihu5 seu ndice e u refere-se
P
T
i=0
ao sistema de controle, diferente da Eq. (4.19), que se relacionado com rede neural RBF
preditiva. A sada de cada neurnio da camada oculta dada por,
Ohu1 = fRBF (Ih1 )

Ohu2 = fRBF (Ih2 )
Ohu3 = fRBF (Ih3 ) (4.40)
Ohu4 = fRBF (Ih4 )
Ohu5 = fRBF (Ih5 ),
em que fRBF e b foram definidos pela Eq. (4.21) e 4.22. O vetor b e w possui uma dimenso
oito. A entrada do neurnio da camada de sada dado por,
IOu 1 = w11 fRBF (Ihu1 ) + w21 fRBF (Ihu2 ) + ... + w51 fRBF (Ihu5 ). (4.41)
A sada da rede RBF fornece a ao de controle u(k) dado por,
u(k) = fO (IOu 1 ). (4.42)
A funo da camada de sada da rede fO tem um comportamento linear.
4.4.2 Atualizao dos parametros da rede

A atualizao dos parmetros da rede neural RBF do controle utilizado o mtodo
do gradiente decrescente,
E(k) = 1
2
[(yd (k) y(k))]2 . (4.43)
Para a atualizao dos pesos wj (k) da rede de controle,

y(k)
wj (k) = w
E
j
= e(k)(y(k) y(k)) u(k) hj
(4.44)
wj (k) = wj (k 1) + wj (k) + wj (k),
em que e so a taxa de aprendizagem e fator de momento, respectivamente.

Para as prximas atualizaes dos parmetros b e c, so dados por

y(k) u(k)
bj (k) = E
bj
= e(k) u(k) bj
(4.45)
2
bj (k) = y(k)
e(k) u(k) wj fRBF ( kxcb3jn k )
j
bj (k) = bj (k 1) + bj (k) + ... + (bj (k 1) bj (k 2)) (4.46)
Para os centros da funo gaussiana

y(k) u(k)
cj (k) = E
bj
= e(k) u(k) cj
(4.47)
2
cj (k) = y(k)
e(k) u(k) cj fRBF ( kxcb2jn k )
j
cij (k) = cij (k 1) + cij (k) + ... + (cij (k 1) cij (k 2)) (4.48)
y(k)
em que u(k) o valor jacobiano expressando a sensibilidade da sada e entrada do sistema.
y(k)
Este valor pode ser obtido pelo sinal de u(k) .
4.5 Comentrios
Apresentou-se as arquiteturas de predio em sistemas discretos baseados em RNAs.
Para a sada futura do sistema foi considerado d-step a frente, com atualizao dos pesos
da rede neural preditiva. Abordou-se o mecanismo de sintonia do controlador PID baseado
numa rede neural estruturada por funes de base radiais e levando em considerao os
ajustes timos dos pesos da rede RBF.

Hilton Iara Cap4

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Hilton Iara Cap4

Enviado por

Direitos autorais:

Formatos disponíveis

Captulo 3.

Controle Adaptativo e RNA 50

com derivao da Eq. (3.47),

Os raios so atualizados, i = 1, ..., m, para

Nota-se que E convexo apenas em relao a wi . Geralmente a seguinte relao

4 Sintonia RNA-Preditiva de Controladores

Neste captulo apresenta-se o modelo e algoritmos para sintonia de controladores

4.1 Arquitetura do Sistema de Predio

Figura 13 Resposta livre e forada

Fonte: Elaborado pelo autor

A estimativa do parmetro ai baseia-se na minimizao da funo do erro, e o erro

E [e(k)y(k j)] = 0, (4.2)

em que j = 1, 2, ..., p e, satisfeito somente quando ai = 1, 2, ..., p, assumir valores timos.

em que ryy ( ) = E [y(k)y(k + )] um valor da funo de autocorrelao de y(k)

Ryy a = ryy (4.4)

com Ryy Rpp a matriz de autocorrelao e a, ryy R so o vetores de parmetro do

a(k + 1) = a(k) + f (ep (k), y(k)) (4.6)

em que , f () so o ganho de adaptao e uma funo dependente do algoritmo de

Fonte: Elaborado pelo autor

aprendizagem, perspetivante. O a(k) o estimador e y(k) o vetor preditor.

A abordagem sequencial da estimao paramtrica dos peso particularmente

4.2 Controle Preditivo e RNA

Figura 15 Sequncia de tarefas envolvidas na aplicao genrica de sistema MPC.

Fonte: Elaborado pelo autor

Um problema que ocorre durante o treinamento de rede neural denominado

Um dos algoritmos mais avanados da segunda abordagem a chamada regula-

4.2.1 MPC direto baseado em RNAs

em que u(k) e y(k), k = 0, 1, ..., so vetores de entradas e sadas no instante de tempo.

O controle MPC baseado em RNA confia nas consideraes da funo aproximada

4.2.2 Preditor recursivo d-Step frente

4.2.2.1 Preditor no recursivo d-Step frente

O preditor no-recursivo d-step frete usa as sequncias de ambas as entradas

Comparado com o preditor recursivo d-step frente, o preditor no-recursivo simples,

A seguir, deriva-se as formas explcitas do preditor neurais acima mencionados (forma no

Isso leva a um problema de otimizao no-linear e no-convexo , para o qual a soluo

Figura 16 MPC direto baseado em RNAs com de otimizao iterativo.

Fonte: Elaborado pelo autor

4.3 Predio de Sistemas e RNA-RBF

em que u(k) e y(k), k=0,1,... so vetores de entrada e sada no instante de tempo k, n e

y(k) = a1 y(k 1) a2 y(k 2) + b0 u(k) + b1 u(k 1) + b2 u(k 2).. (4.17)

A RNA para previso da sada do sistema dinmico baseado em uma RBF de

Para a predio da sada do sistema dinmico no instante de (k + 1) adquirida, utilizando

Figura 17 Esquema do mecanismo de predio baseado na RNA - RBF.

Fonte: Elaborado pelo autor

A entrada da camada da rede neural RBF composta de unidades sensoriais dado

Ih1 = c11 x1 + ... + c41 x4 + c51 x5 + c61 x6

A sada de cada neurnio da camada oculta

em que n e j so os nmeros de unidades sensoriais e de neurnios ocultos, respectivamente.

b = [b1 b2 b3 ... b7 b8 ] (4.22)

Com bj > 0. E o vetor peso sendo, w = [w1 , w2 , w3 , ... w7 , w8 ]. Entrada do neurnio na

A sada do neurnio da camada de sada da rede

Para o ndice de performance da funo da RBF,

E(k) = 21 (y(k) ) (4.25)

O mtodo do gradiente descendente usado para a atualizao dos parmetros da rede

Em que se substituindo e se obtm,

Considerando os pesos anteriores e fazendo as devidas manipulaes algbricas,

wj (k) = wj (k 1) + wj (k) + .... + (wj (k 1) wj (k 2). (4.29)

Para a largura da funo gaussiana,

Para atualizao de bj (k)

bj (k) = bj (k 1) + bj (k) + .... + (bj (k 1) bj (k 2)) (4.32)

Por fim, as atualizaes dos centros cji

em que as atualizaes dos centros, dados por

sendo (0, 1) a taxa de aprendizagem e (0, 1) o momento. No caso de aplicaes

4.4 Sintonia RNA-RBF de Controlador PID