Escolar Documentos
Profissional Documentos
Cultura Documentos
São Carlos
2004
verso
iii
Dedicatória
Agradecimentos
A Deus e à memória das pessoas queridas que certamente intercedem por mim.
Ao Prof. Dr. Marco Henrique Terra pela orientação e confiança depositada na rea-
lização deste trabalho.
Epı́grafe
ix
x Resumo
Abstract
xi
xii Abstract
Lista de Figuras
xiii
xiv Lista de Figuras
FIGURA 5.28 Configuração APA, controle H∞ não linear via teoria dos
jogos, controlador 2: velocidade angular das juntas e torque aplicado. 89
FIGURA 5.39 Posição angular das juntas, configuração PAP, controle quase-
LPV por realimentação do estado: simulação e experimento. . . . . . 105
FIGURA 6.4 Reconfiguração com freios, controle H∞ via teoria dos jogos:
posição das juntas e torques. . . . . . . . . . . . . . . . . . . . . . . . 112
FIGURA 10.1 Sistema cooperativo formado por dois UArm II. . . . . . . . 173
FIGURA A.3 UArm II, fonte de tensão, placa de controle e computador. . 212
TABELA 6.1 Juntas controladas nas configurações AAP, APA e PAA. . . 117
TABELA 6.2 Juntas controladas nas configurações APP, PAP e PPA. . . 117
xxiii
xxiv Lista de Tabelas
AAA Ativa-Ativa-Ativa
AAP Ativa-Ativa-Passiva
APA Ativa-Passiva-Ativa
APP Ativa-Passiva-Passiva
PAA Passiva-Ativa-Ativa
PAP Passiva-Ativa-Passiva
PPA Passiva-Passiva-Ativa
CC Corrente Contı́nua
dll dynamically linked libraries
DMLs Desigualdades Matriciais Lineares
DTMJLS Discrete Time Markovian Jump Linear Systems
ERC Equação de Riccati Congelada
gdl graus de liberdade
LMI Linear Matrix Inequality
LPV Linear com Parâmetros Variantes
quase-LPV quase Linear com Parâmetros Variantes
UArm II Underactuated Arm II
UMCE Underactuated Manipulator Control Environment
VxD Virtual Device Driver
xxv
xxvi Lista de Abreviaturas e Siglas
Lista de Sı́mbolos
xxvii
xxviii Lista de Sı́mbolos
A K , B K , C K , DK matrizes do controlador
xclp estado do sistema em malha fechada
Aclp , Bclp , Cclp , Dclp matrizes do sistema em malha fechada
X(ρ(t)), Y (ρ(t)) variáveis matriciais das DMLs
fi (ρ(t)), gi (ρ(t)) funções base das variáveis X(ρ(t)) e Y (ρ(t))
Xi , Y i matrizes coeficientes das variáveis X(ρ(t)) e Y (ρ(t))
M número de funções base
L número de pontos da divisão do conjunto de parâmetros
τ vetor de torques nas juntas
M (q) matriz de inércia
V (q, q̇) vetor dos termos de Coriolis e forças centrı́fugas
b(q, q̇) vetor dos termos não inerciais
C(q, q̇) matriz de Coriolis e forças centrı́fugas
G(q) vetor das forças gravitacionais
F (q̇) vetor das forças friccionais
q vetor de posição das juntas
M 0 , C 0 , F0 , G 0 valores nominais das matrizes dinâmicas
∆M, ∆C, ∆F, ∆G incertezas paramétricas das matrizes dinâmicas
τd distúrbios externos de energia limitada
qd trajetória de referência para a posição das juntas
x̃ estado para manipuladores totalmente atuados
q̃ erro de acompanhamento de trajetória
n número de juntas
na número de juntas ativas
np número de juntas passivas
qc vetor de posição das juntas controladas
qr vetor de posição das juntas restantes
τa vetor de torques nas juntas ativas
qcd trajetória de referência para as juntas controladas
x̃c estado para manipuladores subatuados
q̃c erro de acompanhamento de trajetória para as
juntas controladas
xxix
Resumo ix
Abstract xi
1 Introdução 1
1.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Descrição do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Estrutura do texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
xxxv
xxxvi Sumário
2.9 Modelo quase-LPV para sistemas não lineares com entradas afins . . 24
3 Manipuladores subatuados 27
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 Manipuladores totalmente atuados . . . . . . . . . . . . . . . . . . . 31
3.3 Manipuladores subatuados . . . . . . . . . . . . . . . . . . . . . . . 33
5 Resultados experimentais 61
5.1 Trajetórias desejadas e ı́ndices de desempenho . . . . . . . . . . . . . 61
5.2 Configuração AAA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.2.1 Controle quase-LPV por realimentação do estado . . . . . . . 63
5.2.2 Controle quase-LPV por realimentação da saı́da . . . . . . . . 67
5.2.3 Controle H∞ não linear via teoria dos jogos . . . . . . . . . . 70
5.2.4 Controle misto H2 /H∞ não linear . . . . . . . . . . . . . . . 72
5.2.5 Controle adaptativo H∞ não linear . . . . . . . . . . . . . . . 74
5.2.6 Controle adaptativo H∞ não linear com redes neurais . . . . 76
5.3 Configuração APA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.3.1 Controle quase-LPV por realimentação do estado . . . . . . . 82
5.3.2 Controle H∞ não linear via teoria dos jogos . . . . . . . . . . 84
5.3.3 Controle misto H2 /H∞ não linear . . . . . . . . . . . . . . . 89
5.3.4 Controle adaptativo H∞ não linear . . . . . . . . . . . . . . . 92
5.3.5 Controle adaptativo H∞ não linear com redes neurais . . . . 95
5.4 Configuração PAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4.1 Controle quase-LPV por realimentação do estado . . . . . . . 101
5.4.2 Controle H∞ não linear via teoria dos jogos . . . . . . . . . . 104
7 Introdução 151
11 Conclusão 191
Introdução
1.1 Motivação
1
2 Capı́tulo 1. Introdução
bações, o controle H∞ é o mais estudado e aplicado nos últimos anos. Tal controlador
faz com que a relação entre as normas induzidas L2 dos sinais de entrada (distúr-
bios) e saı́da seja limitada por um nı́vel de atenuação γ, ou seja, o ganho L2 do
sistema em malha fechada seja limitado, [DOYLE et al. (1992)]. Para sistemas
não lineares, a obtenção de controladores H∞ é baseada em equações e inequações
de Hamilton-Jacobi, que são de difı́cil solução quando os sistemas possuem elevado
número de estados, [SCHAFT (1992)]. Um procedimento alternativo é representar
o sistema não linear na forma quase-linear com parâmetros variantes (quase-LPV),
sendo os parâmetros dependentes dos estados, e utilizar os controladores H∞ de-
senvolvidos para sistemas lineares com parâmetros variantes (LPV). A utilização de
controladores desenvolvidos para sistemas LPV em sistemas quase-LPV é possı́vel
desde que os valores dos estados e de suas derivadas observados após a aplicação
do controlador não sejam superiores aos limites utilizados no projeto, [HUANG E
JADBABAIE (1998)].
Uma solução global para o problema de controle H∞ não linear para robôs ma-
nipuladores totalmente atuados foi encontrada em [CHEN et al. (1994)], baseada
na teoria dos jogos diferenciais e utilizando propriedades dinâmicas de robôs ma-
nipuladores. No trabalhos [CHEN E CHANG (1997)], [CHEN et al. (1997)] e
[CHANG E CHEN (1997)], as soluções dos problemas de controles misto H2 /H∞
não linear, adaptativo H∞ não linear e adaptativo H∞ não linear com redes neurais
para robôs manipuladores foram apresentadas, respectivamente. Embora outros tra-
balhos abordem o controle H∞ não linear para robôs manipuladores, [SAGE et al.
(1999)], apenas em [POSTLETHWAITE E BARTOSZEWICZ (1998)] resultados ex-
perimentais foram apresentados utilizando uma metodologia semelhante a [CHEN
et al. (1994)]. Não há na literatura, implementação dos controladores desenvolvidos
em [CHEN E CHANG (1997)], [CHEN et al. (1997)] e [CHANG E CHEN (1997)],
em robôs manipuladores reais.
1.2 Objetivos
9
Capı́tulo 2
2.1 Introdução
11
12 Capı́tulo 2. Controle H∞ não linear via representação quase-LPV
controlador. Este trabalho foi estendido para sistemas lineares variantes no tempo
(com horizonte de tempo finito) em [LIMEBEER et al. (1992)].
Por outro lado, técnicas semelhantes foram desenvolvidas para sistemas lineares
com parâmetros variantes (LPV) [APKARIAN (1997); APKARIAN E ADAMS
(1998); APKARIAN E BIANNIC (1995); APKARIAN E GAHINET (1995); AP-
KARIAN et al. (1995); BECKER E PACKARD (1994); WU (1995); WU et al.
(1996); WU et al. (2000)] fornecendo controladores dependentes dos parâmetros,
também chamados de ganhos escalonados, que satisfazem a condição de ganho L 2
menor que γ. Alguns destes autores, [APKARIAN E BIANNIC (1995); APKAR-
IAN et al. (1995); BECKER E PACKARD (1994)], utilizaram funções de Lya-
punov quadráticas fixas para garantir a estabilidade e desempenho. Entretanto, tais
procedimentos são conservadores, pois permitem que os parâmetros tenham taxa
de variação arbitrária, e além disso, alguns sistemas não são sempre estabilizados
quando uma função de Lyapunov simples é utilizada [WU et al. (1996)]. Esta
limitação pode ser eliminada utilizando funções de Lyapunov dependentes dos parâ-
metros [APKARIAN E ADAMS (1998); WU (1995); WU et al. (1996); WU et al.
(2000)], que permitem incorporar o conhecimento da taxa de variação na análise e
14 Capı́tulo 2. Controle H∞ não linear via representação quase-LPV
Para a classe de sistemas não lineares com entradas afins, várias técnicas de
projeto fornecem representações lineares dependentes de parâmetros (ou dos estados)
para as dinâmicas não lineares. O procedimento de Equação de Riccati Congelada
(do inglês Frozen, ERC) [CLOUTIER et al. (1996)], no qual os parâmetros variantes
do sistema são fixados em valores especı́ficos, é o mais simples em termos de comple-
xidade computacional e implementação, embora não haja garantia de estabilidade, e
diferentes representações utilizadas no projeto por ERC apresentaram desempenhos
diferentes para uma mesma planta não linear [HUANG E JADBABAIE (1998);
HUANG E LU (1996)]. Quando a técnica LPV é aplicada em sistemas não lineares,
os parâmetros variantes são funções do estado ao invés de variáveis “livres”. Este
tipo de representação dos sistemas não lineares é denominada quase-LPV (quase
linear com parâmetros variantes).
sendo f (0, t) = 0 e h(0, t) = 0 para todo t ∈ [0, T ], e x ∈ <n o estado. Assume-se que
f (x, t), g(x, t), h(x, t) e k(x, t) são funções continuamente diferenciáveis em relação
a x e contı́nuas em t.
2.3. Sı́ntese do controle H∞ para sistemas não lineares variantes no tempo 15
Lema 2.1 (LU (1996)) O sistema (2.1), com R(x, t) = I−k T (x, t)k(x, t) > 0 para
todo x ∈ <n , possui ganho L2 ≤ γ no intervalo [0, T ] se, e somente se, existe uma
solução não negativa V (x, t), com V (0, 0) = 0, para a desigualdade de Hamilton-
Jacobi:
∂V ∂V
(x, t) + (x, t)(f (x, t) − g(x, t)R−1 (x, t)k T (x, t)h(x, t))
∂t ∂x
1 ∂V ∂V T
+ 2 (x, t)g(x, t)R−1 (x, t)g T (x, t) (x, t)
4γ ∂x ∂x
+ hT (x, t)(I − k(x, t)k T (x, t))h(x, t) ≤ 0.
h i h i
T
k12 (x, t) h1 (x, t) k12 (x, t) = 0 I .
Teorema 2.1 (LU (1996)) Considere o sistema não lineares variantes no tempo,
(2.3). O problema de controle H∞ para este sistema tem solução se existe uma
função não negativa V (x, t) que satisfaz a seguinte inequação de Hamilton-Jacobi:
∂V ∂V
(x, t) + (x, t)f (x, t) + hT1 (x, t)h1 (x, t)+
∂t ∂x
1 ∂V ∂V T
+ 2 (x, t) g1 (x, t)g1T (x, t) + g2 (x, t)g2T (x, t) (x, t) ≤ 0. (2.4)
4γ ∂x ∂x
1 ∂V T
u = − g2T (x, t) (x, t)
2 ∂x
ẋ = A(ρ(t))x + B(ρ(t))w,
(2.5)
z = C(ρ(t))x + D(ρ(t))w,
sendo que ρ(t) ∈ FPν e A(·), B(·), C(·) e D(·) são funções matriciais contı́nuas com
dimensões apropriadas. FPν é o conjunto no qual os parâmetros ρ(t) podem variar:
FPν = ρ ∈ C 1 (<+ , <m ) : ρ(t) ∈ P, |ρ̇i | ≤ νi , i = 1, . . . , m ,
O lema a seguir fornece uma condição de suficiência para que o sistema tenha
ganho L2 limitado por γ, considerando a matriz D(ρ(t)) nula.
2.5. Sı́ntese do controle H∞ para sistemas LPV por realimentação do estado 17
Lema 2.2 (WU et al. (1996)) Se existe uma função definida positiva continua-
mente diferenciável W : <m → <n×n tal que:
P
m ∂W T T
± ν i ∂ρi + A (ρ)W (ρ) + W (ρ)A(ρ) + C (ρ)C(ρ) W (ρ)B(ρ)
i=1 < 0,
T 2
B (ρ)W (ρ) −γ I
(2.6)
para todo ρ(t) ∈ P , então o sistema LPV (2.5), com D(ρ(t)) = 0, possui ganho
L2 ≤ γ para toda trajetória paramétrica ρ(t) ∈ FPν .
P
Note que (2.6) na realidade representa 2m inequações, sendo que o termo ±(·)
indica que toda combinação +(·) e −(·) deve ser satisfeita. O ponto chave deste
resultado é a utilização de uma função de Lyapunov dependente do parâmetro
V (x, t) = xT (t)W −1 (ρ(t))x(t). Esta função captura a natureza variante da planta
LPV, o que não ocorre quando se utiliza funções de Lyapunov com W sendo uma
matriz constante, como no caso de sistemas lineares invariantes no tempo.
z1 = C1 (ρ(t))x, (2.7)
z2 = C2 (ρ(t))x + u.
O objetivo é encontrar uma função contı́nua em ρ(t), F (ρ(t)), tal que o sistema
em malha fechada possua ganho L2 menor que γ com lei de realimentação do estado
igual a u = F (ρ(t))x.
Lema 2.3 (WU et al. (1996)) Se existe uma função matricial contı́nua diferen-
18 Capı́tulo 2. Controle H∞ não linear via representação quase-LPV
sendo
m
X
∂X b b T − B2 (ρ)B T (ρ)
E(ρ) = − ± νi + A(ρ)X(ρ) + X(ρ)A(ρ) 2
i=1
∂ρi
y = C2 (ρ(t))x + w2 ,
sendo ρ(t) ∈ FPν , w1 (t) ∈ <p1 e w2 (t) ∈ <p2 as entradas de distúrbio, e y(t) ∈ <s a
saı́da medida.
Define-se xTclp = [xT xTK ], z T = [z1T z2T ] e w T = [w1T w2T ]. Então o sistema LPV
em malha fechada é dado por:
sendo
A(ρ) + B2 (ρ)DK (ρ, ρ̇)C2 (ρ) B2 (ρ)CK (ρ, ρ̇)
Aclp (ρ(t), ρ̇(t)) = ,
BK (ρ, ρ̇)C2 (ρ) AK (ρ, ρ̇)
B11 (ρ) B12 (ρ) + B2 (ρ)DK (ρ, ρ̇)
Bclp (ρ(t), ρ̇(t)) = ,
0 BK (ρ, ρ̇)
C11 (ρ) 0
Cclp (ρ(t), ρ̇(t)) = ,
C12 (ρ) + DK (ρ, ρ̇)C2 (ρ) CK (ρ, ρ̇)
D1111 (ρ) D1112 (ρ)
Dclp (ρ(t), ρ̇(t)) = .
D1121 (ρ) D1122 (ρ) + DK (ρ, ρ̇)
20 Capı́tulo 2. Controle H∞ não linear via representação quase-LPV
Lema 2.4 (WU (1995)) Dado o sistema LPV em malha aberta (2.9) e o nı́vel de
atenuação γ > 0. Se existem uma função W ∈ C 1 e funções matriciais contı́nuas
(AK , BK , CK , DK ) tais que W (ρ(t)) > 0 e
−1 T
Eclp (ρ, β) W (ρ)Bclp (ρ, β) γ Cclp (ρ, β)
T
Bclp (ρ, β)W (ρ) −I γ −1 Dclp
T
(ρ, β) < 0, (2.11)
γ −1 Cclp(ρ, β) γ −1 Dclp (ρ, β) −I
sendo
Xm
∂W
Eclp (ρ, β) = ATclp (ρ, β)W (ρ) + W (ρ)Aclp (ρ, β) + βi ,
i=1
∂ρi
D111. (ρ) D1111 (ρ) D1112 (ρ)
= ,
D112. (ρ) D1121 (ρ) D1122 (ρ)
h i D1111 (ρ) D1112 (ρ)
D11.1 (ρ) D11.2 (ρ) = ,
D1121 (ρ) D1122 (ρ)
0 h i
D12 = e D21 = 0 I .
I
2.7. Sı́ntese do controle H∞ para sistemas LPV por realimentação da saı́da 21
Teorema 2.2 (WU (1995)) Dado o sistema LPV (2.9) e o conjunto compacto P .
Um controlador KP será encontrado se e somente se existirem funções matriciais
X ∈ C 1 e Y ∈ C 1 , tal que para todo ρ(t) ∈ P , X(ρ(t)) > 0, Y (ρ(t)) > 0, e as
seguintes desigualdades sejam satisfeitas:
T
Ê(ρ) X(ρ)C11 (ρ) γ −1 B̂(ρ)
C11 (ρ)X(ρ) −I γ −1 D111. (ρ) < 0, (2.12)
γ −1 B̂ T (ρ) γ −1 D111.
T
(ρ) −I
e
E(ρ) Y T
(ρ)B11 (ρ) e T (ρ)
−1
γ C
T
B11 (ρ)Y (ρ) −I γ −1 D11.1
T
(ρ) < 0, (2.13)
e
γ −1 C(ρ) γ −1 D11.1 (ρ) −I
X(ρ) γ −1 I
≥ 0, (2.14)
−1
γ I Y (ρ)
sendo
m
X
∂X
Ê(ρ) = − ± νi + Â(ρ)X(ρ) + X(ρ)Â(ρ)T − B2 (ρ)B2T (ρ),
i=1
∂ρi
m
X
e ∂Y eT (ρ)Y (ρ) + Y (ρ)A(ρ)
e T − C2T (ρ)C2 (ρ)
E(ρ) = ± νi +A
i=1
∂ρi
e
Define-se:
Dt (ρ) = [I − γ −2 D̄11
T
(ρ)D̄11 (ρ)]−1
T
F (ρ) = − (D12 Dh (ρ)D12 )−1 (B2 (ρ) + γ −2 B̄1 (ρ)D̄11
T
(ρ)Dh (ρ)D12 )T X −1 (ρ)
T
+D12 Dh (ρ)C̄1 (ρ) ,
L(ρ) = − Y −1 (ρ)(C2 (ρ) + γ −2 D21 Dt (ρ)D̄11
T
(ρ)C̄1 (ρ))T + B̄1 (ρ)Dt (ρ)D21
T
T −1
? (D21 Dt (ρ)D21 ) ,
s
X
−1 ∂X −1
H(ρ, ρ̇) = − [X (ρ)AF (ρ) + ATF (ρ)X −1 (ρ) + ρ̇i + CFT (ρ)CF (ρ)
i=1
∂ρi
? (γ −2 I − D̄11
T
(ρ)D̄11 (ρ))−1 (B̄1T (ρ)X −1 (ρ) + D̄11
T
(ρ)CF (ρ))],
com AF (ρ) = Ā(ρ) + B2 (ρ)F (ρ) e CF (ρ) = C̄1 (ρ) + D12 (ρ)F (ρ). Seja:
M (ρ, ρ̇) =H(ρ, ρ̇) + F T (ρ) B2T (ρ)X −1 (ρ) + D 12 (C̄1 (ρ) + D12 (ρ)F (ρ))
2
γ Q(ρ)(−Q−1 (ρ)Y (ρ)L(ρ)D21 − B̄1 (ρ)) + F T (ρ)D12 T
D̄11 (ρ)
−1 T
? γ −2 I − D̄11
T
(ρ)D̄11 (ρ) B̄1 (ρ)X −1 (ρ) + D̄11
T
(ρ)(C̄1 (ρ) +D12 (ρ)F (ρ)) .
dado por:
AK (ρ(t), ρ̇(t)) = Ā(ρ) + B2 (ρ)F (ρ) + Q−1 (ρ)Y (ρ)L(ρ)C2 (ρ) − γ −2 Q−1 (ρ)M (ρ, ρ̇),
CK (ρ(t)) = F (ρ),
DK (ρ(t)) = Ω(ρ).
M
X
X(ρ(t)) = fi (ρ(t))Xi , (2.15)
i=1
sujeito a
PM
∗ T
E (ρ) j=1 fj (ρ)Xj C1 (ρ) B1 (ρ)
PM
C1 (ρ) j=1 fj (ρ)Xj −I 0 < 0,
B1T (ρ) 0 −γ 2 I
M
X
fj (ρ)Xj > 0, (2.16)
j=1
24 Capı́tulo 2. Controle H∞ não linear via representação quase-LPV
sendo
m M
! M
X X ∂fj X
∗
E (ρ) = − ± νi Xj + b
fj (ρ)(A(ρ)X b T T
j + Xj A(ρ) ) − B2 (ρ)B2 (ρ).
i=1 j=1
∂ρi j=1
Note que (2.16) são DMLs em termos das variáveis matriciais {Xi }M
i=1 que de-
vem ser satisfeitas para todo parâmetro ρ(t) em P. Para resolver este problema de
otimização de dimensão infinita, divide-se o conjunto de parâmetros P em L pontos
{ρk }Lk=1 em cada dimensão. Então calcula-se as DMLs acima para estes pontos.
Desde que (2.8) consiste em 2m vı́nculos, um total de (2m + 1)Lm desigualdades ma-
triciais afins em termos das M variáveis matriciais {Xi } devem ser resolvidas. Uma
aproximação da densidade de pontos particionados, L, que garante uma solução
global das DMLs é dada em [WU (1995); WU et al. (1996)].
Controladores com ganho escalonado tem sido utilizados para controlar sistemas
não lineares. Tradicionalmente, o projeto de tais controladores é baseado em apro-
ximações lineares invariantes da planta não linear em vários pontos de operação.
Conforme as variáveis do sistema se aproximam de um ponto de operação, o ganho
2.9. Modelo quase-LPV para sistemas não lineares com entradas afins 25
Note que A(x) no lema acima não é uma linearização de f (x). De fato, tem-se
um número infinito de possı́veis representações matriciais A(x) para uma dada f (x).
As funções:
0 1 0 1
A(x) = e A(x) =
1 + x 1 x2 0 1 x21
ẋ = A(x)x + g(x)w,
z1 = C1 (ρ(x))x, (2.17)
z2 = C2 (ρ(x))x + u.
Esta representação é diferente do modelo LPV (2.7), apenas pelo fato que os
parâmetros ρi são agora funções das variáveis de estado, isto é, ρ = ρ(x). Visando
atenuar os efeitos das entradas externas para todas as trajetórias paramétricas per-
mitidas, o tratamento LPV inevitavelmente introduzirá algum conservadorismo de-
vido à conecção entre os parâmetros e as variáveis.
y = C2 (ρ(x))x + w2 .
Capı́tulo 3
Manipuladores subatuados
3.1 Introdução
27
28 Capı́tulo 3. Manipuladores subatuados
consideradas. Para eliminar estas limitações, redes neurais são utilizadas para repre-
sentar a função descritiva do modelo em [CHANG E CHEN (1997)]. A atualização
dos parâmetros das redes neurais é feita através de um algoritmo adaptativo com
desempenho H∞ . Neste método, não são necessários o conhecimento do modelo
dinâmico do robô manipulador e o cálculo da matriz de regressão.
sendo q ∈ <n o vetor das posições angulares das juntas, M (q) ∈ <n×n a matriz de
inércia (simétrica e positiva definida), V (q, q̇) = C(q, q̇)q̇ ∈ <n o vetor das forças
centrı́petas e de Coriolis, C(q, q̇) ∈ <n×n a matriz de Coriolis, F (q̇) ∈ <n o vetor dos
torques de fricção, G(q) ∈ <n o vetor dos torques gravitacionais e τ ∈ <n o vetor
dos torques aplicados. As incertezas paramétricas podem ser introduzidas dividindo
as matrizes e os vetores paramétricos M (q), C(q, q̇), F (q̇) e G(q) em uma parte
nominal e uma perturbada:
sendo M0 (q), C0 (q, q̇), F0 (q̇) e G0 (q) as matrizes e os vetores nominais, e ∆M (q),
∆C(q, q̇), ∆F (q̇) e ∆G(q) as incertezas paramétricas. Distúrbios externos de energia
finita, τd , podem ser também introduzidos. Após estas considerações a Equação (3.1)
fica:
τ + δ(q, q̇, q̈, τd ) = M0 (q)q̈ + C0 (q, q̇)q̇ + F0 (q̇) + G0 (q), (3.2)
32 Capı́tulo 3. Manipuladores subatuados
com
δ(q, q̇, q̈, τd ) = −(∆M (q)q̈ + ∆C(q, q̇)q̇ + ∆F (q̇) + ∆G(q) − τd ).
com
−M0−1 (q)C0 (q, q̇) 0
A(q, q̇) = ,
I 0
I
B= ,
0
q + q d (t)) = M0 (e
M0 (q) = M0 (e x, t). (3.5)
3.3. Manipuladores subatuados 33
O mesmo pode ser dito para C0 (q, q̇). Portanto,a Equação (3.4) pode ser conside-
rada uma representação quase-LPV para robôs manipuladores, ou seja, com A(e
x, t).
Nota-se que esta representação foi gerada naturalmente a partir de um sistema não
linear escolhendo-se a matriz C0 (q, q̇). Existem várias possibilidades de se esco-
lher a matriz C0 (q, q̇), entretanto, a mais utilizada é a que faz com que a matriz
(C0 (q, q̇) − 12 Ṁ0 (q, q̇)) seja anti-simétrica, [LEWIS et al. (1993)].
τa + δ(q, q̇, q̈, τd ) = M 0 (q)q̈c + C 0 (q, q̇)q̇c + E 0 (q, q̇)q̇r + F 0 (q, q̇) + G0 (q), (3.7)
com
−1
M 0 (q) = Mac (q) − Mar (q)Mur (q)Muc (q),
−1
C 0 (q, q̇) = Cac (q, q̇) − Mar (q)Mur (q)Cuc (q, q̇),
−1
E 0 (q, q̇) = Car (q, q̇) − Mar (q)Mur (q)Cur (q, q̇),
−1
F 0 (q, q̇) = Fa (q̇) − Mar (q)Mur (q)Fu (q̇),
−1
G0 (q) = Ga (q) − Mar (q)Mur (q)Gu (q),
−1
δ(q, q̇, q̈, τd ) = δa (q, q̇, q̈, τd ) − Mar (q)Mur (q)δu (q, q̇, q̈, τd ).
com
−1
−M 0 (q)C 0 (q, q̇) 0
A(q, q̇) = ,
I 0
I
B= ,
0
−1
w = M 0 (q)δ(q, q̇, q̈, τd ),
−1
u = M 0 (q)(τa − M 0 (q)q̈cd − C 0 (q, q̇)q̇cd − E 0 (q, q̇)q̇r − F 0 (q, q̇) − G0 (q)).
Pela equação acima, o torque aplicado nas juntas ativas pode ser dado por:
37
38 Capı́tulo 4. Controle H∞ não linear via teoria dos jogos
sendo T1 = [T11 T12 ] com T11 , T12 ∈ <n×n matrizes constantes a serem determinadas.
Assume-se que a matriz T11 é diagonal, ou seja, T11 = t11 I. A equação dinâmica em
espaço de estados de manipuladores totalmente atuados (3.4) fica:
ė = AT (e
x x, t)e
x + BT (e
x, t)T11 (−F (xe ) + τ ) + BT (e
x, t)w, (4.2)
com
−M0−1 (q)C0 (q, q̇) 0
x, t) = T0−1
AT (e T0 ,
−1 −1
T11 −T11 T12
M0−1 (q)
x, t) = T0−1
BT (e ,
0
w = T11 δ(q, q̇, q̈, τd ),
xe = q T q̇ T (q d )T (q̇ d )T (q̈ d )T
e
Quando os valores das matrizes paramétricas M0 (q), C0 (q, q̇), F0 (q̇) e G0 (q) são
conhecidos, pode-se calcular exatamente o termo F (xe ) e usar a lei de controle,
−1
τ = F (xe ) + T11 u.
4.1. Manipuladores totalmente atuados 39
com
q̈ = q̈ d − T11
−1 −1
T12 qė − T11 M0−1 (q) C0 (q, q̇)B T T0 x
e − u. (4.6)
Considera-se nesta seção que o termo F (xe ) está disponı́vel para o controle. A
aplicação do controle H∞ não linear requer que os efeitos do distúrbio combinado
w no sistema sejam minimizados pela estratégia de controle. Com esta intenção, e
sujeito à dinâmica do erro de acompanhamento, o seguinte critério de desempenho,
incluindo um nı́vel de atenuação de distúrbio desejado γ, é proposto:
R∞ 1 T
x x(t) + 12 uT (t)Ru(t)
e (t)Qe dt
min max 0 2 R
∞ 1 T ≤ γ2, (4.7)
u(·)∈L2 06=w(·)∈L2
0 2
w (t)w(t) dt
A metodologia apresentada por [CHEN et al. (1994)] para resolver este problema
é resumida a seguir. O critério de desempenho (4.7) pode ser modificado para formar
o seguinte problema minimax:
Z ∞
1 T 1 T 1 2 T
min max x x(t) + u (t)Ru(t) − γ w (t)w(t) dt ≤ 0,
e (t)Qe
u(·)∈L2 06=w(·)∈L2 0 2 2 2
40 Capı́tulo 4. Controle H∞ não linear via teoria dos jogos
e(0) = 0.
com x
sendo L(e
x, u, w) o Lagrangiano dado por:
1 T 1 1
L(e
x, u, w) = x x(t) + uT (t)Ru(t) − γ 2 w T (t)w(t).
e (t)Qe
2 2 2
V (e
x(t), t) = min max J(e
x(t), u, w, t),
u(·) w(·)
V (e x(0), u, w, 0) ≤ 0,
x(0), 0) = min max J(e
u(·) w(·)
e(0) = 0.
com x
De acordo com a teoria dos jogos diferenciais, a solução deste problema mini-
max(ou lı́der-seguidor) é encontrada se existe uma função de Lyapunov continua-
mente diferenciável V (e
x, t) que satisfaz a seguinte equação minimax de Bellman-
Isaacs: ( T )
∂V (e
x, t) ∂V (e
x, t)
− = min max L(e x, u, w) + e ,
x
∂t u(·) w(·) ∂ex
x(∞), ∞) = 0.
com condição terminal V (e
1 T
V (e
x, t) = xe P (e
x, t)e
x, (4.8)
2
sendo P (e
x, t) uma matriz simétrica definida positiva para todo t, a equação de
4.1. Manipuladores totalmente atuados 41
Ṗ (e
x, t) + P (e x, t) + ATT (e
x, t)AT (e x, t)P (e
x, t)
1
− P (e x, t) R−1 − 2 I BTT (e
x, t)BT (e x, t)P (e
x, t) + Q = 0.
γ
e
1 T
w∗ = B (e
x, t)P (e
x, t)e
x.
γ2 T
e
1 T
w∗ = e.
B T0 x
γ2
42 Capı́tulo 4. Controle H∞ não linear via teoria dos jogos
e
1 T 1 T
K= Q1 Q2 + QT2 Q1 − Q21 + Q12 ,
2 2
com as condições: K > 0 e R < γ 2 I. A matriz R1 é o resultado da fatoração de
Cholesky: −1
1
R1T R1 = R −1
− 2I (4.13)
γ
e a matriz simétrica definida positiva Q é fatorada como:
QT1 Q1 Q12
Q= . (4.14)
QT12 QT2 Q2
2. Selecione a matriz de peso R > 0 tal que λmax (R) < γ 2 e a matriz de peso Q
como (4.14) e satisfazendo K > 0.
Na aplicação do controle misto H2 /H∞ não linear, além da atenuação dos efeitos
dos distúrbios externos, a obtenção do mı́nimo custo quadrático (H2 ótimo) é re-
querida, [CHEN E CHANG (1997)]. Portanto, o controle H2 ótimo deve ser obtido
4.1. Manipuladores totalmente atuados 43
pode ser alcançado para alguma matriz definida positiva Q2f = QT2f > 0, sujeito ao
critério de desempenho H∞ :
Z tf
T T T 2 T
max e (tf )Q1f x
x e(tf )) + e(t) + u (t)Ru(t) − γ w (t)w(t) dt
e (t)Q1 x
x
w(t)∈L2 [0,tf ] 0
eT (0)P0 x
≤x e(0)), (4.16)
Seja
Z tf
T
e (tf )Q1f x
J1 (u, w) = x e(tf )) + eT (t)Q2 x
x e(t) + uT (t)Ru(t) − γ 2 w T (t)w(t) dt
0
e Z tf
T
e (tf )Q2f x
J2 (u, w) = x e(tf )) + eT (t)Q2 x
x e(t) + uT (t)Ru(t) dt.
0
e
J1 (u∗ , w ∗ ) ≥ J1 (u∗ , w) ∀w(t) ∈ L2 [0, tf ],
u∗ = −R−1 BTT (e
x, t)P2 (e
x, t)e
x (4.17)
e
1 T
w∗ = B (e
x, t)P1 (e
x, t)e
x, (4.18)
γ2 T
sendo P1 (e
x, t) e P2 (e
x, t) as soluções das seguinte equações de Riccati acopladas:
−Ṗ1 (e
x, t) =P1 (e x, t) + ATT (e
x, t)AT (e x, t)P1 (e
x, t) + Q1
−1
γ2
I R−1
− [P1 (e
x, t)BT (e
x, t) P2 (e x, t)]
x, t)BT (e
−1 −1
R −R
BTT (e
x, t)P1 (e
x, t)
× (4.19)
BTT (e
x, t)P2 (e
x, t)
−Ṗ2 (e
x, t) =P2 (e x, t) + ATT (e
x, t)AT (e x, t)P2 (e
x, t) + Q2
−1
0 γ2
I
− [P1 (e
x, t)BT (e
x, t) P2 (e x, t)]
x, t)BT (e
−1 −1
γ2
I R
BTT (e
x, t)P1 (e
x, t)
× , (4.20)
BTT (e
x, t)P2 (e
x, t)
com P1 (e
x(tf ), t) = Q1f , P2 (e x, t) = P1T (e
x(tf ), t) = Q2f , P1 (e x, t) ≥ 0 e P2 (e
x, t) =
P2T (e
x, t) ≥ 0, então (4.17) e (4.18) são as soluções do problema de controle misto
H2 /H∞ .
e
M0 (e
x, t) 0
x, t) = T0T
P2 (e T0 , (4.22)
0 K2
e
0 K2
− T0T B R−1 − 2 I B T T0 + Q2 = 0. (4.24)
K2 0 γ2
e
1 T
w∗ = e.
B T0 x
γ2
Para resolver as equações (4.23) e (4.24) algumas restrições são impostas às
matrizes peso Q1 , Q2 e R. Subtraindo (4.24) de (4.23), tem-se:
0 K1 − K2
− 1 T0T BB T T0 + Q1 − Q2 = 0.
K1 − K 2 0 γ2
Q1 > Q2 > 0.
e sendo
1−α
R= γ 2 I, (4.27)
2−α
as soluções das equações (4.23) (4.24) são dadas por:
(1 − α)1/2 Q11 (1 − α)1/2 Q22
T0 = , (4.28)
0 I
1 T 1 T
K1 = Q11 Q22 + QT22 Q11 − Q12 + Q12
2 2
e
1 T 1 T
K2 = Q11 Q22 + QT22 Q11 − Q12 + Q12 .
4 4
Para garantir que as matrizes K1 e K2 sejam definidas positivas, a seguinte condição
deve ser satisfeita:
QT11 Q22 + QT22 Q11 > QT12 + Q12 . (4.29)
˙
θ̂ = α(e
x, t),
τ = Y (·)θ̂ + u(e
x, t),
tal que o sistema em malha fechada satisfaça o seguinte critério, para qualquer
condição inicial:
Z T Z T
xT T
x + u Ru dt ≤ x
e Qe e (0)P0 xT e +γ
e(0) + θ (0)S0 θ(0)eT 2
(w T w)dt,
0 0
1 T 1
x, t) = x
V (e e P (e x + θeT S θ,
x, t)e e
2 2
48 Capı́tulo 4. Controle H∞ não linear via teoria dos jogos
sendo P (e
x, t) a solução simétrica definida positiva da equação de Riccati obtida na
Seção 4.1.1, a solução do problema de controle adaptativo [CHEN et al. (1997)],
para qualquer matriz simétrica definida positiva S, é dada por:
˙
θ̂ = −S −1 Y T (·)T11 BTT (e
x, t)P (e
x, t)e
x, (4.30)
−1 −1 T
τ = Y (·)θ̂ − T11 R BT (e
x, t)P (e
x, t)e
x. (4.31)
Analogamente à Seção 4.1.1, uma solução simplificada pode ser dada para as
equações (4.30-4.31) como função das matrizes soluções da equação algébrica (4.10):
˙
θ̂ = −S −1 Y T (·)T11 B T T0 x
e, (4.32)
−1 −1 T
τ = Y (·)θ̂ − T11 e.
R B T0 x (4.33)
Nesta seção, um conjunto de redes neurais, F (xe , Θ), sendo Θ o vetor contendo
os parâmetros ajustáveis da rede, é utilizado para aproximar o termo desconhecido
F (xe ) − δ(q, q̇, q̈, τd ) em (4.2). O conjunto de redes é definido por:
F1 (xe , Θ1 )
..
F (xe , Θ) = . .
Fn (xe , Θn )
pk 5n
!
X X
k
Fk (xe , Θk ) = H wij xej + mki Θki
i=1 j=1
= ξkT Θk , (4.34)
com
Θk1
.
Θk = ..
Θkp k
e P
5n k
H j=1 w1j xej + mk1
..
ξk = . ,
P
5n
H j=1 wpkk j xej + mkpk
k
sendo pk o número de neurônios na camada escondida. Os pesos wij e os limiares
mki para 1 ≤ i ≤ pk , 1 ≤ j ≤ 5n são constantes definidas pelo projetista, e H é a
função tangente hiperbólica:
ez − e−z
H(z) = .
ez + e−z
Se τ é escolhido da forma:
τ = F (xe , Θ) + u,
ė =AT (e
x x, t)e x, t)T11 (F (xe , Θ) − F (xe , Θ∗ ) + F (xe , Θ∗ ) − F (xe ) + u)
x + BT (e
+ BT (e
x, t)T11 δ(q, q̇, q̈, τd )
=AT (e
x, t)e x, t)T11 (F (xe , Θ) − F (xe , Θ∗ ) + u) + BT (e
x + BT (e x, t)w,
sendo
w = T11 (F (xe , Θ∗ ) − F (xe ) + δ(q, q̇, q̈, τd )).
Θ̇ = β(e
x, t),
τ = F (xe , Θ) + u(e
x, t),
tal que o sistema em malha fechada, para qualquer condição inicial, satisfaça o
4.2. Manipuladores subatuados 51
e = Θ − Θ∗ o erro de estimativa
sendo Q = QT > 0, P0 = P0T > 0, Z0 = Z0T > 0 e Θ
do parâmetro da rede neural. Além disso, se o erro de aproximação tiver energia
finita, isto é, w ∈ L2 [0, t] para todo t ≥ 0, então as variáveis x
e(t), Θ(t), e τ (t) são
limitadas.
1 T 1 eT e
V (e
x, t) = xe P (e
x, t)e
x+ Θ Z Θ,
2 2
sendo P (e
x, t) a matriz solução, simétrica definida positiva da equação de Riccati
obtida na Seção 4.1.1, e considerando (4.35), a lei de controle adaptativa com redes
neurais fica:
Θ̇ = −Z −1 ΞT T11 BTT (e
x, t)P (e
x, t)e
x,
−1 −1 T
τ = ΞΘ − T11 R BT (e
x, t)P (e
x, t)e
x,
para qualquer matriz simétrica definida positiva Z. As equações acima são a solução
do problema de controle adaptativo H∞ baseado em redes neurais [CHANG E CHEN
(1997)].
Θ̇ = −Z −T ΞT T11 B T T0 x
e,
−1 −1 T
τ = ΞΘ − T11 e.
R B T0 x
se particionar a Equação (3.2) de tal forma que a matriz de inércia relacionada às
juntas controladas seja simétrica e definida positiva e a propriedade de anti-simetria
seja satisfeita. As equações em espaços de estados de manipuladores subatuados
descritas a seguir constituem contribuição original deste trabalho.
sendo τr o vetor dos torques nas juntas restantes e τc o vetor dos torques nas juntas
controladas. Por simplicidade de notação, o ı́ndice 0 representando o sistema no-
minal é retirado das equações. Se a possibilidade escolhida para o controle for 1, o
vetor τc = 0, pois o torque nas juntas passivas é nulo. Se a possibilidade for 2, o
vetor é da forma τc = [τac 0], sendo τac o torque nas juntas ativas sendo controladas.
A segunda linha de (4.37) é:
τc + δc (q, q̇, q̈, τd ) = Mcr (q)q̈r + Mcc (q)q̈c + Ccr (q, q̇)q̇r + Ccc (q, q̇)q̇c + Fc (q̇) + Gc (q).
−1
q̈c = −Mcc (q) (Ccc (q, q̇)q̇c + Fc (q̇) + Gc (q) − τ − δc (q, q̇, q̈, τd )) , (4.39)
−1
qëc = −Mcc (q) Ccc (q, q̇)qėc + Mcc (q)q̈cd + Ccc (q, q̇)q̇cd
com
−1
−Mcc (q)Ccc (q, q̇) 0
A(q, q̇) = ,
I 0
−1
−Mcc (q) Mcc (q)q̈cd + Ccc (q, q̇)q̇cd + Fc (q̇) + Gc (q)
B0 (q, q̇, q̈cd , q̇cd ) = ,
0
−1
Mcc (q)
B= .
0
com
−1
−Mcc (q)Ccc (q, q̇) 0
AT (q, q̇, t) = T0−1 T0 ,
−1 −1
T11 −T11 T12
−1
Mcc (q)
B T (q, q̇, t) = T0−1 ,
0
Note que as matrizes Mcc (q) e Ccc (q, q̇) podem ser descritas como funções apenas
das juntas controladas, ou seja, Mcc (qc ) e Ccc (qc , q̇c ). Como será visto nos resultados
experimentais, Capı́tulo 5, esta condição pode ser satisfeita em determinadas confi-
gurações. Assim, considerando a observação (3.5), as matrizes de estado são descritas
como funções do estado e do tempo, AT (e
xc , t) e B T (e
xc , t). De forma similar, tem-se
que F (xe ) = F (xec ), com xec = [qcT q̇cT (qcd )T (q̇cd )T (q̈cd )T ].
A Equação (4.42) pode ser manipulada de tal forma que a aceleração das juntas
controladas é dada por:
q̈c = q̈cd − T11
−1 −1
T12 qėc − T11 −1
Mcc (qc ) Ccc (qc , q̇c )B T T0 x
ec − u .
sendo que os ı́ndices a e u representam juntas ativas e juntas passivas freadas, res-
pectivamente, e b(q, q̇) = C(q, q̇) + F (q̇) + G(q) . Isolando o vetor q̇r na segunda
4.2. Manipuladores subatuados 55
−1
−1
τa = Mac (q) − Mar (q)Mur (q)Muc (q) q̈c + ba (q, q̇) − Mar (q)Mur (q)bu (q, q̇). (4.46)
pois a matriz Mcc (qc , q̇c ) é simétrica positiva definida, e sendo a matriz (Ccc (qc , q̇c ) −
1
2
Ṁcc (qc , q̇c )) é anti-simétrica, os mesmos algoritmos de projeto descritos nas Seções
4.1.1 e 4.1.2 podem ser aplicados para o caso subatuado.
ˆθ˙ = −S −1 Y T (·)T B T T x
11 0 ec ,
τ = Y (·)θˆ − T11
−1 −1 T
ec .
R B T0 x
−1
q̈c = −M̂cc (q) Ĉcc (q, q̇)q̇c + F̂c (q̇) + Ĝc (q) − τ , (4.47)
−1 −1
τa = M̂ac (q) − M̂ar (q)M̂ur (q)M̂uc (q) q̈c + b̂a (q, q̇) − M̂ar (q)M̂ur (q)b̂u (q, q̇),
sendo M̂ii e b̂i partições da matriz M̂ (q) e do vetor b̂(q, q̇) = Ĉ(q, q̇)q̇ + F̂ (q̇) + Ĝ(q),
respectivamente. M̂ (q) e b̂(q, q̇) são calculados utilizando o vetor dos parâmetros
56 Capı́tulo 4. Controle H∞ não linear via teoria dos jogos
q̈c = q̈cd − T11
−1 −1
T12 qėc − T11 −1
M̂cc (qc ) Ĉcc (qc , q̇c )B T T0 x
ec − u ,
sendo u = −R−1 B T T0 x
ec .
com
δ(q, q̇, q̈) = −(∆M (q)q̈ + ∆D(q, q̇)q̇ + ∆F (q̇) + ∆G(q) − τd ).
sendo que o vetor das forças centrı́petas e de Coriolis é representado por V (q, q̇) =
D(q, q̇)q̇ = D0 (q, q̇)q̇ +∆D(q, q̇)q̇, com D0 (q, q̇) ∈ <nxn . A motivação para reescrever
a matriz C0 (q, q̇) como D0 (q, q̇) será definida em seguida. Aqui, considera-se que
apenas uma junta passiva, qu , é controlada por uma junta passiva, qa , ou seja,
qc = qu ∈ < e qr = qa ∈ <. Assim, a Equação (4.48) é particionada como:
τa δa (q, q̇, q̈, τd ) Maa (q) Mau (q) q̈a
+ = +
0 δu (q, q̇, q̈, τd ) Mua (q) Muu (q) q̈u
Daa (q, q̇) Dau (q, q̇) q̇a Fa (q̇) Ga (q)
+ + .
Dua (q, q̇) Duu (q, q̇) q̇u Fu (q̇) Gu (q)
τa + δ(q, q̇, q̈, τd ) = M 0 (q)q̈u + D 0 (q, q̇)q̇u + E 0 (q, q̇)q̇a + F 0 (q̇) + G0 (q), (4.49)
4.2. Manipuladores subatuados 57
com
−1
M 0 (q) = Mau (q) − Maa (q)Mua (q)Muu (q),
−1
D 0 (q, q̇) = Dau (q, q̇) − Maa (q)Mua (q)Duu (q, q̇),
−1
E 0 (q, q̇) = Daa (q, q̇) − Maa (q)Mua (q)Dua (q, q̇),
−1
F 0 (q̇) = Fa (q̇) − Maa (q)Mua (q)Fu (q̇),
−1
G0 (q) = Ga (q) − Maa (q)Mua (q)Gu (q),
−1
δ(q, q̇, q̈, τd ) = δa (q, q̇, q̈, τd ) − Maa (q)Mua (q)δu (q, q̇, q̈, τd ).
ėu = AT (e
x xu , t)e
xu + B T (e
xu , t)T11 (−F (xeu ) + τa ) + B T (e
xu , t)w,
com
−1
−M 0 (q) D 0 (q, q̇) 0
xu , t) = T0−1
AT (e T0 ,
−1 −1
T11 −T11 T12
−1
M 0 (q)
xu , t) = T0−1
B T (e ,
0
−1
w = M 0 (q)T11 M 0 (q)δ(q, q̇, q̈),
−1
τa = F (xeu ) + T11 u,
e para o controle adaptativo com redes neurais, o termo F (xeu ) pode ser escrito
como:
F (xeu , Θ) = ΞΘ, (4.51)
Quando apenas uma junta passiva é controlada por uma junta ativa, M 0 (q) é
escalar e sempre negativa. Para simplificar a equação de Riccati, como na Seção
4.1.1, Pu (e eu e t. Portanto, Pu (e
xu , t) deve ser definida positiva para todo x xu , t) é
selecionada como:
−M 0 (e
xu , t) 0
xu , t) = T0T
Pu (e T0 ,
0 Kc
Além disso, a matriz D0 (q, q̇) deve ser definida de tal forma que D 0 (q, q̇) −
1 ˙
2
M 0 (q, q̇) seja anti-simétrica. Neste caso, como este termo é escalar, ele deve ser
nulo. Considerando a Equação (4.49), com uma escolha apropriada de Dac (q, q̇) e
Duc (q, q̇), resultados da partição de D0 (q, q̇), a condição de anti-simetria pode ser
satisfeita. Os demais elementos de D0 (q, q̇), Dar (q, q̇) e Dur (q, q̇), são determinados
tal que D0 (q, q̇)q̇ = V (q, q̇). Note que a matriz resultante D0 (q, q̇) é diferente de
C0 (q, q̇).
Com estas definições, o problema de controle adaptativo H∞ com redes pode ser
resolvido para manipulador subatuados como na Seção 4.1.4. Neste caso, a lei de
4.2. Manipuladores subatuados 59
˙ = + Z −T ΞT T B T T x
Θ 11 0 eu ,
−1 −1 T
τa =ΞΘ + T11 eu .
R B T0 x
Resultados experimentais
satisfazendo:
61
62 Capı́tulo 5. Resultados experimentais
sendo t0 o tempo inicial, tf o tempo final desejado, qi0 , q̇i0 , q̈i0 os valores iniciais
da posição, velocidade e aceleração, respectivamente, e qif , q̇if , q̈if os valores finais
desejados para posição, velocidade e aceleração, respectivamente. Calculando os
polinômios de velocidade e aceleração, e substituindo as restrições dadas acima, os
coeficientes do polinômio (5.1) são dados por [LEWIS et al. (1993)]:
−1
ai 1 0 0 0 0 0 q i0
bi 0 1 0 0 0 0 q̇i0
ci 0 0 1 0 0 0 q̈i0
= ,
di 1 T T2 T3 T4 T5 q if
ei 0 1 2T 3T 2 4T 3 5T 4 q̇if
fi 0 0 2 6T 12T 2 20T 3 q̈if
Z tr 21
1
L2 [e
x] = x(t)k22 dt
ke ,
(tr − t0 ) t0
n Z
X tr
E[τ ] = |τi (t)|dt ,
i=0 t0
Para esta configuração, seis tipos de controles foram projetados: quase-LPV por
realimentação do estado, quase-LPV por realimentação da saı́da, H∞ não linear via
teoria dos jogos, misto H2 /H∞ não linear, adaptativo H∞ não linear e adaptativo
H∞ não linear com redes neurais.
O experimento foi realizado para posição inicial q(0) = [0◦ 0◦ 0◦ ]T e posição final
desejada q(tf ) = [−20◦ 30◦ −30◦ ]T , com tf = [4.0 4.0 4.0]s. Para verificar a robustez
dos controladores, distúrbios externos do tipo senóide amortecida, iniciando em t =
1.5 s, foram introduzidos artificialmente nos motores das juntas. Os distúrbios são
dados por:
−1.5e−2t sin(2πt)
−2t
τd = 0.5e sin(2πt) .
−0.25e−2t sin(2πt)
0.06
Junta 1
0.05 Junta 2
Junta 3
0.04
0.02
0.01
−0.01
−0.02
−0.03
−0.04
0 1 2 3 4 5
Tempo (s)
sendo qe2 e qe3 os erros de posição das juntas 2 e 3, respectivamente. Esta escolha é
baseada no fato que a matriz de inércia, M (q), e a matriz de Coriolis, C(q, q̇), são
funções da posição das juntas 2 e 3, e como visto anteriormente, são dependentes do
erro de posição destas juntas. A matriz C(q, q̇) também dependente das velocidades
angulares das juntas 1, 2 e 3. Entretanto, uma escolha de ρ que também considere os
erros de velocidade das juntas, ou seja, ρ contendo 5 elementos, faz com que número
de desigualdades matriciais a serem resolvidas cresça absurdamente (veja Seção 2.8).
A(ρ(x)) = A(ρ(e
x))
B1 (ρ(x)) = B
B2 (ρ(x)) = B
C1 (ρ(x)) = I
C2 (ρ(x)) = 0
5.2. Configuração AAA 65
40 40
Junta 1 Junta 1
Junta 2 Junta 2
30 Junta 3 30 Junta 3
Desejada Desejada
Posição das juntas (graus)
10 10
0 0
−10 −10
−20 −20
−30 −30
−40 −40
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.2: Posição angular das juntas, configuração AAA, controle quase-LPV por
realimentação do estado: sem distúrbios e com distúrbios.
Junta 1 Junta 1
60 Junta 2 60 Junta 2
Junta 3 Junta 3
Desejada Desejada
Velocidade angular (graus/s)
40 40
20 20
0 0
−20 −20
−40 −40
−60 −60
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.3: Velocidade angular das juntas, configuração AAA, controle quase-LPV
por realimentação do estado: sem distúrbios e com distúrbios.
0.2 0.2
Junta 1 Junta 1
Junta 2 Junta 2
0.15 Junta 3 0.15 Junta 3
0.1 0.1
Torque (Nm)
Torque (Nm)
0.05 0.05
0 0
−0.05 −0.05
−0.1 −0.1
−0.15 −0.15
−0.2 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.4: Torque aplicado, configuração AAA, controle quase-LPV por realimen-
tação do estado: sem distúrbios e com distúrbios.
5.2. Configuração AAA 67
com
−M0−1 (q)(C0 (q, q̇) + Fe0 ) 0
A(x) =
In 0
M0−1 (q)
B(x) =
0
u = τ − G0 (q).
sendo que o atrito depende linearmente da velocidade, isto é, F0 = Fe0 q̇, sendo
Fe0 ∈ <n uma matriz diagonal constante.
40 40
Junta 1 Junta 1
Junta 2 Junta 2
30 Junta 3 30 Junta 3
Posição das juntas (graus) Desejada Desejada
10 10
0 0
−10 −10
−20 −20
−30 −30
−40 −40
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.5: Posição angular das juntas, configuração AAA, controle quase-LPV por
realimentação da saı́da: sem distúrbios e com distúrbios.
Junta 1 Junta 1
60 Junta 2 60 Junta 2
Junta 3 Junta 3
Desejada Desejada
Velocidade angular (graus/s)
40 40
20 20
0 0
−20 −20
−40 −40
−60 −60
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.6: Velocidade angular das juntas, configuração AAA, controle quase-LPV
por realimentação da saı́da: sem distúrbios e com distúrbios.
0.2 0.2
Junta 1 Junta 1
Junta 2 Junta 2
0.15 Junta 3 0.15 Junta 3
0.1 0.1
Torque (Nm)
Torque (Nm)
0.05 0.05
0 0
−0.05 −0.05
−0.1 −0.1
−0.15 −0.15
−0.2 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.7: Torque aplicado, configuração AAA, controle quase-LPV por realimen-
tação da saı́da: sem distúrbios e com distúrbios.
70 Capı́tulo 5. Resultados experimentais
tão suave como o apresentado nas Figuras 5.2 e 5.3 para controle quase-LPV por
realimentação do estado. Entretanto, as curvas de torque mostram-se mais suaves
em comparação aos resultados da Figura 5.4. Note que a resposta deste controlador
é mais lenta em relação ao controle por realimentação do estado, o que era espera-
do pela caracterı́stica dinâmica do controlador por realimentação da saı́da. Com a
aplicação do distúrbio, as oscilações aumentaram, entretanto, o posicionamento das
juntas é alcançado no mesmo tempo apresentado no caso sem distúrbio.
Esta metodologia também foi aplicada no robô manipulador UArm II. Os pa-
râmetros do manipulador, as posições iniciais e finais são os mesmos utilizados nas
seções anteriores. Os resultados experimentais: posição angular, velocidade angular
e torque aplicado, com e sem distúrbios, são mostrados nas Figuras 5.8, 5.9 e 5.10,
respectivamente.
5.2. Configuração AAA 71
40 40
Junta 1 Junta 1
Junta 2 Junta 2
30 Junta 3 30 Junta 3
Posição das juntas (graus) Desejada Desejada
10 10
0 0
−10 −10
−20 −20
−30 −30
−40 −40
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.8: Posição angular das juntas, configuração AAA, controle H∞ não linear
via teoria dos jogos: sem distúrbios e com distúrbios.
Junta 1 Junta 1
60 Junta 2 60 Junta 2
Junta 3 Junta 3
Desejada Desejada
Velocidade angular (graus/s)
40 40
20 20
0 0
−20 −20
−40 −40
−60 −60
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.9: Velocidade angular das juntas, configuração AAA, controle H∞ não
linear via teoria dos jogos: sem distúrbios e com distúrbios.
0.2 0.2
Junta 1 Junta 1
Junta 2 Junta 2
0.15 Junta 3 0.15 Junta 3
0.1 0.1
Torque (Nm)
Torque (Nm)
0.05 0.05
0 0
−0.05 −0.05
−0.1 −0.1
−0.15 −0.15
−0.2 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.10: Torque aplicado, configuração AAA, controle H∞ não linear via teoria
dos jogos: sem distúrbios e com distúrbios.
72 Capı́tulo 5. Resultados experimentais
O controlador H∞ não linear via teoria dos jogos também apresentou bom de-
sempenho. Os resultados são semelhantes aos apresentados pelo controle LPV por
realimentação da saı́da. Embora o desempenho do sistema tenha sido afetado pela
introdução dos distúrbios, verifica-se que as juntas alcançaram a posição final dese-
jada no tempo pré-estabelecido.
e
1.71 0 0 2.85 0 0
0 1.71 0 0 2.85 0
0 0 1.71 0 0 2.85
T0 =
.
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
40 40
Junta 1 Junta 1
Junta 2 Junta 2
30 Junta 3 30 Junta 3
Posição das juntas (graus) Desejada Desejada
10 10
0 0
−10 −10
−20 −20
−30 −30
−40 −40
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.11: Posição angular das juntas, configuração AAA, controle misto H 2 /H∞
não linear: sem distúrbios e com distúrbios.
Junta 1 Junta 1
60 Junta 2 60 Junta 2
Junta 3 Junta 3
Desejada Desejada
Velocidade angular (graus/s)
40 40
20 20
0 0
−20 −20
−40 −40
−60 −60
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.12: Velocidade angular das juntas, configuração AAA, controle misto
H2 /H∞ não linear: sem distúrbios e com distúrbios.
0.2 0.2
Junta 1 Junta 1
Junta 2 Junta 2
0.15 Junta 3 0.15 Junta 3
0.1 0.1
Torque (Nm)
Torque (Nm)
0.05 0.05
0 0
−0.05 −0.05
−0.1 −0.1
−0.15 −0.15
−0.2 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.13: Torque aplicado, configuração AAA, controle misto H2 /H∞ não linear:
sem distúrbios e com distúrbios .
74 Capı́tulo 5. Resultados experimentais
O controle misto H2 /H∞ não linear também apresentou bom desempenho, sendo
semelhante ao apresentado pelo controle H∞ não linear via teoria dos jogos.
θ1 = m1 lc21 = m2 lc22 ,
θ2 = m2 l12 ,
θ3 = m2 l1 lc2 ,
θ4 = m3 l12 = m3 l22 = m3 l1 l2 ,
θ5 = m3 lc23 ,
θ6 = m3 l1 lc3 = m3 l2 lc3 ,
θ7 = I 1 = I 2 ,
θ8 = I 3 ,
θ9 = f 1 ,
θ10 = f2 ,
θ11 = f3 .
40 40
Junta 1 Junta 1
Junta 2 Junta 2
30 Junta 3 30 Junta 3
Posição das juntas (graus) Desejada Desejada
10 10
0 0
−10 −10
−20 −20
−30 −30
−40 −40
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.14: Posição das juntas, configuração AAA, controle adaptativo H ∞ não
linear: sem distúrbios e com distúrbios.
Junta 1 Junta 1
60 Junta 2 60 Junta 2
Junta 3 Junta 3
Desejada Desejada
Velocidade angular (graus/s)
40 40
20 20
0 0
−20 −20
−40 −40
−60 −60
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.15: Velocidade angular das juntas, configuração AAA, controle adaptativo
H∞ não linear: sem distúrbios e com distúrbios.
0.2 0.2
Junta 1 Junta 1
Junta 2 Junta 2
0.15 Junta 3 0.15 Junta 3
0.1 0.1
Torque (Nm)
Torque (Nm)
0.05 0.05
0 0
−0.05 −0.05
−0.1 −0.1
−0.15 −0.15
−0.2 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.16: Torque aplicado, configuração AAA, controle adaptativo H ∞ não linear:
sem distúrbios e com distúrbios.
76 Capı́tulo 5. Resultados experimentais
n
X n
X n
X
xx = (qi − qid ) + (q̇i − q̇id ) − q̈i . (5.3)
i=1 i=1 i=1
com
exx−3 − e−xx+3
ξ11 = ξ21 = ξ31 = ,
exx−3 + e−xx+3
exx−2 − e−xx+2
ξ12 = ξ22 = ξ32 = xx−2 ,
e + e−xx+2
exx−1 − e−xx+1
ξ13 = ξ23 = ξ33 = xx−1 ,
e + e−xx+1
exx − e−xx
ξ14 = ξ24 = ξ34 = ,
exx + e−xx
exx+1 − e−xx−1
ξ15 = ξ25 = ξ35 = xx+1 ,
e + e−xx−1
exx+2 − e−xx−2
ξ16 = ξ26 = ξ36 = xx+2 ,
e + e−xx−2
exx+3 − e−xx−3
ξ17 = ξ27 = ξ37 = xx+3 .
e + e−xx−3
Note que, com essa definição, foram escolhidas 7 camadas escondidas para a rede
k
neural com os pesos wij assumindo os valores 1 ou −1 e os limiares mi os valores
−3, −2, −1, 0, 1, 2, 3. Os parâmetros da rede Θ são:
Θ
1
Θ = Θ2 ,
Θ3
com
40 40
Junta 1 Junta 1
Junta 2 Junta 2
30 Junta 3 30 Junta 3
Desejada Desejada
Posição das juntas (graus)
10 10
0 0
−10 −10
−20 −20
−30 −30
−40 −40
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.17: Posição das juntas, configuração AAA, controle adaptativo H ∞ não
linear com redes neurais: sem distúrbios e com distúrbios.
Junta 1 Junta 1
60 Junta 2 60 Junta 2
Junta 3 Junta 3
Desejada Desejada
Velocidade angular (graus/s)
40 40
20 20
0 0
−20 −20
−40 −40
−60 −60
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.18: Velocidade angular das juntas, configuração AAA, controle adaptativo
H∞ não linear com redes neurais: sem distúrbios e com distúrbios.
0.2 0.2
Junta 1 Junta 1
Junta 2 Junta 2
0.15 Junta 3 0.15 Junta 3
0.1 0.1
Torque (Nm)
Torque (Nm)
0.05 0.05
0 0
−0.05 −0.05
−0.1 −0.1
−0.15 −0.15
−0.2 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.19: Torque aplicado, configuração AAA, controle adaptativo H ∞ não linear
com redes neurais: sem distúrbios e com distúrbios.
5.3. Configuração APA 79
Controlador L2 [e
x] E[τ ] (Nms)
Controlador L2 [e
x] E[τ ] (Nms)
e q(tfAP A1 , tfAP A2 ) = [20◦ 20◦ 20◦ ]T . Os vetores tfAP A1 = [1.0 1.0]s e tfAP A2 =
[5.0 5.0]s referem-se aos tempos das trajetórias desejadas para as fases 1 e 2, respec-
tivamente. Para verificar a robustez do controlador, distúrbios externos no torque,
τd , do tipo senóide amortecida, iniciando em t = 0.3 s, foram introduzidos nas
juntas ativas 1 e 3. Para a simulação, os distúrbios utilizados foram:
0.04 Junta 1
Junta 2
Junta 3
0.02
Distúrbios externos (Nm)
−0.02
−0.04
−0.06
−0.08
−0.1
−0.12
0 1 2 3 4 5
Tempo (s)
h iT
ρ(e
xc ) = qe2 qe3
A(ρ(x)) = A(ρ(e
xc ))
B1 (ρ(x)) = B
B2 (ρ(x)) = B (5.4)
C1 (ρ(x)) = I4
C2 (ρ(x)) = 0
30 30
20
20
Posição das juntas (graus)
0
0
−10
−10
−20
Figura 5.21: Posição angular das juntas, configuração APA, controle quase-LPV por
realimentação do estado: simulação e experimento.
50 Junta 1
Junta 1 60
Junta 2 Junta 2
40 Junta 3
Junta 3
Desejada
Velocidade angular (graus/s)
Desejada
Velocidade angular (graus/s)
30 40
20
20
10
0 0
−10
−20
−20
−30 −40
−40
−60
−50
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.22: Velocidade angular angular das juntas, configuração APA, controle
quase-LPV por realimentação do estado: simulação e experimento.
0.1 Junta 1
Junta 1 0.6
Junta 2 Junta 2
Junta 3 Junta 3
0.4
0.05
0.2
Torque (Nm)
Torque (Nm)
0
0
−0.2
−0.05
−0.4
−0.1
−0.6
−0.8
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.23: Torque aplicado, configuração APA, controle quase-LPV por realimen-
tação do estado: simulação e experimento.
86 Capı́tulo 5. Resultados experimentais
Note que a matriz Mcc (q) na primeira fase de controle, Mcc (q) = [M22 (q) M23 (q);
M32 (q) M33 (q)], é função apenas das posições das juntas 2 e 3, que são as juntas
controladas nesta fase. Na segunda fase de controle a junta 2 está bloqueada e
Mcc (q) = [M11 (q) M13 (q); M31 (q) M33 (q)] é função apenas da posição da junta q3 ,
novamente uma junta controlada desta fase. O mesmo pode ser considerado para
a matriz Ccc (q, q̇). Portanto, as matrizes são funções apenas das juntas controladas
para as duas fases de controle da configuração APA.
1 0 4 0
Q1 = , Q2 = , Q12 = 0 e R = 3.5I2 .
0 3 0 3
30 30
20
20
Posição das juntas (graus)
0
0
−10
−10
−20
Figura 5.24: Posição angular das juntas, configuração APA, controle H ∞ não linear
via teoria dos jogos, controlador 1: simulação e experimento.
50 Junta 1
Junta 1 60
Junta 2 Junta 2
40 Junta 3
Junta 3
Desejada
Velocidade angular (graus/s)
Desejada
Velocidade angular (graus/s)
30 40
20
20
10
0 0
−10
−20
−20
−30 −40
−40
−60
−50
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.25: Velocidade angular das juntas, configuração APA, controle H∞ não
linear via teoria dos jogos, controlador 1: simulação e experimento.
0.1 0.5
Junta 1 Junta 1
Junta 2 0.4 Junta 2
Junta 3 Junta 3
0.05 0.3
0.2
Torque (Nm)
Torque (Nm)
0 0.1
−0.05 −0.1
−0.2
−0.1 −0.3
−0.4
−0.5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.26: Torque aplicado, configuração APA, controle H∞ não linear via teoria
dos jogos, controlador 1: simulação e experimento.
88 Capı́tulo 5. Resultados experimentais
20
Posição das juntas (graus)
10
−10
−20
Junta 1
−30 Junta 2
Junta 3
Desejada
−40
0 1 2 3 4 5
Tempo (s)
Figura 5.27: Posição angular das juntas, configuração APA, controle H ∞ não linear
via teoria dos jogos, controlador 2.
5.3. Configuração APA 89
Junta 1 Junta 1
60 Junta 2 0.5 Junta 2
Junta 3 Junta 3
Desejada 0.4
Torque (Nm)
20
0.1
0 0
−0.1
−20 −0.2
−0.3
−40 −0.4
−0.5
−60
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.28: Configuração APA, controle H∞ não linear via teoria dos jogos, con-
trolador 2: velocidade angular das juntas e torque aplicado.
Note que, para o controle H∞ não linear via teoria dos jogos, controlador 2
(quando se diminuiu o valor de γ para nı́veis próximos aos do controle quase-LPV),
há uma deterioração no posicionamento de junta 3, Figura 5.27, e um aumento no
torque aplicado, Figura 5.28, em comparação com o controlador 1. Portanto, um
melhor desempenho para o controle H∞ não linear via teoria dos jogos é encontrado
com valores de γ superiores ao controle quase-LPV. Tal observação poderia indicar
que o controle quase-LPV é mais robusto que o H∞ não linear via teoria dos jogos.
Entretanto, as equações em espaço de estados e os funcionais utilizados no projeto
de cada controlador são diferentes, o que torna impossı́vel uma comparação entre
os controladores considerando os valores de γ. Uma comparação quantitativa entre
estes controladores será feita no final desta seção, mediante a utilização dos ı́ndices
de desempenho descritos na Seção 5.1.
3 0
Q11 = 2I2 , Q22 = e Q12 = 0.
0 1
90 Capı́tulo 5. Resultados experimentais
e
7.59 0 11.38 0
0 7.59 0 3.79
T0 =
.
0 0 1 0
0 0 0 1
e
2.85 0 11.38 0
0 2.85 0 11.38
T0 =
.
0 0 1 0
0 0 0 1
30 30
25
20
Posição das juntas (graus) 20
0
−10
−5
−10 −20
Figura 5.29: Posição angular das juntas, configuração APA, controle misto H 2 /H∞ :
simulação e experimento.
50 Junta 1
Junta 1 60
Junta 2 Junta 2
40 Junta 3
Junta 3
Desejada
Velocidade angular (graus/s)
Desejada
Velocidade angular (graus/s)
30 40
20
20
10
0 0
−10
−20
−20
−30 −40
−40
−60
−50
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.30: Velocidade angular das juntas, configuração APA, controle misto
H2 /H∞ : simulação e experimento.
0.1 Junta 1
Junta 1
0.5 Junta 2
0.08 Junta 2
Junta 3 Junta 3
0.4
0.06
0.3
0.04 0.2
Torque (Nm)
Torque (Nm)
0.02 0.1
0 0
−0.1
−0.02
−0.2
−0.04
−0.3
−0.06
−0.4
−0.08 −0.5
−0.1
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.31: Torque aplicado, configuração APA, controle misto H2 /H∞ : simulação
e experimento.
92 Capı́tulo 5. Resultados experimentais
θ 1 = m1 lc21 = m2 lc22 ,
θ 2 = m3 l12 = m3 l22 = m3 l1 l2 ,
θ 3 = m3 lc23 ,
θ 4 = m3 l1 lc3 = m3 l2 lc3 ,
θ 5 = I1 = I2 ,
θ 6 = I3 ,
θ 7 = f1 ,
θ 8 = f3 .
θ1 = m1 lc21 = m2 lc22 ,
θ2 = m2 l12 ,
θ3 = m2 l1 lc2 ,
θ4 = m3 l12 = m3 l22 = m3 l1 l2 ,
θ5 = m3 lc23 ,
θ6 = m3 l1 lc3 = m3 l2 lc3 ,
θ7 = I 1 = I 2 ,
θ8 = I 3 ,
θ9 = f 1 ,
θ10 = f3 .
30 30
25
20
20
Posição das juntas (graus)
0
−10
−5
−10 −20
Figura 5.32: Posição das juntas, configuração APA, controle adaptativo H ∞ não
linear: simulação e experimento.
50 Junta 1
Junta 1 60
Junta 2 Junta 2
40 Junta 3
Junta 3
Desejada
Velocidade angular (graus/s)
Desejada
Velocidade angular (graus/s)
30 40
20
20
10
0 0
−10
−20
−20
−30 −40
−40
−60
−50
0 1 2 3 4 5 6 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.33: Velocidade angular das juntas, configuração APA, controle adaptativo
H∞ não linear: simulação e experimento.
0.1
Junta 1 Junta 1
0.08 Junta 2 Junta 2
Junta 3 0.4 Junta 3
0.06
0.04 0.2
Torque (Nm)
Torque (Nm)
0.02
0
0
−0.02 −0.2
−0.04
−0.4
−0.06
−0.08
−0.6
−0.1
0 1 2 3 4 5 6 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.34: Torque aplicado, configuração APA, controle adaptativo H ∞ não linear:
simulação e experimento.
5.3. Configuração APA 95
Como visto na Seção 4.2, no controle adaptativo H∞ não linear com redes neurais
para manipuladores subatuados deve-se controlar, em cada fase, uma junta passiva
utilizando uma junta ativa. Para a configuração APA, pode-se controlar a junta
passiva 2, aplicando torque na junta ativa 1. Nesta primeira fase, a junta ativa
3 é mantida bloqueada. Na segunda fase, controla-se as juntas 1 e 3, sendo o
manipulador considerado totalmente atuado pois, a junta passiva 2 já alcançou a
posição final desejada e está bloqueada. Para a primeira fase, a matriz D0 (q, q̇) deve
ser definida de tal forma que o termo D (q, q̇) − 1 M ˙ (q, q̇) seja anti-simétrico. Os
0 2 0
e
M11 (q)D22 (q, q̇)
D0 (q, q̇) = D12 (q, q̇) − , (5.6)
M21 (q)
com Mij (q) e Dij (q, q̇) sendo os ij-elementos das matrizes M0 (q) e D0 (q, q̇), respec-
tivamente. O termo D (q, q̇) − 1 M ˙ (q, q̇) é dado por:
0 2 0
Portanto, D12 e D21 são selecionados de forma a satisfazer esta condição, ou seja:
e
1 1 M22 (q)Ṁ21 (q, q̇)
D22 = Ṁ22 (q, q̇) − . (5.11)
2 2 M21 (q)
D23 = 0.
Desde que a junta 3 é mantida bloqueada nesta fase, a terceira linha de D0 (q, q̇)
não tem influência no sistema de controle, e por conveniência, pode ser definida
como a terceira linha de C0 (q, q̇).
com
sendo que ξi1 , · · · , ξi7 para i = 1, 2, 3 são definidos na Seção 5.2.6. Os parâmetros
da rede F (xeu , Θ), primeira fase, são dados por:
T
Θ = Θ12 Θ12 Θ13 Θ14 Θ15 Θ16 Θ17 ,
com
30 30
25
20
20
Posição das juntas (graus)
0
−10
−5
−10 −20
Figura 5.35: Posição das juntas, configuração APA, controle adaptativo H ∞ não
linear com redes neurais: simulação e experimento.
50 Junta 1
Junta 1 60
Junta 2 Junta 2
40 Junta 3
Junta 3
Desejada
Velocidade angular (graus/s)
Desejada
Velocidade angular (graus/s)
30 40
20
20
10
0 0
−10
−20
−20
−30 −40
−40
−60
−50
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.36: Velocidade angular das juntas, configuração APA, controle adaptativo
H∞ não linear com redes neurais: simulação e experimento.
0.1 Junta 1
Junta 1
0.3 Junta 2
0.08 Junta 2
Junta 3 Junta 3
0.2
0.06
0.1
0.04 0
Torque (Nm)
Torque (Nm)
0.02 −0.1
0 −0.2
−0.3
−0.02
−0.4
−0.04
−0.5
−0.06
−0.6
−0.08 −0.7
−0.1 −0.8
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 5.37: Torque aplicado, configuração APA, controle adaptativo H ∞ não linear
com redes neurais: simulação e experimento.
5.3. Configuração APA 99
Algumas diferenças também são observadas entre os gráficos com resultados si-
mulados e experimentais para as três técnicas. Os nı́veis dos torques aplicados no
caso experimental são maiores aos encontrados para o caso simulado, Figuras 5.23,
5.26 e 5.31. O mesmo pode ser observado com relação à posição angular mı́nima
alcançada pela junta 1 durante a primeira fase de controle.
Controlador L2 [e
x] E[τ ] (Nms)
A princı́pio três fases de controle são necessárias para controlar todas as juntas
até a posição final desejada. Entretanto, uma fase auxiliar pode ser necessária entre
as fases 1 e 2, se, ao final da fase 1, a junta ativa 2 estiver posicionada de tal
forma que ao realizar a fase 2, ela se desloque fora do espaço de trabalho dela.
5.4. Configuração PAP 101
Nesta fase auxiliar, a junta ativa 2 é controlada para retornar à posição inicial,
sendo o controlador o mesmo utilizado na fase 3. Os componentes do vetor tfP AP =
[tf1 tfa tf2 tf3 ] referem-se aos tempos das trajetórias desejadas para as fases 1, auxiliar
(quando necessária), 2 e 3, respectivamente.
h iT
ρ(e
xc ) = qe3 qė3
102 Capı́tulo 5. Resultados experimentais
0.04 Junta 1
Junta 2
Junta 3
0.02
−0.02
−0.04
−0.06
−0.08
−0.1
−0.12
0 1 2 3 4 5
Tempo (s)
A(ρ(x)) = A(ρ(e
xc ))
B1 (ρ(x)) = B
B2 (ρ(x)) = B (5.13)
C1 (ρ(x)) = I2
C2 (ρ(x)) = 0
f1 (ρ(e
xc )) = 1
f2 (ρ(e
xc )) = cos(e
q3 )
xc )) = cos(qė3 ).
f3 (ρ(e
atenuação mı́nimo encontrado foi γ = 2.0. Os valores das matrizes Xi são mostrados
no Apêndice C.
h iT
ρ= qe2 qė1
f1 (ρ(e
xc )) = 1
f2 (ρ(e
xc )) = cos(e
q2 )
xc )) = cos(qė1 ).
f3 (ρ(e
h iT
ρ= qe2 qė2
f1 (ρ(e
xc )) = 1
f2 (ρ(e
xc )) = cos(e
q2 )
xc )) = cos(qė2 ).
f3 (ρ(e
Q1 = 0.5, Q2 = 3, Q12 = 0 e R = 5.
30 30
20
20
Posição das juntas (graus) 10
0 −10
−20
−10
−30
−20 −40
−50
−30
Junta 1 −60 Junta 1
−40 Junta 2 Junta 2
Junta 3 −70 Junta 3
Desejada Desejada
−50 −80
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Figura 5.39: Posição angular das juntas, configuração PAP, controle quase-LPV por
realimentação do estado: simulação e experimento.
80 80
60
60
Velocidade angular (graus/s)
40
40
20
20
0
0 −20
−40
−20
−60
−40
Junta 1 −80 Junta 1
−60 Junta 2 Junta 2
Junta 3 −100 Junta 3
Desejada Desejada
−80 −120
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Figura 5.40: Velocidade angular das juntas, configuração PAP, controle quase-LPV
por realimentação do estado: simulação e experimento.
0.8
Junta 1 Junta 1
Junta 2 Junta 2
0.1 Junta 3 0.6 Junta 3
0.05 0.4
Torque (Nm)
Torque (Nm)
0.2
0
0
−0.05
−0.2
−0.1
−0.4
−0.15
−0.6
−0.2
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Figura 5.41: Torque aplicado, configuração PAP, controle quase-LPV por realimen-
tação do estado: simulação e experimento.
106 Capı́tulo 5. Resultados experimentais
Q1 = 1, Q2 = 2.2, Q12 = 0 e R = 5.
30 30
20
20
Posição das juntas (graus) 10
0 −10
−20
−10
−30
−20 −40
−50
−30
Junta 1 −60 Junta 1
−40 Junta 2 Junta 2
Junta 3 −70 Junta 3
Desejada Desejada
−50 −80
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Figura 5.42: Posição angular das juntas, configuração PAP, controle H∞ não linear
via teoria dos jogos: simulação e experimento.
80 80
60
60
Velocidade angular (graus/s)
40
40
20
20
0
0 −20
−40
−20
−60
−40
Junta 1 −80 Junta 1
−60 Junta 2 Junta 2
Junta 3 −100 Junta 3
Desejada Desejada
−80 −120
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Figura 5.43: Velocidade angular das juntas, configuração PAP, controle H∞ não
linear via teoria dos jogos: simulação e experimento.
0.8
Junta 1 Junta 1
Junta 2 Junta 2
0.1 Junta 3 0.6 Junta 3
0.05 0.4
Torque (Nm)
Torque (Nm)
0.2
0
0
−0.05
−0.2
−0.1
−0.4
−0.15
−0.6
−0.2
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Figura 5.44: Torque aplicado, configuração PAP, controle H∞ não linear via teoria
dos jogos: simulação e experimento.
108 Capı́tulo 5. Resultados experimentais
Controlador L2 [e
x] E[τ ] (Nms)
109
110 Capı́tulo 6. Controles Markovianos aplicados ao robô UArm II
25 Junta 1
Junta 1 0.15
Junta 2 Junta 2
Junta 3 Junta 3
20 Desejada
Posição das juntas (graus) 0.1
15
Torque (Nm)
0.05
10
0
5
−0.05
0
−0.1
−5
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
Tempo (s) Tempo (s)
Junta 1 0.15
Junta 1
25 Junta 2 Junta 2
Junta 3 Junta 3
Desejada
Posição das juntas (graus)
0.1
20
Torque (Nm)
15 0.05
10
0
−0.05
0
−5 −0.1
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
Tempo (s) Tempo (s)
Figura 6.2: Reconfiguração em movimento, controle H∞ via teoria dos jogos: posição
das juntas e torques.
25 0.25
Junta 1 Junta 1
Junta 2 0.2 Junta 2
20 Junta 3 Junta 3
Desejada 0.15
Posição das juntas (graus)
15 0.1
Torque (Nm)
0.05
10
0
−0.05
5
−0.1
0 −0.15
−0.2
−5
−0.25
−10
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Junta 1 0.25
25 Junta 1
Junta 2 Junta 2
Junta 3 0.2
Junta 3
20 Desejada
Posição das juntas (graus)
0.15
15 0.1
Torque (Nm)
10 0.05
0
5
−0.05
0
−0.1
−5
−0.15
−10 −0.2
−15 −0.25
0 2 4 6 8 10 0 2 4 6 8 10
Tempo (s) Tempo (s)
Figura 6.4: Reconfiguração com freios, controle H∞ via teoria dos jogos: posição
das juntas e torques.
Sistemas Markovianos discretos são uma classe particular de sistemas que variam
no tempo de maneira aleatória [HOEL et al. (1987)]. Considere que no instante de
tempo k um sistema desconhecido se encontra na configuração i, e deseja-se saber
qual é a probabilidade de, no instante k + 1, o sistema estar na configuração j. A
principal caracterı́stica dos sistemas Markovianos é que a probabilidade do sistema
estar na configuração j no instante seguinte depende apenas da configuração em que
o sistema se encontra, independentemente do instante de tempo considerado. Sempre
que o sistema estiver na configuração i, a probabilidade dele estar na configuração
j no instante seguinte é pij .
e observe que a soma de cada uma das linhas de P deve ser igual a 1.
são chamados saltos Markovianos. O registro dos estados pelos quais o sistema
passou origina o que se denomina cadeia de Markov, e é representada por Θ. Um
exemplo de cadeia de Markov para o sistema representado na Figura 6.5 poderia ser
Θ = [1, 1, 3, 2, 2, 1, 3, 3, 2, · · · ] (6.2)
com b0 (q, q̇) = C 0 (q, q̇)q̇c + D 0 (q, q̇)q̇r + F 0 (q, q̇) + G0 (q). O manipulador total-
mente atuado (3.2) pode ser representado pela Equação (6.3), considerando q c = q,
M 0 (q) = M0 (q) e b0 (q, q̇) = b0 (q, q̇) = C0 (q, q̇)q̇ + F0 (q̇) + G0 (q).
ė = Āe
x x + B̄τ + B̄ δ̄(q, q̇, q̈) (6.4)
sendo
0 I
Ā =
∂
−1 −1 ∂
,
− ∂q M 0 (q)b0 (q, q̇) −M 0 (q) ∂ q̇ b0 (q, q̇)
(q0 ,q̇0 )
0
B̄ = ,
−1
M 0 (q)
(q0 )
qd − q
e =
x
d
q̇ − q̇
ė = Ae
x x + Bu + B δ̄(q, q̇, q̈)
e + Du,
z = C1 x (6.5)
e,
y = C2 x
com
0 I
A= h i ,
∂ −1 −1 −1 ∂
− ∂q M 0 (q)b0 (q, q̇) + M 0 (q)KP −M 0 (q) ∂ q̇ b0 (q, q̇) − KD
(q0 ,q̇0 )
αI 0
B = B̄, C1 = ,
0 0
0 I 0
D= , C2 = ,
βI 0 0
ex(k) + Bu(k)
e(k + 1) = Ae
x e e δ̄(k)
+B
(6.6)
z(k) e1 x
= C e
e(k) + Du(k).
Neste trabalho, o espaço de trabalho de cada junta foi dividido em dois setores,
com ν = 10◦ (o experimento realizado busca posicionar cada junta em 20◦ , iniciando
na posição 0◦ ). Para cada setor, um ponto foi definido, sendo, 5◦ para a primeiro
setor e 15◦ para o segundo. Todas as possibilidades de posicionamento das três
juntas, q1 , q2 , q3 , nestes dois pontos são usadas para mapear o espaço de trabalho do
manipulador. Portanto, oito pontos de linearização, com as velocidades consideradas
nulas, foram obtidos e são mostrados na lado direito da Tabela (6.3).
Considera-se neste trabalho que duas ou mais falhas não ocorrem simultanea-
mente. Para um robô manipulador com três juntas, sete configurações podem ser
alcançadas após a ocorrência de falhas: AAP, APA, PAA, APP, PAP, PPA e PPP.
Fase 1 Fase 2
AAP 1, 3 1, 2
APA 2, 3 1, 3
PAA 1, 3 2, 3
1 e 2, mantêm-se freadas as juntas passivas que não são controladas. A Tabela 6.2
mostra as juntas controladas nas três fases para cada configuração. A primeira fase
é denotada pelo subscrito u1; a segunda fase pelo subscrito u2; e terceira fase pelo
subscrito l. Por exemplo, para a configuração PPA tem-se as fases PPAu1 , PPAu2 e
PPAl .
Denota-se aqui as configurações com pelo menos uma junta ativa (AAA, AAP,
APA, PAA, APP, PAP e PPA) como configurações controláveis, visto que na con-
figuração PPP não é possı́vel o posicionamento que nenhuma das juntas.
n−1
X
TM S = nlp × ( (ncpi × nf ci ) + 1) + 1,
i=1
118 Capı́tulo 6. Controles Markovianos aplicados ao robô UArm II
n!
sendo nf ci = i!(n−i)!
o número de possı́veis configurações controláveis quando i falhas
n
ocorrem, ncpi = ceil( n−i ) o número de fases de controle para uma configuração
controlável com i falhas (ceil(x) é o inteiro imediatamente superior ou igual a x) e
nlp o número de pontos de linearização.
Nos experimentos realizados neste trabalho, duas seqüências de falhas são con-
sideradas: seqüência AAA-APA e seqüência AAA-PAA-PAP.
1 9 17 5 5 5 0 0 0
2 10 18 15 5 5 0 0 0
3 11 19 5 15 5 0 0 0
4 12 20 15 15 5 0 0 0
5 13 21 5 5 15 0 0 0
6 14 22 15 5 15 0 0 0
7 15 23 5 15 15 0 0 0
8 16 24 15 15 15 0 0 0
De acordo com as Tabelas 6.1 e 6.2, o vetor das juntas controladas, qc , é se-
lecionado como qc = [ q1 q3 ]T para a fase PAAu ; qc = [ q2 q3 ]T para a fase
PAAl ; qc = q1 para a fase PAPu1 ; qc = q3 para a fase PAPu2 ; e qc = q2 para a fase
PAPl . Define-se seis conjuntos de estados Markovianos referentes às fases AAA,
PAAu , PAAl , PAPu1 , PAPu2 e PAPl . Para esta seqüência de falhas, têm-se 48 esta-
dos Markovianos, Tabela 6.4, portanto, a dimensão da matriz de probabilidades de
transição P é 48 × 48. De forma análoga à seção anterior, a matriz P é particionada
em 36 sub-matrizes de dimensão 8×8, mostradas na Equação (6.8). As sub-matrizes
P0 , Pf e Ps são as mesmas utilizadas na Seção 6.4.
PAAA Pf P0 Pf P0 P0
P0 PP AAu Ps Pf P0 P0
P0 Ps PP AAl P0 Pf P0
P =
.
(6.8)
P0 P0 P0 PP APu1 Ps P0
P0 P0 P0 Ps PP APu2 Ps
P0 P0 P0 Ps Ps PP APl
1 9 17 25 33 41 5 5 5 0 0 0
2 10 18 26 34 42 15 5 5 0 0 0
3 11 19 27 35 43 5 15 5 0 0 0
4 12 20 28 36 44 15 15 5 0 0 0
5 13 21 29 37 45 5 5 15 0 0 0
6 14 22 30 38 46 15 5 15 0 0 0
7 15 23 31 39 47 5 15 15 0 0 0
8 16 24 32 40 48 15 15 15 0 0 0
6.6. Controles Markovianos por realimentação do estado 123
Define-se o operador
E(.) = E1 (.), . . . , EN (.) ∈ B(Rn ),
e para V = (V1 , . . . , VN ) ∈ Hn ,
N
X
Ei (V ) = pij Vj .
j=1
Denota-se por l2r o espaço de Hilbert formado pela seqüência de variáveis aleatórias
de segunda ordem w = w(0), w(1), . . . com w(k) ∈ Rr tais que
∞
X
kwk22 = kw(k)k22 < ∞,
k=0
124 Capı́tulo 6. Controles Markovianos aplicados ao robô UArm II
sendo
kw(k)k22 = E(kw(k)k2 ).
T
sujeito a (6.9) com w = 0, L = (L1 , . . . , LN ) ∈ Hm,n , Q = (Q1 , . . . , QN ) ∈ Hn , e
T
R = (R1 , . . . , RN ) ∈ Hm . Assume-se que Qi e Ri , i ∈ S, são hermitianas.
−1
Fi = − BiT Ei (X)Bi + Ri BiT Ei (X)Ai + LTi (6.11)
6.6. Controles Markovianos por realimentação do estado 125
T
e X = (X1 , . . . , XN ) ∈ Hn a solução das equações de Riccati acopladas abaixo,
para i ∈ S, como mostrado em [COSTA E MARQUES (2000)]:
−1
−Xi +ATi Ei (X)Ai +Qi − ATi Ei (X)Bi +Li BiT Ei (X)Bi +Ri BiT Ei (X)Ai +LTi = 0.
kZ(Θ0 , w)k2
kZ(Θ0 , .)k = sup . (6.12)
w∈l2r kwk2
1 T
i) I − W Ei (X)Wi > 0 para i = 1, . . . , N. (6.13)
γ2 i
h i
ii) Xi = Qi + ATi Ei (X)Ai
− ATi Ei (X)Bi 1
γ
Wi
−1
I 0 BiT h i BiT
+ Ei (X) Bi 1 Wi Ei (X)Ai
1 T γ 1 T
0 −I γ
W i γ
W i
T
1
= Qi + FiT Fi − GTi Gi + Ai + Bi Fi + Wi Gi Ei (X)
γ
1
A i + B i Fi + Wi G i ,
γ
126 Capı́tulo 6. Controles Markovianos aplicados ao robô UArm II
−1
1 T 1 T
Fi = − I + BiT Ei (X)Bi
+ 2 Bi Ei (X)Wi I − 2 Wi Ei (X)Wi
γ γ
! −1 !
1 1
WiT Ei (X)Bi −1 BiT I + 2 Ei (X)Wi I − 2 WiT Ei (X)Wi WiT Ei (X)Ai
γ γ
T −1 T 1
= − (I + Bi Ei (X)Bi ) Bi Ei (X) Ai + Wi Gi , (6.14)
γ
−1
1 T 1 T T −1 T
Gi = I − 2 Wi Ei (X)Wi + 2 Wi Ei (X)Bi (I + Bi Ei (X)Bi ) Bi Ei (X)Wi
γ γ
1 T T −1 T
W (I − Ei (X)Bi (I + Bi Ei (X)Bi ) Bi )Ei (X)Ai
γ2 i
−1
1 T 1 T
= I − 2 Wi Ei (X)Wi W Ei (X)(Ai + Bi Fi ). (6.15)
γ γ i
iii) rσ (L) < 1, sendo L(.) = (L1 (.), . . . , LN (.)) é definido como:
T
1 1
Li (.) = A i + B i Fi + Wi G i Ei (.) Ai + Bi Fi + Wi Gi (6.16)
γ γ
para i = 1, . . . , N .
Suponha que (C, A) seja detectável na média quadrática e que γ > 0 seja um
número real fixado. Se existirem X = (X1 , . . . , XN ) ≥ 0 e F = (F1 , . . . , FN ) ∈ Hn,m
6.6. Controles Markovianos por realimentação do estado 127
tais que
1
−Xi + (Ai + Bi Fi )T Ei (X)(Ai + Bi Fi ) + (Ci + Di Fi )T (Ci + Di Fi ) + 2
Xi W W T Xi ≤ 0,
γ
(6.17)
para i ∈ S, então F = (F1 , . . . , FN ) estabiliza o sistema (6.9) na média quadrática
[COSTA E MARQUES (1998)], e
sendo que !
N
1 X
δ∈ 0, 2 tr{W T Xi W } . (6.20)
γ i=1
sujeito a
Qi Qi ATi + YiT BiT Qi MiT YiT JiT D
A i Q i + B i Yi Li 0 0 0
Mi Q i 0 In 0 0 ≥ 0, (6.24)
Ji Y i 0 0 In 0
DT 0 0 0 γ 2 Ir
Li Li Γti
≥ 0, (6.25)
ΓtT
i L i diag{Q}
X I
i ≥ 0, (6.26)
I Qi
N
X
λii (t) = − λij (t),
j=1,j6=i
N
X
min µi T r(Zi ) (6.32)
i=1
sujeito a
Ai Yi + Yi ATi + Bi Fi + FiT BiT + λii Yi Yi C1i
T
+ FiT D1i
T
Ri (Y )
C1i Yi + D1i Fi −I 0 < 0, (6.33)
RiT (Y ) 0 Si (Y )
Yi I Ei
I Xi Xi Ei + Li D2i > 0, (6.34)
EiT EiT Xi + D2i
T T
Li Zi
N
X
ATi Xi + Xi Ai + Li C2i + T T
C2i Li + T
C1i C1i + λij Xj < 0, i = 1, · · · , N, (6.35)
j=1
sendo
hp q q p i
Ri (Y ) = λ1i Yi · · · λ(i−1)i Yi , λ(i+1)i Yi · · · λ1N Yi
6.7. Controles Markovianos por realimentação da saı́da 131
e
Si (Y ) = −diag(Y1 · · · Yi−1 , Yi+1 · · · YN ),
Cci = Fi Yi−1
sendo
N
X
Mi = −ATi − Xi Ai Yi − Xi Bi Fi − Li C2i Yi − T
C1i (C1i Yi + D1i Fi ) − λij Yj−1 Yi .
j=1
Cci = Fi Yi−1
sendo
Estes distúrbios consistem de funções normais com oscilações senoidais, Figura 6.7.
0.025
Junta 1
0.02 Junta 2
Junta 3
0.015
Disturbios externos (Nm)
0.01
0.005
−0.005
−0.01
−0.015
−0.02
−0.025
0 1 2 3 4 5 6
Tempo (s)
−1.10 −0.05 −0.07 −0.01
KPAP Au = , KDAP Au = ,
−0.07 0.7 −0.04 0.06
1.25 0.19 0.27 0.02
KPAP Al = e KDAP Al = .
0.06 0.29 0.01 0.01
eT D
na Seção 6.3, satisfazem as condições C e = 0 e D
eT D
e = I do controlador H∞
1
L2 [e
x] E[τ ] (Nms)
−0.5 0 −0.01 0
KPP AAu = , KDP AAu = ,
0 0.2 0 0.05
1 0 0.01 0
KPP AAl = , KDP AAl = ,
0 1 0 0.01
25
Junta 1
Junta 2
Junta 3
Posição das juntas (graus) 20 Desejada
15
10
−5
0 1 2 3 4 5 6
Tempo (s)
25
APAl
20
Cadeia de Markov
15
APAu
10
5 AAA
0
0 1 2 3 4 5 6
Tempo (s)
70 0.25
Junta 1 Junta 1
60 Junta 2 0.2 Junta 2
Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
50 0.15
40 0.1
Torque (Nm)
30 0.05
20 0
10 −0.05
0 −0.1
−10 −0.15
−20 −0.2
−30 −0.25
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Tempo (s) Tempo (s)
25
Junta 1
Junta 2
Junta 3
20 Desejada
10
−5
0 1 2 3 4 5 6
Tempo (s)
25
APAl
20
Cadeia de Markov
15
APAu
10
5 AAA
0
0 1 2 3 4 5 6
Tempo (s)
70 0.25
Junta 1 Junta 1
60 Junta 2 0.2 Junta 2
Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
50 0.15
40 0.1
Torque (Nm)
30 0.05
20 0
10 −0.05
0 −0.1
−10 −0.15
−20 −0.2
−30 −0.25
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Tempo (s) Tempo (s)
25
Junta 1
Junta 2
Junta 3
Posição das juntas (graus) 20 Desejada
15
10
−5
0 1 2 3 4 5 6
Tempo (s)
25
APAl
20
Cadeia de Markov
15
APAu
10
5 AAA
0
0 1 2 3 4 5 6
Tempo (s)
Figura 6.12: Seqüência AAA-APA, controle Markoviano misto H2 /H∞ por reali-
mentação do estado, posições das juntas e cadeia de Markov.
70 0.25
Junta 1 Junta 1
60 Junta 2 0.2 Junta 2
Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
50 0.15
40 0.1
Torque (Nm)
30 0.05
20 0
10 −0.05
0 −0.1
−10 −0.15
−20 −0.2
−30 −0.25
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Tempo (s) Tempo (s)
Figura 6.13: Seqüência AAA-APA, controle Markoviano misto H2 /H∞ por reali-
mentação do estado, velocidades angulares e torques.
6.8. Resultados Experimentais 139
25
Junta 1
Junta 2
Junta 3
20 Desejada
10
−5
0 1 2 3 4 5 6
Tempo (s)
25
APAl
20
Cadeia de Markov
15
APAu
10
5 AAA
0
0 1 2 3 4 5 6
Tempo (s)
70 0.25
Junta 1 Junta 1
60 Junta 2 0.2 Junta 2
Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
50 0.15
40 0.1
Torque (Nm)
30 0.05
20 0
10 −0.05
0 −0.1
−10 −0.15
−20 −0.2
−30 −0.25
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Tempo (s) Tempo (s)
25
Junta 1
Junta 2
Junta 3
Posição das juntas (graus) 20 Desejada
15
10
−5
0 1 2 3 4 5 6
Tempo (s)
25
APAl
20
Cadeia de Markov
15
APAu
10
5 AAA
0
0 1 2 3 4 5 6
Tempo (s)
70 0.25
Junta 1 Junta 1
60 Junta 2 0.2 Junta 2
Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
50 0.15
40 0.1
Torque (Nm)
30 0.05
20 0
10 −0.05
0 −0.1
−10 −0.15
−20 −0.2
−30 −0.25
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Tempo (s) Tempo (s)
Os valores de L2 [e
x] e E[τ ] para a seqüência de falhas AAA-PAA-PAP são mostra-
dos na Tabela 6.6.
L2 [e
x] E[τ ] (Nms)
30
20
10
−10
−20
−30
−40
Junta 1
−50 Junta 2
Junta 3
−60 Desejada
0 1 2 3 4 5 6 7 8 9
Tempo (s)
50
45 PAPl
40
PAPu2
35
Cadeia de Markov
30
PAPu1
25
20 PAAl
15
PAAu
10
5 AAA
0
0 1 2 3 4 5 6 7 8 9
Tempo (s)
80 0.25
Junta 1 Junta 1
Junta 2 0.2 Junta 2
60 Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
0.15
40
0.1
Torque (Nm)
20
0.05
0 0
−20 −0.05
−0.1
−40
−0.15
−60
−0.2
−80
−0.25
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9
Tempo (s) Tempo (s)
30
20
10
Posição das juntas (graus)
−10
−20
−30
−40
Junta 1
−50 Junta 2
Junta 3
−60 Desejada
0 1 2 3 4 5 6 7 8 9
Tempo (s)
50
45 PAPl
40
PAPu2
35
Cadeia de Markov
30
PAPu1
25
20 PAAl
15
PAAu
10
5 AAA
0
0 1 2 3 4 5 6 7 8 9
Tempo (s)
80 0.25
Junta 1 Junta 1
Junta 2 0.2 Junta 2
60 Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
0.15
40
0.1
Torque (Nm)
20
0.05
0 0
−20 −0.05
−0.1
−40
−0.15
−60
−0.2
−80
−0.25
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9
Tempo (s) Tempo (s)
30
20
10
−10
−20
−30
−40
Junta 1
−50 Junta 2
Junta 3
−60 Desejada
0 1 2 3 4 5 6 7 8 9
Tempo (s)
50
45 PAPl
40
PAPu2
35
Cadeia de Markov
30
PAPu1
25
20 PAAl
15
PAAu
10
5 AAA
0
0 1 2 3 4 5 6 7 8 9
Tempo (s)
80 0.25
Junta 1 Junta 1
Junta 2 0.2 Junta 2
60 Junta 3 Junta 3
Desejada
Velocidade angular (graus/s)
0.15
40
0.1
Torque (Nm)
20
0.05
0 0
−20 −0.05
−0.1
−40
−0.15
−60
−0.2
−80
−0.25
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9
Tempo (s) Tempo (s)
20
0
Posição das juntas (graus)
−20
−40
−60
Junta 1
−80 Junta 2
Junta 3
Desejada
−100
0 1 2 3 4 5 6 7 8 9
Tempo (s)
50
45 PAPl
40
PAPu2
35
Cadeia de Markov
30
PAPu1
25
20 PAAl
15
PAAu
10
5 AAA
0
0 1 2 3 4 5 6 7 8 9
Tempo (s)
80 0.25
Junta 1
0.2 Junta 2
60
Junta 3
Velocidade angular (graus/s)
0.15
40
0.1
20
Torque (Nm)
0.05
0
0
−20
−0.05
−40 −0.1
30
20
10
−10
−20
−30
−40
−50
−60 Junta 1
Junta 2
−70 Junta 3
Desejada
−80
0 1 2 3 4 5 6 7 8 9
Tempo (s)
50
45 PAPl
40
PAPu2
35
Cadeia de Markov
30
PAPu1
25
20 PAAl
15
PAAu
10
5 AAA
0
0 1 2 3 4 5 6 7 8 9
Tempo (s)
80 0.25
Junta 1
0.2 Junta 2
60
Junta 3
Velocidade angular (graus/s)
0.15
40
0.1
20
Torque (Nm)
0.05
0
0
−20
−0.05
−40 −0.1
149
Capı́tulo 7
Introdução
151
152 Capı́tulo 7. Introdução
acima são satisfeitas, as forças aplicadas podem ser decompostas entre as forças que
promovem o movimento do objeto, chamadas forças de movimento, e as forças de
esmagamento, que não contribuem para o movimento, mas podem provocar danos
ao objeto e aos efetuadores. Portanto, a minimização dos efeitos da força de esmaga-
mento deve ser sempre considerada no projeto de controladores para robôs mani-
puladores cooperativos. Entretanto, o movimento dos manipuladores provoca es-
magamento devido ao componente de esmagamento da força inercial de d’Alembert.
Estas forças de esmagamento provocadas pelo movimento tornam-se nulas quando
a velocidade dos manipuladores convergem para zero [TINóS (2003)].
Quando uma ou mais juntas de sistema robótico cooperativo são passivas, diz-se
que os robôs manipuladores cooperativos são subatuados. Poucas pesquisas foram
realizadas considerando o controle deste tipo de robô manipulador [BERGERMAN
et al. (1997); LIU E XU (1997); LIU et al. (1999); TINóS (2003)]. Controladores
robustos utilizando a linearização por realimentação de estados foram propostos
em [BERGERMAN et al. (1997); LIU E XU (1997)]. Em [LIU et al. (1999)],
considerou-se que o sistema cooperativo é formado por dois manipuladores e o
número de juntas ativas (na ) é igual ou superior ao número de coordenadas de
posição do objeto (n). Dois controladores foram propostos: o primeiro é baseado
no controle proporcional-derivativo clássico com compensação dos termos gravita-
cionais, neste caso o controle das forças de esmagamento não é considerado; o se-
gundo é baseado no procedimento de redução de ordem proposto em [MCCLAM-
ROCH E WANG (1988)] com a utilização de na − n juntas para o controle das forças
de esmagamento. Entretanto, neste caso o controle do movimento está acoplado
ao controle de esmagamento, o que não garante a estabilidade do sistema [TINóS
153
(2003)].
155
156 Capı́tulo 8. Modelo dinâmico de robôs manipuladores cooperativos
q̇i = (∂Ωi (xo ))/(∂xo )ẋo = −Ji−1 (xo , Ωi (xo ))Joi (xo , Ωi (xo ))ẋo ,
xo xo
q1 Ω1 (xo ) In
θ=
..
=
..
e θ̇ = ẋo ≡ B(xo )ẋo , (8.1)
. . −J −1 (xo )Jo (xo )
qk Ωk (xo )
sendo
J1 (xo , Ω1 (xo )) 0 ··· 0
0 J2 (xo , Ω2 (xo )) 0
J(xo ) =
.. .. ..
. . .
0 0 · · · Jk (xo , Ωk (xo ))
e
J (x , Ω (x ))
o1 o 1 o
Jo2 (xo , Ω2 (xo ))
Jo (xo ) =
..
.
.
Jok (xo , Ωk (xo ))
8.1. Robôs manipuladores cooperativos totalmente atuados 157
k
X
Mo (xo )ẍo + Co (xo , ẋo )ẋo + Go (xo ) = JoTi (xo , Ωi (xo ))hi = JoT (xo )h, (8.2)
i=1
sendo Mo (xo ) a matriz de inércia, Co (xo , ẋo ) a matriz dos termos centrı́fugos e de
Coriolis, Go (xo ) o vetor dos termos gravitacionais do objeto e h = [hTi · · · hTk ]T , com
hi ∈ <n a força aplicada no objeto pelo efetuador do robô i.
Mi (qi )q̈i + Ci (qi , q̇i )q̇i + Gi (qi ) = τi + JiT (xo , Ωi (xo ))hi , (8.3)
sendo Mi (qi ) a matriz de inércia, Ci (qi , q̇i ) a matriz dos termos centrı́fugos e de
Coriolis, Gi (qi ) o vetor dos termos gravitacionais e τi o vetor dos torques aplicados
no robô i.
sendo
Mo (xo ) 0 ··· 0
0 M1 (q1 ) 0
M (θ) =
.. .. ..
,
. . .
0 0 · · · Mk (qk )
Co (xo , ẋo ) 0 ··· 0
0 C1 (q1 , q̇1 ) 0
C(θ, θ̇) =
.. .. ..
,
. . .
0 0 · · · Ck (qk , q̇k )
158 Capı́tulo 8. Modelo dinâmico de robôs manipuladores cooperativos
G (x ) τ1
o o
G1 (q1 ) τ2
G(θ) =
..
e τ =
..
.
. .
Gk (qk ) τk
T
ho = Joq (xo )h,
sendo
Jo1 (xo , Ω1 (xo )) 0 ··· 0
0 Jo2 (xo , Ω2 (xo )) 0
Joq (xo ) =
.. .. ..
.
. . .
0 0 · · · Jok (xo , Ωk (xo ))
Portanto, a força resultante no objeto hro = JoT (xo )h pode ser reescrita como:
hro = AT Joq
T
(xo )h = AT ho ,
−1
e a Jacobiana A(xo ) = [A Joq (xo )J(xo )]. A dinâmica do sistema cooperativo fica:
T
M (θ)θ̈ + C(θ, θ̇)θ̇ + G(θ) = τv + A (xo )hoE . (8.6)
T
M (xo )B(xo )ẍo + M (xo )Ḃ(xo ) + C(xo , ẋo )B(xo ) ẋo + G(xo ) = τv + A (xo )hoE .
(8.8)
T
cooperativo torna-se independente da força interna, pois B T (xo )A (xo )hoE = 0.
Portanto, tem-se:
M (xo )ẍo + C(xo , ẋo )ẋo + G(xo ) = τ v , (8.9)
sendo
M (xo ) = B T (xo )M (xo )B(xo ),
C(xo , ẋo ) = B T (xo )M (xo )Ḃ(xo ) + B T (xo )C(xo , ẋo )B(xo ),
G(xo ) = B T (xo )G(xo )
τ v = B T (xo )τv .
sendo qa ∈ <na o vetor de posição das juntas ativas, qp ∈ <np o vetor de posição das
juntas passivas e JAP (xo ) a matriz Jacobiana entre as velocidades das juntas ativas
e passivas e as velocidades dos efetuadores dos manipuladores. A matriz JAP (xo )
pode ser obtida através de uma matriz de permutação PAP ortogonal [TINóS (2003)].
Assim, se:
q1
qa q2
qe = = PAP ,
..
qp .
qk
sendo
M (q ) · · · 0
Maa (e
q ) Map (e
q) 1 1
.. .. .. T
q) =
MAP (e = PAP . . . PAP ,
Mpa (e
q ) Mpp (e
q)
0 · · · Mk (qk )
C (q , q̇ ) · · · 0
Caa (e ė Cap (e
q , q) ė
q , q) 1 1 1
.. .. .. T
CAP (e ė =
q , q) = PAP . . . PAP
Cpa (e ė Cpp (e
q , q) ė
q , q)
0 · · · Ck (qk , q̇k )
e
G1 (q1 )
Ga (e
q)
..
GAP = = PAP . .
Gp (e
q)
Gk (qk )
cooperativo fica:
Mo (xo ) 0 Co (xo , ẋo ) 0 Go (xo )
ë
θ+ ė
θ+ eT (xo )hoE .
= τ v +A
0 MAP (e
q) 0 CAP (e ė
q , q) GAP (e
q)
(8.13)
sendo
Mo (xo ) 0
f(xo ) = B
M e T (xo ) e o ),
B(x
0 MAP (e
q)
Mo (xo ) 0
e o , ẋo ) = B
C(x e T (xo ) ė o )+
B(x
0 MAP (e
q)
Co (xo , ẋo ) 0
e T (xo )
+B e o ),
B(x
0 CAP (e ė
q , q)
Go (xo )
e o) = B
G(x e T (xo ) ,
GAP (e
q)
e T (xo )τv .
τev = B
8.3. Controle das forças de esmagamento 163
sendo
τE = D T (xo )hoE , (8.16)
com Z
hoE = hdoE + Ki (hdoE − hoE )dt ,
Jo−1 (xo , Ω1 (xo ))J1 (xo , Ω1 (xo )) ··· 0
1
.. .. ..
D(xo ) = . . . ,
0 · · · Jo−1
k
(xo , Ωk (xo ))Jk (xo , Ωk (xo ))
Para o sistema com juntas passivas, (8.16) pode ser particionada como:
τEa DaT (xo )
= bT λE ,
A (8.17)
0 DpT (xo )
sendo [Da (xo ) Dp (xo )] = D(xo )PAP . Note que np restrições são impostas nos com-
ponentes do vetor λE . Como os robôs manipuladores considerados aqui não são
redundantes, nem todos os componentes do vetor λE podem ser independentemente
controlados. O número de componentes do vetor λE que podem ser controlados é
dado por [TINóS (2003)]:
n(k − 1) − n = n − n se n > n
p a a
ne =
0 se na ≤ n
Z
d d
λEc = λEc + KiE (λEc − λEc )dt , (8.19)
sendo λdEc os valores desejados para λEc e KiE é uma matriz diagonal e positiva. O
8.3. Controle das forças de esmagamento 165
valor de λEn é calculado através das restrições impostas em (8.17) como função do
vetor λEc .
Portanto, o torque aplicado nas juntas ativas acrescido do controle das forças de
esmagamento é dado por:
+
T
A τv1
τa = τv2 − JaT (xo )Joq
−T
(xo ) + τEa ,
JpT (xo )Joq
−T
(xo ) τv3
sendo
bT λE ,
τEa = DaT (xo )A
167
168 Capı́tulo 9. Controle H∞ não linear para manipuladores cooperativos
c(xo ) e
Incertezas paramétricas podem ser introduzidas dividindo as matrizes M
b o , ẋo ), e o vetor G(x
C(x b o ) em uma parte nominal e uma perturbada:
c(xo )
M = c0 (xo ) + ∆M
M c(xo )
b o , ẋo ) = C
C(x b0 (xo , ẋo ) + ∆C(x
b o , ẋo )
b o)
G(x = b 0 (xo ) + ∆G(x
G b o ),
c0 (xo ), C
sendo M b0 (xo , ẋo ) e G
b 0 (xo ) os valores nominais, e ∆M
c(xo ), ∆C(x
b o , ẋo ) e
b o ) as incertezas paramétricas. Um distúrbio externo de energia finita, τd , pode
∆G(x
ser também introduzido. Após estas considerações (9.1) fica:
com
c(xo )ẍo + ∆C(x
τbd = (∆M b o , ẋo )ẋo + ∆G(x
b o ) − τd ).
sendo xdo e ẋdo ∈ <n a trajetória de referência desejada e sua correspondente veloci-
dade, respectivamente. Assume-se que as variáveis xdo , ẋdo e ẍdo (aceleração desejada)
satisfazem os limites fı́sicos e cinemáticos do sistema cooperativo.
ė = A(xo , ẋo )e
x x + Bu + Bw, (9.4)
9.2. Controle H∞ não linear via teoria dos jogos 169
com
c−1 (xo )C
−M b0 (xo , ẋo ) 0
0
A(xo , ẋo ) = ,
In 0
In
B = ,
0
w c0−1 (xo )b
= M τd ,
u c−1 (xo )(b
= M c0 (xo )ẍd − C
τv − M b0 (xo , ẋo )ẋo − G
b 0 (xo )).
0 o
c0 (xo )(ẍd + u) + C
τbv = M b0 (xo , ẋo )ẋd + G
b 0 (xo ). (9.5)
o o
c0 (xo ) = M
M c0 (e c0 (e
xo + xdo (t)) = M xo , t).
formação de estados:
ze1 T11 T12 ėo
x
ze = = T0 x
e= ,
ze2 0 I eo
x
sendo T1 = [T11 T12 ] com T11 , T12 ∈ <n×n matrizes constantes a serem determinadas.
Selecionando a entrada de controle como:
h i zė1
u= c0 (xo ) C
M b0 (xo , ẋo ) c0 (xo )T1 x
=M b0 (xo , ẋo )T1 x
ė + C e, (9.6)
ze1
ė = AT (e
x x, t)e
x + BT (e
x, t)u + BT (e
x, t)w, (9.7)
com
c−1 (xo )C
−M b0 (xo , ẋo ) 0
0
x, t) = T0−1
AT (e T0 ,
−1 −1
T11 −T11 T12
c0−1 (xo )
M
x, t) = T0−1
BT (e ,
0
c0 (xo )T11 M
w = M c0−1 (xo )b
τd .
c0 (xo )ẍc + C
τbv = M b0 (xo , ẋo )ẋo + G
b 0 (xo ), (9.8)
o
com
−1 c−1 b0 (xo , ẋo )B T T0 x
ẍco = ẍdo − T11
−1
ėo − T11
T12 x M0 (xo ) C e−u . (9.9)
sendo τv1 e τv2 partições do vetor τv = (B T (xo ))+ τbv , com B T (xo ) definido em (8.1),
9.2. Controle H∞ não linear via teoria dos jogos 171
e τbv definido em (9.5) e (9.8) para os controles via representação quase-LPV e via
teoria dos jogos, respectivamente.
(8.10), e τbv definido em (9.5) e (9.8) para os controles via representação quase-LPV
e via teoria dos jogos, respectivamente. λE é calculado por (8.18) e (8.19).
172 Capı́tulo 9. Controle H∞ não linear para manipuladores cooperativos
Capı́tulo 10
Resultados Experimentais
173
174 Capı́tulo 10. Resultados Experimentais
massa mo = 0.025 kg
comprimento lo = 0.092 m
distância entre efetuadores e centro de massa do objeto ao = 0.046 m
momento de inércia Io = 0.000023 kgm2
Distúrbios de torque foram introduzidos nas juntas dos manipuladores para ve-
rificar a robustez dos controladores:
(t−2.5)2
−
0.01e sin(4πt)
8
(t−2.5)2
τ d1 = −0.01e− 8 sin(5πt)
(t−2.5)2
−0.01e− 8 sin(6πt)
e
(t−2.5)2
−
0.02e 8 sin(4πt)
(t−2.5)2
τ d2 = 0.02e− 8 sin(5πt) .
(t−2.5)2
0.01e− 8 sin(6πt)
10.2. Configuração totalmente atuada 175
0.04
Robô 1
Robô 2
0.03
0.02
Distúrbio (N.m)
0.01
−0.01
−0.02
−0.03
−0.04
0 1 2 3 4 5
Tempo (s)
Além dos ı́ndices de desempenho L2 [x̃] e E[τ ], definidos na Seção 5.1, utiliza-se
o somatório das áreas das forças de esmagamento, E[hoE ], dado por:
nk Z
X tr
E[hoE ] = |hoE i (t)|dt ,
i=0 t0
sendo tr o tempo gasto para o objeto alcançar a posição desejada e hoE i (t) o compo-
nente i da força de esmagamento. Como os valores desejados das forças de esmaga-
mento são nulos, quanto menor o valor de E[hoE ], melhor será o controlador com
relação ao controle da força de esmagamento.
Para aplicar o algoritmo descrito na Seção 2.5, o sistema de controle do robô ma-
nipulador deve ser representado por (2.17). Escolhe-se como parâmetros os estados
representando os erros de posição do objeto, ou seja, m = 3 (coordenadas X e Y, e
orientação):
ρ(e eo .
x) = x
A(ρ(x)) = A(ρ(e
x))
B1 (ρ(x)) = B
B2 (ρ(x)) = B
C1 (ρ(x)) = I6
C2 (ρ(x)) = 0
C(xo , ẋo ).
f1 (ρ(e
x)) = 1,
f2 (ρ(e eoX ,
x)) = x
f3 (ρ(e eoY ,
x)) = x
f4 (ρ(e
x)) = cos(e
xoφ ),
10.2. Configuração totalmente atuada 177
eo = [e
sendo x eoY x
x oX x eoφ ], x
eoX e x
eoY os erros nas coordenadas X e Y do centro de
eoφ o erro de orientação do objeto. O espaço
massa do objeto, respectivamente, e x
dos parâmetros foi dividido em 3 pontos (L = 3). Cada um dos 27 sistemas lineares,
Lm , gerados pela combinação dos parâmetros ρ fornece 9 DMLs, 1 + 2m . Ou seja,
243 DMLs devem ser resolvidas simultaneamente para as variáveis Xi (veja Seção
2.8). O valor de atenuação mı́nimo encontrado foi γ = 1.25.
Percorrida
Desejada
0.4
Coordenada Y (m)
0.39
0.38
0.37
0.36
0.35
0.34
0.19 0.2 0.21 0.22 0.23 0.24 0.25 0.26
Coordenada X (m)
Figura 10.3: Configuração totalmente atuada, controle H∞ não linear via represen-
tação quase-LPV: Trajetória linear do centro de massa no plano X-Y.
0.45 5
Coordenada X Orientação
Coordenada Y 4 Desejada
Desejada
0.4
3
Orientação (graus)
2
Posição (m)
0.35
1
0.3 0
−1
0.25
−2
−3
0.2
−4
0.15 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.4: Configuração totalmente atuada, controle H∞ não linear via repre-
sentação quase-LPV: Posição do centro de massa do objeto, coordenadas X e Y, e
orientação do objeto.
0.04 5
Velocidade angular (graus/s)
2
0.02
1
0.01 0
−1
0
−2
−3
−0.01
−4
−0.02 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.5: Configuração totalmente atuada, controle H∞ não linear via represen-
tação quase-LPV: Velocidade do centro de massa do objeto, coordenadas X e Y, e
velocidade angular do objeto.
Posição das juntas − Robô 1 (graus)
90
Junta 1 Junta 1
Junta 2 Junta 2
150 Junta 3 Junta 3
80
100 70
60
50
50
0
40
−50
30
−100 20
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.6: Configuração totalmente atuada, controle H∞ não linear via represen-
tação quase-LPV: Posições angulares das juntas dos manipuladores 1 e 2.
10.2. Configuração totalmente atuada 179
0 −5
−10
−5
−15
−10
−20
−15
−25
−20 −30
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.7: Configuração totalmente atuada, controle H∞ não linear via repre-
sentação quase-LPV: Velocidades angulares das juntas dos manipuladores 1 e 2.
0.1
Junta 1 Junta 1
Junta 2 Junta 2
Junta 3 Junta 3
0.15
Torque − Robô 1 (N.m)
0.05
0.1
0
0.05
0
−0.05
−0.05
−0.1
−0.1
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.8: Configuração totalmente atuada, controle H∞ não linear via repre-
sentação quase-LPV: Torques aplicados nos manipuladores 1 e 2.
0.4 0.2
Momento de esmagamento (N.m)
0.3 0.15
0.2 0.1
0.1 0.05
0 0
−0.1 −0.05
−0.2 −0.1
−0.3 −0.15
−0.4 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.9: Configuração totalmente atuada, controle H∞ não linear via represen-
tação quase-LPV, comparação entre as forças de esmagamento: Forças de esmaga-
mento e momento de esmagamento.
180 Capı́tulo 10. Resultados Experimentais
Percorrida
Desejada
0.4
Coordenada Y (m)
0.39
0.38
0.37
0.36
0.35
0.34
0.19 0.2 0.21 0.22 0.23 0.24 0.25 0.26
Coordenada X (m)
Figura 10.10: Configuração totalmente atuada, controle H∞ não linear via teoria
dos jogos: Trajetória linear do centro de massa no plano X-Y.
Note que, o controlador H∞ não linear via teoria dos jogos apresentou um erro de
acompanhamento de trajetória menor, refletido no cálculo de L2 [e
x], mas o controle
da força de esmagamento foi melhor realizado pelo controlador H∞ não linear via
representação quase-LPV, ı́ndice E[hoE ]. O menor consumo de energia, representado
10.3. Configuração subatuada 181
A(ρ(x)) = A(ρ(e
x))
B1 (ρ(x)) = B
B2 (ρ(x)) = B
C1 (ρ(x)) = I6
C2 (ρ(x)) = 0
182 Capı́tulo 10. Resultados Experimentais
0.45 5
Coordenada X Orientação
Coordenada Y 4 Desejada
Desejada
0.4
3
Orientação (graus)
2
Posição (m)
0.35
1
0.3 0
−1
0.25
−2
−3
0.2
−4
0.15 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.11: Configuração totalmente atuada, controle H∞ não linear via teoria
dos jogos: Posição do centro de massa do objeto, coordenadas X e Y, e orientação
do objeto.
0.04 5
Velocidade angular (graus/s)
2
0.02
1
0.01 0
−1
0
−2
−3
−0.01
−4
−0.02 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.12: Configuração totalmente atuada, controle H∞ não linear via teoria
dos jogos: Velocidade do centro de massa do objeto, coordenadas X e Y, e velocidade
angular do objeto.
Posição das juntas − Robô 1 (graus)
90
Junta 1 Junta 1
Junta 2 Junta 2
150 Junta 3 Junta 3
80
100 70
60
50
50
0
40
−50
30
−100 20
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.13: Configuração totalmente atuada, controle H∞ não linear via teoria
dos jogos: Posições angulares das juntas dos manipuladores 1 e 2.
10.3. Configuração subatuada 183
0 −5
−10
−5
−15
−10
−20
−15
−25
−20 −30
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.14: Configuração totalmente atuada, controle H∞ não linear via teoria
dos jogos: Velocidades angulares das juntas dos manipuladores 1 e 2.
0.1
Junta 1 Junta 1
Junta 2 Junta 2
Junta 3 Junta 3
0.15
Torque − Robô 1 (N.m)
0.05
0.1
0
0.05
0
−0.05
−0.05
−0.1
−0.1
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.15: Configuração totalmente atuada, controle H∞ não linear via teoria
dos jogos: Torques aplicados nos manipuladores 1 e 2.
0.4 0.2
Momento de esmagamento (N.m)
0.3 0.15
0.2 0.1
0.1 0.05
0 0
−0.1 −0.05
−0.2 −0.1
−0.3 −0.15
−0.4 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.16: Configuração totalmente atuada, controle H∞ não linear via teoria
dos jogos, comparação entre as forças de esmagamento: Forças de esmagamento e
momento de esmagamento.
184 Capı́tulo 10. Resultados Experimentais
Percorrida
Desejada
0.4
Coordenada Y (m)
0.39
0.38
0.37
0.36
0.35
0.34
0.19 0.2 0.21 0.22 0.23 0.24 0.25 0.26
Coordenada X (m)
Os resultados experimentais são mostrados nas Figuras 10.17 a 10.23. Note que
o torque aplicado na junta 1 do robô 2 é zero, caracterizando uma junta passiva.
Na Figura 10.23 são apresentadas as forças de esmagamento com controle de es-
magamento (caso 1) e sem controle de esmagamento (caso 2). Pode-se observar que
somente os dois componentes das forças de esmagamento referentes às forças lineares
são controlados no caso 1. O momento de esmagamento não está sendo controlado
nos dois casos.
10.3. Configuração subatuada 185
0.45 5
Coordenada X Orientação
Coordenada Y 4 Desejada
Desejada
0.4
3
Orientação (graus)
2
Posição (m)
0.35
1
0.3 0
−1
0.25
−2
−3
0.2
−4
0.15 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
2
0.02
1
0.01 0
−1
0
−2
−3
−0.01
−4
−0.02 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
90
Junta 1 Junta 1
Junta 2 Junta 2
150 Junta 3 Junta 3
80
100 70
60
50
50
0
40
−50
30
−100 20
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
0 −5
−10
−5
−15
−10
−20
−15
−25
−20 −30
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
0.15 0.1
Junta 1 Junta 1
Junta 2 Junta 2
Junta 3 Junta 3
Torque − Robô 1 (N.m)
0.05
0.1
0
0.05
−0.05
0
−0.1
−0.05
−0.15
−0.1
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
0.4 0.2
Momento de esmagamento (N.m)
0.3 0.15
0.2 0.1
0.1 0.05
0 0
−0.1 −0.05
−0.2 −0.1
−0.3 −0.15
−0.4 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Percorrida
Desejada
0.4
Coordenada Y (m)
0.39
0.38
0.37
0.36
0.35
0.34
0.19 0.2 0.21 0.22 0.23 0.24 0.25 0.26
Coordenada X (m)
Figura 10.24: Configuração subatuada, controle H∞ não linear via teoria dos jogos:
Trajetória linear do centro de massa no plano X-Y.
10.3. Entretanto, os valores de E[hoE ], dados por 1.6319 Ns e 0.9250 Ns, para os
controladores via representação quase-LPV e via teoria dos jogos, respectivamente,
são em média três vezes maiores que os valores de E[hoE ] para o caso em que as
forças de esmagamento são controladas.
0.45 5
Coordenada X Orientação
Coordenada Y 4 Desejada
Desejada
0.4
3
Orientação (graus)
2
Posição (m)
0.35
1
0.3 0
−1
0.25
−2
−3
0.2
−4
0.15 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.25: Configuração subatuada, controle H∞ não linear via teoria dos jogos:
Posição do centro de massa do objeto, coordenadas X e Y, e orientação do objeto.
0.04 5
Coordenada X Velocidade angular (graus/s) Velocidade angular
Coordenada Y 4 Desejada
Desejada
0.03
3
Velocidade (m/s)
2
0.02
1
0.01 0
−1
0
−2
−3
−0.01
−4
−0.02 −5
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.26: Configuração subatuada, controle H∞ não linear via teoria dos jogos:
Velocidade do centro de massa do objeto, coordenadas X e Y, e velocidade angular
do objeto.
Posição das juntas − Robô 1 (graus)
90
Junta 1 Junta 1
Junta 2 Junta 2
150 Junta 3 Junta 3
80
100 70
60
50
50
0
40
−50
30
−100 20
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.27: Configuração subatuada, controle H∞ não linear via teoria dos jogos:
Posições angulares das juntas dos manipuladores 1 e 2.
190 Capı́tulo 10. Resultados Experimentais
Velocidade angular − Robô 1 (graus/s)
0 −5
−10
−5
−15
−10
−20
−15
−25
−20 −30
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.28: Configuração subatuada, controle H∞ não linear via teoria dos jogos:
Velocidades angulares das juntas dos manipuladores 1 e 2.
0.15 0.1
Junta 1 Junta 1
Junta 2 Junta 2
Junta 3 Junta 3
Torque − Robô 1 (N.m)
0.05
0.1
0
0.05
−0.05
0
−0.1
−0.05
−0.15
−0.1
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.29: Configuração subatuada, controle H∞ não linear via teoria dos jogos:
Torques aplicados nos manipuladores 1 e 2.
0.4 0.2
Momento de esmagamento (N.m)
0.3 0.15
0.2 0.1
0.1 0.05
0 0
−0.1 −0.05
−0.2 −0.1
−0.3 −0.15
−0.4 −0.2
0 1 2 3 4 5 0 1 2 3 4 5
Tempo (s) Tempo (s)
Figura 10.30: Configuração subatuada, controle H∞ não linear via teoria dos jogos,
comparação entre as forças de esmagamento: Forças de esmagamento e momento de
esmagamento.
Capı́tulo 11
Conclusão
191
192 Capı́tulo 11. Conclusão
Para todos os controladores, houve um aumento dos valores dos torques após
a introdução dos distúrbios, visando atenuar os efeitos destes. Esta é uma das
caracterı́sticas do controle H∞ comprovadas com os resultados experimentais. Os
menores consumos de energia são obtidos pelos controladores H∞ via representação
quase-LPV por realimentação da saı́da e misto H2 /H∞ .
Nos gráficos de posição dos controles H∞ não linear via teoria dos jogos, misto
H2 /H∞ não linear, e adaptativo H∞ não linear, Figuras 5.24, 5.29 e 5.32, repecti-
vamente, verifica-se que a terceira junta sofre uma oscilação nos instantes finais de
seu posicionamento, o que não ocorreu com o controle via representação quase-LPV.
Tal comportamento para aqueles controladores pode ser justificado pela utilização
de uma estratégia de controle que se assemelha às técnicas que utilizam linearização
193
por realimentação do estado, com uma entrada de controle linear, enquanto que no
controle quase-LPV, a entrada de controle é não linear.
Para a configuração subatuada PAP, os melhores resultados são obtidos com este
controlador, confirmando os valores de γ encontrados para esta configuração.
ARAI, H.; TACHI, S. (1991). Position Control of a Manipulator with Passive Joints
Using Dynamic Coupling. IEEE Transactions on Robotics and Automation, v.7, n.4,
p.528–534, Aug.
195
196 Referências Bibliográficas
ARAI, H.; TANIE, K.; SHIROMA, N. (1997). Feedback Control of a 3-DOF Pla-
nar Underactuated Manipulator. In: IEEE International Conference on Robotics
and Automation. 1997, Albuquerque, New México, USA. Proceedings... Piscataway:
IEEE/RAS. 1 CD-ROM.
ARAI, H.; TANIE, K.; TACHI, S. (1993). Dynamic Control of a Manipulator with
Passive Joints in Operation Space. IEEE Transactions on Robotics and Automation,
v.9, n.1, p.85–93, Feb.
BERGERMAN, M.; TERRA, M. H.; TINÓS, R.; SIQUEIRA, A. A. G.; XU, Y.;
SUN, W. L. (2000). Fault tolerant control of mechanical manipulators: a hibrid
systems approach. In: International IFAC Symposium on Robot Control, 6. 2000,
Viena, Áustria. Proceedings... Viena: IFAC. 1 CD-ROM.
CHEN, B. S.; CHANG, Y. C. (1997). Nonlinear mixed H2 /H∞ control for robust
tracking design of robotic systems. International Journal of Control, v.67, n.6,
p.837–857, Aug.
DUFFY, J. (1990). The fallacy of modern hybrid control theory that is based on
“orthogonal complements” of twist and wrench spaces. Journal of Robotics Systems,
v.7, n.2, p.139–144, Apr.
GAHINET, P.; NEMIROVISKI, A.; LAUB, A. J.; CHILALI, M. (1995). LMI Con-
trol Toolbox. The MathWorks Inc.
ISIDORI, A.; KANG, W. (1995). H∞ Control via Measurement Feedback for Gene-
ral Nonlinear Systems. IEEE Transactions on Automatic Control, v.40, n.3, p.466–
472, Mar.
JADBABAIE, A.; YU, J.; HAUSER, J. (1998). Stabilizing Receding Horizon Con-
trol of Nonlinear Systems: A Control Lyapunov Function Approach. In: IEEE
International Conference on Decision and Control, 37. 1998, Tampa, Florida, USA.
Workshop in H∞ nonlinear control by J. C. Doyle, Caltech.
LIAN, K. Y.; CHIU, C. S.; LIU, P. (2002). Semi-Descentralized Adaptive Fuzzy Con-
trol for Cooperative Multirobot Systems with H∞ Motion/Internal Force Tracking
Referências Bibliográficas 201
LIU, Y. H.; XU, Y. (1997). Cooperation of multiple manipulators with passive joints.
In: IEEE International Conference on Robotics and Automation. 1997, Albuquerque,
USA. Proceedings... Piscataway: IEEE/RAS. 1 CD-ROM.
LYNCH, K. M.; SHIROMA, N.; ARAI, H.; TANIE, K. (1998). Motion Planning for
a 3-DOF Robot with a Passive Joint. In: IEEE International Conference on Robotics
and Automation. 1998, Leuven, Belgium. Proceedings... Piscataway: IEEE/RAS. 1
CD-ROM.
PACKARD, A.; DOYLE, J. C. (1993). The complex structure singular value. Au-
tomatica, v.29, n.1, p.71–109, Jan.
SU, W.; SOUZA, C. E. D.; XIE, L. (1999). H∞ Control for Asymptotically Stable
Nonlinear Systems. IEEE Transactions on Automatic Control, v.44, n.5, p.989–993,
May.
SUZUKI, T.; KOIMURA, M.; NAKAMURA, Y. (1996). Chaos and Nonlinear Con-
trol of a Nonholonomic Free-joint Manipulator. In: IEEE International Conference
on Robotics and Automation. 1996, Minneapolis, Minnesota, USA. Proceedings...
Piscataway: IEEE/RAS. 1 CD-ROM.
via H∞ . In: IFAC Symposium on Robust Control Design, 3. 2000, Prague, Czech
Republic. Proceedings... Prague: IFAC. 1 CD-ROM.
TERRA, M. H.; TINóS, R. (2001). Fault Detection and Isolation in Robotic Ma-
nipulators via Neural Networks - A Comparison Among Three Architectures for
Residual Analysis. Journal of Robotic Systems, v.18, n.7, p.357–374, Jul.
TOMEI, P. (1994). Tracking Control of Flexible Joint Robots with Uncertain Pa-
rameters and Disturbance. IEEE Transactions on Automatic Control, v.39, n.5,
p.1067–1072, May.
WEN, T.; KREUTZ-DELGADO, K. (1992). Motion and Force Control for Multiple
Robotic Manipulators. Automatica, v.28, n.4, p.729–743, Jul.
WU, F.; YANG, X. H.; PACKARD, A.; BECKER, G. (1996). Induced L2 -Norm
Control for LPV Systems With Bounded Parameter Variation Rates. International
Journal of Robust and Nonlinear Control, v.6, n.9-10, p.983–998, Nov.-Dec.
ZHOU, K.; DOYLE, J. C. (1998). Essentials of Robust Control. Upper Saddle River:
Prentice Hall.
ZHOU, K.; DOYLE, J. C.; GLOVER, K. (1995). Robust and Optimal Control.
Upper Saddle River: Prentice Hall.
Apêndice A
Neste apêndice, uma descrição completa do robô manipulador UArm II, cons-
truı́do com caracterı́sticas especiais de subatuação, é apresentada. O acionamento
é realizado diretamente a partir de um ambiente de controle desenvolvido em lin-
c
guagem MatLab
.
A.1 UArm II
As matrizes M (q) e C(q, q̇) da equação (3.1) são encontradas pela teoria de
209
210 Apêndice A. UArm II e Ambientes de controle
c
utilizando-se uma placa de entrada-saı́da Servo To Go
, capaz de controlar até 8
motores simultaneamente, ou seja 8 juntas, usada para outros fins além de manipu-
ladores, como, controle de câmeras, controle de instrumentos médicos e ferramentas
mecânicas. Suas caracterı́sticas são as seguintes:
c
geradas a partir da compilação, no espaço de trabalho do MatLab
, de programas
em C++ contendo funções de tipo mex. Foram geradas 4 funções de controle,
mostradas na Tabela A.2.
Especificações do sistema:
1. Braço
• Voltagem nominal: 48 V CC
3. Amplificadores de corrente
214 Apêndice A. UArm II e Ambientes de controle
• Corrente de pico: 20 A
• Corrente contı́nua: 10 A
• Tensão: 20-90 V CC
4. Freios
• Torque: 2.8 Nm
5. Encoders óticos
• Linhas: 2000/rev
6. Flutuadores de ar
8. Sistema computacional
c
O acesso ao ambiente de controle é feito no espaço de trabalho do MatLab
.
Conforme pode-se observar na Figura A.4, a interface gráfica é dividida em duas
áreas denominadas: msg-frame, contendo botões de comando e prompts para entrada
de dados; e movie-axis, na qual o movimento real do robô é representado.
• Set DAC=0 : Faz com que todas as saı́das analógicas dos amplificadores
fiquem com 0 V. Esta opção é utilizada como medida de segurança nos
casos em que o botão de emergência é acionado, pois resı́duos de tensão
nas saı́das podem provocar um movimento inesperado do manipulador.
• Brake Off : Libera todos os freios do robô UArm II. Quando as juntas
alcançam o seu set-point os freios são acionados.
• Set-point: Define a posição final desejada para as juntas. Pode ser alte-
rado utilizando o mesmo procedimento descrito acima.
+ m3 (l12 + l22 + lc23 + 2l1 l2 cos(q2 ) + 2l1 lc3 cos(q2 + q3 ) + 2l2 lc3 cos(q3 )),
223
224 Apêndice B. Matrizes dinâmicas e matrizes de regressão
C11 (q, q̇) C12 (q, q̇) C13 (q, q̇)
C(q, q̇) = C21 (q, q̇) C22 (q, q̇) C23 (q, q̇) ,
C31 (q, q̇) C32 (q, q̇) C33 (q, q̇)
C11 (q, q̇) = − [(m2 l1 lc2 sen (q2 ) + m3 l1 l2 sen (q2 ) + m3 l1 lc3 sen (q2 + q3 ))q˙2
C12 (q, q̇) = − [(m2 l1 lc2 sen (q2 ) + m3 l1 l2 sen (q2 ) + m3 l1 lc3 sen (q2 + q3 ))(q˙1 + q˙2 )
C13 (q, q̇) = − [(m3 l1 lc3 sen (q2 + q3 ) + m3 l2 lc3 sen (q3 ))(q˙1 + q˙2 + q˙3 )],
C2,1 (q, q̇) = (m2 l1 lc2 sen (q2 ) + m3 l1 l2 sen (q2 ) + m3 l1 lc3 sen (q2 + q3 ))q˙1
C3,1 (q, q̇) = (m3 l1 lc3 sen (q2 + q3 ) + m3 l2 lc3 sen (q3 ))q˙1 + m3 l2 lc3 sen (q3 )q˙3 ,
Y13 (·) = 2 cos(q2 )y11 + cos(q2 )y12 − sen (q2 )q̇2 y21 − sen (q2 )(q̇1 + q̇2 )y22 ,
Y14 (·) = (2 + 2 cos(q2 ))y11 + (1 + cos(q2 ))y12 − sen (q2 )q̇2 y21
− ( sen (q2 + q3 ) + sen (q3 ))q̇3 y21 − sen (q2 + q3 )(q̇1 + q̇2 )y22
− ( sen (q2 + q3 ) + sen (q3 ))q̇3 y22 − ( sen (q2 + q3 ) + sen (q3 ))(q̇1 + q̇2
+ q̇3 )y23 ,
Y21 (·) = 2y11 + y12 , Y22 (·) = 0, Y23 (·) = cos(q2 )y11 + sen (q2 )q̇1 y21 ,
+ sen (q2 + q3 )q̇1 y21 − sen (q3 )q̇3 y21 − sen (q3 )q̇3 y22 − sen (q3 )(q̇1 + q̇2
+ q̇3 )y22 ,
226 Apêndice B. Matrizes dinâmicas e matrizes de regressão
Y36 (·) = cos(q2 + q3 )y11 + cos(q3 )y11 + cos(q3 )y12 + sen (q2 + q3 )q̇1 y21
+ sen (q3 )q̇1 y21 − sen (q3 )q̇2 y21 + sen (q3 )(q̇1 + q̇2 )y22 ,
−1
sendo y11 = (q̈1d − T11 T12 q̃˙1 ), y12 = (q̈2d − T11
−1
T12 q̃˙2 ), y13 = (q̈3d − T11
−1
T12 q̃˙3 ),
−1 −1 −1
y21 = (q̇1d − T11 T12 q̃1 ), y22 = (q̇2d − T11 T12 q̃2 ), e y23 = (q̇3d − T11 T12 q̃3 ).
Y 14 (·) = 2 cos(q3 )y11 + cos(q3 )y12 − sen (q3 )q̇3 y21 − sen (q3 )(q̇1 + q̇2 + q̇3 )y22 ,
−1
sendo y11 = (q̈2d − T11 T12 q̃˙2 ), y12 = (q̈3d − T11
−1
T12 q̃˙3 ), y21 = (q̇2d − T11
−1
T12 q̃2 ), e
−1
y22 = (q̇3d − T11 T12 q̃3 ).
227
Y13 (·) = 2 cos(q2 )y11 − sen (q2 )q̇2 y21 − sen (q2 )(q̇1 + q̇2 )y22 ,
− sen (q2 + q3 )q̇2 y21 − ( sen (q2 + q3 ) + sen (q3 ))q̇3 y21 − ( sen (q2 + q3 )
Y17 (·) = 2y11 , Y18 (·) = y11 + y12 , Y19 (·) = q̇1 , Y110 = 0,
Y21 (·) = 0, Y22 (·) = 0, Y23 (·) = 0, Y24 (·) = 0, Y25 (·) = y11 + y12 ,
Y26 (·) = (cos(q2 + q3 ) + cos(q3 ))y11 + ( sen (q2 + q3 ) + sen (q3 ))q̇1 y21
Y27 (·) = 0, Y28 (·) = y11 + y12 , Y29 (·) = 0, Y210 = q̇2 ,
−1
sendo y11 = (q̈1d − T11 T12 q̃˙1 ), y12 = (q̈3d − T11
−1
T12 q̃˙3 ), y21 = (q̇1d − T11
−1
T12 q̃1 ), e
−1
y22 = (q̇3d − T11 T12 q̃3 ).
228 Apêndice B. Matrizes dinâmicas e matrizes de regressão
Apêndice C
229
230 Apêndice C. Matrizes soluções X e Y , e matrizes P e Λ
0.1381 0.1657 −0.0006 −0.1706 −0.1743 −0.0952
0.1657 −0.1461 −0.0817 0.0276 0.0598 0.0392
−0.0006 −0.0817 0.1393 0.0574 0.0666 0.0273
X2 =
−0.1706 0.0276 0.0574 −0.4068 −0.4014 −0.2446
−0.1743 0.0598 0.0666 −0.4014 −0.3994 −0.2437
−0.0952 0.0392 0.0273 −0.2446 −0.2437 −0.1474
e
0.2368 −0.0186 −0.0762 −0.1864 −0.1665 −0.0906
−0.0186 0.1546 0.0679 −0.0231 −0.0312 −0.0200
−0.0762 0.0679 0.1111 0.0665 0.0563 0.0381
X3 =
.
−0.1864 −0.0231 0.0665 −0.3963 −0.3872 −0.2368
−0.1665 −0.0312 0.0563 −0.3872 −0.3771 −0.2303
−0.0906 −0.0200 0.0381 −0.2368 −0.2303 −0.1412
137.5074 −262.4303 61.8169 −9.7516 10.1404 1.6459
−262.4303 610.7223 −347.6516 9.6486 −24.0074 5.2057
61.8169 −347.6516 867.4693 4.4542 3.1906 −34.1244
X= ,
−9.7516 9.6486 4.4542 3.0016 −0.6899 −0.4769
10.1404 −24.0074 3.1906 −0.6899 3.7675 −0.1261
1.6459 5.2057 −34.1244 −0.4769 −0.1261 5.5547
0.2267 0.1118 0.0252 −0.2431 −0.1061 −0.0099
0.1118 0.0545 0.0136 −0.1229 −0.0455 −0.0067
0.0252 0.0136 0.0043 −0.0276 −0.0100 −0.0040
Y1 = ,
−0.2431 −0.1229 −0.0276 0.6703 0.2716 0.0442
−0.1061 −0.0455 −0.0100 0.2716 0.1735 0.0080
−0.0099 −0.0067 −0.0040 0.0442 0.0080 0.1049
C.1. Matrizes soluções X e Y dos controladores quase-LPV 231
−0.0021 −0.0002 0.0020 0.0173 −0.0246 −0.0107
−0.0002 0.0028 0.0012 0.0107 −0.0198 −0.0061
0.0020 0.0012 0.0003 0.0007 −0.0067 −0.0008
Y2 =
0.0173 0.0107 0.0007 −0.0348 −0.0018 0.0041
−0.0246 −0.0198 −0.0067 −0.0018 0.0885 0.0307
−0.0107 −0.0061 −0.0008 0.0041 0.0307 −0.0146
e
−0.0030 0.0009 0.0007 0.0081 −0.0056 −0.0157
0.0009 0.0022 0.0005 0.0021 −0.0060 −0.0089
0.0007 0.0005 0.0000 −0.0004 −0.0012 −0.0023
Y3 =
.
0.0081 0.0021 −0.0004 −0.0182 0.0051 0.0165
−0.0056 −0.0060 −0.0012 0.0051 0.0097 0.0208
−0.0157 −0.0089 −0.0023 0.0165 0.0208 0.0197
0.0447 −0.0112 −0.0036 0.0320
−0.0112 0.0110 −0.0085 −0.0401
X2 =
−0.0036 −0.0085 0.0035 0.0121
0.0320 −0.0401 0.0121 0.0412
232 Apêndice C. Matrizes soluções X e Y , e matrizes P e Λ
e
−0.0094 0.0214 −0.0152 −0.0174
0.0214 0.0128 0.0158 0.0438
X3 =
.
−0.0152 0.0158 −0.0087 −0.0402
−0.0174 0.0438 −0.0402 −0.0588
−0.0121 −0.0393 0.0151 0.0386
−0.0393 0.0023 0.0386 −0.0025
X2 =
0.0151 0.0386 −0.0206 0.0084
0.0386 −0.0025 0.0084 0.0050
e
−0.0174 0.0241 0.0158 0.0051
0.0241 0.0144 −0.0431 −0.0055
X3 =
.
0.0158 −0.0431 −0.0176 0.0183
0.0051 −0.0055 0.0183 0.0037
0.0083 −0.0040
X2 =
−0.0040 0.0021
e
0.0150 −0.0088
X3 = .
−0.0088 0.0063
C.2. Matrizes P e Λ dos controles Markovianos 233
0.0244 −0.0069
X2 =
−0.0069 0.0008
e
0.0606 −0.0339
X3 = .
−0.0339 0.0146
0.2452 −0.2402
X1 = ,
−0.2402 0.7122
0.0004 −0.0003
X2 =
−0.0003 0.0003
e
0.0006 −0.0007
X3 = .
−0.0007 0.0004
PAAA Pf P0
P = P0 PAP Au Ps ,
P0 Ps PAP Al
234 Apêndice C. Matrizes soluções X e Y , e matrizes P e Λ
sendo
0.27 0.09 0.09 0.09 0.09 0.09 0.09 0.09
0.09 0.27 0.09 0.09 0.09 0.09 0.09 0.09
0.09 0.09 0.27 0.09 0.09 0.09 0.09 0.09
0.09 0.09 0.09 0.27 0.09 0.09 0.09 0.09
PAAA =
,
0.09 0.09 0.09 0.09 0.27 0.09 0.09 0.09
0.09 0.09 0.09 0.09 0.09 0.27 0.09 0.09
0.09 0.09 0.09 0.09 0.09 0.09 0.27 0.09
0.09 0.09 0.09 0.09 0.09 0.09 0.09 0.27
0.1 0 0 0 0 0 0 0
0 0.1 0 0 0 0 0 0
0 0 0.1 0 0 0 0 0
0 0 0 0.1 0 0 0 0
Pf =
,
0 0 0 0 0.1 0 0 0
0 0 0 0 0 0.1 0 0
0 0 0 0 0 0 0.1 0
0 0 0 0 0 0 0 0.1
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
P0 =
,
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
C.2. Matrizes P e Λ dos controles Markovianos 235
0.24 0.08 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.24 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.24 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.08 0.24 0.08 0.08 0.08 0.08
PAP Au =
,
0.08 0.08 0.08 0.08 0.24 0.08 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.24 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.24 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.08 0.24
sendo
0.24 0.08 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.24 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.24 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.08 0.24 0.08 0.08 0.08 0.08
PAAA =
,
0.08 0.08 0.08 0.08 0.24 0.08 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.24 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.24 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.08 0.24
236 Apêndice C. Matrizes soluções X e Y , e matrizes P e Λ
0.21 0.07 0.07 0.07 0.07 0.07 0.07 0.07
0.07 0.21 0.07 0.07 0.07 0.07 0.07 0.07
0.07 0.07 0.21 0.07 0.07 0.07 0.07 0.07
0.07 0.07 0.07 0.21 0.07 0.07 0.07 0.07
PP AAu =
,
0.07 0.07 0.07 0.07 0.21 0.07 0.07 0.07
0.07 0.07 0.07 0.07 0.07 0.21 0.07 0.07
0.07 0.07 0.07 0.07 0.07 0.07 0.21 0.07
0.07 0.07 0.07 0.07 0.07 0.07 0.07 0.21
0.24 0.08 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.24 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.24 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.08 0.24 0.08 0.08 0.08 0.08
PP APu1 =
,
0.08 0.08 0.08 0.08 0.24 0.08 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.24 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.24 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.08 0.24
0.18 0.06 0.06 0.06 0.06 0.06 0.06 0.06
0.06 0.18 0.06 0.06 0.06 0.06 0.06 0.06
0.06 0.06 0.18 0.06 0.06 0.06 0.06 0.06
0.06 0.06 0.06 0.18 0.06 0.06 0.06 0.06
PP APu2 =
,
0.06 0.06 0.06 0.06 0.18 0.06 0.06 0.06
0.06 0.06 0.06 0.06 0.06 0.18 0.06 0.06
0.06 0.06 0.06 0.06 0.06 0.06 0.18 0.06
0.06 0.06 0.06 0.06 0.06 0.06 0.06 0.18
ΛAAA Λf Λ0
Λ= Λ0 ΛAP Au Λs ,
Λ0 Λs ΛAP Al
sendo
−0.73 0.09 0.09 0.09 0.09 0.09 0.09 0.09
0.09 −0.73 0.09 0.09 0.09 0.09 0.09 0.09
0.09 0.09 −0.73 0.09 0.09 0.09 0.09 0.09
0.09 0.09 0.09 −0.73 0.09 0.09 0.09 0.09
ΛAAA =
,
0.09 0.09 0.09 0.09 −0.73 0.09 0.09 0.09
0.09 0.09 0.09 0.09 0.09 −0.73 0.09 0.09
0.09 0.09 0.09 0.09 0.09 0.09 −0.73 0.09
0.09 0.09 0.09 0.09 0.09 0.09 0.09 −0.73
−0.76 0.08 0.08 0.08 0.08 0.08 0.08 0.08
0.08 −0.76 0.08 0.08 0.08 0.08
0.08 0.08
0.08 0.08 −0.76 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.08 −0.76 0.08 0.08 0.08 0.08
ΛAP Au =
,
0.08 0.08 0.08 0.08 −0.76 0.08 0.08 0.08
0.08 0.08 0.08 0.08 0.08 −0.76 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.08 −0.76 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.08 −0.76
ΛAP Al = ΛAP Au , Λf = P f , Λs = P s e Λ0 = P0 .
ΛAAA Λf Λ0 Λf Λ0 Λ0
Λ0 ΛP AAu Λs Λf Λ0 Λ0
Λ0 Λs ΛP AAl Λ0 Λf Λ0
Λ=
,
Λ0 Λ0 Λ0 ΛP APu1 Λs Λ0
Λ0 Λ0 Λ0 Λs ΛP APu2 Λs
Λ0 Λ0 Λ0 Λs Λs ΛP APl
sendo
−0.76 0.08 0.08 0.08 0.08 0.08 0.08 0.08
0.08 −0.76 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.08 −0.76 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.08 −0.76 0.08 0.08 0.08 0.08
ΛAAA =
,
0.08 0.08 0.08 0.08 −0.76 0.08 0.08 0.08
0.08 0.08 0.08 0.08 0.08 −0.76 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.08 −0.76 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.08 −0.76
−0.79 0.07 0.07 0.07 0.07 0.07 0.07 0.07
0.07 −0.79 0.07 0.07 0.07 0.07 0.07 0.07
0.07 0.07 −0.79 0.07 0.07 0.07 0.07 0.07
0.07 0.07 0.07 −0.79 0.07 0.07 0.07 0.07
ΛP AAu =
,
0.07 0.07 0.07 0.07 −0.79 0.07 0.07 0.07
0.07 0.07 0.07 0.07 0.07 −0.79 0.07 0.07
0.07 0.07 0.07 0.07 0.07 0.07 −0.79 0.07
0.07 0.07 0.07 0.07 0.07 0.07 0.07 −0.79
C.2. Matrizes P e Λ dos controles Markovianos 239
−0.76 0.08 0.08 0.08 0.08 0.08 0.08 0.08
0.08 −0.76 0.08 0.08 0.08 0.08 0.08 0.08
0.08 0.08 −0.76 0.08 0.08 0.08 0.08 0.08
0.08 0.08 0.08 −0.76 0.08 0.08 0.08 0.08
ΛP APu1 =
,
0.08 0.08 0.08 0.08 −0.76 0.08 0.08 0.08
0.08 0.08 0.08 0.08 0.08 −0.76 0.08 0.08
0.08 0.08 0.08 0.08 0.08 0.08 −0.76 0.08
0.08 0.08 0.08 0.08 0.08 0.08 0.08 −0.76
−0.82 0.06 0.06 0.06 0.06 0.06 0.06 0.06
0.06 −0.82 0.06 0.06 0.06 0.06 0.06 0.06
0.06 0.06 −0.82 0.06 0.06 0.06 0.06 0.06
0.06 0.06 0.06 −0.82 0.06 0.06 0.06 0.06
ΛP APu2 =
,
0.06 0.06 0.06 0.06 −0.82 0.06 0.06 0.06
0.06 0.06 0.06 0.06 0.06 −0.82 0.06 0.06
0.06 0.06 0.06 0.06 0.06 0.06 −0.82 0.06
0.06 0.06 0.06 0.06 0.06 0.06 0.06 −0.82