Você está na página 1de 99

CONTROL LINEAL

DE SISTEMAS
MULTIVARIABLES
Ing. Jairo J. Espinosa
M.Sc. Ph.D.
2 J. Espinosa

Septiembre 2003-Draft Version 3.0


TABLA CONTENIDO
CAPÍTULO 1 SISTEMAS MULTIVARIABLE ......................................................5
1.1 INTRODUCCIÓN .....................................................................................................5
1.2 SISTEMAS DINÁMICOS...........................................................................................6
1.2.1 Función de Transferencia .............................................................................8
1.2.2 Respuesta dinámica ......................................................................................9
1.3 CONTROLABILIDAD Y OBSERVABILIDAD .............................................................12
1.3.1 Controlabilidad...........................................................................................12
1.3.2 Observabilidad............................................................................................13
1.3.3 Prueba de Popov-Belevitch-Hautus (PBH) ................................................14
1.4 ESTABILIDAD, ESTABILIZABILIDAD, DETECTABILIDAD .......................................15
1.4.1 Estabilidad ..................................................................................................15
1.4.2 Estabilizabilidad .........................................................................................15
1.4.3 Detectabilidad.............................................................................................16
1.5 TRANSFORMACIONES SIMILARES Y DESCOMPOSICIÓN CANÓNICA DE KALMAN..16
1.5.1 Realización Mínima ....................................................................................19
1.5.2 Otras Formas Canónicas............................................................................19
1.6 EJERCICIOS DEL CAPITULO ..................................................................................21
CAPÍTULO 2 CONTROL DESACOPLADO.........................................................25
2.1 INTRODUCCIÓN ...................................................................................................25
2.2 INTERACCIÓN EN SISTEMAS MULTIVARIABLES ...................................................25
2.3 LA MATRIZ DE GANANCIAS RELATIVAS .............................................................27
2.4 SELECCIÓN DE LAZOS DE CONTROL USANDO LA MATRIZ DE GANANCIAS
RELATIVAS ...............................................................................................................29
2.5 CONTROL MULTIVARIABLE DESACOPLADO ........................................................32
2.6 COMENTARIOS Y CONCLUSIONES ........................................................................36
2.7 EJERCICIOS DEL CAPITULO ..................................................................................37
CAPÍTULO 3 MÉTODO DE UBICACIÓN DE POLOS ......................................39
3.1 INTRODUCCIÓN ...................................................................................................39
3.2 REALIMENTACIÓN DE ESTADO ............................................................................39
3.3 UBICACIÓN DE LOS POLOS ...................................................................................40
3.3.1 Ubicación de los Polos-Método Directo.....................................................40
3.3.2 Ubicación de los Polos-Sistemas de una entrada. Método de Ackermann.40
4 J. Espinosa

3.3.3 Ubicación de los Polos-Sistemas de múltiple entrada. Método de


Ackermann ...........................................................................................................41
3.3.4 Ubicación de los Polos en sistemas de múltiple entrada-salida - Ecuación
de Sylvester ..........................................................................................................42
3.4 EJEMPLOS............................................................................................................43
3.4.1 Carros Acoplados con Unión Flexible. [12] ..............................................43
3.4.2 Control de un Sistema Lector de Cinta Magnética (Tomado de [3]).........46
3.5 DISEÑO DE SERVO SISTEMAS E IMPLEMENTACIÓN DE REFERENCIAS....................50
3.4.3 Ejemplos......................................................................................................52
3.6 OBSERVADORES O ESTIMADORES DE ESTADO.....................................................56
3.6.1 Estimadores de Estado Completos..............................................................56
3.6.2 Estimadores Realimentados........................................................................57
3.6.3 Diseño de Estimadores - Ubicación de los polos .......................................58
3.6.4 Estimadores de Orden Reducido ................................................................61
3.6.5 Selección de los Polos para el Estimador...................................................62
3.7 EJEMPLOS............................................................................................................63
3.7.6 Carros Acoplados con Unión Flexible. [12] ..............................................63
3.7.7 Control de un Sistema Lector de Cinta Magnética.....................................65
3.8 EJERCICIOS DEL CAPITULO ..................................................................................68
CAPÍTULO 4 REGULADOR OPTIMO CUADRÁTICO LINEAL....................71
4.1 INTRODUCCIÓN ...................................................................................................71
4.2 REGULADOR OPTIMO CUADRÁTICO LINEAL.(LINEAR QUADRATIC REGULATOR-
LQR) ........................................................................................................................72
4.2.1 Problema con Horizonte finito....................................................................72
4.2.2 Problema con Horizonte Infinito ................................................................73
4.2.3 Solución de la ecuación algebraica de Riccati...........................................74
4.2.4 Control Optimo en Sistemas Discretos .......................................................74
4.2.5 Regulador Cuadrático Lineal-Caso discreto..............................................75
4.3 EJEMPLOS............................................................................................................78
4.3.1 Carros acoplados con Unión Flexible........................................................78
4.3.2 Control de un Sistema Lector de Cinta Magnética[4]................................80
4.4 ESTIMACIÓN OPTIMA-FILTROS DE KALMAN-BUCY.............................................83
4.4.1 Estimación Optima-Formulación Discreta.................................................86
4.5 EJEMPLOS DE DISEÑO DE ESTIMADORES OPTIMOS ..............................................86
4.5.1 Carros Acoplados con Unión Flexible .......................................................86
4.5.2 Estimación Optima en un Sistema Lector de Cinta Magnética ..................88
4.6 REGULADOR OPTIMO CUADRÁTICO GAUSSIANO ................................................89
4.7 EJEMPLOS............................................................................................................92
4.7.1 Carros Acoplados con Unión Flexible .......................................................92
4.7.2 Sistema Lector de Cinta Magnética............................................................95
4.8 EJERCICIOS DEL CAPITULO ..................................................................................96
Capítulo 1 Sistemas Multivariable

1.1 Introducción

El comportamiento de un sistema dinámico se encuentra condicionado por las


acciones que se ejerzan sobre el mismo. Esas acciones pueden ser ejercidas como
acciones deseadas, a través de variables manipuladas (válvulas, interruptores, relevos,
potenciómetros, calefactores, ventiladores, etc.) o a través de variables no
manipuladas directamente, generalmente llamadas perturbaciones ( cambios de carga,
masas, cambios de concentración, etc.). Los efectos de esas acciones se pueden ver
reflejados en una o más variables del sistema (temperaturas, niveles, presiones,
velocidad, concentraciones, posición) que bajo ciertas condiciones se desea mantener
en un valor determinado (variables controladas).

En general, el objetivo de la teoría de control es el diseñar estrategias que permitan


comandar un conjunto de variables (variables manipuladas), de manera que se puedan
mantener las variables controladas en unos valores deseados a pesar de las
perturbaciones que puedan afectar al sistema.

Un sistema de control multivariable (MIMO1) permita alcanzar el objetivo de


mantener un conjunto de variables en un valor deseado a diferencia del control de
sistemas SISO2 que solo permite controlar una variable al tiempo.

Ejemplo 1.1
Un ejemplo sencillo de un sistema multivariable es una ducha de agua caliente, en una
ducha de agua caliente se desea controlar al mismo tiempo la temperatura y el caudal
del agua, a través de la manipulación de las válvulas que regulan el caudal de agua
fría y caliente y sin importar las perturbaciones generadas por los cambios de presión
en el agua, o las temperaturas originales de los flujos caliente y frío.

Variables Controladas Variables Manipuladas Perturbaciones


• Temperatura de la • Válvula del agua • Temperatura del
ducha caliente flujo de agua fría.
• Flujo de agua en la • Válvula del agua • Temperatura del
ducha fría flujo de agua
caliente
• Presión del agua
fría
• Presión del agua
caliente
Table 1 Descripción de las variables para la ducha de agua caliente

1
MIMO - De la sigla en inglés Multiple Input Multiple Output – Multiple entrada Multiple salida
2
SISO- De la sigla en inglés Single Input Single Output – Una entrada una salida
6 J. Espinosa

A este sistema tipo de sistemas se les conoce como sistemas MIMO de 2 x 2 ( dos
entradas, dos salidas)■

Este libro está enfocado al estudio y desarrollo de técnicas de control lineal aplicables
a sistemas multivariables. Este primer capítulo se enfoca al estudio y descripción de
sistemas multivariables. Incluye conceptos importantes, como la descripción de
sistemas en espacio de estado y función de transferencia, función de transferencia
multivariable, controlabilidad y observabilidad.

El segundo capítulo está dedicado al concepto de desacoplamiento y al uso de


herramientas tales como RGA3 (Matriz de Ganancias Relativas) para seleccionar y
analizar lazos de control, de forma que se puedan aplicar técnicas usadas en sistemas
SISO para controlar sistemas multivariables.

El tercer capítulo introduce el concepto de realimentación de estado y el diseño de


controladores. El capítulo también incluye la definición y el diseño de observadores
de estado.

El cuarto capítulo describe el concepto del Regulador Optimo Cuadrático (LQR4), el


concepto de estimación óptima y filtros de Kalman y finalmente el Regulador Optimo
Gaussiano (LQG5).

El quinto capítulo está dedicado al diseño de controladores usando las normas H 2 y


H∞ .

1.2 Sistemas Dinámicos

Los modelos dinámicos de muchos sistemas físicos son descritos por ecuaciones
diferenciales ordinarias o parciales . Como ecuaciones diferenciales ordinarias se
entienden aquellas en las que el tiempo t es la única variable independiente. Las
ecuaciones diferenciales parciales tienen como variable independiente no solo a t sino
que también tienen derivadas con respecto a las coordenadas espaciales. Si se
construye un modelo únicamente con ecuaciones diferenciales ordinarias, este
modelo será una aproximación, ya que las variables son independientes del estado
puntual del sistema.

En nuestro caso son centraremos en los sistemas dinámicos descritos por ecuaciones
diferenciales ordinarias de la forma:
.
x = f ( x, u ), x(t o ) = xo (1.1)
y = g ( x, u )
(1.2)
donde x (t ) ∈ℜ es el estado del sistema, x (t o ) son las condiciones iniciales del
n

sistema, u(t ) ∈ℜ m es la entrada del sistema y y (t ) ∈ℜ p es la salida del sistema.

3
RGA-Relative Gain Array
4
LQR – Linear Quadratic Regulator
5
LQG – Linear Quadratic Gaussian regulator
Sistemas Multivariables 7

f(.,.) y g(.,.) son funciones no lineales f : ℜ m + n → ℜ m y g : ℜ m + n → ℜ p . Un sistema


dinámico con una entrada (m=1) y una salida (p=1) se conoce como sistema SISO
(por la sigla en inglés: Single Input Single Output), en caso contrario el sistema es
llamado MIMO (por la sigla en inglés: Multiple Input Multiple Output).

En este texto, nuestro análisis se verá restringido a los sistemas dinámicos lineales.
Para obtener una representación lineal del sistema descrito por las ecuaciones (1.1) y
(1.2) se puede aproximar las funciones f(.,.) y g(.,.) alrededor del punto de operación
u*, x* usando series de Taylor de la siguiente forma:
. ∂f ∂f (1.3)
x ≈ f (x* , u * ) + (x − x* ) + (u − u * ), x(t o ) = xo
∂x x*u * ∂u x*u *

∂g ∂g
y ≈ g (x* , u * ) + (x − x* ) + (u − u * ) (1.4)
∂x x*u * ∂u x*u *

Si el punto de operación es además un punto de equilibrio f ( x * , u * ) = 0 el sistema se


verá reducido a un sistema dinámico lineales con parámetros invariantes en el tiempo.
Esta representación de los sistemas dinámicos es una aproximación que permite
manipular de forma simple las ecuaciones del sistema y así poder llevar a cabo el
diseño de sistemas de control; que, pese a las aproximaciones, pueden controlar con
aceptable precisión el sistema dinámico alrededor del punto de operación.

El sistema se describe en forma general de la siguiente forma:


.
δx = Aδx + Bδu,δx(t o ) = δxo (1.5)
δy = Cδx + Dδu (1.6)

Donde x(t ) − x * = δx(t ) ∈ ℜ n es la desviación del estado del sistema,


x (t o ) − x * = δx (t o ) son las condiciones iniciales del sistema, u (t ) − u * = δu (t ) ∈ ℜ m es
la desviación de la entrada del sistema con respecto al punto alrededor del cual se
realizó la linealización y y (t ) − y * = δy ∈ ℜ p es la desviación de la salida del sistema.
A,B,C y D son matrices con parámetros constantes y dimensiones
∂f ∂f ∂g ∂g
A= ∈ ℜ n×n , B = ∈ ℜ n×m ,C = ∈ ℜ p× n y D = ∈ ℜ p× m .
∂x x* ,u * ∂u x* ,u * ∂x x* ,u* ∂u x* ,u *

Nota para el lector: A partir de este punto en el texto y para simplificar la notación, las
variables de desviación serán reemplazadas de la siguiente manera:
x = δx , y = δy y u = δu

En el caso discreto el sistema se puede representar en la forma:


xk +1 = Axk + Buk , (1.7)
yk = Cxk + Duk (1.8)

con matrices de las mismas dimensiones.


8 J. Espinosa

.
u(t) x(t) x(t) y(t)
B + C +

A
(a)


uk xk+1 xk yk
B + C +

A
(b)
Figura 1.1: Diagramas de bloques de la representación de estado. (a) Continuo (b)
Discreto.

1.2.1 Función de Transferencia

La matriz de transferencia desde u hasta y se define como:

Y ( s) = G ( s)U ( s)

donde U(s) y Y(s) son las trasformadas de Laplace de u(t) y y(t) , asumiendo unas
condiciones iniciales iguales a cero (x(0)=0).
G(s) se obtiene a partir de,

G ( s) = C ( sI − A) −1 B + D

Las ecuaciones (1.5) y (1.6) se pueden escribir en forma matricial:


Sistemas Multivariables 9

.
⎡x ⎤ ⎡ A B ⎤⎡x⎤
⎢ y ⎥ = ⎢C D ⎥ ⎢u ⎥
⎣ ⎦ ⎣ ⎦⎣ ⎦

De forma similar para el caso discreto la matriz de transferencia desde u hasta y se


define como:

Y ( z) = G ( z)U ( z)

donde U(z) y Y(z) son las trasformadas zeta de uk y yk con condiciones iniciales
(x0=0).
G(z) se obtiene a partir de,

G ( z) = C ( zI − A) −1 B + D

Las ecuaciones (1.7) y (1.8) también pueden ser escritas en forma matricial:

⎡ xk + 1 ⎤ ⎡ A B ⎤ ⎡ x k ⎤
⎢ y ⎥ = ⎢C D ⎥ ⎢u ⎥
⎣ k ⎦ ⎣ ⎦⎣ k ⎦

1.2.2 Respuesta dinámica

Dadas la condición inicial x(t0) y la entrada u(t), la respuesta dinámica del sistema
para t ≥ t 0 puede ser calculada a partir de:

t (1.9)
x (t ) = e A ( t − t o ) x (t0 ) + ∫ e A ( t − τ ) Bu(τ )dτ
t0

y (t ) = Cx (t ) + Du(t ) (1.10)

En caso de que u(t) = 0, ∀t ≥ t 0 , será posible observar que para cualquier t1 ≥ t 0 y


t ≥ t0 ,

x ( t ) = e A ( t − t1 ) x ( t1 )

La respuesta impulso estará dada por:

g (t ) = L −1{G ( s)} = Ce At B1+ (t ) + Dδ (t )

donde δ (t ) es el impulso unitario y 1+(t) es el paso unitario definido como:


⎧1, t ≥ 0;
1+ ( t ): = ⎨
⎩0, t < 0.

con D = 0, la respuesta impulso quedará reducida a:


10 J. Espinosa

g (t ) = Ce At B, ∀t ≥ 0

En el caso discreto tendremos:


Dadas la condición inicial x0 y la entrada uk, la respuesta dinámica del sistema para
k ≥ 0 puede ser calculada a partir de:

k −1
xk = A k x0 + ∑ Ai Buk −1− i (1.11)
i =0

yk = Cxk + Duk
(1.12)

En caso de que uk = 0, ∀k ≥ 0 ,

x k = A k x0

Si D=0 la respuesta impulso estará dada por:

g ( k ) = Z −1{G ( z)} = CAk B

1.3 Polos y Ceros

Los conceptos de polos y ceros son importantes para definir la estabilidad de un


sistema o los limites de desempeño de un sistema de control.

1.3.1Polos y ceros en sistemas SISO

La función de transferencia para un sistema SISO esta dada por la siguiente


expresión:
Cadj( sI − A) B + D det( sI − A) num( s )
G ( s ) = C ( sI − A) −1 B + D = =
det( sI − A) den( s )

Una función de transferencia se define como mínima si no existen factores comunes


entre los polinomios del numerador y el denominador. Una representación en espacio
de estado [ A, B, C , D ] es llamada mínima si el det( sI − A) es igual al denominador de
la función de transferencia mínima.

Se definen como ceros del sistema aquellos valores que anula el numerador de la
función de transferencia (raíces del polinomio num(s)). Se dice entonces que un cero
es un valor s = zi tal que:
G ( zi ) = 0
De otro lado los polos del sistema G(s) son las raíces del denominador o las
soluciones de la ecuación den( s ) = 0 . Los polos son lo valores s = pi de manera que
Sistemas Multivariables 11

G ( pi ) = ∞
Para una representación mínima los polos son la solución de la ecuación
característica
det( sI − A) = 0
(1.13)

esta ecuación define a su vez los valores propios de la matriz A. Los polos son de
hecho los valores propios de la matriz de estados del sistema.

1.3.2Polos y ceros en sistemas multivariables

La función de transferencia de un sistema Multivariable es una matriz de funciones


de transferencia SISO. Los polos del sistema Multivariable son la unión de los polos
de las distintas funciones de transferencia. Al igual que el sistema SISO los polos del
sistema Multivariable son los valores propios de la matriz de estados (A).

La definición de los ceros multivariables es la frecuencia a la cual la matriz de


funciones de transferencia pierde su rango.

rank[G ( s )] < min(n y , nu ) (1.14)

De otra manera se puede decir que los ceros multivariables son los valores de s=z de
manera que:

⎡ A − zI B⎤ (1.15)
rank ⎢ < min(n y , nu )
⎣ C D ⎥⎦

Esta condición lo que indica es que la salida será cero para una entrada diferente de
cero
Y ( s ) = 0 = G ( s )U ( s )

usando la transformada de Laplace de la representación de estado, tendremos:

sY ( s ) = AX ( s ) + BU ( s )
Y ( s ) = 0 = CX ( s ) + DU ( s )

si rescribimos esta expresión de forma matricial se obtiene:

⎡ sI − A M B ⎤ ⎡ X ( s) ⎤ ⎡ 0 ⎤ (1.16)
⎢ L L⎥⎥ ⎢⎢ L ⎥⎥ = ⎢⎢L⎥⎥

⎢⎣ C M D ⎥⎦ ⎢⎣U ( s ) ⎥⎦ ⎢⎣ 0 ⎥⎦
12 J. Espinosa

este problema se puede reducir a un problema de valores propios generalizados. El


problema de valores propios consiste en que dadas dos matrices A y B encontrar los
valores de los escalares λ y x de manera que Ax = λ Bx .

En este caso la ecuación se puede resolver planteando el problema como un problema


de valores propios generalizados de la siguiente forma:
⎡ A M B ⎤ ⎡ X (s)⎤ ⎡ I M 0 ⎤ ⎡ X ( s) ⎤
⎢L L⎥ ⎢ L ⎥ = s ⎢⎢L
⎥ ⎢ ⎥ L⎥⎥ ⎢⎢ L ⎥⎥

⎢⎣ C M D ⎥⎦ ⎢⎣U ( s) ⎥⎦ ⎢⎣ 0 M 0 ⎥⎦ ⎢⎣U ( s) ⎥⎦

1.4 Controlabilidad y Observabilidad

1.4.1 Controlabilidad

Un sistema dinámico es controlable si es posible alcanzar un estado deseado x(t1) = x1,


a partir de un estado inicial x(0) = x0 en un tiempo t1 finito.

La controlabilidad de un sistema se puede verificar a través de criterios algebraicos y


geométricos. El método más común es la evaluación de la matriz de controlabilidad.
La matriz de controlabilidad está dada por:

[
C = B AB ... An −1 B ] (1.17)

El par (A,B) es controlable si y solo si el rango de es igual a n, donde n es el orden


del sistema.

Para explicar este método, se escoge un sistema lineal de la forma:

xk + 1 = Axk + Buk
Entonces
x k +1 = A k +1 x 0 + A k Bu 0 + ... + Bu k
operando y presentando en forma matricial,

⎡ uk ⎤
⎢u ⎥
k +1
[
xk +1 − A x0 = B AB ... A B ⎢ .. ⎥
k k −1

⎢ . ⎥
]
⎢u ⎥
⎣ 0 ⎦
Obsérvese, que para k ≥ n − 1 :

[ ] [
rango B AB ... A k B = rango B AB ... An −1 B ]
(Ver: Teorema de Cayley-Hamilton)
Obsérvese, que solo será posible calcular un vector de entradas
Sistemas Multivariables 13

⎡ uk ⎤
⎢u ⎥
.. 1 ⎥
⎢ k−
⎢ . ⎥
⎢u ⎥
⎣ 0 ⎦

que lleve la planta del estado x0 al estado xk+1,sí el rango( ) = n.

Las matrices de controlabilidad para sistemas continuos y para sistemas discretos


tienen la misma forma.

1.4.2 Observabilidad

Un sistema es observable si conociendo la entrada u y la salida y es posible


determinar el estado x.

La matriz de observabilidad está como:

⎡ C ⎤
⎢ CA ⎥
O = ⎢ .. ⎥ (1.18)
⎢ . ⎥
⎢ n −1 ⎥
⎣CA ⎦

Se dice que el sistema es observable si el rango de es igual a n, donde n es el orden


del sistema.

Para ilustrar esta idea, se tomará el sistema autónomo (sin entrada) definido por:

xk +1 = Axk
yk = Cxk

La respuesta del sistema estará dada por:

yk = CA k x0

⎡ y0 ⎤ ⎡ C ⎤
⎢ y ⎥ ⎢ CA ⎥
⎢ .1 ⎥ = ⎢ . ⎥ x
⎢ .. ⎥ ⎢ . ⎥ 0
⎢ ⎥ ⎢ k⎥
⎣ yk ⎦ ⎣CA ⎦

Obsérvese que para k ≥ n −1 :


14 J. Espinosa

⎡ C ⎤ ⎡ C ⎤
⎢ CA ⎥ ⎢ CA ⎥
rango ⎢ ⎥ = rango ⎢ ⎥
⎢ ... ⎥ ⎢ ... ⎥
⎢ k⎥ ⎢ n −1 ⎥
⎣CA ⎦ ⎣CA ⎦

Obsérvese que siempre que el rango( ) = n será posible calcular el valor de x0 a partir
de las salidas observadas.
Las matrices controlabilidad para sistemas continuos y discretos son iguales.

1.4.3 Prueba de Popov-Belevitch-Hautus (PBH)

1.4.3.1 Prueba de Controlabilidad.


La prueba de controlabilidad PBH se puede resumir en la siguiente frase:
(A, B) es controlable sí y solo sí no existe un vector propio de AT diferente de cero que
es perpendicular a B.
(A, B) no es controlable si existe un vector q ≠ 0 tal que

A T q = qλ
BT q = 0
Si existe un vector propio q y un valor propio λ tal que q es perpendicular a B se
puede decir que el modo correspondiente al valor propio λ es no controlable. En caso
contrario se dice que el modo es controlable. Por ejemplo (tomado de [3]):

⎡* ⎤ ⎡*⎤ ⎡0⎤
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
A = ⎢ λi ⎥, B = ⎢0⎥, ⇒ q = ⎢1⎥
⎢⎣ *⎥⎦ ⎢⎣*⎥⎦ ⎢⎣0⎥⎦

.
El sistema (A, B) tiene un modo no controlable xi = λi xi .

Prueba:

Si existe un vector q ≠ 0 tal que


q T A = λq T
qT B = 0
entonces:
q T AB = λq T B = 0
y
q T A 2 B = λq T AB = 0
y así sucesivamente hasta que:
q T C(A,B) = q T B[ ]
AB K A n−1 B = 0 ■
Sistemas Multivariables 15

1.4.3.2 Prueba de Observabilidad


El sistema dinámico con matrices (A, C) es observable si no existe un vector propio de
A que es perpendicular a CT.
(A, C) no es observable si existe un vector p ≠ 0 tal que

Ap = pλ
Cp = 0
Si existe un vector propio p y un valor propio λ tal que p es perpendicular a C se
puede decir que el modo correspondiente al valor propio λ no es observable. En caso
contrario se dice que el modo es observable. Por ejemplo:

⎡* ⎤ ⎡0⎤
⎢ ⎥ ⎢ ⎥
A = ⎢ λi ⎥, [ ]
C = * 0 * , ⇒ p = ⎢1⎥
⎢⎣ *⎥⎦ ⎢⎣0⎥⎦

.
El sistema (A, C) tiene un modo no observable xi = λi xi .
Prueba: (ver prueba de controlabilidad)

1.5 Estabilidad, Estabilizabilidad, Detectabilidad

1.5.1 Estabilidad
.
Un sistema dinámico autónomo x = Ax es estable sí y solo sí la parte real de todos
los valores propios de A son menores que cero (están ubicados en la parte izquierda
del plano complejo), p.e., Reλ(A)<0.
Para el caso discreto, se dice que un sistema dinámico autónomo xk + 1 = Axk es
estable sí todos los valores propios de A están ubicados dentro del circulo unitario en
el plano complejo, p.e., |λ(A)|<1.
Una matriz A con esta propiedad se dice que es estable o Hurwitz.
Es importante recordar que los valores propios de A son las raíces de la expresión,

det( λI − A) =0

Recordando la representación como matriz de transferencia del sistema [A,B,C,D]

adj( sI − A)
G ( s) = C ( sI − A) −1 B + D = C B+D
det( sI − A)

se puede observar que los polos de la matriz de transferencia son los valores propios
de A.

1.5.2 Estabilizabilidad
16 J. Espinosa

Un sistema con matrices (A,B) se dice estabilizable, si sus modos no controlables son
estables. Esta propiedad garantiza que cuando se aplique un sistema de control al
sistema, las variables que no sean controlables no crecerán a límites que pongan en
peligro la operación o la integridad del sistema.

1.5.3 Detectabilidad

Un sistema con matrices (A,C) se dice detectable, si sus modos inestables son
observables. Esta propiedad garantiza que se puede construir estimadores de estado
estables.
Ejemplo:
Dado el sistema dinámico discreto,

xk +1 = Axk + Buk
yk = Cxk + Duk

⎡2 0 0 0 2 ⎤
⎢0 − 0.3 0.4 0 4 ⎥
⎡ A B⎤ ⎢ ⎥
⎢C D ⎥ = ⎢0 − 0.4 − 0.3 0 − 2⎥
⎣ ⎦ ⎢0 0 0 3 4 ⎥


⎢⎣0 2 3 5 2 ⎥⎦

Modo Estable? Estabilizable? Detectable?


2 no si no
- 0.3 ± 0.4i si si si
3 no si si

Nota: para verificación del anterior ejemplo utilice las pruebas PBH de controlabilidad y
observabilidad.

1.6 Transformaciones Similares y Descomposición Canónica de


Kalman

Los sistemas dinámicos pueden ser descritos en diferentes sistemas de coordenadas.


Por ejemplo, un péndulo puede ser descrito en función del ángulo de su cuerda o de la
altura del péndulo. De igual forma cualquier sistema dinámico puede ser representado
en otros sistemas de coordenadas distintos al así llamado sistema natural de
coordenadas. En ocasiones la representación en otro sistema de coordenadas facilita el
análisis del sistema dinámico.

Sea T ∈ℜ n × n una matriz no singular (invertible). Se define la transformación lineal de


cambio de coordenadas como:

x = T −1 x
Sistemas Multivariables 17

Entonces en el nuevo sistema de coordenadas las ecuaciones el sistema dinámico (1.5)


y (1.6) serán

.
x = T −1 AT x + T −1 Bu (1.19)
y = CT x + Du

Estas ecuaciones representan el mismo sistema dinámico, para cualquier matriz no


singular T. Obsérvese, que la matriz A se ve transformada por una operación de la
forma T −1 AT , esta transformación matricial se conoce con el nombre de
transformación de similaridad [11]. Fácilmente, se puede probar que la matriz de
transferencia G(s) no se ve alterada por el cambio de coordenadas,

G ( s ) = C ( sI − A) −1 B + D = CT ( sI − T −1 AT ) −1 T −1 B + D.

El principio de la descomposición de Kalman formula que:


“Dado un sistema dinámico descrito por [A,B,C,D]. Siempre es posible encontrar una
transformación T invertible, tal que las matrices transformadas tengan la estructura:

r1 r2 r3 r4
r1 ⎛ Aco 0 A13 0 ⎞
−1
⎜ ⎟
T AT = r2 ⎜ A21 Aco A23 A24 ⎟
r3 ⎜ 0 0 Ac o 0 ⎟
⎜ ⎟
⎜ 0 0 A43 Ac o ⎟⎠
r4 ⎝
m (1.20)
r1 ⎛ Bco ⎞ r1 r2 r3 r4
⎜ ⎟
−1
T B = r2 ⎜ Bco ⎟ ,CT = p (Cco 0 Cc o 0)
r3 ⎜ 0 ⎟
⎜ ⎟
⎜ 0 ⎟
r4 ⎝ ⎠

donde r1, ...,r4 son las dimensiones de los bloques,

r1 = rango(OC), r2 = rango(C) − r1 ,
r3 = rango(O) − r1 , r4 = n − r1 − r2 − r3 .
El subsistema

[Aco , Bco , Cco , D ]


es controlable y observable, el subsistema
18 J. Espinosa

⎡⎛ Aco 0 ⎞ ⎛ Bco ⎞ ⎤
⎢⎜ ⎟ , ⎜ ⎟ , (C 0), D⎥
⎣⎝ A21 Aco ⎠ ⎝ Bco ⎠ co ⎦

es controlable. El subsistema

⎡⎛ Aco A13 ⎞ ⎛ Bco ⎞ ⎤


⎢⎜ ⎟ , ⎜ ⎟ , (C Cco ), D⎥
⎣⎝ 0 Aco ⎠ ⎝ 0 ⎠ co ⎦
es observable. El subsistema

[A co , 0, 0, D ]
no es controlable, no observable.

Para explicar un poco mejor la función de los distintos bloques observe el siguiente
sistema dinámico [A,B,C,D] transformado a través de la descomposición de Kalman
en:
.
⎡ xco ⎤ ⎡ Aco 0 0 ⎤ ⎡ xco ⎤ ⎡ Bco ⎤
0
⎢ x. ⎥ ⎢ 0 Aco 0
⎥ ⎢ ⎥
0 ⎥ ⎢⎢ xco ⎥⎥ ⎢ Bco ⎥
⎢ .co ⎥=⎢ + u
⎢ xco ⎥ ⎢ 0 0 Aco 0 ⎥ ⎢ xco ⎥ ⎢ Bco ⎥
⎢. ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎣ xco ⎦ ⎣ 0 0 0 Aco ⎦ ⎣ xco ⎦ ⎣ Bco ⎦
⎡ xco ⎤
⎢x ⎥
y = [Cco 0 Cco 0]⎢ ⎥
co

⎢ xco ⎥
⎢ ⎥
⎣ xco ⎦

La respuesta en el tiempo del sistema será:


⎡ A t Bco u(τ )dτ ⎤
⎡ xco (t ) ⎤ ⎢ e co xco (0) + ∫0 e co
t
A ( t −τ )

⎢ x (t ) ⎥ ⎢ A t
⎥ = ⎢e xco (0) + ∫0 e Bco u(τ )dτ ⎥
t
Aco ( t − τ )
⎢ co co


⎢ xco (t ) ⎥ ⎢ ⎥
⎢ ⎥ ⎢ e Aco t
x ( 0 )

co
⎣ xco (t ) ⎦ e Ac o t xco (0)
⎣ ⎦

y (t ) = Cco xco (t ) + Cco xco (t );

Observe, que xc o (t ) y xc o ( t ) no son alterados por la entrada u, estos son los estados
no controlables, en tanto que xco ( t ) y xc o ( t ) no tienen influencia en la salida y, estos
son los estados no observables. Si asumimos x( 0) = 0 la salida queda reducida a:

y ( t ) = ∫ Cco e Aco ( t −τ ) Bco u(τ ) dτ .


0
Sistemas Multivariables 19

Para efectos prácticos la matriz de transformación T se puede calcular a partir de la


factorización en valores singulares de la matrices de controlabilidad y
observabilidad , la matriz T esta compuesta por cuatro submatrices descritas así:
T = [T1 T2 T3 T4 ]
donde
T1 = R ∩ S
T2 = R ∩ S ⊥
T3 = R⊥ ∩ S
T4 = R⊥ ∩ S ⊥
R es una base del subespacio controlable, S es una base del subespacio observable y
R⊥ y S ⊥ son los respectivos complementos ortogonales o sea las bases de los
subespacios no controlables y no observables.

Cont rolable
Obser vable
+

Cont rolable
No
Obser vable

No
Cont rolable
Obser vable

No
Cont rolable
No
Obser vable
Figura 1.2 Descomposición canónica de Kalman
La descomposición canónica de Kalman es aplicable a sistemas discretos sin ninguna
modificación.

1.6.1 Realización Mínima

Una realización mínima es aquella que tiene la matriz A de menor tamaño para todas
las tripletas [A,B,C] que satisfacen:

G( s) = C( sI − A) −1 B + D

donde G(s) es una matriz de transferencia.


El sistema [A,B,C,D] es mínimo sí y solo sí es controlable y observable.

1.6.2 Otras Formas Canónicas


20 J. Espinosa

1.6.2.1 Forma Canónica Controlable

Dado un sistema de simple entrada múltiples salidas descrito por:

⎡ A b⎤ p×n
G( s ) = ⎢ ⎥, b ∈ℜ , C ∈ℜ , d ∈ℜ
n p

⎣ C d ⎦

asumiendo que (A,b) es controlable. El sistema G(s) se puede transformar en un


sistema de la forma:

⎡− a1 − a2 ... − an −1 − an ⎤ ⎡1⎤
⎢ 1 0 ... 0 0 ⎥ ⎢0⎥
⎢ ⎥ ⎢. ⎥
A1 = ⎢ 0 1 ... 0 0 ⎥, b1 = ⎢ .. ⎥,
⎢ ... ..
.
..
.
.. ⎥
. ⎥ ⎢0⎥
⎢ ⎢ ⎥ (1.21)
⎢⎣ 0 0 ... 1 0 ⎥⎦ ⎢⎣ 0 ⎥⎦
C1 = [ β 1 β 2 ... β n −1 β n ], d1 = d

donde

−1 β 1s n −1 + β 2 s n − 2 + ... + β n −1s + β n
G(s) = C(sI − A) b + d = + d,
s n + a1s n −1 + ... + an −1s + an

−1
⎡ A b ⎤ ⎡Tc ATc Tc b ⎤ ⎡ A1 b1 ⎤
G( s ) = ⎢ = ⎢ ⎥=

⎣C d ⎦ ⎣ CTc
−1
d ⎦ ⎢⎣C1 d1 ⎥⎦

la transformación Tc se define como,

Tc = C1C-1

C = [b Ab ... A n −1b]
[
C1 = b1 A1b1 ... ]
A1 n −1b1 .

Es importante comentar que esta forma canónica es apropiada para análisis y cálculos
manuales, pero en algunos casos puede generar problemas de condicionamiento
numérico en cálculos computacionales [9].

1.6.2.2 Forma Canónica Observable

Dado un sistema de múltiple entrada y simple salidas descrito por:


Sistemas Multivariables 21

⎡ A B⎤
G( s ) = ⎢ ⎥, B ∈ℜ n × m , c T ∈ℜ n , d T ∈ℜ m
⎣c d⎦

asumiendo que (c, A) es observable. El sistema G(s) se puede transformar en un


sistema de la forma:

⎡ − a1 1 0 ...
0⎤ ⎡ η1 ⎤
⎢ −a 0 1 ...
0 ⎥ ⎢η ⎥
⎢ .2 .. .. .. ⎥ ⎢ .2 ⎥
A1 = ⎢ .. . . . ⎥, B1 = ⎢ .. ⎥,
⎢− a 0 0 ... 1 ⎥⎥ ⎢η ⎥
⎢ n −1 ⎢ n −1 ⎥ (1.22)
⎢⎣ − an 0 0 ... 0 ⎥⎦ ⎢⎣ η n ⎥⎦
C1 = [ 1 0 0 ... 0], d1 = d

donde

η1s n −1 + η 2 s n − 2 + ... + η n −1s + η n


G(s) = C(sI − A) −1 b + d = + d,
s n + a1s n −1 + ... + an −1s + an

−1
⎡ A B⎤ ⎡To ATo To b⎤ ⎡ A1 B1 ⎤
G( s ) = ⎢ =⎢ ⎥=

⎣ c d ⎦ ⎣ cTo
−1
d ⎦ ⎢⎣ c1 d1 ⎥⎦

la transformación To se define como

To = O1 −1O

⎡ c ⎤ ⎡ c1 ⎤
⎢ cA ⎥ ⎢ c A ⎥
O = ⎢ .. ⎥, O1 = ⎢ .. ⎥.
1 1

⎢ . ⎥ ⎢ . ⎥
⎢ n −1 ⎥ ⎢ n −1 ⎥
⎣cA ⎦ ⎣c1 A1 ⎦

Es importante, tener en cuenta, que esta forma canónica es apropiada para análisis y
cálculos manuales, pero sus propiedades desde el punto de vista numérico son pobres
y pueden generar errores de cálculo[9].

1.7 Ejercicios del Capitulo


Ejercicios Numéricos

Construya un vector usando el número de su documento de identidad.

p.e. cc=[ 9 2 1 4 5 3 2 0]
22 J. Espinosa

1 -construya el siguiente sistema dinámico continuo [A B C D]

⎡− cc(1) − 1 0 0 0 ⎤
⎢ 0 − cc(2) − 2 cc(3) + 1 0 ⎥
A= ⎢ ⎥
⎢ 0 − cc(3) − 1 − cc(2) − 2 0 ⎥
⎢ ⎥
⎣ 0 0 0 − cc(4) − 3⎦

⎡cc(5) + 1 0 0 ⎤
⎢ 0 cc(6) + 1 0 ⎥⎥
B= ⎢
⎢ 0 cc(5) + cc(6) + 1 cc(7) + 1⎥
⎢ ⎥
⎣ 0 0 0 ⎦
⎡0 0 cc(1) + 1 0 ⎤
C=⎢
⎣0 0 0 cc(8) + 1⎥⎦
⎡0 0 0 ⎤
D=⎢ ⎥
⎣0 0 0 ⎦

2- Verifique la estabilidad del sistema.

3- Construya las matrices de controlabilidad y observabilidad.

4- Corrobore la controlabilidad y la observabilidad usando el método PBH.

5- Construya una matriz T que permita realizar la descomposición canónica de


Kalman, verifique el resultado

6- Para cada una de las entradas genere una matriz de transformación T que permita
obtener la representación canónica controlable.

7- Para cada una de las salidas genere una matriz de transformación T que permita
obtener la representación canónica observable.

Ejercicios teóricos.

1 – Pruebe el criterio de observabilidad PBH

2- Pruebe que para cualquier par [A1,B] donde


⎡λ 0 0 ⎤ ⎡0⎤
⎢ ⎥
A1 = ⎢ 0 λ 1 ⎥ y B = ⎢⎢b ⎥⎥ b ≠ 0
⎢⎣ 0 0 λ ⎥⎦ ⎢⎣0⎥⎦
siempre será no controlable.

3- Encuentre las condiciones que debe tener el vector fila c tal que [c,A2]sea siempre
observable.
Sistemas Multivariables 23

⎡λ 1 0 ⎤
A2 = ⎢⎢ 0 λ 1 ⎥⎥
⎢⎣ 0 0 λ ⎥⎦
Capítulo 2 Control Desacoplado

2.1 Introducción

La gran mayoría de sistemas de control se diseñan para comandar sistemas de tipo


multivariable. La correcta elección de las variables controladas y las variables
manipuladas así como de los lazos de control que las relacionan son de particular
importancia para garantizar la implementación de un sistema de control exitoso.

La aproximación más natural al problema de control multivariable ha sido la de tratar


de desagregar el sistema en múltiples lazos sencillos de una entrada y una salida. En
este capitulo se estudiaran los métodos de análisis que permiten definir las
interacciones entre los distintos lazos de un sistema y la metodología que nos permite
definir cuando un sistema puede ser sintonizado utilizando las metodologías de
control clásico aplicadas a sistemas de una entrada y una salida.

Este capítulo ha sido dividido en las siguientes secciones, la primera sección muestra
la importancia de las interacciones entre los distintos lazos de control, la segunda
sección nos presenta una poderosa herramienta para el análisis de las interacciones la
matriz de ganancias relativas y finalmente la tercera sección muestra el diseño de
desacopladores como herramienta de síntesis de controladores.

2.2 Interacción en Sistemas Multivariables

Para facilitar la presentación de los conceptos asumamos la existencia de un sistema


como el que se muestra en la Figura 2.1. Los bloques Gij representan bloques de
ganancia dinámica. El sistema se encuentra descrito por las siguientes ecuaciones:
y1 = G11u1 + G12 u 2 2.1
y 2 = G 21u1 + G 22 u 2
Asuma que las ganancias G11 y G22 son bloques con dinámica de primer orden y sin
retardo. Ahora si asumimos que no existe interacción entre los lazos (G12 y G21=0), si
se aplica un control de ganancia proporcional (Kp1 y Kp2) a cada lazo, se obtienen que
los polinomios característicos del sistema serán:
26 J. Espinosa

u1 G11 y1

G12

G21

u2 G22 y2

Figura 2.1 Multivariable System with 2 Inputs and 2 Outputs


1 + K p1G11 = 0 y 1 + K p 2 G 22 = 0

Ya que los sistemas son de primer orden el sistema será estable para cualquier valor
de ganancia en el controlador.

Ahora suponga que los dos lazos están interactuando ( G12 , G21 ≠ 0 ), entonces
obtendremos una única ecuación característica del sistema, de la forma:

(1 + K p1G11 )(1 + K p 2 G22 ) − G12 K p 2 G21 K p1 = 0


La aparición del signo negativo en la ecuación característica nos indica que el sistema
será estable, solo para ciertos valores de las ganancias proporcionales Kp1 y Kp2.

Entonces diremos que existe interacción si la respuesta de una variable controlada


frente al cambio de una variable manipulada cambia al cerrar otro de los lazos
presentes en el sistema.

El problema de interacción entre lazos puede ser aliviado a través de una selección
adecuada de pares de variables manipuladas y controladas. Para un sistema de 2x2 el
problema es relativamente simple. Si el sistema en el cual la variable u1 controla la
variable y1 y la variable u2 controla la variable y2 no presenta un desempeño
adecuado, entonces el sistema se deberá organizar de forma que u1 controle y2 y u2
controle y1.
Sin embargo sistemas más grandes serán mucho más complejos, al punto que un
sistema de NxN tiene N! (N factorial) posibles combinaciones. Es por ello que es
importante evaluar de manera cuantitativa el grado de interacción entre los distintos
lazos de control. Esta información se puede utilizar para diseñar un sistema con
mínimas interacciones. Esa herramienta cuantitativa existe y se conoce con el nombre
de Matriz de Ganancias Relativas (Relative Gain Array-RGA).
Control Desacoplado 27

2.3 La Matriz de Ganancias Relativas

La matriz de ganancias relativas es una herramienta muy importante en el análisis de


sistemas multivariable. No es solamente una herramienta importante en la selección
de pares de variables manipuladas y controladas, sino que también ha sido utilizada
para predecir el comportamiento de respuestas controladas.

Para presentar esta herramienta inicialmente se utilizara el sistema mostrado en la


Figura 2.1. Asuma Kij sea la ganancia estática de la función de transferencia Gij. Si
asumimos que u2 se mantiene constante un cambio en la variable u1 de magnitud
∆u1 producirá un cambio ∆y1 en la salida y1. De forma que:
∆y1
K 11 u =
2
∆u1 u2

si en lugar de mantener u2 constante, ahora mantenemos la salida y2 constante


cerrando el lazo entre u2 y y2 (control perfecto!!). Un paso de magnitud ∆u1 producirá
un cambio diferente ∆y1 . La ganancia bajo estas nuevas condiciones será expresada de
la forma:
∆y
K11 y = 1
2
∆u1 y
2

A pesar de que las ganancias anteriores fueron obtenidas entre la misma entrada y
salida esta puede presentar valores distintos ya que ha sido obtenida bajo distintas
condiciones. Si existe interacción con otros lazos estas dos ganancias serán distintas.
El cociente,
K11 u 2.2
λ11 = 2

K11 y
2

donde λ11 es un valor adimensional llamado ganancia relativa entre la salida y1 y la


entrada u1 y que provee la siguiente información:
• Si λ11 = 0 quiere decir que el cambio en la entrada u1 no afecta la salida y1 y
por ende no deberá ser utilizada para controlar y1.
• Si λ11 = 1 quiere decir que K 11 u es igual a K 11 y . Eso quiere decir que la
2 2

ganancia entre la salida y1 y la entrada u1 no se vera afectada por el lazo entre


la entrada u2 y la salida y2.
En un sistema de 2x2 existen otras tres ganancias relativas:

K12 (∆y1 ∆u 2 ) u 2.3


λ12 = =
u1 1

K12 y2
(∆y1 ∆u 2 ) y
2

K 21 u (∆y 2 ∆u1 ) u 2.4


λ21 = 2
= 2

K 21 y1
(∆y 2 ∆u1 ) y
1

K 22 (∆y 2 ∆u 2 ) u 2.5
λ22 = =
u2 2

K 22 y2
(∆y 2 ∆u 2 ) y
2
28 J. Espinosa

Finalmente agrupando los elementos λij se construye la Matriz de Ganancias


Relativas (Relative Gain Array-RGA).

⎡λ λ12 ⎤
Λ = ⎢ 11 ⎥
⎣λ21 λ22 ⎦
De manera general para un sistema de N entradas y N salidas, existen (NxN)
elementos de ganancia relativa entre la salida yi y la entrada u j esos elementos están
dados por la expresión:
K ij (∆yi ∆u j ) u 2.6
λij = u
=
K ij (∆yi ∆u j )
y y

Donde los subíndices y y u denotan los valores constantes de


u m , m ≠ j; y n , n ≠ i respectivamente y la matriz de ganancias relativas para el sistema
de NxN será:
⎡ λ11 λ12 … λ1N ⎤ 2.7
⎢λ λ22 … λ2 N ⎥⎥
Λ = ⎢ 21
⎢ ⎥
⎢ ⎥
⎢⎣λN 1 λN 2 … λNN ⎥⎦

El cálculo de los parámetros de la matriz de ganancias relativas puede parecer


complicado y tedioso, en la practica no es ese el caso ya que los elementos de la
matriz tienen las siguientes propiedades:
• La suma de todos los elementos de cada columna es igual a uno
N

∑λ
i =1
ij = 1, j = 1, 2, …, N

• La suma de todos los elementos de cada fila es igual a uno


N

∑λ
j =1
ij = 1, i = 1, 2,…, N

Eso implica que para un sistema de (2x2) solo un elemento deberá ser calculado ( λ11 )
λ12 = 1 − λ11 λ21 = λ12 λ22 = λ11
de la misma manera en un sistema de NxN solo (N-1)*(N-1) elementos deberán ser
calculados.

El método presentado anteriormente es un método experimental. Si conocemos un


modelo del sistema será posible calcular la matriz de ganancias relativas de manera
analítica. Si tomamos el siguiente modelo de estado estacionario,
y1 = K11u1 + K12 u 2
y 2 = K 21u1 + K 22 u 2
donde K ij son las ganancias de estado estable de la matriz de la función de
transferencia del sistema. Entonces
∂y
K 11 u = 1 = K11
2
∂u1 u
2

eliminando u2 de las relaciones de estado estable, nos da:


Control Desacoplado 29

y1 = K11u1 + K12 ( y 2 − K 21u1 ) / K 22


Derivando con respecto a u1 y manteniendo constante y2 nos da:
∂y
K11 y = 1 = K11 + K12 K 21 / K 22
2
∂u1 y
2

La ganancia relativa λ11 estará dada por la expresión:


K11 u 1
λ11 = 2
=
K11 y 1 − ( K12 K 21 ) /( K11 K 22 )
2

las demás ganancias relativas se pueden calcular de manera similar.

2.4 Selección de Lazos de Control Usando la Matriz de Ganancias


Relativas

Una vez construida la Matriz de Ganancias Relativas se lleva a cabo el análisis que
permite la selección de los pares variable manipulada-variable controlada. Las
siguientes situaciones se pueden presentar:
a) Si λij = 0 , implica que no existe relación entre la variable manipulada j y la
variable controlada i por lo cual para controlar la variable controlada i se
necesitará usar otra variable manipulada.
b) Si λij = 1 , implica que no hay interacción con otros lazos y por ende el
controlador podrá ser diseñado sin tener en cuenta los otros lazos
c) Si 0 < λij < 1 , implica que los otros lazos forman un lazo de realimentación
negativa en paralelo con el lazo principal. Esto implica un aumento de la
ganancia en estado estable del sistema por lo cual la ganancia del controlador se
deberá reducir y ajustes en las acciones proporcional e integral.
d) Si λij < 0 , significa que el numerador y el denominador tienen distinto signo lo
cual implica que cuando se cierran los otros lazos de control el sistema se verá
sometido a realimentación positiva lo cual generara inestabilidad, en la práctica
esto significa una dificultad muy grande para realizar un controlador distribuido.
e) Si λij > 1 , significa que la interacción de los otros lazos reduce el efecto de las
acciones de control aplicadas al par ij. Entre más grande sea este valor mayor será
la inhibición de la acción de la variable manipulada j sobre la variable controlada
i.

Ejemplo

El sistema de mezcla mostrado en la siguiente figura será motivo de análisis en


nuestro texto.
30 J. Espinosa

AC

X
m1
FC
Analizador

m2

Figura 2.2 Sistema de Mezcla de dos compuestos


Para efectos de estudios asumiremos solo relaciones estáticas en nuestro modelo, el
balance de masa del sistema y de los componentes estará dado por:

F = m1 + m2 2.8
m1 2.9
x=
m1 + m2

En este sistema el objetivo es controlar el flujo total F de manera que mantenga la


concentración x en un valor dado. La pregunta es: ¿Cuál es la influencia de cada
variable manipulada m1 y m2 sobre las variables controladas F y x?

Primero calculamos la ganancia m1-F cuando el lazo m2-x esta abierto. Derivando la
ecuación (2.8):
2.10
∂F
=1
∂m1 m
2

Ahora se hace el análisis asumiendo control “perfecto” de la concentración x .


Nuevamente derivamos la ecuación (2.8).
2.11
∂F ∂m
=1+ 2
∂m1 x ∂m1 x
∂m2
El término se obtiene derivando la expresión (2.9) con respecto a m1.
∂m1 x
⎛ ∂m ⎞ 2.12
x ⎜1 + 2 ⎟ =1
⎜ ∂m1 ⎟
⎝ x⎠

∂m2
Despejando el término de la ecuación (2.12) y reemplazándolo en la ecuación
∂m1 x
(2.11)
Control Desacoplado 31

2.13
∂F 1
=
∂m1 x x
La ganancia relativa para el par m1-F será:
2.14
∂F
∂m1 m
λm1− F = 1
=x
∂F
∂m1 x

Completando la matriz resultará en:


m1 m2 2.15
F⎡ x 1 − x⎤
Λ=
x⎢ ⎥■
⎣1 − x x ⎦
El análisis de sistemas con un mayor numero de entradas puede parecer tedioso si se
realiza de la manera que se ha hecho hasta este punto. Afortunadamente existe un
método eficiente que nos permite calcular la matriz de ganancias relativas de forma
matricial:
RGA(G ( jω )) = G ( jω ).*(G ( jω ) −1 )T 2.16
Donde el símbolo .* denota una multiplicación termino a termino.

Observe que hasta este instante solo se habían hecho análisis para valores de ω = 0 ,
sin embargo la expresión (2.16) nos muestra que dicho análisis puede ser extendido a
cualquier frecuencia por lo general este análisis solo tiene sentido hacerlo a la
frecuencia 0 y a la frecuencia de corte ( ω c ) esperada para el sistema.

Las reglas de selección se pueden resumir de la siguiente manera:

1- Trate de hacer lazos con aquellos elementos en los cuales el RGA(G ( jω c )) lo


más cercano posible al punto 1+j0 en el plano complejo.
2- Evite hacer lazos con aquellos pares que tienen valores negativos de ganancia
relativa en estado estable RGA(G (0)) .

Ejemplo 2-1

En este ejemplo utilizaremos una columna de destilación para separación de crudo


pesado. La columna es alimentada por el plato inferior y genera tres fracciones,
nuestro interés se centra en la composición de la fracción superior e intermedia.

Consideramos como variables controladas:


y1 Concentración del compuesto retirado en la cabeza de la columna.
y2 Concentración del compuesto retirado en la parte media de la columna.
y3 Temperatura de reflujo inferior.

Las variables manipuladas son:


32 J. Espinosa

u1 Flujo del compuesto de la cabeza de la columna.


u2 Flujo del compuesto intermedio.
u3 Referencia al controlador de la temperatura del plato inferior.

⎡Y1 ( s ) ⎤ ⎡U1 ( s ) ⎤
⎢Y ( s )⎥ = G ( s ) ⎢U ( s )⎥
⎢ 2 ⎥ ⎢ 2 ⎥
⎢⎣Y3 ( s ) ⎥⎦ ⎢⎣U 3 ( s ) ⎥⎦

donde
⎡ 4.05e − 27 s 1.77e− 28s 5.88e − 27 s ⎤
⎢ ⎥
⎢ 50 s + 1 60 s + 1 50 s + 1 ⎥
⎢ 5.39e − 18s 5.72e − 14 s 6.90e − 15s ⎥
G(s) = ⎢ ⎥
⎢ 50 s + 1 60 s + 1 40 s + 1 ⎥
⎢ 4.38e − 20 s 4.42e − 22 s 7.20 ⎥
⎢ ⎥
⎢⎣ 33s + 1 44 s + 1 19 s + 1 ⎥

asumiendo un ancho de banda 1/50 rad/s, para el análisis usaremos únicamente las
variables manipuladas ligadas a la composición el análisis nos dará los siguientes
resultados:
~ ⎡ 0.3203 − 0.5946 1.2744 ⎤
RGA(G (0)) = ⎢ ⎥
⎣− 0.017 1.5733 − 0.5563⎦
y
~ ⎡ 0.4792 − 0.3558 j − 0.6325 − 0.0158 j 1.1532 + 0.3716 j ⎤
RGA(G ( j / 50)) = ⎢ ⎥
⎣− 0.1256 + 0.3558 j 1.5763 + 0.0158 j − 0.4507 − 0.3716 j ⎦

Para hacer el análisis de cual variable deberá controlar y1 , para ello debemos mirar la
primera fila de las matrices RGA, de ellas es posible deducir que la variable
manipulada u2 deberá ser evitada ya que tiene signo negativo. Es claro que para las
dos frecuencias la entrada u3 es la mejor elección para controlar y1 . De manera
similar podemos decir que la mejor elección para controlar y2 es la entrada u2 . La
composición de la cabeza será controlada a través de la referencia de la temperatura
del plato inferior, la composición del compuesto será controlada a través del flujo de
dicho compuesto.

2.5 Control Multivariable Desacoplado

En ocasiones el encontrar un par adecuado de entrada y salida no es garantía de que el


sistema de control distribuido presente un desempeño adecuado debido a la
interacción aun presente entre los lazos del sistema. Una solución a este problema es
la construcción de un compensador que cancele las interacciones entre los lazos y
luego llevar a cabo la sintonía de los controladores en los lazos de manera individual.
El compensador que desarrolla la tarea de desacoplamiento se conoce con el nombre
de desacoplador.
Control Desacoplado 33

La función de los desacopladores es la de descomponer el sistema multivariable en


subsistemas de una variable. Si dicho sistema puede ser implementado de manera
ideal el sistema multivariable podrá ser controlado usando controladores
independientes.

Controlador Desacoplador Planta

Figura 2.3 Estructura General de un sistema de control desacoplado


La estructura detallada del sistema de control se muestra en la Figura 2.4

w1 u1 u1*
C1 D11 G11
y1

D12 G12

D21 G21

y2
C2 D22 G22
u2 u2*
w2
D ESAC O PLAD O R P L A N TA

Figura 2.4 Estructura del Sistema de Control Desacoplado


Este sistema se encuentra descrito por las siguientes ecuaciones:
Y ( s ) = G ( s )U * ( s ) 2.17

U * ( s ) = D( s )U ( s ) 2.18
U ( s ) = C ( s )(W ( s ) − Y ( s )) 2.19
Resolviendo

Y ( s ) = G ( s ) D ( s )U ( s ) = G ( s ) D ( s )C ( s )(W ( s ) − Y ( s )) 2.20

Nuestro objetivo es construir un sistema diagonal, ya que el controlador C(s) es un


sistema diagonal el objetivo será alcanzado garantizando que:
2.21
X ( s) = G ( s) D( s) = diag[ x1 ( s), x2 ( s)]
Para determinar D(s) será necesario calcular el inverso de G(s) ya que:
2.22
D ( s ) = G ( s ) −1 X ( s )
34 J. Espinosa

Donde G(s)-1 es:

adj (G ( s )) 2.23
G ( s ) −1 =
det(G ( s ))
Donde adj(G(s)) y det(G(s)) denota la adjuntan respectivamente la adjunta y el
determinante de G(s) y para el sistema presente nos da:

det(G ( s)) = G11 ( s)G22 ( s) − G12 ( s)G21 ( s)

⎡ G (s) − G12 ( s ) ⎤
adj ( G ( s )) = ⎢ 22
⎣ − G 21 ( s ) G11 ( s ) ⎥⎦
entonces el desacoplador tendrá la forma:
2.24
⎡ G22 ( s ) x1 ( s ) − G12 ( s ) x2 ( s )⎤
⎢− G ( s) x ( s) G ( s ) x ( s) ⎥
D( s) = G ( s) X ( s) = ⎣ 21
−1 1 11 2 ⎦
det(G ( s ))

La representación más simple será asumiendo los términos en la diagonal principal


iguales a uno, con lo cual se obtiene el sistema:
2.25
⎡ 1 − G12 ( s ) G11 ( s )⎤
D( s ) = ⎢ ⎥
⎣− G21 ( s) G22 ( s ) 1 ⎦

De esta manera los controladores verán a G(s)D(s) como la planta:

2.26
⎡ G12G21 ⎤
⎢G11 ( s ) − G 0 ⎥
G ( s) D( s) = ⎢ 22

⎢ G21G12 ⎥
0 G22 ( s ) −
⎢⎣ G11 ⎥⎦

Consideraciones sobre la implementación de desacopladores

Las acciones aplicadas por el desacoplador son similares a una acción de tipo
feedforward y por ello se encontrarán el mismo tipo de dificultades a la hora de
implementar dichos controladores. El uso de los desacopladores esta restringido a la
planta lineal, esto debido a que se utiliza un mecanismo de cancelación. Un cambio de
punto de operación en una planta lineal causara que la cancelación no sea eficaz. El
hecho de ser un mecanismo de cancelación restringe la aplicabilidad del método ya
que no podrá ser aplicado con plantas que tienen ceros de fase no mínima ya que la
cancelación generara polos inestables. Errores en el modelo también pueden causar
problemas.
Control Desacoplado 35

Un problema aun más serio se puede presentar cuando la metodología se aplica a


plantas con retardos. Suponga que la planta incluye las siguientes funciones de
transferencia:
K e −θ12 s K e −θ11s
G12 = 12 y G11 = 11
1 + τ 12 s 1 + τ 11s
donde θ ij y τ ij son respectivamente el retardo y la constante de tiempo del sistema, ya
que el desacoplador incluye la ganancia G12 G11 si calculamos esta relación
obtendremos:

G12 ( s ) K12 (1 + τ 11s ) (θ11 −θ12 ) s 2.27


= e
G11 ( s ) K11 (1 + τ 12 s )
Si se da el caso de θ11 > θ12 el argumento de la exponencial será positivo lo cual se
traduce en la necesidad de tener valores futuros para implementar el sistema, lo cual
es imposible.

Debido a estas dificultades los desacopladores “ideales” son raramente utilizados.


Una aproximación se aplica a problemas en los cuales la planta tiene retardos. En la
simplificación se asumen retardos nulos en el desacoplador. Otra aproximación es
ignorar las dinámicas de orden superior. Adicionalmente se pueden utilizar redes de
dsacoplamiento parcial donde uno sola de las interacciones es cancelada.
Posiblemente la simplificación más drástica es la construcción de desacopladores con
ganancia fija, calculada bien sea sobre la ganancia estática o sobre la ganancia a la
frecuencia de corte.

Ejemplo 2-2
En este ejemplo se utilizara el modelo de la columna de destilación presentado en el
Ejemplo 2-1. Tomando únicamente las entradas [u3 , u2 ]T hasta la salidas [ y1 , y2 ]T la
función de transferencia es:
⎡ 5.88e −27 s 1.77e −28 s ⎤
⎢ 60s + 1 ⎥⎥
G ( s ) = ⎢ 50s +−151s
⎢ 6.90e 5.72e −14 s ⎥
⎢⎣ 40s + 1 60s + 1 ⎥⎦

el sistema tiene un modelo de perturbación:


Y ( s ) = G ( s )U ( s ) + Gd ( s )V ( s )
⎡1.44e − 27 s ⎤
⎢ 40 s + 1 ⎥
⎢ ⎥
⎢ 1.83e −15 s ⎥
Gd ( s ) =
⎢ 20 s + 1 ⎥
⎢ 1.26 ⎥
⎢ 32s + 1 ⎥
⎣ ⎦
sin desacoplador el siguiente controlador fue diseñado:
36 J. Espinosa

⎡ 50 s + 1 ⎤
⎢ 300 s 0 ⎥
C ( s) = ⎢
60s + 1⎥
⎢ 0 ⎥
⎣ 300 s ⎦
Tomando únicamente la ganancia G(0)
⎡5.88 1.77 ⎤
G (s ) = ⎢ ⎥
⎣6.90 5.72⎦
El desacoplador diseñado con esta estrategia será:
⎡ 1 − 0.3010⎤
D(0) = ⎢ ⎥
⎣− 1.2063 1 ⎦
La siguiente grafica compara las respuestas de los dos sistemas, observe la apreciable
reducción del impacto causado por la interacción entre los lazos del sistema.
Senhales de Salida para el sistema interactivo Senhales de Salida para el sistema desacoplado
1.4 1.2
--Y1 -- Y1
Y2 Y2
1.2 1

1 0.8
Cambio en Setpoint de Y2

0.8 Cambio en Setpoint de Y2 0.6

0.6 0.4 Cambio en Setpoint de Y1


Cambio en Setpoint de Y1

0.4 0.2

0.2 0

0 -0.2
0 200 400 600 800 1000 1200 1400 1600 0 200 400 600 800 1000 1200 1400 1600

(a) (b)
Senhales de entrada para el sistema interactivo Senhales de entrada para el sistema desacoplado
0.3 0.3
-- U3 -- U3
U2 U2
0.2 0.2

Cambio en Setpoint de Y2
0.1 Cambio en Setpoint de Y2
0.1

Cambio en Setpoint de Y1
0 0
Cambio en Setpoint de Y1

-0.1 -0.1

-0.2 -0.2

-0.3
-0.3

-0.4
-0.4 0 200 400 600 800 1000 1200 1400 1600
0 200 400 600 800 1000 1200 1400 1600

(c) (d)
Figura 2.5 Comparación del sistema de control para la columna de destilación (a) Salidas sin
desacoplador (b) Salidas con desacoplador (c) Entradas sin Desacoplador (d) Entradas con
desacoplador

2.6 Comentarios y Conclusiones

El diseño de sistemas de control sin interacción, estará precedido siempre de un


análisis de ganancia relativa que permite determinar los pares y las interacciones. Este
análisis es valioso ya que nos permite mejorar las condiciones de diseño del
Control Desacoplado 37

desacoplador. La selección de los pares usando el análisis de ganancia relativa


permite reducir el trabajo que el desacoplador debe ejecutar.

Los pasos de diseño usando las técnicas presentadas en este capítulo se pueden
resumir así:
a) Haga un análisis de ganancia relativa que permita encontrar los pares de
entrada y salida que reducen las interacciones.
b) Diseñe un sistema de control distribuido, y evalúe el desempeño observando el
impacto de las interacciones.
c) Si el desempeño de este sistema no es el adecuado debido a las interacciones
con otros lazos diseñe una red de desacople.

2.7 Ejercicios del Capitulo

1- Haga un análisis de ganancia relativa (RGA) para el siguiente sistema:


⎡ 2 3 ⎤
⎢s +1 s + 2⎥
G ( s) = ⎢
1 1 ⎥
⎢ ⎥
⎣s +1 s +1⎦
asuma una frecuencia de corte de 5 rad/s.

2- Para el ejemplo de la columna de destilación presentado en el texto calcule los


controladores PI para los lazos y1 − u3 y y2 − u2 y analice las respuestas del
sistema. (implemente el modelo en Simulink). Haga las simulaciones abriendo
y cerrando los respectivos lazos.
3- Haga un análisis de ganancia Relativa para el siguiente modelo linealizado de
la caldera de una central termoeléctrica:
⎡− 0.005509 0 0 − 0.1588⎤
⎢ 0 − 0.2062 0 0 ⎥
A= ⎢ ⎥
⎢ − 0.01216 0 0 − 0.5672⎥
⎢ ⎥
⎣ 0 0 0 − 0.040 ⎦
⎡ 0.280 0 − 0.01348 0 ⎤
⎢ − 9.375 7.658 0 0 ⎥⎥
B= ⎢
⎢ 0 0 0.7317 0 ⎥
⎢ ⎥
⎣0.02999 0 0 0.040⎦
⎡ 14.21 0 0 0 ⎤
⎢ 0 1.0 0 0 ⎥⎥
C= ⎢
⎢0.3221 0 0.1434 11.16⎥
⎢ ⎥
⎣0.4133 0 0 19.28⎦
⎡ 0 0 0 0⎤
⎢ 0 0 0 0⎥⎥
D= ⎢
⎢1.272 0 − 0.2080 0⎥
⎢ ⎥
⎣ 0 0 0 0⎦
38 J. Espinosa

Las entradas del sistema son:


U1 – Entrada de combustible
U2- Entrada de aire
U3- Entrada de agua
U4- Válvula de control de vapor

Las salidas
Y1- Es la presión en la caldera
Y2- %de oxigeno en los gases de salida
Y3 Nivel de agua
Y4 Flujo de vapor

Si es viable defina un sistema de control que mantenga las variables Y1-Y3


constante y permita alcanzar un flujo de vapor determinado.

4- Para el ejemplo de la columna de destilación:


- Diseñe una red de desacople estática evaluada a la frecuencia 1/50
rad/sec
- Diseñe una red de desacople dinámica
Compare las respuestas

5- Realice un análisis de ganancia relativa para el siguiente sistema y diseñe un


sistema de control distribuido con y sin acople. Diseñe desacopladores
estáticos y dinámicos.
⎡ 1 2 ⎤
⎢ s + 3⎥
G ( s) = ⎢ s + 1
1 1 ⎥
⎢ ⎥
⎣s +1 s +1⎦
Capítulo 3 Método de Ubicación de Polos

3.1 Introducción
Una de las características que hacen atractiva la representación de estado es que la
síntesis del controlador se puede llevar a cabo en dos etapas, la primera asume la
posibilidad de medir todos los estados y realimentarlos a la entrada (que en la práctica
resulta costoso por el número de sensores) y la segunda etapa que involucra el diseño
de un estimador u observador de estado que permite estimar el valor presente de los
estados a partir de un número reducido de mediciones, haciendo viable la
implementación de la ley de control basada en los estados.

3.2 Realimentación de Estado

Para la realimentación de estado asuma que la entrada u=-Kx+v, entonces las


ecuaciones del nuevo sistema en lazo cerrado serán:

.
x = ( A − BK ) x + Bv (3.1)
y = (C − DK ) x + Dv.

v
B 1/s C
-
A

Figura 3.1 Realimentación de Estado


Las ecuaciones para el caso discreto tienen la misma presentación.
40 J. Espinosa

El sistema será gobernado por la matriz (A-BK) y los valores propios de esta matriz
serán los polos del sistema en lazo cerrado.

3.3 Ubicación de los polos

La pregunta que surge ahora es: ¿Dado un polinomio cualquiera de grado n,

α c ( s) = s n + α 1s n −1 +...+α n

con coeficientes reales y dadas las matrices (A,B) es posible encontrar al menos una
matriz K ∈ℜ m × n tal que det(sI − ( A − BK )) = α c (s) ? La respuesta es siempre que el
par (A,B) sea controlable es posible encontrar una matriz K tal que
det(sI − ( A − BK )) = α c (s) (ver prueba [7]).

Recuerde que la ubicación de las raíces de A depende de las especificaciones de


control tales como tiempo de subida, máximo sobrepico, ancho de banda, margen de
fase, tiempo de establecimiento etc. Otros valores típicos pueden ser tomados de los
polinomios óptimos para el criterio ITAE (Integral of Time multiplied by Absolute
Error, ver [8]) dan una respuesta rápida pero con sobreimpulso y los polinomios de
Bessel que dan una respuesta más lenta pero sin sobreimpulso.

Sabiendo que la controlabilidad del sistema garantiza la posibilidad de ubicar los


polos en un lugar deseado se hace necesario encontrar un método para calcular K. El
primer método y el más intuitivo es el llamado método directo.

3.3.1Ubicación de los Polos-Método Directo

Los elementos de la matriz K pueden ser calculados de modo algebraico resolviendo:

det( sI − ( A − BK )) = ( s − s1 )( s − s2 )...( s − sn )
donde s1, s2,..,sn son las raíces del polinomio αc(s) y son los polos deseados en lazo
cerrado.

Los valores de la matriz K pueden ser calculados igualando términos a ambos lados de
la ecuación.
Sin embargo, este método se vuelve tedioso para sistemas de orden superior a 3.

3.3.2Ubicación de los Polos-Sistemas de una entrada. Método de


Ackermann

Si tomamos las matrices del sistema Ac, Bc en la forma canónica controlable entonces:
Métodos de Asignación de Polos 41

⎡ − a1 − K1 − a2 − K2 ... ... − an − Kn ⎤
⎢ 1 0 ... ... 0 ⎥
⎢ ... ... ... .. ⎥
Ac − Bc K = ⎢ 0 . ⎥
⎢ .. ... ... ... .. ⎥
⎢ . . ⎥
⎢⎣ 0 ... 0 1 0 ⎥⎦

det( sI − ( Ac − Bc K )) = s n + ( a1 + K1 )s n −1 + ( a2 + K2 )s n −1 + ... + ( an + Kn )
Ya que el polinomio característico deseado tiene la forma:

α c ( s) = s n + α 1s n −1 +...+α n = ( s − s1 )( s − s2 ) ... ( s − sn )

los elementos de K serán:

K1 = a1 − α 1 , K2 = a2 − α 2 ,..., Kn = an − α n

El procedimiento de cálculo de K se puede resumir así:


• Transforme las matrices (A, B) a su forma canónica controlable (Ac, Bc).
• Halle la ley de control Kc utilizando el anterior procedimiento.
• Transforme Kc en K = Kc T −1 .
En forma compacta el procedimiento de diseño es:

K = [ 0 . . . 0 1] C−1α c ( A), (3.2)

donde es la matriz de controlabilidad y

α c ( A) = An + α 1 An −1 + α 2 An − 2 +...+α n I

La formula de Ackermann solo es aplicable a sistemas de una entrada y no es


aconsejable en sistemas de gran dimensión, debido a que el cálculo del polinomio
αc(A), puede generar errores numéricos, cuando los parámetros de A difieren en
magnitud de forma significativa[10].

Para el caso de múltiple entrada la solución de K no es única.

3.3.3Ubicación de los Polos-Sistemas de múltiple entrada. Método de


Ackermann

En sistemas de más de una entrada se pueden aprovechar las siguientes características


para aplicar la fórmula de Ackermann.

Si (A, B) es controlable, entonces para casi cualquier K r ∈ℜ m × n y casi cualquier


v ∈ℜ m , ( A − BK r , Bv ) es controlable entonces aplicamos la fórmula de Ackermann
para el nuevo sistema de una entrada ( A − BK r , Bv ) y obtenemos K s ∈ℜ1× n que nos
ubica los polos en el lugar deseado.
42 J. Espinosa

Los polos de ( A − BK ) estarán en el lugar deseado para una realimentación de estado


aplicada al sistema (A, B), de la forma:
u = − Kx = − ( Kr + vKs ) x

El procedimiento de cálculo de K se puede reducir a los siguientes pasos:


• Escoja arbitrariamente Kr y v de forma que ( A − BKr , Bv ) sea controlable.
• Use la fórmula de Ackermann para encontrar Ks para ( A − BKr , Bv ) .
• Encuentre la ganancia de realimentación de estado como K = Kr + vKs .

3.3.4Ubicación de los Polos en sistemas de múltiple entrada-salida -


Ecuación de Sylvester

Dada una matriz Λ


⎡ α1 β1 ⎤
⎢− β α1 ⎥
⎢ 1 ... ⎥
Λ=⎢ ⎥,
⎢ ⎥
⎢ λ1 ⎥
⎢⎣ . .. ⎥

con valores propios: α 1 ± jβ1 ,..., λ1 ,... que son los polos deseados para el sistema en
lazo cerrado.
Recuérdese que para un par controlable (A, B), existe una transformación de
similaridad X tal que:

X −1 ( A − BK ) X = Λ ⇒ AX − XΛ = BKX .
Esta ecuación se puede plantear como:

AX − XΛ = BG , (Ecuación de Sylvester en X) (3.3)


KX = G.

La ecuación de Sylvester es una ecuación matricial lineal en X. Se puede resolver si el


valor de G es conocido. Y se obtiene la ley de control:

K = GX −1 .

El procedimiento de cálculo de K se puede resumir en tres pasos:

• Escoja un valor arbitrario de G.


• Resuelva la ecuación de Sylvester en X.
• Calcule la ganancia de realimentación K = GX −1 .
• El método puede fallar, encontrándose una matriz X no invertible en ese caso se
debe realizar todo el procedimiento partiendo de una matriz G diferente.
Métodos de Asignación de Polos 43

Es importante tener en cuenta ciertos detalles, por ejemplo, siempre será posible
encontrar una solución para X, si A y Λ no tienen valores propios comunes.
Para sistema de simple entrada la matriz K es única e independiente de G.

3.4 Ejemplos
3.4.1 Carros Acoplados con Unión Flexible. [12]

Este sistema está compuesto por dos carros con masas M1 y M2 como se muestra en la
Figura 3.2. Los carros están unidos a través de un resorte con constante K . El carro
de la izquierda tiene un motor eléctrico que permite aplicar una fuerza F al sistema.
El objetivo del sistema de control es reducir la oscilación del segundo carro cuando el
primero cambia de posición, se espera un tiempo de establecimiento de 1 segundo y
un sobrepico menor al 10%. Como instrumentación hay instalados en cada carro un
potenciómetro que permite medir el desplazamiento.

x1 x2

K
F
M1 M2

Figura 3.2 Carros acoplados con union flexible.

El modelo del sistema será:


M 1 &x&1 = F − K ( x1 − x 2 )
.
M 2 &x&2 = K ( x1 − x 2 )
2 2
KmKg Km K g
F= V− x&1
Ra r1 Ra r 2 1
Donde:
M1 Masa del carro uno
= 0.98 Kg
M2 Masa del carro dos
= 0.58 Kg
K Constante del resorte
= 45.9 N/m
x1, x2 Posición de los carros 1 y 2 respectivamente
F Fuerza aplicada al carro uno (N)
V Voltaje aplicado al motor que acciona el carro uno
44 J. Espinosa

Km, Kg, Ra, r1 Constantes debidas al motor y la transmisión.

Las ecuaciones del sistema serán:

⎡ x1 ⎤ ⎡ 0 1 0 0 ⎤ ⎡ x1 ⎤ ⎡ 0 ⎤
⎢ x ⎥ ⎢ −46.84 −7.4 46.84 0 ⎥ ⎢ x ⎥ ⎢1.73⎥
⎢ 1⎥ = ⎢ ⎥⎢ 1⎥+ ⎢ ⎥V
⎢ x2 ⎥ ⎢ 0 0 0 1 ⎥ ⎢ x2 ⎥ ⎢ 0 ⎥
⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎢⎣ x2 ⎥⎦ ⎣ 79.13 0 −79.13 0 ⎦ ⎢⎣ x2 ⎥⎦ ⎣ 0 ⎦
⎡ x1 ⎤
⎢ ⎥
⎡ y1 ⎤ ⎡1 0 0 0 ⎤ ⎢ x1 ⎥ ⎡ 0 ⎤
⎢ y ⎥ = ⎢0 0 1 0⎥ ⎢ x ⎥ + ⎢0⎥ V
⎣ 2⎦ ⎣ ⎦ 2 ⎣ ⎦
⎢ ⎥
⎣⎢ x2 ⎦⎥
Primero se hace un análisis de controlabilidad y observabilidad
⎡ 0 1.73 − 12.8 13.7 ⎤
⎢ 1.73 − 12.8 13.70 498.2538⎥⎥
C=⎢
⎢ 0 0 0 136.89 ⎥
⎢ ⎥
⎣ 0 0 136.89 − 1013 ⎦
⎡ 1 0 0 0 ⎤
⎢ 0 0 1 0 ⎥⎥

⎢ 0 1 0 0 ⎥
⎢ ⎥
⎢ 0 0 0 1 ⎥
O=
⎢ − 46.8 − 7.4 46.84 0 ⎥
⎢ ⎥
⎢ 79.13 0 − 79.13 0 ⎥
⎢ 346.6 7.92 − 346.62 46.84 ⎥
⎢ ⎥
⎢⎣ 0 79.13 0 − 79.13 ⎥⎦

El rango de ambas matrices es cuatro lo que indica que el sistema es totalmente


controlable y observable.
Métodos de Asignación de Polos 45

Impulse Response

From: U(1)
0.4

To: Y(1) 0.3

0.2

0.1
Amplitude

0.4

0.3
To: Y(2)

0.2

0.1

0
0 1 2 3 4 5 6

Time (sec.)

Figura 3.3 Respuesta Impulso del sistema en lazo abierto


Con las especificaciones dadas los polos deseados serán:

−4 ± 5.46i, − 12, − 12

entonces el polinomio característico tendrá la forma:

α c ( s) = s 4 + 32 s 3 + 381.78s 2 + 2250.8s + 6592.9

Para aplicar la fórmula de Ackermann se evalúa A en el polinomio característico,

⎡ 3140 − 32.48 3457 1152 ⎤


⎢ 92700 3380 − 92700 3457 ⎥⎥
α c ( A) = ⎢
⎢ 20245 1947 − 13648 − 280.7 ⎥
⎢ ⎥
⎣− 113389 5839.9 113389 − 13648⎦
en este cálculo se puede observar la desventaja del método de Ackermann, que nos
muestra valores con ordenes de magnitud claramente diferentes, lo cual puede generar
problemas por errores de cálculo.

Calculando la ley de control de acuerdo con la fórmula K = [ 0 . . . 0 1] C−1α c ( A),


se obtiene:
K = [147.88 14.22 − 99.7 − 2.05]
La respuesta paso del sistema compensado será:
46 J. Espinosa

Step Response

From: U(1)
0.025

0.02

0.015
To: Y(1)

0.01

0.005
Amplitude

0.025

0.02

0.015
To: Y(2)

0.01

0.005

0
0 1 2 3 4 5 6

Time (sec.)

Figura 3.4 Respuesta paso del sistema realimentado

3.4.2 Control de un Sistema Lector de Cinta Magnética (Tomado de [3])

En la Figura 3.5se muestra un esquema del sistema. El sistema está compuesto por
dos transportadores de cinta, cada una acoplada a un motor eléctrico que puede ser
comandado por medio de señales de voltaje. La cinta ha sido modelada como un
resorte lineal con amortiguación viscosa, el modelamiento ha sido realizado tomando
como tensión nominal 6 N.

Figura 3.5 Sistema Lector de Cinta


Métodos de Asignación de Polos 47

Las ecuaciones de movimiento del sistema son:


dϖ 1
J = Tr − βϖ 1 + Ki1 ,
dt
.
p1 = rϖ 1 ,
di1
L = − Ri1 − K eϖ 1 + e1 ,
dt
dϖ 2
J = Tr − βϖ 2 + Ki2 ,
dt
.
p2 = rϖ 2 ,
di2
L = − Ri2 − Keϖ 2 + e2 ,
dt
K D . .
T = ( p2 − p1 ) + ( p2 − p1 ),
2 2
p + p2
p3 = 1 .
2

Descripción de la variables:
D Amortiguación de la cinta.
= 20 N/ms,
e1,2 Voltaje aplicado a los motores,(V)
I1,2 Corriente en los motores,
J Inercia del motor y la rueda,
= 4 × 10 −5 kg.m2,
K Constante del resorte de la cinta, 4 × 10 4 N/m,
Ke Constante eléctrica de los motores = 0.03 V.s,
Kt Constante de torque de los motores = 0.03 V.s,
L Inductancia de la armadura= 10-3H,
R Resistencia de armadura=1Ω,
r radio de las ruedas de los transportadores,0.02m,
T Tensión de la cinta en el punto de la cabeza de lectura y escritura (N),
p1,2,3 Posición de la cinta en los transportadores y la cabeza,
θ1,2 Desplazamiento angular de los transportadores,
ω1,2 Velocidad angular de los transportadores.
Tomando un factor de escala de 103 para el tiempo y 10-5 para la posición, las
ecuaciones de estado obtenidas son:
48 J. Espinosa

.
⎡ p1 ⎤ ⎡ 0 2 0 0 0 0 ⎤ ⎡ p1 ⎤ ⎡0 0⎤
⎢ϖ. ⎥ ⎢ −0.1 −0.35 0.1 0.1 0.75 0 ⎥ ⎢ϖ 1 ⎥ ⎢ 0 0⎥
⎢ .1 ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎢ p2 ⎥ ⎢ 0 0 0 2 0 0 ⎥ ⎢ p2 ⎥ ⎢0 0 ⎥ ⎡ e1 ⎤
⎢ϖ. ⎥=⎢ ⎥⎢ ⎥ + ⎢ ,
⎢ .2 ⎥ ⎢ 0.1 0.1 −0.1 −0.35 0 0.75 ⎥ ⎢ϖ 2 ⎥ ⎢0 0 ⎥⎥ ⎢⎣e2 ⎥⎦
⎢ i1 ⎥ ⎢ 0 −0.03 0 0 −1 0 ⎥ ⎢ i1 ⎥ ⎢1 0⎥
⎢ . ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎣ i2 ⎦ ⎣ 0 0 0 −0.03 0 −1 ⎦ ⎣ i2 ⎦ ⎣0 1⎦
⎡ p1 ⎤
⎢ϖ ⎥
⎢ 1⎥
⎡ p3 ⎤ ⎡ 0.5 0 0.5 0 0 0 ⎤ ⎢ p2 ⎥ ⎡0 0 ⎤ ⎡ e1 ⎤
⎢ T ⎥ = ⎢−0.2 −0.2 0.2 0.2 0
⎢ ⎥+
0 ⎥⎦ ⎢ϖ 2 ⎥ ⎢⎣0 0 ⎥⎦ ⎢⎣e2 ⎥⎦
.
⎣ ⎦ ⎣
⎢ i1 ⎥
⎢ ⎥
⎣ i2 ⎦

Primero se hace un análisis de controlabilidad y observabilidad.

⎡0 0 0 0 .
15 0 − 2.02 .
015 .
189 0.04 − 164
− 0.26⎤
.
⎢0 0 0.75 0 − 101
. 0.07 0.94 0.02 − 0.82 − 013
. . ⎥
0.78
015
⎢ ⎥
⎢0 0 0 0 0 .
15 .
015 − 2.02 0.04 .
189 . ⎥
− 0.26
− 164
C= ⎢ ⎥
⎢0 0 0 0.75 0.07 − 101
. 0.02 0.94 − 013
. − 0.82 .
015 0.78 ⎥
⎢1 0 −1 0 0.98 0 − 0.95 − 0.002 0.92 0.002 − 0.9 0.003 ⎥
⎢ ⎥
⎣0 1 0 −1 0 0.98 − 0.002 − 0.95 0.002 0.92 0.0024 − 0.89 ⎦

⎡ 0.5 0 0.5 0 0 0 ⎤
⎢ − 0.2 − 0.2 0.2 0.2 0 0 ⎥
⎢ ⎥
⎢ 0 1 0 1 0 0 ⎥
⎢ ⎥
⎢ 0.04 − 0.31 − 0.04 0.31 − 015
. .
015 ⎥
⎢ 0 − 0.25 0 − 0.25 0.75 0.75 ⎥
⎢ ⎥
⎢ 0.062 0.22 − 0.062 − 0.224 − 0.082 0.082 ⎥
O= ⎢ ⎥
0 0.04 0 0.04 − 0.94 − 0.94
⎢ ⎥
⎢ − 0.045 0.026 0.049 − 0.026 0.25 − 0.25 ⎥
⎢ 0 0.018 0 0.018 0.97 0.97 ⎥
⎢ ⎥
⎢ − 0.005 − 0.11 0.005 .
011 − 0.23 0.23 ⎥
⎢ 0 − 0.034 0 − 0.034 − 0.95 − 0.95 ⎥
⎢ ⎥
⎢⎣ 0.022 − 0.0456 − 0.0217 − 0.0456 .
015 − 015
. ⎥⎦

El rango de ambas matrices es seis lo que indica que el sistema es totalmente


controlable y observable.
Métodos de Asignación de Polos 49

Step Response

From: U(1) From: U(2)


150

100
To: Y(1)

50
Amplitude

0.5
To: Y(2)

-0.5

-1
0 15 30 450 15 30 45

Time (sec.)

Figura 3.6 Respuesta paso en lazo abierto

Los polos deseados son:

−0.451 ± 0.937i,−0.947 ± 0.581i,−116


. ,−116
.

Tomando una matriz G al azar:

⎡−0.8 0.22 −2.17 −1.01 0.51 0.59 ⎤


G=⎢ ⎥
⎣ 0.53 −0.92 −0.06 0.61 1.69 −0.64⎦

Resolviendo (Ecuación de Sylvester en X) (3.3) para X con:

⎡ −0.451 0.937 0 0 0 0 ⎤
⎢−0.937 −0.451 0 0 0 0 ⎥
⎢ ⎥
⎢ 0 0 −0.947 0.581 0 0 ⎥
Λc = ⎢ ⎥
⎢ 0 0 −0.581 −0.947 0 0 ⎥
⎢ 0 0 0 0 −116
. 0 ⎥
⎢ ⎥
⎣ 0 0 0 0 0 −1.16⎦

se obtiene:
50 J. Espinosa

⎡ 1.06 1.48 6.45 0.24 4.47 3.97 ⎤


⎢-0.93 0.16 -3.12 1.76 -2.59 -2.3 ⎥
⎢ ⎥
⎢-2.00 -0.97 -0.52 -0.76 12.45 -4.35⎥
X=⎢ ⎥
⎢ 0.91 -0.72 0.46 0.21 -7.22 2.52 ⎥
⎢ 0.20 -0.77 1.99 -3.72 2.70 3.26 ⎥
⎢ ⎥
⎣ 0.49 0.88 -1.05 -0.18 9.21 -3.53⎦
Calculando la ley de control de acuerdo con la fórmula K = GX −1 , se obtiene:

⎡ 0.51 2.64 -0.08 0.42 1.57 0.53⎤


K=⎢
⎣0.38 0.84 0.73 2.11 0.19 0.85⎥⎦

La respuesta paso del sistema compensado será:

Figura 3.7 Respuesta paso del sistema en lazo cerrado

3.5 Diseño de Servo sistemas e implementación de referencias.

En los ejemplos anteriores se observo que el regulador de estado estabiliza el sistema


hacia el origen. La introducción de referencias distintas al origen causará un error de
estado estacionario, lo cual en muchos casos se considera inaceptable, la solución a
dicho problema pasa por la introducción de integradores que permitan reducir el error
de estado estacionario a cero.
Métodos de Asignación de Polos 51

El diseño de dicho sistema involucra la creación de una señal de error por cada
variable de referencia que se introduzca al sistema. De hecho el orden del sistema en
lazo cerrado se vera aumentado en un orden igual al número de señales de referencia
que se introduzcan. El proceso de diseño del controlador será idéntico al presentado
en las secciones anteriores ya que las ganancias de los integradores estarán
determinadas por la realimentación de estado.

En la siguiente figura se muestra la descripción del sistema con las señales de


referencia incluidas. Es importante mencionar que en caso de que las especificaciones
de control demanden el seguimiento de señales de tipo rampa con cero error de estado
estacionario, se deberán incluir mas integradores. Por ahora nuestro estudio se
limitará al seguimiento de referencias de tipo paso.

D
yref e v y
Ki 1/s B 1/s C
-
A

Figura 3.8 Sistema con Realimentación de Estado y Señal de Referencia incluyendo integradores
para cero error de estado estacionario.
El sistema estará descrito en lazo abierto por las siguientes ecuaciones:

x = Ax + Bu
(3.4)
y = Cx + Du
e = yref − y
donde yref , e ∈ℜ p y p es el número de salidas del sistema
Expandiendo la anterior expresión obtenemos en lazo abierto:
⎡ x ⎤ ⎡ A 0⎤ ⎡ x ⎤ ⎡ B ⎤ ⎡ 0⎤ (3.5)
⎢ e ⎥ = ⎢ −C 0 ⎥ ⎢ e ⎥ + ⎢ − D ⎥ u + ⎢ I ⎥ yref
⎣ ⎦ ⎣ ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦
y = Cx + Du

Si calculamos una realimentación de estado, esta tendrá la siguiente forma

K T = [K Ki ] (3.6)
52 J. Espinosa

donde K T ∈ ℜ m×( n + p ) , K ∈ ℜ m×n , K i ∈ ℜ m× p .


Introduciendo la realimentación:

⎡ x⎤
u = [K K i ]⎢ ⎥ (3.7)
⎣e ⎦

la descripción del sistema en lazo cerrado será:


⎡ x ⎤ ⎡ A − BK − BK i ⎤ ⎡ x ⎤ ⎡ 0 ⎤ (3.8)
⎢ e ⎥ = ⎢ −C + DK DK ⎥ ⎢ e ⎥ + ⎢ I ⎥ yref
⎣ ⎦ ⎣ i ⎦⎣ ⎦ ⎣ ⎦
⎡ x⎤
y = [C − DK − DK i ] ⎢ ⎥ + [ 0] yref
⎣e⎦

Si analizamos la situación de estado estacionario y asumiendo que la realimentación


estabiliza el sistema obtendremos:
⎡0⎤ ⎡ A − BK − BK i ⎤ ⎡ x(∞ )⎤ ⎡0⎤ (3.9)
⎢0⎥ = ⎢− C + DK DK ⎥ ⎢ e(∞) ⎥ + ⎢ I ⎥ y ref (∞)
⎣ ⎦ ⎣ i ⎦⎣ ⎦ ⎣ ⎦
⎡ x (∞ ) ⎤
y (∞) = [C − DK − DK i ]⎢ ⎥ + [0]y ref (∞)
⎣ e( ∞ ) ⎦
de la segunda fila de la matriz, se desprende:
⎡ x (∞ ) ⎤
0 = [− C + DK DK i ]⎢ ⎥ + y ref (∞)
(3.10)
⎣ e( ∞ ) ⎦
0 = − y (∞) + y ref (∞)
0 = ess
Lo cual indica cero error de estado estacionario.

3.4.3 Ejemplos

3.4.3.1 Carros Acoplados con Unión Flexible.

Para el sistema descrito en la sección 3.4.1 introduciremos nuestra señal de referencia


de manera que la posición del segundo carro se posicione en un valor de referencia
dado.

Seleccionamos como polos los siguientes valores, de forma que se garanticen nuestros
objetivos de un error de estado estacionario cero, tiempo de establecimiento de
alrededor de 1 segundo y un sobrepico máximo del 10 %.

− 4 ± 5.46i,−12,−12,−15

Calculando la ley de control de acuerdo con la fórmula


K = [0 ... 0 1 ]C α c ( A ), se obtiene:
−1

K T = [425.34 22.89 − 130.45 31.11 − 722.8396]


Métodos de Asignación de Polos 53

observe que el ultimo termino corresponde a la ganancia del termino integral. La


respuesta del nuevo sistema compensado alcanza un error cero de estado estacionario
a una referencia paso, el sobrepico máximo no supera el 6%.

Respuesta paso de la posicion del carro 2


1.4

1.2 Sobrepico 6 % Tss=1.12 sec

0.8
Amplitud

0.6

0.4

0.2

0
0 0.5 1 1.5 2 2.5 3
Tiempo (seg.)

Figura 3.9 Respuesta paso al posicionamiento del carro 2

Respuesta paso de las posiciones de los carros


1.4
Pos.Carro 1
-- Pos. Carro 2
1.2

0.8
Pos Carro

0.6

0.4

0.2

0
0 0.5 1 1.5 2 2.5 3
Tiempo (seg.)

Figura 3.10 Respuesta paso de los 2 carros


54 J. Espinosa

Senhal de Control
14

12

10

8
Voltios

-2
0 0.5 1 1.5 2 2.5 3
Tiempo (seg.)

Figura 3.11 Señal de Control enviada por el controlador

3.4.3.2 Control de un Sistema Lector de Cinta Magnética

Para el sistema descrito en la sección 3.4.2 introduciremos nuestras señales de


referencia de manera que la tensión y la posición de la cabeza lectora puedan ser
seleccionadas sin error de estado estacionario. Para ello introducimos dos integradores
lo cual incrementará el orden de nuestro sistema será ahora 8 en lugar del orden 6
original.

Seleccionando una matriz G arbitraria de la forma:


⎡− 0.8 0.22 − 2.17 − 1.01 0.51 0.59 0.63 − 0.53⎤
G=⎢ ⎥
⎣ 0.53 − 0.92 − 0.06 0.61 1.69 − 0.64 − 3.2 1.4 ⎦

la matriz KT obtenida resolviendo la ecuación de Silvestre tendrá los siguientes


valores:
⎡ 5.36 12.93 1.26 2.54 4.57 0.53 − 1.29 8.46 ⎤
KT = ⎢ ⎥
⎣1.996 1.59 4.61 9.49 0.19 3.84 − 3.34 − 5.93⎦
Métodos de Asignación de Polos 55

Step Response

From: U(1) From: U(2)


1.5

1
To: Y(1)

0.5
Amplitude

1.5

1
To: Y(2)

0.5

0
0 4 8 120 4 8 12

Time (sec.)

Figura 3.12 Respuesta paso del sistema de cinta en la figura superior el posicionamiento de la
cabeza, figura inferior cambio en la tensión.

Senhales de Entrada- Paso en Posicion


0.8
Motor 1
0.6 -- Motor 2
Amplitud

0.4

0.2

-0.2
0 2 4 6 8 10 12
Tiempo (seg.)
Senhales de Entrada- Paso en Tension
2
Motor 1
1 -- Motor 2
Amplitud

-1

-2
0 2 4 6 8 10 12
Tiempo (seg.)

Figura 3.13 Señales de control de los motores en las dos respuestas paso
56 J. Espinosa

3.6 Observadores o Estimadores de Estado

La implementación de las leyes de control por realimentación de estado requieren


información de los estados del sistema. En la práctica, obtener señales de todos los
estados es una tarea que puede resultar en costos elevados debido a la necesidad de
usar sensores para medir cada uno de los estados del sistema o en el peor de los casos
la variable no puede ser medida. Para resolver este problema se ha planteado como
solución la construcción de observadores de estado. Un observador de estado tiene
como misión reconstruir todas las variables de estado x a partir de la medición de las
señales disponibles a la salida del sistema, de forma que los estados reconstruidos ^x
pueden ser usados para implementar la ley de control.
Es importante recordar que la construcción de un observador de estado solo es posible
sí y solo sí el sistema es observable.

3.6.1 Estimadores de Estado Completos

3.6.1.1 Estimadores en lazo abierto

Es la forma más simple de construir un observador, el sistema estima el estado x^ a


partir de la entrada u:

x&ˆ = Axˆ + Bu

^x es el valor estimado de x.
El error de estimación se define como:
~
x = x − xˆ

Entonces el error estará gobernado por la dinámica:


.
~
x = A~
x ,~
x (0) = x(0) − xˆ (0)

Si A es estable, entonces el error de estimación tiende a cero con la misma dinámica


del sistema, en caso contrario no convergerá. No existe una forma de influenciar la
dinámica del estimador de forma que la estimación sea más rápida, es por estas dos
razones que este tipo de estimación no es útil en la práctica.
Métodos de Asignación de Polos 57

u(t) x y(t)
.
x=Ax+B u C

Proceso

^x
.
x=Ax+B u

Observador

Figura 3.14 Estimador en lazo abierto

3.6.2 Estimadores Realimentados

Una forma de influenciar la dinámica del estimador es introducir en este una señal que
sea indicadora del error de estimación, esta señal es la diferencia entre la salida real y
la estimada ( y − Cxˆ ).

El nuevo modelo del estimador tiene la forma:

x&ˆ = Axˆ + Bu + L( y − Cxˆ ) (3.11)

donde L ∈ℜ n × p es la matriz que determina la realimentación del error de salida


( y − Cxˆ ).
Se define el error de estimación como:
~
x = x − xˆ

Entonces el error estará gobernado por la dinámica:


.
~
x = ( A − LC ) ~
x ,~
x (0) = x(0) − xˆ (0)

Ya que la matriz A-LC gobierna la dinámica del error escogiendo un valor apropiado
de L se puede lograr que el sistema sea estable y que tenga una convergencia más
rápida que la dinámica del proceso.
58 J. Espinosa

u(t) x y(t)
.
x=Ax+Bu C

Proceso +

. ^x
^x=Ax+Bu C
-
Observador

Figura 3.15 Observador de lazo cerrado

3.6.3 Diseño de Estimadores - Ubicación de los polos

Con la nueva formulación se pudo observar que el problema de hallar la matriz L para
el estimador puede ser enfocado como un problema de ubicación de los polos, ya que
lo que nos interesa es seleccionar la dinámica del sistema (A-LC).
El problema es calcular L de forma tal que:

det( sI − ( A − LC )) = ( s − s1 )( s − s2 )...( s − sn )

donde s1, s2,..,sn son las raíces del polinomio αe(s) que es la ecuación característica del
observador.
Este problema es equivalente a hallar K = LT en:

det( sI − ( AT − C T K )) = ( s − s1 )( s − s2 )...( s − sn )

Claramente se puede ver que el problema es equivalente al problema de ubicación de


polos para el caso de control.
Obsérvese que la matriz de controlabilidad de ( AT , C T ) , es la transpuesta de la matriz
de observabilidad del sistema [A, B, C, D].

Métodos similares a los utilizados en el problema de control de ubicación de los polos


serán aplicados al problema de diseño del observador

3.6.3.1 Método Directo

La matriz L puede ser calculada resolviendo:

det( sI − ( A − LC )) = ( s − s1 )( s − s2 )...( s − sn )
Métodos de Asignación de Polos 59

donde s1, s2,..,sn son las raíces del polinomio característico αe(s) del observador
deseado.

Los valores de la matriz L pueden ser calculados igualando términos a ambos lados de
la ecuación.

Este método se vuelve tedioso para sistemas de orden superior a 3.

3.6.3.2 Método de Ackermann para sistemas de una salida

Si tomamos las matrices del sistema Ao, Co en la forma canónica observable entonces:

⎡ − a1 − L1 − a2 − L2 ... ... − an − Ln ⎤
⎢ 1 0 ... ... 0 ⎥
⎢ ... ... ... .. ⎥
Ao T − Co T Lo T =⎢ 0 . ⎥
⎢ .. ... ... ... .. ⎥
⎢ . . ⎥
⎢⎣ 0 ... 0 1 0 ⎥⎦

det( sI − ( Ao T − Co T Lo T )) = sn + (a1 + L1 ) sn −1 + (a2 + L2 ) sn −1 + ... + (an + Ln )

Dado que el polinomio característico deseado tiene la forma:

α e ( s) = sn + α1sn −1 +...+α n = ( s − s1 )( s − s2 ) ... ( s − sn )

los elementos de Lo serán:

L1 = a1 − α 1 , L2 = a2 − α 2 ,..., Ln = an − α n .

El procedimiento de cálculo de L se puede resumir así:


• Transforme las matrices (A, C) a su forma canónica observable (Ao, Co).
• Halle la ley de control Lo utilizando el anterior procedimiento.
• Transforme Lo en L = To −1 Lo .
En forma compacta el procedimiento de diseño es:
⎡0⎤
⎢0⎥
−1 ⎢ ⎥ (3.12)
L = α e ( A) O .. ,
⎢.⎥
⎢ ⎥
⎣1⎦
donde es la matriz de observabilidad y

α e ( A) = A n + α 1 A n −1 + α 2 A n − 2 +...+α n I
60 J. Espinosa

La formula de Ackermann para observadores solo es aplicable a sistemas de una


salida y no es aconsejable en sistemas de gran dimensión, ya que el cálculo del
polinomio αe(A), puede generar errores numéricos [10].

Para el caso de múltiples salidas la solución de L no es única.

3.6.3.3 Método de la Ecuación de Sylvester

Dada una matriz Λ :


⎡ α1 β1 ⎤
⎢− β α1 ⎥
⎢ 1 ... ⎥
Λ=⎢ ⎥,
⎢ ⎥
⎢ λ1 ⎥
⎢⎣ . .. ⎥

con valores propios: α 1 ± jβ1 ,..., λ1 ,... que son los polos deseados en el estimador.

Visto que el tratamiento para las ecuaciones del estimador es análogo al del diseño del
controlador podemos decir que existe una transformación de similaridad X tal que:

X −1 ( AT − C T LT ) X = Λ ⇒ AT X − XΛ = C T LT X .

Esta ecuación se puede plantear como:

A T X − XΛ = C T G , (Ecuación de Sylvester en X) (3.13)


LT X = G.

Escogiendo un valor de G arbitrario, se obtiene la matriz de realimentación para el


estimador como:

L = ( GX −1 ) .
T

El procedimiento de cálculo de L se puede resumir en tres pasos:

• Escoja un valor arbitrario de G.


• Resuelva la ecuación de Sylvester en X.
Calcule la ganancia de realimentación L = ( GX −1 ) .
T

• El método puede fallar, encontrándose una matriz X no invertible en ese caso se
debe realizar todo el procedimiento partiendo de una matriz G diferente.

Recuerde, que siempre será posible encontrar una solución para X si A y Λ no tienen
valores propios comunes.
Métodos de Asignación de Polos 61

3.6.4 Estimadores de Orden Reducido

Los estimadores de orden reducido son estimadores cuyos estados se ven reducidos
por el número de estados medidos. En otras palabras, son observadores que estiman
solamente los estados no medidos.

Para aplicar este método el sistema es convertido a la forma:


.
⎡ xa ⎤ ⎡ Aaa Aab ⎤ ⎡ xa ⎤ ⎡ Ba ⎤
⎢ x. ⎥ = ⎢ A +
Abb ⎥⎦ ⎢⎣ xb ⎥⎦ ⎢⎣ Bb ⎥⎦
u
⎣ b ⎦ ⎣ ba (3.14)

⎡ xa ⎤
y= I [ ]
0⎢ ⎥
⎣ xb ⎦

usando una transformación de coordenadas [


T = C† Cn ] donde C† es la
seudoinversa de C y Cn es una base del espacio de nulidad de C.

Observe que xa son los estados medibles y xb son los estados que necesitan ser
estimados,
y = xa
Si descomponemos las dinámicas de las variables medidas y las no medidas se
obtiene:
. .
xa = y = Aaa y + Aab xb + Ba u
.
xb = Abb xb + Aba xa + Bb u

Son valores conocidos en la dinámica de xa

y − Aaa y − Ba u = Aab xb
y en la dinámica de xb

Aba xa + Bb u

Entonces podemos construir un estimador para los estados xb

xˆb = Abb xˆb + Aba y + Bbu + L ( y − Aaa y − Ba u − Aab xˆb )

el error de estimación en este caso está dado por:


.
Aab xb − Aab xˆ b = y& − Aaa y − Ba u − Aab xˆ b
62 J. Espinosa

Note que este estimador es poco inmune al ruido de medición ya que involucra el
cálculo de la derivada de y. Para eliminar la derivada de y, definimos xc = xˆ b − Ly
y el estimador toma la forma:

xc = ( Abb − LAab ) xˆb + ( Aba − LAaa ) y + ( Bb − LBa ) u ( 3.15)


xˆb = xc + Ly

Figura 3.16 Estimador de Orden Reducido


Si definimos error de estimación se define como:
~
xb = xb − xˆ b

Entonces el error estará gobernado por la dinámica:


.
xb = ( Abb − LAab ) ~
~ xb

El método de diseño para los estimadores de orden reducido se puede resumir asi:

• Encuentre una transformación T que convierta el sistema a la forma (3.14).

• Calcule la matriz L utilizando la fórmula Ackermann si el sistema es SISO o


ecuación de Sylvester si es MIMO, substituyendo el par ( A, C ) por ( Abb , Aab ) .
• Aplique la transformación T −1 para obtener los estados en las coordenadas
originales.

3.6.5 Selección de los Polos para el Estimador

Para hacer la selección de los polos del estimador tenemos que decir que lo ideal es
que la dinámica del estimador convergiera instantáneamente, para ello deberíamos
Métodos de Asignación de Polos 63

poner los polos lo mas cerca posible al infinito, pero esta situación convierte el
estimador en un derivador haciendo el sistema sensible al ruido[5].

En forma analítica considere el sistema con ruido en el proceso w y ruido en el sensor


v:
.
x = Ax + Bu u + Bw w,
y = Cx + v

La dinámica del error de estimación será:


.
x = ( A − LC )~
~ x + B w w − Lv

en este caso el valor de L está relacionado con la dinámica. Si L es grande la


dinámica será más rápida, pero el ruido debido al sensor también aumentará.

3.7 Ejemplos

3.7.6 Carros Acoplados con Unión Flexible. [12]

Para el diseño de observadores se asumirá que únicamente el segundo carro tiene


potenciómetro para medir la posición. Entonces la matriz C del sistema se reduce a:

C = [ 0 0 1 0]

La matriz de observabilidad será,

⎡0 0 1 0 ⎤
⎢0 0 0 1 ⎥
O= ⎢ ⎥
⎢76 0 − 76 0 ⎥
⎢ ⎥
⎣ 0 76 0 − 76⎦

El rango de la matriz es cuatro lo que indica que el sistema es totalmente observable.

Se eligen los polos de observador 5 veces los deseados para el sistema en lazo
cerrado:

−20 ± 27.29i, − 60, − 60

entonces el polinomio característico tendrá la forma:

α e ( s) = s 4 + 160 s 3 + 9544.6 s 2 + 281400 s + 4.120 × 10 6 .

Para aplicar la fórmula de Ackermann se evalúa A en el polinomio característico,


64 J. Espinosa

⎡ 3.747 × 10 6 2.125 × 10 6 3.732 × 10 5 6867 ⎤


⎢ ⎥
⎢ −9.043 × 10 2.174 × 10
6 6
9.043 × 10 6
3.732 × 10 5 ⎥
α e ( A) =
⎢ 7.162 × 10 5 11598 3.404 × 10 6 2.692 × 10 5 ⎥
⎢ ⎥
⎣ 1.994 × 10 6.304 × 10 6 −1.994 × 10 7 3.404 × 10 6 ⎦
7

en este cálculo se puede observar nuevamente la desventaja del método de


Ackermann, que nos muestra valores con ordenes de magnitud claramente diferentes,
lo cual puede generar problemas por errores de cálculo.

Calculando la ganancia del estimador de acuerdo con la fórmula


⎡0⎤
⎢0⎥
−1 ⎢ ⎥
L = α e ( A) O .. , se obtiene:
⎢.⎥
⎢ ⎥
⎣1⎦

⎡2796.6⎤
⎢ 28612 ⎥
L=⎢ ⎥
⎢ 152.6 ⎥
⎢8294.4⎥
⎣ ⎦

La respuesta del estimador vs. sistema con condiciones iniciales


⎡−1⎤ ⎡0 ⎤
⎢1⎥ ⎢0 ⎥
x(0) = ⎢ ⎥ y x(0) = ⎢ ⎥ será:
^
⎢−1⎥ ⎢0 ⎥
⎢1⎥ ⎢0 ⎥
⎣ ⎦ ⎣ ⎦

Figura 3.17 Convergencia del estimador al estado x4 salida del sistema (-), estimador (._)
Métodos de Asignación de Polos 65

A continuación se puede observar el efecto del ruido en el estimador calculado


anteriormente y un estimador con los polos del orden de 10 veces los polos deseado
en lazo cerrado,

Figura 3.18 Inmunidad al ruido. Estado original (--), estado estimado con polos 5 veces los polos
de lazo cerrado (.), estado estimado con 10 veces los polos de lazo cerrado (-).

3.7.7 Control de un Sistema Lector de Cinta Magnética

Se eligen los polos de observador 5 veces más rapidos que los deseados para el
sistema en lazo cerrado:

−2.25 ± 4.68i,−4.73 ± 2.90i, − 5.8, − 5.8

Escogiendo una matriz G arbitraria,

⎡−0.065 −0.221 −1.303 −1.984 0.802 0.939 ⎤


G=⎢
⎣ −1.017 −0.228 1.731 −1162
. −0.943 −0.241⎥⎦

y construyendo una matriz Λe con los polos deseados para el estimador,

⎡−2.25 4.68 0 0 0 0 ⎤
⎢−4.68 −2.25 0 0 0 0 ⎥
⎢ ⎥
⎢ 0 0 −4.73 2.9 0 0 ⎥
Λe = ⎢ ⎥
⎢ 0 0 −2.9 −4.73 0 0 ⎥
⎢ 0 0 0 0 −5.8 0 ⎥
⎢ ⎥
⎣ 0 0 0 0 0 −5.8⎦
66 J. Espinosa

resolviendo la ecuación de Sylvester para X y se calcula la ganancia del estimador


como L = ( GX −1 )
T

⎡ −10.5 −120.32 ⎤
⎢ 51.01 64.4 ⎥
⎢ ⎥
⎢ 35.89 111.22 ⎥
L=⎢ ⎥
⎢ 4.74 −116.2 ⎥
⎢−13.08 −457.52 ⎥
⎢ ⎥
⎣124.71 287.72 ⎦

La respuesta del estimador vs. sistema con condiciones iniciales


⎡1⎤ ⎡0 ⎤
⎢−1⎥ ⎢0 ⎥
⎢ ⎥ ⎢ ⎥
⎢1⎥ ^ ⎢0 ⎥
x(0) = ⎢ ⎥ y x(0) = ⎢ ⎥ será:
⎢−1⎥ ⎢0 ⎥
⎢1⎥ ⎢0 ⎥
⎢ ⎥ ⎢ ⎥
⎣−1⎦ ⎣0 ⎦

A continuación se puede observar el efecto del ruido en el estimador cálculado


anteriormente y un estimador con los polos del orden de 10 veces los polos deseado
en lazo cerrado,

10

-2

-4

-6

-8
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Figura 3.19 Inmunidad al ruido. Estado original (-), estado estimado con polos 5 veces los polos
de lazo cerrado (.-), estado estimado (--).
Métodos de Asignación de Polos 67

En la siguiente figura se puede comparar la respuesta del sistema a la función paso


con realimentación de los estados generados por el estimador.

Ahora se diseñará un observador de orden reducido, para diseñar el observador es


necesario calcular la matriz de transformación T de la siguiente forma:

[
T = C† Cn ]
donde C † es la seudoinversa de C y Cn es una base del espacio de nulidad de C.

⎡1 −1.25 0.5 0 0 0⎤
⎢0 −1.25 −0.5 0.707 0 0⎥
⎢ ⎥
⎢1 1.25 −0.5 0 0 0⎥
T=⎢ ⎥
⎢0 1.25 0.5 0.707 0 0⎥
⎢0 0 0 0 1 0⎥
⎢ ⎥
⎣0 0 0 0 0 1⎦

Las matrices transformadas serán:


⎡0 0 0 1.414 0 0 ⎤
⎢0 0.67 0.35 0 − 0.15 0.15 ⎥⎥

⎡A Aab ⎤ ⎢0 − 3.31 − 1.13 0 − 0.375 0.375⎥
At = T −1 AT = ⎢ aa ⎥ =⎢ ⎥
⎣ Aba Abb ⎦ ⎢0 0 0 − 0.25 0.53 0.53 ⎥
⎢0 0.037 0.015 − 0.021 −1 0 ⎥
⎢ ⎥
⎣⎢0 − 0.037 − 0.015 − 0.021 0 − 1 ⎦⎥

⎡0 0⎤
⎢0 0⎥
⎢ ⎥
−1 ⎡ Ba ⎤ ⎢0 0⎥
Bt = T B = ⎢ ⎥ = ⎢
⎣ Bb ⎦ ⎢0 0 ⎥⎥
⎢1 0⎥
⎢ ⎥
⎣0 1⎦

[
Ct = CT = CC

]
CCn = [ I 0]

Los polos del estimador de orden reducido serán los primeros cuatro del estimador de
orden completo.

−2.25 ± 4.68i,−4.73 ± 2.90i

Con estos datos se puede calcular la ganancia del estimador, resolviendo la ecuación
de Sylvester,
68 J. Espinosa

⎡−11.24 −5315
. ⎤
⎢ 4.90 −3.644⎥
L=⎢ ⎥
⎢ −1.31 −93.38⎥
⎢ ⎥
⎣ 25.53 5512
. ⎦

En la figura se puede observar la comparación entre la estimación de orden completo,


la estimación de orden reducido y el estado real del sistema

10

-2

-4
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Figura 3.20 Estado x3 real (--) estimador de orden completo (.-) y estimador de orden reducido
(.).

3.8 Ejercicios del Capitulo

1- Diseñe un sistema de realimentación de estado (usando del método de


Ackerman) que permita estabilizar el sistema correspondiente al péndulo
invertido mostrado en la figura
Métodos de Asignación de Polos 69

x θ l
mg

F
M

los parámetros del modelo son M= 10 kg m=M/10 kg l=1 m

Las ecuaciones del sistema asumiendo un ángulo θ pequeño son:

( M + m) x + mlθ = F
mx + mlθ = mgθ

Haga la descripción de estado del sistema asumiendo como estados [ x, x&, θ , θ&] asuma
como salidas medibles la posición y el ángulo. Ubique los polos del sistema de forma
que el tiempo de establecimiento del sistema sea tenga un tiempo de establecimiento
de 2 seg y un amortiguamiento de ζ = 0.5 .
1
Recuerde Ts = para un sistema de segundo orden con
ζω n
polos − ζω n ± jω n 1 − ζ 2
Simule el sistema en simulink y simule es sistema para las siguientes condiciones
iniciales:
[0.1,0,0,0]
[0,0,0.1,0]

2- Diseñe un sistema de realimentación de estado que estabilice el modelo de la


caldera mostrado en los ejercicios del capitulo anterior y obtenga un tiempo de
establecimiento de 250 s y un amortiguamiento razonable, simule la respuesta
del sistema usando distintas condiciones iniciales de forma que cada vez un
solo estado sea distinto de cero
3- Diseñe un sistema de realimentación de estado para la columna de destilación
asumiendo que no existen retardos.

4- Para los siguientes sistemas introduzca referencias y verifique que el error de


estado estacionario se reduce a cero:
a. Péndulo invertido variable posición del carro.
b. Columna de destilación Concentraciones
c. Para la caldera – En la Presión, contenido de O2 y demanda de vapor
70 J. Espinosa

5- Construya observadores que estimen los estados de las siguientes plantas. Use
un factor 5 y un factor 10 para la ubicación de los polos. Aplique ruido de
medición,
a. Péndulo invertido
b. Columna de destilación
c. Para la caldera

6- Aplique la realimentación de estado obtenida en los numerales 1,2 y 3


utilizando los estados estimados por el observador diseñado en el punto
anterior, en lugar de los estados de la planta. Para la simulación añada ruido a
las mediciones y compare las respuestas con el sistema en el que se
realimentaron los estados directamente.
Capítulo 4 Regulador Optimo Cuadrático
Lineal

4.1 Introducción

Como se vio en el capitulo anterior, la ubicación de los polos en un sistema dinámico


controlado viene determinada por las especificaciones de control. Típicamente las
especificaciones de control vienen dadas por las condiciones del problema. El
problema a su vez, responde a unos índices de desempeño relacionados con la
cantidad de energía necesaria para controlar el sistema, así como a limitaciones
relacionadas con la máxima cantidad de energía aplicable al sistema de forma
instantánea. Estos índices son traducidos por el diseñador a especificaciones como
tiempo de subida, sobrepico máximo, tiempo de establecimiento, etc. y a partir de
ellos se diseña un sistema que aproxima un sistema de segundo orden aplicando la
idea de los polos dominantes.
Es importante resaltar que en este método el diseñador no tiene una relación directa
entre el desempeño deseado y el resultado obtenido, la verificación de la ‘calidad’ del
sistema de control se realiza en las especificaciones intermedias y no directamente en
la especificaciones originales. El método no presenta mayores dificultades si se
emplea en sistemas de una entrada una salida (SISO), pero en sistemas multivariables
las interrelaciones entre entradas y salidas dificultan la formulación del problema.
Es por ello, que es deseable tener una técnica de diseño que permita formular las
especificaciones de control de forma más simple y que permita obtener el mejor
controlador que cumple esa tarea. Ese es el fundamento del control óptimo.

Para el control óptimo, las especificaciones de control son formuladas en una función
de costo. La función de costo (también conocida como figura de mérito, índice de
desempeño, etc.), es una función que penaliza el “mal” comportamiento del sistema,
es decir cuanto más lejos este el sistema de la situación deseada, mayor será el valor
de la función de costo. Entonces, el objetivo del controlador óptimo, será minimizar
esta función. En el presente capítulo se estudiará el diseño de sistemas de control por
realimentación de estado con funciones de costo cuadráticas. Existen otras funciones
de costo, pero tal vez la más popular sea la cuadrática por su fácil derivación y por
estar directamente relacionada con el contenido energético de un sistema.

En la primera parte del capítulo se estudiará la síntesis de controladores óptimos


cuadráticos por realimentación de estado. Luego se estudiará el diseño de estimadores
Regulador Optimo Cuadratico Lineal 72

óptimos o filtros de Kalman y finalmente se estudiará la estructura conocida como


regulador optimo cuadrático Gaussiano.

4.2 Regulador Optimo Cuadrático Lineal.(Linear Quadratic


Regulator-LQR)

4.2.1 Problema con Horizonte finito.


El problema puede ser planteado como la necesidad de calcular la mejor entrada u(t),
que permita llevar el sistema de un estado inicial x(t o ) , a un estado final x (t f ) , en un
tiempo t f − t o .
El problema es equivalente a minimizar la función:
tf

J = x(t f ) Pf x(t f ) +
1 1
∫ ( x(t ) Qx(t ) + u (t ) T Ru (t ))dt
T T
2 2 (4.1)
to

con las siguientes restricciones:


.
x = Ax(t ) + Bu (t ) (4.2)
u (t ) = − K (t ) x(t )

Las matrices Pf, Q y R son matrices positivas definidas, generalmente diagonales o


cuando menos simétricas, que determinan la importancia de cada parámetro dentro de
la función de costo. La matriz Pf indica la importancia del estado final, la matriz Q la
importancia de los estados durante la transición y R la importancia de la entrada. La
formulación del problema utilizando una matriz R distinta de cero, tiene particular
importancia en la práctica ya que esta matriz nos limitará el valor de la entrada u,
aplicada al sistema.

El problema con las restricciones dadas puede ser formulado como una optimización
sin restricciones utilizando el método de los multiplicadores de Lagrange,
∂H (4.3)
λ&T = − ; λ (t f ) = Pf x(t f )
∂x
∂H
0= , (4.4)
∂u
donde,
H = 12 x T Qx + 12 u T Ru + λT ( Ax + Bu ) (4.5)

calculando las derivadas indicadas en (4.3) y en (4.4) se obtiene:

λ& = −Qx − AT λ (4.6)


(4.7)
0 = Ru + B T λ →u = − R −1 B T λ
73 J. Espinosa

El problema se puede plantear como un sistema de ecuaciones diferenciales con dos


puntos como condición de frontera,
. (4.8)
⎡ x ⎤ ⎡ A − BR −1 B T ⎤ ⎡ x ⎤
. =
⎢λ ⎥ ⎢ ⎥⎢ ⎥
⎣ ⎦ ⎣− Q − A T ⎦ ⎣λ ⎦
x(t o ) → dado
λ (t f ) = Pf x(t f )
λ (t ) = P(t ) x(t )

o la ecuación diferencial,
.
( P + PA + AT P − PBP −1 B T P + Q) x = 0
dado que x ≠ 0 entonces
.
P = − PA − AT P + PBR −1 B T P − Q (4.9)

La ecuación (4.9) se conoce con el nombre de ecuación matricial de Riccati.


Esta ecuación se puede resolver utilizando el método del barrido. El método consiste
en integrar en sentido inverso (desde tf hasta to) la ecuación de Riccati con valor
“inicial” λ (t f ) = Pf x (t f ) , hasta obtener P(to) y ya que x(to) es conocido será posible
calcular λ (t o ) = P (t o ) x(t o ) . Con estos valores iniciales se puede integrar la ecuación
(4.8)y obtener los valores de λ (t ) y calcular la entrada óptima como,

u (t ) = − R −1 B T λ (t )
= − R −1 B T P(t ) x(t )
u (t ) = − K (t ) x(t ) (4.10)

Como se puede apreciar en (4.10) la entrada óptima está dada por una realimentación
de estado variable en el tiempo.

4.2.2 Problema con Horizonte Infinito


En el problema con horizonte infinito se asume que el tiempo t f = ∞ .
Asuma que P (t , t f ) es solución de la ecuación
.
P = − PA − AT P + PBR −1 B T P − Q
con condiciones de frontera P (t f , t f ) = 0 . Entonces se puede decir que
lim P(t , t f ) = P existe y además es constante. Entonces la ecuación de Riccati se
t f →∞

convierte en la ecuación algebraica de Riccati, de la forma:

P A + AT P − P BR −1 B T P + Q = 0 (4.11)

y la ley de control será una matriz K = R −1 B T P invariante en el tiempo. La existencia


de una solución P única para la ecuación de Riccati está garantizada si el sistema
Regulador Optimo Cuadratico Lineal 74

(A,B) es estabilizable y (Q, A) es detectable. Además esta solución estabiliza el


sistema, ya que los valores propios de la matriz,

A − BR −1 P (4.12)

se encuentran en la parte izquierda del plano complejo (ver detalles [2]).

4.2.3 Solución de la ecuación algebraica de Riccati.

La ecuación algebraica de Riccati se puede escribir como:

⎡ A − BR −1 B T ⎤ ⎡ I ⎤ (4.13)
P A + AT P − P BR −1 B T P + Q = [P − I ]⎢ ⎥⎢ ⎥ = 0
⎣ − Q − A T
⎦ ⎣P ⎦

En esta representación tenemos una matriz de 2n × 2n asociada a la ecuación de


Riccati, esta matriz se conoce con el nombre de matriz de Hamilton,

⎡ A − BR −1 B T ⎤
H =⎢ ⎥ (4.14)
⎣− Q − AT ⎦

Algunas propiedades importantes de la matriz de Hamilton:


• Los valores propios de H son simétricos con respecto al eje imaginario.
• Existen las matrices X 1 , X 2 ∈ ℜ n×n y X1 es invertible de forma que la matriz
formada por X1 y X2 son los vectores propios de la matriz H, si (A, B) es
estabilizable y (Q, A) detectable.

⎡X ⎤ ⎡X ⎤ (4.15)
H ⎢ 1 ⎥ = ⎢ 1 ⎥Λ
⎣X 2 ⎦ ⎣X 2 ⎦
Λ = diag(λ1 ,..., λn ), Re(λi ) < 0

Entonces la solución de la ecuación de Riccati se obtiene por descomposición de H en


sus espacios propios, y la solución es de la forma:

P = X 2 X 1−1 (4.16)

4.2.4 Control Optimo en Sistemas Discretos

Considere el sistema descrito por,

x k +1 = Ax k + Bu k , (4.17)
y k = Cx k + Du k
75 J. Espinosa

El problema de control consiste en hallar las entradas u k ,k = 1,..., N de forma tal que la
función de costo

N (4.18)
J N = ∑ ( wk − y k ) T ( wk − y k )
k =0

sea minimizada, donde wk ,k = 1,..., N es una secuencia dada. Es claro, que entre más
pequeño sea el valor de JN, menor será la diferencia entre yk y wk.

La solución puede ser obtenida en términos de las siguientes ecuaciones de entrada y


salida:
⎡ H0 0 ... ... 0 ⎤
⎡ y0 ⎤ ⎡ C ⎤ ⎢ H ⎡ u0 ⎤
⎢ y ⎥ ⎢ CA ⎥ ⎢ 1 H0 ... ... 0 ⎥⎥ ⎢ ⎥
⎢ .1 ⎥ = ⎢ . ⎥ x + ⎢ H H H ... 0 ⎥ ⎢ u.1 ⎥
⎢ .. ⎥ ⎢ .. ⎥ 0 ⎢ 2 (4.19)
⎥ ⎢ .. ⎥
1 0

⎢ ⎥ ⎢ N⎥ ⎢ ... ... ... ... ... ⎥ ⎢ ⎥


⎣ y N ⎦ ⎣CA ⎦ ⎢⎣ H N −1 H N − 2 ... ... H 0 ⎥⎦ ⎣u N −1 ⎦

y = O N x0 + H N u

donde Hk son los parámetros de Markov, definidos como:

H 0 = D, H k = CA k −1 B,k = 1,2,..., N .
La función de costo (4.18)se transforma en:

J N = w T w + x 0T O TN O N x 0 + u T H TN H N u − 2 w T O N x 0 − 2 w T H N u + 2 x 0T O TN H N u
derivando con respecto a u e igualando a cero se obtiene,

H TN H N u = H TN w − H TN O N x 0
La secuencia u* optima se puede obtener calculando la solución de mínimos
cuadrados de la ecuación anterior.

Obsérvese que en este caso el valor de la entrada u no se encuentra limitado, esto


quiere decir que la entrada u puede tomar valores muy grandes cosa que en la práctica
no es posible por la saturación del actuador. Es por ello, que se hace necesario
formular el problema de control discreto en términos análogos a la formulación en
tiempo continuo.

4.2.5 Regulador Cuadrático Lineal-Caso discreto.

4.2.5.1 Horizonte Finito


En este caso tenemos el sistema descrito por:

x k +1 = Ax k + Bu k , x0 conocido (4.20)
Regulador Optimo Cuadratico Lineal 76

El problema de control consiste en hallar las entradas u k ,k = 1,..., N de forma tal que la
función de costo,

JN =
1 T
2
1 N −1
[
x N Px N + ∑ x kT Qx k + u kT Ru k
2 k =0
] (4.21)

sea minima.

Aplicando el método de los multiplicadores de Lagrange para integrar las


restricciones del problema, la función de costo se convierte en:

JN =
1 T
2
1 N −1
[
x N Px N + ∑ x kT Qx k + u kT Ru k + λTk +1 (− x k +1 + Ax k + Bu k )
2 k =0
] (4.22)

Donde λk son nuevamente los multiplicadores de Lagrange.


Derivando la función de costo con respecto a u k ,λ k +1 y x k e igualando a cero se
obtiene:
∂J N (4.23)
= u kT R + λTk +1 B = 0
∂u k
∂J N (4.24)
= − x k +1 + Ax k + Bu k = 0
∂λ k +1
∂J N
= x kT Q − λTk + λTk +1 A = 0 (4.25)
∂x k
∂J N
= Px N − λ N = 0
∂x N (4.26)

Planteando el problema como un sistema de ecuaciones de diferencia con condiciones


dos condiciones de frontera tenemos:

⎡ x k +1 ⎤ ⎡ A + BR −1 B T A −T Q − BR −1 B T A −T ⎤ ⎡ x k ⎤ (4.27)
⎢λ ⎥ = ⎢ ⎥⎢ ⎥
⎣ k +1 ⎦ ⎣ − A −T Q A −T ⎦ ⎣λ k ⎦
x 0 → dado
λ N = Px N
(4.28)
λ k = Pk x k

La entrada óptima del sistema estará dada por:


Ru k = − B T Pk +1 x k +1
Ru k = − B T Pk +1 ( Ax k + Bu k )
( R + B T Pk +1 B)u k = − B T Pk +1 Ax k
u k = − S k−+11 B T Pk +1 Ax k
(4.29)
donde S K = R + B T Pk B (4.30)
77 J. Espinosa

Reemplazando (4.28) en (4.25) se obtiene,

Pk x k = AT Pk +1 x k +1 + Qxk
Pk x k = AT Pk +1 ( Axk + Bu k ) + Qxk (4.31)

y reemplazando (4.29)en (4.31),

[Pk ( ) ]
− AT Pk +1 + Pk +1 BS k−+11 B T Pk +1 A − Q x k = 0,∀k . (4.32)

Ya que x k ≠ 0 entonces,

( )
Pk = AT Pk +1 + Pk +1 BS k−+11 B T Pk +1 A + Q. (4.33)

(4.33) es una ecuación de diferencia de Riccati.


Usando el método del “barrido”, resolvemos a partir de las condiciones de frontera.
Del estado final

λ N = Px N = PN x N .

se pueden calcular todos los valores de Pk hasta P0.

La entrada estará descrita como una realimentación de estado,

u k = − K k xk , (4.34)

donde,

K k = ( R + B T Pk +1 B ) −1 B T Pk +1 A . (4.35)

El costo óptimo será


1 T (4.36)
J Nmin = xo Px 0
2

4.2.5.1 Horizonte infinito

Para el caso de horizonte infinito en sistemas discretos, se asume que PK alcanza una
condición de estado estable y entonces la función de realimentación queda descrita
por:

u k = − Kx k , (4.37)

donde,

K = ( R + B T P B ) −1 B T P A . (4.38)
Regulador Optimo Cuadratico Lineal 78

Donde P satisface la ecuación algebraica de Riccati,

[ ]
P = AT P + P B( R + B T P B) −1 B T P A + Q. (4.39)

1
La solución estabilizará el sistema si el par (A,B) es estabilizable y el par ( P 2 , A) es
detectable.

El costo óptimo será

1 T (4.40)
J Nmin = xo P x0
2

La solución de la ecuación algebraica de Riccati para el caso discreto, es similar a la


explicada en el apartado 4.2.3.

4.3 Ejemplos

En este capítulo se continuará con el estudio de los dos ejemplos mostrados en el


capítulo anterior. En este apartado se asumirá que tenemos acceso a todos los estados
y se calcularán leyes de control óptimas.

4.3.1 Carros acoplados con Unión Flexible

Para el diseño del controlador LQR seleccionamos las matrices Q y R así:

⎡1000 0 0 0⎤
⎢ 0 1 0 0⎥⎥
Q=⎢ ,R = [1]
⎢ 0 0 1000 0⎥
⎢ ⎥
⎣ 0 0 0 1⎦
Observe que la matriz Q penaliza en mayor proporción las desviaciones de los carros
de su punto de equilibrio, comparado con las velocidades o con la entrada.

La matriz P que satisface la ecuación algebraica de Riccati es

⎡ 470.46 30.46 − 69.92 29.72⎤


⎢ 30.46 2.7 − 4.61 1.62 ⎥⎥
P= ⎢
⎢− 69.92 − 4.61 195.33 3.43 ⎥
⎢ ⎥
⎣ 29.72 1.62 3.43 3.82 ⎦

y la matriz K de realimentación construida a partir de la solución de Riccati,

K = [52.69 4.68 − 7.97 2.8]


79 J. Espinosa

Los polos del sistema serán:

- 1.9521 ± 10.6106i, - 5.7951 ± 4.1151i

Si penalizamos aún más la posición la matriz Q será,

⎡10000 0 0 0⎤
⎢ 0 1 0 0⎥⎥
Q= ⎢ ,R = [1]
⎢ 0 0 10000 0⎥
⎢ ⎥
⎣ 0 0 0 1⎦
la nueva matriz de realimentación será:

K = [163 10.14 − 21.58 10.57]


y los polos del sistema:
- 8.7999 ± 8.4970i,- 3.6673 ± 10.5267i

En la siguiente figura se pueden observar las respuestas de los dos sistemas, es claro
que el segundo tiene una respuesta más rápida, pero en la Figura 4.1 se puede
apreciar que para lograr esa respuesta más rápida se requiere una entrada con mayor
amplitud. La selección de las matrices de costo esta basada en el compromiso entre
una respuesta rápida pero sin saturar la entrada o consumir demasiada energía para
llevar el sistema al estado deseado.

Figura 4.1 Respuesta del sistema para los dos controladores propuestos
Regulador Optimo Cuadratico Lineal 80

Figura 4.2 Entrada u(t) para los dos controladores

Esto convierte el diseño en la tarea de encontrar los valores adecuados de Q y R que


llenen las especificaciones de control.

4.3.2 Control de un Sistema Lector de Cinta Magnética[4]

En este caso las especificaciones de control exigen minimizar la energía a la salida del
sistema (posición de la cabeza de lectura y escritura y la tensión de la cinta). Sin
embargo, la señal de control no puede ser demasiado grande ya que puede saturar el
actuador (los drives de los motores). Debido a esto, se requiere un poco de intento y
error en la selección de las matrices Q y R.
Primero que todo, debemos observar que nuestras especificaciones están dadas en
función de las salidas del sistema, entonces la función de costo estará definida como:

J= 1
∫ ( y(t ) Q ′y (t ) + u (t ) T Ru (t ))dt
T
2
0

Para obtener la matriz Q a partir de Q’ reemplazamos y(t) por Cx(t)


J= 1
∫ ( x(t ) C T Q ′Cx(t ) + u (t ) T Ru (t ))dt
T
2
0

Entonces Q será de la forma:

Q = C T Q ′C
Como primera elección escogemos Q’ y R como:
⎡2 0⎤ ⎡1 0 ⎤
Q' = ⎢ ⎥ ,R = ⎢ ⎥
⎣0 2⎦ ⎣0 1 ⎦
Entonces Q será:
81 J. Espinosa

⎡0.5 − 0.2⎤
⎢ 0 − 0.2⎥
⎢ ⎥
⎢0.5 0.2 ⎥ ⎡2 0⎤ ⎡ 0.5 0 0.5 0 0 0⎤
Q = C Q' C = ⎢
T

⎢0 0.2 ⎥ ⎢⎣0 ⎥
2⎦ ⎣− 0.2 − 0.2 0.2 0.2 0 0⎥⎦

⎢0 0 ⎥
⎢ ⎥
⎢⎣ 0 0 ⎥⎦
⎡ 0.58 0.08 0.42 − 0.08 0 0⎤
⎢ 0.08 0.08 − 0.08 − 0.08 0 0⎥⎥

⎢ 0.42 − 0.08 0.58 0.08 0 0⎥
Q=⎢ ⎥
⎢− 0.08 − 0.08 0.08 0.08 0 0⎥
⎢ 0 0 0 0 0 0⎥
⎢ ⎥
⎣⎢ 0 0 0 0 0 0⎦⎥

Observe que Q no es diagonal, pero es positiva definida y simétrica.

Resolviendo la ecuación de Riccati para el Q y R dados, se obtiene:

⎡1.02 1.73 0.84 1.36 0.55 0.45⎤


⎢1.73 4.35 1.36 3.02 1.78 1.14 ⎥⎥

⎢0.84 1.36 1.02 1.73 0.45 0.55⎥
P =⎢ ⎥
⎢1.36 3.02 1.73 1.14 1.14 1.78 ⎥
⎢0.55 1.78 0.45 1.14 0.86 0.46⎥
⎢ ⎥
⎢⎣0.45 1.14 0.55 1.78 0.46 0.86⎥⎦

generando la ley de control:


⎡0.55 1.78 0.45 1.14 0.86 0.46⎤
K =⎢ ⎥
⎣0.45 1.14 0.55 1.78 0.46 0.86⎦

Con esta ley de control los polos de lazo cerrado quedan ubicados en:

- 1.3145 , - 0.6268 ± 0.8650i, - 0.4056 ± 0.7266i, - 1.0413

Si ahora escogemos un nuevo Q’,


⎡9 0⎤ ⎡1 0⎤
Q' = ⎢ ⎥ , R = ⎢0 1 ⎥
⎣0 9 ⎦ ⎣ ⎦
aplicando el mismo procedimiento anterior obtenemos una ley de control:

⎡1.26 3.31 0.86 1.68 1.38 0.53⎤


K =⎢ ⎥
⎣0.86 1.68 1.26 3.31 0.53 1.38 ⎦

y los polos de lazo cerrado para esta ley de control serán:


Regulador Optimo Cuadratico Lineal 82

- 1.5962, - 1.1583, - 0.7836 ± 1.1744i,-0 .5743 ± 0.9066i

Las respuestas impulso de ambos sistemas se pueden observar en la Figura 4.3.


En la Figura 4.4 se puede comparar las amplitudes de las entradas para los dos
controladores propuesto, de nuevo, es claro, que el precio a pagar por un transiente
corto es una entrada de mayor amplitud.

Figura 4.3 Respuesta Impulso del Sistema en Lazo Cerrado

Figura 4.4 Salida del controlador del Sistema en Lazo Cerrado durante la respuesta impulso.
83 J. Espinosa

4.4 Estimación Optima-Filtros de Kalman-Bucy

En el diseño de estimadores de estado existe la pregunta ¿Cual debería ser la


ubicación óptima de los polos del estimador? La ubicación de los polos del estimador
está determinada por el compromiso entre la velocidad de convergencia y la
inmunidad al ruido.

Kalman y Bucy resolvieron este problema y por ello la solución es llamada también
filtro de Kalman-Bucy. El término filtro viene de la capacidad del estimador para
reducir el impacto del ruido en el valor estimado del estado.

En este apartado se presenta la formulación de este estimador.

Considere el sistema dinámico,

x& (t ) = Ax(t ) + Bu u (t ) + Bw w(t ), (4.41)


y (t ) = Cx (t ) + v(t ) (4.42)

y el estimador,

xˆ& (t ) = Axˆ (t ) + L( y (t ) − Cxˆ (t )) + Bu u (t ) (4.43)

donde las señales w(t) representan las perturbaciones del sistema, v(t) representa el
ruido en el sensor. Ruido y perturbaciones son modelados como ruido blanco, con
amplitud unitaria y valor medio cero. Es importante aclarar, que en la realidad el ruido
blanco no puede existir en sistemas continuos, ya que el ancho de banda del espectro
del ruido blanco debe ser infinito y esto implica a su vez un ruido con contenido de
energía infinito. Sin embargo, en la práctica el ruido tiene un ancho de banda mucho
mayor al del sistema en estudio y por eso es correcto asumir en términos prácticos
que la señal se puede modelar como un ruido blanco.

Como se mencionó en el párrafo anterior el ruido se asume blanco no correlacionado


con los estados ni con la salida. Lo cual implica que:

ε {v(t ) x(t ) T } = 0 (4.44)


ε {w(t ) x(t ) T } = 0 (4.45)
ε {v(t ) y (t ) T } = 0 (4.46)
donde {.} es el valor esperado. Estas condiciones se conocen también como
condiciones de ortogonalidad del ruido con respecto a los estados y la salida.

De otra parte la covarianza del ruido se define como:


ε {v (t )v (t ) T } = Rv (4.47)
ε {w(t ) w(t ) T } = R w (4.48)
ε {v(t ) w(t ) T } = 0 (4.49)

El problema consiste ahora en encontrar un valor óptimo de L de forma que la función


de costo,
Regulador Optimo Cuadratico Lineal 84

⎧1 T ⎫ (4.50)
J = E ⎨ ∫ (( x(t ) − xˆ (t )) T ( x(t ) − xˆ (t )))dt ⎬
⎩T 0 ⎭

sea minimizada.

Si la estimación es óptima, el error de estimación no tendrá ninguna relación con la


salida medida,
ε {( x(t ) − xˆ (t )) y (τ ) T } = 0 (4.51)
reemplazando (4.42) en (4.51)
ε {( x(t ) − xˆ (t ))( x(τ ) T C T + v(τ ) T )} = 0 (4.52)
expandiendo la expresión se obtiene:
ε {( x(t ) − xˆ (t )) x(τ ) T }C T + ε1{x42 (t )v(τ ) T }− ε {xˆ (t )v(τ ) T } = 0
43
(4.53)
=0

ε {( x(t ) − xˆ (t )) x(τ ) }C T = ε {xˆ (t )v(τ ) T }


T

el segundo término es igual a 0 de acuerdo con la condición de ortogonalidad.

Recordando que la respuesta xˆ (t ) es la solución de la ecuación diferencial (4.43) que


esta dada por:

(4.54)
xˆ (t ) = Φ(t ,0) xˆ (0) + ∫ Φ(t , γ ) Bu u (γ )dγ + ∫ Φ(t , γ ) L(γ ) y (γ )dγ
t t

0 0

Φ(t ,τ ) = e A(t −τ )
donde la matriz L se asume variante en el tiempo.

Reemplazando la expresión (4.54) para xˆ (t ) en (4.53) se obtiene:

ε {( x(t ) − xˆ (t )) x(τ ) T }C T = (4.55)

ε ⎧⎨⎛⎜ Φ (t ,0) xˆ (0) + ∫ Φ (t , γ ) Bu u (γ )dγ + ∫ Φ (t , γ ) L(γ ) y (γ )dγ ⎞⎟v(τ ) T ⎫⎬


t t

⎩⎝ 0 0 ⎠ ⎭

ε {( x(t ) − xˆ (t )) x(τ ) T }C T = (4.56)

1424
{3 0
} t

1
{
Φ (t ,0) xˆ (0)ε v(τ ) T + ∫ Φ (t , γ ) Bu u (γ )dγ ε v(τ ) T
424 3
}
=0 =0
t
{
+ ∫ Φ (t , γ ) L(γ )ε y (γ )v(τ ) T dγ
0
}
reemplazando y (t ) = Cx (t ) + v (t ) se obtiene:
ε {( x(t ) − xˆ (t )) x(τ ) T }C T = (4.57)
∫0 Φ(t , γ ) L(γ )Cε1{x42
(γ )v(τ ) T }dγ
t

4 43 4
=0

0
t

14 4244
{
+ ∫ Φ (t , γ ) L(γ )ε v(γ )v(τ ) T dγ
3
}
Rv

lo cual es igual a:
85 J. Espinosa

ε {( x(t ) − xˆ (t )) x(τ ) T }C T = ∫ Φ(t , γ ) L(γ ) Rv δ (γ − τ )dγ (4.58)


t

reemplazando τ = t − ε y resolviendo la integral se obtiene:

ε {( x(t ) − xˆ (t )) x(t − ε ) T }C T = L(t − ε ) Rv (4.59)

si calculamos el lim ε → 0 se obtiene:


Q(t )C T = L(t ) Rv (4.60)

donde Q (t ) es la matriz de covarianza del error de estimación.


De esta forma la matriz L (t ) que genera una estimación optima estará dada por:
L (t ) = Q (t )C T R v
−1
(4.61)

La matriz de covarianza Q (t ) del error de estimación se obtiene a partir de la


ecuación diferencial que gobierna el error de estimación y que esta dado por la resta
entre la ecuación (4.41) menos (4.43).
⎡ w(t )⎤ (4.62)
e&(t ) = x& (t ) − x&ˆ (t ) = ( A − L(t )C )e(t ) + [Bw − L(t )]⎢ ⎥
⎣ v(t ) ⎦
La matriz Q (t ) de covarianza del error estará gobernada por la ecuación:
Q& (t ) = Q (t )[ A − L(t )C ] + [ A − L(t )C ]Q(t ) (4.63)
T

⎡R 0 ⎤ ⎡ Bw T ⎤
+ [Bw − L(t )]⎢ w ⎥⎢ T ⎥
⎣ 0 Rv ⎦ ⎣− L(t ) ⎦
reemplazando L (t ) de la expresión (4.61) en (4.73) obtenemos
−1
Q& (t ) = Q(t ) AT + AQ(t ) + B R B − Q(t )C T R CQ(t )
T (4.64)
W w x v
que corresponde a una ecuación diferencial de Riccati.

Si se resuelve la ecuación para condiciones de estado estacionario ( Q& (t ) = 0 ) se


obtiene una ecuacion algebraica de Riccati de la forma:
AQ + QA T + BwT Rw Bw − QC T Rv−1CQ = 0 (4.65)

Aplicando un procedimiento similar al aplicado para resolver ley de control óptima


descrito en la seccion 4.2.3 y resolviendo Q , el valor óptimo de L para la ganancia
del estimador está dado por:

L = QC T Rv−1 (4.66)

Uno de los problemas encontrados en el diseño de estimadores óptimos, tiene que ver
con las imprecisiones en el modelo de la planta, este problema puede ser corregido
aumentado el valor de la covarianza Rw. Entre más grande sea el valor de Rw se asume
mayor incertidumbre eso hace que el estimador sea mas lento pero mas robusto. Este
truco es utilizado para robustificar soluciones optimas de control en la literatura se
hace referencia a esta estrategia como Loop Transfer Recovery (LTR).
Regulador Optimo Cuadratico Lineal 86

4.4.1 Estimación Optima-Formulación Discreta

Considere el sistema,

x k +1 = Ax k + Bu u k + Bw wk , (4.67)
y k = Cx k + v k

el observador tendrá la forma,

xˆ k +1 = Axˆ k + Lk ( y − Cxˆ k ) + Bu u k (4.68)

Para el caso de un observador variante en el tiempo la ganancia del observador está


dada por:

−1
Lk = AQk C T ( Rv + CQk C T ) −1 (4.69)

Donde Qk es una matriz simétrica, positiva semidefinida, que representa la matriz de


covarianza del error de estimación y está dada por la solución de la ecuación de
diferencia de Riccati,

Qk +1 = AQ k AT − AQk C T ( Rv + CQ k C T ) −1 CQ K A T + B w R w B wT (4.70)

Para el caso invariante en el tiempo tomamos el valor de Q de estado estable y la


ecuación de diferencia se convierte en una ecuación algebraica de Riccati, de la
forma.

Q − AQ AT + AQ C T ( Rv + CQ C T ) −1 CQ AT − Bw Rw BwT = 0 (4.71)

y la matriz de realimentación será,

−1
L = AQ C T ( Rv + CQ C T ) −1 (4.72)

Existen otras formulaciones más detalladas para el filtro de Kalman, la formulación es


basada en la posibilidad de plantear el problema de estimación como un problema de
mínimos cuadrados [10].

4.5 Ejemplos de Diseño de Estimadores Optimos

4.5.1 Carros Acoplados con Unión Flexible


87 J. Espinosa

Para este caso de nuevo asumimos la misma condición descrita en el capítulo anterior
para el diseño de observadores. La condición consiste en asumir como única salida la
posición del segundo carro.
Suponiendo Bw=B.
Asumiendo,

Rw = 0.7,Rv = 1

Resolviendo la ecuación de Riccati se obtiene

⎡1.92e − 01 1.84e − 02 1.92e − 01 1.9e − 02 ⎤


⎢1.84e − 02 1.42e − 01 1.83e − 02 1.21e − 5 ⎥⎥
Q=⎢
⎢1.92e − 01 1.83e − 02 1.95e − 01 1.89e − 02⎥
⎢ ⎥
⎣ 1.9e − 02 1.21e − 05 1.89e − 02 2.39e − 01⎦

Con la solución Q se calcula la ganacia L,

⎡1.92e − 01⎤
⎢1.83e − 02⎥
=⎢ ⎥
−T
L = QC T Rv
⎢1.95e − 01⎥
⎢ ⎥
⎣1.89e − 02⎦

Figura 4.5 Comparación en la estimación con ruido, (-)estado real, (--) estimador con polos 10
veces los polos de lazo cerrado, (.-) estimador con 5 veces los polos de lazo cerrado, (+) estimador
óptimo.
Regulador Optimo Cuadratico Lineal 88

4.5.2 Estimación Optima en un Sistema Lector de Cinta Magnética

Tomamos el modelo (A,B,C,D) del sistema dado en el capítulo anterior y tomamos la


matriz

⎡0 0⎤
⎢0 0⎥⎥

⎢0 0⎥
Bw = B = ⎢ ⎥
⎢0 0⎥
⎢0 1⎥
⎢ ⎥
⎣⎢1 0⎦⎥

Suponiendo que la precisión RMS de la posición de la cinta es 2.10-5 y la precisión


RMS de la medida de tensión de la cinta es 0,01N la matriz de covarianza de v será,

⎡4 0 ⎤
Rv = ⎢ ⎥
⎣0 0.0001⎦

La matriz de covarianza de w está dada como

⎡0.001 0 ⎤
Rw = ⎢
⎣ 0 0.001⎥⎦

resolviendo la ecuación de Riccati, se obtiene,

⎡ 2.23e − 1 3.16e − 3 2.22e − 1 3.02e − 3 2.39e − 4 1.07e − 4 ⎤


⎢ 3.16e − 3 4.81e − 4 3.02e − 3 3.35e − 4 2.22e − 4 5.33e − 5 ⎥⎥

⎢ 2.22e − 1 3.02e − 3 2.23e − 1 3.16e − 3 1.07e − 4 2.39e − 4⎥
Q=⎢ ⎥
⎢ 3.02e − 3 3.35e − 4 3.16e − 3 4.81e − 4 5.33e − 5 2.22e − 4⎥
⎢2.39e − 4 2.22e − 4 1.07e − 4 5.33e − 5 4.75e − 4 1.65e − 5 ⎥
⎢ ⎥
⎢⎣1.07e − 4 5.33e − 5 2.39e − 4 2.22e − 4 1.65e − 5 4.75e − 4⎥⎦

Con la solución Q se calcula la ganancia L,

⎡5.56e − 2 − 1.67 ⎤
⎢7.74e − 4 − 0.571⎥
⎢ ⎥
−T ⎢5.56e − 2 1.67 ⎥
L = QC T Rv =⎢ ⎥
⎢7.74e − 4 0.571 ⎥
⎢ 4.32e − 5 − 0.602⎥
⎢ ⎥
⎢⎣ 4.32e − 5 0.602 ⎥⎦
89 J. Espinosa

Figura 4.6 Comparación en la estimación con ruido, (-)estado real, (--) estimador con polos 10
veces los polos de lazo cerrado, (.-) estimador con 5 veces los polos de lazo cerrado, (..) estimador
óptimo.

4.6 Regulador Optimo Cuadrático Gaussiano

Hasta este punto se han desarrollado dos elementos,

• La posibilidad de obtener una ley de control óptima basada en los estados del
sistema.
• La posibilidad de estimar los estados del sistema de forma óptima para unas
características de ruido dadas y a partir de los datos de entrada y salida.

Estos elementos permiten la construcción de un compensador como se muestra en la


Figura 4.7 basado en los datos de salida. Sin embargo, la pregunta que surge es: si el
compensador construido con una ley de realimentación de estado óptima y con un
estimador óptimo es a su vez óptimo?
Regulador Optimo Cuadratico Lineal 90

Figura 4.7 Realimentación de Estado con Estimador

El problema se puede formular de la siguiente forma:

Dada una planta


x& (t ) = Ax(t ) + Bu u (t ) + Bw w(t ), (4.73)
y (t ) = Cx (t ) + v(t )

donde w y v son ruido blanco con covarianzas Rw y Rv respectivamente, no


correlacionados. Encontrar la entrada u que minimiza la función de costo

∫ (x(t ) )
T
1
J = lim T
Qx(t ) + u (t ) T Ru (t ) dt (4.74)
T →∞ 2T
−T

Con matrices Q y R simétricas, positivas definidas.

La solución óptima está dada por

u (t ) = − Kxˆ (t ) (4.75)
91 J. Espinosa

donde,

K = R −1 Bu P
T (4.76)

donde P se calcula a partir de la ecuación algebraica de Riccati

PA + AT P − PBR −1 Bu P + Q = 0
T (4.77)

El vector estimado xˆ (t ) se obtiene de

xˆ& (t ) = Axˆ (t ) + L( y (t ) − Cxˆ (t )) + Bu u (t ) (4.78)

donde la matriz L está dada por,

L = SC T Rv−1 (4.79)

donde S es la solución de la ecuación matricial algebraica de Riccati,

AS + SAT + B wT Rw Bw − SC T Rv−1CS = 0 (4.80)

Entonces el compensador tendrá la estructura,

x&ˆ (t ) = [ A − Bu K − LC ]xˆ (t ) + Ly (t ), (4.81)


u (t ) = − Kxˆ (t )

el sistema en lazo cerrado será

⎡ x& ⎤ ⎡ A − Bu K ⎤ ⎡ x ⎤ ⎡ Bw 0 ⎤ ⎡ w⎤ (4.82)
⎢ x&ˆ ⎥ = ⎢ LC A − B K − LC ⎥ ⎢ xˆ ⎥ + ⎢ 0 L ⎥⎦ ⎢⎣ v ⎥⎦
⎣ ⎦ ⎣ u ⎦⎣ ⎦ ⎣
⎡C 0⎤ ⎡ x ⎤ ⎡0 I ⎤ ⎡ w⎤
y=⎢ ⎥⎢ ⎥ + ⎢ ⎥⎢ ⎥
⎣ 0 0⎦ ⎣ xˆ ⎦ ⎣0 0⎦ ⎣ v ⎦

si se utiliza el vector e(t ) = x(t ) − xˆ (t ) el sistema quedará

⎡ x& ⎤ ⎡ A − Bu K Bu K ⎤ ⎡ x ⎤ ⎡ Bw 0 ⎤ ⎡ w⎤ (4.83)
⎢ e& ⎥ = ⎢ 0
+
A − LC ⎥⎦ ⎢⎣ e ⎥⎦ ⎢⎣ Bw − L ⎥⎦ ⎢⎣ v ⎥⎦
⎣ ⎦ ⎣
⎡C 0⎤ ⎡ x ⎤ ⎡0 I ⎤ ⎡ w⎤
y=⎢ ⎥⎢ ⎥ + ⎢ ⎥⎢ ⎥
⎣ 0 0 ⎦ ⎣ e ⎦ ⎣0 0 ⎦ ⎣ v ⎦
Regulador Optimo Cuadratico Lineal 92

Se puede observar claramente que los valores propios del sistema en lazo cerrado está
dado por los valores propios del sistema compensado por realimentación de estado y
los valores propios del estimador.

Esta característica es conocida como Principio de Separación. Y este principio


permite diseñar compensadores óptimos, diseñando de forma independiente la ley de
control óptima por realimentación de estado (LQR) y el compensador óptimo (Filtro
de Kalman).

Entonces los elementos de diseño serán las matrices Q, R, Rw y Rv. No existen


procedimientos sistemáticos para la selección de estas matrices, sin embargo, es
importante resaltar que una buena selección las matrices Rw y Rv ayuda a compensar
los errores en el modelo, en tanto que la selección las matrices Q y R nos permiten
mantener los estados del sistema lo más cercano posible al punto de operación
aumentando la validez de modelos linealizados alrededor de un punto de operación,
minimizando el esfuerzo de control.

4.7 Ejemplos

En esta sección de ejemplos se muestran los compensadores obtenidos al combinar


para cada caso la ley de control óptima con el estimador óptimo calculados en los
apartados anteriores.

4.7.1 Carros Acoplados con Unión Flexible

En la Figura 4.8 se puede observar el resultado de combinar los dos controladores


LQR con el estimador óptimo, comparado con la respuesta del controlador LQR, es
claro que la respuesta no es la deseada, a pesar de que los dos componentes fueron
calculados de forma óptima. Este ejemplo permite ilustrar que a pesar de que el
principio de separación permite realizar el calculo del controlador y el estimador de
forma separada la elección de las matrices Q, R, Rw y Rv se debe llevar a cabo de
manera coordinada. En este caso es claro que los valores propios del estimador son los
que dominan la respuesta del sistema cuando en realidad debían ser los del
controlador los que dominaran la respuesta.
93 J. Espinosa

Figura 4.8 Desempeño de los sistemas LQR (-- y ..) vs LQG (- y *)


La explicación para esta situación es la siguiente, cuando se realiza el diseño del
controlador LQR no se toma en cuenta el ruido en el sistema, por eso el diseño del
controlador generó unos polos de frecuencia mayor a los polos del estimador, dejando
como polos dominantes los polos del estimador.
Como conclusión de este ejemplo podemos sacar que el principio de separación es
una herramienta que permite calcular de manera simple las ganancias del controlador
y el estimador, sin embargo, el principio de separación no nos garantiza que el
desempeño del sistema combinado sea el mismo que se obtuvo cuando se realizaron
los cálculos de controlador y estimador por aparte. El procedimiento obvio es colocar
nuestros requerimientos de control dentro de los limites alcanzables y recalcular el
controlador, si el controlador no cumple con las especificaciones deseadas, se hace
necesario reducir el ruido en el sistema. Para reducir el ruido se debe apelar a dos
estrategias una es mejorar el modelo del sistema y la otra es mejorar la calidad de los
sensores utilizados o su número, es decir medir más estados.
Para el presente caso se recalculará el controlador con unas nuevas matrices de costo,
⎡1 0 0 0 ⎤
⎢0 1 0 0⎥
Q=⎢ ⎥, R = [1]
⎢0 0 1 0⎥
⎢ ⎥
⎣0 0 0 1 ⎦
Regulador Optimo Cuadratico Lineal 94

Figura 4.9 Respuesta del sistema con un nuevo Q=diag(1,1,1,1)


la respuesta de se observa en la Figura 4.9 y es claramente no satisfactoria por ello
tomando un nuevo sensor y aumentando el margen de confianza en nuestro modelo.
Se utilizó para el diseño las matrices de costo y covarianza,

⎡1000 0 0 0⎤
⎢ 0 1 0 0⎥⎥
Q=⎢ , R = [1], Rw = 7e − 02, Rv = 1e − 03
⎢ 0 0 1000 0⎥
⎢ ⎥
⎣ 0 0 0 1⎦

Figura 4.10 Respuesta final del sistema


A pesar de que en este ejemplo se variaron de forma “arbitraria” los parámetros de
covarianza del ruido, no se debe olvidar que estos parámetros son dados por la calidad
de los sensores y el modelo y por ello no son de libre elección en el diseño del
compensador, los cambios en estos parámetros deben venir acompañados de cambios
en el modelo y en el sensor.
95 J. Espinosa

4.7.2 Sistema Lector de Cinta Magnética

Para este ejemplo, se combinarán las soluciones obtenidas en los apartados de LQR y
de estimación óptima y se analizará el resultado.

Figura 4.11 Desempeño de los sistemas LQR (-- y ..) vs LQG (- y *)


En la figura es claro nuevamente que los valores propios del estimador, dominan la
dinámica del sistema, sin embargo la diferencia en la respuesta no es muy grande y el
diseño LQG es menos sensible a las perturbaciones que el diseño realizado por el
método de ubicación de los polos, como lo muestra la Figura 4.12.

Figura 4.12 Desempeño del sistema LQG (-) vs. Método de ubicación de polos en presencia de
ruido.
Regulador Optimo Cuadratico Lineal 96

4.8 Ejercicios del Capitulo

1. Diseñe un regulador optimo de realimentación de estado, introduzca la


referencia para la posición horizontal del carro. Utilice los mismos parámetros
físicos del ejemplo anterior. Obtenga un Q y un R de manera que el sistema
tenga un tiempo de establecimiento de 2 seg y un amortiguamiento de
ζ = 0.5 .

2. Diseñe un sistema de realimentación de estado que estabilice el modelo de la


caldera y obtenga un tiempo de establecimiento de 250 s y un
amortiguamiento razonable, simule la respuesta del sistema usando distintas
condiciones iniciales de forma que cada vez un solo estado sea distinto de cero

El modelo se linealizo alrededor del siguiente punto de operación


U*=[0.32270 0.39503 0.37404 0]
Y*=[320 2.5 0.0 9.3053]
X*=[22.5 2.5 621.17 0.6941]

El controlador deberá evitar saturar las entradas que se encuentran en un valor


entre 0 y 1

3. Diseñe un sistema de realimentación de estado optimo calcule Q y R de forma


que el sistema de la columna de destilación cumpla con las especificaciones de
control impuestas en el ejercicio anterior asumiendo que no existen retardos.
4. Construya observadores optimos que estimen los estados de las siguientes
plantas.
a. Péndulo invertido
b. Columna de destilación
c. Para la caldera
Defina de antemano las varianzas de los ruidos y examine la ubicacion de los

valores propios de la matriz (A-LC). Aplique los ruidos de medicion y estados y

simule.

5. Aplique la realimentación de estado obtenida en los numerales 1,2 y 3


utilizando los estados estimados por el observador diseñado en el punto
anterior, en lugar de los estados de la planta. Para la simulación añada ruido a
las mediciones y compare las respuestas con el sistema en el que se
realimentaron los estados directamente
97 J. Espinosa

Bibliografía
[1] R.E.Kalman, Y.C.Ho, and K.S.Narendra, “Controllability of linear dynamical
systems” Contributions to Differential Equations, vol. 1, no.2, pp.189-213, 1963.

[2] O.I.Elgerd, Control Systems Theory, 1 ed., Ed.McGrawHill, 1967.

[3] B.DeMoor,Y.Cheng, P.DeGersem and K.Eneman, Computer Aided Control Systems


Design, Course Notes. ESAT-SISTA Katholieke Universiteit Leuven, 1996.

[4] J.C.Willems and S.K. Mitter, “Controllability, Observability, Pole Allocation and
State Reconstruction”, IEEE Transactions on Automatic Control,vol.16, no.6, pp.582-595

[5] D.G. Luenberger, “An Introduction to Observers”, IEEE Transactions on Automatic


Control,vol.16, no.6, pp.596-602

[6] K.Zhou, J.C. Doyle and K. Glover, Robust And Optimal Control, Ed. Prentice Hall,
preprint. 1995

[7] W.M.Wonham, “On Pole Assignment in Multi-Input Controllable Linear Systems”,


IEEE Transactions on Automatic Control,vol.12, no.6, pp.660-665

[8] R.C.Dorf, Modern Control Systems, 6 Ed., Ed.Addison Wesley, 1992

[9] A.Grace, A.J.Laub, J.N.Little y C.M. Thompson, Control System Toolbox User’s
Guide, Mathworks Inc. 1992

[10] P.Van Dooren, Numerical Linear Algebra for Signals Systems and Control, Draft
notes for the Graduate School in Systems and Control, Bélgica, 1995

[11] R.A.Horn, C.R. Johnson. Matrix Analysis. Cambridge University Press, Cambridge.
1990

[12] J. Apkarian.A comprehensive and modular laboratory for control systems design
and implementation. Quanser Consulting, 1995

[13] T. Kailath. Linear Systems, Ed. Prentice Hall, USA, 1980

[14] F.G. Shinskey. Process Control Systems: Application Design and Tuning, Ed
McGraw-Hill, 4 ed. USA, 1996

[15] V. Kucera. Analysis and Design of Discrete Linear Control Systems, Ed Academia,
Praga, 1991
Regulador Optimo Cuadratico Lineal 98

[16] A. Preumont. Vibration and Control of Active Structures: An introduction, Ed.


Kluwer Academic, Netherlands, 1997

[17] P. Desphande. Multivariable Process Control, Instrument Society of America, USA,


1989

[18] A. Bryson Jr, Y-C Ho. Applied Optimal Control: optimization, estimation and
control, Hemisphere Publishing Corp., USA, 1975

[19] S. Skogestad, I. Postlethwaite. Multivariable Feedback Control: Analysis and


Design, Ed. John Wiley & Sons, England, 1996

Você também pode gostar