Control Predictivo.

TESIS DOCTORAL
Control predictivo de sistemas

no lineales con restricciones:
estabilidad y robustez
Daniel Limon Marruedo
Sevilla, Septiembre de 2002
TESIS DOCTORAL
por
Daniel Limon Marruedo
Ingeniero Industrial por la Escuela Superior de Ingenieros
de la Universidad de Sevilla
Presentada en la
Escuela Superior de Ingenieros
de la
Universidad de Sevilla
para la obtencion del
Grado de Doctor Ingeniero Industrial
Sevilla, Septiembre de 2002
TESIS DOCTORAL
Autor: Daniel Limon Marruedo
Directores:
Teodoro

Alamo Cantarero
Eduardo Fernandez Camacho
Indice general
Notacion 1
1. Introduccion 3
1.1. Introduccion al control predictivo . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Formulacion del control predictivo . . . . . . . . . . . . . . . . . 4
1.1.2. Ventajas e inconvenientes del MPC . . . . . . . . . . . . . . . . 6
1.2. Motivacion de la investigacion . . . . . . . . . . . . . . . . . . . . . . . 8
1.3. Objetivos y estructura de la tesis . . . . . . . . . . . . . . . . . . . . . 8
2. Estabilidad y robustez del control predictivo basado en modelo 13
2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2. Controladores predictivos en la industria. . . . . . . . . . . . . . . . . . 14
2.3. El problema de la estabilidad: optimalidad no implica estabilidad . . . 15
2.3.1. Un ejemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . . 19
2.4. Controladores predictivos con estabilidad garantizada . . . . . . . . . . 20
2.5. Formulaci on general del MPC: necesidad de la region terminal y el coste
terminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
i
ii

INDICE GENERAL
2.5.1. Un ejemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . . 26
2.6. Robustez de los controladores MPC . . . . . . . . . . . . . . . . . . . . 28
2.6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.6.2. Analisis de robustez de los controladores MPC . . . . . . . . . . 28
2.6.3. Formulaciones robustas del MPC . . . . . . . . . . . . . . . . . 30
2.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3. Nuevas formulaciones del MPC con estabilidad garantizada 35
3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3. Formulacion general del MPC . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.1. Condiciones sucientes de estabilidad . . . . . . . . . . . . . . . 39
3.3.2. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 44
3.4. MPC con horizonte de prediccion mayor que el de control . . . . . . . . 45
3.4.1. Formulaci on del controlador . . . . . . . . . . . . . . . . . . . . 47
3.4.2. Condiciones sucientes de estabilidad . . . . . . . . . . . . . . . 48
3.5. MPC con coste terminal cuasi-innito . . . . . . . . . . . . . . . . . . . 52
3.6. El MPC como controlador optimo cuasi-innito . . . . . . . . . . . . . 58
3.6.1. El MPC general como controlador con horizonte cuasi-innito . 60
INDICE GENERAL iii

3.6.2. Inuencia de los horizontes en el coste optimo del MPC . . . . . 61
3.6.3. El MPC como aproximaci on al controlador con horizonte innito 62
3.7. Calculo de la region terminal . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8. Analisis de estabilidad del MPC suboptimo . . . . . . . . . . . . . . . . 72
3.9. Eliminacion de la restriccion terminal . . . . . . . . . . . . . . . . . . . 77
3.10. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4. Aumento del dominio de atraccion del MPC 89
4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.2. El dominio de atraccion del MPC . . . . . . . . . . . . . . . . . . . . . 91
4.3. Aumento del dominio de atraccion mediante los horizontes . . . . . . . 93
4.3.1. Aumento mediante el horizonte de control . . . . . . . . . . . . 93
4.3.1.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 96
4.3.2. Aumento mediante el horizonte de prediccion . . . . . . . . . . 97
4.4. Aumento del dominio de atraccion mediante el coste terminal . . . . . 100
4.4.1. Incorporacion del coste terminal cuasi-innito . . . . . . . . . . 100
iv

INDICE GENERAL
4.4.2. Aumento de la region terminal ponderando el coste terminal . . 102
4.5. Aumento del dominio de atraccion mediante la restriccion terminal . . 105
4.5.1. Aumento del dominio de atraccion mediante una region terminal
contractiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.5.2. MPC con region terminal contractiva basada en invariantes de
control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.5.2.1. Obtencion de una secuencia de invariantes de control . 110
4.5.2.2. MPC con restriccion terminal contractiva . . . . . . . 112
4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal . . 119
4.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5. Analisis de robustez del MPC nominal 127
5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.2. Sistemas con incertidumbres aditivas . . . . . . . . . . . . . . . . . . . 129
5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas . . . . . 131
5.4. Aplicacion al analisis de robustez del MPC . . . . . . . . . . . . . . . . 138
5.4.1. Factibilidad robusta del MPC . . . . . . . . . . . . . . . . . . . 139
5.4.1.1. Invariancia robusta del dominio de atraccion . . . . . . 141
INDICE GENERAL v
5.5. Estabilidad entrada a estado (ISS) del MPC . . . . . . . . . . . . . . . 143
5.5.1. Estabilidad entrada a estado . . . . . . . . . . . . . . . . . . . . 144
5.5.2. Aplicacion al MPC . . . . . . . . . . . . . . . . . . . . . . . . . 146
5.6. Suboptimalidad y robustez en el MPC . . . . . . . . . . . . . . . . . . 148
5.6.1. Estabilidad robusta del MPC suboptimo . . . . . . . . . . . . . 149
5.7. Robustez del controlador MPC sin restriccion terminal . . . . . . . . . 153
5.8. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . . . . . 155
5.9. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
6. MPC ISS con satisfaccion robusta de las restricciones 159
6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
6.2. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.3. Acotacion del efecto de las incertidumbres en la prediccion . . . . . . . 161
6.3.1. Acotacion basada en la continuidad Lipschitz . . . . . . . . . . 164
6.3.2. Reduccion del conservadurismo . . . . . . . . . . . . . . . . . . 164
6.4. Controlador MPC con estabilidad entrada a estado . . . . . . . . . . . 167
6.4.1. Determinacion de la region terminal . . . . . . . . . . . . . . . . 168
6.4.2. Formulacion del MPC . . . . . . . . . . . . . . . . . . . . . . . 170
6.4.3. Analisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . 171
6.5. Robustez de la formulaci on con N
p
> N
c
. . . . . . . . . . . . . . . . . 175
6.6. MPC robusto con restricciones en el estado . . . . . . . . . . . . . . . . 177
vi

INDICE GENERAL
6.6.1. Factibilidad del MPC basada en restricciones conservadoras . . 178
6.8. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
7. MPC robusto basado en regiones de evolucion incierta 185
7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
7.2. Regiones de evoluci on incierta . . . . . . . . . . . . . . . . . . . . . . . 186
7.2.1. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . 186
7.2.2. Notacion y denicion de operaciones sobre conjuntos . . . . . . 187
7.2.3. Regiones de evoluci on incierta . . . . . . . . . . . . . . . . . . . 188
7.2.4. Un procedimiento de calculo basado en el algebra intervalar . . 192
7.3. Controlador MPC dual robusto . . . . . . . . . . . . . . . . . . . . . . 194
7.4. Controlador MPC robusto no dual . . . . . . . . . . . . . . . . . . . . 199
7.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
8. MPC robusto basado en conjuntos invariantes robustos 209
8.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.2. MPC robusto en bucle cerrado . . . . . . . . . . . . . . . . . . . . . . . 210
8.2.1. Necesidad de controladores MPC en bucle cerrado . . . . . . . . 211
8.2.2. Formulaci on del MPC robusto en bucle cerrado . . . . . . . . . 213
INDICE GENERAL vii

8.3. Analisis de estabilidad del MPC robusto en bucle cerrado . . . . . . . . 214
8.3.1. Aproximaci on desde la programacion dinamica . . . . . . . . . . 214
8.3.2. Estabilidad del MPC robusto en bucle cerrado con horizonte jo
e incertidumbres que decaen con el estado . . . . . . . . . . . . 216
8.3.3. Estabilidad del MPC robusto en bucle cerrado con horizonte jo
e incertidumbres acotadas . . . . . . . . . . . . . . . . . . . . . 219
8.4. Transformaci on de la formulaci on en bucle cerrado en restriccion esta-
bilizante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
8.5. MPC robusto basado en conjuntos invariantes de control . . . . . . . . 223
8.5.1. Determinacion de una secuencia de invariantes de control robustos224
8.5.2. Formulacion del MPC robusto . . . . . . . . . . . . . . . . . . . 226
8.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
8.6.1. El sistema de Scokaert y Mayne . . . . . . . . . . . . . . . . . . 229
8.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
9. Conclusiones y futuras lneas de investigacion 237
9.1. Conclusiones y aportaciones originales . . . . . . . . . . . . . . . . . . 237
9.2. Futuras lneas de investigacion . . . . . . . . . . . . . . . . . . . . . . . 240
A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 243
A.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
A.2. Estabilidad de sistemas no lineales en tiempo discreto . . . . . . . . . . 244
viii

INDICE GENERAL
A.2.1. Deniciones previas . . . . . . . . . . . . . . . . . . . . . . . . . 245
A.2.2. Estabilidad de un sistema . . . . . . . . . . . . . . . . . . . . . 247
A.2.3. Teora de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . 248
A.2.4. Estabilidad de sistemas con restricciones . . . . . . . . . . . . . 253
A.2.5. Generalizacion a sistemas no autonomos: funciones de Lyapunov
de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
A.2.5.1. Sistema sujeto a restricciones en el estado . . . . . . . 256
A.3. Teora de conjuntos invariantes . . . . . . . . . . . . . . . . . . . . . . 257
A.3.1. Determinacion del conjunto a un paso . . . . . . . . . . . . . . 265
A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado268
A.4.1. Suavidad implica robustez . . . . . . . . . . . . . . . . . . . . . 271
A.4.2. Robustez de sistemas no autonomos . . . . . . . . . . . . . . . . 272
A.5. Conjuntos invariantes robustos . . . . . . . . . . . . . . . . . . . . . . . 273
B. Un ejemplo ilustrativo: el reactor continuamente agitado (CSTR) 277
C. Analisis de la continuidad del coste optimo 281
C.1. El problema de programacion matematica en el MPC . . . . . . . . . . 281
C.2. Analisis de sensibilidad de un problema NLP . . . . . . . . . . . . . . 283
C.3. Continuidad Lipschitz del coste optimo J
N
(x
k
) . . . . . . . . . . . . . . 286
C.3.1. MPC con restricciones en el estado . . . . . . . . . . . . . . . . 286
C.3.2. MPC sin restricciones en el estado . . . . . . . . . . . . . . . . . 291
INDICE GENERAL ix
C.4. Continuidad Lipschitz local del coste optimo J
N
(x
k
) ante incertidumbres
parametricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
Bibliografa 295
x

INDICE GENERAL
Notacion
En el presente documento se utilizara la siguiente notacion:
J
N
(x) Coste optimo del problema de optimizacion del MPC con horizonte
N, en el estado x.
J
s
N
(x) Coste suboptimo del problema de optimizacion del MPC con hori-
zonte N, en el estado x.
J
Nc,Np
(x) Coste optimo del problema de optimizacion del MPC en el estado
x, con horizonte de control N
c
y horizonte de prediccion N
p
.
J
M
N
c
,N
p
(x) Coste optimo del problema de optimizacion del MPC en el estado
x, con horizonte de control N
c
, horizonte de prediccion N
p
y coste
terminal V
M
(x).
J
(x) Coste optimo, con horizonte innito, en el estado x.

J
MPC
(x) Coste asociado a la evolucion del sistema controlado por el MPC.

u
F
(k) Secuencia optima, solucion del problema de optimizacion del MPC
con horizonte N, en el instante k.
x
(k + j[k) Estado del sistema predicho para el instante k+j a partir del estado
x
k
, utilizando el modelo de prediccion.
u
(k + j[k) Actuacion futura correspondiente al instante k + j de la secuencia

de actuaciones considerada en el instante k, u
F
(k).
x
h
(i + j[j) Estado del sistema predicho para el instante i + j a partir del in-
stante j, considerando el sistema controlado por la ley de control
u = h(x).
(x, u) (f(x, u)) (x), siendo x
k+1
= f(x
k
, u
k
) el modelo del sistema.
f
1
() Funci on inversa. Es una funcion tal que f
1
f(x) = x
f
n
() Funci on resultante de la composicion n veces de la funcion f(), es
decir, tal que f
n
(x) = f(f
n1
(x)), siendo f
1
(x) = f(x)
B
Vecindad del origen dada por x IR

n
: |x| (el orden se
inere del contexto).
1
2

INDICE GENERAL
A B Diferencia de Pontryagin entre los conjuntos A IR
n
y B IR
n
.
Viene dada por c IR
n
: b +c A, b B.
A B Suma de Minkowski de dos conjuntos A IR
n
y B IR
n
. Viene
dada por c IR
n
: a A, b B[c = a + b.
A B representa el conjunto de estados que pertenecen a A pero no a B.
Q() Conjunto a un paso del conjunto a un paso. Vease la denicion en
la seccion A.3.
/
i
(X, ) Conjunto controlable en i pasos al conjunto . Vease la denicion
en la seccion A.3.
(
i
(X) Conjunto admisible en i pasos. Vease la denicion en la seccion A.3.
S
i
(X, ) Conjunto estabilizable en i pasos al conjunto . Vease la denicion
en la seccion A.3.
IR
+
Conjunto de n umeros reales no negativos.
Acronimos
MPC Control predictivo basado en modelo.
LQR Regulador lineal cuadratico.
CLF Funci on de Lyapunov de control.
ISS Estabilidad (o estable) entrada a estado.
Captulo 1
Introduccion
1.1. Introduccion al control predictivo
Esta tesis se centra en la estabilidad y robustez de una tecnica denominada gene-
ricamente control predictivo basado en modelo o MPC
1
. Esta estrategia tambien se
conoce como control por horizonte deslizante, por ser esta la forma en la que se aplican
las actuaciones.
El MPC se enmarca dentro de los controladores optimos, es decir, aquellos en los
que las actuaciones responden a la optimizacion de un criterio. El criterio a optimizar,
o funcion de coste, esta relacionado con el comportamiento futuro del sistema, que se
predice gracias a un modelo dinamico del mismo, denominado modelo de prediccion
(de ah el termino predictivo basado en modelo). El intervalo de tiempo futuro que se
considera en la optimizacion se denomina horizonte de prediccion.
Dado que el comportamiento futuro del sistema depende de las actuaciones que
se aplican a lo largo del horizonte de prediccion, son estas las variables de decision
respecto a las que se optimiza el criterio. La aplicacion de estas actuaciones sobre
el sistema conducen a un control en bucle abierto. La posible discrepancia entre el
comportamiento predicho y el comportamiento real del sistema crean la necesidad
de imponer cierta robustez al sistema incorporando realimentacion del mismo. Esta
realimentacion se consigue gracias a la tecnica del horizonte deslizante que consiste en
aplicar las actuaciones obtenidas durante un periodo de tiempo, tras el cual se muestrea
el estado del sistema y se resuelve un nuevo problema de optimizacion. De esta manera,
1
Acronimo derivado del termino ingles Model Predictive Control. Dado que estas siglas son con las
que se denomina frecuentemente esta tecnica de control en la literatura, se utilizaran para designarla
a lo largo de este documento.
3
4 1.1. Introduccion al control predictivo
el horizonte de prediccion se va deslizando a lo largo del tiempo.
Una de las propiedades mas atractivas del MPC es su formulacion abierta, que
permite la incorporacion de distintos tipos de modelos de prediccion, sean lineales o no
lineales, monovariables o multivariables, y la consideracion de restricciones sobre las
se nales del sistema. Esto hace que sea una estrategia utilizada en muy diversas areas del
control, como se pone de maniesto en los trabajos preliminares a esta tesis (Ramrez,
Limon Marruedo, Gomez Ortega & Camacho 1999b, Gomez Ortega, Ramrez, Limon
Marruedo & Camacho 2001, Ramrez, Limon Marruedo, Gomez Ortega & Camacho
1999a). Ademas es una de las pocas tecnicas que permiten controlar sistemas con
restricciones incorporando estas en el propio dise no del controlador.
Estas caractersticas han hecho del control predictivo una de las escasas estrategias
de control avanzado con un impacto importante en problemas de ambito industrial
(J.Qin & Badgwell 1997). En este sentido es importante resaltar que el control predic-
tivo se ha desarrollado en el mundo de la industria, y ha sido la comunidad investigadora
la que se ha esforzado en dar un soporte teorico a los resultados practicos obtenidos.
1.1.1. Formulaci on del control predictivo
El control predictivo esta formado por los siguientes elementos (Camacho & Bordons
1999):
Modelo de prediccion : es el modelo matematico que describe el comportamiento
esperado del sistema. Este modelo puede ser lineal o no lineal, en tiempo continuo
o en tiempo discreto, en variables de estado o en entrada salida.
El hecho de que el problema de optimizacion implicado se resuelva mediante el
computador, as como la tecnica de horizonte deslizante con la que se aplica la
solucion, hace que sea mas natural considerar modelos discretos que continuos.
Por ello, en lo que sigue se consideran modelos en tiempo discreto
2
. Asimismo,
dado que los modelos en el espacio de estados son mas generales que los modelos
entrada-salida, en lo que sigue se adopta dicha formulacion. Se considera ademas
que el origen es el punto de equilibrio en el que se quiere regular el sistema, lo
cual no resta generalidad pues se puede conseguir con un cambio de variables
adecuado. As el modelo de prediccion considerado tiene la forma
x
k+1
= f(x
k
, u
k
)
2
Esto no supone una merma en la variedad de modelos sobre los que se puede aplicar, pues, dado que
el controlador requiere de algoritmos de optimizacion a implementar sobre un computador, utilizando
alg un procedimiento de integraci on de ecuaciones diferenciales se puede obtener implcitamente una
descripcion en tiempo discreto a partir del modelo en tiempo continuo.
Captulo 1. Introduccion 5
siendo x
k
IR
n
el estado y u
k
IR
m
las actuaciones sobre el sistema en el
instante k.
A lo largo de esta tesis, se denota x(k +j[k) al estado del sistema predicho en el
instante k + j a partir del estado conocido en el instante k. Por lo tanto
x(k + j + 1[k) = f(x(k + j[k), u(k +j[k))
siendo x(k[k) = x
k
. Como se puede ver, la prediccion depende ademas de la
secuencia de actuaciones aplicadas desde el instante k hasta el instante k + j, y
por lo tanto futuras.
En el contexto de control predictivo, se denomina estado terminal al estado predi-
cho al nal del horizonte de prediccion, es decir x(k + N[k).
En el caso en que el sistema presente incertidumbres, estas pueden aparecer en
el modelo de prediccion. En consecuencia, se considera su efecto en la prediccion
del comportamiento futuro del sistema, dependiendo este del valor futuro de las
incertidumbres que se consideren. A esta secuencia de incertidumbres futuras se
denomina realizacion de las mismas.
Funci on de coste : es la funcion que indica el criterio a optimizar. Es una funcion
denida positiva que expresa el coste asociado a una determinada evoluci on del
sistema a lo largo del horizonte de prediccion N. Esta funcion suele tener la forma
J
N
(x
k
, u
F
(k)) =
N1
i=0
L(x(k + i[k), u(k + i[k)) + V (x(k + N[k))
siendo L(, ) la funcion de coste de etapa y V () la funcion de coste terminal.
Estas funciones son denidas positivas.
Dado que el coste considera el comportamiento del sistema hasta un horizonte N,
este depende del estado actual del sistema x
k
y de la secuencia de N actuaciones
que se aplican durante el horizonte de prediccion u
F
(k), siendo
u
F
(k) = u(k[k), u(k + 1[k), , u(k +N 1[k)
Restricciones : indican los lmites dentro de los cuales debe discurrir la evolucion del
sistema. La evolucion de las se nales de un sistema no debe exceder determinadas
restricciones que, ya sea por lmites fsicos o bien por motivos de seguridad, se
imponen al sistema. Por ejemplo, los lmites de los actuadores forman parte de
estas restricciones. La necesidad, generalmente por motivos economicos, de tra-
bajar en puntos de operacion cercanos a los lmites fsicos admisibles del sistema
han provocado la necesidad de incorporar dichas restricciones en la sntesis de los
controladores.
Estas restricciones se suelen expresar como conjuntos X y U, generalmente ce-
rrados y acotados, en los cuales deben estar contenidos los estados del sistema y
6 1.1. Introduccion al control predictivo
las actuaciones
3
en cada instante, de forma que
x
k
X k
u
k
U k
Es habitual imponer una restriccion sobre el estado terminal del sistema llama-
da restriccion terminal.

Esta viene dada por un conjunto X denominado
conjunto o region terminal. As, esta restriccion tiene la forma
x(k + N[k)
Teniendo en cuenta todos estos elementos, el problema de optimizacion asociado al
controlador predictivo que se debe resolver en cada instante es:
mn
u
F
(k)
J
N
(x
k
, u
F
(k))
s.a
u(k + j[k) U j = 0, , N 1
x(k + j[k) X j = 0, , N 1
x(k + N[k)
Este problema de optimizacion tiene como variables de decision las actuaciones a
lo largo del horizonte de prediccion y depende de forma parametrica del estado del
sistema. Una vez obtenida la solucion, seg un la estrategia del horizonte deslizante, se
aplica la actuacion obtenida para el instante siguiente u
(k[k)
4
y se vuelve a resolver
en el siguiente periodo de muestreo. As la ley de control del MPC viene dada por
u
k
= K
MPC
(x
k
) = u
(k[k)
1.1.2. Ventajas e inconvenientes del MPC
Los controladores predictivos han tenido un notable exito en el campo de la industria
as como en la comunidad investigadora. Esto se debe a las propiedades que tienen estas
tecnicas de control, no exentas, por otro lado, de desventajas (Camacho & Bordons
1999, Mayne, Rawlings, Rao & Scokaert 2000).
Entre las ventajas del MPC se pueden destacar:
3
Tambien se pueden considerar restricciones que relacionen estados y entradas, si bien, en la for-
mulacion tpica del MPC no se suelen a nadir.
4
A lo largo de esta tesis, el superndice indica que el valor es el optimo del problema de mini-
mizacion asociado.
Formulacion en el dominio del tiempo, exible, abierta e intuitiva.
Permite tratar con sistemas lineales y no lineales, monovariables y multivariables
utilizando la misma formulacion del controlador.
La ley de control responde a criterios optimos.
Permite la incorporacion de restricciones en la sntesis del controlador.
De todas estas ventajas, sin duda la mas importante es la posibilidad de incorporar
restricciones en el calculo de las actuaciones, aspecto que las tecnicas clasicas de control
no permiten.
Entre las desventajas de esta tecnica de control se pueden citar las siguientes:
Requiere el conocimiento de un modelo dinamico del sistema sucientemente
preciso.
Requiere un algoritmo de optimizacion, por lo que solo puede implementarse por
computador
5
.
Requiere un alto coste computacional, lo que hace difcil su aplicacion a sistemas
rapidos.
Hasta hace relativamente poco, no se poda garantizar la estabilidad de los con-
troladores, especialmente en el caso con restricciones. Esto haca que el ajuste de
estos controladores fuese heurstico y sin un conocimiento de como podan inuir
los parametros en la estabilidad.
Resulta muy compleja la consideracion de incertidumbres en
Merece la pena destacar que el control predictivo es una tecnica muy potente que
permite formular controladores para sistemas complejos y con restricciones. Esta poten-
cia tiene un precio asociado: el coste computacional y la sintonizaci on del controlador.
Recientes avances en el campo del MPC proveen un conocimiento mas profundo de es-
tos controladores, obteniendose resultados que permiten relajar estos requerimientos.
As por ejemplo, se han establecido condiciones generales para garantizar la estabi-
lidad (Mayne 2001), condiciones bajo las cuales se puede relajar la optimalidad del
controlador garantizando su estabilidad (Scokaert & Mayne 1998) y se han desarrolla-
do algoritmos ecientes para la resolucion del problema (Biegler 1998).
5
Para evitar esta necesidad, se han utilizado aproximaciones neuronales del controlador realizadas
fuera de lnea (Gomez Ortega 1994, Parisini & Zoppoli 1995) , o bien se ha recurrido al calculo
explcito del controlador cuando este es posible, como en (Ramrez 2002, Bemporad, Morari, Dua &
Pistikopoulos 2000).
8 1.2. Motivacion de la investigacion
1.2. Motivacion de la investigacion
El campo del control predictivo se puede dividir en dos areas: el control predictivo
de sistemas lineales y de sistemas no lineales. La facilidad y sencillez de tratamiento
de los sistemas lineales y la existencia de herramientas ecientes de analisis hicieron
que este area tomase un protagonismo inicial. Sin embargo, la incorporacion de las
restricciones en el controlador hacen que el sistema en bucle cerrado sea no lineal, por
lo que estas herramientas de analisis dejaron de ser utiles.
As, el area de control predictivo no lineal ha ido tomando una importancia cre-
ciente en los ultimos a nos, y como consecuencia, un n umero creciente de resultados
y publicaciones han aparecido en la literatura. Todo este desarrollo ha provocado un
conocimiento cada vez mas profundo de la estabilidad y robustez de esta tecnica de con-
trol, resolviendose problemas existentes y apareciendo nuevos retos. Entre los problemas
que se consideran maduros se encuentra la estabilidad de los controladores. Gracias a
recientes trabajos como (Mayne et al. 2000), se conocen procedimientos de ajuste del
controlador para garantizar la estabilidad del mismo, pero quedan aspectos interesantes
que tratar como el estudio del dominio de atraccion de los controladores, su desempe no,
tecnicas que permitan mejorar la implementacion de los mismos, formulacion para el
seguimiento de trayectorias, etc.
Otro importante campo abierto de investigaci on es el analisis y sobre todo el dise no
de controladores predictivos robustos. La madurez alcanzada en la estabilidad ha susci-
tado una revision de la robustez a la luz de esta. Esto ha permitido detectar deciencias
de los controladores propuestos, apareciendo nuevas formas de plantear el problema del
control robusto. Quiza la mas relevante sea la formulacion en bucle cerrado. Esto ha
motivado la aparicion de nuevos controladores y por lo tanto de nuevos problemas que
resolver.
En este contexto se enmarca la investigacion fruto de la cual ha surgido esta tesis,
cuyos objetivos se detallan a continuacion.
1.3. Objetivos y estructura de la tesis
El objetivo de esta tesis se puede situar en la profundizacion en el conocimiento de
la estabilidad y robustez de los controladores predictivos de sistemas no lineales sujetos
a restricciones. El analisis llevado a cabo se fundamenta en la teora de Lyapunov (y
sus variantes) y en la teora de los conjuntos invariantes. Estas dos teoras conjugadas
proveen el soporte teorico para comprender en profundidad la estabilidad del control
predictivo con restricciones, con o sin incertidumbres.
As, a la luz de estas, se han analizado los distintos aspectos del control predicti-
vo: el dise no de controladores estabilizantes, el analisis de su robustez y el dise no de
controladores robustos. Fruto de este analisis han surgido las ideas que se presentan y
desarrollan en esta tesis.
El desarrollo de la tesis, y en consecuencia el presente documento, sigue la estruc-
turacion que se indica a continuaci on (vease la gura 1.1), donde se mencionan las
aportaciones originales de la misma:
En el captulo 2 se hace un recorrido por las distintas formulaciones existentes de
los controladores predictivos en relacion a la estabilidad. El objetivo del captulo
es poner de maniesto el origen de la perdida de estabilidad de los controladores
predictivos, y el camino seguido hasta recuperarla. Tambien se hace un recorrido
por los resultados existentes en la literatura sobre el analisis de robustez de los
controladores predictivos y sus formulaciones robustas.
El captulo 3 se centra en el analisis y el dise no de controladores MPC esta-
bilizantes. Para ello se parte del estudio de la formulaci on general del MPC
propuesta en (Mayne et al. 2000). A partir de esta, se presentan dos nuevos
controladores basados en el aumento del horizonte de prediccion y en la consid-
eracion de un coste terminal cuasi-innito. A continuaci on se pone de maniesto
que ambos controladores mejoran el comportamiento del sistema. As mismo, se
analizan tecnicas encaminadas a una mejora en la implementaci on de los contro-
ladores predictivos: la suboptimalidad y la eliminacion de la restriccion terminal,
obteniendose nuevos resultados.
Continuando con el analisis de los controladores predictivos, en el captulo 4 se
estudia el dominio de atraccion de estos y se proponen tecnicas para su aumento.
Estas tecnicas tienen un denominador com un: aumentar el dominio de atraccion
sin aumento considerable del coste computacional. Se proponen procedimientos
de ajuste del controlador encaminados a este n y se presentan dos controladores
nuevos basados en una restriccion terminal contractiva. En el primero, la res-
triccion esta basada en invariantes positivos y en el segundo, dicha restriccion se
basa en una secuencia de conjuntos invariantes de control. Este ultimo ha sido
publicado en (Limon Marruedo,

Alamo & Camacho 2002a).
A partir del captulo 5, la tesis se centra en la robustez de los controladores
predictivos, comenzando por el analisis de la estabilidad de los controladores
predictivos nominales en presencia de incertidumbres en la planta. As, se hace
una primer analisis basado en la continuidad Lipschitz del coste optimo y la
teora de Lyapunov y cuyos resultados se han publicado en (Limon Marruedo,
Alamo & Camacho 2002c). A raz de estos, se incorpora un concepto novedoso

en el contexto del control predictivo: la estabilidad entrada a estado. Esta teora
permite el analisis de la robustez del MPC de una manera sencilla y permite
generalizar resultados anteriores.
10 1.3. Objetivos y estructura de la tesis
En el captulo 6 se propone un nuevo controlador MPC robusto. Este controlador
parte de una acotacion de las discrepancias que existen entre el comportamiento
de la planta y la evoluci on predicha por el modelo. A partir de esta, se propone un
procedimiento sencillo para garantizar la satisfaccion robusta de las restricciones y
ademas la convergencia del controlador, gracias a la estabilidad entrada a estado.
Los resultados obtenidos han dado como fruto la publicacion (Limon Marruedo,
Alamo & Camacho 2002b).

En el captulo 7 se propone un procedimiento para estimar la acotacion de las
discrepancias entre la planta y el modelo de una forma local. Dicha acotacion
depende del estado del sistema y de la actuacion aplicada sobre el mismo. Esto
da lugar a las denominas regiones de evolucion incierta, que permiten calcular en
lnea acotaciones de las discrepancias. Estas regiones, incorporadas en la formu-
lacion del problema, dan lugar a un nuevo controlador MPC robusto. Este con-
trolador se ha publicado en (Limon Marruedo, Bravo,

Alamo & Camacho 2002).
En el captulo siguiente se abordan las denominadas formulaciones del MPC en
bucle cerrado. Se parte de un analisis de la estabilidad y factibilidad de los con-
troladores min-max en bucle cerrado y se extienden estos resultados a la garanta
de estabilidad en caso de incertidumbres acotadas. Se pone de maniesto un pro-
cedimiento para garantizar la estabilidad y factibilidad a partir de una restriccion
estabilizante impuesta sobre un controlador formulado en bucle abierto. Esto da
lugar a un nuevo controlador robusto basado en una restriccion estabilizante
contractiva, que se obtiene a partir de una secuencia de invariantes de control
robustos.
Por ultimo se presentan conclusiones de esta tesis y futuras lneas de investigaci on.
Con el n de articular el documento, los controladores propuestos se han aplicado
sobre un mismo banco de ensayo: un reactor continuamente agitado (CSTR) muy
utilizado en la literatura.
Esta tesis se complementa mediante los apendices: en el primero se presenta un
compendio de resultados sobre la teora de estabilidad y teora de los conjuntos in-
variantes utilizadas a lo largo de la tesis. El n de este apendice es hacer un balance
de los conocimientos necesarios para el analisis de la estabilidad y robustez de los
controladores predictivos.
En el segundo apendice se presenta el modelo del reactor utilizado en los ejemplos,
y en el tercer apendice se trata del analisis de la continuidad del coste optimo basado
en la sensibilidad del problema de optimizacion.
Con el n de facilitar la lectura del documento se presentan a continuaci on un
diagrama con la estructura del mismo
Estabilidad
y robustez del
MPC
Captulo 2
Nuevas
formulaciones
del MPC
Captulo 3
Aumento del
dominio de
atraccin
Captulo 4
MPC ISS
con factibilidad
robusta
Captulo 6
MPC robusto
basado en
regiones de
evolucin incierta
Captulo 7
MPC robusto
basado en
invariantes
robustos
Captulo 8
Fundamentos
Anlisis y diseo
de controladores
MPC nominales
Anlisis
de
robustez
Anlisis y diseo
de controladores
MPC robustos
Teora de
Lyapunov y teora
de conjuntos
invariantes
Apndice A
Anlisis de
robustez del
MPC nominal
Captulo 5
Figura 1.1: Organizacion de la tesis
12 1.3. Objetivos y estructura de la tesis
Captulo 2
Estabilidad y robustez del control
predictivo basado en modelo
2.1. Introduccion
En este captulo se hace un recorrido por la evoluci on del control predictivo desde
la perspectiva de la estabilidad y de la robustez. Comienza poniendo de maniesto el
origen de la perdida de la garanta de estabilidad en las formulaciones originales del
controlador. Este hecho apareca como un problema importante y una merma de los
benecios de esta tecnica de control. La incorporacion de la teora de Lyapunov y la
teora de conjuntos invariantes arroja una nueva luz sobre el problema. Esto provoca
la aparicion de trabajos que profundizan en el conocimiento y solucion del mismo, los
cuales se recogen en una seccion del captulo.
La evoluci on de este estudio termina en la presentacion de la denominada formu-
lacion general del control predictivo. Esta formulacion viene a recoger la esencia de
los controladores con estabilidad garantizada y tal y como se muestra, resuelve los
problemas que originalmente provocaron la perdida de la garanta de estabilidad.
A continuacion se hace un balance de los principales resultados en la robustez de
controladores predictivos, centr andose en el caso de sistemas no lineales, por ser esta
el area objeto del estudio realizado.
Antes de adentrarse en el captulo, merece la pena destacar que el recorrido por la
estabilidad y robustez de los controladores MPC que se va a exponer, se hace a la luz
de la teora de estabilidad de Lyapunov y de la teora de los conjuntos invariantes. Por
ello, a lo largo del captulo se hacen numerosas referencias al apendice A, en el cual se
13
14 2.2. Controladores predictivos en la industria.
recopilan los principales resultados en estos campos.
2.2. Controladores predictivos en la industria.
El control predictivo ha tenido una evoluci on peculiar en la disciplina del control en
tanto en cuanto ha sido una estrategia en la cual el campo industrial ha ido por delante
de la comunidad investigadora. Si bien los controladores predictivos tienen su origen en
el control optimo (Propoi 1963, Lee & Markus 1967, Kwon & Pearson 1977), nuevas y
mas avanzadas formulaciones surgieron en el seno de la industria, principalmente en la
industria petroqumica y de procesos. La necesidad de controlar procesos en puntos de
operacion lmites con el objetivo de optimizar el proceso productivo llevo a la aparicion
de controladores predictivos basados en modelos sencillos, orientados a la resolucion
de los problemas de control asociados, tales como la consideracion de restricciones,
incertidumbres y no linealidades. Entre otras formulaciones destacan las siguientes:
IDCOM o MPHC : (Identication-Command o Model Predictive Heuristic Control )
propuesto en (Richalet, Rault, Testud & Papon 1978), utiliza como modelo de
prediccion la respuesta impulsional (FIR), funcion de coste cuadratica, y restric-
ciones en las entradas y salidas. El algoritmo de optimizacion es heurstico.
DMC : (Dynamic Matrix Control ) propuesto en (Cutler & Ramaker 1980), utiliza
como modelo de prediccion la respuesta ante escalon, lo cual limita su aplicacion a
plantas estables, considera un coste cuadratico penalizando el esfuerzo de control
y no considera restricciones en la optimizacion.
QDMC : (Quadratic Dynamic Matrix Control ) propuesto en (Garca & Morshedi
1986), surge de la extension del DMC al caso con restricciones. Este controlador
forma parte de la denominada segunda generacion de controladores predictivos,
en los que el problema de optimizacion asociado se resuelve utilizando la pro-
gramacion matematica. Establece dos tipos de restricciones: duras y blandas,
permitiendo la violacion de estas ultimas durante alg un periodo de tiempo.
SMOC : (Shell Multivariable Optimizing Control ) propuesto en (Marquis & Broustail
1988), forma parte de la tercera generacion de controladores predictivos. Permite
la utilizacion de modelos en espacios de estados e incorpora observadores y mo-
delos de perturbaciones. Introduce tambien restricciones duras, blandas y con
niveles de prioridad.
GPC : (Generalized Predictive Control ) propuesto en (Clarke, Mohtadi & Tus 1987a,
Clarke, Mohtadi & Tus 1987b), utiliza como modelo de prediccion la formulaci on
CARIMA, que incorpora una perturbacion modelada como ruido blanco. Incor-
pora restricciones y existen resultados asociados a la estabilidad.
Captulo 2. Estabilidad y robustez del control predictivo basado en modelo 15
Se han propuesto otras formulaciones de controladores predictivos tales como el
RMPCT, el PCT o el PFC. Una lectura mas profunda sobre todos estos controladores
se puede encontrar en (Camacho & Bordons 1999), donde se analizan tanto en aspectos
practicos, como en los relativos a la estabilidad y robustez.
En la mayora de estos controladores, la estabilidad no esta garantizada, requirien-
dose un ajuste especco para cada sistema de una forma heurstica y sin garantas de
exito. Por ello, se establecen reglas practicas de ajuste, como la eleccion de un horizonte
de prediccion del orden del tiempo de establecimiento de la planta en sistemas estables.
El problema de la estabilidad no estaba resuelto en general y resultaba de hecho
una suerte de barrera psicologica que los investigadores en control predictivo ni siquiera
intentaban superar
1
, produciendose un vaco teorico que mermaba las caractersticas
de estos controladores.
2.3. El problema de la estabilidad: optimalidad no
implica estabilidad
La ley de control obtenida en un controlador predictivo surge de la optimizacion
de un criterio relacionado con el comportamiento del sistema, en el que se penaliza
tanto el error respecto al punto de equilibrio como el esfuerzo de control necesario para
alcanzar dicho equilibrio. Contrariamente a lo que dicta el sentido com un, el hecho
de que la actuacion aplicada sea optima no garantiza que el sistema en bucle cerrado
alcance el punto de equilibrio tal y como se desea. El problema de la estabilidad tiene su
origen en el desarrollo propio de los controladores predictivos: la necesidad de utilizar
un horizonte de prediccion nito e invariante en el tiempo y la estrategia de horizonte
deslizante.
El origen de los controladores predictivos esta en el control optimo en el cual se
pretende calcular la ley de control u = K
(x) que minimiza el coste de regular el

sistema al punto de equilibrio a lo largo de toda la evoluci on del mismo. As, la funcion
de coste a optimizar es:
J
(x
k
) =
i=0
L(x(k + i[k), K
(x(k + i[k)))
1
Morari en (Morari 1994) hace la siguiente armacion en relacion a la estabilidad de los contro-
ladores predictivos the recent work has removed this technical and to some extent psycologycal barrier
(people did not even try) and started wide spread eorts to tackle extensions of these basic problems
with the new tools.
16 2.3. El problema de la estabilidad: optimalidad no implica estabilidad
y el problema de optimizacion a resolver viene dado por
mn
K(x)
J
(x
k
)
s.a
u(k + j[k) U j 0
x(k + j[k) X j 0
siendo x(k + j[k) la prediccion del estado del sistema en el instante k + j a partir del
estado en x
k
. Los conjuntos U y X denen las restricciones, de forma que X es un
conjunto acotado, U compacto y ambos contienen el origen en su interior.
Este problema de control, bajo ciertas condiciones de observabilidad relacionadas
con la funcion de coste de etapa
2
, estabiliza asint oticamente todo estado en cual exista
una solucion con un coste asociado acotado. De hecho, todo punto asint oticamente
estabilizable, se puede estabilizar por esta estrategia de control.
El problema del control optimo se puede resolver utilizando dos tecnicas: la primera
se deriva del principio de optimalidad de Bellman (Bellman 1957, Bryson & Ho 1969),
seg un el cual
J
(x) = mn
uU
L(x, u) + J
(f(x, u))[ f(x, u) X
siendo la ley de control la solucion de este problema de optimizacion en cada estado

K
(x) = u
(x). El conjunto X
es el conjunto de estados asintoticamente estabili-

zables al origen de una forma admisible, y por lo tanto el conjunto estabilizable en
innitos pasos al origen X
= S
(X, 0). Es en este conjunto en el que esta denido

J
(x).
La solucion de este problema se puede obtener a partir de las ecuaciones de Hamilton-
Jacobi-Bellman, cuya resolucion es muy compleja, si no imposible, salvo en casos es-
peciales como el problema de regulacion de un sistema lineal sin restricciones con una
funcion de coste de etapa cuadratica, que da lugar al regulador lineal cuadratico o LQR
(Bryson & Ho 1969).
Otro procedimiento para resolver este problema es la aplicacion del calculo varia-
cional, que conduce a las ecuaciones de Euler-Lagrange. La gran diferencia entre ambas
resoluciones es que en las ecuaciones de H-J-B la solucion es la ley de control, conducien-
do a soluciones globales y en bucle cerrado, mientras la formulacion de E-L conduce a
soluciones locales y en bucle abierto, si bien la resolucion de estas ecuaciones es mas
2
La condicion de observabilidad consiste en L(x, u) l|(h(x), u)|
siendo 1 y h(x) una

funcion detectable con el modelo, y garantiza que si J
N
(x
k
) 0 cuando k , entonces x
k
0
(Keerthi & Gilbert 1988).
sencilla que la de H-J-B. Un analisis mas exhaustivo, pero con un caracter didactico,
sobre control optimo puede encontrarse en (Nevistic 1997).
La dicultad en la resolucion de este problema llevo a adoptar soluciones practicas
que hiciesen mas sencilla su realizacion.

Estas ideas son basicamente las siguientes:
Horizonte nito y jo : considerando un horizonte nito, el problema de optimizacion
toma la forma habitual del control predictivo:
mn
u
F
(k)
J
N
(x
k
, u
F
(k))
s.a
u(k + j[k) U j = 0, , N 1
x(k + j[k) X j = 0, , N 1
x(k + N[k)
donde el coste a optimizar
J
N
(x
k
, u
F
(k)) =
N1
i=0
L(x(k + i[k), u(k + i[k)) + V (x(k + N[k))
siendo V (x) una funcion que penaliza el coste estado nal de la prediccion (es-
tado terminal), denominada funcion de coste terminal. Al conjunto al que se
restringe dicho estado se denomina region terminal.
La principal ventaja de la adopcion del horizonte nito reside en que el problema
de optimizacion tiene la forma de un problema de programacion matematica,
el cual admite solucion numerica gracias a los algoritmos existentes (Luenberger
1989). Notese que el coste computacional de la resolucion de este problema puede
ser muy elevado si el modelo es no lineal.
Estrategia de horizonte deslizante : seg un esta tecnica, en cada periodo de mues-
treo se resuelve el problema de optimizacion y se aplica tan solo la actuacion
obtenida para el siguiente periodo de muestreo. En el siguiente periodo de muestreo
se toma un nuevo estado del sistema y se repite la operacion. Esto dota de re-
alimentaci on a la formulaci on basada en el problema de optimizacion en bucle
abierto, lo cual le conere cierto grado de robustez.
El problema de control optimo con horizonte nito i se puede resolver mediante el
problema de programacion dinamica asociado:
J
i
(x) = mn
u
L(x, u) + J
i1
(f(x, u))[ f(x, u) X
i1
18 2.3. El problema de la estabilidad: optimalidad no implica estabilidad

siendo J
0
(x) = V (x) y X
0
= . De la solucion de este problema se deriva la ley de
control K
i
(x) = u
. El conjunto X
i1
es el conjunto de estados que pueden ser llevados
por una ley de control admisible siguiendo una trayectoria admisible hasta el conjunto
en i 1 pasos. Por tanto este conjunto es el conjunto controlable en i 1 pasos, es
decir, X
i1
= /
i1
(X, )
3
. Este problema de optimizacion es factible en el conjunto
X
i
= /
i
(X, ), siendo este el dominio de denicion del controlador K
i
(x) y por lo
tanto de J
i
(x).
Considerese un estado inicial tal que el problema de optimizacion con horizonte N
es factible, es decir, x
0
X
N
. Entonces, aplicando sobre el sistema la actuacion optima
u
0
= K
N
(x
0
), el estado evoluciona a x
1
. En ese instante, la actuacion optima viene
dada por la ley de control optima con un horizonte N 1, por tanto u
1
= K
N1
(x
1
).
Esto se debe al principio de optimalidad de Bellman. Entonces, en el instante k, la
actuacion optima vendr a dada por u
k
= K
Nk
(x
k
), que es el controlador optimo para
conducir al sistema en N k pasos al conjunto terminal .
En consecuencia, el horizonte de prediccion se va reduciendo en cada instante, has-
ta el instante N en el cual el sistema alcanza la region terminal . En esta region,
el problema de optimizacion dinamica no esta denido, requiriendose un controlador
alternativo.
Sin embargo, en el control predictivo la estrategia de horizonte deslizante y horizonte
nito e invariante hace que siempre se aplique el controlador con horizonte N. Por lo
tanto, la ley de control del MPC es invariante en el tiempo y viene dada por
u
k
= K
MPC
(x
k
) = K
N
(x
k
)
Esto hace que la convergencia del controlador optimo con horizonte nito se pierda,
pues no se reduce el horizonte y este controlador no garantiza que el sistema evolucione
hacia el punto de equilibrio, ni siquiera que alcance la region terminal.
Una segunda consecuencia es la posible perdida de la factibilidad del problema.
En efecto, el hecho de que el problema tenga solucion factible en el instante k (x
k

/
N
(X, )) no garantiza la factibilidad del problema en el instante k+1. Lo que s garan-
tiza el controlador predictivo es que x
k+1
pertenece al conjunto /
N1
(X, ). El conjunto
/
N1
(X, ) no tiene por que estar contenido en /
N
(X, ) (salvo en el caso en que el
conjunto sea un conjunto invariante positivo o de control). Por lo tanto puede ocurrir
que el estado x
k+1
este en el conjunto /
N1
(X, ) pero no este contenido en /
N
(X, ),
por lo que el problema de optimizacion no tendra solucion factible.
3
El conjunto controlable en i pasos, /
i
(X, ) viene dado por:
/
i
(X, ) = x
0
X : para todo k = 0, , i 1, u
k
U tal que x
k
X, y x
i

En el caso en que no hubiese restriccion terminal equivale a considerar = X, por lo que en este
caso, X
i
= K
i
(X, X) = (
i
(X) que es el conjunto admisible. Vease la seccion A.3.
Por tanto, a pesar de que en cada instante se aplica una actuacion optima, en el
sentido que optimiza un coste y satisface unas restricciones, esta actuacion no garantiza
ni la factibilidad ni la convergencia del sistema en bucle cerrado.
Esta perdida de la estabilidad supuso un grave problema de los controladores pre-
dictivos, haciendo necesario un ajuste del controlador particular para cada sistema con
el n de garantizar la estabilidad, con el temor a nadido sobre como poda inuir la
variaci on de un parametro sobre esta. Por ello los controladores predictivos contaban
entre sus desventajas la dicultad del ajuste.
La comunidad investigadora tomo el reto del analisis de estabilidad de los contro-
ladores predictivos, que dio como fruto una serie de formulaciones que garantizan la
estabilidad.
2.3.1. Un ejemplo ilustrativo
Para ilustrar como el MPC con restriccion terminal no garantiza la estabilidad, se
va a considerar un sistema lineal correspondiente a un doble integrador muestreado
con T
m
= 1s. Su modelo es x
k+1
= Ax
k
+ Bu
k
siendo
A =
_
_
1,0 1,0
0,0 1,0
_
_
B =
_
_
0,5
1,0
_
_
y esta sujeto a las restricciones
x
1
[5, 5]
x
2
[5, 5]
u [0,3, 0,3]
Este sistema se va a controlar con un MPC con horizonte de prediccion N = 4, y se va
a considerar un coste de etapa cuadratico
L(x, u) = x
T
Qx + u
T
Ru
siendo
Q =
_
_
0,01 0,0
0,0 0,01
_
_
R = 1
y no se a nade coste terminal. En el ejemplo se va a considerar una region terminal
= x IR
2
: |x|
1
20 2.4. Controladores predictivos con estabilidad garantizada
6 4 2 0 2 4 6
2
1
0
1
2
x
1
x
2

K
1

K
2

K
3
K
4
Figura 2.1: Evolucion de un sistema controlado por un MPC sin garanta de estabilidad
que no es un invariante positivo del sistema. Notese que conjunto en que este contro-
lador es factible es /
4
(X, ).
En la gura 2.1 se muestran los conjuntos controlables desde 1 paso hasta 4 pasos.
Dado que la region terminal no es un invariante positivo del sistema, estas regiones
no tienen por que estar anidadas y, de hecho, no lo estan. Esto hace que puedan
existir estados iniciales factibles para los cuales el controlador no estabiliza el sistema,
perdiendose en alg un instante la factibilidad (vease el recuadro aumentado). Notese
que esto ocurre a pesar de que el problema es inicialmente factible, es decir, que existe
una secuencia admisible que conduce el sistema hacia . Sin embargo, estas actuaciones
no son las que proporciona el controlador MPC.
Esto no quiere decir, como tambien se muestra en la gura, que el controlador no
estabilice al sistema en ciertos estados iniciales. El problema es que no se sabe a priori
cuales son.
2.4. Controladores predictivos con estabilidad garan-
tizada
El rapido desarrollo de los controladores predictivos supuso un reto en la comunidad
investigadora para dar un soporte teorico bajo el cual se garantizase la estabilidad. Esto
dio lugar a una serie de formulaciones con estabilidad garantizada, cuyo denominador
com un es la utilizacion de la teora de Lyapunov, y en particular, el coste optimo como
funcion de Lyapunov. Estas formulaciones se pueden agrupar de la siguiente forma:
MPC con restriccion terminal de igualdad : fue propuesto para garantizar esta-
bilidad del problema LQR con restricciones en (Kwon & Pearson 1977) y exten-
dido en (Keerthi & Gilbert 1988) a sistemas no lineales con modelo en espacio de
estados, en tiempo discreto, sujetos a restricciones. La estabilidad se garantiza
imponiendo como restriccion terminal
x(k + N[k) = 0
bajo ciertas condiciones de controlabilidad y observabilidad del sistema. En este
caso, la funcion de coste optimo es estrictamente decreciente con el tiempo, por
lo que es una funcion de Lyapunov del sistema.
En (Mayne & Michalska 1990), se formula este controlador para sistemas en
tiempo continuo y se relajan las condiciones para garantizar la estabilidad.
En (Chisci, & Mosca 1994, Bemporad, Chisci & Mosca 1995) se extiende esta
condicion a sistemas lineales descritos por un modelo CARMA, sin restricciones.
En este caso, la restriccion terminal se traduce en una condicion sobre las salidas
y las entradas del sistema.
MPC con coste terminal : la estabilidad se logra incorporando en la funcion de
coste, un termino que penalice el estado terminal mediante el denominado coste
terminal. En (Bitmead, Gervers & Wertz 1990) se propone, para sistemas lineales
sin restricciones un coste terminal cuadratico cuya matriz de ponderacion se
obtiene de la resolucion de una ecuacion de Riccati.
En (Rawlings & Muske 1993), en el caso de un sistema lineal estable con res-
tricciones politopicas, se propone tomar como coste terminal el coste innito
resultante de aplicar la actuacion nula.
En (Alamir & Bornard 1995) se utiliza esta tecnica para sistemas no lineales
tomando como coste terminal el coste de un controlador localmente estabilizante
durante un periodo sucientemente largo.
MPC con restriccion terminal de desigualdad : los problemas computacionales
que supone el cumplimiento de una restriccion de igualdad, llevaron a relajar esta
condicion, extendiendo la restriccion terminal a una vecindad del origen. As, se
establece una restriccion terminal de desigualdad de la forma
x(k +N[k)
siendo el conjunto el denominado conjunto terminal.
22 2.4. Controladores predictivos con estabilidad garantizada
Esta estrategia fue propuesta en (Michalska & Mayne 1993) para sistemas no
lineales en tiempo continuo y sujeto a restricciones. En este trabajo, se elige co-
mo region terminal un invariante positivo del sistema no lineal controlado por un
controlador local. Ademas, para garantizar la factibilidad se introduce como vari-
able de decision el horizonte de prediccion. El controlador as formulado garantiza
que conduce al sistema a la region terminal, donde el sistema pasa a regularse
por el controlador local que lo estabiliza al origen. De ah que este controlador
se denomine controlador MPC dual. Las bondades de esta formulacion son tan
notables, que marco las futuras lneas de investigaci on en estabilidad.
En (Chisci, Lombardi & Mosca 1996) se extiende el control predictivo dual al
caso de sistemas lineales con restricciones.
En esta misma lnea, se enmarcan los denominados controladores predictivos
con estabilidad forzada, en los que esta se garantiza por la satisfaccion de una
restriccion estabilizante. En (De Oliveira Kothare & Morari 2000) se presenta
el denominado control predictivo contractivo. Esta estrategia esta basada en el
trabajo anterior (Yang & Polak 1993) e incorpora como restriccion terminal una
restriccion que fuerza al estado terminal x(k + N[k) a tener una norma inferior
a la del estado actual x
k
|x(k + N[k)|
P
< |x
k
|
P
La secuencia obtenida se aplica en bucle abierto desde el instante k hasta hasta
el k + N, en el que se vuelve a resolver el problema. Esta formulaci on tiene dos
problemas: el funcionamiento en bucle abierto durante el horizonte de prediccion,
que se resuelve con un procedimiento de realimentaci on extra, y el hecho de que
la factibilidad esta garantizada tan solo en una vecindad del origen, que puede
ser peque na y no se conoce a priori.
En (Primbs, Nevistic & Doyle 2000), se garantiza la estabilidad forzando que una
funcion de control de Lyapunov conocida a priori, sea estrictamente decreciente
V (x(k + 1[k)) < V (x
k
)
Esta restriccion se impone en la actuacion para el instante actual u
k
, y garantiza
estabilidad para todo horizonte de prediccion N 1.
MPC con coste y restriccion terminal : esta es la estructura en la que se enmar-
can las mas recientes formulaciones del MPC. Es importante decir que en algunas
de las formulaciones propuestas en las que se garantiza estabilidad con la adicion
unicamente de una funcion de coste terminal, implcitamente se impone que la
prediccion alcance una vecindad del origen. En consecuencia se deben considerar
tambien como formulaciones con restriccion terminal.
El primer trabajo en el que se garantiza estabilidad incorporando ambos ingredi-
entes es en (Sznaier & Damborg 1987) en el cual, para sistemas lineales sujetos
a restricciones politopicas, se considera como controlador local el LQR y como
region terminal un invariante asociado. En este trabajo se demuestra que para
cada estado, existe un horizonte de prediccion sucientemente largo, tal que la
solucion optima garantiza la satisfaccion de la restriccion terminal, lo que permite
eliminarla.
Esta misma lnea se sigue en (Parisini & Zoppoli 1995) para sistemas no linea-
les en tiempo discreto con restricciones. Se calcula un controlador lineal basado
en la linealizacion del modelo en torno al punto de equilibrio (analogamente al
procedimiento presentado en (Michalska & Mayne 1993) para el calculo de la
region terminal) y se toma como coste terminal una funcion proporcional a la
funcion de Lyapunov asociada al sistema linealizado en torno al origen en bucle
cerrado V (x) = ax
T
Px. La estabilidad se garantiza demostrando que existe
una combinaci on de la constante a y del horizonte de prediccion N tal que el
estado terminal resultante del problema de optimizacion (sin restriccion termi-
nal) alcanza un invariante positivo del sistema y la funcion de coste optimo es
estrictamente decreciente.
En (De Nicolao, Magni & Scattolini 1998) se propone como coste terminal el
coste innito incurrido por el sistema controlado por el controlador local. Esta
opcion es una aproximacion razonable al coste optimo en el estado terminal, por
lo que el coste del MPC sera proximo al del controlador optimo. La imposicion
de que el estado terminal alcance la region terminal se impone implcitamente
en la suposicion de que la funcion de coste terminal solo esta denida en la
region terminal, tomando un valor innito fuera de ella. La region terminal es un
invariante positivo del sistema controlado por el controlador local. En (Magni, De
Nicolao, Magnani & Scattolini 2001), se propone una formulaci on implementable
del controlador predictivo anterior. Se basa en considerar como funcion de coste
terminal una aproximacion truncada del coste innito. Pero lo mas destacable de
este trabajo es que considera un horizonte de prediccion mayor que el de control
gracias a la incorporacion del controlador local.
En (Jadbabaie, Yu & Hauser 2001) se establece la estabilidad de un contro-
lador predictivo para sistemas sin restricciones, tomando como coste terminal
una funcion de Lyapunov de control y sin restriccion terminal. En este trabajo
se demuestra que existe una vecindad del origen en la cual la solucion optima
del problema sin restricciones, garantiza la satisfaccion de la restriccion termi-
nal. As, de una forma implcita, se considera dicha restriccion. La eliminacion
de la restriccion terminal hace que el controlador se formule como un problema
de optimizacion sin restricciones, lo que permite su implementaci on en sistemas
rapidos, como sistemas aeronauticos.
La formulacion del MPC incluyendo explcitamente la restriccion terminal y la
funcion de coste terminal no se alcanza hasta el denominado MPC con horizonte
quasi-innito (Chen & Allgower 1998b). Para el calculo de estos, se propone un
controlador local lineal con una funcion de Lyapunov cuadratica asociada tal que
garantiza que el coste terminal es una cota superior del coste optimo del estado
terminal controlado por el controlador local. De ah la denominacion horizonte
24 2.5. Formulacion general del MPC: necesidad de la region terminal y el coste terminal
cuasi-innito, pues el coste optimo del MPC es una cota superior del coste optimo
(con horizonte innito).
2.5. Formulaci on general del MPC: necesidad de la
region terminal y el coste terminal
Como se ha mostrado anteriormente, las formulaciones del control predictivo con
garanta de estabilidad han ido evolucionando hasta llegar a la necesidad de la region
terminal y del coste terminal de una u otra forma. Sorprendentemente, todas las estrate-
gias responden a unas condiciones generales de estabilidad. Este importante resultado
es el que se propuso en (Mayne et al. 2000). Este trabajo, a juicio del autor de esta
tesis, constituye una piedra angular del control predictivo y una referencia obligada
para futuros desarrollos en este campo.
En este trabajo se analizan las formulaciones existentes de controladores predictivos
con estabilidad garantizada y se establece que el control predictivo con coste terminal
y restriccion terminal puede, bajo ciertas condiciones, estabilizar asint oticamente un
sistema no lineal sujeto a restricciones. Ademas se establecen condiciones sucientes
sobre la funcion de coste terminal y la region terminal para garantizar dicha estabilidad.
Estas condiciones son las siguientes:
La region terminal debe ser un conjunto invariante positivo admisible del sis-
tema. Es decir, que debe existir una ley de control local u = h(x) tal que estabiliza
el sistema en y ademas la evoluci on del sistema y las actuaciones en dicho con-
junto son admisibles.
El coste terminal V (x) es una funcion de Lyapunov
4
asociada al sistema regulado
por el controlador local, tal que
V (f(x, h(x))) V (x) L(x, h(x))
para todo x . Por lo tanto, la ley de control local estabiliza asintoticamente
el sistema.
Esta formulacion del predictivo se denomina a lo largo de esta tesis formulacion
general del MPC. Esto se debe al hecho de que, como se demuestra en el artculo,
4
En el artculo (Mayne 2001), inspirado por (Jadbabaie et al. 2001), se extiende esta condicion a
funciones de Lyapunov de control (CLF), que son mas generales que las funciones de Lyapunov. Vease
la seccion A.2.5.
todas las formulaciones existentes hasta entonces se reducen a casos particulares de
estas condiciones.
Considerando el analisis realizado en la seccion 2.3, se puede ver como las hipotesis
impuestas resuelven los problemas existentes y garantizan la estabilidad.
Necesidad de la region terminal invariante : Si la region terminal es un invarian-
te positivo, entonces el conjunto de estados factibles es el conjunto de estados es-
tabilizables en N pasos X
N
= S
N
(X, ). Considerese x
k
X
N
. Dada la ausencia
de discrepancias entre el modelo de prediccion y el sistema, se tiene que el estado
al que evoluciona el sistema es el predicho x
k+1
= x(k + 1[k). Este estado puede
alcanzar la region en N 1 pasos, luego x
k+1
X
N1
. Gracias a que es un
conjunto invariante, este conjunto tiene la propiedad que X
N1
X
N
y por lo
tanto X
N
es un conjunto invariante positivo del sistema en bucle cerrado, lo que
garantiza la factibilidad del controlador en todo instante.
Necesidad del coste terminal como funcion de Lyapunov : bajo esta condicion
se garantiza que el coste optimo es estrictamente decreciente, y por lo tanto es
una funcion de Lyapunov del sistema. Esto garantiza la estabilidad asintotica del
sistema en bucle cerrado con restricciones.
La monotona de la funcion de coste optimo se basa en la existencia de una
secuencia de actuaciones factibles u
F
(k+1) basada en la solucion optima obtenida
en el instante anterior u
F
(k). Esta secuencia no es mas que los N 1 terminos
que restan de la secuencia anterior mas la actuacion obtenida de la ley de control
local. As, la diferencia entre el coste de esta secuencia,

J
N
(x
k+1
), y el coste
optimo anterior, J
N
(x
k
), es
J
N
(x
k+1
) J
N
(x
k
) = L(x
k
, u
(k[k)) +
_
L(x
(k + N[k), h(x
(k + N[k)))
+V (f(x
(k + N[k), h(x
(k + N[k)))) V (x
(k + N[k))
_
La incorporacion del coste terminal garantiza que el termino entre llaves es ne-
gativo, y por lo tanto la secuencia factible tiene un coste menor que el optimo
anterior, por lo que la solucion optima tambien lo tendra. En consecuencia
J
N
(x
k+1
) J
N
(x
k
) L(x
k
, K
MPC
(x
k
))
y por lo tanto el coste optimo es una funcion de Lyapunov que decrece a lo
largo de la evolucion del sistema, lo que garantiza la estabilidad asintotica. Esta
demostracion se hace con mas detalle en el captulo siguiente, dedicado al analisis
de estabilidad del MPC.
Es importante resaltar que, aun en el caso en el que el controlador garantice la
estabilidad en bucle cerrado del sistema, la trayectoria seguida por el mismo no es
26 2.5. Formulacion general del MPC: necesidad de la region terminal y el coste terminal
optima, en el sentido de que puede existir otra cuyo coste total a lo largo de la misma
sea inferior. Esto se deriva del horizonte nito considerado en la formulaci on del pro-
blema. As, la trayectoria del sistema diere de la trayectoria resultante de la secuencia
optima calculada en un instante (consecuencia derivada del principio de optimalidad
de Bellman).
Un resultado muy interesante relacionado con la estabilidad de los controladores
MPC es el denominado MPC suboptimo que se presenta en (Scokaert, Mayne &
Rawlings. 1999). En este trabajo se demuestra que es la factibilidad de la solucion
la que garantiza la estabilidad, siempre que esta garantice un decrecimiento de la fun-
cion de coste, no siendo necesaria la optimalidad de la solucion obtenida al problema de
optimizacion. Esta consideracion es trascendental para la implementaci on de contro-
ladores MPC en sistemas no lineales. En efecto, el problema de optimizacion implicado
en el MPC es en general no convexo, y por lo tanto el problema puede presentar mni-
mos locales. La obtencion del mnimo global es sumamente costosa comparada con la
obtencion de un mnimo local, y tanto mas comparada con la obtencion de una solucion
que simplemente presente un menor coste que la anterior.
2.5.1. Un ejemplo ilustrativo
Retomando el ejemplo del doble intergrador utilizado en la seccion 2.3.1, se va a
aplicar sobre el sistema un controlador MPC siguiendo la formulaci on general, es decir,
a nadiendo un coste terminal y una region terminal adecuados.
Para ello se ha calculado un controlador LQR para el sistema con las mismas ma-
trices de ponderacion que el MPC y, asociado a el, un invariante positivo . Dada la
optimalidad del LQR, la funcion de Lyapunov asociada V (x) = x
T
Px, siendo
P =
_
_
0,0511 0,1001
0,1001 0,4668
_
_
representa el coste innito de la evolucion del sistema en bucle cerrado para todos los
estados de . En consecuencia satisface las condiciones de estabilidad.
En la gura 2.2 se muestran los conjuntos estabilizables desde 1 paso hasta 4 pasos.
En este caso, al contrario que el mostrado anteriormente, los conjuntos estan anidados,
por lo que S
3
(X, ) S
4
(X, ) lo que garantiza la factibilidad. Ademas el coste
terminal a nadido garantiza la convergencia asint otica del sistema al origen, como se
muestra en la gura.
En la gura 2.3 se muestran las curvas de nivel de la funcion de coste optimo, junto
con las trayectorias del sistema. Se puede comprobar que el coste es una funcion de
Lyapunov del sistema observando como la evoluci on del sistema es tal que el coste
asociado decrece con el tiempo.
6 4 2 0 2 4 6
2
1
0
1
2
x
1
x
2

S
1

S
2
S
3
S
4
Figura 2.2: Evolucion de un sistema controlado por un MPC con garanta de estabilidad
6 4 2 0 2 4 6
2
1
0
1
2
x
1
x
2

Figura 2.3: Evolucion del coste optimo en las trayectorias del sistema
28 2.6. Robustez de los controladores MPC
2.6. Robustez de los controladores MPC
2.6.1. Introduccion
La estabilidad de los controladores predictivos se garantiza bajo la hipotesis de que
el modelo de prediccion coincide con el modelo del sistema a controlar. Sin embargo,
todo sistema tiene asociado un error con el modelo que representa su dinamica. Por ello,
para que un controlador sea aplicable debe poseer ciertas caractersticas de robustez.
En el caso en que no hubiese incertidumbres, si se aplica la secuencia de actuaciones
obtenida en bucle abierto, el sistema evoluciona de una manera admisible hasta alcanzar
el conjunto terminal. Sin embargo, las posibles discrepancias existentes entre el modelo
de prediccion y el sistema real pueden hacer que su evoluci on viole las restricciones o
bien que el controlador deje de ser factible o incluso que se pierda la convergencia del
sistema en bucle cerrado. El hecho de que el MPC se aplique mediante la estrategia de
horizonte deslizante hace que la actuacion se recalcule en cada periodo de muestreo, lo
que dota de realimentaci on al sistema y por lo tanto de cierta robustez.
El estudio de la robustez se puede realizar desde dos puntos de vista: el del analisis
de robustez y el de la sntesis de controladores robustos. En el primero, se parte de un
controlador MPC obtenido para un sistema sin considerar el efecto de las incertidum-
bres en su dise no y se determina que grado de incertidumbres es capaz de soportar
dicho controlador conservando la estabilidad del sistema.
El segundo enfoque es el de la sntesis, por el cual se establecen formulaciones
del controlador que consideran en el calculo de las actuaciones el efecto que tienen las
incertidumbres sobre el sistema. El objetivo es por lo tanto garantizar, para cierto grado
de incertidumbres, la estabilidad, la satisfaccion de las restricciones y, a ser posible,
alguna especicacion sobre el desempe no.
A continuaci on se trata el primer aspecto, abordandose la sntesis de controladores
robustos en el siguiente apartado.
2.6.2. Analisis de robustez de los controladores MPC
En el caso de sistemas lineales, existen numerosas tecnicas de analisis de robustez de
sistemas sin restricciones, pero pocas en el caso de sistemas con restricciones, pues, en
este caso el sistema en bucle cerrado puede ser no lineal. En (Zariou 1990) se presentan
condiciones sucientes (y tambien necesarias) para garantizar la estabilidad nominal
y robusta del MPC. En (Genceli & Nikolau 1993) se dan condiciones sucientes de
estabilidad robusta del DMC y se analiza el comportamiento del sistema en presencia de
incertidumbres. En (Primbs et al. 2000) se presenta un procedimiento para comprobar
la robustez de controladores predictivos de sistemas lineales con restricciones en las
entradas, basado en la solucion de una serie de desigualdades matriciales lineales (LMI).
La robustez de los controladores predictivos de sistemas no lineales se ha analizado
siguiendo dos lneas: una en la que se explota la optimalidad del controlador, y otra
basada en la teora de Lyapunov.
En la lnea basada en la optimalidad del controlador, en (Glad 1987) se presenta un
compendio de resultados de estabilidad robusta de controladores optimos para sistemas
no lineales en tiempo continuo, anes en la actuacion y sin restricciones. En este trabajo
se considera unicamente incertidumbres en las actuaciones de dos tipos: incertidumbres
en la ganancia, de forma que la actuacion real u
r
= (u) es una funcion (estatica) de
la actuacion que se aplica, e incertidumbres aditivas, de forma que u
r
= u + (x). El
principal resultado de este trabajo es la demostracion de que el controlador optimo
estabiliza al sistema con incertidumbres de ganancia contenidas en el sector (1/2, ),
es decir tal que
1
2
u
2
< u(u) <
Este resultado se demuestra para el caso de una entrada y se extiende al caso de
m ultiples entradas, garantizandose la robustez en otro sector.
Este trabajo se extendio en (Geromel & Da Cruz 1987) al caso de sistemas discre-
tos anes en la actuacion, sin restricciones y con incertidumbres en las actuaciones,
considerando tambien horizonte innito. En este trabajo se analiza la estabilidad del
sistema ante incertidumbres en la ganancia del controlador, obteniendose bajo ciertas
condiciones, un margen de estabilidad, que en el caso de una unica entrada, se reduce
al sector (0,5, ), como en los sistemas continuos. En este trabajo tambien se analiza
el caso de incertidumbres aditivas en la ganancia.
En (De Nicolao, Magni & Scattolini 1996) se extiende el trabajo de (Geromel &
Da Cruz 1987) al analisis de robustez de sistemas discretos sin restricciones controla-
dos con un MPC con restriccion terminal. Si bien el trabajo original esta formulado
para el caso de restriccion terminal nula, esta se puede extender al caso general pues
esta basado en el principio de optimalidad (De Nicolao et al. 1998). Siguiendo un desar-
rollo practicamente paralelo al desarrollado en (Geromel & Da Cruz 1987), se obtienen
resultados semejantes.
Otra forma de demostrar la robustez del MPC general basada en la optimalidad
es la presentada en (Magni & Sepulchre 1997). En este trabajo se demuestra la op-
timalidad inversa del MPC: el controlador obtenido de un MPC con horizonte nito
y estabilidad garantizada para un sistema sin restricciones se puede considerar como
un controlador optimo con horizonte innito considerando un coste de etapa modica-
do. En consecuencia, todo controlador MPC hereda las propiedades de robustez de los
controladores optimos, y en particular, el margen de incertidumbre en la ganancia de
(0,5, ).
El segundo enfoque para el analisis de robustez de los controladores es la teora de
Lyapunov, y se basa en la estabilidad asint otica (o bien, exponencial) que presentan es-
tos controladores. La idea basica consiste en garantizar que el coste optimo sigue siendo
una funcion de Lyapunov estrictamente decreciente a pesar de las incertidumbres. Es
por tanto una herramienta general y no aprovecha la optimalidad de los controladores,
sin embargo permite el analisis en presencia de restricciones, no consideradas en el
enfoque de la optimalidad. Es importante resaltar que la presencia de restricciones en
el controlador, en especial sobre los estados, impone un grado de complejidad mayor a
la robustez del controlador, pues se debe garantizar la satisfaccion de las restricciones
en presencia de las incertidumbres.
En (Scokaert, Rawlings & Meadows 1997) se analiza la estabilidad robusta de los
controladores MPC con horizonte nito para sistemas en tiempo discreto con restric-
ciones bajo incertidumbres aditivas que decaen con el tiempo. Este analisis se orienta
a la estabilidad del MPC cuando se conecta en cascada un observador para estimar
los estados del sistema, suponiendo que el error en la estimacion de los estados decae
con el tiempo. Basandose en las propiedades de los sistemas exponencialmente estables
y bajo la continuidad Lipschitz de la ley de control, se demuestra que el controlador
MPC soporta cierto grado de incertidumbre.
En (De Nicolao et al. 1998) se presenta una formulaci on estable del MPC y ademas
se analiza la estabilidad del controlador siguiendo la lnea de (Scokaert et al. 1997),
considerando incertidumbres aditivas que decaen y cierta condicion de continuidad
sobre el coste optimo.
Todos estos trabajos demuestran que los controladores predictivos tienen cierto
grado de robustez de forma inherente, es decir, que ante cierto grado de incertidumbres,
el sistema mantiene la estabilidad. Otro problema distinto es la sntesis de controladores
considerando las incertidumbres que presenta el sistema, el cual se trata en la siguiente
seccion.
2.6.3. Formulaciones robustas del MPC
Dado el alto grado de complejidad de los controladores predictivos (que incorporan
optimalidad y satisfaccion de restricciones en el control de sistemas no lineales), la in-
corporacion de las incertidumbres en el dise no es muy costosa, por lo que la mayor parte
de las formulaciones propuestas (con estabilidad garantizada) constituyen soluciones
meramente teoricas.
La forma habitual de considerar las incertidumbres en predictivo es incorporando
todas las posibles realizaciones de estas en la solucion del problema de optimizacion.
As, si el sistema incierto responde a un modelo
x
k+1
= f(x
k
, u
k
, w
k
)
siendo w
k
el vector de incertidumbres tal que w
k
W IR
p
. La prediccion de la
evolucion del sistema incierto a lo largo del horizonte depende de la realizacion de las
incertidumbres w
F
= w
i
con w
i
W para i = 0, , N 1. Considerando esta, el
controlador tiene la forma
mn
u
F
(k)
J
N
(x
k
, u
F
(k), W)
s.a
u(k + j[k) U j = 0, , N 1
x(k + j[k) X j = 0, , N 1, w
F
x(k + N[k) w
F
siendo el estado predicho
x(k + j + 1[k) = f(x(k + j[k), u(k + j[k), w
k+j
)
con x(k[k) = x
k
.
Notese que las restricciones en la evolucion de los estados se deben satisfacer de una
forma robusta, es decir, para todas las posibles realizaciones de las incertidumbres. La
incorporacion de restricciones en el estado complica notablemente el problema, pero,
a un en el caso en el que no haya restricciones sobre los estados, la restriccion terminal
siempre esta presente en el problema de optimizacion pues se a nade para garantizar la
estabilidad del controlador.
El coste a optimizar J
N
(x
k
, u
F
(k), W) puede basarse en las predicciones nominales
del sistema o bien considerar el efecto de las incertidumbres tomando, por ejemplo, la
peor situacion posible. Esto da lugar a la denominada formulacion min-max
J
N
(x
k
, u
F
(k), W) = max
w
F
_
N1
i=0
L(x(k + i[k), u(k + i[k), w
k+i
) + V (x(k + N[k))
_
Otra formulaci on consiste en a nadir un termino en la funcion de coste de etapa que
pondera la posible incertidumbre, como en la formulacion H
.
Esta forma de considerar las incertidumbres es intuitiva y razonable, pero puede
conducir a soluciones muy conservadoras. Este conservadurismo radica en la naturaleza
misma del control predictivo: la prediccion en bucle abierto.
En efecto, el control predictivo surge como solucion practica e implementable de
controladores optimos, evitando la resolucion del problema de programacion dinamica
gracias a la resolucion en cada instante del problema de optimizacion asociado. Eso
hace que, en vez de obtener una ley de control u
k
= K
N
(x
k
), se obtiene una secuencia
actuaciones asociada al estado actual, x
k
. En el caso en que haya incertidumbres, la
factibilidad del problema se debe garantizar para todas las posibles incertidumbres.
Por tanto, para que la secuencia obtenida sea factible, debe garantizar que la evolucion
del sistema incierto satisfaga las restricciones para toda posible incertidumbre. En
consecuencia, el conjunto de estados para los cuales existe una solucion factible X
ba
,
puede ser muy reducido.
Entre los controladores predictivos que se pueden englobar en esta formulaci on
esta el controlador min-max propuesto en (Campo & Morari 1987) para sistemas li-
neales, y el controlador dual robusto presentado en (Michalska & Mayne 1993). En
este trabajo se presenta el denominado MPC dual y se propone un procedimiento
que garantiza robustez. Este procedimiento parte de un controlador local robusto con
un invariante positivo robusto asociado . Sin embargo, considera en el problema de
optimizacion un conjunto , de forma que la secuencia optima para la region
conservadora garantice que el estado terminal incierto este contenido en . Esta idea
permite garantizar la satisfaccion robusta de la restriccion terminal.
Si se considera, en vez de una secuencia de actuaciones, una ley de control en la
optimizacion, la actuacion a aplicar en cada estado predicho para una determinada
realizacion de las incertidumbres, depende del estado en que se encuentra y en conse-
cuencia, de la realizacion de las incertidumbres. Por tanto la actuacion puede compen-
sar el efecto de las mismas con el n de satisfacer las restricciones. En consecuencia, el
conjunto de estados que pueden satisfacer las restricciones de este modo X
bc
es mucho
mayor, de forma que
X
ba
X
bc
La incorporacion de esta idea en el controlador MPC da lugar a la denominada
formulacion en bucle cerrado y fue introducida en (Scokaert & Mayne 1998, Lee &
Yu 1997) en el contexto del min-max. En esta formulaci on, el problema de control no
esta planteado en terminos de una secuencia de actuaciones, sino de una secuencia de
leyes de control
F
= u,
1
(x) ,
N1
(x)
lo cual hace que el problema de optimizacion implicado sea innito-dimensional. En
consecuencia estos controladores constituyen (por ahora) una herramienta meramente
teorica (Mayne et al. 2000). Sin embargo, estas consideraciones han permitido enfocar
mejor el problema de la robustez, dando un giro en la investigacion en este campo.
Esta formulaci on se sigue tambien en (Magni, Nijmeijer & van der Shaft 2001),
donde se propone un controlador H
con horizonte deslizante para un sistema no

lineal, afn en la actuacion y sin restricciones.
Dentro del control predictivo en bucle cerrado se pueden considerar otras for-
mulaciones como por ejemplo el trabajo presentado en (Kothare, Balakrishnan &
Morari 1996). En este se propone un controlador que estabiliza una planta incierta
tal que se puede expresar en cada instante como una combinaci on convexa de una serie
de plantas lineales y que presenta restricciones en los estados y en las actuaciones. En
esta formulaci on se considera como variable de optimizacion un controlador lineal que
estabiliza todas las plantas y se puede plantear como un LMI que se resuelve en cada
instante.
Tambien se pueden considerar dentro de los controladores en bucle cerrado los tra-
bajos (Bemporad 1998) y (Chisci, Rossiter & Zappa 2001) en los cuales se parametriza
la ley de control como u
k
= Kx
k
+v
k
, siendo Kx una ley de control que estabiliza la
planta nominal. El controlador predictivo se formula en terminos de v
k
. Las restriccio-
nes en los estados y en las actuaciones son politopicas, y por lo tanto, tras el cambio de
variables siguen siendo politopicas. Esta tecnica mejora el condicionamiento numerico
del problema de optimizacion y en cierta forma, el controlador a nadido reduce el efecto
de las incertidumbres, pues a nade cierta realimentaci on en las predicciones en bucle
abierto.
Ademas, en (Chisci & Zappa 1999) se a nade una restriccion adicional con el n
de garantizar la satisfaccion robusta de las incertidumbres. Esta idea se generaliza al
caso no lineal en (Kerrigan 2000), donde se analiza utilizando la teora de conjuntos
invariantes la satisfaccion robusta de las restricciones.
Todas estos controladores reducen el conservadurismo de la formulaci on en bucle
abierto, pero siguen siendo mas conservadoras que la formulacion en bucle cerrado. A
su favor tienen que son controladores mas facilmente implementables.
2.7. Conclusiones
En este captulo se ha hecho un repaso de las formulaciones del control predictivo,
especialmente enfocado al analisis de la estabilidad y la robustez, por ser estos los
aspectos que se tratan en esta tesis. Existen en la literatura publicaciones en las que
34 2.7. Conclusiones
se hace un balance y se resumen las distintas estrategias de controladores predictivos
existentes. Entre ellas caben citar (Camacho & Bordons 1999, Garca, Prett & Morari
1989, Mayne 2000, De Nicolao, Magni & Scattolini 2000, Chen & Allgower 1998a,
Mayne et al. 2000, Mayne 2001).
Se ha puesto de maniesto que el origen de la perdida de estabilidad de los con-
troladores predictivos radica en la formulacion con horizonte nito, jo y aplicado en
modo deslizante, y como las soluciones propuestas en la literatura, resumidas en la
denominada formulaci on general del predictivo, resuelven los problemas derivados de
esta formulaci on.
Tambien se muestra la robustez de los controladores predictivos desde dos puntos
de vista: el analisis de la estabilidad del MPC ante incertidumbres en la planta y el
dise no de controladores MPC robustos. La incorporacion de las incertidumbres en el
dise no de controladores es uno de los grandes temas de investigaci on abiertos en MPC,
en los que se han realizado avances signicativos, como la formulaci on en bucle cerrado
del MPC.
En el captulo siguiente se presenta con mayor profundidad la denominada formu-
lacion general del MPC que sirve de base para un posterior analisis de la estabilidad de
estos controladores. En este captulo se introducen nuevas formulaciones del MPC con
estabilidad garantizada que son aportaciones originales de esta tesis. Ademas se anali-
zan aspectos como el comportamiento y la optimalidad de los controladores. Tambien
se analiza la posibilidad de garantizar estabilidad en ausencia de la restriccion terminal,
obteniendose una serie de resultados originales y generalizando otros existentes.
Captulo 3
Nuevas formulaciones del MPC con
estabilidad garantizada
3.1. Introduccion
El control predictivo basado en modelo es una de las pocas tecnicas de control que
permite la incorporacion de restricciones en su formulaci on. Ademas esta estrategia de
control es valida para un amplio abanico de sistemas, tanto lineales como no lineales
y ha tenido una importante repercusion en la industria.
Un aspecto primordial en el dise no de un controlador es la garanta de estabilidad
del sistema en bucle cerrado. El estudio de la estabilidad en el MPC es un aspecto que
ha ido evolucionando hasta llegar al estado actual, en el que se considera una materia
madura. Esto se debe en gran parte al establecimiento de unas condiciones generales
(validas para la mayora de sistemas) bajo las cuales se garantiza la estabilidad del
controlador MPC (Mayne et al. 2000). Estas condiciones parten de una formulaci on
del controlador que incluye el coste terminal as como la restriccion terminal y que se
denomina a lo largo de este documento, formulaci on general del MPC.
Este captulo comienza estableciendo las condiciones de estabilidad del MPC ge-
neral, pues sirven de base para las posteriores secciones. A continuacion se presentan
nuevas formulaciones del MPC con estabilidad garantizada: en la primera de ella se
propone un controlador MPC con un horizonte de prediccion mayor que el horizonte
de control. Esta es una aportacion original de esta tesis y supone una generalizacion
de la formulaci on propuesta en (Magni, De Nicolao, Magnani & Scattolini 2001).
Otro nuevo controlador propuesto en este captulo considera un coste terminal basa-
35
36 3.1. Introduccion
do en una funcion de Lyapunov del sistema, el cual, ademas de garantizar estabilidad,
mejora la optimalidad del controlador. Este coste es una aproximaci on nita al coste
(con horizonte innito) del sistema regulado por el controlador local, y por ello se ha
denominado coste terminal con horizonte cuasi-innito (o simplemente coste terminal
cuasi-innito). Este resultado es una generalizacion del controlador propuesto en (De
Nicolao et al. 1998).
A continuaci on se realiza un analisis del comportamiento de los controladores desde
el punto de vista de la optimalidad, donde se demuestra que las dos formulaciones
anteriores mejoran la optimalidad del controlador.
Tambien se analiza la estabilidad de los controladores en caso de la suboptimali-
dad del controlador, y se imponen unas condiciones mas suaves que las originalmente
propuestas en (Scokaert et al. 1999).
Por ultimo se analizan bajo que condiciones se puede eliminar la restriccion terminal
conservandose la estabilidad y se caracteriza una region en la cual se garantiza la esta-
bilidad asintotica. Este analisis es una generalizacion de trabajos anteriores (Parisini &
Zoppoli 1995, Jadbabaie et al. 2001) a la formulaci on general del MPC, constituyendo
una aportacion original de esta tesis. Estos resultados han dado lugar a la publicacion
(Limon Marruedo,

Alamo & Camacho 2003) que esta pendiente de revision.
As, la organizacion de este captulo se ilustra en el siguiente diagrama:
Formulacin
general del MPC
Controlador MPC
con mayor
horizonte de
prediccin
Controlador MPC
con coste
terminal
cuasi-infinito
Anlisis de
optimalidad
Estabilidad
MPC subptimo
Eliminacin
de la restriccin
terminal
Fundamentos
Nuevos
controladores MPC
Anlisis
de los nuevos
controladores
Aspectos de
implementacin
Figura 3.1: Organizacion del captulo
Es importante indicar que todo el analisis llevado a cabo en este captulo, y en
general a lo largo de la tesis, se basa en la teora de Lyapunov y en la teora de conjuntos
invariantes, cuyos resultados mas importantes estan recopilados en el apendice A. Cabe
resaltar que para el analisis y el dise no de los controladores se considera que el sistema
no presenta incertidumbres. En captulos posteriores se analizara la robustez de los
controladores MPC.
Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 37
3.2. Descripcion del sistema
A lo largo de este captulo, se considera un sistema descrito por un modelo no lineal
en tiempo discreto de la forma
x
k+1
= f(x
k
, u
k
) (3.1)
siendo x
k
IR
n
el estado del sistema y u
k
IR
m
el vector de actuaciones sobre el
sistema en el instante k. El sistema presenta un punto de equilibrio en el origen, por
tanto f(0, 0) = 0.
Cada una de estas se nales estan connadas en una serie de restricciones a lo largo
del tiempo. Estas restricciones tienen la forma
x
k
X (3.2)
u
k
U (3.3)
donde el conjunto X se considera generalmente cerrado y U compacto. Para que el
sistema pueda evolucionar al punto de equilibrio, los conjuntos X y U deben contener
el vector nulo en su interior.
3.3. Formulacion general del MPC
Como se comento en el captulo anterior, la evoluci on que han experimentado los
controladores MPC en busca de la estabilidad ha convergido en la denominada formu-
lacion general del MPC
1
. Esta formulaci on establece unas condiciones sucientes de
estabilidad del MPC genericas que, como demuestran en el artculo, re une la mayora
de las formulaciones existentes hasta la fecha. En esta seccion se hace un analisis de
estabilidad de esta formulaci on analogo al realizado en (Mayne et al. 2000), que sirve
de introduccion e inicio al analisis de los controladores posteriores.
La formulaci on del problema de optimizacion del MPC es
mn
u
F
(k)
J
N
(x
k
, u
F
(k))
s.a
u(k +j[k) U j = 0, , N 1
x(k +j[k) X j = 0, , N 1
x(k +N[k)
1
De esta forma se reere en este documento a la formulacion del MPC propuesta en (Mayne
et al. 2000).
38 3.3. Formulacion general del MPC
siendo el funcional a optimizar
J
N
(x
k
, u
F
(k)) =
N1
i=0
L(x(k + i[k), u(k + i[k)) + V (x(k + N[k))
El vector u
F
(k) denota la secuencia de N actuaciones futuras
u
F
(k) = u(k[k), , u(k + N 1[k)
siendo u(k + j[k) la actuacion en el instante k + j calculada en el instante actual k.
Ante esta secuencia de actuaciones, la evolucion predicha del sistema en el instante
k + j + 1 a partir del modelo (3.1) se denota como x(k + j + 1[k) y viene dada por
x(k +j + 1[k) = f(x(k + j[k), u(k + j[k))
de modo que x(k[k) = x
k
es el estado muestreado del sistema en el instante actual.
El problema de optimizacion es un problema de programacion matematica cuyas
variables de decision son las componentes del vector de actuaciones futuras u
F
(k) de
tama no N m. Si las funciones que intervienen en el problema de optimizacion, f(, ),
V () y L(, ) son funciones continuas y si el conjunto U es compacto y los conjuntos
X y son cerrados, entonces se puede garantizar que el problema de optimizacion, en
caso de ser factible, presenta al menos un mnimo (Mayne et al. 2000).
Este problema depende del estado del sistema en cada instante, siendo por tanto
un problema parametrizado en x
k
. La solucion del problema dependera por tanto del
valor de x
k
. Dado que la solucion obtenida que se aplica mediante la estrategia de
horizonte deslizante, en cada instante k se calcula la secuencia optima u
F
(k). De esta
secuencia tan solo se aplica la actuacion correspondiente al instante k, es decir, u
(k[k)
desech andose, por tanto, el resto de la secuencia de actuaciones. Dado que esta solucion
depende del estado de la planta, la ley de control del MPC viene dada implcitamente
por
K
MPC
(x
k
) = u
(k[k)
Es interesante resaltar que, debido a la ausencia de discrepancias entre el modelo
de prediccion y el del sistema, el estado al que evoluciona el sistema es el predicho, es
decir, x
k+1
= x(k + 1[k). Pero, dado que el problema a resolver depende del estado, la
actuacion optima en el instante k + j solucion en x
k
puede ser distinta a la actuacion
optima para ese mismo instante en x
k+1
, es decir, u
(k+j[k) ,= u
(k+j[k+1). Por tanto,

las trayectorias optimas predichas en cada instante son distintas y, en consecuencia, la
evoluci on del sistema en bucle cerrado diere de la evolucion predicha en la resolucion
del sistema. Tan solo en el caso de horizonte innito se verica que la evolucion real
coincide con la predicha, por el principio de optimalidad de Bellman.
3.3.1. Condiciones sucientes de estabilidad
La formulaci on general del MPC comprende los siguientes parametros de dise no:
Horizonte de prediccion (N) : es el horizonte temporal en el que se considera la
evoluci on futura de la planta para el calculo de la actuacion.
Coste de etapa (L(x, u)) : es la funcion que penaliza el estado y la actuacion sobre
el sistema en el funcional a optimizar. Esta funcion es continua y denida positiva
tal que L(0, 0) = 0 y ademas L(x, u) (|(x, u)|), siendo () una funcion / .
Generalmente se impone que L(x, u) l|(x, u)|
para ciertas constantes l > 0

y > 0.
Esta condicion se puede relajar tomando L(x, u) l|(g(x), u)|
satisfaciendo
g(x) ciertas condiciones de observabilidad (Keerthi & Gilbert 1988).
Las funciones de coste pueden estar basadas en norma innito, en norma 1, si
bien lo mas habitual es considerar norma 2 ponderada, lo que da lugar al coste
cuadratico
L(x, u) = x
T
Qx + u
T
Ru
siendo Q una matriz semidenida positiva y R una matriz denida positiva.
Coste terminal (V (x)) : es la funcion que penaliza el estado terminal, es decir, el
estado predicho al nal del horizonte de prediccion.
Region terminal () : es un conjunto cerrado, vecindad del origen, que el estado
terminal debe alcanzar. Para garantizar esto, se impone como restriccion en el
problema de optimizacion denominada restriccion terminal.
Estos son los parametros del controlador MPC sobre los cuales se imponen condi-
ciones para garantizar la estabilidad del sistema. En esta seccion se presentan condi-
ciones sucientes incorporando los resultados presentados por Mayne en (Mayne 2001).
Para una mayor sencillez en la exposicion de los resultados, se incorpora la siguiente
notacion: sea (x) una funcion IR
n
IR, en lo que sigue se denota
(x, u) = (f(x, u)) (x)
que representa el incremento que experimenta la funcion al evolucionar el sistema que
se encuentra en un estado x al aplicar una actuacion u. Analogamente se denota
[ + L](x, u) = (x, u) + L(x, u)
Hipotesis 3.1 (Region y coste terminal) El sistema es tal que existe una vecindad
del origen X que es un conjunto invariante de control del sistema
2
y ademas tiene
asociada una funcion de Lyapunov de control (CLF)
3
V (x) tal que
mn
uU
V (f(x, u)) V (x) + L(x, u), sujeto a f(x, u) 0 x (3.4)
Esta hipotesis suele formularse en terminos de funcion de Lyapunov. Pero el con-
cepto de CLF es mas general y engloba a las funciones de Lyapunov, dado que estas se
pueden considerar funciones de Lyapunov de control particularizadas para una cierta
ley de control. Esta generalidad se plasmara en una mayor diversidad de funciones y
sobre todo en mayores regiones invariantes. Notese tambien que toda region del tipo
= x IR
n
: V (x)
contenida en la region factible del problema (3.4) es un invariante de control del sistema.
Sea u = h
V
(x) la ley de control formada por las actuaciones optimas de (3.4) en
cada estado, entonces, esta condicion se puede reescribir de una forma mas compacta
como
[V + L](x, h
V
(x)) 0
para todo x .
A partir de las condiciones anteriormente expuestas se puede establecer el siguiente
resultado:
Teorema 3.2 (Estabilidad asint otica) (Mayne et al. 2000)
Sea un sistema x
k+1
= f(x
k
, u
k
), tal que f(0, 0) = 0 y esta sujeto a las restricciones
x
k
X y u
k
U.
Sea un problema de optimizacion MPC con una funcion de coste terminal y una region
terminal tales que satisfacen la hipotesis 3.1.
Entonces el sistema controlado por la ley de control u
k
= K
MPC
(x
k
) es asintoticamente
estable con un dominio de atraccion X
N
que es el conjunto de estados para los que el
problema de optimizacion es factible.
Demostracion:
Factibilidad:
La estabilidad se basa en probar que el conjunto factible X
N
es un invariante positivo
2
Vease la seccion A.3.
3
Vease la seccion A.2.5.
del sistema en bucle cerrado. El conjunto X
N
es el conjunto de estados para los cuales
existe una secuencia de N actuaciones admisibles tales que el sistema evoluciona dentro
de X hasta alcanzar el conjunto terminal . Este conjunto es el conjunto estabilizable
en N pasos
4
, S
N
(X, ). Por tanto el dominio de atraccion es X
N
= S
N
(X, ).
Sea x
k
S
N
(X, ), entonces el estado siguiente puede alcanzar en N 1 pasos,
por lo que x
k+1
= x(k+1[k) S
N1
(X, ) S
N
(X, ). Por tanto, verica la condicion
de invariancia y el conjunto S
N
(X, ) es un invariante positivo del sistema en bucle
cerrado.
Convergencia:
Se demuestra comprobando que el coste optimo es una funcion de Lyapunov del sistema
en bucle cerrado.
Sea u
F
(k) la solucion optima del sistema en x
k
, con un coste optimo J
N
(x
k
) y una
secuencia predicha optima x
(k+j[k) para j = 1, , N. Es facil comprobar que J
N
(x
k
)
es una funcion denida positiva por serlo L(, ), ya que
J
N
(x
k
) L(x
k
, u
(k[k)) l|(x
k
, u
(k[k))|
l|x
k
|
Considerese la secuencia u
F
(k + 1) dada por:
u(k +j[k + 1) =
_
_
_
u
(k + j[k) j = 1, , N 1
h
V
( x(k + N[k + 1)) j = N
siendo h
V
() la actuacion optima de (3.4) para el coste terminal y x(k+j[k+1) el estado
predicho en el instante k +j a partir del estado x
k+1
aplicando la secuencia u
F
(k +1).
Notese que esta secuencia esta formada por los terminos que restan de la secuencia
optima anterior completada por la actuacion que satisface la condicion terminal (3.4).
Dado que no hay discrepancias entre el modelo de prediccion y el sistema real, se
tiene que x
k+1
= x
(k +1[k). As, aplicando la secuencia u

F
(k +1), el estado predicho
x(k + j[k + 1) satisface que
x(k + j[k + 1) = x
(k +j[k) para j = 1, , N
Por lo tanto, x(k + j[k + 1) X para todo j = 1, , N. Ademas, de la factibilidad
de la secuencia optima se deduce que x(k + N[k + 1) y por lo tanto la actuacion
u(k+N[k+1) = h
V
( x(k+N[k+1)) esta denida y es admisible y ademas satisface que
x(k + N + 1[k + 1) por la hipotesis 3.1 . De todo esto se deduce que la secuencia
u
F
(k + 1) es una secuencia de actuaciones factible.
4
Sea

J
N
(x
k+1
) el coste asociado a la secuencia factible u
F
(k + 1). Entonces se tiene
que
J
N
(x
k+1
) J
N
(x
k
) = L(x
k
, u
(k[k)) +
_
L( x(k + N[k + 1), h
V
( x(k + N[k + 1))
+V ( x(k + N + 1[k + 1)) V (x
(k + N[k))
_
dado que x(k +N[k + 1) = x
(k + N[k) , que
x(k + N + 1[k + 1) = f(x
(k + N[k), h
V
(x
(k + N[k)))
y que h
V
() satisface (3.4), se deduce que
J
N
(x
k+1
) J
N
(x
k
) = L(x
k
, u
(k[k)) + [V + L](x
(k + N[k), h
V
(x
(k + N[k))
L(x
k
, u
(k[k))
Por tanto, del principio de optimalidad se tiene que
J
N
(x
k+1
) J
N
(x
k
)

J
N
(x
k+1
) J
N
(x
k
) L(x
k
, u
(k[k)) l|x
k
|
Por tanto J
N
(x) es una funcion de Lyapunov y el sistema es asintoticamente estable.
Esta demostracion es la base de resultados posteriores y se divide en dos partes:
la factibilidad que garantiza que el controlador esta denido en todo instante y que
la evolucion del sistema satisface las restricciones, y la convergencia, que se deriva de
que el coste optimo es una funcion de Lyapunov. La mayora de las demostraciones de
estabilidad en el campo de predictivo siguen esta lnea.
Nota 3.3 La demostracion de estabilidad asintotica se basa en que el coste optimo es
una funcion de Lyapunov del sistema. Es interesante resaltar que para completar la
demostracion con rigor, es necesario encontrar una funcion / que acote superiormente
el coste optimo en una vecindad del origen. Esta condicion se puede inferir de la con-
tinuidad del coste optimo. Tambien se podra derivar de la continuidad de la funcion
de coste terminal, pues para todo estado en se tiene que J
N
(x) V (x), como se
demostrara posteriormente.
A continuaci on se establecen condiciones sucientes para garantizar la estabilidad
exponencial del sistema en bucle cerrado.
Corolario 3.4 (Estabilidad exponencial) (Scokaert et al. 1997)
Sea la funcion de coste tal que L(x, u) c
x
|x|
+ c
u
|u|
Sea la secuencia optima u
F
(k) para la cual existe una constante b
u
> 0 tal que
|u
(k + j[k)| b
u
|x
k
|
Sea el modelo f(, ) para el cual existen unas constantes a
x
> 0 y a
u
> 0 tales que
|f(x, u)| a
x
|x| + a
u
|u|
Sea el coste terminal V (x) tal que V (x) d
x
|x|
.
Entonces el sistema controlado por el MPC, bajo las hipotesis del teorema 3.2, es ex-
ponencialmente estable en X
N
.
Demostracion:
Del teorema 3.2 se tiene que el coste optimo J
N
(x) es una funcion de Lyapunov del
sistema. Ademas verica que
J
(x) l|x|
(x, K
MPC
(x)) l|x|
Entonces, si existe una constante r tal que J
N
(x
k
) r|x
k
|
, seg un la teora de Lya-

punov el sistema sea exponencialmente estable (ver apendice A). Para ello se va a
demostrar primero que
|x(k + 1[k)| a
x
|x
k
| +a
u
|u
(k[k)| (a
x
+ a
u
b
u
)|x
k
| =
1
|x
k
|
|x(k + 2[k)| a
x
|x(k + 1[k)| + a
u
|u
(k + 1[k)|
(a
x
1
+ a
u
b
u
)|x
k
| =
2
|x
k
|
.
.
.
|x(k + j[k)| a
x
|x(k + j + 1[k)| + a
u
|u
(k + j 1[k)|
(a
x
j1
+ a
u
b
u
)|x
k
| =
j
|x
k
|
Entonces se tiene que
J
N
(x
k
) =
N1
i=0
L(x(k + i[k), u
(k + i[k)) + V (x(k +N[k))
N1
i=0
c
x
i
|x
k
|
+ c
u
b
u
|x
k
|
+ d
x
N
|x
k
|
=
_
c
x
N1
i=0
i
+ Nc
u
b
u
+d
x
N
_
|x
k
|
= r|x
k
|

Las condiciones anteriores son suaves en general, salvo la impuesta sobre la secuencia
de actuaciones, que esta relacionada con su continuidad Lipschitz. Esta condicion se
satisface bajo ciertas condiciones de regularidad del problema de optimizacion. En el
apendice C se hace un analisis de esta propiedad.
3.3.2. Ejemplo de aplicacion al reactor
Para ilustrar el controlador MPC general se aplica este controlador sobre el reactor
continuamente agitado que se muestra en el apendice B. Se va a considerar una funcion
de coste cuadratica
L(x, u) = x
T
Qx + u
T
Ru
siendo las matrices de ponderacion
Q =
_
_
10 0
0 1
_
_
R = 1
Para poder aplicar esta estrategia de control, es necesario calcular un invariante
positivo del sistema as como una funcion de Lyapunov, o bien una CLF, asociada que
satisfagan la hipotesis 3.1. Como se muestra en la seccion 3.7, si el sistema linealizado en
el punto de equilibrio es controlable, se puede establecer un procedimiento sistematico
para el calculo de un invariante positivo basado en la funcion de Lyapunov del sistema
linealizado. Procediendo de esta forma se dise na un controlador por la tecnica LQR
obteniendose el controlador u
k
= Kx
k
siendo
K =
_
1,6154 3,6644
_
para este controlador se calcula la funcion de Lyapunov V (x) = x
T
Px, que satis-
face la condicion (3.4) en la region invariante
= x IR
n
: V (x)
siendo
P =
_
_
265,8811 49,3961
49,3961 125,9963
_
_
= 9,3353
Considerando V (x) y como funcion de coste terminal y region terminal, y tomando
un horizonte de prediccion N = 5, se aplica el controlador MPC al sistema, partiendo
de diversos estados iniciales. De esta forma se ha obtenido el retrato de estados que
se muestra en la gura 3.2 en la que tambien se puede observar la region terminal
calculada para el sistema .
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2

Figura 3.2: Retrato de estados del reactor en bucle cerrado con N = 5.
En la gura 3.3 se muestra la evoluci on a lo largo del tiempo de las se nales del
sistema partiendo de una concentraci on inicial C
A
= 0,4 mol/l (x
1
= 0,1) y una
temperatura inicial T = 357,6 K (x
2
= 0,38). Considerando un horizonte de control
N = 5, el estado inicial es factible, por lo que es asintoticamente estabilizado por
el controlador. Notese como el controlador satura la actuacion durante los primeros
instantes para no violar las restricciones impuestas.
Tal y como se demuestra en el teorema 3.2, la secuencia de valores del coste optimo
es estrictamente decreciente a lo largo de la trayectoria optima como se puede ver en
la gura 3.4.
3.4. MPC con horizonte de prediccion mayor que
el de control
En la formulacion general del MPC se considera como variables de decision las
actuaciones aplicadas a lo largo del horizonte de prediccion. Sin embargo, en la tradicion
de los controladores predictivos lineales se encuentra la consideracion de un horizonte de
prediccion mayor que el horizonte de control (Camacho & Bordons 1999). El horizonte
46 3.4. MPC con horizonte de prediccion mayor que el de control
0 5 10 15 20 25 30 35 40 45 50
0.1
0.05
0
0.05
x
1
0 5 10 15 20 25 30 35 40 45 50
0.1
0
0.1
0.2
0.3
x
2
0 5 10 15 20 25 30 35 40 45 50
1
0.5
0
u
muestras
Figura 3.3: Evolucion de las se nales del reactor en bucle cerrado.
0 5 10 15 20 25 30 35 40 45 50
2
1.5
1
0.5
0
0.5
1
1.5
muestras
l
o
g
1
0

J
* 5
Figura 3.4: Evolucion del logaritmo decimal del coste optimo del reactor.
de control se reere al n umero de variables de decision consideradas en el problema de
optimizacion. Esta medida permite considerar en el controlador el comportamiento del
sistema en un horizonte mayor sin aumentar el n umero de variables de decision, si bien
es necesario jar las actuaciones a considerar en la porcion de horizonte de prediccion
que es mayor que el horizonte de control.
Esta medida fue traslada a sistemas no lineales en (Chen & Allgower 1997, Zheng
2000), limitandose al caso de sistemas estables. En (Magni, De Nicolao, Magnani &
Scattolini 2001) se generalizo para una formulaci on particular del MPC, en la que se
considera como funcion de coste terminal el coste de la evolucion del sistema controlado
por la ley de control local u = h(x) en un horizonte nito sucientemente largo. Esta
aproximacion es una version implementable de la formulaci on propuesta por los autores
en (De Nicolao et al. 1998) en la cual consideran como coste terminal el coste innito
del sistema controlado por un controlador local.
En esta seccion se extiende la formulacion general del MPC a la formulaci on con
mayor horizonte de prediccion y se establecen condiciones de estabilidad del contro-
lador. Esta formulaci on, no solo conserva las propiedades del controlador propuesto
en (Magni, De Nicolao, Magnani & Scattolini 2001), sino que ademas posee algunas
nuevas. Todas estas propiedades se analizan en secciones posteriores. Esta formulacion
y su analisis posterior son una de las contribuciones originales de esta tesis.
3.4.1. Formulacion del controlador
Supongamos que el sistema satisface las siguientes hipotesis:
Hipotesis 3.5 El sistema es tal que existe un conjunto que es un conjunto invariante
positivo del sistema controlado por una ley de control u
k
= h(x
k
), que verica
(i) X
h
= x X : h(x) U.
(ii) El sistema en bucle cerrado tiene una funcion de Lyapunov asociada V (x) tal que
V (f(x, h(x))) V (x) L(x, h(x)) x
Notese que esta hipotesis es la particularizacion de la hipotesis 3.1 al caso de una
funcion de Lyapunov, para la cual se conoce una ley de control estabilizante. La condi-
cion terminal puede reescribirse como
[V + L](x, h(x)) 0
En lo que sigue se denota L
h
(x) = L(x, h(x)) al coste de etapa asociado al estado
de la planta x aplicando la ley de control local u = h(x).
El funcional considerado en el MPC con un horizonte de prediccion N
p
y un hori-
zonte de control N
c
viene dado por
J
Nc,Np
(x
k
, u
F
(k)) =
Nc1
i=0
L(x(k +i[k), u(k +i[k)) +
N
p
1
i=N
c
L
h
(x(k +i[k)) +V (x(k +N
p
[k))
Notese que en este caso las variables de optimizacion son las N
c
acciones de control a
lo largo del horizonte de control. A partir de entonces se considera que el sistema se
controla con la ley de control local u
k
= h(x
k
). Por tanto, el problema de optimizacion
se formula de la siguiente manera:
mn
u
F
(k)
J
N
c
,N
p
(x
k
, u
F
(k))
s.a
u(k + j[k) U j = 0, , N
c
1
h(x(k + j[k)) U j = N
c
, , N
p
1
x(k + j[k) X j = 0, , N
p
1
x(k + N
p
[k)
En este caso las predicciones se realizan de forma que
x(k + j + 1[k) = f(x(k + j[k), u(k + j[k)) j = 0, N
c
1
x(k + j + 1[k) = f(x(k + j[k), h(x(k + j[k))) j = N
c
, N
p
1
siendo x(k[k) = x
k
.
En cada instante se resuelve este problema de optimizacion y se aplica sobre el
sistema seg un la estrategia de horizonte deslizante. Por tanto, la ley de control viene
dada por
K
MPC
(x
k
) = u
(k[k)
3.4.2. Condiciones sucientes de estabilidad
A continuacion se va a demostrar que el nuevo controlador estabiliza asintoticamente
el sistema bajo las mismas hipotesis que el MPC general. Esto permite extender la
formulaci on general del MPC a horizontes de prediccion mayores que el de control, lo
cual es una contribuci on de esta tesis.
Teorema 3.6 (Estabilidad asintotica)
Sea un sistema x
k+1
= f(x
k
, u
k
x
k
X y u
k
U.
Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y una
region terminal tales que satisfacen la hipotesis 3.5.
Entonces el sistema controlado por la ley de control u
k
= K
MPC
(x
k
) con un horizonte de
prediccion N
p
y un horizonte de control N
c
es asintoticamente estable con un dominio de
atraccion X
N
c
,N
p
que es el conjunto de estados para los que el problema de optimizacion
es factible.
Demostracion:
La demostracion es similar a la del teorema 3.2, por lo que habra razonamientos que
se ineran de esta.
Factibilidad:
Al igual que en el MPC general, se puede obtener una solucion factible u
F
(k + 1) a
partir de la solucion optima anterior u
F
(k). Esta viene dada por
u(k + j[k + 1) =
_
_
_
u
(k + j[k) j = 1, , N
c
1
h(x(k + N
c
[k + 1)) j = N
c
La secuencia de estados predichos obtenida al aplicar la secuencia de actuaciones
u
F
(k + 1) se denota x(k + j[k + 1).
Dado que el sistema no discrepa del modelo, se tiene que x
k+1
= x(k+1[k). Entonces
la prediccion nominal en k +1 a partir de la secuencia factible satisface que x(k +j[k +
1) = x
(k +j[k) para j = 1, , N
c
. Ademas, dado que x(k +N
c
[k +1) = x
(k +N
c
[k),
y que a partir de este instante se aplica la ley de control local u = h(x), se tiene que
x(k +j[k +1) = x
(k +j[k) para j = N
c
+1, , N
p
. Por lo tanto x(k +N
p
[k +1) ,
y de la hipotesis 3.5 se tiene que la ley de control local proporciona una actuacion
admisible tal que x(k + N
p
+ 1[k + 1) X.
Por tanto, la restriccion en el estado, as como la restriccion terminal, y la restriccion
sobre las actuaciones se satisfacen, y en consecuencia la secuencia u
F
(k +1) es factible.
De aqu se deduce que para todo x
k
X
Nc,Np
, el estado siguiente x
k+1
X
Nc,Np
,
luego el conjunto factible X
N
c
,N
p
es un invariante positivo del sistema en bucle cerrado.
Convergencia:
Sea

J
Nc,Np
(x
k+1
) el coste en el estado x
k+1
asociado a la actuacion factible u
F
(k + 1),
entonces dado que x
(k + N
p
[k) y considerando la hipotesis 3.5, se tiene que
J
Nc,Np
(x
k+1
) J
N
c
,N
p
(x
k
) = L(x
k
, u
(k[k)) +
_
L
h
( x(k + N
p
[k + 1))
+V ( x(k + N
p
+ 1[k + 1)) V (x
(k + N
p
[k))
_
= L(x
k
, u
(k[k))
+[V + L](x
(k + N
p
[k), h(x
(k +N
p
[k)))
L(x
k
, u
(k[k))
Por tanto, del principio de optimalidad se tiene que
J
N
c
,N
p
(x
k+1
) J
N
c
,N
p
(x
k
)

J
N
c
,N
p
(x
k+1
) J
N
c
,N
p
(x
k
) L(x
k
, u
(k[k))
De aqu se deduce que el coste optimo es una funcion de Lyapunov estrictamente
decreciente y, por tanto, el sistema es asint oticamente estable.
Como se comento anteriormente, esta formulaci on es una generalizacion de la pro-
puesta en (Magni, De Nicolao, Magnani & Scattolini 2001). En dicho trabajo se utiliza
como coste terminal, una version truncada del coste innito del sistema controlado
por la ley de control local. El n umero de terminos considerados en el coste terminal
se calcula para garantizar que el sistema en bucle cerrado sea asintoticamente estable.
Estas condiciones dan como resultados altos valores del horizonte y ademas, dicho
horizonte depende del estado terminal del sistema, y del estado inicial de la planta.
Esto es un gran inconveniente, pues la sintonizacion del controlador depende de la
evoluci on del sistema. Estas desventajas se mitigan en la formulaci on propuesta, en la
que se demuestra estabilidad para un coste terminal jo.
Si bien la formulaci on propuesta en (Magni, De Nicolao, Magnani & Scattolini 2001)
presenta ciertas propiedades entre las que destacan un mayor dominio de atraccion y
un mejor desempe no debido al mayor grado de optimalidad. Esta ultima tan solo se
verica en el caso de coste terminal con horizonte innito (que es irrealizable desde un
punto de vista practico, salvo en el caso de sistemas lineales). En secciones posteriores
y en el captulo siguiente, se demuestra que la formulaci on que se propone en esta tesis
conserva las propiedades del controlador anterior y ademas presenta un mayor grado
de optimalidad sin tener que recurrir a soluciones meramente teoricas.
El controlador MPC propuesto se aplica al reactor utilizando los parametros del
controlador (coste de etapa, region y coste terminal) presentados en el ejemplo de la
seccion 3.3.2. Considerando en este caso un horizonte de control N
c
= 3 y un horizonte
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
Figura 3.5: Retrato de estados del sistema en bucle cerrado.
de prediccion N
p
= 15, se aplica el MPC al sistema partiendo de diversos estados
iniciales, dando como resultado el retrato de estados que se muestra en la gura 3.5.
En la gura 3.6 se muestra la evoluci on a lo largo del tiempo de las se nales del
sistema partiendo de una concentraci on inicial C
A
= 0,4 mol/l (x
1
= 0,1) y una
temperatura inicial T = 357,6 K (x
2
= 0,38).
0 5 10 15 20 25 30 35 40 45 50
0.2
0.15
0.1
0.05
0
0.05
x
1
0 5 10 15 20 25 30 35 40 45 50
0
0.2
0.4
x
2
0 5 10 15 20 25 30 35 40 45 50
1
0.5
0
0.5
u
muestras
Figura 3.6: Evolucion de las se nales del sistema en bucle cerrado.
52 3.5. MPC con coste terminal cuasi-innito
Tal y como se demuestra, la secuencia de valores del coste optimo es estrictamente
decreciente a lo largo de la trayectoria optima como se puede ver en la gura 3.7.
0 5 10 15 20 25 30 35 40 45 50
2.5
2
1.5
1
0.5
0
0.5
1
1.5
lo
g
1
0

J
*
muestras
Figura 3.7: Evolucion del logaritmo decimal del coste optimo.
Notese que manteniendo una complejidad de calculo similar a la formulaci on ge-
neral, se extienden los estados futuros a considerar en el controlador de 3 a 15. Esto
conere un mejor comportamiento al sistema y un mayor dominio de atraccion como
se demostrara posteriormente.
3.5. MPC con coste terminal cuasi-innito
En el artculo (De Nicolao et al. 1998) se presenta una formulaci on del MPC con
estabilidad garantizada.

Esta emplea como coste terminal el coste con horizonte innito
del controlador local, es decir,
V
(x) =
i=
i=0
L(x
h
(i + j[j), h(x
h
(i + j[j)))
siendo x
h
(i + j[j) la prediccion del estado del sistema en el instante i + j, controlado
por la ley de control local u = h(x), partiendo de x
h
(j[j) = x .
Esta eleccion de coste terminal satisface la hipotesis 3.5 pues, si la ley local es
asint oticamente estabilizable, se verica que
V
(f(x, h(x))) V
(x) = L(x, h(x))

y por tanto garantiza la estabilidad asint otica del sistema en bucle cerrado. Sin embar-
go, esta es una solucion meramente teorica pues es practicamente imposible calcular el
coste innito V
(x) de forma analtica, salvo en el caso de sistemas lineales. Este coste

se podra calcular en lnea de forma numerica, pero el horizonte innito hace que sea
imposible a menos que se aproxime por el coste en un horizonte nito sucientemente
largo. En este caso, podra no estar garantizada la estabilidad del controlador.
Esta limitacion se resolvio en un trabajo posterior (Magni, De Nicolao, Magnani
& Scattolini 2001) limitando el coste a un horizonte nito. Esta solucion garantiza
estabilidad para un horizonte sucientemente largo como para que sea una aproxi-
macion sucientemente precisa. Este horizonte se ja a partir de una condicion que
depende del estado terminal predicho en cada instante y del estado en que se encuentra
el sistema. Por lo tanto depende de la evolucion del sistema, lo que la hace muy difcil de
comprobar a priori. Esta condicion, que en el artculo se presenta como una condicion
tecnica, es clave para la demostracion de la estabilidad del controlador, no estando
garantizada si esta no se cumple.
En esta seccion se presenta un coste terminal con horizonte nito de la forma
5
V
M
(x) =
j=M1
j=0
L
h
(x
h
(i + j[i)) +V (x
h
(i +M[i)) (3.5)
siendo V () una funcion de Lyapunov del sistema que satisface la hipotesis 3.5. Este
coste terminal se denomina coste terminal con horizonte cuasi-innito, o simplemente
coste terminal cuasi-innito.
Este coste terminal garantiza la estabilidad del MPC para cualquier horizonte
M 1 y ademas puede aproximar arbitrariamente bien el coste innito. Esta formu-
lacion conserva, como se ver a, la optimalidad de la formulacion de (Magni, De Nicolao,
Magnani & Scattolini 2001) sin los problemas que esta presenta. Este controlador y
sus resultados asociados constituye una de las aportaciones originales de esta tesis.
El nuevo controlador que se presenta en esta seccion se basa en el siguiente resultado:
Lema 3.7 Sea la funcion V (x) y la region tales que satisfacen la hipotesis 3.5. Sea
la funcion
V
M
(x) =
j=M1
j=0
L
h
(x
h
(i + j[i)) +V (x
h
(i +M[i)) (3.6)
siendo x
h
(i+j[i) la prediccion del sistema controlado por la ley de control local u = h(x)
considerando x(i[i) = x, de forma que
x
h
(i + j + 1[i) = f(x
h
(i + j[i), h(x
h
(i +j[i)))
5
En lo que sigue y por sencillez en la presentacion de los resultados se denota L
h
(x) = L(x, h(x)).
Entonces la funcion V
M
(x) y la region S
h
M
(X, )
6
tambien satisfacen la hipotesis 3.5.
Demostracion:
De la teora de conjuntos invariantes se deduce que el conjunto S
h
M
(X, ) X
h
es un
invariante positivo del sistema por serlo . Entonces, para todo x S
h
M
(X, ) se tiene
que
V
M
(f(x, h(x))) V
M
(x) = V (x
h
(i + M + 1[i)) + L
h
(x
h
(i +M[i))
L
h
(x) V (x
h
(i + M[i))
L
h
(x) +V (x
h
(i + M[i)) +L
h
(x(i + M[i))
Dado que x S
h
M
(X, ), entonces x
h
(i + M[i) , y por lo tanto por la hipotesis
3.5 se tiene que
V
M
(f(x, h(x))) V
M
(x) L
h
(x)
con lo que se demuestra el lema.
Nota 3.8 Bajo las condiciones del lema 3.7, es facil demostrar que para cualquier
conjunto invariante positivo del sistema controlado por la ley de control local u = h(x),
S
h
M
(X, ), la funcion de Lyapunov V
M
(x) y el conjunto tambien satisfacen la
hipotesis 3.5. En particular tambien se satisface con el conjunto .
La funcion V
M
(x) tiene una serie de propiedades que se establecen en el siguiente
teorema:
Teorema 3.9 Sea V (x) la funcion de Lyapunov de la hipotesis 3.5 y sea V
M
(x) la
funcion de Lyapunov denida a partir de V (x) como en el lema 3.7. Entonces se tiene
que:
(i) V (x) V
M
(x), para todo M 1, para todo x .
(ii) V
M
(x)
j=0
L
h
(x
h
(i +j[i)) = V
(x) siendo x(i[i) = x, para todo x S

h
M
(X, ).
(iii) V
M
(x) V
M+1
(x) para todo x S
h
M
(X, ).
6
La region S
h
M
(X, ) es el conjunto de estados del sistema controlado por la ley de control u = h(x)
tales que la evolucion del sistema es admisible y ademas alcanzan en M pasos. Vease la seccion A.3.
(iv) V
M
(x) V
(x) V
M
(f(x, h(x))) V
(f(x, h(x))) para todo x S

h
M
(X, ).
Demostracion:
(i) De la hipotesis 3.5 se tiene que para todo x se verica
V (x
h
(i + j[i)) V (x
h
(i + j + 1[i)) L
h
(x
h
(i + j[i))
siendo x(i[i) = x. De aqu se deduce que
V (x) V (x
h
(i + M[i)) =
j=M1
j=0
V (x
h
(i + j[i)) V (x
h
(i +j + 1[i))
j=M1
j=0
L
h
(x
h
(i + j[i))
Por tanto V (x) V
M
(x), lo que demuestra la primera armacion del teorema.
(ii) De la invariancia positiva de S
h
M
(X, ), se tiene que para todo x S
h
M
(X, )
implica que x
h
(i +j[i) S
h
M
(X, ) para todo i 0. Entonces, aplicando el lema
3.7 se tiene que
V
M
(x
h
(i + j[i)) V
M
(x
h
(i + j + 1[i)) L
h
(x
h
(i + j[i))
siendo x
h
(i[i) = x. De aqu se deduce que
j=
j=0
V
M
(x
h
(i + j[i)) V
M
(x
h
(i + j + 1[i))
j=
j=0
L
h
(x
h
(i +j[i))
= V
(x)
dado que el sistema controlado con la ley de control u = h(x) es asintoticamente
estable en , el termino de la izquierda se reduce a V
M
(x), lo que demuestra la
propiedad.
(iii) Para demostrar la tercera consecuencia basta con considerar que
V
M+1
(x) V
M
(x) = L
h
(x
h
(i + M[i)) +V (x
h
(i + M + 1[i)) V (x
h
(i + M[i))
= V (x
h
(i + M[i), h(x
h
(i + M[i))) + L
h
(x
h
(i +M[i))
dado que x
h
(i + M[i) , de la hipotesis 3.5 se demuestra la propiedad.
(iv) La cuarta propiedad surge inmediatamente considerando que
V
M
(x) V
M
(f(x, h(x))) L
h
(x) = V
(x) V
(f(x, h(x)))
De estos resultados se deriva que para todo x , la diferencia
V
M
(x) V
(x)
se puede hacer tan peque na como se desee tomando un valor de M sucientemente
grande.
Por ejemplo, supongamos que el controlador local u = h(x) de la hipotesis 3.5
estabiliza exponencialmente al sistema en = x : V (x) . Por tanto existe una
constante [0, 1) tal que
V (f(x, h(x)) V (x)
Si se quiere que la diferencia sea
V
M
(x) V
(x)
se puede encontrar un valor de M() tal que para todo M M() se verique la
condicion anterior.
En efecto, de las propiedades de V
M
(x) se tiene que
V
M
(x) V
(x) = V (x
h
(i + M[i)) V
(x
h
(i + M[i))
dado que x , se tiene que
V (x
h
(i + M[i))
M
V (x)
M
por lo tanto, considerando que V
(x) 0, se verica que

V
M
(x) V
(x)
M
En consecuencia considerando un M tal que

M
, se satisface la condicion.
Por lo tanto, de aqu se deduce que para todo M tal que
M M() =
log () log ()
log (1/)
la diferencia V
M
(x) V
(x) .
A continuacion se presenta un corolario que establece que considerando como coste
terminal V
M
(x), el MPC es asint oticamente estable para cualquier valor del n umero de
muestras consideradas en el coste terminal M. Esto generaliza el resultado de (Magni,
De Nicolao, Magnani & Scattolini 2001), pues la estabilidad se conserva para cualquier
valor de M considerado, independientemente del estado en el que se encuentre el sis-
tema. Ademas puede aproximar el coste innito con la precision que se desee, sin
condicionar el valor de M tomado, la estabilidad del controlador.
Corolario 3.10 Sea V (x) y tales que satisfacen la hipotesis 3.5. Sea un controlador
MPC de horizonte de control N
c
p
tal que la region terminal
es y el coste terminal
V
M
(x) =
j=M1
j=0
L
h
(x
h
(i + j[i)) +V (x
h
(i +M[i)) (3.7)
siendo x
h
(i + j[i) la prediccion del sistema controlado por la ley de control local u =
h(x) considerando x(i[i) = x. Entonces el controlador predictivo anterior estabiliza
asintoticamente el sistema para todo M 1 y el dominio de atraccion X
Nc,Np
es el
conjunto de estados para los que el problema es factible.
La demostracion es consecuencia inmediata del teorema 3.6, dado que por el lema
3.7 la region terminal V
M
(x) y satisfacen la hipotesis 3.5.
Este controlador propuesto permite observar el efecto del aumento del horizonte de
prediccion desde una nueva perspectiva.
El controlador MPC con horizonte de control N
c
p
=
N
c
+ M formulado con region terminal y coste terminal V (x), puede considerarse
como un controlador MPC general con horizonte N
c
tal que la funcion de coste terminal
es V
M
(x) y la region terminal S
h
M
(X, ).
El caracter no lineal del modelo hace que en general sea imposible calcular con
exactitud dicho conjunto. Por tanto, la ventaja de la formulacion con un mayor hori-
zonte de prediccion N
p
es basicamente que evita el calculo del conjunto S
h
M
(X, ). As,
permite considerar una mayor region terminal (y en consecuencia, un mayor dominio
de atraccion) sin necesidad de calcular dicho invariante.
El controlador propuesto se aplica al control del reactor sintonizado con el mismo
coste de etapa y el invariante positivo y la funcion de Lyapunov utilizadas como region
y coste terminal en la seccion 3.3.2.
Para comprobar las propiedades demostradas de la funcion de coste terminal V
M
(x)
se ha calculado, para un estado contenido en , el valor de V
M
(x) frente a M. El re-
sultado obtenido se muestra en la gura 3.8(a). Se puede comprobar el caracter estric-
tamente decreciente de V
M
(x) al aumentar M, evolucionando hacia V
(x) tomando
valores siempre superiores. Notese como, considerando un M sucientemente largo, el
coste V
M
(x) aproxima arbitrariamente bien el coste innito V
(x).
58 3.6. El MPC como controlador optimo cuasi-innito
Otra propiedad interesante es que V (x) V
M
(x) para todo x y para todo
M 1. Para ilustrar esto, en la gura 3.8 (b) se muestra la evolucion del coste V
M
(x
k
)
con M = 10, junto con el de V (x
k
) a lo largo de la evolucion del sistema regulado con el
controlador local. En esta gura se observa como la evoluci on de ambas funciones son
estrictamente decrecientes, por ser ambas funciones de Lyapunov del sistema y ademas
V (x
k
) V
M
(x
k
) y su diferencia se reduce a medida que se acerca el sistema al punto
de equilibrio.
0 5 10 15 20 25 30 35 40 45 50
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
M
lo
g
1
0

V
M
(
x
)
0 10 20 30 40 50 60 70 80 90 100
6
5
4
3
2
1
0
1
muestras
log
10
V
10
(x
k
)
log
10
V(x
k
)
(a) (b)
Figura 3.8: (a) Variacion de V
M
(x) frente a M, (b) Evolucion de V
10
(x
k
) y V (x
k
).
A continuaci on se muestra la evoluci on del sistema controlado con el controlador
MPC propuesto considerando N
c
= 5, N
p
= 5 y M = 10. En la gura 3.9 se puede
observar el plano de fases del sistema en bucle cerrado. En la gura 3.10 se muestra
la evolucion de las se nales del sistema partiendo de un estado inicial x
1
= 0,1 y
x
2
= 0,38.
3.6. El MPC como controlador optimo cuasi-innito
El MPC es una formulaci on implementable de los controladores optimos con hori-
zonte innito. Estos controladores tratan de optimizar el coste del comportamiento del
sistema a lo largo de toda su evoluci on. Esto conere propiedades muy interesantes a
estos controladores como optimalidad, robustez y ademas la posibilidad de conducir
hacia el origen al sistema partiendo de cualquier estado asint oticamente estabilizable.
La trayectoria del sistema as controlado es aquella que minimiza el coste de su evolu-
cion, no existiendo otra con menor coste. Por ello, es la trayectoria que optimiza el
desempe no impuesto sobre el sistema mediante el coste de etapa.
El horizonte nito y jo con el que se resuelve el MPC hace que la trayectoria
que sigue el sistema pueda diferir de la obtenida por el controlador con horizonte
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
Figura 3.9: Retrato de estados del sistema con M = 10.
0 5 10 15 20 25 30 35 40 45 50
0.1
0.05
0
0.05
x
1
0 5 10 15 20 25 30 35 40 45 50
0
0.2
0.4
x
2
0 5 10 15 20 25 30 35 40 45 50
1
0.5
0
u
muestras
Figura 3.10: Evolucion de las se nales del sistema en bucle cerrado.
innito. Por consiguiente la trayectoria no es optima y por lo tanto presenta un peor
comportamiento.
En esta seccion se analiza la relacion que existe entre ambas soluciones desde un
punto de vista de la optimalidad. Ademas se analiza como inuyen los distintos ele-
mentos del controlador sobre esta, demostrandose que las formulaciones presentadas
anteriormente proveen de un mejor comportamiento al sistema en bucle cerrado. Este
analisis se realiza para la formulaci on con N
p
N
c
por ser esta mas general, pues los
resultados son extrapolables al caso de N
c
= N
p
.
En lo que sigue se denota J
(x) al coste optimo con horizonte innito. Se denomina

J
N
c
,
(x) al coste optimo del MPC con horizonte de control N
c
y horizonte de prediccion
innito. Por ultimo, J
MPC
(x) representa el coste asociado a la evolucion del sistema

controlado por el MPC, partiendo del estado x.
3.6.1. El MPC general como controlador con horizonte cuasi-
innito
En (Chen & Allgower 1998b) se presenta una formulacion denominada MPC con
horizonte cuasi-innito.

Esta se basa en la incorporacion en el funcional de una funcion
de coste terminal que es una cota superior del coste optimo del estado terminal. En este
apartado se comprueba que esta propiedad tambien la satisface la formulaci on general
del MPC. Para ello, en el siguiente lema se muestra una propiedad interesante de la
funcion de coste.
Lema 3.11 Sea V (x) una funcion de Lyapunov de control tal que satisface la hipotesis
3.5, entonces se tiene que V (x) J
(x) para todo x .

Demostracion:
Sea u = h(x) la ley de control local asociada a V (x). Entonces del teorema 3.9 se tiene
que para todo x
V (x) V
(x)
por otro lado, de la optimalidad del control con horizonte innito se deduce que
V
(x) J
(x), y por lo tanto

V (x) J
(x)
lo que demuestra el lema.
De esta propiedad se puede inferir el siguiente resultado:
Propiedad 3.12 Del lema anterior se deduce que para todo x
k
X
Nc,Np
J
Nc,Np
(x
k
) J
(x
k
)
Por tanto la hipotesis 3.5 garantiza que el coste a optimizar es una cota superior del
coste innito, de forma que la convergencia del coste del MPC garantiza en cierta forma
la convergencia del coste innito.
3.6.2. Inuencia de los horizontes en el coste optimo del MPC
A continuacion se analiza como inuye un incremento en los horizontes de control
y de prediccion sobre el coste optimo del MPC.
Teorema 3.13 Sea un sistema y un controlador MPC tal que satisfacen las hipotesis
del teorema 3.6, entonces se tiene que para todo x
k
X
Nc,Np
J
Nc,Np
(x
k
) J
Nc+1,Np
(x
k
)
Demostracion:
Sea u
F
(k) la solucion optima del MPC en el estado x
k
con horizontes N
c
y N
p
, con un
coste asociado J
N
c
,N
p
(x
k
). Entonces la secuencia u
F
(k) dada por
u(k + j[k) =
_
_
_
u
(k +j[k) j = 0, , N
c
1
h(x
(k + N
c
[k)) j = N
c
es factible en el mismo estado x
k
, para unos horizontes N
c
+ 1 y N
p
. Esto se deriva
del hecho que x(k + j[k) = x
(k + j[k) para todo j = 0, , N

p
. Ademas, dado que
x
(k + N
c
[k) S
h
NpNc
(X, ) la actuacion, h(x
(k + N
c
[k)) es admisible.
Sea el

J
N
c
+1,N
p
(x
k
) el coste asociado a la actuacion factible. Entonces se tiene que
J
Nc,Np
(x
k
) =

J
Nc+1,Np
(x
k
)
y del principio de optimalidad se deduce que
J
N
c
+1,N
p
(x
k
)

J
Nc+1,Np
(x
k
) = J
N
c
,N
p
(x
k
)
En consecuencia, cuanto mayor es el horizonte de control, menor sera el coste opti-
mo. Por tanto al aumentar el horizonte de control se gana en optimalidad de la solucion
pero a costa de aumentar el coste computacional en la resolucion del problema. Analogo
resultado se obtiene a continuaci on al aumentar el horizonte de prediccion.
Teorema 3.14 Sea un sistema y un controlador MPC tal que satisfacen las hipotesis
del teorema 3.6, entonces se tiene que
J
N
c
,N
p
(x
k
) J
N
c
,N
p
+1
(x
k
)
Demostracion:
Sea u
F
(k) la solucion optima del MPC con coste J
N
c
,Np
(x
k
, u
F
), entonces, dado que la
ley de control local u = h(x) es estabilizante, u
F
(k) = u
F
(k) es una solucion factible
del problema de optimizacion con horizonte N
p
+1. Por lo tanto x(k+j[k) = x
(k+j[k)
para todo j = 1, , N
p
. Ademas se tiene que
x(k +N
p
+ 1[k) = f(x
(k + N
p
[k), h(x
(k +N
p
[k)))
J
N
c
,Np+1
(x
k
) J
N
c
,N
p
(x
k
) = L
h
(x
(k + N
p
[k)) + V ( x(k + N
p
+ 1[k))
V (x
(k + N
p
[k)) 0
dado que x
(k +N
p
[k) . Del principio de optimalidad se deduce que
J
N
c
,N
p
+1
(x
k
)

J
Nc,Np+1
(x
k
) J
N
c
,N
p
(x
k
)
Notese que el controlador propuesto verica que un aumento del horizonte de predic-
cion reduce el coste optimo y por lo tanto se aproxima mas a la optimalidad, mejorando
el comportamiento del sistema en bucle cerrado. Esta mejora se consigue sin un incre-
mento apreciable del coste computacional.
3.6.3. El MPC como aproximacion al controlador con hori-
zonte innito
A continuaci on se analizan propiedades de los nuevos controladores MPC propues-
tos en relacion a su aproximaci on al controlador con horizonte innito, es decir, a
la optimalidad de la solucion. As, cuanto mayor sea la optimalidad de la solucion
obtenida, mejor sera el comportamiento del sistema en bucle cerrado. Este analisis es
una de las contribuciones de esta tesis.
Corolario 3.15 Sea V (x) y tales que satisfacen la hipotesis 3.5. Sea u
F
(k) una
secuencia factible del MPC en el estado x
k
con horizonte de prediccion N
p
y de control
N
c
. Sea J
M
N
c
,N
p
(x
k
, u
F
(k)) el coste de dicha secuencia considerando como coste terminal
V
M
() y sea J
N
c
,N
p
(x
k
, u
F
(k)) el coste considerando como coste terminal V (). Entonces
J
N
c
,N
p
(x
k
, u
F
(k)) J
M
N
c
,N
p
(x
k
, u
F
(k))
Es decir, que considerar como coste terminal V
M
() en el MPC reduce el coste
optimo y por tanto se acerca mas a la evoluci on optima. Este corolario se deduce de la
propiedad
V (x) V
M
(x)
para todo M 1 y para todo x , demostrada en el teorema 3.9.
Corolario 3.16 Bajo las hipotesis del teorema 3.6, para cualquier secuencia factible
u
F
(k), la funcion de coste con horizonte de prediccion N
p
es una cota superior del coste
con horizonte de prediccion innito
J
Nc,Np
(x
k
, u
F
(k)) J
Nc,
(x
k
, u
F
(k))
Esto es consecuencia inmediata del corolario anterior, de la propiedad V
M
(x) V
(x)
demostrada en el teorema 3.9.
Corolario 3.17 De las propiedades anteriores se deduce que, para toda secuencia
factible u
F
(k)
J
N
c
,N
p
(x
k
, u
F
(k)) J
M
N
c
,N
p
(x
k
, u
F
(k)) J
N
c
,
(x
k
, u
F
(k))
y ademas la diferencia J
M
N
c
,N
p
(x
k
, u
F
) J
N
c
,
(x
k
, u
F
) se puede reducir arbitrariamente
tomando un valor de M sucientemente grande.
Esto se deduce de que
J
M
Nc,Np
(x
k
, u
F
) J
Nc,
(x
k
, u
F
) = V
M
(x(k +N
p
[k)) V
(x(k + N
p
[k))
y de que esta diferencia se puede hacer tan peque na como se desee tomando un valor
de M sucientemente grande.
A continuaci on se va a analizar la relacion del coste optimo del MPC obtenido en x
k
con el coste en que incurre la evolucion del sistema controlado por el MPC a partir de
ese estado, lo cual forma parte del trabajo original realizado en la tesis. As, se denota
J
MPC
(x
k
) al coste innito asociado al sistema controlado por el MPC, es decir,
J
MPC
(x
k
) =
j=
j=0
L(x
k+j
, K
MPC
(x
k+j
))
Teorema 3.18 Sea un sistema tal que satisface la hipotesis 3.5. Sea un controlador
MPC tal que la region terminal es y el coste terminal V (x), la funcion de Lyapunov
asociada. Entonces se verica que
J
Nc,Np
(x
k
) J
MPC
(x
k
)
y ademas, la diferencia entre ambas es monotonamente decreciente con el tiempo
J
Nc,Np
(x
k
) J
MPC
(x
k
) J
Nc,Np
(x
k+1
) J
MPC
(x
k+1
)
Demostracion:
Por las hipotesis se tiene que el sistema controlado por el MPC es asint oticamente
estable y ademas el coste optimo satisface
J
N
c
,N
p
(x
k+j
) J
N
c
,N
p
(x
k+j+1
) L(x
k+j
, K
MPC
(x
k+j
))
por tanto
j=
j=0
_
J
N
c
,N
p
(x
k+j
) J
N
c
,N
p
(x
k+j+1
)
_
j=
j=0
L(x
k+j
, K
MPC
(x
k+j
)) = J
MPC
(x
k
)
dado que el sistema controlado por el MPC es asint oticamente estable, el termino de
la izquierda se reduce a J
N
c
,N
p
(x
k
), lo que demuestra la primera armacion del teorema.
La monotona se deduce de
J
Nc,Np
(x
k
) J
Nc,Np
(x
k+1
) L(x
k
, K
MPC
(x
k
))
= J
MPC
(x
k
) J
MPC
(x
k+1
)
de donde se tiene que
J
N
c
,N
p
(x
k
) J
MPC
(x
k
) J
N
c
,N
p
(x
k+1
) J
MPC
(x
k+1
)
y por recurrencia se demuestra la propiedad.
Nota 3.19 De todo lo expuesto hasta ahora se puede obtener el siguiente balance:
J
Nc
(x) J
Nc,Np
(x) J
M
Nc,Np
(x) J
MPC
(x) J
(x)
siendo J
MPC
(x) el coste de la evolucion del sistema controlado por la ley de control

obtenida con N
c
, N
p
y M.
Este es quiza el resultado mas importante de todo este analisis: las nuevas formu-
laciones propuestas consistentes en el aumento del horizonte de prediccion, as como
la consideracion como coste terminal V
M
() producen una reduccion del coste optimo
del MPC y por lo tanto un comportamiento del sistema mas optimo y un mejor com-
portamiento del sistema en bucle cerrado. Ademas el coste computacional en el que se
incurre por la incorporacion de estas medidas no es grande y, dado que la estabilidad
esta garantizada para todo N
p
N
c
y M 0, estos elementos se pueden a nadir en
funcion del tiempo de calculo disponible sin peligrar la estabilidad.
Para ilustrar las propiedades de optimalidad del MPC se va a analizar como inuyen
los distintos parametros sobre el sistema partiendo del estado inicial C
A
= 0,2 mol/l y
T = 340 K que equivale a x
1
= 0,3 y x
2
= 0,5.
En la gura 3.11 se muestra la variacion del coste optimo del MPC en un estado
determinado al variar el horizonte de control (considerando N
p
= N
c
). Como se puede
observar, el coste optimo disminuye al aumentar el horizonte de control tal y como se
demostro.
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
20
25
30
35
40
45
N
c
J
* N
c
Figura 3.11: Variacion del coste optimo con N
c
.
En la gura 3.12 se puede observar la variaci on del coste optimo del MPC con un
horizonte de control jo N
c
= 5, para una serie de valores del horizonte de prediccion.
Tal y como se demostro, el coste optimo disminuye monotonamente al aumentar N
p
.
En el analisis realizado anteriormente se ha demostrado que al aumentar el horizonte
de control, o el de prediccion o bien tomando como coste terminal el cuasi-innito, el
5 10 15 20 25 30 35 40 45 50
20
25
30
35
40
45
N
p
J
* 5
,
N
p
Figura 3.12: Variacion del coste optimo con N
p
.
coste del MPC se reduce tendiendo a la optimalidad. En consecuencia, la evoluci on
del sistema en cada una de estas situaciones debe tender a la trayectoria optima del
sistema. Esto se ilustra en la gura 3.13, en la que se muestran las trayectorias del
sistema controlado con un horizonte de control N
c
= 4 y N
p
= 4, otra con un horizonte
de control N
c
= 4 y un horizonte de prediccion N
p
= 10, otra igual a la anterior pero
considerando como coste terminal V
10
(x) y por ultimo la evolucion optima.
0.4 0.3 0.2 0.1 0 0.1 0.2
0.5
0.4
0.3
0.2
0.1
0
0.1
0.2
0.3
x
1
x
2
N
c
=4
N
c
=4, N
p
=10
N
c
=4, N
p
=10, M=10
N
c
=
Figura 3.13: Tendencia a la optimalidad al variar N
c
, N
p
y M.
Ademas se han calculado los costes optimos en el estado inicial, obteniendose los
siguientes resultados
J
4
(x
0
) 33.5711
J
4,10
(x
0
) 29.4109
J
10
4,10
(x
0
) 25.7196
J
MPC
(x
0
) 23.6733
J
(x
0
) 23.5891
siendo J
MPC
(x
0
) el coste de la evolucion del MPC con N
c
= 4, N
p
= 10 y M = 10.
En esta tabla se puede comprobar como un aumento del horizonte de prediccion y/o
del n umero de terminos del coste terminal cuasi-innito, hacen que el coste optimo
disminuya, aproximandose el controlador al optimo. Tambien el aumento del horizonte
de control aproxima el controlador, pero al contrario que las medidas anteriores, esta
supone una mayor carga computacional.
3.7. Calculo de la region terminal
El elemento esencial en la sintonizaci on de un controlador MPC con estabilidad
garantizada para un sistema es, sin duda, el calculo de la region terminal y una funcion
de Lyapunov asociada tales que satisfagan la hipotesis 3.5. En la literatura se han
propuesto metodos para su calculo en el caso de sistemas continuos (Michalska &
Mayne 1993, Chen & Allgower 1998b) y discretos (Parisini & Zoppoli 1995, Magni, De
Nicolao, Magnani & Scattolini 2001) garantizando la existencia de ambos. Sin embargo,
la necesidad de calcular y V (x) se presenta habitualmente como una desventaja del
MPC, por la complejidad que ello entra na. Teniendo en cuenta que con ello se obtiene
estabilidad de un sistema no lineal sujeto a restricciones, el calculo de esta region es
insignicante comparado con las ventajas que ofrece el controlador MPC. Ademas,
dado que el invariante es una vecindad de un punto de equilibrio, permite el uso de
tecnicas locales. Por ultimo, hay que resaltar, que el calculo se hace fuera de lnea, por
lo que no supone un mayor coste computacional del controlador.
Con el n de mostrar que el calculo de la region y coste terminal es una tarea
abordable, aunque costosa, se presenta aqu un procedimiento de calculo para el caso
de coste de etapa cuadratico
L(x, u) = |x|
2
Q
+|u|
2
R
siendo la matriz Q semidenida positiva y R denida positiva. En este procedimiento,
similar al presentado en (Magni, De Nicolao, Magnani & Scattolini 2001), se supone
que el modelo del sistema
x
k+1
= f(x
k
, u
k
)
68 3.7. Calculo de la region terminal
es una funcion (
2
y ademas que el sistema linealizado en el origen es estabilizable.
Para la determinacion del coste terminal y de la region terminal deben seguirse los
siguientes pasos:
1. Sea el sistema linealizado en el origen x
k+1
= Ax
k
+ Bu
k
siendo
A =
f(x, u)
x
(0,0)
y B =
f(x, u)
u
(0,0)
Calcular un controlador u
k
= Kx
k
por cualquier procedimiento habitual (LQR,
PID, asignacion de polos, etc.), tal que estabilice asintoticamente el sistema lin-
ealizado.
2. Sea A
K
= A + BK y sea Q
= Q + K
T
RK. Tomese una matriz

Q ~ Q
(por
ejemplo

Q = Q
para cierto > 1) y calc ulese la matriz P tal que

A
T
K
PA
K
P =
Q
3. Sea V (x) = x
T
Px. Calcular la constante > 0 tal que para todo
x
= x IR
n
: V (x)
se satisfaga
X
K
= x X : u = Kx U
V (f(x, Kx)) V (x) x
T
Q
x
4. Si se desea calcular el invariante positivo en el cual el sistema es asint oticamente
estable pero en el que no se verica la hipotesis 3.5, tomese una constante
[0,
min
(Q
)] arbitrariamente peque na. Calcular la constante > 0 tal que para

todo x
= x IR
n
: V (x) se satisface
X
K
V (f(x, Kx)) V (x) x
T
x
El calculo del paso 3 se puede realizar resolviendo el problema de optimizacion no
lineal
= mn
x
V (x)
s.a
V (f(x, Kx)) V (x) > x
T
Q
x
Para todo x
= x IR
n
: V (x) , se satisface la condicion V (f(x, Kx))
V (x) x
T
Q
x.
Este problema tiene solucion factible ya que, deniendo
(x) = f(x, Kx) A
K
x
la condicion V (f(x, Kx)) V (x) x
T
Q
x se puede reescribir como

((x) + A
K
x)
T
P((x) + A
K
x) x
T
Px =
(x)
T
P(x) + 2(x)
T
PA
K
x +x
T
(A
T
K
PA
K
)x x
T
Px x
T
Q
x
Teniendo en cuenta que A
T
K
PA
K
P =
Q se tiene que
(x)
T
P(x) + 2(x)
T
PA
K
x x
T
(

QQ
)x
Dado que el modelo es dos veces continuamente diferenciable, existe una constante
L
r
= max
0<x
P
r
|(x)|
P
|x|
P
siendo |x|
P
=
x
T
Px. Esta constante satisface que L
r
0 cuando r 0.
A continuaci on se va a demostrar las siguientes propiedades
(i) (x)
T
P(x) L
2
r
|x|
2
P
.
Es consecuencia inmediata de la denicion de la constante L
r
.
(ii) 2(x)
T
PA
K
x 2L
r
|A|
P
|x|
P
.
Para ello basta comprobar que,
2(x)
T
PA
K
x = 2
_
(x)
T
P
1/2
_
_
P
1/2
A
K
x
_
2|P
1/2
(x)||P
1/2
A
K
x|
2|(x)|
P
|A
K
x|
P
2L
r
|x|
P
|A
K
|
P
|x|
P
= 2L
r
|A
K
|
P
|x|
2
P
(iii) x
T
(

QQ
)x |x|
2
P
, siendo =
min
(P
1/2
(

QQ
)P
1/2
).
En efecto,
x
T
(

QQ
)x = x
T
P
1/2
P
1/2
(

QQ
)P
1/2
P
1/2
x
x
T
P
1/2
min
(P
1/2
(

QQ
)P
1/2
)P
1/2
x
=
min
(P
1/2
(

QQ
)P
1/2
)|x|
2
P
70 3.7. Calculo de la region terminal
Entonces, de estas tres propiedades se tiene que
(x)
T
P(x) + 2(x)
T
PA
K
x x
T
(

QQ
)x (L
2
r
+ 2L
r
|A
K
|
P
)|x|
2
P
Dado que L
r
0 cuando r 0, existira un r sucientemente peque no tal que
L
2
r
+ 2L
r
|A
K
|
P

y por lo tanto, para todo x tal que V (x) = |x|
2
P
r
2
se satisface la condicion. En
consecuencia, siempre existe una vecindad del origen en la que se cumple la hipotesis
3.5.
Habitualmente las restricciones en las actuaciones y en el estado son politopicas, con
lo que el conjunto X
K
tambien es un politopo. Dado que el invariante es un elipsoide,
es posible calcular el maximo elipsoide contenido en X
K
. Sea el conjunto X
K
formado
por n
r
restricciones lineales a
T
i
x b
i
. Entonces
esta contenido en X
K
siendo
= mn
i
_
b
2
i
a
T
i
P
1
a
i
_
Por tanto, la region
= x IR
n
: x
T
Px = mn(, ) es un invariante
positivo admisible del sistema.
En caso de que los conjuntos de restricciones no sean politopicos, entonces habra que
calcular el maximo elipsoide que satisface las restricciones, que se obtiene resolviendo
uno o varios problemas de optimizacion analogos al propuesto (siempre que X
K
sea
convexo). Por tanto se deben resolver una serie de problemas de optimizacion y se
tomara como el menor de los argumentos obtenidos.
Para ilustrar el calculo de la region terminal, se va aplicar el procedimiento presen-
tado al ejemplo del reactor. En este caso se obtiene el controlador local linealizando el
sistema en torno al origen obteniendose
A =
_
_
0,9385 0,0443
0,1624 1,1365
_
_
B =
_
_
0,0013
0,0668
_
_
y calculando el controlador lineal mediante la tecnica del LQR con los mismos factores
de ponderacion que los utilizados en la seccion 3.3.2, se obtiene
K =
_
1,6154 3,6644
_
Para esta ley de control se calcula la matriz P
que resuelve la ecuacion de Lyapunov

A
T
K
P
A
K
P
= Q
siendo
A
K
= A +BK =
_
_
0,9406 0,0396
0,0545 0,8918
_
_
la matriz del sistema en bucle cerrado linealizado, y la matriz Q
= Q +K
T
QK =
_
_
12,6095 5,9195
5,9195 14,4279
_
_
y el parametro > 1.
Para calcular el conjunto invariante hay que calcular el maximo
tal que se veri-

que la condicion
f(x, Kx)
T
P
f(x, Kx) x
T
P
x x
T
Q
x
En el caso de = 2, se obtiene la solucion utilizada en los ejemplos realizados a lo
largo de este captulo:
2
= 9,3353 y
P
2
=
_
_
265,8811 49,3961
49,3961 125,9963
_
_
Analizando la ecuacion de Lyapunov del sistema linealizado se observa que
P
= P
1
relacion que al sustituirse en la condicion de Lyapunov se tiene que
f(x, Kx)
T
P
1
f(x.Kx) x
T
P
1
x
1
x
T
Q
x
por lo que al aumentar disminuye la tasa de decrecimiento de la funcion de Lyapunov,
es decir, se relaja la condicion, lo que conduce a regiones invariantes mayores. Este
hecho se ilustra en la gura 3.14, en la que se muestra el conjunto factible X
K
, que es
un politopo, y las regiones para distintos valores de : 1,1, 1,25 y 1,5. Como se puede
observar, la region crece hasta alcanzar el maximo que esta limitado por su pertenencia
al conjunto X
K
.
En la gura 3.15 se muestra el valor de (referido a P
1
) para distintos valores de ,
en la que se puede observar que el tama no del invariante crece hasta llegar a su lmite.
72 3.8. Analisis de estabilidad del MPC suboptimo
1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1
1.5
1
0.5
0
0.5
1
x
1
x
2
Figura 3.14: Invariantes positivos del sistema para = 1,1, 1,25 y 1,5.
1.1 1.15 1.2 1.25 1.3 1.35 1.4 1.45 1.5 1.55 1.6
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
Figura 3.15: Evolucion de en funcion de .

3.8. Analisis de estabilidad del MPC suboptimo
El controlador MPC se basa en la solucion global de un problema de optimizacion
que es no lineal. Existen algoritmos ecientes como el denominado Sequential Quadratic
Programming (SQP) que solucionan estos problemas en un tiempo computacionalmente
aceptable para la implementaci on en sistemas no muy rapidos (Luenberger 1989, Biegler
1998). Pero el caracter no lineal del problema conlleva normalmente la no convexidad
del mismo, por lo que podra presentar mnimos locales que el algoritmo puede dar como
solucion al problema. El calculo de la solucion global es posible, pero el incremento de
tiempo de calculo que esto conlleva puede ser excesivo y, en consecuencia, dejar de ser
implementable (ya que el tiempo de calculo esta limitado por el periodo de muestreo,
y en consecuencia, por la dinamica de la planta a controlar).
Por tanto, para que un controlador MPC sea implementable debe ser capaz de
conservar la estabilidad asint otica en bucle cerrado del sistema en el caso de soluciones
suboptimas del problema de optimizacion.
Como se puede observar en los teoremas de estabilidad del MPC, esta surge de la
posibilidad de calcular una solucion factible u
F
(k) a partir de la solucion factible (la
optima, por ejemplo) obtenida en el instante anterior u
F
(k 1) que ademas incurre en
un menor coste. Por tanto, la convergencia esta garantizada tomando como solucion
en cada instante la factible u
F
(k), si no se calcula una mejor. Esto es teoricamente
posible, dada la ausencia de errores entre la prediccion y el comportamiento real de la
planta, y puede conducir a un control en bucle abierto de la planta. En consecuencia, la
optimalidad de la solucion se puede relajar dando lugar al denominado MPC suboptimo.
Como se mostrara en el captulo 5, esta propiedad toma un mayor sentido cuando el
sistema presenta incertidumbres, pues estas pueden hacer que la solucion factible tenga
un coste superior al anterior.
A continuaci on se demuestra la estabilidad del MPC suboptimo. Esta formulacion
fue propuesta inicialmente en (Scokaert et al. 1999) para unas formulaciones del MPC
y extendida a la formulaci on general en (Mayne et al. 2000). La demostracion presen-
tada aqu se basa en la teora de conjuntos invariantes y en la convergencia del coste
suboptimo.
Para esta demostracion se ha considerado la formulacion general del MPC, si bi-
en es extensible a las otras formulaciones presentadas. A lo largo de esta seccion, el
superndice s denota suboptimo, en oposicion al asterisco que denota optimo.
Teorema 3.20 (Estabilidad asintotica del MPC Suboptimo)
Sea un sistema x
k+1
= f(x
k
, u
k
x
k
X y u
k
U.
region terminal tales que satisfacen la hipotesis 3.5.
Sea u
s
F
(x
k
) una solucion suboptima del MPC tal que
J
s
N
(x
k
) J
s
N
(x
k1
) L(x
k1
, u
s
k1
)
siendo un parametro libre tal que 0 < 1.
Entonces el controlador predictivo K
s
MPC
(x
k
) = u
s
(k[k) estabiliza asintoticamente
el sistema y el dominio de atraccion X
N
es el conjunto de estados para los que el
problema es factible.
Demostracion:
Factibilidad:
Analogamente a la demostracion del teorema 3.6, conocida una solucion factible en
k, u
s
F
(k), se puede obtener una secuencia de actuaciones u
F
(k + 1) dada por
u(k + j[k + 1) =
_
_
_
u
s
(k + j[k) j = 1, , N 1
h(x(k + N
c
[k + 1)) j = N
que es una solucion factible en k + 1. Esto es consecuencia de que x(k + j[k + 1) =
x
s
(k + j[k) para todo j = 1, , N 1 y de la hipotesis 3.5.
Por tanto X
N
es un invariante positivo del sistema. As, si el conjunto X
N
es aco-
tado, entonces el sistema en bucle cerrado es estable.
Convergencia:
Analogamente al teorema 3.6 se puede comprobar que la secuencia u
F
(k +1) tiene
un coste asociado tal que
J
N
(x
k+1
) J
s
N
(x
k
) L(x
k
, u
s
(k[k))
Por lo tanto existe una secuencia de actuaciones que satisface la condicion
J
s
N
(x
k
) J
s
N
(x
k1
) L(x
k1
, u
s
k1
)
Ademas, se tiene que la secuencia de n umeros positivos J
s
N
(x
k
) es estrictamente decre-
ciente para todo x
k
,= 0. Entonces, cuando k , J
s
N
(x
k
) J
s
N
(x
k+1
) 0. Por lo
tanto L(x
k
, u
s
k
) 0 por lo que, dado que L(x, u) l|x|
, se tiene que x
k
0 y el
sistema es asintoticamente estable.
Con esta demostracion se demuestra que el controlador esta denido a lo largo
de la evoluci on del sistema, satisface las restricciones y ademas converge al origen.
Sin embargo, para demostrar con rigor la estabilidad asint otica hay que probar que
el origen es un punto de equilibrio estable. Notese que la funcion de coste suboptimo
no puede considerarse como una funcion de Lyapunov estricta y ademas no tiene por
que ser continua.
Para ello en (Scokaert et al. 1999) se propone imponer una restriccion adicional sobre
el sistema.

Esta garantiza que en una vecindad del origen, la secuencia suboptima de
actuaciones decrezca en norma con el estado, es decir que existe una funcion / , (),
tal que
|u
s
F
(k)| (|x
k
|)
Esta condicion no es muy restrictiva, pero dado que no se puede demostrar, hay que
imponerla como restriccion.
Esta restriccion se puede evitar imponiendo unas condiciones mas suaves que las
anteriores. En efecto, para garantizar la estabilidad del origen es suciente encontrar
una funcion / que acote superiormente el coste suboptimo en una vecindad del mismo.
Esto se puede garantizar si para todo x
k
, se satisface que J
s
N
(x
k
) V (x
k
). Esta
condicion es muy suave, y se debe satisfacer en la mayora de los casos, siempre que el
grado de suboptimalidad no sea alto.
Si para x
k
esta condicion no se satisface, esta se puede imponer simplemente
tomando como secuencia suboptima, la derivada de aplicar la ley de control local, pues
en este caso, J
s
N
(x
k
) = V
N
(x
k
) V (x
k
).
As, para todo x
0
tal que |x
0
| =
1
(l
), siendo () la funcion / tal que

V (x) (|x|) y tal que esta bola esta contenida en , se tiene que
l|x
k
|
J
s
N
(x
k
) < J
s
N
(x
0
) V (x
0
) (|x
0
|) l
y por lo tanto |x
k
| , lo que demuestra la estabilidad.
Un procedimiento mas sencillo para garantizar la estabilidad consiste en partir de
la solucion optima en el estado inicial. As, dado que J
N
(x) V (x) para todo x ,
se satisface la condicion anterior.
En (Scokaert et al. 1999) los autores resaltan que la suboptimalidad no es deseable
en un controlador pues, aunque hace el controlador mas facilmente implementable,
tiene asociado una perdida de optimalidad y por lo tanto un peor comportamiento. La
suboptimalidad es, por tanto, una deciencia en el control optimo y no un objetivo
en s.

Esta puede estar motivada por diversas razones: un algoritmo de optimizacion
deciente, insuciente tiempo de calculo o bien discrepancias entre los estados predichos
y reales. Bajo estas circunstancias, la condicion de convergencia impuesta garantiza
la estabilidad asintotica del sistema en bucle cerrado. El parametro [0, 1] es un
factor de convergencia mnimo del sistema en bucle cerrado, que permite establecer un
compromiso entre suboptimalidad y comportamiento.
Para ilustrar el efecto de la suboptimalidad de la solucion del problema de op-
timizacion, se ha aplicado esta estrategia al reactor con los mismos parametros de
ejemplos anteriores, con un horizonte de prediccion igual al de control N
c
= 5 y par-
tiendo de un estado inicial x
1
= 0,3 y x
2
= 0,5. Para poder mostrar el efecto de
la suboptimalidad, la resolucion del problema de optimizacion no se ha iniciado con la
solucion inicial factible y se ha reducido el n umero de iteraciones hasta lograr la condi-
cion de convergencia con un valor del parametro = 0,1. La trayectoria resultante se
puede observar en la gura 3.16 junto con la obtenida por el controlador optimo.
En la gura 3.17 se puede ver la evoluci on de los estados y la actuacion a lo largo
del tiempo.
0.4 0.3 0.2 0.1 0 0.1
0.6
0.5
0.4
0.3
0.2
0.1
0
0.1
x
1
x
2
trayectoria ptima
trayectoria subptima
Figura 3.16: Trayectorias optima y suboptima del sistema en bucle cerrado.
Como se puede observar, la trayectoria obtenida diere en gran medida del com-
portamiento optimo, presentado un peor comportamiento en cuanto a desempe no se
reere. Observese ademas la evolucion de la actuacion sobre el sistema: aparecen cam-
bios bruscos en la entrada, perdiendose la suavidad que presenta en el caso optimo.
Este efecto no es deseable pues puede someter a los actuadores a cambios bruscos.
En la gura 3.18 se muestra la evolucion del coste suboptimo en escala logartmica.
Como se puede observar, esta evoluci on es monotonamente decreciente, lo que garantiza
la convergencia del sistema.
0 5 10 15 20 25 30 35 40 45 50
0.4
0.3
0.2
0.1
0
0.1
x
1
0 5 10 15 20 25 30 35 40 45 50
0.6
0.4
0.2
0
x
2
0 5 10 15 20 25 30 35 40 45 50
0.5
0.5
1.5
2.5
u
muestras
Figura 3.17: Evolucion de la se nales del sistema con MPC suboptimo.
0 5 10 15 20 25 30 35 40 45 50
2
1.5
1
0.5
0
0.5
1
1.5
2
l
o
g
1
0

J
*
muestras
Figura 3.18: Evolucion del logaritmo decimal del coste suboptimo.
3.9. Eliminacion de la restriccion terminal
En la literatura existen resultados de estabilidad en MPC formulado con coste
terminal pero sin restriccion terminal. En estos controladores la restriccion terminal
esta implcitamente considerada pues se establecen hipotesis bajo las cuales la solucion
del MPC sin restriccion terminal satisface dicha restriccion. En (Parisini & Zoppoli
1995) se establecen condiciones bajo las cuales un MPC con coste terminal cuadratico
estabiliza asintoticamente un sistema discreto con restricciones y en (Jadbabaie et al.
2001) se analiza la estabilidad del MPC para sistemas continuos sin restricciones. En
78 3.9. Eliminacion de la restriccion terminal
estos se demuestra que existe una vecindad del origen que contiene a la region terminal
en la cual el MPC sin restriccion terminal estabiliza asint oticamente el sistema. Ademas
se comprueba que, bajo ciertas condiciones, existe un horizonte de control tal que
el controlador predictivo sin restriccion terminal es capaz de estabilizar todo estado
asint oticamente estabilizable.
En esta seccion los resultados anteriores se trasladan a la formulacion general del
MPC con restricciones, estableciendose condiciones bajo las cuales se puede eliminar
del problema de optimizacion la restriccion terminal sin que el controlador pierda su
caracterstica estabilizante. Tambien se demuestra que todo estado asintoticamente
estabilizable se puede estabilizar con un MPC con un horizonte sucientemente largo.
De las demostraciones anteriores, se extrae un resultado muy interesante y que
dota de una originalidad mayor al analisis de esta seccion: la caracterizacion de una
region en la que el controlador MPC sin restriccion terminal estabiliza el sistema. Este
resultado permite ademas analizar como sintonizar el MPC para que la region en la
que se puede eliminar la restriccion terminal sea mayor. Estos resultados se muestran
en el captulo siguiente, dedicado al analisis del dominio de atraccion del MPC. Por
ultimo, tambien se demuestra la estabilidad del controlador sin restriccion terminal en
el caso suboptimo. Estos resultados son contribuciones originales de esta tesis.
La eliminacion de esta restriccion es especialmente interesante en sistemas sin res-
tricciones en el estado del sistema, pues hace que el problema de optimizacion tan solo
presente restricciones sobre las variables de decision, reduciendose considerablemente
la complejidad en la resolucion de dicho problema. As, dado que el tiempo de calculo
se reduce, se podra aplicar a sistemas mas rapidos.
Esta seccion comienza generalizando los resultados obtenidos en (Jadbabaie et al.
2001) de sistemas en tiempo continuo sin restricciones, a sistemas en tiempo discreto
con restricciones en las actuaciones y en el estado.
Teorema 3.21
Sea un sistema x
k+1
= f(x
k
, u
k
), tal que f(0, 0) = 0 y que esta sujeto a las restricciones
x
k
X y u
k
U.
region terminal dada por
= x IR
n
: V (x)
tales que satisfacen la hipotesis 3.1.
Entonces el MPC general sin restriccion terminal estabiliza asintoticamente el sistema
para todo estado inicial tal que x
0

, siendo
= x IR
n
: J
N
(x)
Demostracion:
Estabilidad:
Dado que el coste de etapa es denido positivo, se tiene que
V (x
(k + N[k)) J
N
(x
k
)
y por tanto, para todo x
k

, resulta que V (x
(k + N[k)) J
N
(x
k
) , lo que
implica que x
(k + N[k) , y se satisface la restriccion terminal.

A continuaci on se va a comprobar que x
k+1
tambien esta contenido en
.
Sea u
F
(k) la solucion optima del sistema en x
k
N
(x
k
) y sea
la secuencia u
F
(k + 1) dada por
u(k +j[k + 1) =
_
_
_
u
(k + j[k) j = 1, , N 1
h
V
( x(k + N[k + 1)) j = N
siendo h
V
() la actuacion optima de (3.4) para el coste terminal. Dado que x
k+1
= x
(k+
1[k), para esta secuencia el estado predicho satisface que x(k + j[k + 1) = x
(k + j[k)
para j = 1, , N. En consecuencia x(k + N[k + 1) = x
(k + N[k) y por lo tanto

esta denida h
V
() para ese estado.
Es inmediato comprobar que la ausencia de incertidumbres, la factibilidad de u
F
(k)
y la hipotesis 3.1 garantizan la factibilidad de u
F
(k +1) aplicada en x
k+1
. Entonces se
tiene que el coste de la secuencia optima verica que
J
N
(x
k+1
) J
N
(x
k
) = L(x
k
, u
(k[k)) + [V + L](x
(k + N[k), h
V
(x
(k + N[k)))
L(x
k
, u
(k[k))
dado que x(k +N[k +1) = x
(k +N[k) y que h
V
() satisface (3.4). Por tanto, del
principio de optimalidad se tiene que
J
N
(x
k+1
) J
N
(x
k
)

J
N
(x
k+1
) J
N
(x
k
) L(x
k
, u
(k[k)) l|x
k
|
Por tanto J
N
(x
k+1
) < J
N
(x
k
) lo que implica que x
k+1

. En consecuencia
este conjunto es un invariante positivo del sistema.
Convergencia:
Es consecuencia inmediata de lo anterior que J
N
(x) es una funcion de Lyapunov y que
el sistema es asintoticamente estable.
Lema 3.22 Sea V (x) y tales que satisfacen la hipotesis 3.1. Entonces J
N
(x) V (x)
para todo x .
Demostracion:
De la hipotesis 3.1 se tiene que para x , el sistema controlado por u = h
V
(x)
satisface
V (x(k + j[k)) V (x(k + j + 1[k)) L(x, h
V
(x))
entonces
N1
j=0
V (x(k + j[k)) V (x(k + j + 1[k)) = V (x) V (x(k + N[k))
N1
j=0
L(x, h
V
(x))
Del principio de optimalidad se tiene que
V (x)
N1
j=0
L(x, h
V
(x)) + V (x(k + N[k)) J
N
(x)
De este lema se deduce que para todo x , resulta que J
N
(x) V (x) y por
lo tanto x
. En consecuencia

Con los resultados anteriores se ha demostrado que existe una vecindad del origen
tal que para todo estado inicial contenido en ella, el MPC sin la restriccion terminal
estabiliza el sistema. En (Jadbabaie et al. 2001) se demuestra que para todo estado
asint oticamente estabilizable existe un horizonte N tal que el MPC sin restricciones y
sin restriccion terminal estabiliza el sistema. En (Parisini & Zoppoli 1995) se demuestra
que para un MPC con restricciones, sin restriccion terminal y con un coste terminal
V (x) = ax
T
Px existe un valor de la constante a, la matriz P y del horizonte N, tales
que el MPC estabiliza cualquier estado asint oticamente estabilizable.
A continuacion se extienden ambos resultados a la formulacion general del MPC,
demostrando que todo estado asint oticamente estabilizable es estabilizable por el MPC
sin restriccion terminal, para un horizonte N sucientemente largo. Para ello primero
es necesario establecer el siguiente resultado.
Lema 3.23 Sea V (x) y = x IR
n
: V (x) tales que satisfacen la hipotesis
3.1. Sea u
F
(k) la secuencia optima del MPC sin restriccion terminal en x
k
S
N
(X, ).
Entonces si x
(k+N[k) / , ning un otro estado x
(k+j[k) / , para j = 0, , N1.

Demostracion:
Se procede por reduccion al absurdo. Supongamos que x
(k + N[k) / , pero existe

un i tal que x
(k +i[k) . Por optimalidad se tiene que la solucion optima del MPC

con horizonte N i en x
(k + i[k) es la secuencia [u
(k + i[k), , u
(k + N 1[k)].
Entonces, en virtud del lema 3.22:
V (x
(k + i[k)) J
Ni
(x
(k + i[k)) V (x
(k + N[k)) >
luego x
(k + i[k) / lo que es una contradiccion, demostrandose el lema.

A la luz de este lema se puede demostrar este otro:
Lema 3.24 Para todo x asintoticamente estabilizable existe un horizonte N nito tal
que la solucion optima del MPC con horizonte N y sin restriccion terminal satisface
la restriccion terminal.
Demostracion:
Dado el caracter denido positivo del coste de etapa L(x, u), y teniendo en cuenta
que el invariante es una vecindad del origen, existe una constante d > 0 tal que
L(x, u) d para todo x / .
Por otro lado, para todo estado asint oticamente estabilizable, el coste con horizonte
nito esta acotado.
Para demostrar el lema se va a proceder por reduccion al absurdo. Supongamos que
para un estado x
k
estabilizable no existe un N tal que la solucion del MPC verica que
x
(k + N[k) pertenece a . Entonces, del lema anterior se tiene que x
(k + j[k) / ,
para j = 0, , N 1. Por tanto,
J
N
(x
k
) Nd + N 1
Haciendo N se deduce que el coste optimo J
(x
k
) no esta acotado y por lo tanto
no es estabilizable asintoticamente, lo que es una contradiccion.
A partir de este lema se puede establecer el siguiente resultado:
Teorema 3.25 (Estabilidad asintotica)
Sea un sistema x
k+1
= f(x
k
, u
k
x
k
X y u
k
U.
= x IR
n
: V (x)
Entonces, para todo x
0
asintoticamente estabilizable existe un horizonte nito N tal que
el controlador MPC con horizonte N y sin restriccion terminal estabiliza asintotica-
mente el sistema.
Demostracion:
Sea un N tal que satisface esta condicion
J
N
(x
0
) Nd +
entonces del lema anterior se deduce que la solucion optima en x
0
satisface la restriccion
terminal. Ademas para todo estado tal que x = x IR
m
: J
N
(x) J
(x
0
)
tambien se verica, y por tanto la solucion optima alcanza la region terminal. Tambien
se vericar a para todo horizonte mayor que N.
Considerando este valor de N, se puede comprobar que es un invariante positivo
del sistema. Para ello se demuestra que si x
k
entonces x
k+1
.
El procedimiento es similar a las demostraciones de estabilidad anteriores. Sea u
F
(k)
la solucion optima del sistema en x
k
N
(x
k
) y sea la secuencia
u
F
(k + 1) dada por
u(k + j[k + 1) =
_
_
_
u
(k + j[k) j = 1, , N 1
h
V
( x(k + N[k + 1)) j = N
siendo h
V
() la actuacion optima de (3.4) para el estado terminal. Es inmediato com-
probar que la ausencia de incertidumbres, la factibilidad de u
F
(k) y la hipotesis 3.1
garantizan la factibilidad de u
F
(k + 1) aplicada en x
k+1
= x
(k + 1[k).
Entonces se tiene que el coste de la secuencia factible verica que
J
N
(x
k+1
) J
N
(x
k
) = L(x
k
, u
(k[k)) + [V + L](x
(k +N[k), h
V
(x
(k + N[k)))
L(x
k
, u
(k[k))
dado que x(k +N[k +1) = x
(k +N[k) y que h
V
() satisface (3.4). Por tanto, del
principio de optimalidad se tiene que
J
N
(x
k+1
) J
N
(x
k
)

J
N
(x
k+1
) J
N
(x
k
) L(x
k
, u
(k[k)) l|x
k
|

Por tanto J
N
(x
k+1
) J
N
(x
k
) J
N
(x
0
).
En consecuencia, para el horizonte N la solucion optima del MPC satisface la re-
striccion terminal a lo largo de la evolucion del sistema en bucle cerrado. Por tanto el
conjunto es un invariante positivo, lo que garantiza estabilidad. La convergencia es
consecuencia de la monotona del coste optimo.
De los resultados obtenidos hasta ahora se puede caracterizar una zona en la que
el controlador MPC sin restriccion terminal estabiliza asint oticamente el sistema. Esta
caracterizacion no esta hecha en (Jadbabaie et al. 2001) ni en (Parisini & Zoppoli 1995).
En esta tesis se presenta el siguiente teorema en el cual se determina una vecindad del
origen, que crece con el horizonte de control, en la que el controlador sin restriccion
terminal estabiliza el sistema. De esta forma se extiende el resultado presentado en el
teorema 3.21.
Teorema 3.26 (Caracterizacion del dominio de atraccion)
Sea un sistema x
k+1
= f(x
k
, u
k
x
k
X y u
k
U.
= x IR
n
: V (x)
Entonces el MPC general sin restriccion terminal estabiliza asintoticamente el sistema,
para todo estado inicial tal que x
0
, siendo esta region
= x IR
n
: J
N
(x) L
(x) + (N 1)d +
siendo L
(x) = L(x, K
MPC
(x)) el coste de etapa optimo.
Demostracion:
Como ya se ha demostrado anteriormente, si x
k
es tal que la solucion optima no conduce
al sistema hasta la region terminal, entonces ning un estado de la trayectoria optima
entra en la region terminal. As, por el principio de optimalidad de Bellman se tiene
que
J
N
(x
k
) L
(x
k
) = J
N1
(x
(k + 1[k)) (N 1)d +
siendo L
(x
k
) = L(x
k
, u
(k[k)). Por tanto si x

k
es tal que
J
(x
k
) L
(x
k
) + (N 1)d +
entonces la solucion optima conduce al sistema a la region terminal.
Se va a demostrar que si x
k
satisface la condicion anterior, entonces x
k+1
tambien.
Dado que la solucion optima en x
k
es tal que x
(k+N[k) , se tiene que la secuencia

u
F
(k + 1) dada por
u(k + j[k + 1) =
_
_
_
u
(k + j[k) j = 1, , N 1
h
V
( x(k + N[k + 1)) j = N
siendo h
V
() la actuacion optima de (3.4) para el coste terminal, es factible y ademas
la trayectoria tambien satisface la condicion terminal. Entonces se tiene que
J
N
(x
k+1
)

J
N
(x
k+1
) J
N
(x
k
) L(x
k
, u
(k[k))
(N 1)d + L
(x
k+1
) + (N 1)d +
Por recurrencia se deduce que dado que x
0
es tal que J
(x
0
) L
(x
0
)+(N1)d+,
entonces x
k
verica que J
(x
k
) L
(x
k
) + (N 1)d + para todo k, y por tanto la
solucion optima del MPC siempre cumple la restriccion terminal. Notese ademas que
para todo k tambien se tiene que J
(x
k
) J
(x
0
) L
(x
0
) + (N 1)d + y por
lo tanto x
k
que es un conjunto acotado, por lo que el sistema es estable en bucle
cerrado.
La monotona del coste optimo garantiza la convergencia asintotica del sistema.
A continuacion se presenta un nuevo resultado en el que se demuestra que el con-
trolador sin restriccion terminal suboptimo estabiliza asint oticamente el sistema. Esta
armacion que puede parecer una traslacion de la suboptimalidad del MPC con res-
triccion terminal, no es tan inmediata. Tengase en cuenta que el lema 3.23 y todos los
resultados derivados de el, estan basados en la optimalidad de la solucion y no en la
factibilidad.
Teorema 3.27 (Suboptimalidad)
Bajo las hipotesis del teorema anterior, el controlador MPC sin restriccion terminal
suboptimo estabiliza asintoticamente el sistema si
J
s
N
(x
k+1
) < J
s
N
(x
k
) |x
k
|
siendo L(x, u) l|x|
y [0, l], para todo

x
0
= x IR
n
: J
s
N
(x
0
) Nd +
Demostracion:
Sea x
k
tal que J
s
N
(x
k
) Nd + . Entonces por optimalidad se tiene que
J
N
(x
k
) J
s
N
(x
k
) Nd +
lo que implica que x
k
. Como se demostro anteriormente el controlador optimo
u
k
= K
MPC
(x
k
) hace que
J
N
(x
k+1
) J
N
(x
k
) L(x
k
, K
MPC
(x
k
)) J
s
N
(x
k
) L(x
k
, K
MPC
(x
k
)) J
s
N
(x
k
) |x
k
|
por lo tanto existe una actuacion factible tal que satisface la condicion de convergencia
J
s
N
(x
k+1
) < J
s
N
(x
k
) |x
k
|
. En consecuencia, el problema tiene solucion factible en

todo instante x
k
si x
0
.
De aqu se deduce que el sistema evoluciona de forma que x
k
, por lo que es un
invariante positivo del sistema. Ademas la monotona del coste suboptimo garantiza
la convergencia asint otica al origen (teniendo en cuenta las consideraciones sobre la
estabilidad hechas en la seccion 3.8).
El controlador propuesto se va aplicar al reactor utilizado a lo largo de este captulo.
Para ilustrar el efecto de la eliminacion de la restriccion terminal sobre el calculo en
lnea de la actuacion optima, se ha eliminado las restricciones sobre los estados. De
esta manera el problema sin restriccion terminal no presenta restricciones en los estados
(restricciones no lineales sobre las actuaciones) mientras que el problema con restriccion
terminal s las presenta. Esta diferencia, como se vera mas adelante, supone un ahorro
sustancial de calculo.
Para el ejemplo se va a considerar como matrices de ponderacion
Q =
_
_
10 0
0 10
_
_
R = 1
y como funcion de coste terminal y region terminal las utilizadas hasta ahora. El
horizonte de control es N
c
= 10 y el horizonte de prediccion se considera igual al de
control. Con estos parametros se calcula la constante d que toma el valor
7
d =
min
(P
1/2
QP
1/2
) = 0,3316
7
En la seccion 4.6 se demuestra que d =
min
(P
1/2
QP
1/2
) .
por lo que la region en la que se puede eliminar la region terminal es
= x IR
n
: J
10
(x) 10d + = 12,6508
Para el reactor se han probado distintos estados iniciales contenidos en dicha region.
En la tabla siguiente se muestran los valores de las operaciones en punto otante (ops)
requeridas para la resolucion del problema sin y con restriccion terminal. Estos valores
corresponden a la resolucion del problema utilizando la funcion fmincon de la biblioteca
de optimizacion de MATLAB.
x
0
J
10
(x
0
) ops sin R.T. ops con R.T. ratio( %)
(0,2, 0,3) 12.267 957794 1743184 54.94
(0,25, 0,2) 11.898 796123 1505492 52.88
(0,27, 0,1) 12.210 698281 1324588 52.71
(0,24, 0,1) 11.755 781474 1483264 52.68
(0,1, 0,34) 12.391 790154 1499478 52.69
(0,0, 0,375) 11.881 885181 1670070 53.00
(0,2, 0,275) 11.961 896235 1696148 52.83
(0,25, 0,1) 10.741 827263 1544369 53.56
El ratio calculado (razon entre ops sin restriccion terminal y con ella) pone de
maniesto que el ahorro computacional es importante y ademas se logra sin perdida
de optimalidad, pues la solucion en cada caso es la misma.
En la gura 3.19 se muestra la evolucion del sistema partiendo de un estado inicial
(0,2, 0,3). En la gura 3.20 se muestra la evolucion del coste optimo, que como se ha
demostrado, es monotonamente decreciente, lo que garantiza la convergencia.
3.10. Conclusiones
En este captulo se ha analizado la estabilidad del MPC de la formulacion general
del MPC en la que se ha establecido el procedimiento de analisis que es com un en los
restantes analisis de estabilidad. Basandose en esta se proponen dos nuevas formula-
ciones del MPC con estabilidad garantizada: la formulacion con un mayor horizonte
de prediccion y la formulacion basada en el coste con horizonte cuasi-innito. Se ha
analizado tambien el comportamiento de los controladores propuestos en cuanto a su
optimalidad. De este analisis se desprende que el aumento del horizonte de prediccion,
0 5 10 15 20 25 30 35 40 45 50
0.2
0.1
0
0.1
x
1
0 5 10 15 20 25 30 35 40 45 50
0
0.2
0.4
x
2
0 5 10 15 20 25 30 35 40 45 50
1
0.5
0
0.5
u
muestras
Figura 3.19: Evolucion del sistema en bucle cerrado con MPC sin restriccion terminal.
0 5 10 15 20 25 30 35 40 45 50
2.5
2
1.5
1
0.5
0
0.5
1
1.5
l
o
g
1
0

J
*
muestras
Figura 3.20: Evolucion del coste optimo del MPC sin restriccion terminal.
as como la consideracion del coste terminal cuasi-innito suponen un acercamiento a
la optimalidad y por lo tanto una mejora del comportamiento.
Tambien se ha abordado la estabilidad asint otica en caso de suboptimalidad de la
solucion, demostrandose esta basandose en el analisis anterior y relajandose la condicion
para la estabilidad originalmente impuesta. Por ultimo se ha estudiado la estabilidad
del controlador MPC en ausencia de restriccion terminal, lo cual es especialmente
interesante en caso de sistemas sin restricciones en los estados. Se han obtenido nuevos
resultados generalizado otros existentes a la formulaci on general del MPC y se ha
caracterizado las regiones en las que el controlador estabiliza al sistema.
Asociado al concepto de estabilidad asint otica del controlador esta el concepto de
invariancia y en particular el concepto de dominio de atraccion del mismo.

Este conjun-
to es la region en la que el sistema es asint oticamente estabilizable por el controlador,
y por lo tanto, cuanto mayor sea mayor sera la validez del controlador. El captulo
siguiente esta dedicado al estudio del dominio de atraccion del controlador y en el se
proponen procedimientos y nuevas formulaciones orientadas a su aumento.
Captulo 4
Aumento del dominio de atraccion
del MPC
4.1. Introduccion
Como se ha mostrado en captulos anteriores, bajo ciertas condiciones, el MPC
estabiliza asintoticamente el sistema garantizando la satisfaccion de las restricciones
impuestas a los estados y actuaciones a lo largo de la evoluci on del mismo. Estas
restricciones, as como la propia naturaleza del sistema, pueden hacer que no todos
los estados sean estabilizables por el controlador. El sistema sera por tanto localmente
estable en una determinada region, denominada dominio de atraccion, que es ademas
un invariante positivo del sistema controlado.
El conocimiento de este conjunto es importante pues representa el dominio de validez
del controlador, de forma que, si la planta partiese de estados fuera del mismo, el
controlador no sera apropiado, haciendose necesario el dise no de un nuevo controlador
valido para ese estado. Por tanto, cuanto mayor sea esta region, mayor sera el conjunto
de estados estabilizables por el controlador, lo cual es notablemente benecioso.
En este captulo se aborda el analisis del dominio de atraccion del MPC orientado
a su aumento. Este es un problema que no se ha tratado monogracamente en la
literatura, en la que s se pueden encontrar resultados aislados sobre el dominio de
atraccion de las formulaciones existentes (Mayne 2001, Magni, De Nicolao, Magnani &
Scattolini 2001, Kerrigan & Maciejowski 2000, Keerthi & Gilbert 1988).
Para ello, se parte del analisis del dominio de atraccion del MPC desde el punto
de vista de la teora de conjuntos invariantes, y se pone de maniesto que paramet-
89
ros inuyen sobre el. A partir de estos, se proponen procedimientos encaminados al
aumento del dominio de atraccion del controlador sin aumento signicativo del coste
computacional. As se pueden establecer tres medidas a tomar: aumento de los hori-
zontes, variaci on del coste terminal y variaci on de la restriccion terminal.
En esta ultima medida se proponen nuevas formulaciones del MPC considerando
restricciones terminales contractivas, basadas en conjuntos invariantes positivos e in-
variantes de control. Esta ultima formulacion ha sido publicada en (Limon Marruedo,
Alamo & Camacho 2002a). Tanto el analisis del aumento de atraccion, como las nuevas
formulaciones introducidas en este captulo son aportaciones originales de esta tesis.
La organizacion de las medidas llevadas a cabo en este captulo se ilustran en el
siguiente diagrama:
Aumento del
dominio de
atraccin del MPC
Incremento de
los horizontes
Modificacin
del coste terminal
Restriccin
terminal
contractiva
Horizonte
de control
Horizonte
de prediccin
cuasi-infinito ponderado
invariantes
positivos
invariantes
de control
Figura 4.1: Tecnicas para el aumento del dominio de atraccion.
El captulo termina presentando procedimientos para aumentar el dominio de atrac-
cion del MPC sin restriccion terminal que se caracterizo en el captulo anterior. Esto
tambien forma parte de las contribuciones originales de esta tesis.
Antes de proceder al cuerpo del captulo merece la pena destacar que el analisis
del dominio de atraccion se basa principalmente en la teora de conjuntos invariantes,
cuyos principales resultados se pueden consultar en la seccion A.3.
Captulo 4. Aumento del dominio de atraccion del MPC 91
4.2. El dominio de atraccion del MPC
La formulaci on general del MPC tiene los siguientes elementos de dise no: el hori-
zonte de control, la funcion de coste de etapa, la funcion de coste terminal y la region
terminal. Como se ha demostrado, si se considera como region terminal un invariante
positivo del sistema y como coste terminal una funcion de Lyapunov asociada tal
que el decrecimiento de esta sea mayor que el coste de etapa incurrido (hipotesis 3.1),
entonces el controlador MPC estabiliza asintoticamente el sistema. Estas condiciones,
demostradas en el teorema 3.2, se denominan a lo largo del captulo como condiciones
sucientes de estabilidad del MPC.
La imposicion de la invariancia positiva de la region terminal garantiza que, conocida
una secuencia de actuaciones factibles en el instante k, se puede construir otra secuencia
factible para el instante siguiente k + 1. Por tanto si el estado inicial es tal que el
problema de optimizacion tiene solucion (es factible), entonces dicho problema tiene
solucion a lo largo de la trayectoria del sistema. En consecuencia, el conjunto de estados
para los cuales el problema de optimizacion es factible es un invariante positivo del
sistema en bucle cerrado y, por lo tanto, el dominio de atraccion del controlador.
Ademas para todo estado en el cual el problema no tiene solucion, el controlador
no esta denido. De aqu se deduce que el conjunto factible es el mayor dominio de
atraccion posible del sistema.
Seg un lo anterior, el dominio de atraccion del controlador X
N
sera el conjunto de
estados para los cuales el problema de optimizacion es factible. Este conjunto depende
exclusivamente del conjunto de restricciones del problema de optimizacion y no del
funcional a optimizar. Entonces, el coste de etapa L(x, u) y la funcion de coste terminal
no inuyen en el dominio de atraccion. Tampoco depende, por tanto, de la optimalidad
de la solucion, pues basta con que dicha solucion sea factible.
El conjunto de restricciones del MPC en su formulacion general con un horizonte
de control N son
u(k + j[k) U j = 0, , N 1
x(k + j[k) X j = 0, , N 1
x(k + N[k)
Un estado x
k
pertenece al conjunto factible de estas restricciones (es decir, pertenece
a X
N
) si existe una secuencia de N actuaciones admisibles (u(k +j[k) U) tal que la
evolucion del sistema es admisible (x(k + j[k) X) y alcanza el conjunto terminal
en N pasos (x(k + N[k) ). Al conjunto de estados que satisfacen las condiciones
92 4.2. El dominio de atraccion del MPC
anteriores se denomina conjunto estabilizable en N pasos S
N
(X, )
1
. Por tanto,
X
N
= S
N
(X, )
El conjunto S
N
(X, ) es el maximo conjunto que satisface las condiciones anteriores.
Ademas esta contenido en el maximo conjunto estabilizable
2
S
N
(X, ) S
(X, 0).
En el caso en el que la region terminal no fuese un invariante positivo, entonces
se puede perder la invariancia positiva del conjunto factible, es decir, la garanta de
que, si el estado inicial es factible, el problema lo sera a lo largo de su evolucion. Este
problema es estudiado en (Kerrigan 2000) donde se establecen condiciones sobre la
region terminal para que el problema sea factible a lo largo de la evoluci on del sistema.
Estos resultados estan basados en la teora de conjuntos invariantes.
En este captulo el analisis se va a centrar en el aumento del dominio de atraccion
del controlador. Para poder llevar esto a cabo es fundamental considerar que factores
del controlador inuyen en el dominio de atraccion. Dado que el dominio de atraccion
X
N
tan solo depende del conjunto factible y no de la funcion de coste a optimizar ni
de la optimalidad de la solucion obtenida, este esta caracterizado por:
(i) El conjunto de restricciones en las actuaciones U.
(ii) El conjunto de restricciones en el estado X.
(iii) El modelo del sistema, que esta implcito en las restricciones impuestas sobre el
estado
(iv) La region terminal .
(v) El horizonte de control N.
Los tres primeros elementos forman parte de la descripcion del sistema: el modelo
de prediccion describe el sistema a controlar y las restricciones impuestas sobre las
actuaciones y estados, vienen dadas en general por lmites fsicos sobre las se nales
del sistema, tales como saturaciones en los actuadores, temperaturas lmites en proce-
sos,etc. Por tanto, los unicos parametros manipulables sobre los que se puede inuir
para variar el dominio de atraccion son el horizonte N y la region terminal .
En este captulo se proponen medidas para el aumento del dominio de atraccion del
controlador, que se pueden agrupar en tres :
1
Vease la seccion A.3 para consultar la denicion del conjunto estabilizable as como sus
propiedades.
2
El maximo conjunto estabilizable, es decir, el conjunto de estados que pueden ser llevados al origen
siguiendo una evolucion admisible por un controlador admisible, es S
(X, 0)
1. Variaci on de los horizontes (de control y de prediccion) del MPC.
2. Incorporacion de funciones de coste terminal adecuadas.
3. Modicacion de la restriccion terminal.
Como se vera a continuacion, a excepcion del aumento del horizonte de control,
estas medidas son procedimientos encaminados al aumento de la region terminal, pues,
de la propiedad de los conjuntos estabilizables se tiene que si
2

1
resulta que
S
N
(X,
2
) S
N
(X,
1
)
Por lo tanto, un aumento de la region terminal supone un aumento del dominio de
atraccion del controlador. Ademas, dado que el calculo de la region terminal del con-
trolador se hace fuera de lnea, esta medida no incurre en un aumento signicativo
del coste computacional. Por ello, la mayora de las medidas van encaminadas en esta
direccion.
4.3. Aumento del dominio de atraccion mediante
los horizontes
4.3.1. Aumento mediante el horizonte de control
Se va a considerar un controlador MPC con horizonte de control igual al horizonte
de prediccion N
c
= N
p
= N. Entonces, como se ha mostrado en la seccion anterior, el
dominio de atraccion X
N
es el conjunto estabilizable del sistema en N pasos S
N
(X, ),
siendo N el horizonte de control. Basandose en las propiedades de este conjunto se
pueden establecer los siguientes resultados:
Teorema 4.1 (Mayne 2001) Sea un controlador MPC general con una region terminal
y un coste terminal V (x), tal que satisface las condiciones sucientes de estabilidad
(teorema 3.2). Entonces el dominio de atraccion del controlador satisface las siguientes
propiedades:
1. Para cualquier horizonte de control N 1, el dominio de atraccion del MPC
contiene la region terminal.
X
N
X
94 4.3. Aumento del dominio de atraccion mediante los horizontes
2. Aumentando el horizonte de control, el dominio de atraccion aumenta
X
N
X
N+1
3. Puede existir un horizonte N
tal que para todo N N
, el dominio de atraccion
no aumenta, es decir, X
N
= X
N
Demostracion:
La demostracion se basa en las propiedades del conjunto estabilizable (propiedad A.27).
1. X
N
= S
N
(X, ) X para todo N 1. Ademas S
N
(X, ) .
2. X
N
= S
N
(X, ) S
N+1
(X, ) = X
N+1
.
3. En todo sistema dinamico puede existir un ndice de determinacion N
tal que
S
N
(X, ) = S
N
(X, ) = S
(X, ) para todo N N
. Por tanto X
N
= X
N
=
X
.
La primera consecuencia de estas propiedades es que el controlador MPC tiene un
dominio de atraccion mayor que el obtenido con el controlador local. Esto permite
interpretar el control MPC como un procedimiento para aumentar el dominio de atrac-
cion de controladores locales (ademas de introducir un criterio optimo en la obtencion
de la actuacion sobre el sistema).
La segunda consecuencia es el aumento del dominio de atraccion del controlador al
aumentar el horizonte de control. En efecto, en la mayora de los casos al aumentar
N, se puede comprobar que el dominio de atraccion aumenta. Pero esto no siempre es
as, debido a la propiedad de determinacion nita del conjunto estabilizable. Existen
plantas (como, por ejemplo, una planta lineal inestable con actuaciones limitadas) para
las cuales el conjunto estabilizable S
(X, ) esta nitamente determinado, y por lo

tanto a partir de un cierto horizonte nito N
, el conjunto de estados estabilizables

para un horizonte N > N
no aumenta, es decir,
S
N
(X, ) = S
N+1
(X, ) = S
(X, )
En consecuencia, para estas plantas, el aumento del horizonte de control puede no
aumentar el dominio de atraccion, a partir de cierto valor del mismo.
Entonces se puede armar que para horizontes de control inferiores al ndice de
determinacion N
, el dominio de atraccion aumenta al aumentar el horizonte de con-

trol. En plantas en las que S
(X, ) no esta nitamente determinado, el dominio de

atraccion aumenta para todo N.
Dado que S
(X, 0), aplicando el teorema A.28, se deduce que

S
(X, ) = S
(X, 0)
siendo S
(X, 0) el conjunto de estados asintoticamente estabilizables. Entonces, si

el conjunto S
(X, ) esta nitamente determinado, del corolario A.29 se deduce que

el conjunto S
(X, 0) tambien esta nitamente determinado, y ademas existe un N
tal que
S
N
(X, ) = S
(X, ) = S
(X, 0)
para todo N N
.
En consecuencia, un controlador MPC con horizonte nito (N N
) alcanza el
maximo dominio de atraccion posible S
(X, 0), que es el dominio de atraccion del

MPC con horizonte innito (Keerthi & Gilbert 1988). Este horizonte sera valido para
todo estado inicial asintoticamente estabilizable.
Si S
(X, 0) no esta nitamente determinado entonces tampoco lo esta S
(X, )
y por lo tanto no existe un horizonte jo N
tal que estabilice todos los estados a-

sintoticamente estabilizables. Lo que s se verica es que para todo estado existe un
horizonte nito que depende del estado (por ejemplo, si x S
i
(X, 0), basta tomar
N = i) tal que el MPC con ese horizonte lo estabiliza.
Notese que el desarrollo anterior, viene a demostrar desde un punto de vista de
conjuntos invariantes el resultado obtenido en el teorema 3.25, en virtud del cual,
todo estado asintoticamente estabilizable (x S
(X, 0)) puede ser asintoticamente

estabilizado por un controlador MPC de un horizonte N sucientemente largo, es decir,
existe un N tal que x S
N
(X, ).
De lo anteriormente expuesto se deriva el hecho de que aumentando el horizonte de
control, se puede aumentar el dominio de atraccion del controlador (siempre que no se
supere el ndice de determinacion de S
(X, )). Este procedimiento es el que habitual-

mente se sigue y, como se ha comentado, con resultados satisfactorios en la mayora de
los sistemas. Sin embargo, esta tecnica tiene un gran inconveniente: el aumento del ho-
rizonte de control produce tambien un aumento del n umero de variables de decision, y
por lo tanto un aumento de la complejidad del problema de programacion matematica
a resolver. Dado que en un problema de programacion no lineal (NLP) la necesidad
de computo crece generalmente de forma exponencial con el n umero de variables de
decision, el tiempo de calculo del controlador puede aumentar apreciablemente. Como
es sabido, el tiempo de calculo esta limitado por el periodo de muestreo del sistema,
que depende de la dinamica que presente el sistema a controlar. Por tanto, el tiempo
de calculo del MPC esta limitado y, en consecuencia, tambien lo esta el horizonte de
control que se puede considerar. As, este procedimiento de aumento del dominio de
atraccion es costoso, y limitado.
Por este motivo, los restantes procedimientos expuestos en este captulo para au-
mentar el dominio de atraccion se centran en el aumento de la region terminal, que
permite aumentar el dominio de atraccion sin afectar a la dimension del problema de
optimizacion.
4.3.1.1. Ejemplo de aplicacion al reactor
Para ilustrar lo anteriormente expuesto se va a aplicar el controlador MPC al reactor
continuamente agitado. Los parametros del controlador, y en consecuencia la region
terminal, utilizados en este ejemlo son los obtenidos en la seccion 3.3.2. Para este
controlador se ha calculado el dominio de atraccion del controlador para N = 3 y para
N = 4. Estas dos regiones se representan en la gura 4.2.
0.4 0.2 0 0.2
1.2
0.8
0.4
0
0.4
x
1
x
2

X
3

X
4

Figura 4.2: Dominio de atraccion del MPC para N = 3 (X
3
) y para N = 4 (X
4
).
Como se puede observar en la misma, X
3
X
4
aumentandose el dominio de atrac-
cion al aumentar N. Ademas cabe resaltar que X
3
, es decir, que el controlador
MPC consigue un dominio de atraccion mayor que el conseguido con la ley de control
local.
4.3.2. Aumento mediante el horizonte de prediccion
En el anterior captulo se present o la formulaci on del MPC con un horizonte de
prediccion mayor que el horizonte de control, estableciendose condiciones sucientes
bajo las cuales el controlador estabiliza asintoticamente el sistema (teorema 3.6). La
idea clave radica en considerar el controlador local para extender la prediccion mas
alla del horizonte de control. Esta formulaci on presenta una serie de propiedades que
lo hacen benecioso, entre las que destaca el mayor grado de optimalidad conseguido.
Sin duda alguna la propiedad mas interesante que se consigue con esta formulacion es
el aumento del dominio de atraccion del controlador.
En efecto, como se coment o en la seccion 3.5, el controlador MPC con horizonte de
control N
c
p
= N
c
+M formulado con una region terminal
y un coste terminal V (x), puede considerarse como un controlador MPC general
con horizonte N
c
tal que la funcion de coste terminal fuese V
M
(x) y la region terminal
S
h
M
(X, ). Esta region es el conjunto de los estados que pueden ser estabilizados a en
M pasos por la ley de control local u = h(x) de forma que la trayectoria es admisible
y las actuaciones tambien.
El conjunto estabilizable en j pasos por la ley de control u = h(x), S
h
j
(X, ), viene
dada por
3
S
h
j
(X, ) = Q
h
(S
h
j1
(X, )) X
siendo S
h
0
(X, ) = . Por lo tanto se puede calcular a partir del conjunto a un paso
del sistema controlado por u = h(x), que viene dado por
Q
h
() = x IR
n
: h(x) U y f(x, h(x))
el cual representa el conjunto de estados que pueden llevarse al conjunto invariante
por la ley de control u = h(x) con una actuacion admisible.
El caracter no lineal del modelo hace que en general sea imposible calcular con exac-
titud dicho conjunto. Por tanto, la ventaja de la formulaci on con un mayor horizonte
de prediccion N
p
es la consideracion como region terminal del conjunto S
h
M
(X, ) sin
necesidad de realizar el calculo del mismo, pues esta implcitamente impuesto en las
restricciones.
Dado que S
h
M
(X, ), se tiene que el dominio de atraccion del MPC es mayor
(respecto al del controlador con horizonte de prediccion N
p
= N
c
). El dominio de
atraccion de este controlador se denota X
Nc,Np
, y depende ademas del horizonte de
prediccion. En el siguiente teorema se establece la inuencia que sobre el dominio de
atraccion tiene el aumento de los horizonte de control y de prediccion.
3
Teorema 4.2 (Aumento del dominio de atraccion) Sea un sistema y un contro-
lador MPC tal que el coste terminal y la region terminal satisfacen las hipotesis del
teorema 3.6, entonces se tiene que
X
N
c
,N
p
X
N
c
,N
p
+1
X
N
c
+1,N
p
+1
y ademas
X
N
c
,N
p
X
N
c
+1,N
p
X
N
c
+1,N
p
+1
Demostracion:
De las propiedades de los conjuntos estabilizables (propiedad A.27), se tiene que si
el conjunto es un invariante positivo del sistema, S
h
j
(X, ) es un invariante positivo
del sistema controlado por el controlador local y verica que S
h
j
(X, ) S
h
j+1
(X, ).
Ademas verica que S
h
j
(X, ) S
j
(X, ).
De estas propiedades tambien se deduce que el conjunto estabilizable en N pasos
verica que
S
N
(X, ) = S
Nj
(X, S
j
(X, ))
Considerando las anteriores propiedades se tiene que
X
Nc,Np
= S
Nc
(X, S
h
N
p
N
c
(X, )) S
Nc
(X, S
h
N
p
N
c
+1
(X, )) = X
Nc,Np+1
S
N
c
(X, S
1
(X, S
h
NpNc
(X, ))) = S
N
c
+1
(X, S
h
NpNc
(X, )) = X
N
c
+1,N
p
+1
La segunda armacion es inmediata dado que
X
N
c
,N
p
= S
N
c
(X, S
h
N
p
N
c
(X, )) S
N
c
+1
(X, S
h
N
p
N
c
(X, ))
= X
N
c
+1,N
p
X
N
c
+1,N
p
+1
demostrandose el teorema.
Una teorema similar a este se puede encontrar en (Magni, De Nicolao, Magnani &
Scattolini 2001), en el que se demuestra parte del resultado aqu establecido sin utilizar
la teora de conjuntos invariantes.
Una consecuencia inmediata del teorema 4.2 es que
X
Nc
= X
Nc,Nc
X
Nc,Np
para todo N
p
N
c
. Es decir, que tal y como se comprobo anteriormente, la conside-
racion de un horizonte de prediccion mayor que el de control aumenta el dominio de
atraccion del controlador. Es importante resaltar que, dado que el n umero de variables
de decision no se vara, el aumento de dominio de atraccion se consigue con un escaso
incremento del coste computacional. Este esfuerzo se incrementa por la incorporacion
de nuevas restricciones sobre el problema, pero es un incremento leve.
Para este ejemplo se va a considerar como region terminal la utilizada en la seccion
3.3.2 (
b
). As, se han calculado los dominios de atraccion del MPC con N
c
= 3 y
N
p
= 3 (X
3
), con N
p
= 4 (X
3,4
) y con N
p
= 10 (X
3,10
). Estos conjuntos se muestran en
la gura 4.3, en la cual se puede observar que al aumentar el horizonte de prediccion
el dominio de atraccion aumenta. Este aumento es monotono al aumentar N
p
, si bien
para cierto valor de N
p
el incremento es escaso o nulo, de hecho, a partir de N
p
= 10,
este incremento no es sustancial.
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3 0.4
1.5
1
0.5
0
0.5
x
1
x
2
X
3

X
3,4

X
3,10

Figura 4.3: Aumento del dominio de atraccion al aumentar N
p
.
En la gura 4.4 se muestra el dominio de atraccion X
3
, X
3,4
y X
4
. Como se puede
observar, tal y como se demostro en el teorema 4.2, X
3
X
3,4
X
4
100 4.4. Aumento del dominio de atraccion mediante el coste terminal
0.4 0.2 0 0.2
1.2
0.8
0.4
0
0.4
x
1
x
2
X
3

X
3,4

X
4

Figura 4.4: Relacion entre X
3
(lnea con puntos), X
3,4
(lnea gruesa) y X
4
(lnea con cruces).
4.4. Aumento del dominio de atraccion mediante el
coste terminal
En esta seccion se van a presentar un par de procedimientos de aumento del do-
minio de atraccion mediante la modicacion del coste terminal. Esto puede resultar
contradictorio con el desarrollo llevado a cabo en la seccion 4.2, en el que se armo que
el dominio de atraccion no depende del funcional a optimizar.
Sin embargo, para que el controlador MPC estabilice asintoticamente el sistema,
la funcion de coste terminal y la region terminal deben satisfacer la hipotesis 3.5. Por
lo tanto, una modicacion adecuada de la funcion de coste terminal, puede llevar a
encontrar una mayor region terminal en la que se satisfacen las condiciones sucientes
de estabilidad, y de esta forma aumentar el dominio de atraccion.
Por lo tanto, las modicaciones que se presentan a continuacion estan encaminadas
al aumento de la region terminal y por consiguiente, del dominio de atraccion.
4.4.1. Incorporacion del coste terminal cuasi-innito
Considerese un controlador local u = h(x) que estabiliza asintoticamente el sistema,
una funcion de Lyapunov asociada V (x) y una region (invariante positivo) tales que
satisfacen la hipotesis 3.5. Como se demostro en la seccion 3.5, a partir de estos se
puede obtener otra funcion V
M
(x), denominada funcion de coste cuasi-innito, dada
por
V
M
(x) =
j=M1
j=0
L
h
(x
h
(i + j[i)) +V (x
h
(i +M[i)) (4.1)
siendo x
h
(i + j[i) la prediccion del sistema controlado por la ley de control local
u = h(x) considerando x(i[i) = x.
Esta funcion es tambien una funcion de Lyapunov para el sistema controlado por
la ley de control u = h(x) y tal que satisface la condicion terminal en el conjunto
S
h
M
(X, ). El conjunto invariante a utilizar como region terminal se puede aumen-
tar aproximandose a S
h
M
(X, ), aumentando, por tanto, el dominio de atraccion del
controlador MPC con V
M
(x) como coste terminal.
Como se comento anteriormente, para incorporar este conjunto como region termi-
nal, basta con considerar un horizonte de prediccion N
p
= N
c
+ M. Sin embargo hay
ocasiones en las que la consideracion de un horizonte de prediccion N
p
> N
c
puede no
ser deseable. Esto se puede deber al hecho de que esto supone aumento de restricciones
en los estados y por lo tanto un incremento del coste computacional en lnea. Este
problema es mas acusado cuando el problema no presenta restricciones en los estados.
En estas ocasiones, puede resultar interesante el aumento del dominio de atraccion
considerando el coste terminal cuasi-innito.
Para determinar una region terminal asociada, basta con encontrar una constante
M
> 0 tal que el conjunto
M
= x IR
n
: V
M
(x)
M
este contenido en S
h
M
(X, ). Esto se puede realizar mediante el siguiente procedimiento:
se calcula el conjunto factible X
h
(que se supone convexo) y se resuelve el siguiente
problema de minimizacion
= mn
x
V
M
(x)
s.a x / X
h
Entonces para todo
M
, se tiene que
M
X
h
.
Para garantizar que
M
S
h
M
(X, ), basta con tomar
M
= mn(, Md + ),
siendo = x IR
n
: V (x) y d una constante positiva tal que L
h
(x) d para
todo x / . La condicion Md + es una consecuencia inmediata de la siguiente
propiedad.
Propiedad 4.3 Sea la ley de control u = h(x) tal que estabiliza asintoticamente el
sistema, sea V (x) una funcion de Lyapunov asociada y sea X
h
un invariante
positivo asociado de la forma
= x IR
n
: V (x)
tal que V (x) y satisfacen la hipotesis 3.5. Sea V
M
(x) la funcion de Lyapunov denida
por (4.1). Sea la region
M
= x IR
n
: V
M
(x) Md +
siendo d una constante positiva tal que L
h
(x) d para todo x / .
Entonces para todo x
M
la ley de control u = h(x) lleva al sistema a en M
pasos (o menos).
Demostracion:
Supongamos que V
M
(x) es menor que Md + y la prediccion en el instante M es tal
que x
h
(i +M[i) / . Del principio de invariancia se tiene que x(i +j[i) / para todo
j = 0, , M 1, pues si en alg un instante el sistema entrase en , permanecera en
el. Entonces se tiene que
V
M
(x) =
j=M1
j=0
L
h
(x
h
(i + j[i)) + V (x
h
(i + M[i)) Md +
y por tanto
V (x
h
(i + M[i))
j=M1
j=0
d L
h
(x
h
(i + j[i)) +
Dado que x
h
(i + j[i) / se tiene que L
h
(x
h
(i + j[i)) d. En consecuencia
V (x
h
(i + M[i))
lo que contradice la hipotesis, demostrandose la propiedad.
En consecuencia se puede calcular un conjunto invariante positivo
M
tal que

M
y ademas el coste terminal cuasi-innito V
M
(x) y la region
M
satisfacen
la hipotesis 3.5.
4.4.2. Aumento de la region terminal ponderando el coste ter-
minal
Como se mostro en la seccion 3.7, el procedimiento habitual para obtener la region
terminal y el coste terminal asociado V (x) suele ser:
1. Calcular una ley de control u = h(x) localmente estabilizante.
2. Obtener una funcion de Lyapunov asociada V (x).
3. Calcular la region = x IR
n
: V (x) X
h
tal que para todo x
V (f(x, h(x))) V (x) L(x, h(x)) (4.2)
Esta region debe estar contenida en X
h
para garantizar que tanto las actuaciones
como la evoluci on del sistema son admisibles.
El tama no de la region suele estar limitado por la condicion de convergencia (4.2),
de forma que, cuanto mayor sea la tasa de decrecimiento impuesta a la funcion de
Lyapunov, menor sera la region terminal .
Si el coste terminal V (x) se multiplica por una constante 1, entonces el coste
ponderado
V
(x) = V (x)
es tambien una funcion de Lyapunov asociada al controlador local u = h(x), pues V
(x)
es denida positiva por serlo V (x) y ser > 0 y ademas, si V (f(x, h(x))) < V (x),
entonces V (f(x, h(x))) < V (x).
La condicion de convergencia para el coste terminal V
(x) es
V
(f(x, h(x))) V
(x) = V (f(x, h(x))) V (x) L(x, h(x))

que se traduce en
V (f(x, h(x))) V (x)
1
L(x, h(x))
dado que 1, entonces la tasa de decrecimiento impuesta se reduce, y por lo tanto,
aumentara la region en la que se satisface dicha condicion. En consecuencia la region
terminal asociada a V
(x) sera mayor que la asociada a V (x), y por lo tanto el dominio

de atraccion aumenta.
Es importante resaltar, que la ponderacion de este coste desvirt ua su caracterstica
de aproximacion al coste innito. Por lo tanto, el controlador obtenido tendra un mayor
dominio de atraccion, pero a costa de empobrecer la optimalidad de la evoluci on del
sistema.
Para el calculo de la region terminal y el coste terminal se utilizan los resultados
obtenidos en la seccion 3.7. En esta seccion se calcula un controlador local lineal a
partir del modelo linealizado y se calcula la funcion de Lyapunov asociada. A partir de
esta se toma una region terminal de la forma
= x IR
2
: x
T
Px
siendo
P =
_
_
132,9406 24,6980
24,6980 62,9982
_
_
Como se mostro en el ejemplo de dicha seccion, al aumentar , la constante
crece,
siendo por tanto mayor el tama no de la region terminal tal y como se ha expuesto. As,
considerando
a
= 1,1, la region terminal
a
viene dada por
a
= 0,5. Si se considera
como ponderacion
b
= 2,0, la region terminal
b
que viene dada por
b
= 4,66, que
es la region utilizada en ejemplos anteriores.
En la gura 4.5 se pueden observar ambas regiones terminales, de forma que
a

b
. Se muestran ademas los dominios de atraccion del MPC con un horizonte de control
N = 3 utilizando como region terminal
a
(X
a
3
) y el dominio utilizando
b
(X
b
3
). Como
se ha demostrado, el dominio de atraccion del MPC con la mayor region terminal es
mayor que el dominio del otro MPC (X
a
3
X
b
3
).
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
X
3
b
X
3
a

b

Figura 4.5: Dominio de atraccion del MPC con N = 3 con
a
como region terminal (X
a
3
) y
con
b
(X
b
3
).
4.5. Aumento del dominio de atraccion mediante la
restriccion terminal
A continuacion se presentan dos controladores originales basados en la sustitucion
de la restriccion terminal por otra cuyo n es el aumento del dominio de atraccion del
controlador (conservando por lo tanto la estabilidad asintotica del controlador resul-
tante).
4.5.1. Aumento del dominio de atraccion mediante una region
terminal contractiva
En este apartado se presenta una formulacion del MPC que aumenta el dominio
de atraccion del controlador incorporando una region terminal, en la que no tiene por
que cumplirse la condicion terminal y que se contrae en cada instante. Esta estrategia
garantiza la estabilidad y la factibilidad del MPC en cada instante y no a nade coste
computacional en la resolucion del problema asociado. Este controlador es una de las
aportaciones originales de esta tesis.
Se va a considerar en este caso que existe un controlador local u = h(x) que esta-
biliza exponencialmente el sistema, con una funcion de Lyapunov asociada V (x) y un
conjunto invariante
= x IR
n
: V (x) X
h
tales que satisfacen las condiciones sucientes de estabilidad del MPC dadas por la
hipotesis 3.5. Entonces existe una region
= x IR
n
: V (x) X
h
siendo (y por tanto
) tal que para todo x
, se satisface que
V (f(x, h(x))) < V (x)
siendo [0, 1). Por lo tanto es un invariante positivo en el que el sistema en bucle
cerrado es exponencialmente estable y en el que no tiene por que cumplirse la condicion
de convergencia de la hipotesis 3.5. Cabe resaltar que el procedimiento de calculo del
invariante propuesto en la seccion 3.7 garantiza todas estas condiciones.
Bajo estas condiciones se puede formular un controlador MPC tal que se considera
como coste terminal V (x) y como restriccion terminal
V (x(k + N[k))
k
106 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

Esta restriccion terminal es una restriccion contractiva, en el sentido en el que en
cada instante la secuencia de actuaciones debe conducir al sistema a una region cada
vez mas peque na.
Este controlador no sigue la formulaci on general del MPC, pues la region terminal
cambia en cada instante y ademas no cumple la hipotesis 3.5 y por lo tanto el contro-
lador MPC no garantiza la estabilidad. En consecuencia, es necesario demostrar que
el controlador propuesto estabiliza asintoticamente al sistema, lo cual se hace en el
siguiente teorema.
Teorema 4.4 (Estabilidad asint otica)
Sea un sistema dado por
x
k+1
= f(x
k
, u
k
)
tal que los estados y las actuaciones estan sujetas a las restricciones x
k
X y u
k
U.
Sea un controlador u = h(x) que estabiliza exponencialmente el sistema y tiene una
funcion de Lyapunov V (x) asociada tal que
(i) Existe una region
X
h
, en la cual se satisface la hipotesis 3.5 y que tiene la
forma
= x IR
n
: V (x)
(ii) Existe una region
X
h
= x IR
n
: V (x)
tal que > (por lo tanto
) y tal que para todo x
existe una
constante [0, 1) tal que
V (f(x, h(x))) V (x)
Entonces el controlador MPC con coste terminal V (x) y restriccion terminal
V (x(k + N[k))
k
estabiliza asintoticamente el sistema con un dominio de atraccion X
N
= S
N
(X,
).
Demostracion:
Factibilidad:
Se va a proceder por induccion.
Sea un estado inicial x
0
S
N
(X,
), entonces existe una secuencia de N actuaciones

tales que conducen al sistema a
, y por lo tanto el problema de optimizacion es

factible, satisfaciendo la restriccion terminal
V (x(k +N[k))
En el instante siguiente k = 1, existe una secuencia factible u
F
(1) calculada a partir
de la secuencia optima u
F
(0) dada por
u(j[1) =
_
_
_
u
(j[0) j = 1, , N 1
h( x(N[1)) j = N
Dado que x
1
= x
(1[0), se tiene que x(j[1) = x
(j[0) para todo j = 1, N. Entonces

el estado predicho satisface V ( x(N[1)) . Al aplicar a partir de este instante el
controlador local, se tiene que el estado terminal verica V ( x(N + 1[1)) , por lo
que en x
1
el problema de optimizacion es factible.
Considerese que el problema es factible en el instante k, entonces de manera analoga
se puede obtener una secuencia factible u
F
(k + 1), a partir de la solucion optima en k
u
F
(k) dada por
u(k + j[k + 1) =
_
_
_
u
(k + j[k) j = 1, , N 1
h( x(k + N[k + 1)) j = N
Dado que x
k+1
= x(k + 1[k), se tiene que x(k + j[k + 1) = x
(k + j[k) para todo

j = 1, N. Por lo tanto se tiene que
V ( x(k +N[k + 1))
k
Al aplicar la ley de control local en el estado x(k + N[k + 1), se tiene que
V ( x(k + N + 1[k + 1)) V ( x(k + N[k + 1))
k+1
y por lo tanto el problema de optimizacion es factible.

Por induccion se deriva que el problema es factible a lo largo de la trayectoria del
sistema para todo x
0
S
N
(X,
).
Convergencia:
Esta propiedad se deriva del hecho de que existe una region
( ) en la
cual se satisface la condicion terminal 4.2. Dado que en todo instante k, existe una
solucion tal que
V (x
(k + N[k))
k

existe un instante k
tal que
k
. Por tanto a partir de ese instante, el MPC

satisface la condicion terminal, y por el teorema de estabilidad del MPC (teorema 3.2),
el controlador estabiliza asintoticamente el sistema.
Este controlador establece un procedimiento para extender la region terminal al
maximo conjunto invariante
contenido en X
h
. Por tanto el dominio de atraccion
del controlador aumenta, respecto a la formulaci on general. Ademas es de resaltar el
hecho de que el controlador estabiliza asintoticamente el sistema sin necesidad de que
se satisfaga la condicion terminal en dicho invariante.
Partiendo del ejemplo del apartado 4.4.2, se observa que el conjunto
a
es un
invariante positivo del sistema, para el cual la funcion de Lyapunov asociada V (x) =
x
T
P
a
x viene dada por P
a
= 1,1P, siendo P la matriz de Lyapunov obtenida del
problema linealizado controlado por un controlador LQR. El dominio de atraccion
asociado a esta region terminal es X
a
3
.
El dominio de atraccion del controlador se puede aumentar dicha region ponderando
la funcion de Lyapunov, de forma que para
b
= 2,0, se obtiene la region
b
notable-
mente mas grande. El controlador MPC con una funcion de coste terminal dada por
P
b
= 2,0P estabiliza asintoticamente el sistema con un dominio de atraccion mayor
X
b
3
. Pero, la ponderacion aplicada sobre el coste terminal hace que la optimalidad de
la solucion empeore dado que la funcion de coste terminal se empobrece como aproxi-
macion al coste optimo.
Aplicando en controlador propuesto, se puede conseguir estabilizar el sistema en el
dominio de atraccion X
b
3
utilizando como coste terminal V (x) = x
T
P
a
x que es mas
aproximada a la solucion optima. Para ello se considera una region terminal contractiva
de la forma
x
T
P
a
x
k
siendo = 1,1 4,667 = 5,134 y = 1,1 0,5 = 0,55. La constante indica el factor
de decrecimiento de la funcion de Lyapunov y toma un valor = 0,9223.
En la gura 4.6 se muestra el retrato de fases del sistema controlado por el MPC con
region terminal contractiva. Como se puede observar, el dominio de atraccion es X
b
3
, a
pesar que la condicion terminal tan solo se satisface en
a
. La restriccion terminal se
contrae sucesivamente partiendo de
b
hasta
a
.
En la gura 4.7 se muestra la evoluci on del sistema controlado por el MPC propuesto
con region terminal contractiva (lnea con puntos) y del sistema controlado con el
MPC general con una funcion de coste terminal adecuada V (x) = 2x
T
Px (lnea con
cuadros). La trayectoria con lnea con cruces es la evolucion del sistema con N
c
=
10, N
p
= 10 y un coste terminal cuasi innito V
30
(x). Como se ha demostrado, esta
trayectoria tiene un grado de optimalidad mayor que las otras dos, y por lo tanto
supone un comportamiento mas proximo al optimo.
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
X
3
b
b

X
3
a
Figura 4.6: Retrato de fases y dominio de atraccion del MPC con N = 3 y con region
terminal contractiva.
4.5.2. MPC con region terminal contractiva basada en inva-
riantes de control
En esta seccion se presenta una nueva formulaci on de control MPC orientada al
aumento del dominio de atraccion mediante la incorporacion como restriccion terminal
la pertenencia a una secuencia contractiva de regiones invariantes de control. Esta
formulacion del controlador MPC forma parte de las contribuciones originales de esta
tesis y ha sido publicada en (Limon Marruedo,

La idea es similar a la que se ha presentado en la seccion 4.5.1, en la que a partir
de un invariante positivo se contrae dicha region hasta alcanzar una region en la que
se satisface la condicion terminal. En este caso, se propone una generalizacion de esta
idea incorporando el concepto de regiones invariantes de control. Basandose en las
propiedades de estos conjuntos, es posible determinar una secuencia de invariantes de
control tales que permiten una formulacion contractiva del MPC.
0.25 0.2 0.15 0.1 0.05 0 0.05
0.6
0.5
0.4
0.3
0.2
0.1
0
x
1
x
2
X
3
b
b

Figura 4.7: Evolucion del sistema controlado por el MPC con N = 3, con region terminal
contractiva (puntos), con la region terminal ja
b
(cuadrados) y con un MPC con N
p
=
N
c
= 10 y V
30
(x) (cruces).
4.5.2.1. Obtencion de una secuencia de invariantes de control
Para obtener una secuencia de invariantes de control se hace uso de la teora de
conjuntos invariantes. Un compendio de deniciones y resultados de esta teora se
puede consultar en la seccion A.3 de este documento. A continuaci on se presentan
algunas de ellas que son de utilidad en esta seccion.
Un conjunto IR
n
se dice que es un invariante de control, si para cualquier
estado contenido en , existe una actuacion admisible u(x) U tal que el estado
siguiente permanece en el, f(x, u) .
La obtencion de invariantes de control esta basada en el conjunto a un paso Q().
Este conjunto viene dado por
Q() = x IR
n
: u(x) U tal que f(x, u)
es decir, el conjunto de estados para los cuales existe una actuacion admisible tal que
el estado siguiente esta contenido en .
Teniendo en cuenta lo anterior, se puede establecer la siguiente propiedad
Propiedad 4.5 Sea X un invariante de control del sistema y sea Q() su con-
junto a un paso, entonces todo conjunto tal que
Q() X (4.3)
es un invariante de control del sistema.
Esta propiedad es inmediata, considerando el principio de invariancia y la denicion
del conjunto a un paso. La interseccion con el conjunto de restricciones sobre el estado
X es necesario para garantizar que la evoluci on del sistema es admisible.
Esta propiedad se verica tambien si es un invariante positivo, pues esta basado
en la propiedad geometrica de invariancia. En general, el calculo del conjunto Q()
es muy costoso, si no imposible, debido al caracter no lineal del modelo. Pero, gracias
a la propiedad anterior, este conjunto puede sustituirse por un conjunto aproxima-
do Q
ap
(). Este conjunto aproximado debe ser lo sucientemente preciso como para
garantizar que
Q
ap
() Q()
con el n de que el conjunto = Q
ap
() X satisfaga la condicion (4.3).
De todo lo anterior se deduce que mediante el siguiente algoritmo es posible obte-
ner una secuencia de N
r
invariantes de control, partiendo de un conjunto invariante
(positivo o de control) .
1. Hacer
0
= . i 0
2. Calcular
i
= Q
ap
(
i1
) X
i1
3. Si i = N
r
ir a 5
4. Si no, hacer i i + 1 e ir a 2
5. Fin
Notese que el procedimiento para calcular Q
ap
() debe ser lo sucientemente preciso
como para que el paso 2 tenga solucion.
De este algoritmo se obtienen N
r
conjuntos invariantes de control tales que satis-
facen las siguientes propiedades
Propiedad 4.6 Sea
i
la secuencia de N
r
invariantes de control obtenidos del al-
goritmo anterior, entonces
1.
0
=
1

N
r
X.
2. Para todo x
i
existe una actuacion admisible u U tal que f(x, u)
i1
.
3.
i
S
i
(X, ).
4. Si el calculo de la region a un paso es exacta (Q
ap
() = Q()), entonces
i
=
S
i
(X, ).
Es interesante resaltar que esta secuencia de invariantes de control puede estar ni-
tamente determinada, es decir, que exista un i
tal que para todo i i
, resulta que
i
=
i+1
=
. En consecuencia, la secuencia de invariantes de control dejara de

crecer. Esto puede ser a consecuencia de la determinacion nita de S
i
(X, ), es de-
cir, de la propia naturaleza del sistema y de las restricciones, o bien por el caracter
aproximado del calculo de Q
ap
().
Para el caso de sistemas lineales sujetos a restricciones politopicas, existen pro-
cedimientos numericamente ecientes para realizar el calculo del conjunto Q() con
exactitud (Blanchini 1999, Kerrigan 2000). En el caso de sistemas no lineales, no ex-
isten procedimientos para el calculo de estos conjuntos, y es un tema abierto en la
comunidad investigadora. En el apendice A de esta tesis, se propone un metodo para
su calculo aproximado basado en la obtencion de una envoltura convexa y en la resolu-
cion de problemas de optimizacion. La complejidad del procedimiento obtenido para
el calculo de estos conjuntos no es crtico en la implementacion del controlador pues el
calculo se realiza fuera de lnea, formando parte de la etapa de dise no del controlador.
4.5.2.2. MPC con restriccion terminal contractiva
Sea una funcion de Lyapunov de control V (x) y un conjunto invariante de control
tales que satisfacen la hipotesis 3.1, y por lo tanto pueden utilizarse para sintonizar
un controlador MPC general con estabilidad garantizada.
Considerese que, a partir del conjunto invariante de control , se calcula una secuen-
cia de N
r
invariantes de control
i
utilizando el algoritmo propuesto en el apartado
anterior. A partir de esta secuencia se puede formular el siguiente problema de opti-
mizacion MPC:
mn
u
F
(k)
J
N
(x
k
, u
F
(k))
s.a
u(k +j[k) U j = 0, , N 1
x(k +j[k) X j = 0, , N 1
x(k +N[k)
Nrk
si k < N
r
x(k +N[k) si k N
r
J
N
(x
k
, u
F
(k)) =
N1
i=0
L(x(k + i[k), u(k + i[k)) +V (x(k + N[k))
Como se puede observar, la unica variacion que tiene el MPC propuesto, respecto
a la formulacion general del MPC esta en la restriccion terminal. Para k < N
r
, la
restriccion contractiva fuerza al estado terminal a estar contenido en el invariante de
control
Nrk
. El caracter contractivo de esta secuencia hace que la region terminal vaya
evolucionando a una region menor, hasta que en el instante N
r
, esta region terminal es
el invariante de control .
La solucion de este problema depende del instante en el que nos encontremos, por
lo que, para k < N
r
, la ley de control MPC es variante en el tiempo. A partir de N
r
,
coincide con la formulacion general del MPC. Ademas, cabe destacar que este problema
es computacionalmente similar al MPC general, si bien requiere tener almacenada la
secuencia de invariantes de control.
Antes de demostrar la estabilidad del controlador propuesto, es necesario establecer
el siguiente lema.
Lema 4.7 Sea
i
una secuencia de invariantes de control calculados a partir del
algoritmo propuesto. Entonces se satisface que
S
N1
(X,
i
) S
N
(X,
i1
)
Demostracion:
De las propiedades de la secuencia de invariantes de control se tiene que
i
= Q
ap
(
i1
) X Q(
i1
) X = S
1
(X,
i1
)
Dado que el conjunto estabilizable en N pasos verica la siguiente propiedad (vease la
seccion A.3)
S
N
(X, ) = S
Nj
(X, S
j
(X, ))
se deduce que
S
N1
(X,
i
) S
N1
(X, S
1
(X,
i1
)) = S
N
(X,
i1
)
con lo que se demuestra el lema.
Basandose en este lema, se demuestra que el nuevo controlador propuesto estabiliza
asintoticamente el sistema en todo estado inicial para el cual el problema de opti-
mizacion tiene solucion factible.
Teorema 4.8 (Estabilidad asint otica)
Sea una funcion de Lyapunov de control V (x) y un conjunto invariante de control
asociado tales que satisfacen la hipotesis 3.5.
Sea una secuencia de N
r
invariantes de control
i
obtenida a partir del conjunto
invariante de control utilizando el algoritmo propuesto.
Entonces el controlador MPC con restriccion terminal contractiva estabiliza asintoti-
camente el sistema con un dominio de atraccion S
N
(X,
N
r
).
Demostracion:
Factibilidad:
Se procede por induccion.
Sea el estado inicial tal que x
0
S
N
(X,
Nr
), entonces por denicion de conjunto esta-
bilizable, existe una secuencia de actuaciones admisibles tal que el sistema es conducido
hasta el conjunto
N
r
en N pasos siguiendo una evolucion admisible. Por tanto el pro-
blema de optimizacion es factible en ese instante. Dado que no existe discrepancias
entre el modelo de prediccion y el comportamiento del sistema,
x
1
= f(x
0
, u
(0[0)) S
N1
(X,
N
r
)
Del lema 4.7 se deduce que x
1
S
N
(X,
N
r
1
) y por lo tanto, el controlador es factible
en k = 1.
Considerese que el problema es factible en k < N
r
, es decir, que x
k
S
N
(X,
N
r
k
).
Entonces la solucion optima garantiza que
x
k+1
= f(x
k
, u
(k[k)) S
N1
(X,
Nrk
)
Del lema 4.7 se deduce que x
k+1
S
N
(X,
N
r
k1
) y por lo tanto, el controlador
es factible en k + 1.
Por induccion se inere que el problema es factible para todo k N
r
.
Notese ademas que x
Nr
S
N
(X, ). Por tanto para k > N
r
la factibilidad esta garan-
tizada por la estabilidad del MPC general.
Convergencia:
Como se ha visto anteriormente, la evolucion del sistema es tal que es factible a lo
largo de la evoluci on del sistema y ademas, para k > N
r
, el controlador coincide con la
formulacion general del MPC y es factible. Por lo tanto el sistema a partir de entonces
evoluciona asintoticamente hacia el punto de equilibrio.
Corolario 4.9 Dado que la estabilidad y la convergencia estan basadas en la factibili-
dad del problema, la formulacion suboptima de este controlador, tambien garantiza la
convergencia, bajo las hipotesis del teorema anterior, manteniendo el mismo dominio
de atraccion.
El objetivo nal de este controlador es aumentar el dominio de atraccion. Esta
propiedad se establece en el siguiente corolario.
Corolario 4.10 Sea la secuencia de invariantes de control tal que
Nr
y sea el
horizonte de control menor que el ndice de determinacion del conjunto estabilizable
S
(X, ). Entonces el dominio de atraccion del MPC propuesto es mayor que el del
controlador MPC general. Es decir
S
N
(X, ) S
N
(X,
N
r
)
Demostracion:
Dado que
Nr
y que el horizonte de control es menor que el ndice de determinacion
N < i
, es inmediato que
S
N
(X, ) S
N
(X,
N
r
) S
N+N
r
(X, )
Por lo tanto, en el caso en que el conjunto S
(X, ) no este nitamente determinado, o

bien el horizonte de control N sea inferior al ndice de determinacion i
, el controlador
propuesto aumenta el dominio de atraccion.
Notese que para un horizonte de control tal que N i
se tiene que S
N
(X, ) =
S
N+N
r
(X, ) = S
i
(X, ) = S
(X, ). Por lo tanto, del resultado anterior se deduce

que S
N
(X, ) = S
N
(X,
N
r
), por lo que el dominio de atraccion no aumenta al incor-
porar la secuencia.
Es interesante resaltar que, en el caso en que se pudiese calcular con exactitud el
conjunto Q(), entonces la secuencia de invariantes de control es
i
= S
i
(X, ). Por lo
que el dominio de atraccion del controlador es S
N+N
r
(X, ). Por tanto, tiene el mismo
dominio de atraccion que un MPC general con horizonte de control N + N
r
, pero
utilizando tan solo un horizonte de control N. Esto es particularmente interesante para
sistemas lineales sujetos a restricciones politopicas, para los cuales se puede calcular
estos conjuntos con exactitud.
El precio a pagar por el aumento del dominio de atraccion es una perdida de opti-
malidad del controlador en los primeros N
r
periodos de muestreo. Esto se debe a que
el coste terminal no se puede considerar como una aproximacion del coste optimo fuera
del conjunto .
En la sintonizaci on del controlador se han utilizado los siguientes parametros: el
coste de etapa cuadratico con
Q =
_
_
10 0
0 1
_
_
y R = 1. Como region terminal y coste terminal se ha utilizado la correspondiente
a un controlador local lineal y un factor de ponderacion = 2 (vease el ejemplo del
apartado 4.3.1.1).
Para la aplicacion del controlador propuesto es necesario calcular una secuencia
de invariantes de control del sistema. Para ello se ha seguido el algoritmo propuesto
y como conjuntos invariantes de control se han tomado politopos por la sencillez de
tratamiento matematico y la exibilidad que permiten. La unica restriccion que supone
esta consideracion es que los conjuntos obtenidos son aproximaciones convexas de los
conjuntos reales, que no tienen por que serlo. El procedimiento para calcular la aprox-
imacion al conjunto a un paso a partir de politopos, Q
ap
() se basa en el calculo de un
politopo interior al conjunto Q().
Para iniciar el algoritmo se ha calculado un politopo que es un invariante positivo del
sistema, por ser interior al invariante V (x) y contener al conjunto V (x) .
El conjunto obtenido se denota
0
. A partir de este conjunto se ha calculado una
secuencia de 3 conjuntos invariantes de control denotados
1
,
2
y
3
, que se muestran
en la gura 4.8.
0.3 0.2 0.1 0 0.1 0.2 0.3
1
0.8
0.6
0.4
0.2
0
0.2
x
1
x
2
3
Figura 4.8: Secuencia de invariantes de control
i
.
El dominio de atraccion del MPC con region terminal contractiva y con N
p
= N
c
= 3
(X
c
3
) es el conjunto de estados que pueden alcanzar la region
3
en N
c
= 3 pasos, es
decir, X
c
3
= S
3
(X,
3
). En la gura 4.9 se muestra el dominio de atraccion X
c
3
(lnea
con cruces) junto con la secuencia de invariantes de control. Tambien se ha trazado
el dominio de atraccion del controlador MPC con N
c
= 3 y con region terminal el
invariante . Como se puede observar, el nuevo dominio de atraccion es mayor que
el del MPC general. Es importante resaltar que este aumento no implica un mayor
coste computacional del predictivo. Se ha conseguido gracias a la incorporacion de la
secuencia de invariantes de control, cuyo calculo se realiza en la etapa de dise no del
controlador, fuera de lnea.
En la gura 4.10 se muestra el retrato de estados del sistema controlado con el
MPC con restriccion terminal contractiva propuesta en esta seccion. En la gura 4.11
se han trazado las curvas de evolucion del sistema a lo largo del tiempo, junto con la
actuacion. Es interesante resaltar que la estabilidad no esta basada en el decrecimiento
del coste optimo durante las 3 primeras muestras, pudiendo aumentar el coste optimo.
A partir de entonces, una vez que la region terminal se ha contrado hasta
0
, el coste
optimo s decrece.
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
1.5
1
0.5
0
0.5
x
1
x
2
3
X
3
c
X
3
Figura 4.9: Dominio de atraccion del MPC con restriccion terminal contractiva (X
c
3
), frente
al del MPC general (X
3
).
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
1.5
1
0.5
0
0.5
x
1
x
2
3
X
3
c
Figura 4.10: Trayectorias del sistema controlado con el MPC con restriccion terminal con-
tractiva.
0 5 10 15 20 25 30 35 40 45 50
0.1
0.05
0
0.05
0.1
x
1
0 5 10 15 20 25 30 35 40 45 50
1.5
1
0.5
0
x
2
0 5 10 15 20 25 30 35 40 45 50
0.5
0.5
1.5
2.5
3.5
muestras
u
Figura 4.11: Evolucion del sistema controlado con el MPC con restriccion terminal contrac-
tiva.
4.6. Aumento del dominio de atraccion del MPC
sin restriccion terminal
En el captulo anterior se caracterizo una region vecindad del origen en la cual el
MPC sin restriccion terminal estabiliza asintoticamente el sistema. Lo mas interesante
de la caracterizacion de la region es poder llevar a cabo el analisis de que factores
inuyen sobre esta con el n de poder aumentar el dominio de atraccion del MPC
sin restriccion terminal. Este analisis es el que se presenta en esta seccion y es una
aportacion original de esta tesis.
Como se demostro en la seccion 3.9, la region en la que el controlador MPC sin
restriccion terminal estabiliza asintoticamente el sistema viene dada por
= x (
N
(X) : J
N
(x) L(x, K
MPC
(x)) + (N 1)d +
siendo la region terminal
= x IR
n
: V (x)
y siendo la constante d tal que L(x, K
MPC
(x)) d para todo estado x / , donde
K
MPC
(x) es la solucion optima del controlador en x.
La condicion de pertenencia al conjunto admisible en N pasos, (
N
(X), pone de
maniesto que este conjunto existe en todos aquellos estados factibles, en los que existe
una secuencia de N actuaciones admisibles tal que la evoluci on del sistema es admisible
120 4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal
,y ,por lo tanto, para los cuales el J
N
(x) esta denido. Notese que en el caso en el que no
haya restricciones en el estado, X = IR
n
se tiene que (
N
( IR
n
) = IR
n
, por lo que el coste
optimo estara denido en todo IR
n
. Por otro lado, dado que la solucion optima alcanza
la region terminal en N pasos para todo x , entonces x S
N
(X, ) (
N
(X). En
consecuencia S
N
(X, ).
Esta region es un invariante positivo del sistema en bucle cerrado, y por lo tanto
es un dominio de atraccion del controlador. No obstante, esta region no es el maximo
dominio de atraccion del controlador, pues la condicion bajo la que se ha determinado
dicha region es conservadora.
El objetivo de esta seccion es analizar como se puede ajustar un controlador predic-
tivo para obtener una region mayor, y por lo tanto, un mayor dominio de atraccion
del controlador. Esta region esta caracterizada por cuatro elementos: el coste optimo (y
en consecuencia todos aquellos parametros que inuyan sobre su valor, como el coste
de etapa L(x, u), etc.), el horizonte de control N, la constante d y la constante . En
lo que sigue se proponen ciertas medidas para conseguir una mayor region .
1. Aumentar la constante :
Esta medida se puede obtener, por ejemplo, aumentando la region terminal (cal-
culando el controlador local con este n o bien con un coste de etapa con menor
valor) o bien ponderando el coste terminal.
En el caso en el que se aumente la region terminal se aumenta tanto como d,
pues, dado que la funcion de coste de etapa es denida positiva, al aumentar el
tama no de puede aumentar el mnimo coste de etapa de los estados que no
pertenecen a dicha region. Por ejemplo en el caso del coste de etapa cuadratico
y de la region terminal calculada a partir de un controlador lineal siguiendo el
procedimiento propuesto en la seccion 3.7, el parametro d viene dado por
d =
min
(P
1/2
QP
1/2
)
Para demostrar esta armacion, se comprueba que para todo x / , es decir, tal
que x
T
Px , se verica que
x
T
Qx > x
T
Qx
min
(P
1/2
QP
1/2
)(x
T
Px )
= x
T
_
Q
min
(P
1/2
QP
1/2
)P
_
x +
min
(P
1/2
QP
1/2
)
= x
T
P
1/2
_
P
1/2
QP
1/2
min
(P
1/2
QP
1/2
)I
_
P
1/2
x
+
min
(P
1/2
QP
1/2
)

min
(P
1/2
QP
1/2
)
siendo I la matriz identidad.
De lo anterior se deduce el tama no de la region aumentara al aumentar .
J
N
(x) L(x, u
) +
_
min
(P
1/2
QP
1/2
)(N 1) + 1
_
Esto se puede conseguir mediante la ponderacion del coste terminal como se ha

comentado en secciones anteriores. La ponderacion de la funcion de Lyapunov,
relaja la condicion terminal a imponer en la region, y por lo tanto esta region
aumenta, es decir, la constante aumenta.
2. Aumentar la ponderacion del coste terminal:
Como se ha comentado anteriormente, la ponderacion de la funcion de Lyapunov
asociada al invariante (y en consecuencia del coste terminal) aumenta la region
terminal, si bien, a partir de un cierto valor, esta region deja de crecer. A un
en esta situacion, la ponderacion de la funcion de coste terminal en el funcional
aumenta el dominio de atraccion del controlador MPC sin restricciones.
Considerese, que el nuevo coste terminal es V
(x) = V (x), siendo 1. En-

tonces la region terminal , se puede expresar en terminos del coste terminal
como
= x IR
n
: V
(x)
En este caso, el dominio de atraccion del controlador es
= x (
N
(X) : J
N
(x) L(x, u
) + (N 1)d +
Notese que la ponderacion puede aumentar el dominio de atraccion y en conse-
cuencia afectar tambien al valor de la constante d. Pero, a un en el caso en que
la region no crezca, y la constante d no se vea afectada por , el termino
aumenta, lo que produce un aumento del dominio de atraccion.
Por otra parte la ponderacion del coste terminal puede aumentar el coste optimo
J
N
(x), con lo que el aumento de la region terminal puede no ser tan acusado como
se puede esperar. Sin embargo, es razonable pensar que esta medida aumente el
dominio de atraccion, pues la ponderacion del coste terminal se puede considerar
como una funcion de barrera de la restriccion terminal nula. El caracter denido
positivo de la funcion de coste terminal fuerza a la solucion optima a que el estado
terminal este lo mas cerca posible del origen.
En (Parisini & Zoppoli 1995) se calcula una funcion de Lyapunov V (x) = x
T
Px
similar a la obtenida en el procedimiento de calculo de la region terminal pro-
puesto en 3.7. Basandose en esta, considera como coste terminal esta funcion
ponderada ax
T
Px y demuestra que existe una terna de valores (a, P, N) tales
que el controlador MPC sin restriccion terminal estabiliza cualquier estado a-
sintoticamente estabilizable. Este resultado se puede interpretar a la luz de los
resultados obtenidos.
En este caso, la ponderacion del coste terminal introducida por los autores tiene
un triple efecto, satisfacer la hipotesis 3.5, aumentar la region terminal y au-
mentar el dominio de atraccion del controlador sin restriccion terminal hasta
lograr estabilizar cualquier estado contenido en S
N
(X, ). Por ultimo, como se
demostro anteriormente, existe un horizonte N nito tal que el MPC general
estabiliza un estado asintoticamente estabilizable.
A la luz de esto se podra extender el resultado de (Parisini & Zoppoli 1995)
al caso de la formulaci on general del MPC, de forma que existe una pareja de
valores (, N) para los cuales el MPC sin restriccion terminal estabiliza cualquier
estado asint oticamente estabilizable.
3. Aumentar el horizonte de control N:
Esta medida aumenta la region por dos motivos principales:
a) porque aumenta el sumando (N 1)d.
b) porque disminuye el coste optimo J
N
(x).
Por lo tanto habra un mayor conjunto de estados que satisfacen la condicion. Es
por tanto beneciosa, pero notese, que a costa de aumentar el coste computacional
del controlador.
4. Aumentar el horizonte de prediccion N
p
:
Como se coment o anteriormente, un aumento del horizonte de prediccion N
p
=
N +M con M 1, se puede considerar como un MPC general con un horizonte
de control N y con una funcion de coste terminal V
M
(x) y una region terminal
M
= x IR
n
: V
M
(x) S
h
M
(X, ). En este caso la region vendra dada
por J
N
(x) L
(x) + (N 1)d + .
La region terminal esta contenida en
M
, por tanto, este aumento de la region
terminal, produce un aumento de la constante d. Ademas es muy posible que la
constante sea mayor que . De hecho, en el caso en el que no haya restricciones,
esta constante puede tomarse = Md
+ , siendo d
la constante d calculada
para .
En este caso la region puede aumentar por tres motivos:
a) porque .
b) porque aumenta d.
c) porque el coste optimo se reduce al aumentar el horizonte de prediccion.
Para ilustrar los resultados obtenidos se va a calcular el dominio de atraccion del
controlador sin restricciones del reactor utilizado hasta ahora. Para estos ejemplos se
ha tomado un coste de etapa cuadratico con una ponderacion dada por
Q =
_
_
10 0
0 10
_
_
y R = 1. Como region terminal y coste terminal se ha utilizado la considerada
inicialmente en los ejemplos (vease el ejemplo del apartado 4.3.1.1). La constante d,
que es el mnimo coste de etapa de los estados que no pertenecen a la region terminal,
es
d = 0,3316
Por defecto, el horizonte de control considerado es N
c
= 3 y el de prediccion N
p
= 3.
En este caso el dominio de atraccion es la region
a
= x (
3
(X) : J
3
(x) L(x, K
MPC
(x)) + 9,9984
siendo 2d + = 9,9984. Esta region, comparada con el dominio de atraccion del
controlador con restricciones X
3
se muestra en las guras de este ejemplo.
Con el n de comprobar la inuencia de las distintas medidas propuestas, se van a
mostrar los dominios de atraccion en diversas situaciones:
1. Aumento N
c
:
Se calcula el dominio de atraccion con un horizonte de control y de prediccion
N
p
= N
c
= 4. En este caso la region viene dada por
b
= x (
4
(X) : J
4
(x) L(x, u
) + 10,33
siendo 3d + = 10,33. En la gura 4.12 se muestra este dominio de atraccion
b
comparado con el correspondiente a N
c
= 3, que es
a
. Como se puede observar,
el dominio de atraccion aumenta, sin bien el aumento es peque no.
2. Ponderando la funcion de coste terminal:
Se ha calculado el dominio de atraccion considerando como coste terminal 10
veces el coste terminal original. Esta region viene dada por:
b
= x (
3
(X) : J
3
(x) L(x, u
) + 94,016
siendo 2d + 10 = 94,016.
Esta medida, como se puede observar en la gura 4.13, produce un aumento
considerable del dominio de atraccion, alcanzando casi la totalidad del dominio
de atraccion maximo X
3
.
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
X
3

b

Figura 4.12: Aumento del dominio de atraccion del MPC sin restriccion terminal al aumentar
N
c
.
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
b

X
3

la ponderacion del coste terminal.
3. Aumento del horizonte de prediccion:
Esta medida produce un aumento de la region principalmente porque el coste
optimo en un determinado estado es menor al aumentar N
p
. Para ilustrar esto,
se ha considerado un controlador MPC con un horizonte de prediccion N
p
= 30,
por lo que el dominio de atraccion del nuevo controlador viene dado por:
b
= x (
3
(X) : J
3,30
(x) L(x, u
) + 9,9984
En la gura 4.14 se muestra los dominios de atraccion de los controladores. Como
se puede observar, el dominio aumenta como consecuencia de la consideracion de
un mayor horizonte de prediccion. En esta gura se observa que
b
no esta con-
tenida en X
3
, lo cual no es sorprendente pues el dominio de atraccion maximo
con N
p
= 30 es bastante mayor.
0.4 0.3 0.2 0.1 0 0.1 0.2 0.3
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
b

X
3
el horizonte de prediccion.
4.7. Conclusiones
En este captulo se ha abordado el problema del aumento del dominio de atraccion
del controlador MPC. Este problema es relevante, pues permite aumentar el conjunto
de estados estabilizables por el controlador.
Para ello se proponen dos metodos fundamentales: aumentando el horizonte de
control o bien aumentando la region terminal. Entre ellos, se opta por el segundo,
pues el primero incurre en un aumento del coste computacional. En este sentido se
han propuesto una serie de medidas para el aumento del dominio de atraccion como
son: el incremento del horizonte de prediccion, la variacion de la funcion de coste
terminal mediante la ponderacion del coste terminal o la incorporacion como coste
terminal de la funcion V
M
(x). Por ultimo se han propuesto dos nuevos controladores
MPC que aumentan el dominio de atraccion sustituyendo la restriccion terminal por
una restriccion terminal contractiva. Esta restriccion contractiva puede estar basada
en invariantes positivos o en invariantes de control.
El analisis realizado, y en particular las nuevas formulaciones del MPC son aporta-
ciones originales de esta tesis. El controlador basado en conjuntos invariantes de control
ha sido publicado en (Limon Marruedo,

Por ultimo se ha analizado el dominio de atraccion del MPC sin restriccion terminal,
proponiendose una serie de medidas encaminadas a aumentar dicha region. Este analisis
tambien es una de las aportaciones originales de esta tesis.
Con este captulo se cierra la primera parte de la tesis dedicada al analisis de
controladores MPC en ausencia de incertidumbres. Las discrepancias entre el modelo
de prediccion y el modelo real hacen que los resultados obtenidos hasta ahora puedan no
ser validos, lo que conduce a la necesidad de analizar la robustez de estos controladores,
es decir, a analizar bajo que condiciones el controlador mantiene la estabilidad del
sistema incierto en bucle cerrado. Este analisis se lleva a cabo en el siguiente captulo.
Captulo 5
Analisis de robustez del MPC
nominal
5.1. Introduccion
Como se ha visto en los captulos anteriores, el control predictivo esta basado en la
determinacion de la evolucion futura del sistema, para lo cual es necesario disponer de
un modelo que exprese la dinamica del sistema a controlar. Estas predicciones permiten
estimar el coste de una determinada secuencia de actuaciones, y comprobar si el sistema
se mantendr a dentro de una serie de restricciones impuestas.
Sin embargo, es muy difcil, si no imposible, la obtencion de un modelo de un sis-
tema tal que caracterice el comportamiento del sistema real con total exactitud. Esto
se puede deber a diversas causas como la presencia de fenomenos inmodelados, la sim-
plicacion de modelos, la consideracion de parametros inexactos o bien el efecto de
perturbaciones externas. Por tanto, todo modelo tiene asociado unos errores en el mo-
delado o incertidumbres, que hacen que exista un discrepancia entre el comportamiento
predicho y el comportamiento futuro del sistema real.
Estas discrepancias en el modelo son trascendentales en el dise no de controladores
basados en este como en el caso del control MPC. Las incertidumbres pueden provocar
los siguientes efectos sobre el controlador MPC:
(i) La actuacion obtenida, basada en un modelo sin incertidumbres, puede no ser
optima para el sistema real incurriendo en un coste mayor, y por tanto, en un
peor comportamiento del sistema.
127
(ii) El sistema real puede evolucionar a estados en los que el control MPC no es
factible, es decir, en los que es imposible satisfacer todas las restricciones del
sistema y por tanto el problema de optimizacion no tendra solucion posible. Es
decir, que las incertidumbres pueden hacer que el sistema, en su evoluci on, aban-
done el dominio de atraccion del controlador, fuera del cual este no esta denido.
(iii) La evolucion del sistema podra hacerse inestable, a pesar del correcto dise no del
controlador con el modelo sin incertidumbres.
Por tanto es de relevante importancia la consideracion de dichas incertidumbres en
el dise no del controlador, con el n primordial de garantizar la estabilidad del sistema
y la satisfaccion de las restricciones impuestas.
Esto conduce a dos cuestiones fundamentales en el control: la primera es el anali-
sis de la estabilidad robusta del sistema en bucle cerrado, es decir, la determinacion
del grado de incertidumbre que puede tener un sistema de forma que el controlador
dise nado para el sistema nominal conserve la estabilidad en bucle cerrado. La segunda
cuestion es el dise no robusto, en el cual, dado un sistema con un cierto grado de in-
certidumbres, se dise na un controlador tal que garantice la estabilidad del sistema en
bucle cerrado, la satisfaccion de las restricciones y a ser posible, ciertas caractersticas
en su comportamiento.
Este captulo se centra en el primer aspecto: en el analisis de la robustez. En la
seccion 2.6.2 se ha presentado un balance de los resultados existentes en este campo,
los cuales se pueden agrupar en dos grandes grupos: unos basados en la optimalidad
del controlador (Glad 1987, Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni
& Sepulchre 1997) y otros basados unicamente en la teora de Lyapunov. El analisis
aqu realizado sigue la segunda lnea.
En (Scokaert et al. 1997) se analiza la estabilidad robusta de los controladores MPC
con horizonte nito para sistemas en tiempo discreto con restricciones bajo incertidum-
bres aditivas que decaen con el tiempo. Este analisis se orienta a la estabilidad del MPC
cuando se a nade un observador para estimar los estados del sistema, suponiendo que el
error en la estimacion de los estados decae con el tiempo. Basandose en las propiedades
de los sistemas exponencialmente estables, y bajo la continuidad Lipschitz de la ley de
control, demuestra que el controlador MPC soporta cierto grado de incertidumbre.
En (De Nicolao et al. 1998) se presenta un controlador MPC con restriccion terminal
y coste terminal respondiendo a la formulaci on general del MPC. Tambien se hace
un analisis de la robustez siguiendo la lnea de (Scokaert et al. 1997), considerando
incertidumbres aditivas que decaen y cierta condicion de continuidad sobre el coste
optimo.
Captulo 5. Analisis de robustez del MPC nominal 129
En la misma lnea se encuentra (Santos & Biegler 1999), en el cual, desde un punto
de vista de la sensibilidad del problema de optimizacion, se prueba que el controlador
MPC con restriccion terminal nula y sin restricciones en los estados soporta cierto
grado de robustez.
En este captulo se aborda el analisis de la estabilidad robusta del controlador MPC
general. En una primera parte se incorpora la teora de Lyapunov y la teora de con-
juntos invariantes
1
al analisis de robustez de sistemas con incertidumbres simplemente
acotadas, es decir, que no tienen por que decaer. Esto generaliza los resultados de
(Scokaert et al. 1997) e incorpora nuevos aspectos:
(i) Se consideran incertidumbres aditivas acotadas (que no decaen).
(ii) Se simplican los resultados y se suavizan las condiciones a imponer sobre el
sistema.
(iii) Se cuantica el grado de incertidumbres que soporta el sistema.
(iv) Se analiza la satisfaccion robusta de las restricciones.
Estos resultados han sido publicados en (Limon Marruedo,

Alamo & Camacho 2002c)
y constituyen una de las aportaciones originales de esta tesis.
En una segunda parte de este captulo, se generaliza el analisis anterior incorporando
los conceptos de estabilidad entrada a estado. Esto permite considerar incertidumbres
parametricas y extender las condiciones de continuidad Lipschitz del coste optimo
y estabilidad exponencial del sistema a la suavidad de dicha funcion y estabilidad
asintotica del controlador. La incorporacion de la estabilidad entrada a estado en el
analisis de la estabilidad robusta del MPC arroja mucha luz sobre el problema y es
otra de las aportaciones originales de esta tesis.
La organizacion de este captulo se ilustra en el siguiente diagrama
5.2. Sistemas con incertidumbres aditivas
Sea un sistema descrito por un modelo en tiempo discreto, no lineal con incertidum-
bres aditivas, de la forma
x
k+1
= f(x
k
, u
k
) + w
k
(5.1)
1
En el apendice A se presenta un compendio de resultados de cada uno de estos campos.
130 5.2. Sistemas con incertidumbres aditivas
Robustez
del MPC
Estabilidad
robusta
Factibilidad
robusta
Estabilidad
entrada estado
Incertidumbres
paramtricas
coste ptimo
suave
Teora de
Lyapunov
Incertidumbres
aditivas
coste ptimo
Lipschitz
MPC
subptimo
Figura 5.1: Organizacion del captulo 5
siendo el vector de estados del sistema x
k
IR
n
y las actuaciones u
k
IR
m
en el
instante k. El vector w
k
IR
n
representa las incertidumbres sobre el sistema. El unico
conocimiento que se tiene de las incertidumbres es que estan acotadas, de forma que
w
k
W (5.2)
siendo W un conjunto compacto en IR
n
.
El sistema esta sometido a una serie de restricciones tanto en las actuaciones como
en los estados del sistema
x
k
X (5.3)
u
k
U (5.4)
donde X IR
n
y U IR
m
son conjuntos compactos, tales que el origen esta contenido
en ellos.
El modelo
x
k+1
= f(x
k
, u
k
) (5.5)
describe el comportamiento del sistema en caso de no haber incertidumbres. Este mo-
delo se denomina modelo nominal del sistema y es el que se utiliza como modelo de
prediccion en el controlador MPC.
En la literatura relativa a MPC es frecuente el modelado de las incertidumbres como
incertidumbres aditivas (Mayne 2000, Michalska & Mayne 1993, De Nicolao et al. 1998),
pues son sencillas de identicar, mas faciles de tratar que otras posibles representaciones
de las incertidumbres y ademas permiten modelar un amplio espectro de discrepancias
en el modelo. Para ello basta comprobar que las incertidumbres aditivas representan
la diferencia entre el comportamiento del modelo nominal y el comportamiento real
del sistema.

Estas pueden representar perturbaciones sobre el estado del sistema o
discrepancias entre modelos que dependan del estado o de las salidas del sistema.
As supongase un sistema real cuyo modelo es x
k+1
=

f(x
k
, u
k
), que se describe por un
modelo nominal x
k+1
= f(x
k
, u
k
), entonces
x
k+1
=

f(x
k
, u
k
) = f(x
k
, u
k
) + f(x
k
, u
k
)
y por lo tanto se puede tomar una incertidumbre w
k
y un conjunto W tales que
w
k
=

f(x
k
, u
k
) f(x
k
, u
k
) = f(x
k
, u
k
) W, x
k
X, u
k
U
Este tipo de incertidumbres proveen una informacion poco precisa del compor-
tamiento de la planta real. Para obtener una mejor descripcion de este, es necesario
obtener un mejor modelo de las incertidumbres. Esto se podra hacer considerando
incertidumbres estructuradas. La estructuracion provee una aproximaci on mas precisa
del comportamiento real del sistema y puede permitir obtener resultados menos con-
servadores. Sin embargo, la determinacion de este tipo de incertidumbres puede ser una
tarea difcil en sistemas no lineales. Las incertidumbres aditivas proveen un modelo sen-
cillo de incertidumbres que ademas facilita el analisis del comportamiento del sistema
incierto. El precio a pagar es en general, la obtencion de resultados conservadores. La
consideracion de incertidumbres estructuradas constituye una lnea de trabajo futuro.
5.3. Estabilidad de sistemas no lineales con incer-
tidumbres aditivas sujetos a restricciones
En esta seccion se aborda el analisis de estabilidad robusta de un sistema no lineal
autonomo con incertidumbres aditivas
x
k+1
= F(x
k
) + w
k
sujeto a la restriccion x
k
X IR
n
. El vector w
k
representa las incertidumbres
aditivas tales que w
k
W. El sistema nominal viene dado por
x
k+1
= F(x
k
)
y el origen es un punto de equilibrio, por lo que F(0) = 0.
Se parte de la base de que el sistema es estable y satisface las restricciones impuestas
en ausencia de incertidumbres. En el caso que el sistema fuese incierto, se estudia bajo
que condiciones se conserva la estabilidad del sistema y ademas se siguen satisfaciendo
las restricciones.
132 5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas
Esto es esencial para el analisis de sistemas en bucle cerrado. As, si un sistema no
autonomo dado por (5.5) sujeto a las restricciones (5.4) y (5.3) se controla por una
ley u
k
= h(x
k
), el sistema en bucle cerrado es un sistema autonomo que responde al
modelo
x
k+1
= f(x
k
, h(x
k
)) = F(x
k
)
donde el estado esta restringido al conjunto X
h
, tal que
X
h
= x X : h(x) U
Si bien la ley de control se dise na para que estabilice el sistema nominal satisfaciendo
las restricciones a las que esta sometido, las incertidumbres pueden hacer perder la
estabilidad o la factibilidad que el comportamiento nominal presenta. En esta seccion
se establecen condiciones bajo las cuales se conservan ambas propiedades del sistema.
Dado que el unico conocimiento que se tiene de las incertidumbres que presenta
el sistema, w
k
, es que estan acotadas, el origen deja de ser un punto de equilibrio del
sistema incierto. De hecho lo que se puede esperar es que el sistema evolucione hasta
una determinada vecindad del origen en la cual permanece connado. Por tanto las
deniciones clasicas de estabilidad, tales como estabilidad asint otica o exponencial, no
pueden aplicarse a este tipo de sistemas. Tampoco la teora clasica de Lyapunov es
aplicable por este mismo motivo. Esto nos lleva a utilizar una denicion de estabilidad
apropiada a este caso.
Denicion 5.1 Un sistema es asintoticamente acotado al nal si el sistema evoluciona
a un conjunto acotado, es decir, si existen unas constantes positivas b y c tales que
para todo (0, c), existe un k
tal que para todo estado inicial |x

0
| se tiene que
|x
k
| b k > k
.
Esta denicion es una adaptacion a sistemas discretos de la utilizada en (Khalil 1996).
Para el analisis de estabilidad de sistemas con incertidumbres es importante, como
se apunta en (Scokaert et al. 1997), el concepto de continuidad Lipschitz de una funcion.
Denicion 5.2 Sea una funcion g(z) : IR
p
IR
q
, se dice que es localmente Lipschitz
en un conjunto Z IR
p
si para todo z
1
, z
2
Z, existe una constante 0 < L < tal
que se verica
|g(z
1
) g(z
2
)| L|z
1
z
2
|
La constante L se denomina constante de Lipschitz.
Es importante resaltar el hecho de que si una funcion es Lipschitz en una determina-
da norma, entonces, en virtud de la equivalencia entre normas, es tambien Lipschitz
en cualquier otra norma. Sin embargo, el valor que toma la constante de Lipschitz
s depende de la norma elegida.
La continuidad Lipschitz garantiza que la discrepancia de una funcion entre dos
puntos esta acotada y depende, ademas, de la distancia entre ellos. Esta propiedad es
mas fuerte que la continuidad pero mas debil que la derivabilidad.
Propiedad 5.3 (Khalil 1996) Sea la funcion g(z) : IR
p
IR
q
continua en una region
Z IR
p
y tal que existe
g
z
y es continua en Z, entonces dicha funcion es localmente
Lipschitz en Z.
Esta condicion es suciente, pero no necesaria, pues no toda funcion Lipschitz tiene
que ser derivable.
Basandose en estas propiedades se presenta en esta tesis el siguiente teorema de
estabilidad.
Teorema 5.4 (Estabilidad robusta)
Sea el sistema autonomo x
k+1
= F(x
k
) tal que el origen es un punto de equilibrio del
sistema y por tanto F(0) = 0.
Sea V (x) una funcion de Lyapunov asociada al sistema tal que
a|x|
V (x) b|x|
V (F(x)) V (x) c|x|
siendo a, b, c constantes positivas y > 0. Ademas V (x) es Lipschitz en una vecindad

del origen
r
= x IR
n
: V (x) r
Entonces existe una constante > 0 tal que para toda incertidumbre
w
k
B
= w
k
IR
n
: |w
k
| <
el sistema incierto x
k+1
= F(x
k
) + w
k
es asintoticamente acotado al nal, para todo
estado inicial x
0

r
.
Demostracion:
Estabilidad:
La demostracion se hace utilizando conceptos de la teora de conjuntos invariantes
2
tales como el conjunto robusto a un paso

Q() y la propiedad que este conjunto verica
en el caso de incertidumbres aditivas
Q() = Q( W)
siendo W el conjunto de incertidumbres y siendo W la diferencia de Pontryagin
de ambos conjuntos. En lo que sigue se denotan los siguientes conjuntos
p
= x IR
n
: V (x) p
B
p
= x IR
n
: |x| p
De la teora de Lyapunov
3
se tiene el sistema x
k+1
= F(x
k
) es exponencialmente
estable en el origen y ademas existe una constante [0, 1) tal que V (F(x)) V (x).
Sea L
v
la constante de Lipschitz de la funcion de Lyapunov V (x) en el conjunto acotado
r
. Entonces se tiene que
V (x + w) V (x) + L
v
|w|
Considerese una constante

1
L
v
r
entonces se satisface que
Q(
r
) = Q(
r
B
) Q(
rL
v
)
q

r
siendo q =
rL
v
. Para demostrarlo se van a probar las siguientes propiedades:

(i) Q(
r
B
) Q(
rLv
):
Para ello considerese que para todo x
k

rLv
se tiene que
V (x
k
) r L
v
V (x
k
+ w
k
) V (x
k
) + L
v
r
Por tanto, x
k
+ w
k

r
, w
k
B
, y entonces x
k

r
B
. En consecuencia
rL
v

r
B
.
De la propiedad de monotona del conjunto a un paso se tiene que Q(
r
B
)
Q(
rL
v
)
2
3
(ii)
q
Q(
rL
v
), siendo q =
rL
v
:
x
k

q
V (F(x
k
)) V (x
k
) rL
v
F(x
k
)
rLv
x
k
Q(
rLv
)
(iii)
r

q
:
q =
r L
v
(1 L
v
1
L
v
) = r
Por lo tanto el conjunto acotado
r
es un invariante positivo robusto para unas incer-
tidumbres w
k
B
y esta acotado, lo que demuestra la estabilidad.

Convergencia:
Se va a demostrar que para una incertidumbre w
k
B
con
1
Lv
r, el estado del
sistema evoluciona al conjunto invariante robusto
r
= x IR
n
: V (x)
L
v
1
= r
en el cual permanece. Para ello basta demostrar que la evoluci on del sistema verica
que
V (x
1
) V (F(x
0
)) + L
v
|w
o
| r + L
v
= r
1
r
V (x
2
) V (F(x
1
)) + L
v
|w
1
| r
1
+ L
v
=
2
r + L
v
(1 + ) = r
2
r
.
.
.
V (x
j
)
j
r +
j1
i=0
L
v
j1i
|w
i
|
j
r +
1
j
1
L
v
= r
j
r
Dado que < 1 entonces r
j

L
v
1
= r
r cuando j .
Ademas la evoluci on del estado satisface la siguiente acotacion
|x
k
|
1
a
_
_
k
r +
k1
j=0
L
v
kj1
|w
j
|
_
_
(5.6)
De este teorema se inere que el conjunto
r
es un invariante robusto para un
conjunto de incertidumbres B
.
Este teorema es una generalizacion del resultado principal presentado en (Scokaert
et al. 1997), el cual demuestra estabilidad (ante perturbaciones que decaen) bajo las
hipotesis de que F(x) sea exponencialmente estable y Lipschitz. Como se va a compro-
bar, estas hipotesis son un caso particular de las del teorema 5.4.
Corolario 5.5 Por el teorema inverso de Lyapunov (vease el teorema A1 en (Scokaert
et al. 1997)), si F(x) es Lipschitz y el origen es exponencialmente estable, entonces
existe una funcion de Lyapunov asociada que es Lipschitz, por lo que se satisfacen las
hipotesis del teorema 5.4.
Para un sistema en bucle cerrado, la imposicion de la continuidad Lipschitz del
modelo nominal f(x, h(x)) se puede garantizar bajo la continuidad Lipschitz del modelo
respecto a x y a u y ademas bajo la continuidad Lipschitz de la ley de control u = h(x).
Sin embargo, el teorema 5.4 esta formulado en terminos de la continuidad Lipschitz
de la funcion de Lyapunov, que se puede satisfacer sin necesidad de la continuidad
Lipschitz de la ley de control.
Merece la pena resaltar que la incorporacion de la teora de conjuntos invariantes
en la demostracion del teorema permite obtener resultados compactos y sencillos.
A continuaci on se extiende el teorema anterior al caso de sistemas con restricciones
en el estado (que en el caso de sistemas en bucle cerrado pueden derivar de restricciones
en las actuaciones y en los estados). Estas restricciones se transforman en la existencia
de un dominio de atraccion del sistema nominal, que es un invariante positivo, tal que
X
F
X. En este caso, se establece el siguiente corolario.
Corolario 5.6 Sea el sistema x
k+1
= F(x
k
) tal que satisface las hipotesis del teorema
5.4 en el dominio de atraccion X
F
. Entonces existe una constante > 0 tal que para
toda incertidumbre
w
k
B
= w
k
IR
n
: |w
k
| <
k+1
= F(x
k
) + w
k
estado inicial x
0

r
= x IR
n
: V (x) r X
F
.
Esto se debe a la invariancia robusta del conjunto
r
. Gracias a ella, siempre que el
sistema parta de este conjunto, la evolucion del sistema permanece en dicho conjunto,
y ademas evoluciona convergiendo a un conjunto interior en el cual permanece acotado.
Por tanto, dado que el conjunto
r
esta contenido en el dominio de atraccion del sistema
X
F
X, la evoluci on del mismo satisface las restricciones.
Como se puede observar, la invariancia robusta es la propiedad que garantiza la
satisfaccion de las restricciones del sistema incierto. En el caso de que el dominio
de atraccion sea un invariante robusto del sistema, se puede establecer el siguiente
resultado.
Corolario 5.7 Sea el sistema x
k+1
= F(x
k
) tal que satisface las hipotesis del teorema
5.4 en el dominio de atraccion X
F
.
Sea el dominio de atraccion X
F
invariante robusto del sistema incierto x
k+1
= F(x
k
)+
w
k
para
w
k
B
= w
k
IR
n
: |w
k
| <
Entonces existe una constante 0 < tal que para toda incertidumbre
w
k
B
= w
k
IR
n
: |w
k
| <
k+1
= F(x
k
) + w
k
estado inicial x
0
X
F
.
Para demostrar este corolario, basta con tomar una region
r
(preferiblemente la
region maxima) tal que
r
X
F
. Entonces considerando una constante
mn(,
1
L
v
r)
el sistema incierto con w
k
B
, evoluciona a la region
r
para todo estado inicial de
X
F
, donde permanece acotado.
En resumen, si un sistema esta sometido a restricciones y tiene un dominio de
atraccion X
F
, tan solo se puede garantizar la estabilidad robusta cumpliendo las res-
tricciones (factibilidad robusta) en una region
r
contenida en X
F
y para cierto grado
de incertidumbre B
. Solamente en el caso en que dicho conjunto X

F
sea un invariante
robusto (para un cierto grado de incertidumbres B
), se puede garantizar que en todo

el dominio de atraccion X
F
se satisfacen las restricciones. En este caso, para garantizar
que para todo estado de X
F
evoluciona hasta
r
, donde queda connado, el grado de
incertidumbre que admite el sistema es el mnimo de (para garantizar convergencia)
y ( para que X
F
sea invariante robusto).
En el siguiente corolario se trasladan los resultados anteriores al caso de perturba-
ciones que decaen.
Corolario 5.8 Bajo las hipotesis del teorema 5.4, si las incertidumbres tienden a 0,
entonces el origen es un punto de equilibrio asintoticamente estable del sistema pertur-
bado para un cierto grado de incertidumbres.
Si, ademas, el sistema presenta restricciones, los corolarios anteriores garantizan
la factibilidad robusta.
138 5.4. Aplicacion al analisis de robustez del MPC
Si la perturbacion decae exponencialmente de forma que |w
k
|
k
|w
0
|, con
< 1, entonces la evolucion del sistema es exponencial
|x
k
|
_
r
k
a
+
L
v
(
k
k
)
a( )
|w
0
|
_
1/
_
_
_
_
r
a
_
k
+
L
v
a[ [
_
k
_
k
|w
0
|
_
_
_
_
1/
siendo = max(, ). Dado que y se tiene que
_
k
_
k
1
Por lo tanto, se deduce que
|x
k
|
_
_
r
a
+
L
v
a[ [
|w
0
|
__
1/

k/
siendo > 0.
5.4. Aplicacion al analisis de robustez del MPC
Los resultados obtenidos anteriormente establecen un procedimiento para analizar la
estabilidad robusta de un sistema en bucle cerrado (con o sin restricciones). Basandose
en ellos se va a analizar la estabilidad robusta y la satisfaccion de las restricciones de
un sistema controlado por un controlador MPC en su formulaci on general.
Corolario 5.9 (Estabilidad robusta del MPC)
Sea un sistema descrito por un modelo nominal
x
k+1
= f(x
k
, u
k
)
sujeto a las restricciones u
k
U, y x
k
X.
Sea un controlador MPC u
k
= K
MPC
(x
k
) tal que estabiliza exponencialmente el sistema
en el dominio de atraccion X
N
.
Sea el coste optimo del MPC J
N
(x
k
) una funcion Lipschitz en X
N
.
Entonces, existe una constante > 0 tal que para cualquier incertidumbre
w
k
B
= w
k
IR
n
: |w
k
|
el sistema incierto descrito por
x
k+1
= f(x
k
, K
MPC
(x
k
)) + w
k
es asintoticamente acotado al nal para todo
x
0

r
= x IR
n
: J
N
(x) r X
N
Este corolario es consecuencia inmediata de los resultados obtenidos en la seccion
anterior. Es importante resaltar que una propiedad que parece clave en la robustez del
controlador predictivo es la continuidad Lipschitz del coste optimo, seg un la cual
[J
N
(x + w) J
N
(x)[ L
J
|w|
Esta garantiza que el efecto de las incertidumbres sobre el coste optimo este limitado, es
decir, que una incertidumbre acotada supone una variaci on en el coste optimo acotada.
Las condiciones bajo las cuales el MPC garantiza la continuidad Lipschitz del coste
optimo estan asociadas a las condiciones de regularidad del problema de optimizacion
y a la optimalidad de la solucion obtenida. Esta propiedad tan solo esta garantizada
para sistemas lineales sujetos a restricciones lineales (Muske 1995). En el apendice C de
este documento se presenta un analisis de las condiciones bajo las cuales el controlador
MPC para sistemas no lineales satisface la continuidad Lipschitz del coste optimo.
Bajo estas mismas condiciones se establece tambien la continuidad Lipschitz de la
secuencia optima, lo que garantiza en virtud del corolario 3.4 que el controlador MPC
estabiliza exponencialmente el sistema.
5.4.1. Factibilidad robusta del MPC
En el caso de que el sistema este sujeto a restricciones tanto en las actuaciones como
en el estado, el controlador MPC debe garantizar la satisfaccion de dichas restricciones a
pesar de las incertidumbres. Las restricciones sobre las actuaciones se satisfacen gracias
a la factibilidad de la solucion del problema de optimizacion. Son las restricciones
impuestas sobre los estados las que realmente el controlador puede no ser capaz de
satisfacer. Estas restricciones son de dos tipos: restriccion por lmites sobre los estados y
la restriccion terminal para garantizar la estabilidad. La violacion de las primeras hacen
que el sistema evolucione fuera de los lmites fsicos impuestos y el incumplimiento de la
segunda puede hacer que el sistema pierda la estabilidad y la convergencia. Sin duda,
ambas son igualmente importantes y su satisfaccion a pesar de las incertidumbres
constituyen un gran reto y una gran complejidad en la robustez del MPC. De hecho,
gran parte de los resultados existentes en robustez del MPC omiten las restricciones del
problema (Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni & Sepulchre 1997).
El analisis llevado a cabo anteriormente garantiza la factibilidad robusta en un
conjunto
r
= x IR
n
: J
N
(x) r X
N
contenido en X
N
. Este conjunto satisface las restricciones gracias a que es un invariante
positivo robusto y por lo tanto garantiza que si el sistema parte de un estado en el
contenido, la evoluci on permanece en su interior. Este conjunto puede interpretarse
como que existe un coste optimo umbral r tal que si en el instante inicial J
N
(x
0
) r
(x
0

r
), entonces se satisfacen las restricciones. Si por el contrario el estado inicial
es tal que J
N
(x
0
) > r (x
0
X
N

r
), el sistema podra evolucionar de forma que en
un determinado instante no satisfaga las restricciones.
Conocido el dominio de atraccion del MPC X
N
, y suponiendo que es un conjunto
conexo y compacto, es posible calcular el coste umbral que garantiza la estabilidad
y satisfaccion robusta de las restricciones ante incertidumbres. En el caso en que X
N
sea convexo, el coste optimo umbral r se puede determinar de la solucion del siguiente
problema
r = mn
x/ X
N
J
N
(x)
el cual se resuelve fuera de lnea. Si X
N
no fuese convexo, se podra considerar en el
problema un conjunto convexo contenido en el, obteniendo un coste umbral conser-
vador.
Para ilustrar esto, considerese un sistema lineal x
k+1
= Ax
k
+Bu
k
+w
k
dado por
A =
_
_
1,2775 1,3499
1,0 0,0
_
_
B =
_
_
1,0
0,0
_
_
sujeto a las restricciones |x|
5 y [u[ < 1. El sistema real presenta unas incertidum-

bres |w
k
|
0,35. Considerando el coste de etapa cuadratico L(x, u) = |x|

2
+|u|
2
,
y calculando el controlador local con un LQR, la region terminal obtenida es .
El MPC con un horizonte N = 5 estabiliza robustamente el sistema para las incer-
tidumbres dadas y la region
r
viene dada por un coste optimo umbral de r = 25,24. En
la gura 5.2 se muestra como la evoluci on del sistema para estados iniciales contenidos
en
r
, permanece contenida en este.
En la gura 5.3 se muestra que existen estados iniciales pertenecientes a X
5

r
tales que la evolucion del sistema permanece en X
5
, satisfaciendo las restricciones, y
3 2 1 0 1 2 3
4
3
2
1
0
1
2
3
4
x
1
x
2
r

X
5
Figura 5.2: Evolucion del sistema con x
0

r
sin embargo existen otros estados desde los cuales la evoluci on del sistema pierde la
estabilidad, abandonando el dominio de atraccion.
3 2 1 0 1 2 3
4
3
2
1
0
1
2
3
4
x
1
x
2
r

X
5
Figura 5.3: Evolucion del sistema con x
0
X
5

r
5.4.1.1. Invariancia robusta del dominio de atraccion
Un analisis mas exhaustivo sobre la condiciones bajo las cuales el MPC satisface
las restricciones en presencia de incertidumbres se ha llevado a cabo en (Kerrigan
2000, Kerrigan & Maciejowski 2001). Este trabajo se basa en la teora de conjuntos
invariantes y establece condiciones bajo las cuales el controlador MPC garantiza que
su dominio de atraccion es un invariante robusto. La invariancia robusta es condicion
necesaria y suciente para garantizar que el sistema no abandona dicho conjunto en
su evoluci on. As, si el dominio de atraccion es un invariante robusto, todo estado
estabilizable satisface las restricciones. En estos trabajos no se aborda la convergencia
robusta del MPC, tan solo se determinan condiciones para la satisfaccion robusta de
las restricciones. Por ello, los resultados obtenidos no se limitan a las formulaciones con
estabilidad garantizada. Sin embargo, en esta seccion, se han adaptado estos resultados
tan solo a este caso.
Lo primero que se analiza es bajo que condiciones el dominio de atraccion del MPC
es un invariante robusto y se establece el siguiente teorema .
Teorema 5.10 (Kerrigan 2000)
Sea un controlador MPC formulado para un sistema x
k+1
= f(x
k
, u
k
) sujeto a restric-
ciones x
k
X, u
k
U que satisface las condiciones sucientes de estabilidad (teorema
3.2). Entonces, el sistema incierto, con incertidumbres aditivas acotadas a W, satisface
las restricciones si se verica la siguiente condicion
S
N1
(X, ) W S
N
(X, )
siendo la operacion de suma de Minkowski
4
Es interesante resaltar que la satisfaccion de esta condicion depende de la forma que
tengan los conjuntos estabilizables en N y en N1 pasos. Estos conjuntos dependen del
modelo del sistema, de los conjuntos de restricciones X y U y del conjunto invariante
. En lo unico en lo que puede inuir la sintonizacion del controlador es en el conjunto
invariante y el horizonte de control N. Por tanto, es el sistema y sus restricciones los
que limitan la satisfaccion de esta condicion. Es probable encontrar casos en los que
esa condicion no se satisface para ning un valor del horizonte de control.
En el caso en el que el dominio de atraccion del MPC no sea inherentemente ro-
busto, Kerrigan propone a nadir una restriccion adicional al MPC que garantice dicha
propiedad. El trabajo de Kerrigan es una generalizacion de la restriccion del mismo
tipo propuesta en (Chisci & Zappa 1999) para sistemas lineales.
Esta restriccion se denomina restriccion de robustez y tiene la forma
x(k + 1[k) X
R
W
siendo x(k + 1[k) la prediccion nominal del estado en el instante siguiente y X
R
un
conjunto que es parametro de dise no. Esta nueva restriccion modica el dominio de
atraccion del MPC, siendo por tanto distinto al del MPC general. El nuevo dominio
de atraccion es
X
r
N
= Q(X
R
W) S
N
(X, )
4
AB es la suma de Minkowski de los conjuntos A y B y viene dada por
c IR
n
: a A, b B[c = a +b.
Kerrigan establece condiciones sobre el conjunto X
R
X para que el dominio de
atraccion del MPC modicado, X
r
N
, sea un invariante robusto. Estas condiciones se
resumen en el siguiente teorema.
Teorema 5.11 (Kerrigan 2000)
Sea un controlador MPC con restriccion de robustez formulado para un sistema x
k+1
=
f(x
k
, u
k
) sujeto a restricciones x
k
X, u
k
U que satisface las condiciones sucientes
de estabilidad (teorema 3.2). Entonces, el sistema incierto, con incertidumbres aditivas
acotadas a W, satisface las restricciones si
(1(X
r
N
) (X
R
W) S
N1
(X, )) W X
r
N
siendo 1() el conjunto de alcance (vease la seccion A.3).
Ademas, Kerrigan propone formas de determinacion del conjunto X
R
que general-
mente se toma un conjunto invariante robusto de control del sistema.
Como se ha comentado, estos resultados garantizan la factibilidad robusta del MPC,
no su convergencia. El analisis de estabilidad realizado previamente permite establecer
resultados que aseguren la convergencia del sistema. As, aplicando el corolario 5.7, se
determina que si el dominio de atraccion es robusto para incertidumbres contenidas en
B
y el MPC converge para incertidumbres contenidas en B
, siendo , entonces,
el controlador MPC satisface las restricciones y converge a un conjunto
r
X
N
.
En el caso de perturbaciones que decaen con el tiempo, no es necesario estable-
cer condiciones adicionales de convergencia, pues la naturaleza desvaneciente de las
incertidumbres hacen que el sistema vaya convergiendo al punto de equilibrio.
5.5. Estabilidad entrada a estado (ISS) del MPC
En la seccion anterior se ha analizado la robustez de los controladores MPC ante
incertidumbres aditivas en el sistema y se ha comprobado que todo sistema controla-
do por un MPC, bajo ciertas condiciones, admite un cierto grado de incertidumbre.
Tomando un poco de perspectiva en el analisis realizado, se puede observar que las
claves de la estabilidad robustas son dos: la estabilidad exponencial del sistema y la
continuidad Lipschitz del coste optimo. La primera garantiza un decrecimiento distinto
de cero del coste optimo en cada instante y la segunda garantiza que el efecto de las
incertidumbres esta acotado, y ademas este depende del grado de incertidumbre. Por
tanto, para mantener la estabilidad del sistema, basta con que el posible incremento
144 5.5. Estabilidad entrada a estado (ISS) del MPC
de coste optimo que experimenta el sistema por la incertidumbre sea compensado por
el decrecimiento en el coste que fuerza la estabilidad exponencial.
De todo esto se deduce que la prueba de estabilidad anterior es generalizable a
sistemas asintoticamente estabilizables e incluso a sistemas con otro tipo de modelo
de incertidumbres (no aditivas o parametricas, por ejemplo) con tal de que su efecto
sobre el coste optimo este acotado. Esta generalizacion se puede hacer incorporando el
concepto de estabilidad entrada a estado o ISS
5
.
5.5.1. Estabilidad entrada a estado
La estabilidad entrada a estado fue formulada por primera vez en (Sontag 1989a)
para sistemas en tiempo continuo, pero recientes resultados (Jiang, Sontag & Wang
1999, Jiang & Wang 2001) han trasladado estos conceptos a sistemas en tiempo discreto.
A continuaci on se presentan las deniciones y resultados necesarios para el desarrollo
de esta seccion. En la seccion A.4 se presentan estos resultados de una manera mas
extensa y detallada.
Denicion 5.12 (Estabilidad entrada a estado) (Jiang & Wang 2001) Un sis-
tema x
k+1
= F(x
k
, w
k
) es estable entrada a estado si existe una funcion /L , (, ), y
una funcion / , (), tal que la evolucion del sistema satisface que
|x
k
| (|x
0
|, k) + ()
para todo x
0
B
, siendo |w
k
| para todo k.
La se nal de entrada a la que se reere en esta denicion es w
k
, que en el contexto
de la robustez viene a ser la incertidumbre. As, esta denicion dice que en ausencia
de incertidumbres el sistema es asint oticamente estable. Sin embargo, cuando apare-
cen incertidumbres acotadas, el efecto que estas tienen sobre la evolucion del sistema
esta acotada, es decir, que las incertidumbres no hacen divergir al sistema.
Notese que esta denicion incluye a la anteriormente utilizada de estabilidad asin-
totica acotada al nal, pues, de la denicion de estabilidad entrada a estado se deduce
que para todo |x
0
| , el estado esta acotado |x
k
| b
k
de forma que b
k
()
cuando k , dado que (|x
0
|, k) 0.
Asociada a este concepto de estabilidad existe la denicion de una funcion de Lya-
punov entrada a estado:
5
Acronimo ingles de Input to State Stability
Denicion 5.13 (Funcion de Lyapunov entrada a estado) (Jiang & Wang 2001)
Una funcion continua V : IR
n
IR
+
se denomina funcion de Lyapunov entrada a es-
tado si satisface que
Existen unas funciones / ,
1
() y
2
(), tales que
1
(|x|) V (x)
2
(|x|) x B
Existe una funcion / ,

3
(), y una funcion / , (), tales que
V (F(x, w))V (x)
3
(|x|)+() x B
w B
= w IR
p
: |w|
La segunda propiedad de la denicion es equivalente a decir que existe una funcion
/
, (), y una funcion / ,

4
(), tales que
V (F(x, w)) V (x)
4
(x) x : |x| ()
es decir, que se satisface la condicion de Lyapunov tan solo fuera de una vecindad del
origen.
El principal resultado es el siguiente lema, donde se establece la condicion suciente
para garantizar la estabilidad entrada a estado de un sistema.
Lema 5.14 (Jiang & Wang 2001) Si un sistema x
k+1
= F(x
k
, w
k
) admite una funcion
de Lyapunov entrada a estado entonces el sistema es estable entrada a estado
La demostracion de este lema se muestra en la seccion A.4. De este resultado se deduce
que existe una funcion / , (), tal que
V (F(x, w)) (V (x)) + ()
Entonces la funcion / , d() = (id)
1
(), siendo id(s) = s, satisface las siguientes
propiedades
(i) Si un sistema es estable entrada a estado y la entrada (incertidumbre) tiene una
cota , entonces todo conjunto
r
, siendo r d(), es un conjunto invariante
robusto del sistema. Ademas el sistema evoluciona hasta quedar connado en
r
= x IR
n
: V (x) r siendo r = d().
(ii) Todo conjunto
r
es invariante robusto para unas incertidumbres tales que su
cota satisfaga
d
1
(r) =
1
(r (r)) (5.7)
146 5.5. Estabilidad entrada a estado (ISS) del MPC
Los resultados obtenidos son mas generales, pero con un desarrollo semejante, a los
presentados en el analisis de estabilidad robusta de la seccion 5.3. En ese caso se tiene
que (r) = r siendo una constante [0, 1), y () es L
v
. Por tanto de (5.7) se
tiene que

1
L
v
r
que es la misma cota obtenida en la seccion 5.2.
La aplicacion de estos resultados a sistemas con restricciones se hace siguiendo la
lnea presentada en la seccion 5.3: la invariancia robusta de
r
garantiza la satisfac-
cion de las restricciones siempre que
r
este contenido en el dominio de atraccion del
controlador. Si dicho dominio es un invariante robusto, entonces el resultado obtenido
garantiza que evoluciona a un conjunto en el que permanecera acotado y cuyo tama no
depende de la cota de la incertidumbre.
5.5.2. Aplicacion al MPC
Sea un sistema incierto descrito por la ecuacion
x
k+1
= f(x
k
, u
k
, w
k
)
siendo w
k
IR
p
las incertidumbres presentes en el modelo, el cual esta acotada a un
conjunto w
k
B
= w IR
p
: |w| . Por otro lado las entradas y los estados
estan sujetos a u
k
U, y x
k
X.
El modelo en ausencia de incertidumbres
x
k+1
= f(x
k
, u
k
, 0)
es el modelo nominal y es el que se utiliza como modelo de prediccion en un MPC
tal que satisface las condiciones sucientes de estabilidad (teorema 3.2), y por tanto
estabiliza asint oticamente el sistema en un dominio de atraccion X
N
. La ley de control
obtenida es u
k
= K
MPC
(x
k
).
Como se puede comprobar en el teorema 3.2, el coste optimo resultado del MPC es
una funcion de Lyapunov del sistema y ademas verica que
J
N
(f(x
k
, K
MPC
(x
k
), 0)) J
N
(x
k
) L(x
k
, K
MPC
(x
k
))
De todo lo anterior se puede establecer el siguiente teorema, que es el resultado
principal de este analisis, aportacion de esta tesis.
x
k+1
= f(x
k
, u
k
, w
k
)
con u
k
U, x
k
X y las incertidumbres w
k
B
.
Sea un controlador MPC obtenido a partir del modelo nominal (sin incertidumbres)
tal que satisface las condiciones sucientes de estabilidad (teorema 3.2) y estabiliza
asintoticamente el sistema nominal en X
N
.
Supongase que el coste optimo es suave con las incertidumbres de forma que existe una
funcion / , (), tal que
[J
N
(f(x, K
MPC
(x), w)) J
N
(f(x, K
MPC
(x), 0))[ (|w|)
para todo x X
N
.
Entonces el sistema es estable entrada a estado y ademas para todo
r
X
N
, existe
una cota de la incertidumbre = (r) para la cual el sistema incierto es estable y
satisface las restricciones.
Demostracion:
Para demostrar el teorema basta comprobar que el coste optimo es una funcion de
Lyapunov entrada a estado. Sea el estado x
k+1
= f(x
k
, K
MPC
(x
k
), w
k
), entonces
J
N
(x
k+1
) J
N
(x
k
) = [J
N
(f(x
k
, K
MPC
(x
k
), w
k
)) J
N
(f(x
k
, K
MPC
(x
k
), 0))]
+[J
N
(f(x
k
, K
MPC
(x
k
), 0)) J
N
(x
k
)]
(|w
k
|) L
(x
k
, K
MPC
(x
k
))
l|x
k
|
+ ()
Ademas la region
r
X
N
es un invariante robusto del sistema, y por lo tanto satisface
las restricciones a lo largo de la evoluci on del sistema.
Para un conjunto
r
dado, el grado de incertidumbre que soporta el controlador
depende de las funciones l|x|
y (). Por tanto, el grado de conservadurismo asociado

a esta cota dependera del grado de aproximacion que tenga la funcion a la discrepancia
real ().
Es importante resaltar que la condicion
[J
N
(f(x, K
MPC
(x), w)) J
N
(f(x, K
MPC
(x), 0))[ (|w|)
es una condicion sobre la suavidad de la funcion de coste respecto a los parametros. Por
ejemplo, si la funcion de coste es Lipschitz (o bien (
1
) con las incertidumbres, entonces
existe una constante L
J
tal que
[J
N
(f(x, K
MPC
(x), w)) J
N
(f(x, K
MPC
(x), 0))[ L
J
|w|
148 5.6. Suboptimalidad y robustez en el MPC
Por lo tanto, seg un su grado de derivabilidad, se puede realizar una aproximaci on de
mayor orden (por la formula de Taylor, por ejemplo), y por lo tanto obtener una funcion
() menos conservadora.
Una condicion suciente para garantizar la suavidad del coste optimo respecto a
los parametros es la suavidad de J
N
(x) respecto al estado y la suavidad del modelo
f(x, u, w) respecto a los parametros. En efecto, supongase que existen dos funciones
/ ,
J
() y
f
(), tales que
[J
N
(x + x) J
N
(x)[
J
(|x|)
|f(x, u, w) f(x, u, 0)|
f
(|w|)
entonces se tiene que
[J
N
(f(x, u, w)) J
N
(f(x, u, 0))[
J
(|f(x, u, w) f(x, u, 0)|)
J

f
(|w|)
Dado que =
J
f
es una funcion / , se comprueba la suavidad del coste optimo.
5.6. Suboptimalidad y robustez en el MPC
La estabilidad asint otica del MPC (en ausencia de incertidumbres) esta basada en el
decrecimiento que experimenta el coste optimo a lo largo del tiempo. Esto permite con-
siderar el coste optimo como funcion de Lyapunov. Sin embargo, como se demostro en
la seccion 3.8, la optimalidad de la solucion no es necesaria para garantizar la estabi-
lidad, es tan solo una caracterstica deseable de cara al comportamiento del sistema
controlado. En realidad basta con que la evoluci on del coste optimo sea estrictamente
decreciente para garantizar la estabilidad asint otica del controlador. Esto se consigue
imponiendo al problema de optimizacion a resolver en el instante k, la siguiente re-
striccion de convergencia
J
s
N
(x
k
) J
s
N
(x
k1
) L(x
k1
, u
s
(k 1[k 1)) (5.8)
siendo una constante positiva tal que 1 y u
s
(k 1[k 1) la actuacion suboptima
obtenida en el instante k 1. La constante indica la tasa de convergencia mnima
que se desea del controlador de forma que cuanto menor sea, mas lenta puede ser la
convergencia del sistema en bucle cerrado al origen.
En (Mayne et al. 2000) se comenta que la solucion optima global del problema de
optimizacion del MPC puede ser inabordable desde un punto de vista computacional,
lo que conduce a la necesidad de soluciones suboptimas para que el MPC sea imple-
mentable. Sin embargo, en ausencia de incertidumbres, la restriccion de convergencia no
es necesaria, pues la factibilidad de la solucion en un instante k, garantiza la existencia
de una solucion factible en k + 1, u
F
(k + 1), tal que
6
J
N
(x
k+1
, u
F
(k + 1)) J
N
(x
k
) L(x
k
, u
(k[k))
Por lo tanto, en ausencia de incertidumbres, la factibilidad de la solucion garantiza la
estabilidad del controlador MPC.
La necesidad de la restriccion de convergencia surge de la discrepancia entre la
evolucion predicha del sistema y la evoluci on real del mismo, es decir, cuando el sistema
esta sujeto a incertidumbres. En este caso, dado que x
k+1
,= x(k + 1[k), no se puede
garantizar que la solucion optima sea tal que el coste optimo decrezca mas que el coste
de etapa, haciendose necesaria la imposicion de la restriccion de convergencia para
garantizar la estabilidad asintotica del sistema.
5.6.1. Estabilidad robusta del MPC suboptimo
Dado que el controlador MPC suboptimo toma sentido en presencia de incertidum-
bres, se va a trasladar el analisis de estabilidad entrada a estado del MPC optimo al
caso suboptimo.
El MPC suboptimo presenta las restricciones propias del MPC, es decir, la re-
striccion sobre los estados, sobre las actuaciones y sobre el estado terminal, y ademas
impone la restriccion de convergencia dada por la ecuacion (5.8), por la cual garantiza
una convergencia mnima del sistema en bucle cerrado. Las restricciones sobre las en-
tradas y estados en presencia de incertidumbres presentan el problema de factibilidad
robusta tratado anteriormente y que esta relacionado con la invariancia robusta. La
satisfaccion de la restriccion de convergencia depende tambien de las incertidumbres y
no esta garantizada a pesar del cumplimiento de las anteriores.
Del analisis de estabilidad entrada a estado desarrollado anteriormente, se establece
que bajo condiciones de suavidad del coste optimo, el incremento que experimenta este
por el efecto de la incertidumbre esta acotado y depende del grado de incertidumbre
que presenta el sistema
[J
N
(x
k+1
) J
N
(x(k + 1[k))[ ()
siendo () una funcion / y la cota de las incertidumbres. Entonces, el coste optimo
es una funcion de Lyapunov ISS y verica que
J
N
(x
k+1
) J
N
(x
k
) L(x
k
, u
(k[k)) +()
6
Vease la demostracion de estabilidad de la formulacion general del MPC en la seccion 3.3
Para que el coste optimo satisfaga la condicion de convergencia basta con que se
verique que
L(x
k
, u
k
) + () L(x
k
, u
k
)
de donde se tiene que
() (1 )L(x
k
, u
k
)
Por lo tanto, , la tasa de convergencia del controlador, condiciona el grado de incer-
tidumbres que admite el sistema y viceversa. Cuanto mayor sea la tasa de convergencia
, menor sera el grado de incertidumbres para el cual se satisface la restriccion de
convergencia, o lo que es lo mismo, el grado de incertidumbres para el cual el contro-
lador esta denido (es factible). Por el contrario, mas rapida sera la convergencia del
sistema en bucle cerrado.
En resumen, la restriccion de convergencia del MPC suboptimo tiene como n ase-
gurar una tasa de convergencia del controlador, limitando as el grado de incertidumbres
que admite. Notese ademas que si las incertidumbres no decaen con el tiempo, tan solo
se podra satisfacer la restriccion de convergencia fuera de una vecindad del origen.
Es importante resaltar que estos resultados son validos si la funcion de coste es
suave ante las incertidumbres. En el caso del MPC optimo esto se puede garantizar
bajo ciertas condiciones de regularidad del problema de optimizacion. Sin embargo esta
suavidad esta sujeta a la optimalidad de la solucion, perdiendose en caso de subopti-
malidad
7
.
Esto se puede solucionar gracias a que, como se demuestra en el teorema siguiente,
la suavidad del coste optimo, garantiza la factibilidad del problema suboptimo, y por
lo tanto la estabilidad del controlador.
A continuacion se va a demostrar la estabilidad del controlador MPC suboptimo
propuesto en el artculo (Scokaert et al. 1999), que viene dado por
Si existe una solucion factible con restriccion de convergencia, entonces se aplica
la solucion.
Si no, aplicar la mejor solucion obtenida.
Este procedimiento garantiza convergencia siempre que el problema de optimizacion
sea factible. Pero los autores no analizan bajo que condiciones es factible el problema y
en consecuencia bajo que condiciones este procedimiento estabiliza el sistema incierto.
En el siguiente teorema, fruto de esta tesis, se establecen condiciones que garantizan
la estabilidad.
7
Vease el ejemplo de la seccion 3.8, en el que se pone de maniesto la falta de suavidad en el caso
suboptimo.
Teorema 5.16 (Estabilidad robusta del MPC suboptimo)
x
k+1
= f(x
k
, u
k
, w
k
)
con u
k
U, x
k
X y las incertidumbres w
k
B
.
Sea un controlador MPC obtenido a partir del modelo nominal (sin incertidumbres)
tal que satisface las condiciones sucientes de estabilidad (teorema 3.2) y estabiliza
asintoticamente el sistema nominal en X
N
.
Supongase que el coste optimo es suave con las incertidumbres de forma que existe una
funcion / , (), tal que
[J
N
(f(x, u, w)) J
N
(f(x, u, 0))[ (|w|)
para todo x X
N
y para todo u U.
Entonces el controlador MPC suboptimo propuesto, con una restriccion de convergencia
J
s
N
(x
k
) J
s
N
(x
k1
) L(x
k1
, u
s
(k 1[k 1))
siendo J
s
N
(x
k1
) el coste suboptimo y u
s
(k 1[k 1) la actuacion suboptima en el
instante k 1, estabiliza el sistema en un conjunto
r
= x IR
n
: J
s
N
(x) r
tal que
r
X
N
, para una cota de la incertidumbre = (r, ). Ademas la evolucion
del sistema incierto satisface las restricciones.
Demostracion:
La clave de la demostracion radica en comprobar la existencia de una solucion factible
a la restriccion de convergencia (que sera la secuencia optima).
Supongase que el sistema en el instante k 1 se encuentra en el estado x
k1
tal
que la actuacion proporcionada por el controlador suboptimo es u
s
(k 1[k 1). Como
consecuencia el sistema evoluciona a x
k
(estado que diere del estado predicho x
k
,=
x
s
(k[k 1) = f(x
k1
, u
s
(k 1[k 1), 0)).
A partir de la secuencia de actuaciones u
s
F
(k 1) se obtiene la secuencia para el
instante k, u
s
F
(k) dada por
u
s
(k + j 1[k) =
_
_
_
u
s
(k + j 1[k 1) j = 1, , N 1
h( x(k + N 1[k))
siendo u = h(x) la ley de control local a la region terminal. Esta secuencia garantiza la
satisfaccion de las restricciones sobre los estados y sobre las actuaciones en el estado
x(k[k 1) = f(x
k1
, u
s
k1
, 0)
y tiene asociado un coste

J
N
(x(k[k 1)), el cual satisface que
J
N
(x(k[k 1)) J
s
N
(x
k1
) L(x
k1
, u
s
(k 1[k 1))
Entonces la solucion optima del MPC en el instante x
k
verica que
J
N
(x
k
) J
N
(f(x
k1
, u
s
k1
, 0)) + (|w
k1
|)

J
N
(x(k[k 1)) + (|w
k1
|)
J
s
N
(x
k1
) L(x
k1
, u
s
k1
) + (|w
k1
|)
J
s
N
(x
k1
) L(x
k1
, u
s
k1
)
_
(1 )L(x
k1
, u
s
k1
) (|w
k1
|)
_
Una vez establecido este resultado se va a demostrar la estabilidad comprobando
que el conjunto
r
= x IR
n
: J
s
N
(x) r
tal que
r
X
N
es un invariante robusto del sistema controlado por el MPC suboptimo
para un cierto grado de incertidumbres. Para ello se va a demostrar que para todo
x
k1

r
, entonces x
k

r
para cualquier incertidumbre admisible.
Para ello se van a considerar dos casos:
(i) Incertidumbres acotadas:
Considerese una cota de incertidumbres tal que w
k
B
, para la cual existe

una constante q (0, r ()) tal que
(1 )l|x|
() x
r

q
Notese que siempre existe una pareja de valores (, q) tal que satisface lo anterior.
Entonces, para todo x
k1

r

q
se tiene que
() (1 )l|x
k1
|
(1 )L(x
k1
, u
s
(k 1[k 1))
Por lo tanto se tiene que
J
N
(x
k
) J
s
N
(x
k1
) L(x
k1
, u
s
(k 1[k 1))
y en consecuencia existe una solucion factible tal que verica la restriccion de
convergencia.
De aqu se deduce que para todo x
r

q
, el coste suboptimo es estricta-
mente decreciente y por lo tanto el estado se va aproximando al origen hasta un
determinado instante en el que el estado del sistema entra en la region
q
.
En este conjunto, las incertidumbres pueden hacer que la restriccion de conver-
gencia no sea factible. En ese caso se elimina y se proporciona la mejor actuacion
disponible. As, el estado podra volver a salir de
q
, pero no de
r
. En efecto,
supongase que x
k

q
, entonces en ese instante, la solucion puede no satisfacer
la condicion de convergencia, pero sin embargo satisface que
J
s
N
(x
k+1
) J
s
N
(x
k
) L(x
k
, u
s
(k[k)) + ()
J
s
N
(x
k
) + () q + () r
por lo tanto x
k+1

r
. En el caso en que el estado saliese de
q
, el controlador
vuelve a conducirlo hacia este. Por lo tanto, el sistema quedara connado por lo
tanto en una region contenida en
r
.
(ii) Incertidumbres que decaen con el estado:
Sean unas incertidumbres tales que
(|w
k
|) (1 )l|x
k
|
para todo x
k

r
, entonces se satisface la restriccion de convergencia en todo
instante y por lo tanto el sistema incierto es asintoticamente estable al origen.
Notese que este resultado tambien se satisface para las incertidumbres que decaen
en el tiempo.
De todo lo anterior se deduce que el conjunto
r
es un invariante robusto para
cierto grado de incertidumbres. Entonces, por estar contenido en X
N
la evoluci on del
sistema satisface las restricciones.
Notese que en el caso de incertidumbres acotadas el sistema evoluciona partiendo
de
r
hasta un invariante robusto contenido en el donde queda connado. En este caso,
ante perturbaciones s ubitas tales que no saquen al sistema de
r
el sistema conserva
la estabilidad. Esto demuestra el comportamiento estable de los ensayos realizados en
(Scokaert et al. 1999).
5.7. Robustez del controlador MPC sin restriccion
terminal
El analisis de robustez realizado en las secciones anteriores es facilmente trasladable
al controlador MPC sin restriccion terminal ni restricciones sobre los estados. Esto se
debe a que la condicion de suavidad del coste optimo se satisface bajo condiciones
blandas.
154 5.7. Robustez del controlador MPC sin restriccion terminal
Lema 5.17 Sea un sistema incierto descrito por la ecuacion
x
k+1
= f(x
k
, u
k
, w
k
)
tal que u
k
U y x
k
IR
n
. La funcion del modelo f(, , ) es Lipschitz respecto x
k
y a
w
k
para todo u
k
U es decir
|f(x
1
, u, w
1
) f(x
2
, u, w
2
)| L
x
|x
1
x
2
| + L
w
|w
1
w
2
|
siendo L
x
y L
w
las constantes de Lipschitz del sistema.
Sea la funcion de coste de etapa L(x, u) Lipschitz en x con una constante L
c
y sea la
funcion de coste terminal V (x) Lipschitz con una constante de Lipschitz L
v
. Entonces
la funcion de coste optima del MPC sin restriccion terminal es suave y verica que
[J
N
(f(x, u, w)) J
N
(f(x, u, 0))[ L
J
|w|
siendo
L
J

_
L
c
L
N
x
1
L
x
1
+ L
v
L
N
x
_
L
w
Este resultado es una consecuencia inmediata del analisis de sensibilidad del MPC
desarrollado en el apendice C.
Por lo tanto, seg un se establecio anteriormente, el coste optimo es una funcion de
Lyapunov ISS, lo que garantiza estabilidad robusta del sistema para cierta cota de la
incertidumbre.
Dado que el controlador sin restriccion terminal estabiliza el sistema en una region
= x IR
n
: J
N
(x) L(x, K
MPC
(x)) + (N 1)d +
siendo d el mnimo coste de estapa que puede tener todo estado que no pertenece a
la region terminal = x IR
n
: V (x) . En el siguiente corolario se analiza la
invariancia robusta de esta conjunto.
Corolario 5.18 Bajo las hipotesis del lema anterior, el conjunto es un invariante
robusto para toda incertidumbre tal que
|w| =
d
L
J
Demostracion:
En efecto, supongase que x
k
y x
k+1
no pertenecen a , entonces
J
N
(x
k+1
) J
N
(x
k
) L(x
k
, K
MPC
(x
k
)) + L
J
(N 1)d + + L
J
sustituyendo el valor de se tiene que

J
N
(x
k+1
) Nd + L(x
k+1
, K
MPC
(x
k+1
)) + (N 1)d +
por lo que x
k+1
.
Ademas dado que para todo x / , se tiene que L(x, K
MPC
(x)) d, entonces
J
N
(x
k+1
) J
N
(x
k
) (L(x
k
, K
MPC
(x
k
)) d)
por tanto para todo x
k
/ , J
N
(x
k+1
) decrece haciendo converger el sistema en . El
sistema permanece en este conjunto, salvo que la incertidumbre en un momento dado
lo saque de este conjunto, de forma que el controlador vuelve a conducir el sistema
hasta esta region. Notese que si x
0
, entonces en ning un caso se abandonara dicha
region.
5.8. Ejemplo de aplicacion al reactor
A continuacion se va a comprobar que el MPC aplicado al reactor posee una robustez
inherente ante incertidumbres. En este caso se sintoniza el controlador MPC con los
mismos parametros que en la seccion 3.3.2. El horizonte de control en este caso es de
N
c
= N
p
= 3.
Para el sistema as sintonizado se ha calculado un conjunto invariante
r
contenido
en X
3
. Este conjunto viene dado por
r
= x IR
2
: J
3
(x) 8,5
Como se ha demostrado anteriormente, existe un conjunto de incertidumbres cuya
cota depende de r, para el cual el conjunto
r
es un conjunto invariante robusto. Con
el objeto de ilustrar la robustez inherente del controlador, se ha calculado grado de
incertidumbres que admite la region de una forma no conservadora, obteniendose unos
valores de las incertidumbres:
w
1
[610
3
, 610
3
]
w
2
[210
2
, 110
3
]
156 5.8. Ejemplo de aplicacion al reactor
0.3 0.2 0.1 0 0.1 0.2
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
r

X
3
Figura 5.4: Evolucion del sistema incierto controlado por el MPC.
En la gura 5.4 se muestra el dominio de atraccion del controlador X
3
y la region
r
.
Tambien se muestra la evoluci on del sistema ante incertidumbres que se han modelado
como aleatorias. Como se puede observar, el sistema evoluciona hasta quedar connado
en una cierta vecindad del origen.
En la gura 5.5 se ilustra que la evolucion del sistema incierto permanece en
r
para las cotas de incertidumbres obtenidas. Para ello se muestra la evolucion del sistema
considerando las incertidumbres mnimas (a) y maximas (b), constantes a lo largo de la
evoluci on. Se han considerado por ser estas las realizaciones mas desfavorables. Se puede
comprobar que los estados mas sensibles a las incertidumbres son los extremos derecho
e izquierdo de las regiones y son las zonas que marcan las maximas incertidumbres que
admite el sistema. Esto supone un conservadurismo en el resto del invariante, pero es
la unica forma de garantizar la estabilidad robusta en toda la region
r
.
Es importante resaltar, que las cotas que se obtienen a partir de los procedimientos
presentados en este captulo son mas conservadoras que las utilizadas en este ejemplo.
Estas han sido calculadas para ilustrar la robustez inherente del controlador y tras un
exhaustivo analisis del sistema. Sin embargo, a pesar del conservadurismo de los proce-
dimientos presentados, son metodos generales para obtener un grado de incertidumbres
para las cuales el sistema es robusto.
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
0.4
0.3
0.2
0.1
0
0.1
0.2
0.3
0.4
x
1
x
2
r

0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
0.4
0.3
0.2
0.1
0
0.1
0.2
0.3
0.4
r

x
2
x
1
(a) (b)
Figura 5.5: Evolucion del sistema incierto con incertidumbres mnimas (a) y maximas (b)
5.9. Conclusiones
En esta seccion se ha abordado el analisis de robustez inherente del controlador
MPC, es decir, se ha analizado el grado de incertidumbre que es capaz de soportar el
controlador dise nado para el sistema nominal. Resultados existentes en la literatura
establecen robustez del MPC para sistemas cuyas actuaciones son anes en el modelo
y no presentan restricciones ni en los estados ni en las actuaciones. Basandose en la
optimalidad del problema, se establecen margenes de estabilidad robusta ante incer-
tidumbres en las entradas (Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni &
Sepulchre 1997).
En este captulo, el analisis de estabilidad se basa en la teora de Lyapunov, sigui-
endo la lnea de (Scokaert et al. 1997, De Nicolao et al. 1998) extendiendo resultados
previos al caso de incertidumbres aditivas en el modelo. Se hace hincapie en la necesi-
dad de garantizar la satisfaccion de las restricciones a pesar de las incertidumbres,
para lo cual se hace uso del concepto de invariancia robusta y se incorporan resultados
existentes (Kerrigan 2000). Este resultado ha sido presentado en (Limon Marruedo,
Alamo & Camacho 2002c).

Este analisis se puede generalizar a controladores con estabilidad asintotica e in-
certidumbres parametricas en el sistema gracias a la incorporacion del concepto y
resultados de la estabilidad entrada a estado (ISS) del sistema. As, se puede establecer
el siguiente resultado: la suavidad de la funcion de coste optimo garantiza que el MPC
admite cierto grado de incertidumbre. Este analisis, al igual que el anterior, representa
una de las aportaciones originales de esta tesis.
Tambien se pone de maniesto la relacion entre suboptimalidad y robustez, pues
esta tan solo tiene sentido en presencia de incertidumbres. Dado que las condiciones de
suavidad del coste optimo estan basadas en la optimalidad de la solucion, la suavidad
se puede perder en el MPC suboptimo. Sin embargo, sorprendentemente, la suavidad
del coste optimo, garantiza la robustez del MPC suboptimo, pues garantiza la factibili-
dad de la restriccion de convergencia. Este analisis constituye tambien una aportacion
original de esta tesis.
Por ultimo, se ha demostrado la robustez del MPC sin restriccion terminal, dado
que la ausencia de restricciones en los estados permite garantizar la suavidad del coste
optimo. Ademas se determina una cota explcita de las incertidumbres que admite.
Este analisis tambien es original de esta tesis.
En este captulo se ha puesto de maniesto que la suavidad del coste optimo es una
pieza clave para la robustez del MPC nominal. Sin embargo, esta condicion se puede
satisfacer bajo ciertas condiciones de regularidad del problema, difciles de comprobar.
Por lo tanto, resulta interesante encontrar alguna forma de sintonizar el controlador que
garantice cierto grado de robustez. En el captulo siguiente se presenta una formulaci on
del MPC que la estabilidad entrada a estado del controlador y la satisfaccion robusta
de las restricciones.
Captulo 6
MPC ISS con satisfaccion robusta
de las restricciones
6.1. Introduccion
En el anterior captulo se analizo la robustez que inherentemente presenta el contro-
lador predictivo. Esta robustez se comprueba de dos formas: mediante la optimalidad
de la solucion y mediante la capacidad del controlador MPC de estabilizar asintotica-
mente el sistema. En todos los estudios realizados se parte de la hipotesis que el coste
optimo es una funcion suave (en los basados en optimalidad se exige que sea (
2
(De
Nicolao et al. 1996, Magni & Sepulchre 1997)) y esta condicion tan solo esta garan-
tizada bajo ciertas condiciones de regularidad del problema de optimizacion (vease el
apendice C).
En este captulo se presenta un procedimiento sencillo para incorporar el conocimien-
to de las incertidumbres en el dise no del controlador. Esta basado en la acotacion de la
discrepancia entre la evoluci on del sistema nominal y el real cuando el sistema presenta
incertidumbres. Esta acotacion se incorpora en las restricciones en los estados y en el
dise no de la region terminal y a partir de estos, se formula un controlador MPC basado
en predicciones nominales, semejante a las formulaciones no robustas.
El controlador presentado es factible en todo instante (partiendo de estados ini-
ciales factibles) y por lo tanto satisface las restricciones en cada instante a pesar de
la incertidumbres. Ademas, el controlador es estable entrada a estado lo que garantiza
la convergencia del sistema. Este trabajo ha cristalizado en una publicacion (Limon
Marruedo,

159
160 6.2. Descripcion del sistema
6.2. Descripcion del sistema
A lo largo del captulo se va a considerar que el sistema real o planta responde a
un modelo incierto descrito por
x
k+1
= f(x
k
, u
k
, w
k
) (6.1)
siendo x
k
IR
n
el vector de estados del sistema y u
k
IR
m
las actuaciones sobre el
mismo. El vector w
k
IR
p
representa las incertidumbres presentes en el modelo, de las
cuales se conoce exclusivamente que estan acotadas de forma que
w
k
B
= w IR
p
: |w|
Por otro lado las entradas y los estados estan sujetos a las restricciones
u
k
U
x
k
X
El modelo en ausencia de incertidumbres viene dado por
x
k+1
= f(x
k
, u
k
, 0) (6.2)
y se denomina modelo nominal. Este modelo es el que se utiliza como modelo de
prediccion en el controlador MPC propuesto.
Ademas se va a suponer que el sistema satisface la siguiente hipotesis de suavidad.
Hipotesis 6.1 El modelo es suave respecto a los estados y a las incertidumbres, de
forma que existen dos funciones / ,
x
() y
w
(), tales que
|f(x + x, u, 0) f(x, u, 0)|
x
(|x|)
|f(x, u, w) f(x, u, 0)|
w
(|w|)
para todo x, x + x X, u U y w B
.
Resulta interesante destacar que en el caso en el que el modelo sea Lipschitz respecto
a x y a w, entonces estas funciones tienen la forma
x
(|x|) = L
x
|x|
w
(|w|) = L
w
|w|
Captulo 6. MPC ISS con satisfaccion robusta de las restricciones 161
6.3. Acotacion del efecto de las incertidumbres en
la prediccion
Las incertidumbres existentes en el sistema real o planta hacen que el compor-
tamiento de este diera del comportamiento dado por el modelo nominal, por lo que
el sistema no evolucionara como se espera. Con el n de incorporar este efecto en el
dise no del controlador, resulta de interes realizar una acotacion de la discrepancia entre
la evoluci on del sistema real y la evoluci on esperada o predicha por el modelo nominal,
ante una misma secuencia de actuaciones.
Para hacer mas legibles las demostraciones de esta seccion se denotara:
x
k+j
: el estado del sistema real (incierto) en el instante k +j al aplicar una secuencia
de actuaciones u
k
, , u
k+j1
a partir del instante k, estando el sistema en el
estado x
k
.
x(k + j[k) : el estado predicho mediante el modelo nominal (en ausencia de incertidum-
bres) ante la misma secuencia de actuaciones y partiendo de x
k
.
El objeto de esta seccion es pues calcular una acotacion de la forma
|x
k+j
x(k + j[k)| c
j
()
siendo la constante la cota de las incertidumbres, tal que w
k
B
. Esta se establece
en el siguiente lema.
Lema 6.2 Sea un sistema dado por la ecuacion (6.1) tal que satisface la hipotesis 6.1,
entonces
|x
k+j
x(k + j[k)| c
j
()
donde c
j
() viene dada por la recursion
c
j
() =
w
() +
x
(c
j1
())
siendo c
1
() =
w
().
Demostracion:
Para ello se va a proceder de la siguiente forma:
162 6.3. Acotacion del efecto de las incertidumbres en la prediccion
j = 1 :
|x
k+1
x(k + 1[k)| = |f(x
k
, u
k
, w
k
) f(x
k
, u
k
, 0)|
w
() = c
1
()
j = 2 :
|x
k+2
x(k + 2[k)| = |f(x
k+1
, u
k+1
, w
k+1
) f(x(k + 1[k), u
k+1
, 0)|
|f(x
k+1
, u
k+1
, w
k+1
) f(x
k+1
, u
k+1
, 0)|
+|f(x
k+1
, u
k+1
, 0) f(x(k + 1[k), u
k+1
, 0)|

w
() +
x
(|x
k+1
x(k + 1[k)|)

w
() +
x
(c
1
()) = c
2
()
j : siguiendo este procedimiento, para k +j se tendra
|x
k+j
x(k + j[k)| = |f(x
k+j1
, u
k+j1
, w
k+j1
) f(x(k + j 1[k), u
k+j1
, 0)|
|f(x
k+j1
, u
k+j1
, w
k+j1
) f(x
k+j1
, u
k+j1
, 0)|
+|f(x
k+j1
, u
k+j1
, 0) f(x(k + j 1[k), u
k+j1
, 0)|

w
() +
x
(|x
k+j1
x(k + j 1[k)|)

w
() +
x
(c
j1
()) = c
j
()
Es interesante resaltar que la funcion c
j
() tiene las siguientes propiedades:
Propiedad 6.3 La funcion c
j
() verica que:
(i) Es una funcion / .
(ii) La secuencia c
j
() es monotonamente creciente, es decir, c
j
() > c
j1
() para
todo > 0.
Demostracion:
(i) Se demuestra por induccion: dado que c
1
() =
w
(), esta funcion es / .
Supongase que c
j1
() es una funcion / . Entonces, considerando que la composi-
cion de dos funciones / es tambien una funcion / y que la suma de dos funciones
/ es tambien una funcion / , se tiene que
c
j
() =
w
() +
x
(c
j1
())
es una funcion / .
(ii) Se demuestra por induccion: en primer lugar se demuestra que
c
2
() =
w
() +
x
(c
1
()) >
w
() = c
1
()
Entonces si c
j
() > c
j1
(), se tiene que
c
j+1
() =
x
() +
x
(c
j
()) >
x
() +
x
(c
j1
()) = c
j
()
por ser
x
() una funcion / .
Notese que una secuencia monotonamente creciente no tiene por que divergir. Por
tanto, la acotacion del efecto de las incertidumbres puede no tender a innito (cuando
j ), permaneciendo acotado, tal y como puede ocurrir en sistemas estables.
En el desarrollo llevado a cabo en las siguientes secciones, se requiere la acotacion
de la discrepancia que experimenta el sistema considerando tan solo el efecto de las
incertidumbres en el instante siguiente. Esta acotacion se establece en el siguiente lema.
Lema 6.4 Sea x
k
el estado de un sistema incierto descrito por (6.1) tal que satisface
la hipotesis 6.1. Sea x(k + j[k) el estado predicho en el instante k + j a partir de
x(k[k) = x
k
utilizando el modelo nominal y aplicando una secuencia de actuaciones
u
F
(k) = u(k[k), , u(k + j 1[k)
Sea x
k+1
el estado al que evoluciona el sistema incierto al aplicar u(k[k). Sea el estado
x(k +j[k +1) el estado predicho en el instante k +j a partir de x(k +1[k +1) = x
k+1
aplicando el resto de la secuencia u
F
(k), es decir u(k + 1[k), , u(k + j 1[k).
|x(k + j[k) x(k +j[k + 1)|
j1
x

w
() (6.3)
para cualquier incertidumbre w
k
B
, siendo
i
x
() la composicion sucesiva i veces de
la funcion
x
().
Demostracion:
Para j = 1 se tiene que
|x(k + 1[k + 1) x(k + 1[k)| = |x
k+1
x(k + 1[k)|
w
()
La prediccion en el instante siguiente verica que
|x(k + 2[k + 1) x(k + 2[k)|
x
(|x(k + 1[k + 1) x(k + 1[k)|)
x

w
()
y analogamente para la prediccion siguiente se tiene que
|x(k + 3[k + 1) x(k + 3[k)|
x
(|x(k + 2[k + 1) x(k + 2[k)|)
2
x

w
()
Procediendo por recursion se demuestra el lema.
6.3.1. Acotacion basada en la continuidad Lipschitz
Particularmente interesante resulta el caso en el que el modelo sea Lipschitz, tanto
en los estados como en las incertidumbres. Como se coment o anteriormente, en este
caso las funciones
x
() y
w
() toman la forma
x
(|x|) = L
x
|x|
w
(|w|) = L
w
|w|
y por lo tanto
j
x
(x) = L
j
x
|x|
De la recursion presentada en el lema 6.2 es inmediato comprobar que
|x
k+j
x(k +j[k)| c
j
() =
i=j1
i=0
L
i
x
L
w
=
L
j
x
1
L
x
1
L
w
y ademas se tiene que

c
j
() = c
j1
() + L
j1
x
L
w
Merece la pena destacar que la continuidad Lipschitz es la forma mas blanda de

suavidad y basta con que la funcion sea continuamente diferenciable para garantizarla.
En este caso, la constante de Lipschitz se puede calcular como la maxima norma in-
ducida del jacobiano del modelo, lo que no es complejo de obtener.
6.3.2. Reduccion del conservadurismo
Las cotas obtenidas de la discrepancia entre la evolucion real del sistema y la
predicha por el modelo nominal estan basadas en las funciones / que acotan las varia-
ciones del modelo en el estado
x
() y en las incertidumbres
w
(),
|f(x + x, u, w) f(x, u, w)|
x
(|x|)
|f(x, u, w) f(x, u, 0)|
w
(|w|)
que se verican para todo x, x + x X, u U y w B
. Dado el caracter global

de estas acotaciones, las cotas obtenidas son conservadoras, pues representan la peor
de las situaciones posibles. Por lo tanto al incorporar estas acotaciones en el dise no del
controlador predictivo, se esta considerando siempre que el sistema se encuentra en la
situacion mas desfavorable, lo que conduce a actuaciones conservadoras.
Sin embargo, la principal fuente de conservadurismo radica en el hecho de que las
predicciones se hacen a partir de una secuencia de actuaciones jas, independiente de
las incertidumbres. Es decir, que las predicciones no consideran el efecto de la realimen-
tacion del controlador, y por lo tanto, la adaptacion que las actuaciones experimentan
ante el efecto de las incertidumbres. Esto es derivado del hecho de que el MPC es
una estrategia en bucle abierto aplicada en bucle cerrado mediante la estrategia de
horizonte deslizante. Este problema ha dado lugar a una reformulacion del MPC de
cara a la robustez, en lo que se ha denominado formulacion del MPC en bucle cerrado
(Mayne et al. 2000, Scokaert & Mayne 1998). Este problema se tratara en un captulo
posterior de esta tesis.
Con vista a reducir el conservadurismo de estas cotas se pueden llevar a cabo las
siguientes medidas:
Eleccion de una norma adecuada : las acotaciones obtenidas estan denidas en
una norma y sus propiedades son independientes de esta. Sin embargo, los val-
ores alcanzados por estas funciones, y por lo tanto la bondad de la acotacion,
s puede depender de la norma elegida. Una reduccion en alguna de estas fun-
ciones puede reducir el grado de conservadurismo de la cota. La reduccion de
x
() es particularmente interesante por la composicion sucesiva que experimenta
en la determinacion de la cota.
Para ilustrar este punto, considerese una acotacion basada en la constante de
Lipschitz. Como se comento anteriormente, el valor de dicha constante depende
de la norma. Sea la norma ||
s
en la que se acota la discrepancia, de forma que
|f(x, u, w) f(x, u, 0)|
s
L
w
|w|
s
L
w
Considerese otra norma diferente ||

q
en la que se calcula la constante de Lips-
chitz L
x
, de forma que
|f(y, u, w) f(x, u, w)|
q
L
x
|y x|
q
Sean las constantes m
q
y M
q
tales que m
q
|x|
q
|x|
s
M
q
|x|
q
, entonces
|f(x, u, w) f(x, u, 0)|
q
M
q
|f(x, u, w) f(x, u, 0)|
s
M
q
L
w
Por lo tanto la acotacion de la discrepancia en norma ||

q
viene dada por
|x
k+j
x(k + j[k)|
q

L
j
x
1
L
x
1
M
q
L
w

y de la equivalencia entre normas se deduce que la acotacion de la discrepancia
en norma ||
s
es
|x
k+j
x(k + j[k)|
s

L
j
x
1
L
x
1
M
q
m
q
L
w
De esta expresion se deduce que, por el efecto de la composicion de L

x
, una re-
duccion en el valor de L
x
puede afectar en mayor medida que un posible aumento
en la relacion entre normas (que viene dado por la razon M
q
/m
q
).
Tomese por ejemplo un sistema lineal x
k+1
= Ax
k
+ w
k
siendo
A =
_
_
0,9 2,0
0 0,8
_
_
con unas incertidumbres |w
k
|
0,1 y considerando la norma-s como la norma

. Dado que la norma de la matriz |A| es una constante de Lipschitz del modelo,
se tiene que L
x
= |A|
= 2,9. Dado que la incertidumbre es aditiva, la constante

de Lipschitz L
w
= 1, por lo que la cota obtenida en j = 5 es
|x
k+5
x(k + 5[k)|
107,43 0,1 = 10,74

Sin embargo, si se toma como norma-q, para calcular la constante de Lipschitz, la
norma dos ponderada ||
P
con una matriz de ponderacion P tal que A
T
PA
P entonces la constante de Lipschitz es L
P
= |A|
P
=

. Resolviendo este
problema, que se puede expresar en forma de desigualdad matricial lineal (LMI)
(Boyd, Ghaoui, Feron & Balakrishnan 1994), se obtiene una matriz
P =
_
_
1,0189 0,7283
0,7283 29,9620
_
_
lo que induce una constante de Lipschitz L
P
= 1,113 y unas constantes m
P
=
0,1826 y M
P
= 1,4138. En este caso, la cota obtenida es
| x(k + 5[k) x
k+5
|
4,84
Como se puede observar, la cota obtenida es mas precisa. La obtencion de una
norma adecuada para un sistema no lineal es una tarea difcil, pero lo que no
debe hacerse es tomar cualquier norma, pues se puede incurrir en el aumento del
conservadurismo.
Controlador en cascada : fue propuesto originalmente en (Bemporad 1998), con
el n de reducir el conservadurismo de las predicciones en bucle abierto en un
controlador MPC robusto lineal. La idea consiste en a nadir una realimentacion
adicional al sistema con el n de considerar en las predicciones la realimentacion
que introduce el controlador MPC.
Incorporando esta idea en la acotacion que se esta realizando, la actuacion sobre
el sistema se reformula como
u
k
= Kx
k
+ v
k
siendo v
k
la nueva variable de decision en el problema de optimizacion. As, el
modelo del sistema prealimentado sera
x
k+1
= f(x
k
, Kx
k
+ v
k
, w
k
) = f
K
(x
k
, v
k
, w
k
)
el cual vara por el efecto del controlador de la prealimentaci on. De esta manera,
las funciones de acotacion, principalmente
x
(), varan y por lo tanto se pueden
reducir las cotas.
Utilizacion de aproximaciones locales : la acotacion sobre la discrepancia entre
el estado predicho y el real, se puede reducir si se calcula esta de forma local, es
decir, dependiendo no solo del grado de incertidumbre, sino tambien del estado
y secuencia de actuaciones que se aplican. Esto se puede hacer utilizando las
regiones de evoluci on incierta, que se desarrolla en el captulo siguiente.
6.4. Controlador MPC con estabilidad entrada a
estado
En el captulo anterior se introdujo el concepto de estabilidad entrada a estado y
se comprobo que esta teora ofrece un marco adecuado para el analisis de robustez
del controlador MPC. De este analisis se deduce que si el coste optimo es suave y la
inuencia de las incertidumbres sobre el sistema es suave, entonces el sistema admite
cierto grado de incertidumbre. La suavidad del MPC esta sujeta a condiciones de
regularidad en el problema de optimizacion, que resultan difciles de comprobar.
En esta seccion se plantea una formulaci on del MPC que garantiza la estabilidad
entrada a estado del sistema sin consideraciones de suavidad en el coste optimo. En este
analisis se considera primero el caso en que no hayan restricciones en los estados. En
una seccion posterior se extienden los resultados al caso con restricciones en los estados.
La motivaci on de este analisis por separado es distinguir los dos aspectos de la robustez:
la factibilidad robusta y la convergencia. La convergencia esta garantizada para todo
estado inicial factible, bajo cierta cota de las incertidumbres admitidas, gracias a la
estabilidad entrada a estado. La factibilidad se garantiza modicando las restricciones
en funcion de las incertidumbres presentes en el sistema.
El controlador que se propone se basa en la formulacion robusta del controlador
MPC dual presentada en (Michalska & Mayne 1993). En este trabajo se presenta
168 6.4. Controlador MPC con estabilidad entrada a estado
primero un controlador MPC dual, tal que conduce el sistema hasta una region terminal
, donde un controlador local es el encargado de estabilizarlo hasta el origen. En esta
formulaci on, ademas de la conmutaci on del controlador, el horizonte de control es una
variable de decision, por lo que se va reduciendo a lo largo de la evolucion del sistema.
Con el n de proveer robustez al sistema cuando se a nade un observador de los estados,
se propone un controlador robusto dual que estabiliza sistemas con cierto grado de
incertidumbres aditivas que decaen con el tiempo. Partiendo de un invariante robusto,
se considera en el problema de optimizacion una region terminal mas conservadora
. Para cierto grado de incertidumbres se garantiza que en el instante siguiente el
problema es factible en y por lo tanto el controlador local lo puede llevar hasta en
un tiempo determinado.
En la formulaci on que se propone en esta seccion, se utiliza la idea de la region
terminal conservadora pero se extiende a un controlador MPC con horizonte jo, y por
lo tanto no es necesario conmutar a un controlador local. Ademas se demuestra que el
controlador propuesto garantiza la estabilidad entrada a estado para ciertas cotas de
las incertidumbres.
Cabe resaltar que la formulaci on que se presenta esta basada en la prediccion no-
minal del sistema, con un problema de optimizacion semejante al de un MPC general.
Por lo tanto el procedimiento propuesto para garantizar robustez es tan sencillo co-
mo considerar en el problema de optimizacion una region interior a la region terminal
obtenida.
A continuaci on se presentan una serie de resultados preliminares sobre la region
terminal necesarios para la formulacion del controlador que se propone.
6.4.1. Determinacion de la region terminal
Se va a considerar que el sistema satisface la siguiente hipotesis:
Hipotesis 6.5 El sistema es tal que existe un conjunto que es un conjunto invariante
positivo del sistema controlado por una ley de control u
k
= h(x
k
), tal que
1. X
h
= x IR
n
: h(x) U.
2. Sea un conjunto invariante tal que
1
Q
h
() (6.4)
1
Q
h
() = x IR
n
: h(x) U y f(x, h(x)) . Vease la seccion A.3.
es decir, que para todo x , se satisface que f(x, h(x), 0) .
3. El sistema en bucle cerrado tiene una funcion de Lyapunov asociada V (x) tal que
V (f(x, h(x), 0)) V (x) L(x, h(x)) x
4. Sea un conjunto no vaco B
= z IR
n
: |z| tal que
B
(6.5)
siendo B
= IR
n
: , z B
[ = + z.
Notese que las condiciones impuestas sobre el conjunto invariante y la funcion
de coste terminal V (x) son la hipotesis habituales a imponer sobre la region terminal
del MPC nominal. El conjunto y el conjunto B
existen gracias a que el controlador

local estabiliza asintoticamente el sistema.
Se va a suponer ademas que la funcion de Lyapunov satisface la siguiente hipotesis
Hipotesis 6.6 La funcion de coste terminal V (x) es suave, de forma que existe una
funcion / ,
V
(x), tal que
[V (x + x) V (x)[
V
(|x|)
para todo x .
En el caso en que el conjunto venga dado por
= x IR
n
: V (x)
y el controlador local estabilice exponencialmente el sistema siendo V (x) la funcion
de Lyapunov asociada, se puede obtener el conjunto de la siguiente forma: sea una
constante positiva < 1 tal que, para todo x verica
2
V (f(x, h(x), 0)) V (x)
entonces se puede determinar el conjunto como
= x IR
n
: V (x) =
v
El conjunto B
vendr a dado por un valor de tal que
V
() (
v
) = (1 ) (6.6)
dado que para todo x y z B
, se verica que
V (x + z) V (x) +
V
(|z|)
v
+
V
()
y por tanto x + z , por lo que B
.
2
6.4.2. Formulaci on del MPC
Una vez determinados la region terminal , el controlador MPC se obtiene de la
resolucion del siguiente problema de optimizacion:
mn
u
F
(k)
J
N
(x
k
, u
F
(k))
s.a
u(k + j[k) U j = 0, , N 1
x(k + N[k)
J
N
(x
k
, u
F
(k)) =
N1
i=0
L(x(k + i[k), u(k + i[k)) + V (x(k + N[k))
El vector u
F
(k) denota la secuencia de N actuaciones futuras
u
F
(k) = u(k[k), , u(k + N 1[k)
siendo u(k + j[k) la actuacion en el instante k + j calculada en el instante actual k.
Ante esta secuencia de actuaciones, la evolucion predicha del sistema en el instante
k +j +1 a partir del modelo nominal del sistema se denota como x(k +j +1[k) y viene
dada por
x(k + j + 1[k) = f(x(k + j[k), u(k +j[k), 0)
de modo que x(k[k) es el estado muestreado del sistema en el instante actual x
k
.
Como se puede observar, este problema de optimizacion es semejante al asociado a
la formulaci on general del MPC, en el que la region terminal es un invariante con unas
condiciones adicionales.
Se va a considerar que el coste de etapa satisface la siguiente hipotesis de suavidad:
Hipotesis 6.7 La funcion de coste de etapa L(x, u) es suave respecto al estado de
forma que existe una funcion / ,
L
(x), tal que
[L(x + x, u) L(x, u)[
L
(|x|)
para todo u U y para todo x IR
n
.
6.4.3. Analisis de estabilidad
Para comprobar la estabilidad entrada a estado del sistema, se va a demostrar
primero que el controlador esta bien planteado bajo cierto grado de incertidumbres,
es decir, que si un estado es factible, entonces el estado siguiente tambien lo es. Esta
prueba de factibilidad robusta permite armar que el conjunto de estados factibles es
un invariante robusto positivo del sistema.
Teorema 6.8 (Factibilidad robusta)
Sea un sistema incierto descrito por un modelo
x
k+1
= f(x
k
, u
k
, w
k
)
con las actuaciones sujetas a u
k
U en todo instante k. Las incertidumbres w
k
IR
p
estan contenidas en el conjunto w
k
B
= w IR
p
: |w| .
Supongase que las funciones que describen el modelo f(, , ), el coste terminal V () y
el coste de etapa L(, ) son funciones suaves que satisfacen las hipotesis 6.1,6.6 y 6.7.
Sea el controlador MPC obtenido del problema de optimizacion propuesto,de forma tal
que el conjunto terminal satisface la hipotesis 6.5, siendo B
el conjunto asociado a
.
Entonces el sistema incierto controlado por el controlador MPC propuesto, si parte
de un estado inicial factible (x
0
X
r
N
), la evolucion del sistema incierto es factible
(x
k
X
r
N
), para unas incertidumbres tales que
N1
x

w
()
Demostracion:
Para probar el teorema, se va a proceder demostrando que para todo x
k1
X
r
N
, se
tiene que x
k
= f(x
k1
, u
(k1[k1), w
k1
) X
r
N
para toda incertidumbre w
k1
B
.
Esta condicion garantiza que el conjunto X
r
N
es un invariante robusto del sistema en
bucle cerrado.
Sea u
F
(k 1) la solucion optima en el instante k 1. A partir de esta se va a
calcular una secuencia u
F
(k) para el instante k, de forma que
u(k +j 1[k) =
_
_
_
u
(k + j 1[k 1) para j = 1, ..., N 1

h( x(k + N 1[k)) para j = N
(6.7)
Se denota x(k + j[k) al estado predicho en k + j a partir del estado x(k[k) = x
k
utilizando el modelo nominal (en ausencia de incertidumbres) y aplicando la secuencia
de actuaciones u
F
(k).
A continuacion se va a demostrar que esta secuencia de actuaciones es factible en
el instante k, lo que demuestra el teorema. Para ello se va a comprobar la satisfaccion
de las restricciones del problema de optimizacion en x
k
para cualquier incertidumbre
admisible.
a) u(k +j[k) U: es consecuencia inmediata de la factibilidad de u
F
(k 1) y de la
propiedad del controlador local por la cual h(x) U, x .
b) x(k +N[k) : en la gura 6.1,se ilustra la idea de esta demostracion. Primero
se va a demostrar que x(k + N 1[k) . Para ello tengase en cuenta que por
el lema 6.4 se tiene que
| x(k +N 1[k) x
(k + N 1[k 1)|
N1
x

w
()
Considerando que
N1
x

w
() se deduce que el vector
z = x(k + N 1[k) x
(k + N 1[k 1) B
Entonces, considerando que x
(k + N 1[k 1) y que z B
se tiene que
x(k +N 1[k) = x
(k + N 1[k 1) + z B

Por la hipotesis 6.4 se tiene que Q
h
() y por lo tanto el controlador local es
capaz de llevar cualquier estado de a en un solo paso. Por lo tanto
x(k + N[k) = f( x(k +N 1[k), h( x(k + N 1[k)), 0)
lo que demuestra la factibilidad de la restriccion terminal.
4 3 2 1 0
0
1
2
3
4
x
1
x
2
x
k1

x
k

x
*
(k+N1|k1)
x(k+N1|k)
x(k+N|k)

Figura 6.1: Ilustracion de la factibilidad robusta de la restriccion terminal
En el caso de continuidad Lipschitz de las funciones, la cota de incertidumbre ad-
mitida es

L
N1
x
L
w
Notese que si el sistema es estable y con una constante de Lipschitz L
x
< 1, cuanto
mayor es el horizonte, mayor es el grado de incertidumbres que admite el controlador.
Una vez demostrado que el controlador es factible a lo largo de la evoluci on del
sistema incierto, se va a demostrar que el sistema en bucle cerrado es estable entrada a
estado respecto a las incertidumbres. Esto implica que el controlador es robusto en el
sentido de que si las incertidumbres sobre el sistema estan acotadas, el comportamiento
del sistema tambien estara acotado. Si, ademas, estas decaen con el tiempo, el contro-
lador estabiliza asint oticamente el sistema incierto. Este resultado forma parte de las
contribuciones de esta tesis.
Teorema 6.9 (Estabilidad entrada a estado)
x
k+1
= f(x
k
, u
k
, w
k
)
k
k
IR
p
k
B
= w IR
p
: |w| .
Sea el sistema y el controlador MPC tales que satisfacen las hipotesis del teorema 6.8
con un dominio de atraccion X
r
N
.
Entonces el sistema en bucle cerrado es estable entrada a estado respecto a las incer-
tidumbres para todo x
0
X
r
N
.
Demostracion:
En esta demostracion se sigue la misma notacion utilizada en la demostracion del
teorema 6.8, siendo u
F
(k 1) la secuencia optima de actuaciones obtenida en el estado
x
k1
. Como consecuencia de la aplicacion de la actuacion optima, el sistema evoluciona
al estado x
k
, en el cual, como se demostro anteriormente, existe una secuencia factible
de actuaciones u
F
(k) calculada a partir de la secuencia u
F
(k1). Los estados predichos
con esta secuencia son x(k +j[k). As el coste optimo en el instante k 1 es
J
N
(x
k1
) =
N1
i=0
L(x
(k + i 1[k 1), u
(k + i 1[k 1)) + V (x(k + N 1[k 1))

y el coste de la secuencia factible en k es
J
N
(x
k
) = J
N
(x
k
, u
F
(k)) =
N1
i=0
L( x(k + i[k), u(k + i[k)) + V ( x(k + N[k))
Restando ambas expresiones se tiene que
J
N
(x
k
) J
N
(x
k1
) =
N2
i=0
_
L( x(k +i[k), u(k + i[k))
L(x
(k +i[k 1), u
(k + i[k 1))
_
L(x
k1
, u
(k 1[k 1))
+L( x(k + N 1[k), h( x(k + N 1[k)))
+V ( x(k + N[k)) V (x
(k + N 1[k 1))
Teniendo en cuenta que u(k +i[k) = u
(k +i[k 1) para todo i = 0, , N 2, del

lema 6.4 se tiene que
| x(k + i[k) x
(k + i[k 1)|
i
x

w
()
Basandose en la suavidad de L(, ) y V () se pueden obtener las siguientes acotaciones:
L( x(k + i[k), u(k + i[k)) L(x
(k +i[k 1), u
(k + i[k 1))
L

i
x

w
()
y analogamente
V ( x(k +N 1[k)) V (x
(k + N 1[k 1))
V

N1
x

w
()
Considerando que x(k + N 1[k) , de la condicion terminal se tiene que
L( x(k + N 1[k), h( x(k + N 1[k))) + V ( x(k + N[k)) V ( x(k +N 1[k))
Incorporando estas condiciones se tiene que
J
N
(x
k
) J
N
(x
k1
)
_
N2
i=0
L

i
x

w
() +
V

N1
x

w
()
_
L(x
k1
, u
(k 1[k 1))
Dado que las funciones
L
(),
V
(),
x
() y
w
(), son funciones / , entonces el
primer sumando es una funcion / que se va a denotar (). Por otro lado, la funcion
de coste de etapa verica L(x
k1
, u
(k 1[k 1)) l|x

k1
|
. Considerando esto, por

el principio de optimalidad se tiene que
J
N
(x
k
) J
N
(x
k1
) l|x
k1
|
+ ()
y por lo tanto, en virtud de la denicion de funcion de Lyapunov entrada a estado
3
,
la funcion de coste optimo es una funcion de Lyapunov entrada a estado, y en conse-
cuencia, el sistema en bucle cerrado es estable entrada a estado.
Por ultimo, merece la pena resaltar que el controlador propuesto puede ser bastante
conservador por dos motivos:
Esta basado en una acotacion conservadora. El conservadurismo en la acotacion
hace que las cotas de incertidumbre que admite el sistema y el dominio de atrac-
cion asociado sean menores que los que se podran obtener con otro tipo de
acotaciones no tan conservadoras. Las medidas propuestas para reducir el con-
servadurismo tienden a suavizar este efecto.
Esta basado en predicciones en bucle abierto. Esta es sin duda la causa mas
importante. La prediccion del comportamiento del sistema se hace sin atender a
la posible reaccion del controlador ante la incertidumbre presente en el sistema.
Esto hace que el sistema real pueda admitir un mayor grado de incertidumbre
que el grado para el cual se garantiza la estabilidad.
6.5. Robustez de la formulacion con N
p
> N
c
Del analisis de estabilidad desarrollado en la seccion anterior, se deducen unas pro-
piedades interesantes en el caso en que se considere un horizonte de prediccion mayor
que el de control.
En esta formulacion, la secuencia de actuaciones se calcula para un horizonte de
control N
c
, de forma que la prediccion del comportamiento se extiende hasta N
p
apli-
cando el controlador local obtenido para la region terminal u
k
= h(x
k
). Seg un esto, el
MPC se formula como
mn
u
F
J
Nc,Np
(x
k
, u
F
)
s.a
u(k + j[k) U j = 0, , N
c
1
h(x(k +j[k)) U j = N
c
, , N
p
1
x(k + N
p
[k)
(6.8)
3
176 6.5. Robustez de la formulacion con N
p
> N
c
siendo el funcional considerado
J
N
c
,N
p
(x
k
, u
F
) =
N
c
1
i=0
L(x(k + i[k), u(k + i[k))
+
Np1
i=N
c
L(x(k + i[k), h(x(k + i[k))) + V (x(k + N
p
[k))
En este caso las predicciones se realizan de forma que
x(k + j + 1[k) = f(x(k + j[k), u(k + j[k), 0) j = 0, N
c
1
x(k + j + 1[k) = f(x(k + j[k), h(x(k + j[k)), 0) j = N
c
, N
p
1
siendo x(k[k) = x
k
.
Esta formulaci on hace que la acotacion del efecto de la incertidumbre obtenida
cambie para predicciones mas alla del horizonte de control. Para ello basta considerar
la funcion / ,
hx
(), tal que
|f(x + x, h(x + x), 0) f(x, h(x), 0)|
hx
(|x|)
para todo x, x + x S
NpNc
( IR
n
, ).
Notese que esta acotacion es menos conservadora que
x
() pues acota el efecto de
la variaci on sobre el estado del sistema en bucle cerrado controlado por una ley de
control asintoticamente estabilizante. Por tanto, el efecto de x sobre el sistema es-
tara compensado por el controlador. Esta compensacion no se considera en la denicion
de
x
().
En consecuencia la acotacion |x(k + j[k) x
k+j
| c
j
() se obtiene haciendo
c
j
() =
w
() +
x
(c
j1
()) para j N
c
c
j
() =
w
() +
hx
(c
j1
()) para j > N
c
siendo c
1
() =
w
().
Analogamente al desarrollo realizado en la seccion anterior, se deduce el siguiente
teorema:
Teorema 6.10 Sea un sistema incierto descrito por un modelo
x
k+1
= f(x
k
, u
k
, w
k
)
k
k
IR
p
k
B
= w IR
p
: |w| .
Sea el controlador MPC obtenido del problema de optimizacion dado por la ecuacion
(6.8), de forma que el conjunto terminal satisface la hipotesis 6.5, para cierto con-
junto de incertidumbres B
.
Entonces el sistema incierto controlado por el controlador MPC propuesto es estable
entrada a estado con un dominio de atraccion que es el conjunto factible del problema
X
N
c
,N
p
y para unas incertidumbres tales que
N
p
N
c
hx

N
c
1
x

w
()
La incorporacion del horizonte de prediccion dota al controlador de una serie de
propiedades:
Aumento del dominio de atraccion : dado que S
h
1
( IR
n
, ), resulta que para
cualquier horizonte de prediccion mayor que el de control, la disminucion de
dominio de atraccion derivado de considerar como region terminal , se
compensa. De hecho para N
p
> N
c
, el controlador puede presentar un dominio
de atraccion mayor.
Posible aumento de la incertidumbres admitidas : el hecho de que el sistema
controlado por la ley de control local sea asint oticamente estable hace posible
que para cierta norma, la funcion
hx
() satisfaga que
hx
(|x|) |x|
Esta propiedad hace que el efecto de las incertidumbres se aten ue a partir N
c
.
Esto se puede satisfacer, por ejemplo, tomando un controlador local lineal que
estabilice exponencialmente el sistema y tomando como norma en la acotacion la
norma ponderada por la matriz de Lyapunov del sistema linealizado en torno al
origen controlado por dicho controlador.
6.6. MPC robusto con restricciones en el estado
Las restricciones impuestas sobre los estados son especialmente delicadas en el caso
en el que el sistema real tenga incertidumbres. En efecto, si el comportamiento real
del sistema diere de la prediccion realizada a partir del modelo nominal, la actuacion
obtenida del controlador basado en este puede hacer que el sistema incierto viole las
restricciones impuestas.
178 6.6. MPC robusto con restricciones en el estado
En el captulo anterior se analizo el problema de la factibilidad robusta y se ex-
pusieron distintas formas de garantizarla. Todas estas medidas estan relacionadas con
la propiedad de invariancia robusta:
1. La primera forma y mas inmediata es basandose en el coste optimo que es una
funcion de Lyapunov entrada a estado. As toda region
r
= x IR
n
: J
N
(x) r
es un invariante robusto (para un cierto grado de incertidumbres). As en un
conjunto tal que
r
X el controlador garantiza las restricciones.
2. Determinando si el dominio de atraccion X
r
N
= S
N
(X, ) es un invariante robusto
del sistema en bucle cerrado. En el caso de incertidumbres aditivas, esto se cumple
bajo la condicion (Kerrigan 2000) dada por
S
N1
(X, ) W S
N
(X, )
3. Incorporando la restriccion de robustez (Kerrigan 2000). A nadiendo al problema
de optimizacion la restriccion
x(k + 1[k) X
R
W
y bajo ciertas condiciones sobre X
R
se establece que el dominio de atraccion del
controlador con esta restriccion es un invariante robusto, y por lo tanto satisface
las restricciones.
Hay que indicar que en este caso, en las condiciones impuestas en la determinacion
de la region terminal en la hipotesis 6.5, se debe considerar las restricciones en los
estados, de forma que X.
Bajo estas condiciones, el controlador MPC propuesto garantiza la estabilidad ro-
busta, pues los teoremas sobre la estabilidad entrada a estado se siguen satisfaciendo,
y la factibilidad robusta.
6.6.1. Factibilidad del MPC basada en restricciones conser-
vadoras
La acotacion sobre la discrepancia entre la evoluci on predicha y la evolucion del
sistema real permite establecer un procedimiento para garantizar la factibilidad robus-
ta. Basandose en esta acotacion se puede considerar un conjunto de restricciones mas
conservador tal que garantice que si el sistema nominal satisface la restriccion conser-
vadora, entonces el sistema real satisface la restriccion X a pesar de las incertidumbres.
Para ello se va a denir una nueva secuencia de cotas c
j
() que posee unas propiedades
interesantes:
c
j
() = max
_
w
() +
x
( c
j1
()), c
j1
+
j1
x

w
()
_
(6.9)
siendo c
1
() =
w
() y
i
x
() la composicion sucesiva i veces de la funcion
x
(), siendo
1
x
() =
x
(). Es inmediato que c
j
() c
j
().
A continuaci on se va a establecer el procedimiento de obtencion de las restricciones
conservadoras: sea X
j
el conjunto de restriccion conservadora que debe satisfacer el
estado predicho (utilizando el modelo nominal) en el instante k+j a partir del instante
k. Este conjunto viene dado por:
X
j
= X B
j
(6.10)
siendo X
0
= X y donde B
j
es el conjunto
B
j
= z IR
n
: |z| c
j
()
De esta manera, si x(k + j[k) es tal que esta contenido en X
j
, entonces el estado
real del sistema, ante la misma secuencia de entradas, satisface la restriccion x
k+j
X,
ante cualquier incertidumbre presente en el sistema. De la denicion de diferencia de
Pontryagin de conjuntos se deduce que para todo x(k +j[k) X
j
y para todo z B
j
,
se tiene que
x(k + j[k) + z X
Dado que, para una determinada secuencia de actuaciones, la discrepancia entre el
estado predicho y el real es
|x
k+j
x(k +j[k)| c
j
() c
j
()
entonces
x
k+j
= x(k +j[k) +x
k+j
x(k +j[k)
. .
B
j
X
Esta idea esta relacionada con la restriccion de robustez introducida en (Chisci
et al. 2001) para sistemas lineales. En este caso, se resta al conjunto de las restricciones
X los conjuntos de Kolmanovski que son una acotacion de la evolucion del sistema
incierto.
Los conjuntos denidos verican una propiedad que sera de utilidad en posteriores
demostraciones.
180 6.6. MPC robusto con restricciones en el estado
Lema 6.11 Sea x X
j+1
y sea y IR
n
tal que |x y|
j
x

w
() entonces y X
j
.
Demostracion:
Sea e
j
B
j
y sea z = x y + e
j
. Entonces se tiene que
|z| |x y| +|e
j
|
j
x

w
() + c
j
() c
j+1
()
por lo tanto z B
j+1
.
Teniendo en cuenta que x X
j+1
, se tiene que y + e
j
= x + z X para todo
e
j
B
j
. Por lo tanto y X
j
.
En este caso, el controlador MPC toma la forma
mn
u
F
(k)
J
N
(x
k
, u
F
(k))
s.a
u(k + j[k) U j = 0, , N 1
x(k + j[k) X
j
j = 0, , N 1
x(k + N[k)
Ademas, en las condiciones de la hipotesis 6.5, se debe considerar las restricciones
en los estados, de forma que X
N1
.
A continuaci on se va a demostrar que el controlador as obtenido garantiza la fac-
tibilidad robusta del sistema. Para ello se va a demostrar el teorema 6.8 considerando
estas restricciones. Dado que las restricciones en los estados y la restriccion terminal
son factibles como ya se demostro, tan solo se va a demostrar que las restricciones en
los estados son factibles. De esta forma se complementa el nuevo controlador propues-
to en este captulo, en el que se garantiza la satisfaccion robusta de las restricciones,
as como la convergencia gracias a la estabilidad ISS.
Teorema 6.12 (Factibilidad robusta con restricciones en el estado)
x
k+1
= f(x
k
, u
k
, w
k
)
con el estado sujeto a x
k
X y las actuaciones sujetas a u
k
U en todo instante k.
Las incertidumbres w
k
IR
p
k
B
= w IR
p
:
|w| .
Sea el controlador MPC obtenido del problema de optimizacion propuesto, de forma
que los conjuntos de restricciones X
j
vienen dados por la ecuacion (6.10) y el conjunto
terminal X
N1
satisface la hipotesis 6.5, siendo B
el conjunto asociado a .
Entonces el sistema incierto controlado por el controlador MPC propuesto es factible a
lo largo de la evolucion del sistema, para todo estado inicial perteneciente al conjunto
factible del problema X
r
N
y para unas incertidumbres tales que
N1
x

w
()
Demostracion:
Se procede de la misma forma que en la demostracion del teorema 6.8, comprobando
que la secuencia u
F
(k) es factible. En esta demostracion se probo que se satisface la
restriccion terminal y ademas que
x(k + N + 1[k)
Para demostrar x(k +j[k) X
j
, considerese que, por el efecto de la incertidumbre,
la discrepancia entre el estado real y el predicho verica
|x
k
x
(k[k 1)|
w
()
Aplicando el lema 6.4 se tiene que
| x(k + j[k) x
(k +j[k 1)|
j
x

w
()
Teniendo en cuenta esto, y dado que x
(k+j[k1) X
j+1
para todo j = 0, , N2,
por el lema 6.11 se tiene que x(k + j[k) X
j
para todo j = 0, , N 2.
Por ultimo, dado que x(k + N 1[k) X
N1
, las restricciones se satisfacen.
Por lo tanto la acotacion realizada sobre la discrepancia en las predicciones, permite
establecer un procedimiento sencillo para demostrar factibilidad robusta del sistema.
Ademas, tambien se puede comprobar que el controlador es estable entrada a estado,
lo que garantiza convergencia.
Para ilustrar el controlador presentado en este captulo, se va a aplicar al reactor
utilizado a lo largo de la tesis. Las incertidumbres en el sistema se van a modelar
como incertidumbres aditivas acotadas. Ademas, para reducir el conservadurismo se
va a considerar el sistema prealimentado por el controlador local. Tambien se van a
considerar unas restricciones sobre el sistema dadas por:
x
1
[0,21, 0,21]
x
2
[2,0, 0,25]
La aplicacion de este controlador requiere una serie de calculos previos encaminados
a la determinacion del grado de robustez capaz de soportar el controlador. As, es
necesario determinar las funciones de suavidad y un conjunto invariante.
Para la determinacion del invariante positivo, se ha sintonizado un controlador local
lineal obtenido por la tecnica LQR, con matrices de ponderacion
Q =
_
_
10 0
0 0,1
_
_
R = 1
y para las cuales se obtiene un controlador lineal y una funcion de Lyapunov cuadratica
dados por
K =
_
1,5488 3,4658
_
P =
_
_
263,5900 47,1760
47,1760 117,4640
_
_
El sistema controlado por este controlador local tiene un invariante positivo dado por
= x IR
2
: x
T
Px
siendo = 9,764 y una constante de decrecimiento de la funcion de Lyapunov =
0,924. El conjunto que se va a considerar como region terminal en el problema de
optimizacion sera
= x IR
2
: x
T
Px
v
siendo
v
= = 9,0219.
Como norma para expresar las incertidumbres se va a tomar la norma dos ponderada
por la matriz P. As, la constante viene dada en este caso por
|w|
P
= (1
obteniendose = 0,1208.
A continuaci on, se calcula la constante de Lipschitz en la norma dos ponderada, del
sistema prealimentado, obteniendose un valor de la constante de L
x
= 1,6. Dado que
las incertidumbres son aditivas, se tiene que L
w
= 1. Por consiguiente, tomando un
horizonte de control N
c
= 4, se tiene que la incertidumbre admitida por el controlador
() viene dada por
L
3
x
L
w

de donde se deduce que 0,0295.
Con el n de considerar las restricciones en los estados del controlador, se obtiene
una cota conservadora en norma innito de las incertidumbres obtenidas en norma P.
Esto se debe a que las restricciones se han expresado en norma innito. En consecuencia
se tiene que
B
j
= z IR
2
: |z|

L
j
x
1
L
x
1
siendo
= 5,910
3
.
La evolucion del sistema incierto en bucle cerrado se puede observar en la gura
6.2.
0.25 0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2 0.25
1.5
1
0.5
0
0.5
x
1
x
2

Figura 6.2: Evolucion del sistema incierto en bucle cerrado
6.8. Conclusiones
En este captulo se ha presentado un procedimiento para incorporar el conocimien-
to de las incertidumbres en el dise no del controlador. Basandose en la acotacion de
las discrepancias entre la evoluci on del sistema real y el comportamiento predicho por
el modelo nominal, se garantiza que, bajo ciertas cotas de la incertidumbres y con-
siderando como region terminal una region mas conservadora, se satisface de manera
robusta la condicion terminal. Tambien se consideran unas restricciones conservadoras
en los estados predichos que garantizan la satisfaccion robusta de las restricciones por
parte del sistema incierto. En consecuencia, se garantiza la satisfaccion robusta de las
restricciones en el conjunto factible X
r
N
.
Ademas se puede garantizar la estabilidad entrada a estado del sistema para todo
estado inicial factible lo que dota de convergencia al controlador. Esta formulaci on
forma parte de las contribuciones originales de esta tesis y ha dado lugar al artculo
(Limon Marruedo,

Cabe resaltar que la factibilidad robusta y la convergencia se han obtenido mo-
dicando ligeramente la formulaci on general del MPC y se basa en las predicciones
nominales del sistema. Por lo tanto el coste computacional del controlador es el mismo
que el controlador nominal. Ademas estas propiedades se satisfacen bajo hipotesis de
suavidad de las funciones que forman parte del problema de optimizacion y no es
necesario imponer condiciones adicionales como la suavidad del coste optimo, que es
difcil de comprobar.
Un problema del controlador propuesto es que puede conducir a controladores con-
servadores y/o peque nos dominios de atraccion. Este conservadurismo tiene su origen
en la acotacion realizada y en la prediccion en bucle abierto del sistema. La primera
de las causas, puede reducirse incorporando una serie de medidas propuestas, como la
incorporacion de un controlador en cascada o bien, la utilizacion de acotaciones locales
que dependan del estado del sistema y de las actuaciones aplicadas sobre el mismo.
En el captulo siguiente de la tesis se presenta un procedimiento para la acotacion lo-
cal de las discrepancias, que da lugar a las denominadas regiones de evoluci on incierta.
Ademas se dise na un controlador que incorpora estas regiones para garantizar robustez.
La segunda causa, y mas importante, es la prediccion en bucle abierto realizado,
sin incorporar en la prediccion el efecto corrector que incorpora el controlador. Este
problema se puede subsanar con las denominadas formulaciones en bucle cerrado, que
se tratan en un captulo posterior.
Captulo 7
MPC robusto basado en regiones
de evolucion incierta
7.1. Introduccion
En el captulo anterior se han establecido condiciones bajo las cuales el controlador
estabiliza el sistema para cierto nivel de incertidumbres. As, suponiendo ciertas condi-
ciones de suavidad del sistema y considerando una region terminal conservadora, el
controlador es factible a lo largo de la evolucion del sistema incierto y garantiza que el
coste optimo es una funcion de Lyapunov entrada a estado.
El grado de incertidumbres que puede soportar el controlador garantizando estabi-
lidad se obtiene a partir de acotaciones basadas en la suavidad de las funciones. Es-
tas acotaciones son acotaciones globales, es decir, validas para todo estado, actuacion
e incertidumbre admisible del sistema. Esto hace que los niveles de incertidumbres
obtenidos sean mas conservadores.
Para tratar de mitigar este efecto, se establece en este captulo un procedimiento
para incorporar al dise no de controladores predictivos robustos, procedimientos locales
para la determinacion de la discrepancia entre el estado predicho y la posible evoluci on
del sistema. Este procedimiento se plasma en el concepto de region de evoluci on incierta.
Con el n de dotar de robustez al controlador predictivo, se incorporan las regiones
de evoluci on incierta en su formulaci on, dando lugar a un controlador dual y otro no
dual que garantizan la estabilidad bajo la factibilidad del estado inicial. Estos contro-
ladores MPC robustos son aportaciones originales de esta tesis y han dado lugar al
artculo (Limon Marruedo, Bravo,

185
186 7.2. Regiones de evolucion incierta
A continuacion se introduce el concepto de region de evolucion incierta, en el cual
se basa el controlador propuesto.
7.2. Regiones de evolucion incierta
7.2.1. Descripcion del sistema
Sea un sistema tal que responde a un modelo con incertidumbres aditivas de la
forma
x
k+1
= f(x
k
, u
k
) + w
k
(7.1)
siendo x
k
IR
n
el estado del sistema en el instante k, u
k
IR
m
el vector de actuaciones
y w
k
IR
n
las posibles incertidumbres que afectan al sistema. Tanto los estados como
las actuaciones estan restringidos a lo largo del tiempo, de forma que
x
k
X (7.2)
u
k
U (7.3)
Ademas, las incertidumbres se consideran que estan acotadas en un conjunto compacto
w
k
W (7.4)
El sistema en ausencia de incertidumbres se denomina modelo nominal y viene dado
por
x
k+1
= f(x
k
, u
k
)
de forma que, dicho modelo presenta un punto de equilibrio en el origen, por tanto
f(0, 0) = 0.
El modelado de incertidumbres como aditivas representa a una gran cantidad de
sistemas inciertos, dado que la incertidumbre w
k
puede depender del estado del sistema.
El unico conocimiento de las incertidumbres es el margen de variacion que estas pueden
tener, que se traduce en un determinado conjunto W. Por ejemplo, considerese un
sistema incierto descrito por
x
k+1
= f(x
k
, u
k
, p
k
)
siendo p
k
P el vector de incertidumbres parametricas del que depende el sistema.
Entonces
x
k+1
= f(x
k
, u
k
, p
k
) = f(x
k
, u
k
)+(f(x
k
, u
k
, p
k
)f(x
k
, u
k
)) = f(x
k
, u
k
)+f(x
k
, u
k
, p
k
)
Captulo 7. MPC robusto basado en regiones de evolucion incierta 187
considerando como modelo nominal x
k+1
= f(x
k
, u
k
, 0) = f(x
k
, u
k
), se puede denir
unas incertidumbres w
k
y un conjunto W tales que
w
k
= f(x
k
, u
k
, p
k
) W, x
k
X, u
k
U, p
k
P
Este tipo de sistemas tambien se suelen denominar sistemas perturbados, por res-
ponder estos al mismo modelo. Es importante resaltar que desde un punto de vista
practico, este tipo de descripciones son muy sencillas de obtener en la etapa de iden-
ticacion de un sistema, pues w
k
respresentara el error entre el sistema real y el
identicado.
7.2.2. Notacion y denicion de operaciones sobre conjuntos
Con el n de simplicar la exposicion de los desarrollos y resultados obtenidos en
este captulo, se introduce una notacion para describir distintos elementos implicados
en estos. As se denota:
u
N
F
(k) : a una secuencia de N actuaciones futuras a partir del instante k, es decir
u
N
F
(k) = u(k[k), u(k + 1[k), , u(k + N 1[k)
siendo u(k + j[k) la actuacion j-esima de dicha secuencia. El n umero de termi-
nos de esta secuencia se suele inferir del contexto, por lo que se suele denotar
simplemente u
F
(k).
u
N
F
(k)
j
i
: a los terminos de la secuencia u
N
F
(k)
u
N
F
(k)
j
i
= u(k +i[k), , u(k + j[k)
siendo i j N.
x(k + j[k) : a la prediccion en el instante k +j de la evoluci on del sistema en ausencia
de incertidumbres a partir del estado x
k
aplicando sobre el sistema una secuencia
de actuaciones u
F
(k).
Tambien resulta de utilidad la denicion de ciertas operaciones sobre conjuntos que
se utilizan en el desarrollo de posteriores resultados.
Denicion 7.1 Sea el conjunto IR
n
, y sea la funcion g : IR
n
IR
n
, entonces
se dene el conjunto g() como
g() = z IR
n
: s , z = g(s)
Denicion 7.2 Sea IR
n
, y IR
n
, se denomina conjunto diferencia de Pon-
tryagin al conjunto
= x IR
n
: x +y , y
Denicion 7.3 Sea IR
n
, y IR
n
, se denomina conjunto suma de Minkowski
al conjunto
= z IR
n
: x , y , z = x + y
Esta denicion se puede extender a la operacion x siendo x un vector contenido
en IR
n
, sin mas que considerar que = x. As x = x + a, a .
Propiedad 7.4 Si incluye el origen, entonces
( )
7.2.3. Regiones de evolucion incierta
Como es bien sabido, el efecto de la incertidumbre sobre el sistema hace que, ante
una determinada accion de control, exista una discrepancia entre el estado al que este
evoluciona y el que predice el modelo nominal. As, el estado real del sistema puede
evolucionar a cualquier estado contenido en una vecindad del estado nominal, dado
que 0 W. La region a la que el sistema real puede evolucionar ante una determinada
actuacion depende del estado del que se parte, de la actuacion aplicada y del grado de
incertidumbres que presenta el sistema, siendo tanto mayor cuanto mayor sea el grado
de incertidumbre.
Esta idea puede extenderse a la prediccion realizada a j pasos. As, existe una region
entorno al estado nominal predicho x(k+j[k) tal que contiene todas los posibles estados
a los que el sistema puede evolucionar ante una determinada secuencia de actuaciones.
Esta region se plasma en la denominada region exacta de evolucion incierta.
Denicion 7.5 Sea un sistema incierto descrito por un modelo
x
k+1
= f(x
k
, u
k
) + w
k
de forma que las incertidumbres w
k
W, entonces se denomina region exacta de
evolucion incierta en el instante k +j partiendo del estado en el instante k,x
k
, y ante
una secuencia de actuaciones u
F
(k), al conjunto que contiene todos los posibles estados
a los que el sistema incierto puede evolucionar en el instante k+j. Este conjunto viene
dado por:
A
j
(x
k
, u
F
(k)
j1
0
) = f(A
j1
(x
k
, u
F
(k)
j2
0
), u(k + j 1[k)) W
siendo
A
1
= f(x
k
, u(k[k)) W
La region exacta de evoluci on incierta A
j
depende en general del estado del sistema
en el instante k, x
k
, de la secuencia de actuaciones desde el instante k hasta el instante
j 1, u
F
(k)
N
j1
0
, del conjunto de incertidumbres W y del modelo nominal f(, ).
Para simplicar la notacion, esta region se denota A
j
(x
k
, u
F
(k)). As esta viene dada
por la composicion
A
j
(x
k
, u
F
(k)) = f(X
j1
(x
k
, u
F
(k)), u(k + j 1[k)) W
Notese que la region A
j
se puede entender como la union de todas las regiones
exactas de evolucion incierta a un paso que parten de cualquier estado en A
j1
ante la
actuacion u(k +j 1[k), es decir
A
j
(x
k
, u
F
(k)) =
_
xX
j1
f(x, u(k + j 1[k)) W
Dado que las regiones exactas de evolucion incierta resultan en general muy difciles
de calcular con exactitud, resulta de interes caracterizar regiones que las aproximen de
una manera conservadora y cuyo calculo sea sencillo. Esto da lugar a las denominadas
regiones de evoluci on incierta.
Para ello se parte de un procedimiento (, ) tal que para un conjunto A IR
n
dado proporciona otro conjunto (A, u) tal que
f(A, u) (A, u)
para todo A IR
n
y para todo u U. En consecuencia, el procedimiento (A, u) es una
aproximacion conservadora de f(A, u) que se puede obtener mediante la utilizacion de
tecnicas de aproximacion de conjuntos. De este modo se puede hacer mas facil y menos
costoso el calculo de estos conjuntos, a cambio, claro esta, de un mayor conservadurismo
en la aproximaci on. Este procedimiento debe satisfacer la siguiente hipotesis
Hipotesis 7.6 Sea un conjunto A IR
n
y sea una actuacion admisible u U. Sea el
procedimiento (, u) : A IR
n
(A, u) IR
n
, entonces (, ) debe satisfacer las
siguientes condiciones:
1. Condicion de inclusion: f(A, u) (A, u).
2. Condicion de monotona: Sea un conjunto B A, entonces
(B, u) (A, u)
siendo f(, ) el modelo nominal del sistema.
Considerando esto, se puede establecer la siguiente denicion.
Denicion 7.7 (Region de evoluci on incerta) Sea un sistema incierto descrito por
un modelo
x
k+1
= f(x
k
, u
k
) + w
k
de forma que las incertidumbres w
k
W. Sea (, ) un procedimiento tal que satisfaga
la hipotesis 7.6, entonces se denomina region de evolucion incierta en el instante k +j
partiendo del estado x
k
y ante una secuencia de actuaciones u
F
(k) al conjunto:
A
j
(x
k
, u
F
(k)) = (

A
j1
(x
k
, u
F
(k)), u(k + j 1[k)) W
siendo
A
1
= f(x
k
, u(k[k)) W = A
1
Estos conjuntos tienen las siguientes propiedades:
Propiedad 7.8 Sea

A
j
(x
k
, u
F
(k)) el conjunto de evolucion incierta en el instante k+j.
Este conjunto satisface las siguientes propiedades:
1. Contiene todos lo estados posibles del sistema en el instante k +j, es decir
A
j
(x
k
, u
F
(k))

A
j
(x
k
, u
F
(k))
2. Para todo x
k+1
= f(x
k
, u(k[k)) +w
k
con w
k
W, se tiene que
A
j
(x
k+1
, u
F
(k + 1))

A
j+1
(x
k
, u
F
(k))
siendo u
F
(k + 1) = u
F
(k)
j
1
.
Demostracion:
1. Se procede por induccion: considerese que j = 2. Entonces se tiene que
A
2
(x
k
, u
F
(k)) = f(A
1
, u(k +1[k)) W (A
1
, u(k +1[k)) W =

A
2
(x
k
, u
F
(k))
Supongase que A
j1
(x
k
, u
F
(k))

A
j1
(x
k
, u
F
(k)), entonces
A
j
(x
k
, u
F
(k)) = f(A
j1
, u(k + j 1[k)) W
(A
j1
, u(k + j 1[k)) W
(

A
j1
, u(k + j 1[k)) W
=

A
j
(x
k
, u
F
(k))
Con lo que se demuestra esta propiedad.
2. Para demostrar la propiedad se procede tambien por induccion:
Partiendo de que x
k+1

A
1
(x
k
, u
F
(k)) y utilizando la propiedad de monotona
se tiene que
A
1
(x
k+1
, u
F
(k + 1)) = (x
k+1
, u(k + 1[k + 1)) W
(

A
1
(x
k
, u(k[k)), u(k + 1[k)) W =

A
2
(x
k
, u
F
(k))
Supongase que

A
j1
(x
k+1
, u
F
(k + 1))

A
j
(x
k
, u
F
(k)). Dado que
u(k +j[k + 1) = u(k + j[k)
de la propiedad de inclusion se tiene que:
A
j
(x
k+1
, u
F
(k + 1)) = (

A
j1
(x
k+1
, u
F
(k + 1)), u(k + j[k + 1)) W
(

A
j
(x
k
, u
F
(k)), u(k + j[k + 1) W
= (

A
j
(x
k
, u
F
(k)), u(k + j[k) W =

A
j+1
(x
k
, u
F
(k))
La primera de las propiedades demuestra que bajo las hipotesis impuestas al pro-
cedimiento (, ) se garantiza que las regiones de evoluci on incierta contienen a las
regiones exactas.
La segunda propiedad resulta muy interesante para posteriores aplicaciones, pues
demuestra que ante una misma secuencia de actuaciones, las regiones de evoluci on
incierta obtenidas en un estado real de la planta en k + 1 estan contenidas en las
calculadas en el instante anterior k.
7.2.4. Un procedimiento de calculo basado en el algebra in-
tervalar
La region de evoluci on incierta es una aproximaci on conservadora de la posible
evoluci on del sistema incierto calculada a partir de un procedimiento que permita
obtener el mapa de un conjunto a traves del modelo nominal de una forma conservadora
y no muy costosa computacionalmente.
Las acotaciones sobre la evoluci on del sistema incierto realizadas en el captulo
anterior llevan a regiones inciertas de la forma
A
j
= x IR
n
: |x x(k + j[k)| c
j
()
Dado que las constantes c
j
() se calculan fuera de lnea, la determinacion de las re-
giones de evoluci on incierta en cada instante k se lleva a cabo realizando la prediccion
nominal del sistema. Este procedimiento es muy sencillo, pero por su caracter global
resulta conservadora. Por tanto, interesan procedimientos locales (que dependan de las
actuaciones) para reducir este conservadurismo. El algebra intervalar ofrece un marco
para la denicion de procedimientos apropiados para el calculo de estas regiones.
La aritmetica intervalar es una generalizacion del algebra real en la que los n umeros
se sustituyen por intervalos y las operaciones sobre los n umeros se sustituyen por
operaciones intervalares (Moore 1996).
Un intervalo en IR, X = [a, b], es el conjunto de n umeros reales
X = x IR : a x b
La extension de un intervalo a IR
n
es un vector de intervalos en los que cada compo-
nente del vector es un intervalo escalar. Como se puede ver un intervalo en IR
n
es un
hiperrectangulo en IR
n
.
La aritmetica intervalar esta caracterizada por las cuatro operaciones basicas sobre
intervalos (Moore 1996):
[a, b] + [c, d] = [a + c, b +d]
[a, b] [c, d] = [a d, b c]
[a, b] [c, d] = [min(ac, ad, bc, bd), max(ac, ad, bc, bd)]
[a, b] / [c, d] = [a, b]
_
1
d
,
1
c
_
si 0 / [c, d]
(7.5)
En (Hansen 1992) se puede encontrar la denicion del operador division en el caso en
el que el intervalo cociente contiene el 0. Merece la pena resaltar que el rango de estos
intervalos son exactos, en el sentido en el que coincide con el rango de variaci on de los
posibles valores reales.
Considerese una funcion g : IR
n
IR
n
, y X un intervalo en IR
n
. Entonces, es
claro que en general el conjunto g(X) no es un intervalo. El algebra intervalar ofrece
un procedimiento para obtener un intervalo Y tal que g(X) Y . Esto se basa en la
denominada funcion de inclusion.
Denicion 7.9 Una funcion G : IR
n
IR
n
es una funcion de inclusion de g() si
para cualquier intervalo en X IR
n
se tiene que
g(X) G(X)
Se dice que una funcion de inclusion es monotona si para cualquier pareja de intervalos
X, Y IR
n
tales que X Y , se tiene que
G(X) G(Y )
En el caso de funciones estandar (exponenciales, logaritmos, etc.) se pueden obtener
funciones de inclusion de forma analtica, utilizando por ejemplo su desarrollo en serie
de Taylor, o en serie de potencias, en los que se tiene una cota del termino de error.
Sin embargo, para funciones complejas se pueden obtener a partir de la denominada
extension intervalar natural (Keartfort 1996).
Denicion 7.10 Si una funcion g() se puede calcular por una expresion (o un algo-
ritmo) formada por las cuatro operaciones elementales y funciones estandar, entonces
una extension intervalar natural de g() se obtiene sustituyendo las operaciones ele-
mentales por sus equivalentes intervalares y las funciones estandar por sus funciones
de inclusion.
Por tanto la extension intervalar natural es un procedimiento que transforma un
intervalo en otro intervalo. En el siguiente teorema se establece el resultado mas im-
portante.
Teorema 7.11 (Keartfort 1996) Sea una funcion g : IR
n
IR
m
, entonces su exten-
sion natural intervalar es una funcion de inclusion monotona de g().
Este resultado establece una forma sencilla de obtener un procedimiento para cal-
cular regiones intervalares que acoten el mapa de otra region intervalar a traves de una
funcion dada. Este consiste en sustituir las operaciones y funciones estandar por sus
equivalentes intervalares. As, la determinacion de la region dada por un intervalo no
es mas que la evaluaci on de dicho intervalo en la funcion intervalar obtenida (que es la
extension intervalar natural), lo cual no es muy costoso computacionalmente.
194 7.3. Controlador MPC dual robusto
Este procedimiento se puede utilizar para la determinacion de regiones de evolucion
incierta, obteniendo la funcion de extension intervalar natural del modelo nominal
f(x, u) respecto al estado del sistema x, con lo que se obtiene una funcion intervalar
F(X, u), en la que las actuaciones u son un parametro de la funcion. Se va a comprobar
que este procedimiento satisface la hipotesis 7.6:
Condicion de inclusion : Se satisface por el teorema 7.11 y por la denicion de
funcion de inclusion, seg un los cuales, para todo X se tiene que
f(X, u) F(X, u)
Condicion de monotona : El teorema 7.11 tambien establece que la funcion de
extension intervalar natural es monotona, por lo tanto, para todo X Y , se
tiene que
F(X, u) F(Y, u)
7.3. Controlador MPC dual robusto
Como ya se ha comentado en captulos anteriores, la estabilidad que garantiza la
formulaci on general del MPC puede perderse cuando existen discrepancias entre el
modelo de prediccion y el modelo real de la planta. Para dotar de robustez al contro-
lador, hay que considerar su efecto en su dise no, de forma que el sistema sea estable y
garantice la satisfaccion robusta de las restricciones impuestas sobre los estados.
En esta seccion se presenta un controlador MPC dual que considera el efecto de las
incertidumbres gracias a la incorporacion en su formulaci on de las regiones de evoluci on
incierta anteriormente introducidas.
El controlador MPC dual se propuso por primera vez en (Michalska & Mayne 1993)
para sistemas no lineales en tiempo continuo. Este controlador parte del conocimiento
de un invariante positivo del sistema denominado region terminal , donde el sistema
se estabiliza por una ley de control local u = h(x). Si el estado del sistema esta fuera de
dicho conjunto, entonces se resuelve un problema de optimizacion MPC de horizonte
nito tomando como restriccion terminal la pertenencia al conjunto . El horizonte,
que inicialmente es N, se reduce un periodo de muestreo en cada instante de forma que
en el instante k, el horizonte del controlador es N k. Una vez obtenida la actuacion
se aplica. De esta forma se garantiza que el controlador conduce el sistema hasta el
conjunto invariante en N pasos, donde se conmuta a la ley de control local que estabiliza
el sistema hasta el origen. De ah el termino de dual.
En este trabajo tambien se presenta una tecnica para dotar de robustez al con-
trolador, que es la que inspiro la formulaci on presentada en el captulo anterior. En
este caso la presencia de incertidumbres hace necesario que el controlador local deba
estabilizar el sistema incierto y que el conjunto terminal sea un invariante robusto.
Entonces considerando como restriccion terminal un conjunto contenido en , demues-
tra que el controlador estabiliza el sistema ante un cierto grado de incertidumbres
aditivas que decaen.
El controlador que se propone en esta seccion es esencialmente distinto pues se incor-
poran los conjuntos de evoluci on incierta en la formulacion del controlador MPC dual.
Para ello, y dado que el sistema presenta incertidumbres, se requiere el conocimiento
de un conjunto invariante robusto para las incertidumbres del sistema.
Hipotesis 7.12 Sea el conjunto X, una region entorno al origen que es un in-
variante robusto del sistema (7.1). La ley de control local asociada u = h(x) es tal
que
X
h
= x X : h(x) U.
Para todo x se tiene que
f(x, h(x)) W
Esta condicion garantiza que el conjunto es un invariante robusto por el principio
de invariancia.
Partiendo de la determinacion del conjunto invariante robusto y de un procedimien-
to para el calculo de las regiones de evolucion incierta, se puede formular el siguiente
problema de optimizacion:
mn
u
F
J
Nk
(x
k
, u
F
)
s.a
u(k + j[k) U j = 0, , N k 1
A
j
(x
k
, u
F
) X j = 1, , N k 1
A
Nk
(x
k
, u
F
)
Siendo el funcional a minimizar :
J
Nk
=
Nk1
i=0
L(x(k + i[k), u(k + i[k)) + V (x(k + N[k))
Este coste esta basado en las predicciones nominales del sistema, sin considerar el efecto
de las incertidumbres. En este caso el funcional afecta exclusivamente al desempe no
del sistema y no a la estabilidad como en la formulaci on general del MPC. As, por
ejemplo, el coste terminal se puede eliminar, o bien se puede tomar una funcion de
coste que considere el efecto de las incertidumbres, como por ejemplo, el coste de la
peor situacion posible, lo cual conduce a un problema min-max.
La principal caracterstica de este controlador es que las restricciones en los estados
se establecen en terminos de regiones de evolucion incierta en vez de en terminos de
estados nominales del sistema. Estas regiones dependen del estado actual x
k
, de la
secuencia de actuaciones futuras u
F
, y del grado de incertidumbres. Por tanto son
restricciones en u
F
.
Notese tambien que el problema de optimizacion reduce el horizonte de control a lo
largo del tiempo, de forma que el controlador tan solo esta denido desde k = 0 hasta
k = N 1. Pero esto no ofrece problemas pues, como se demostrara mas adelante, se
garantiza que en el instante N el estado del sistema alcanza la region terminal, donde
se conmuta al controlador local.
A partir de este problema de optimizacion se establece la siguiente ley de control
dual:
K
d
MPC
(x
k
) =
_
_
_
u
(k[k) x
k
,
h(x
k
) x
k

(7.6)
siendo u
(k[k) el primer termino de la secuencia de control optima del problema en el

instante k.
Dado que las incertidumbres que afectan al sistema se modelan como incertidumbres
aditivas acotadas, el origen no es un punto de equilibrio del sistema incierto, por lo
que hay que considerar otro concepto de estabilidad como la estabilidad nalmente
acotada, que se present o en el captulo 6.
Denicion 7.13 (Khalil 1996) Un sistema es asintoticamente acotado al nal si el
sistema evoluciona a un conjunto acotado. Es decir, si existen unas constantes positivas
b y c tales que para todo (0, c), existe un k
tal que para todo estado inicial |x

0
|
se tiene que |x
k
| b k > k
.
Entonces se puede establecer el siguiente teorema en el que se demuestra que la ley
de control derivada del problema de optimizacion propuesto estabiliza al sistema en
cualquier estado inicial factible.
Teorema 7.14 (Estabilidad nalmente acotada)
Sea un sistema incierto que responde al modelo
x
k+1
= f(x
k
, u
k
) + w
k
con unas incertidumbres w
k
W y sujeto a las restricciones
u
k
U x
k
X
Sea el sistema tal que satisface la hipotesis 7.12.
Sea X
d
N
el conjunto de estados tal que el problema de optimizacion del MPC robusto
dual tiene solucion factible con horizonte N.
Entonces la ley de control K
d
MPC
(x) estabiliza robustamente al sistema para todo x
0

X
d
N
, evolucionando hacia la region , donde queda connado.
Demostracion:
Para probar el teorema se va a comprobar que en cada instante k se puede calcular
una secuencia de actuaciones a partir de la solucion optima en k 1 que es factible.
La secuencia de actuaciones factibles es
u(k + j[k) = u
(k + j[k 1) j = 0, , N k 1
es decir u
F
(k) = u
F
(k 1)
Nk
1
Para comprobar la factibilidad se va a proceder por induccion.
Sea x
0
X
d
N
, entonces el problema de optimizacion es factible y tiene una solucion
optima u
F
(0). Sea x
1
el estado al que evoluciona el sistema incierto al aplicar u
(0[0).
Sea u
F
(1) la solucion factible calculada.
Entonces, esta secuencia es admisible por serlo u
F
(0). Dado que x
1

A
1
(x
0
, u
(0[0)),
de la propiedad 7.8 se tiene que
A
j1
(x
1
, u
F
(1))

A
j
(x
0
, u
F
(0)) X
para todo j = 2, , N. De aqu se deduce ademas que
A
N1
(x
1
, u
F
(1))

A
N
(x
0
, u
F
(0))
Por lo tanto, el problema de optimizacion es factible en k = 1.
Supongase que el problema de optimizacion es factible en el instante k1, situandose
el sistema en x
k1
donde se obtiene una solucion optima u
F
(k 1). Sea x
k
el estado
al que evoluciona el sistema al aplicar u
(k 1[k 1). Sea u

F
(k 1) la secuencia
de actuaciones calculada a partir de u
F
(k). Entonces es obvio que esta secuencia es
admisible por serlo u
F
(k). Ademas, dado que x
k

A
1
(x
k1
, u
(k 1[k 1)), de la
propiedad 7.8 se tiene que
A
j1
(x
k
, u
F
(k))

A
j
(x
k1
, u
F
(k 1)) X
para todo j = 2, , N k + 1. Ademas
A
Nk
(x
k
, u
F
(k))

A
Nk+1
(x
k1
, u
F
(k 1))
y por lo tanto, el problema de optimizacion es factible en el instante k.
Por induccion se deduce que el problema es factible en todo k < N.
En el instante k = N 1, se tiene que
A
1
(x
N1
, u
(N 1[N 1))
por lo que el estado en el instante N satisface que x
N
.
Una vez que el sistema entra en la region , se conmuta a la ley de control local
u = h(x), que mantiene la evolucion del sistema incierto en , por la propiedad de
invariancia. Por tanto x
k
para todo k N.
Nota 7.15 La convergencia del controlador esta basada en la obtencion de una solu-
cion factible del problema de optimizacion, que no necesariamente tiene que ser la
solucion optima. Esto implica que soluciones suboptimas del problema de optimizacion
estabilizan igualmente el sistema.
De este teorema se deduce que para todo estado inicial factible, el controlador
conduce al sistema incierto hasta el invariante robusto donde queda connado. Por
tanto el sistema es asintoticamente estable acotado al nal. Si las incertidumbres fuesen
decayendo a lo largo del tiempo y el controlador local estabilizase al sistema asintotica-
mente, entonces el controlador dual conduce el sistema hasta el origen.
Una bondad del controlador propuesto es que la estabilidad esta sujeta a la factibili-
dad del estado inicial. Por tanto no se imponen cotas explcitas sobre las incertidumbres,
sino que estas estan implcitamente consideradas en la factibilidad del problema con las
regiones de evoluci on incierta. En efecto este controlador admite cualquier grado de in-
certidumbres y garantiza que estabiliza el sistema siempre que, para las incertidumbres
consideradas, el estado del que se parte sea factible.
Ademas, el caracter local de estas regiones hace que la cota de incertidumbres que
admite el controlador dependa del estado inicial en que se encuentra el sistema. Esto es
una ventaja pues en otro tipo de controladores basados en acotaciones globales de las
incertidumbres (como por ejemplo las basadas en la continuidad Lipschitz del modelo)
se toma el caso mas desfavorable como cota de incertidumbres, incurriendo en cierto
conservadurismo del controlador.
A pesar de la ventaja que supone la aproximaci on local, no debe perderse de vista
que este controlador se enmarca dentro de los controladores en bucle abierto, es decir,
aquellos en los que no se considera el efecto de realimentaci on del controlador en la
prediccion del comportamiento del sistema incierto. Esto hace que el controlador pre-
sente un alto grado de conservadurismo en relacion a formulaciones en bucle cerrado.
De todas formas existen procedimientos que permiten reducir este efecto, como ya se
comento en el captulo anterior.
7.4. Controlador MPC robusto no dual
Los controladores duales proporcionan un metodo sencillo e intuitivo de controlar
el sistema, muy relacionado ademas con el control optimo con horizonte nito. Sin
embargo, la conmutaci on necesaria de una ley de control a otra se presenta como
una desventaja de estos (Allgower, Badgwell, Qin, Rawlings & Wright 1999, Chen &
Allgower 1998a). Quiza la mas inmediata es la perdida de optimalidad del controlador
dentro de la region terminal.
Para evitar la conmutaci on al controlador local, se reformula el problema de opti-
mizacion para que el controlador garantice la estabilidad tanto fuera como dentro de
la region terminal. Esto permite eliminar la conmutacion al controlador local y dota
de optimalidad a las actuaciones obtenidas en esta region.
Una forma sencilla de lograr esto es considerando el principio de invariancia robusta
que se satisface en la region . As, a nadiendo la restriccion
x(k +j[k) W
para todo j = N k + 1, , N, se puede extender el horizonte de control hasta N,
de forma que las actuaciones obtenidas en este intervalo garantizan que el sistema
incierto permanece en el conjunto . Notese que la factibilidad esta garantizada por la
existencia de la ley de control local u = h(x).
Teniendo en cuenta esto, se puede reformular el problema de optimizacion dual,
para obtener un MPC no dual
200 7.4. Controlador MPC robusto no dual
mn
u
F
J
N
(x
k
, u
F
)
s.a
u(k + j[k) U j = 0, , N 1
_
_
si k < N
_
A
j
(x
k
, u
F
) X j = 1, , N k 1
A
Nk
(x
k
, u
F
(k))
x(k + j[k) W j = N k + 1, , N
si no x(k + j[k) W j = 1, , N
Como se puede observar, en el instante inicial coincide con la formulaci on dual. Pero
en este caso, en todo instante k el horizonte de control se extiende hasta N, a nadiendose
desde N k + 1 hasta N la condicion de invariancia robusta sobre los estados. As,
para k > N es esta restriccion la unica que se impone sobre los estados, quedando el
problema de optimizacion
mn
u
F
J
N
(x
k
, u
F
)
s.a
u(k + j[k) U j = 0, , N 1
x(k + j[k) W j = 1, , N
Notese que esto hace que el controlador aplique soluciones optimas en el conjunto
invariante robusto que garantizan la robustez. Ademas, si la region terminal y la funcion
de coste terminal se obtienen de forma que satisfacen las condiciones de estabilidad de
la formulaci on general del MPC (hipotesis 3.5), entonces el controlador optimo obtenido
proporciona un mejor desempe no y garantiza la estabilidad asintotica del sistema al
origen en el caso en que las incertidumbres decaigan con el tiempo.
El nuevo controlador robusto viene dado por
K
nd
MPC
(x
k
) = u
(k[k)
A continuacion se demuestra la estabilidad robusta del controlador no dual propuesto.
Teorema 7.16 (Estabilidad nalmente acotada)
Sea un sistema incierto que responde al modelo
x
k+1
= f(x
k
, u
k
) + w
k
con unas incertidumbres w
k
W y sujeto a las restricciones dadas por
u
k
U x
k
X
tal que satisface la hipotesis 7.12.
Sea X
d
N
el conjunto de estados tal que el problema de optimizacion del MPC robusto
dual tiene solucion factible con horizonte N.
Entonces la ley de control K
nd
MPC
(x) estabiliza robustamente al sistema para todo x
0

X
d
N
, evolucionando hacia la region , donde queda connado.
Demostracion:
Para probar el teorema se va a comprobar que en cada instante k se puede calcular
una secuencia de actuaciones a partir de la solucion optima en k 1 que es factible.
La secuencia de actuaciones factibles es
u(k + j[k) =
_
u
(k + j[k 1) j = 0, , N k 1
h( x(k + j[k)) j = N k, , N 1
que verica u
F
(k)
Nk1
0
= u
F
(k 1)
Nk
1
.
Para comprobar la factibilidad se va a proceder por induccion.
Sea x
0
X
d
N
, entonces el problema de optimizacion es factible y tiene una solucion
optima u
F
(0). Sea x
1
el estado al que evoluciona el sistema incierto al aplicar u
(0[0).
Sea u
F
(1) la solucion factible calculada.
Entonces, esta secuencia u
F
(1)
N2
0
es factible por serlo u
F
(0). Dado que
x
1

A
1
(x
0
, u
(0[0))
A
j1
(x
1
, u
F
(1)
N2
0
)

A
j
(x
0
, u
F
(0)
N1
1
) X
para todo j = 2, , N. De aqu se deduce ademas que
A
N1
(x
1
, u
F
(1)
N2
0
)

A
N
(x
0
, u
F
(0)
N1
1
)
202 7.4. Controlador MPC robusto no dual
Por lo tanto, x(N[1) . Aplicando la ley de control local se tiene una actuacion
admisible tal que
x(N + 1[1) = f(x(N[1), h(x(N[1))) W
Consecuentemente, el problema de optimizacion es factible en k = 1.
Supongase que el instante k 1 el estado del sistema es x
k1
y el problema de
optimizacion es factible. Entonces, se obtiene una solucion optima u
F
(k 1). Sea x
k
el estado al que evoluciona el sistema al aplicar u
(k 1[k 1) y sea u
F
(k 1) la
secuencia de actuaciones calculada a partir de u
F
(k). Entonces es obvio que la secuencia
u
F
(k)
Nk1
0
es admisible por serlo u
F
(k). Ademas, dado que
x
k

A
1
(x
k1
, u
(k 1[k 1))
A
j1
(x
k
, u
F
(k)
Nk1
0
)

A
j
(x
k1
, u
F
(k 1)
Nk
1
) X
para todo j = 2, , N k + 1. Ademas
A
Nk
(x
k
, u
F
(k)
Nk1
0
)

A
Nk+1
(x
k1
, u
F
(k 1)
Nk
1
)
Ademas se tiene que x(N[k) . Aplicando la ley de control local se mantiene el sis-
tema nominal en W con una secuencia de actuaciones admisibles. En consecuencia
el problema es factible.
Por induccion se deduce que el problema es factible en todo k N 1.
En el instante k = N 1, se tiene que
A
1
(x
N1
, u
(N 1[N 1))
por lo que el estado en el instante N satisface que x
N
.
A partir de este instante, la restriccion
x(k + j[k) W
es factible gracias a la invariancia robusta de , lo que garantiza la estabilidad. Notese
que a partir de este instante la secuencia dada por el controlador local es la secuencia
factible, y el controlador proporciona una actuacion que minimiza el coste.
En esta seccion se muestran los resultados de aplicar el controlador dual presentado
al ejemplo del reactor utilizado a lo largo de la tesis. Para el calculo de las regiones
de evoluci on incierta se ha utilizado el algebra intervalar, que como se demostro ante-
riormente, proporciona un procedimiento adecuado por ser sencillo de desarrollar y no
implicar un alto coste computacional. Estos resultados han sido publicados en (Limon
Marruedo, Bravo,

El algebra intervalar ofrece una ventaja a nadida que mejora a un mas su imple-
mentacion: las regiones de evolucion obtenidas son hiperrectangulos. Dado que la re-
gion terminal suele calcularse a partir de la linealizacion del modelo en torno al origen,
las regiones invariantes suelen ser elipsoides o politopos. Ademas las restricciones en
los estados tambien suelen ser regiones convexas. La convexidad de estas regiones per-
miten expresar la restriccion de que una region de evoluci on incierta esta contenida
en ellas como una restriccion sobre cada uno de los vertices del hiperrectangulo. Por
tanto cada restriccion en terminos de region de evolucion incierta se transforma en 2
n
restricciones sobre los vertices del hiperrectangulo.
El calculo del conjunto invariante robusto, que se va a utilizar como region termi-
nal, se ha hecho buscando el mayor grado de incertidumbre posible. Para ello se ha
tomado como controlador local, el controlador lineal obtenido en el ejemplo del captulo
anterior, cuyo controlador y cuya funcion de Lyapunov cuadratica vienen dadas por
K =
_
1,5488 3,4658
_
P =
_
263,5900 47,1760
47,1760 117,4640
_
El sistema controlado por este controlador local tiene un invariante positivo dado por
= x IR
2
: x
T
Px
siendo = 9,764. Tomando de base este conjunto, se ha calculado un invariante positivo
en el cual el controlador local estabiliza robustamente el sistema con una incertidumbre
w
1

_
810
3
, 6,510
3
_
w
2

_
8,510
2
, 1,210
2
_
Como coste de etapa se ha tomado un coste cuadratico con unas matrices de pon-
deracion
Q =
_
0,5000 0
0 1,1429
_
R = 1,3333
Se ha considerado tambien como coste terminal, V (x) = x
T
Px.
En este ejemplo se han realizado dos ensayos del controlador. En el primero se ha
considerado como incertidumbres del sistema las maximas incertidumbres que admite
el invariante robusto y se ha tomado un horizonte de control N = 4. En la gura 7.1
se muestran las regiones de evoluci on inciertas correspondientes a la primera iteracion
del controlador, para un par de estados iniciales. Como se puede observar, la region

A
4
esta en el interior de la region terminal , satisfaciendo la factibilidad del problema.
0.25 0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2 0.25
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
x
1
x
2

Figura 7.1: Regiones de evolucion incierta en k = 0 para el ensayo 1.
En la gura 7.2 se muestra la evolucion del sistema incierto controlado por el MPC
robusto dual para el primer ensayo. Como se puede observar, el sistema se estabiliza
hasta el invariante robusto donde, debido a las incertidumbres, el sistema evoluciona
hasta quedarse connado en una vecindad del origen.
En un segundo ensayo, se ha considerado que la planta tiene unas incertidumbres
menores, dadas por
w
1

_
6,510
3
, 6,510
3
_
w
2

_
1,210
2
, 1,210
2
_
Como se ha comentado, el controlador es valido para cualquier grado de incertidumbre,
pues la estabilidad esta garantizada en todo estado inicial factible. En efecto, notese que
el tama no de las regiones de evolucion incierta (y en particular la terminal) aumenta
con el grado de incertidumbre y con el horizonte de control. Por lo tanto dado que
el sistema tiene menor incertidumbre, el controlador admite un mayor horizonte de
control y en consecuencia un mayor dominio de atraccion del controlador.
0.25 0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2 0.25
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2

Figura 7.2: Evolucion del sistema incierto en bucle cerrado en el ensayo 1.
Por este motivo se ha considerado para este segundo ensayo un horizonte de control
de N = 7. En la gura 7.3 se ilustra la primera iteracion del algoritmo en un par de
estados iniciales, en la que se puede observar la evoluci on de las regiones inciertas,
as como la factibilidad del problema de optimizacion. El comportamiento del sistema
en bucle cerrado se muestra en la gura 7.4. En esta se puede observar que, tal y como se
esperaba, el controlador es capaz de estabilizar el sistema incierto partiendo de estados
mas alejados del punto de equilibrio que los estabilizables en el primer ensayo.
7.6. Conclusiones
En este captulo se ha presentado un procedimiento para incorporar el efecto de las
incertidumbres en la formulacion del MPC. Este procedimiento se basa en el concepto
de regiones de evoluci on incierta. Estas regiones no son mas que aquellas que con-
nan la evolucion futura del sistema ante una determinada secuencia de actuaciones. El
principal matiz que las diferencia es que estas regiones se orientan a su calculo en lnea
mediante la utilizacion de procedimientos aproximados de acotacion de mapas de con-
juntos. As se establecen condiciones sobre los procedimientos aproximados adecuados
para su determinacion y se presentan algunas caractersticas de estas regiones.
Basado en estas regiones, se propone un controlador MPC robusto dual en el que
las restricciones en los estados y terminal se formulan en terminos de regiones de
evolucion incierta. Requiere tambien la determinacion de un controlador robusto local
0.25 0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2 0.25
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2

Figura 7.3: Regiones de evolucion incierta en k = 0, para el ensayo 2.
0.25 0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2 0.25
1.6
1.2
0.8
0.4
0
0.4
x
1
x
2

Figura 7.4: Evolucion del sistema incierto en bucle cerrado en el ensayo2.
con un conjunto invariante positivo admisible asociado. As, para todo estado factible,
el controlador estabiliza de forma robusta el sistema. Ademas, la estabilidad se conserva
en ausencia de optimalidad de la solucion.
Para evitar la conmutacion al controlador local, se propone una modicacion sobre
la formulaci on del MPC que consiste en incorporar el principio de invariancia como
restriccion. Esta restriccion es admisible gracias a la existencia del controlador local
robusto y conere optimalidad (y convergencia) en la region terminal.
Por ultimo se ha aplicado el controlador dual al reactor utilizado a lo largo de
la tesis. Las regiones de evoluci on incierta se implementan gracias al algebra inter-
valar. Este algebra proporciona un procedimiento general, sencillo y no muy costoso
computacionalmente de calcular estas regiones y de incorporarlas en el problema de
optimizacion.
Estos controladores MPC robustos son aportaciones originales de esta tesis y han
dado lugar al artculo (Limon Marruedo, Bravo,

Hay que resaltar que el controlador propuesto puede tener un alto grado de conser-
vadurismo, pues se enmarca dentro de los controladores MPC en bucle abierto en los
que se predice el comportamiento del sistema incierto en bucle abierto. Este defecto,
presente en los controladores predictivos, viene a solucionarse con formulaciones del
controlador en bucle cerrado. Dentro de ellas se puede considerar el controlador robus-
to que se presenta en el siguiente captulo, en el que se incorpora el comportamiento
del sistema ante las incertidumbres gracias a la teora de conjuntos invariantes.
Captulo 8
MPC robusto basado en conjuntos
invariantes robustos
8.1. Introduccion
La consideracion de incertidumbres en la formulacion estandar de los controladores
MPC incurre en un alto grado de conservadurismo. El origen de este efecto es la nat-
uraleza de las predicciones que se llevan a cabo en el problema de optimizacion: la
prediccion se hace sin considerar la posible reaccion del controlador ante las incer-
tidumbres presentes. Para resolver este problema se han propuesto en la literatura los
denominados controladores predictivos en bucle cerrado (Scokaert & Mayne 1998, Lee
& Yu 1997).
En este captulo se muestra la necesidad de estas estrategias, su planteamiento y
se analiza su estabilidad desde el punto de vista de la programacion dinamica y de la
formulacion min-max. Estos controladores resuelven el problema del conservadurismo
pero a costa de resolver un problema de optimizacion sumamente complejo.
Sin embargo, de este analisis se deriva la importancia del concepto de invariancia
robusta en esta formulacion, lo cual permite establecer una nueva forma de resolver
el problema: una restriccion estabilizante que, impuesta sobre el problema MPC en
bucle abierto, garantiza la estabilidad robusta del sistema. Esta restriccion esta basa-
da en el calculo de las regiones estabilizables robustas. Dado que para sistemas no
lineales pueden resultar muy complejas de determinar, se propone una nueva restric-
cion estabilizante basada en una secuencia de conjuntos invariantes de control robustos
mas sencilla de calcular y que permite garantizar la estabilidad de igual forma. Esta
formulacion es una contribuci on original de esta tesis.
209
210 8.2. MPC robusto en bucle cerrado
La organizacion del captulo se muestra en el siguiente diagrama:
MPC
en
bucle cerrado
Min-max MPC
MPC robusto
basado en
invariantes robustos
Incertidumbres
acotadas
Incertidumbres
que decaen
Restriccin
estabilizante
Figura 8.1: Organizacion del captulo 8
8.2. MPC robusto en bucle cerrado
En captulos anteriores se han dado ciertas pinceladas sobre la formulacion en bucle
cerrado del MPC, como solucion al conservadurismo de los controladores predictivos
robustos basados en la incorporacion de las incertidumbres en la prediccion en bucle
abierto. En esta seccion se pretende abordar mas directamente el tema, justicando
el por que de esta necesidad y como se formula este tipo de controladores. Para ello
se sigue la lnea presentada en (Mayne 2001), en el cual se analiza el problema de la
robustez del MPC desde un punto de vista de la programacion dinamica. De este modo
se continua la lnea de anteriores captulos y se hace hincapie sobre la necesidad de la
consideracion de aspectos de invariancia.
A lo largo de esta seccion se va a considerar que el sistema real o planta responde
a un modelo incierto descrito por la ecuacion
x
k+1
= f(x
k
, u
k
, w
k
) (8.1)
siendo x
k
IR
n
el vector de estados del sistema y u
k
IR
m
las actuaciones sobre el
mismo. El vector w
k
IR
p
representa las incertidumbres presentes en el modelo, de las
cuales tan solo se conoce que estan acotadas en un conjunto
w
k
W
Captulo 8. MPC robusto basado en conjuntos invariantes robustos 211
Por otro lado las entradas y los estados estan sujetos a las restricciones
u
k
U x
k
X
siendo ambos conjuntos compactos.
8.2.1. Necesidad de controladores MPC en bucle cerrado
Para justicar la necesidad de la formulacion e introducir al concepto de prediccion
en bucle cerrado, se va a seguir un ejemplo ilustrativo utilizado en (Scokaert & Mayne
1998).
Considerese el sistema lineal incierto dado por
x
k+1
= x
k
+ u
k
+ w
k
siendo x
k
IR el estado del sistema, u
k
la actuacion sobre el mismo y w
k
las incer-
tidumbres del sistema. El estado del sistema esta restringido a
x
k
[1,2, 2]
mientras que la actuacion no esta acotada. Las incertidumbres del sistema son
w
k
[1, 1]
El conjunto = x [1, 1] es un conjunto invariante robusto del sistema con-
trolado con una ley de control u
k
= x
k
ya que para todo x
k
, se tiene que
x
k+1
= w
k
.
Considerese un controlador MPC con horizonte de prediccion N = 2 y region ter-
minal . El estado del sistema en k + 2 sera
x
k+2
= x
k
+ u
k
+ u
k+1
+ w
k
+ w
k+1
Considerese una formulaci on robusta estandar (en bucle abierto) del MPC. El ob-
jetivo del controlador robusto es determinar una secuencia de actuaciones u
k
, u
k+1
tal que lleve al sistema a para cualquier realizacion de las incertidumbres. De la

prediccion del estado terminal se observa que
x
k+2
= x
k
+ u
k
+ u
k+1
+ w
k
+ w
k+1
. .
[2,2]
212 8.2. MPC robusto en bucle cerrado
entonces, dado que la incertidumbre posible es mayor que la region se deduce que
no existe ninguna secuencia de actuaciones tal que el problema sea factible.
Sin embargo el problema s es robustamente controlable a ese conjunto en dos pasos.
Para ello basta hacer u
k
= x
k
y u
k+1
= x
k+1
. En efecto
x
k+1
= x
k
+ u
k
+ w
k
= w
k
[1, 1] [1,2, 2]
luego satisface las restricciones. En el instante siguiente se tiene que
x
k+2
= x
k+1
+ u
k+1
+ w
k+1
= w
k+1
[1, 1] =
luego, el sistema puede ser llevado hasta la region terminal en N pasos.
La diferencia entre ambas situaciones es que en la primera la secuencia de actua-
ciones que se determina en un determinado estado es ja e independiente de la real-
izacion de las incertidumbres futuras: debe satisfacer las restricciones para cualquier
incertidumbre posible, y esta secuencia no existe. Sin embargo, si se considera que in-
certidumbres han intervenido en el sistema se pueden determinar actuaciones, depen-
dientes de la evolucion del sistema, que satisfacen las restricciones. Notese que estas
actuaciones son leyes de control, pues proporcionan una actuacion en funcion del estado
del sistema: u
k
= x
k
, u
k+1
= x
k+1
.
En efecto, para un sistema incierto, el conjunto de estados que pueden ser lleva-
dos por una secuencia de actuaciones admisible u
k
=
k
(x
k
) U a un determinado
invariante robusto , en N pasos y satisfaciendo las restricciones a pesar de las incer-
tidumbres es el conjunto estabilizable a N pasos robusto

S
N
(X, ).
S
N
(X, ) = x
0
X : u
k
=
k
(x
k
) U k = 0, , N1 [ x
k
X, x
N
, w
k
W
Sin embargo, en el control predictivo robusto (en bucle abierto) el conjunto de
estados robustamente estabilizables es
X
ba
= x
0
X : u
k
(x
0
) U k = 0, , N 1 [ x
k
X, x
N
, w
k
W
es decir, el conjunto de estados que pueden ser llevados por una secuencia de actua-
ciones admisible y ja hasta el conjunto en N pasos. Este conjunto esta incluido en
S
N
(X, ), y de hecho suele ocurrir que este conjunto es mucho menor
X
ba

S
N
(X, )
En consecuencia, el problema de la prediccion en bucle abierto es un problema de fac-
tibilidad: el conjunto de estados estabilizables de forma robusta en bucle abierto es
mucho menor que el que realmente se puede estabilizar. Este es el origen del conser-
vadurismo de las formulaciones robustas del MPC basadas en predicciones en bucle
abierto.
8.2.2. Formulacion del MPC robusto en bucle cerrado
La formulaci on del MPC en bucle cerrado consiste, basicamente, en sustituir la
secuencia de actuaciones
u
F
(k) = u(k[k), , u(k + N 1[k)
por una secuencia de leyes de control
(k) = u(k[k),
1
(), ,
N1
()
como variables de decision del problema de optimizacion. Notese que la actuacion
u(k[k) se mantiene como variable de decision, pues el estado actual es conocido.
As, el problema de optimizacion del predictivo se reformula como
mn
(k)
J
N
(x
k
, (k), W)
s.a
u(k[k) U
j
(x(k + j[k)) U j = 1, , N 1 w
k+i
W, i = 0, j 1
x(k + j[k) X j = 0, , N 1 w
k+i
W, i = 0, j 1
x(k + N[k) w
k+i
W, i = 0, N 1
siendo x(k + 1[k) = f(x
k
, u(k[k), w
k
) y para j = 1, , N 1
x(k + j + 1[k) = f(x(k +j[k),
j
(x(k +j[k)), w
k+j
)
el estado predicho incorporando el efecto de las incertidumbres.
Es importante poner de maniesto que la prediccion de los estados depende de la
realizacion de las incertidumbres, pudiendo ser esta distinta en el calculo del coste a
optimizar que en la determinacion de las restricciones. Sera conveniente pues, a nadir a
la notacion de los estados predichos la dependencia de las incertidumbres. Sin embargo,
dado que esta dependencia se deriva del contexto y con el objetivo de la sencillez en
el desarrollo de los resultados que se presentan, se realiza un abuso de notacion y se
omite esta dependencia. Sin embargo, se insta al lector a tener esto en cuenta a lo
largo del captulo, pues en secciones posteriores, los estados predichos corresponden al
comportamiento nominal.
La region terminal X suele ser un conjunto invariante robusto, con una ley de
control local asociada u
k
= h(x
k
) tal que garantiza que f(x, h(x), w) para todo
x y w W.
En consecuencia el coste a minimizar tiene la forma
J
N
(x
k
, (k), W) =
j=N1
j=0
L(x(k + j[k),
j
(x(k + j[k))) + V (x(k + N[k))
214 8.3. Analisis de estabilidad del MPC robusto en bucle cerrado
considerando
0
= u(k[k) (en aras de la sencillez). El coste puede depender del con-
junto de incertidumbres presentes sobre el sistema, seg un como se calculen los estados
predichos para la determinacion de su coste. As, se puede considerar la peor de las
realizaciones posibles de las incertidumbres, lo cual conduce a un problema min-max, o
bien considerar el coste nominal, resultante de hacer w
k+j
= 0. Por eso, la dependencia
del coste con las incertidumbres se pone de maniesto en la incorporacion del conjunto
de incertidumbres W en la notacion del coste.
Notese que independientemente de la forma del coste a minimizar, las restricciones
deben satisfacerse para toda posible realizacion de las incertidumbres.
Como es logico, este problema de optimizacion es notablemente mas complejo en
su resolucion que la formulaci on en bucle abierto, pues requiere el calculo de leyes de
control, que son variables innito dimensionales, en general. Por tanto, esta estrategia
se considera una solucion teorica por ahora, si bien importantes esfuerzos se estan
haciendo en la comunidad investigadora para tratar este nuevo reto.
Esta formulacion se utiliza en (Scokaert & Mayne 1998) en el contexto de min-max
y en (Magni, De Nicolao, Magnani & Scattolini 2001) en el contexto del control H
.
Dentro de esta familia de controladores se puede englobar el presentado en (Kothare
et al. 1996), en el cual se plantea el problema en bucle cerrado en forma de LMI que
se resuelve en cada instante.
8.3. Analisis de estabilidad del MPC robusto en bu-
cle cerrado
8.3.1. Aproximacion desde la programacion dinamica
Al igual que los controladores nominales, el control robusto permite una inter-
pretacion desde el punto de vista de la programacion dinamica. Para ello se va a
considerar el controlador en su formulacion min-max, el cual se puede expresar como
la solucion del siguiente problema de programacion dinamica (Mayne 2001):
J
i
(x) = mn
uU
_
max
wW
L(x, u) + J
i1
(f(x, u, w)) [ f(x, u, w)

X
i1
, w W
_
siendo J
0
(x) = V (x) y X
0
= . Este problema esta denido en el conjunto

X
i
, que
es el conjunto de estados que pueden alcanzar el conjunto terminal en i pasos,
estabilizados por una secuencia de actuaciones admisibles y siguiendo una trayectoria
admisible. Por tanto este conjunto es el conjunto controlable en i pasos robusto.
X
i
=

/
i
(X, )
Al igual que en el caso nominal, para garantizar la factibilidad del problema de
optimizacion en cada instante, se debe imponer la condicion que sea un invariante
robusto del sistema. Entonces
X
i
=

S
i
(X, )
que garantiza que

X
i1

X
i
.
La ley de control resultante de este problema es
K
r
i
(x) = arg mn
uU
_
max
wW
L(x, u) + J
i1
(f(x, u, w)) [ f(x, u, w)

X
i1
, w W
_
Aplicando en el instante k la ley de control u
k
= K
r
Nk
(x
k
) el sistema incierto
evoluciona de una forma admisible hasta alcanzar el invariante robusto donde la ley
de control local u
k
= h(x
k
) mantiene el sistema evolucionando en dicho conjunto.
Es importante resaltar que la convergencia al conjunto no se debe a la optimalidad
de la solucion obtenida, sino a la satisfaccion de la restriccion
f(x, u, w)

X
i1
w W
Esta restriccion garantiza que en el instante k, x
k

X
Nk
, y por lo tanto el estado
evoluciona de una region a otra interior, de forma que en el instante N alcanza la region
, x
N
.
Por tanto, cualquier solucion suboptima factible del problema de programacion
dinamica estabiliza el sistema, si bien con un peor comportamiento en la evolucion
del mismo. En esta idea se basa la formulaci on robusta propuesta en este captulo: se
impone sobre el problema en bucle abierto una restriccion tal que garantiza la robustez
del sistema, con las ventajas del bucle cerrado. Este nuevo controlador se expone en
una seccion posterior.
Notese que este analisis justica la estabilidad siempre y cuando el horizonte de
control se reduzca en cada instante, de forma que en el instante k, el horizonte de control
es Nk. Sin embargo, la formulacion habitual del MPC considera un horizonte jo N,
por lo que se aplica en cada instante el controlador invariante en el tiempo K
r
N
(x). Este
controlador tan solo garantiza la factibilidad del problema, siempre y cuando la region
terminal sea un invariante robusto. Al igual que en el caso nominal, para garantizar
la convergencia del controlador, es necesario imponer condiciones adicionales, que se
exponen a continuaci on.
8.3.2. Estabilidad del MPC robusto en bucle cerrado con ho-
rizonte jo e incertidumbres que decaen con el estado
Siguiendo la lnea de (Mayne 2001), se establecen condiciones sucientes bajo las
cuales el control predictivo robusto en bucle cerrado en su formulacion min-max es-
tabiliza el sistema. Para ello supone que las incertidumbres dependen del estado, de
forma que tienden a 0 cuando el sistema tiende al origen.
w W(x) : x 0 w 0
Este tipo de incertidumbres pueden aparecer, por ejemplo, cuando se obtienen modelos
que son muy precisos en una vecindad del punto de equilibrio, aumentando el error de
estos cuanto mas alejado se encuentra el estado del equilibrio.
En este caso, el origen es un punto de equilibrio del sistema incierto y por lo tanto
puede ser asint oticamente estabilizado al origen. Esta condicion permite la satisfaccion
de la siguiente hipotesis
Hipotesis 8.1 Existe un conjunto invariante robusto con una ley de control asociada
u
k
= h(x
k
) y una funcion de Lyapunov
1
V (x) tales que
(i) X
h
.
(ii) f(x, h(x), w) para todo x y w W.
(iii) V (f(x, h(x), w)) V (x) + L(x, h(x)) 0 para todo x y w W.
El controlador min-max MPC considerando como coste terminal V (x) y region
terminal viene dado por el siguiente problema de optimizacion
mn
(k)
max
w
F
W
j=N1
j=0
L(x(k + j[k),
j
(x(k +j[k))) + V (x(k + N[k))
s.a
u(k[k) U
j
(x(k + j[k)) U j = 1, , N 1 w
k+i
W, i = 0, j 1
x(k + j[k) X j = 0, , N 1 w
k+i
W, i = 0, j 1
x(k + N[k) w
k+i
W, i = 0, N 1
del cual se deriva la ley de control
u
k
= K
r
MPC
(x
k
) = u
(k[k)
La estabilidad de este controlador se establece en el siguiente teorema
1
Analogamente se puede establecer esta hipotesis en terminos de funcion de Lyapunov de control.
Teorema 8.2 (Mayne 2001) Sea un sistema incierto que responde a un modelo
x
k+1
= f(x
k
, u
k
, w
k
)
siendo x
k
IR
n
, u
k
IR
m
y w
k
IR
p
. Las entradas y los estados estan sujetos a las
restricciones
u
k
U x
k
X
Las incertidumbres presentes en el modelo satisfacen w
k
W de forma que w 0
cuando x 0. Por lo tanto f(0, 0, 0) = 0 es un punto de equilibrio del sistema incierto.
Sea el sistema tal que se satisface la hipotesis 8.1.
Entonces la ley de control u
k
= K
r
MPC
(x
k
) estabiliza asintoticamente el sistema al origen
para todo estado inicial factible x
0

X
N
.
Demostracion:
Todo estado inicial, por ser factible, satisface que x
0

X
N
=

S
N
(X, ) y ademas para
todo x
k

X
N
se satisface que x
k+1

X
N1
=

S
N1
(X, )

S
N
(X, ), por lo que el
controlador es siempre factible a pesar de las incertidumbres.
Para probar la convergencia, se va a demostrar antes el siguiente resultado
J
i
(x) J
i1
(x) 0 x

X
i1
para lo cual se va a proceder por induccion.
As, para i = 1, para todo x se tiene que
J
1
(x) J
0
(x) = mn
uU
max
wW
L(x, u) + V (f(x, u, w))[f(x, u, w) , w W V (x)
En virtud de la hipotesis 8.1, se tiene que
mn
uU
max
wW
L(x, u) + V (f(x, u, w))[f(x, u, w) , w W V (x) 0
luego, J
1
(x) J
0
(x) 0.
Supongase que J
i
(x) J
i1
(x) para todo x

X
i1
. Entonces para todo x

X
i
se
tiene que
J
i+1
(x)J
i
(x) = mn
uU
_
max
wW
L(x, u)+J
i
(f(x, u, w)) [ f(x, u, w)

X
i
, w W
_
J
i
(x)
dado que x

X
i
, el controlador optimo a i pasos K
r
i
(x) es un controlador suboptimo
factible del problema en i + 1 pasos pues para todo x

X
i
satisface la restriccion, ya
que
f(x, K
r
i
(x), w)

X
i1

X
i
En lo que sigue, y en aras de la sencillez de la presentacion de la demostracion, se
omitira la restriccion f(x, u, w) X
i
, w W de los calculos.
Considerando esto y la optimalidad de K
r
i
(x) para todo x

X
i
, se tiene que
J
i+1
(x) J
i
(x) max
wW
L(x, K
r
i
(x)) + J
i
(f(x, K
r
i
(x), w)) J
i
(x)
= max
wW
L(x, K
r
i
(x)) + J
i
(f(x, K
r
i
(x), w))
max
wW
L(x, K
r
i
(x)) + J
i1
(f(x, K
r
i
(x), w))
Teniendo en cuenta la siguiente propiedad
max
w
A(w) max
w
B(w) max
w
A(w) B(w)
se deriva que
J
i+1
(x) J
i
(x) max
wW
J
i
(f(x, K
r
i
(x), w)) J
i1
(f(x, K
r
i
(x), w))
Dado que f(x, K
r
i
(x), w)

X
i1
para todo w W, de la hipotesis de partida se verica
que
J
i+1
(x) J
i
(x) 0
Con lo que queda demostrada la armacion anterior.
Considerando este resultado se puede establecer que
J
N
(x
k+1
) J
N
(x
k
) = J
N
(x
k+1
) max
wW
L(x
k
, K
r
MPC
(x
k
)) + J
N1
(f(x
k
, K
r
MPC
(x
k
), w))
Dado que x
k+1
= f(x
k
, K
r
MPC
(x
k
), w
k
), se verica que
max
wW
L(x
k
, K
r
MPC
(x
k
)) + J
N1
(f(x
k
, K
r
MPC
(x
k
), w)) L(x
k
, K
r
MPC
(x
k
))
+J
N1
(f(x
k
, K
r
MPC
(x
k
), w
k
))
= L(x
k
, K
r
MPC
(x
k
)) + J
N1
(x
k+1
)
Por lo tanto, se tiene que
J
N
(x
k+1
) J
N
(x
k
) J
N
(x
k+1
) L(x
k
, K
r
MPC
(x
k
)) J
N1
(x
k+1
)
Dado que x
k+1

X
N1
, se aplica el resultado anterior por el cual
J
N
(x
k+1
) J
N1
(x
k+1
) 0
de donde se deduce que
J
N
(x
k+1
) J
N
(x
k
) L(x
k
, K
r
MPC
(x
k
))
y por lo tanto J
N
(x) es una funcion de Lyapunov del sistema.
Este resultado demuestra la estabilidad asintotica del sistema controlado por un
MPC min-max, para incertidumbres que tienden a cero cuando el estado del sistema
tiende al origen. Esta demostracion es una versi on detallada de la presentada en (Mayne
2001).
8.3.3. Estabilidad del MPC robusto en bucle cerrado con ho-
rizonte jo e incertidumbres acotadas
Considerese el caso de incertidumbres simplemente acotadas, es decir aquellas que
no tienen por que tender a cero cuando el estado tiende al origen. En este caso, tan
solo se conoce de las incertidumbres su pertenencia a un conjunto acotado W, de forma
que, existe una constante > 0 tal que para todo w W, se tiene que |w| .
Este tipo de incertidumbres hacen que el origen no sea un punto de equilibrio
del sistema y por lo tanto el resultado anterior no puede aplicarse. En este caso, en
(Mayne 2001) se propone la utilizacion de una formulaci on dual del controlador, en la
que se a nade como variable de decision el horizonte de control.
Sin embargo, incorporando resultados de la estabilidad entrada a estado se puede
establecer que el sistema controlado por el controlador robusto min-max anterior, es-
tabiliza el sistema en sentido entrada estado. Esto generaliza el resultado anterior y
demuestra que en caso de incertidumbres acotadas no es necesario recurrir a formula-
ciones duales para demostrar estabilidad. Este resultado es una contribucion de esta
tesis.
El sistema debe satisfacer la siguiente hipotesis, seg un la cual debe existir un inva-
riante robusto en el que el sistema es estabilizable entrada a estado.
Hipotesis 8.3 Existe un conjunto invariante robusto con una ley de control asociada
u
k
= h(x
k
) y una funcion de Lyapunov V (x) tales que
(i) X
h
.
(ii) f(x, h(x), w) para todo x y w W.
(iii) Existe una funcion / , (), tal que
V (f(x, h(x), w)) V (x) L(x, u) + ()
para todo x y w W.
Con esta ligera modicacion se puede comprobar que el sistema controlado por la
ley
u
k
= K
r
MPC
(x
k
)
es estable entrada a estado, y por lo tanto, que el sistema evoluciona hasta un invariante
robusto en el que queda acotado. Este resultado es original de esta tesis y se establece
en el siguiente teorema
Teorema 8.4 Sea un sistema incierto que responde a un modelo
x
k+1
= f(x
k
, u
k
, w
k
)
siendo x
k
IR
n
, u
k
IR
m
y w
k
IR
p
. Las entradas y los estados estan sujetos a las
restricciones
u
k
U x
k
X
Las incertidumbres presentes en el modelo satisfacen
w
k
W
siendo el conjunto de incertidumbres W tal que existe una constante > 0 que verica
W B
= |w| .
Sea el sistema tal que se satisface la hipotesis 8.3.
Entonces la ley de control u
k
= K
r
MPC
(x
k
) estabiliza el sistema en el sentido entrada a
estado para todo estado inicial factible x
0

X
N
.
En la demostracion del teorema se simplica por ser muy similar a la del teorema
anterior.
Demostracion:
La evolucion del sistema garantiza la factibilidad robusta del problema de optimizacion.
Para probar la convergencia, se va a demostrar por induccion que
J
i
(x) J
i1
(x) () x

X
i1
As, para i = 1, para todo x se tiene que
2
J
1
(x) J
0
(x) = mn
uU
max
wW
L(x, u) + V (f(x, u, w)) V (x)
2
Al igual que en la demostracion anterior, en aras de la sencillez de la misma, se omite en la
notacion la restriccion en el estado siguiente f(x, u, w)

X
i
, w W.
max
wW
L(x, h(x)) + V (f(x, h(x), w)) V (x)
()
consecuencia de la hipotesis 8.3.
Supongase que J
i
(x) J
i1
(x) () para todo x

X
i1
. Entonces para todo
x

X
i
se tiene que
J
i+1
(x) J
i
(x) max
wW
J
i
(f(x, K
r
i
(x), w)) J
i1
(f(x, K
r
i
(x), w))
Dado que f(x, K
r
i
(x), w)

X
i1
para todo w W, de la hipotesis de partida se verica
que
J
i+1
(x) J
i
(x) ()
Con lo que queda demostrada la armacion anterior.
Considerando esto se tiene que
J
N
(x
k+1
) J
N
(x
k
) = J
N
(x
k+1
) max
wW
L(x
k
, K
r
MPC
(x
k
)) + J
N1
(f(x
k
, K
r
MPC
(x
k
), w
k
))
J
N
(x
k+1
) L(x
k
, K
r
MPC
(x
k
)) J
N1
(x
k+1
)
Dado que x
k+1

X
N1
, se aplica el resultado anterior por el cual
J
N
(x
k+1
) J
N1
(x
k+1
) ()
de donde se deduce que
J
N
(x
k+1
) J
N
(x
k
) L(x
k
, K
r
MPC
(x
k
)) + ()
y por lo tanto J
N
(x) es una funcion de Lyapunov entrada a estado del sistema.
8.4. Transformaci on de la formulacion en bucle ce-
rrado en restriccion estabilizante
La formulaci on en bucle cerrado del MPC aparece como una formulacion nece-
saria para solventar los problemas asociados a los controladores robustos tradicionales,
basados en las predicciones en bucle abierto. Sin embargo, la incorporacion de leyes de
control en el problema de optimizacion hacen el problema tan complejo de resolver,
que se considera por ahora una solucion teorica.
222 8.4. Transformacion de la formulacion en bucle cerrado en restriccion estabilizante
Del analisis hecho anteriormente se comprueba que la teora de conjuntos invariantes
ofrece un marco para el analisis de la estabilidad y factibilidad de sistemas inciertos.
Estas propiedades estan muy relacionadas con el concepto de conjunto invariante de
control robusto, y en particular con los conjuntos estabilizables robustos. En efecto, en
el caso de la programacion dinamica se observa que es la satisfaccion en el instante k
de la restriccion
f(x
k
, u
k
, w
k
)

X
Nk1
w W
lo que garantiza la convergencia del sistema al invariante robusto a pesar de las
incertidumbres, dado que la secuencia de conjuntos

X
Nk
es una secuencia contractiva
3
que converge en .
Esta consideracion permite abandonar la optimalidad de la solucion, pues es la
factibilidad la garanta de convergencia. Por tanto un controlador formulado a partir
del siguiente problema de optimizacion
mn
u
F
J
N
(x
k
, u
F
, W)
s.a
x(k + 1)

X
Nk1
w W
u(k + j[k) U j = 0, , N 1
x(k + j[k) X j = 0, , N 1
x(k + N[k)
siendo x(k + 1) = f(x, u(k[k), w), garantiza igual la factibilidad del sistema y su con-
vergencia al conjunto a pesar de las incertidumbres. Notese que en el problema
de optimizacion, las predicciones hechas a partir del instante k + 1, x(k + j[j) para
j = 2, , N pueden ser predicciones nominales del sistema.
La propiedad mas importante de este problema de optimizacion es que se recupera
la formulaci on en bucle abierto, que es mucho mas sencilla de resolver. La adicion en
el problema en bucle abierto de la restriccion
x(k + 1)

X
Nk1
w W
es lo que garantiza la factibilidad del problema, pues para todo x
k

X
Nk
, existe
una actuacion factible tal que x
k+1

X
Nk1
para toda incertidumbre w W y
ademas, dado que

X
Nk1
X, la restriccion asegura la satisfaccion robusta de las
restricciones en el estado. Por tanto, la consideracion de un horizonte de control mayor
que 1, as como el resto de restricciones impuestas sobre los estados, tienen sentido
en lo que respecta al desempe no del controlador pero no por la estabilidad ni por el
dominio de atraccion del controlador.
En efecto, el conocimiento de la secuencia de conjuntos estabilizables a i pasos,

X
i
=
S
i
(X, ), ofrece una informacion del sistema muy importante que puede incorporarse
3
Se entiende una secuencia contractiva de conjuntos, aquella secuencia tal que
i

i+1
para
todo i.
al dise no de controladores estabilizantes. Para ello es necesario llevar a cabo el calculo
explcito de estas regiones para incorporarlas como restricciones. Este calculo se hace
fuera de lnea, por lo que el coste computacional derivado, si bien puede ser grande,
forma parte del dise no del controlador. En lnea, el coste computacional asociado a la
resolucion de este problema de optimizacion es similar a la del MPC nominal.
Existen algoritmos ecientes para la determinacion de estos conjuntos tan solo en
sistemas lineales con restricciones politopicas (Kerrigan 2000). En un contexto diferente
al MPC, en (Mayne & Schroeder 1997) se dise na un controlador en tiempo mnimo
robusto para sistemas lineales utilizando conjuntos invariantes.
En el caso de sistemas no lineales es necesario recurrir a procedimientos aproxi-
mados, que hacen que la anterior restriccion estabilizante no se pueda implementar.
Para subsanar este problema, se propone en la siguiente seccion una formulaci on de la
restriccion basada en una secuencia de conjuntos invariantes de control robustos, que
pueden calcularse a partir de procedimientos aproximados.
Esta idea se puede enmarcar dentro los denominados controladores predictivos con
restriccion estabilizante, en los cuales se garantiza la estabilidad del sistema mediante
una restriccion estabilizante impuesta sobre el estado siguiente. En (Primbs et al. 2000),
se presenta un controlador con estabilidad garantizada para sistemas sin incertidumbres
y sin restricciones en los estados. Este controlador se basa la incorporacion de una
restriccion basada en una funcion de Lyapunov de control (CLF). Esta restriccion
obliga a tomar una actuacion que provoque un decrecimiento de la CLF en el instante
siguiente. As, esta funcion es funcion de Lyapunov del sistema en bucle cerrado. La
idea de restriccion estabilizante basada en invariantes de control se podra considerar
una generalizacion de estos resultados.
8.5. MPC robusto basado en conjuntos invariantes
de control
En la seccion anterior se mostro como se pueden transformar las condiciones im-
puestas en el control predictivo en bucle cerrado en una restriccion estabilizante so-
bre el problema formulado en bucle abierto. Esto tiene unas ventajas notables, pero
esta basado en la determinacion de los conjuntos

S
i
(X, ).
Con el n de evitar el calculo de estos conjuntos y conservar las caractersticas
estabilizantes del controlador, se propone un controlador basado en una secuencia de
invariantes de control robustos, que es mas sencilla de obtener.
224 8.5. MPC robusto basado en conjuntos invariantes de control
En lo que sigue se va a considerar un sistema incierto cuyo modelo responde a
incertidumbres aditivas
x
k+1
= f(x
k
, u
k
) + w
k
de forma que las incertidumbres estan contenidas en un conjunto acotado w
k
W. Las
actuaciones y los estados estan a su vez restringidos a
u
k
U, x
k
X
8.5.1. Determinacion de una secuencia de invariantes de con-
trol robustos
A lo largo del desarrollo de esta seccion se utilizan conceptos y resultados de la
teora de conjuntos invariantes, que se puede encontrar en el apendice A.
Un conjunto IR
n
se dice que es un invariante de control robusto, si para
cualquier estado contenido en , existe una actuacion admisible u(x) U tal que el
estado siguiente permanece en el, es decir, f(x, u) + w para todo w W.
La obtencion de invariantes de control esta basada en el conjunto a un paso robusto
Q(). Este conjunto viene dado por
Q() = x IR
n
: u(x) U [ f(x, u) + w w W
es decir, el conjunto de estados para los cuales existe una actuacion admisible tal que
el estado siguiente esta contenido en para toda posible incertidumbre.
En el caso de incertidumbres aditivas, el conjunto a un paso robusto satisface la
propiedad
Q() = Q( W)
por lo que se puede obtener a partir del conjunto a un paso nominal
4
.
Teniendo en cuenta lo anterior, se puede establecer la siguiente propiedad
Propiedad 8.5 Sea X un invariante de control robusto del sistema y sea

Q()
su conjunto a un paso robusto, entonces todo conjunto tal que

Q() X
es un invariante de control robusto del sistema.
4
El n ultimo de considerar modelos con incertidumbres aditivas es poder obtener el conjunto a
un paso robusto a partir del nominal, que resulta mas sencillo de calcular. Sin embargo, todos los
resultados posteriores son extensibles a otro tipo de incertidumbres considerando el conjunto a un
paso robusto
Esta propiedad es inmediata, considerando el principio de invariancia y la denicion
del conjunto a un paso robusto. La interseccion con el conjunto de restricciones sobre
el estado X es necesario para garantizar que la evolucion del sistema es admisible. En
el caso en que el conjunto fuese un invariante positivo robusto tambien se satisface
la propiedad pues esta basada en la propiedad geometrica de invariancia.
Como se ha comentado en captulos anteriores, el calculo del conjunto a un paso Q()
es muy costoso, si no imposible, en el caso de sistemas no lineales. Pero la propiedad
anterior provee un procedimiento para determinar invariantes de control robustos a
partir de un calculo aproximado del conjunto a un paso Q(). As, se puede obtener un
procedimiento aproximado de calculo Q
ap
() tal que
= Q
ap
( W) Q( W)
De todo lo anterior se deduce que mediante el siguiente algoritmo es posible obtener
una secuencia de N
r
invariantes de control robustos.
1. Hacer
0
= . i 0
2. Calcular
i
= Q
ap
(
i1
W) X
i1
3. Si i = N
r
ir a 5
4. Si no, hacer i i + 1 e ir a 2
5. Fin
Notese que el procedimiento para calcular Q
ap
() debe ser lo sucientemente preciso
como para que el paso 2 tenga solucion.
De este algoritmo se obtienen N
r
conjuntos invariantes de control robusto tales que
satisfacen las siguientes propiedades
Propiedad 8.6 Sea
i
la secuencia de N
r
invariantes de control robustos obtenidos
del anterior algoritmo, entonces
1.
0
=
1

Nr
X.
2. Para todo x
i
existe una actuacion admisible u U tal que f(x, u)+w
i1
para todo w W.
3.
i

S
i
(X, ).
4. Si el calculo de la region a un paso es exacta, es decir Q
ap
() = Q(), entonces
i
=

S
i
(X, ).
Es interesante resaltar que esta secuencia de invariantes de control robustos puede
estar nitamente determinada, es decir, que exista un i
tal que para todo i i
, resulta
que
i
=
i+1
. En consecuencia, la secuencia de invariantes de control dejara de crecer.
Esta determinacion puede venir derivada de la determinacion nita de

S
(X, ), es
decir, de la propia naturaleza del sistema y de las restricciones, o bien por el caracter
aproximado del calculo de Q
ap
().
8.5.2. Formulaci on del MPC robusto
El analisis llevado a cabo anteriormente muestra que la incorporacion de una re-
striccion estabilizante basada en las regiones estabilizables asegura estabilidad del con-
trolador robusto en una formulaci on en bucle abierto. Sin embargo, la dicultad de la
determinacion de estos conjuntos en sistemas no lineales, conduce a la necesidad de
formulaciones mas implementables.
La estabilidad de la formulacion anterior esta basada en la contractividad de la
secuencia de regiones

X
Nk
, que va forzando al sistema, de una forma admisible, a
alcanzar el invariante robusto. Para conservar la contractividad y admisibilidad de las
soluciones, se propone el calculo de una secuencia de N
r
invariantes de control robustos
desarrollado en el apartado anterior. Por tanto, esta secuencia puede utilizarse para
formular un nuevo controlador MPC robusto:
mn
u
F
J
N
(x
k
, u
F
, W)
s.a
_
x(k + 1[k)
Nrk
W si k < N
r
x(k + 1[k) W si k N
r
u(k +j[k) U j = 0, , N 1
x(k +j[k) X j = 0, , N 1
En este caso los estados x(k+j[k) son los estados predichos a partir del modelo nominal
del sistema.
Este problema de optimizacion es en bucle abierto, lo que simplica la resolucion del
problema. El coste a optimizar J
N
(x
k
, u
F
, W) puede basarse en predicciones nominales,
o bien el correspondiente a una formulacion min-max o cualquier otra. El coste J
N
, el
horizonte de control N, as como las restricciones adicionales sobre los estados tan solo
afectan al comportamiento del sistema controlado, no a la estabilidad del mismo, que
esta garantizada por la restriccion estabilizante (como se demostrara a continuacion).
A continuaci on se demuestra que el controlador propuesto estabiliza el sistema
incierto.
Sea un sistema incierto cuyo modelo responde a
x
k+1
= f(x
k
, u
k
) + w
k
de forma que las incertidumbres estan contenidas en un conjunto acotado w
k
W. Las
actuaciones y los estados estan a su vez restringidos a
u
k
U x
k
X
Sea X un conjunto invariante robusto del sistema incierto y sea
i
una secuen-
cia contractiva de N
r
invariantes de control robustos basada en obtenida utilizando
el algoritmo propuesto.
Entonces el sistema incierto controlado por el controlador MPC robusto propuesto es-
tabiliza el sistema hasta quedar acotado en , para todo estado contenido en X
r
N
=
Q(
Nr
W) X.
Demostracion:
Se va a comprobar que todo x
0
X
r
N
es asint oticamente estabilizado al conjunto , y
para ello se procede por induccion.
Supongase que x
0
X
r
N
= Q(
N
r
W) X, entonces existe una actuacion
admisible u
0
U tal que f(x
0
, u
0
)
N
r
W X. Por lo tanto satisface las
restricciones en x(1[0). Ademas, de la teora de conjuntos invariantes se tiene que
Nr

S
Nr
(X, ) S
Nr
(X, ) (
(X), siendo (
(X) el maximo invariante de

control robusto. Por lo tanto existe una secuencia de actuaciones admisibles tales que la
evolucion del sistema es admisible. En consecuencia se satisfacen todas las restricciones
y el problema es factible en x
0
. Ademas el estado siguiente x
1

N
r
Q(
N
r
1

W) X.
Supongase ahora que x
k
Q(
N
r
k
W) X. Entonces existe una actuacion
admisible u
k
U tal que x(k + 1[k)
N
r
k
W. Ademas, dado que
N
r
k

(
(X), existe una secuencia de actuaciones admisibles que mantienen la evoluci on del
sistema admisible. Entonces el problema es factible en x
k
y ademas x
k+1

Nrk

Q(
Nrk1
W) X.
Por lo tanto, para todo k < N
r
, se satisface que el problema es factible y ademas el
sistema evoluciona de forma que x
N
r
.
Para k N
r
la restriccion x(k + 1[k) W es factible por ser un conjunto
invariante robusto, y ademas la actuacion obtenida garantiza que el sistema permanece
contenido en dicho invariante.
Nota 8.8 La restriccion x(k + 1[k) W se a nade para garantizar que el contro-
lador mantiene el sistema en una vez alcanzada la region. Si se omite, entonces es
necesaria una formulacion dual, y por lo tanto la conmutacion al controlador local una
vez que el sistema alcanza el conjunto .
Nota 8.9 Si la funcion de coste se toma de forma que el MPC estabiliza asintotica-
mente el sistema en ausencia de incertidumbres, entonces el controlador estabiliza
asintoticamente el sistema incierto si las incertidumbres decaen con el tiempo.
Esto se debe a que, una vez que el estado del sistema queda connado en , la
robustez inherente del controlador MPC garantiza la estabilidad asintotica.
Nota 8.10 La adicion de la restriccion terminal x(k + N[k) en el problema de
optimizacion, solo se puede hacer cuando N N
r
. La incorporacion de esta restriccion
mejora el comportamiento del controlador.
Nota 8.11 El sistema se puede comportar de forma que en un determinado instante
k, el sistema evolucione a un conjunto de la secuencia
i
con i < N
r
k (es decir, que
se salte una o mas de una region de la secuencia en un solo paso). En este caso el con-
trolador sigue estabilizando el sistema, pero el desempe no del sistema podra empeorar.
Para evitar esto, la restriccion estabilizante se puede sustituir por
x(k + 1[k)
i
W
siendo i tal que x
k

i+1

i
.
Propiedad 8.12 El controlador propuesto tiene las siguientes propiedades:
(i) El controlador obtenido eliminando las restricciones sobre los estados x(k+j[k)
X del problema de optimizacion tambien estabiliza el sistema de forma admisible,
es decir, satisfaciendo las restricciones.
(ii) El controlador estabiliza el sistema para cualquier funcion de coste.
(iii) El dominio de atraccion tan solo depende de la secuencia
i
.
(iv) Si el procedimiento Q
ap
() = Q(), entonces el dominio de atraccion es

X
N
r
=
S
N
r
(X, ).
(v) El controlador estabiliza el sistema con el mismo dominio de atraccion para
cualquier horizonte de control N 1.
(vi) El controlador estabiliza el sistema con el mismo dominio de atraccion ante
cualquier solucion suboptima del problema de optimizacion.
Por lo tanto, la secuencia de invariantes de control robustos sirven para garantizar
la estabilidad del controlador, y en consecuencia, determinar el dominio de atraccion
del mismo. El horizonte de control, el coste a optimizar y la optimalidad de la solucion
tan solo afecta al comportamiento del sistema controlado. As, el horizonte de control
y por ende el n umero de variables de decision, se puede jar en funcion del coste
computacional en lnea que es admisible para que el tiempo de calculo del controlador
no supere el periodo de muestreo.
8.6. Ejemplos
8.6.1. El sistema de Scokaert y Mayne
Se va aplicar la tecnica propuesta al ejemplo utilizado en (Scokaert & Mayne 1998),
con el que se ilustro anteriormente la necesidad de la formulaci on en bucle cerrado.
Considerese el sistema lineal incierto dado por
x
k+1
= x
k
+ u
k
+ w
k
siendo x
k
IR el estado del sistema, u
k
la actuacion sobre el mismo y w
k
las incer-
tidumbres del sistema. El estado del sistema esta restringido a
x
k
[1,2, 2]
mientras que la actuacion no esta acotada. Las incertidumbres del sistema son
w
k
[1, 1]
230 8.6. Ejemplos
El conjunto = x [1, 1] es un conjunto invariante robusto del sistema controlado
con una ley de control u
k
= x
k
. La secuencia de invariantes de control robustos
esta nitamente determinada en un solo paso, de forma que
1
= X.
Basandose en la secuencia de invariantes se aplica el controlador propuesto con
horizonte de control N = 3 y coste de etapa L(x, u) = x
2
+ u
2
sin funcion de coste
terminal. El controlador se aplica en las situaciones ilustradas en (Scokaert & Mayne
1998, Bemporad, Borrelli & Morari 2001), con una perturbacion w
k
= 1/k y con otra
w
k
= cos(k/5). En las guras 8.2 y 8.3 se muestran las evoluciones del sistema en
ambas situaciones, que como era de esperar, estabilizan el sistema en un solo paso.
0 2 4 6 8 10 12 14 16 18 20
1
0.5
0
0.5
1
1.5
2
2.5
muestras
0 2 4 6 8 10 12 14 16 18 20
1.5
1
0.5
0
0.5
x
x
Figura 8.2: Evolucion del sistema con w
k
= 1/k,partiendo de x
0
= 2 y x
0
= 1,2.
0 5 10 15 20 25 30 35 40
1.5
1
0.5
0
0.5
1
1.5
2
sample time
x
k
Figura 8.3: Evolucion del sistema con w
k
= cos(k/5) y x
0
= 2.
En este apartado se aplica la estrategia presentada al ejemplo del reactor (CSTR)
utilizado a lo largo de esta tesis. En captulos anteriores se han dise nado controladores
robustos basados en la formulacion en bucle abierto del mismo. En este caso se va
a sintonizar un controlador basado en invariantes de control robustos para lo cual es
necesario partir de un conjunto invariante robusto. Como tal se va a tomar el utilizado
en el ejemplo del captulo anterior, el cual para un controlador local
K =
_
1,5488 3,4658
_
admite unas incertidumbres
w
1

_
810
3
, 6,510
3
_
w
2

_
8,510
2
, 1,210
2
_
A partir de este conjunto se debe calcular la secuencia de invariantes de control
robustos. Para ilustrar la satisfaccion robusta de las restricciones, se van a considerar
unas restricciones sobre los estados mas exigentes, de forma que
x
1
[0,2, 0,2]
Para el calculo de la secuencia se ha seguido el algoritmo propuesto dando lugar a
los conjuntos que se muestran en la gura 8.4.
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
1.2
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
6
Figura 8.4: Secuencia de 6 conjuntos invariantes de control del reactor.
Para ilustrar la forma en que los invariantes de control introducen informacion del
comportamiento del sistema en bucle cerrado, se muestra en la gura 8.5 la evoluci on
232 8.6. Ejemplos
de varias realizaciones de incertidumbres aleatorias considerando la restriccion estabi-
lizante. En esta se puede comprobar que la evoluci on es siempre admisible a pesar de
las incertidumbres.
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
1
0.8
0.6
0.4
0.2
0
0.2
x
2
x
1
Figura 8.5: Evolucion del sistema para un gran n umero de realizaciones de las incertidum-
bres.
En la gura 8.6 se muestra las trayectorias del sistema incierto en bucle cerrado.
Como ponderacion en el controlador se han tomado las mismas matrices de ponderacion
anteriormente citadas y se ha tomado un coste terminal cuadratico dado por la matriz
P. El horizonte de control considerado ha sido N
c
= 1 y el de prediccion N
p
= 1. Para
la simulaci on se ha considerado incertidumbres aditivas sobre el sistema aleatorias, de
ah el comportamiento erratico del sistema una vez ha alcanzado el invariante robusto.
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
1.2
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
x
2
x
1
x
2
x
1
Figura 8.6: Trayectorias del sistema en bucle cerrado con incertidumbres aleatorias.
Para mostrar la satisfaccion robusta de las incertidumbres se muestra la evolucion
del sistema considerando las incertidumbres extremas constantes. En el caso (a) se
considera w
1
= 810
3
y w
2
= 8,510
2
. En el caso (b) se considera w
1
= 6,510
3
y w
2
= 1,210
2
. En la gura 8.7 se muestran ambos casos y se puede comprobar que
existen situaciones en las que las restricciones se mantienen a pesar de las incertidum-
bres.
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
1
0.8
0.6
0.4
0.2
0
0.2
x
1
x
2
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
1.2
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
(a) (b)
Figura 8.7: Trayectorias del sistema en bucle cerrado con incertidumbres mnimas y maxi-
mas.
En la gura 8.8 se muestra la evoluci on del sistema en el caso (b) en el estado
proximo a la violacion de las restricciones.
0 5 10 15 20 25 30 35
0.1
0.15
0.2
x
1
0 5 10 15 20 25 30 35
0.4
0.2
0
x
2
0 5 10 15 20 25 30 35
1
0
1
2
3
muestras
u
Figura 8.8: Satisfaccion de las restricciones en la evolucion del sistema en bucle cerrado.
A continuaci on se van a ilustrar ciertas propiedades del controlador propuesto.
234 8.6. Ejemplos
Como se comento anteriormente, la restriccion
x(k + 1[k)
0
W
garantiza la estabilidad del sistema, pues fuerza al sistema a permanecer en el invariante
robusto. Sin embargo esta restriccion por s sola puede no ofrecer un comportamiento
satisfactorio, si se compara con el que tendra el controlador conmutando a la ley de
control local. En la gura 8.9 se muestra la evoluci on del sistema en bucle cerrado en el
caso de incertidumbres que decaen con el tiempo. La evoluci on representada mediante
una lnea con puntos corresponde con la del sistema en bucle cerrado conmutando al
controlador local lineal una vez ha alcanzado la region terminal. En lnea con cruces
se muestra la evoluci on del controlador optimo sin conmutar. En ambos casos no se
a nade al funcional la funcion de coste terminal y se considera N
c
= 1.
Como se puede observar, el controlador local conduce el sistema al origen, mientras
el controlador optimo mantiene el sistema en el invariante pero de forma no deseable.
Este efecto se debe a que la actuacion obtenida no es estabilizable asintoticamente,
pues no se considera la ponderacion en el estado terminal. Si se a nade esta, entonces el
controlador MPC nominal es estabilizante en la region terminal y, dada la robustez in-
herente del MPC, estabiliza asintoticamente al sistema con incertidumbres que decaen.
Esto se muestra en la misma gura, en lnea con crculos.
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
1
0.8
0.6
0.4
0.2
0
0.2
x
1
x
2
Figura 8.9: Inuencia del coste terminal en el sistema en bucle cerrado: lnea con pun-
tos: MPC dual, lnea con cruces: MPC no dual, lnea con crculos: MPC no dual con coste
terminal.
En los ejemplos anteriores, el controlador estabiliza el sistema con un horizonte de
control N
c
= 1. Sin embargo, la consideracion de horizontes mayores mejora el de-
sempe no y la optimalidad del controlador, a costa de un mayor coste computacional.
En la gura 8.10 se muestra la evoluci on del sistema incierto, considerando las incer-
tidumbres maximas, para ciertos valores de los horizontes.
0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0.2
1.2
1
0.8
0.6
0.4
0.2
0
0.2
0.4
x
1
x
2
Figura 8.10: Inuencia del horizonte de control y de prediccion sobre el sistema en bucle
cerrado
Los resultados obtenidos se resumen en la siguiente tabla:
Tipo de lnea N
c
N
p
J
MPC
puntos 1 1 60.38
cruces 3 3 52.61
crculos 3 10 45.91
siendo J
MPC
el coste de la trayectoria en bucle cerrado.
Como se puede observar, la estabilidad de la evoluci on del sistema esta siempre
garantizada, sin embargo, el incremento de los horizontes de prediccion mejoran el de-
sempe no del sistema, a pesar de que las incertidumbres no se consideran en el funcional
a optimizar. Esto se puede comprobar observando el coste asociado a la evolucion del
sistema en bucle cerrado J
MPC
para cada uno de los casos.
La incorporacion de la restriccion terminal tambien mejora el desempe no del sis-
tema en bucle cerrado, pero para ello los horizontes deben ser tales que garanticen la
factibilidad inicial del sistema.
8.7. Conclusiones
En este captulo se ha abordado el control predictivo robusto en bucle cerrado. A
partir de un ejemplo ilustrativo se pone de maniesto que la necesidad de la formulaci on
del controlador en bucle cerrado esta basicamente motivada por la perdida de dominio
de atraccion de los controladores en bucle abierto. Este problema se debe a la forma
en la que se realiza la prediccion: sin considerar la realimentaci on del sistema. As,
considerando como variables de decision leyes de control, en vez de actuaciones, se
formula el MPC en bucle cerrado.
A continuaci on se analiza la estabilidad de los controladores en bucle cerrado desde
la programacion dinamica. A partir de esta, se demuestra la estabilidad del MPC
min-max en bucle cerrado para incertidumbres que decaen con el estado, siguiendo
la demostracion de (Mayne 2001). Este analisis se extiende al caso de sistemas con
incertidumbres acotadas incorporando el concepto de estabilidad entrada a estado, lo
cual es un resultado novedoso.
Este analisis sirve ademas de base para probar que la estabilidad robusta del contro-
lador se puede transformar en una restriccion estabilizante. Por tanto, la factibilidad de
dicha restriccion garantiza la estabilidad robusta. Esto permite volver a la formulaci on
en bucle abierto, a costa de un peor desempe no.
La restriccion estabilizante se basa en la determinacion del conjunto estabilizable
robusto en i pasos, lo cual es practicamente imposible salvo en sistemas lineales con
incertidumbres aditivas o politopicas (Kerrigan 2000). Por ello, se propone un contro-
lador MPC robusto basado en una secuencia de invariantes robustos de control, mas
sencilla de calcular. Este controlador garantiza estabilidad robusta con las ventajas del
bucle abierto y las del bucle cerrado: permite reducir el conservadurismo del contro-
lador sin apenas incremento del coste computacional en lnea. El dominio de atraccion
del controlador propuesto puede llegar a ser igual que el de la formulaci on en bucle
cerrado, y el controlador presenta unas caractersticas interesantes, como que estabiliza
para todo horizonte de control N
c
1, entre otras.
Este controlador es uno de los controladores MPC originales propuestos en esta
tesis.
Captulo 9
Conclusiones y futuras lneas de
investigaci on
9.1. Conclusiones y aportaciones originales
En esta tesis se ha abordado el analisis y el dise no de controladores MPC para
sistemas no lineales sujetos a restricciones. Todo ello se ha llevado a cabo siguiendo
un hilo argumental: la garanta de estabilidad del sistema controlado. La teora de
Lyapunov y la teora de conjuntos invariantes han sido el soporte teorico del analisis,
as como de las pruebas de estabilidad realizadas a lo largo de la tesis.
El desarrollo de la tesis se puede distinguir en tres partes diferenciadas: comienza
con el analisis y dise no de nuevos controladores MPC que garantizan la estabilidad en
ausencia de incertidumbres. A continuacion se analiza la robustez de los controladores
MPC nominales, incorporando un nuevo enfoque: la estabilidad entrada a estado. La
tercera y ultima parte constituye el dise no de nuevos controladores robustos que garan-
tizan la estabilidad en presencia de incertidumbres, tanto en la formulacion en bucle
abierto como en bucle cerrado. A continuacion se detallan las aportaciones realizadas
en esta tesis en cada una de las tres partes citadas:
Dise no de controladores con estabilidad garantizada :
Partiendo del analisis de estabilidad de la formulaci on general del MPC, se han
propuesto dos controladores originales: El controlador MPC con horizonte de
prediccion mayor que el de control, y el controlador MPC con coste terminal
cuasi-innito. El controlador con mayor horizonte de prediccion es una gene-
ralizacion del trabajo previo (Magni, De Nicolao, Magnani & Scattolini 2001)
237
238 9.1. Conclusiones y aportaciones originales
a la formulaci on general del MPC. Este controlador soluciona problemas de la
formulacion original, conserva sus propiedades y a nade otras nuevas que este no
tena. Por otro lado, el controlador con coste cuasi-innito surge como solucion a
los problemas que presenta el controlador propuesto en (De Nicolao et al. 1998).
Se ha analizado ademas el desempe no de estos controladores, demostrandose que
lo mejoran sin un incremento apreciable del coste computacional del controlador.
Con el objetivo de mejorar la implementacion de los controladores MPC, se anali-
zan la suboptimalidad de las soluciones y la eliminacion de la restriccion terminal
en el problema de optimizacion. El analisis de la estabilidad del MPC suboptimo
se hace desde la perspectiva de la teora de conjuntos invariantes y se estable-
cen condiciones mas suaves que las consideradas en (Scokaert et al. 1999, Mayne
et al. 2000). Por otro lado, se establecen condiciones bajo las cuales se puede elim-
inar la restriccion terminal del problema de optimizacion de los controladores
MPC, extendiendo resultados anteriores (Parisini & Zoppoli 1995, Jadbabaie
et al. 2001) al MPC general. Ademas se ha caracterizado un dominio de atrac-
cion de este controlador. Estos resultados, as como los derivados del aumento del
dominio de atraccion caracterizado ha dado lugar al artculo (Limon Marruedo
et al. 2003), que esta pendiente de revision.
A continuaci on se analiza un aspecto importante de los controladores predictivos:
el dominio de atraccion y medidas para aumentarlo. Se parte de un analisis del
dominio de atraccion mediante la teora de conjuntos invariantes. Tambien se de-
muestra utilizando la teora de conjuntos invariantes que todo estado estabilizable
puede ser estabilizado por un controlador MPC con horizonte nito.
A la luz de este analisis se proponen procedimientos de sintonizacion y nuevos
controladores MPC orientados a aumentar el dominio de atraccion del contro-
lador MPC general. Se demuestra que la ponderacion del coste terminal o bien la
incorporacion del coste cuasi-innito pueden aumentar el dominio de atraccion.
Por otro lado, los nuevos controladores propuestos se basan en la consideracion de
una region terminal contractiva: uno contrayendo un conjunto invariante positivo
y otro basado en una secuencia de invariantes de control. Este ultimo controlador
ha sido publicado en (Limon Marruedo,

Por ultimo, se proponen medidas para aumentar el dominio de atraccion del
controlador sin restriccion terminal: partiendo de la region caracterizada anteri-
ormente, se muestran procedimientos para aumentarlo, entre los que destacan:
la ponderacion del coste terminal y la consideracion de un mayor horizonte de
prediccion.
Analisis de la robustez de los controladores MPC :
La garanta de estabilidad de los controladores MPC esta basada en la ausencia
de incertidumbres, hipotesis que es una idealizacion, pues todo sistema dinamico
discrepa en mayor o menor medida, del modelo que lo describe. Por lo tanto, es
imprescindible realizar un analisis del grado de incertidumbres del sistema que es
capaz de soportar los controladores predictivos garantizando la estabilidad. Este
Captulo 9. Conclusiones y futuras lneas de investigacion 239
analisis se debe realizar desde dos aspectos: la convergencia y la satisfaccion de
las restricciones.
Partiendo de la teora de Lyapunov, se analiza la estabilidad robusta de con-
troladores MPC aplicados sobre sistemas con incertidumbres aditivas acotadas.
Este estudio es una generalizacion de (Scokaert et al. 1997) y ha sido publicado
en (Limon Marruedo,

Alamo & Camacho 2002c). Este analisis se extiende incor-
porando el concepto de estabilidad entrada a estado, no utilizado anteriormente
en este contexto. De este analisis se inere un resultado interesante: la suavidad
del coste optimo garantiza la robustez del controlador.
La satisfaccion de las restricciones esta ntimamente unida con el concepto de
invariancia robusta. Por ello su analisis se hace incorporando conceptos de la
teora de conjuntos invariantes robustos.
Por ultimo, basandose en el analisis de continuidad del coste optimo realizado en
el apendice C, se demuestra que el controlador MPC sin restriccion terminal es
robusto, pues esta garantizada la suavidad del coste optimo.
Dise no de controladores MPC robustos :
Del analisis anterior se pone de maniesto que la suavidad del coste optimo es
condicion suciente para garantizar la estabilidad entrada estado del controlador,
y por lo tanto su robustez. Sin embargo, la funcion de coste de un controlador
predictivo no tiene por que ser suave.
Basandose en la acotacion del efecto de las incertidumbres sobre el sistema, se
propone un controlador MPC que garantiza la satisfaccion robusta de las restric-
ciones y ademas la estabilidad entrada a estado bajo condiciones de suavidad del
modelo y de las funciones implicadas en el problema de optimizacion. Estos resul-
tados estan en periodo de revision (Limon Marruedo,

Un problema asociado a la acotacion del efecto de las incertidumbres necesaria
para la robustez es su conservadurismo, derivado en parte del caracter global
de esta. Para mitigar este efecto, se propone el concepto de region de evoluci on
incierta. Estas regiones son acotaciones del efecto de las incertidumbres que se
calculan en lnea por alg un procedimiento adecuado, como puede ser el algebra
intervalar. De esta forma se propone un nuevo controlador MPC que incorpora
en su formulacion estas regiones. Este controlador se formula como controlador
dual y no dual. La estabilidad robusta y la satisfaccion de las restricciones estan
garantizadas bajo la factibilidad del problema. Estos resultados han dado lugar
a la publicacion (Limon Marruedo, Bravo,

Los controladores robustos propuestos anteriormente se engloban dentro de los
denominados, controladores MPC en bucle abierto, pues no consideran el efecto
de la realimentaci on del sistema sobre la prediccion del comportamiento futuro del
sistema. Esto hace que puedan incurrir en un alto grado de conservadurismo, por
lo que se han propuesto en la literatura los denominados controladores MPC en
bucle cerrado. Por ello se hace un analisis de la estabilidad de estos controladores
240 9.2. Futuras lneas de investigacion
en su formulaci on min-max basado en (Mayne 2001). Este estudio se ha extendido,
estableciendo condiciones para garantizar la estabilidad entrada a estado de los
controladores min-max cuando el sistema presenta incertidumbres acotadas.
Estos controladores, si bien resultan menos conservadores, su implementaci on es
tan costosa que no resultan practicos (por ahora). Como una posible solucion a
este problema se propone un nuevo controlador hbrido entre la formulaci on en
bucle abierto y la formulaci on en bucle cerrado. Para ello se analiza el origen de
la estabilidad robusta de los controladores en bucle cerrado a la luz de la teora
de conjuntos invariantes y se demuestra que se puede convertir en una restriccion
estabilizante a imponer sobre un controlador MPC estandar. De esta forma se
conserva la facilidad de implementaci on del bucle abierto, manteniendo el mismo
dominio de atraccion del controlador en bucle cerrado.
Esta restriccion estabilizante se basa en el conjunto estabilizable robusto, el cual
es difcil de calcular con exactitud salvo para el caso de sistemas lineales con
incertidumbres aditivas o politopicas. Por ello se propone un nuevo controlador
MPC con una restriccion estabilizante basada en el calculo de una secuencia de
invariantes robustos de control, mas sencilla de obtener.
Es importante resaltar que todo el analisis llevado a cabo en esta tesis se basa en la
teora de Lyapunov conjugada con la teora de conjuntos invariantes. El enfoque de la
estabilidad de sistemas no lineales con restricciones a la luz de ambas teoras permiten
una comprension profunda del problema y dan una amplia perspectiva en el analisis y en
el dise no de controladores predictivos. Por ello se ha tratado de recoger en el apendice A
un conjunto de resultados sobre la estabilidad de sistemas no lineales discretos sujetos
a restricciones. Para ello se han desarrollado algunos resultados (Vidyasagar 1993) y
se han extendido otros, como los relativos a las funciones de control de Lyapunov.
En el apendice C se muestra un estudio de la continuidad del coste optimo basado
en el analisis de sensibilidad del problema de optimizacion, propiedad interesante para
la robustez del controlador.
9.2. Futuras lneas de investigaci on
Las caractersticas del control predictivo y el rapido avance que se ha experimen-
tado recientemente en aspectos teoricos como estabilidad y robustez, hacen que esta
estrategia tenga un futuro prometedor. Sin embargo, quedan temas abiertos en los que
trabajar, principalmente orientados a la implementaci on.
En esta tesis se ha estudiado con profundidad la estabilidad y robustez de los
controladores predictivos y se han adquirido conocimientos que serviran de base para
Captulo 9. Conclusiones y futuras lneas de investigacion 241
el analisis de aspectos del control predictivo no abordados en la misma o bien que han
quedado abiertos. Entre ellos se pueden destacar:
La implementacion de los controladores propuestos y analizados en esta tesis.
Para ello, se esta dise nando una planta de laboratorio formada por 4 depositos
interconectados y dotada de instrumentaci on industrial. Esta planta esta orien-
tada principalmente a la utilizacion de controladores predictivos no lineales en
espacio de estados y permite ser congurada para explotar distintos aspectos co-
mo son: control multivariable, presencia de ceros de transmision, incorporacion
de se nales logicas, posibilidad de subactuacion y sobreactuacion sobre el sistema.
Implementaciones de controladores MPC rapidos como son controladores sin res-
triccion terminal, suboptimos y con restricciones blandas en los estados. Para ello
se pueden utilizar algoritmos de optimizacion no lineal como son los algoritmos
geneticos, que se han probado en aplicaciones de control predictivo de robots
moviles con bastante exito.
Estudiar y analizar la formulacion del control predictivo para seguimiento de
referencias. Esto conlleva dos aspectos distintos: la formulaci on del controlador
en entrada-salida (con la posible incorporacion de observadores) y la estabilidad
y satisfaccion de restricciones ante cambios en la referencia.
La incorporacion de invariantes de control en el dise no de controladores pre-
dictivos es, a juicio del autor, una idea prometedora, pues permite incorporar
conocimiento del sistema sobre el que se va aplicar el controlador en la propia
formulaci on del mismo. El procedimiento de calculo de estos conjuntos es geo-
metrico y se basa en la determinacion del conjunto a un paso Q(). En el caso
de sistemas no lineales, interesa trabajar en procedimientos que mejoren los pro-
puestos en esta tesis para el calculo de estos de una forma aproximada.
Consideracion de incertidumbres estructuradas en el analisis de robustez de los
controladores.
Estudio de la formulacion simultanea del controlador: la ruptura de la composi-
cion sucesiva que conlleva esta formulacion, mejora el condicionamiento del pro-
blema y permite explotar propiedades como anidad del modelo con respecto a
los parametros.
242 9.2. Futuras lneas de investigacion
Apendice A
Estabilidad y robustez de sistemas
no lineales en tiempo discreto
A.1. Introduccion
Esta tesis se centra en el analisis y el dise no de controladores predictivos de sistemas
no lineales en tiempo discreto sujetos a restricciones. En esta se contemplan tanto
sistemas sin incertidumbres como sistemas inciertos y todo ello con un nexo de union:
la garanta de estabilidad.
Ya sea por la naturaleza no lineal del modelo del sistema o por la presencia de
restricciones, los sistemas que se estudian son no lineales. La teora de Lyapunov pro-
porciona un marco adecuado para el analisis de la estabilidad de sistemas no lineales
autonomos. De hecho, el analisis de la estabilidad de los controladores predictivos se
suele realizar mediante esta teora (Mayne et al. 2000).
La teora de Lyapunov se extiende a sistemas no autonomos gracias a la denominada
funcion de Lyapunov de control (CLF
1
). En este apendice se presenta una recopilacion
de esta teora formulada para el caso de sistemas en tiempo discreto.
Intimamente relacionada con esta teora esta el concepto invariancia positiva de

un conjunto en relacion a un sistema autonomo (en bucle cerrado, por ejemplo). Este
concepto se extiende a sistemas no autonomos incorporando el concepto de invariancia
de control, alrededor del cual se desarrolla la teora de conjuntos invariantes. Esta
teora da soporte al analisis de regiones estabilizables, dominios de atraccion, etc. y es
1
Acronimo del termino ingles Control Lyapunov Function.
243
244 A.2. Estabilidad de sistemas no lineales en tiempo discreto
de suma utilidad en el analisis de sistemas con restricciones. Esta teora, ademas de ser
una potente herramienta de analisis, puede ser utilizada en la sntesis de controladores.
Todo ello hace de la teora de conjuntos invariantes un campo que, a juicio del autor, va
a tener un protagonismo cada vez mayor en el area del control. Como referencia tomese
el artculo, (Mayne 2001), que resume la sesion plenaria del ECC del a no 2000, en la
cual D. Q. Mayne hace un enfoque de la estabilidad y robustez del MPC introduciendo
conceptos de la teora de conjuntos invariantes.
En este apendice se presenta ademas un balance de resultados en el campo de la
teora de conjuntos invariantes de sistemas en tiempo discreto. Entre las publicaciones
dentro de esta teora cabe destacar (Blanchini 1999), en el que se presentan resultados
en este campo, y los trabajos de E. C. Kerrigan (Kerrigan & Maciejowski 2000, Kerrigan
2000) en los que se hace un balance de esta teora con una notacion y nomenclatura
muy consistente, que es la que se ha adoptado en esta tesis.
En el caso de que los sistemas presenten incertidumbres, la teora de Lyapunov
se extiende de una manera natural a la denominada estabilidad entrada a estado.
Esta teora ofrece un marco teorico para el analisis de estos sistemas, dentro del cual
se enmarcan el analisis y dise no de controladores predictivos para sistemas inciertos
desarrollados en esta tesis. Junto a esta se extiende tambien el concepto de invariancia
robusta, que se desarrolla en la teora de conjuntos invariantes robustos.
A.2. Estabilidad de sistemas no lineales en tiempo
discreto
Sea un sistema dinamico autonomo en tiempo discreto dado por
x
k+1
= F(x
k
)
siendo x
k
IR
n
el estado del sistema en el instante k y la funcion F : IR
n
IR
n
una
funcion continua. En lo que sigue se va a considerar siempre que k es un n umero entero
no negativo, es decir, que el tiempo discurre hacia delante.
Un estado x
o
se dice que es un punto de equilibrio del sistema (tambien denominado
punto jo) si
x
o
= F(x
o
)
es decir, si el sistema, una vez que alcanza ese estado, permanece en el.
En adelante, y sin perdida de generalidad, se considera que el origen es un punto
de equilibrio del sistema
2
.
2
Basta con hacer el cambio de variables z = x x
o
para trasladar el punto de equilibrio al origen.
Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 245
A.2.1. Deniciones previas
Antes de introducir el concepto de estabilidad, se va a denir un tipo de funciones
muy utiles en la teora de estabilidad (Khalil 1996, Vidyasagar 1993).
Denicion A.1 (Funciones / , /
y /L )
Una funcion : IR
+
IR
+
se dice que es una funcion / si:
Es una funcion continua.
Es estrictamente creciente, es decir: si a > b, entonces (a) > (b).
(0) = 0.
Una funcion : IR
+
IR
+
se dice que es una funcion /
si es una funcion
/ y ademas
(a) cuando a .
Una funcion : IR
+
IR
+
IR
+
se dice que es una funcion /L si
La funcion (a, k) es una funcion / en a para todo k 0 jo.
La funcion (a, k) es decreciente en k para todo a 0 jo, de forma que
(a, k) 0 cuando k .
Estas funciones tienen una serie de propiedades muy utiles. A continuacion se pre-
senta una recopilacion de algunas de ellas.
Propiedad A.2 (Propiedades de las funciones / , /
y /L )
(i) Sean
1
() y
2
() funciones / denidas en [0, a).
(ii) Sean
3
() y
4
() funciones /
.
(iii) Sea (, ) una funcion /L .
Entonces:
Notese que esto hace que la funcion que describe el sistema pueda depender del punto de equilibrio,
variando esta si dicho punto cambia.
La funcion inversa
1
1
() es una funcion / denida en [0,
1
(a)).
La funcion inversa
1
3
() es una funcion /
.
La composicion de dos funciones / ,
1

2
, es una funcion / .
La composicion de dos funciones /
,
3

4
, es una funcion /
.
La composicion de una funcion / con una /L ,
1
, es una funcion /L .
La funcion
5
(s) = max(
1
(s),
2
(s)) es una funcion / .
Dada una funcion /
,
3
(), existe una funcion /
,
6
(), asociada tal que

6
(s)
3
(s) para todo s 0.
La funcion
7
(s) = s
6
(s) es una funcion / , es decir
6
(s) < s para
todo s > 0.
Tambien resulta de interes introducir el concepto de funcion denida positiva
Denicion A.3 (Funci on denida positiva) Una funcion V : IR
n
IR
+
se dice
que es (localmente) denida positiva si existe una funcion / , () tal que
(|x|) V (x)
para todo x B
r
= x IR
n
: |x| r.
Si esta condicion se extiende a IR
n
, entonces se denomina globalmente denida
positiva.
Si la funcion V () es globalmente denida positiva y ademas existe una funcion ()
que es /
, entonces se dice que es radialmente no acotada. En este caso se verica

que V (x) cuando |x| .
Lema A.4 (Khalil 1996) Sea una funcion V : IR
n
IR
+
continua y denida positiva
en B
r
, entonces existe una funcion / () denida en [0, r] tal que
V (x) (|x|)
para todo x B
r
.
Si ademas V () es radialmente no acotada, entonces () puede ser /
.
A.2.2. Estabilidad de un sistema
A continuacion se denen los conceptos de estabilidad de un sistema en el origen
(Vidyasagar 1993).
Denicion A.5 (Estabilidad) Un sistema x
k+1
= F(x
k
) se dice que es estable en el
origen (o bien que el origen es un punto de equilibrio estable) si para todo > 0 existe
una constante = () tal que
x
0
: |x
0
| |x
k
| k 0
En consecuencia un sistema es estable si para una cota del sistema dada existe
una vecindad del origen tal que si el sistema parte de ella, este evoluciona acotado por
. Esta condicion esta relacionada con cierta robustez del sistema en torno al punto
de equilibrio, pues garantiza que una variaci on peque na de la cota del estado inicial,
supone una variaci on peque na de la cota en la evoluci on del sistema.
Denicion A.6 (Estabilidad asint otica) Un sistema x
k+1
= F(x
k
) se dice que es
asintoticamente estable en el origen si es estable y ademas existe una constante > 0
tal que
x
0
: |x
0
| x
k
0 cuando k
o lo que es equivalente, que existe una funcion /L (, ) tal que
|x
k
| (|x
0
|, k)
para todo k 0 y para todo x
0
tal que |x
0
| .
La denicion de estabilidad asintotica consta de dos partes: que el sistema sea
estable y ademas que tienda asint oticamente al origen. Puede caber la duda de si la
tendencia del sistema al origen implica que el sistema sea estable. Sin embargo no es
as, pues puede existir un sistema tal que para una vecindad del origen arbitrariamente
peque na, existen estados tales que si el sistema parte de ellos, este evoluciona saliendose
de esta vecindad, para posteriormente tender al origen asint oticamente. Por lo tanto, el
sistema no es estable pero s tiende al origen asintoticamente. Para mas detalles, vease
la discusion sobre el tema y su ejemplo de la pagina 141 de (Vidyasagar 1993).
Denicion A.7 (Estabilidad exponencial) Un sistema x
k+1
= F(x
k
) se dice que
es exponencialmente estable en el origen si es asintoticamente estable y ademas existen
unas constantes > 0, a > 0 y [0, 1) tal que
|x
k
| a|x
0
|
k
para todo k 0 y para todo x
0
tal que |x
0
| .
Como se puede observar, la diferencia entre estabilidad asintotica y exponencial,
es la existencia de una funcion /L que acota el sistema tal que tiene una expresion
exponencial
(|x
0
|, k) = a|x
0
|
k
Todas las deniciones de estabilidad anteriormente presentadas se formulan para
una vecindad del origen B
= x IR
n
: |x| . Se dice en ese caso que el sistema
es estable localmente. En el caso en el que dichas deniciones se puedan extender a
todo IR
n
entonces se dice que el sistema es globalmente estable.
A.2.3. Teora de Lyapunov
Esta teora establece condiciones sucientes para garantizar la estabilidad de un
sistema y esta basada en la existencia de una funcion del estado denida positiva
asociada al sistema denominada funcion de Lyapunov. Bajo ciertas hipotesis sobre
esta funcion se puede demostrar estabilidad, estabilidad asintotica o exponencial. As,
existe un teorema de estabilidad de Lyapunov asociado a cada tipo de estabilidad
(Vidyasagar 1993).
Antes de establecer los teoremas de estabilidad resulta util la siguiente denicion:
Denicion A.8 Sea una funcion V : IR
n
IR
+
asociada a un sistema dinamico
x
k+1
= F(x
k
)
siendo x
k
IR
n
el estado del sistema en el instante k. Entonces se dene
V (x) = V (F(x)) V (x)
Teorema A.9 (Estabilidad)
(i) Sea un sistema dinamico en tiempo discreto dado por
x
k+1
= F(x
k
)
siendo x
k
IR
n
el estado del sistema en el instante k y tal que el origen es un
punto de equilibrio.
(ii) Sea una funcion V : IR
n
IR
+
denida positiva tal que
Existen dos funciones /
1
() y
2
() tales que
1
(|x|) V (x)
2
(|x|)
Satisface la condicion
V (x) 0
para todo x B
r
3
.
Entonces el origen es un punto de equilibrio estable del sistema. Si estas condiciones
se extienden a IR
n
entonces es globalmente estable
4
.
A la funcion V (x) denida positiva que satisface las condiciones de este teorema se
denomina funcion de Lyapunov asociada al sistema x
k+1
= F(x
k
). As, el teorema an-
terior se puede reescribir como: un sistema es estable si tiene una funcion de Lyapunov
asociada.
Por el lema A.4, la condicion
V (x)
2
(|x|)
se satisface si la funcion denida positiva V (x) es continua.
La estabilidad de Lyapunov esta ntimamente ligada al concepto de invariancia
positiva.
Denicion A.10 (Conjunto invariante positivo) Un conjunto IR
n
se dice
que es un conjunto invariante positivo, si para todo x
0
, la evolucion del sistema es
tal que x
k
para todo k 0.
Por tanto, si un sistema en su evoluci on alcanza un invariante positivo, entonces la
evolucion del sistema permanecera en dicho conjunto.
La estabilidad de Lyapunov se deriva del hecho que V (x) es negativa, y por lo
tanto la secuencia de valores V (x
k
) es decreciente en toda trayectoria que no salga de
B
r
, por lo que V (x
k
) V (x
0
) para todo k. Se puede comprobar que todo conjunto
= x IR
n
: V (x)
3
En adelante se denotara B
r
como la vecindad del origen x IR
n
: |x| r.
4
En lo que sigue, la estabilidad se considera local, es decir, en una vecindad del origen, salvo que
se indique lo contrario.
siendo
1
(r), es un conjunto contenido en B
r
, pues para todo x ,
1
(|x|) V (x)
1
(r)
y por lo tanto |x| r. En consecuencia, B
r
es invariante positivo del sistema,
pues para todo x
0
tal que V (x
0
)
1
(r), se tiene que V (x
k
) V (x
0
)
1
(r),
por lo que x
k
.
Para demostrar la estabilidad hay que probar que para toda cota de la evoluci on
del sistema r, existe un () tal que para todo x
0
B
, resulta que x
k
B
. Esto
se puede demostrar tomando =
1
2
(
1
()). As, para todo x
0
B
se tiene que
V (x
0
)
2
(|x
0
|)
2
() =
1
()
1
(r)
por lo que , con =
1
(), es un invariante positivo contenido en B
r
y que contiene
B
. En consecuencia
1
(|x
k
|) V (x
k
) V (x
0
)
1
()
y por lo tanto x
k
B
, lo que demuestra la estabilidad. Notese que la estabilidad se

basa en la acotacion superior de la funcion de Lyapunov por una funcion / , lo que
garantiza la existencia de la vecindad B
contenida en el invariante . Esta es una

condicion blanda, pues, en virtud del lema A.4, se satisface si la funcion de Lyapunov
es continua en una vecindad del origen.
Es importante resaltar que si la condicion
V (x) 0
se satisface en un conjunto que es un invariante positivo del sistema, entonces
V (x
k
) V (x
0
) para todo x
0
perteneciente al invariante, pues la trayectoria esta con-
tenida en para todo k. Por tanto el sistema es estable en .
Teorema A.11 (Estabilidad asintotica)
x
k+1
= F(x
k
)
siendo x
k
IR
n
n
IR
+
Existen dos funciones / ,
1
() y
2
(), tales que
1
(|x|) V (x)
2
(|x|)
3
(), tal que
V (x)
3
(|x|)
para todo x B
r
.
Entonces el origen es un punto de equilibrio asintoticamente estable del sistema. Si estas
condiciones se extienden a IR
n
y la funcion de Lyapunov es radialmente no acotada,
entonces es globalmente asintoticamente estable.
El sistema es estable, pues se satisface el teorema de estabilidad. Por otro lado, la
condicion de que V (x) sea estrictamente decreciente excepto en el origen, hace que
la secuencia V (x
k
) sea estrictamente decreciente en todo estado de la trayectoria, salvo
en el origen, para todo x
0
perteneciente al conjunto invariante positivo
= x IR
n
: V (x)
1
(r) B
r
Dado que la secuencia de valores V (x
k
) es denida positiva y estrictamente decre-
ciente para todo x ,= 0, entonces, V (x
k
) tiende a 0, cuando k pues de lo contrario,
V (x) lo cual es una contradicci on con el caracter denido positivo de V (). Por
lo tanto x
k
0.
Si la condicion
V (x)
3
(|x|)
se satisface en un conjunto invariante positivo , entonces el sistema es asintoticamente
estable para todo x
0
.
Teorema A.12 (Estabilidad exponencial)
x
k+1
= F(x
k
)
siendo x
k
IR
n
n
IR
+
Existen unas constantes a > 0, b > 0 y > 0
5
tales que
a|x|
V (x) b|x|
Existe una constante c > 0 tal que

V (x) c|x|
para todo x B
r
.
Entonces el origen es un punto de equilibrio exponencialmente estable del sistema. Si
estas condiciones se extienden a IR
n
entonces es globalmente exponencialmente estable.
En este caso la estabilidad asint otica se deriva del teorema anterior, pues una funcion
del tipo a|x|
es una funcion / . Lo unico que hay que demostrar es que el estado se

puede acotar de la forma
|x
k
| |x
0
|
k
siendo > 0 y < 1 .
Para ello basta comprobar que existe una constante [0, 1) tal que
V (F(x)) V (x)
En efecto, haciendo
V (F(x)) V (x) c|x|
= V (x)
c
b
b|x|
_
1
c
b
_
V (x) = V (x)
Para demostrar que [0, 1), observese que
b|x|
V (x) V (x) V (F(x)) c|x|
por lo que que c b. Considerando ademas que b y c son constantes positivas, se tiene
que 0 = 1 c/b < 1. A partir de esta propiedad se deriva que
V (x
k
)
k
V (x
0
) b|x
0
|
k
Dado que a|x
k
|
V (x
k
), se tiene que
|x
k
| |x
0
|
k
siendo
=
_
b
a
_1
=
1
[0, 1)
5
En (Vidyasagar 1993) se impone que > 1, sin embargo en (Scokaert et al. 1997) demuestra que
basta con considerar > 0. El teorema aqu presentado es una sntesis de ambos resultados.
Por ultimo, hay que comentar que, si bien estos teoremas establecen condiciones
sobre la funcion de Lyapunov que son sucientes para garantizar estabilidad, bajo
ciertas condiciones estas condiciones son tambien necesarias. Estos son los denominados
teoremas inversos de Lyapunov (Khalil 1996, Vidyasagar 1993, Scokaert et al. 1997,
Jiang & Wang 2002).
A.2.4. Estabilidad de sistemas con restricciones
Sea un sistema
x
k+1
= F(x
k
)
cuyo estado esta sujeto a las restricciones dadas por
x
k
X
para todo k. Dado que el punto de equilibrio debe ser admisible, por lo que 0 X.
Este tipo de sistemas incluyen el caso de un sistema no autonomo
x
k+1
= f(x
k
, u
k
)
controlado por la ley de control u
k
= h(x
k
), sujeto a restricciones en las actuaciones
u
k
U y en los estados x
k
X. El sistema autonomo resultante de cerrar el bucle es
x
k+1
= f(x
k
, h(x
k
))
sujeto a la restriccion
x
k
X
h
= x X : h(x) U X
El concepto de invariancia es esencial en el analisis de sistemas con restricciones. En
efecto, un sistema autonomo sujeto a restricciones evoluciona de una forma admisible
(es decir cumpliendo las restricciones en todo k) si existe un conjunto invariante positivo
contenido en el conjunto de restricciones X. Por tanto, si x
0
X, entonces, por
ser un conjunto invariante positivo, se tiene que x
k
X para todo k y por lo
tanto la evoluci on del sistema es admisible.
La teora de Lyapunov demuestra que si existe una funcion de Lyapunov V (x) tal
que
V (x) 0
para todo x X, entonces todo conjunto
= x IR
n
: V (x)
contenido en X es un invariante positivo del sistema, y por lo tanto para todo estado
inicial x
0
el sistema satisface las restricciones. Si por el contrario, x
0
X ,
entonces la evolucion del sistema podra no ser admisible.
El conjunto de estados que satisfacen las restricciones sera por lo tanto el maximo
conjunto invariante asociado al sistema contenido en X, que no tiene por que ser X.
A.2.5. Generalizacion a sistemas no autonomos: funciones de
Lyapunov de control
Los resultados de la teora de Lyapunov permiten el analisis de estabilidad de sis-
temas autonomos (que incluye a los sistemas no autonomos en bucle cerrado). Dada
la generalidad de la teora de Lyapunov resulta muy interesante trasladar todos estos
resultados al analisis de sistemas no autonomos. Esto se consigue gracias al concep-
to de funcion de Lyapunov de control introducido por primera vez en (Arstein 1983)
para sistemas continuos. En este trabajo se demuestra que la existencia de una CLF
asociada a un sistema es equivalente a la existencia de un controlador asint oticamente
estabilizable. En (Sontag 1989b), se establece una ley de control general obtenida a
partir de la CLF para sistemas anes en la actuacion. En esta seccion se traslada el
concepto de CLF a sistemas en tiempo discreto.
Sea un sistema no autonomo dado por
x
k+1
= f(x
k
, u
k
)
siendo x
k
IR
n
k
IR
m
las actuaciones aplicadas sobre el
sistema. Sea el origen un punto de equilibrio del sistema, por tanto f(0, 0) = 0.
Las entradas del sistema pueden estar restringidas a un conjunto compacto U que
contiene el origen, de forma que u
k
U en todo instante k.
El concepto de sistema estable denido para sistemas autonomos, se transforma en
estabilizable para un sistema no autonomo. Un sistema es estabilizable si existe una ley
de control tal que estabilice el sistema en bucle cerrado. As se generalizan las distintas
nociones de estabilidad anteriormente denidas.
El concepto de conjunto invariante positivo asociado al caso autonomo se puede
extender al caso de sistemas no autonomos introduciendo el concepto de conjunto
invariante de control.
Denicion A.13 (Conjunto invariante de control) Un conjunto IR
n
se dice
que es un conjunto invariante de control asociado a un sistema
x
k+1
= f(x
k
, u
k
)
siendo x
k
IR
n
y u
k
IR
m
, si para todo x
0
, existe una ley de control u
k
= h(x
k
)
tal que x
k
para todo k 0 y ademas las actuaciones son admisibles u
k
= h(x
k
)
U.
El concepto de funcion de Lyapunov asociado a un sistema autonomo, se puede ex-
tender para el caso de un sistema no autonomo en la denominada funcion de Lyapunov
de control.
Denicion A.14 (Funcion de Lyapunov de Control) Una funcion V : IR
n
IR
+
se dice que es una funcion de Lyapunov de control asociada al sistema
x
k+1
= f(x
k
, u
k
)
siendo x
k
IR
n
, u
k
U IR
m
, si es denida positiva y satisface que
V (x) = mn
uU
_
V (f(x, u)) V (x)
_
0
para todo x B
r
.
Notese que el problema de minimizacion implicado en una funcion de control de
Lyapunov no es difcil de resolver, especialmente en el caso de sistemas anes en las
actuaciones o sistemas sin restricciones en las actuaciones.
La principal diferencia es que la funcion V (x) se dene en terminos de la actuacion,
de forma que si se satisface
mn
uU
_
V (f(x, u)) V (x)
_
0
entonces existe una actuacion admisible asociada a cada estado x
k
(es decir, una ley
de control u
k
= h(x
k
) U) tal que la funcion V (x
k+1
) V (x
k
).
Por lo tanto si un sistema tiene una funcion de Lyapunov de control asociada,
entonces el conjunto acotado V (x) contenido en B
r
es un invariante de control del
sistema y por lo tanto el sistema es estabilizable. Esto permite establecer el siguiente
resultado:
Teorema A.15 Si un sistema no autonomo admite una funcion de Lyapunov de con-
trol asociada al sistema en B
r
, entonces el sistema es estabilizable.
Analogamente se establece el siguiente resultado:
Teorema A.16 Si un sistema no autonomo tiene asociada una funcion de Lyapunov
de control tal que
V (x) = mn
uU
_
V (f(x, u)) V (x)
_
(|x|)
para todo x B
r
, siendo () una funcion / , entonces el sistema es asintoticamente
estabilizable.
Si la condicion anterior se satisface en el conjunto , entonces el sistema sera
asint oticamente estabilizable en una region tal que para todo x excepto
el origen, exista una actuacion admisible u U tal que satisfaga las dos condiciones
siguientes:
(i) V (f(x, u)) V (x) < 0.
(ii) f(x, u) .
es decir, en todos aquellos estados tales que la CLF garantiza convergencia, mantenien-
do la evolucion del sistema en . El conjunto sera por tanto un conjunto invariante
de control.
A.2.5.1. Sistema sujeto a restricciones en el estado
Si el sistema no autonomo esta sujeto a restricciones en el estado del tipo x
k
X,
entonces el sistema sera estabilizable si existe una ley de control admisible tal que
la evoluci on del sistema es admisible, es decir, si discurre en el conjunto X en todo
instante. Esta condicion esta relacionada con el concepto de invariancia de control, pues
un sistema evoluciona de forma admisible si existe un conjunto invariante de control
incluido en X.
Por tanto, si el sistema tiene asociada una funcion de Lyapunov de control en X,
entonces todo conjunto X tal que para todo x excepto el origen, exista una
actuacion admisible u U tal que satisfaga las dos condiciones siguientes:
(i) V (f(x, u)) V (x) < 0.
(ii) f(x, u) .
es un conjunto invariante de control contenido en X en el que, ademas, la CLF es
estrictamente decreciente (en todos los estados salvo el origen). Por lo tanto, para todo
x
0
, existe una ley de control admisible tal que estabiliza asint oticamente el sistema
permaneciendo su evolucion en X, y por lo tanto satisfaciendo las restricciones.
Notese que todo conjunto
= x IR
n
: V (x)
contenido en X es un invariante de control del sistema.
Como se puede comprobar, el concepto de la invariancia de control es esencial en
el analisis de sistemas no autonomos sujetos a restricciones. Todos estos conceptos se
desarrollan y extienden en la llamada teora de conjuntos invariantes que se aborda en
la proxima seccion.
A.3. Teora de conjuntos invariantes
Como se ha podido comprobar, los conceptos tales como conjunto invariante positivo
o conjunto invariante de control son trascendentales en el analisis de la estabilidad de un
sistema dinamico, especialmente cuando el sistema esta sujeto a restricciones. Alrededor
de estos conceptos se ha formado toda una teora que los desarrolla, denominada teora
de conjuntos invariantes.
Existen numerosos trabajos en este campo (Bertsekas 1972, Keerthi & Gilbert 1987,
Bitsoris 1988, Gilbert & Tan 1991), si bien, esta teora ha experimentado un nuevo auge
a raz de los trabajos de Blanchini y otros autores (Blanchini 1994, Kolmanovsky &
Gilbert 1998, Kerrigan & Maciejowski 2000). En (Blanchini 1999) se presenta un com-
pendio de resultados en este campo, tanto en el aspecto teorico como de su aplicacion
al control de sistemas.
En esta seccion se sigue la lnea y notacion utilizada en (Kerrigan & Maciejowski
2000), artculo en el que se hace un balance conciso de los principales resultados en
esta teora y los aplica al analisis de la factibilidad del control predictivo.
En lo que sigue, las deniciones se van a centrar en el caso de sistemas no autonomos.
La traslacion a sistemas autonomos, o bien a sistemas en bucle cerrado, es inmediata.
Sea pues un sistema no autonomo dado por
x
k+1
= f(x
k
, u
k
)
258 A.3. Teora de conjuntos invariantes
siendo x
k
IR
n
k
IR
m
las actuaciones aplicadas sobre el
mismo. Sea el origen un punto de equilibrio del sistema, f(0, 0) = 0. Las entradas del
sistema pueden estar restringidas a un conjunto compacto U IR
m
y el estado del
sistema a un conjunto compacto X IR
n
, ambos contiendo el origen. Por tanto
u
k
U x
k
X
para todo k.
Si el sistema estuviese controlado por una ley de control u = h(x), entonces las
restricciones se transforman en x
k
X
h
= x X : h(x) U.
A partir del concepto de conjunto invariante de control (e invariante positivo), se
extienden estos al analisis de la region en la que un sistema puede ser admisible o
estabilizable. Para ello es necesaria la introduccion de un conjunto basico: el conjunto
a un paso.
Denicion A.17 (Conjunto a un paso) El conjunto a un paso del conjunto , Q(),
es el conjunto de estados x para los cuales existe una actuacion admisible u U
(que dependera del estado x) tal que el sistema alcanza el conjunto en un solo paso
f(x, u) .
Q() = x IR
n
: u(x) U tal que f(x, u)
Esta denicion se puede extender a un sistema controlado por una ley de control
u = h(x) de la siguiente forma
Q
h
() = x IR
n
: h(x) U y f(x, h(x))
En oposicion al conjunto Q(), esta el conjunto de alcance.
Denicion A.18 (Conjunto de alcance) El conjunto de alcance del conjunto ,
1(), es el conjunto de estados x a los cuales puede evolucionar el sistema partiendo
de ante una actuacion admisible u U en un solo paso.
1() = z IR
n
: x , u U tal que z = f(x, u)
A partir de la denicion de conjunto a un paso se puede establecer una condicion
necesaria y suciente para garantizar la invariancia de un conjunto.
Teorema A.19 (Condicion geometrica de invariancia)
Un conjunto es un invariante de control si y solo si
Q()
Notese que esta condicion tiene una interpretaci on geometrica, pues el conjunto
Q() es un conjunto que se calcula por procedimientos geometricos (que requiere la
transformacion de un conjunto a traves de un mapa y proyecci on ortogonal del mismo) y
una vez obtenido, basta con comprobar si contiene al conjunto . Esta interpretacion
geometrica de los conjuntos invariantes es muy util y es la base del calculo de los
conjuntos relacionados con la teora de invariantes, que como se vera, estan todos
basados en el conjunto a un paso Q().
El conjunto a un paso satisface las siguientes propiedad de monotona:
Propiedad A.20 Sean dos conjuntos
1

2
, entonces
Q(
1
) Q(
2
)
A partir del conjunto a un paso, se pueden analizar propiedades del sistema, tales
como la region en la que este es controlable a una determinada region.
Denicion A.21 (Conjunto controlable en i pasos) El conjunto controlable en i
pasos /
i
(X, ) es el conjunto de estados para los cuales existe una secuencia de actua-
ciones admisibles tal que conduce el sistema hasta el conjunto X en i pasos con
una trayectoria admisible.
/
i
(X, ) = x
0
k
U tal que x
k
X, y x
i

El conjunto controlable a i pasos, /
i
(X, ), nos indica los estados que pueden
alcanzar un determinado conjunto en i pasos con una evoluci on admisible mediante
una secuencia de actuaciones admisibles. Este conjunto depende del n umero de pasos
i y representa una secuencia de conjuntos que posee una serie de propiedades:
Propiedad A.22 La secuencia /
i
(X, ) satisface las siguientes propiedades:
El calculo de la secuencia se puede obtener haciendo
/
i+1
(X, ) = Q(/
i
(X, )) X
con /
0
(X, ) = .
El conjunto /
i
(X, ) no tiene por que estar incluido en /
i+1
(X, ), salvo en el
caso en que el conjunto sea un conjunto invariante de control. As, si x
0

/
i
(X, ) /
i+1
(X, ), entonces el sistema puede llevarse a en i pasos, pero no
en i + 1.
El conjunto /
(X, ) esta nitamente determinado si existe un ndice i tal que

/
(X, ) = /
i
(X, ). Al menor ndice que satisface esta propiedad i
se denom-
ina ndice de determinacion.
Si existe un ndice j tal que /
i+1
(X, ) = /
i
(X, ) para todo i j entonces
/
(X, ) = /
j
(X, ) y ademas el menor j que cumple esta propiedad es el
ndice de determinacion.
Este conjunto se puede extender a sistemas en bucle cerrado controlados por una
ley de control u = h(x), dando lugar a
/
h
i
(X, ) = x
0
X
h
: x
k
X
h
, k = 0, , i 1 y x
i

siendo X
h
= x X : h(x) U.
Este conjunto satisface las propiedades anteriores y ademas
/
h
i+1
(X, ) = Q
h
(/
h
i
(X, )) X
A la luz de la secuencia de conjuntos controlables se pueden denir dos familias de
conjuntos: la secuencia de conjuntos admisibles y la secuencia de conjuntos estabiliza-
bles.
La secuencia de conjuntos admisibles esta relacionado con el conjunto de estados
para los cuales el sistema es capaz de evolucionar satisfaciendo las restricciones. Da-
do que, como se puso de maniesto anteriormente, la satisfaccion de las restricciones
esta muy relacionada con los invariantes de control, resulta interesante denir antes el
siguiente conjunto:
Denicion A.23 (Maximo conjunto invariante de control) El conjunto (
(X)
es el maximo conjunto invariante de control contenido en X si y solo si todo conjunto
invariante de control del sistema satisface que
(
(X) X
As, (
(X) es el maximo conjunto en el cual existe una ley de control admisible tal
que el sistema puede satisfacer las restricciones en su evoluci on. Por lo tanto
/
i
(X, ) (
(X)
para todo i, y para todo conjunto X.
El maximo conjunto invariante de control se deriva del denominado conjunto ad-
misible.
Denicion A.24 (Conjunto admisible en i pasos) El conjunto admisible en i pa-
sos (
i
(X) es el conjunto de estados para los cuales existe una secuencia de actuaciones
admisibles tal que la evolucion del sistema permanece en el conjunto X durante los i
instantes siguientes.
(
i
(X) = x
0
k
U tal que x
k+1
X
El conjunto (
i
(X) representa una secuencia de conjuntos que posee una serie de
propiedades:
Propiedad A.25 La secuencia (
i
(X) satisface las siguientes propiedades:
El conjunto (
i
(X) = /
i
(X, X).
(
i+1
(X) (
i
(X), es decir, si un estado es tal que existen i + 1 actuaciones ad-
misibles que hacen la evolucion del sistema admisible, entonces, tambien satisface
que es admisible en i pasos.
Si x
0
X (
i
(X), entonces no existe una ley de control admisible para la cual
la evolucion del sistema sea admisible por i pasos o mas.
El conjunto (
(X) es el maximo control invariante contenido en X, es decir, el

conjunto de todos los estados para los cuales existe una ley de control admisible
que garantice la satisfaccion de las restricciones.
(
(X) esta nitamente determinado si y solo si existe un ndice i
tal que
(
i+1
(X) = (
i
(X) para todo i i
. Entonces C
i
(X) = (
(X).
Es importante resaltar que los conjuntos (
i
(X) no son en general conjuntos inva-
riantes de control, sin embargo esta secuencia de conjuntos tiende a un conjunto que
s es un conjunto invariante de control y ademas es el maximo contenido en X.
Tambien hay que hacer notar que el hecho de que en un determinado estado inicial
x
0
exista una trayectoria sea admisible, puede implicar estabilidad en el sentido BIBO
(siempre que el conjunto invariante de control maximo sea una conjunto acotado), pero
no quiere decir que el sistema sea asint oticamente estabilizable.
El concepto de sistema estabilizable se reere a la capacidad que tiene un sistema
de evolucionar en cierto un n umero de pasos hasta un conjunto en el cual, una vez
alcanzado, la evolucion del sistema queda connada. Esta propiedad viene caracterizada
en el denominado conjunto estabilizable en i pasos.
Denicion A.26 (Conjunto estabilizable en i pasos) El conjunto estabilizable en
i pasos al conjunto invariante (positivo o de control) X es el conjunto de estados
S
i
(X, ) para los cuales existe una secuencia de actuaciones admisibles tal que conduce
el sistema hasta el conjunto en i pasos con una trayectoria admisible.
S
i
(X, ) = x
0
k
U tal que x
k
X, y x
i

Como se puede observar, la unica diferencia entre el conjunto estabilizable S
i
(X, )
y controlable /
i
(X, ) es la condicion de que el conjunto debe ser un conjunto
invariante. Este hecho conere una serie de propiedades adicionales a los conjuntos
estabilizables, propiedades que se presentan a continuaci on y que son extensamente
utilizadas a lo largo de esta tesis.
Propiedad A.27 La secuencia S
i
(X, ) satisface las siguientes propiedades:
El calculo de la secuencia se puede obtener haciendo
S
i+1
(X, ) = Q(S
i
(X, )) X
con S
0
(X, ) = .
S
i
(X, ) S
i+1
(X, ).
Todo conjunto S
i
(X, ) es un conjunto invariante de control.
Sean dos conjuntos invariantes de control
1
y
2
tales que
1

2
, entonces
S
i
(X,
1
) S
i
(X,
2
).
S
i
(X, S
j
(X, )) = S
i+j
(X, ).
El conjunto S
(X, ) esta nitamente determinado si y solo si existe un ndice

i
tal que S
i+1
(X, ) = S
i
(X, ) para todo i i
. Ademas S
(X, ) = S
i
(X, )
para i i
.
Este conjunto se puede extender a sistemas en bucle cerrado controlados por una
ley de control u = h(x), dando lugar a
S
h
i
(X, ) = x
0
X
h
: x
k
X
h
, k = 0, , i 1 y x
i

siendo X
h
= x X : h(x) U. Este conjunto satisface las propiedades anteriores y
en particular
S
h
i+1
(X, ) = Q
h
(S
h
i
(X, )) X
Ademas, todo conjunto S
h
i
(X, ) es un invariante positivo del sistema.
La diferencia entre el conjunto controlable y estabilizable radica en el hecho de que
el conjunto al que evolucionan es un invariante del sistema. Esta diferencia, a priori
trivial, es trascendental en la estabilidad. En efecto, si un estado x
0
S
i
(X, ) entonces
existe una secuencia de actuaciones que conducen el sistema al conjunto y una vez
all, existe una ley de control admisible que lo mantiene en dicho conjunto. Por lo tanto
es estable y converge al conjunto . Si por el contrario, el conjunto no fuese un
invariante de control, entonces, el sistema, una vez alcanzado ese conjunto en i pasos,
puede no ser estabilizable en dicho conjunto y abandonarlo, perdiendo la estabilidad.
Hay que resaltar que el conjunto (
(X) es diferente al conjunto S
(X, ), de hecho
S
(X, ) (
(X). As, para todo estado x

0
(
(X) S
(X, ) existe una ley de

control admisible que hace que el sistema satisfaga las restricciones, pero no existe una
ley de control que ademas conduzca el sistema al conjunto .
Notese que el conjunto trivial 0 es un invariante del sistema (por ser el origen
un punto de equilibrio). Por lo tanto el conjunto de estados que son asintoticamente
estabilizables al origen en i pasos sera S
i
(X, 0).
El conjunto S
(X, ) es el maximo conjunto estabilizable al invariante y es

en general distinto al conjunto S
(X, 0) que es el maximo conjunto estabilizable al

origen, es decir, el conjunto de estados que pueden ser conducidos al punto de equilibrio
por una ley de control admisible satisfaciendo las restricciones
6
.
A raz de esto, resulta interesante establecer una condicion necesaria y suciente
sobre bajo la cual S
(X, ) = S
(X, 0). Esta condicion se establece en el siguiente

teorema, que es original de esta tesis y cuyo resultado tendra una aplicacion inmediata
sobre el control predictivo.
Teorema A.28 Los conjuntos
S
(X, ) = S
(X, 0)
si y solo si el conjunto invariante es tal que S
(X, 0)
Demostracion:
6
Este conjunto es una generalizacion del maximo conjunto estabilizable introducido en (Keerthi
& Gilbert 1987).
Necesidad:
Supongase que S
(X, ) = S
(X, 0), entonces se tiene que

S
(X, ) = S
(X, 0)
y por lo tanto S
(X, 0).
Suciencia:
Supongase que S
(X, 0), entonces:

S
(X, ) S
(X, 0) :
Dado que S
(X, 0), se tiene que

S
(X, ) S
(X, S
(X, 0)) = S
(X, 0)
S
(X, 0) S
(X, ) :
Dado que 0 , entonces de las propiedades del conjunto estabilizable
se tiene que S
(X, 0) S
(X, ).
Y por lo tanto se demuestra que S
(X, 0) = S
(X, )
Este teorema demuestra que el maximo conjunto estabilizable al origen y a co-
inciden si y solo si es un conjunto invariante cuyos estados son asint oticamente
estabilizables al origen.
En el corolario siguiente se establecen condiciones bajo las cuales ambos conjuntos
S
(X, 0) y S
(X, ) estan nitamente determinados. Este resultado tambien es

original de esta tesis y tiene una aplicacion interesante en el analisis del dominio de
atraccion de los controladores predictivos.
Corolario A.29 Sea S
n
(X, 0) para cierto n, entonces S
(X, 0) esta nita-

mente determinado si y solo si S
(X, ) tambien lo esta.

Ademas si el ndice de determinacion de S
(X, ) es i
, y el de S
(X, 0) es j
, se
verica que
i
+n
Demostracion:
Si S
(X, 0) esta nitamente determinado entonces S
(X, ) tambien lo esta:

Dado que S
n
(X, ) S
(X, ), por el teorema anterior se inere que

para todo j j
(X, ) = S
(X, 0) = S
j
(X, 0) S
j
(X, )
De las propiedades de los conjuntos estabilizables se tiene que
S
j
(X, ) S
(X, )
y por lo tanto, para todo j j
, se deduce que S
j
(X, ) = S
(X, ), y conse-
cuentemente esta nitamente determinado con un ndice i
.
Si S
(X, ) esta nitamente determinado entonces S
(X, 0) tambien lo esta:

Para todo i i
se tiene que
S
(X, 0) = S
(X, ) = S
i
(X, ) S
i+n
(X, 0)
dado que S
i+n
(X, 0) S
(X, 0), se tiene que

S
i+n
(X, 0) = S
(X, 0)
para todo i i
. Por lo tanto S
(X, 0) esta nitamente determinado con un

ndice de determinacion j
+ n.
Este resultado es interesante desde un punto de vista practico, ya que, si el inva-
riante es tal que S
n
(X, 0), que es lo habitual, entonces, S
(X, ) esta ni-

tamente determinado si y solo si S
(X, 0) tambien lo esta. Por lo tanto si todo

estado estabilizable a lo es en N pasos (siendo N el ndice de determinacion), en-
tonces sera asintoticamente estabilizable al origen N + n pasos. Esta consecuencia se
utilizara en el analisis del dominio de atraccion del MPC, en la seccion 4.3.1.
A.3.1. Determinacion del conjunto a un paso
Los conjuntos anteriormente presentados caracterizan regiones en las que se verican
propiedades tan importantes como la posibilidad de que sea controlable o que sea
asintoticamente estabilizable satisfaciendo las restricciones. La posibilidad del calculo
de estos conjuntos es muy interesante pues permite analizar fuera de lnea todas estas
propiedades. Ademas ofrece la posibilidad de utilizar estas regiones para el dise no de
controladores. A lo largo de la tesis, se muestran controladores que aprovechan estos
conjuntos en su dise no.
La determinacion de estas regiones es un calculo puramente geometrico pues basta
con tener un algoritmo para determinar el conjunto a un paso Q() y otro para la
intersecci on de dos conjuntos.
El conjunto Q() viene caracterizado por todo estado x para el cual exista una
actuacion u tal que
f(x, u) IR
n
u U IR
m
La determinacion del conjunto a un paso puede hacerse trasladando el problema al
espacio de estados extendido
z =
_
x
u
_
as, el conjunto Q() se transforma en el espacio extendido en el conjunto
=
_
z IR
n+m
:
_
f(z)
I
U
z
_
U
_
siendo I
U
=
_
I
m
_
, donde I
m
es la matriz identidad de dimension m. Entonces, el
conjunto Q() sera la proyecci on de sobre las n primeras componentes de z.
La determinacion de este conjunto no es sencilla en general. Sin embargo, en el caso
de sistemas lineales y los conjuntos X, U y politopicos, existen algoritmos ecientes
para su determinacion exacta (Keerthi & Gilbert 1987, Blanchini 1994, Kerrigan 2000).
Sea el sistema lineal x
k+1
= Ax
k
+Bu
k
y sea el conjunto de restricciones sobre las
actuaciones U dado por
A
u
u b
u
siendo A
u
IR
nrum
y b
u
IR
nru
. Sea el conjunto otro politopo dado por
A
x b
siendo A
IR
nr
n
y b
u
IR
nr
. Entonces en el espacio extendido, el conjunto

viene dado por
_
A
A A
B
A
u
_
z
_
b
b
u
_
que es otro politopo. Este conjunto se puede proyectar sobre x utilizando por ejemplo
el algoritmo de eliminacion de Fourier-Motzkin utilizado en (Keerthi & Gilbert 1987,
Kerrigan 2000), lo que da lugar a Q(), que es otro politopo.
Una vez obtenido este conjunto, la interseccion con otro politopo da como resultado
otro politopo y su determinacion es sencilla. En consecuencia, los conjuntos estabiliza-
bles, controlables, y admisibles en sistemas lineales sujetos a restricciones politopicas
son politopos y el procedimiento por el que se obtienen estos es exacto.
En el caso de sistemas no lineales el calculo exacto es enormemente complejo. Sin
embargo en ocasiones es suciente con la determinacion de conjuntos aproximados a
estos conjuntos de forma que
Q
ap
() Q()
Estos conjuntos aproximados pueden servir para la determinacion de conjuntos inva-
riantes de control de sistemas, pues todo conjunto tal que Q() es un
conjunto invariante de control (si es un invariante).
Un posible procedimiento para el calculo aproximado Q
ap
() puede obtenerse tras-
ladando el procedimiento seguido para sistemas lineales a sistemas no lineales. Para ello
se va a considerar que los conjuntos X, U y son politopos. Esto no es muy restrictivo,
pues es habitual expresar las restricciones de forma politopica. Si no fuese este el caso,
se pueden tomar aproximaciones politopicas no muy conservadoras, siempre que estos
conjuntos sean convexos.
As, el conjunto Q() vendr a caracterizado en el espacio extendido por el conjunto
=
_
z IR
n+m
:
_
A
f(z)
A
U
z
_
_
b
b
u
__
siendo A
U
= [, A
u
]. El conjunto Q() es la proyeccion de sobre x. Dado que este
conjunto no tiene por que ser un politopo (ni siquiera convexo), la determinacion de
esta proyeccion es difcil.
Teniendo en cuenta que la proyeccion es una operacion monotona, es decir, que
para todo , se tiene que la proyeccion de esta contenida en la proyeccion de
, el conjunto Q() se puede aproximar por la proyeccion de un politopo contenido en
. Notese que la proyeccion de un politopo se puede realizar mediante procedimientos
conocidos.
La aproximaci on politopica de se puede determinar en dos pasos: primero se
calcula la envoltura convexa del conjunto . De este modo, el politopo adapta su
forma a la geometra particular de la region, que viene caracterizada por la dinamica
del sistema. Una vez hecho esto, se contrae el politopo obtenido hasta estar contenido
en . Esto se puede hacer afectando el termino independiente de la inecuacion por un
factor (0, 1).
Este procedimiento trata de aprovechar la exibilidad que ofrecen los politopos,
268 A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado
as como la existencia de algoritmos ecientes para realizar operaciones sobre ellos.
Una restriccion fuerte que impone esta eleccion se deriva del hecho de que un politopo
siempre es convexo. Ademas, es claro tambien que este procedimiento puede no ser de
utilidad en caso de sistemas fuertemente no lineales. El desarrollo de este procedimiento
es una de las futuras lneas de trabajo del autor de esta tesis.
A.4. Analisis de la robustez de sistemas no lineales:
estabilidad entrada a estado
Sea un sistema autonomo cuyo comportamiento es incierto y responde a un modelo
dado por
x
k+1
= f(x
k
, w
k
)
siendo x
k
IR
n
es estado del sistema y w
k
IR
q
el vector de incertidumbres sobre
el sistema. Estas incertidumbres se suponen acotadas de forma que
w
k
W = w IR
q
: |w|
para todo k. Se supone que, en ausencia de incertidumbres, el origen es un punto de
equilibrio del sistema, as f(0, 0) = 0.
Si las incertidumbres dependen del estado (w W(x)), de forma que w 0 cuando
x 0, entonces el origen es un punto de equilibrio del sistema incierto. En este caso,
la teora de Lyapunov se puede extender considerando en las condiciones de estabilidad
la peor posible de las situaciones posibles, es decir
V (x) = max
wW(x)
V (f(x, w)) V (x)
Si existe una funcion de Lyapunov tal que V (x) 0, el sistema sera estable a pesar de
las incertidumbres. Si ademas existe una funcion / , (), tal que V (x) (|x|),
entonces el sistema incierto es asintoticamente estable en el origen.
Sin embargo, en el caso en el que las incertidumbres estan simplemente acotadas, el
origen deja de ser un punto de equilibrio del sistema incierto. Por tanto las deniciones
de estabilidad al origen, as como la teora de Lyapunov asociada, no se pueden aplicar.
La teora de la estabilidad entrada a estado, basada en la de Lyapunov, ofrece un marco
para el analisis de estos sistemas.
La estabilidad entrada a estado fue formulada por primera vez en (Sontag 1989a)
para sistemas en tiempo continuo, pero recientes resultados (Jiang et al. 1999, Jiang
& Wang 2001) han trasladado estos conceptos a sistemas en tiempo discreto. A con-
tinuaci on se presentan algunas deniciones y resultados interesantes.
Denicion A.30 (Estabilidad entrada a estado) (Jiang & Wang 2001) Un sis-
tema x
k+1
= f(x
k
, w
k
) es estable entrada a estado si existe una funcion /L , (, ), y
una funcion / , (), tal que la evolucion del sistema satisface que
|x
k
| (|x
0
|, k) + ()
siendo |w
k
| para todo k.
Esta denicion se puede interpretar como que el sistema en ausencia de incer-
tidumbres es asint oticamente estable. Sin embargo, cuando aparecen incertidumbres
acotadas, el efecto que estas tienen sobre la evoluci on del sistema esta acotada, es
decir, que las incertidumbres no hacen divergir al sistema.
Asociada a este concepto de estabilidad existe la denicion de una funcion de Lya-
punov entrada a estado.
Denicion A.31 (Funcion de Lyapunov entrada a estado) (Jiang & Wang 2001)
Una funcion continua V : IR
n
IR
+
se denomina funcion de Lyapunov entrada a es-
tado si satisface que
Existen unas funciones / ,
1
() y
2
(), tales que
1
(|x|) V (x)
2
(|x|) x B
r
3
(), y una funcion / , (), tales que
V (f(x, w)) V (x)
3
(|x|) + () x B
r
, w B
= |w|
La segunda propiedad de la denicion es equivalente a decir que existe una funcion
/
, (), y una funcion / ,

4
(), tales que
V (f(x, w)) V (x)
4
(x) x : |x| (||)
es decir, que se satisface la condicion de Lyapunov tan solo fuera de una vecindad del
origen.
En el siguiente lema se establece la condicion suciente para garantizar la estabilidad
entrada a estado de un sistema.
Lema A.32 (Jiang & Wang 2001) Si un sistema x
k+1
= f(x
k
, w
k
) admite una funcion
de Lyapunov entrada a estado entonces el sistema es estable entrada a estado.
La demostracion de este lema esta muy relacionada con la denicion de conjunto
invariante robusto.
Denicion A.33 (Conjunto invariante positivo robusto) Sea un sistema incier-
to dado por
x
k+1
= f(x
k
, w
k
)
siendo x
k
IR
n
el estado del sistema y w
k
IR
q
el vector de incertidumbres, que se
suponen acotadas de forma que w
k
W.
Un conjunto IR
n
se dice que es un conjunto invariante positivo robusto del sis-
tema si para todo x
0
se tiene que x
k
para todo k 0 y para toda incertidumbre
w
k
W.
La demostracion de este lema se basa en probar que una region dada por
b
= x IR
n
: V (x) b
contenida en B
r
, es un invariante robusto del sistema para un cierto grado de incer-
tidumbres = (b).
La demostracion a grandes rasgos es la siguiente: de la denicion de V (x) se tiene
que
V (f(x, w)) V (x)
3
(|x|) + ()
Dado que para todo x se tiene que |x|
1
2
(V (x)), sustituyendo tenemos que
V (f(x, w)) V (x)
3

1
2
(V (x)) + ()
Considerando que la funcion
3

1
2
es una funcion /
, de las propiedades de estas

funciones se tiene que existe una funcion /
,
4
(), tal que
4
(s)
3

1
2
(s)
con una funcion / , (), asociada tal que
(s) = s
4
(s) 0
Por tanto, dado que V (x) 0, se tiene que
V (f(x, w)) V (x)
3

1
2
(V (x)) + ()
V (x)
4
V (x) + ()
V (x) + ()
entonces si V (x) b, se tiene que
V (f(x, w)) (b) + ()
para garantizar que V (f(x, w)) b se debe satisfacer que
b (b) ()
Del desarrollo anterior, se tiene que la funcion
4
(s) = (id )(s) es una funcion
/
, siendo id la funcion identidad. Por lo tanto basta tomar

b (id )
1
() = d()
siendo d() una funcion / .
De aqu se pueden obtener 2 conclusiones: la primera es que si un sistema es estable
entrada a estado y la entrada (incertidumbre) tiene una cota , entonces todo conjunto
b
= x IR
n
: V (x) b B
r
con b d(), es un conjunto invariante robusto del sistema. Ademas el sistema evolu-
ciona hasta quedar connado en b = d().
Otra conclusion es la lectura inversa, todo conjunto
b
es invariante robusto para
unas incertidumbres tales que su cota satisfaga

1
(b (b)) (A.1)
A.4.1. Suavidad implica robustez
Sea un sistema incierto x
k+1
= f(x
k
, w
k
) tal que su modelo es suave respecto a la
variaci on de los parametros, es decir, que existe una funcion / , (), tal que
|f(x, w) f(x, 0)| (|w|)
Notese que esta condicion se satisface bajo condiciones de diferenciabilidad de la fun-
cion.
Sea el sistema sin incertidumbres x
k+1
= f(x
k
, 0) asint oticamente estable con una
funcion de Lyapunov asociada V (x) tal que
V (f(x, 0)) V (x) (|x|)
siendo () una funcion / . Supongase que V (x) una funcion suave, es decir, que existe
una funcion / () tal que
[V (x + x) V (x)[ (|x|)
para todo |x| .
Entonces, bajo estas hipotesis, el sistema es estable entrada a estado, es decir,
admite cierto grado de incertidumbre. Para ello basta ver que
V (f(x, w)) V (x) = V (f(x, w)) V (f(x, 0)) + V (f(x, 0)) V (x)
(|f(x, w) f(x, 0)|) (|x|)
(|w|) (|x|) (|x|) + ()
y por lo tanto la funcion de Lyapunov es tambien una funcion de Lyapunov entrada a
estado.
A.4.2. Robustez de sistemas no autonomos
El analisis anterior se puede trasladar al concepto de funcion de Lyapunov de control
para al analisis de robustez de sistemas no autonomos. Considerese un sistema dado
por
x
k+1
= f(x
k
, u
k
, w
k
)
siendo x
k
IR
n
el estado del sistema, u
k
IR
m
las actuaciones y w
k
IR
q
el vector de
incertidumbres sobre el sistema. Estas incertidumbres se suponen acotadas de forma
que
w
k
W = w IR
q
: |w|
para todo k. Se supone que, en ausencia de incertidumbres, el origen es un punto de
equilibrio del sistema, as f(0, 0, 0) = 0.
En el caso en que las incertidumbres decaigan con el estado, entonces la funcion de
Lyapunov de control se puede denir como una funcion denida positiva tal que
V (x) = mn
uU
_
max
wW(x)
V (f(x, u, w)) V (x)
_
(|x|)
para todo x B
r
, siendo () una funcion / . Por tanto si un sistema tiene una funcion
de Lyapunov de control asociada, entonces es estabilizable a pesar de las incertidumbres
en una region
b
= x IR
n
: V (x) b
En el caso en que las incertidumbres sean meramente acotadas, se puede extender
el concepto de funcion de Lyapunov entrada a estado a una CLF. As, si una funcion
denida positiva satisface que
V (x) = mn
uU
_
max
wW
V (f(x, u, w)) V (x)
_
(|x|)
para todo x B
r
B
d
siendo B
d
una vecindad del origen que depende del grado de
incertidumbres del sistema.
En este caso, la existencia de una funcion que satisfaga esta condicion garantiza que
el sistema evoluciona hasta una vecindad del origen en la que la evolucion del sistema
queda acotada. En efecto, sea una region
b
contenida en B
r
tal que B
d

b
. Este
conjunto,
b
es un invariante robusto del sistema. Entonces para todo x
b
B
d
, existe
una ley de control que conduce el sistema hacia el origen a pesar de las incertidumbres
(gracias a que V (x
k
) es estrictamente decreciente). Por lo tanto, en un determinado
instante, el sistema entra en B
d
, donde la condicion puede no satisfacerse, y entonces
la evoluci on del sistema podra salir de dicho conjunto. Pero, dado que una vez fuera,
el sistema es forzado a converger, el sistema permanecera acotado en una vecindad del
origen.
Asociado al concepto de conjunto robustamente estabilizable esta el concepto de
conjunto invariante de control robusto.
Denicion A.34 (Conjunto invariante de control robusto) Sea un sistema incier-
to dado por
x
k+1
= f(x
k
, u
k
, w
k
)
siendo x
k
IR
n
k
U IR
m
las actuaciones sobre el sistema
y w
k
IR
q
el vector de incertidumbres sobre el sistema que se suponen acotadas de
forma que w
k
W.
Un conjunto IR
n
se dice que es un conjunto invariante de control robusto
del sistema si para todo x
0
se tiene que que existe una ley de control admisible
u
k
= h(x
k
) U tal que x
k
para todo k 0 y para toda incertidumbre w
k
W.
Por ejemplo, el conjunto
b
anteriormente denido es un conjunto invariante robus-
to. Alrededor de este concepto, se extiende la teora de conjuntos invariantes al caso
de sistemas con incertidumbres, que es particularmente util para el analisis de sistemas
inciertos sujetos a restricciones.
A.5. Conjuntos invariantes robustos
En el caso en el que un sistema presente incertidumbres, los conjuntos invariantes
deben considerar los efectos de las mismas para garantizar convergencia a un conjunto
y la satisfaccion de las restricciones a pesar de la incertidumbres del sistema. Estos
conjuntos son de especial interes para el analisis de la robustez de sistemas sujetos a
274 A.5. Conjuntos invariantes robustos
restricciones y por ello se utilizan en el desarrollo de captulos de esta tesis dedicados
a la robustez de los controladores predictivos.
Numerosos trabajos tratan sobre este asunto tanto para el analisis como para el
dise no de controladores, generalmente lineales en tiempo mnimo (Bertsekas 1972,
Blanchini 1994, Mayne & Schr oeder 1997). En (Kerrigan 2000, Kerrigan & Maciejowski
2001) se utilizan estos conjuntos para el analisis de la factibilidad robusta de contro-
ladores predictivos.
Considerese un sistema incierto dado por
x
k+1
= f(x
k
, u
k
, w
k
)
siendo x
k
IR
n
k
IR
m
las actuaciones sobre el sistema y
w
k
IR
q
el vector de incertidumbres sobre el sistema que se suponen acotadas de
forma que w
k
W. El sistema esta sujeto a las restricciones
u
k
U
x
k
X
Estas restricciones deben satisfacerse a pesar de las incertidumbres.
A continuaci on se van a extender las deniciones de los distintos conjuntos previa-
mente denidos al caso robusto, que se denota por el smbolo . As

Q() se reere al
conjunto a un paso robusto.
Denicion A.35 (Conjunto a un paso robusto) El conjunto a un paso robusto
del conjunto ,

Q(), es el conjunto de estados x para los cuales existe una actuacion
admisible u U (que dependera del estado x) tal que el sistema alcanza el conjunto
en un solo paso, es decir, f(x, u, w) ante cualquier incertidumbre w W.
Q() = x IR
n
: u(x) U[f(x, u, w) , w W
Notese que la unica diferencia con el caso no robusto es que se debe satisfacer la
condicion para toda posible incertidumbre. En el caso en que las incertidumbres sean
aditivas, de forma que
x
k+1
= f(x
k
, u
k
) + w
k
el conjunto robusto a un paso robusto verica que
Q() = Q( W)
siendo W la diferencia de Pontryagin de ambos conjuntos. Por lo tanto, en este
caso, el conjunto robusto se calcula a partir del conjunto no robusto.
Denicion A.36 (Conjunto de alcance robusto) El conjunto de alcance robusto
del conjunto ,

1(), es el conjunto de estados x a los cuales puede evolucionar el
sistema partiendo de ante una actuacion admisible u U y ante cualquier incer-
tidumbre w W en un solo paso.
1() = z IR
n
: x , U, w W tal que z = f(x, u, w)
A partir de la denicion de conjunto a un paso robusto, se extienden inmediatamente
todos los resultados y deniciones no robustas al caso robusto.
Teorema A.37 (Condicion geometrica de invariancia robusta)
Un conjunto es un invariante de control robusto si y solo si

Q()
Denicion A.38 (Conjunto controlable en i pasos robusto) El conjunto contro-
lable en i pasos

/
i
(X, ) es el conjunto de estados para los cuales existe una secuencia
de actuaciones admisibles que dependen del estado, tal que conduce el sistema hasta
el conjunto en i pasos con una trayectoria admisible y ante cualquier secuencia de
incertidumbres posibles.
/
i
(X, ) = x
0
X : u
k
(x
k
) U k = 0, , i [ x
k
X, x
i
, w
k
W
El conjunto

/
i
(X, ) presenta propiedades semejantes al caso sin incertidumbres.
Denicion A.39 (Maximo conjunto invariante de control robusto) El conjun-
to

(
(X) es el maximo conjunto invariante de control robusto contenido en X si y solo

si todo conjunto invariante de control robusto del sistema satisface que

(
(X) X
As,

(
(X) es el maximo conjunto en el cual existe una ley de control admisible tal
que el sistema puede satisfacer las restricciones en su evoluci on ante cualquier posible
incertidumbre.
Denicion A.40 (Conjunto admisible en i pasos robusto) El conjunto admisi-
ble en i pasos robusto

(
i
(X) es el conjunto de estados para los cuales existe una secuen-
cia de actuaciones admisibles tal que la evolucion del sistema permanece en el conjunto
X durante las i muestras siguientes ante cualquier incertidumbre posible.
(
i
(X) = x
0
X : u
k
(x
k
) U [ x
k
+ 1 X, w
k
W, k = 0, , i 1
276 A.5. Conjuntos invariantes robustos
Denicion A.41 (Conjunto estabilizable en i pasos robusto) El conjunto esta-
bilizable en i pasos robusto al conjunto invariante robusto (positivo o de control) ,
S
i
(X, ), es el conjunto de estados para los cuales existe una secuencia de actuaciones
admisibles tal que conduce el sistema hasta el conjunto en i pasos con una trayectoria
admisible para toda posible incertidumbre.
S
i
(X, ) = x
0
X : u
k
(x
k
) U k = 0, , i 1 [ x
k
X, x
i
, w
k
W
Todas las propiedades presentadas para los conjuntos invariantes no robustos se
extienden al caso robusto, simplemente sustituyendo los conjuntos invariantes por sus
equivalentes robustos. Estas propiedades son de suma utilidad en el analisis y dise no
de controladores con incertidumbres.
Apendice B
Un ejemplo ilustrativo: el reactor
continuamente agitado (CSTR)
Para ilustrar las estrategias de control MPC que se presentan a lo largo de esta
tesis, se van a aplicar sobre el modelo de un sistema altamente no lineal: un reactor
continuamente agitado de mezcla perfecta (CSTR). Este proceso ha sido extensamente
utilizado en la literatura de control pues re une las principales caractersticas de la
mayora de los reactores (Seborg, Edgar & Mellichamp 1989, Henson & Seborg 1997,
Magni, De Nicolao, Magnani & Scattolini 2001, De Oliveira Kothare & Morari 2000).
Este sistema esta formado por un tanque en el cual tiene lugar una reaccion exo-
termica irreversible de descomposicion
A B
El caracter exotermico de la reaccion provoca una continua generacion de calor en el
seno del tanque, el cual es evacuado por medio de una camisa de refrigeracion por la
que circula el refrigerante, cuya temperatura T
c
es manipulable.
El objetivo del control es mantener la concentracion de reactivo del producto C
A
y la temperatura del tanque T en el punto de funcionamiento determinado. Para ello
se act ua sobre la temperatura de refrigerante T
c
modicando as la temperatura del
tanque y, por lo tanto, la temperatura a la que se realiza la reaccion. En consecuencia
se acelera o decelera la reaccion y por tanto se act ua sobre la concentraci on de reactivo
y de producto.
El modelado de este sistema se puede encontrar en (Seborg et al. 1989, Ollero &
Camacho 1997) y se hace bajo las siguientes hipotesis o simplicaciones:
277
278
(i) Se supone mezcla perfecta, por lo que la concentracion de reactivo en el caudal
de salida C
A
es igual a la concentraci on en el seno del tanque.
(ii) La reaccion responde a una cinetica de primer orden, por lo que la velocidad de
reaccion es r
A
= kC
A
siendo k la constante cinetica, que responde a la ley de
Arrhenius
k = k
0
exp
_
E
RT
_
siendo E la energa de activaci on de la reaccion, R la constante de los gases y k
0
la constante de frecuencia.
(iii) La temperatura en el reactor es uniforme y ademas tan solo se considera la
transferencia de calor con el refrigerante, despreciandose otros efectos termicos
como la transferencia de calor con el medio o la aportacion de energa interna del
agitador.
(iv) Se supone que el sistema se halla en equilibrio en el nivel de lquido en el tanque,
de forma que el caudal de entrada al tanque de reactivo A es igual al caudal de
salida de producto. En consecuencia el volumen de lquido contenido en el tanque
es constante.
Considerando estas simplicaciones se establecen las ecuaciones de balance de masas
y energa en el reactor, que dan lugar a las ecuaciones diferenciales que modelan este
proceso: (Seborg et al. 1989, Ollero & Camacho 1997):
d C
A
dt
=
q
V
(C
Af
C
A
) k
0
exp
_
E
RT
_
C
A
d T
dt
=
q
V
(T
f
T) +
(H
r
)k
0
C
p
exp
_
E
RT
_
C
A
+
UA
V C
p
(T
c
T)
donde C
A
es la concentraci on del reactivo A en el tanque, T es la temperatura en el
mismo y T
c
es la temperatura del refrigerante, C
Af
, T
f
y q son la concentracion de A,
la temperatura y el caudal del ujo de entrada, V el volumen de lquido contenido en
el tanque.
Los parametros del sistema son:
Apendice B. Un ejemplo ilustrativo: el reactor continuamente agitado (CSTR) 279
Parametro Descripcion Valor
Densidad del lquido 1000 g/l
C
p
Calor especco medio 0,239 J/g K
(H
r
) Entalpa de reaccion 5 10
4
J/mol
E/R Constante de la formula de Arrhenius 8750 K
k
0
Constante de frecuencia 7,2 10
10
min
1
UA Coeciente de transferencia de calor 5 10
4
J/min K
Las condiciones nominales de funcionamiento corresponden a q = 100 l/min, T
f
= 350
K, V = 100 l, C
Af
= 1,0 mol/l, lo que conduce al sistema a un punto de equilibrio
dado por
C
o
A
= 0,5 mol/l, T
o
= 350 K, T
o
c
= 300 K
La temperatura del refrigerante esta restringida a 280 K T
c
370 K, la temperatura
del reactor a 280 K T 370 K y la concentraci on a 0 C
A
1mol/l.
Dada la diferencia entre las magnitudes de ambos estados, los estados del modelo
se ha normalizado para evitar posibles problemas de condicionamiento numerico. Los
estados y la entrada considerados han sido:
x
1
=
C
A
0,5
0,5
x
2
=
T 350
20
u =
T
c
300
20
Los parametros que denen el sistema, as como las condiciones nominales de fun-
cionamiento, se han tomado iguales a las utilizadas en (Magni, De Nicolao, Magnani
& Scattolini 2001). El punto de funcionamiento elegido es inestable y ademas, el sis-
tema presenta un comportamiento altamente no lineal como se puede observar en las
respuestas en bucle abierto ante un escalon negativo (gura B.1) y ante un escalon
positivo (gura B.2).
El modelo se ha discretizado con un periodo de muestreo T
m
= 0,03. El procedimien-
to de discretizacion utilizado para la implementaci on de los controladores predictivos es
mplcito, de forma que no se han obtenido unas expresiones en forma de ecuaciones en
diferencias. El modelo continuo se ha integrado mediante un algoritmo de integraci on
numerica, sucientemente preciso (alto orden y de paso variable). As, partiendo de las
condiciones iniciales dadas por el estado en el instante anterior x
k
, se integra el modelo
considerando a lo largo del periodo de muestreo la entrada constante u(t) = u
k
para
280
t [kTm, (k +1)Tm], tal y como hace un mantenedor de orden cero. De esta forma,
el estado obtenido en t = (k + 1)Tm es el estado x
k+1
.
El modelo discreto linealizado en torno al origen se ha obtenido calculando el ja-
cobiano del modelo aproximado utilizando el metodo de diferencias nitas. El modelo
linealizado obtenido es x
k+1
= Ax
k
+ Bu
k
siendo
A =
_
_
0,9385 0,0443
0,1624 1,1365
_
_
B =
_
_
0,0013
0,0668
_
_
que, como se puede comprobar, la matriz A tiene un autovalor fuera del disco unidad,
por lo que el origen es un punto de equilibrio inestable.
0 50 100 150 200 250 300 350
0
0.2
0.4
0.6
0.8
1
muestras
x
1
0 50 100 150 200 250 300 350
2
1.5
1
0.5
0
muestras
x
2
Figura B.1: Respuesta en escalon del sistema con u = 0,25.
0 50 100 150 200 250 300 350
1
0.8
0.6
0.4
0.2
0
muestras
x
1
0 50 100 150 200 250 300 350
0
1
2
3
4
5
muestras
x
2
Figura B.2: Respuesta en escalon del sistema con u = 0,25.
Apendice C
Analisis de la continuidad del coste
optimo
C.1. El problema de programacion matematica en
el MPC
Como es bien sabido, la estrategia de horizonte deslizante con la que se aplica el
control predictivo en bucle cerrado, hace que en cada periodo de muestreo se resuelva
un problema de optimizacion que tiene la forma:
mn
u
F
J
N
(x
k
, u
F
) (C.1)
s.a
x(k + j[k) X j = 0, , N 1
x(k + N[k)
u(k + j[k) U j = 0, , N 1
J
N
(x
k
, u
F
(k)) =
N1
i=0
L(x(k + i[k), u(k + i[k)) +V (x(k + N[k))
que depende del comportamiento futuro del sistema y de las actuaciones a lo largo del
horizonte de prediccion N.
Las restricciones en el estado en el instante j-esimo x(k + j[k) pueden expresarse
mediante un conjunto de ecuaciones
g
x
j
(x) _ 0
281
282 C.1. El problema de programacion matematica en el MPC
de forma que para j = 0, , N1 representan el conjunto X y para j = N representan
el conjunto .
A su vez, las restricciones en las actuaciones se pueden expresar como
g
u
(u) _ 0
de forma que estas ecuaciones representan el conjunto U.
Dado que los estados predichos dependen del estado actual x
k
y de la secuencia de
actuaciones u
F
, el problema de optimizacion a resolver es en general, un problema de
programacion no lineal con la siguiente forma:
mn
u
F
J
N
(x
k
, u
F
)
s.a
G(x
k
, u
F
) _ 0
donde la funcion G(, ) representa las restricciones sobre el estado y sobre las actua-
ciones.
Otra forma de plantear este problema de programacion matematica es mediante
la denominada formulaci on simultanea (Biegler 1998). En esta, la prediccion de los
estados futuros no se incluye implcitamente en las restricciones y en el funcional del
problema de optimizacion. Para ello se a nade como variable adicional de optimizacion
la secuencia de estados futuros del sistema. Esta nueva variable debe satisfacer en
cada instante el modelo de prediccion, lo que a nade n
x
N restricciones de igualdad
a las restricciones de desigualdad derivadas de las restricciones en el estado y en las
actuaciones. El problema de optimizacion se formula pues de la siguiente forma:
mn
u
F
,x
F
J
N
(x
k
, x
F
, u
F
) (C.2)
s.a
x(k + j + 1[k) = F(x(k + j[k), u(k + j[k)) j = 0, , N
x(k[k) = x
k
g
x
j
(x(k + j[k)) _ 0 j = 0, , N
g
u
(u(k + j[k)) _ 0 j = 0, , N 1
La solucion optima de este problema de optimizacion es tambien la solucion optima del
problema no simultaneo (C.1). Esta formulaci on del problema rompe la composicion
sucesiva del modelo que es necesaria para la prediccion de x(k +j[k) a partir del esta-
do x
k
. De esta forma el problema de optimizacion esta mejor condicionado, haciendose
menos sensible a errores o perturbaciones en el estado (Biegler 1998). Ademas es mas
sencilla en su implementacion y ofrece un marco de analisis del problema de opti-
mizacion mas intuitivo.
Apendice C. Analisis de la continuidad del coste optimo 283
La formulacion simultanea responde a un problema de programacion no lineal de
la forma:
mn
u
F
,x
F
J
N
(x
k
, x
F
, u
F
)
s.a
H(x
k
, x
F
, u
F
) = 0
G(x
k
, x
F
, u
F
) _ 0
En ambas formulaciones, el problema de optimizacion a resolver depende del estado
en el que se encuentra el sistema, de forma que la solucion optima obtenida es una
funcion del estado u
F
= u
F
(x
k
). Por tanto el problema de optimizacion es un problema
de programacion parametrica, dependiente del estado del sistema.
Resulta de interes analizar como vara la solucion optima del problema, as como
el coste optimo, al variar el estado del sistema, es decir, al variar el parametro. Este
analisis se enmarca dentro del analisis de sensibilidad de un problema de programacion
no lineal.
Esto es particularmente util para el analisis de robustez del controlador MPC que
se desarrolla en el captulo 5, en el cual se demuestra que la suavidad del coste optimo
es condicion suciente para garantizar robustez del controlador. A continuaci on se
presentan algunos resultados de sensibilidad del problema de optimizacion del MPC,
orientados a garantizar suavidad del coste optimo. Primero se establecen condiciones
para imponer la continuidad Lipschitz, que es la forma menos exigente de suavidad y
despues se extiende a condiciones de mayor orden.
C.2. Analisis de sensibilidad de un problema NLP
En esta seccion se presentan resultados conocidos sobre la sensibilidad de un proble-
ma de programacion matematica no lineal (NLP) que seran de utilidad para el analisis
de la suavidad del coste optimo del MPC. Como se ha comentado, el presente analisis se
centra en la continuidad del coste optimo con respecto a la variacion de los parametros
de los que depende. Un estudio mas extenso y profundo sobre el analisis de sensibilidad
de problemas de programacion matematica puede encontrarse en (Fiacco 1983) y en
sus referencias.
El problema de programacion no lineal parametrica, cuyas variables de decision son
x y que depende del vector de parametros y, se formula de la siguiente forma:
284 C.2. Analisis de sensibilidad de un problema NLP
mn
x
f(x, y) (C.3)
s.a
h(x, y) = 0
g(x, y) _ 0
en el cual el vector x IR
n
es el conjunto de variables respecto al cual se minimiza, y el
vector y IR
m
es el conjunto de parametros del que depende el problema. La funcion
de coste f(, ) es una funcion escalar, la funcion h(, ) representa las p restricciones de
igualdad y g(, ) representa las k restricciones de desigualdad impuestas al sistema.
La solucion optima de este problema dependera en general de los parametros, por
lo que x
= x
(y). En consecuencia el coste optimo tambien depende de los parametros

f
(y). El conjunto de puntos factibles, es decir que satisfacen las restricciones, depende
tambien del valor de los parametros y se dene como
S(y) = x IR
n
[h(x, y) = 0, g(x, y) _ 0
Denicion C.1 El conjunto S(y) es uniformemente compacto en una vecindad N( y)
en torno a y si el cierre de

yN( y)
S(y) es un conjunto compacto.
A continuacion se establece el primer resultado de este analisis, en el que se estable-
cen condiciones para garantizar la continuidad Lipschitz del coste optimo.
Teorema C.2 (Continuidad Lipschitz) (Gauvin & Dubeau 1982)
Sea un problema de programacion parametrica (C.3) que satisface las siguientes condi-
ciones:
(i) Sean las funciones que denen el problema f,g y h funciones (
1
.
(ii) Sea el problema de optimizacion factible para un cierto valor de los parametros
y.
(iii) Sea x el optimo del problema para un valor de los parametros y, tal que satisface
las condiciones de Magasarian-Fromovitz:
a) Existe una direccion d IR
n
tal que
x
g
i
( x, y)d < 0 si g
i
( x, y) = 0
x
h( x, y)d = 0
b) El jacobiano
x
h( x, y) es de rango maximo.
(iv) Sea el conjunto factible S(y) uniformemente compacto en una vecindad de y.
Entonces el coste optimo f
(y) es localmente Lipschitz en una vecindad de los paramet-

ros.
Teorema C.3 (Teorema de sensibilidad)(Fiacco 1983)
Sea un problema de programacion parametrica (C.3) que satisface las siguientes condi-
ciones:
1. Sea x
la solucion optima del problema para un valor de los parametros y = 0.

2. Sean las funciones que denen el problema f(, ),g(, ) y h(, ) funciones (
2
respecto a x y (
1
respecto a y en un vecindad de x = x
e y = 0.
3. Sea x
una solucion optima tal que satisface las condiciones sucientes de segundo
orden.
4. Sea x
una solucion optima tal que satisface la condicion de independencia lineal:

La matriz formada por
_
_

x
g
i
(x
, 0)
x
h(x
, 0)
_
_
para todo i tal que g
i
(x
, 0) = 0, es de rango maximo por las.

5. Las restricciones de desigualdad activas g
i
(x
, 0) = 0 son no degeneradas, es
decir, que sus multiplicadores de Lagrange asociados
i
son positivos.
Entonces en una vecindad de y = 0, se verica la condicion suciente de segundo
orden en x
(y) y ademas la solucion optima, los multiplicadores de Lagrange, as como

el coste optimo son funciones (
1
respecto a los parametros y.
Bajo las hipotesis de los dos teoremas anteriores se deduce la continuidad Lipschitz
del coste optimo en una vecindad de los parametros. Las condiciones del teorema
C.2 son menos restrictivas que las del teorema C.3. En primer lugar, las funciones
que denen el problema deben ser (
1
, y ademas el punto optimo debe satisfacer la
condicion de Magasarian-Fromovitz, para la cual la condicion de independencia lineal
es suciente. Es decir, la condicion de independencia lineal implica la de Magasarian-
Fromovitz, pero no al contrario. Tan solo cuando el problema no presenta restricciones
de igualdad, ambas son equivalentes.
286 C.3. Continuidad Lipschitz del coste optimo J
N
(x
k
)
Ademas resulta complejo determinar cuando el mnimo obtenido para un determi-
nado problema satisface las condiciones sucientes de segundo orden. En (Biegler 1998),
L.T. Biegler arma que no es frecuente que el hessiano de la lagrangiana en el punto
optimo sea denido positivo, por lo que no se satisfacen dichas condiciones. Aunque
en dicho trabajo se establece que cuando el sistema se encuentra en las proximidades
del punto de equilibrio, los multiplicadores de Lagrange tienden a anularse, haciendose
dicho hessiano denido positivo. Esta propiedad es aprovechada para aumentar la tasa
de convergencia del algoritmo de optimizacion.
El teorema C.3 puede extenderse para demostrar que la solucion optima x
(y) es
una funcion (
p
. Para ello basta imponer que las funciones implicadas en el problema
sean de mayor orden: f(, ),g(, ) y h(, ) sean (
p+1
respecto a x y (
p
respecto a y.
C.3. Continuidad Lipschitz del coste optimo J
N
(x
k
)
Como se expuso en una seccion anterior, el problema de optimizacion del MPC es
un problema parametrico en el estado del sistema. Por tanto, basandose en los teoremas
anteriores, es posible establecer condiciones bajo las cuales el coste optimo J
N
(x) es
localmente Lipschitz con el estado. Para ello se va a distinguir dos casos: con y sin
restricciones en el estado.
C.3.1. MPC con restricciones en el estado
Previamente se va a analizar bajo que condiciones se satisfacen las hipotesis de los
teoremas anteriores. Primero se va a comprobar que el problema de optimizacion en
formulaci on simultanea (C.2) verica la condicion de Magasarian-Fromovitz si y solo
si el problema (C.1) satisface la condicion de independencia lineal.
Sea el modelo de prediccion x
k+1
= F(x
k
, u
k
). Se denotara en lo que sigue:
A
i
=
x
F(x(k + i[k), u(k +i[k))
B
i
=
u
F(x(k + i[k), u(k +i[k))
C
x
i
=
x
g
x
(x(k +i[k))
C
u
i
=
u
g
u
(u(k +i[k))
As, los jacobianos de las restricciones son:
h(x
F
, u
F
) =
_

x
h
u
h
_
x
h(x
F
, u
F
) =
_
_
I
A
1
I
.
.
.
.
.
.
.
.
.
.
.
.
A
N2
I
A
N1
I
_
u
h(x
F
, u
F
) =
_
_
B
0

B
1

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
B
N2

B
N1
_
_
g(x
F
, u
F
) =
_
_

x
g
x

u
g
u
_
_
=
_
_
C
x
1

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
C
x
N

C
u
1

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
C
u
N
_
_
Un vector de direccion d verica la condicion de Magasarian-Fromovitz si
h(x
F
, u
F
)d = 0
g
a
(x
F
, u
F
)d 0
siendo g
a
el conjunto de restricciones de desigualdad que estan activas. Dividiendo
el vector d = [d
x
, d
u
],
h(x
F
, u
F
)d =
x
hd
x
+
u
hd
u
= 0
N
(x
k
)
y teniendo en cuenta que
x
h es invertible se tiene que
d
x
= (
x
h)
1
u
hd
u
= h
xu
d
u
La matriz (
x
h)
1
es una matriz triangular inferior y la matriz
u
h es diagonal,
por lo que h
xu
sera una matriz triangular inferior dada por:
h
xu
ij
=
_
_
0 i < j
B
j1
i = j
_
i1
s=j
A
s
_
B
j1
i > j
siendo
i1
s=j
A
s
= A
j
A
j1
A
i
Se puede observar que
h
xu
ij
=
x(k + i[k)
u(k +j 1[k)
Sustituyendo en g
gd =
_
_

x
g
x
h
xu
u
g
u
_
_
d
u
=
_
_

u
g
x
u
g
u
_
_
d
u
La submatriz superior
u
g
x
es una matriz triangular superior tal que
u
g
x
ij
=
g
x
(x(k + i[k))
u(k + j 1[k)
La submatriz inferior
u
g
u
es una submatriz diagonal a bloques tal que
u
g
u
ij
=
g
u
(u(k +i 1[k))
u(k + j 1[k)
Por tanto para que se satisfaga la condicion de Magasarian-Fromovitz deben ve-
ricarse dos condiciones: que el jacobiano
u
h sea de rango maximo y que las las
de gd correspondientes a las restricciones activas sean menores que cero para alg un
vector d. La primera de las condiciones se satisface siempre por ser la submatriz
x
h
de rango maximo. La segunda condicion se satisface si y solo si dichas las de la matriz
g son de rango maximo por las. Es decir, siempre que las restricciones expresadas
de forma no simultanea, veriquen la condicion de independencia lineal.
Esta condicion no es muy exigente y es suciente para la aplicacion de metodos
duales de optimizacion.
Por otro lado, el conjunto de actuaciones factibles asociada a un determinado estado
de la planta |(x
k
) debe ser uniformemente compacto. Dado que las actuaciones estan
restringidas a un conjunto compacto U, el conjunto |(x
k
) es acotado.
Corolario C.4 Sea el problema de optimizacion del MPC (C.1) tal que el modelo de
prediccion F(x, u), la funcion de coste de etapa L(x, u), la funcion de coste terminal
V (x) y las funciones que denen los conjuntos de restricciones g
x
(x), g
u
(u) son fun-
ciones (
1
. Sea un estado actual x
k
tal que el conjunto de actuaciones factibles es un
conjunto compacto. Sea el optimo de dicho problema tal que satisface la condicion de
independencia lineal de las restricciones activas. Entonces la funcion de coste optimo
J
N
(x
k
) es localmente Lipschitz en un vecindad de estados en torno a x
k
.
prediccion F(x, u), la funcion de coste de etapa L(x, u), la funcion de coste termi-
nal V (x) y las funciones que denen los conjuntos de restricciones g
x
(x), g
u
(u) son
funciones (
2
. Sea el optimo de dicho problema tal que satisface la condicion de inde-
pendencia lineal de las restricciones activas y la condicion suciente de segundo orden.
Entonces la funcion de coste optimo J
N
(x
k
) es localmente Lipschitz en un vecindad de
estados en torno a x
k
.
De estos dos resultados se inere que si las funciones que denen el problema de
optimizacion son (
1
, entonces es necesario comprobar la compacidad del conjunto de
actuaciones factibles. En el caso en que estas funciones sean (
2
entonces no es necesario
determinar dicha compacidad.
Teorema C.6 Sea el problema de optimizacion MPC tal que el coste optimo es local-
mente Lipschitz en una vecindad de x, para todo estado x en el que el problema tiene
solucion factible x X
N
. Entonces el coste optimo es Lipschitz en todo subconjunto
conexo y compacto de X
N
.
N
(x
k
)
Demostracion:
Supongase que conjunto X
N
es un conjunto compacto (Mayne 2001)(si no fuese as,
el resultado es valido para un conjunto compacto incluido en X
N
, como por ejemplo
r
= x IR
n
: J
N
(x) r). Sea un conjunto convexo tal que X
N
. Entones
para todo x, y existe una recta de la forma z = x+(yx) con [0, 1]. Sea z
k
una secuencia de n
z
puntos de dicha recta con z
1
= x y z
n
z
= y, tal que z
k+1
pertenece
a la vecindad de z
k
en la que la funcion de coste optimo es localmente Lipschitz con
una constante de Lipschitz L
k
.
[J
N
(x, u
F
(x)) J
N
(y, u
F
(y))[ = [
nz1
k=1
J
N
(z
k
, u
F
(z
k
))
n
z
k=2
J
N
(z
k
, u
F
(z
k
))[
nz1
k=1
[J
N
(z
k
, u
F
(z
k
)) J
N
(z
k+1
, u
F
(z
k+1
))[
nz1
k=1
L
k
|z
k+1
z
k
|
L
J
nz1
k=1
|z
k+1
z
k
| = L
J
|x y|
La constante L
J
es la mayor de las constantes de Lipschitz L
k
.
En caso de que el conjunto X
N
sea convexo, este resultado demuestra que es Lip-
schitz. En caso de que no lo sea, el conjunto X
N
podra ser no conexo. En este caso
considerese que X
N
=

i
X
i
N
siendo X
i
N
subconjuntos conexos disjuntos de X
N
.
El resultado obtenido para conjuntos convexos se puede extender a conjuntos no
convexos conexos: para todo par de puntos x, y pertenecientes a X
i
N
existe una secuen-
cia nita de n
v
puntos v
k
con v
1
= x y v
n
v
= y, tales que todos los puntos de la
recta v
k
+
k
(v
k+1
v
k
) pertenecen a X
N
y ademas |v
k
v
k+1
| |x y|. Entonces,
se tiene que
[J
N
(x, u
F
(x)) J
N
(y, u
F
(y))[ = [
nv1
k=1
J
N
(v
k
, u
F
(v
k
))
nv
k=2
J
N
(v
k
, u
F
(v
k
))[
nv1
k=1
L
Ji
|v
k+1
v
k
| = n
v
L
Ji
|x y|
Por tanto J
N
(x) es Lipschitz en X
i
N
.
C.3.2. MPC sin restricciones en el estado
Lema C.7 Sea la funcion de coste de etapa L(x, u) Lipschitz en x con una constante
L
c
. Sea el modelo del sistema F(x, u) Lipschitz en x con una constante L
f
. Sea la
funcion de Lyapunov asociada al controlador local en la region terminal V (x) Lipschitz
en x con una constante L
v
. Entonces se verica que
[J
N
(x + x, u
F
) J
N
(x, u
F
)[ L
J
|x|
siendo
L
J
= L
c
L
N
f
1
L
f
1
+ L
v
L
N
f
Demostracion:
Sea x(k +j[k) el estado predicho con el modelo tal que x
k
= x, y sea x(k +j[k) al
estado predicho partiendo de x
k
= x + x. Dado que el modelo es Lipschitz en x, se
tiene que
| x(k + j[k) x(k + j[k)| L
j
f
|x|
Seg un esto se tiene que
[J
N
(x + x, u
F
) J
N
(x, u
F
)[ = [
N1
i=0
_
L( x(k + i[k), u(k + i[k))
L(x(k + i[k), u(k + i[k))
_
+V ( x(k + N[k)) V (x(k + N[k))[
N1
i=0
L
c
L
i
f
|x| + L
v
L
N
f
|x|
_
L
c
L
N
f
1
L
f
1
+ L
v
L
N
f
_
|x|
Teorema C.8 Sea un sistema no lineal controlado por un MPC cuyo dominio de atrac-
cion es X
N
. Sea la funcion de coste de etapa L(x, u) Lipschitz respecto a x en el con-
junto X
N
con una constante L
c
. Sea el modelo del sistema F(x, u) Lipschitz respecto
N
(x
k
)
a x en el conjunto X
N
con una constante L
f
. Sea la funcion de Lyapunov asociada al
controlador local en la region terminal V (x) Lipschitz respecto a x en el conjunto X
N
con una constante L
v
. Entonces el coste optimo es Lipschitz en X
N
de forma que
[J
N
(y) J
N
(x)[ L
J
|y x|
para todo x, y X
N
, siendo
L
J
= L
c
L
N
f
1
L
f
1
+ L
v
L
N
f
Demostracion:
Por el principio de optimalidad se tiene que
J
(y) < J(y, u

F
)
para toda secuencia de actuaciones factibles. Teniendo en cuenta que la secuencia
optima en x, u
F
(x), es factible para todo y X
N
y considerando el lema anterior, se
demuestra el teorema. Para ello se distinguen dos casos:
a) J
N
(y) > J
N
(x)
J
N
(y) J
N
(x) J
N
(y, u
F
(x)) J
N
(x, u
F
(x)) L
J
|y x|
b) J
N
(y) < J
N
(x)
J
N
(x) J
N
(y) J
N
(x, u
F
(y)) J
N
(y, u
F
(y)) L
J
|y x|
y por tanto
[J
N
(y) J
N
(x)[ L
J
|y x|
siendo L
J
la constante calculada en el lema anterior.
C.4. Continuidad Lipschitz local del coste optimo
J
N
(x
k
) ante incertidumbres parametricas
Sea un sistema que responde a un modelo
x
k+1
= f(x
k
, u
k
, w
k
) (C.4)
siendo x
k
IR
n
el estado del sistema en el instante k, u
k
IR
m
el vector de actuaciones
sobre el sistema y w
k
IR
q
las incertidumbres que afectan al sistema. Cada una de
estas se nales estan connadas en una serie de restricciones a lo largo del tiempo, de
forma que
x
k
X (C.5)
u
k
U (C.6)
w
k
W (C.7)
El sistema presenta, en ausencia de incertidumbres, un punto de equilibrio en el origen,
por tanto f(0, 0, 0) = 0. En consecuencia, para que el sistema en ausencia de incer-
tidumbres pueda evolucionar al punto de equilibrio, los conjuntos X, U y W deben
contener el vector nulo en su interior.
En lo que sigue se denotara

f(x
k
, u
k
) = f(x
k
, u
k
, 0) al modelo nominal del sistema,
en ausencia de incertidumbres sobre el sistema. Al estado obtenido con el modelo
nominal, se denotara x
k
.
El problema de optimizacion del MPC es en este caso un problema NLP parametri-
co que depende en general del estado actual y del valor del parametro del modelo w
considerado en la prediccion del comportamiento del sistema. Si este se considera con-
stante para toda la prediccion, entonces el coste optimo dependera de J
N
(x
k
, w
k
). Sin
embargo, si se considera que el parametro del modelo vara a lo largo de la prediccion,
el coste optimo dependera de la realizacion de incertidumbres futuras que afectan al
sistema w
F
, J
N
(x
k
, w
F
). En lo que sigue se considera el primer caso.
La solucion optima del MPC en el caso nominal (en ausencia de incertidumbres) es
J
(x
k
, 0). La variacion del coste optimo ante una variaci on en w
k
es un problema de
analisis de sensibilidad y se puede aplicar los resultados del apartado C.2. En particular,
bajo hipotesis semejantes a las obtenidas para la continuidad Lipschitz frente al estado,
el coste optimo es Lipschitz ante variaciones en las incertidumbres.
prediccion F(x, u, w), la funcion de coste de etapa L(x, u), la funcion de coste termi-
nal V (x) y las funciones que denen los conjuntos de restricciones g
x
(x), g
u
(u) son
294 C.4. Continuidad Lipschitz local del coste optimo J
N
(x
k
) ante incertidumbres parametricas
funciones (
1
. Sea un estado actual x
k
tal que el conjunto de actuaciones factibles es
un conjunto compacto para un conjunto de realizaciones de las incertidumbres en una
vecindad de w
k
= 0. Sea el optimo del problema MPC con el modelo nominal (w
k
= 0)
tal que satisface que la condicion de independencia lineal de las restricciones activas.
Entonces la funcion de coste optimo J
(x
k
, w
k
) es localmente Lipschitz en un vecindad
de incertidumbres w
k
en torno a w
k
= 0.
[J
(x
k
, w
k
) J
(x
k
, 0)[ L
w
|w
k
|
Por tanto la variacion del coste optimo por una variacion en las incertidumbres esta aco-
tada, y dicha cota dependera en general del tama no del conjunto de incertidumbres W.
Este resultado es de particular interes para el analisis de robustez del MPC ante
incertidumbres no aditivas.
Bibliografa
Alamir, M. & Bornard, G. (1995), Stability of truncated innite constrained receding
horizon scheme: The gerenal discrete nonlinear case, Automatica 31, 13531356.
Allgower, F., Badgwell, T. A., Qin, J. S., Rawlings, J. B. & Wright, S. J. (1999), Non-
linear model predictive control and moving horizon estimation - an introductory
overview, in P. M. Frank, ed., Advances in Control, Springer, pp. 391449.
Arstein, Z. (1983), Stabilization with relaxed controls, Nonlinear Analysis 7, 1163
1173.
Bellman, R. (1957), Dynamic Programming, Princeton Universuty Press.
Bemporad, A. (1998), Reducing conservativeness in predictive control of constrained
systems with disturbances, in Proceedings of the CDC.
Bemporad, A., Borrelli, F. & Morari, M. (2001), Robust model predictive control:
Piecewise linear explicit solution, in Proceedings of the ECC.
Bemporad, A., Chisci, L. & Mosca, E. (1995), On the stabilizing property of SIORHC,
Automatica 31, 20132015.
Bemporad, A., Morari, M., Dua, V. & Pistikopoulos, E. (2000), The explicit solution
of model predictive control via multiparametric quadratic programming, en Pro-
ceedings of the ACC.
Bertsekas, D. M. (1972), Innite-time reachability of state-space regions by using feed-
back control, IEEE Transactions on Automatic Control 17, 604612.
Biegler, L. T. (1998), Advances in nonlinear programming concepts for process control,
International Journal of Process Control 8(5-6), 301311.
Bitmead, R. R., Gervers, M. & Wertz, V. (1990), Adaptive optimal control - The think-
ings man GPC, Prentice-Hall.
Bitsoris, G. (1988), On the positive invariance of polyhedral sets for discrete-time
systems, Systems & Control Letters 11, 243248.
295
296 BIBLIOGRAF
IA
Blanchini, F. (1994), Ultimate boundedness control for discrete-time uncertain system
via set-induced lyapunov functions, IEEE Transactions on Automatic Control
39, 428433.
Blanchini, F. (1999), Set invariance in control, Automatica 35, 17471767.
Boyd, S., Ghaoui, L. E., Feron, E. & Balakrishnan, V. (1994), Linear Matrix Inequalities
in systems and control theory, SIAM.
Bryson, A. & Ho, Y. (1969), Applied Optimal Control, Blaisdell Publishing Company.
Camacho, E. F. & Bordons, C. (1999), Model Predictive Control, 2 edn, Springer-Verlag.
Campo, P. J. & Morari, M. (1987), Robust model predictive control, en Proceedings
of the ACC.
Chen, H. & Allgower, F. (1997), A quasi-innite horizon nonlinear model predictive
control scheme for stable systems: application to a CSTR, en Proceedings of the
ADCHEM.
Chen, H. & Allgower, F. (1998a), Nonlinear model predictive control scheme with
guaranteed stability, en R.Berber & C. Kravaris, eds, Nonlinear Model Based
Process Control, Kluwer Academic Publisher, pp. 465494.
Chen, H. & Allgower, F. (1998b), A quasi-innite horizon nonlinear model predictive
control scheme with guaranteed stability, Automatica 34(10), 12051218.
Chisci, L., & Mosca, E. (1994), Stabilizing i-o receding horizon control of CARMA
plants, IEEE Transactions on Automatic Control 39, 614618.
Chisci, L., Lombardi, A. & Mosca, E. (1996), Dual receding horizon control of con-
strained discrete-time linear systems, European Journal of Control 2, 278285.
Chisci, L., Rossiter, J. A. & Zappa, G. (2001), Systems with persistent disturbances:
predictive control with restricted constraints, Automatica 37, 10191028.
Chisci, L. & Zappa, G. (1999), Robustifying a predictive controller against persistent
disturbances, en Proceedings of the ECC.
Clarke, D. W., Mohtadi, C. & Tus, P. S. (1987a), Generalized predictive control. Part
I: The basic algorithms, Automatica 23, 137148.
Clarke, D. W., Mohtadi, C. & Tus, P. S. (1987b), Generalized predictive control. Part
II: Extensions and interpretations, Automatica 23, 149160.
Cutler, C. R. & Ramaker, B. L. (1980), Dynamic matrix control- a computer control
algorithm, en Proceedings of Automatic Control Conference.
BIBLIOGRAF
IA 297
De Nicolao, G., Magni, L. & Scattolini, R. (1996), On the robustness of receding hori-
zon control with terminal constraints, IEEE Transactions on Automatic Control
41, 451453.
De Nicolao, G., Magni, L. & Scattolini, R. (1998), Stabilizing receding-horizon control
of non-linear time-varying systems, IEEE Transactions on Automatic Control
43, 10301036.
De Nicolao, G., Magni, L. & Scattolini, R. (2000), Stability and robustness of nonlin-
ear receding horizon control, en F.Allgower & A.Zheng, eds, Nonlinear Model
Predictive Control, Birkhauser.
De Oliveira Kothare, S. L. & Morari, M. (2000), Contractive model predictive con-
trol for constrained nonlinear systems, IEEE Transactions on Automatic Control
45, 10531071.
Fiacco, A. V. (1983), Introduction to Sensivity and Stability Analysis in Nonlinear
Programming, Vol. 165 of Mathematics in Science and Engineering, Academic
Press.
Garca, C. E. & Morshedi, A. M. (1986), Quadratic programming solution of dynamic
matrix control (QDMC), Chemical Engineering Communications 46, 7387.
Garca, C. E., Prett, D. M. & Morari, M. (1989), Model predictive control: theory and
practice - a survey, Automatica 25, 335348.
Gauvin, J. & Dubeau, F. (1982), Dierential properties of the marginal function in
mathematical programming, Mathematical Programming Study 19, 101119.
Genceli, H. & Nikolau, M. (1993), Robust stability analysis of constrained l
1
-norm
model predictive control, AIChE Journal 39, 19541965.
Geromel, J. C. & Da Cruz, J. J. (1987), On the robustness of optimal regulators
for nonlinear discrete-time systems, IEEE Transactions on Automatic Control
32, 703710.
Gilbert, E. G. & Tan, K. (1991), Linear systems with state and control constraints: The
theory and application of maximal output admissible sets, IEEE Transactions on
Automatic Control 36, 10081020.
Glad, S. T. (1987), Robustness of nonlinear state feedback - a survey, Automatica
23, 425435.
Gomez Ortega, J. (1994), Navegaci on en robots moviles basada en tecnicas de control
predictivo neuronal, PhD thesis, Universidad de Sevilla.
Gomez Ortega, J., Ramrez, D. R., Limon Marruedo, D. & Camacho, E. F. (2001), Ge-
netic algorithms based predictive control for mobile robot navigation in changing
environments, en Proceedings of the ECC.
298 BIBLIOGRAF
IA
Hansen, E. (1992), Global optimization using interval analysis, Marcel Dekker, Inc.
Henson, M. A. & Seborg, D. E. (1997), Nonlinear process control, Prentice Hall.
Jadbabaie, A., Yu, J. & Hauser, J. (2001), Unconstrained receding-horizon control of
nonlinear systems, IEEE Transactions on Automatic Control 46(5), 776783.
Jiang, Z.-P. & Wang, Y. (2001), Input-to-state stability for discrete-time nonlinear
systems, Automatica 37, 857869.
Jiang, Z.-P. & Wang, Y. (2002), A converse lyapunov theorem for discrete-time systems
with disturbances, Systems & Control Letters 45, 4958.
Jiang, Z., Sontag, E. & Wang, Y. (1999), Input-to-state stability for discrete-time
nonlinear systems, en Proceedings of the IFAC World Congress.
J.Qin, S. & Badgwell, T. A. (1997), An overview of industrial model predictive control
technology, en Proceedings of the conference on Chemical Process Control.
Keartfort, R. B. (1996), Rigorous global search: continuous problems, Kluwer Academic
Publishers.
Keerthi, S. S. & Gilbert, E. G. (1987), Computation of minimum-time feedback control
laws for discrete-time systems with state-control constraints, IEEE Transactions
on Automatic Control 32, 432435.
Keerthi, S. S. & Gilbert, E. G. (1988), Optimal innite-horizon feedback laws for a
general class of constrained discrete-time systems: Stability and moving-horizon
approximations, Journal of Optimization Theory and Applications 37, 265293.
Kerrigan, E. C. (2000), Robust Constraint Satisfaction: Invariant Sets and Predictive
Control, PhD thesis, University of Cambridge.
Kerrigan, E. C. & Maciejowski, J. M. (2000), Invariant sets for constrained discrete-time
systems with application to feasibility in model predictive control, en Proceedings
of the CDC.
Kerrigan, E. C. & Maciejowski, J. M. (2001), Robust feasibility in model predictive
control: Necessary and sucient conditions, en Proceedings of the CDC.
Khalil, H. (1996), Nonlinear Systems, 2 edn, Prentice-Hall.
Kolmanovsky, I. & Gilbert, E. G. (1998), Theory and conmputation of disturbance
invariant sets for discrete-time linear systems, Mathematical Problems in Engi-
neering: Theory, Methods and Applications 4, 317367.
Kothare, M. V., Balakrishnan, V. & Morari, M. (1996), Robust constrained model
predictive control using linear matrix inequalities, Automatica 32, 13611379.
BIBLIOGRAF
IA 299
Kwon, W. H. & Pearson, A. E. (1977), A modied quadratic cost problem and feedback
stabilization of a linear system, Automatica 22, 838842.
Lee, E. B. & Markus, L. (1967), Foundations of optimal control theory, Wiley.
Lee, J. H. & Yu, Z. (1997), Worst-case formulations of model predictive control for
systems with bounded parameters, Automatica 33, 763781.
Limon Marruedo, D.,

Alamo, T. & Camacho, E. F. (2002a), Enlarging the domain of
attraction of MPC controller using invariant sets, en Proceedings of the IFAC
World Congress.
Limon Marruedo, D.,

Alamo, T. & Camacho, E. F. (2002b), Input-to-state stable MPC
for constrained discrete-time nonlinear systems with bounded additive uncertain-
ties, en Proceedings of the CDC.
Limon Marruedo, D.,

Alamo, T. & Camacho, E. F. (2002c), Stability analysis of sys-
tems with bounded additive uncertainties based on invariant sets: Stability and
feasibility of MPC, en Proceedings of the ACC.
Limon Marruedo, D.,

Alamo, T. & Camacho, E. F. (2003), Stable constrained MPC
without terminal constraint, en Proceedings of the ACC, (pendiente de revision).
Limon Marruedo, D., Bravo, J. M.,

Alamo, T. & Camacho, E. F. (2002), Robust MPC
of constrained discrete-time nonlinear systems based on uncertain evolution sets:
application to a CSTR model, en Proceedings of the CCA.
Luenberger, D. E. (1989), Programacion lineal y no lineal, Addison-Wesley Iberoamer-
icana.
Magni, L., De Nicolao, G., Magnani, L. & Scattolini, R. (2001), A stabilizing model-
based predictive control algorithm for nonlinear systems, Automatica 37, 1351
1362.
Magni, L., Nijmeijer, H. & van der Shaft, A. (2001), A receding-horizon approach to
the nonlinear H
control problem, Automatica 37, 429435.

Magni, L. & Sepulchre, R. (1997), Stability margins of nonlinear receding-horizon
control via inverse optimality, Systems & Control Letters 32, 241245.
Marquis, P. & Broustail, J. P. (1988), SMOC, a bridge between state space and model
predictive controllers: application to the automation of a hydrotreating unit, en
Proceedings of the IFAC Workshop on model based predictive control.
Mayne, D. Q. (2000), Nonlinear model predictive control: Challeges and opportunities,
en F.Allgower & A.Zheng, eds, Nonlinear Model Predictive Control, Birkhauser,
pp. 2344.
300 BIBLIOGRAF
IA
Mayne, D. Q. (2001), Control of constrained dynamic systems, European Journal of
Control 7, 8799.
Mayne, D. Q. & Michalska, H. (1990), Robust horizon control of nonlinear systems,
IEEE Transactions on Automatic Control 35, 814824.
Mayne, D. Q., Rawlings, J. B., Rao, C. V. & Scokaert, P. O. M. (2000), Constrained
model predictive control: Stability and optimality, Automatica 36, 789814.
Mayne, D. Q. & Schroeder, W. R. (1997), Robust time-optimal control of constrained
linear systems, Automatica 33(12), 21032118.
Michalska, H. & Mayne, D. Q. (1993), Robust receding horizon control of constrained
nonlinear systems, IEEE Transactions on Automatic Control 38(11), 16231633.
Moore, E. (1996), Interval analysis, Prentice Hall.
Morari, M. (1994), Model predictive control: Multivariable control technique of choice
in the 1990s?, en D. Clarke, ed., Advances in Model-Based Predictive Control,
Oxford University Press.
Muske, K. R. (1995), Linear model predictive control of chemical processes, PhD thesis,
The University of Texas at Austin.
Nevistic, V. (1997), Constrained control of nonlinear systems, PhD thesis, Swiss Federal
Institute of technology (ETH), Z urich (Suiza).
Ollero, P. & Camacho, E. F. (1997), Control e instrumentacion de procesos qumicos,
Editorial Sntesis.
Parisini, T. & Zoppoli, R. (1995), A receding-horizon regulator for nonlinear systems
and a neural approximation, Automatica 31(10), 14431451.
Primbs, J. A., Nevistic, V. & Doyle, J. C. (2000), A receding horizon generaliza-
tion of pointwise min-norm controllers, IEEE Transactions on Automatic Control
45, 898909.
Propoi, A. I. (1963), Use of linear programming methods for synthesizing sampled-data
automatic systems, Automation and Remote Control 24, 837844.
Ramrez, D. R. (2002), Control Predictivo min-max: analisis, caracterizacion y tecnicas
de implementaci on, PhD thesis, Universidad de Sevilla.
Ramrez, D. R., Limon Marruedo, D., Gomez Ortega, J. & Camacho, E. F. (1999a),
Model based predictive control using genetic algorithms: Application to a pilot
plant, en Proceedings of the ECC.
Ramrez, D. R., Limon Marruedo, D., Gomez Ortega, J. & Camacho, E. F. (1999b),
Nonlinear MBPC for mobile robot navigation using genetic algortihms, en Pro-
ceedings of the ICRA.
BIBLIOGRAF
IA 301
Rawlings, J. B. & Muske, K. R. (1993), Stability of constrained receding horizon
control, IEEE Transactions on Automatic Control 38, 15121516.
Richalet, J., Rault, A., Testud, J. L. & Papon, J. (1978), Model predictive heuristic
control: Applications to industrial processes, Automatica 14, 413428.
Santos, L. O. & Biegler, L. T. (1999), A tool to analyze robust stability for model
predictive controllers, Journal of Process Control 9, 234246.
Scokaert, P. O. M. & Mayne, D. Q. (1998), Min-max feedback model predictive con-
trol for constrained linear systems, IEEE Transactions on Automatic Control
43(8), 11361142.
Scokaert, P. O. M., Mayne, D. Q. & Rawlings., J. B. (1999), Suboptimal model pre-
dictive control (feasibility implies stability), IEEE Transactions on Automatic
Control 44(3), 648654.
Scokaert, P. O. M., Rawlings, J. B. & Meadows, E. S. (1997), Discrete-time sta-
bility with perturbations: Application to model predictive control, Automatica
33(3), 463470.
Seborg, D. E., Edgar, T. & Mellichamp, D. (1989), Process Dynamics and Control,
Wiley.
Sontag, E. D. (1989a), Smooth stabilization implies coprime factorization, IEEE
Transactions on Automatic Control 34, 435443.
Sontag, E. D. (1989b), A universal construction of the Arsteins theorem on nonlinear
stabilization, Systems & Control Letters 13, 117123.
Sznaier, M. & Damborg, M. J. (1987), Suboptimal control of linear systems with state
and control inequality constraints, en Proceedings of the CDC.
Vidyasagar, M. (1993), Nonlinear Systems Theory, 2 edn, Prentice-Hall.
Yang, T. H. & Polak, E. (1993), Moving horizon control of nonlinear systems with
input saturation, disturbances and plant uncertainty, International Journal of
Control 58, 875903.
Zariou, E. (1990), Robust model predictive control of systems with hard constraints,
Computers and Chemical Engineering 14, 359371.
Zheng, A. (2000), Some practical issues and possible solutions for nonlinear model
predictive control, en F.Allgower & A.Zheng, eds, Nonlinear Model Predictive
Control, Birkhauser.

Control Predictivo.

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Control Predictivo.

Enviado por

Direitos autorais:

Formatos disponíveis

TESIS DOCTORAL

Control predictivo de sistemas

INDICE GENERAL iii

INDICE GENERAL vii

(x) Coste optimo, con horizonte innito, en el estado x.

(x) Coste asociado a la evolucion del sistema controlado por el MPC.

(k + j[k) Actuacion futura correspondiente al instante k + j de la secuencia

Vecindad del origen dada por x IR

Alamo & Camacho 2002c). A raz de estos, se incorpora un concepto novedoso

Alamo & Camacho 2002b).

(x) que minimiza el coste de regular el

(f(x, u))[ f(x, u) X

siendo la ley de control la solucion de este problema de optimizacion en cada estado

es el conjunto de estados asintoticamente estabili-

(X, 0). Es en este conjunto en el que esta denido

siendo 1 y h(x) una

18 2.3. El problema de la estabilidad: optimalidad no implica estabilidad

con horizonte deslizante para un sistema no

(k+j[k+1). Por tanto,

para ciertas constantes l > 0

(k+j[k) para j = 1, , N. Es facil comprobar que J

(k +1[k). As, aplicando la secuencia u

Sea la secuencia optima u

Entonces, si existe una constante r tal que J

, seg un la teora de Lya-

(k + i[k)) + V (x(k +N[k))

44 3.3. Formulacion general del MPC

(x) = L(x, h(x))

(x) de forma analtica, salvo en el caso de sistemas lineales. Este coste

(x) siendo x(i[i) = x, para todo x S

(f(x, h(x))) para todo x S

por lo tanto, considerando que V

(x) 0, se verica que

En consecuencia considerando un M tal que

(x) al coste optimo con horizonte innito. Se denomina

(x) representa el coste asociado a la evolucion del sistema

(x) para todo x .

(x), y por lo tanto

(k + j[k) para todo j = 0, , N

(x) el coste de la evolucion del sistema controlado por la ley de control

para cierto > 1) y calc ulese la matriz P tal que

)] arbitrariamente peque na. Calcular la constante > 0 tal que para

x se puede reescribir como

que resuelve la ecuacion de Lyapunov

tal que se veri-

Figura 3.15: Evolucion de en funcion de .

), siendo () la funcion / tal que

(k + N[k) , y se satisface la restriccion terminal.

(k + N[k) y por lo tanto

(k+N[k) / , ning un otro estado x

(k+j[k) / , para j = 0, , N1.

(k + N[k) / , pero existe

(k +i[k) . Por optimalidad se tiene que la solucion optima del MPC

(k + i[k) / lo que es una contradiccion, demostrandose el lema.

(k + N[k) pertenece a . Entonces, del lema anterior se tiene que x

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 83

(k[k)). Por tanto si x

(k+N[k) , se tiene que la secuencia

siendo L(x, u) l|x|

y [0, l], para todo

. En consecuencia, el problema tiene solucion factible en

tal que para todo N N

(X, ) para todo N N

(X, ) esta nitamente determinado, y por lo