Você está na página 1de 7

Identificación y control difusos mediante un núcleo

híbrido de transición de estados


José Ruiz Ascencio Rodolfo Castillo Romero
Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET)
Interior Internado Palmira S/N, Colonia Palmira, C.P. 62490, Cuernavaca, Morelos, México
E-mail: josera@cenidet.edu.mx acrcr@cenidet.edu.mx

Sumario. Se describen dos contribuciones: i) Una representación computacional de


los sistemas dinámicos para fines de identificación y control y ii) un control difuso
auto sintonizado por un método de gradiente descendente para implementarlo. El
núcleo híbrido de transición de estados (NHTE), inspirado en la función de transición
de estados, modela una amplia clase de sistemas invariantes de parámetros
concentrados. Este trabajo demuestra el uso del NHTE con redes neuronales y lógica
difusa para la identificación y control, incluyendo control de planta inversa con
realimentación. El NHTE es un método de modelado natural para el control digital de
sistemas de tiempo contínuo que ofrece posibilidades computacionales interesantes.

1. El núcleo híbrido de transición de estados.

Considérese un sistema de parámetros concentrados, invariante, de dimensión N con M entradas


que es observable y controlable. Nos referiremos a éste como la planta. Sea x(t) = [x0( t ), x1( t ),
… xN-1( t )]T una representación del sistema y y(t) la salida del sistema y una componente de x(t).
Sea Φ la función de transición de estados (No las ecuaciones diferenciales de la dinámica, como
en [1], sino su solución para un tiempo fijo). Podemos escribir x( t1 ) = Φ( x( t0 ), u[ t0, t1 ] ), en
donde u[ t0, t1 ] es la función de entrada para t en [ t0, t1 ], tal que con variantes mínimas podamos
referirnos a sistemas discretos o contínuos. Comparando con los cuatro modelos que se
contemplan en [1], éste corresponde al cuarto modelo, el más general.

La salida de la planta es una componente del estado x( t ): y( t ) = xN-1( t )


En un intervalo de muestreo T:
u(t)
x( t0 + T ) = Φ( x( t0 ), u[ t0, t0 +T ] )
u’(t)
La función de transición de estados Φ tiene la propiedad de
composición: .: y(t+T)
x( t0+2T ) = Φ( Φ( x( t0 ), u[ t0, t0+T ] ), u[t0+T, t0+2T ] ) y(t)
NHTE
y’(t)
:.
yn-1(t)

Considérese una realización de Φ en filas Φ0, Φ1, … ΦN-1. Cada Φk es un bloque con N + M
entradas y una salida. Todas las Φk’s tienen los mismos argumentos. Para sistemas de tiempo
continuo, elíjase un intervalo de muestreo T y restrínjase a que las señales de entrada sean
constante dentro de los intervalos [t0, t0+T), tal que u[t0, t0+T)=u(t0).

La evolución del vector de estado x(t) para sistemas estrictamente propios (sin componente
algebraica de la entrada en la salida), puede especificarse como xk( t0 +T ) = Φk( x( t0 ), u( t0 ) )
con k = 0, 1, 2, … N-1. (Si el sistema no es estrictamente propio, es necesario suministrar u(t0 +
T) en cada intervalo). Esta Φ es un híbrido: es una representación discreta de un sistema de
tiempo continuo, que puede emplear cantidades de éste último (e.g. derivadas de la salida o sus
estimados), pero también usa datos muestreados a intervalos discretos de tiempo. Para sistemas de
tiempo discreto, xk (j+1) = Φk( x( j ), u( j ) ) k = 0, 1, 2, … N-1.
Para un sistema causal Φk es un mapa pues tiene un valor único para cada punto del espacio de
argumentos. El mapa Φk puede considerarse un desdoblamiento del espacio de estados con
respecto a las entradas u. Podemos medir sus puntos para un sistema observable y controlable.
Como en [1], el sistema es, en general, no lineal. Sin embargo, no supondremos ninguna
estructura en particular. El objetivo es usar un único procedimiento para identificación y control.
El modelo que usamos corresponde al más general de los usados por Narendra and Parthasarathy.
En esa obra se usan redes neuronales como aproximadores universales capaces de representar
mapas estáticos no lineales. Aquí usamos además lógica difusa auto-sintonizada como otro medio
para el mismo fin. También utilizamos elementos de retraso para obtener sistemas dinámicos bien
planteados que aproximen la planta. Hasta aquí las similitudes, pues la obra citada usa una
representación diferencial y aquí se usarán los datos del sistema o sus estimados.

Las ventajas de usar sólo el núcleo híbrido son: i) El formalismo de la función de transición de
estados está bien establecido. ii) El NHTE es más fácil de analizar que la variedad de estructuras
usadas en [1]. iii) Se requiere menos información a priori (sobre todo en cuanto a estructura de la
planta).

2. Identificación y control

Por identificación de una planta nos referiremos a la obtención de la Φk para cada punto dentro
de un espacio de trabajo compacto. En la práctica, la identificación consiste en estimar Φk a partir
de un conjunto finito de puntos. Esto requiere aproximación, optimización e interpolación, para lo
cual usamos redes neuronales o lógica difusa. El procedimiento planteado ofrece varias ventajas
para los sistemas que cumplen las suposiciones: i) La representación de espacio de estados
obtenida es independiente de la entrada que se haya usado para ello, con tal que el espacio sea
muestreado. ii) La Φ obtenida sirve para cualquier punto de operación de la simulación o el
control. iii) La Φ es una representación natural del control por computadora.

Las desventajas: i) El espacio de estados tiene que ser muestreado con suficiente finura para que
no se oculte ninguna singularidad o cambio importante de valores entre datos.
Para el control de la planta deben considerarse dos casos importantes del núcleo de transición
de estados:
Invertible.- (El mapa del espacio de estados es inyectivo) Se rotan las columnas de datos, usando
el estado final como parte de las entradas del núcleo y la entrada de la planta como la salida del
núcleo.
No invertible.- (Dos o más estados iniciales se transfieren al mismo estado final). El núcleo del
sistema identificado puede usarse para realizar una búsqueda rápida de un control que conduzca al
estado final deseado.

La síntesis de sistemas dinámicos mediante lógica difusa fue hecha a partir del algoritmo de
gradiente descendente de Nomura [2]. Este algoritmo sintoniza las posiciones y anchos de
funciones de pertenencia triangulares, además de la fuerza o peso de cada regla de una base
completa de reglas, para múltiples entradas y una salida.
Se impusieron algunas mejoras [3]: en primer lugar, Nomura usó funciones triangulares que no
eran propiamente funciones de pertenencia, pues desplegaban valores negativos sobre la mayor
parte del espacio de trabajo. El gradiente se calculó para funciones de membrecía de tres formas -
triángulos isóceles independientes, funciones gaussianas y triángulos escalenos encadenados. El
algorimo sintonizó correctamente con las tres formas. Para los ejemplos realizados, los triángulos
isóceles dieron convergencia más rápida, además de una interpretación más sencilla del
conocimiento obtenido. Otro cambio realizado fue la sintonización de los tres conjuntos de
parámetros basándose en el error global de los datos en lugar de sintonizar sobre el error en cada
punto, lo cual dio otra mejora.
3. Identificación

Sistema no lineal simple

El primer caso de estudio [3] es el sistema de la figura 1. Fue elegido porque se visualiza
fácilmente como proyección en dos dimensiones del espacio de tres dimensiones del núcleo. Los
datos de entrenamiento se tomaron de muestrear la respuesta a la señal u(t) = 2sin(2.5t)*sin(0.8t),
muestreada cada 0.1 segundos durante 40 segundos (401 puntos). Se usaron tres funciones de
pertenencia para cada una de las variables de entrada. Las nueve reglas se sintonizaron a partir de
un peso inicial de 0.5 utilizando una ganancia de sintonización de 0.5. Tras 200 pasos de
sintonización, la suma de los cuadrados de los errores Ed para 401 puntos normalizados a [-1, 1]
es 0.0077. Los datos de entrenamiento junto con la superficie que representa el núcleo asociado se
muestra en la figura 2. La evolución de los parámetros correspondientes a ancho de las funciones
triangulares de pertenencia asociados con la variable y(t - T) se grafica en la figura 3. La salida de
la planta comparada con la identificación difusa se muestra en la figura 4.

u(t)
Σ
30 y’ y(t)
∫ 10

0
y(t)

-3 -10

Σ 10
0 2
-3 y >2.5
-10 0
-2 u(t)
y(t- T)

Fig. 1. El sistema no lineal tiene ganancia de 5 o 10, Fig. 2. Datos comparados con el mapa aproximado por
según la amplitud de la salida. la sintonización.

1.5
5
1.45
0
1.4
width

1.35 -5

1.3
-10
1.25 0 5 10 t( seg) 15 20
0 50 100 step 150 200
Fig. 4. Respuestas de planta (punteada) y del sistema
Fig. 3. Variación de los parámetros de ancho. difuso (negro) para una entrada triangular.

Conclusiones de la identificación

Las decisiones de usuario se refieren a intervalos de muestreo y el número de funciones de


pertenencia a usar. La experiencia es una buena guía para el intervalo de muestreo. El número de
conjuntos difusos puede proponerse por inspección, tratándose de curvas estáticas. Para sistemas
dinámicos, se descubrieron algunas reglas heurísticas. Al usar el NHTE, sólo se requieren dos
conjuntos por estado de un sistema lineal y dos o tres para la entrada. Para sistemas no lineales se
requieren bastantes más.
Encontramos que, en términos generales, las funciones triangulares dieron mejores resultados
que las curvas gaussianas. Se calculó el resultado unidimensional de las funciones triangulares en
forma analítica y se encontraron tres resultados: una constante, cuando no hay traslape, una línea
recta cuando se traslapan dos triángulos de igual ancho y una función racional de los parámetros
(centro, ancho y peso) en los demás casos.

Cuando se usan demasiados conjuntos, habrá una tendencia a sacar algunos del área de trabajo, ya
sea moviéndolos a un lado o comprimiéndolos a un ancho despreciable. Cuando hacen falta más
funciones de pertenencia o más dimensiones, se observa un estancamiento temprano del error
cuadrático medio. Las simetrías se pueden explotar fácilmente.

4. Control

Estructura de controlador de planta inversa

Para obtener un controlador de planta inversa se calcula el NHTE sintonizado de los datos
rotados: La entrada u(t) se usa de salida y la próxima salida se usa como entrada.. El estado y(t),
y'(t), y''(t) se usa normalmente. Cuando el controlador se pone en serie con la planta, sus entradas
corresponden a salidas deseadas de la planta. Debe tenerse cuidado en la selección de esdtas
entradas para no requerir un esfuerzo de control que esté fuera del espacio de estados previamente
muestreado. El uso del NHTE permite que el controlador se use en lazo abierto o en lazo cerrado.
Esto último es una prestación valiosa que mejora en mucho el desempeño.

u y y(t) P -1 Control
Input P
signal Delay
Condition
y(t-T)
r(t)
PLANT D Reference u(t) y(t)
signal y(t-T) FC P
u(t-T) D
D Action Delay FUZZY PLANT
CONTROLLER
Delays
Training
Data Feedback

Fig.5. Rotación de datos para entrenar un controlador Fig. 6. Controlador tipo inverso de primer orden en
de planta inversa de primer orden. lazo cerrado.

Model Reference Controller

Se elige un modelo M para el comportamiento deseado del sistema controlado en lazo cerrado,
tal que su inverso M-1 pueda encontrarse por el método de la sección anterior. El controlador de
modelo de referencia es M P-1 y puede encontrarse registrando datos entrada/salida del
encadenamiento directo de los bloques. Un método preferido es emular M-1 y usarlo en cascada
con la planta, invirtiendo los datos resultantes PM-1 para obtener el controlador. La trayectoria de
realimentación requiere M-1 para obtener los estados que entran al controlador de modelo de
referencia.

Inverso de un modelo no lineal simple

El inverso de la planta de la figura 1 se obtuvo en forma muy parecida, asignando 4 conjuntos


a y(t) y tres a y(t - T). Las doce reglas se sintonizaron a partir de peso inicial de 0.5, para obtener
la superficie de la figura 7.
2

u(t)
0
-1
-2
10
0 10
0
y (t-T) -10 -1 0
y(t)

Fig. 7. Superficie generada por el sistema difuso comparada con los datos de entrenamiento.

El desempeño del controlador se aprecia en las figuras 8 y 9 donde se comparan referencia


contra salida y entrada de control, en lazo abierto y lazo cerrado respectivamente.

10
10

5
5

0
0

-5
-5

-10
0 5 10 15 20 0 5 10 15 20
t(sec ) t(sec)

Fig. 8. Fuzzy inverse control in open loop with Fig. 9. Fuzzy inverse control in closed loop with
perturbation at 7 seconds versus reference input perturbation at 7 seconds versus reference input
(dashed) and control u(t) (long dash). (dashed) and control u(t) (long dash).

Identificación de un controlador para un péndulo invertido

Este ejemplo tiene algunas peculiaridades interesantes: no hay entrada, por lo cual es un
problema de regulador. La dinámica de la planta es inestable pero estabilizada por un controlador
que será identificado por la sintonización de la lógica diifusa. Para obtener los datos de
entrenamiento, se provocaron cuatro transitorios mediante condiciones iniciales no nulas.

Las figuras 10 y 11 despliegan la entrada y salida del controlador identificado, es decir que se usó
el NHTE derivado del controlador para controlar el péndulo invertido.
1
20

0.5
10

0 0

-10
-0.5

0 2 t(sec) 4 6 0 2 t(sec) 4 6
Fig. 10. Ángulo del péndulo bajo control difuso Fig. 11. Salida del controlador (fuerza sobre el
desde una condición inicial de 0.9 radianes. péndulo) para condición inicial de 0.9 radianes.

Control de un manipulador planar

La tesis de José Juan Hernández Mora [4] muestra una implementación del NHTE mediante
redes neuronales, comparando holográficas con backpropagation (Se obtuvieron resultados
ligeramente más precisos con la versión holográfica). Se usó un generador de trayectorias
trapezoidales (en velocidad) para alimentar los ángulos, velocidades y aceleraciones angulares.

..

Planeador
θ
Controlador Τd Τ Τf θs
.
trayectoria θ RNA PLANTA
+ +
holográfica
+ Τa +
Τg
Dinamica
θd Kp gravita-
cional

∆θ
+ -

Fig. 12. Estructura del controlador de un brazo robot Fig. 13. Respuesta del controlador del
basado en NHTE implementado con red neuronal manipulador
holográfica.

Conclusiones de los Experimentos de Control

Con el NHTE es posible control de modelo inverso con realimentación. La realimentación provee
la información sobre el estado del sistema dinámico que permite suprimir perturbaciones y reducir
el error. Los sistemas continuos y discretos pueden manejarse de forma muy parecida. El método
de lógica difusa sintonizada por gradiente descendente ofrece un alto grado de automatización y
converge rápidamente, en relación a red neuronal backpropagation, además de ofrecer la
información lingüística de los conjuntos difusos y posibilitar el uso de la información disponible a
priori. Si ha de usarse redes neuronales, es preferible la red holográfica, por su aprendizaje de una
pasada.
Evaluación del concepto de Núcleo Híbrido de Transición de Estados

El método propone en el fondo un control por variables de estado. Aunque puede parecer un
problema relativamente fácil o limitado, hay varias justificaciones: i) permite formalizar técnicas
heurísticas, convirtiéndolas en aproximaciones numéricas que esperamos tengan propiedades
sencillas, ii) utiliza adquisición automática de conocimiento, lo cual permite una evaluación
objetiva, independiente de expertos, iii) cuando se realiza por lógica difusa, nos da información
lingüística sobre el sistema, iv) ofrece varias estrategias de control, incluyendo planta inversa,
modelo de referencia y por búsqueda, para plantas no invertibles y v) ofrece una expresión natural
del control por computadora.

5. Referencias

[1] K. S. Narendra, K. Parthasarathy “Identification an Control of Dynamical Systems Using


Neural Networks”, IEEE Trans. Neural Networks, Vol. 1, No. 1, March 1990.
[2] Hiroyoshi Nomura, Isao Hayashi, Noburu Wakami "A Learning Method of Fuzzy Inference
Rules by Descent Method". IEEE International Conference on Fuzzy Systems, San Diego,
California 1992.
[3] Rodolfo Castillo Romero "Sintonización de controladores difusos basada en el método de
gradiente descendente", Tesis de maestría, Centro Nacional de Investigación y Desarrollo
Tecnológico, México, mayo de 1999.
[4] José Juan Hernández Mora “Implementación de una red neuronal holográfica, para el control
de un brazo robot articulado”, Tesis de maestría, Centro Nacional de Investigación y
Desarrollo Tecnológico, México, 1999.

Você também pode gostar