Você está na página 1de 3

ESCUELA POLITÉCNICA NACIONAL

PLANIFICACIÓN DE SISTEMAS DE DISTRIBUCIÓN

DEBER N°7

Nombre: Jaramillo V. Fernanda B. Facultad: F.I.E.E

Grupo: GR 1 Fecha: 2018/07/11

APROXIMACION VIA CLUSTERING


El análisis de cluster es una técnica estadística multivariante, cuyo objetivo es dividir un
conjunto de elementos en grupos, de manera que las características de los elementos
pertenecientes a un mismo grupo sean muy similares entre sí, situación denominada
cohesión interna, y las características de elementos pertenecientes a distintos grupos sean
diferentes, situación conocida como aislamiento externo del grupo. Para conocer tal
similitud se hace necesaria la existencia de medidas que indiquen el grado de parecido,
medidas de proximidad, o diferencia, medidas de distancia, que existen entre dos
elementos que se quieren agrupar.
En particular, la técnica de cluster que se empleará en el presente trabajo, es el algoritmo
de k-means, que permite clasificar un conjunto de n datos en k subconjuntos, donde la
cantidad de grupos a formar, k, es un dato de entrada del algoritmo. Éste, en términos
sencillos está compuesto por los siguientes pasos:
1. Elección de k datos de los n a agrupar, estos constituyen los k centroides iniciales.
Se calculan las distancias de los datos a cada uno de los centroides. Cada dato es asignado
al centroide más cercano, formándose k grupos.
2. Para cada uno de los grupos se calcula el nuevo centroide como el valor medio de todos
los datos asignados a él.
3. Se repite el proceso 2 y 3 hasta que se satisface un criterio de convergencia
determinado. La medida de distancia utilizada por el algoritmo corresponde a la distancia
euclidiana, dada por:

Donde:
d: distancia euclidiana.
x:vector de posiciones de los datos.
𝜇𝑥 :valor medio de los datos (centroide).

El criterio de parada está dado por el mínimo entre un número máximo de iteraciones
permitidas y la variación de la distorsión entre dos iteraciones sucesivas. El número
máximo de iteraciones es un dato de entrada al algoritmo y dependerá de la convergencia
presentada en el problema a resolver. En tanto que la distorsión es la suma de todas las
distancias a su respectivo centroide.
De la expresión anterior se desprende que el criterio de parada será

A modo de ejemplo en la figura (1) se emplea la técnica para crear tres subconjuntos
utilizando como criterio la cercanía entre los nodos, en la iteración 1 se parte con la
ubicación aleatoria de los tres centros, señalados mediante triángulos, a cada uno se le
asignan los nodos más cercanos (identificados en la figura por un mismo color), para
luego mover tales centros al centroide del subconjunto, dicho proceso se repite, en este
caso durante 12 iteraciones, dado que más iteraciones no presentan mejoras a la solución,
lo que se aprecia claramente en la tabla 1.

Tabla 1: Evolución de la distorsión en el caso de ejemplo

Se debe notar que entre la iteración 11 y 12 no existe variación de la distorsión, de no


haberse logrado la convergencia el algoritmo se detiene cuando se alcanza un número
máximo de iteraciones, el cual en este trabajo es de 200 iteraciones.
Figura 2: Ejemplo de aplicación de análisis de aproximación via clustering

Con ε, definido por el planificador, no obstante usualmente está entre 0.5 % y 1%.

[1]
Referencias:
[1] ALEJANDRO ANDRES NAVARRO ESPINOSA, «PLANIFICACION DE REDES DE DISTRIBUCION:
APROXIMACION VIA CLUSTERING, DIAGRAMAS DE VORONOI Y BUSQUEDA TABU»,
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE ESCUELA DE INGENIERIA, Santiago de Chile,
2007.

Você também pode gostar