Principal Component Analysis of Symmetric Fuzzy Data

Principal Component Analysis of symmetric fuzzy data
Anlisis de componentes principales de datos simtricos difusos
Abstracto Anlisis de Componentes Principales (PCA) es una conocida herramienta de uso frecuente para el anlisis exploratorio de un conjunto de datos numricos. He aqu una extensin del clsico PCA, se propone que se ocupa de los datos difusos (en breve PCAF), donde el dato elemental no pueden ser reconocidos exactamente por un nmero especfico, sino por un centro, dos medidas de dispersin y una funcin de pertenencia. En concreto, dos mtodos diferentes PCAF, asociados con diferentes hiptesis de interrelacin entre las partes de la solucin, se proponen. En el primer mtodo, denominadas Centers-related Spread PCAF (CS-PCAF), el tamao de las medidas de propagacin depende del tamao de los centros. En el segundo mtodo, llamado Loadings-related Spread PCAF (LS-PCAF), los diferenciales no estn relacionados directamente con el tamao de los centros, sino indirectamente, a travs de las saturaciones en componentes. Para analizar qu tan bien funciona PCAF un estudio de simulacin se llev a cabo. En general, el mtodo PCAF funcion mejor que o igual de bien como PCA, excepto en unas pocas condiciones particulares. Finalmente, la aplicacin de PCAF a un conjunto de datos empricos difusa se describe. 1. introduccin Hay muchas situaciones prcticas en las que las observaciones numricas de unidades I con respecto a las variables J no pueden ser representadas por valores especificados con precisin. Se pueden encontrar ejemplos en economa (intercambios diarios de cambio), en la investigacin de mercados (evaluacin de la opinin pblica acerca de eventos especiales como elecciones para el gobierno, el lanzamiento de nuevos consumidor bienes), en la psicologa (el estado mental o la percepcin subjetiva), la fsica (en una esfera balstico, la velocidad necesaria de la perforacin de una placa por proyectiles). Otra situacin signi1cant se relaciona con el intento de analizar la percepcin subjetiva o variables lin-tic. En cada uno de los ejemplos anteriores una codificacin numrica exacta parece ser muy difcil de ofrecer: por lo tanto, la nica informacin disponible se puede representar aproximadamente.
En las situaciones anteriores que la informacin es vaga o difusa y se puede resumir mediante el intervalo de los datos de valor en lugar de datos numricos. As, la puntuacin de la observacin genrico i en la variable j genrica est representada por un par de valores: un lmite inferior y un lmite superior que encierran la observacin exacta.
En contraste con el intervalo valorado los datos marco, el enfoque borroso datos ofrece la posibilidad de tomar en cuenta la informacin adicional proporcionada por la funcin de pertenencia. Esta funcin asigna una diferente "papel" para cada valor de un intervalo en contraste con el intervalo valorado enfoque de datos en el que cada valor tiene una importancia uniforme. Esta distincin ser ms claro despus de definir un nmero difuso, como sigue. Un nmero difuso se de1ned como la triple F = (m, l, r) LR donde m denota el centro y L y R son la propagacin izquierda y derecha, respectivamente, con la siguiente funcin de pertenencia
donde L y R son funciones estrictamente decreciente en [0, 1] la forma llamada funciones. Adems estas funciones deben cumplir requisitos adicionales: por ejemplo, con referencia a L; L(0) = 1,
L(z)<1 if z>0, L(z)>0 if z<1 and L(1) = 0. . Ms detalles se pueden encontrar en Dubois y Prade
(1980).
En lo sucesivo, en aras de la simplicidad, se considera "simtrico" nmeros difusos slo. Para un nmero difuso simtrico l = r y L = R. De ello se deduce que un nmero difuso simtrico puede ser completamente definido por la pareja F = (m, s) L = R donde s = l = r es la extensin. Por lo tanto, un conjunto de datos difuso es un conjunto de nmeros difusos, que representan los resultados de las unidades de observacin I en J variables difusas simtricas. Por una variable difusa simtrica queremos decir una variable para la que cada dato observado no puede ser cuantificada exactamente, pero slo mediante el uso de la pareja F = (m, s) L = R.
En este trabajo se generaliza el anlisis clsico de Componentes Principales (PCA) para tratar con datos borrosos establece utilizando una aproximacin de mnimos cuadrados. Algunas propuestas para esto estn disponibles en la literatura: Yabuuchi et al. (1997) proponen un mtodo para realizar PCA en datos borrosos, en la que los valores propios difusos y ntidos (no difusos) vectores propios se obtienen al resolver un problema de programacin lineal. Cazes et al. (1997) y extensiones de su enfoque (vase, por ejemplo, Palumbo y Lauro, 2002) proponen para llevar a cabo descomposiciones factoriales de datos de intervalo de valor, as como de los mismos una generalizacin probabilstica. La idea bsica consiste en realizar PCA en los lmites o en los centros de los datos de intervalo valorados. En su generalizacin probabilstica, hacen uso de un coeficiente cuyo valor depende de la ley de probabilidades a la mano que modifica la informacin de tenerse en cuenta en la descomposicin factorial.
La necesidad de generalizar el PCA a los datos difusos se basa en la suposicin de que, as como para los datos de valor individuales, puede ser til para sintetizar los datos sin perder la informacin pertinente. En la siguiente seccin, se presenta un enfoque general de mnimos cuadrados para el anlisis de datos difusos. En la seccin 3, se proponen dos modelos diferentes que se extienden PCA a los datos difusos y en la Seccin 4 de mnimos cuadrados alternantes un algoritmo para calcular las soluciones se le dar. En la Seccin 5, se discute la representacin de cada unidad de observacin en el subespacio dimensional bajo obtenido por PCAF. En las Secciones 6 y 7, los resultados de un estudio de simulacin para comparar la PCAF a clsica PCA y una aplicacin de PCAF reales a datos difusos se darn.
2. Mnimos cuadrados acercarse al anlisis de datos difusos La necesidad de estudiar y entender los datos difusos ha llevado a un creciente inters en el anlisis de datos difusos. Muchos autores han abordado el anlisis de regresin difusa en el pasado, as como en la actualidad. En el sentido de mnimos cuadrados, el anlisis implica un problema de minimizacin de una funcin de distancia entre dos conjuntos de valores, el conjunto de datos empricos y los valores estimados de acuerdo con el modelo especfico involucrado. En este contexto nos referimos a Diamond (1988) que ha desarrollado un mtodo de mnimos cuadrados difusos basado en una medida compatibilidad entre dos nmeros difusos, a la observada y la estimada. D'Urso y Gastaldi (2000) han propuesto un problema de regresin difuso basado en la minimizacin de una nueva distancia expresar la suma de cuadrados de los errores de estimacin de los centros y los diferenciales. Por lo tanto, tenemos
donde m y m * son los vectores, respectivamente, de los centros observados y estimados de la variable difusa dependiente y s y s * son los vectores, respectivamente, de los mrgenes observados y estimados de la variable difusa dependiente. Los vectores de estimacin se obtienen mediante el uso de dos modelos de regresin diferente que se relacionan con la variable dependiente difusa a un conjunto de variables independientes ntidas.
Un posible inconveniente de (2) es que los vectores de los centros y los diferenciales tienen el mismo peso en el procedimiento de estimacin. Coppi y D'Urso (2001) propusieron un enfoque ms flexible que toma en cuenta la informacin debido a diferenciales, pero, al mismo tiempo, se centra especialmente en la informacin de centros en el procedimiento de estimacin, ya que en estos puntos, el valor de funcin de pertenencia es mximo . En concreto, se propone tener en cuenta la funcin de pertenencia de la variable especfica difusa con el fin de peso de la manera correcta el papel de los diferenciales, utilizando la distancia:
donde m, m *, s y s * son los vectores definidos anteriormente, mientras que, al contrario que en (2), en (3) el parmetro aparece. Basado en la idea de Yang y Ko (1996), tiene una doble funcin: teniendo en cuenta la variabilidad de la funcin de pertenencia y disminuir el nfasis en la estimacin de los diferenciales. Para explicar esto, se calcula el parmetro para una funcin de pertenencia particular, a saber, para la funcin de pertenencia triangular muy comn
Sea x = (m - )/s, se deduce que
y por lo tanto
De (6) tenemos
El parmetro es a menudo un nmero menor que uno, excepto en la situacin improbable de que la importancia de los puntos aumenta a medida que estn ms lejos del centro. Sin embargo, para las funciones de pertenencia ms comunes (normal, trapezoidal) el parmetro es siempre menor que uno, pero, al mismo tiempo, depende de la funcin de pertenencia a la mano. As, en la distancia en (3), se reduce el nfasis de los diferenciales de una manera diferente en base a la funcin de pertenencia a la mano. Si los valores de la funcin de pertenencia son slo muy altos cerca del centro, se deduce que el parmetro es muy pequeo debido a que la superficie bajo L1 () es pequea. Por el contrario, si los valores de la funcin de pertenencia son altos en casi todo el intervalo [m - s, m + s] y disminuir muy cerca de los puntos extremos del intervalo se sigue que la superficie bajo L-1() es muy grande y por lo tanto asume un valor ms grande. Vase, para ms detalles, Yang y KO (1996).
Siguiendo la idea de Yang y Ko (1996), se calcula la integral con respecto a la variable , que tiene en cuenta la imprecisin de los datos. Al mismo tiempo, se sugiere evitar el uso de la inversa de la funcin de pertenencia. Teniendo en cuenta los requisitos de la funcin de pertenencia se sigue que
debido a que tratar con exactamente la misma superficie mediante la duplicacin de la grfica de L (x) en contra de x para obtener la de L-1() contra . Creemos que el primer trmino en (8) es una expresin ms fcil y ms comprensible para definir el parmetro .
3. Anlisis de componentes principales de datos simtricos difusos (PCAF) En este artculo se propone un modelo de componentes principales para datos difusos mediante la ampliacin (3) para hacer frente a las matrices en lugar de vectores. Si cada unidad de observacin est representada por un resultado en una variable difusa nico, la informacin puede ser representado como un segmento en . De ello se deduce que, si se quiere comparar dos unidades, es suficiente con comparar el centro y los dos vrtices como en (3). En cambio, si dos variables diferentes estn asociadas con cada unidad, una unidad genrica se representa como un rectngulo en .Obviamente, el nmero de vrtices es 22 = 4. En el caso general de variables J, cada una de las unidades de E se representa por un hipercubo en y el nmero total de vrtices es 2J = K. A diferencia de los datos de intervalo de valor, en el que los puntos se encuentran distribuidos uniformemente en que hipercubo, con datos difusos la distribucin de los puntos depende de las funciones de pertenencia J. Para ampliar (3) tenemos que tener en cuenta las diferencias entre los centros observados y los estimados y las diferencias entre cada vrtice observado y estimado. De hecho, no usamos exactamente los vrtices sino una especie de versin reducida teniendo en cuenta la funcin de pertenencia (como se expresa por el parmetro ). Esta idea se justifica al observar que en cada vrtice el valor de funcin de pertenencia es igual a 0. Por lo tanto, se aconseja utilizar, para cada vrtice, una especie de "medio" punto entre el centro y el vrtice, la posicin de la cual depende de la funcin de pertenencia particular, por lo tanto, en el valor particular del parmetro . En analoga a (3), pero ahora teniendo en cuenta todos los vrtices del hipercubo asociados con cada unidad, se obtiene
donde M, M *, S * y S son matrices con I filas y columnas J de los centros observados y los estimados y de los mrgenes observados y los estimados, respectivamente. es una matriz diagonal de orden J, cuyos elementos de la diagonal principal son los parmetros j, j = 1,.., J. Por lo tanto, se supone que cada variable tiene su funcin de pertenencia caracterstica que es la
misma para cada unidad. De (9) hay que sealar que se supone que los vrtices estimados estn situadas simtricamente con respecto al centro como-asociado estimado. Por otra parte, se toma el peso de los diferenciales estimados iguales a los de los diferenciales observados. Queda por explicar las matrices Hk, k = 1,., K, donde K = 2J. Su funcin es ayudar a definir cada vrtice por separado. Nos permiten considerar todos los vrtices del hipercubo asociado con cada unidad. Ellos son matrices diagonales cuyos elementos de la diagonal principal son 1 para referirse exactamente a cada vrtice. Un pequeo ejemplo (J = 3) puede ayudar a aclarar estas matrices. Vamos a presentar la siguiente nueva matriz HK J de orden K J (o 23 3):
Sus elementos son 1 pero cada fila est relacionada con un vrtice diferente: por ejemplo, la primera fila indica el mnimo vrtice y la fila 1fth el mximo uno. Por mnima y mxima vrtice, es decir, respectivamente, los vrtices cuyas coordenadas son los lmites inferiores y los lmites superiores para todas las variables. Los principales elementos de la diagonal de la matriz genrica Hk son exactamente los elementos de la fila k-sima de HK J. Por lo tanto, las matrices de la mnima y la mxima de vrtices son, respectivamente,
La utilidad ser evidente ms adelante, pero es muy importante tener en cuenta que las filas de HK J -1 J estn dispuestos de una manera especfica. Se puede ver fcilmente que el Hg + H2 + g = 0J, g = 1,.,2J -1. Ahora vamos a simplificar la expresin (9). De (9) se considera el trmino genrico k-simo de la suma. Tenemos
Podemos ver que hemos ampliado el trmino genrico kth en nueve rastros. Podemos distinguir estos nueve trminos en tres grupos diferentes de acuerdo a la matriz Hk. En tres trazas Hk est ausente, mientras que est presente en los restantes. En primer lugar, podemos considerar los trminos en que Hk est ausente. Es fcil ver que estos trminos tomados en conjunto dan
Vamos ahora a recoger los cuatro trminos de (13) en el que Hk aparece slo una vez:
Utilizando el Hg + H2J -1 + g = 0J, g = 1,, 2J -1, es evidente que
para g = 1,., 2J -1. El resultado en (16) es muy til para simplificar (9), porque, por lo tanto, todos los trminos en que Hk aparece slo una vez desaparecen. Por ltimo, podemos analizar los tres rastros que quedan en el cual Hk aparece dos veces. Tenemos
donde se utilizan las matrices que Hk y son diagonal y que Hk Hk = IJ, k = 1; :::; K. Usando las relaciones (13) - (17), podemos simplificar (9) como
Pensamos que (18) es una forma muy til para expresar las diferencias entre dos matrices I J de datos difusos donde, en este contexto, las dos matrices son el observado y el estimado, ya que podemos utilizar toda la informacin disponible (centros, pastas para untar y funciones de pertenencia) y un sistema objetivo de pesos para tener en cuenta los diferentes tipos de informacin en la forma correcta. En (9) se compararon los centros y todos los vrtices 2 J = K (reducido por ) de cada hipercubo asociada a cada unidad de observacin. Como cuestin de hecho, (9) puede ser muy pesada para calcular si aumenta el nmero de variables. En (18), (9) se simplifica mucho porque hemos demostrado que en lugar de comparar todos los centros y todos los vrtices (modificado por ), tenemos que comparar slo los centros y los mrgenes (modificado por ) y llevar a en cuenta el sistema de pesas. Observamos que (18) es la matriz de generalizacin de la frmula (3,3) por Coppi y D'Urso (2001), que en s es el caso especial de (18) con J = 1:
Ahora hemos introducido y discutido la funcin objetiva para reducir al mnimo basado en el cuadrado de la distancia entre observados y estimados matrices centros y observados y estimados matrices para untar. Sin embargo, todava no se ha definido el modelo que se utilizar en PCAF. En notacin matricial el modelo en PCAF es
donde AM y F son, respectivamente, la matriz de componentes puntuaciones de los centros de orden I P y la matriz de cargas componente de orden J P, donde P es el nmero de componentes y E y Zk son matrices residuales de orden i j . Queda por establecer la forma en que sugerira para modelar la matriz S* se propaga. Dos enfoques diferentes ser discutido: Centros relacionados con la propagacin PCAF (CS-PCAF) y las cargas relacionadas con PCAF Spread (LSPCAF).
3,1. Centros relacionados con la propagacin PCAF (CS-PCAF) El mtodo CS-PCAF est relacionada con la hiptesis de que existe una relacin lineal entre la difusidad (el tamao de los mrgenes) y la magnitud de los centros, por lo que se supone que tal relacin se mantiene para los centros estimados y los diferenciales estimados. La hiptesis anterior se propuso por primera vez por D'Urso y Gastaldi (2000). Hay varios casos reales en los que esa hiptesis parece ser por lo menos aproximadamente correcta en diferentes campos: por ejemplo, la velocidad de un coche, la distancia astronmica, ingresos, tipo de cambio. As, en CS-PCAF tenemos la siguiente expresin para las estimaciones de los diferenciales
donde II J es una matriz de orden I J con elementos unitarios y B y D son matrices diagonales de orden J cuyos elementos de la diagonal principal, respectivamente, son bj y dj. Por lo tanto, se supone que existe una relacin lineal entre los centros de propagacin y que es diferente para cada variable, pero es la misma para cada unidad de observacin. Sustituyendo (20b) en (21) se encuentra
que muestra cmo se propaga el estimados estn relacionados con las estimaciones de PCA de los centros. Ajustar el modelo CS-PCAF consiste en minimizar (18), donde M * y S * se obtienen a partir de (20b) y (21), con respecto a AM, F, B y D. Como se ver a continuacin, al sustituir (21) en (18), est claro que la informacin de los productos afecta las estimaciones ptimas de las matrices de puntuaciones de los componentes y las cargas de los componentes de los centros.
3,2. Las cargas relacionadas con la propagacin PCAF (LS-PCAF) El modelo CS-PCAF en (20a) - (20c) y (21) es un modelo parsimonioso para PCAF. Sin embargo, la hiptesis entre los centros y los mrgenes no siempre es razonable consumo. En muchos casos, parece muy difcil de probar su validez. Por este motivo se propone tambin un segundo mtodo, LS-PCAF, lo que explica el fenmeno usando ms parmetros, dando un modelo ms general. En esa situacin se sugiere la relacin siguiente para estimar la matriz de mrgenes
donde F es la matriz de cargas componente se define en (20) y AS es la matriz de puntuaciones de componente para los diferenciales. Por lo tanto, se supone que los centros y difunde el uso del mismo componente cargas F. En este caso, la comparacin de (20b) y (23), el papel de los diferenciales en el procedimiento de estimacin se vuelve claro. De hecho, el componente de
matriz de cargas F se obtiene teniendo en cuenta la informacin y los diferenciales de los centros aunque haciendo uso de diferentes pesos.
En este punto, la pregunta es si es o no es posible encontrar los mismos componentes para los centros y de los diferenciales. De hecho, es una cuestin trivial: "siempre es posible obtener los mismos componentes en todos los grupos, con slo definir de la misma manera en todos los grupos, aunque que no necesita considerar la variancia mucho en todos los grupos. De ah que la cuestin de si es o no es posible encontrar los mismos componentes en diferentes grupos no tiene sentido "(Kiers Berge y Diez, 1994). De ello se desprende que la cuestin principal es si estos componentes son capaces de representar los datos en cada grupo lo suficientemente bien, por lo que es importante en este mtodo para verificar la bondad de ajuste tanto de los centros y los mrgenes.
Una situacin sencilla en la que el modelo LS-PCAF parece ser adecuado es el siguiente al correspondiente a las puntuaciones difusas de seis unidades de observacin de cuatro variables. Tenemos la matriz centros
y la matriz se extiende
Ahora, claramente, el factor subyacente estructura en (24) y (25) tiene dos componentes relacionados, respectivamente, a las dos primeras variables y a los ltimos dos. Obviamente, en el ejemplo anterior, el modelo trata LS-PCAF con el conjunto de datos muy bien. En otras situaciones, creemos que el modelo recupera una especie de "compromiso" estructura entre los centros y los mrgenes, teniendo en cuenta la estructura de los centros ms que la estructura se extiende por los diferentes pesos y para los parmetros en la matriz .
Para ajustar el modelo LS-PCAF, se minimiza (18), en la que las matrices de los centros estimados y de los diferenciales estimados se obtienen, respectivamente, en (20b) y (23), con respecto a A M, AS y F.
3,3. Preprocesamiento paso Antes de realizar PCAF, es muy til para preprocesar los datos en bruto. Se aconseja utilizar diferentes procedimientos para los centros y de los diferenciales. En primer lugar, es normalizar la matriz de centros utilizando la media y la desviacin estndar de los valores de los centros de cada variable. Despus de que se dividen los diferenciales de cada variable por la desviacin estndar de los centros de la variable en cuestin. De esta manera se eliminan las diferencias artificiales alcance pero mantenemos la informacin sobre los tamaos de los spreads.
Para explicar cmo la relacin lineal existente entre los centros y los diferenciales en el modelo CSPCAF se modifica usando diferentes procedimientos de preprocesamiento, primero introducimos el operador de centrado Los diferenciales estn relacionadas con los centros pero no a los centros centrados. De ello se deduce que, en el modelo CS-PCAF, centrado sobre los centros, (20a) y (20b) debe ser sustituido por
Esta transformacin no es necesario en el modelo LS-PCAF debido al hecho de que tenemos dos anotaciones diferentes componentes de las matrices, que por separado pueden captar las implicaciones de los procedimientos de pre-procesamiento diferentes.
3,4. Bondad de ajuste Para evaluar la bondad de ajuste del modelo se sugiere el siguiente ndice que compara la suma de cuadrados explicada a la observada en un porcentaje. As, tenemos
donde M* se define en (20b) y S* en (21) para el CS-PCAF o en (23) para LS-PCAF. En el trmino cociente en (27), el numerador muestra la cantidad de los valores estimados de los centros y de los diferenciales difieren de los originales, el denominador da la suma de los cuadrados de los
centros y de los diferenciales de acuerdo con el sistema de pesos nos acostumbramos. El ndice toma valores en el intervalo [0, 100].
4. Procedimiento de estimacin: mnimos cuadrados alternantes un enfoque En esta seccin se propone un algoritmo de mnimos cuadrados alterna con el fin de resolver el problema de minimizacin de PCAF en (18). En efecto se proponen dos algoritmos diferentes para encontrar las estimaciones de los parmetros: uno para CS-PCAF y otro para LS-PCAF. Tomamos nota de que los procedimientos siguientes no prohben los diferenciales estimados a ser negativa, aunque esto resulta ser muy frecuente. De hecho, estamos trabajando en una versin modificada del algoritmo que garantiza la no-negativo propagacin estimaciones (por ejemplo, comparar en el marco del anlisis de regresin borrosa, D'Urso, 2003). En la actualidad, se aconseja sustituir los diferenciales negativos estimados por 0.
4,1. Estimacin procedimiento para CS-PCAF Al sustituir (22) y (20b) en (18) y teniendo en cuenta el procedimiento de preprocesamiento se describe en la Seccin 3,3 tenemos
A continuacin, le damos a la actualizacin de las matrices con respecto a la cual se minimiza la expresin (28). Cuando actualizar con respecto a una matriz, se resuelve el problema de minimizacin en (28) manteniendo fijo para las otras matrices. Para indicar las matrices que actualmente utilizan para minimizar la funcin en (28) vamos a escribir slo esa matriz dentro de los parntesis en Cada vez que se actualiza una matriz, la funcin de prdida de minimizar disminuye. Despus de actualizar todas las matrices, si el valor de la funcin de prdida disminuy menos de un porcentaje especificado del valor de la funcin anterior (en la simulacin en la siguiente seccin se utiliza 0,0001%), consideramos que el algoritmo convergente, de lo contrario, repita el la actualizacin de todas las matrices que intervienen. La expresin en (28) tiene un lmite inferior y por lo tanto las de funcin de valor converge a un valor estable.
Antes de la actualizacin, se tiene que inicializar las matrices. El B matrices y D se inicializa como matrices diagonales cuyos elementos son generados aleatoriamente. El componente de las puntuaciones matriz AM y las cargas F componentes de la matriz se inicializan con los valores generados al azar o la realizacin de la SVD de la matriz de los centros observados M.
Actualizando AM: De (28), despus de definir
, sigue siendo para minimizar
donde vec (X) es el operador que transforma el m n matriz X cuya i-sima columna es xi en un vector de mn-dimensional [x1 ... xn],
El problema de minimizacin en (29) tiene la solucin
Actualizando F: A partir de (28) tenemos
donde
El problema en (31) tiene la solucin que se da
Actualizando B (diagonal): En el primer trmino de (28) la matriz B est ausente. Por tanto, podemos considerar este trmino como una constante en el problema de minimizacin y el plazo 2J ya no es importante. Por lo tanto, consideramos
donde usamos que las matrices B y son diagonales y minimizacin en (33) est dada por
La solucin del problema de
donde diag (X) es el operador que transforma las X matriz cuadrada de orden n en una matriz diagonal de la misma dimensin que los elementos de la diagonal principal son iguales de X. Actualizando D (diagonal): La manera de obtener la actualizacin de D es similar a la de B. As, a partir de (28) tenemos
donde usamos que las matrices D y son diagonales y Y3 = S - AM FB y Y4 = 1I J . La solucin del problema de minimizacin en (35) es
En resumen, el procedimiento de estimacin consta de los pasos siguientes:
Paso 1: Inicializar las matrices AM, F, B y D y calcular el valor de la funcin de prdida. Paso 2: Actualizar las matrices AM, F, B y D. Paso 3: Calcular el valor de prdida de funcin de nuevo y comprobar si se diferencia inferior a un valor especificado con respecto al valor de la prdida de la funcin anterior: en este caso el algoritmo se considera convergentes, de lo contrario ir al paso 2.
4,2. Estimacin procedimiento para LS-PCAF El procedimiento de estimacin para LS-PCAF es similar a la de CS-PCAF pero ahora tenemos que encontrar el mnimo de la funcin de prdida en (37) la actualizacin, alternativamente, las puntuaciones de los componentes matrices para los centros (AM) y de los diferenciales (AS), y el componente de matriz de cargas F. para inicializar las matrices de AM y F, se propone utilizar los valores generados al azar o valores racionales que realizan la SVD en M. del mismo modo, con respecto a la matriz AS, podemos utilizar los valores generados al azar o valores racionales de realizar la SVD de la matriz de S. diferenciales observada al sustituir (23) y (20b) en (18) se han
Podemos obtener actualizaciones de las puntuaciones de los componentes matrices AM y AS teniendo en cuenta que las matrices anteriores aparecen slo en uno de los dos trminos en (37). Actualizacin de AM: De (37) se mantiene para minimizar
y la solucin es
Actualizacin de AS: De (37) se mantiene para minimizar
En este caso se obtiene
Actualizacin de F: Contamos con:
donde
La solucin del problema de minimizacin en (42) es
En resumen, el procedimiento de estimacin consta de los pasos siguientes: Paso 1: Inicializar las matrices AM, AS y F y calcular el valor de la funcin de prdida. Paso 2: Actualizar las matrices AM, AS y F. Paso 3: Calcular el valor de prdida de funcin de nuevo y comprobar si se diferencia inferior a un valor especificado con respecto al valor de la prdida de la funcin anterior: en este caso el algoritmo se considera convergentes, de lo contrario ir al paso 2.
4.2.1. El caso especial en el que
Como sealamos en la Seccin 1, la funcin de pertenencia triangular en (4) es la ms comn. En este caso, usando (5) - (7), el parmetro $ $ es igual a 1 = 2. Por lo tanto, en muchas situaciones, podemos tener un matriz diagonal cuya diagonal valores son los mismos. Adems, $ $ es proporcional a la matriz identidad cuando las variables difusas tienen las mismas funciones de pertenencia. Por lo tanto, a menudo podemos tener
para y 0. Cuando la expresin en (44) se mantiene, el algoritmo iterativo en la Seccin 4,2 no es necesario. Mediante el uso de (44), podemos reescribir (37) como
Donde
Las estimaciones de AM, AS y F se puede obtener mediante la realizacin de la SVD de E6. Es bien sabido E6 que se puede descomponer como
donde y RP son matrices que contienen la longitud de la primera unidad P vectores singulares de E6 y QP es la matriz diagonal P con las diagonales de los primeros valores singulares de E6. PP se divide en dos submatrices que son, respectivamente, PP1 y PP2, que contiene las filas por primera vez y la ltima vez que las filas del PP. De (46) se puede obtener la estimacin de la componente F cargas matriz como
Con respecto a las puntuaciones de los componentes matrices, respectivamente, para los centros y de los diferenciales, tenemos
y, por lo tanto, se obtienen las siguientes estimaciones
5. Trazado procedimiento para visualizar las unidades de observacin En PCAF pensamos que es muy til e interesante para trazar cada unidad de representacin en RJ como un hipercubo en el espacio dimensional bajo Sobre todo si P = 2, podemos representar cada unidad como un rectngulo. Uno de los objetivos de PCAF es ofrecer una descripcin ms simple grfica de cada unidad. En esta seccin se sugieren dos procedimientos para trazar las unidades de observacin sobre el subespacio generado por las columnas de F.
En el algoritmo de la seccin anterior, no hizo ninguna suposicin acerca de las restricciones de ortogonalidad para el F cargas de la matriz, pero si la matriz F no es por columnas ortonormales la representacin de cada punto y, por lo tanto, de cada hipercubo-est distorsionada (ver, por ejemplo, , Kiers, 2000). Sin embargo, mediante un procedimiento orthonormalization general (por ejemplo Gram-Schmidt) podemos encontrar una matriz de transformacin T para el que es por columnas ortonormales. De este modo, nos encontramos con una base ortonormal que se extiende por el subespacio en el que se representa cada unidad de observacin. La rotacin de F mediante el uso de T debe ser compensada por postmultiplying las puntuaciones de los componentes matrices AM y AS por Estas transformaciones no modificar las estimaciones de los centros y de los diferenciales, como puede verse de la siguiente manera. Uso de la tilde para indicar la F matrices, AM y AS modificada por T, mantenga las siguientes relaciones:
donde (53) se utiliza en el modelo LS-PCAF y (54) en el modelo CS-PCAF. De ello se deduce que, despus de aplicar los mnimos cuadrados alternantes algoritmo dado en la Seccin 4, hay que aplicar, por ejemplo, el procedimiento de Gram-Schmidt para obtener una matriz ortonormal por columnas que es la base del subespacio en el que podemos proyectar correctamente cada hipercubo. Ahora podemos introducir los dos procedimientos trazados.
En el primero, proyectamos los vrtices estimados de cada hipercubo. Los vrtices del hipercubo estimados asociados con la unidad genrica i son los elementos de la matriz
donde Mi* y Si* son matrices diagonales de orden J cuyos elementos de la diagonal principal son centros estimados y los diferenciales estimados correspondientes a la unidad i y 1 K J es una matriz de orden K J con elementos de la unidad. Por lo tanto, los elementos diagonales de Mi* son los elementos de la fila i-sima de la matriz definida en (20b) y los de SI* son de la i-sima fila de la matriz definida en (21), utilizando el modelo CS-PCAF , o (23), utilizando el modelo LS-PCAF. Finalmente HK J es la matriz de orden K J, que se define en la Seccin 3. As, las coordenadas de los vrtices que pertenecen a la unidad de observacin i en el subespacio generado por las columnas de se obtienen como
que es similar a la expresin utilizada en PCA, , donde y son, respectivamente, las puntuaciones de los componentes de la matriz y el componente por columnas ortonormal cargas de matriz y X * es la matriz de datos estimada. Mediante el uso de la expresin (56), para i = 1,,I , podemos trazar cada unidad de observacin como un hipercubo en el espacio de pocas dimensiones atravesado por .
Utilizando el procedimiento anterior, los vrtices proyectados no definen un rectngulo (si se extrae dos componentes) o un hipercubo (si se extrae ms de dos componentes). Este es un problema bien conocido reconocido, por ejemplo, por Bock y Diday (2000). De la misma manera como Bock y Diday (2000), se sugiere para resolver este problema mediante la representacin de la unidad genrica i en cada eje por el segmento que incluye todas las proyecciones. Por lo tanto, con nuestro primer procedimiento trazado encontramos hipercubos que cubren las hipercubos proyectadas. Adems, se propone una segunda manera de representar las unidades de observacin. A diferencia de la de arriba, este procedimiento ofrece una representacin de las unidades de observacin como hipercubos exacta en el espacio de pocas dimensiones pero tiene una desventaja ya que se sealan ms adelante. Para alcanzar nuestro propsito, nos proponemos utilizar una matriz similar a HK J cuyo orden depende del nmero de componentes P. Nos referimos a esta matriz de orden L P donde L = 2P como HL P. Cada fila de da las coordenadas del centro del hipercubo asociado con la unidad de observacin i-sima en el subespacio generado por . De manera similar, las filas de (en LS-PCAF) dan las coordenadas , que da las
de los spreads de las unidades I, del mismo modo forCS-PCAF usamos coordenadas de S* proyectado en
Entonces, las coordenadas de los vrtices del hipercubo i-esimo, para i = 1,..., I, en el espacio de pocas dimensiones atravesado por se puede obtener como
en el modelo CS-PCAF, y como
en el modelo LS-PCAF. En (57) y (58), 1L x P es la matriz de orden L P con elementos de la unidad y y respectivamente, son matrices diagonales de orden P cuyos diagonal es la fila i-esima de, y , para i = 1, ..., I. El inconveniente en las frmulas (57) y (58) es la
posibilidad de que las coordenadas en y puede ser negativo. Desde un punto de vista grfico, el inconveniente desaparece porque siempre obtener un hipercubo dimensional bajo: en este modo, es como si ignoramos el signo de los elementos de y . Para evitar el inconveniente, le sugerimos a encontrar, si es posible, una matriz de rotacin V de modo que es tambin por columnas ortonormales y el CS-PCAF modelo) tiene elementos positivos. en el modelo LS-PCAF (o en
6. Simulacin de estudio En esta seccin se presentan los resultados de un estudio de simulacin realizado para evaluar cmo funciona PCAF. En particular, el estudio de simulacin tiene como objetivo responder a tres preguntas: 1. Es PCAF recuperar la estructura subyacente en los datos mejor que el PCA clsico aplica a la matriz centros? 2. Los algoritmos (para CS-PCAF y PCAF LS-) eficiente? 3. Los algoritmos ptimos locales golpeado con frecuencia? Para responder a estas preguntas, hemos generado al azar conjuntos de datos difusos con una estructura factorial subyacente conocido y hemos estudiado si PCAF mejor que se recupere de PCA. Despus de la generacin de y al azar de la distribucin uniforme, respectivamente, el componente conocido matriz y la matriz de puntuaciones de componente cargas de los centros, hemos construido los datos de estas matrices y se aade ruido. Se han considerado siete niveles diferentes de ruido aadido ( = 0:1, 0:3, 0:5, 0:75, 1:00, 1:5, 2:0). De la misma manera, a partir de
la distribucin uniforme, se ha construido de acuerdo con los diferenciales de las dos hiptesis de CS-PCAF y PCAF LS con un poco de ruido aadido. Por otra parte, se han considerado tres diferentes tamaos relativos de los diferenciales con respecto a la de los centros ( = 0:2; 0:5; 1:0). Forinstance, = 0:2 significa que el tamao de los mrgenes es 0,2 veces la de los centros. En concreto, se han construido centros y los diferenciales de acuerdo con
donde y y son, respectivamente, el componente de matriz conocida puntuaciones para los mrgenes (en el modelo LS-PCAF), y las matrices conocidas diagonal cuyos elementos se conectan, de forma lineal, centros y untar (en el modelo CS-PCAF); matrices y y fueron generados aleatoriamente de la distribucin uniforme. NM y NS se generaron matrices al azar de la distribucin uniforme de tal manera que
donde (62) es utilizado en ambos modelos, (63) en la CS-PCAF y (64) en LS-PCAF. Las restricciones en (62)-(64) nos permite cuantificar exactamente la cantidad relativa de ruido mediante el parmetro. Hemos considerado cuatro diferentes mtodos de anlisis. El primero dos guardan relacin con CS-PCAF donde en el primero se ha supuesto que la matriz tena los mismos elementos diagonales (j = 1/2, para j = 1,,J) y, en el ltimo, el medio primero de los elementos de era igual a 1/2 (los valores difusos tienen una funcin de pertenencia triangular) y la ltima media a (que utiliza una funcin de pertenencia normal). La misma distincin se mantiene en los dos ltimos mtodos en los que se han considerado las mismas estructuras desde hace durante el uso de LS-PCAF. Hemos construido tres conjuntos de datos de diferentes dimensiones (18 8, 36 8, 36 16). Hemos considerado una estructura subyacente con dos y tres componentes (P = 2, 3). Para cada condicin, se han construido diez conjuntos de datos. Por lo tanto, la simulacin se bas en 3 (tamaos relativos de los diferenciales) x 7 (porcentajes de ruido aadido) x 3 (dimensiones del conjunto de datos) 2 (componentes extrados) x 10 (generados conjuntos de datos para cada condicin) 4 (modelos e hiptesis utilizadas en la matriz ) = 5040 generados al azar conjuntos de datos difusos.
Los conjuntos de datos construidos de acuerdo con (59) y (60) se analizaron por medio de LS-PCAF, mientras que los construidos de acuerdo con (59) y (61) por medio de CS-PCAF. Adems, los centros de todos los conjuntos de datos han sido analizados por PCA como referencia. Para cada caso, el algoritmo se ha ejecutado utilizando un arranque racional, la SVD de la matriz de centros M, y cinco aperturas aleatorias para LS-PCAF y un punto de partida aleatorio para CS-PCAF.
Se utiliz slo un punto de partida aleatorio en caso de CS-PCAF para reducir el tiempo de clculo del estudio de simulacin que es relativamente alta para CS PCAF. Hemos trabajado de esta manera despus de sealar que CS-PCAF muy a menudo alcanza el ptimo global con el principio racional, como se encontr en una pequea simulacin realizada en dos conjuntos de datos generados para cada condicin de uso de un principio racional y cinco aperturas aleatorias. De hecho, en ese estudio se encontr que en el 97,4% de los casos la racionalmente comenz ejecutar condujo a la mejor solucin.
Para comparar los mtodos de recuperacin de la estructura subyacente (pregunta 1), hemos utilizado dos ndices diferentes con base en las diferencias entre lo conocido componente de las cargas de la matriz y el estimado. Para hacer frente a la libertad de rotacin en el modelo, en ambos casos, primero tuvieron que resolver el siguiente problema con respecto a T.
para s = 1; 2 donde es el componente conocido matriz cargas, como se define anteriormente, y F * s es el componente estimado matriz de cargas que, para s = 1, se obtiene mediante el uso de uno de los dos modelos PCAF y, por s = 2, utilizando el modelo clsico de PCA. Finalmente, utilizando la libertad de rotacin, T es una matriz de transformacin de orden apropiado, que transforma posible a a de tal manera que se convierte en lo ms similar
. La solucin del problema en (65) est dada por regresin ordinaria as, para s = 1,2,
De ello se deduce que podemos encontrar que una de los dos mtodos se recupera la estructura subyacente mejor considerando los siguientes ndices, para s=1,2:
En el ndice en (66), conocido como la proporcin de recuperacin (PR) medida (por ejemplo, Timmerman y Kiers, 2000), cuyos valores estn en [0, 1], se compara la norma al cuadrado de la diferencia entre el componente estimado cargas matriz y el conocido, y la norma cuadrada de y el . En (67) se considera la diferencia media absoluta (MAD) entre todos los elementos de
estimado de . En ambos ndices, para cada caso, se han utilizado los valores correspondientes a la ejecucin del algoritmo que llev a la menor valor de la funcin (en LS-PCAF en la que tiene iguales elementos de la diagonal se usan los valores relativos a la ejecucin de la no -algoritmo iterativo). Decidimos concluir que un mtodo realizado notablemente mejor que la otra cuando la diferencia en cualquiera de los ndices excedido un valor umbral , por lo general = 0:02. Si la diferencia es menor, se consider que la diferencia es insignificante. Tambin hemos considerado el valor de umbral = 0:10 con el fin de evaluar cuando uno de los dos mtodos se recupera la estructura subyacente en los datos de una manera mucho mejor. En la secuela, cuando no se especifica, nos referimos = 0:02. Para evaluar la eficiencia del algoritmo, se compar el tiempo de clculo utilizando tanto el principio racional y los arranques aleatorios (pregunta 2). Es til sealar que la simulacin se llev a cabo en un ordenador personal con procesador Pentium III a 1 GHz y 256 MB de RAM. Finalmente, con respecto a la pregunta 3, se estudi la tendencia del algoritmo para golpear ptimos locales. Para este fin, se comprob, en cada caso, las veces que el valor de funcin era ms de 0:1% ms grande que la de la solucin ptima.
6.1.1. Rendimiento Recuperacin de PCAF En esta seccin daremos una respuesta a la primera de las tres preguntas planteadas al inicio de la seccin 6. Los resultados se resumen en la Tabla 1 que contiene 36 filas y 10 columnas. Las dos primeras columnas se refieren a la condicin involucrada, mientras que, a partir de la tercera, los otros pares de columnas se refieren a CS-PCAF con elementos diagonales iguales o diferentes y con LS-PCAF con, de nuevo, los elementos diagonales iguales o diferentes. Cada clula informa cuntas veces uno de los mtodos (PCAF en la primera columna, en la PCA segundo de cada par) trabajado notablemente mejor en trminos de ambos ndices. En la Tabla 1 podemos ver que CS-PCAF y PCA realiza de manera similar en muchos casos. Cuando tiene elementos diagonales iguales, este fue el caso en particular si el nivel de ruido aadido y el tamao de los diferenciales eran conjuntamente pequeos, de lo contrario CS-PCAF trabajado
ligeramente mejor que el PCA. Considerando CS-PCAF cuando tiene diferentes elementos de la diagonal, los mismos resultados mantenidos, excepto que, si = 1:0 y el nivel de ruido aadido era alta, se encontr con ms frecuencia que la ACP funcion mejor que CS-PCAF que el otro manera alrededor. Probablemente, en estas condiciones, la relacin entre los centros y los diferenciales perdido su validez. Para LS-PCAF, los ndices mostraron diferencias ms notables y de nuevo, en general, se encontr que el rendimiento de LS-PCAF era mejor que la de los tabla 1 Resultados de la CS-PCAF. Cada celda muestra el nmero de veces en las que uno de los dos mtodos funciona notablemente mejor que el otro de acuerdo con ambos ndices. Los valores entre parntesis se refieren al caso = 0:10 cuando no son iguales a 0
PCA. De hecho, se encontr que esto slo no se mantuvo cuando el nivel de ruido aadido era pequeo (especialmente cuando tiene diferentes elementos de la diagonal). Con respecto a las dems condiciones (nmero de componentes extrados de Dimension Data, el tamao de los mrgenes) que encontramos pocas diferencias y, en general, LS-PCAF funcion mejor que PCA.
La figura. 1. Promedio de tiempo de clculo de la CS-PCAF cuando tiene elementos diagonales iguales utilizando el principio racional y se inicia el azar. El tiempo de clculo promedio se distingue con respecto al tamao de los datos, el nivel de ruido aadido, el nmero de los componentes extrados y el tamao de los mrgenes.
En suma, para responder a la primera pregunta, se puede afirmar que LS-PCAF recupera la estructura subyacente en los datos mejor que PCA. Con respecto a la CS-PCAF, se puede concluir que CS-PCAF recupera la estructura subyacente en los datos a veces mejor y a menudo igualmente bien como PCA, salvo en raras condiciones en las que el PCA es mejor. PCA funciona mejor si ha diferentes elementos de la diagonal, tamao elevado de los diferenciales y un alto nivel de ruido aadido. La ltima consideracin (y los acerca LS-PCAF) nos ayuda a destacar el papel de la estructura de no afecta mucho los resultados, pero PCAF funciona mejor cuando tiene elementos diagonales iguales.
6.1.2. La eficiencia de los algoritmos En esta seccin responder a la segunda en la Seccin 6, perteneciente a la eficiencia del algoritmo. En la fig. 1, se da la media de tiempo de computacin del algoritmo, que distinguen la utilizacin del principio racional y de las aperturas aleatorias. Para cada caso, el algoritmo se ha ejecutado utilizando el principio racional y se inicia el azar. En las figuras siguientes, el tiempo de clculo promedio para cada valor de los parmetros se inform. El tiempo de clculo promedio perteneciente a los arranques aleatorios es la media de los tiempos de clculo de todas las cinco carreras (una carrera para CS-PCAF) para los diez casos para cada condicin.
Con respecto a LS-PCAF, en la que tiene elementos diagonales iguales, se corre el algoritmo no iterativo de la Seccin 4.2.1. Por lo tanto, en esta seccin, no se considera el caso de LS-PCAF, en la que tiene elementos diagonales iguales. Con un inicio racional (los resultados se muestra en la fig. 1) el tiempo promedio para el clculo interno basado en CS-PCAF con tienen elementos diagonales iguales era ms pequeo
La figura. 2. Promedio de tiempo de clculo de la CS-PCAF cuando tiene diferentes elementos de la diagonal utilizando el principio racional y se inicia el azar. El tiempo de clculo promedio se distingue con respecto al tamao de los datos, el nivel de ruido aadido, el nmero de los componentes extrados y el tamao de los mrgenes.
(15:3 s) de que el uso de azar comienza (60:6 s). Teniendo en cuenta los dos tipos de inicio, el tiempo de clculo aumenta si el nmero de la dimensin de otros datos de los componentes extrados o el tamao de los mrgenes aumentado. Ms o menos los mismos comentarios para sostener CS-PCAF con con diferentes elementos de la diagonal, como se puede observar considerando la fig. 2. En este caso, las diferencias entre las carreras racionalmente iniciadas ejecutan y comenz aleatoriamente eran ms pequeas que anteriormente: un poco ms del doble fue el promedio de tiempo de clculo usando el principio racional (42,55) en comparacin con que el uso de azar comienza (140,15).
El tiempo de clculo promedio era considerablemente ms pequeo para LS-PCAF para que tienen diferentes elementos de la diagonal (Fig. 3). En este caso, el tiempo de clculo promedio fue de 0:64 s utilizando el principio racional y 1:28 s utilizando azar comienza. Una vez ms el tiempo de clculo promedio aument si la dimensin de la cantidad de datos de otros componentes extrados o el tamao de los mrgenes aumentado. En este caso, el nivel de ruido y, sobre todo, el nmero de variables implica un aumento de los tiempos de clculo tambin.
Ahora podemos responder a la pregunta acerca de la eficacia. El tiempo de clculo de LS-PCAF es considerablemente menor que la de CS-PCAF. La estructura de la matriz afecta el tiempo de clculo mediante el aumento de si los elementos de la diagonal son diferentes. El se ejecuta utilizando el principio racional son ms eficientes que los que utilizan aperturas aleatorias. Finalmente, la eficiencia del algoritmo se reduce si la dimensin de los datos o el nivel de ruido aadido otro nmero de componentes extrados otro tamao del incremento de los diferenciales, aunque para CS-PCAF el nivel de ruido, no parece a3ect el tiempo de clculo mucho.
La figura. 3. Tiempo de clculo de promedio LS-PCAF cuando tiene diferentes elementos de la diagonal utilizando el principio racional y se inicia el azar. El tiempo de clculo promedio se distingue con respecto al tamao de los datos, el nivel de ruido aadido, el nmero de los componentes extrados y el tamao de los mrgenes.
6.1.3. Frecuencia de alcanzar ptimos locales de los algoritmos La ltima pregunta del comienzo de la seccin 6 fue "Los algoritmos ptimos locales golpeado con frecuencia? '. Al igual que en el apartado anterior que la conteste mediante el anlisis de los resultados de cada mtodo de anlisis para distinguir entre el principio racional y se inicia al azar. Los resultados se presentan en las Figs. 4-7. Los puntos en las Figs. 4 y 6 pantalla cuantas veces, en promedio, en cada condicin, los recorridos del algoritmo usando el cable de comienzo racional para el ptimo global (es decir, si el valor de la funcin es menor que 0,1% ms grande que la ms baja obtenida en los seis carreras ). La figura. 4 se refiere a CS-PCAF y los valores promedio puede variar de 0 a 2, ya que los resultados se basan en un estudio de simulacin ms pequeo realizado en dos conjuntos de datos para cada condicin. En su lugar, la fig. 6 se refiere a LS-PCAF y los valores pueden variar de 0 a 10. Finalmente, en las Figs. 5 y 7, respectivamente, para el CS-PCAF y LS-PCAF, los puntos de reportar el nmero promedio de arranques aleatorios que condujeron al ptimo global en cada condicin (el valor puede variar de 0 a 5).
Una vez ms, hemos considerado LS-PCAF slo cuando tiene diferentes elementos de la diagonal. La frecuencia de golpear ptimos locales depende, sobre todo, en la carrera algoritmo, sino tambin en el tamao de los mrgenes, la estructura de y el nivel de ruido. La dimensin de la matriz de datos y el nmero de componentes extrados no fueron importantes. En primer lugar, considerar CS-PCAF. Casi siempre se obtiene el ptimo global con lo racional o las aperturas aleatorias, tanto cuando tiene elementos diagonales iguales y cuando tiene diferentes elementos de la diagonal. De hecho, los resultados fueron a menudo muy bien, excepto en la condicin y = 1:0, donde la frecuencia de golpear ptimos locales segua siendo bueno, pero lo peor de toda la simulacin, especialmente cuando tiene diferentes elementos de la diagonal. Los resultados del algoritmo para el LS-PCAF eran incluso mejores que las anteriores. Con respecto al inicio racional, el algoritmo dado lugar a un ptimo local de un
La figura. 4. Frecuencia de alcanzar ptimos globales de CS-PCAF: nmero de veces en que se alcanza ptimo global cuando se utilizan las salidas racionales. Los valores se distinguen con respecto al tamao de los datos, el nivel de ruido aadido, el nmero de componentes extrados, el tamao de los mrgenes y la estructura de .
La figura. 5. Frecuencia de alcanzar ptimos globales de CS-PCAF: nmero medio de veces en que se alcanza ptimo global cuando se utilizan las aperturas aleatorias. Los valores se distinguen con respecto al tamao de los datos, el nivel de ruido aadido, el nmero de componentes extrados, el tamao de los mrgenes y la estructura de .
nmero insignificante de veces. En el otro caso el algoritmo se ejecuta con los arranques-la frecuencia de golpear al azar ptimos globales sigue siendo muy alta. Para concluir, podemos responder a la ltima pregunta observar que, en los algoritmos para el LSPCAF y CS-PCAF, podemos utilizar slo el principio racional (recordando que el
La figura. 6. Frecuencia de alcanzar ptimos globales de LS-PCAF ('s di3erent!): Nmero de veces en que se alcanza ptimo global cuando se utilizan las salidas racionales. Los valores se distinguen
con respecto al tamao de los datos, el nivel de ruido aadido, el nmero de los componentes extrados y el tamao de los mrgenes.
La figura. 7. Frecuencia de alcanzar ptimos globales de LS-PCAF ( 's es diferente): nmero medio de veces en que se alcanza ptimo global cuando se utilizan las aperturas aleatorias. Los valores se distinguen con respecto al tamao de los datos, el nivel de ruido aadido, el nmero de los componentes extrados y el tamao de los mrgenes.
tiempo de clculo promedio es menor), ya que conduce casi siempre al ptimo global (el riesgo es menor que 1%). La nica condicin en la que ms del inicio racional podra ser aconsejable es que si el tamao de los mrgenes es alta y tiene diferentes elementos de la diagonal, porque entonces la probabilidad de encontrar ptimos locales a menudo es considerablemente mayor (aproximadamente 5%). 7. Aplicacin a un conjunto de datos reales En esta seccin se aplican PCAF a un conjunto de datos reales, introducido por Ichino (1988). El conjunto de datos que s se conoce como "Grasas y Aceites de datos" y se reproduce en la Tabla 2. El conjunto de datos se refiere a ocho aceites (I = 8) descritos por cuatro variables de intervalos cuantitativos valor (J = 4). Por lo tanto, cada aceite es descrita por la "gravedad especfica", el "Punto de congelacin", el "ndice de yodo" y la "saponificacin". De hecho, hay tambin una variable cualitativa sino que slo se refieren a las cuantitativas. Hemos asumido que todas las variables tienen una funcin de pertenencia triangular y que existe una relacin lineal entre los centros y los mrgenes no puede ser una hiptesis plausible. Por lo tanto, hemos aplicado LSPCAF. Como tiene elementos diagonales iguales, las soluciones se obtienen utilizando el algoritmo no iterativo propuesto en la Seccin 4.2.1. Antes de ejecutar el algoritmo, se han preprocesado de los datos en la forma descrita en la Seccin 3,3. Hemos extrajo dos componentes (P = 2) y la bondad de ajuste, mediante el ndice en (27), fue de 90,2%. Despus de aplicar el
procedimiento de Gram-Schmidt a la matriz F, hemos obtenido la matriz de componentes cargas en la Tabla 3. Ahora puede representar adecuadamente los aceites de ocho a comprender mejor sus caractersticas. Hemos aplicado los dos procedimientos de trazado que figuran en la seccin 5. Usando (56) y despus de encontrar el segmento que incluye todos los vrtices, hemos obtenido la representacin dada en la fig. 8. tabla 2 Grasas y aceites conjunto de datos
La figura. 8. Representacin de los ocho aceites en la 2rst dos frmulas eje principal mediante (56). Cada etiqueta se refiere a la asociada oroil grasa de acuerdo con la Tabla 2.
Hemos representado (en la fig. 9) los ocho aceites tambin mediante el procedimiento segundo trazado utilizando la frmula (58). La nica diferencia es que los rectngulos obtenidos utilizando (56) son ligeramente ms grandes, especialmente con respecto al primer componente. De todos modos, podemos observar tres tipos de aceites. El primero est compuesto por linaza y perilla (aceites utilizados forpaint) y el segundo, el ms grande, de semillas de algodn, ssamo, Camelia y Olive. Por ltimo, muy lejos de los otros dos grupos, aparece el ltimo de la derecha. Est compuesta por sebo y grasa de cerdo, dos grasas animales. Inspeccin de las Figs. 8 y 9, se puede observar que los resultados obtenidos son muy similares. De acuerdo con las ubicaciones de los aceites en las dos figuras y a las caractersticas de los aceites que se pueden interpretar los ejes. A la derecha (izquierda) de los ejes primero hay aceites cuya saponificacin y los valores del punto de congelacin es mayor (menor). Podemos comprobar esto mediante la observacin de que las dos grasas de la derecha tienen los valores ms altos (utilizando el punto medio del intervalo): respectivamente, 194,5 y 34 para el sebo de ternera y 196 y 27 para la grasa del cerdo. Los ejes segundo es ligeramente ms complejo. En la parte superior se encuentran los aceites cuya gravedad especfica de valor y, de nuevo, el valor de saponificacin son ms altos. Por esta razn, la perilla se en la parte superior: tiene el valor ms alto de gravedad especfica y el valor de saponificacin es, en promedio (que es el valor ms alto sucesivamente). Linaza tiene una gravedad especfica alta, pero un bajo saponificacin y, por el contrario, sebo y grasa de cerdo tienen altos valores de saponificacin pero los valores especficos de muy baja gravedad (su ubicacin es el ms bajo de esto es la razn). Los valores de saponificacin y gravedad especfica de las otras cuatro aceites, pertenecientes al segundo grupo, son en promedio. Por lo tanto, explica su posicin en el centro. El importante papel desempeado por saponificacin en ambos ejes ayuda
La figura. 9. Representacin de los ocho leos sobre el eje principal dos primeros mediante la frmula (58). Cada etiqueta se refiere a la grasa asociada o aceite de acuerdo con la Tabla 2.
tambin para explicar el tamao del rectngulo perteneciente a Semilla de lino, que es con mucho el ms grande. La falta de claridad de este resultado es el ms grande: el lmite inferior es de 118 y el lmite superior 196 que conducen a un valor central igual a 157 y un valor diferencial igual a 39.
8. Conclusin En este trabajo se han propuesto dos procedimientos PCA para detectar la estructura subyacente de los datos difusos de las unidades de observacin y las variables I J difusos. En el primero (CSPCAF), se supone que se propaga estimados son linealmente relacionada con la matriz de centros estimado. En la segunda (LS-PCAF) asumimos que los diferenciales se descomponen en una matriz de puntuaciones de componente (diferente de la de los centros) y el mismo componente matriz cargas de los centros. De esta manera, LS-PCAF busca un compromiso entre la estructura de centros y se extiende. Adems, sugerimos dos procedimientos para el trazado puntuaciones de los componentes. En el primero, teniendo Bock y Diday (2000) como punto de partida, encontramos las hipercubos (en el espacio dimensional bajo), incluyendo todos los vrtices proyectados de los hipercubos originales. En la segunda, hemos obtenido hipercubos exactas, pero el procedimiento tiene un inconveniente y no siempre tiene una solucin. En este contexto, se necesita ms investigacin. Para evaluar cmo PCAF funciona, lo hemos comparado con el clsico PCA por medio de los resultados de una aplicacin a datos reales y difusos de una simulacin en la que se generan aleatoriamente conjuntos difusos de datos cuya estructura subyacente se conoca. Los conjuntos de datos se construyeron de acuerdo a los diferentes niveles de dimensiones de datos de ruido,, componentes extrados, los tamaos de los mrgenes y las funciones de pertenencia. En conjunto, los resultados han mostrado que el rendimiento de LS-PCAF era mejor que la de PCA, pero el rendimiento vari en las condiciones anteriores. Con respecto a la CS-PCAF, se encontr que funcionaba mejor que o igual de bien como PCA. Sobre la base de los buenos resultados de la simulacin y de la aplicacin real, indicada al menos dos perspectivas de investigacin: la mejora de la representacin grfica de las unidades en el espacio de pocas dimensiones, como se ha sealado ms arriba, y la extensin del modelo a acuerdo con conjuntos de tres vas de datos difusos. Por otra parte, ser interesante realizar un estudio de simulacin nuevo con el fin de comparar nuestros mtodos para el trabajo de Cazes et al. (1997) y extensiones de su enfoque (Palumbo y Lauro, 2002) y la obra de Yabuuchi et al. (1997).

Principal Component Analysis of Symmetric Fuzzy Data

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Principal Component Analysis of Symmetric Fuzzy Data

Enviado por

Direitos autorais:

Formatos disponíveis

Principal Component Analysis of symmetric fuzzy data

Anlisis de componentes principales de datos simtricos difusos

Sea x = (m - )/s, se deduce que

Utilizando el Hg + H2J -1 + g = 0J, g = 1,, 2J -1, es evidente que

Actualizando AM: De (28), despus de definir

, sigue siendo para minimizar

El problema de minimizacin en (29) tiene la solucin

Actualizando F: A partir de (28) tenemos

El problema en (31) tiene la solucin que se da

La solucin del problema de

En resumen, el procedimiento de estimacin consta de los pasos siguientes:

Actualizacin de AS: De (37) se mantiene para minimizar

En este caso se obtiene

Actualizacin de F: Contamos con:

La solucin del problema de minimizacin en (42) es

4.2.1. El caso especial en el que

y, por lo tanto, se obtienen las siguientes estimaciones

en el modelo CS-PCAF, y como

Você também pode gostar