Você está na página 1de 7

Las redes neuronales

Este documento describe de manera breve el funcionamiento y algunos usos posibles de las redes neuronales. Se trata de una herramienta de anlisis estadstico que permite la construccin de un modelo de comportamiento a partir de una determinada cantidad de ejemplos (constituidos por una determinada cantidad de "variables descriptivas") de dicho comportamiento. La red neuronal, completamente "ignorante" al principio, efecta un "aprendizaje" partiendo de los ejemplos, para luego transformarse, a travs de modificaciones sucesivas, en un modelo susceptible de rendir cuenta del comportamiento observado en funcin de las variables descriptivas. La construccin del modelo es automtica y directa desde los datos; no necesita intermediario especial o costoso sea experto o "cognitista". Por ejemplo, al impartir a una red neuronal un aprendizaje relacionado con descripciones de personas que piden prstamos (estado civil, profesin, etc.), aunado a su comportamiento adoptado frente al reintegro del dinero, nos encontramos en capacidad de construir un modelo del riesgo asociado con la descripcin de los clientes. Si luego, le pedimos a ese modelo predicciones sobre nuevos expedientes, podemos constatar que la red neuronal predice correctamente de 80 a 95% si el cliente pagar bien o no. Esta es la operacin de segmentacin o clasificacin. En todo caso, la red neuronal una vez construida constituye une verdadero modelo "a la medida" que acta en funcin de lo que percibe : no va a repetir las experiencias pasadas de manera tonta. tampoco se trata de ir a buscar dentro de una biblioteca un modelo ms o menos adaptado. Si en realidad existe una relacin de causa a efecto en medio de las descripciones introducidas (perfil del prestatario, cotizaciones anteriores de una accin, relaciones de medidas, punto de funcionamiento deseado) y los valores a prever (riesgo de "ruptura" del prstamo, curso de la accin 10 das ms tarde, naturaleza de la avera, variables de mando), la red la descubrir. La red neuronal es slida. No se queda invalidada con algunos ejemplos enredados o falsos : estos sern descartados del resto por su incoherencia. Los valores ausentes son tambin hbilmente manejados y no perturban la construccin del modelo. En un mbito completamente diferente, se puede aprender a asociar en una mquina-herramienta relaciones de medidas y sus averas : el previsor despejado realiza una manutencin preventiva indicando la posibilidad de avera desde el momento en que las medidas tomarn valores que l estimar como sospechosas (o realizando un diagnstico a partir de las ltimas relaciones si es demasiado tarde). Esto ha sido ampliamente experimentado en el caso del diagnstico de vibracin de las mquinas giratorias.

Asmismo, en funcin automtica y en funcin mando es posible modelizar el comportamiento de un reactor qumico o de un robot. La red neuronal indica segn el modo de funcionamiento que usted desee cules son los valores necesarios de las variables de mando. A este respecto remtase a nuestro ejemplos Parabola (gua de proyectil) y Vehculo (gua de vehculos) en nuestro CD-ROM de demostracin. Dichos ejemplos son sencillos pero ilustran ampliamente el problema. Esta capacidad para aprender todo aquello que tenga un sentido ("aproximador universal") ha sido establecida de manera rigurosa (Teorema de Kolmogorov). Las redes neuronales son una herramienta de gran rigor cuyas bases han sido demostradas. No se trata de un "hack", ni de una fbrica de gas de los cuales "no se sabe porqu funcionan". Este mtodo no se ha popularizado sino en la poca actual por la simple razn de que ahora es cuando se ha llegado a un cierto poder de clculo necesario para su puesta en aplicacin : los 10 minutos necesarios para aplicar un aprendizaje en un IBM-PC Pentium en 1998 representan 320 horas en un IBMPC XT en 1982 (es decir 13 das y 13 noches). Incluso los inventores del aprendizaje de redes neuronales en los aos 70 habran requerido los recursos de la NASA para construir un previsor neuronal con respecto a los 50 000 clientes de un banco dado. Otra de las razones tiene que ver con el hecho de que una cantidad cada vez mayor de actividades disponen de registros informticos. Sin embargo, el proverbio "los datos no estn dados" es afortunadamente cada vez menos cierto.

El algoritmo gentico
El algoritmo gentico permite obtener soluciones a un problema que no tiene ningn mtodo de resolucin descrito de forma precisa, o cuya solucin exacta, si es conocida, es demasiado complicada para ser calculada en un tiempo aceptable. Es el caso particular de cuando se encuentran restricciones mltiples y complejas e incluso contradictorias que deben ser satisfechas simultneamente como por ejemplo para formar equipos de trabajo, planificar rondas de entregas, implantar puntos de venta de manera ptima, construir modelos estadsticos. Segn el algoritmo gentico, numerosas soluciones ms o menos correctas inherentes a dicho problema son creadas al azar, segn una forma ya definida : itinerario, horarios, base de reglas de decisin, evaluacin por puntuacin, red neuronal, etc. Cada solucin ser representada a travs de una cadena de 0 y de 1 "cromosomas" que se vern entonces sometidos a una imitacin de la evolucin de las especies : mutaciones y reproduccin por hibridacin. Al favorecer la supervivencia de los ms "aptos" (las soluciones ms correctas), se provoca la aparicin de hbridos cada vez mejores que sus padres. Remtase al artculo "The origin of Sex" en el folleto anexo (o

disponible si nos lo solicita). Una funcin de descodificacin sirve para "traducir" la representacin de forma cromosomas 0-1 a la forma que ms nos interese. La poblacin inicial da paso de esta manera a generaciones sucesivas mutadas y procreadas por hibridacin a partir de sus "padres". Al despejar los elementos ms aptos ("presin de la evolucin") se garantiza que las generaciones sucesivas sern cada vez ms adaptadas a la resolucin del problema. Este mecanismo sorprendente de clasificacin ha sido validado matemticamente con el rigor que le compete. El mecanismo de evolucin y de seleccin es independiente del problema por resolver : slo varan la funcin que descodifica el genotipo en una solucin posible (cualquier tipo de descodificacin tiene la posibilidad de ser utilizado de la manera ms sencilla posible) y la funcin que evala la justeza de la solucin (en el caso de los previsores probndolos en unas cuantas centenas de casos). Esta tcnica es de aplicacin general.

Algoritmo gentico y data mining


El algoritmo gentico puede aplicarse a la produccin de una variedad de objetos mientras sea posible obtener una calificacin que represente la justeza de la solucin. En particular, es posible fabricar previsores estadsticos no a travs de clculos de datos como en la estadstica clsica sino haciendo evolucionar los datos por algoritmo gentico ("induccin"). Por problemas de clasificacin o de segmentacin, la justeza significa simple y llanamente la tasa de reordenacin del previsor con respecto a un conjunto dado de ejemplos. El mecanismo de estimulacin de lo ms apto permite entonces la aparicin del previsor que reordenar los datos lo mejor posible. Este tipo de construccin de previsor forma parte de las llamadas tcnicas de data mining. Los previsores producidos pueden tener formas muy diversas : bases de reglas, evaluacin por puntuacin, rboles de decisin e incluso redes neuronales. Las herramientas respectivas de PMSI son Galvano Bases de Reglas, Galvano Radial Basis-Function, Galvano Puntuacin, Galvano Arboles de decisin y GalvaNeuronas.

Por qu esta tcnica es interesante


Se trata de un enfoque un poco brutal que necesita un gran poder de clculo pero que posee la inmensa ventaja de proporcionar soluciones no muy lejos de lo ptimo incluso sin conocer mtodos de soluciones. El algoritmo gentico no exige ningn conocimiento acerca de la manera ms idnea de resolver el problema; slo es necesario la capacidad de evaluar la calidad de una solucin. Tambin es muy ligero para ponerlo en prctica (el "motor" es comn, no hay mucha programacin especfica que hacer). En la resolucin de un mismo problema : el enfoque algortmico es especfico, muy rpido mientras el algoritmo gentico se caracteriza por ser general pero muy lento. Enfoque ad hoc (analtico especfico) Enfoque gentico Rapidez Segn la solucin, por lo general Dbil o media grande Performance Segn la solucin Media a alta Comprensin del Necesaria No necesaria problema

Trabajo del hombre Aplicabilidad

De algunos minutos a algunas tesis


Dbil : La mayora de los problemas interesantes no son explotables desde el punto de vista de su expresin matemtica, o son no-calculables o NPCompletos (demasiadas posibilidades)

Algunas horas General

Etapas intermediarias

soluciones No son soluciones (hay que esperar a Son proceso puede terminar los clculos)

(el ser retomado en cualquier momento)

El Data Mining
Data Mining y estadstica
El Data Mining es el descendiente y -segn algunos- el sucesor de la estadstica tal y como sta se utiliza actualmente. Estadstica y Data Mining conducen al mismo objetivo, el de efectuar "modelos" compactos y comprensibles que rindan cuenta de las relaciones establecidas entre la descripcin de una situacin y un resultado (o un juicio) relacionado con dicha descripcin. Fundamentalmente, la diferencia entre ambas reside en que las tcnicas del Data Mining construyen el modelo de manera automtica mientras que las tcnicas estadsticas "clsicas" necesitan ser manejadas - y orientadas - por un estadstico profesional. Las tcnicas de Data Mining permiten ganar tanto en performance como en manejabilidad e incluso en tiempo de trabajo. La posibilidad de realizar uno mismo sus propios modelos sin necesidad de sub-contratar ni ponerse de acuerdo con un estadstico proporciona una gran libertad a los usuarios profesionales.

Porqu el Data Mining es una buena idea ?


Al construir espontneamente un modelo de dependencias en lugar de verificar las hiptesis de un estadstico, es posible, a veces, a travs de las tcnicas de Data Mining remontar tesoros a la superficie, como por ejemplo la asociacin entre el sndrome de Reyes y el tomarse una aspirina o para ser menos serios la correlacin entre la compra de paales y de cerveza el sbado por la tarde en los supermercados norteamericanos. Este ltimo ejemplo ilustra muy bien la necesidad de conocer su campo de trabajo -pero slo eso- para lanzarse en el Data Mining : slo un especialista que conozca su clientela es capaz de interpretar una correlacin bruta para realizar el retrato de una joven pareja haciendo sus compras, la mujer

comprando paales mientras que el marido se aprovisiona de cervezas previendo el partido de ftbol del domingo por la tarde. Las tcnicas del Data Mining nos hacen prescindir de un estadstico, sin embargo todava es indispensable dominar el oficio. Correlaciones sorpresa como las que anteriormente describamos no son, de todas maneras, muy frecuentes ; las principales ventajas del data mining siguen siendo su rapidez y su sencillez. Adems, dichas tcnicas permiten trabajar con grandes cantidades de ejemplos (varios millones) sin ningn inconveniente. Tambin permiten tratar una gran cantidad de variables predictivas (hasta varios millares). Esto ltimo es de una gran utilidad para "seleccionar variables" (determinar las ms tiles dentro de una gran masa).

Varios tipos de modelos estadsticos


PMSI propone herramientas capaces de producir rboles de decisin, bases de reglas de decisin, evaluacin por puntuacin y redes neuronales. Como en todo lo producido por la mquina, las predicciones estadsticas fabricadas por el Data Mining deben ser inspeccionadas por personas familiarizadas con el asunto, de manera a comprender y verificar lo que fue producido. Por ende, es importante que dichas predicciones dispongan de una forma ampliamente legible y, en la medida de lo posible, que ya sea conocida en otro campo. Existe un trmino medio entre la claridad del modelo y su poder de prediccin. Mientras ms sencilla sea la forma del modelo, ms fcil ser su comprensin, pero tendr menor capacidad para tomar en cuenta dependencias sutiles o demasiado variadas (no lineales). La figura del lado izquierdo ilustra una representacin de dicho trmino medio. Los rboles de decisin y las bases de reglas se interpretan muy fcilmente pero no conocen sino los lmites "duros" de comparacin en niveles de decisin Si-No. Adolecen de una fineza predictiva. Los evaluacines por puntuacin, lineales o con funciones logsticas son un poco ms "sofisticadas" pero como slo adicionan resultados no pueden dar cuenta de relaciones multivariables (por ejemplo, para los propietarios el riesgo aumenta mientras que para los arrendatarios disminuye en funcin de la edad). Las redes neuronales son las damas de la prediccin estadstica (y tienen tambin la posibilidad de adaptarse a valores bastante indefinidos e incluso ausentes), pero resulta completamente imposible el inspeccionar - es como si quisiramos examinar el cerebro de alguien para saber lo que piensa !-. Slo las predicciones realizadas pueden ser inspeccionadas y visualizadas. Sin embargo, una buena herramienta de visualizacin (como por ejemplo nuestro SaxView) le da la posibilidad al usuario de reconstruir el "razonamiento" de la red neuronal. Segn cual sea el precio a pagar, y una vez que se haya establecido la confianza en la herramienta establecida, el usuario notar, la

mayora de las veces, que la prdida parcial de comprensin ser ms que compensada por la calidad de las predicciones.

Cmo se construyen los modelos ?


Ninguno de los modelos estadsticos presentados es nuevo. Los rboles de decisin y de regresin (classification and regression trees o "CART") han sido utilizados en ciencias sociales en los aos 60 ; las bases de reglas fueron popularizadas durante el auge de los "sistemas expertos" en los 80 ; y la evaluacin por puntuacin apreciada por los banqueros durante largos decenios. Incluso las redes neuronales nos acompaan desdes los aos 40, pero han sido preciso el desarrollo en poder de clculo de estos ltimos aos para que por fin fueran utilizables de manera sencilla. La mayora de estos previsores se fabrican, no por clculo directo partiendo de los datos como antes, sino a travs de mtodos tomados del campo de la "inteligencia artificial". Las dos tcnicas principales son el aprendizaje (a partir de un modelo "cualquiera" que se ajusta progresivamente a la realidad) y la evolucin (o "vida artificial", un conglomerado de varios miles de modelos "cualquiera" son susceptibles de "evolucionar" de manera competitiva, "darwiniana"). Tradicionalmente, pero no de manera obligatoria, el aprendizaje slo se aplica a las redes neuronales (aunque la tcnica de "retropropagacin del error" sea aplicable a una gran variedad de objetos), y las tcnicas de evolucin ("algoritmo gentico") se aplican a la produccin de bases de reglas, de rboles de decisin y de evaluacin por puntuacin. Adems, todas las herramientas permiten que se determine la importancia de cada variable para la decisin ("distintividad" o carcter pertinente). Esto resulta de extrema utilidad para proceder a la seleccin de variables. Al haber determinado con precisin las variables ms pertinentes, se podr optar por retomar el problema con tcnicas ms convencionales si ciertas restricciones de explotacin lo imponen.

Text Mining
Las tcnicas hasta ahora descritas slo tratan datos numricos o cualitativos. El text mining surge ante el problema cada vez ms apremiante de extraer informacin automticamente a partir de masas de textos. La enorme cantidad de referencias recogidas durante una bsqueda en Internet ilustra muy bien este problema. La investigacin literal simple se ha mostrado limitada desde hace ya mucho tiempo ; hay muchos problemas como los errores de tipeado, la sinonimia, las acepciones mltiples, etc. En definitiva, es necesario inyectarle al ordenador un cierto sentido comn o "conocimiento del mundo". An en ese caso, la memoria y el poder de clculo disponibles en nuestra poca permiten ciertas

soluciones que no siempre son las ms elegantes pero s potentes y rpidas. Nuestras tcnicas de "fuzzy string matching" y de bsqueda de contexto han dado excelentes resultados en la prctica. Il nous est possible de savoir quels sont les sujets abords dans un texte sans trop de contresens grossiers, particulirement dans des domaines techniques (textes scientifiques, brevets, etc.). Nos techniques sont cependant mises l'preuve sur des textes littraires - qui peut le plus, peut le moins.

Conclusin
La llegada del Data Mining se considera como la ltima etapa de la introduccin de mtodos cuantitativos, cientficos en el mundo del comercio, industria y negocios. Desde ahora, todos los no-estadsticos -es decir el 99,5% de nosotros - pueden construir modelos exactos de algunas de sus actividades, para estudiarlas mejor, comprenderlas y mejorarlas. Por primera vez en la historia, las estadsticas escaparn a las manos de los especialistas. El arte del especialista se ha sustituido por nuevos mtodos que aportan resultados de la misma calidad o mejores, todo ello sin necesidad de conocimientos especializados. El Data Mining y el "Text Mining" son, sin duda aguna, las aplicaciones ms tiles de la potencia creciente del ordenador y pertenecen al campo de investigacin de mayor inters en la Informtica Avanzada.

Você também pode gostar