Tabla Resumen Conexionismo

Universidad de Valparaso Escuela de Psicologa Fundamentos Filosficos y epistemolgicos de los sistemas tericos en Psicologa II Acadmico: Eduardo Jeria Garay
El enfoque conexionista 1. Breve historia del enfoque conexionista Es posible rastrear el conexionismo en el trabajo de algunos tericos precursores. En primer lugar, el trabajo de Ramn y Cajal, quien enunci por primera vez la idea que el sistema nervioso humano estaba compuesta por millones de unidades discretas llamadas neuronas. Otros neurobilogos, como Sherrington, descubrieron que, no obstante lo anterior, las unidades no eran independientes, sino que estaban conectadas entre s por medio de transmisores qumicos que se descargaban en el espacio interneuronal o espacio sinptico. Gracias a estos aportes de la neurobiologa se pudo saber ms acerca del sistema nervioso y con ello se abrieron numerosas especulaciones acerca de cmo podra funcionar la compleja estructura del cerebro a partir de unidades tan pequeas. Un segundo elemento terico fue propuesto por Donald Hebb. Este psiclogo propuso que la unin entre dos neuronas poda fortalecerse en la medida que las actividades entre estas dos neuronas tendan a coincidir. As, las unidades podan establecer recurrencias entre unidades, de manera que se formen redes y subredes. En tercer lugar, la investigacin de McCulloch y Pitts publicada en un influyente artculo de 1956, sobre el uso de unidades conectadas entre s similares a las neuronas- que podan demostrar teoremas lgicos produjo un gran asombro y abri un insospechado campo para la Psicologa, la Lgica y otras ciencias cognitivas. Estas primeras investigaciones produjeron una gran expectativa de lo que las redes podran hacer y la tecnologa que seran capaces de generar. Sin embargo se comprob matemticamente serias limitaciones para lo que las redes podan hacer y con ello la investigacin qued estancada por varios aos. En los aos 60 se declaraban oficialmente muertas las redes neuronales. Sin embargo, nuevos descubrimientos en la matemtica permitieron liberar a las redes de su entrampamiento inicial y darle nuevos bros a la investigacin. En los ltimos 20 aos (principalmente desde 1986) ha resurgido el inters inicial por el tema de las redes neuronales y vemos como da a da ganas espacios en ciencia bsica y aplicada. Dado lo anterior han surgido muchos programas que aplican los principios del conexionismo exitosamente y abarcan un amplio espectro que va desde la percepcin visual a la prediccin en la bolsa de valores. Como resumen general, podemos decir que el conexionismo concibe la cognicin como una emergencia de la actividad de una red de unidades, conocidas como neuronas artificiales, que estn interconectadas masivamente y que computan en paralelo los mensajes de activacin o inhibicin provenientes de otras neuronas. Las neuronas reciben inputs de muchas otras neuronas y responde con un output que es funcin de la activacin de la que fueron objeto. La respuesta depende de si se supera un umbral, es decir, un lmite numrico que indica de modo todo o nada si la neurona disparar, es decir, enviar un output. Las conexiones entre neuronas tienen un peso, es decir, algunas conexiones tienen mayor impacto sobre la respuesta de la neurona target que otras. 2. Los elementos bsicos de una arquitectura conexionista 2.1 Las unidades de una red conexionista Los elementos bsicos de una arquitectura conexionista son una serie de microprocesadores simples que por sus caractersticas son asemejadas a neuronas, puesto que son unidades que reciben y envan seales y que funcionan como estaciones locales de procesamiento y computacin. Las neuronas artificiales reciben informacin de muchas otras unidades con las cuales estn conectadas, de manera de procesar o transformar la informacin recibida y emitir una seal de salida hacia otras neuronas. Existen tres tipos de unidades en una red neuronal, que se organizan en tres capas, una por cada tipo de unidad1:
1
Se les llama capa, estrato o nivel al conjunto de neuronas que reciben informacin de la misma fuente y ofrecen informacin al mismo destino.
Por Eduardo Jeria Garay Santiago, primer semestre 2005
Unidades de entradas Las unidades de entrada reciben informacin desde fuentes externas a la red. La informacin puede provenir del mundo fsico en el caso que la red posea algn tipo de sensores. Por otra parte la informacin tambin puede provenir de bases de datos, de otras redes o de informacin que un usuario introduce en el computador Unidades de salida Las unidades de salida envan informacin o seales al exterior del sistema; constituyen las unidades de respuesta de la red. Si la red dispone de conexiones con sistemas motores su respuesta ser la intervencin en el exterior. Si en cambio la red no los posee, la salida puede ser utilizada como sistema de alimentacin de datos para otras redes o slo entregan datos de par ser interpretados por el usuario. Unidades ocultas (hidden units). Las unidades ocultas no estn en contacto directo con el exterior de la red. Las unidades ocultas no reciben input directamente del ambiente ni envan output al ambiente externo. Su funcin es procesar informacin la informacin en niveles complejos y favorecer cmputos ms eficaces. El sistema de tres capas con unidades ocultas permite una potencia computacional mucho mayor que una red neuronal de dos capas 2.2 Las conexiones entre las unidades
En una red neuronal, las unidades se conectan entre s por medio de sinapsis. Estas sinapsis son funcionalmente anlogas a las conexiones de las neuronas reales, es decir, dos unidades se vinculan entre s de manera tal que una de las neuronas cumple la funcin de entrega de seal (presinptica) y otra la de recepcin de dicho mensaje. Cada unidad tiene habitualmente una gran cantidad de unidades que se conectan con ella. El abanico de entrada es el nmero de elementos que excitan o inhiben una unidad dada. El abanico de salida de una unidad es el nmero de unidades que son afectadas directamente por dicha unidad. La informacin que puede recibir, almacenar y emitir una red, est determinada por lo que se llama el abanico de entrada y el abanico de salida. Hay dos tipos de sinapsis: Sinapsis inhibidora: En este tipo de conexin el impulso que una neurona recibe, inhibe su actividad. Si la neurona j transmite a la neurona i un impulso que inhibe a sta, el nivel de activacin de la neurona I decrecer y decrecer en funcin del peso establecido para dicha conexin y de la cantidad de informacin que se transmite por dicha sinapsis. Sinapsis excitatoria: En este tipo de conexin el impulso que una neurona recibe excita o aumenta su actividad. Si la neurona J est conectada mediante una sinapsis excitadora con la neurona I, el nivel de activacin de la unidad I aumentar si le llega informacin por dicha conexin desde la neurona J, y lo har en funcin del peso de la conexin y de la magnitud de la seal que se le enva.
Cada uno de estas sinapsis tiene un peso sinptico o peso de conexin. Las conexiones entre dos unidades estn jerarquizadas en orden de importancia o impacto en la unidad target. Esto se logra por medio de la introduccin de una constante numrica que interviene en el algoritmo de activacin-inhibicin que supone la sinapsis y, por lo tanto, que grada la intensidad de la seal entrante, amplificndola o minimizndola. El concepto de peso de las conexiones permite entender tanto las capacidades computacionales de la red como su flexibilidad para procesar los datos. El concepto de peso puede servir para entender cmo el sistema almacena la informacin a medida que aprende. Una sinapsis frecuente o
Conexiones sinpticas (pesos diversos) UNIDADES DE SALIDA
Salida axonal UNIDADES OCULTAS Conexiones sinpticas (pesos diversos) UNIDADES DE ENTRADA
Salida axonal
Figura 5. Esquema de una red conexionista

importante en la red se presentar por medio de un valor de peso de conexin elevado y contribuir de manera importante en el estado de respuesta de la neurona receptora. En el caso opuesto, un valor de peso menor impactar menos en la respuesta de la neurona. Los pesos sinptico se expresan por medio de valores numricos sencillos, como nmeros enteros o fracciones con los que se ponderan las seales que reciben de las diferentes neuronas involucradas en la sinapsis. Por otra parte, en los modelos conexionistas tambin es muy relevante la vinculacin que se establece entre las diferentes unidades, lo que podemos denominar patrn de conexiones. El conocimiento que la red alcanza a partir del aprendizaje no slo se representa mediante los pesos de las conexiones sino tambin por medio de este patrn de conexin, que determinar, por lo tanto, el modo de procesamiento de las seales y la respuesta del sistema ante cualquier entrada. Como sealamos, las conexiones de la red se ordenan segn una jerarqua son entre las capas adyacentes, estrictamente jerarquizadas. Todas provienen de la capa input y van avanzando, desde las capas input a las capas output y, por lo tanto, son conexiones del tipo prospectivas (feedfoward conections). As, el conocimiento en una red neuronal habitualmente se relaciona especialmente con la conectividad que se produce en torno a la capa oculta, puesto que esta capa permite el procesamiento de las seales de entrada, su combinacin, reacomodacin y posterior transformacin en seal de salida.
Flujo de Informacin
2.3 La red en funcionamiento Cada neurona posee un estado de activacin, que es el estado numrico dependiente de las entradas recibidas. Ese estado sirve de dato fundamental para calcular la funcin de salida, que calcula la seal de salida a partir del estado de activacin que en ese momento tiene la neurona. La seal de salida se transmite a las dems neuronas conectadas con la unidad. La unidad receptora pondera la seal de las unidades con las que est conectada tomando en consideracin tanto el peso asociado a cada una de las conexiones como la intensidad del mensaje recibido. El estado de activacin cambia en funcin de cuatro factores: el estado de activacin anterior, las entradas que la neurona recibe, los pesos de las conexiones por las que recibe las seales y el algoritmo utilizado para calcular la activacin a partir de dichas entradas. Una vez establecida la red neuronal se inicia el proceso de entrenamiento o aprendizaje de la red. Una red neuronal aprende cuando es capaz de ofrecer ante un determinado patrn de entrada el correspondiente patrn de salida. El procedimiento consiste en exponer al sistema a los patrones de estmulos que queremos que la red reconozca. Para ello se presentan miles de estmulos al sistema. Mientras ello ocurre, los pesos sinpticos irn variando gracias a la aplicacin de diferentes reglas de aprendizaje, como la regla delta generalizada que permite ajustar el valor de los pesos de las conexiones que no cumplen con el valor esperado de salida. Este proceso permitir que la red pueda enfrentarse exitosamente a nuevos estmulos y que sea capaz de reconocer acertadamente los patrones de estmulos propuestos. En otras palabras, la regla delta permite moldear exitosamente la red como una configuracin necesaria de pesos, aunque comience con una configuracin aleatoria. Esta regla hace que el sistema aprenda de las pruebas que se le hacen y tambin de los errores que produce. Este proceso se denomina aprendizaje automatizado por la retropropagacin del error. Esta regla permite encontrar el orden y la estructura ante estmulos que desestructurados y en caos. Hay un descenso de gradiente en el porcentaje de error de los pesos sinpticos, lo que lleva a que el sistema presente, al cabo de un cierto tiempo, un error global mnimo, lo que le da al sistema una gran potencia a la hora de reconocer un patrn de estmulos. Existen varios modelos de aprendizaje que muestran cmo se produce el entrenamiento. En el aprendizaje supervisado existe un agente externo (supervisor o maestro) que controla el proceso de aprendizaje de la red. En el aprendizaje no supervisado la red se autoorganiza y en virtud de su propia actividad descubre caractersticas, regularidades, correlaciones o categoras en los datos de entrada. Finalmente en el aprendizaje reforzado tambin existe un supervisor que examina las salidas del sistema, sin embargo, no se dispone de salidas deseadas precisas por lo que no es posible computar el error para cada una de las unidades de salida; el supervisor valora el comportamiento global de la red mediante un criterio y en funcin de l modifica los pesos mediante un mecanismo de probabilidades. En este aprendizaje, el supervisor se comporta como un crtico, que opina sobre la respuesta de la red. 3. Las ventajas del conexionismo Los partidarios del conexionismo han argido que ste presenta claras ventajas sobre las arquitecturas simblicas computacionales. Dentro de stas sealan: a) Inspiracin biolgica: Una de las principales fortalezas del conexionismo es que nos permite entender de manera clara cmo la cognicin puede sentarse sobre un rgano biolgico. El cerebro. La arquitectura del conexionismo es una modelizacin y una idealizacin de la arquitectura del cerebro. El sistema nervioso, tal como un sistema de procesamiento en paralelo est compuesta de unidades discretas masivamente conectadas, formando una red. Las neuronas artificiales, al igual que las biolgicas reciben mltiples seales de entrada y se conectan con una nica seal de salida con muchas otras unidades, etc. b) Dualismo hardware-software: Derivado de lo anterior, los modelos conexionistas no obedecen al dualismo funcionalista hardware-software. La descripcin de la mente no puede hacerse con independencia de las propiedades del hardware del que es funcin. Al menos, no puede
hacerse sin dejarse en el camino caractersticas esenciales de los procesos mentales (robustez, flexibilidad, sensibilidad a la experiencia, etc.). c) Robustez: Las redes neuronales biolgicas y artificiales comparte la caracterstica de ser robustas ante fallas y daos, puesto que an perdiendo parte de la informacin de la red son capaces de funcionar de manera aceptable y acertada. Estas fallas pueden provenir de condiciones de degradacin parcial del medio interno (fallas del propio organismo, como cambios de atencin, estados de somnolencia, microlesiones del tejido cerebral, etc.) y externo (informacin con mucho ruido, incompleta o degradada). Esta robustez tambin es propia de las redes neuronales artificiales, las cuales son hbiles para captar significados globales de las situaciones con informacin incompleta, completar patrones conceptuales, perceptivos, sin contar con toda la informacin lgicamente-necesaria para hacerlo, etc.
d) Procesamiento en paralelo: Los procesos en una red neuronal artificial son en paralelo: en las redes conexionistas se efectan numerosos cmputos simultneamente y en cada momento de procesamiento mltiples capas de microprocesadores estn activadas. No realizan una secuencia de cmputos colocados en una fila temporal a lo largo de un camino en que slo cabe un proceso despus de otro. Este paralelismo sin duda parece mas realista que la serialidad en relacin con el funcionamiento nervioso. Este rasgo explica por qu las redes pueden dar cuenta de demandas mltiples y simultneas, lo que las hace ms rpidas y ms ajustadas al procesamiento tal y cmo se da en el cerebro. e) Simplicidad: Los trminos de la explicacin conexionista son bastante simples y lo supuestos son prcticamente elementales: unidades, conexiones, reglas de aprendizaje, etc. Este conjunto de mecanismos sencillos puede explicar el accionar cognitivo y dar cuenta de acciones cognitivas de nivel superior. f) Subsimblico: el conexionismo rechaza la doctrina de las representaciones mentales y de los smbolos y asume que la actividad cognitiva puede basarse en un sistema subsimblico, donde las representaciones estn distribuidas en la red. Los cmputos no consisten en transformaciones de representaciones simblicas, sino en cambios que tienen lugar en los estados de activacin y los patrones de conectividad de la red en su totalidad. No se puede decir, en rigor, que correspondan a reglas de una sintaxis. Mas bien corresponden a reglas de activacin, propagacin y aprendizaje que son inherentes al funcionamiento del sistema.
g) Leyes estadsticas: El paradigma simblico tiene constricciones rgidas, inferencia lgica proceso en serie. En el paradigma subsimblico en cambio, las decisiones se basan en parmetros estadsticos, lo que concuerda con las investigaciones de categorizacin ms influyentes, como el trabajo de Rosch con prototipos. Las categoras del pensamiento humano, entonces responden ms bien a leyes probabilsticas que lgicas. h) Sistemas motores y perceptuales: El modelo clsico se centra en procesos cognitivos centrales (como la planificacin, la memoria, la atencin, la categorizacin, etc.) y habitualmente no incluyen modelos detallados de las operaciones perceptuales y del sistema motor. En cambio, el conexionismo, por su manera de manejar los input y output paralelamente, considera de manera natural estas reas. i) Incorporacin del ambiente y del aprendizaje: Una de las ventajas del conexionismo es que explica claramente el papel que juegan el ambiente y el aprendizaje en la conducta inteligente. La capacidad de las redes de modificarse adaptativamente en funcin de las experiencias previas, la plasticidad y flexibilidad de sus conexiones explican cmo un dispositivo puede
aprender de los inestables estmulos ambientales. De esta manera evitan una de las caractersticas ms criticadas de la arquitectura simblica: una tendencia al innatismo. j) Rapidez: los sistemas conexionistas asignan significados rpidos, sin necesidad de reducir a algoritmos exhaustivos su proceder. Esta caracterstica se relaciona estrechamente con el hecho que el procesamiento es en paralelo Flexibles: Las redes logran ser, a la vez, estructuradas y flexibles. Son estructuradas en cuanto el diseo de la red permite que se responda de la misma manera a estmulos similares, presentan discriminacin y generalizacin y son capaces de tener adquirir conocimiento. Son flexibles en la medida que su estructura puede variar si la red es expuesta a clases de estmulos muy diferentes de los que sta conoca. Adems, los constreimientos que la red tiene en su procesamiento son mnimos, existiendo muchas maneras de procesar la misma informacin. As, desde una red, se puede acceder a los conocimientos por vas diversas, lo que explica la capacidad de los agentes inteligentes de ser flexibles ante las demandas de un ambiente cambiante. Control ejecutivo: Por otra parte, en los modelos conexionistas de la mente no hay un procesador central con misiones de control. El control es tambin distribuido e implcito, y no localizable ni explicito. Se deriva de las propiedades de los propios sistemas. Las memorias no se definen por localizaciones y nos hay sistemas de acceso a ellas, sino por patrones de conectividad diversos que pueden producirse en un mismo subconjunto de la red.
k)
l)
Para finalizar podemos sealar algunas deficiencias de los modelos de procesamiento distribuido en paralelo. a) An no se han desarrollado modelos lo suficientemente potentes como para desplazar a otro tipo de programas ms efectivos. b) Las redes neuronales no producen resultados exactos, sino que en general nicamente aproximados. c) Son fuertemente dependientes del estmulo, por lo que actan bien en simulaciones de procesos perceptivos, pero menos bien con relacin a otras reas de la cognicin. d) Mientras que las representaciones de los modelos clsicos son semnticamente trasparentes, las de los conexionistas no lo son. Referencias Bechtel et al. (1998) A companion to the cognitive science Oxford: Blackwell McCulloch y Pitts (1965) Un clculo lgico de las ideas inmanentes en la actividad nerviosa. En Boden (1990) Filosofa de la inteligencia artificial Mxico DF: Fondo de cultura econmica Stillings, N. et al. (2002) Cognitive Science: an introduction.

Tabla Resumen Conexionismo

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Tabla Resumen Conexionismo

Enviado por

Direitos autorais:

Formatos disponíveis

Universidad de Valparaso Escuela de Psicologa Fundamentos Filosficos y epistemolgicos de los sistemas tericos en Psicologa II Acadmico: Eduardo Jeria Garay

Por Eduardo Jeria Garay Santiago, primer semestre 2005

Por Eduardo Jeria Garay Santiago, primer semestre 2005

Figura 5. Esquema de una red conexionista

Por Eduardo Jeria Garay Santiago, primer semestre 2005

Por Eduardo Jeria Garay Santiago, primer semestre 2005

Você também pode gostar