Você está na página 1de 34

INTELIGENCIA ARTIFICAL

Concepto.- Definimos a la IA como el estudio de los agentes que reciben


percepciones del entorno y llevan a cabo las acciones.
Cada agente implementa una funcin la cual estructura las secuencia de las
percepciones en acciones; tambin tratamos las diferentes formas de
representar estas funciones, Tales como sistemas de produciran. Agentes
reactivos, planificadores condicionales en tiempo real, redes neurales y
sistemas tericos para las decisiones.
Redes Neuronales.- Los primeros trabajos en computacin neuronal se
remontan a principios de los aos 40. Un neurofsico llamado Warren
McCulloch y un matemtico llamado Walter Pitts propusieron, en base a sus
estudios del sistema nervioso, un modelo de neurona formal implementada
mediante circuitos elctricos (McMulloch, 1943).
Puede definirse como un sistema de procesamiento de informacin compuesto
por un gran nmero de elementos de procesamiento (neuronas), profusamente
conectados entre s a travs de canales de comunicacin. Estas conexiones
establecen una estructura jerrquica y permiten la interaccin con los objetos
del mundo real tratando de emular al sistema nervioso biolgico.
A diferencia de la computacin tradicional, basada en algoritmos predecibles, la
computacin neuronal permite desarrollar sistemas que resuelvan problemas
complejos cuya formalizacin matemtica es sumamente difcil. Esto se logra
gracias a los principios de funcionamiento de las RNA, de los cuales citamos a
continuacin los cinco ms importantes

Aprendizaje adaptativo: Una RNA es adaptativa porque puede


modificarse constantemente con el fin de adaptarse a nuevas
condiciones de trabajo.
Auto organizacin: consiste en la modificacin de toda la red completa
con el fin de llevar a cabo un objetivo especfico. significa generalizacin,
de esta forma una red puede responder a datos o situaciones que no ha
experimentado antes, pero que puede inferir en base a su
entrenamiento. Esta caracterstica es muy til sobre todo cuando la
informacin de entrada es poco clara o se encuentra incompleta.
Tolerancia a fallos: se entiende aqu en dos sentidos: primero, las redes
pueden reconocer patrones de informacin con ruido, distorsin o
incompletos (tolerancia de fallos respecto de los datos); y segundo,
pueden seguir trabajando (con cierta degradacin) aunque se destruya
parte de la red (tolerancia a fallos respecto de la estructura).
Operacin en tiempo real: son las ms indicadas para el reconocimiento
de patrones en tiempo real, debido a que trabajan en paralelo
actualizando todas sus instancias simultneamente.
Fcil insercin en la tecnologa existente: es relativamente sencillo
obtener chips especializados para redes neuronales que mejora

Se pueden configurar para representar funciones o reconocer patrones. La


ventaja de la segunda configuracin es que el tiempo de entrenamiento se
reducen considerablemente en relacin con otros algoritmos y adems se
garantiza una buena velocidad de convergencia, por lo que sta se eligi para
este trabajo.
Comnmente se utilizan las redes neuronales en situaciones para las cuales no
existe alguna clase de modelo o aproximacin matemtica, o cierto proceso
iterativo, Ms bien, stas se usan cuando el problema se resuelve por
observacin continua y se entrena dicha red para identificar lo que se busca, y
debido a la inexistencia de cierta relacin entre parmetros o funciones que
modelen el problema, que sera inapropiado el uso de lgica difusa o
algoritmos genticos.

ARQUITECTURA DE UNA RED NEURONAL


Estas se agrupan en capas, cada una de ellas con un conjunto de neuronas de
nmero variable y comportamiento similar, constituyendo varias capas una red
neuronal.
1.- Capa de Entrada.- El nmero y tipo de neuronas que constituye esta capa,
depende de los datos del problema.
2.- Capas Intermedias.- pueden ser ms de una, dependiendo del tipo y
complejidad del problema a resolver con la red. Mediante el tratamiento
adecuado de estas capas se consigue las propiedades de generalizacin.
3.- Capa de Salida.- El nmero de neuronas de esta capa, depende del
formato esperado de salida de la red.
APLICACIONES REDES NEURONALES
Las redes neuronales estn siendo utilizadas para tratar tareas que parecan
inabordables por los mtodos tradicionales. Se tratan de problemas que
parecan fciles de resolver por un operador empleando capacidades innatas y
de bajo nivel del cerebro humano. Dentro de este tipo de tareas podemos
encontrar.

Sistemas de decisin.- Cuando el conocimiento se puede explicitar en


reglas, la solucin ms adecuada parece ser un sistema experto, sin
embargo cuando el conocimiento aparece difuso y esta difundido en
ejemplos, esta solucin no es suficiente, apareciendo como alternativa
vlida las Redes Neuronales.
Procesamiento de seales.- En esta rea las redes neuronales han sido
utilizadas tanto en clasificacin como en filtrado de seales.

Lenguaje Natural.- dada las caractersticas mencionadas antes de


aprendizaje, tratamiento masivo de informacin y reconstruccin de
datos distorsionados, los sistemas de computacin neuronal aparecen.

TOPOLOGA DE REDES NEURONALES EMPLEADAS PARA LA


CLASIFICACIN, PREDICCIN Y RECONOCIMIENTO DE PATRONES
Red Instar
Este tipo de redes se emplea para el reconocimiento de patrones, a partir de
una entrada vectorial como muestra la fi gura 3.45 y asociaciones y aprendizaje
no supervisado.

Red Outstar
La red Outstar (fi gura 3.46) tiene una entrada escalar y una salida vectorial y
recuerda patrones por asociacin de un estmulo de entrada con un vector de
respuesta. La expresin de salida corresponde a: a = satlins ( p).

Redes Competitivas
En este tipo de redes las neuronas compiten para activarse quedando
finalmente una, o una por grupo, como neurona vencedora; el resto quedarn
anuladas y siendo forzadas a sus valores de respuesta mnimos. La
competencia se realiza en todas las capas de la red, existiendo conexiones de
autoexcitacin y conexiones de inhibicin. El objetivo de la competencia es
categorizar o agrupar los datos de entrada, de tal manera que las entradas de
la misma categora activen la misma neurona de salida.

Red de Kohonen
Existen evidencias que demuestran que en el cerebro hay neuronas
organizadas en zonas, de tal forma que la informacin captada del entorno se
representa internamente en forma de mapas bidimensionales. Estas teoras se
sustentan en que algunas reas del cerebro pueden crear y ordenar neuronas
especializadas y construir mapas especiales para atributos y caractersticas.
Redes ANFIS
Los sistemas ANFIS son sistemas basados en redes neurales adaptables con
inferencia difusa. En dichos sistemas se tiene como principio el uso de
diferentes mtodos para el ajuste de los parmetros de ajuste, entre ellos se
encuentra el mtodo de retro propagacin del error. El principio de
funcionamiento de este tipo de topologas fue propuesto por R. Jang en su
trabajo de tesis neuro-fuzzy modeling.

PERCEPTRON.- Una de las caractersticas ms significativas de las redes


neuronales es su capacidad para aprender a partir de alguna fuente de
informacin interactuando con su entorno. En 1958 el psiclogo Frank
Ronsenblant desarroll un modelo simple de neurona basado en el modelo de
McCulloch y Pitts y en una regla de aprendizaje basada en la correccin del
error. A este modelo le llam Perceptrn. Una de las caractersticas que ms
inters despert de este modelo fue su capacidad de aprender a reconocer
patrones.

El Perceptrn simple.- consta de una red con una capa de salida de n


neuronas y otra de salida con m neuronas. Utiliza seales binarias, tanto de
entrada como de salida. Como regla de propagacin se usa la suma ponderada
del producto escalar por el vector de entrada, debiendo superarse un cierto
umbral.
Supongamos que tenemos una funcin f de R n en {-1,1}, que aplica un patrn
de entrada x = (x1, x2,,xn)T Rn en la salida deseada z {-1,1}, es decir, f(x) =
z. La informacin de que disponemos sobre dicha funcin viene dada por p
pares de patrones de entrenamiento
{x1,z1}, {x2,z2},,{ xp,zp}
donde x Rn y f (xi) = zi{-1,1}, i=1,2,,p. Dicha funcin realiza una particin
en el espacio Rn de patrones de entrada; por una parte estaran los patrones
con salida +1 y por otra parte los patrones con salida 1. Por lo tanto, diremos

que la funcin f clasifica a los patrones de entrada en dos clases. Ejemplos de


funciones f de este tipo son la funcin lgica OR o la funcin par.

Condiciones de Convergencia del Perceptrn:

redes mono capa slo pueden aprender conceptos con separabilidad


lineal (funcin OR, AND)
pero no puede aprender el XOR por ejemplo,
se puede aadir una segunda capa (capa AND) y una tercera (capa OR)
para conseguirlo, pero NO SE SABE CMO ENTRENAR REDES
MULTICAPA
2) MINERIA DE DATOS

Minera de datos: Es el proceso de descubrir nuevas correlaciones, patrones y


tendencias a travs del anlisis de grandes cantidades de datos almacenados
en bases de datos, usando tecnologa de patrones de reconocimiento, as
como tcnicas estadsticas y matemticas.
Tcnicas de Minera de datos.- La aplicacin automatizada de algoritmos de
minera de datos permite detectar fcilmente patrones en los datos, razn por
la cual esta tcnica es mucho ms eficiente que el anlisis dirigido a la
verificacin cuando se intenta explorar datos procedentes de repositorios de
gran tamao y complejidad elevada. Dichas tcnicas emergentes se
encuentran en continua evolucin como resultado de la colaboracin entre
campos de investigacin tales como bases de datos, reconocimiento de
patrones, inteligencia artificial, sistemas expertos, estadstica, visualizacin,
recuperacin de informacin, y computacin de altas prestaciones
Matriz de Confusin.- Una matriz de confusin nos permite visualizar
mediante
una
tabla
de contingencia el tipo de las predicciones
correctas e incorrectas cuando se aplica el modelo sobre el conjunto de
prueba. Esta matriz de confusin para el caso de dos clases tiene la siguiente
apariencia, como se puede apreciar en la Tabla.

VP (Verdaderos positivos): instancias correctamente reconocidas por el


sistema.
FN (Falsos negativos): instancias que son positivas y que el sistema
dice que no lo son.
FP (Falsos positivos): instancias que son negativas pero el sistema dice que
no lo es.
VN (Verdaderos negativos): instancias que son negativas y correctamente
reconocidas como tales.
Suponiendo que N es el nmero del conjunto
de
datos
de
entrenamiento,
N=VP+FN+FP+VN.
El nmero de instancias clasificadas correctamente es la suma de la
diagonal de la matriz y el resto estn clasificadas de forma incorrecta.

3) METADATOS DE LA WEB SEMANTICA

Web Semntica.- Tim Berners-Lee, define a la web semntica: no es una web


separada sino una extensin de la actual, donde la informacin est dotada de
un significado bien definido, los ordenadores estn mejor capacitados y las
personas trabajan en colaboracin
Los fundamentos de la web semntica: es una evolucin de la actual web
donde los ordenadores sern capaces de interpretar los documentos ya que
estarn dotados de contenido semntico y el trabajo colaborativo ser una
realidad, permitiendo a los usuarios delegar tareas en software. Gracias a la
semntica en la Web, el software es capaz de procesar su contenido, razonar
con este, combinarlo y realizar deducciones lgicas para resolver problemas
cotidianos automticamente.
Berners-Lee propuso que la nueva informacin debe ser reunida de forma que
un buscador pueda "comprender", en lugar de ponerla simplemente en una
"lista. La Web semntica sera una red de documentos "ms inteligentes" que
permitan, a su vez, bsquedas ms inteligentes. La idea sera aumentar la
inteligencia de los contenidos de las pginas web dotndolas de contenido
semntico.
Principales componentes
Entre los principales componentes de la Web Semntica podemos encontrar
XML, XML Schema, RDF, RDF Schema y OWL. La descripcin de OWL en
ingls Ontology Web Language describe las funciones y relaciones de cada
componente de la Web Semntica:

XML: Provee una sintaxis elemental para las estructuras de contenidos


dentro de documentos.
XML Schema: Es un lenguaje para proporcionar y restringir la estructura
y el contenido de los elementos contenidos dentro de documentos XML.

RDF: Es un lenguaje simple para expresar modelos de los datos, que


refieren a los objetos recursos y a sus relaciones. Un modelo de RDFbased se puede representar en sintaxis de XML.
RDF Schema: Es un vocabulario para describir propiedades y clases de
recursos RDF-based, con semntica para generalizar-jerarquas de las
propiedades y clases.
OWL: Es un mecanismo para desarrollar temas o vocabularios
especficos en los que podamos asociar esos recursos

ARQUITECTURA WEB SEMANTICA

Los dos niveles iniciales hacen referencia a la base y los estndares en los que
se sustenta su desarrollo: Unicode, URI, XML y RDF. stos permiten convertir
la web en una infraestructura global donde ser posible compartir y reutilizar
datos y documentos entre diferentes tipos de usuarios.
La siguiente capa, referida a las ontologas, es en donde reside el contenido
semntico del sistema. La cuarta capa tiene que permitir, a partir de la
estructura semntica generada con las ontologas y los metadatos, realizar
inferencias lgicas. Estas dos etapas son las que presentan ms incgnitas
actualmente y las que pueden actuar como freno para la implantacin de la
web semntica ya que comportan una infraestructura que actualmente no es
posible realizar a gran escala. Es aqu donde las tecnologas del lenguaje
humano pueden intervenir ayudando a la creacin y mantenimiento de las
ontologas y tambin vinculando stas con los documentos, pero se trata de un
camino an en fase experimental.

El desarrollo de la Web semntica requiere la utilizacin de otros lenguajes


como el lenguaje estructurado XML (Extensible Markup Language) y el
lenguaje RDF (Resource Description Framework) que puedan dotar a cada
pgina, a cada archivo y a cada recursos o contenido de la red, de una lgica y
un significado, y que permitan a los ordenadores conocer el significado de la
informacin que manejan con el fin de que esta informacin pueda no slo ser
presentada en pantalla, sino tambin que pueda ser integrada y reutilizada.
Para poder explotar la Web semntica, se necesitan lenguajes semnticos ms
potentes, lenguajes de marcado capaces de representar el conocimiento
basndose en el uso de metadatos y ontologas.
Ontologas.- Se trata de especificaciones formales y explcitas que
representan los conceptos de un determinado dominio y sus relaciones. Es

decir, son un modelo abstracto de un dominio, donde los conceptos utilizados


estn claramente definidos y pueden ser utilizados directamente por los
agentes. De este modo los agentes pueden interpretar el significado de un
texto y a partir de aqu buscar e integrar datos.
Las ontologas se usan principalmente para favorecer la comunicacin entre
organizaciones, personas y aplicaciones, permitiendo la interoperabilidad entre
sistemas informticos con el objetivo final de llegar al razonamiento automtico.
Gracias al conocimiento almacenado en las ontologas, los agentes podrn
extraer automticamente datos de las pginas web, procesarlos y sacar
conclusiones de ellos; sin embargo, esta funcionalidad actualmente todava
est lejos de ser una realidad.

El anlisis lingstico aplicado a los textos puede ser de diferentes niveles


segn cada sistema, aunque casi todos se apoyan en el principio de que el
significado de una palabra est estrechamente relacionado con el contexto en
que aparece. El proceso consiste en identificar las dependencias sintcticas y
semnticas de los tems, basndose en el principio de restriccin seleccional
(Gamallo, 01), donde se considera que la estructura sintctica facilita
informacin relevante a cerca del contenido semntico. Otra de las tcnicas
ms utilizadas es la localizacin de patrones lxico-sintcticos, ya que stos
implican restricciones semnticas a los trminos.
El aprendizaje de ontologas:
El aprendizaje de ontologas se define como la adquisicin de los trminos que
representan un dominio a partir de datos. Tiene por objetivo principal crear una
jerarqua de conceptos, es decir, una taxonoma. Existen diferentes
modalidades de sistemas de aprendizaje de ontologas dependiendo de los

tipos de datos de entrada utilizados para el aprendizaje: textos, diccionarios,


bases de conocimiento, datos semiestructurados y bases de datos.
El aprendizaje de ontologas a partir de textos extrae el conocimiento de stos,
estudiando como los trminos son utilizados en su contexto. Uno de los
obstculos de este proceso es la creacin y diseo del conjunto de textos que
deben ser utilizados para que el sistema aprenda ya que deben cubrir todos los
mbitos del dominio. Para ello algunos sistemas recurren a un glosario de
trminos del dominio para realizar la seleccin de los textos.
El proceso consiste en extraer los conceptos, los distintos trminos usados
para referirse a un concepto, los diferentes sinnimos de los trminos, las
relaciones entre los conceptos, por ejemplo las jerrquicas y las de causaefecto, y por ltimo las reglas y axiomas, que son teoremas que se declaran
sobre relaciones que deben cumplir los elementos de la ontologa.
La poblacin de ontologas
La poblacin de ontologas consiste en enriquecer una ontologa con las
instancias de los conceptos y de las relaciones extradas de los textos de una
forma (semi)automtica. Muchas de las aproximaciones realizadas a partir de
este enfoque se basan en la extraccin de las entidades. Concretamente se
centran en la identificacin, extraccin y clasificacin de las entidades
nombradas (EN); es decir, de los nombres de personas y de organizaciones, y
tambin de los lugares, fechas y medidas (porcentajes, peso, monedas,
tiempo) pues se considera que en ellas reside gran parte del contenido
semntico de un texto.
El proceso consiste en reconocer las EN como instancias de alguno de los
conceptos de la ontologa y de este modo ir poblando una ontologa. El
reconocimiento de EN no es un proceso trivial ya que existen algunos conflictos
que requieren la aplicacin de tcnicas lingsticas para resolverlos como
veremos en los siguientes ejemplos.
La asignacin de metadatos
Uno de los elementos fundamentales de la web semntica son los metadatos;
es decir, informacin/datos que describen los contenidos de los documentos a
los que estn asociados representando de forma explcita el significado de
stos. El modelo de representacin de los metadatos en la web semntica es
RDF (Resource Description Framework). Se basa en describir los recursos
como expresiones con la forma sujeto-predicado-objeto. El sujeto es el recurso,
es decir, aquello que se est describiendo. El predicado es la propiedad o
relacin que se desea presentar del recurso. Por ltimo, el objeto es el valor de
la propiedad o el otro recurso con el que se establece una relacin. Esta
estructura presenta limitaciones, por eso se combina con RDF Schema y OWL
que permite representar relaciones semnticas ms complejas que las
descritas.

Conclusiones
Las tecnologas y la infraestructura desarrollada para la web semntica tendrn
repercusin directa en muchas reas y disciplinas que tienen como eje la
comunicacin y gestin de informacin en lenguaje natural. As pues, la
estructura diseada para la web semntica permitir mejorar los diferentes
mecanismos existentes para el acceso a la informacin puesto que la
informacin ya estar estructurada. Existen diferentes campos de investigacin
relacionados con el acceso a la informacin en lenguaje natural que podrn
evolucionar y ofrecer productos de calidad cuando la infraestructura de la web
semntica est extendida a gran escala.
El desarrollo de ontologas, que se ha visto activamente impulsado con la web
semntica, tendra tambin repercusin directa en el mbito del procesamiento
del lenguaje natural, ya que las ontologas como representaciones de un
dominio e independientes de la lengua pueden ser el punto de encuentro entre
dos o ms lenguas. Por tanto, las ontologas consideradas como un repositorio
de conceptos que establece conexiones entre los smbolos de una lengua y sus
referentes en el dominio que refleja, permiten llevar a cabo un tratamiento
adecuado del fenmeno de la sinonimia y tambin son un soporte bsico para
la desambiguacin, tanto lxica como estructural. Ello podra resultar til para
avanzar en otras disciplinas en las que el lenguaje natural es un elemento
clave, como por ejemplo la traduccin automtica, la recuperacin de
informacin, la interaccin persona-ordenador, la enseanza de segundas
lenguas.
4) AGENTES INTELIGENTES
Un agente es cualquier cosa capaz de percibir su medioambiente con la ayuda
de sensores y actuar en ese medio utilizando actuadores.

Se trabajar con la hiptesis general de que cada agente puede percibir sus
propias acciones (pero no siempre sus efectos).
El trmino percepcin se utiliza en este contexto para indicar que el agente
puede recibir entradas en cualquier instante. La secuencia de percepciones de
un agente refleja el historial completo de lo que el agente ha recibido. En
general, un agente tomar una decisin en un momento dado dependiendo de
la secuencia completa de percepciones hasta ese instante. En trminos
matemticos se puede decir que el comportamiento del agente viene dado por
la funcin del agente que proyecta una percepcin dada en una accin.

La definicin de agente inteligente es que es un programa de software con


conocimientos que le permiten realizar operaciones con la finalidad de aportar
informacin requerida por los usuarios o por otros programas, bien por iniciativa
de stos o bien por la del propio agente. Acta como un sistema con
inteligencia artificial, que procesa informacin asociando conceptos e
interactuando con otros agentes.
Propiedades:

Autonoma: actuar sin ningn tipo de intervencin humana directa, y


tener control sobre sus propios actos.
Sociabilidad: comunicarse por medio de un lenguaje comn con otros
agentes, e incluso con los humanos.
Capacidad de reaccin: percibir su entorno, y reaccionar para adaptarse
a l.
Iniciativa: emprender las acciones para resolver un problema.

La base de la Inteligencia Artificial es el diseo de un programa de agente: Una


funcin que permita implantar el mapeo del agente para pasar de percepciones
a acciones. Este programa se ejecutar en algn tipo de dispositivo de
cmputo al que se denominar arquitectura. La arquitectura puede ser una
computadora sencilla o un hardware especial.

Agente = programa agente + arquitectura, donde:


El programa agente ser una funcin que implementara la transformacin
(mapping) de secuencias de percepciones en acciones
La arquitectura ser un ordenador que se ocupara de que las percepciones
lleguen al programa y las acciones lleguen a los efectores.
Obviamente, el programa que se elija tiene que ser apropiado para la
arquitectura. Si el programa tiene que recomendar acciones como Caminar, la
arquitectura tiene que tener piernas. La arquitectura puede ser un PC comn, o
puede ser un coche robotizado con varios computadores, cmaras, y otros
sensores a bordo. En general, la arquitectura hace que las percepciones de los
sensores estn disponibles para el programa, ejecuta los programas, y se
encarga de que los actuadores pongan en marcha las acciones generadas.
Antes de disear un programa agente tenemos que conocer los distintos
elementos que caracterizan al agente

percepciones posibles
acciones posibles
medida de desempeo u objetivos que debe lograr tipo de entorno en el
que va a operar

Agente basado en una tabla Un agente basado en una tabla almacena la


transformacin de secuencias de percepciones en acciones.
Inconvenientes: la tabla podra ser enorme y difcil construir, y el agente no
tendra autonoma

Tipos Bsicos De Programas Para Agentes

Agentes reactivos simples.- Estos agentes seleccionan las acciones sobre la


base de las percepciones actuales, ignorando el resto de las percepciones
histricas. Los agentes reactivos simples tienen la admirable propiedad de ser
simples, pero poseen una inteligencia muy limitada.

El agente de la Figura 2.10 funcionar slo si se puede tomar la decisin


correcta sobre la base de la percepcin actual, lo cual es posible slo si el
entorno es totalmente observable. Incluso el que haya una pequea parte que
no se pueda observar puede causar serios problemas.

Agentes reactivos basados en modelos.- La forma ms efectiva que tienen


los agentes de manejar la visibilidad parcial es almacenar informacin de las
partes del mundo que no pueden ver. O lo que es lo mismo, el agente debe
mantener algn tipo de estado interno que dependa de la historia percibida y
que de ese modo refleje por lo menos alguno de los aspectos no observables
del estado actual.

La Figura 2.11 proporciona la estructura de un agente reactivo simple con


estado interno, muestra cmo la percepcin actual se combina con el estado
interno antiguo para generar la descripcin actualizada del estado actual. La
Figura 2.12 muestra el programa del agente. La parte interesante es la
correspondiente a la funcin Actualizar-Estado, que es la responsable de la
creacin de la nueva descripcin del estado interno. Adems de interpretar la
nueva percepcin a partir del conocimiento existente sobre el estado, utiliza
informacin relativa a la forma en la que evoluciona el mundo para conocer
ms sobre las partes del mundo que no estn visibles; para ello debe conocer
cul es el efecto de las acciones del agente sobre el estado del mundo.

Agentes que aprenden.- El aprendizaje permite que el agente opere en


medios inicialmente desconocidos y que sea ms competente que si slo
utilizase un conocimiento inicial.
El diseo del elemento de aprendizaje depende mucho del diseo del elemento
de actuacin. Cuando se intenta disear un agente que tenga capacidad de
aprender, la primera cuestin a solucionar no es cmo se puede ensear a

aprender?, sino qu tipo de elemento de actuacin necesita el agente para


llevar a cabo su objetivo, cuando haya aprendido cmo hacerlo? Dado un
diseo para un agente, se pueden construir los mecanismos de aprendizaje
necesarios para mejorar cada una de las partes del agente.
El ltimo componente del agente con capacidad de aprendizaje es el generador
de problemas. Es responsable de sugerir acciones que lo guiarn hacia
experiencias nuevas e informativas. El trabajo del generador de problemas es
sugerir estas acciones exploratorias. Esto es lo que los cientficos hacen
cuando llevan a cabo experimentos.

En resumen, los agentes tienen una gran variedad de componentes, y estos


componentes se pueden representar de muchas formas en los programas de
agentes, por lo que, parece haber una gran variedad de mtodos de
aprendizaje. Existe, sin embargo, una visin unificada sobre un tema
fundamental. El aprendizaje en el campo de los agentes inteligentes puede
definirse como el proceso de modificacin de cada componente del agente, lo
cual permite a cada componente comportarse ms en consonancia con la
informacin que se recibe, lo que por tanto permite mejorar el nivel medio de
actuacin del agente.

Tipos de agentes inteligentes segn su funcionamiento bsico


-Cooperativos: Se coordinan con otros agentes para conocer el entorno de
informacin en el que se mueven.
-Mviles: Realizan las bsquedas basndose en la programacin remota, de
manera que se desplazan a travs de los servidores, y ejecutan programas en
stos por orden de los usuarios.
Los agentes mviles son supervisados, para evitar la ejecucin de programas
que puedan ser malware, mediante pasillos de seguridad que controlan el flujo
de agentes mviles y la ejecucin de tareas.
Tipos de agentes inteligentes segn sus prestaciones
-Agentes de bsqueda: Son agentes especializados en la bsqueda de datos,
que realizan bsquedas conceptuales en base a los trminos solicitados por los
usuarios y las expanden aadiendo sinnimos o trminos relacionados.
-Agentes de consulta: Realizan las consultas originando ms agentes como
respuesta las peticiones del usuario. stos recogen informacin de las bases
de datos, y si no consiguen la informacin solicitada, generarn nuevos
agentes que ampliarn la bsqueda hasta obtener lo que busca el usuario.
-Agentes de bases de datos: son agentes especializados en hacer consultas en
una base de datos concreta, que conocen la informacin almacenada en ella.
Es el caso de Clientelle.net, que concretamente es un gestor de billetes de
avin, que busca en las bases de datos de las compaas areas los viajes que
por su precio o por sus caractersticas puedan interesar ms al consumidor.
-Agentes de consulta de bases de datos: Son el resultado de la interaccin de
los dos anteriores.
-Agentes mediadores de consulta de bases de datos: Equivalen al anterior,
aunque adems cuentan con un sistema mediador entre el agente de consulta
y el de base de datos.

-Agentes de usuario: Son agentes asociados a un individuo, a quien aportan


informacin sobre las bsquedas de los usuarios.
-Interfaces web: Son gestores de consulta capaces de
conocimientos y procesar informacin incompleta o de alto nivel.

almacenar

-Compradores web o ShopBots: Son agentes que buscan informacin sobre


productos en venta y comparan caractersticas y precios entre ellos para
ofrecer al usuario los productos ms adecuados a sus necesidades. Los ms
conocidos son Shopbot y Botspot.com.

5) ALGORITMOS GENETICOS

Un algoritmo gentico (o AG) es una variante de la bsqueda de haz


estocstica en la que los estados sucesores se generan combinando dos
estados padres, ms que modificar un solo estado. La analoga a la seleccin
natural es la misma que con la bsqueda de haz estocstica, tamban es una
bsqueda de ascensin de colinas estocstica en la que se mantiene una
poblacin grande de estados. Los estados nuevos se generan por mutacin y
por cruce, combinando pares de estados de la poblacin.
Son Algoritmos de bsqueda basados en los mecanismos de seleccin natural
y gentica natural. Combinan la supervivencia de los ms compatibles entre
las estructuras de cadenas, con una estructura de informacin ya aleatorizada,
intercambiada para construir un algoritmo de bsqueda con algunas de las
capacidades de innovacin de la bsqueda humana.
Bsicamente, el Algoritmo Gentico funciona como sigue: en cada generacin,
se crea un conjunto nuevo de criaturas artificiales (cadenas) utilizando bits y
partes ms adecuadas del progenitor. Esto involucra un proceso aleatorio que
no es, en absoluto, simple. La novedad que introducen los Algoritmos
Genticos es que explotan eficientemente la informacin histrica para
especular sobre nuevos puntos de bsqueda, esperando un funcionamiento
mejorado.

Elementos de un AG.-

Cromosoma= se refiere a un candidato a solucin del problema, que a


menudo se codifica como una cadena de bits.
Genes= son tanto un bit como bloques cortos de bits adyacentes que codifican
un elemento particular del candidato a solucin (por ejemplo, en el caso de la
optimizacin de una funcin multiparamtrica, los bits que codifican un
parmetro particular, se considera un gene).
Alelo= en una cadena de bits ser un 0 o un 1 (para alfabetos largos cada
Lugar puede tener ms alelos).

Cruce= consiste, normalmente, como en su espejo biolgico, en un


intercambio de material gentico entre dos cromosomas de dos padres
haploides.
Mutacin= es una permutacin en un bit en un lugar aleatorio (o, en el caso de
alfabetos largos, remplazar el smbolo de un lugar escogido aleatoriamente
con un smbolo nuevo escogido tambin aleatoriamente).
TIPOS DE OPERADORES:
Los algoritmos genticos parten de la premisa de emplear la evolucin natural
como un procedimiento de optimizacin que se caracteriza por tener
operaciones bsicas que son:
Seleccin o reproduccin: Este operador escoge cromosomas entre la
poblacin para efectuar la reproduccin. Cuanto ms capaz sea el cromosoma,
ms veces ser seleccionado para reproducirse.
Cruce: Se trata de un operador cuya labor es elegir un lugar, y cambiar las
secuencias antes y despus de esa posicin entre dos cromosomas, para crear
nueva descendencia (por ejemplo, las cadenas 10010011 y 11111010 pueden
cruzarse despus del tercer lugar para producir la descendencia 10011010 y
11110011). Imita la recombinacin biolgica entre dos organismos haploides.
Mutacin: Este operador produce variaciones de modo aleatorio en un
cromosoma (por ejemplo, la cadena 00011100 puede mutar su segunda
posicin para dar lugar a la cadena 01011100). La mutacin puede darse en
cada posicin de un bit en una cadena, con una probabilidad, normalmente
muy pequea (por ejemplo 0.001).

Como se ve, los Algoritmos Genticos difieren de los mtodos tradicionales de


bsqueda y optimizacin, en cuatro cuestiones esenciales:
1. Trabajan con un cdigo del conjunto de parmetros, no con el conjunto
mismo (necesitan que el conjunto de parmetros del problema de optimizacin
est codificado en cadenas finitas sobre un determinado alfabeto). Por trabajar
a nivel de cdigo, y no con las funciones y sus variables de control, como los
otros mtodos, son ms difciles de engaar.
2. Buscan una poblacin de puntos, no un nico punto. Manteniendo una
poblacin de puntos mustrales bien adaptados, se reduce la probabilidad de
caer en una cima falsa.
3. Emplean la funcin objetivo, no necesitan derivadas ni otra informacin
complementaria, tan difcil a veces de conseguir. De este modo ganan en
eficiencia y en generalidad.
4.
Se valen de reglas de transicin estocstica, no determinista. Los
Algoritmos Genticos se valen de operadores aleatorios para guiar la bsqueda
de los mejores puntos; puede parecer extrao, pero la Naturaleza est llena de
precedentes al respecto.

Algoritmo Principal:
Los Algoritmos Genticos trabajan sobre una poblacin de individuos.
Cada uno de ellos representa una posible solucin al problema que se desea
resolver.
Todo individuo tiene asociado un ajuste de acuerdo a la bondad con respecto al
problema de la solucin que representa (en la naturaleza el equivalente sera
una medida de la eficiencia del individuo en la lucha por los recursos).
Una generacin se obtiene a partir de la anterior por medio de los operadores
de reproduccin. Existen 2 tipos:
Cruce. Se trata de una reproduccin de tipo sexual. Se genera una
descendencia a partir del mismo nmero de individuos (generalmente 2)
de la generacin anterior. Existen varios tipos que se detallarn en un
punto posterior.
Copia. Se trata de una reproduccin de tipo asexual. Un determinado
nmero de individuos pasa sin sufrir ninguna variacin directamente a la
siguiente generacin.
Cruce de 2 puntos
Se trata de una generalizacin del cruce de 1 punto. En vez de cortar por un
nico punto los cromosomas de los padres, como en el caso anterior, se
realizan dos cortes. Deber tenerse en cuenta que ninguno de estos puntos de
corte coincida con el extremo de los cromosomas para garantizar que se
originen tres segmentos. Para generar la descendencia se escoge el segmento
central de uno de los padres y los segmentos laterales del otro padre.

Figura 1.7: Cruce de dos puntos

Ventajas y Desventajas
No necesitan conocimientos especficos sobre el problema que intentan
resolver.

Operan de forma simultnea con varias soluciones, en vez de trabajar


de forma secuencial como las tcnicas tradicionales.

Cuando se usan para problemas de optimizacin maximizar una funcin


objetivo- resultan menos afectados por los mximos locales (falsas
soluciones) que las tcnicas tradicionales.

Resulta sumamente fcil ejecutarlos en las modernas arquitecturas


masivamente paralelas.

Usan operadores probabilsticos, en vez de los tpicos operadores


determinsticos de las otras tcnicas.

Pueden tardar mucho en converger, o no converger en absoluto,


dependiendo en cierta medida de los parmetros que se utilicen tamao
de la poblacin, nmero de generaciones, etc.-.

Pueden converger prematuramente debido a una serie de problemas de


diversa ndole.

EJEMPLO:
Generar una poblacin intermedia. Para ello asignar a cada individuo una
probabilidad de ser seleccionado directamente proporcional a su funcin de
calidad.

De la poblacin intermedia se seleccionan parejas de forma aleatoria.


*Cruce: elegir un punto intermedio e intercambiar los genes de los padres a
partir de ese punto.

*Mutacin: cambio de un bit elegido aleatoriamente (probabilidad pequea)

6) REDES BAYECIANAS

Las redes bayesianas son una representacin grfica de dependencias para


razonamiento probabilstico, en la cual los nodos representan variables
aleatorias y los arcos representan relaciones de dependencia directa entre las
variables.
Una red bayesiana es un grafo dirigido en el que cada nodo est comentado
con informacin probabilista cuantitativa. La especificacin completa es como
sigue:
1. Un conjunto de variables aleatorias forman los nodos de la red. Las variables
pueden ser discretas o continuas.
2. Un conjunto de enlaces dirigidos o flechas conectan pares de nodos. Si hay
una flecha de un nodo X a un nodo Y, se dice que X es un padre de Y.
3. Cada nodo Xi tiene una distribucin de probabilidad condicionada P (X i|
Padres (Xi)) que cuantifica el efecto de los padres del nodo.
4. El grafo no tiene ciclos dirigidos (y as es un grafo acclico dirigido, o GAD).
La independencia condicional se verifica mediante el criterio de separacin -D.
Antes de definir formalmente la separacin-D, es necesario distinguir tres tipos
de nodos de acuerdo a las direcciones de los arcos que inciden en el nodo:

Nodos en secuencia: X Y Z.
Nodos divergentes: X Y Z.
Nodos convergentes: X Y Z.

Separacin D
El conjunto de variables A es independiente del conjunto B dado el conjunto C,
si no existe trayectoria entre A y B en que:
1. Todos los nodos convergentes estn o tienen descendientes en C.
2. Todos los dems nodos estn fuera de C.
La cobija de Markov (manto de Markov, Markov Blanquet) de un nodo es el
conjunto de nodos que lo hacen independiente del resto de la red. Para una
RB, la cobija de Markov est formada por:

Nodos padre.
Nodos hijo.
Otros padres de los hijos.

El diseo de una red bayesiana comienza con la definicin de su grafo. A


continuacin es necesario establecer las probabilidades condicionales de cada
nodo dados los valores de sus padres. Para cada nodo sin padres, nicamente
hay que definir sus probabilidades a priori. La inferencia consiste en fijar los
valores de las variables observadas y calcular la probabilidad a posteriori de las
variables no observadas.
En el caso general, es necesario asignar a cada nodo un conjunto de
probabilidades condicionales que crece exponencialmente con el nmero de
padres del nodo. Este hecho dificulta el proceso de adquisicin de los
parmetros de la red, su almacenamiento y la propagacin de la evidencia. Los
inconvenientes citados motivaron la aparicin de nuevos modelos de
interaccin causal denominados modelos cannicos, que permiten simplificar
tanto la construccin de la red como el cmputo de las probabilidades a
posteriori.
REPRESENTACION.Las redes bayesianas son una representacin grfica de dependencias para
razonamiento probabilstico, en la cual los nodos y arcos representan:
Nodos: Variables proposicionales.
Arcos: Dependencia probabilstica
La variable a la que apunta el arco es dependiente (causa-efecto) de la que
est en el origen de ste.

Estructura
La topologa o estructura de la red nos da informacin sobre las
dependencias probabilsticas entre las variables.
La red tambin representa las independencias condicionales de una variable
(o conjunto de variables) dadas otra variable(s).
Representacin Grfica

Una red bayesiana representa en forma grfica las dependencias e


independencias entre variables aleatorias, en particular las independencias
condicionales
Independencia en la distribucin
P(X | Y, Z) = P(X | Z)
Independencia en el grafo
X separada de Y por Z
Notacin:
Independencia en la distribucin
I(X, Z, Y)
Independencia en el grafo
<X|Z|Y>

Especificacin Estructural

INFERENCIA
El razonamiento probabilstico o propagacin de probabilidades consiste en
propagar los efectos de la evidencia a travs de la red para conocer la
probabilidad a posteriori de las variables. Es decir, se le dan valores a ciertas
variables (evidencia), y se obtiene la probabilidad posterior de las dems
variables dadas las variables conocidas (el conjunto de variables conocidas
puede ser vaco, en este caso se obtienen las probabilidades a priori). Existen
diferentes tipos de algoritmos para calcular las probabilidades posteriores, que

dependen del tipo de grafo y de si obtienen la probabilidad de una variable a la


vez o de todas.
Los principales tipos de algoritmos de inferencia son:
1. Una variable, cualquier estructura: algoritmo de eliminacin (variable
elimination).
2. Cualquier variable, estructuras sencillamente conectadas: algoritmo de
propagacin de Pearl.
3. Cualquier variable, cualquier estructura: (i) agrupamiento (junction tree),
(ii) simulacin estocstica, y (iii) condicionamiento.

APRENDIZAJE DE REDES BAYESIANAS


El aprendizaje, en general, de redes bayesianas consiste en inducir un modelo,
estructura y parmetros asociados, a partir de datos. Este puede dividirse
naturalmente en dos partes:
1. Aprendizaje estructural. Obtener la estructura o topologa de la red.
2. Aprendizaje paramtrico. Dada la estructura, obtener las probabilidades
asociadas.
Aprendizaje de arboles
El aprendizaje de rboles se basa en el algoritmo desarrollado por Chow y Liu
para aproximar una distribucin de probabilidad por un producto de
probabilidades de segundo orden (rbol). La probabilidad conjunta de n
variable se puede representar como:

donde Xj(i) es el padre de Xi


Para obtener el rbol se plantea el problema como uno de optimizacin:
obtener la estructura de rbol que ms se aproxime a la distribucin real. Esto
se basa en una medida de la diferencia de informacin entre la distribucin real
(P) y la aproximada (P):

El objetivo es minimizar DI. Se puede definir dicha diferencia en funcin de La


informacin mutua entre pares de variables, que se define como:

Podemos entonces encontrar el rbol ptimo mediante el siguiente algoritmo,


que es equivalente al conocido problema del mximum weight spanning tree:
1. Calcular la informacin mutua entre todos los pares de variables (que
para n variables, son n(n 1)/2).
2. Ordenar las informaciones mutuas de mayor a menor.
3. Seleccionar la rama de mayor valor como rbol inicial.
4. Agregar la siguiente rama mientras no forme un ciclo, si es as desechar.
5. Repetir 4 hasta que se cubran todas las variables (n-1 ramas).
El algoritmo NO provee la direccin de los arcos, por lo que esta se puede
asignar en forma arbitraria o utilizando semntica externa (experto)

APRENDIZAJE DE POLIRBOLES

Parte del esqueleto (estructura sin direcciones) obtenido con el algoritmo


anterior
Determina la direccin de los arcos utilizando pruebas de dependencia entre
tripletas de variables.
Dadas 3 variables, existen 3 casos posibles:

Arcos divergentes
Arcos secuenciales
Arcos convergentes

Los primeros dos casos son indistinguibles, pero el tercero es diferente, ya


que las dos variables "padre" son marginalmente independientes.
Tripleta de variables:
XZY
Si X Y son independientes dado Z, entonces pueden ser secuenciales o
divergentes

Si X Y no son independientes dado Z, entonces son arcos convergentes

APRENDIZAJE DE POLIRBOLES - ALGORITMO


1. Obtener esqueleto utilizando el algoritmo de Obtener esqueleto utilizando el
algoritmo de Chow y Liu
2. Recorrer la red hasta encontrar una tripleta de nodos que Recorrer la red
hasta encontrar una tripleta de nodos que sean convergentes (tercer caso) nodo sean convergentes (tercer caso) - nodo multipadre- multipadre3. A partir de un nodo A partir de un nodo multipadre multipadre determinar las
direcciones determinar las direcciones de los arcos utilizando la prueba de
tripletas hasta donde de los arcos utilizando la prueba de tripletas hasta donde
sea posible (base causal). sea posible (base causal).
4. Repetir 2-3 hasta que ya no se puedan descubrir ms Repetir 2-3 hasta que
ya no se puedan descubrir ms direcciones. direcciones.
5. Si quedan arcos sin direcci Si quedan arcos sin direccin, utilizar semntica
externa , utilizar semntica externa para obtener su direccin (o fijar
direcciones)

APRENDIZAJE DE REDES MULTICONECTADAS


Existen dos tipos de mtodos para el aprendizaje genrico de redes
bayesianas:
1. Mtodos basados en medidas de ajuste y bsqueda
2. Mtodos basados en pruebas de independencia
Mtodos basados en medidas
Se generan diferentes estructuras y se evalan respecto a los datos utilizando
alguna medida
Dos aspectos principales:

Medida de ajuste de la estructura a los datos


Bsqueda de la mejor estructura

Bsqueda de ascenso de colinas (hillclimbing)


Se inicia con una estructura simple (rbol) y se van agregando arcos
hasta llegar a un mnimo local

Se puede iniciar con una estructura compleja (mximo nmero de arcos)


y se van eliminando arcos hasta llegar a un mnimo local

EJEMPLO:

Mtodos basados en medidas


Se genera la estructura en base a ir agregando/eliminando arcos de acuerdo
a medidas de dependencia entre variables
Algoritmo PC
Se basa en pruebas de independencia entre variables:
I (Xi, Xj | A)
Donde A es un subconjunto de variables
Asume que:
Se tienen suficientes datos
Las pruebas estadsticas no tienen errores
Prueba de Independencia

Para probar si X, Y son independientes dado A se utiliza la entropa cruzada


condicional:

Si es cero o cercana a cero, quiere decir que son independientes (se puede
usar un umbral o una prueba estadstica con cierto nivel de significancia).

Algoritmo
1. Encontrar un esqueleto (grafo no dirigido)
2. Encontrar arcos convergentes en tripletas de variables por pruebas de
independencia
3. Orientar el resto de las ligas de forma que no se produzcan ciclos

Esqueleto
La idea bsica para determinar el esqueleto es iniciar con un grafo completo
(conectando todos vs. todos los nodos) y eliminar el arco entre X Y si hay un
subconjunto de nodos en G (excepto X, Y) que los hace independientes
En principio se consideran todos los posibles subconjuntos de variables, de
tamao 1 hasta de tamao N-1 (N es el nmero de nodos adyacentes a X)
El considerar todos los posibles subconjuntos es muy ineficiente, y
normalmente se limita a considerar slo subconjuntos de 1, 2,, k nodos.

Arcos convergentes

Se verifica cada tripleta de variables para encontrar arcos convergentes


mediante pruebas de independencia:
XZY
Si X Y no son independientes dado Z, entonces son arcos convergentes

Otras orientaciones
En base a los arcos existentes, se orientan los dems con pruebas de
independencia, evitando crear ciclos

Si quedan al final arcos sin orientar, se direccionan en forma aleatoria,


evitando ciclos

EJEMPLOS REDES BAYESIANAS:

La topologa de la red anterior nos expresa que:

Caries es una causa directa de Dolor Huecos


Dolor y Huecos son condicionalmente independientes dada Caries
Tiempo es independiente de las restantes variables

Ejemplo 2:
Tenemos una alarma antirrobo instalada en una casa
La alarma salta normalmente con la presencia de ladrones
Pero tambin cuando ocurren pequeos temblores de tierra

Tenemos dos vecinos en la casa, Juan y Mara, que han prometido llamara la
polica si oyen la alarma
Juan y Mara podran no llamar aunque la alarma sonara: por tener
msica muy alta en su casa, por ejemplo
Incluso podran llamar aunque no hubiera sonado: por confundirla con
un telfono.

La topologa de la red nos expresa que:


Robo y Terremoto son causas directas para Alarma
Tambin, Robo y Terremoto son causas para Juan llama y para Marial llama,
pero esa influencia solo se produce a travs de Alarma: ni Juan ni Mara
detectan directamente el robo ni los pequeos temblores de tierra
En la red no se hace referencia directa, por ejemplo, a las causas por las
cuales Mara podra no or la alarma: estas estn implcitas en la tabla de
probabilidades P (Mariallama|Alarma)

Você também pode gostar