Você está na página 1de 26

Aunque la Representación del Conocimiento es uno de los conceptos centrales y,

de alguna manera, más conocidos en Inteligencia Artificial, la pregunta más


fundamental "¿qué es?" rara vez se ha contestado directamente. En esta entrada
volvemos a o básico para abordar la cuestión directamente. Creemos que la respuesta
se puede entender mejor en función de los cinco roles importantes, y claramente
diferentes, que desempeña una representación, cada uno de los cuales plantea
necesidades diferentes, y a veces contradictorias, a las propiedades que debe tener
una representación. Sostenemos que el hecho de tener en cuenta estas cinco
funciones proporciona una perspectiva útil y amplia que arroja luz sobre algunas
controversias de larga duración y puede estimular tanto la investigación como la
práctica en el campo.

Introducción
¿Qué es una representación del conocimiento? Esta noción se puede entender
mejor en términos de los cinco posibles roles que desempeña, todos ellos cruciales
para el objetivo de comprender qué es una representación del conocimiento (RC, a
partir de ahora):

 Una representación del conocimiento es fundamentalmente un sustituto, un


reemplazo de la cosa misma, utilizado para permitir a una entidad determinar
consecuencias pensando en lugar de actuar, es decir, razonando sobre el mundo
en lugar de actuando en él.
 Es un conjunto de compromisos ontológicos, es decir, una respuesta a la
pregunta: ¿en qué términos debo pensar sobre el mundo?
 Es una teoría parcial del razonamiento inteligente, expresada en términos de tres
componentes:
1. la concepción fundamental de la representación del razonamiento inteligente;
2. el conjunto de inferencias que la representación establece; y
3. el conjunto de inferencias que recomienda.
 Es un medio para la computación pragmáticamente eficiente, es decir, el entorno
computacional en el que se realiza el pensamiento. Una contribución a esta
eficiencia pragmática es la que aporta la orientación que proporciona una
representación para organizar la información a fin de facilitar la realización de las
inferencias recomendadas.
 Es un medio de expresión humana, es decir, una lengua en la que decimos cosas
sobre el mundo.

Comprender los roles y reconocer su diversidad tiene varias consecuencias útiles.

1. En primer lugar, cada rol requiere algo ligeramente diferente de una


representación; cada uno de ellos conduce a un conjunto interesante y diferente
de propiedades que queremos que tenga una representación.
2. En segundo lugar, creemos que los roles proporcionan un marco útil para
caracterizar una amplia variedad de representaciones. Sugerimos que la
"mentalidad" fundamental de una representación puede ser capturada al
entender cómo ve cada uno de los roles, y que al hacerlo revela similitudes y
diferencias esenciales.
3. En tercer lugar, creemos que algunos desacuerdos previos sobre la representación
se disuelven provechosamente cuando los cinco roles reciben la consideración
apropiada. Demostramos esto revisando y diseccionando los primeros
argumentos sobre marcos y lógica.
4. Por último, creemos que ver las representaciones de esta manera tiene
consecuencias tanto para la investigación como para la práctica. Para la
investigación, este punto de vista proporciona una respuesta directa a una
pregunta de importancia fundamental en el campo. También sugiere adoptar una
perspectiva amplia sobre lo que es importante en una representación, y
argumenta que una parte significativa de la representación - capturar y
representar la riqueza del mundo natural - está recibiendo atención insuficiente.
Creemos que esta visión también puede mejorar la práctica recordando a los
especialistas las inspiraciones que son fuentes significativas para una variedad de
representaciones.

Terminología y perspectiva
Dos elementos de la terminología ayudarán en nuestra presentación.
1. Primero, usamos el término inferencia en un sentido genérico, para referirnos
a cualquier forma de obtener nuevas expresiones de lo antiguo. Sólo en raras
ocasiones estamos hablando de inferencias lógicas sólidas y al hacerlo nos
referimos explícitamente a eso.
2. En segundo lugar, para darles un nombre colectivo único, nos referimos al
conocido conjunto de herramientas básicas de representación como la lógica,
reglas, marcos, redes semánticas, etc., como tecnologías de representación
del conocimiento.
También resultará útil considerar explícitamente la práctica común de construir
representaciones del conocimiento en múltiples niveles de lenguajes, normalmente
con una de las tecnologías de representación del conocimiento en el nivel inferior.
La ontología de líquidos de Hayes[12], por ejemplo, es a un nivel una representación
compuesta de conceptos como piezas del espacio, que tienen portales, caras, lados,
etc. El lenguaje en el siguiente nivel más primitivo (y como resultado, inferior) es la
lógica de primer orden, donde, por ejemplo, In(s1, s2) es una relación que expresa
que el espacio s1 está contenido en s2.

Esta visión es útil en parte porque permite que nuestro análisis y discusión se
concentre en gran medida en las tecnologías RC. Al igual que el nivel de
representación primitiva en los fundamentos de los lenguajes RC, se encuentran con
todos los temas centrales para la representación del conocimiento de cualquier
variedad. También son ejemplos útiles porque son ampliamente conocidos en el
campo y hay un considerable conjunto de experiencias que se pueden aprovechar.
¿Qué es una Representación de
Conocimiento?
Tal vez la pregunta más fundamental sobre el concepto de representación del
conocimiento sea: ¿Qué es? Creemos que la respuesta se entiende mejor en términos
de los cinco roles fundamentales que desempeña.

Rol I: Una RC es un sustituto


Cualquier entidad inteligente que desee razonar sobre su mundo se encuentra
con un hecho importante e ineludible: el razonamiento es un proceso que transcurre
internamente, mientras que la mayoría de las cosas que desea razonar sólo existen
externamente. Un programa (o persona) dedicado a planificar el montaje de una
bicicleta, por ejemplo, puede tener que razonar sobre entidades como ruedas,
cadenas, piñones, manillares, etc., pero tales cosas existen sólo en el mundo exterior.

Esta inevitable dicotomía es una justificación y un rol fundamental para una


representación: funciona como sustituto dentro del razonador, como sustituto de las
cosas que existen en el mundo. Las operaciones sobre, y con, representaciones
sustituyen a las operaciones sobre lo real, es decir, sustituyen a la interacción directa
con el mundo. Desde este punto de vista, el razonamiento mismo es en parte un
sustituto de la acción en el mundo, cuando no podemos o no queremos (todavía)
tomar esa acción. (1)

Considerar las representaciones como sustitutos conduce naturalmente a dos


preguntas importantes. La primera pregunta acerca de cualquier sustituto es su
propia identidad: ¿para qué sirve? Debe haber alguna forma de correspondencia
especificada entre el sustituto y su pretendido referente en el mundo; la
correspondencia es la semántica para la representación.

La segunda pregunta es la fidelidad: ¿cuán cerca está el sustituto de lo real? ¿Qué


atributos del original captura y explicita, y cuáles omite? La fidelidad perfecta es en
general imposible, tanto en la práctica como por principio. Es imposible por
principio, porque cualquier otra cosa que no sea la cosa en sí misma es
necesariamente diferente de la cosa misma (ya sea en la ubicación si no hay otra
razón). Dicho de otro modo, la única representación completamente exacta de un
objeto es el objeto mismo. Todas las demás representaciones son inexactas;
inevitablemente contienen suposiciones simplificadoras y posiblemente artefactos.

Dos pequeñas elaboraciones amplían esta visión de las representaciones como


sustitutos. En primer lugar, parece servir tanto para los objetos intangibles como
para los materiales como las ruedas dentadas: las representaciones funcionan como
sustitutos de nociones abstractas como acciones, procesos, creencias, causalidad,
categorías, etc., permitiendo describirlas dentro de una entidad para que pueda
razonar sobre ellas. En segundo lugar, los objetos formales pueden existir dentro de
la máquina con una fidelidad perfecta: las entidades matemáticas, por ejemplo,
pueden ser capturadas con exactitud, precisamente porque son objetos formales.
Puesto que casi cualquier tarea de razonamiento encontrará la necesidad de tratar
con objetos naturales (es decir, aquellos encontrados en el mundo real) así como con
objetos formales, los sustitutos imperfectos son pragmáticamente inevitables.

Sustitutos imperfectos implican inferencias incorrectas


inevitables.
Dos consecuencias importantes se derivan de la inevitabilidad de sustitutos
imperfectos. Una consecuencia es que al describir el mundo natural, debemos
inevitablemente mentir, al menos por omisión. Como mínimo, debemos prescindir
de la complejidad efectivamente ilimitada del mundo natural; nuestras
descripciones pueden además introducir artefactos que no están presentes en el
mundo.

La segunda y más importante consecuencia es que todos los razonamientos


suficientemente amplios sobre el mundo natural deben llegar a conclusiones
incorrectas, independientemente del proceso de razonamiento utilizado e
independientemente de la representación empleada. El razonamiento correcto no
puede salvarnos: si el modelo del mundo es de alguna manera equivocado (y debe
serlo) algunas conclusiones serán incorrectas, no importa lo cuidadosamente
extraídas que sean. Una mejor representación no puede salvarnos: todas las
representaciones son imperfectas y cualquier imperfección puede ser fuente de
error.

El significado del error puede, por supuesto, variar; de hecho, gran parte del arte
de seleccionar una buena representación consiste en encontrar una que minimice (o
quizás incluso elimine) el error para la tarea específica en cuestión. Pero la inevitable
imperfección de los sustitutos significa que podemos proporcionar al menos una
garantía para cualquier entidad razonando de cualquier manera sobre el mundo
natural: si razona lo suficiente y ampliamente, está garantizado que se equivoca.

Por lo tanto, extraer sólo inferencias correctas no libera al razonamiento del


error; sólo puede garantizar que la inferencia no es la fuente de ese error. Dado que
el razonamiento de base general inevitablemente será incorrecto, el paso de una
inferencia correcta a otros modelos de inferencia no es, por lo tanto, un movimiento
desde la exactitud total hacia el error, sino una cuestión de equilibrar la posibilidad
de una fuente más de error con las ganancias (por ejemplo, la eficiencia) que puede
ofrecer.

No sugerimos que el razonamiento poco riguroso deba ser aceptado casualmente,


pero afirmamos que, dada la inevitabilidad del error, incluso con razonamiento
correcto, tiene sentido evaluar pragmáticamente los costes y beneficios relativos
derivados del uso de métodos de razonamiento rigurosos y poco rigurosos.

Rol II: Una RC es un conjunto de compromisos


ontológicos
Si, como hemos argumentado, todas las representaciones son aproximaciones
imperfectas a la realidad, cada aproximación atendiendo a unas cosas e ignorando
otras, al seleccionar cualquier representación estamos en el mismo acto tomando
inevitablemente un conjunto de decisiones sobre cómo y qué ver en el mundo. Es
decir, seleccionar una representación significa asumir un conjunto de compromisos
ontológicos. (2) Los compromisos son en efecto un par de gafas fuertes que
determinan lo que podemos ver, haciendo que alguna parte del mundo se centre en
el punto de mira, a expensas de desdibujar otras partes.
Estos compromisos y su efecto de enfoque/ difuminado no son un efecto
secundario incidental de una elección de representación; son esenciales: un RC es
un conjunto de compromisos ontológicos. Es inevitable que así sea debido a las
imperfecciones de las representaciones. Resulta útil porque una selección sensata de
los compromisos ofrece la oportunidad de centrar la atención en aspectos del mundo
que consideramos pertinentes.

El efecto de enfoque es una parte esencial de lo que ofrece una representación,


porque la complejidad del mundo natural es abrumadora. Nosotros (y nuestras
máquinas de razonamiento) necesitamos una guía para decidir qué es lo que hay que
atender y qué ignorar en el mundo. Las gafas suministradas por una representación
pueden proporcionar esa orientación: al decirnos qué y cómo ver, nos permiten
hacer frente a lo que de otro modo sería una complejidad y un detalle insostenibles.
De ahí que el compromiso ontológico de una representación pueda ser uno de los
aportes más importantes que ofrece.

Hay una larga historia de trabajo que intenta construir buenas ontologías para
una variedad de dominios de tareas, incluyendo el trabajo inicial sobre una ontología
para líquidos[12], el modelo de elementos agrupados ampliamente utilizado en la
representación de circuitos electrónicos (por ejemplo,[3]), así como ontologías para
el tiempo, la creencia e incluso la programación en sí misma. Cada uno de ellos ofrece
una manera de ver alguna parte del mundo.

El modelo de elementos agrupados, por ejemplo, sugiere que pensemos en


circuitos en términos de componentes con conexiones entre ellos, con señales que
fluyen instantáneamente a lo largo de las conexiones. Esta es una vista útil, pero no
la única posible. Una ontología diferente se presenta si necesitamos ocuparnos de la
electrodinámica en el dispositivo: Aquí las señales se propagan a velocidad finita y
un objeto (como una resistencia) que antes se veía como un componente único con
un comportamiento de E/S puede que ahora deba pensarse como un medio
extendido a través del cual fluye una onda electromagnética.

Las ontologías pueden, por supuesto, ser escritas en una amplia variedad de
lenguajes y notaciones (por ejemplo, la lógica, LISP, etc.); la información esencial no
es la forma de ese lenguaje sino el contenido, es decir, el conjunto de conceptos
ofrecidos como una forma de pensar sobre el mundo. En pocas palabras, la parte
importante son las nociones como conexiones y componentes, no si optamos por
escribirlas como predicados o estructuras de LISP.

El compromiso que asumimos al seleccionar una u otra ontología puede dar lugar
a una visión muy distinta de la tarea que nos ocupa. Consideremos la diferencia que
surge al seleccionar la representación del elemento agrupado de un circuito en lugar
de la representación electrodinámica del mismo dispositivo. Como segundo ejemplo,
el diagnóstico médico visto en términos de reglas (por ejemplo, MYCIN) parece
sustancialmente diferente de la misma tarea vista en términos de marcos (por
ejemplo, INTERNIST). Mientras que MYCIN considera que el mundo de la medicina
está compuesto por asociaciones empíricas que conectan el síntoma con la
enfermedad, INTERNIST considera que un conjunto de prototipos, en particular las
enfermedades prototípicas, deben ser cotejados con el caso concreto.

El compromiso comienza con las primeras elecciones


El ejemplo de INTERNIST también demuestra que existe un compromiso
ontológico significativo e inevitable, incluso a nivel de las tecnologías de
representación habituales. Lógica, reglas, marcos, etc., cada uno encarna un punto
de vista sobre el tipo de cosas que son importantes en el mundo. La lógica, por
ejemplo, implica un compromiso (muy mínimo) de ver el mundo en términos de
entidades individuales y relaciones entre ellas. Los sistemas basados en reglas ven el
mundo en términos de triples atributo-objeto-valor y las reglas de inferencia
plausible que los conectan, mientras que los marcos nos hacen pensar en términos
de objetos prototípicos.

Cada uno de ellos aporta así su propia visión de lo que es importante atender, y
cada uno sugiere, a la inversa, que cualquier cosa que no sea fácilmente reconocible
en esos términos puede ser ignorada. Por supuesto, no se garantiza que esto sea
correcto, ya que todo lo ignorado puede resultar pertinente más adelante. Pero la
tarea es desesperanzadora en principio --cada representación ignora algo sobre el
mundo-- de ahí que lo mejor que podemos hacer es empezar con una buena
suposición. Las tecnologías de representación existentes proporcionan un conjunto
de conjeturas sobre qué atender y qué ignorar. La selección de cualquiera de ellos
implica un grado de compromiso ontológico: la selección tendrá un impacto
significativo en nuestra percepción y enfoque de la tarea, así como en nuestra
percepción del mundo que se está modelando.

Los compromisos se acumulan en capas


El compromiso ontológico de una representación comienza por lo tanto al nivel
de las tecnologías de representación y se construye desde allí. A medida que ponemos
la tecnología a trabajar, se establecen nuevos niveles de compromiso. El uso de
estructuras enmarcadas en INTERNIST ofrece un ejemplo ilustrativo. En el nivel
más fundamental, la decisión de ver el diagnóstico en términos de marcos sugiere
pensar en términos de prototipos, defectos y una jerarquía taxonómica. Pero,
¿prototipos de qué y cómo se organizará la taxonomía?

Una descripción temprana del sistema[21] muestra cómo estas preguntas fueron
respondidas en la tarea que nos ocupa, suministrando el segundo nivel de
compromiso:

La base de conocimientos que subyace en el sistema INTERNIST se compone de


dos tipos básicos de elementos: entidades y manifestaciones de la enfermedad...
también contiene una... jerarquía de categorías de enfermedades, organizadas
principalmente en torno al concepto de sistemas de órganos, teniendo en el nivel
superior categorías tales como "enfermedad hepática","enfermedad renal", etc.

Los prototipos, en consecuencia, están destinados a captar enfermedades


prototípicas (por ejemplo, un "caso clásico" de una enfermedad) y se organizarán en
una taxonomía indexada en torno a los sistemas de órganos. Se trata de un conjunto
de opciones razonable e intuitivo, pero claramente no es la única forma de aplicar
marcos a la tarea; por lo tanto, es otro nivel de compromiso ontológico.

En la tercera (y en este caso última) capa, este conjunto de opciones es


instanciado: ¿qué enfermedades serán incluidas y en qué ramas de la jerarquía
aparecerán? Las cuestiones ontológicas que surgen incluso en este nivel pueden ser
fundamentales. Consideremos, por ejemplo, la determinación de cuáles de los
siguientes factores se consideran enfermedades (es decir, estados anormales que
requieren curación): alcoholismo, homosexualidad y síndrome de fatiga crónica. El
compromiso ontológico aquí es suficientemente obvio e importante como para que
a menudo sea objeto de debate en el campo mismo, independientemente de la
construcción de razonadores automatizados.

Hay que tomar decisiones similares con todas las tecnologías de representación,
porque cada una de ellas sólo proporciona un primer orden de aproximación sobre
cómo ver el mundo: ofrecen una forma de ver pero no indican cómo instanciar esa
visión. Como los marcos sugieren prototipos y taxonomías, pero no nos dicen qué
cosas seleccionar como prototipos, las reglas sugieren pensar en términos de
inferencias plausibles, pero no nos dicen qué inferencias plausibles hay que atender.
Del mismo modo, la lógica nos dice que debemos ver el mundo en términos de
individuos y relaciones, pero no especifica qué individuos y relaciones utilizar.

El compromiso con una visión particular del mundo comienza con la elección de
una tecnología de representación, y se acumula a medida que se van tomando
decisiones sobre cómo ver el mundo en esos términos.

Recordatorio: Una RC no es una estructura de datos


Hay que tener en cuenta que en cada capa, incluso en la primera (por ejemplo,
seleccionar reglas o marcos), las opciones que se toman son sobre la representación,
no sobre las estructuras de datos. Parte de lo que hace que un lenguaje sea
representativo es que tiene sentido[13], es decir, existe una correspondencia entre
sus construcciones y las cosas en el mundo exterior. Esa correspondencia conlleva a
su vez una restricción.

Una red semántica, por ejemplo, es una representación, mientras que un grafo es
una estructura de datos. Son entidades de diversa índole, aunque una
invariablemente se utiliza para implementar la otra, precisamente porque la red
tiene (debe tener) una semántica. Esa semántica se manifestará en parte porque
limita la topología de la red: una red que pretende describir las afiliaciones familiares
tal como las conocemos no puede tener un ciclo en sus vínculos padre, mientras que
los grafos (es decir, las estructuras de datos) no están por supuesto bajo ninguna
restricción y pueden tener ciclos arbitrarios.

Mientras que cada representación debe ser implementada en la máquina por


alguna estructura de datos, la propiedad representacional está en la correspondencia
con algo en el mundo y en la restricción que la correspondencia impone.

Rol III: Una RC es una Teoría Parcial del


Razonamiento Inteligente
El tercer rol de una representación es como teoría parcial del razonamiento
inteligente. Este papel se debe a que la concepción inicial de una representación está
motivada normalmente por alguna perspicacia que indica cómo la gente razona
inteligentemente, o por alguna creencia sobre lo que significa razonar
inteligentemente en realidad.

La teoría es parcial en dos sentidos distintos:

1. la representación normalmente incorpora sólo una parte de la percepción o


creencia que la motivó, y
2. esa percepción o creencia es a su vez sólo una parte del fenómeno complejo y
multifacético del razonamiento inteligente.

La teoría del razonamiento inteligente de una representación es a menudo


implícita, pero puede hacerse más evidente examinando sus tres componentes:

1. la concepción fundamental de inferencia inteligente de la representación;


2. el conjunto de inferencias que la representación establece; y
3. el conjunto de inferencias que recomienda.

Mientras que las inferencias establecidas indican lo que puede inferirse, las
inferencias recomendadas se refieren a lo que debe inferirse. (Se necesitan
directrices porque el conjunto de inferencias establecidas suele ser demasiado
grande para ser utilizado indiscriminadamente). Mientras que la ontología que
examinamos antes nos dice cómo ver, las inferencias recomendadas sugieren cómo
razonar.
Estos componentes también pueden ser vistos como las respuestas de la
representación a las tres cuestiones fundamentales correspondientes:

1. ¿Qué significa razonar inteligentemente?


2. ¿Qué podemos inferir de lo que sabemos? y
3. ¿Qué debemos deducir de lo que sabemos?

Las respuestas a estas preguntas están en el corazón del espíritu y la mentalidad


de una representación; conocer su postura acerca de estos temas nos dice mucho al
respecto.

Comenzamos con el primero de estos componentes, examinando dos de las


diversas concepciones fundamentalmente diferentes del razonamiento inteligente
que se han explorado en la IA. Esas concepciones y sus supuestos subyacentes
demuestran la amplia gama de opiniones sobre la cuestión y establecen un contexto
importante para los demás componentes.

¿Qué es el razonamiento inteligente?


¿Cuáles son las propiedades esenciales que definen el razonamiento inteligente?

Como consecuencia de la relativa juventud de la IA como disciplina, las


percepciones sobre la naturaleza del razonamiento inteligente a menudo han
provenido del trabajo en otros campos. Cinco campos --lógica matemática,
psicología, biología, estadística y economía-- han inspirado cinco nociones
distinguibles de lo que constituye el razonamiento inteligente (ver Tabla siguiente).
Una visión, históricamente derivada de la lógica matemática, hace suponer que
el razonamiento inteligente es una variedad de cálculos formales, típicamente
deducibles; los ejemplos modernos de esta visión en AI son los logistas. Una segunda
visión, arraigada en el trabajo de la psicología, ve el razonamiento como un
comportamiento humano característico y ha dado lugar tanto al extenso trabajo
sobre la resolución de problemas humanos como a la gran colección de sistemas
basados en el conocimiento.

Un tercer enfoque, poco arraigado en la biología, opina que la clave del


razonamiento es la arquitectura de la maquinaria que lo realiza, por lo que el
razonamiento es un comportamiento de estímulo/respuesta característico que surge
de la interconexión paralela de una gran colección de procesadores muy simples. Los
investigadores que trabajan en varias variedades de conexionismo son los
descendientes actuales de esta línea de trabajo. Un cuarto enfoque, derivado de la
teoría de la probabilidad, añade a la lógica la noción de incertidumbre, dando lugar
a una visión en la que razonar inteligentemente significa obedecer a los axiomas de
la teoría de la probabilidad. Una quinta visión, desde la economía, añade el
ingrediente adicional de los valores y preferencias, conduciendo a una visión del
razonamiento inteligente definido por la adherencia a los principios de la teoría de
utilidad.

Explorar brevemente el desarrollo histórico de los dos primeros puntos de vista


ilustrará las diferentes concepciones que tienen de la naturaleza fundamental del
razonamiento inteligente y demostrará las profundas diferencias de fondo que
surgen como consecuencia.

Razonamiento inteligente: la visión lógica y la visión psicológica

Consideremos primero la tradición que rodea a la lógica matemática como una


visión del razonamiento inteligente. Esta visión tiene sus orígenes históricos en los
esfuerzos de Aristóteles por acumular y catalogar los silogismos, en un intento por
determinar lo que se debe tomar como argumento convincente. (3) La línea continúa
con Descartes, cuya geometría analítica muestra que la obra de Euclides,
aparentemente preocupada por el material del pensamiento puro (líneas de ancho
cero, círculos perfectos del tipo que sólo los dioses podían hacer), podía de hecho
conectarse con el álgebra, una forma de cálculo, algo que los simples mortales podían
hacer.

En tiempos de Leibnitz la agenda es bastante específica y contundente: no buscó


nada menos que un "cálculo del pensamiento" que permitiera resolver todos los
desacuerdos humanos con la simple invocación "Calculemos". Para entonces existe
una creencia clara y concreta de que, al igual que la geometría de Euclides, que
alguna vez fue una geometría divina e inalcanzable, podía ser capturada con el
álgebra, alguna (o quizás cualquiera) variedad de esa materia efímera llamada
pensamiento podría ser capturada en el cálculo, específicamente la deducción lógica.

En el siglo XIX, Boole proporcionó las bases para el cálculo proposicional en sus
"Leyes del Pensamiento"; el trabajo posterior de Frege y Peano proporcionó una base
adicional para la forma moderna del cálculo de predicados. El trabajo de Davis,
Putnam y Robinson en el siglo XX proporcionó los últimos pasos en la mecanización
de la deducción lo suficiente como para permitir a los primeros demostradores
automáticos de teoremas.
La descendencia moderna de esta línea de desarrollo intelectual incluye los
muchos esfuerzos que utilizan la lógica de primer orden como representación y
alguna variedad de deducción como motor del razonamiento, así como el amplio
cuerpo de trabajo con la agenda explícita de hacer computacional el razonamiento
lógico, ejemplificado por PROLOG.

Esta línea de desarrollo ilustra claramente cómo los enfoques de la


representación se basan en la naturaleza del razonamiento inteligente y la forma en
que éste se fundamenta. Por ejemplo, se encuentra aquí el desarrollo histórico de la
premisa subyacente de que razonar inteligentemente significa razonar lógicamente;
cualquier otra cosa es un error o una aberración. Junto a esto, está la creencia de que
"lógicamente" a su vez significa lógica de primer orden, por lo general con deducción
correcta. Por simple transitividad, estos dos se contraen en una parte clave de la
lógica subyacente del razonamiento inteligente: razonar inteligentemente significa
razonar de la manera definida por la lógica de primer orden.

Una segunda parte importante de esta visión es la creencia asociada de que el


razonamiento inteligente es un proceso que puede ser capturado en una descripción
formal, particularmente una descripción formal que es precisa y concisa.

Pero también son posibles puntos de vista muy diferentes sobre la naturaleza del
razonamiento inteligente. Una visión claramente diferente se encuentra en la parte
de la IA influenciada por la tradición psicológica. Esa tradición, arraigada en el
trabajo de Hebb, Bruner, Miller, y Newell & Simon, rompió con la visión de
estímulo/respuesta exigida por el conductismo y sugirió en su lugar que el
comportamiento de resolver problemas humanos podía ser visto en términos de
metas, planes y otras estructuras mentales complejas. Las manifestaciones
modernas incluyen el trabajo sobre SOAR como un mecanismo general para
producir razonamientos inteligentes y sistemas basados en el conocimiento como un
medio para capturar el razonamiento experto humano.

Comparar estas dos tradiciones revela diferencias significativas e ilustra las


consecuencias de adoptar una u otra visión del razonamiento inteligente. En la
tradición logicista, el razonamiento inteligente se toma como una forma de cálculo,
por lo general la deducción en la lógica de primer orden, mientras que la tradición
basada en la psicología toma como característica definitoria del razonamiento
inteligente que es una variedad particular de la conducta humana. En la visión
logicista, el objeto de interés es por lo tanto un constructo definible en términos
formales a través de las matemáticas, mientras que para los influenciados por la
tradición psicológica es un fenómeno empírico del mundo natural. Por lo tanto,
existen dos supuestos muy diferentes sobre la naturaleza esencial del fenómeno
fundamental que se debe captar.

Una segunda diferencia surge al considerar el carácter de las respuestas que cada
uno busca. El punto de vista logicista ha buscado tradicionalmente caracterizaciones
compactas y precisas de la inteligencia, buscando el tipo de caracterizaciones
encontradas en las matemáticas (y a veces en la física). La tradición psicológica, por
el contrario, sugiere que la inteligencia no es sólo un fenómeno natural, sino que es
un fenómeno natural intrínsecamente complejo: como la anatomía y la fisiología
humanas son sistemas intrínsecamente complejos que resultan de un largo proceso
de evolución, tal vez lo sea la inteligencia. Como tal, la inteligencia puede ser una
colección amplia y fundamentalmente ad hoc de mecanismos y fenómenos, para la
cual puede no ser posible realizar descripciones completas y concisas.

Son varias las consecuencias útiles que se derivan de la comprensión de las


diferentes posiciones adoptadas por cada tradición sobre esta cuestión fundamental.
En primer lugar, demuestra que seleccionar cualquiera de los descendientes
modernos de esas tradiciones -es decir, cualquiera de las tecnologías de
representación mostradas al final de la tabla- significa elegir más que una
representación: en el mismo acto también estamos seleccionando una concepción de
la naturaleza fundamental del razonamiento inteligente.

En segundo lugar, esas concepciones difieren de manera importante: hay


diferencias fundamentales en la concepción del fenómeno que intentamos captar.
Las diferentes concepciones a su vez significan que existen profundas diferencias de
fondo en el carácter y las metas de los diversos esfuerzos de investigación que
intentan crear programas inteligentes. En pocas palabras: diferentes concepciones
de la naturaleza del razonamiento inteligente conducen a diferentes metas,
definiciones de éxito y diferentes artefactos creados.

Por último, esas diferencias rara vez se expresan. Esto a su vez conduce a
argumentos que pueden ser expresados en términos de temas como la elección de la
representación (por ejemplo, las virtudes del razonamiento sólido en FOPC vs. la
dificultad de caracterizar inferencias producidas por sistemas basados en marcos),
cuando los temas reales son, creemos, las diferentes concepciones de la naturaleza
fundamental de la inteligencia. Comprender las diferentes posiciones ayuda a
analizar y resolver los problemas de manera apropiada.

¿Qué inferencias se autorizan?


El segundo componente de la teoría del razonamiento inteligente de una
representación es su conjunto de inferencias autorizadas, es decir, un conjunto
seleccionado de inferencias que se consideran conclusiones apropiadas para extraer
de la información disponible. La definición clásica viene dada por la lógica formal
tradicional, donde las únicas inferencias autorizadas son las inferencias correctas (es
decir, aquellas comprendidas por la vinculación lógica, en las que cada modelo para
el conjunto de axiomas es también un modelo para la conclusión). Esta respuesta
tiene una serie de importantes beneficios, incluyendo la satisfacción intuitiva (un
argumento válido nunca introducirá error), explícito (ya que sabemos exactamente
de qué estamos hablando), lo suficientemente preciso como para que pueda ser
objeto de pruebas formales, y lo suficientemente antiguo como para que hayamos
acumulado una experiencia significativa sobre él.

La lógica también ha explorado diversas formas de inferencia poco sólidas,


incluyendo la circunscripción y el secuestro. Esta exploración se ha guiado
normalmente por el requisito de que haya "una justificación teórica del modelo bien
motivada"[19], como por ejemplo el criterio de modelo mínimo de circunscripción.
Este requisito mantiene un componente fundamental del enfoque logicista: si bien
está dispuesto a llegar a conclusiones que son verdaderas en algún subconjunto de
los modelos (y no en cada modelo) el conjunto de inferencias sancionadas sigue
siendo concebido en términos teóricos del modelo y se especifica precisamente en
esos términos.

Otras representaciones han explorado otras definiciones: los sistemas de


razonamiento probabilista (por ejemplo,[20]) permiten las inferencias especificadas
mediante la teoría de la probabilidad, mientras que el trabajo sobre los agentes
racionales (por ejemplo,[7]) se basa en conceptos de la teoría de la racionalidad
económica.

Entre las tecnologías de representación de conocimiento común, los sistemas


basados en reglas capturan conjeturas del tipo que hace el experto humano,
conjeturas que no son necesariamente ni sólidas ni verdaderas en ningún modelo.
Una representación basada en marcos anima a saltar a conclusiones posiblemente
incorrectas basadas en buenos resultados, expectativas o incumplimientos. Ambos
comparten la tradición psicológica de definir el conjunto de inferencias autorizadas
con referencia al comportamiento del experto humano, más que a un modelo formal
abstracto.

Forma y contenido de las respuestas

Como muestran estos ejemplos, los diferentes enfoques de representación


especifican inferencias autorizadas de maneras que difieren tanto en el contenido
como en la forma. Mientras que la especificación de la lógica, por ejemplo, se expresa
en términos de teoría de modelos y es matemáticamente precisa, otras
representaciones proporcionan respuestas expresadas en otros términos, a menudo
con una precisión considerablemente menor. La teoría de los marcos, por ejemplo,
ofrece una definición expresada en términos de comportamiento humano y se
especifica sólo aproximadamente.

Las diferencias de contenido y estilo, a su vez, tienen su origen en las diferentes


concepciones de razonamiento inteligente exploradas anteriormente. La definición
en términos de comportamiento humano es apropiada para los marcos porque la
teoría concibe el razonamiento inteligente como una forma característica del
comportamiento humano. Al tratar de describir ese comportamiento, la teoría se
enfrenta a la tarea de caracterizar un fenómeno empírico complejo que sólo puede
ser captado en forma aproximada en este momento, y que puede que nunca sea
especificable con precisión matemática, de ahí la idoneidad de una respuesta
aproximada.

Para la teoría de los marcos, por tanto, la especificación de inferencias


sancionadas es tanto informal como empírica, como una consecuencia inevitable de
su concepción de la inteligencia. Sin embargo, el trabajo (y otros trabajos como éste)
no es descuidado ni carece de precisión causal; la concepción subyacente del
razonamiento inteligente dicta un enfoque diferente de la tarea, un conjunto de
términos diferentes en los que expresar la respuesta y un enfoque diferente para la
respuesta.

El objetivo general es reconocer la legitimidad de una variedad de enfoques para


especificar inferencias aceptadas: la teoría de modelos puede ser familiar y poderosa,
pero incluso para los sistemas formales no es el único lenguaje posible. En términos
más generales, las definiciones formales no son los únicos términos en los que se
puede especificar la respuesta. La elección del vocabulario apropiado y el grado de
formalidad dependen a su vez de la concepción básica del comportamiento
inteligente.

¿Qué inferencias se recomiendan?


Mientras que las inferencias autorizadas nos dicen qué conclusiones podemos
sacar, ese conjunto es invariablemente muy grande y por lo tanto nos proporciona
una restricción insuficiente. Cualquier sistema automatizado que intente razonar,
guiado sólo por el conocimiento de las inferencias autorizadas, pronto se verá
abrumado por las elecciones. De ahí que necesitemos algo más que una indicación
de qué inferencias podemos hacer legalmente, también necesitamos alguna
indicación de qué inferencias son las apropiadas para hacer, es decir, inteligentes.
Esta indicación viene dada por el conjunto de inferencias recomendadas.

Obsérvese que la necesidad de una especificación de inferencias recomendadas


significa que al especificar una representación también necesitamos decir algo sobre
cómo razonar inteligentemente. La representación y el razonamiento están
inextricablemente entrelazados, y son útiles: una representación del conocimiento
es una teoría del razonamiento inteligente.

Razonablemente a menudo esa teoría ha sido proporcionada por la observación


del comportamiento humano. La exposición original de Minsky de la teoría del
marco, por ejemplo, ofrece un ejemplo claro de un conjunto de inferencias
recomendadas y un conjunto inspirado en la observación del comportamiento
humano. Consideremos lo siguiente, de la introducción al artículo original de
marcos[17]:

Esta es una teoría parcial del pensamiento..... Cada vez que uno se
encuentra con una nueva situación (o hace un cambio sustancial en su
punto de vista), selecciona de la memoria una estructura llamada
marco; un esquema recordado para adaptarse a la realidad cambiando
los detalles según sea necesario.

Un marco...[representa] una situación estereotipada, como estar en


una cierta clase de salón o ir a una fiesta de cumpleaños de un niño.

La primera frase ilustra la interrelación entre razonamiento y representación: se


trata de un documento sobre la representación del conocimiento, pero anuncia desde
el principio que también es una teoría del pensamiento. Esa teoría, a su vez, surgió
de una percepción del razonamiento inteligente humano, es decir, de cómo la gente
podía llegar a hacer el tipo de inferencias sencillas de sentido común que parecen
difíciles de captar en los programas. La teoría señala un conjunto particular de
inferencias para recomendar, a saber, el razonamiento en el estilo de la concordancia
anticipada.

Se pueden dar caracterizaciones similares de inferencias recomendadas para la


mayoría de las otras tecnologías de representación. Las redes semánticas en su forma
original, por ejemplo, recomiendan la propagación bidireccional a través de la red,
inspirada en el carácter interconectado de las definiciones de las palabras y la parte
de la inteligencia humana manifestada en la habilidad de las personas para encontrar
conexiones entre conceptos aparentemente dispares. Las reglas de los sistemas
basados en el conocimiento recomiendan inferencias plausibles, inspiradas en la
observación del razonamiento humano experto.

La lógica, por el contrario, ha adoptado tradicionalmente una postura


minimalista al respecto. La representación en sí misma sólo ofrece una teoría de
inferencias autorizadas, buscando permanecer en silencio sobre la cuestión de qué
inferencias recomendar.

El silencio sobre este tema está motivado por el deseo de generalidad en la


maquinaria de inferencia y una forma declarativa (es decir, independiente del uso)
para el lenguaje, ambos objetivos fundamentales del enfoque logicista:"... los
logicistas se esfuerzan por hacer que el proceso de inferencia sea lo más uniforme y
el dominio lo más independiente posible y por representar todo el conocimiento
(incluso el conocimiento sobre cómo usar el conocimiento) de forma declarativa".
[19]

Pero una representación con estos objetivos no puede destacar ningún conjunto
particular de inferencias que se puedan recomendar, por dos razones. En primer
lugar, si el proceso de inferencia ha de ser general y uniforme (es decir, trabajar sobre
todos los problemas, y trabajar de la misma manera), debe ser neutral en cuanto a
qué inferencias recomendar: cualquier subconjunto particular de inferencias que se
intente destacar podría ser apropiado en una situación pero fatalmente malo en otra,
ya que ninguna estrategia de inferencia (preferencias unitarias, conjunto de apoyo,
etc.) es universalmente apropiada. En segundo lugar, si las declaraciones en el
lenguaje han de ser declarativas, deben expresar un hecho sin ninguna indicación de
cómo razonar con él (la expresión libre de uso es una característica definitoria de
una representación declarativa). Por lo tanto, el motor de inferencia no puede
recomendar inferencias (o pierde su generalidad y uniformidad) y las afirmaciones
de hecho en el lenguaje no pueden recomendar inferencias (ya que al incrustar tal
información pierden su carácter declarativo). (4)

El deseo de generalidad y de expresión libre de uso impide así que la


representación misma pueda elegir inferencias para recomendar. Pero si la
representación en sí no puede hacer la recomendación, el usuario debe hacerlo, ya
que la alternativa --búsqueda no guiada-- es insostenible.

Esto es en parte una virtud deliberada del enfoque logicista: impedir que la
representación seleccione inferencias y, por lo tanto, exigir al usuario que lo haga,
ofrece la oportunidad de que esa información se represente explícitamente, en lugar
de estar implícitamente incrustada en la maquinaria de la representación (como, por
ejemplo, en los sistemas basados en reglas, o en PROLOG).

Una dificultad con este objetivo admirable surge al tratar de proporcionar al


usuario las herramientas para expresar las estrategias y guiar el sistema. Se utilizan
comúnmente tres enfoques: hacer que el usuario le diga al sistema qué hacer, que el
usuario lo guíe para que haga lo correcto y que construya estrategias de inferencia
para propósitos especiales. Al "decirle al sistema lo que debe hacer" queremos decir
que el usuario recomiende un conjunto de inferencias escribiendo declaraciones en
el mismo lenguaje (declarativo) utilizado para expresar hechos sobre el mundo (por
ejemplo, MRS[9]). Al "guiar al sistema a hacer lo correcto" nos referimos a que el
usuario seleccione cuidadosamente los axiomas, teoremas y lemas que se le
suministrarán al sistema. La presencia de un lema, por ejemplo, no es simplemente
un hecho que el sistema deba conocer, sino que también proporciona una manera de
abreviar una larga cadena de deducciones en un solo paso, permitiendo que el
sistema dé un "gran" paso en una cierta dirección (a saber, la dirección en la que el
lema nos lleva). Con una cuidadosa selección de hechos y lemas el usuario puede
recomendar indirectamente un conjunto particular de inferencias. Por "estrategias
de inferencia de propósito especial" nos referimos a construir estrategias de control
específicas directamente en el demostrador de teoremas. Esto puede ofrecer una
aceleración significativa y un nivel pragmáticamente útil de eficiencia
computacional.

Cada uno de estos enfoques tiene tanto beneficios como inconvenientes.


Expresar las estrategias de razonamiento en la lógica de primer orden está en
consonancia con el espíritu del enfoque logicista, es decir, la representación explícita
del conocimiento en una representación uniforme y declarativa. Pero esto es a
menudo problemático en la práctica: un lenguaje diseñado para expresar los hechos
declarativamente no es necesariamente bueno para expresar la información
imperativa característica de una estrategia de razonamiento.

La selección cuidadosa de los lemas es, en el mejor de los casos, una codificación
indirecta de la información orientativa que debe facilitarse. Por último, los
mecanismos de deducción para fines especiales son potentes, pero incrustan la
estrategia de razonamiento tanto invisible como procedimentalmente, anulando los
objetivos originales de inferencia independiente del dominio y de representación
explícita y declarativa.

La buena noticia aquí es que al permanecer deliberadamente en silencio sobre el


tema de las inferencias recomendadas, la lógica ofrece tanto un grado de generalidad
como la posibilidad de hacer que la información sobre las inferencias recomendadas
sea explícita y esté disponible para ser razonada a su vez. La noticia menos positiva
es que la tarea de guiar el sistema se ha dejado al usuario sin asistencia conceptual,
y las prácticas que a veces provocan fracasan en algunos de los objetivos clave que
motivaron el enfoque al principio.

Rol IV: Una RC es un medio para computación


eficiente
Desde un punto de vista puramente mecanicista, el razonamiento en las
máquinas (y algo más debatible, en las personas) es un proceso computacional. En
pocas palabras, para usar una representación debemos calcular con ella. Como
resultado, las preguntas acerca de la eficiencia computacional son inevitablemente
centrales en la noción de representación.

Esto ha sido reconocido desde hace mucho tiempo, al menos implícitamente, por
los diseñadores de representaciones: junto con su especificación de un conjunto de
inferencias recomendadas, las representaciones ofrecen habitualmente un conjunto
de ideas sobre cómo organizar la información de forma que se facilite hacer esas
inferencias. Una parte importante de la noción original de marcos, por ejemplo, se
refiere a este tipo de sugerencias, como ilustra la introducción del artículo sobre
marcos:
Un marco...[representa] una situación estereotipada, como estar en
una cierta clase de salón o ir a una fiesta de cumpleaños de un niño.

A cada marco se le añaden varios tipos de información. Parte de esta información


se refiere a cómo utilizar el marco. Algunos hablan de lo que uno puede esperar que
suceda a continuación. Algunos se refieren a qué hacer si estas expectativas no se
confirman.

La noción de desencadenantes y el agregado de procedimientos en los marcos no


es tanto una declaración sobre qué procedimientos escribir (sobre esto la teoría es
bastante vaga), como una descripción de una manera útil de organizar la
información: por ejemplo, (paráfrasis de arriba) adjuntar a cada marco información
sobre cómo usar el marco, qué hacer si no se confirman las expectativas, etc. Del
mismo modo, la organización de los marcos en jerarquías taxonómicas permite el
razonamiento taxonómico y facilita su ejecución (como en las redes estructuradas de
herencia).

Otras representaciones ofrecen orientaciones similares. Las redes semánticas


tradicionales facilitan la propagación bidireccional por el simple hecho de
proporcionar un conjunto apropiado de enlaces, mientras que los sistemas basados
en reglas facilitan inferencias plausibles al proporcionar indicadores desde objetivos
a reglas cuya conclusión coincide (para encadenamientos hacia atrás) y desde hechos
a reglas cuya premisa coincide (para encadenamientos hacia adelante).

Si bien la cuestión del uso eficiente de las representaciones ha sido abordada por
los diseñadores de las representaciones, en el sentido más amplio del término, el
campo parece haber sido históricamente ambivalente en su reacción. El
reconocimiento temprano de la noción de adecuación heurística[16] demuestra que
los investigadores apreciaron desde el principio la importancia de las propiedades
computacionales de una representación, pero el tono de gran parte del trabajo
posterior en la lógica (por ejemplo,[13]) sugirió que la epistemología (contenido de
conocimiento) por sí sola importaba, y dejaba fuera de la agenda la eficiencia
computacional. La epistemología sí importa, por supuesto, y puede resultar útil
estudiarla sin la posibilidad de que distraiga la atención sobre la velocidad. Pero al
final debemos calcular con nuestras representaciones, por lo que la eficiencia debe
ser parte de la agenda.

El péndulo más tarde se balanceó bruscamente, a lo que podríamos llamar la


vista imperativa computacional. Algunos trabajos en este sentido (por ejemplo,[15])
ofrecían lenguajes de representación cuyo diseño estaba fuertemente impulsado por
el deseo de proporcionar no sólo eficiencia, sino también eficacia garantizada. El
resultado parece ser un lenguaje de velocidad significativa pero con una potencia
expresiva restringida[6].

Cualquiera de los dos extremos de este espectro parece problemático: ignoramos


las consideraciones computacionales a nuestro riesgo, pero también podemos
preocuparnos demasiado por ellas, produciendo representaciones rápidas pero
inadecuadas para su uso real.

Rol V: Una RC es un medio de expresión


humana
Finalmente, las representaciones del conocimiento son también el medio por el
que expresamos cosas sobre el mundo, el medio de expresión y comunicación en el
que le contamos a la máquina (y quizás entre nosotros) sobre el mundo. Este rol de
las representaciones es inevitable siempre y cuando necesitemos decirle a la
máquina (u otras personas) sobre el mundo, y siempre y cuando lo hagamos creando
y comunicando representaciones. (5) La quinta función de las representaciones del
conocimiento es, pues, como medio de expresión y comunicación para nosotros.

A su vez, esto plantea dos grupos importantes de preguntas. Un grupo es


conocido: ¿Qué tan bien funciona la representación como medio de expresión? ¿Qué
tan general es? ¿Qué tan preciso? ¿Proporciona una adecuación expresiva? etc.

Una pregunta importante que se discute con menos frecuencia es: ¿Qué tan bien
funciona como medio de comunicación? Es decir, ¿qué tan fácil es para nosotros
"hablar" o pensar en ese idioma? ¿Qué tipo de cosas se dicen fácilmente en el
lenguaje y qué tipo de cosas son tan difíciles como para ser pragmáticamente
imposibles?
Observe que las preguntas aquí son de la forma "¿qué tan fácil es?" en lugar de
"¿podemos?" Este es un lenguaje que debemos utilizar, por lo que las cosas que son
posibles en principio son útiles pero insuficientes; la verdadera cuestión es de
utilidad pragmática. Si la representación hace que las cosas sean posibles pero no
fáciles, entonces como usuarios reales nunca sabremos si hemos malinterpretado la
representación y no sabemos cómo usarla, o si realmente no puede expresar algunas
cosas que nos gustaría decir. Una representación es el lenguaje en el que nos
comunicamos, por lo que debemos ser capaces de hablarlo sin esfuerzo heroico.

Você também pode gostar