Escolar Documentos
Profissional Documentos
Cultura Documentos
Introducción
¿Qué es una representación del conocimiento? Esta noción se puede entender
mejor en términos de los cinco posibles roles que desempeña, todos ellos cruciales
para el objetivo de comprender qué es una representación del conocimiento (RC, a
partir de ahora):
Terminología y perspectiva
Dos elementos de la terminología ayudarán en nuestra presentación.
1. Primero, usamos el término inferencia en un sentido genérico, para referirnos
a cualquier forma de obtener nuevas expresiones de lo antiguo. Sólo en raras
ocasiones estamos hablando de inferencias lógicas sólidas y al hacerlo nos
referimos explícitamente a eso.
2. En segundo lugar, para darles un nombre colectivo único, nos referimos al
conocido conjunto de herramientas básicas de representación como la lógica,
reglas, marcos, redes semánticas, etc., como tecnologías de representación
del conocimiento.
También resultará útil considerar explícitamente la práctica común de construir
representaciones del conocimiento en múltiples niveles de lenguajes, normalmente
con una de las tecnologías de representación del conocimiento en el nivel inferior.
La ontología de líquidos de Hayes[12], por ejemplo, es a un nivel una representación
compuesta de conceptos como piezas del espacio, que tienen portales, caras, lados,
etc. El lenguaje en el siguiente nivel más primitivo (y como resultado, inferior) es la
lógica de primer orden, donde, por ejemplo, In(s1, s2) es una relación que expresa
que el espacio s1 está contenido en s2.
Esta visión es útil en parte porque permite que nuestro análisis y discusión se
concentre en gran medida en las tecnologías RC. Al igual que el nivel de
representación primitiva en los fundamentos de los lenguajes RC, se encuentran con
todos los temas centrales para la representación del conocimiento de cualquier
variedad. También son ejemplos útiles porque son ampliamente conocidos en el
campo y hay un considerable conjunto de experiencias que se pueden aprovechar.
¿Qué es una Representación de
Conocimiento?
Tal vez la pregunta más fundamental sobre el concepto de representación del
conocimiento sea: ¿Qué es? Creemos que la respuesta se entiende mejor en términos
de los cinco roles fundamentales que desempeña.
El significado del error puede, por supuesto, variar; de hecho, gran parte del arte
de seleccionar una buena representación consiste en encontrar una que minimice (o
quizás incluso elimine) el error para la tarea específica en cuestión. Pero la inevitable
imperfección de los sustitutos significa que podemos proporcionar al menos una
garantía para cualquier entidad razonando de cualquier manera sobre el mundo
natural: si razona lo suficiente y ampliamente, está garantizado que se equivoca.
Hay una larga historia de trabajo que intenta construir buenas ontologías para
una variedad de dominios de tareas, incluyendo el trabajo inicial sobre una ontología
para líquidos[12], el modelo de elementos agrupados ampliamente utilizado en la
representación de circuitos electrónicos (por ejemplo,[3]), así como ontologías para
el tiempo, la creencia e incluso la programación en sí misma. Cada uno de ellos ofrece
una manera de ver alguna parte del mundo.
Las ontologías pueden, por supuesto, ser escritas en una amplia variedad de
lenguajes y notaciones (por ejemplo, la lógica, LISP, etc.); la información esencial no
es la forma de ese lenguaje sino el contenido, es decir, el conjunto de conceptos
ofrecidos como una forma de pensar sobre el mundo. En pocas palabras, la parte
importante son las nociones como conexiones y componentes, no si optamos por
escribirlas como predicados o estructuras de LISP.
El compromiso que asumimos al seleccionar una u otra ontología puede dar lugar
a una visión muy distinta de la tarea que nos ocupa. Consideremos la diferencia que
surge al seleccionar la representación del elemento agrupado de un circuito en lugar
de la representación electrodinámica del mismo dispositivo. Como segundo ejemplo,
el diagnóstico médico visto en términos de reglas (por ejemplo, MYCIN) parece
sustancialmente diferente de la misma tarea vista en términos de marcos (por
ejemplo, INTERNIST). Mientras que MYCIN considera que el mundo de la medicina
está compuesto por asociaciones empíricas que conectan el síntoma con la
enfermedad, INTERNIST considera que un conjunto de prototipos, en particular las
enfermedades prototípicas, deben ser cotejados con el caso concreto.
Cada uno de ellos aporta así su propia visión de lo que es importante atender, y
cada uno sugiere, a la inversa, que cualquier cosa que no sea fácilmente reconocible
en esos términos puede ser ignorada. Por supuesto, no se garantiza que esto sea
correcto, ya que todo lo ignorado puede resultar pertinente más adelante. Pero la
tarea es desesperanzadora en principio --cada representación ignora algo sobre el
mundo-- de ahí que lo mejor que podemos hacer es empezar con una buena
suposición. Las tecnologías de representación existentes proporcionan un conjunto
de conjeturas sobre qué atender y qué ignorar. La selección de cualquiera de ellos
implica un grado de compromiso ontológico: la selección tendrá un impacto
significativo en nuestra percepción y enfoque de la tarea, así como en nuestra
percepción del mundo que se está modelando.
Una descripción temprana del sistema[21] muestra cómo estas preguntas fueron
respondidas en la tarea que nos ocupa, suministrando el segundo nivel de
compromiso:
Hay que tomar decisiones similares con todas las tecnologías de representación,
porque cada una de ellas sólo proporciona un primer orden de aproximación sobre
cómo ver el mundo: ofrecen una forma de ver pero no indican cómo instanciar esa
visión. Como los marcos sugieren prototipos y taxonomías, pero no nos dicen qué
cosas seleccionar como prototipos, las reglas sugieren pensar en términos de
inferencias plausibles, pero no nos dicen qué inferencias plausibles hay que atender.
Del mismo modo, la lógica nos dice que debemos ver el mundo en términos de
individuos y relaciones, pero no especifica qué individuos y relaciones utilizar.
El compromiso con una visión particular del mundo comienza con la elección de
una tecnología de representación, y se acumula a medida que se van tomando
decisiones sobre cómo ver el mundo en esos términos.
Una red semántica, por ejemplo, es una representación, mientras que un grafo es
una estructura de datos. Son entidades de diversa índole, aunque una
invariablemente se utiliza para implementar la otra, precisamente porque la red
tiene (debe tener) una semántica. Esa semántica se manifestará en parte porque
limita la topología de la red: una red que pretende describir las afiliaciones familiares
tal como las conocemos no puede tener un ciclo en sus vínculos padre, mientras que
los grafos (es decir, las estructuras de datos) no están por supuesto bajo ninguna
restricción y pueden tener ciclos arbitrarios.
Mientras que las inferencias establecidas indican lo que puede inferirse, las
inferencias recomendadas se refieren a lo que debe inferirse. (Se necesitan
directrices porque el conjunto de inferencias establecidas suele ser demasiado
grande para ser utilizado indiscriminadamente). Mientras que la ontología que
examinamos antes nos dice cómo ver, las inferencias recomendadas sugieren cómo
razonar.
Estos componentes también pueden ser vistos como las respuestas de la
representación a las tres cuestiones fundamentales correspondientes:
En el siglo XIX, Boole proporcionó las bases para el cálculo proposicional en sus
"Leyes del Pensamiento"; el trabajo posterior de Frege y Peano proporcionó una base
adicional para la forma moderna del cálculo de predicados. El trabajo de Davis,
Putnam y Robinson en el siglo XX proporcionó los últimos pasos en la mecanización
de la deducción lo suficiente como para permitir a los primeros demostradores
automáticos de teoremas.
La descendencia moderna de esta línea de desarrollo intelectual incluye los
muchos esfuerzos que utilizan la lógica de primer orden como representación y
alguna variedad de deducción como motor del razonamiento, así como el amplio
cuerpo de trabajo con la agenda explícita de hacer computacional el razonamiento
lógico, ejemplificado por PROLOG.
Pero también son posibles puntos de vista muy diferentes sobre la naturaleza del
razonamiento inteligente. Una visión claramente diferente se encuentra en la parte
de la IA influenciada por la tradición psicológica. Esa tradición, arraigada en el
trabajo de Hebb, Bruner, Miller, y Newell & Simon, rompió con la visión de
estímulo/respuesta exigida por el conductismo y sugirió en su lugar que el
comportamiento de resolver problemas humanos podía ser visto en términos de
metas, planes y otras estructuras mentales complejas. Las manifestaciones
modernas incluyen el trabajo sobre SOAR como un mecanismo general para
producir razonamientos inteligentes y sistemas basados en el conocimiento como un
medio para capturar el razonamiento experto humano.
Una segunda diferencia surge al considerar el carácter de las respuestas que cada
uno busca. El punto de vista logicista ha buscado tradicionalmente caracterizaciones
compactas y precisas de la inteligencia, buscando el tipo de caracterizaciones
encontradas en las matemáticas (y a veces en la física). La tradición psicológica, por
el contrario, sugiere que la inteligencia no es sólo un fenómeno natural, sino que es
un fenómeno natural intrínsecamente complejo: como la anatomía y la fisiología
humanas son sistemas intrínsecamente complejos que resultan de un largo proceso
de evolución, tal vez lo sea la inteligencia. Como tal, la inteligencia puede ser una
colección amplia y fundamentalmente ad hoc de mecanismos y fenómenos, para la
cual puede no ser posible realizar descripciones completas y concisas.
Por último, esas diferencias rara vez se expresan. Esto a su vez conduce a
argumentos que pueden ser expresados en términos de temas como la elección de la
representación (por ejemplo, las virtudes del razonamiento sólido en FOPC vs. la
dificultad de caracterizar inferencias producidas por sistemas basados en marcos),
cuando los temas reales son, creemos, las diferentes concepciones de la naturaleza
fundamental de la inteligencia. Comprender las diferentes posiciones ayuda a
analizar y resolver los problemas de manera apropiada.
Esta es una teoría parcial del pensamiento..... Cada vez que uno se
encuentra con una nueva situación (o hace un cambio sustancial en su
punto de vista), selecciona de la memoria una estructura llamada
marco; un esquema recordado para adaptarse a la realidad cambiando
los detalles según sea necesario.
Pero una representación con estos objetivos no puede destacar ningún conjunto
particular de inferencias que se puedan recomendar, por dos razones. En primer
lugar, si el proceso de inferencia ha de ser general y uniforme (es decir, trabajar sobre
todos los problemas, y trabajar de la misma manera), debe ser neutral en cuanto a
qué inferencias recomendar: cualquier subconjunto particular de inferencias que se
intente destacar podría ser apropiado en una situación pero fatalmente malo en otra,
ya que ninguna estrategia de inferencia (preferencias unitarias, conjunto de apoyo,
etc.) es universalmente apropiada. En segundo lugar, si las declaraciones en el
lenguaje han de ser declarativas, deben expresar un hecho sin ninguna indicación de
cómo razonar con él (la expresión libre de uso es una característica definitoria de
una representación declarativa). Por lo tanto, el motor de inferencia no puede
recomendar inferencias (o pierde su generalidad y uniformidad) y las afirmaciones
de hecho en el lenguaje no pueden recomendar inferencias (ya que al incrustar tal
información pierden su carácter declarativo). (4)
Esto es en parte una virtud deliberada del enfoque logicista: impedir que la
representación seleccione inferencias y, por lo tanto, exigir al usuario que lo haga,
ofrece la oportunidad de que esa información se represente explícitamente, en lugar
de estar implícitamente incrustada en la maquinaria de la representación (como, por
ejemplo, en los sistemas basados en reglas, o en PROLOG).
La selección cuidadosa de los lemas es, en el mejor de los casos, una codificación
indirecta de la información orientativa que debe facilitarse. Por último, los
mecanismos de deducción para fines especiales son potentes, pero incrustan la
estrategia de razonamiento tanto invisible como procedimentalmente, anulando los
objetivos originales de inferencia independiente del dominio y de representación
explícita y declarativa.
Esto ha sido reconocido desde hace mucho tiempo, al menos implícitamente, por
los diseñadores de representaciones: junto con su especificación de un conjunto de
inferencias recomendadas, las representaciones ofrecen habitualmente un conjunto
de ideas sobre cómo organizar la información de forma que se facilite hacer esas
inferencias. Una parte importante de la noción original de marcos, por ejemplo, se
refiere a este tipo de sugerencias, como ilustra la introducción del artículo sobre
marcos:
Un marco...[representa] una situación estereotipada, como estar en
una cierta clase de salón o ir a una fiesta de cumpleaños de un niño.
Si bien la cuestión del uso eficiente de las representaciones ha sido abordada por
los diseñadores de las representaciones, en el sentido más amplio del término, el
campo parece haber sido históricamente ambivalente en su reacción. El
reconocimiento temprano de la noción de adecuación heurística[16] demuestra que
los investigadores apreciaron desde el principio la importancia de las propiedades
computacionales de una representación, pero el tono de gran parte del trabajo
posterior en la lógica (por ejemplo,[13]) sugirió que la epistemología (contenido de
conocimiento) por sí sola importaba, y dejaba fuera de la agenda la eficiencia
computacional. La epistemología sí importa, por supuesto, y puede resultar útil
estudiarla sin la posibilidad de que distraiga la atención sobre la velocidad. Pero al
final debemos calcular con nuestras representaciones, por lo que la eficiencia debe
ser parte de la agenda.
Una pregunta importante que se discute con menos frecuencia es: ¿Qué tan bien
funciona como medio de comunicación? Es decir, ¿qué tan fácil es para nosotros
"hablar" o pensar en ese idioma? ¿Qué tipo de cosas se dicen fácilmente en el
lenguaje y qué tipo de cosas son tan difíciles como para ser pragmáticamente
imposibles?
Observe que las preguntas aquí son de la forma "¿qué tan fácil es?" en lugar de
"¿podemos?" Este es un lenguaje que debemos utilizar, por lo que las cosas que son
posibles en principio son útiles pero insuficientes; la verdadera cuestión es de
utilidad pragmática. Si la representación hace que las cosas sean posibles pero no
fáciles, entonces como usuarios reales nunca sabremos si hemos malinterpretado la
representación y no sabemos cómo usarla, o si realmente no puede expresar algunas
cosas que nos gustaría decir. Una representación es el lenguaje en el que nos
comunicamos, por lo que debemos ser capaces de hablarlo sin esfuerzo heroico.