Você está na página 1de 11

Ingeniera del conocimiento Introduccin

La ingeniera del conocimiento es aquella disciplina moderna que forma parte de la Inteligencia Artificial y cuyo fin es el diseo y desarrollo de Sistemas expertos (o Sistemas Basados en el Conocimiento SS.BB.C.). Para ello, se apoya en metodologas instruccionales y en las ciencias de la computacin y de la Informacin, intentando representar el conocimiento y razonamiento humanos en un determinado dominio, dentro de un sistema artificial. El trabajo de los ingenieros del conocimiento consiste en extraer el conocimiento de los expertos humanos en una determinada rea, y en codificar dicho conocimiento de manera que pueda ser procesado por un sistema. El problema es que la ingeniera del conocimiento no es un experto en el campo que intenta modelar, mientras que el experto en el tema no tiene experiencia modelando su conocimiento (basado en la heurstica) de forma que pueda ser representado de forma genrica en un sistema. La ingeniera del conocimiento engloba a los cientficos, tecnologa y metodologa necesarios para procesar el conocimiento. Su objetivo es extraer, articular e informatizar el conocimiento de un experto. El punto clave del desarrollo de un Sistema Basado en el Conocimiento es el momento de traspasar el conocimiento que posee el experto a un sistema real. En este proceso no slo se han de captar los elementos que componen el dominio del experto, sino que tambin se han de adquirir las metodologas de resolucin que utilizan stos. Este trabajo de extraccin del conocimiento (Knowledge elicitation) se realiza durante la interaccin entre dos personajes, el ingeniero del conocimiento (IC) (persona que conoce el formalismo de representacin que utilizar el SBC) y elexperto (persona que posee el conocimiento, pero que no tiene por qu usar un formalismo para representarlo). Durante las entrevistas entre el IC y el experto, el primero ha de ayudar a sistematizar el conocimiento del experto, consiguiendo que vaya explicitando las diferentes tcnicas que utiliza para resolver los problemas de su dominio, de manera que se puedan representar en un formalismo computable. Esta metodologa de extraccin del conocimiento es bastante lenta (se cita que se suele extraer informacin equivalente a de dos a cinco reglas de produccin por da). Varias son las dificultades que dan una produccin tan baja a esta metodologa: La naturaleza especializada del dominio hace que el IC deba aprender unas nociones bsicas para que pueda establecerse una comunicacin (Vocabulario bsico, elementos que intervienen en el dominio, formalismos que utilizan los expertos, etc.). Los expertos se encuentran ms cmodos pensando en trminos de ejemplos tpicos que razonando en trminos generales, que son de los que realmente se podra hacer una mejor abstraccin. La bsqueda de un formalismo de representacin que se adapte adecuadamente al problema y que sea fcil de interpretar y adoptar por el experto. Este formalismo ha de ser susceptible de ser transformado en algo computable. Por lo general, a los expertos les es muy difcil explicitar los pasos que utilizan para resolver los problemas. Es la que se ha denominado paradoja del experto. Cuanta ms

experiencia, menos explcitos son los razonamientos del experto y ms ocultos los mtodos de resolucin. Si observamos cmo un experto resuelve un problema, ste omite muchas cadenas de razonamiento e informacin que da por supuesta, y a la que no asigna importancia dentro de la resolucin, pero que si se quiere abordar de manera sistemtica s es necesaria. Con todas estas circunstancias, podemos observar que la autntica dificultad de la extraccin del conocimiento estriba en descubrir los mtodos mediante los que se usa el conocimiento en la resolucin y no tanto en la adquisicin del conocimiento esttico del problema (elementos del problema y relaciones). Sobre la adquisicin de los elementos bsicos del dominio, existen bastantes herramientas automticas, encuadradas dentro del rea del aprendizaje automtico, que permiten reducir el esfuerzo. Sobre la adquisicin automtica de conocimiento de resolucin de problemas, tambin hay algunas tcnicas automticas, pero que por lo general son a niveles bastante bsicos.

Fases de adquisicin del conocimiento


Dado que la tarea de adquisicin del conocimiento es una tarea difcil, se han identificado varias etapas en las que se ha de dividir su desarrollo y as permitir abordar esta labor de una manera ms sistemtica. Existen diferentes versiones sobre la divisin de esta tarea; la ms aceptada en la literatura es la siguiente: 1. Identificacin del problema/s 2. Conceptualizacin 3. Formalizacin 4. Implementacin 5. Prueba

Identificacin
En esta fase se ha de determinar, en primer lugar, si el problema se puede o se debe abordar mediante las tcnicas de los SBC. Para que un problema sea adecuado no ha de poder solucionarse de manera algortmica, ya que si se pudiera de ese modo, no tendra sentido iniciar una labor tan costosa. Tambin ha de ser necesario tener acceso a las fuentes de conocimiento suficientes para completar la tarea. Por ltimo, el problema a tratar ha de tener un tamao adecuado para que no constituya una tarea inabordable por su complejidad. El siguiente paso consiste en buscar las fuentes de conocimiento que sern necesarias para el desarrollo del sistema, las ms comunes son: Expertos humanos en el dominio del problema. Libros y manuales que expliciten el problema y tcnicas de resolucin. Ejemplos de casos resueltos. stos ltimos sern importantes sobre todo en la ltima fase de validacin, pero se pueden usar tambin para utilizar tcnicas de adquisicin automtica del conocimiento y obtener de esta manera los elementos bsicos que intervienen y sus relaciones.

Con estas fuentes de informacin se podrn determinar los datos necesarios para la resolucin del problema y los criterios que determinen la solucin, tanto los pasos que permiten la resolucin como su posterior evaluacin. En este momento el IC y el experto podrn realizar una primera descripcin del problema; en sta se especificarn: Los objetivos Motivaciones Las estrategias de resolucin y su justificacin Fuentes de conocimiento Tipos de tareas que son necesarias Este esquema ser el punto de partida para plantear las siguientes fases.

Conceptualizacin
Antes de entrar en las caractersticas globales del problema, es necesario detallar los elementos bsicos de ste y descubrir las relaciones entre ellos. En particular, es necesario observar cmo el experto resuelve problemas tpicos y abstrae de ellos principios generales que pueden ser aplicados en diferentes contextos. Hay tambin que obtener una descomposicin del problema en subproblemas, realizando un anlisis por refinamientos sucesivos hasta que el IC pueda hacerse una idea de la relacin jerrquica de las diferentes fases de resolucin hasta los operadores de razonamiento ms elementales. Otro elemento necesario es descubrir el flujo del razonamiento en la resolucin del problema y especificar cundo y cmo son necesarios los elementos de conocimiento. Con esta descomposicin jerrquica y el flujo del razonamiento, el IC puede caracterizar los bloques de razonamiento superiores y los principales conceptos que definen el problema. Har falta distinguir entre evidencias, hiptesis y acciones necesarias en cada uno de los bloques y determinar la dificultad de cada una de las sub-tareas de resolucin. De esta manera se conseguir captar la estructura del dominio y las diferentes relaciones entre sus elementos.

Formalizacin
Se han de considerar los diferentes esquemas de razonamiento que se pueden utilizar para modelizar las diferentes necesidades de resolucin de problemas identificadas en las fases anteriores. En este punto, se ha de poder comprender la naturaleza del espacio de bsqueda y el tipo de bsqueda que habr que hacer. Para ello, se puede comparar sta con diferentes mecanismos prototpicos de resolucin de problemas como la clasificacin, abstraccin de datos, razonamiento temporal, estructuras causales, etc. En esta etapa tambin tendr que analizarse la certidumbre y completitud de la informacin disponible, dependencias temporales, o la fiabilidad y consistencia de la informacin. Se deber descubrir qu partes del conocimiento constituyen hechos seguros y cules no. Para stos ltimos deber adaptarse alguna metodologa de tratamiento de la incertidumbre, de manera que sta pueda ser modelizada dentro del sistema.

Implementacin
En este punto se han de tomar decisiones sobre la especificacin del control de la resolucin y del flujo de la informacin. Se debern tomar decisiones sobre el modo concreto de representar el conocimiento para que se adapte a las estrategias de resolucin que se necesiten y las relaciones entre los diferentes conjuntos de conocimiento. En esta fase se definirn las reglas, e inevitablemente se descubrirn problemas e incompletitudes que obligarn a revisar fases anteriores.

Prueba
Se ha de elegir un conjunto de casos resueltos representativos y se ha de comprobar el funcionamiento del sistema con stos. En esta fase se descubrirn errores que permitirn corregir anlisis anteriores; por lo general aparecern problemas por falta de reglas, incompletitud, falta de correccin, y posibles fallas en el anlisis de las reglas preestablecidas.

Clasificacin de los SBC


El abordar la construccin de un SBC en cualquier dominio es una tarea difcil, y sera deseable disponer de un conjunto de metodologas de resolucin de problemas que permitieran aproximar soluciones a diferentes tipos de SBC segn sus caractersticas. Con esta idea en mente se han realizado clasificaciones de los SBC segn las tareas que realizan, para intentar descubrir metodologas comunes y as extraer directrices de anlisis en los distintos tipos de dominios. De esta manera, dada una clase de problema dispondramos de: 1. Un conjunto de tareas usuales para cada tipo fciles de identificar. 2. Un conjunto de metodologas de resolucin generales especficas para cada tipo. 3. Estilos de representacin del conocimiento e inferencia adecuados para cada tipo. Originalmente se realiz una primera clasificacin de los SBC atendiendo a las tareas que [1] realizan , sta es: Sistemas de Interpretacin Infieren descripciones de situaciones a partir de observaciones. Sistemas de prediccin Infieren consecuencias previsibles de situaciones o eventos. Sistemas de diagnstico Infieren fallos a partir de sntomas. Sistemas de diseo Desarrollan configuraciones de objetos que satisfacen ciertas restricciones. Sistemas de planificacin Generan secuencias de acciones que obtienen un objetivo. Sistemas de monitorizacin Estudian el comportamiento de un sistema en el tiempo y procuran que siga unas especificaciones.

Sistemas de correccin Genera soluciones para fallos en un sistema. Sistemas de control Gobiernan el comportamiento de un sistema anticipando problemas, planeando soluciones.

Mtodos de resolucin de problemas


Diferentes son las tcnicas de resolucin de problemas que se pueden utilizar para las tareas que debe realizar un SBC. Existen ciertas tcnicas generales que se pueden aplicar a diferentes tipos de dominios y tareas. De ellas destacaremos las tres ms utilizadas: Clasificacin Heurstica (Heuristic Classification) Resolucin Constructiva (Constructive Problem Solving) Hiptesis y Prueba Jerrquica (Hierarchical Hipotesize and Test)

Clasificacin Heurstica
La clasificacin es un mtodo utilizado en muchos dominios. El elemento esencial de sta consiste en que el experto escoge una categora de un conjunto de soluciones previamente enumerado. En dominios simples, el disponer de las caractersticas esenciales de cada una de las categoras es suficiente para establecer la clase del problema y su solucin. Esto no ocurre as cuando la complejidad del problema aumenta, pues las caractersticas esenciales son cada vez ms difciles de identificar. El objetivo de la tcnica de clasificacin heurstica ser obtener y representar el conocimiento necesario para que la asociacin problema-solucin se pueda realizar. Se define como clasificacin heurstica a toda asociacin no jerrquica entre datos y categoras que requiere de inferencias intermedias. Es decir, el establecer la clase de un problema requiere realizar inferencias y transformaciones sobre ste, para poder asociarlo con la descripcin de la clase. El esquema de razonamiento para hacer estas inferencias se ha de adquirir del experto. La clasificacin heurstica se divide en tres etapas: 1. Abstraccin de los datos Por lo general, se hace una abstraccin del caso concreto para acercarlo a las soluciones que se poseen. 2. Asociacin heurstica Se busca la mayor coincidencia entre el caso abstrado y las soluciones. Esta asociacin es de naturaleza heurstica, es decir, depende de conocimiento basado en la experiencia, y, por lo general, la correspondencia entre caso y soluciones no ser uno a uno, existirn excepciones, y las coincidencias no sern exactas. La solucin corresponder con la que mejor coincida con la abstraccin de los datos. 3. Refinamiento de la solucin

Haber identificado la abstraccin de la solucin reducir el espacio de bsqueda, ahora ser necesario buscar la mejor solucin determinada por la solucin abstracta. Esto puede necesitar de ms deducciones, o de la utilizacin de ms informacin. De esta manera se debe reducir el espacio de bsqueda hasta encontrar la mejor solucin. Dentro de este proceso, un punto importante es la abstraccin de los datos. Tres son las ms utilizadas:: Abstraccin definicional Se deben extraer las caractersticas definitorias del problema y focalizar la bsqueda con stas. Le corresponde al experto decidir cules son esas caractersticas. Cualitativa Supone abstraer sobre valores cuantitativos, convirtindolos en cualitativos (e.g.: Fiebre = 39 grados ===> Fiebre = alta). Generalizacin Se realiza abstraccin sobre una jerarqua de conceptos (e.g.: forma = pentgono ===> forma = polgono). Se puede ver que esta metodologa de resolucin de problemas capta una gran cantidad de dominios, siendo adecuada para cualquier problema en el que se pueda hacer una enumeracin del espacio de soluciones. Es vlida para todas las tareas de anlisis.

Clasificacin heurstica en los sistemas de reglas


Por lo general, la construccin de un sistema mediante clasificacin heurstica basado en reglas es una labor iterativa. A los expertos les es difcil dar las reglas que son capaces de realizar la labor de clasificacin, y adems encuentran difcil el formalismo de las reglas. El proceso de refinamiento del sistema ha de hacerse paso a paso, aadiendo nuevas reglas que cubran nuevos casos y vigilando las interacciones. La metodologa que se suele seguir es la siguiente: 1. 2. 3. 4. El experto da las nuevas reglas al IC. El IC cambia la base de conocimiento. El IC prueba casos ya resueltos para comprobar inconsistencias. Si aparecen errores, se comprueba el nuevo conocimiento con el experto y se empieza de nuevo. 5. Se prueban nuevos casos. 6. Si no hay problemas se para, si los hay se retorna al principio. Esta labor iterativa se puede dividir para cada uno de los mdulos que componen el sistema, reduciendo de esta manera las interacciones entre diferentes partes del conocimiento.

Estrategias de adquisicin del conocimiento con clasificacin heurstica


La aplicacin de la clasificacin heurstica a diferentes problemas ha dado con mtodos que permiten dirigir la explicitacin del conocimiento por parte del experto de una manera ms sistemtica, enfocando la labor de extraccin en cada uno de los elementos que componen las reglas (hiptesis, evidencias, cadenas de inferencia, hechos intermedios, confianza en las

evidencias y las asociaciones evidencia-hiptesis). Algunos de los pasos que debe incluir la adquisicin son los siguientes:

Diferenciacin Buscar los sntomas que distinguen entre hiptesis. Frecuencia de condicionalizacin Buscar condiciones de base que hagan a una hiptesis ms o menos probable. Distincin de sntomas Identificar propiedades de sntomas que indican las causas originales. Condicionalizacin de sntomas Buscar las condiciones bajo las cuales se espera que aparezcan ciertos sntomas dada una hiptesis. Divisin de caminos Descubrir los sucesos intermedios entre hiptesis y sntomas que son ms probables. Diferenciacin de caminos Buscar los eventos intermedios que pueden diferenciar hiptesis con similares evidencias. Diferenciacin de condiciones Determinar el grado de confianza a aplicar al resultado de las condiciones. Condicionalizacin de condiciones Buscar las condiciones de base que afectan a la confianza de las condiciones. La conjuncin de todas estas fases permiten construir la base de conocimiento necesaria para la resolucin del problema.

Aplicacin de la clasificacin heurstica


Como ejemplo de la tcnica de clasificacin heurstica, vamos a plantear un pequeo SBC para la concesin de crditos bancarios para creacin de empresas. El propsito de este sistema ser examinar las solicitudes de crditos de clientes con pretensiones de crear una empresa para determinar si se les debe conceder y qu cuanta es la recomendable respecto a la que solicitan. El problema que se nos plantea tiene por lo tanto una labor de anlisis que nos ha de predecir la fiabilidad de si cierta persona, en ciertas condiciones, ser capaz de devolver un crdito si se lo concedemos. El nmero de soluciones a las que podemos llegar es evidentemente finito: el crdito se concede, o no se concede, y en el caso de que se conceda, se decidir si la cuanta solicitada es adecuada o si slo se puede llegar hasta cierto lmite. Todas estas caractersticas indican que la metodologa de resolucin que mejor encaja es la clasificacin heurstica, por lo tanto dirigiremos el planteamiento con las fases que necesita. Deberemos plantear cuatro tipos de elementos y los mecanismos para transformar unos en otros. El primero ser cmo se plantearn los problemas al sistema, es decir, qu elementos se correspondern con los datos especficos, las solicitudes de crdito.

Esta informacin ha de definir el estado financiero del solicitante, el motivo por el que pide el crdito, cunto dinero solicita, etc. Supongamos que una solicitud contiene la siguiente informacin: Si tiene avales bancarios. Si tiene familiares que puedan responder por l. Si tiene cuentas corrientes, casas, coches, fincas, etc. y su valoracin. Si tiene antecedentes de morosidad. Si ha firmado cheques sin fondos. Si tiene crditos anteriores concedidos. Tipo de empresa que quiere crear. Cantidad de dinero que solicita. Esta informacin deber convertirse mediante el proceso de abstraccin de datos en los problemas abstractos a partir de los cuales se har el razonamiento. Podramos decidir que nuestras soluciones abstractas quedan definidas por los siguientes atributos: Apoyo financiero: Valoracin de la capacidad econmica para responder al valor del crdito que solicita. Este apoyo se puede evaluar con la informacin sobre avales y personas allegadas que puedan responder por l. Bienes: Dinero o propiedades que puedan usarse para responder por el crdito o que se puedan embargar en caso de no devolucin. Fiabilidad de devolucin: Informacin sobre si el cliente tiene antecedentes econmicos positivos o negativos. Compromiso: Informacin sobre si ya se tiene compromisos econmicos con esa persona o si se tienen intereses especiales con ella. Viabilidad de la empresa: Tipo de empresa que se quiere crear y su posible futuro. Supondremos que estos cinco atributos pueden tomar valores cualitativos que estarn dentro de este conjunto: muy bueno, bueno, normal, regular, malo, muy malo. Para realizar la abstraccin de datos se podran dar un conjunto de reglas que haran la transformacin, como por ejemplo: si avales > 10 millones o to rico entonces apoyo financiero bueno si avales entre 10 millones y un milln entonces apoyo financiero normal si avales < 1 milln entonces apoyo financiero malo si suma bienes < 10 millones entonces bienes malo si suma bienes entre 10 y 20 millones entonces bienes normal si suma bienes > 20 millones entonces bienes bien si cheques sin fondos o moroso entonces fiabilidad muy mala si fbrica de agujeros entonces viabilidad muy mala si hamburguesera o heladera entonces viabilidad normal si grandes almacenes o proveedor de Internet entonces viabilidad muy buena si concedido crdito < 1 milln entonces compromiso regular si concedido crdito > 10 millones o hermano del director entonces compromiso bueno

El conjunto de soluciones abstractas a las que podra dar el anlisis de las solicitudes podra ser el siguiente: Denegacin: no hay crdito para el cliente. Aceptacin: se acepta el crdito tal como se solicita. Aceptacin con rebaja: se acepta el crdito, pero se rebaja la cantidad solicitada; harn falta reglas para crear la solucin concreta indicando la cantidad final que se concede. Aceptacin con inters preferente: se concede la cantidad solicitada, pero adems se rebajan los intereses que normalmente se ponen al crdito; en este caso tambin har falta generar una solucin concreta. Ahora nos faltan las reglas que nos harn la asociacin heurstica entre los problemas abstractos y las soluciones abstractas. Un conjunto de reglas que cubre una pequea parte del espacio de soluciones podra ser: si apoyo financiero regular y bienes malo entonces denegar si fiabilidad mala o muy mala entonces denegar si apoyo financiero normal y bienes normal y viabilidad buena entonces aceptar con rebaja si apoyo financiero bueno y bienes normal y compromiso normal y viabilidad buena entonces aceptar si apoyo financiero bueno y bienes bueno y compromiso muy bueno y viabilidad muy buena entonces aceptar con inters preferente Por ltimo, nos hacen falta reglas para poder generar soluciones concretas en los casos que son necesarias; algunas reglas podran ser: si aceptacin con rebaja y peticin > 5 millones y bienes = 5 millones entonces rebaja a 5 millones si aceptacin con inters preferente y peticin > 10 millones y bienes > 10 millones entonces rebaja de un 1% de inters si aceptacin con inters preferente y hermano del director entonces rebaja de un 2% de inters.....

Resolucin Constructiva
En contraste con la clasificacin heurstica, hay dominios en los que las soluciones no se pueden enumerar a priori, sino que la solucin ha de construirse. Por ejemplo, en problemas de diseo, o de planificacin, y por lo general, todos los sistemas que incluyen tareas de sntesis. Este tipo de problemas se pueden atacar mediante mtodos no guiados por conocimiento, pero obtener una solucin satisfactoria es computacionalmente prohibitivo. Construir una solucin necesita que exista un modelo de la estructura y el comportamiento del objeto que se desea construir, modelo que debe contener conocimiento acerca de las restricciones que se deben satisfacer. Este conocimiento debe incluir: 1. Restricciones en la configuracin de los componentes. 2. Restricciones respecto a las entradas y salidas. 3. Interacciones entre estos dos tipos de restricciones.

Dos son las estrategias generales que se siguen para la resolucin de este tipo de problemas: Proponer y aplicar (Propose and apply). Mnimo compromiso (Least commitment).

Proponer y aplicar
En principio, el experto debe tener una idea clara de la descomposicin en tareas del problema y de las relaciones espacio-temporales entre stas, para de esta manera plantear las restricciones que se tienen que cumplir. Se han de definir tambin las operaciones que se pueden efectuar en cada estado de la resolucin, cundo se pueden aplicar y cules son sus efectos. Los pasos que se siguen en esta metodologa son los siguientes, para cada tarea a realizar para alcanzar la solucin: Inicializar el objetivo: se crea el elemento que define el estado actual. Proponer un operador: se seleccionan operaciones plausibles sobre el estado actual. Podar operadores: se eliminan operadores de acuerdo con criterios globales. Estos criterios globales consistirn en criterios de consistencia generales que permiten descartar operadores que, aun siendo aplicables, se ve claramente que no mejorarn la solucin (e.g.: no tiene sentido escoger el operador que deshaga el efecto del ltimo operador aplicado). Evaluar operadores: se comparan los efectos de los operadores sobre la solucin y se evala su resultado. Es en este punto donde interviene el conocimiento del experto para realizar la evaluacin de los operadores. Seleccionar un operador: se escoge el operador mejor evaluado. Aplicar el operador: se aplica el operador al estado actual. Evaluar el objetivo: Se comprueba si se ha llegado al objetivo, continuando si se ha cumplido, o reconsiderando si no.

Mnimo compromiso
Un planteamiento alternativo consiste en partir de soluciones parciales e ir reformndolas hasta llegar a la solucin. La estrategia sera la siguiente: Partir de una solucin inicial no ptima, pero que satisfaga las restricciones. Hacer una modificacin sobre la solucin. Esta modificacin ha de hacerse de acuerdo con la heurstica de mnimo compromiso, es decir, escoger la accin que menos restricciones imponga sobre la solucin y, por lo tanto, menos restricciones imponga sobre el prximo paso. Si la modificacin viola alguna de las restricciones, se intenta deshacer alguno de los pasos anteriores, procurando que las modificaciones sean las mnimas. Esta modificacin no tiene por qu ser precisamente deshacer el ltimo paso que se realiz. El conocimiento del experto ha de aparecer en la evaluacin de los efectos de los operadores sobre las restricciones, de manera que se pueda escoger siempre el operador con menos efecto sobre stas y que permita ms libertad de movimientos.

Hiptesis y Prueba Jerrquica


Esta metodologa combina aspectos de la clasificacin heurstica y la resolucin constructiva de problemas. Est indicado para problemas en los que: El espacio de soluciones es muy grande, pero enumerable. La solucin puede ser una combinacin de un conjunto de hiptesis. Parte de la idea de que el espacio de soluciones est organizado jerrquicamente, de manera que en niveles ms altos se encuentran soluciones ms generales, que se deben refinar mediante el conocimiento que guiar a travs del rbol de soluciones a soluciones ms concretas. La estructuracin en forma jerrquica ayuda a plantear el problema y a focalizar la solucin. Ser labor del experto el definir la jerarqua y el conocimiento necesario para evaluar el estado de la solucin en cada nodo, tanto para descender hacia soluciones ms concretas como para descartar ramas.

Você também pode gostar