Você está na página 1de 31

Adquisicin del Conocimiento

Julio R. Baeza Pereyra

Introduccin
Lo bsico:

Tratar de imitar el funcionamiento del cerebro humano a nivel computador lo cual implica construir una analoga de tipo fsico del cerebro del hombre. Esto podra llamarse entonces enfoque fsico, y como principal exponente de este rumbo encontramos a las redes neuronales. Tratar de lograr el conocimiento humano a travs de la lgica, por lo que estaramos en presencia de un enfoque lgico. En este enfoque de pensamiento encontramos a los sistemas inteligentes que intentan reproducir el razonamiento humano de forma simblica.

Porqu?
Las personas expertas en un rea son volubles, dependiendo del estado de nimo, edad, interactibilidad. Estos Expertos no son eternos en las empresas. Un sistema tiene un formalismo que no cambia en el tiempo. Un sistema puede ser extendido para cubrir nuevas situaciones. Se puede hacer un sistema modular. Un mdulo para cada aspecto del problema. Pero: hay que extraer el conocimiento del experto, as como extraer patrones de los datos que se tienen disponibles. A este proceso se le conoce como ADQUISICIN DE CONOCIMIENTO.

La Ingeniera/Gestin del Conocimiento


De esta manera, es posible definir una "economa basada en el conocimiento" como aquella economa basada en la produccin, distribucin y uso del conocimiento y de la informacin. La importancia de la creacin del conocimiento y de las actividades innovadoras como factores de crecimiento econmico, no es una teora aparecida recientemente, no obstante el reciente protagonismo dado al conocimiento viene explicado por los siguientes factores Bajo este contexto se hace necesario definir el concepto de conocimiento, Prusak en 1998 lo defini de la siguiente manera: "Conocimiento es la fluida mezcla estructurada de experiencia, valores, informacin contextualizada, y ojo clnico muy experto que proporciona un marco de trabajo excelente para evaluar e incorporar nuevas experiencias e informacin. Se origina y se aplica en la mente de los que lo tienen. En las organizaciones, se encuentra muchas veces almacenado no solamente en documentos o bases de datos, sino tambin en rutinas, procedimientos, prcticas y normas". De la definicin anterior se desprenden dos tipos de conocimiento: el explcito y el tcito. El primero es aquel que puede ser expresado en palabras y nmeros, puede ser fcilmente transmitido y compartido en forma de procedimientos codificados, frmulas cientficas o principios universales. En contraste con l, el conocimiento tcito est muy personalizado y su formalizacin es compleja. Por lo que es difcil de transmitir ya que no ha adoptado una forma explcita.

EL CAPITAL INTELECTUAL
El capital humano se refiere a la educacin, experiencia, "know how", conocimientos, habilidades, valores y actitudes de las personas que trabajan en la empresa. No son propiedad de la empresa, ya que pertenecen a los trabajadores, estos al marcharse a casa se llevan consigo estos activos. En el capital humano residen los conocimientos tcitos de la organizacin. El capital estructural se refiere a la estructura organizativa formal e informal, a los mtodos y procedimientos de trabajo, al software, a las bases de datos, a la I+D, a los sistemas de direccin y gestin, y a la cultura de la empresa. Estos activos son propiedad de la empresa y algunos de ellos pueden protegerse legalmente (patentes, propiedad intelectual, etc.) El capital relacional se refiere a la cartera de clientes, a las relaciones con los trabajadores, proveedores, bancos, dueos y contratistas, etc., a los acuerdos de cooperacin y alianzas estratgicas, tecnolgicas, de produccin y comerciales, a las marcas comerciales y a la imagen de la empresa. Estos activos son propiedad de la empresa y algunos de ellos pueden protegerse legalmente, como es el caso de las marcas comerciales.

El Objetivo de la Ingeniera de Conocimiento


El objetivo de la ingeniera del conocimiento consiste en analizar los mtodos viables para obtener, organizar, codificar, mantener y extender un sistema que haga las labores de un experto humano. Las posibles aplicaciones de este campo son innumerables, dado que mediante un conjunto de pautas establecidas, se puede conseguir la resolucin de problemas de cualquier tipo. En ingeniera civil existen diversas reas en las que se pueden aplicar la ingeniera de conocimiento:

Administracin de recursos humanos Manejo de aspectos administrativos en la empresa Planificacin de actividades en el sitio de obra. Organizacin del sitio de la obra Obtencin de patrones en el comportamiento de la mano de obra Prediccin de niveles de productividad y consumo de materiales por parte de la mano de obra. Etc.

La Labor del Ingeniero de Conocimiento

La Labor del Ingeniero de Conocimiento


Conducir una entrevista con el experto(s) para: sondear el conocimiento que se va a adquirir, conocer la terminologa, el propsito del conocimiento y el sistema. Crear un diagrama conceptual derivado de los resultados de la entrevista y utilizarlo para generar preguntas que cumplan con los propsitos del sistema. Realizar otra entrevista, semi-estructurada, con el experto utilizando las preguntas del paso anterior. Generar los conceptos, reglas, atributos, valores, relaciones que van surgiendo de las entrevistas. Representar estos elementos de la manera ms apropiada (Texto, diagramas, ilustraciones, hipertexto, ancdotas, etc.) Presentar los resultados al experto y permitirle realizar cambios en el conocimiento ya capturado. Consultar con otros expertos y realizar las modificaciones apropiadas.

La Labor del Ingeniero de Conocimiento


La mayora de los ejemplos hasta hoy documentados de implementacin de sistemas expertos son en empresas grandes, sin embargo este tipo de sistemas se pueden implementar de manera sencilla en empresas pequeas y medianas, a travs de bases de datos como Access y herramientas como Internet. El proceso de adquisicin de conocimiento y por lo tanto el desarrollo del sistema experto, es continuo y constante. Siempre habr cosas nuevas: procesos, productos, problemas, etc. por documentar y por esto la organizacin debe estar consciente del esfuerzo y recursos que se requieren para lograrlo. En mi opinin, los Sistemas Expertos forman una parte muy importante dentro de todas las herramientas que ayudan a las organizaciones actualmente a tomar mejores decisiones, basadas en conocimiento.

Un ejemplo sencillo:
Una seccin problemtica de una casa tipo en un fraccionamiento tiene tres habitaciones: Un bao, una cocina y un pasillo. La cocina tiene una ventana. La distribucin de la casa es como sigue: Los compradores de dichos inmuebles se han quejado constantemente de que existen encharcamientos en las casas y estn pensando en demandar a la empresa en la que trabajas por falta de calidad en el trabajo. Como se piensan construir 1000 casas ms de dicho modelo, es necesario tener al plomero estrella Ek Chan trabajando a todo lo que da. Sin embargo, el plomero no est siempre disponible. ventana

COCINA

BAO

PASILLO

Debido a lo anterior, te propones entrevistarte con l para encontrar una manera ms sencilla de encontrar los problemas de fugas en dichas secciones de la casa.

Lo que se necesita para extraer las reglas


Tomar al experto de su trabajo por perodos cortos Permitir que los no experto entiendan el conocimiento Enfocarse en el conocimiento esencial Se puede capturar conocimiento implcito Permitir que el conocimiento sea compaginado contra diversos expertos Permitir que el conocimiento sea validado y mantenido

Las Tcnicas de adquisicin del Conocimiento


Muchas tcnicas se han desarrollado para ayudar a sacar conocimiento de un experto. stas se refieren como la extraccin del conocimiento o tcnicas de adquisicin de conocimiento. La siguiente lista da una breve introduccin a los tipos de tcnicas usadas para adquirir, analizar y modelar conocimiento.

Las Tcnicas
Generacin-protocolaria: incluyen varios tipos de entrevistas (no estructuradas, semi-estructuradas y estructuradas), divulgando tcnicas (tales como un auto-informe e inferencia) y tcnicas observacionales. Anlisis de protocolo: se utilizan con las transcripciones de las entrevistas o de otra informacin basada en texto para identificar varios tipos de conocimiento, tales como metas, decisiones, relaciones y cualidades. Esto acta como puente entre el uso de tcnicas basadas en protocolo y tcnicas de modelacin de conocimiento. Generacin de jerarquas, tales como las ontologas o diagramas de rboles, se utilizan para construir taxonomas u otras estructuras jerrquicas tales como rboles de metas y redes de decisin.

Las Tcnicas
Anlisis basado en Matrices: implica la construccin de rejillas que indican las cosas tales como los problemas encontrados contra soluciones posibles. Los tipos importantes incluyen el uso de marcos para representar las propiedades de los conceptos y la tcnica de la rejilla de repertorio usada para sacar, para clasificar, para analizar y para categorizar las caractersticas de conceptos. Tcnicas de ordenamiento: se utilizan para capturar la manera que la gente compara y ordena conceptos, y puede conducir a la revelacin de conocimiento sobre clases, caractersticas y prioridades.

Las Tcnicas
Tcnicas y tareas basadas en informacin limitada y manejo de restricciones: son tcnicas que limitan el tiempo y/o la informacin disponibles para el experto al realizar tareas. Por ejemplo, la tcnica de cuestionarios cortos proporciona una manera eficiente de tener acceso a la informacin dominante en un dominio en una orden dado de prioridad. Tcnicas basadas en diagramas: incluyen la generacin y el uso de los mapas conceptuales, de las redes de la transicin del estado, de los diagramas de rbol de acontecimientos y de los mapas de proceso. El uso de stos es particularmente importante para capturar el "qu, cmo, cuando y porqu" de tareas o de acontecimientos .

Porqu tantas tcnicas?


La respuesta yace en el hecho de que hay diversos tipos de conocimiento los expertos poseen, y diversas tcnicas se requieren para tener acceso a los diversos tipos de conocimiento. Esto se conoce como la Hiptesis Acceso Diferencial, y se ha demostrado experimentalmente que tiene evidencia que la soporta.

Comparaciones entre las distintas tcnicas

El proceso para aplicar alguna de las tcnicas:


Conducir una entrevista inicial con el experto para (a) delimitar el conocimiento que debe ser adquirido , (b) determinar para qu propsito debe servir el conocimiento, (c) ganar una cierta comprensin de la terminologa dominante, y (d) construir un vnculo con el experto. Esta entrevista (como con toda sesin con expertos) se registra en la cinta magntica de audio o videocinta . Transcribir la entrevista inicial y analizar el protocolo que de ella resulta. Crear una escala de conceptos de conocimiento resultante para proporcionar una representacin amplia del conocimiento en el dominio. Utilizar la escala para producir un conjunto de preguntas que cubren las puntos esenciales a travs del dominio y que sirven para las metas del proyecto de adquisicin de conocimiento . Conducir una entrevista semi-estructurada con el experto usando las preguntas preestablecidas para proporcionar la estructura y enfoque. Transcribir la entrevista semi-estructurada y analizar el protocolo que resulta para los tipos de conocimiento presentes. stas seran tpicamente conceptos, cualidades, valores, relaciones, tareas y reglas

El proceso
Representar estos elementos del conocimiento usando los modelos ms apropiados del conocimiento, ej. escalas, rejillas, diagramas de la red, hipertexto, etc. Adems, documentar las ancdotas, las ilustraciones y las explicaciones de una manera estructurada usando ttulos del hipertexto y plantillas. Utilizar los modelos de conocimiento que resultan y el texto estructurado con tcnicas ideadas tales como jerarquas y ontologas, pensar en voz alta en la solucin de problemas, veinte preguntas y rejillas del repertorio para permitir que el experto modifique y se ample en el conocimiento ya capturado. Repetir la construccin del anlisis, modelo y las sesiones de adquisicin hasta que el experto y el ingeniero del conocimiento estn satisfechos con las metas del proyecto que se han observado. Validar el conocimiento adquirido con otros expertos, y hacer las modificaciones cuando sea necesario.

Las Tcnicas
sta es una cobertura muy breve de qu sucede. No se asume que se ha recolectado cualquier conocimiento previo, ni que cualquier conocimiento genrico puede ser aplicado. En realidad, el objetivo sera reutilizar tanto conocimiento adquirido previamente como sea posible. Las tcnicas se han desarrollado para asistir al proceso, tal como el uso de ontologas y de modelos de resolucin de problemas. stos proporcionan conocimiento genrico para sugerir ideas al experto, tal como clases generales de objetos en el dominio y las maneras generales en que se realizan las tareas. Esta reutilizacin del conocimiento es la esencia de la realizacin del proceso de adquisicin de conocimiento tan eficiente y eficaz como sea posible. Esto es un proceso que evoluciona. As pues, tanto ms conocimiento se recolecta y se abstrae para producir conocimiento genrico, el proceso entero llega a ser ms eficiente. En la prctica, los ingenieros del conocimiento mezclan a menudo el conocimiento dirigido por la teora (de genrico hacia lo especfico) como conocimiento dirigido por datos (de lo especfico a lo genrico).

Tcnica de la Rejilla del Repertorio


La tcnica de la rejilla del repertorio se utiliza en muchos campos para sacar y analizar conocimiento y para propsitos de autoayuda y autocompresnsin. La tcnica esencialmente se basa en una matriz, aunque es ms compleja que simplemente llenar una matriz de elementos. Cuando est utilizada en la ingeniera de conocimiento, la tcnica implica generalmente las cuatro etapas principales siguientes: Etapa 1: los conceptos (llamados los elementos) se seleccionan para la rejilla. Para que la tcnica sea acertada y no tomar demasiado tiempo para funcionar, el nmero elegido no debe ni menos de 7 y no mas que 15. Un conjunto casi igual al nmero de las cualidades (llamadas las constructos) tambin se requiere. stos deben ser tales que los valores pueden ser clasificados en una escala continua. Las cualidades se pueden tomar del conocimiento sacado o generado previamente durante la sesin. Etapa 2: implica asignar un grado a cada concepto contra cada cualidad. Una escala numrica se utiliza, por lo general de 1 a 9. Por ejemplo, si los conceptos son planetas en la Sistema Solar, cada uno pudo ser clasificado en su distancia al sol (1 significa cerca del sol, 9 que significan muy lejos), etc., con otra de las cualidades . Etapa 3: a los grados se les aplican clculo estadstico llamado anlisis del racimos para crear una rejilla focalizada. Estos clculos se aseguran de que los conceptos con calificaciones similares estn agrupados juntos en la rejilla. Semejantemente, las cualidades que tienen cuentas similares a travs de los conceptos se agrupan juntas en la rejilla. Un ejemplo de una rejilla del foco para los planetas de la Sistema Solar se demuestra en las siguiente.

Tcnica de la Rejilla del Repertorio

Las estructuras al fondo y a la derecha de la rejilla son los dendrogramas que indican la fuerza de correlaciones. Por ejemplo, el dendrogram ms bajo muestran que Neptuno y Urano como planetas muy similares, y el dendrograma derecho indica una correlacin entre el tamao y la carencia de la densidad. Etapa 4: el ingeniero del conocimiento dirige al experto por la rejilla para ganar retroalimentacin e incitar por conocimiento referente las agrupaciones y a las correlaciones mostradas. Si es apropiado, los conceptos o las cualidades adicionales se agregan y despus se clasifican para proporcionar una rejilla ms grande y ms representativa. En esta manera la tcnica se puede utilizar para destapar correlaciones ocultadas y conexiones causales.

Retomando la entrevista
Durante la entrevista con el plomero, l te explic una manera rpida de detectar el problema en dichas secciones:
Si el pasillo est hmedo y la cocina est seca entonces la fuga de agua est en el bao. Si el pasillo est hmedo y el bao est seco entonces el problema debe de estar en la cocina. Si la ventana est cerrada o no ha llovido entonces el agua no provino de fuera. Si se sabe que el problema es de la cocina y se sabe que el agua no provino de fuera entonces la fuga de agua est en la cocina.

La Codificacin del Conocimiento


Despus de sopesar toda la informacin del plomero, pones todos los factores y las relaciones entre ellos en una especie de diagrama:
pasillo hmedo fuga en bao cocina seca pasillo hmedo problema en cocina bao seco ventanas cerradas agua no es de afuera no lluvia fuga en cocina

Las Reglas si - entonces


Representar el conocimiento mediante reglas es una forma muy comn y fcil de manejar para las personas, tanto como para usuarios como para programadores. Si se codifica el anterior conjunto de reglas, stas seran similares a lo siguiente:

si pasillo hmedo y cocina seca entonces fuga en bao. si pasillo hmedo y bao seco entonces problema en cocina. si ventanas cerradas o no lluvia entonces agua no es de afuera. si problema en cocina y agua no es de afuera entonces fuga en cocina.

El interprete de reglas:
Se sabe que el centro de toda la inteligencia artificial gira alrededor de la bsqueda, pero existen dos tipos de estrategias para realizar la bsqueda en reglas:
Encadenamiento hacia adelante Bsqueda en reglas Encadenamiento hacia atrs

El interprete de reglas
Sin embargo, ningn lenguaje de programacin maneja reglas de la manera como se mostr anteriormente:

si Condicin entonces predicado

Es por ello que es necesario desarrollar un programa que las interprete y las procese de manera lgica. Para ello, se podra seleccionar un lenguaje o un Shell que realice dicha tarea. Para este ejemplo, se usar Prolog Para este ejemplo nos limitaremos a establecer un mecanismo de encadenamiento hacia atrs, sin incertidumbre.

El programa Prolog para encadenamiento hacia atrs bsico:


/* Intrprete de reglas de tipo Si Condicin entonces Accin. Muy sencillo. Basado en encadenamiento hacia atrs. Basado en el ejemplo del Captulo 12 del libro de Ivan Bratko, Prolog Programming for Artificial Intelligence, 3a Edicin, 2001, Ed. Pearson Addison WesleyEspaolizado por Julio R. Baeza Pereyra, 2005 */

/* DEFINICIN DE LOS OPERADORES */ :- op( 800, fx, si). % El operador si :- op( 700, xfx, entonces). % entonces :- op( 300, xfy, o). % o, disyuncin :- op( 200, xfy, y). % y, conjuncin :- dynamic hecho/1. % predicado hecho, % con aridad 1, % dinmico

Definicin de la mquina inferencial

verdadero( P) hecho( P).

:-

% Un predicado es verdadero si % existe en le hecho en la base de % hechos

verdadero( P) :si Condicion entonces P, % una regla es relevante y tiene verdadero( Condicion). % una condicin verdadera verdadero( P1 y P2) verdadero( P1), verdadero( P2). verdadero( P1 o P2) verdadero( P1) ; verdadero( P2). :% P1 y P2 es verdadero si % se prueban que los predicados P1 % y P2 son verdaderos % % % % P1 o P2 es verdadero si se prueban que el predicado P1 O el predicado P2 son verdaderos

:-

Conjunto de reglas
% BASE DE HECHOS: hecho(pasillo_humedo). hecho(bano_seco). hecho(ventanas_cerradas). % BASE DE REGLAS: si pasillo_humedo y cocina_seca entonces fuga_en_bano. si pasillo_humedo y bano_seco entonces problema_en_cocina. si ventanas_cerradas o no_lluvia entonces agua_no_es_de_afuera. si problema_en_cocina y agua_no_es_de_afuera entonces fuga_en_cocina.