Você está na página 1de 7

IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO.

8, DECEMBER 2014 1553

Knowledge Engineering: Survey of


Methodologies, Techniques and Tools
D. C. Nazário, M. A. R. Dantas and J. L. Todesco

Abstract— This paper presents a broad overview of Knowledge Inteligentes, Redes Neurais Artificiais, Algoritmos Genéticos,
Engineering (KE). This is a research area that aims to develop Inteligência Coletiva, Descoberta de conhecimento em bases
methodologies, techniques and tools to support the construction of de dados e textos (KDD e KDT), Extração de Informação,
knowledge-based systems, supporting management and Sumarização de Textos, Taxonomias e Ontologias.
dissemination of knowledge. The objective of this paper is to bring
together, in a single document, important definitions and concepts Este artigo apresenta o termo Engenharia do Conhecimento,
of KE, presenting its history, main methodologies, tools and sua definição, o histórico da EC, traz um levantamento sobre
techniques found in the literature. Knowledge systems are as principais metodologias, técnicas e ferramentas de EC para
increasingly needed, due to the constant growth of data and web, finalizando com algumas considerações sobre o conteúdo
information. The integration and interoperability between these abordado.
systems are challenges in this area, where KE can contribute
through its available mechanisms.
II. HISTÓRICO DA ENGENHARIA DO CONHECIMENTO
Keywords— knowledge engineering, survey, methodologies, O termo Engenharia do Conhecimento nasceu na área da
techniques, knowledge management. Inteligência Artificial (IA) como uma subárea dedicada à
concepção, desenvolvimento e implantação de sistemas
I. INTRODUÇÃO especialistas. Inicialmente, na chamada Engenharia do

O CONHECIMENTO vem se tornando um fator


estratégico nas organizações. A competitividade no
mundo dos negócios tem forçado as organizações a buscarem
Conhecimento Clássica, os pesquisadores buscaram
“transferir” ou “extrair” o conhecimento do especialista para
uma base de conhecimento [3] [4].
novos modelos de gestão, para melhor atender às suas A seguir são apresentadas duas definições para EC:
necessidades. A melhoria contínua tornou-se fundamental na 1. O processo de construir um sistema especialista é
estratégia de negócios das organizações, devido a grande chamado Engenharia do Conhecimento. O engenheiro do
concorrência do mercado. Desta forma, o conhecimento, conhecimento “extrai” do especialista humano seus
tornou-se um elemento chave desse processo organizacional procedimentos, estratégias e regras na resolução de problemas
[1]. e constrói este conhecimento em um sistema especialista [5].
Essa intensificação do conhecimento como elemento 2. A área de pesquisa acadêmica para desenvolvimento de
fundamental e estratégico no processo organizacional fez com modelos, métodos e tecnologias básicas para representar e
que as atividades de gerar, codificar e gerir conhecimento processar conhecimento e para construir sistemas inteligentes
tornassem-se tarefas essenciais às organizações. Para atender baseados em conhecimento é chamada Engenharia do
essas demandas, novas disciplinas têm emergido, combinando Conhecimento. Ela é parte de IA e é mais direcionada a
elementos de mais de uma área do conhecimento, como a aplicações [6].
Engenharia do Conhecimento [2]. A EC Clássica é composta pelas etapas: Aquisição de
A Engenharia do Conhecimento (EC) tem o objetivo de conhecimento (Extração do conhecimento de suas diversas
fornecer metodologias, técnicas e ferramentas para a fontes), Representação de conhecimento (Modelagem do
construção de Sistemas Baseados em Conhecimento (SBC) de domínio), Validação do conhecimento (Verificação de
forma sistêmica e controlada [3]. A EC consiste na criação de consistência), Explicação e justificativa (Recuperação e
diferentes aspectos dos modelos do conhecimento humano [4]. apresentação do raciocínio ao usuário) [7].
Algumas metodologias de EC são: CommonKADs, A área da IA que buscava o desenvolvimento de sistemas
SPEDE, MOKA, Suite PCPACK4, XP.K, RapidOWL, MIKE, que pudessem pensar e resolver problemas de forma
VITAL, entre outras. Algumas destas metodologias serão inteligente como os seres humanos, é conhecida como EC. Um
comentadas neste artigo. breve histórico da EC é apresentado a seguir [4] e
Alguns exemplos de técnicas utilizadas na EC são: Sistemas representado na Fig. 1:
Especialistas, Raciocínio Baseado em Casos, Agentes • As primeiras tentativas foram com um Resolvedor
Geral de Problemas em 1965, que resultou na
D. C. Nazário, Universidade Federal de Santa Catarina (UFSC), concepção de métodos genéricos para resolução de
Florianópolis,SC, Brasil; Universidade do Estado de Santa Catarina
(UDESC), Joinville, SC, Brasil, debora.nazario@gmail.com
problemas, mas perdeu especificidade e aplicabilidade;
M. A. R. Dantas, Universidade Federal de Santa Catarina (UFSC), • A 1ª geração de Sistemas Baseados em Conhecimento
Florianópolis,SC, Brasil, mario@inf.ufsc.br em 1975 era fundamentada em shells e em linguagens
J. L. Todesco, Universidade Federal de Santa Catarina (UFSC),
Florianópolis,SC, Brasil, tite@egc.ufsc.br
de representação de conhecimento simbólico e
dedutivo, que culminou em problemas de escala,
1554 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 8, DECEMBER 2014

dificuldade em modelagem e aplicação em problemas O processo de desenvolvimento de um SBC na EC


complexos; Contemporânea é composto pelas etapas: Identificação do
• Em 1985 surgem os métodos estruturados – KADS - conhecimento, Aquisição e organização do conhecimento;
pela necessidade de metodologias e técnicas mais Formalização e representação do conhecimento;
formais para auxiliar o desenvolvimento de SBC, Implementação, Avaliação e manutenção de sistemas de
retomou a ideia da generalidade, separando modelagem conhecimento [7].
do domínio da tarefa;
• Em 1995 têm-se metodologias mais maduras, como III. METODOLOGIAS DE EC
CommonKADS. A EC auxilia o desenvolvimento de SBC através de
metodologias e técnicas formais.
A pirâmide metodológica definida por [4], contém os
blocos componentes de uma metodologia, que são: Visão de
mundo, Teorias, Métodos, Ferramentas e Uso, conforme
apresentado na Fig. 2.

Figura 1: Histórico da Engenharia do Conhecimento.


Fonte: Baseado em [4]

No desenvolvimento dos chamados SBC, o conhecimento


era extraído dos especialistas através de entrevistas (ou outras
fontes) e codificado através de regras heurísticas e rápida
prototipação. Isto gerava dificuldade no desenvolvimento de
sistemas grandes (mais complexos), a manutenção se tornava
difícil e custosa. Percebia-se a necessidade de uma abordagem
estruturada para análise, projeto e gestão de sistemas de
conhecimento, que atendesse aos sistemas mais complexos e Figura 2: Pirâmide Metodológica.
dependentes do contexto [8]. Fonte: Adaptado de [4]
Surge então a Nova Engenharia do Conhecimento que
através das lições aprendidas com a evolução da EC, muda o Com relação aos blocos da pirâmide [4]:
paradigma de transferência (conhecimento do especialista • A visão de mundo ou “slogans” é formulada por um
extraído e colocado no sistema) para o paradigma de número de princípios que forma a base da abordagem.
modelagem (conhecimento existente nas pessoas, arquivos e Os princípios são baseados em lições aprendidas sobre
sistemas deve ser extraído e modelado em um formato o desenvolvimento de sistemas do conhecimento;
computacional) [7]. • Conceitos teóricos são os princípios científicos que
O objetivo de construir uma nova disciplina de EC é similar darão base aos modelos de solução para os problemas
aquele da Engenharia de Software: tornar o processo de propostos;
construir SBC de arte para uma disciplina de engenharia. Isto • Métodos usados na metodologia são os procedimentos
requer análise de construir e manter o processo e o que levarão as soluções propostas pela metodologia;
desenvolvimento de métodos e linguagens apropriadas e de • Ferramentas para aplicar os métodos são os
ferramentas especializadas para desenvolver SBC [3]. instrumentos disponíveis para serem usados para
É um consenso que o processo de construção de um SBC
aplicar a metodologia;
pode ser visto como uma atividade de modelagem. Construir
• As experiências por meio do uso da metodologia é um
um SBC significa construir um modelo computacional com o
dos principais momentos de feedback, que pode fluir
objetivo de realizar capacidades de resolução de problemas
ao longo da pirâmide.
comparáveis a um especialista humano no domínio. Não se
intenciona criar um modelo cognitivo adequado, isto é, Um estudo sobre algumas das principais metodologias da
simular processos cognitivos de um especialista em geral, mas EC encontradas na literatura é realizado em [9], gerando um
criar um modelo que oferece resultados similares [3]. quadro comparativo entre as metodologias, com o propósito de
Para a construção de um SBC o engenheiro do informar como elas estão constituídas em relação à pirâmide
conhecimento tem as seguintes responsabilidades: Entender o metodológica da Fig. 2.
contexto organizacional e o ambiente em que o sistema de As metodologias estudadas foram:
conhecimento será inserido (Por quê?); Descrever • MIKE (Model-based and Knowledge Engineering);
conceitualmente o conhecimento que é aplicado na tarefa que • MOKA (Methodology and tools Oriented to
será modelada pelo sistema de conhecimento (O quê?); Knowledge-Based Engineering Applications);
Descrever os aspectos tecnológicos dos elementos que deverão • CommonKADS;
compor a implementação computacional do sistema de • XP.K (Extreme Programming. Knowledge);
conhecimento (Como?) [4]. • RapidOWL;
CABRAL NAZARIO et al.: KNOWLEDGE ENGINEERING 1555

A seguir é apresentada, para cada uma destas metodologias, Refactoring, testes em ambiente real, checagem de
uma síntese em relação às camadas da pirâmide metodológica, restrição, planejamento, semanas de 38,5 horas;
baseado no estudo de [9]. • Ferramentas: KBeans e KBeans Shell;
MIKE (1993): Esta metodologia tem o princípio de integrar • Uso: Aplicação para a área médica;
as características dos modelos de ciclo de vida de RapidOWL (2006): É uma metodologia ágil que possibilita
desenvolvimento de software e prototipagem, além de técnicas o desenvolvimento colaborativo de bases de conhecimento na
de especificação em linguagem formal e semiformal [10]. web semântica [13].
• Visão de Mundo: Engenharia de Software, • Visão de Mundo: Engenharia de Software e Web
Prototipagem; Semântica;
• Teorias: Reuniões e entrevistas estruturadas com o • Teorias: Colaboração Web;
especialista de domínio; • Métodos: Design de ontologias conjuntas, integração
• Métodos: Fluxo de informação e interdependência da informação, evolução de ontologias, construção
entre os dados; compartilhada de visões;
• Ferramentas: KARL; • Ferramentas: POWL, OntoWIKI, ProtégéOWL;
• Uso: Meio acadêmico, estudos de caso na Indústria e • Uso: Blogs, Jabber, Skype networks, Linkedln;
Help desk; Ainda com base no estudo realizado em [9] e no quadro
MOKA (1998): É um framework para estruturar e comparativo entre as metodologias, quando se observa a visão
representar conhecimento de engenharia, focado para produtos de mundo das metodologias, nas mais antigas como MIKE
mecânicos complexos para indústria aeronáutica e automotiva, (1993), MOKA (1998) e CommonKADS (2000), há a
principalmente projetos rotineiros [11]. preferência pelo uso da UML (Unified Modeling Language)
• Visão de Mundo: Engenharia de Software e juntamente com a Orientação a Objetos para modelar o
metamodelo; conhecimento, além da preocupação com o processo de
• Teorias: Integração do conhecimento entre produto e explicitação. Já metodologias mais atuais como XP.K (2002) e
processo; RapidOWL (2006) utilizam ontologias para modelar o
• Métodos: KBE (Knowledge-Based Engineering) em conhecimento e tem foco também no processo de construção
dois modelos: informal e formal; do sistema, além da modelagem.
• Ferramentas: Suit PCPACK 5; No bloco relacionado à teoria, todas as metodologias
• Uso: Na indústria aeronáutica e automobilística; apresentadas tem a preocupação em ter o especialista do
CommonKADS (2000): É uma metodologia de Gestão do domínio presente, já que a elicitação do conhecimento é uma
Conhecimento proposta por Schreiber e colegas, baseada em atividade crítica na construção de um SBC. Mais informações
modelos, com apoio de técnicas e ferramentas de engenharia sobre técnicas de elicitação podem ser encontradas em [8].
[4]. Com relação aos métodos, todas as metodologias estudadas
• Visão de Mundo: Modelagem e Engenharia de têm as suas particularidades. Se as diferenças não forem
Software; consideradas pode-se perceber que o cerne encontra-se na
• Teorias: Planilhas com anotações gráficas e textuais e formalização do conhecimento.
documentos estruturados; Em relação às ferramentas, cada metodologia usa aquelas
• Métodos: Modelo de ciclo de vida, modelos de específicas para a área do conhecimento a que se propõe [9].
processo, diretrizes, técnicas de elicitação; O uso das metodologias inicialmente era restrito ao meio
• Ferramentas: Ferramentas CASE, ambiente de acadêmico, com MOKA as metodologias saíram da academia
implementação; para chegar ao mercado, sendo amplamente empregada na
• Uso: Programa do governo Holandês para aluguéis de indústria aeronáutica e automobilística europeia. Já o
residências; CommonKADS, além de servir como referência para o
XP.K (2002): Metodologia que utiliza princípios para desenvolvimento de projetos de pesquisa no programa
atender aos processos de modelagem do conhecimento, Europeu de Tecnologia da Informação e em projetos do
prezando a integração da equipe do projeto e dos especialistas governo, é a principal metodologia utilizada em organizações
do conhecimento [12]. empresarias para o desenvolvimento de sistemas comerciais e
financeiros. As metodologias XP.K e RapidOWL, que
• Visão de Mundo: Engenharia de Software, Engenharia
derivam do XP, são mais recentes e menos difundidas quando
do Conhecimento, ontologias da EC;
comparadas ao MOKA e ao CommonKADS [9].
• Teorias: Feedback, comunicação intensiva e
desenvolvimento evolucionário;
IV. TÉCNICAS DE EC
• Métodos: Especialista do conhecimento presente,
design de ontologias coletivas, modelagem padrão, Como uma subárea da Inteligência Artificial dedicada ao
símbolos fundamentais compartilhados, modelo do desenvolvimento de SBC, a EC utiliza algumas técnicas da IA.
conhecimento simples, Engenharia Round-Trip, A EC se refere a todos os aspectos técnicos, científicos e
sociais envolvidos na construção, manutenção e uso de SBC.
1556 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 8, DECEMBER 2014

Um SBC é modelado segundo técnicas reutilizáveis de cupins, abelhas, entre outros) para resolver problemas de
representação e extração de conhecimento [14]. Para este otimização, podendo ser utilizado como técnica de mineração
autor, tais técnicas são denominadas Agentes Computacionais de dados ou descoberta de conhecimento [20].
da EC podendo-se citar: Sistemas Especialistas (SE), Knowledge Discovery in Databases (KDD), descoberta de
Raciocínio Baseado em Casos (RBC), Agentes Inteligentes, conhecimento em bases de dados (ou mineração de dados), se
Redes Neurais Artificiais, Algoritmos Genéticos, Sistemas preocupa com o desenvolvimento de algoritmos e técnicas
Imunológicos Artificiais, Inteligência Coletiva, Descoberta de para extrair conhecimento de bases de dados grandes e
Conhecimento em Base de Dados (KDD) e Descoberta de complexas. Tanto o Aprendizado de Máquina como o KDD
Conhecimento em Texto (KDT). compartilham o mesmo objetivo de encontrar nos dados
A seguir são apresentadas breves definições para estas conhecimentos novos e úteis, e assim eles têm a maioria das
técnicas. técnicas e processos em comum. A diferença fundamental
Sistema Especialista (SE) é uma ferramenta que tem a entre Aprendizado de Máquina e KDD está no volume de
capacidade de entender o conhecimento sobre um problema dados a ser processado [21].
específico e usar este conhecimento inteligentemente para Em [22] o problema de descoberta de conhecimento é
sugerir alternativas de ação. SE é uma técnica da IA abordado a partir de uma coleção de texto não estruturado, e
desenvolvida para resolver problemas em um determinado descrevem o sistema Knowledge Discovery from Text (KDT),
domínio cujo conhecimento utilizado é obtido de pessoas que que prevê para texto os tipos de operações KDD fornecida
são especialistas naquele domínio [7]. anteriormente para bancos de dados estruturados.
Raciocínio Baseado em Casos (RBC) é uma abordagem Com as técnicas de KDT as organizações podem extrair
para a resolução de um problema novo, lembrando-se de uma conhecimento de fontes semiestruturadas e não estruturadas,
situação anterior similar e por reutilização de informações e como: relatórios técnicos, manuais, currículos, documentos em
conhecimento desta situação. Este conceito assume que geral (formatos diversos), correio eletrônico, páginas da
problemas semelhantes têm soluções similares, deste modo internet, comunicação instantânea, redes sociais, entre outras
RBC é um método adequado para um domínio prático focado [8].
em casos reais em vez de regras ou conhecimento para Técnicas da EC e de aquisição de conhecimento também
resolver problemas [15]. são abordadas em [23] e [8].
Agente Inteligente é um sistema computacional situado em Uma representação das técnicas de EC pode ser visualizada
um ambiente, capaz de autonomamente agir sobre este na Fig. 3, proposto por [24], onde estão classificadas de
ambiente, de acordo com sua percepção, comunicação, acordo com a fase em que serão utilizadas, ou seja, Aquisição
representação, motivação, deliberação, raciocínio e do conhecimento, Integração do conhecimento ou
aprendizagem [16]. Recuperação do conhecimento.
Rede Neural Artificial é um modelo computacional
abstrato do cérebro humano, que imita o comportamento dos
neurônios biológicos. Similar ao cérebro quando acionado em
relação a um evento, uma Rede Neural Artificial recebe
estímulos (sinais de entradas), processa sinais e produz uma
saída [17].
Algoritmos Genéticos são modelos computacionais
baseados na teoria da evolução das espécies [17]. Estes
implementam a seleção de soluções baseadas na aptidão da
solução quanto à resposta de um problema, reprodução de
soluções e a ocorrência ocasional de mutação sobre as
soluções. Com estas metáforas, um Algoritmo Genético
otimiza a busca de uma solução ótima dentre várias soluções
possíveis. São empregados geralmente em problemas de
alocação de recursos [14].
Os Sistemas Imunológicos Artificiais são definidos como
Figura 3: Técnicas de EC.
sistemas adaptativos inspirados pela teoria imunológica, pelas Fonte: [24]
funções imunológicas observáveis e pelos princípios e
modelos, que são aplicados na resolução de problemas [18]. Algumas técnicas de EC podem ser usadas como suporte ao
Exemplos de aplicação destes sistemas são: Reconhecimento processo de aquisição do conhecimento, como: Extração de
de Padrões, Segurança Computacional, Robótica, Otimização, Informação, Sumarização de Textos, Data warehouse e
Controle, Abordagens Conexionistas, Detecção de Falhas e processos de descoberta de conhecimento (KDD e KDT) [24].
Anomalias, Aprendizagem de Máquina [19]. Extração de Informação é um processo de EC que
Inteligência Coletiva é um paradigma da IA baseado na basicamente toma textos como entrada e produz dados em
distribuição e no comportamento coletivo (enxame, colônia, formato fixo e não ambíguos. Esta abordagem pode ser vista
aglomerado, rebanho) de elementos biológicos (formigas, como a atividade de preenchimento de fontes estruturadas de
CABRAL NAZARIO et al.: KNOWLEDGE ENGINEERING 1557

informação a partir de fontes não estruturadas ou textos Com relação à etapa de recuperação do conhecimento, o
escritos em formato livre [25] [26]. suporte da EC pode ser através das técnicas: Recuperação de
Na Sumarização de Textos o problema consiste em Informação, Question Answering, Raciocínio Baseado em
concentrar um texto em uma versão menor preservando seu Casos e Agentes Inteligentes [24].
conteúdo [27], poupando assim o tempo das pessoas que não Um sistema de Recuperação de Informação “interpreta” o
podem ler todos os documentos relacionados a um conteúdo dos itens de informação (documentos) em uma
determinado assunto. A sumarização ou extração consiste no coleção e os classifica de acordo com o grau de relevância em
processo de classificar e apresentar os extratos (sentenças, relação à consulta do usuário. O principal objetivo é recuperar
parágrafos) mais originais e relevantes dentro de um todos os documentos relevantes e ao mesmo tempo recuperar a
documento [24]. menor quantidade de documentos não relevantes [34].
Data warehouse (DW) pode ser definido como uma O objetivo da abordagem Question Answering (QA) é
coleção de dados integrada, variável no tempo e não volátil localizar, extrair e representar uma resposta específica a uma
usadas principalmente nas organizações como suporte à pergunta feita por um usuário usando a linguagem natural
tomada de decisões [28]. O data warehouse pode ser visto [35].
como uma abordagem de integração de informação onde
informações de interesse são extraídas a partir de diferentes V. FERRAMENTAS DE EC PARA WEB
fontes e armazenadas em um repositório centralizado onde são As organizações enfrentam uma sobrecarga de informações
executadas as consultas dos usuários [29]. que ficam espalhadas por inúmeros documentos, mensagens
Na fase de integração do conhecimento a EC pode apoiar de e-mail, bancos de dados em diferentes locais e sistemas.
com algumas formas de modelagem e representação do Com isso, muitas vezes é difícil encontrar dados relevantes e
conhecimento, como: vocabulários controlados, taxonomias, informações precisas, tomando bastante tempo e necessitando
tesauros, metatesauros e ontologias [24]. de acesso a vários sistemas [36].
Um Vocabulário Controlado pode ser entendido como uma Neste sentido, algumas ferramentas apoiam a gestão do
lista fechada de nomes. Os constituintes de um vocabulário conhecimento, como é o caso de um Portal Web. O portal
controlado são geralmente conhecidos como termos, onde um pode ser um ponto de acesso e integração entre as diferentes
termo é um nome específico para um determinado conceito fontes de conhecimento, melhorando a produtividade e
[30]. tornando-se uma vantagem competitiva nas empresas [1].
Uma Taxonomia pode ser vista como uma organização dos O termo portal começou a ser utilizado em 1997, com o
termos de um vocabulário controlado em uma hierarquia. A intuito de ser ponto de entrada ou acesso associado a um
vantagem desta abordagem é que permite que termos motor de busca, com o objetivo de auxiliar os usuários na
relacionados sejam agrupados e categorizados tornando assim localização de conteúdos na web. Nem todo sítio web é um
o processo de busca mais simples [30]. portal, o portal tem características especiais como:
Um Tesauro pode ser definido como uma lista classificada funcionalidades dinâmicas; integração de dados de diversas
de termos, especialmente palavras-chave, em um domínio fontes; serviços e funcionalidades personalizáveis, como
específico. Os tesauros lidam com palavras, as alternativas layout, resultados de pesquisas baseados em históricos ou
para essas palavras, sinônimos e traduções [31]. outros parâmetros pré-definidos [37].
Ontologias são esquemas de metadados, que fornecem um Na literatura encontram-se várias definições para portais
vocabulário controlado dos termos, todos eles explicitamente web, entre elas: um portal web é um ponto de acesso, único e
definidos e com semântica que pode ser processada pelas personalizado, por meio de um navegador web, a informações
máquinas. Desta forma as ontologias ajudam as pessoas e as empresariais importantes localizadas dentro e fora de uma
máquinas a se comunicarem com mais eficácia [32]. organização, disponíveis na internet, intranets e extranets [36].
Ontologia pode ser definida como uma “especificação Seguindo a evolução da web tradicional, tem-se a web 2.0
formal e explícita de uma conceitualização compartilhada” ou também chamada web social. Nesta tendência, os portais
[33], onde: 2.0 têm seu foco em facilidade de acesso ao conteúdo e
• Conceitualização: indica que se trata de um modelo interação entre os usuários. Os princípios fundamentais estão
abstrato que representa algum fenômeno ou objeto do voltados à construção de conteúdo pelo próprio usuário,
mundo real; proporcionando colaboração e interatividade. Outro conceito
• Formal: implica que uma ontologia deve ser relacionado é o da web como plataforma e a relação de muitos
compreendida e processada por máquinas; para muitos, no lugar de um para muitos [38]. Como exemplos
• Explícita: significa que os conceitos utilizados, bem de ferramentas da web 2.0 enquadram-se os blogs, wikis e
como as relações e restrições sobre seu uso, são redes sociais.
objetivamente definidos e claros; Dentre os vários projetos desenvolvidos pelo World Wide
• Compartilhada: no sentido de que uma ontologia reflete Web Consortium (W3C) está o da web semântica, uma
o conhecimento consensual sobre um determinado proposta de levar a Internet ao seu próximo estágio, chamado
assunto por uma comunidade de especialistas no por alguns autores de web 3.0 [39]. Essa nova Internet
domínio. viabilizará a representação e busca de conhecimento pelos
1558 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 8, DECEMBER 2014

computadores, é projetada e construída para ser entendida da elicitação do conhecimento. Já em relação aos métodos, o
também pelas máquinas [40]. foco está na formalização do conhecimento.
O objetivo da web semântica é trazer estrutura para o Cada metodologia utiliza ferramentas específicas. E quanto
conteúdo das páginas web, aumentando o seu significado, ao uso as metodologias mais recentes são menos difundidas
criando um ambiente onde agentes de software possam fluir de em relação às mais antigas como MOKA e CommonKADS.
página a página, cumprindo tarefas para os seus usuários [41]. As técnicas de EC que foram citadas e descritas brevemente
Neste sentido, as ontologias fornecem um entendimento no artigo, são: Sistemas Especialistas, Raciocínio Baseado em
comum e compartilhado de um domínio, que pode ser Casos, Agentes Inteligentes, Redes Neurais Artificiais,
comunicado através de pessoas e sistemas de aplicação, Algoritmos Genéticos, Sistemas Imunológicos Artificiais,
tornando-se fator chave para o desenvolvimento da web Inteligência Coletiva, Descoberta de conhecimento em bases
semântica. A utilização de ontologias permite representar de dados e textos (KDD e KDT), Extração de Informação,
explicitamente a semântica dos dados. Sumarização de Textos, Data warehouse, Vocabulário
Neste contexto da web semântica, tem-se então como uma Controlado, Taxonomia, Tesauro, Ontologia, Recuperação de
evolução natural dos portais tradicionais, os portais Informação e Question Answering.
semânticos. Estes portais fazem uso intensivo de ontologias, Uma classificação interessante destas técnicas é proposta
com objetivo de permitir o entendimento comum entre pessoas por [24], onde estão organizadas com a fase em que serão
e sistemas. O propósito principal é melhorar a integração e utilizadas: Aquisição do conhecimento, Integração do
reuso de recursos [39]. conhecimento e Recuperação do conhecimento.
De acordo com o exposto nesta seção, a Tabela I lista Finalmente são apresentadas algumas ferramentas voltadas
algumas ferramentas presentes na Web Tradicional, Web 2.0 e para web, em suas diversas fases de evolução como: Web
Web Semântica. As ferramentas presentes na Web Semântica, Tradicional ou Web 1.0, Web 2.0 e Web Semântica ou Web
como os Portais Semânticos [39], Wikis Semânticos, entre 3.0. Algumas ferramentas são: Portais Web, Portais Web 2.0,
outros, são consideradas ferramentas de EC voltadas para web. Blogs, Wikis, Redes Sociais, Portais Semânticos e Wikis
Semânticos. A EC está presente na Web Semântica, através da
Web Tradicional Portais Web; utilização da técnica ontologia.
Web 2.0 Portais Web 2.0; Conclui-se que a Engenharia do Conhecimento possui
Blogs, Wikis, Redes Sociais; diversos mecanismos disponíveis para auxiliar o processo de
Web Semântica Portais Semânticos; desenvolvimento de SBC. O diferencial deste artigo é
Wikis Semânticos; possibilitar uma visão geral da EC, desde seu histórico até
TABELA I: Ferramentas para web exemplos de algumas metodologias, técnicas e ferramentas,
disponibilizando ainda algumas referências que podem
VI. CONSIDERAÇÕES complementar futuras pesquisas na área.
Os Sistemas de Conhecimento têm se tornado cada vez
mais necessários, devido ao aumento constante de dados e REFERÊNCIAS
informações. A integração e interoperabilidade entre estes [1] J. L. Todesco, N. Amboni, D. C. Nazário, I. R. F. Müller, and M. I. A. S.
sistemas podem ser citados como desafios nesta área. dos Santos, “Portais corporativos como ferramenta de apoio a gestão do
A Engenharia do Conhecimento tem o objetivo de auxiliar o conhecimento nas empresas,” in XXII ENANGRAD - Teoria Geral da
Administração (TGA), 2011, pp. 1–17.
desenvolvimento de Sistemas Baseados em Conhecimento, [2] PPEGC, “Engenharia do Conhecimento,” 2012. [Online]. Available:
sendo que a Nova EC ou EC contemporânea utiliza o http://www.egc.ufsc.br/index.php/egc/pos-graduacao/areas-de-
paradigma de modelagem do conhecimento existente nas concentracao#ec. [Accessed: 05-Aug-2012].
[3] R. Studer, V. R. Benjamins, and D. Fensel, “Knowledge engineering:
pessoas, arquivos e sistemas para um formato computacional. Principles and methods,” Data & Knowledge Engineering, vol. 25, no.
Diversas são as metodologias, técnicas e ferramentas de EC 1–2, pp. 161–197, Mar. 1998.
disponíveis para alcançar esse objetivo, como apresentado [4] G. T. Schreiber, H. Akkermann, A. Anjewierden, R. de Hoog, N.
Shadbolt, W. van de Velde, and B. Wielinga, Knowledge Engineering
neste artigo. and Management: The CommonKADS Methodology. 2002.
Na seção que trata sobre metodologias foi descrita a [5] D. A. Waterman, A guide to Expert Systems. Addison Wesley, 1986.
pirâmide metodológica proposta por [4] que é bastante [6] N. K. Kasabov, Foundations of Neural Networks, Fuzzy Systems, and
Knowledge Engineering. MIT Press, 1996.
relevante quando se trata de metodologias de EC. Em seguida [7] J. L. Todesco and F. A. O. Gauthier, “Fundamentos de Engenharia do
as metodologias MIKE, MOKA, CommonKADS, XP.K e Conhecimento.” 2010.
RapidOWL foram apresentadas com relação às camadas da [8] D. C. Nazário, M. J. R. Rotta, R. C. dos S. Pacheco, and J. L. Todesco,
pirâmide metodológica. “The acquisition process in knowledge engineering: extraction and
elicitation techniques,” in International Conference on Information
Percebeu-se que em relação à visão de mundo, as Systems and Technology Management, 2012, pp. 499–517.
metodologias mais antigas utilizam UML e/ou orientação a [9] P. R. O. de Sá, “Engenharia do conhecimento aplicada a criação
objetos. Enquanto as mais recentes utilizam ontologias para automatizada de conteúdo interativo para tv digital,” Universidade
Federal de Santa Catarina, 2012.
modelar o conhecimento. [10] J. ANGELE, D. FENSEL, and R. STUDER, “Domain and Task
Com relação à camada teoria existe sempre a preocupação Modeling in MIKE,” 1998.
com a presença do especialista do domínio, dada à importância [11] K. Oldham, S. Kneebone, M. Callot, A. Murton, and R. Brimble,
“MOKA - A Methodology and tools Oriented to Knowledge-based
CABRAL NAZARIO et al.: KNOWLEDGE ENGINEERING 1559

engineering Applications,” in Proceedings of the Conference on in Congresso de Engenharia de Produção da Região Sul, 2012, no.
Integration in Manufacturing, 1998. Alvarenga, pp. 1–11.
[12] H. KNUBLAUCH, “An Agile Development Methodology for [40] T. Berners-Lee, J. Hendler, and O. Lassila, “The Semantic Web: A new
Knowledge-Based Systems Including a Java Framework for Knowledge form of Web content that is meaningful to computers will unleash a
Modeling and Appropriate Tool Support,” Universität Ulm, 2002. revolution of new Possibilities,” Scientific American Magazine, 2001.
[13] S. AUER, “RapidOWl - An Agile Knowledge Engineering [41] A. D. Jardim and L. A. M. Palazzo, “Aplicações da web semântica nas
Methodology,” in Semantic Web Engineering in the Knowledge Society, redes sociais,” in Congresso Nacional de Ambientes Hipermídia para
2009. aprendizagem, 2009.
[14] S. Rautenberg, “Modelo de conhecimento para mapeamento de
instrumentos da gestão do conhecimento e de agentes computacionais da
engenharia do conhecimento baseado em ontologias,” Universidade
Débora Cabral Nazário possui graduação em Ciências
Federal de Santa Catarina, 2009.
da Computação pela Universidade Federal de Santa
[15] A. Aamodt and E. Plaza, “Case-Based Reasoning: Foundational Issues,
Catarina (2001) e mestrado em Ciências da Computação
Methodological Variations, and System Approaches,” AI
pela Universidade Federal de Santa Catarina (2003). É
Communications, vol. 7, no. 1, pp. 39–59, 1994.
professora efetiva da Universidade do Estado de Santa
[16] J. F. Hubner, R. H. Bordini, and R. Vieira, “Introdução ao
Catarina desde 2004, atualmente está em capacitação,
Desenvolvimento de Sistemas Multiagentes com Jason,” in ERI 2004 –
realizando doutorado no programa de Engenharia e
XII Escola Regional de Informática SBC, 2004, pp. 51–89.
Gestão do Conhecimento na Universidade Federal de
[17] T. Munakata, Fundamentals of the New Artificial Intelligence: Neural,
Santa Catarina, sob a orientação do professor Mário Antônio Ribeiro Dantas.
Evolutionary, Fuzzy and More. Springer, 2008.
[18] J. Timmis, “Exploiting the Immune System for Computation,” IEEE
Intelligent Informatics Bulletin, vol. 4, no. 2, pp. 1–2, 2004.
Mário Antônio Ribeiro Dantas é Professor Associado
[19] L. N. Castro, “Engenharia Imunológica: Desenvolvimento e Aplicação
do Departamento de Informática e Estatística (INE) e do
de Ferramentas Computacionais inspiradas em Sistemas Imunológicos
Programa de Pós-Graduação em Ciência da Computação
Artificiais,” Universidade Estadual de Campinas, 2001.
(PGCC), no Centro Tecnológico (CTC), da Universidade
[20] A. Abraham, H. Guo, and H. Liu, “Swarm Intelligence: Foundations,
Federal de Santa Catarina (UFSC). Com doutorado em
Perspectives and Applications,” in Swarm Intelligent Systems, 2006, pp.
Ciência da Computação pela University of Souhtampton
3– 25.
(UK) e estágio pós-doutoral na University of Western Ontario (Canada). Foi
[21] T. B. Ho, S. Kawasaki, and J. Granat, “Knowledge Acquisition by
Professor da Universidade de Brasília (UnB), além de ter trabalhado por mais
Machine Learning and Data Mining,” Studies in Computational
de dez anos na Petrobrás (Departamento de Produção) e no Centro
Intelligence, vol. 59, pp. 69–91, 2007.
Tecnológico do Exército (Ctex), no suporte a ambientes de redes e ao
[22] R. Feldman, I. Dagan, and H. Hirsh, “Mining text using keyword
desenvolvimento de aplicações distribuídas. Na UFSC têm ministrado cursos
distributions,” Journal of Intelligent Information Systems, vol. 10, pp.
no doutorado (Departamento de Engenharia e Gestão do Conhecimento),
281–300, 1998.
mestrado (Ciência da Computação), especialização e graduação. Em adição, o
[23] D. C. Nazário, M. J. R. Rotta, and M. A. R. Dantas, “Utilização de
Prof. Dantas tem atuado como consultor em diferentes projetos com a
técnicas da Engenharia do Conhecimento como apoio aos processos de
indústria nas áreas de redes, sistemas distribuídos e ambientes de alto
Memória Organizacional,” in Congresso de Engenharia de Produção da
desempenho.
Região Sul, 2012, pp. 1–12.
[24] H. A. M. Sasieta, F. D. Beppler, and R. C. dos S. Pacheco, “A Memória
Organizacional no Contexto da Engenharia do Conhecimento,”
José Leomar Todesco possui graduação em Matemática
DataGramaZero - Revista de Informação, vol. 12, no. 3, 2011.
pela Universidade Federal de Santa Catarina (1987),
[25] H. Cunningham and U. Sheffield, “Information Extraction, Automatic,”
graduação em Educação Física pela Universidade do
in Encyclopedia of Language & Linguistics, 2006, pp. 665–677.
Estado de Santa Catarina (1985), mestrado e doutorado
[26] R. Gaizauskas and Y. Wilks, “Information extraction: Beyond document
em Engenharia de Produção também pela UFSC (1991 e
retrieval,” Journal of Documentation, vol. 54, no. 1, pp. 70–105, 1998.
1995, respectivamente). Atualmente é professor
[27] S. Jones, “Automatic summarising: The state of the art,” Information
associado I do departamento de Engenharia do
Processing & Management, vol. 43, no. 6, pp. 1449–1481, 2007.
Conhecimento da Universidade Federal de Santa
[28] W. Inmon, Building the Data Warehouse. John Wiley, 1992.
Catarina, atuando no curso de Sistemas de Informação
[29] J. Widom, “Research problems in data warehousing,” in Proceedings of
na graduação, no Programa de Pós-Graduação em Engenharia e Gestão do
the fourth international conference on Information and knowledge
Conhecimento da UFSC e como pesquisador do Instituto Stela. Tem
management, 1995, pp. 25–30.
experiência na construção de Sistemas de Informação, com ênfase em Data
[30] L. M. Garshol, “Metadata? Thesauri? Taxonomies? Topic Maps!
Warehouse, Inteligência Artificial e Engenharia do Conhecimento, com
Making Sense of it all,” Journal of Information Science, vol. 30, no. 4,
interesse principalmente nos seguintes temas: business intelligence,
pp. 378–391, 2004.
engenharia de ontologias, sistemas de informação, representação de
[31] R. Van Rees, “Clarity in the usage of the terms ontology, taxonomy and
conhecimento, web semântica, linked data e interatividade para TV Digital.
classification,” in Proceedings of the 2003 cib w78 conference, 2003.
[32] S. Bechhofer, “Ontoweb report: Ontology language standardisation
efforts,” 2002.
[33] T. R. Gruber, “A translation approach to portable ontology
specifications,” Knowledge Acquisition, vol. 5, pp. 199–220, 1993.
[34] R. A. Baeza-Yates and B. A. Ribeiro-Neto, Modern Information
Retrieval. ACM Press/Addison-Wesley, 1999.
[35] D. Roussinov and J. Robles-Flores, “Web question answering:
technology and business applications,” in Proceedings of the Tenth
Americas Conference on Information Systems, 2004, pp. 3248–3254.
[36] E. Turban and D. King, Comércio Eletrônico: Estratégia e Gestão. São
Paulo: Prentice Hall, 2004.
[37] D. R. N. Ribeiro, “Um portal para o comércio eletrônico em Portugal,”
Universidade de Trás-os-Montes e Alto Douro, 2007.
[38] T. O’Reilly, “What is Web 2.0: design patterns and business models for
the next generation of software,” Communications & Strategies, vol. 1,
p. 17, 2007.
[39] D. C. Nazário, D. Sell, and F. O. Gauthier, “A utilização de Portais
Semânticos como apoio à Gestão do Conhecimento das Organizações,”

Você também pode gostar