Você está na página 1de 4

Estudo introdutório sobre Web Semântica e suas 

Tecnologias
Emerson Henrique Soares Silva
ASPER ­ Associação Paraibana de Ensino Renovado
João Pessoa, Brasil
emerson.hss@gmail.com

RESUMO em coperação. Esses autores construíram essa definição baseada


nas diferenças com o estágio mais conhecido da web, “Web
Neste artigo, apresentamos a web em uma forma evoluída, onde o Sintática”, onde os computadores são ferramentas de apresentação
conteúdo possa ser interpretado tanto por homens como por da informção, deixando a interpretação com contas das pessoas.
computadores, a Web Semântica. A Web Semântica é hoje
equipada com linguagens e ferramentas regidas por padrões que O objetivo da WS (Web Semântica) é enriquecer a informação
garantem a extensibilidade, portabilidade e interoperabilidade de disponível com semântica afim de se obter acesso inteligente a
documentos que contém as informações da web. Essa evolução informação heterogênea e distribuída, permitindo que produtos de
nas linguagens permite que os documentos tenham suporte a software (agentes de software inteligentes) possam fazer a
metadados que podem definir vocabulários e significados sobre as intermediação entre as necessidades do usuário e as fontes de
informações, e os computadores ganharam o poder de interpretar informação disponíveis [Breitman 2005]. Dessa forma os
essas informações e inferir sobre elas de forma discreta e formal, resultados obtidos através de buscas nas informações com
interagindo de mais precisamente e eficazmente com o usuário semântica poderão ser bastante superiores em relevância ao
humano. contexto do que as buscas por palavras-chaves, já que essas
buscas serão realizadas por softwares capazer de fazer deduções
através de motores de inferência, que podem, apartir da semântica
Palavras-chaves das informações, inferir respostas, situações ou novas
Web semântica, ontologias, ferramentas, OWL, modor de informações.
inferência.
Para fazer acontecer a WS, são necessárias a união de várias
tecnologias como as apresentadas na Figura 1. Sendo a maior
1. INTRUDOÇÃO parte da informação contida na web em forma de linguagem
A web é um grande repositório de informações que possui natural, para fazer com essa linguagem seja mais compreensível
ferramentas, nas quais possibilitam o usuário realizar buscas a por agentes de software é necessário a combinação dessas
partir de palavras-chaves. Essas ferramentas são praticmente informações com metadados, que podem ser compreendidos tanto
indispensáveis no cotidiano humano, mas o resultado dessas pessoas como por agentes de softwares. Souza e Alvarenga (2004)
buscas não são tão relevantes, já que não há semantica nos explicam que “Meta” é um prefixo de auto referência, de forma
documentos, o que permite a existêmcia de problems comuns de que “metadados” quer dizer “dados sobre dados”. Esses autores
polissemia e sinonímia, além de que não consideram as citados ainda afirmam:“Os metadados em documentos Web têm a
informações em seus significados. função de especificar características dos dados que descrevem, a
Esse artigo tem como objetivo apresentar um estudo teórico- forma com que serão utilizados, exibidos, ou mesmo seu
bibliográfico sobre o que envolve esse novo conceito da web, o significado em um contexto.”[Souza e Alvarenga 2004]
qual [Berners-Lee et al. 2001] definem como uma evolução Voltando a Figura 1, podemos perceber na base da arquitetura a
natural da web vigente, a “Web Semântica”, que trás significado URI , que é acronomo para Identificador Uniforme de Recursos
ao conteúdo da web, facilitando a interação entre computadores e (Uniform Resource Identifier em inglês) e representa uma
pessoas. linguagem padrão para troca de documentos na web. Sobre esta
A proposta da web semântica veio através dos autores citados base estão os XML e RDF, que são tecnologias e ou padrões de
acima com a intenção de tornar possível a interpretação semântica documentos criados pelo W3C para troca de informações na web.
(por significados) do conteúdo da web para máquinas (através de O RDF, por sua vez, herda estrutura e tecnologias que envolvem o
agentes de softwares inteligentes), visto que o conteúdo da web XML, como namespaces e xmlschemas, na verdade é um padrão
não passava de informações sem significado para os de metadados para ser embutido na codificação XML., e possui
computadores, que por muitas vezes, retornava as consultas dos também um RDFS ( RDF Schema) que é a exemplificação da sua
usuários com resultados ambíguos e pouco precisos [Forte, Souza implementação, e é incluída na sua especificação padrão. Sobre
e Prado 2006]. essa estrutura é onde se encontra a tecnologia mais impotante da
WS, a Ontologia. A ontologia é uma específicação conceitual de
Nas próximas seções apresentaremos os conceitos e ferramentas um domínio do conhecimento, o padrão utilizado atualmente para
que envolvem a web semântica. fazer essa especificação é a OWL (Web Ontology Language),
sobre a OWL trataremos com mais detalhes na seção 3.1. Sobre
essa estrutura conceitual que é a ontologia, existe uma lógica que
2. WEB SEMÂNTICA é programada para trabalhar com a realidade comprovada do
Para [Berners-Lee et al. 2001] a web semântica é uma extensão da domínio especificado. Sobre toda essa arquiterura existe uma
web atual, na qual é dado a infomação um significado bem interface de confiança que permite acesso assinado dgitalmente e/
defindo, permitindo com que computadores e pessoas trabalhem
ou cruptigrafado por aplicações que fazem a interface com o Para fazer uso de ontologias na web, o W3C (World Wide Web
usuário final. Consortium) padronizou algumas linguagens, das quais a
evolução atual e recomendada por este consórcio é a OWL (Web
Ontology Language), a qual trataremos na seção seguinte.

3.1 OWL (Web Ontology Language)


A OWL é a Web Ontology Language, como dito anteriormente,
ela tem em sua base XML e RDF com seus respectivos schemas.
Essa linguagem foi desenvolvida e padronizada pelo W3C pelo
fato de que as ferramentas existentes para manipulação de
ontologias eram criadas e utilizadas por usuário e comunidades
específicas e muitas vezes não eram compatíveis com a World
Wide Web e a Web Semântica. A OWL utiliza as URIs para
nomeação de quadros e entidades da Web, como també utiliza o
RDF para descrições desses quadros e entidades. Essa união
fornece as ontologias capacidades adicionais como distribução
entre sitemas, escalabilidade necessária na web,
internacionalizaçã, compatibilidade com as normas de
acessibilidade na web, transparência e extensibilidade.
Como OWL é utilizada para modelar Ontologias, é possível
descrever classe e suas propriedades, os relacionamentos entre
classes e cardinalidade desses relacionamentos, igualdade,
características e tipagem mais ricas das propriedades, além de
Figura 1: Arquitetura da Web Semântica [W3C numeração de classes. O RDF Shema acrescenta a OWL o
Semantic Web Activity 2009] vocabulário para essas descrições mais detelhadas.
A OWL possui três sublinguagens bastante expressivas, são as
Nas próximas seções trataremos sobre algumas tecnologias OWL Lite, OWL DL, e a OWL Full. A mais comum dessas
utilizadas na WS, como ontologias, agentes e algumas ferramentas sublinguagens é a OWL DL, já que a OWL Lite implementa
de forma mais detalhada. apenas algumas caraterísticas da OWL, e a OWL Full implementa
algumas características a mais que são pouco utilizadas.
3. ONTOLOGIAS A Figura 2 apresenta um exemplo de código simples da OWL,
simples mas permite que se perceba a colocação de classes e seus
Ontologia é a principal camada da Web Semântica, por ser uma
relacionamentos. A tag “<owl:Class rdf:ID='Doenca'/>”
base de conhecimento sob um modelo conceitual de determinado
representa a definição da classe Doenca. Podemos notar também a
domínio do conhecimento. De acordo com Gruber (1993) uma
presença da tag “<owl:ObjectProperty rdf:ID='tem'>”, essa tag
ontologia é uma especificação formal e explícita de uma
define a existencia de um relacionamento entre o domínio Doenca
conceitualização compartilhada que existem entre agentes ou
e a classe Tratamento. Em um código mais completo certamente
comunidades de agentes. Souza e Alvarenga (2004) apresentam
notaríamos a presentça de tags que definem as propriedades de
ontologia como disciplina filosófica que estuda as teorias sobre a
dados de uma classe, bem como seríam notadas também restrições
natureza da existência, de como as “coisas” existem. Existe,
que são possíveis definir, por exemplo as cardinalidades mínimas
também, uma relação de ontologias com a epistemologia1 que
e máximas, entre outras coisas que a OWL permite fazer.
trata do conhecimento e saber.
Normalmente, uma ontologia é denotada em uma hierarquia de
conceitos (ou taxonomias) [Freitas et al. 2008]. Isso significa que
existem conceitos de generalização e especialização que se
relacionam caracterizando heranças e que existem restrições de
cardinalidade que definem o real relacionamento entre esses
conceitos.
A utilidade das ontologias variam desde de o apoio a processos de
desenvolvimento de software até apoio em sistemas de
informações, já que o objetivo dessas ontologias, geralmente, é
restringir um determinado domínio de aplicação ou de
conhecimento. Na web o objetivo dos usuários é recuperar,
classificar e extraír informações, e agentes de software utilizam as
ontologias como base de conhecimento portável para recuperar as
informações e motores de inferência para classificar e extraír o
que realmente se deseja saber.
1
Epistemologia ou teoria do conhecimento (do grego ἐπιστήμη
[episteme], ciência, conhecimento; λόγος logos], discurso) é um ramo
da Filosofia que trata dos problemas filosóficos relacionados à crença e
ao conhecimento.
3.2.3 SPARQL
A SPARQL é uma linguagem de consulta para documentos RDF.
Uma linguagem semelhante a SQL, porém como o foco a beses de
dados RDF. A SPARQL permite tratamentode ordenação das
consultas, a criação de variáveis de consultas, termos e álias, entre
outras várias características em comum com a SQL.
A SPARQL é usada para consultar fontes de dados que podem ser
nativamente RDF ou podem ser vistas com RDF através de
middlewares.
3.2.4 Pellet
Pellet é um raciocinador (máquina ou motor de inferência) OWL
DL, escrito em Java e possui código fonte aberto sobre licensas
bastante liberais. Esse motor possuí uma performance muito boa,
middleware extensivo e características únicas.
Pellet permite a realização de serviços em ontologias como:
controle de consistência, que garante que uma ontologia não
contenha qualquer fato contraditóio; verifica se a classe pode ter
instâncias, garantindo a coerência e consistência da ontologia;
classificação, que calcula relacionamentos entre classes sobre
hierarquias; realização, que considera as classe mais específicas
pertencentes a um indivíduo.

4. CONCLUSÃO
A WS trás significado e poder a softwares de “compreender” e
inferir sobre as informações encontradas na web. Mas para
garantir esse poder essa evolução natural da web sintática, onde os
softwares apenas apresentava as informações e o poder de
compreenção e inferência fica por conta apenas dos homens, é
necessário definir documentos com tecnologias que permitem
descrever, de forma mais discreta para computadores, o conteúdo
da web impondo significados e vocabulários. Para inserir
Figura 2: Exemplo de Código da Linguagem OWL
semântica no conteúdo da web de forma portável, extensível e
interoperável foram criados alguns padrões em forma de
linguagens. E, para manter o conteúdo semântico coerente são
usadas ontologias na modelagem de desenvolvimento do conceito
dessa semântica. A OWL permite descrever, através do RSF e
3.2 Ferramentas RDF Schema, um vocabulário consistente de umdeterminado
Existem na comunidade algumas ferramentas que auxiliam na domínio do conhecimento, permite trasnportar de forma portável e
criação e manipulação de ontologias. Apresentarei algumas como definir tipos de dados interoperáveis através do XML e do XML
o Protégé, o framework JENA, a SPARQL e o motor de inferência Schema, e fornece a modelagem ontológica do domínio
Pellet. especificado, foi criada e definida como padrão para a construção
de ontologias na WS pelo W3C. Para que computadores
3.2.1 Protégé interpretem o conteúdo da WS são utilizados raciocinadores ou
motores de inferência, que mais do que inferir também
O Protégé [Protégé] é editor de ontologias e framework de base proporcionam cálculos sobre as ontologias, verificações de
de conhecimento. É um projeto gratuito e de código fonte aberto consitência e validações.
baseado na linguagem Java. Foi desenvolvido por pesquisadores
do Stanford Center for Biomedical Informatics Research da Essa evolução permite a organização e compreenção do conteúdo
Escola de Medicina da Universidade de Stanford. da web em contextos, garantindo maior precisão na busca por
informações, evitando polissêmias.
3.2.2 Jena
O Jena (Java Semantic Web Framework) [Jena] é um framework
5. REFÊNCIAS
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O.; The Semantic
Java para desenvolvimento de aplicações na WS. Esse framework
Web. Scientific American, mai., 2001.
inclui uma API RDF e OWL, leitura e gravação de arquivos RDF
em RDF/XML, persistencia no armazenamento e in-memory, e o BREITMAN, K.; Web Semântica: a Internet do futuro. Ro de
motor de consultas SPARQL. O Jena fornece uma interface de Janeiro, LTC, 2005.
acesso em Java à estruturas semânticas (ontologias). O Jena não
fornece nenhum poder de inferência, para pbter esse poder é FORTE, M.; SOUZA, W. L. de; PRADO, A. F. do; Utilizando
necessário fazer uso de uma máquina ou motor de inferência, um Ontologias e Serviços Web na Computação Ubíqua. In: XX
exemplo é o motor de inferẽncia Pellet [Pellet] que será Simpósio Brasileiro de Engenharia de Software. 2006.
referenciado na seção 3.2.4.
FREITAS, F.; CABRAL, L.; LIMA, R.; ESPINASSE, B.;
PALMEIRA, E.; FOURNIER, S.; BITTENCOURT, G.; Do
MASTER-Web ao AGATHE: a evolução de uma arquitetura de
manipulação de informações para a web usando ontologias.
RECIIS – Revista Eletrônica de Comunicação, Informação e
inovação em Saúde. Rio de Janeiro, v.2, n.1, p.74-86,jan.-jun.,
2008.
GRUBER, T. R.; Toward principles for the design of ontologies
used for knowledge sharing. Intenational Jounal of Human an
Computer Studies, v. 43, p.907-928.
Jena. Disponível em: <http://jena.sourceforge.net/>. Acesso em:
2009.
OWL. Disponível em: <http://www.w3.org/2004/OWL/>. Acesso
em: 2009.
Pellet. Disponível em: <http://clarkparsia.com/pellet/>. Acesso
em: 2009.
Protégé. Disponível em: <http://protege.stanford.edu/>. Acesso
em: 2009.
SOUZA, R. R.; ALVARENGA, L.; A Web Semântica e suas
contribuições para a ciência da informação. Revista Ciência da
Informação. Brasília, v. 33, n. 1, p. 132-141, jan.-abr., 2004.
SPARQL. Disponível em: <http://www.w3.org/TR/rdf-sparql-
query/>. Acesso em: 2009.

Você também pode gostar