Você está na página 1de 92

Pontifcia Universidade Catlica de So Paulo

PUC-SP

Luciano Gonzaga Leme

Site com Contedo Apropriado Web


Semntica e Mecanismos de Busca

Mestrado em
Tecnologias da Inteligncia e Design Digital

So Paulo

2009

Pontifcia Universidade Catlica de So Paulo


PUC-SP

Luciano Gonzaga Leme

Site com Contedo Apropriado Web


Semntica e Mecanismos de Busca

Mestrado em
Tecnologias da Inteligncia e Design Digital

Dissertao apresentada Banca Examinadora


da Pontifcia Universidade Catlica de So Paulo,
como exigncia parcial para obteno do ttulo de
Mestre em Tecnologias da Inteligncia e Design
Digital - Inteligncia Coletiva e Ambientes Interativos,
sob a orientao do Professor Doutor Demi
Getschko.

So Paulo
2009

Banca Examinadora

________________________________

________________________________

________________________________

Ao meu orientador: Professor Doutor Demi Getschko


pelo apoio e auxlio para a realizao deste trabalho.

Resumo
Leme, Luciano Gonzaga Site com Contedo Apropriado Web
Semntica e Mecanismos de Busca So Paulo, 2009.

Esta dissertao apresenta uma abordagem que tem como objetivo principal
questionar e apresentar possveis caminhos para que o contedo de um web site seja
apropriadamente oferecido em termos de Web Semntica e Mecanismos de Busca.
Para alcanar esse objetivo foram efetuadas pesquisas e utilizada a experincia do
autor. Desse modo foram combinados os conceitos e as tecnologias envolvidas em
relao a metadados, ontologias, servios web semnticos e otimizao de
mecanismos de busca.
Os metadados permitem qualificar informaes apropriadamente, as
ontologias so empregadas para aprimorar a anlise do domnio do problema e para
obter componentes de software com descries semnticas, os quais podem ser
reutilizados numa grande variedade de aplicaes. Os servios web semnticos so
utilizados como componentes de software distribudos pela Internet e podem realizar
tarefas complexas de aplicaes.
Partindo do questionamento do que publicar em um web site, ou melhor,
como deve ser o contedo de um web site - foram expostos conhecimentos e
tecnologias que delineiam a questo: como oferecer contedo apropriado?
Aps a exposio dos conceitos associados e da apresentao de possveis
solues conclumos com questionamentos e indicativos de possveis pesquisas que
muito contribuiro ao desenvolvimento de sites com contedo apropriado com a
Web Semntica e seus possveis efeitos colaterais positivos, propiciando a melhor
utilizao do conhecimento e das informaes disponibilizadas na web.

Palavras-chave: contedo apropriado na web, Web Semntica, Metadados,


Ontologias, Agentes Semnticos, Servios Web Semnticos, SEO.

Abstract
Leme, Luciano Gonzaga Site with Appropriated Content to Semantic
Web and Search Engines Sao Paulo, 2009.

This work introduces an approach which main purpose is to ask and present
possible ways so that the web sites content will be appropriately offered related to
Semantic Web and Search Engines. To achieve this purpose many researches were
made and used the authors experience in this area. Therefore many concepts and
technologies were combined and used, such as: metadata, ontologies, semantic web
services and search engine optimization.
Metadata allow qualifying informations appropriately, ontologies are used to
improve domains analysis problem and to obtain software components with
semantic descriptions, which may be reused in a great variety of applications.
Semantic web services may be used as software components spread through the
Internet to perform applications complex tasks.
Starting asking what should be published in a web site, or even better, how
should be a web sites content the work exposes knowledges and technologies to
answer the question: how to offer appropriated content?
After exposing the associated concepts and showing possible solutions a
conclusion is achieved with questions and possible researches which will allow
appropriated content sites development with Semantic Web and its possible positive
collateral effects, granting improvement in both: knowledge utilization and available
informations in the web.

Keywords: appropriated content in the web, Semantic Web, Metadata,


Ontologies, Semantic Agents, Semantic Web Services, SEO.

Sumrio

I Introduo ........................................................................................................... 9
II Contedo de um site ........................................................................................ 11
II.01 - Definindo o contedo de um site ......................................................... 11
II.02 Interao com o usurio ....................................................................... 23
II.03 A utilizao da Web Semntica ........................................................... 25
II.03.01 Web Semntica versus Inteligncia Artificial .......................... 27
II.03.02 Metadados..................................................................................... 31
II.03.02.01 Padro Dublin Core .......................................................... 34
II.03.02.02 Resource Description Framework - RDF ...................... 36
II.03.02.03 Crticas aos Metadados ..................................................... 40
II.03.03 Ontologias .................................................................................... 44
II.03.03.01 Linguagens para Representao de Ontologias ............. 47
II.03.03.02 Principais Ontologias ........................................................ 54
II.03.03.03 Criao de Ontologias ....................................................... 59
II.03.03.03.01 Seleo dos Termos referentes ao domnio da
ontologia: ............................................................................................................. 59
II.03.03.03.02 Definir as classes e a hierarquia de classes da
ontologia: ............................................................................................................. 59
II.03.03.03.03 Definir as propriedades: .......................................... 59
II.03.03.03.04 Definir as restries: ................................................ 60
II.03.03.03.05 Definir instncias: .................................................... 60
II.03.04 Ferramentas .................................................................................. 61
II.03.04.01 Principais Ferramentas ...................................................... 62
II.03.04.01.01 - OilEd: ......................................................................... 62
II.03.04.01.02 - OilViz: ........................................................................ 62

II.03.04.01.03 - Protg: ...................................................................... 62


II.03.04.01.04 - DC.dot: ....................................................................... 63
II.03.04.01.05 - API JENA:................................................................. 64
II.03.04.01.06 - Chimaera: ................................................................... 65
II.03.04.01.07 - SNOBASE: ................................................................ 65
II.03.04.01.08 - FaCT: .......................................................................... 66
II.03.04.01.09 - Pellet: .......................................................................... 67
II.03.05 Agentes.......................................................................................... 68
II.03.05.01 Principais Agentes ............................................................. 69
II.03.05.01.01

CATO

(Componente

para

Alinhamento

Taxnomico de Ontologias): ............................................................................ 69


II.03.05.01.02 - API Jena: .................................................................... 69
II.03.05.01.03 - Servios Web Semnticos ........................................ 69
II.04 Como organizar o contedo para que os mecanismos de busca
sejam mais eficientes ....................................................................................................... 74
III Concluso ....................................................................................................... 77
Notas ........................................................................................................................ 80
Glossrio .................................................................................................................. 81
Referncias Bibliogrficas ...................................................................................... 82
Impressas: ............................................................................................................ 82
Sites da Internet: .................................................................................................. 86
Anexos .................................................................. Erro! Indicador no definido.
Anexo 01 - Exemplo de Arquivo utilizando SHOE:Erro! Indicador no
definido.
Anexo 02 Tabela Comparativa entre as linguagens OIL e DAML: ... Erro!
Indicador no definido.

I Introduo

tualmente existe uma grande quantidade de dados que demandam o


nosso tempo. Dentro dessa enxurrada de dados, quais so os que tm

relevncia aos nossos interesses? As empresas de contedo (Abril, BBC, CNN,


Globo, iG, Reuters, UOL dentre muitas) demandam o nosso tempo e nem sempre
atendem nossas intenes. Ao mesmo tempo em que estar bem informado passou a
ser uma condio sine qua non para nossa integrao social e ampliarmos nossas
perspectivas de negcios, como escolher o contedo que mais nos agrada e que pode
nos trazer melhores perspectivas numa sociedade que nos bombardeia a todo o
tempo com dados que no so importantes e que nos tomam o pouco tempo que
poderamos despender com atividades mais agradveis? Outro problema o lado do
comunicador (que ser o foco deste trabalho), qual a melhor forma de atingir um
pblico que lhe trar bons retornos, venda de espao propagandstico, venda de
assinaturas etc. a mdia quer atingir o pblico em geral, de preferncia com
eficincia (fazer certo as coisas) e eficcia (fazer as coisas certas). Como a mdia pode
oferecer contedo relevante com interao inteligente para atender demandas
variveis? Esse o desafio: site ou ambiente Web com contedo apropriado.
Segundo Guevara: As interfaces dos atuais sistemas necessitam no somente
responder s solicitaes dos usurios, mas tambm antecipar, adaptar e buscar
ativamente maneiras de lhes dar suporte.
Pretende-se, com o trabalho, descrever ou caracterizar as principais opes
que atendam ao objetivo geral da pesquisa que o de criar mecanismos cognitivos,
simblicos, interativos e inteligentes para atender s demandas de informao
relevante. Hoje em dia, um usurio faz uma busca a respeito de um livro de um
determinado gnero e pode aparecer no resultado da pesquisa um link para um site de
e-commerce que oferece ao usurio sugestes do gnero daquele livro que no
condizem com o que o usurio necessita ou deseja (talvez ele no queira pagar frete
ou gostaria de obter alguma promoo etc.). Dessa forma, o trabalho visa estudar
como oferecer, atravs de mecanismos inteligentes, contedo adequado, com Web
9

Semntica apropriada, de acordo com o que houver sido identificado ou solicitado


pelo usurio.
Um trabalho que apresente opes aos desafios de divulgao de informao
e comunicao apresenta-se como fonte inesgotvel de solues que podero ser
adotadas para que as empresas faam dinheiro que o fator mais atrativo no mundo
empresarial.
Iniciaremos nosso trabalho definindo o que seria um site de contedo e as
dificuldades de alcanar diferentes idiomas, assim como diferentes culturas.
Apresentaremos quais as possveis solues para que o problema possa ser
contornado e quais as tcnicas que podem ser aplicadas at apresentarmos uma
concluso do que pode ser feito para atingir o pblico de forma adequada atravs de
sites de contedo.

10

II Contedo de um site

II.01 - Definindo o contedo de um site

um site de contedo, uma das grandes questes como disponibilizar


e permitir a atualizao de contedo a ser visto pelo usurio. Haveria

um modo de disponibilizar informao relevante e que atinja aos mais variados


pblicos de forma que o que for enviado ao internauta seja relevante e que atinja a
culturas, crenas e condies sociais diversas? Ou seja, teramos como fornecer a
informao relevante e que interessa a cada usurio em especfico?
Inicialmente vamos definir o que venha a ser um site de contedo: todo e
qualquer site que no tem como objetivo fim apresentar uma ferramenta ou utilitrio
para o usurio. Webmails, internet banking ou sites de busca so exatamente o oposto
dos sites de contedo, j que tm como objetivo fim arrolar e-mails, facilitar o acesso
do cliente a sua conta corrente ou fazer uma pesquisa na Internet, respectivamente.
Os sites de contedo podem ser categorizados em um grande nmero, dada a
natureza do que se prope a publicar. Como exemplos h sites de contedo infantil,
esportivo, econmico, noticirio, opinies e muito mais. Sites puramente
institucionais tambm so considerados como de contedo.
Mas para abordar dificuldade acima: fornecer informao adequada ao perfil
especfico de cada usurio em um site de contedo, vrios aspectos precisam ser
analisados, tais como: qual o pblico que se deseja atingir? Se a resposta for a todos,
j comeamos com o problema da lngua e para abordarmos exatamente esse ponto:
o lingustico - consideraremos inicialmente o trabalho realizado por Raimundo Llio
retratado por Umberto Eco no livro A busca da lngua perfeita, que tentou obter
uma lngua que atendesse s culturas crist, hebraica e muulmana, ou seja, escritos
que fossem adequados as trs culturas. Ramn Lull, em portugus Raimundo Llio,
foi um catalo nascido em Maiorca1 entre aproximadamente 1232 e 1316 seu local

1 Maiorca (em catalo e castelhano Mallorca) a maior ilha do arquiplago das Ilhas Baleares
localizado a leste da Espanha e sua maior cidade e capital Palma de Maiorca.

11

de nascimento era encruzilhada das culturas crist, islmica e hebraica. Aps uma
juventude mundana, Llio teve uma experincia ou crise mstica (Umberto Eco no
entra em maiores detalhes) e entrou para a Ordem Franciscana.
Raimundo Llio foi o primeiro filsofo a escrever obras doutrinais em lngua
verncula2 e em sua obra Ars magna desenvolveu uma lngua filosfica que seria,
segundo Llio, perfeita mediante a qual seria possvel converter os infiis. Para
Llio, os infiis seriam todos os que no fossem cristos. Havia em sua Ars magna
uma forte tendncia crena e doutrina catlica, que em plena Idade Mdia possua
fortssima influncia no mundo ocidental. A lngua defendida por Llio ambicionava
ser universal, porque universal a combinao matemtica que articula o seu plano
de expresso. Llio elabora no nvel de contedo o seu sistema de ideias que deve ser
universal e comum a todos os povos. Faz uso de letras alfabticas e de figuras para
alcanar seus objetivos de universalizao de uma lngua que poderia ser considerada
perfeita para a finalidade a qual Llio se propunha: converter muulmanos e judeus
ao catolicismo.
Aqui cabem parnteses: no estamos ambicionando inventar uma nova lngua
a ser colocada em sites de contedo e que possa ser considerada universal, mas a ideia
que Llio tinha era a de uma lngua universal, perfeita e que permitiria atingir culturas
diversas, ento a referncia ao trabalho de Llio nesta dissertao para que
possamos indagar se podemos abordar a questo atravs de um mecanismo de lngua
que permita a comunicao nica, mas que seja adequada a crenas e culturas
diversas, de modo a permitir um contedo universal adequado a perfis diversos.
Contemporneo a Llio tivemos um franciscano, Roger Vacona, que no
queria inventar uma lngua nova, nem divulgar o conhecimento das lnguas dos
outros, queria era a supremacia da cultura crist ocidental em detrimento s demais
culturas ou tradies. Pensamentos franciscanos predominantes na poca eram:
carter missionrio e utopia universalista defendidos por So Francisco, Vacona, e,
em partes, pelo prprio Llio.

Em contraste com a lngua litrgica.

12

Tambm no intuito deste trabalho, impor pesos ou valores a contedos


especficos, para que os mesmos sejam considerados os verdadeiros. Partimos do
pressuposto de que o contedo pode ser bastante diversificado e que no existe
contedo melhor do que outro, apenas temos contedo que pode atender aos
interesses de um usurio e que no atenderia aos interesses de outro usurio.
Utilizando-se de elementos de arte combinatria, se queremos dispor n
elementos t a t em que a ordem tenha valor diferencial, temos a seguinte frmula:
n!/(n-t)! (fatorial de n dividido por fatorial de (n-t))

como sendo a possvel

quantidade de resultados. Exemplo disso : dadas quatro pessoas, como podemos


disp-las em duplas nos assentos de um teatro. No entanto, se quisermos combinar n
elementos t a t em que a ordem no altere o resultado, temos: n!/t(n-t)! (fatorial de n
dividido pelo produto de t e fatorial de (n-t)). Exemplo deste ltimo : dados quatro
soldados (A, B, C e D) como podemos combin-los 2 a 2 (dois a dois) para
realizarem uma patrulha, enviar A e B ou B e A a mesma dupla para efetuar a
patrulha, ou seja, a ordem no alteraria o resultado.
Numa abordagem semitica, sistema de expresso (smbolos) e de regras
sintticas (n elementos podem combinar-se t a t, onde t pode coincidir com n) que
sejam capazes de revelar automaticamente possveis sistemas de contedo teremos,
segundo Umberto Eco, 21 (vinte e uma) letras do alfabeto quantidade de letras
condizente ao alfabeto utilizado poca de Raimundo Llio, sculo XIII que
podem resultar em mais de 51 (cinquenta e um) bilhes de bilhes de sequncias de
21 (vinte e uma) letras nmero astronomicamente alto que traduz as diversas
disposies de 21 (vinte e uma) letras em todas as possveis quantidades de
disposies. O nmero alcanado no contempla critrios ou restries que no
dizem respeito combinatria, pois critrios ou restries vm do exterior para
limitar as possibilidades matemticas - exemplo uma palavra formada apenas por

Na matemtica, o fatorial de um nmero natural n o produto de todos os inteiros


positivos menores ou iguais a n. Isso escrito como n! e lido como "fatorial de n". A notao n! foi
introduzida por Christian Kramp em 1808.
3

13

vogais ou consoantes que nada possa representar ou foneticamente invivel e que


teria que ser descartada.
Llio, em sua Ars magna, montou um dispositivo com um alfabeto de 9
(nove) letras de B a K e 4 (quatro) figuras e uma Tabula generalis - veja Figura 01 - que
uma lista de 6 (seis) conjuntos de 9 (nove) entidades cada um, onde temos: 9 (nove)
de cada um dos seguintes itens: Princpios Absolutos, Princpios Relativos, Tipos de
Questes, Sujeitos, Virtudes e Vcios, que formariam uma espcie de quadro das
dignidades, segundo Llio.

Figura 01 Tabula Generalis


Com relao Figura 02, observamos que ela permite combinaes possveis
que podem unir os princpios da Tabula Generalis a predicados, construindo
afirmaes do tipo A Bondade grande. E teremos 36 (trinta e seis) linhas com 72
(setenta e duas) combinaes. As combinaes devem permitir silogismos regulares e
sendo assim estaro descartadas afirmaes do tipo: A Bondade boa.

14

Figura 02 Combinaes de Princpios da Tabula Generalis versus Predicados


A Figura 03 no visa nenhuma combinao, trata-se de um artifcio
mnemnico-visual que permite lembrar as relaes fixas entre os vrios tipos de
relao e vrios tipos de entidades.

Figura 03 Relaes versus Entidades


Na Figura 04 so consideradas todas as combinaes possveis entre as letras,
aparentemente excluindo as inverses de ordem. As regras das combinaes como
todas as outras dependem das definies dos termos (que so de natureza teolgica)
15

assim como de algumas modalidades de argumentao que as regras estabelecem,


alheias s leis da combinatria.

Figura 04 Combinaes entre as letras


Na Figura 05, h tripletas geradas por 9 (nove) elementos. utilizada a roda,
provavelmente devido a tradies cabalsticas, sendo que Llio transforma as tripletas
em qudruplas, inserindo a letra T. Desse modo, utilizado um artifcio mnemnico
em que as letras que precedem a letra T devem ser lidas como princpios ou
dignidades, ao passo que aquelas que seguem a T devem ser lidas como princpios
relativos. No caso, podemos questionar se todas as milhares de qudruplas levam a
uma argumentao vlida. Sendo que para Llio, devem ser deduzidas somente
aquelas frmulas cujas premissas e concluses correspondem disposio real do
cosmos. Ele aceita algumas converses das proposies, mas no outras, que
tambm seriam formalmente corretas.

Figura 05 - Tripletas
No fcil de entender primeira vista como era a formao dessa lngua
universal luliana. Mas j podemos afirmar que a Ars magna no um instrumento
16

lgico, mas um instrumento dialtico, isto , uma maneira de identificar e relembrar


todas as formas vlidas para argumentar a favor de uma tese pr-construda. E isso
de tal maneira que no h qudrupla, segundo Llio, que, devidamente interpretada,
no possa resolver a questo qual aplicada.
A Ars, segundo Llio, levaria a concluses mais seguras do que as da lgica,
e, portanto, o artista desta arte pode aprender mais em um ms do que possa
aprender um lgico em um ano (Ars magna, Decima pars, cap. 101).
Leibniz4, em 1666, questiona por que Llio teria limitado o nmero de
elementos, por que o nmero de princpios no teria ficado aberto? O motivo que
Llio no pensava, de modo algum, em uma combinatria livre de elementos de
expresso no vinculados a um contedo especfico, pois se assim fosse, no
consideraria a sua arte como uma lngua perfeita, capaz de assumir uma realidade
divina que ele assume, desde o incio, como absoluta, auto-evidente e revelada por
Deus. Ele a concebia como um instrumento para converter os infiis, e para tanto
estudara durante longo tempo as doutrinas tanto dos judeus quanto dos
muulmanos.
Llio realizou outros trabalhos, alm da Ars magna um deles, A arbor
scientiarum (A rvore das cincias) apresenta noes elementares que seriam comuns
tambm aos infiis. Tais princpios elementares se inserem em um sistema fechado e
pr-definido, ou seja, um sistema j rigidamente hierarquizado, o sistema das rvores
das Cincias.
Se no silogismo aristotlico afirmamos: todas as flores so vegetais, X uma
flor, logo X um vegetal - do ponto de vista lgico, o que X irrelevante. Mas
Llio quer saber se X uma margarida ou um barco. E em sua arbor scientiarum, Llio
pretende construir um instrumento capaz de enfrentar toda a enciclopdia do saber.
Na arbor scientiarum, a combinatria luliana um instrumento retrico
mediante o qual se quer demonstrar o que j conhecido, isto , aquilo que a

Gottfried Wilhelm von Leibniz (Leipzig, 1646 Hanover, 1716) foi um filsofo, cientista,
matemtico, diplomata e bibliotecrio alemo.
4

17

estrutura de uma floresta de vrias rvores j fixou, de uma vez para sempre, e que
nenhuma combinatria jamais poder subverter, segundo Llio.
De qualquer forma, a Ars poderia aspirar a ser lngua perfeita se o jconhecido que visava comunicar tivesse pertencido realmente a um universo de
contedo igual a todos os povos. Ela foi traduzida para o rabe e o hebraico, mas ela
fala do produto de uma organizao do mundo realizado pela tradio crist
ocidental.
Umberto Eco relata:
Llio houvera feito da prpria reflexo teolgica, e da prpria
investigao de uma lngua universal, um meio para lanar uma ponte
intelectual e religiosa entre Ocidente europeu e Oriente, e que julgava
que a verdadeira autoridade no se devia basear em uma unidade
inflexvel, mas em uma tenso entre vrios centros de forma que
Moiss, Cristo e Maom pudessem levar a um resultado unitrio. O
lulismo acolhido como estmulo mstico e filosfico, e como alternativa
imaginria e potica para a enciclopdia do aristotelismo escolstico, mas
tambm como inspirao poltica.

Esse apelo concordatrio de Llio retomado dois sculos mais tarde por
Nicolau Cusano5 que em seu tratado De pace fidei causa uma polmica e tenta um
dilogo com os muulmanos e judeus e se coloca o problema (luliano) de como
demonstrar aos representantes de outras duas religies monotestas que eles devem
concordar com a verdade crist.
No sculo XVI, outro que tentou a empreitada de Llio foi Giordano Bruno.
Ele entendia que a lngua perfeita deveria oferecer a chave para exprimir no s este
mundo, mas todos os infinitos na sua concordncia mtua. Essa ambio parece
imperfeita no que concerne estrutura semitica: tratava-se de um lxico imenso,
com significados vagos, e cuja sintaxe, quando muito, era de uma combinatria sem
limites.

Nicolau Cusano (1401-1464), matemtico e astrnomo.

18

A retrica de Giordano Bruno pretendia reforma, renovao e revoluo dos


costumes, dos conhecimentos e da prpria ordem poltica da Europa.
Desenvolvendo os conceitos lulistas, Bruno criou uma estrutura de rodas
concntricas, limitao de letras, com 23 (vinte e trs) letras do alfabeto mais
caracteres gregos e hebraicos. A sua combinatria era vida pelo ilimitado,
diferenciando-se da combinatria restrita de Raimundo Llio.
E questionamos: podemos ter uma mquina para gerar todas as lnguas
possveis ou algum contedo automtico? Dentre outros, deparamo-nos com o
problema das combinaes vlidas. Exemplo: quente, frio, seco e mido essa
combinao pode formar uma sentena sem o devido significado.
O nmero de palavras (de comprimentos variveis de duas letras at 23)
mais de setenta mil bilhes de bilhes6. O problema de uma lngua universal, na
medida em que poderia conter potencialmente todas as lnguas possveis o de
apresentar nmeros astronmicos. E desse modo no de se surpreender que
existam tantas lnguas diferentes.
Para Descartes7, Llio um autor que tentou sem xito a criao de um
mtodo que pode ser considerado um pseudomtodo, pois suas regras no so claras
e a determinao das coisas a conhecer insuficiente, e menciona a promessa errnea
de oferecer conhecimentos gerais em pouco tempo.
Com o advento da informtica, programas de computador8 que mostram o
funcionamento da Ars magna, assim como inmeras comunidades na Internet que
estudam e comentam a respeito dos trabalhos de Llio so uma realidade.

No calculado mais a respeito de conceitos (como fazia Llio), e sim sobre sequncias
alfabticas, meros elementos da expresso, no controlados por nenhuma ortodoxia que no seja a do
nmero.
6

7 Ren Descartes (1596, Frana 1650, Sucia), filsofo, fsico e matemtico. Notabilizou-se,
sobretudo, pelo seu trabalho revolucionrio da Filosofia, tendo tambm inventado o sistema de
coordenadas cartesiano, que influenciou o desenvolvimento do Clculo contemporneo.
8

http://lullianarts.net/downloads.htm; http://www.ramonllull.net.

19

Abordando a questo voltando-se Inteligncia Artificial (IA) temos que,


segundo George F. Luger, a maioria das pessoas - quando so questionadas sobre
quais habilidades so essencialmente mais humanas e mais difceis de serem
computadorizadas, alm da criao artstica, da tomada de deciso tica e da
responsabilidade social menciona linguagem e aprendizado. Ao longo dos anos,
estas duas reas tm funcionado como objetivo, desafio e meio de teste para o
progresso da IA.
George F. Luger relata:
Uma das razes do porqu linguagem e aprendizado so reas
de pesquisa difceis, embora importantes, que elas englobam muitas
outras habilidades inteligentes humanas. Comunicar-se atravs de
linguagem natural, quer seja como texto ou como um ato de fala,
depende enormemente do nosso conhecimento e expectativas dentro do
domnio do discurso. A compreenso de linguagem no meramente a
transmisso de palavras: ela tambm requer inferncias sobre o objetivo,
conhecimento e suposies do locutor, bem como sobre o contexto da
interao. A implementao de um programa para compreender
linguagem

natural

requer

que

representemos

conhecimento

expectativas do domnio e raciocinemos efetivamente sobre eles.


Precisamos considerar questes como no-monotonia, reviso de crena,
metfora, planejamento, aprendizado e as complexidades prticas da
interao humana.

E a voltamos questo principal sobre como disponibilizar informao


relevante e que atinja aos mais variados pblicos de forma que o que for enviado ao
internauta seja relevante e que atinja a culturas, crenas e condies sociais diversas.
Vemos que se a abordagem for ao mbito luliano, ou seja, restringirmos o
que deve ser dito a uma verdade absoluta e imutvel, estaremos divulgando dogmas e
crenas e a probabilidade de atingir corretamente pessoas com valores culturais
diversificados ser extremamente pequena. A retrica revolucionria de Giordano
Bruno, no entanto, com suas infinitas possibilidades, pode at atingir o contedo
certo a um pblico com interesses distintos ao que estiver sendo apresentado, ou
seja, poderia no atender a qualquer valor cultural.
Sendo assim, uma possvel abordagem a de que a informao que possa
atingir pblicos variados deve seguir um caminho em que ao verificar o que tiver sido
20

pesquisado ou desejado pelo usurio possamos indicar contedo adequado, ou seja,


personalizado, e, sendo assim, no ser o mesmo contedo a todos, pessoas
diferentes sero tratadas diferentemente.
Se em algum momento reivindicarmos a criao de uma inteligncia artificial
para dirimir o assunto, devemos abordar questes sobre linguagem natural, raciocnio
automtico e aprendizado de mquina. Mas, quando falamos de HTML (HyperText
Markup Language) pensamos em camada de apresentao e no em troca de dados ou
indexao de dados de forma adequada. A entra a Web Semntica para tentar sanar
todo esse problema, ou seja, teremos que atravs de metadados e ontologias
(conceito explanado no pargrafo seguinte) classificar o contedo de forma
adequada. Com a devida classificao podemos atravs de mecanismos de buscas
adequados fornecer o contedo certo ao que o usurio anseia. O mesmo critrio
valeria para quando estivermos efetuando uma pesquisa num Google, Yahoo, MSN,
AltaVista etc. se buscamos informao sobre redes de computadores e digitamos
apenas a palavra rede, obteremos informaes diversas sobre redes para pescadores,
redes de televiso, redes para descanso e tambm, claro, sobre redes de
computadores. A pesquisa precisaria ser mais especfica, mas ao mesmo tempo se
nos metadados de todas as pginas que trazem informaes sobre redes diversas no
houver a devida classificao e os mecanismos de busca no forem suficientemente
bons para efetuar a devida triagem, encontraremos o mesmo problema de
recebermos informaes que tero que ser humanamente analisadas. Com a Web
Semntica conseguimos uma classificao adequada em que a mquina poder filtrar
tudo que no nos interessaria nos resultados de busca ou com base no
comportamento do usurio. Atravs da Web Semntica tambm, pode-se fornecer
contedo com maior probabilidade de atender aos anseios do mesmo. Uma
abordagem luliana, em que o que informado fixo, dogmtico, no corresponde
realidade e ao dinamismo do mundo Web, ou seja, no podemos determinar
possveis respostas pr-estipuladas a qualquer mecanismo de pesquisa o caminho
a classificao adequada, a utilizao da Web Semntica e claro, podemos utilizar
inteligncia artificial no sentido de permitir a aprendizagem e o raciocnio automtico
para aperfeioar esses processos, mas no que tange linguagem natural o fato de
utilizarmos Web Semntica e termos documentos compreensveis por mquinas no
implica em uma inteligncia artificial que passar a entender o que os humanos falam.
21

O conceito aqui que com a Web Semntica os computadores podero resolver


problemas bem definidos atravs da utilizao de dados catalogados de forma
adequada.
Precisamos classificar os dados de forma adequada e a sim, conceituamos
ontologia que, na filosofia, o estudo da existncia ou do ser (verbo). basicamente
uma maneira de compreender identidades e grupos de identidades, chamados de
classes. Em TI chamamos de ontologias as classificaes de identidades, sejam elas
informao ou matria (objetos no mundo real). Podemos criar uma ontologia que
descreva livros no Amazon (www.amazon.com) e as relaes entre os mesmos, assim
como podemos criar uma ontologia sobre os diferentes tipos de barcos de pesca.
Importante saber que ontologias podem descrever qualquer coisa. Importante,
tambm, diferenciar taxonomia de ontologia. A taxonomia tambm permite
classificaes, mas elas tero uma estrutura hierrquica e sem relacionamentos. Por
exemplo, o homem um ser vivo, vertebrado, mamfero etc. Essa classificao da
taxonomia rgida e no permite relacionamentos de causa-efeito ou de dependncia
entre as partes que a ontologia permite.
Definindo o contedo de um site com mecanismos inteligentes vimos,
preliminarmente, que o caminho a Web Semntica e aqui cabe uma ressalva de
Karin Breitman sobre o atual estgio no qual a Web se encontra:
No estgio atual temos, predominantemente, a Web Sinttica:
onde nos preocupamos apenas em apresentar as informaes. Com a
Web Semntica teremos condies de oferecer significado adequado s
pginas e com isso passaremos a enfatizar os mecanismos de troca e
busca de informaes.
A grande verdade que a Internet se desenvolveu mais
rapidamente como um meio para a troca de documentos entre pessoas,
em vez um meio que fomentasse a troca de dados e informaes que
pudessem ser processadas automaticamente. Como consequncia, o
contedo semntico das pginas, ou seja, seu significado, codificado de
uma maneira acessvel para seres humanos apenas.

Ou seja, com a evoluo da Web Semntica vislumbra-se um caminho


oferta de contedo adequado, ou at mesmo: inteligente, na interao do usurio.

22

II.02 Interao com o usurio

uando pensamos em interagir com um usurio muitas questes


podem surgir: o que deve ser identificado, armazenado, filtrado e

atualizado? Devemos rastrear e deixar fixo esse rastreamento? Quantas vezes


devemos rastrear um usurio para obter um comportamento definido? O assunto
seria inesgotvel ou de abrangncia para outra dissertao. Esta se limita a abordar a
oferta de contedo adequado a partir de um interesse manifestado pelo usurio e por
isso s mencionamos o fato de que o usurio pode ter seu comportamento rastreado
e suas implicaes, sem esgotar esse assunto.
Aqui cabe, uma explicao a respeito de perfil de usurio. Os responsveis
por um site tm ferramentas de anlise de trfego (WebTrends, Google Analytics,
Urchin etc.), navegao, chegadas e sadas, sites referenciadores etc. Com essas
ferramentas podemos caracterizar alguns perfis de usurios, tais como classificao
esta, informal - utilizada na Web por empresas como Abril9 ou iG10: usurios fiis
(aqueles que visitam o site com muita frequncia, comentam, do sugestes, enviam
excees encontradas e acessam o site com dois ou mais navegadores principais para
verificar possveis inconsistncias so quase co-autores do site); leitores cativos (so
assinantes de feeds, comentam e participam do site mas sem o fanatismo dos usurios
fiis); usurios ocasionais (acessam o site de vez em quando, provenientes de algum
mecanismo de busca, como o Google por exemplo) e usurios espordicos ou praquedistas (acessam o site por uma navegao aleatria, vindo de um mecanismo de
busca ou no, muitas vezes nem sabem por qu esto visitando o site alis, esse tipo
de navegao aleatria tem a ver com o termo: serendipismo, que a descoberta
por acidente).

9 Editora Abril S.A. a maior editora de revistas da Amrica Latina www.abril.com.br,


publica revistas como Veja e Exame.

iG Internet Group Brasil um dos maiores provedores de acesso do Brasil


www.ig.com.br.
10

23

A definio do perfil do usurio, no deixa de ser um tipo de rastreamento do


usurio em si. Mas quando pensamos em disponibilizar um contedo adequado no
necessitamos, necessariamente, saber qual o perfil do usurio, conforme descrito
sumariamente acima. E ressaltamos que para esta dissertao o que desejamos
oferecer contedo adequado a partir de uma interao de um usurio, um mecanismo
de busca, por exemplo, e a sim oferecer o que ele deseja atravs de algum
mecanismo semntico ou inteligente. Mas se desejarmos registrar o perfil do usurio,
para que em visitas futuras j haja um prvio direcionamento ao mesmo, precisamos
saber de coisas, tais como: esse usurio em meu site supostamente um site com
contedo diversificado, d preferncias a quais tipos de canais de contedo (esportes,
economia, sade, finanas etc.). Dentro de cada canal, por exemplo: esportes, quais
as categorias que ele d preferncia: futebol, automobilismo, boxe, dentre outros.
Dentro da categoria futebol, por exemplo, esse usurio prefere Campeonato
Brasileiro, Italiano ou Espanhol? So inmeras as possibilidades, o que precisamos
definir o que deve ser registrado e a armazenar em um banco de dados associado
autenticao do usurio, seu e-mail, por exemplo, para que em suas prximas visitas
ele j possa ser direcionado as suas preferncias principais com o uso da Web
Semntica, mas esse tipo de abordagem, prvio redirecionamento, foge aos objetivos
desta dissertao.

24

II.03 A utilizao da Web Semntica

egundo Tim Berners-Lee11, a Web Semntica uma extenso da Web


tradicional, onde, a partir do uso intensivo de metadados, espera-se obter

o acesso automatizado s informaes, com base no processamento semntico de


dados e heursticas feitos por mquinas.
Para tal, desde 1998, a equipe do W3C (World Wide Web Consortium) vem
trabalhando arduamente no desenvolvimento de tecnologias avanadas, que visam
representao estrutural e semntica dos recursos na Web. Essas tecnologias, aliadas
teoria de domnios ou ontologias, permitem oferecer um servio Web com um
nvel maior de qualidade.
Dentro destas perspectivas, a Web ser capaz de tecer uma rede extensa de
conhecimento humano, podendo ainda, por meio do processamento via mquina,
inferir novos conhecimentos.
As tecnologias acima mencionadas englobam desde linguagens de transporte
de dados, como o XML (Extensible Markup Language), linguagens para
representao da estrutura desses dados, tais como o RDF (Resource Description
Framework) e linguagens para representao da semntica desses dados explicitando
restries sobre a semntica do mundo real. Aliadas a essa gama de linguagens, h
tambm as ferramentas para manipulao das ontologias.
O filsofo francs Pierre Lvy12 define a Web Semntica como "ferramenta"
necessria para o desenvolvimento da inteligncia coletiva. Segundo ele, a semntica
da Web a elaborao de um sistema de cdigos. No necessrio que as pessoas
utilizem uma nova lngua - cada um utilizar sua prpria, mas haver um software
que traduzir o que est sendo escrito ou dito para uma lngua universal.

Tim Berners-Lee considerado o criador da Internet. Seu perfil encontra-se em:


http://www.w3.org/People/Berners-Lee/.
11

12 Pierre Lvy professor da cadeira de Pesquisas sobre Inteligncia Coletiva da Universidade


de Ottawa (Canad).

25

Segundo Breitman, o HTML uma linguagem que se tornou muito


interessante para os usurios, mas os links s tm sentido em seu contexto. Para as
"mquinas", no possvel traduzir a informao, pois a orientao do HTML para
apresentao. Por isso, a importncia dos metadados, relacionando os recursos
semanticamente e tendo os contedos descritos de forma clara (enquanto o HTML
trabalha com palavras-chave, o XML trabalha com metadados).
Para alguns, a Web Semntica a Web do futuro. As pesquisas atuais esto
buscando tecnologias para tornar mais eficazes as localizaes das informaes na
Web. As ontologias, com suas subsequentes classificaes, surgem para atender a
essa necessidade.

26

II.03.01 Web Semntica versus Inteligncia Artificial

Segundo Karin Breitman, a Web Semntica no Inteligncia Artificial (IA).


E segundo Antoniou e Harmelen:
Se o objetivo da Inteligncia Artificial construir um agente de
software que mostre inteligncia no nvel humano (e superior), o
objetivo da Web Semntica auxiliar humanos a realizarem suas tarefas
dirias na rede.

A inteno de termos documentos compreensveis por mquinas no implica


numa inteligncia artificial que far com que os computadores passem a entender o
que os seres humanos falam. Com a Web Semntica os computadores podero
resolver problemas muito bem definidos atravs do processamento de operaes ou
instrues que utilizaro dados. No solicitaremos aos computadores que passem a
compreender a linguagem das pessoas, mas sero as pessoas que passaro a ter um
trabalho a mais de classificar as informaes em representaes que possibilitaro
processamento automtico tais representaes poderiam ser os metadados e as
ontologias, por exemplo.
Segundo Karin Breitman, a maioria das tcnicas necessrias para a construo
da Web Semntica vem da rea da Inteligncia Artificial. Dada a histria de
insucessos da IA, uma preocupao seria se a Web Semntica no estaria no mesmo
caminho. Segundo Antoniou e Harmelen, essa preocupao totalmente infundada.
A realizao da Web Semntica no depende de inteligncia superior ou algo no nvel
da inteligncia humana, que era a promessa dos pesquisadores de Inteligncia
Artificial h vinte anos.
No caso da Web Semntica, solues parciais sero satisfatrias. Pode ser que
um agente de software no chegue nem perto das concluses a que um ser humano
chegaria, mas ainda assim este agente pode auxiliar para uma Internet muito superior
que temos hoje em dia. Aqui cabe uma explicao sobre agentes. Eles so
definidos, segundo Breitman, como programas de software autnomos que agem em
benefcio de seus usurios. Um agente pessoal na Web Semntica, segundo Grigoris
Antoniou e Frank Harmelen, vai receber algumas tarefas e preferncias de um
usurio, procurar informao nos recursos disponibilizados pela Internet, se
27

comunicar com outros agentes e comparar informaes relativas s tarefas que deve
desempenhar, de modo a fornecer respostas adequadas ao usurio.
A Web Semntica no exigir uma Web separada, ela uma extenso (termo,
inclusive, utilizado por Tim Berners-Lee) da Web atual (denominada de Web
Sinttica). Na Web Semntica a informao vai ter significado bem definido atravs
de linguagens de marcao semntica. Essas linguagens e ontologias sero
acrescentadas s pginas atuais, atravs de marcaes especficas ou atravs de
arquivos separados em que as respectivas pginas faro links para acrescentar o
devido contedo semntico.
Segundo Breitman, a Web Semntica no exigir a utilizao de expresses
complexas, pois apesar de a linguagem-padro recomendada para a Web Semntica
(aqui Breitman, refere-se OWL Ontology Web Language, que ser explanado mais
adiante) permitir a expresso de sentenas muito complexas, isto , sentenas que
utilizam conectivos lgicos, disjuno, inverso e axiomas, entre outros, no ser
exigido que todas as aplicaes utilizem a marcao semntica em todo o seu
potencial.
E por fim, a Web Semntica no uma reprise de um experimento falido.
Pois outra questo que poderia ser feita : no havia sido tentado tudo isso,
anteriormente, com sistemas de representao de conhecimento, nos projetos do
KIF (Knowledge Interchange Format) e Cyc (reduo de EnCYClopaedia, ou
enciclopdia)? Segundo Hendler, a resposta de certa forma, sim, mas havia outros
objetivos. A viso da comunidade de Representao do Conhecimento est mais
ligada criao de modelos cannicos que poderiam ser globalmente utilizados,
enquanto a Web Semntica tem um foco em ontologias menores, tambm chamadas
de ontologias de domnio13 e no processo de integrao dessas ontologias.

Ontologias de domnio descrevem o vocabulrio relativo a um domnio especfico atravs


da especializao de conceitos presentes na ontologia de alto nvel que descreve conceitos muito
genricos, tais como: espao, tempo e eventos.
13

28

No entanto e segundo Breitman, a experincia adquirida pelo projeto Cyc na


rea de representao de conhecimento, que forneceria uma ontologia de referncia
inestimvel, no pode ser ignorada na construo da Web Semntica.
O gerenciamento de conhecimento engloba as tarefas de aquisio,
disponibilizao e manuteno de bases de dados. Na medida em que os sistemas de
informao adquirem maturidade surge uma nova atividade, gerncia de
conhecimento, necessria para dar suporte utilizao da grande massa de dados
gerada com a informatizao das empresas. Atualmente muitos dos processos e
regras de negcios de uma empresa podem estar em cdigo, muitas vezes legado.
Grande parte dessa informao est disponvel de maneira fraca ou indevidamente
estruturada. Do ponto de vista de gerncia de conhecimento, as maiores limitaes,
segundo Breitman, so:
Busca de informao a maior parte das empresas utiliza indexao
por palavras-chave para conduzir buscas a suas bases de dados.
Extrao de dados muito tempo perdido em tarefas ligadas
extrao, filtragem e converso de informao para diferentes
formatos.
Manuteno problemas relativos a inconsistncias de modelos
conceituais e vocabulrio fazem com que seja difcil identificar e
eliminar dados obsoletos.
Minerao de dados muitas empresas tm recorrido a tcnicas
ligadas minerao (data mining) de grandes bases de dados como
forma de descobrir novas informaes. No entanto, essas tcnicas so
difceis de serem aplicadas quando as informaes esto espalhadas
em vrios aplicativos distribudos e pouco ou indevidamente
estruturados.
A Web Semntica visa permitir sistemas de gerncia de conhecimento muito
mais avanados. Com a utilizao de tecnologias, tais como: RDF, OIL, OWL e
lgicas de descrio, espera-se poder chegar a um nvel de integrao e troca de
dados muito superior ao que se tem atualmente.
Ou seja:
29

Conhecimento poder ser organizado em espaos conceituais, de


acordo com o seu significado. Essa organizao ser assistida por
mquinas que sero capazes de fazer a seleo e a filtragem da
informao. Ontologias sero cruciais para essa tarefa.
Ferramentas automatizadas sero responsveis pela verificao de
consistncia e minerao de novas informaes.
Mecanismos de busca baseados em palavras-chave sero substitudos
por queries14 sofisticadas. A informao requisitada poder ser
recuperada, extrada e apresentada de maneira amigvel.

Atualmente, h uma quantidade gigantesca de informaes na Internet e os


nmeros no param de crescer. Quando fazemos uma pesquisa sobre um
determinado assunto atravs de um buscador, como o Google por exemplo, muita
informao intil ou que no de interesse ao usurio poder ser listada. Para
melhorar essa situao, faz-se necessrio indexar de forma adequada os recursos na
Internet, ou seja, precisamos acrescentar elementos que nos indiquem, por exemplo,
que tipo de informao fornecido em um site, necessitamos de metadados - que o
assunto do nosso prximo tpico.

Query o termo em ingls para consulta, seu plural queries. Uma query pode usar uma
tcnica especfica ou conjunto de instrues para obter o que se deseja.
14

30

II.03.02 Metadados

A International Federation of Library Associations (IFLA) define metadados


da seguinte forma: Metadados so dados sobre dados. O termo se refere a qualquer
informao utilizada para a identificao, descrio e localizao de recursos.
O consrcio W3 (W3C World Web Consortium www.w3.org) tem uma
viso mais voltada para a Web Semntica. Metadados so definidos como
informaes para a Web que podem ser compreendidas por mquinas.
Quando se trata do mundo digital, chama-se de recurso o objeto descrito por
metadados, pois este pode ser tanto um simples dado, quanto um documento, uma
pgina da Web, ou at mesmo uma pessoa, uma coleo, um sistema, um
equipamento ou uma organizao. Na Web, o conceito recurso significa qualquer
objeto que pode ser alcanado atravs de uma URI (Uniform Resource Identifier www.w3.org/Addressing), como qualquer recurso que acessado via seu endereo
eletrnico. Isso inclui documentos, pginas pessoais, sites ou sistemas. A descrio de
uma pessoa ou organizao feita atravs da descrio da pgina dessa pessoa ou
organizao.
Metadados descrevem os recursos da Web com a finalidade de facilitar a sua
descoberta, localizao e utilizao. Motores ou mecanismos de busca (em ingls:
Search engines), ao utilizarem esses metadados, proporcionam consultas bem mais
precisas, envolvendo no somente palavras, mas propriedades descritas, como o
autor do recurso, o formato do recurso, a data do recurso etc.
No mundo digital, metadados no se restringem queles usados para
descrever recursos para permitir sua descoberta e localizao. Por exemplo,
metadados tambm descrevem os formatos dos recursos, a fim de permitir que
computadores identifiquem quais aplicativos podem ser usados para manipular esses
recursos. Aplicativos, ao analisarem metadados, verificam se o formato do recurso
compatvel, as condies de uso do recurso, restries de acesso etc.
Em computadores, metadados servem de representantes de um recurso e
para caracterizar o trabalho original, para que usurios entendam seu significado,
propsito, origem e condies de uso. Metadados so vistos como dados que
descrevem propriedades de um recurso para diversos propsitos, como o contexto
31

em que o recurso se insere, sua qualidade, suas condies de uso, sua identificao,
suas estratgias de preservao etc. Essa diversidade de tipos de metadados d
suporte realizao de inmeras funes, como funes de descoberta do recurso,
de localizao do recurso, de avaliao do recurso, de uso do recurso etc.
Embora o conceito seja aparentemente novo, bibliotecrios esto h sculos
produzindo e padronizando metadados, medida que extraem de documentos (que
seriam os dados) informaes de indexao e catalogao (que seriam os metadados),
para oferecer aos usurios caminhos, para que estes possam buscar os documentos
de que necessitarem. Na Biblioteconomia, o padro MARC (MAchine-Readable
Cataloging com mais detalhes no site da Biblioteca do Congresso Americano em:
www.loc.gov/marc) um exemplo de esquema de metadados. Estes metadados
indicam propriedades do documento, como seu autor, sua data de publicao, seu
ttulo, seu assunto etc. e tm como finalidade permitir a descoberta e a localizao
desses documentos.
Os metadados podem estar inseridos nos prprios documentos que
descrevem. Em pginas HTML possvel inserir metadados atravs de marcaes
(chamadas de meta tags), que no so visveis quando a pgina exibida pelo
navegador. Esses metadados podem ser lidos por motores de busca ou por
aplicativos que os utilizem.
Os metadados tambm podem ser armazenados em repositrios. Nesses
repositrios, os metadados so produzidos atravs de anotadores, que so sistemas
que guiam usurios na descrio dos recursos. Esse tipo de soluo tem sido utilizada
em organizaes para permitir que estas descrevam seus recursos.
Essas organizaes consideram como recursos, pginas da Web que
identificam seus departamentos, seus especialistas, seus sistemas informatizados
disponibilizados, bibliotecas digitais, repositrios de documentos digitais etc.
Atravs desses metadados, essas organizaes possuem um maior
entendimento de suas prprias potencialidades.
Um exemplo de metadado popularmente muito utilizado a tag ID3 (tambm
chamada de ID3 Tag) que um conjunto de informaes muito utilizado no formato
de udio MP3. Esse conjunto de informaes que compe a ID3 permite armazenar
32

informaes como o ttulo, artista, lbum, nmero da faixa ou outra informao


sobre o arquivo no prprio arquivo.
A primeira verso da ID3 foi criada em 1996 para atender a necessidade de
armazenar mais informaes no arquivo e no apenas deix-las no nome do prprio
arquivo com extenso mp3. Desse modo, teve-se a ideia de adicionar alguns dados
no fim do arquivo e logo tornou-se o padro de metadados dos arquivos com
extenso mp3.
Para atender a determinados objetivos, a uma comunidade ou a um assunto
em especfico diversos padres de metadados foram criados. A seguir, veremos os
principais padres voltados Web Semntica.

33

II.03.02.01 Padro Dublin Core

Os usurios desse padro se organizaram em uma iniciativa, o Dublin Core


Metadata Initiative (DCMI www.dublincore.org). Essa organizao dedica-se
adoo de padres de metadados e ao desenvolvimento de vocabulrios
especializados para a descrio de recursos, de modo a viabilizar sistemas mais
inteligentes de recuperao de informaes.
Os elementos que compem o padro Dublin Core esto listados a seguir
(http://www.dublincore.org/documents/dcmi-terms/):
-Assunto (subject)

O tpico abordado pelo recurso.

-Ttulo (title)

Nome dado ao recurso.

-Criador (creator)

Pessoa responsvel, podendo ser mais do que uma,


pelo contedo intelectual do recurso.

-Descrio (description)

Descrio do contedo do recurso.

-Editor (publisher)

Entidade

responsvel

por

tornar

contedo

disponvel.
-Outro agente (contributor)

Entidade responsvel por contribuies ao recurso.

-Data (date)

Data da publicao. O padro sugerido o W3CDTF


(http://www.w3.org/TR/NOTE-datetime).

-Tipo (type)

Natureza do recurso. Padro sugerido: DCMITYPE


(http://dublincore.org/documents/dcmi-typevocabulary).

-Formato (format)

O formato do arquivo. Exemplo: PDF, TXT etc.

-Identificador (identifier)

Identificao nica do recurso. Exemplo: nmero.

-Relacionamento (relation)

Relacionamento com outros recursos.

-Fonte (source)

O recurso do qual este derivado, se aplicvel.

-Linguagem (language)

Linguagem do recurso.

-Cobertura (coverage)

Abrangncia espacial ou temporal do recurso.


34

-Direitos (rights)

Informao sobre os direitos pertinentes ao recurso.

Segundo Breitman, o padro Dublin Core um padro bastante simples,


como pode ser observado a partir do grupo bsico de elementos que o compem.
Sua simplicidade um ponto forte, pois permite a disseminao e a utilizao em
larga escala, e , ao mesmo tempo, sua maior fraqueza, pois no acomoda uma
semntica mais expressiva. um padro que fez opo pela facilidade sobre o poder
de expresso.
Atualmente o Dublin Core um padro ANSI para metadados (ANSI/NISO
Z39.85) e norma ISO (ISO Standard I5836-2003).

Veremos no tpico a seguir um padro aberto, o RDF, com grande


capacidade de expresso e que o padro mais compatvel com o dinamismo da Web
atual.

35

II.03.02.02 Resource Description Framework - RDF

Em 1995, um ano aps a realizao da conferncia que deu origem ao padro


Dublin Core, realizou-se um outro evento onde foi proposto um novo padro para
metadados, o Framework de Warwick - que utiliza os descritores bsicos do Dublin
Core, sendo adicionados novos elementos. Ele composto por vrios pacotes, onde
cada um deles pode utilizar uma sintaxe diferente. Apesar de aumentar a flexibilidade
do modelo Dublin Core, no garante que dois pacotes podero trocar dados entre si
e nada no Framework de Warwick garante que dois conjuntos de metadados possam
estar utilizando um conceito com significados diferentes ou dois conceitos com um
mesmo significado. De modo a tratar essas dificuldades, um novo padro surgiu, o
RDF Resource Description Framework.
O RDF uma linguagem declarativa que fornece uma maneira padronizada
de utilizar o XML para representar metadados no formato de sentenas sobre
propriedades e relacionamentos entre itens na Web. Esses itens, denominados de
recursos, podem ser virtualmente quaisquer objetos (texto, imagem, vdeo e outros),
basta que possuam um endereo na Web.
O RDF recebeu grande influncia da comunidade de bibliotecas digitais. O
RDF pode ser entendido como uma implementao do Framework de Warwick sem
um dos problemas identificados no Framework de Warwick: atravs da utilizao da
marcao de namespace propiciada pelo XML, a questo da superposio semntica
resolvida.
Um dos objetivos do RDF tornar a semntica de recursos da Web acessvel
a mquinas. Apesar de a informao na Web poder ser lida automaticamente, sua
semntica no definida. O RDF vai acrescentar metainformao a esses recursos,
de modo, a possibilitar s mquinas lidarem com eles de modo inteligente.
Descries RDF foram projetadas para fornecer informaes aos computadores e
no aparecerem na tela.
O modelo RDF bsico destaca-se pela simplicidade com que busca estruturar
o contedo de uma pgina Web. Eles so construdos com a utilizao de recursos e
propriedades, descritos a seguir:
36

Recursos: representam o universo de objetos que podem ser descritos pelo


modelo RDF. Uma pgina inteira da Web ou uma parte dela; uma coleo de
pginas; ou um objeto que no diretamente acessvel via Web, por exemplo, um
livro impresso. Para cada recurso associado um identificador nico (URI) de forma
a poder identific-lo posteriormente.
Propriedades: representam os aspectos do recurso a serem descritos.
Propriedades podem ser visualizadas como atributos (caractersticas) de
recursos. Tambm so utilizadas para descrever relacionamentos entre recursos.
Neste sentido, o modelo de dados RDF assemelha-se ao modelo EntidadeRelacionamento. Cada propriedade tem um significado especfico, definem seus
valores permitidos, os tipos de recursos que podem descrever, e seus
relacionamentos com outras propriedades.
Vejamos como ficaria, a partir de um exemplo de um site de contedo, o
RDF correspondente. A tabela a seguir ilustra uma parte de um contedo HTML de
um site de contedo, por exemplo: www.ig.com.br, dentro do canal de Esportes e da
categoria Futebol, os campees brasileiros dos anos de 2005 e 2006:
Categoria

Campeonato

Ano

Campeo

Futebol

Brasileiro

2005

Corinthians

Futebol

Brasileiro

2006

So Paulo

Um possvel arquivo RDF correspondente o seguinte:


<?xml version=1.0? >
<rdf:RDF
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:esp=http://www.pucsp.br/~demi/vocabulario/esporte/#>
<rdf:Description
rdf:about=http://www.ig.com.br/esportes/futebol/br_camp.aspx>
<esp:ano>
37

<rdf:Description
rdf:about=http://www.ig.com.br/#2005>
</rdf:Description>
</esp:ano>
</rdf:Description>
<rdf:Description rdf:about=http://www.ig.com.br/#2005>
<esp:categoria>Futebol</esp:categoria>
<esp:campeonato>Brasileiro</esp:campeonato>
<esp:campeao>Corinthians</esp:campeao>
</rdf:Description>
<rdf:Description
rdf:about=http://www.ig.com.br/esportes/futebol/br_camp.aspx>
<esp:ano>
<rdf:Description
rdf:about=http://www.ig.com.br/#2006>
</rdf:Description>
</esp:ano>
</rdf:Description>
<rdf:Description rdf:about=http://www.ig.com.br/#2006>
<esp:categoria>Futebol</esp:categoria>
<esp:campeonato>Brasileiro</esp:campeonato>
<esp:campeao>So Paulo</esp:campeao>
</rdf:Description>
</rdf:RDF>

Explicando o arquivo RDF acima, temos:


38

A primeira linha do arquivo declarativa, ela diz qual a verso do XML est
sendo utilizada, no caso trata-se da verso 1.0.
O elemento rdf:RDF o elemento raiz (e no caso tem o terminador
/rdf:RDF). Neste caso, ele indica que o contedo RDF.
O elemento xmlns:rdf indica o namespace do prprio RDF, ou seja, ele indica
que todos os elementos ou atributos que comearem com o prefixo rdf: estaro
localizados dentro de um nico arquivo, que contm a especificao do vocabulrio
de RDF.
Tambm podemos ter vocabulrios criados pelos autores do arquivo RDF
em

questo.

No

exemplo

acima,

foi

apontado

para

http://www.pucsp.br/~demi/vocabulario/esporte/#. Neste local estaro descritos


os termos utilizados: ano, campeao, campeonato e categoria. O namespace deste local
o xmlns:esp e que identificar as etiquetas do tipo esp:.
O elemento rdf:Description (e seu terminador /rdf:Description) contm a
descrio do recurso identificado atravs do atributo rdf:about.
O elemento esp:ano descreve uma propriedade do recurso. O mesmo
acontece para os elementos esp:categoria, esp:campeonato e esp:campeao.
recomendvel que o nome do arquivo RDF seja o mesmo do recurso que
est sendo descrito com o sufixo .rdf. Por exemplo: se a pgina for: br_camp.aspx, o
arquivo RDF correspondente ser: br_camp.aspx.rdf.
Para ligar ou efetuar o link entre o recurso HTML (que expe o contedo ao
usurio, sendo que no caso trata-se de um arquivo asp.net com extenso aspx) e sua
respectiva descrio RDF, devemos adicionar a tag <link> dentro da seo da tag
<head> da pgina. Por exemplo: <link rel=meta href=br_camp.aspx.rdf>.
Como vemos, o RDF simples, intuitivo, prtico e extensvel.

39

II.03.02.03 Crticas aos Metadados

Vimos a criao de uma estrutura projetada para que sejam fornecidas


informaes s mquinas e que no necessariamente aparecero na tela do
computador de um usurio ou internauta. Mas essa a soluo mais adequada?
Segundo Cory Doctorow15 no site: http://www.well.com/~doctorow/metacrap.htm
temos muitos problemas a serem enfrentados:
-As pessoas mentem. Estamos num mundo competitivo e as pessoas querem
aparecer ou vender, por isso, no h garantias de que as classificaes sero honestas,
politicamente corretas ou algo que valha.

-As pessoas so preguiosas. O modelo baseado em metadados supe que os


usurios ou responsveis pelas pginas iro classificar, indexar ou fornecer as
informaes necessrias. Como podemos supor isso se muitos e-mails no tm o
assunto a que se referem discriminado e muitas pginas Web no possuem sequer um
ttulo descritivo adequado.

-As pessoas so disciplicentes. A falta de cuidado e interesse das pessoas em


fazer de forma correta a criao e manuteno de metadados. Doctorow cita como
exemplo o site de leilo e-Bay (www.ebay.com), um site em que seus utilizadores
teriam interesse em classificar corretamente os produtos que colocam venda mas,
que apresenta um grande nmero de produtos cadastrados erroneamente. Ele sugere

15 Cory Doctorow um jornalista canadense, atua como professor visitante na Universidade


de
Southern
na
Califrnia.
Mais
informaes
em:
http://en.wikipedia.org/wiki/Cory_Doctorow#Biography.

40

uma busca por plam pilot em vez de palm pilot onde se verificar que podem
aparecer resultados cadastrados de forma incorreta.

-Misso impossvel: conhea a si mesmo. Como diz Doctorow, seria uma


metautopia supor que as pessoas se conhecem adequadamente e que sabero
descrever seus metadados e domnios de forma adequada. A experincia prtica diz
que as pessoas no conseguem observar seus prprios comportamentos de forma
adequada. Isso pode ser comprovado com experincias, tais como: pergunte a um
programador quanto tempo ele levar para codificar uma determinada rotina ou
pergunte a um empreiteiro quanto tempo ser necessrio para construir alguma coisa.

-Falta de neutralidade nos modelos. A forma de organizar as categorias dos


metadados j demonstra uma tendncia dos usurios. Nenhum modelo realmente
isento de influncias. O processo de descrio de metadados no exceo. Esperase que a decomposio do domnio e sua categorizao sejam influenciadas pelos
interesses de quem est fazendo a modelagem. Doctorow cita o exemplo de um
fabricante de mquinas de lavar. Se ele for consciente de questes relativas ao meio
ambiente ou se a vantagem competitiva oferecida por seu produto for o baixo
consumo de energia de se esperar uma decomposio do seguinte tipo:
Consumo de energia:
Consumo de gua limpa:
Tamanho:
Capacidade:
Confiabilidade:

Enquanto que se o fabricante tiver o design como diferencial, poderamos


esperar uma decomposio assim:
Cor:
Tamanho:
41

Programabilidade:
Confiabilidade:

Ou seja, cada um procuraria enfatizar o que tem de destaque ou o item que


apresentaria melhores resultados.

-Mtricas influenciam resultados. Evidentemente que a escolha das mtricas a


serem utilizadas na caracterizao da informao fornecida vai sofrer a influncia de
quem est escolhendo o conjunto de mtricas que ser utilizado. Da mesma forma
que no item anterior, pode-se dar preferncia a aspectos que sabidamente vo ter
uma pontuao maior do que a de seus concorrentes, em detrimento de itens que
podem no ser to interessantes sob o ponto de vista da concorrncia. Exemplo
disso, so softwares que apresentam boas caractersticas em termos de segurana,
mas so ruins em termos de convenincia

-Existe mais de uma maneira de descrever alguma coisa. No, eu no estou


assistindo desenhos animados! antropologia cultural. Pessoas razoveis podem
discordar para sempre em como descrever uma determinada coisa. Solicitar para que
todos usem o mesmo vocabulrio para descrever seus recursos, foraria a uma
homogeneidade de ideias.

E qual a soluo? Jogar tudo fora? Os americanos tm uma expresso


idiomtica que adverte os usurios, quando no esto satisfeitos com algo, para no
jogar fora o beb junto com a gua do banho. Na essncia, o que esse ditado quer
dizer que mesmo com uma srie de restries que podemos fazer ao assunto, no
caso os metadados, ainda existem muitas coisas vlidas (o beb), que no devem ser
jogadas fora.

Enfim, os metadados podem no ser a soluo de todos os problemas, mas


so muito teis e auxiliam na identificao, classificao ou indexao de pginas da
42

Web, melhorando o resultado de buscas e permitindo que uma parte do


processamento possa ser efetuado por computadores, em vez de seres humanos.

Devemos ressaltar que para obter resultados satisfatrios em uma pesquisa


precisamos, tambm, classificar as informaes de uma forma adequada e para isso,
apresentaremos no prximo captulo o conceito e a utilizao de ontologias para esse
fim.

43

II.03.03 Ontologias

Neste captulo sero expostas as caractersticas das ontologias.


Segundo Karin Breitman, temos a seguinte definio para ontologias:
Ontologias so especificaes formais e explcitas de
conceitualizaes compartilhadas. Ontologias so modelos conceituais
que capturam e explicitam o vocabulrio utilizado nas aplicaes
semnticas. Servem como base para garantir uma comunicao livre de
ambiguidades. Ontologias sero a lngua franca da Web Semntica.

O termo conceitualizao utilizado por Karin Breitman, acima exposto


aponta para um modelo abstrato de algum acontecimento que identifique conceitos
de importncia desse acontecimento. J a expresso explcita quer dizer que os
tipos de conceitos usados e as limitaes do uso desses conceitos devem ser de
forma explcita. Atravs dessa descrio possvel visualizar algumas caractersticas
importantes. Uma delas o fato de que uma ontologia deva ser explcita, as outras se
atribuem ao fato de que uma ontologia deva ser formal e descrever um
conhecimento comum a um grupo.
Uma segunda definio para o termo dada por Gmez e Corcho, eles
definem uma ontologia da seguinte forma: Uma ontologia um conjunto de termos
ordenados hierarquicamente para descrever um domnio que pode ser usado como
um esqueleto para uma base de conhecimentos. Diferentemente da primeira, essa
definio apresenta algumas informaes sobre a estruturao de uma ontologia.
Pois, segundo ela, uma ontologia deve possuir termos organizados com uma
hierarquia associada, o que chamado de taxonomia. Ainda nessa descrio
apresentada outra caracterstica importante, a qual consiste numa das principais
utilidades de uma ontologia que servir como um schema, ou seja, um marcador, para
um banco de conhecimentos, viso essa muito comum dentro da rea da gesto de
conhecimentos. Ainda nessa ltima definio de ontologia vale pena ressaltar que
essa definio mostra uma diferena importante sobre o que uma ontologia e o que
uma base de conhecimento. Como Guimares descreve, uma ontologia
disponibiliza um esqueleto bsico no qual se pode edificar uma base de
conhecimentos. Ela tambm prov um conjunto de conceitos e termos para
descrever certo domnio, enquanto a base de conhecimento usa essas expresses para
detalhar uma determinada realidade. Caso acontea de que essa realidade seja alterada
44

a base de conhecimento ser modificada, porm a ontologia ficar a mesma, desde


que o domnio fique inalterado.
Segundo o trabalho de Guimares, as principais vantagens para o uso de
ontologias so: primeiramente, o fato de que ontologias fornecem um vocabulrio
para a representao do conhecimento. Esse vocabulrio tem uma conceitualizao
que o sustenta, de forma a prevenir interpretaes diferentes dele. As ontologias
ainda permitem o compartilhamento de conhecimento, dessa forma caso haja uma
ontologia que molde adequadamente certo domnio de conhecimento, essa pode ser
compartilhada e usada por pessoas que criem aplicaes dentro desse domnio. Um
exemplo dessa caracterstica pode ser dado na seguinte situao: imaginemos a
existncia de uma ontologia para o domnio de barcos. Uma vez que essa esteja
disponvel, qualquer outro barco pode construir seus catlogos usando o vocabulrio
fornecido por essa ontologia sem que precisem refazer uma avaliao do domnio de
barcos. Diferentemente da linguagem natural, onde as palavras podem ter
significados diferentes conforme o seu contexto, as ontologias por serem escritas em
linguagem formal fornecem uma descrio exata do conhecimento. Um exemplo
disso quando algum fala a palavra globo, dependendo do estado mental da
pessoal que ouviu o termo, poder associ-lo com o significado da rede de televiso
Globo, como tambm possvel que para essa mesma pessoa a palavra tenha a
semntica de um corpo esfrico. Isso no aconteceria, ou pelo menos teria pequenas
chances de acontecer, se existisse uma conceitualizao comum entre as duas pessoas
que esto se comunicando. Por exemplo, imagine que as duas pessoas concordem em
usar uma ontologia sobre o domnio de formas geomtricas, provavelmente no
existiria mal entendido entre elas.
Vimos o que uma ontologia e quais so as suas principais vantagens. Com
esses tpicos j possvel ter-se uma ideia bsica das partes que compem uma
ontologia, porm vale a pela formalizar essa questo. Segundo Guimares, entre as
vrias definies sobre o que compe uma ontologia, a que mais se destaca dada
por Maedche devido ao seu alto grau de formalismo. Porm, a descrio feita por
Gmez tambm bastante completa. Isso fez com que Guimares mesclasse as
definies dos dois autores, e essa mistura que ser apresentada aqui.
Um conjunto de conceitos e uma hierarquia entre esses conceitos, ou seja,
uma taxonomia definida como um dos componentes principais que compem uma
45

ontologia. Aqui, os conceitos possuem a capacidade de ser abstratos, um exemplo


disso a fora; concretos, como por exemplo, um navio; elementares que
exemplificado por um eltron; ou compostos, como por exemplo, um tomo. Para
melhor se entender taxonomia pode-se pensar no conceito prton ser um
subconceito do conceito tomo.
Outra pea que tambm compe uma ontologia um conjunto de
relacionamento entre esses conceitos. Como exemplifica o fato de que entre o
conceito pessoa e o conceito carro a relao que h a de ser dono. Ainda h um
conjunto de funes, onde uma funo um caso especial de relacionamento em que
um conjunto de elementos tem uma relao nica com outro elemento. Um exemplo
de funo o fato de certo conceito ser pai biolgico de outro.
Por fim, contrrio ao conjunto de funes um conjunto de axiomas, onde
h regras que sempre so verdade. Exemplificar axioma fazer-se pensar que toda
pessoa tem uma me.
Ressaltamos a principal diferena entre taxonomia e ontologia que o fato de
que a taxonomia permite classificaes, mas elas tero uma estrutura hierrquica e
sua classificao rgida e no permite relacionamentos de causa-efeito ou de
dependncia entre as partes que a ontologia permite.
E para obtermos as especificaes formais, relacionadas definio de Karin
Breitman acima, ou, simplesmente, ontologias que desejarmos, precisamos de
linguagens apropriadas para isso o que ser apresentado no prximo captulo e
tambm precisamos conhecer quais so as principais ontologias e qual o processo de
criao de uma ontologia, caso desejemos obter uma especificao inexistente tudo
isso ser apresentado nos captulos subsequentes.

46

II.03.03.01 Linguagens para Representao de Ontologias

Neste captulo sero expostas as caractersticas das principais linguagens para


representao de ontologias.
Listando as principais linguagens para representao de ontologias, temos:
RDF (Resource Description Framework): esta linguagem tambm
pode ser utilizada para metadados e foi explanada detalhadamente
em item anterior (II.03.02.02).

SHOE (Single HTML Ontology Extension): uma linguagem que se


apresenta como uma extenso do HTML. Ela fornece tags particulares
que podem ser utilizadas para representar ontologias e que no fazem
parte das tags que so utilizadas no HTML e por isso no so
mostradas a partir dos browsers. Sua inteno armazenar
informaes a respeito do contedo das pginas, permitindo maior
eficincia aos mecanismos de busca. Podemos ter agentes que
utilizariam o SHOE para realizar buscas semnticas na rede.
Segundo Heflin, Hendler e Luke, a linguagem SHOE faz uma
distino entre o contedo das pginas asseres ou instncias e a
terminologia, informao acerca dos metadados. SHOE permite a
definio de conceitos, relacionamentos e atributos. Veja no Anexo
01 Exemplo de Arquivo utilizando SHOE um arquivo da
Universidade de Princeton que o utiliza. Nesse exemplo, observe a
utilizao de novos tags: INSTANCE KEY (instncia), CATEGORY
NAME (conceito) e RELATION NAME (funo que relaciona dois
conceitos propriedade). Essas tags so adicionadas ao contedo
HTML como se fosse um novo cabealho. Esse conjunto de tags com
o contedo HTML forma a pgina SHOE.
SHOE menos expressivo que o RDF e, principalmente, dificulta a
manuteno das pginas que a utilizem. Ela foi descontinuada, mas
mantida pela Universidade de Maryland, que a havia criado. Porm,
devido a sua praticidade e simplicidade uma boa opo para criar-se
uma ontologia e por isso foi exemplificada no Anexo 01.
47

Mais informaes e exemplos da utilizao de SHOE esto em:


http://www.cs.umd.edu/projects/plus/SHOE/.

OIL (Ontology Inference Layer) segundo Gmez-Prez OIL pode


ser definida assim:
Uma linguagem baseada em frames (quadros) que utilizam
lgica de descrio para fornecer uma semntica clara, ao mesmo tempo
em que permitem implementaes eficientes de mecanismos de
inferncia que garantam a consistncia da linguagem.

Muito do trabalho relacionado linguagem OIL foi incorporado


OWL, que veremos adiante.
Mais informaes no quadro comparativo entre as linguagens DAML
e OIL, no Anexo 02 Tabela Comparativa entre as linguagens OIL
e DAML. Informaes detalhadas e exemplos relacionados OIL
podero

ser

encontrados

no

seguinte

endereo:

http://www.ontoknowledge.org/oil/.

DAML + OIL. (DAML o acrnimo de: DARPA (Defense


Advanced Research Projects Agency) Agent Markup Language):
Segundo Karin Breitman, temos:
DAML + OIL dividida em duas partes, domnio dos objetos,
que consiste nos objetos que so membros de classes definidas na
ontologia DAML, e domnio dos tipos de dados, que consiste nos
valores importados do modelo XML. A ideia por trs da separao
permitir a implementao de mecanismos de inferncia, j que realizar
inferncias sobre tipos concretos de dados no seria possvel. DAML
composta por elementos de classe, expresses de classe e propriedades.

Uma comparao entre as linguagens OIL e DAML encontra-se em:


Anexo 02 Tabela Comparativa entre as linguagens OIL e DAML.
Informaes detalhadas e exemplos podem ser encontrados em:
http://www.daml.org/.
48

OWL (Ontology Web Language)


Lanada como uma reviso da DAML + OIL pelo W3C, foi
projetada para atender s necessidades das aplicaes para a Web
Semntica, tais como:
- Construo de ontologias
- Fornecer claramente fatos sobre um determinado domnio
- Racionalizar sobre ontologias e fatos
Os elementos bsicos da OWL so: namespaces, cabealhos, classes,
indivduos, propriedades e restries.
- Namespaces: so declaraes que se localizam entre etiquetas do
tipo rdf:RDF e permitem que os identificadores que estaro presentes
na ontologia sejam interpretados sem ambiguidades.
- Cabealhos: sob a etiqueta

owl:Ontology

comum incluir uma

coleo de etiquetas sobre a prpria OWL. Elas so responsveis por


registrar comentrios, pelo controle de verso e pela incluso de
conceitos e propriedades de outras ontologias.
- Classes: so utilizadas para descrever os conceitos mais bsicos de
um domnio, que serviro como bases ou razes de vrias taxonomias.
O construtor fundamental de uma taxonomia rdfs:subClassOf, que
define a hierarquia de classes, atravs de relacionamentos de
generalizao (tipo-de). Por exemplo, temos a sentena: Um exame
de sangue um exame mdico. Em OWL classificamos os conceitos
Exame_Medico e Exame_De_Sangue como classes e estabelecemos
um relacionamento de generalizao entre eles utilizando a tag
rdfs:subClassOf,

conforme exemplo a seguir:

<owl:Class rdf:ID=Exame_De_Sangue>
<rdfs:subClassOf rdf:resource=Exame_Medico />

</owl:Class>

Ressalte-se que esse comportamento transitivo. Isto , se existe uma


classe Hemograma que subclasse da classe Exame_De_Sangue e
49

esta, por sua vez, subclasse de Exame_Medico, temos que a classe


Hemograma subclasse de Exame_Medico.
- Indivduos: so objetos do mundo. Eles pertencem a classes e so
relacionados a outros indivduos e classes atravs de propriedades.
Eles so os membros das classes. Exemplo:
<Exame_De_Sangue rdf:ID=Colesterol />

Propriedades: descrevem caractersticas em geral. Exemplo:


<owl:Class rdf:ID=Exame_De_Sangue />
<Exame_De_Sangue rdf:ID=Colesterol>
<quantidadeMinimaColeta
rdf:datatype=&xsd:positiveInteger>1000</quantidadeMinimaCo
leta>
</Exame_De_Sangue>

Restries: so utilizadas para definir limites para indivduos que


pertencem a uma classe.

A linguagem OWL oferece trs sublinguagens projetadas para uso de


comunidades especficas de implementadores e usurios:

A OWL Lite d suporte aos usurios que necessitam, principalmente,


de uma hierarquia de classificao e simples caractersticas de
restrio. Por exemplo, enquanto a OWL Lite suporta restries de
cardinalidade, ela somente permite 0 (zero) ou 1 (um) como valores
de cardinalidade. Dessa forma, mais simples criar ferramentas que
suportam a OWL Lite do que seus custosos parentes, alm de

50

fornecer um rpido caminho de migrao para o tesauro16 e outras


taxonomias.

A OWL DL d suporte aqueles usurios que desejam o mximo de


expressividade sem perder a completude computacional (todas as
concluses so garantidas de serem computadas) e a capacidade de
deciso (todas as computaes sero finalizadas em um tempo finito)
dos sistemas de raciocnio. A OWL DL inclui todos os construtores
da linguagem OWL com restries como separao entre tipos (uma
classe no pode ser ao mesmo tempo um indivduo ou tipo e uma
propriedade no pode ser ao mesmo tempo um indivduo ou uma
classe). OWL DL tem esse nome devido a sua correspondncia a
Lgica de Descrio, ou Description Logic, um campo de pesquisa que
tem estudado um fragmento de deciso particular de primeira ordem
lgica. OWL DL foi desenhada para suportar o que j existe no
segmento de descrio de lgica de negcios e tem propriedades
computacionais desejveis para sistemas de raciocnio.

A sublinguagem OWL Full feita aos usurios que desejam o


mximo de expressividade e a liberdade sinttica do RDF, sem
nenhuma garantia computacional. Por exemplo, na OWL Full uma
classe pode ser tratada simultaneamente como uma coleo de
indivduos ou, simplesmente, como um indivduo. Uma outra
diferena significante em relao OWL DL que um elemento
owl:DataTypeProperty pode ser marcado como um elemento
owl:InverseFunctionalProperty. A OWL Full permite uma ontologia
aumentar o significado de um vocabulrio pr-definido (RDF ou

Tesauro, tambm conhecido como dicionrio de ideias afins, uma lista de palavras com
significados semelhantes, dentro de um domnio especfico de conhecimento.
16

51

OWL). improvvel que todo software de raciocnio venha a ser


capaz de suportar todas as caractersticas da OWL Full.

Cada uma dessas sublinguagens uma extenso de sua predecessora


mais simples, tanto no que pode ser legalmente expresso, quanto no
que pode ser concludo validamente.

A OWL pode ser entendida como um componente da atividade Web


Semntica. Esse esforo tenta fazer com que os recursos Web sejam
mais acessveis a processos automatizados, adicionando informaes
sobre os recursos que descrevem ou disponibilizam contedo Web.
Como a Web Semntica naturalmente distribuda, a OWL deve
permitir que as informaes sejam reunidas de diferentes fontes. Isto
feito, em parte, permitindo que ontologias sejam relacionadas,
incluindo informaes explcitas de importaes de outras ontologias.
Em adio, a OWL assume uma abordagem open world, ou seja,
descries de recursos no so confinadas a um nico escopo de
arquivo. Enquanto uma classe C1 pode ser definida dentro de uma
ontologia O1, ela pode se extendida em outras ontologias. As
consequncias

dessas

proposies

adicionais

sobre

C1

so

monotnicas. Novas informaes no podem retratar informaes


anteriores. Novas informaes podem ser contraditrias, mas fatos e
concluses somente podem ser adicionados, nunca excludos. Tratase de um comportamento tpico de heranas de classes.
A possibilidade desse tipo de contradio uma coisa que o projetista
de uma ontologia deve considerar. esperado que o suporte dado
por ferramentas venha a ajudar a detectar esses casos.

Para se escrever uma ontologia que possa ser interpretada sem


ambiguidade e que possa ser devidamente utilizada por agentes de
software, precisamos de um sintaxe e uma semntica formal para a
52

OWL, sendo que a OWL uma extenso das Semnticas do RDF -http://www.w3.org/TR/rdf-mt/ e a semntica da OWL definida
em OWL Web Ontology Language Semantics and Abstract Syntax:
http://www.w3.org/TR/2004/REC-owl-guide20040210/#FormalModel.

De qualquer forma, antes de usarmos um conjunto de termos,


necessitamos de uma indicao precisa sobre quais vocabulrios
especficos sero utilizados. Mais detalhes no tpico II.03.03 03
Criao de Ontologias.
Informaes detalhadas e exemplos sobre a linguagem OWL podem
ser encontrados em: http://www.w3.org/TR/owl-ref/.

Aps vermos as principais linguagens para representao de ontologias,


veremos a seguir as caractersticas das principais ontologias.

53

II.03.03.02 Principais Ontologias

Neste captulo sero expostas as caractersticas de algumas das principais


ontologias.
Segundo Karin Breitman temos diversas ontologias, dentre as principais
temos a SUMO (Suggested Upper Merged Ontology): o que traduzido, seria a
ontologia de topo incorporada sugerida, ou seja, trata-se de uma ontologia de topo
(base para outras ontologias) e uma iniciativa da comunidade de software livre
tendo como objetivo a construo de padro pblico, a ser disponibilizado
livremente com o uso da Internet. Como ontologia de topo, sua ideia conter um
nmero total de termos genricos, algo estimado entre 1.000 (um mil) e 3.000 (trs
mil). A partir desses termos genricos, podemos especializar para a criao de
ontologias de domnios especficos.
Citando outras ontologias de domnio, temos: GUM (Generalized Upper
Model), EDR (Eletronic Dictionary Research), WordNet (banco de dados lxico que
fornece os possveis significados de mais de 120.000 (cento e vinte mil) palavras em
lngua inglesa, organizados em conjuntos de sinnimos), ODP (Open Directory
Project), NAICS (North American Industry Classification System), GALEN
(desenvolvida pela organizao OpenGALEN, ela representa uma terminologia
clnica e foi desenvolvida para especificar restries utilizadas em domnios mdicos),
FOAF (Friend Of A Friend), Gartner (ndice de tpicos das pesquisas realizadas pelo
grupo Gartner). E, temos tambm, as de domnio mais especficas ao conhecimento,
tais como: KR (Knowledge Representation) e CYC (enCYClopaedia, em ingls).
Tambm para a Gesto de Conhecimento, temos: RCPTIA (Relating
Personal, Technological and Institutional Contexts by Associations, ou Relao de
Contextos Pessoais, Tecnolgicos e Institucionais). Segundo Alexandre Silva, temos:
O mtodo RCPTIA prope uma taxionomia dinmica que
associa contextos pessoais, contextos institucionais e contextos
tecnolgicos a todo arquivo digital ou endereo na Internet.

Existem inmeros projetos voltados a ontologias e se focarmos apenas


naqueles voltados ao processamento de linguagens naturais, temos o seguinte quadro
(Tabela 02):
54

Tabela 02 - Projetos relacionados ao processamento de linguagens naturais


Projeto

Descrio

Gazelle

Traduz textos japoneses, rabes e espanhis para o ingls; inclui


processamento e anlise semntica das lnguas, gerao de
sentenas em ingls, construo de ontologias interlngua e criao
de lxicos para japons, rabe, espanhol e ingls [Germann, 1998].

KPML

KMPL (Komet-Penman MultiLingual) desenvolve gramticas e


gera linguagens naturais; oferece um ambiente de desenvolvimento
grfico para a construo, manuteno e uso de gramticas para
diversas lnguas (ingls, alemo, holands, chins, espanhol, russo,
blgaro e tcheco) [Bateman et al., 1996].

Mikrokosmos

Mecanismo em que textos em linguagem natural so traduzidos


para textos no formato interlngua (linguagem neutra, denominada
TMR Text Meaning Representation); a ligao da ontologia com o
TMR feita por meio de um lxico, no qual os significados dos
itens so definidos por conceitos ontolgicos [Beale, Nirenburg e
Mahesh, 1995].

Oncoterm

Facilita a traduo de textos mdicos sobre oncologia mediante


uma ontologia baseada em textos especializados e dicionrios
mdicos; os conceitos so organizados em categorias e
representados por esquemas [Moreno e Hernndez, 2000].

Ontogeneration Gera textos em espanhol no domnio da qumica e utiliza


linguagens naturais para responder a consultas sobre grupos,
elementos e propriedades qumicas; utiliza uma ontologia da
qumica (Chemicals ontologia do domnio da qumica que contm
conhecimento sobre elementos qumicos e estruturas cristalinas
[Fernndez-Lopez et al., 1999]), uma ontologia lingustica e uma
gramtica em espanhol [Aguado et al., 1998].

55

PANGLOSS

Possui um sistema baseado em exemplos e um sistema de


transferncia lxica que trabalham em paralelo propondo tradues
das entradas; o resultado ou traduo final selecionado por um
modelo estatstico [Frederking e Nirenburg, 1994].

Penman

Gera sentenas em linguagem natural a partir de uma entrada no


lingustica, aceita vrias notaes na entrada e foi projetado para o
uso por pessoas com vrios graus de sofisticao lingustica e
computacional [Teich e Bateman, 1993].

TechDoc

Gera documentos tcnicos multilingusticos (ingls, alemo e


francs) a partir de uma representao independente construda
pela anlise comparativa de partes dos manuais tcnicos e
lingusticos disponveis em diferentes lnguas [Rsner e Stede,
1994].

No quadro abaixo (Tabela 03) vemos um agrupamento das ontologias


lingusticas, algumas, inclusive, j mencionadas, anteriormente, na introduo deste
captulo.

56

Tabela 03 Ontologias lingusticas


Ontologia

Descrio

CoreLex

uma ontologia lxico-semntica que contm 126 (cento e vinte e


seis) tipos semnticos, cobre cerca de 40 (quarenta) mil
substantivos e define um grande nmero de classes polissmicas,
derivadas de anlise do WordNet [Buitelaar, 2001].

EDR

Eletronic

Dictionary

Research

foi

desenvolvido

para

processamento de linguagem natural, integra relaes entre


entradas lxicas e seus conceitos na forma de uma hierarquia e de
relaes semnticas, agrupados em um banco de dados de onde os
conceitos so extrados. constitudo por cinco grandes tipos de
dicionrios [Ogino et al., 1997].
EuroWordNet

Trata-se de um conjunto de dicionrios para lnguas europeias


(alemo, espanhol, estoniano, francs, holands, italiano, tcheco)
organizados a partir de grupos de sinnimos e das relaes entre
eles. Cada dicionrio conectado a um ndice interlngua que
acessa uma ontologia semntica de alto nvel, possibilitando
navegar de uma palavra em uma lngua para a mesma palavra em
outra lngua. Pode ser utilizado para recuperao da informao
multilngue [Vossen, 1998].

GT

Trata-se de um lxico de 40 (quarenta) mil palavras japonesas que

(Goi-Taikeis)

consiste de uma ontologia, um dicionrio semntico de palavras e

Ontology

um dicionrio semntico da estrutura. A ontologia classifica


conceitos expressando as relaes entre as palavras. O significado
das palavras dado por uma hierarquia semntica, em que os ns
representam uma classe semntica e as arestas representam
relaes: -um ou tem-um [Bond et al., 2001].

GUM

Ontologia para processamento de linguagens naturais que

(Generalized

simplifica a interface entre o conhecimento de um domnio e

Upper Model)

recursos lingusticos genricos. Consiste de duas hierarquias: uma


contm todos os conceitos e a outra contm todos os papis
57

[Bateman, Magnini e Fabris, 1995].


WordNet

Trata-se de um grande banco de dados lxico para a lngua inglesa,


em que so organizados 70 (setenta) mil grupos de sinnimos, cada
um representando um conceito lxico. Os sinnimos so
conectados por relaes e o lxico dividido em substantivos,
verbos, adjetivos e advrbios [Miller, 1995].

A seguir, veremos como podemos criar uma ontologia.

58

II.03.03.03 Criao de Ontologias

Neste captulo sero expostas as caractersticas de como criar sua prpria


ontologia. Apresentaremos uma metodologia que pode ser aplicada para a criao de
ontologias.
Segundo Tim Berners-Lee a descentralizao tpica da Web far com que
inmeras ontologias sejam criadas e utilizadas.
Segundo Natalya F. Noy e Deborah L. McGuinness, podemos atravs dos
passos seguintes, criar uma ontologia que seguir uma metodologia de criao de fcil
entendimento:

II.03.03.03.01 Seleo dos Termos referentes ao domnio da ontologia:


Esta fase constitui em criar uma lista com todos os termos da ontologia,
atravs de um vocabulrio controlado, que tem a finalidade de nomear os conceitos,
identificar suas propriedades e as relaes desejadas.

II.03.03.03.02 Definir as classes e a hierarquia de classes da ontologia:


Nesta etapa os termos que resultaram da fase anterior podem ser colocados
em hierarquia de forma que os mais genricos sejam refinados em termos mais
especficos, conhecida como estratgia top-down. Ou os termos podem ser
generalizados, conhecida como estratgia bottom-up. Ou at mesmo, pode ser utilizada
uma combinao de ambas. De qualquer forma, os principais conceitos podem ser
definidos primeiro e depois refinados e/ou generalizados e dessa forma podemos
definir as diversas classes que iro compor a ontologia.

II.03.03.03.03 Definir as propriedades:


Devemos considerar que somente as classes no fornecero informao
suficiente para responder s perguntas da competncia do escopo. Ou seja, uma vez
definidas as classes, deve-se descrever a estrutura interna dos conceitos, que so as
propriedades.
59

II.03.03.03.04 Definir as restries:


Devemos, nesta etapa, descrever ou limitar o conjunto de valores possveis
para uma propriedade.

II.03.03.03.05 Definir instncias:


As instncias so entidades do domnio que atendem s especificaes de
uma classe. A atividade de instanciao consiste em criar os registros de uma base de
dados a partir do seu esquema (descrio das classes).

Aps a execuo dos passos acima mencionados, temos uma ontologia.


Atualmente, existem inmeras ontologias que so criadas, no entanto, no existe um
padro oficial para a sua criao o que pode dificultar a reutilizao de contedos, no
entanto, como j mencionado anteriormente, faz parte do dinamismo caracterstico
da Web.

E temos ferramentas que podem nos auxiliar. Tanto na parte de metadados


como de ontologias, conforme veremos a seguir.

60

II.03.04 Ferramentas

Neste captulo sero expostas as caractersticas das ferramentas.


Temos diversas ferramentas voltadas Web Semntica. Podemos classificlas em trs grandes categorias: Editores de Metadados, Editores de Ontologias e
ferramentas de Visualizao em Mecanismos de Inferncia.
Os Editores de Metadados facilitam a criao e manuteno de metadados.
E analogamente, temos os Editores de Ontologias que nos permitem
trabalhar tanto na criao quanto na edio ou manuteno de ontologias diversas.
As ferramentas de Visualizao em Mecanismos de Inferncia so softwares
capazes de derivar novos fatos ou associaes a partir de informaes existentes.
Existe uma crena de que esse tipo de ferramenta capaz de emular o modo como
os seres humanos pensam e chegam a concluses. A realidade que essas
ferramentas no implementam capacidades de inteligncia artificial, elas utilizam
estratgias conhecidas de processamento de dados. Essas inferncias sero to boas
quanto a informao que estiver disponvel e, segundo Breitman, no caso da Web
Semntica, esses mecanismos de inferncia tero disponveis apenas as classes e
associaes que possam ser possveis de se descrever em modelos OWL ou RDF, ou
seja, um conjunto muito restrito. Exemplos desse tipo de ferramenta so: FaCT e
Pellet, descritos no tpico seguinte II.03.04.01.

61

II.03.04.01 Principais Ferramentas

Neste captulo sero expostas as caractersticas das principais ferramentas.


No um estudo completo, pois seria muito extenso listar todas as ferramentas
disponveis atualmente. Foram selecionadas as que so mais utilizadas ou mais
comentadas pela literatura referenciada.
Listando algumas ferramentas voltadas Web Semntica, temos:
II.03.04.01.01 - OilEd:
Segundo Horrocks, Sattler e Tobies, o OilEd um editor simples, o
NotePad dos editores de ontologias. Ele utiliza as linguagens DAML+OIL. Sua
inteno inicial propiciar um simples editor que facilite o uso e estimule o interesse
na linguagem OIL. Sua verso atual no prov um ambiente completo de
desenvolvimento de ontologias no suporta o desenvolvimento destas em larga
escala, migrao, integrao, versionamento, argumentao e muitas outras tarefas
envolvidas no processo de construo de uma ontologia.

II.03.04.01.02 - OilViz:
Segundo Karin Breitman, trata-se de uma ferramenta que pode ser adicionada
ferramenta OilEd. OilViz o visualizador de hierarquias de classes. Auxilia na
visualizao da estrutura de classes da ontologia e oferece uma opo ao visualizador
bsico do OilEd. Mostra a hierarquia no formato de uma rvore de diretrios.

II.03.04.01.03 - Protg:
Segundo Noy e Musen, trata-se de um ambiente interativo para projeto de
ontologias de cdigo aberto, que oferece uma interface grfica para edio de
ontologias e uma arquitetura para criao de ferramentas baseadas em conhecimento.
A arquitetura modulada e permite a insero de novos recursos.
Com o Protg temos um ambiente para criao e edio de ontologias e
bases de conhecimento, que permite ao usurio iniciar o projeto de uma ontologia de
forma rpida e intuitiva. Alm do qu, ele gratuito e de cdigo aberto. Suas
ontologias podem ser exportadas nos formatos RDF e OWL. Ele feito em Java,
62

extensvel e propicia rpido desenvolvimento de ontologias com sua interface


amigvel.
O Protg tambm utiliza um mecanismo de inferncia para a verificao de
ontologias e subsequente classificao automtica.
Na Figura 06 vemos o incio da construo de um novo projeto, utilizando-se
o Protg e comeando, a priori, pela construo de classes.

Figura 06 Protg
Mais informaes e detalhes sobre o Protg podem ser obtidas no seguinte
endereo: http://protege.stanford.edu/.

II.03.04.01.04 - DC.dot:
Trata-se de um editor de metadados, cuja ferramenta se encontra na prpria
Web, no seguinte endereo: http://www.ukoln.ac.uk/metadata/dcdot/.
Karin Breitman relata:
O processo de criao de metadados acerca de um documento
pode ser realizado no momento de sua criao ou posteriormente. Como o
grande argumento a favor da Web Semntica a falta de marcao de

63

metadados

nas

pginas

da

Internet,

estamos

presenciando

desenvolvimento de um grande nmero de ferramentas dedicadas


identificao e edio de contedos de metadados a posteriori. Algumas
ferramentas, utilizando pginas como marcao HTML como entrada, so
capazes de gerar uma sugesto de marcao de metadados. Tipicamente
so identificadas informaes acerca do autor, data de criao, assunto e
linguagem do contedo dessa pgina. O DC.dot uma ferramenta desse
tipo. A partir da submisso de qualquer pgina da Internet, essa ferramenta
faz uma anlise e sugere um conjunto de metadados, descritos no padro
Dublin Core (ver item II.03.02.01).

II.03.04.01.05 - API JENA:


Trata-se de uma API (Application Programming Interface) Java desenvolvida
para dar suporte implementao de aplicativos para a Web Semntica. Jena
software livre e foi originalmente desenvolvida pela HP. A API Jena suporta as
linguagens RDF, RDF Schema e OWL e inclui um mecanismo para a realizao de
inferncia. Ela transforma uma dada ontologia em um modelo abstrato de dados
orientado a objetos e possibilita que suas primitivas (conceitos e relacionamentos)
possam ser tratadas como objetos. A grande vantagem possibilitar a manipulao
das ontologias atravs de linguagens orientadas a objetos, como, por exemplo, o Java
(bastante difundido e multi-plataforma). O endereo que apresenta a API Jena,
tutorial e mais informaes : http://jena.sourceforge.net.
Na Figura 07 vemos a utilizao da API Jena na IDE (Integrated
Development Environment) Java NetBeans 6.017. Como podemos ver, com a API
Jena a manipulao de classes, propriedades etc. em um ambiente integrado de
desenvolvimento torna-se uma realidade - o que propicia o desenvolvimento de
programas que utilizam adequadamente os preceitos da Web Semntica.

NetBeans 6.0 um ambiente de desenvolvimento integrado em Java, na sua verso 6.0


Mais informaes em: http://www.netbeans.org.
17

64

Figura 07 Utilizao da API Jena no NetBeans IDE 6.0

II.03.04.01.06 - Chimaera:
um software que apoia o usurio na criao e manuteno de ontologias
distribudas na Web. Suas duas principais funes so: combinao de mltiplas
ontologias e diagnstico de ontologias individuais ou mltiplas. Apoia o usurio nas
tarefas de carregamento de bases de conhecimento em diferentes formatos,
reorganizao taxionmica, resoluo de conflitos com nomes, busca de ontologias,
edio de termos etc. Sua inteno original era combinar fragmentos de bases de
conhecimento.
Mais informaes e detalhes sobre o sistema Chimaera podem ser obtidas no
endereo: http://www.ksl.stanford.edu/software/chimaera/.

II.03.04.01.07 - SNOBASE:
O SNOBASE (Semantic Network Ontology Base) da IBM um sistema de
gerenciamento de ontologias que permite que uma aplicao de software realize
buscas em ontologias sem que seja preciso se preocupar como e onde essa ontologia
est armazenada. Um sistema de gerenciamento de ontologias para uma ontologia o
65

que um SGBD (Sistema de Gerenciamento de Banco de Dados) para dados. O


SNOBASE permite que ontologias sejam carregadas atravs de arquivos na Internet.
Ontologias tambm podem ser criadas localmente. Internamente o SNOBASE
utiliza um mecanismo de inferncia, uma base de armazenamento de ontologias
persistente, um diretrio de ontologias e um conjunto de conectores que permite o
acesso a fontes de ontologias distribudas na rede.
Mais informaes e detalhes sobre o SNOBASE podem ser obtidas no
endereo: http://www.alphaworks.ibm.com/tech/snobase. Sendo que desde 2004, o
SNOBASE migrou para um conjunto de ferramentas: IBM Integrated Ontology
Development Toolkit.

II.03.04.01.08 - FaCT:
Podemos utilizar o FaCT (Fast Classification of Terminologies) para efetuar a
verificao da consistncia de ontologias. Ele possibilita a verificao automtica ao
mapear as ontologias para uma linguagem de lgica de descrio. Os servios
oferecidos pela ferramenta FaCT incluem deteco de inconsistncias e identificao
automtica de relacionamentos taxonmicos. Um exemplo simples de classificao
automtica efetuada pelo FaCT o seguinte: imaginemos que a classe Vaca, inerente
taxonomia dos seres vivos, tenha a seguinte restrio: Come Vegetal.
Suponhamos tambm que a classe Herbvoro defina todos os animais que se
alimentem apenas de vegetais. A partir disso, estabelecemos que essa classe seja
necessria e suficiente para definir herbvoros, ou seja, todos os animais que se
alimentam apenas de vegetais so herbvoros. Ferramentas que utilizem mecanismos
de inferncia tambm so conhecidas como classificadores e o FaCT, como j
dissemos, pode efetuar essa classificao de forma automtica. O FaCT pesquisar
todas as classes e automaticamente classificar todas as classes de animais que se
alimentem somente de plantas como pertencentes classe Herbvoro.
Mais informaes e detalhes sobre o FaCT podem ser obtidas no seguinte
endereo: http://www.cs.man.ac.uk/~horrocks/FaCT/.

66

II.03.04.01.09 - Pellet:
Trata-se de um mecanismo de inferncia para a linguagem OWL, construdo
em Java. Pode ser utilizado com a API Jena, descrita anteriormente. Essa ferramenta
implementa algoritmos que manipulam expresses em lgica de descrio. Ela pode
ser utilizada online, atravs da submisso da URI (Uniform Resource Identifier) de
sua ontologia ou do texto. O Pellet faz parte do conjunto de ferramentas
disponibilizado pelo grupo de Web Semntica da Universidade de Maryland,
conhecido como MindSwap.
Mais informaes e detalhes sobre o Pellet podem ser obtidas no seguinte
endereo: http://www.mindswap.org/2003/pellet/.

Em seguida veremos as caractersticas dos agentes voltados Web Semntica.

67

II.03.05 Agentes

Neste captulo sero expostas as caractersticas dos agentes de software.


Agentes so programas de software autnomos que agem em benefcio de
seus usurios. Um agente pessoal na Web Semntica, segundo Grigoris Antoniou e
Frank Harmelen, vai receber algumas tarefas e preferncias de um usurio, procurar
informaes nos recursos disponibilizados pela Internet (metadados e ontologias, por
exemplo), se comunicar com outros agentes e comparar informaes relativas s
tarefas que deve desempenhar, de modo a fornecer respostas adequadas ao usurio.

Veremos, a seguir, os principais agentes.

68

II.03.05.01 Principais Agentes

Neste captulo sero expostas as caractersticas dos principais agentes:

II.03.05.01.01 - CATO (Componente para Alinhamento Taxnomico de


Ontologias):
Segundo Karin Breitman, trata-se de uma iniciativa da PUC do Rio de
Janeiro. O CATO (Componente para Alinhamento Taxonmico de Ontologias)
uma ferramenta para o alinhamento de ontologias em OWL disponvel na Internet.
O CATO foi construdo baseado na viso de que a Web Semntica ser composta
por diversas aplicaes com ontologias parciais e respectivas contextualizaes.

II.03.05.01.02 - API Jena:


No seria bem um agente, embora alguns autores classifiquem dessa forma.
Ela, mais propriamente dita, pode ser utilizada para a construo de agentes. Mais
informaes sobre a API Jena foram detalhadas no item II.03.04.01.05.

II.03.05.01.03 - Servios Web Semnticos


Os Servios Web Semnticos so utilizados como componentes de software
distribudos pela Internet e podem realizar tarefas complexas de aplicaes. Eles
podem ser modificados sem que as aplicaes que os utilizam tenham que ser
adaptadas. Os Servios Web so popularmente conhecidos no Brasil pelo termo em
ingls: web services. A natureza dos web services a utilizao do protocolo HTTP18 e
com isso conseguimos que eles sejam utilizados por aplicaes que sejam executadas
em qualquer plataforma.

HTTP: o acrnimo para HiperText Transfer Protocol que significa Protocolo de


Transferncia de Hipertexto e um protocolo de comunicao muito utilizado na Web.
18

69

Entretanto, o uso desses servios ainda oferece desafios: encontrar o servio


necessrio; compor um conjunto desses servios para atender a tarefas complexas e
monitorar um desses servios ou uma composio deles, com o intuito de garantir o
sucesso na execuo da tarefa.

Um exemplo de utilizao o seguinte caso: uma aplicao no domnio da


adaptao de contedo. A adaptao realizada por um servio de traduo de
linguagens de marcao. Baseia-se em informaes sobre o ambiente de uso de
dispositivos mveis, por exemplo: preferncias do usurio, rede de acesso, contrato
com o provedor de servios, caractersticas do dispositivo, contedo a ser adaptado.
Essas informaes so descritas em ontologias e denominadas perfis, a fim de que
pginas da Web possam ser acessadas por esses dispositivos [Santana et al., 2007].
Para facilitar o entendimento dos requisitos dessa aplicao, as Figuras 08 e
09 fornecem uma viso geral da sua arquitetura. Na Figura 08 um usurio acessa o
servio de adaptao de contedo atravs de um dispositivo mvel. Um Proxy de
Adaptao tem o papel de interceptar requisies desse dispositivo para um Servidor
de Contedo, que armazena contedo em seu formato original. Nesses Proxies esto
localizados os Agentes Mveis, que utilizam Servidores de Adaptao disponveis em
Servios Web Semnticos. Esses servidores realizam traduo de pginas HyperText
Markup Language (HTML) para Wireless Markup Language (WML) e adaptaes
das imagens presentes nessas pginas.

70

Figura 08 Adaptao Local de Contedo


Numa adaptao local, o fluxo de execuo tem inicio aps uma requisio
de um usurio (1) ser interceptada por um Proxy de Adaptao. Em seguida, este
Proxy de Adaptao requisita (2) e recebe (3), do Servidor de Contedo, o contedo
a ser adaptado. De posse desse contedo, o Proxy de Adaptao delega ao seu agente
a tarefa de realizar a adaptao necessria. Baseando-se na requisio e nos perfis,
esse agente encontra, compe e monitora a execuo (4) dos Servios Web
Semnticos necessrios.
Finalmente, o Proxy de Adaptao recebe (5), armazena em sua memria
(cache), e envia os contedos adaptados ao Usurio (6).

Figura 09 Adaptao Remota de Contedo


71

A Figura 09 considera o caso de uma adaptao remota, quando necessrio


um Servio Web Semntico que no est disponvel no Proxy de Adaptao de
Origem, nesse exemplo a adaptao de HTML para Compact HTML (cHTML19). A
requisio do usurio interceptada por um Proxy de Adaptao (1), o agente do
Proxy da Adaptao de Origem migra para um Proxy de Adaptao Remoto (2),
requisita (3) e recebe (4) o contedo a ser adaptado. No Proxy de Adaptao Remoto
o Agente utiliza o Servidor de Adaptao necessrio (5) e (6), realiza a adaptao e
retorna ao Proxy de Adaptao de Origem (7) para enviar o contedo adaptado ao
Usurio (8).

Existem diversos trabalhos que empregam ontologias, servios Web e agentes


de software para apoiar o processo de desenvolvimento de software. Alguns tm
foco apenas nas ontologias como o de [Linhalis e Moreira 2006], que utiliza
linguagem natural para descrever os requisitos dos componentes de software, que
posteriormente so transformadas em ontologias. A abordagem proposta utiliza os
modelos de ontologias complementados por modelos em UML (Unified Modeling
Language).
Em [Elias et al. 2006] proposto um repositrio de componentes que utiliza
descries sintticas baseadas em XML para representao de metadados. A
abordagem proposta utiliza a linguagem OWL-S - que tem semntica para descrever
os componentes de Servios Web Semnticos.
O trabalho de [Ha e Lee, 2006] utiliza Servios Web Semnticos num
ambiente especfico de e-business. A abordagem proposta genrica e tambm pode
ser empregada em outros domnios de aplicaes.

cHTML: acrnimo para Compact HTML trata-se de um subgrupo do HTML para alguns
telefones mveis.
19

72

Dentre os trabalhos que utilizam Agentes de Software para busca,


composio e monitoramento de Servios Web Semnticos destaca-se o de [CharifDjebbar e Sabouret, 2006]. Este trabalho prope uma abordagem baseada em
sistemas multiagentes, na qual os agentes possuem um protocolo de interao que
permite selecionar e compor os servios. Na abordagem proposta os agentes podem
migrar atravs dos diferentes ns da rede, para utilizar os Servios Web Semnticos
que esto distribudos.

Poucos agentes foram listados, e isso porque, segundo a pesquisa realizada, a


Web Semntica encontra-se ainda em sua fase embrionria ou muita classificao,
atravs de ontologias, e qualificao, atravs de metadados, ainda precisam ser
realizadas para que mais agentes sejam desenvolvidos e/ou efetivamente utilizados,
como se deseja, em termos de autonomia e relevncia. Inclusive o agente CATO,
acima mencionado - o site relacionado pela literatura no apresentou disponibilidade
no incio de 2009 e por isso seu endereo no foi mencionado nem listado, no final
deste trabalho, na bibliografia atravs de sites da Internet.

Mas no bastam classificaes ou qualificaes adequadas para utilizar


agentes. E tambm no basta para que o contedo seja apropriado, considerarmos
apenas os metadados e a classificao de contedo atravs de ontologias, precisamos
tambm considerar a otimizao dos mecanismos de busca para que tenhamos
contedo com relevncia. E isso porque tambm no podemos descartar os
mecanismos de busca dos buscadores como sendo agentes voltados Web
Semntica. o que veremos no captulo a seguir.

73

II.04 Como organizar o contedo para que os mecanismos de


busca sejam mais eficientes

este captulo sero expostas algumas das principais caractersticas que


devem ser consideradas para a otimizao dos mecanismos de busca.

Essa otimizao mais conhecida pelo termo em ingls: SEO (Search Engine
Optimization).
No basta, para que o contedo seja apropriado, considerarmos apenas os
metadados e a classificao de contedo atravs de ontologias, precisamos tambm
considerar a otimizao dos mecanismos de busca.
Segundo Jerri L. Ledford, um site bem otimizado e com timos rankings nos
maiores buscadores, leia-se principalmente o Google, mas tambm o Yahoo, garante
muitas visitas ao site pois hoje em dia o mais comum que os internautas faam suas
visitas a partir dos buscadores. No entanto, os buscadores no abrem explicitamente
todos os seus critrios para ranking dos sites, pois muitos podem utilizar essas
informaes de critrios para exatamente burlar os buscadores e fazer com que o site
obtenha melhores rankings artificialmente. Exemplo seria o Google deixar explcito
que a quantidade de palavras na pgina que coincidam com a palavra-chave da busca
seja um critrio muito eficaz, o que at pode ser. Muitos poderiam colocar a palavra
com fonte reduzidssima no final da pgina simplesmente para melhorar seu ranking.
Sendo assim, sem uma sequncia de passos muito especfica pois os buscadores no
explicitam isso, podemos resumir os critrios de SEO, com nfase na Web
Semntica, com o que deve ser evitado, conforme segue:
- Priorizar busca antes do usurio:
A otimizao um processo que objetiva colocar um site nas listas dos
resultados de buscas mais relevantes. A razo para perseguir com afinco o topo desta
lista atrair trfego de relevncia. Assim, surpreendente que, na nsia de obter esse
resultado, muitos sites acabem esquecendo o seu pblico-alvo ou seus usurios.
Exemplo disso, seria aumentar o maior nmero possvel de palavras-chave
em cada pgina do site isso pode garantir bons resultados no incio, mas tambm
poder afugentar visitantes. Aos olhos do usurio, textos bem escritos ainda
prevalecem sobre o ranking dos buscadores.
74

Melhor a classificao e qualificao atravs de metadados que no


prejudicam a navegao do usurio e melhoram o ranking do site em relao aos
buscadores.

- Link spamming:
Trata-se do termo em ingls para fazer com que o link do site se espalhe e seja
colocado em outras pginas (o que incluria, at mesmo, a pouco recomendvel
prtica de responder tpicos em fruns e blogs s para ser referenciado). O fato aqui
que os links conseguidos so de pouca relevncia ou de valor comercial reduzido.
Os mecanismos de busca avaliam os links baseando-se na relevncia do site que os
inclui, de maneira que se utilizar do link spamming na verdade poder rebaixar sua
classificao ou, na melhor das hipteses, no ajudar na qualificao.
O ideal utilizar uma poltica mais eficiente utilizando-se de campanhas
estrategicamente direcionadas, focando a construo de links em sites com afinidade e
bem qualificados. A estratgia de focar os esforos em sites relevantes resulta numa
maior probabilidade de tambm atingir a audincia desejada.

- Negligenciar links de texto:


O txto-ncora de cada link de uma pgina deve ser escrito o mais
cuidadosamente possvel, uma vez que os mecanismos de busca como o do Google
so capazes de avaliar a qualidade e a quantidade dos links internos de um site. Textos
sem imaginao do tipo clique aqui no ajudam nem na experincia do usurio nem
na busca.

- No rastrear o progresso:
praticamente impossvel determinar a eficincia de uma otimizao se no
h marcao do ponto de partida. O rastreamento frequentemente negligenciado,
pois muitos pensam que basta acompanhar as listagens dos sites de buscas. No s
isso: o nmero de vendas e as novas incluses de busca so importantes. Mas no
devem ser adotados como parmetros exclusivos para determinar o sucesso da
75

estratgia de SEO. Um relatrio peridico e confivel desses fatores pode determinar


mudanas de rumo e verificar o impacto de alguma eventual alterao.

- Escolher palavras-chave ruins:


Alguns profissionais de SEO propem garantias de resultados imediatos, mas
eles se baseiam em palavras-chave ruins, com pouca afinidade ao site em especfico.
Isso pode propiciar resultados sem relevncia. Exemplo disso seriam palavras-chave
que envolvam nomes de produtos e modelos - elas so de uso restrito numa
estratgia de otimizao, pois tendem a ser muito pouco eficientes. Exemplificando:
lancha com cabine melhor que Brazilian Boat 230. Obviamente que os
metadados devem refletir esse aspecto pois eles afetaro os resultados de busca
tambm.

- Desconsiderar a acessibilidade:
Acessibilidade pode ser entendida em termos de disponibilizar o site para
pessoas com algum tipo de deficincia, inclusive visual e essa preocupao pode ser
um ponto crtico. Tornar seus links de texto bastante acessveis e deixar o site de
acordo com as normas do W3C s otimizaro o site, ou seja, permitiro melhorar os
resultados do site, em todos os aspectos.

- No criar uma estratgia de SEO:


Planejar uma campanha anlogo ao planejamento de uma viagem. Um dos
erros mais comuns cometidos pelos incautos se precipitar no lanamento do site e
deixar de mapear os pontos de interesse pelo caminho. Em vez de focar no objetivo
final, muito melhor ou mais fcil, determinar objetivos de curto prazo que, juntos,
formem o caminho para o to desejado primeiro lugar no ranking de um Google, por
exemplo.

76

III Concluso

ntegrando os conceitos para oferecer contedo apropriado, vemos que


um site que apresente metadados no padro RDF, que nada mais que um

XML com namespaces adequados e que permite a devida identificao e qualificao


do metadado tornar o contedo mais acessvel e devidamente desenvolvido para
que a Web Semntica e todos os seus subsequentes recursos sejam mais bem
utilizados.
A utilizao de ontologias ou a criao de uma ontologia utilizando o Protg,
que bastante amigvel e permite o rpido desenvolvimento de uma ontologia so
boas prticas ao contedo semntico, conforme foi exposto nesta dissertao. Mas
reinventar a roda uma opo que no ser necessria na maioria dos casos, pois a
utilizao de ontologias j prontas, inclusive atravs de alinhamento e integrao de
ontologias, permite a devida classificao, hierarquizao e relacionamentos de
informaes classificadas.
Tambm podemos utilizar agentes para disponibilizar contedo apropriado
mirade de usurios que um site de contedo pode apresentar. Ou ento, para ajudar a
relacionar esses dados de forma mais apropriada. E conforme a Web Semntica, com
seus conceitos e recursos, estiver sendo cada vez mais utilizada e difundida podemos
analisar a criao e oferta de agentes para que o contedo que for disponibilizado seja
alcanado como se espera pelos agentes que oferecermos.
As boas prticas de otimizao de mecanismos de busca, conforme foram
expostas, tambm sero cruciais para que o contedo seja bem classificado em sites de
busca como, por exemplo, o Google fator primordial Internet atual.
Os mecanismos de busca no possuem a habilidade de pensar, apenas
seguem uma sequencia de instrues ou regras dispostas em um algoritmo. No
porque um ser humano consegue entender o assunto de um site que ele ser listado
em um buscador. Criar uma pgina que acerte exatamente as instrues do algoritmo
do buscador pode levar a boas posies, mas ela poder ser pssima para a
experincia do usurio em termos de navegao na mesma.

77

Assim, existe um dilema na otimizao de nosso contedo, mas uma boa


regra, segundo Jerri L. Ledford, sempre colocar os usurios em primeiro lugar.
Seria ruim ter um excelente trfego a partir de palavras-chave teis para um site
pssimo, pois ele perder relevncia aos usurios e poder, com o tempo, deixar de
ter um trfego minimamente desejvel.
No existe uma sequencia de passos pr-definida que atenda a todas as
situaes possveis e no o escopo dessa dissertao apresentar uma espcie de
caminho nico ou mgico que propiciar excelentes resultados. Ela permite que
sejam conhecidas, discutidas ou refletidas as principais questes que a
disponibilizao de contedo apropriado oferece e nesse sentido apresenta diversas
possibilidades de solues que devidamente combinadas podero ser bem-sucedidas
- conforme o que foi exposto nos captulos anteriores. Tudo forma um quadro que
levar realidade de uma Web Semntica, Web 3.0 ou Web do Futuro.
Um dos sonhos dos criadores da Web a Web Semntica, proposta por Tim
Berners-Lee, que, resumindo o que j foi explanando ao longo da dissertao,
consiste em documentos organizados de tal forma que facilitem a coleta, pesquisa e
cruzamento de informaes de maneira automtica e baseada no significado real do
contedo desses documentos ao contrrio da simples pesquisa por palavras-chave
que realizada pelas atuais ferramentas de busca. Embora muitas pessoas tenham
dvida em relao a expanso da Web Semntica, ningum tem dvidas de que ela
depender muito da aplicao de padres compreensveis tanto para pessoas como
para mquinas. E se pensarmos em uma Internet em que agentes forneam opes
inteligentes de contedo, muito pode e deve ser desenvolvido nessa parte, pois essa
a maior lacuna que vemos atualmente talvez porque muito ainda precise ser
efetivamente classificado para termos pesquisas semnticas com inteligncia que nos
levariam a inmeras opes de escolha com pr-selees realizadas pelos agentes.
Enfim, um campo imenso para pesquisa e desenvolvimento est aberto.
A dissertao procurou mostrar os benefcios que poderiam ser obtidos se os
computadores fossem capazes de entender as informaes disponveis na Web e,
dessa forma, realizar parte do trabalho que grande parte dos internautas executa
manualmente. Procuramos mostrar que o objetivo da Web Semntica criar uma
Web mais adequada s necessidades de seus usurios e que muita tecnologia tem sido
78

desenvolvida e disponibilizada de modo a permitir que se adicione semntica a


pginas e aplicativos para realizar tudo isso.
Segundo Berners-Lee, a coordenao das diversas comunidades ou
subculturas dolorosamente lenta e requer muita comunicao. Claro que uma
linguagem comum essencial para esse processo. Talvez a Web Semntica seja capaz
de fornecer essa linguagem. Segundo Berners-Lee, Hendler e Lassila, se
conseguirmos projetar essa futura Web Semntica poderemos ajudar na evoluo do
conhecimento humano como um todo.

79

Notas

- Este trabalho foi escrito atendendo s normas do Novo Acordo


Ortogrfico vigente a partir de janeiro de 2009.

- Todas as pginas ou endereos Web discriminados neste trabalho estavam


acessveis durante o ms de fevereiro de 2009.

80

Glossrio

Feed: O termo feed vem do verbo em ingls "alimentar". Na Internet, este


sistema tambm conhecido como "RSS Feeds" (RDF Site Summary ou Really
Simple Syndication). Na prtica, feeds so usados para que um usurio de internet
possa acompanhar os novos artigos e demais contedos de um site sem que precise
visitar o site em si. Sempre que um novo contedo for publicado em determinado site,
o "assinante" do feed poder ler imediatamente ao receber um arquivo no formato
XML com o contedo adequado.
Heurstica: Denomina-se heurstica capacidade de um sistema fazer
inovaes e desenvolver tcnicas de forma imediata e positivas para um determinado
fim.
Namespace: Espao nominal ou mais popularmente conhecido no Brasil
pelo termo em ingls: namespace utilizado para eliminar a confuso de nomes ao
combinar formatos. RDF um bom exemplo de formato XML que utiliza espao
nominal. Nesse espao nominal voc pode evitar confuses com elementos ou
atributos homnimos: <p> significa pargrafo ou pessoa? Voc pode definir no
namespace o que significa o elemento ou atributo utilizado ou definir um novo
formato de documento, inclusive combinando ou reutilizando outros formatos.
Proxy: Servidor que atende a requisies e repassa os dados a outros
servidores ou para usurios em geral. Eles podem filtrar contedo, verificar
autenticao etc.
Tag: Etiqueta utilizada em pginas Web que pode conter alguma informao
a respeito do documento ou que pode ser utilizada para uma linguagem para sua
devida interpretao, como as etiquetas do padro HTML, por exemplo: <head>,
<body>, <a> etc.

81

Referncias Bibliogrficas

Impressas:

Aguado, G. et al. Ontogeneration reusing domain and linguistic


ontologies for Spanish text generation European Conference on
Artificial Intelligence Brighton, England, 1998.
Antoniou, G.; Harmelen, F. A Semantic Web Primer Cambridge,
Massachussets: MIT Press, 2004.
Barceinas Guevara, A. - Un Marco de Comunicacin Inter-Agentes
en una Biblioteca Digital. Tesis Licenciatura. Ingeniera en Sistemas
Computacionales. Departamento de Ingeniera en Sistemas
Computacionales, Escuela de Ingeniera, Universidad de las Amricas,
Puebla. Mayo.
Derechos Reservados - Universidad de las Amricas, Puebla, 1998.
Bateman, J.; Magnini, B.; Fabris, G. The generalized upper model
knowledge base organization and use Conference on Knowledge
Representation and Sharing The Netherlands, 1995.
Berners-Lee, T.; Lassila, O.; Hendler, J. The Semantic Web
Scientific American, 2001.
Bond, F. et al. Design and construction of a machine tractable
Japanese-Malay lexicn Annual Meeting of the Association for
Natural Language Processing, 2001.
Breitman, Karin Koogan Web Semntica: a Internet do Futuro
Rio de Janeiro: LTC, 2005.
Buitelaar, Paul Semantic lexicons: between ontology and
terminology Proceedings of Ontolex: Ontologies and Lexical
Knowledges Bases 2000. OntoText Lab.: Sofia, Bulgaria, 2001.
82

Charif-Djebbar, Y; Sabouret, N. - Dynamic Service Composition


and Selection through an Agent Interaction Protocol. Anais da
International Conference on Web Intelligence and Intelligent Agent
Technology, p. 105-108, 2006.
Eco, Umberto - A Busca da Lngua Perfeita 2 edio Bauru/SP:
EDUSC, 2001.
Eco, Umberto Como se faz uma Tese 20 edio So Paulo:
Editora Perspectiva, 2006.

Elias, G.; Schuenck, M.; Negcio, Y.; Dias, J.; Filho, M. - X-ARM:
an asset representation model for component repository systems
Anais do Symposium on Applied Computing, p. 1690 1694, 2006.

Fernndez-Lpez, M. et al. Building a chemical ontology using


methotology and the ontology design environment. IEEE
Intelligent Systems & their Applications, p. 37-46, 1999.
Frederking, R.; Nirenburg, S. Three heads are better than one,
Proceedngs of the Fourth Conference on Applied Natural Language
Processing, Stuttgart, Germany, 1994.
Gmez-Prez, A.; Corcho, O. Ontology Languages for the
Semantic Web. The IEEE Intelligent Systems, January/February,
2002.
Guimares, F. Z. - Utilizao de ontologias no domnio B2C
Dissertao de Mestrado PUC-RJ, 2002.
Ha, Y.; Lee, R. Integration of Semantic Web Service and
Component-Based Development for e-business environment Anais
da International Conference on Software Engineering Research,
Management and Applications, p. 315 323, 2006.
Heflin, J.; Hendler, J.; Luke, S. SHOE: A Knowledge
Representation Language for Internet Applications. Technical Report
CS-TR-4078 (UMIACS TR-99-71), 1999.

83

Hendler, J. Agents and the Semantic Web IEEE Intelligent


Systems, 2001.
Horrocks, I.; Sattler, U.; Tobies, S. Practical reasoning for
expressive description logics. Logic Journal of the IGPL, v. 8, n. 3, p.
239-264, May, 2000.
Ledford, Jerri L. Search Engine Optimization Bible 1st edition Indianapolis: Willey Publishing Inc., 2008.
Linhalis, F.; Moreira, D.A. - Ontology-Based Application Server to
the Execution of Imperative Natural Language Requests. Anais do
International Conference on Flexible Query Answering Systems, p.
589-600, 2006
Luger, George F. Inteligncia Artificial: estruturas e estratgias para
a soluo de problemas complexos 4 edio Porto Alegre:
Bookmann, 2004.
Maedche, A. Ontology Learning for the Semantic Web 1 edio
Kluwer Academic Publisher 272p., 2002.
Matos, L. et al. Segredos do Google So Paulo: Digerati Books,
2004.
Miller, George A. WordNet: a lexical database for English
Communications of the ACM, v. 38, n. 11, p. 39-41, 1995.
Moreno, A. O.; Hernndez, C. P. - Reusing the Mikrokosmos
Ontology for concept-based multilingual terminology databases.
International Conference on Language Resources & Evaluation Athens, 2000.
Noy, N.; Musen, M. The Prompt Suite: Interactive Tools For
Ontology Merging And Mapping. International Journal of HumanComputer Studies, 2003.
Ogino, T. et al. An experiment on matching EDR concept
classification dictionary with WordNet. IJCAI-97 Workshop WP24
Ontologies and Multilingual, 1997.
84

Rsner, D.; Stede, M. Techdoc: multilingual generation of online


and offline instructional text. Disponvel em:
http://acl.ldc.upenn.edu/A/A94/A94-1044.pdf, 1994.
Salam, A. F./Stevens, Jason R. Semantic Web Technologies and EBusiness University of North Carolina e-book 2007.
Santana, L.; Prado, A.; Souza, W.; Biajiz, M. Usando Ontologias,
Servios Web Semnticos e Agentes Mveis no Desenvolvimento
Baseado em Componentes UFSCar So Paulo/SP, 2007.
Silva, A. C. Gesto de Conhecimento: linguagem, forma e impacto
na comunicao em redes de informao Tese de Doutorado em
Comunicao e Semitica So Paulo: PUC/SP, 2005.
Teich, E.; Bateman, A.; Maier, A.; Wanner, L. - Towards an
architecture for situated text generation - International Conference on
Current Issues in Computational Linguistics, Penang, Malaysia.
Tambm disponvel em: Technical Report of GMD/Institut fr
Integrierte Publikations- und Informationssysteme, Darmstadt,
Germany, 1991.
Towards the Semantic Web: Knowledge Representation in a
Dynamic Distributed Environment, by Jeff Heflin. Ph.D. Thesis,
University of Maryland, College Park, 2001.
Vossen, P. EuroWordNet: A Multilingual Database with Lexical
Semantic Networks, Kluwer Academic Publishers, Dordrecht, 1998.
Wiley, John - Towards the Semantic Web Onthology-Driven
Knowledge Management England, 2003.

85

Sites da Internet:

Almeida, M.; Bax, M. Uma viso geral sobre ontologias: pesquisa


sobre definies, tipos, aplicaes, mtodos de avaliao e de
construo Disponvel em:
http://revista.ibict.br/index.php/ciinf/article/viewArticle/17/11.
Beale, S.; Nirenburg, S.; Mahesh, K. Semantic analysis in the
mikrokosmos machine translation project Proceeding of the Second
Symposium on Natural Language Processing Disponvel em:
http://crl.nmsu.edu/users/sb/papers/thai/thai.html.
Chimaera Disponvel em:
http://www.ksl.stanford.edu/software/chimaera/.
DAML Disponvel em: http://www.daml.org/.
Doctorow, C. Metacrap: Putting the Torch to Seven Straw Men of
the Meta Utopia - Disponvel em:
http://www.well.com/~doctorow/metacrap.htm.
FaCT Disponvel em:
http://www.cs.man.ac.uk/~horrocks/FaCT/.
Germann, U. - Making semantic interpretation parser-independent
Proceedings of the AMTA Conference, 1998. Disponvel em:
http://www.isi.edu/natural-language/people/germann/.
Informaes e downloads sobre Raimundo Llio e a Ars Magna:
http://lullianarts.net/downloads.htm; http://www.ramonllull.net.
Informaes sobre o padro MARC:
http://www.loc.gov/marc.
Jena (API Java) Disponvel em: http://jena.sourceforge.net.
Milstead, J.; Feldman, S. Metadata cataloging by any other name.
On Line Magazine, New Haven, v. 23, n. 1, 1999.
86

Disponvel em:
http://www.infotoday.com/nom99/nomprogram.htm.
Noy, F. N.; McGuinness, D. L. - Ontology development 101: a guide
to create your first ontology. Stanford University, USA, 2002.
Disponvel em:
http://ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noymcguinness.doc.
Pellet Disponvel em: http://www.mindswap.org/2003/pellet/.
OIL Disponvel em: http://www.ontoknowledge.org/oil/.
Ontology.org http://www.ontology.org.
OWL Disponvel em: http://www.w3.org/TR/owl-ref/.
Protg Disponvel em: http://protege.stanford.edu/.
RDF W3C RDF Primer Disponvel em: http://www.w3.org.
SHOE Disponvel em:
http://www.cs.umd.edu/projects/plus/SHOE/.
Simplicity Media Survey Disponvel em:
http://simplicity.media.mit.edu.
SNOBASE Disponvel em:
http://www.alphaworks.ibm.com/tech/snobase.

87

Anexos

Anexo 01 - Exemplo de Arquivo utilizando SHOE:


<HTML>
<HEAD>
<TITLE>Princeton SHOE Data</TITLE>
<META HTTP-EQUIV="SHOE" CONTENT="VERSION=1.0">
</HEAD>
<BODY>
<A HREF="http://www.cs.umd.edu/projects/plus/SHOE">
<IMG SRC="http://www.cs.umd.edu/projects/plus/SHOE/images/SHOEpage.gif" ALT=""
VALIGN=TOP ALIGN=RIGHT BORDER=0>
</A>
<H1>Princeton Summary Data</H1>
<P>This page contains SHOE information for the
<A
HREF="http://www.cs.princeton.edu/">Princeton
Science</A>. The SHOE data includes:

Department

of

Computer

<UL>
<LI>Basic university information
<LI>Basic department information
<LI>Faculty
</UL>
<INSTANCE KEY="http://www.cs.princeton.edu/">
<USE-ONTOLOGY
ID="cs-dept-ontology"
VERSION="1.0"
PREFIX="cs"
"http://www.cs.umd.edu/projects/plus/SHOE/onts/cs1.0.html">
<CATEGORY NAME="cs.University" FOR="http://www.princeton.edu/">
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.princeton.edu/">
<ARG POS="2" VALUE="Princeton University">
</RELATION>
<CATEGORY NAME="cs.Department" FOR="http://www.cs.princeton.edu/">
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="Princeton Department of Computer Science">
</RELATION>
<RELATION NAME="cs.subOrganization">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.princeton.edu/">
</RELATION>

URL=

</INSTANCE>
<INSTANCE KEY="http://www.cs.princeton.edu/fac/">
<USE-ONTOLOGY
ID="cs-dept-ontology"
VERSION="1.0"
PREFIX="cs"
URL=
"http://www.cs.umd.edu/projects/plus/SHOE/onts/cs1.0.html">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~appel">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~arora">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~august">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~chazelle">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~doug">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~prc">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~dpd">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~felten">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~af">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~funk">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~bwk">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~li">
<CATEGORY NAME="cs.Faculty" FOR="http://www.cs.princeton.edu/~sahai">

<CATEGORY
<CATEGORY
<CATEGORY
<CATEGORY
<CATEGORY
<CATEGORY
<CATEGORY
<CATEGORY

NAME="cs.Faculty"
NAME="cs.Faculty"
NAME="cs.Faculty"
NAME="cs.Faculty"
NAME="cs.Faculty"
NAME="cs.Faculty"
NAME="cs.Faculty"
NAME="cs.Faculty"

FOR="http://www.cs.princeton.edu/~rs">
FOR="http://www.cs.princeton.edu/~jps">
FOR="http://www.cs.princeton.edu/~mona">
FOR="http://www.cs.princeton.edu/~ken">
FOR="http://www.cs.princeton.edu/~ret">
FOR="http://www.cs.princeton.edu/~rywang">
FOR="http://www.cs.princeton.edu/~wayne">
FOR="http://www.cs.princeton.edu/~yao">

<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~appel">
<ARG POS="2" VALUE="Andrew Appel">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~arora">
<ARG POS="2" VALUE="Sanjeev Arora">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~august">
<ARG POS="2" VALUE="David August">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~chazelle">
<ARG POS="2" VALUE="Bernard Chazelle">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~doug">
<ARG POS="2" VALUE="Douglas Clark">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~prc">
<ARG POS="2" VALUE="Perry Cook">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~dpd">
<ARG POS="2" VALUE="David Dobkin">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~felten">
<ARG POS="2" VALUE="Edward Felten">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~af">
<ARG POS="2" VALUE="Adam Finkelstein">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~funk">
<ARG POS="2" VALUE="Thomas Funkhouser">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~bwk">
<ARG POS="2" VALUE="Brian Kernighan">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~li">
<ARG POS="2" VALUE="Kai Li">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~sahai">
<ARG POS="2" VALUE="Amit Sahai">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~rs">
<ARG POS="2" VALUE="Robert Sedgewick">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~jps">
<ARG POS="2" VALUE="Jaswinder Singh">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~mona">
<ARG POS="2" VALUE="Mona Singh">

</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~ken">
<ARG POS="2" VALUE="Kenneth Steiglitz">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~ret">
<ARG POS="2" VALUE="Robert Tarjan">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~rywang">
<ARG POS="2" VALUE="Randy Wang">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~wayne">
<ARG POS="2" VALUE="Kevin Wayne">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/~yao">
<ARG POS="2" VALUE="Andrew Yao">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~appel">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~arora">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~august">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~chazelle">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~doug">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~prc">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~dpd">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~felten">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~af">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~funk">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~bwk">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~li">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~sahai">

</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~rs">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~jps">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~mona">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~ken">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~ret">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~rywang">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~wayne">
</RELATION>
<RELATION NAME="cs.member">
<ARG POS="1" VALUE="http://www.cs.princeton.edu/">
<ARG POS="2" VALUE="http://www.cs.princeton.edu/~yao">
</RELATION>
</INSTANCE>
</BODY>
</HTML>

Anexo 02 Tabela Comparativa entre as linguagens OIL e


DAML:
Similaridades

Diferenas

Ambas oferecem suporte a hierarquias A OIL oferece melhor compatibilidade


de conceitos e propriedades, baseadas com RDF-Schema do que DAML.
nos relacionamentos de subclasse e
subpropriedade.
Ambas permitem que conceitos sejam A OIL foi projetada de modo a permitir
construdos a partir de outros conceitos a inferncia de modo completo e
utilizando combinaes dos conectivos eficiente.
OR, AND e NOT.

Algumas

construes

em

DAML fazem com que a inferncia em


DAML

se

torne

praticamente

impossvel.
Ambas permitem que sejam definidos o Em OIL podemos explicitar condies
domnio, o escopo e a cardinalidade das que sejam suficientes ou necessrias e
propriedades

que

vo

compor

as suficientes. A ltima opo permite a

restries dos conceitos.


Ambas

oferecem

classificao automtica de conceitos.


propriedades DAML permite a especificao de

transitivas e inversas.
Ambas oferecem apoio a tipos de dados
concretos (inteiros, cadeias etc.).

valores default, ou seja, valores que sero


inicializados se nenhum outro for
definido pelo modelador da ontologia. A
OIL,

no

entanto,

no

permite

utilizao de valores default, pois no


existe uma semntica formal clara para
trat-los.

Você também pode gostar