Você está na página 1de 10

A Web Semntica e suas contribuies para a

cincia da informao
Renato Rocha Souza INTRODUO
Doutorando em cincia da informao. Escola de Cincia da
Informao. Universidade Federal de Minas Gerais Surgida no incio dos anos 90, a World Wide Web*, ou
E-mail: rsouza@eci.ufmg.br
simplesmente Web, hoje to popular e ubqua, que,
no raro, no imaginrio dos usurios, confunde-se com
Ldia Alvarenga
Doutora em cincia da informao (UnB). Professora titular da Escola a prpria e balzaquiana Internet a infra-estrutura de
de Cincia da Informao. Universidade Federal de Minas Gerais redes, servidores e canais de comunicao que lhe d
E-mail: lidiaalvarenga@eci.ufmg.br sustentao. Se a Internet surgiu como proposta de um
sistema distribudo de comunicao entre computadores
para possibilitar a troca de informaes na poca da
Guerra Fria, o projeto da Web, ao implantar de forma
magistral o conceito de hipertexto imaginado por Ted
Resumo
Nelson & Douglas Engelbart (1962), buscava oferecer
O presente artigo apresenta o processo de atualizao por interfaces mais amigveis e intuitivas para a organizao
que passa a World Wide Web na sua transio para o que e o acesso ao crescente repositrio de documentos que
tem sido chamado de Web Semntica. Neste sentido,
se tornava a Internet. Entretanto, o enorme crescimento
busca-se identificar as tecnologias, as organizaes
associadas e o embasamento filosfico e conceitual alm das expectativas do alcance e tamanho desta
subjacentes a esta nova web. O artigo tambm procura rede, alm da ampliao das possibilidades de utilizao,
apresentar as imbricaes existentes com a cincia da fazem com que seja necessria uma nova filosofia, com
informao e as possibilidades de ampliao de escopo dos
seus objetos tradicionais de pesquisa com o aporte dos suas tecnologias subjacentes, alm da ampliao da infra-
novos padres e tecnologias que esto sendo desenvolvidos estrutura tecnolgica de comunicao.
no mbito da Web Semntica.
Para apresentar as mudanas por que est passando a
Palavras-chave
Web na transio para este novo patamar que tem sido
Web Semntica; Cincia da informao; Internet; Sistemas chamado de Web Semntica e avaliar alguns dos
de recuperao da informao; Hipertexto. impactos deste fenmeno, convm explorar brevemente
os conceitos inerentes aos sistemas de recuperao de
informaes, sua funcionalidade, e estabelecer algumas
Web Semantics and its contributions to
categorias de anlise.
information science
A Web e os sistemas de recuperao de
Abstract informaes
This article explores the updating process that is taking place
in the World Wide Web in the transition to what is being
A dificuldade de conceitualizao do que um sistema
called The Semantic Web. In this sense, we try to identify de recuperao de informaes (SRI) advm, a princpio,
the technologies, the associated organizations and da ambigidade dos conceitos de sistema e de informao
institutions, the conceptualization and the philosophy that
underlie this new web. The article also tries to show the
em si (Arajo, 1995). Podemos adotar, entretanto, algumas
interconnections between the semantic web and the field of definies que faam sentido no escopo do assunto
information science, and how the semantic web technologies tratado e, desde j, assumimos que, ao falar de sistemas
can broaden the traditional information science research de recuperao de informaes, estamos falando em
subjects.
tecnologias para a recuperao de informaes registradas
Keywords em formato impresso ou digital.
Semantic Web; Information science; Internet; Systems of
information retrieval; Hypertext.

* Em uma traduo literal, Teia de Alcance Mundial.

132 Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004


A Web Semntica e suas contribuies para a cincia da informao

As metodologias e tecnologias associadas projetados e deve funcionar continuamente, medida


biblioteconomia e documentao e, mais recentemente, que novas informaes so adicionadas ao sistema.
cincia da informao surgiram como uma resposta s
necessidades causadas pelo papel cambiante que tomou Embora tenha sido projetada para possibilitar o fcil
o conhecimento humano e seus registros atravs dos acesso, intercmbio e a recuperao de informaes, a
tempos (Wersig, 1993). Com a exploso de documentos Web foi implementada de forma descentralizada e quase
disponveis, surgiram os diversos sistemas de informao anrquica; cresceu de maneira exponencial e catica e
que, mediante operaes de indexao, armazenamento se apresenta hoje como um imenso repositrio de
e recuperao, buscavam organizar e prover acesso documentos que deixa muito a desejar quando precisamos
informao registrada em documentos. Com o fenmeno recuperar aquilo de que temos necessidade. No h
contemporneo da crescente disponibilizao destes nenhuma estratgia abrangente e satisfatria para a
documentos em formato digital, vimos surgir e indexao dos documentos nela contidos, e a recuperao
ampliarem-se os sistemas informatizados de recuperao das informaes, possvel por meio dos motores de
de informaes. busca (search engines), baseada primariamente em
palavras-chave contidas no texto dos documentos
Prover aos usurios fcil acesso aos documentos atinentes originais, o que muito pouco eficaz. A dificuldade de
disponveis o objetivo dos SRIs. Para Lancaster & determinar os contextos informacionais tem como
Warner (1993, p. 4-5), os SRIs so uma interface entre conseqncia a impossibilidade de se identificar de forma
uma coleo de recursos de informao, em meio precisa a atinncia dos documentos. Alm disso, a nfase
impresso ou no, e uma populao de usurios, e das tecnologias e linguagens atualmente utilizadas nas
desempenham as seguintes tarefas: aquisio e pginas Web focaliza os aspectos de exibio e
armazenamento de documentos; organizao e controle apresentao dos dados, de forma que a informao seja
destes; distribuio e disseminao aos usurios. Esta pobremente descrita e pouco passvel de ser consumida
viso abrangente e inclui tarefas que so normalmente por mquinas e seres humanos. neste contexto que
associadas a atores humanos. Salton & Mcgill (1983, surge a proposta da Web Semntica.
p. 1) e, mais tarde, Baeza-Yates & Ribeiro-Neto (1999, p. 1)
definem SRIs como sistemas que lidam com as tarefas A WEB SEMNTICA
de representao, armazenamento, organizao e acesso A Web Semntica no uma Web separada, mas uma
aos itens de informao. extenso da atual. Nela a informao dada com um
H de se distinguir os sistemas de recuperao de significado bem definido, permitindo melhor interao
informaes dos sistemas de recuperao de dados, nos entre os computadores e as pessoas. Com estas palavras,
quais basta uma determinada condio a ser satisfeita Berners-Lee (2001) define os planos de seu grupo de
para que se tenha uma resposta exata, fruto de uma busca trabalho no World Wide Web Consortium* (W3C) para
completa e exaustiva. A recuperao de informaes traz operar a transformao que ir modificar a Web como a
dificuldades intrnsecas ao conceito de informao, conhecemos hoje. Web Semntica (Decker et alii, 2000
como a dificuldade da determinao da real necessidade & Berners-Lee et alii, 1999) o nome genrico deste
do usurio e seu melhor atendimento com os projeto, capitaneado pelo W3C, que pretende embutir
documentos que fazem parte do acervo do sistema inteligncia e contexto nos cdigos XML utilizados para
(Foskett, 1997, p.5). Isto nos traz problemas para as confeco de pginas Web, de modo a melhorar a forma
consultas, como baixas revocao* e preciso**. com que programas podem interagir com estas pginas
e tambm possibilitar um uso mais intuitivo por parte
Para a representao adequada de documentos, dos usurios.
necessrio criar sistemas de indexao eficazes, de forma
que a recuperao das informaes neles contidas, de Embora semntica signifique estudo do sentido das
acordo com as necessidades dos usurios, seja a mais palavras, Guiraud (1975) reconhece trs ordens
significativa possvel. A determinao do processo de principais de problemas semnticos:
indexao vivel no momento em que os sistemas so

* Razo do nmero de documentos atinentes recuperados sobre o


total de documentos atinentes disponveis na base de dados.
* Consrcio de empresas, profissionais, cientistas e instituies
** Razo do nmero de documentos atinentes recuperados sobre o acadmicas que responsvel pela criao de padres tecnolgicos
total de documentos recuperados. que regulam a World Wide Web.

Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004 133


Renato Rocha Souza / Ldia Alvarenga

1) a ordem dos problemas psicolgicos, que relaciona referncia, de forma que metadados sejam dados sobre
os estados fisiolgicos e psquicos dos interlocutores nos dados. Os metadados em documentos na Web tm a
processos de comunicao de signos; funo de especificar caractersticas dos dados que
descrevem, a forma com que sero utilizados, exibidos,
2) a ordem dos problemas lgicos, que estabelece as ou mesmo seu significado em um contexto.
relaes dos signos com a realidade no processo de
significao; A linguagem ainda utilizada atualmente para a construo
da maioria das pginas Web o HTML, ou HyperText
3) a ordem dos problemas lingsticos, que estabelece a Markup Language (linguagem de marcao em
natureza e as funes dos vrios sistemas de signos. hipertexto). A linguagem HTML derivada do padro
Guiraud confere terceira ordem de problemas o status SGML (Standard Generalized Markup Language), que
de semntica por excelncia (1976, p.8), mas o uso da , na verdade, uma metalinguagem, ou seja, uma
conotao semntica para a Web ampliada est ancorado linguagem para descrever outras linguagens. O padro
na segunda definio, e se justifica se observarmos as SGML baseado na idia de que documentos contm
aumentadas possibilidades de associaes dos documentos estrutura e outros elementos semnticos que podem ser
a seus significados por meio dos metadados descritivos. descritos sem que se faa referncia forma com que
Alm disso, as ontologias construdas em consenso pelas estes elementos sero exibidos. O conjunto de todas as
comunidades de usurios e desenvolvedores de aplicaes tags marcaes sintticas que descrevem os dados e
permitem o compartilhamento de significados comuns. comandos para manipulao de um documento passveis
de serem utilizadas por uma linguagem derivada do SGML
Berners-Lee (2001) imagina um mundo em que chamado de DTD, ou Document Type Definition.
programas e dispositivos especializados e personalizados,
chamados agentes, possam interagir por meio da infra- A linguagem HTML um conjunto definido de tags, ou
estrutura de dados da Internet trocando informaes um DTD especfico do SGML, e foi criada tendo em
entre si, de forma a automatizar tarefas rotineiras dos mente a necessidade de construo de documentos para
usurios. O projeto da Web Semntica, em sua essncia, serem exibidos em dispositivos de computador (na Web),
a criao e implantao de padres (standards) da sua vocao para tratar do formato que os dados
tecnolgicos para permitir este panorama, que no contidos no documento vo assumir ao serem exibidos.
somente facilite as trocas de informaes entre agentes Um navegador ou browser, ao ler um documento HTML,
pessoais, mas principalmente estabelea uma lngua interpreta as tags que este documento contm para decidir
franca para o compartilhamento mais significativo de como sero exibidos os dados tambm contidos. Os
dados entre dispositivos e sistemas de informao de navegadores atuais interpretam o HTML porque o DTD
uma maneira geral. para definio do HTML fixo, e conhecido a priori
pelo interpretador do navegador. Assim mesmo, podemos
Para atingir tal propsito, necessria uma padronizao ter navegadores diferentes interpretando definies de
de tecnologias, de linguagens e de metadados descritivos, exibio de forma particular, com resultados distintos
de forma que todos os usurios da Web obedeam a no dispositivo de sada. A estrutura do HTML rgida,
determinadas regras comuns e compartilhadas sobre no existindo a possibilidade de adio de novos
como armazenar dados e descrever a informao comandos de marcao (tags), sem que haja uma
armazenada e que esta possa ser consumida por outros redefinio do DTD da linguagem e conseqente
usurios humanos ou no, de maneira automtica e no atualizao dos navegadores para que interpretem estas
ambgua. Com a existncia da infra-estrutura tecnolgica novas tags. A ltima especificao do HTML lanada
comum da Internet, o primeiro passo para este objetivo pelo W3C foi a verso 4.0, e desde ento a linguagem
est sendo a criao de padres para descrio de dados no tem sofrido mais modificaes.
e de uma linguagem que permita a construo e
codificao de significados compartilhados. Para melhor A partir das limitaes do HTML e das necessidades de
entender estes padres e linguagens, vamo-nos debruar uma linguagem que pudesse descrever o contedo
a seguir um pouco mais sobre estes conceitos. semntico e os significados contextuais, alm da estrutura
e forma de exibio de documentos, foi criado o XML
SGML, HTML e XML (eXtensible Markup Language). O XML uma
recomendao formal do W3C e, em determinados
Um documento na Web composto por uma mistura de aspectos, assemelha-se ao HTML. Ambas so derivadas
dados e metadados. Meta um prefixo de auto- do SGML e contm tags para descrever o contedo de

134 Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004


A Web Semntica e suas contribuies para a cincia da informao

um documento. Mas, enquanto o HTML tem como e SGML, de forma a possibilitar a interoperabilidade
objetivo controlar a forma com que os dados sero dos sistemas internos da companhia.
exibidos, o XML se concentra na descrio dos dados
que o documento contm. Alm disso, o XML flexvel Metadados e o Dublin Core
no sentido de que podem ser acrescentadas novas tags No basta possuir uma linguagem flexvel como o XML
medida que forem necessrias, bastando para isso que para construir metadados. Para compartilhar um
estejam descritas em um DTD especfico; ou seja, significado, necessrio que este seja consensual e
qualquer comunidade de desenvolvedores pode criar suas inteligvel de forma no ambgua entre todos os
marcaes (tags) especficas que sirvam aos propsitos participantes de uma comunidade. Para resolver o
de descrio de seus dados. Isto possibilita que os dados problema da exploso de nomenclaturas diferentes e as
sejam descritos com mais significado, abrindo caminho vrias situaes em que a interpretao dos dados de
para embutirmos semntica em documentos da World maneira unvoca no possvel, foram criados, no escopo
Wide Web e nas intranets. O HTML 5.0 ou XHTML do projeto da Web Semntica, alguns padres de
o HTML 4.0 reescrito como se fosse um DTD especfico metadados, de construo de cdigo XML e uma nova
que segue o padro XML. significao para o termo ontologias, como vemos a seguir.
Os dados contidos nos documentos XML podem ser O padro Dublin Core uma iniciativa para criao de
exibidos em uma infinidade de maneiras, dependendo um vocabulrio controlado, mesmo que limitado, para
do dispositivo em que sero manuseados (telas de uso na Web, baseado no pressuposto de que a busca por
computador, celulares, PDAs etc.). Os documentos XML recursos de informao deve ser independente do meio
no contm, em si, as diretivas para exibio dos dados, em que esto armazenadas. composto de 15 elementos
e, para cada dispositivo-destino especfico, podemos de metadados (DCMI, 2003) e se baseia no padro
realizar uma transformao do documento originalmente MARC* (2003). Seus elementos so title (o nome dado
em XML para um documento passvel de ser exibido ao ao recurso, ou ttulo), creator (a pessoa ou organizao
usurio ou entendido e utilizado por outro dispositivo responsvel pelo contedo), subject (o assunto, ou tpico
tecnolgico. Esta transformao realizada utilizando- coberto pelo documento), description (descrio do
se a linguagem XSL (eXtensible Stylesheet Language), e contedo), publisher (o responsvel por tornar o recurso
cada arquivo XSL contm as definies de exibio ou ou documento disponvel), contributors (aqueles que
leitura de um ou vrios dispositivos especficos (tela do contriburam para o contedo), date (data em que o
computador, tela do celular, impressora, coletores de recurso foi tornado disponvel), type (uma categoria
dados, outros sistemas de informao etc.), no formato preestabelecida para o contedo), format (o formato no
que melhor convier (tabelas, grficos, seqncia de qual o recurso se apresenta), identifier (identificador
caracteres etc.). O arquivo XML passa por uma numrico para o contedo, tal como uma URL**), source
transformao definida pelo XSL, e o resultado um (fonte de onde foi originado o contedo), language (a
arquivo muito semelhante a um documento HTML linguagem em que est escrito), relation (como o contedo
comum. Desta forma, o trio XML, seu DTD especfico e se relaciona com outros recursos, como, por exemplo,
o XSL se apresentam como um conjunto de padres que se um captulo em um livro), coverage (onde o recurso
possibilitam o armazenamento, descrio significativa, est fisicamente localizado) e rights (um ponteiro ou link
intercmbio e exibio dos dados de forma personalizada. para uma nota de copyright). O Dublin Core Metadata
O padro XML aceito como o padro emergente para Initiative (DCMI) teve incio em 1995, ganhando o
troca de dados na Web. Mas, apesar de possibilitar aos nome da localidade onde se deu o encontro inicial,
autores a criao de suas prprias tags, em uma Dublin, Ohio, USA. Sua aceitao foi rpida e hoje
perspectiva computacional, h muito pouca diferena
* O MARC um padro para comunicao de informaes
entre as tags <AUTHOR> e <CREATOR>. Para que as bibliogrficas de forma que possibilite o entendimento por
marcaes semnticas criadas sejam utilizadas de forma dispositivos eletrnicos. uma iniciativa da biblioteca do Congresso
no-ambgua por comunidades maiores, so necessrios dos EUA.
alguns padres de compartilhamento mais universais. ** A URL, ou Uniform Resource Locator, um caso particular dos
O W3C e as comunidades de usurios tm procurado URI (Uniform Resource Identifier), que so os endereos que identificam
um ponto de contedo da World Wide Web, seja este uma pgina
prover estes padres, como abordamos em seguida.
de texto, vdeo, imagem, som etc. O tipo mais comum de URI a
URL, que descreve o endereo de uma pgina na Web (o servidor que
Muitas empresas esto migrando seus bancos de dados e a hospeda e o nome do documento neste servidor) e o mecanismo
bases de documentos para padres compatveis com XML (protocolo) utilizado para o acesso (HTTP, FTP etc.).

Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004 135


Renato Rocha Souza / Ldia Alvarenga

um padro internacional, com participantes de mais de QUADRO 1


20 pases. Existem duas formas para o padro Dublin Exemplo de cdigo XML
Core, a forma simples e a qualificada. Enquanto Simples
apenas especifica os padres para os 15 possveis pares
de atributo e valor, a qualificada aumenta a especificidade
dos metadados com informaes sobre codificao e
outras orientaes para o processamento dos documentos.

O padro RDF

O RDF ou Resource Description Framework uma


recomendao do W3C que deve vir a ser implementada
na confeco de pginas da Web Semntica. O RDF
encerra um padro de ontologias, para a descrio de
qualquer tipo de recurso Internet, como um site Web e
seu contedo. O RDF estabelece na verdade um padro
de metadados para ser embutido na codificao XML, e
sua implementao exemplificada pelo RDF Schema, do conhecimento, possamos recorrer aos metadados
ou RDFS, que faz parte da especificao do padro. consensuais e compartilhados. O padro RDF, as
A idia do RDF a descrio dos dados e dos metadados ontologias e os namespaces compartilhados vo permitir
por meio de um esquema de triplas de recurso- que qualquer indivduo ou organizao publique
propriedade-valor, e uma forma coerente de acesso aos informaes em sites Web de forma que produtos de
padres de metadados (namespaces*) publicados na Web software ou agentes possam interpretar a informao
(como o Dublin Core, ou outro namespace marcada semanticamente e agir sobre esta informao
compartilhado). Vejamos no quadro 1 um exemplo de de forma mais inteligente.
cdigo XML que utiliza trs diferentes namespaces.
Em resumo, so estes alguns dos benefcios do padro RDF:

prover um ambiente consistente para a publicao e


Nas segunda, terceira e quarta linhas de cdigo, vemos a utilizao de metadados na web utilizando a infra-estrutura
referncia aos namespaces utilizados pelo documento XML do XML;
o namespace do padro RDF, o do padro Dublin Core
e o namespace de especificao de Vcards (Visit Cards), prover uma sintaxe padronizada para a descrio dos
que padroniza a descrio dos dados comumente recursos e propriedades dos documentos na Web;
encontrados em um carto de visita. Uma vez
especificado um namespace, podemos utilizar seus permitir que aplicaes possam agir de forma
descritores de forma no-ambgua ao longo do inteligente e automatizada sobre as informaes
documento, fazendo sempre referncia a qual deles publicadas na Web, uma vez que seus significados so
estamos utilizando (ex: <v:Name>, <dc:Creator> ou </ mais facilmente inteligveis.
rdf:Description>). Podemos ter centenas ou milhares de O padro RDF ainda est em evoluo, e se estudam
namespaces de uso geral (como o da especificao Dublin solues para que a descrio dos namespaces seja feita
Core) ou especficos (como o do padro Vcard) publicados de forma mais inteligente e no repetitiva no escopo de
na Web, de forma que os metadados estejam sempre um documento e, alm disso, possam compreender mais
disponveis, e, sempre que precisarmos de um propriedades. Neste mbito, vamos falar um pouco mais
vocabulrio controlado para descrever algum domnio sobre um tipo mais genrico de namespace, que so as
ontologias.
* Um namespace (NS) define um vocabulrio controlado que identifica
um conjunto de conceitos de forma nica para que no haja Ontologias
ambigidade na sua interpretao. Os namespaces XML so conjuntos
de tipos de elementos e atributos possveis para cada tipo. As triplas
do RDF se baseiam em namespaces de forma que a cada recurso seja
A palavra ontologia deriva do grego onto (ser) e logia
associado uma dupla de propriedade e valor. Os namespaces podem (discurso escrito ou falado). Na filosofia, a ontologia
ser referenciados por meio de uma URI, que se constitui em um uma teoria sobre a natureza da existncia, de que tipos
repositrio compartilhado, e no-ambguo, onde usurios e programas
de coisas existem; a ontologia como disciplina
de validao de cdigo XML podem consultar a sintaxe e propriedades
semnticas dos conceitos cobertos. filosfica estuda tais teorias. Pesquisadores da Web e de

136 Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004


A Web Semntica e suas contribuies para a cincia da informao

inteligncia artificial adaptaram o termo aos seus prprios Agentes


jarges, e, para eles, uma ontologia um documento ou
arquivo que define formalmente as relaes entre termos O grande poder da Web Semntica s vai se realizar
e conceitos. Neste sentido, uma ontologia mantm quando forem criadas peas de programa que coletem
semelhanas com os tesauros, utilizados para definio contedo da Web de diversas fontes, processem estas
de vocabulrios controlados. Nas palavras do informaes e compartilhem os resultados com outros
SemanticWeb.org, programas. Estes programas so os agentes. Embora no
haja uma definio universal para o termo agente no
uma ontologia uma especificao de uma mbito da computao, podemos considerar o conceito
conceituao. designada com o propsito de habilitar disseminado de agentes como assistentes de tarefa, ou
o compartilhamento e reuso de conhecimentos, de forma seja, entidades de software que empregam tcnicas de
a criar compromissos ontolgicos, ou definies inteligncia artificial com o objetivo de auxiliar o usurio
necessrias criao de um vocabulrio comum. na realizao de uma determinada tarefa, agindo de
forma autnoma e utilizando a metfora de um assistente
As ontologias se apresentam como um modelo de pessoal.
relacionamento de entidades e suas interaes, em algum
domnio particular do conhecimento ou especfico a A tecnologia de agentes permite que se repense a natureza
alguma atividade. O objetivo de sua construo a da interao entre homem e computador, na qual esse
necessidade de um vocabulrio compartilhado para se ltimo torna-se um parceiro do usurio, cooperando para
trocarem informaes entre os membros de uma o alcance dos objetivos traados. Podemos esperar que o
comunidade, sejam eles humanos ou agentes inteligentes. futuro da computao seja caracterizado por uma
Diversos padres e linguagens para construo e completa delegao de tarefas por parte dos usurios aos
compartilhamento de ontologias na Web esto sendo computadores, sem a necessidade de qualquer tipo de
criados, todos baseados no XML, com algumas diferenas manipulao direta. A utilizao de agentes possibilita a
de sintaxe de marcao (tags). Alguns exemplos so o implementao de um estilo complementar de interao,
SHOE*, a Ontology Exchange Language (XOL)**, a chamado gerncia indireta, no qual o computador se
Ontology Markup Language (OML e CKML***) e a torna uma entidade ativa, dotada de certo grau de
Resource Description Framework Schema Language autonomia e capaz de realizar tarefas que auxiliem o
(RDFS)****. Existe uma proposta de extenso do RDF e usurio no desempenho de suas atividades, de acordo
o RDFS chamada OIL (Ontology Interchange com seus interesses.
Language)***** e seu sucessor DAML+OIL******.
Em Wooldridge & Jennings (1995), apresenta-se um
O DAML+OIL (DARPA Agent Markup Language conjunto de propriedades desejveis a um agente, a saber:
Ontology Interchange Language) uma linguagem
baseada no XML, desenhada para possuir muito mais autonomia, de modo a agir sem qualquer tipo de
capacidade que este na descrio de objetos e no seu interveno, possuindo controle sobre suas aes e
relacionamento; para expressar semntica e criar um alto estado interno;
grau de interoperabilidade entre sites Web. O OWL sociabilidade, de modo a interagir com outros agentes
uma linguagem de marcao semntica para publicao (artificiais ou humanos) por meio de algum tipo de
e compartilhamento de ontologias na Web e do linguagem de comunicao;
DAML+OIL. Um exemplo de um editor que suporta a
criao cooperativa de ontologias baseado na Web o reatividade, de modo a perceber alteraes em seu
Webonto*******. ambiente, reagindo a tempo;

proatividade, de modo a estar apto a tomar iniciativas,


* http://www.cs.umd.edu/projects/plus/SHOE/ em vez de simplesmente atuar em resposta ao ambiente;
** http://ecocyc.panbio.com/xol/xol.html
continuidade temporal, ou seja, est sendo executado
*** http://www.ontologos.org/ continuamente, ativamente ou em background,
**** http://www.w3.org/TR/PR-rdf-schema/ possivelmente captando informaes sobre o usurio e
***** http://www.ontoknowledge.org/oil/ sobre o ambiente, para melhor desempenhar suas
funes;
****** http://www.daml.org/
******* http://webonto.open.ac.uk/

Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004 137


Renato Rocha Souza / Ldia Alvarenga

orientao para objetivos, por ser capaz FIGURA 1


de interagir e desempenhar uma srie O roadmap da Web Semntica (SemanticWeb. Org, 2001)
diversa de aes isoladas, com objetivo de
executar uma tarefa mais complexa.

Em Nwana (1996), apresentada uma


tipologia para agentes na qual estes so
analisados segundo vrias dimenses:
mobilidade; presena de um modelo de
raciocnio simblico; exibio de um
conjunto ideal e primrio de atributos, tais
como autonomia, cooperao e
aprendizagem; papis desempenhados
pelos agentes; filosofias hbridas,
decorrentes da combinao das
caractersticas anteriores; atributos
secundrios, tais como versatilidade,
benevolncia, confiabilidade, qualidades
emocionais, entre outros. Com base
nessas caractersticas, Nwana classifica os
agentes como colaborativos, mveis, de
informao/Internet, reativos, hbridos,
inteligentes e de interface. compartilhadas (Ontology Construction Tools). Estas
ferramentas possibilitaro a existncia cada vez mais
A efetividade destes agentes de software vai aumentar ampla e disseminada de pginas web marcadas
exponencialmente medida que mais contedo marcado semanticamente (Annotated Web-Pages) com
semanticamente e passvel de ser entendido por metadados descritos em namespaces de domnio
mquinas estiver disponvel. A Web Semntica promete pblico (Metadata Repositor y) e com contedo
esta sinergia: mesmo os agentes que no tenham sido semntico compartilhado em seu significado pelas
expressamente desenhados para trabalhar em conjunto comunidades e usurios da web atravs das ontologias.
podero trocar informaes entre si, quando houver As ontologias criadas sero articuladas entre si por meio
semntica embutida nestes dados. de ferramentas especficas e meta-ontologias
A WEB SEMNTICA: A WEB SE APROXIMA (Ontologies Articulation Toolkits). Com uma estratgia
DE UM GRANDE SRI padronizada de indexao, podemos projetar sistemas
mais funcionais para recuperao da informao
A partir dos conceitos de sistemas de recuperao de armazenada.
informaes e das tecnologias apresentadas, vamos
entender um pouco mais o grande panorama da Web No mbito da recuperao e uso dos documentos, os
Semntica, com a ilustrao a seguir (figura 1). agentes, associados aos mecanismos de busca e
inferncia (Inference Engine) executaro o harvesting
(colheita) de informaes nos documentos anotados
Na figura 1, que ilustra o roadmap da Web Semntica semanticamente de maneira eficaz, porque sero capazes
(SemanticWeb.Org, 2001), podemos entender como as de compreender seus contedos, de modo que a
tecnologias se articulam entre si e como a Web Semntica informao seja mais significativamente utilizada pelos
aproxima a Web da funcionalidade plena de um sistema usurios (humanos e no humanos) da Web. Estes
de recuperao de informaes. Vamos associar as vrias podero acessar estas novas tecnologias por meio dos
entidades representadas e suas funcionalidades associadas portais comunitrios (community portals) ou mesmo
a seguir. dos portais corporativos das organizaes. Podemos
esperar que a Web tenha grande melhoria dos ndices de
No mbito da representao e indexao dos revocao e preciso no atendimento das necessidades
documentos, temos as ferramentas e tecnologias de informao, porque a semntica embutida nos
para anotao semntica das pginas web (Web- documentos permitir aos dispositivos de recuperao
Page annotation Tools) e para construo de ontologias evitar os problemas comuns de polissemia e sinonmia,

138 Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004


A Web Semntica e suas contribuies para a cincia da informao

alm de considerar as informaes em seus contextos namespaces da Web Semntica e, tambm, da lgica
de significado. formalizada do XML e do RDF.

A infra-estrutura da Internet e as intranets, no mbito Construo de novas interfaces com o usurio


das vrias organizaes, sero os dispositivos responsveis para sistemas de informao
pelo armazenamento e os canais por onde ocorre a
disseminao dos documentos, neste grande sistema de O estudo de interfaces dos sistemas de informao, como
informao. As tecnologias para implementao, assim os motores de busca, com o usurio, ganha um novo
como os prottipos destas ferramentas, j se encontram impulso com aumentadas possibilidades da Web
disponveis, e o processo de atualizao da Web est em Semntica, uma vez que a lgica intuitiva e natural do
pleno curso. A Web Semntica no trata de uma RDF permite que projetemos interfaces para sistemas de
revoluo, mas sim de uma evoluo da Web como a informao de forma mais intuitiva e coerente com o
conhecemos hoje. Trata-se principalmente da adoo de funcionamento cognitivo dos seres humanos. Alm disso,
padres de metadados e de compartilhamento destes com os agentes inteligentes, poderemos aprimorar e
padres, de forma que possamos melhor utilizar o vasto personalizar a utilizao dos perfis de usurios para que
repositrio de informaes disponvel da Web de maneira a interao destes com os sistemas seja mais significativa
mais produtiva, gil e significativa. e gil. A lgica de triplas do RDF casa-se sobremaneira
com a construo de mapas conceituais (Novak, 1977), e
A WEB SEMNTICA E A CINCIA DA podemos adotar estratgias de visualizao como as
INFORMAO geometrias hiperblicas (Lamping, 1995).

Como dissemos, acreditamos que, na convergncia destas Construo automtica de tesauros e


tecnologias e ferramentas apresentadas, podem surgir vocabulrios controlados
alternativas para suportar um uso mais significativo e
eficaz do grande patrimnio disponvel nas redes de Devido semntica genrica e formalizada do RDF (Ora
informao. Mas o que no foi dito que estes padres Lassila et alii, 1999), s possibilidades de se embutir
que esto sendo criados no limitam seu escopo de significado nos documentos e disponibilizao de
aplicabilidade Web. A palavra de ordem que se iniciou ontologias em diversas reas do conhecimento, podemos
com o XML interoperabilidade, ou seja, a esperar o surgimento de novas metodologias
possibilidade de sistemas diferentes conversarem entre automatizadas para criao de tesauros e vocabulrios
si. Tudo indica que os padres que esto sendo controlados, a partir da anlise das marcaes semnticas
desenhados para esta nova Web tambm sejam adotados dos documentos e das relaes trplices de recurso,
na arquitetura de bibliotecas digitais e de novos sistemas propriedade e valor, explicitadas pelo RDF.
de informao. Podemos esperar que estas tecnologias Indexao automtica de documentos
tambm tragam mudanas para a rea e a atividade dos
profissionais da cincia da informao. Podemos Por meio das ontologias e dos metadados utilizados,
exemplificar algumas atividades bem especficas que compartilhados e validados entre comunidades de
sero possibilitadas ou melhoradas com esta nova Web: interesse, podemos engendrar novas metodologias para
analisar automaticamente a atinncia de documentos e
Projetos de novos e melhorados motores de busca assim classific-los de maneira automtica ou semi-
Com a marcao semntica das informaes, h uma automtica.
nova mirade de possibilidades para o projeto de Gesto do conhecimento organizacional
mecanismos de recuperao de informaes. Nota-se uma
preocupao atual por parte dos maiores motores de De acordo com Teixeira Filho (2000), a gesto do
busca em se preparar para essa outra verso da Web conhecimento organizacional nasce da confluncia entre
(Marchiori, 1998), que constituda gradualmente de tecnologia da informao e administrao e se posiciona
um nmero cada vez maior de documentos marcados entre os campos da cultura organizacional, estratgia
semanticamente. Faz parte do escopo da cincia da empresarial e sistemas de informao de uma
informao o estudo de processos de indexao e organizao. Outros autores poderiam acrescentar o
recuperao de informaes e, nesta perspectiva, bem campo da educao corporativa e de recursos humanos,
provvel que venhamos a confrontar nossas linguagens e um dos campos de estudo da cincia da informao.
artificiais de indexao com as metodologias de marcao Podemos apontar a grande confluncia das tecnologias
semntica dos dados representadas pelos metadados e tornadas disponveis pela Web Semntica e as

Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004 139


Renato Rocha Souza / Ldia Alvarenga

necessidades de gesto do conhecimento organizacional. CONCLUSES


Com o aumento das possibilidades de recuperao de
documentos e da interoperabilidade entre os sistemas, O objetivo deste artigo , alm de oferecer uma amostra
podemos esperar maior funcionalidade de portais das tecnologias e inovaes que surgem com a Web
corporativos, tecnologia-smbolo da gesto do Semntica, apontar as confluncias entre o campo da
conhecimento. Com as ontologias comunitrias e da cincia da informao, com sua tipologia e teoria sobre
padronizao dos metadados, torna-se mais fcil a tarefa os sistemas de recuperao de informao, e a filosofia e
de explicitar, classificar e armazenar o conhecimento as tecnologias que esto embutidas no projeto desta nova
produzido pelos ativos de capital intelectual da e atualizada Web. O estudo das possibilidades que se
organizao. abrem e a compreenso de que todo o embasamento
filosfico, metodolgico e conceitual da Web Semntica
Gesto da Informao Estratgica e da parte do ncleo duro da cincia da informao nos
Inteligncia Competitiva impelem a demarcar e arrebanhar os legtimos territrios
do saber e a buscar ativamente uma atuao no desenho
Segundo Cronin (1990), as atividades de gesto de destes novos panoramas informacionais. Precisamos hoje
recursos de informao so vitais para acompanhamento trilhar um caminho rumo a uma nova e necessria
dos ambientes externo e interno das organizaes e, valorizao da rea de cincia da informao, que oferece
conseqentemente, para a gesto estratgica do negcio. teoria, metodologias e competncias que compem a
Dentre estas atividades, podemos citar a anlise contnua quintessncia daquilo que se espera dos trabalhadores e
de informaes sobre indicadores selecionados publicada pesquisadores de uma sociedade baseada em informao
nas redes de comunicao como a Internet. A tecnologia e conhecimento. E a importncia da Web e das demais
dos agentes promete automatizar e agilizar a colheita redes digitais de troca de informaes no panorama
destas informaes, por meio da anlise de dados que mundial so amostras de como a atividade de organizao
alimentaro data marts e data warehouses*, que, por sua da informao necessria para a evoluo dos
vez, constituiro uma fonte de informaes para auxlio indivduos, organizaes e da sociedade em geral.
na tomada de deciso.
Artigo recebido em 23-10-2003 e aceito para publicao em
24-04-2004.

* Um data warehouse uma coleo de dados no-voltil, crescente no


tempo, integrada e orientada ao negcio, para dar suporte a decises
gerenciais (Inmon, 1996). O data mart segue a mesma filosofia, mas
tem abrangncia menor.

140 Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004


A Web Semntica e suas contribuies para a cincia da informao

REFERNCIAS LASSILA, Ora; SWICK Ralph R. Resource description framework (RDF)


model and syntax specification: recommendation W3C, Feb. 1999.
ARAJO, Vnia M.R.H. Sistemas de recuperao da informao: Disponvel em: <http://www.w3.org/TR/1999/RECrdf-syntax-
nova abordagem terico conceitual. Cincia da Informao, Braslia, 19990222>. Acesso em: jun. 2003.
v. 24, n. 1, 1995. Disponvel em: < > Acesso em: 07 fev. 2003.
LAWRENCE, Steve. Context in web search. IEEE Data Engineering
BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern information retrieval. Bulletin, v. 23, n. 3, p. 25-32, 2000. Disponvel em: <http://
New York : ACM, 1999. 511 p. citeseer.nj.nec.com/lawrence00context.html>. Acesso em: jun. 2003.
BERNERS-LEE, T. et al. The semantic toolbox: building semantics on MARC standards. Disponvel em: <http://www.loc.gov/marc/>.
top of XML -RDF. Disponvel em: <http://www.w3.org/ Acesso em: jun. 2003.
DesignIssues/Toolbox.html>. Acesso em: jun. 2003.
MARCHIORI, Massimo. The limits of web metadata, and beyond. In:
BERNERS-LEE, T., LASSILA, Ora; HENDLER, James. The semantic INTERNATIONAL WORLD WIDE WEB CONFERENCE, 7., 1998.
web. Scientific America, Maio 2001. Disponvel em: <http:// Computer networks and ISDN systems. Proceedings... [S. l. : s.
www.sciam.com/article.cfm?ar ticleID=00048144-10D2-1C70- n. ], 1998. v. 30. p. 1-9.
84A9809EC588EF21>. Acesso em: jun. 2003.
NELSON, T. H. Literary machines. Sausalito, CA : Mindful, 1982.
CRONIN, Blaise. Esquemas conceituais e estratgicos para a
gerncia da informao. Revista da Escola da Biblioteconomia da UFMG, NOVAK, J. D. A theory of education. Ithaca, NY : Cornell University,
Belo Horizonte, v. 19, n. 2, p. 195-220. 1990. 1977.
DECKER, S. et al. The semantic web: the roles of XML and RDF. NWANA, H.; Software agents: an overview. Knowledge Engineering Review,
IEEE Expert, v. 15, n. 3. Oct. 2000. v. 11, n. 3. p. 205-244, 1996.
DUBLIN CORE METADATA INITIATIVE. Disponvel em: <http:/ RAGHAVAN, P. et al. Finding anything in the billion page web: are
/dublincore.org.>. Acesso em: jun. 2003. algorithms the key? Toronto : WWW8, 1999.
ENGELBART, Douglas. Augmenting human intellect: a conceptual SALTON, Gerard; MCGILL, Michael J. Introduction to modern information
framework. Disponvel em: < http://www.liquidinformation.org/ retrieval. New York : Mcgraw-Hill Book, 1983. 448 p.
engelbart/62_paper_full.pdf >. Acesso em: ago. 2003.
SEMANTIC web. Disponvel em: <http://www.semanticweb.org/
FOSKETT, A. C. The subject approach to information. 5. ed. London about.html>. Acesso em: jun. 2003.
: Library Association, 1997. 119 p.
TEIXEIRA FILHO, J. Gerenciando conhecimento. Rio de Janeiro : Senac,
GUIRAUD, Pierre. A semntica. 2. ed. Rio de Janeiro : Difel, 1975. 2000.
133 p.
WEB architecture: describing and exchanging data. Disponvel em: <http:/
HERMANS, B. Inteligent software agents on the Internet: an inventory of /www.w3.org/1999/04/WebData>. Acesso em: jun. 2003.
currently offered functionality in the information society & a
prediction of (near-) future developments, Tilburg, Holanda : WERSIG, Gernot. Information science: the study of postmodern
Tilburg University, 1996. Disponvel em: <http:// knowledge usage. Information Processing & Management, Oxford, U.K.
www.hermans.org/agents>. Acesso em: jun. 2003. v. 29, p. 229-239, Mar. 1993.

INMON, Willian. Building the data warehouse. 2. ed. New York : WHAT is computer terminology. Disponvel em: <http://
John Wiley, 1996. 401 p. www.whatis.com>. Acesso em: jun. 2003.

LAMPING, J; RAO, R.; PIROLLI, P. A Focus+context technique based WOOLDRIDGE, M.; JENNINGS, N. Intelligent agents: theory and
on hyperbolic geometry for visualizing large hierarchies. Disponvel em: practice. Knowledge Engineering Review, v. 10, n. 2, p. 115-152, 1995.
<http://www.acm.org/sigchi/chi95/proceedings/papers/ WOOLDRIDGE, M; JENNINGS, N. (Ed.). Agent technology:
jl_bdy.htm>. Acesso em: jul. 2003. foundations, applications, and markets. Berlim : Springer-Verlag,
LANCASTER, F. W.; WARNER, A. J. Information retrieval today. 1998.
Information Resources, 1993.

Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004 141

Você também pode gostar