Escolar Documentos
Profissional Documentos
Cultura Documentos
Um novo formato de contedo web que compreendido pelos computadores ir desencadear uma revoluo de novas possibilidades.
( Tim Berners-Lee )
RESUMO
Este trabalho trata da Web Semntica, uma ideologia voltada para uma refatorao da web que conhecemos e que est ganhando as mesas de discusso por todo o mundo. Neste documento ser apresentado a web semntica, a viso geral por trs dessa nova web, as instituies que colaboram com o desenvolvimento da mesma, a explorao das tecnologias que a cercam e a viabilidade da implementao e do estudo da web semntica na atualidade. Em seguida o leitor irar se deparar com os problemas que incidem no mbito de desenvolvimento e de negcios. Em sua fase final, o trabalho expe recursos para a criao de cdigos semnticos atravs de uma anlise elaborada, mostra tambm as aplicaes semnticas de maior uso atualmente. Em sua ltima seo, o trabalho dedica seu contedo a cincia da informao.
PALAVRAS CHAVE web, semntica, aplicaes, W3C, informao, processamento,
ABSTRACT
This paper discusses the Semantic Web, an ideology toward a refactoring of the web we know and that is winning the roundtable discussions throughout the world. This document will be presented the semantic web, the general view behind this new web, the institutions that contribute to its development, the exploitation of the technologies that surround and feasibility of implementation and the study of the semantic web today. Then the reader is confronted with the anger issues that affect the development and course of business. In its final phase, the document raises funds for the creation of semantic codes through an elaborate analysis also shows the applications currently use more semantic. In the last section, the work devotes its contentes to information science.
KEY WORDS - web, semantics, applications, W3C, information, processing, inference, metadata, deduction.
SUMRIO
1. INTRODUO ........................................................................................................................... 9 1.1 CONTEXTO .......................................................................................................................... 9 1.2 OBJETIVOS ........................................................................................................................... 9 1.3 ORGANIZAO DO DOCUMENTO .................................................................................... 10
2. WEB SEMNTICA .................................................................................................................... 10 2.1 VISO GERAL .................................................................................................................... 11 2.1.1 CONSOLIDANDO A WEB SEMNTICA ........................................................................ 11 2.1.2 TECNOLOGIAS DA WEB SEMNTICA ......................................................................... 13 2.1.2.1 URI (Uniform Resource Identifier) ..................................................................... 14 2.1.2.2 XML (Extensible Markup Language) .................................................................. 14 2.1.2.3 RDF (Resource Description Framework) ........................................................... 15 2.1.2.4 OWL (Web Ontology Language ) ....................................................................... 16
3. O W3C E A WEB SEMNTICA .................................................................................................. 17 3.1 DADOS LINKADOS ............................................................................................................. 17 3.2 VOCABULRIOS E ONTOLOGIAS ...................................................................................... 18 3.3 INFERNCIA ...................................................................................................................... 18 3.4 CONSULTAS ...................................................................................................................... 19 3.5 APLICAES VERTICAIS .................................................................................................... 19
5. APLICAES BASEADAS EM WEB SEMNTICA E COMPARTILHAMENTO DE DADOS .......... 21 5.1 FREEBASE .................................................................................................................. 21 5.2 POWERSET ............................................................................................................... 21 5.3 BING ......................................................................................................................... 22 5.4 HAKIA ....................................................................................................................... 22
6. ANLISE DAS FERRAMENTAS DE APOIO A WEB SEMNTICA ............................................... 24 6.1 ANOTAES ............................................................................................................. 24 6.2 API (APPLICATION PROGRAMMING INTERFACE) .................................................... 25 6.3 ARMAZENAGEM DE DADOS .................................................................................... 26 6.4 EDIO DE INFORMAES ...................................................................................... 27 6.5 FERRAMENTAS DE SUPORTE INFERNCIA ............................................................ 28 6.6 INTEGRAO ........................................................................................................... 29 6.7 APLICAES PARA CONSULTA ................................................................................. 30 6.8 VALIDAO DE INFORMAES ............................................................................... 31 6.9 VISUALIZAO DE INFORMAES .......................................................................... 31
7. CONTRIBUIES PARA A CINCIA DA INFORMAO ...................................................... 32 7.1 APERFEIOAMENTO E MELHORAMENTO DOS BUSCADORES ................................. 33 7.2 NOVAS INTERFACES COM O USURIO PARA SISTEMAS DE INFORMAO ............. 33 7.3 GESTO DO CONHECIMENTO ORGANIZACIONAL .................................................... 33
INTRODUO
1.1
CONTEXTO
A Web arranjada por elementos e suas ligaes, sendo adequado para as pessoas a identificao do significado de um elemento e o tipo de relao com outros elementos, como a relao de um indivduo com o seu respectivo website. Para o computador, porm, esse tipo de relacionamento entre os elementos no natural. Como espelho da falta de semntica das informaes, os mecanismos de busca encaram problemas para executar pesquisas por documentos que no esto distinguidos por tema, qualidade e relevncia. Alm disso, agentes inteligentes, empregados para obter informaes a partir dos documentos, so atidos e possuem pouca competncia para interagir com tipos de dados distintos e informaes. Os computadores proporcionam auxlio restrito no acesso e processamento da informao, deixando as funes de extrair e interpretar a cargo dos usurios. Alm disso, a web ineficiente para transferir, encontrar, acessar, expor e manusear conceitos definidos nos documentos de forma simples e autnoma. A Web Semntica, uma proposta para aprimorar pesquisas realizadas na web, procura adicionar semntica ao atual formato de representao de dados. Desta maneira, o trabalho de ponderar a qualidade e a validade de um documento seria realizado de maneira eficaz e em conjunto pelas pessoas e pelos computadores. Nessa situao, foi proposta pelo W3C (World Wide Web Consortium) uma linha de processos para que os computadores, a partir de aplicaes, sejam capazes de raciocinar e deduzir sobre as informaes estruturadas semanticamente na Web. As aplicaes utilizadas com o desgnio de raciocinar e deduzir sobre as informaes na Web so chamadas aplicaes semnticas. Para abordar os seus desgnios, as aplicaes semnticas necessitam de uma web semanticamente estruturada. Esta estruturao pode ser feita a partir do uso dos mtodos da Web Semntica. Dessa forma, as aplicaes de apoio web semntica podem auxiliar no manuseio de informaes definidas de acordo com as tecnologias da Web Semntica e no apoio ao desenvolvimento de aplicaes semnticas.
1.2
OBJETIVOS
Sendo assim os objetivos desse trabalho apresentar a web semntica, suas tecnologias, seus desafios de implementao, revelar o ambiente semntico em softwares j usuais e analisar aplicaes de apoio a nova web. Nosso objetivo contribuir com pesquisas nessa rea como formar de difundir o que acreditamos ser o futuro da web. Atravs da web semntica, cremos na construo de uma internet mais inteligente, capaz de lidar com contextos e interpretaes, mais do que simples tags. Tornar as coisas muito mais fceis e com auxlio das novas tecnologias.
1.3
ORGANIZAO DO DOCUMENTO
O prximo captulo fala sobre a Web Semntica, ele introduzir nosso assunto dando uma viso geral completa sobre nosso tema principal, e as tecnologias associadas a ele. O captulo 3 aborda as caractersticas bsicas que devem existir e serem difundidas nas aplicaes semnticas, segundo a viso da W3C (The World Wide Web Consortium). O captulo 4 rene a problemtica que cerca nosso tema, tanto do ponto de vista tcnico, de implementao, quanto do ponto de vista dos negcios abrangidos por ele. O captulo 5 agrupa aplicaes semnticas, vista sobre o olhar da W3C, algumas delas utilizam o princpio de compartilhamento de dados, que alguns especialistas visam como a soluo para a construo da nossa nova web. O captulo 6 apresenta a anlise das aplicaes que do suporte web semntica, de todas as maneiras possveis, desde realizao de inferncias at o armazenamento, edio e validao de nossas pginas, aplicaes ou dados. O captulo 7 direciona toda nossa pesquisa aos cientistas da informao e exibe os benefcios consequentes da proposta da Web Semntica no mundo da cincia da informao. Por fim consideraes so feitas na ltima seo, anumerada.
2. WEB SEMNTICA
Antigamente, a internet era restringida aos meios acadmicos e militares e tinha como ocupaes fundamentais: a troca de arquivos, o correio eletrnico e a emulao de terminal. Em maro de 1989, o fsico britnico Tim Berners-Lee expediu uma proposta para o CERN (European Center of Nuclear Research). Sua ambio era inventar um sistema de gesto de informaes para promover o compartilhamento de documentos entre os seus colegas. A proposta de Berners-Lee foi acolhida e como decorrncia surgiu a World Wide Web, ou Web. Com o aparecimento da web, o uso da Internet generalizou-se, permitindo a disponibilizao de novos servios na Internet. Atualmente, a Web to pblica que, no raro, os seus usurios embaraam-se com a prpria internet. No comeo da Web, a quantidade de informaes disponveis era pequena, entretanto nos dias de hoje existem mais de 90 milhes de websites. Os servios disponibilizados na Web comportam aos usurios pesquisar, negociar produtos, ler noticirios, escutar msica, jogar, interagir com outros usurios, consultar a conta corrente, recarregar crditos no celular e inmeras outras atividades. Para buscar por informaes disponveis na Web, so empregados os mecanismos de busca. Entretanto, apesar da ampla quantidade de informaes adquiridas, apenas parte da Web observada, enquanto uma parte considervel das informaes fica inacessvel pelos motores de busca (Web Oculta). O W3C (World Wide Web Consortium), consrcio criado em 1994 pelo autor da web (Tim Berners-Lee), determina padres (particularizaes, diretrizes, software e
instrumentos) e tem como desgnio a criao de uma web segura, onde as pessoas tomem a autoria e carga por suas publicaes. A Web Semntica, uma expanso da Web contempornea, permitir a acessibilidade, a captao e a gesto das informaes disponibilizadas na Web, autnoma da maneira em que elas se apresentem (texto, som, imagem), a partir do uso dos padres definidos pelo W3C.
Para que os computadores possam processar e compreender o sentido das informaes transmitidas na Web, os recursos disponveis necessitam ter semntica.
Desta maneira, os computadores podero pesquisar, processar, agregar, intercambiar e expor recursos de forma inteligente. Para isso, indispensvel estruturar semanticamente os recursos da Web. As seguintes abordagens podem ser usadas: Top-Down (de cima para baixo): os agentes inteligentes retiram informaes das pginas da Web e estrururam-nas semanticamente. Bottom-Up (de baixo para cima): as aplicaes semnticas pesquisam na Web por informaes estruturadas semanticamente. Agentes inteligentes, para a abordagem Top-Down j existem, como o Blue Organizer da Adaptive Blue e o Personal Web da Claria. O Blue Organizer mune um complemento para o navegador Firefox, que proporciona organizar websites de interesse do usurio. O Personal Web altera a pgina inicial do navegador do usurio com informaes do seu interesse. As aplicaes semnticas esto em constante trabalho e a consolidao da abordagem Bottom-Up se dar quando as informaes das pginas Web ficarem estruturadas semanticamente. A Web Semntica permitir o desenvolvimento de aplicaes que promovero o agrupamento e o reuso de informaes. Como exemplo, uma aplicao poderia refinar informaes e executar trabalhos que hoje so considerados complexos, como rebater a seguinte pergunta: Quais hospitais da cidade de Currais Novos aceitam o plano Mais Sade? A estruturao semntica da informao nos documentos criaria uma atmosfera onde as pessoas e as mquinas (os computadores ou qualquer outro aparelho ligado na internet) poderiam trabalhar em colaborao, deixando a cargo das mquinas qualquer servio que pudesse ser automtico. Para alcanar os desgnios da Web Semntica, indispensvel uma uniformizao de tecnologias, linguagens e metadados descritivos, de maneira que todos os usurios da Web satisfaam a determinadas normas comuns e partilhadas sobre como gravar dados e descrever a informao armazenada de forma que ela seja usada por pessoas e mquinas de maneira automtica e sem impreciso. Apesar dos padres web terem evoludo nos ltimos 5 anos e empreendimentos comerciais terem nascido, os esforos atingidos neste campo se renem principalmente no meio acadmico. O procedimento para o desenvolvimento da web atual em uma Web Semntica pode ser lento. O sucesso dessa nova estrutura est amarrado cooperao entre seus usurios, independentemente de diversidades tnicas, sociais e culturais. Apesar de as possibilidades enxergadas pela Web Semntica sejam empolgantes, os seguintes desafios precisam ser encarados: Constituir regras que determinem a informao contida nas pginas web de maneira simples, inteligente e universal. Desenvolver aplicaes que consigam, de maneira autnoma, explicar e compartilhar a informao obtida a partir de distinta origens. Desenvolver aplicaes que obtenha gerar novas informaes estruturadas semanticamente a partir da informao recebida. Desenvolver aplicaes que permitam o manuseio das tecnologias da Web Semntica de forma clara.
Para acessar, decodificar e usar informaes estruturadas de maneira competente, as aplicaes utilizam as tecnologias da Web Semntica, as quais so abordadas a seguir.
As tecnologias exibidas nas camadas inferiores da arquitetura so empregadas como base para as tecnologias das camadas superiores. Apesar do afastamento, as camadas esto fortemente relacionadas, sendo complexa a anlise separada de algumas camadas, tais como RDF e RDF-S, por exemplo. A disposio das tecnologias pode ser feita de acordo com a sua maturidade, sendo expostas na ordem decrescente de maturidade: Tecnologias normatizadas: as tecnologias Unicode, URI (Universal Resource Identifier) e XML esto nas camadas de alicerces da estrutura. Tecnologias recm-normatizadas: as tecnologias RDF, RDF-S e OWL, esto no centro da estrutura. Tecnologias experimentais: as tecnologias SPARQL, Regras, Estrutura Lgica, Prova e Confiana, esto no topo da estrutura.
Alm dessas tecnologias, ainda tem a camada de encriptao, existente desde a base at o topo da estrutura, e que empregada para codificar e encontrar alteraes
nas informaes. Na prxima seo as tecnologias normalizadas e recm-normalizadas pelo W3C so expostas.
<aviso> <data>28/04/2012</data> <para>Fernanda Cardinaly</para> <de>Prof Flavius Gorgnio</de> <cabecalho>Lembrete</cabecalho> <corpo>Amanh, avaliao de arquitetura de computadores</corpo> </aviso>
A linha 2, do cdigo , exibe a etiqueta data. A etiqueta inicia em <data>, possui o contedo 28/04/2012, e finaliza em </data>. Todos os benefcios da XML fazem com que ela signifique uma armao ideal para permuta de dados. Acredita-se que, com a expanso da web e o advento da Web Semntica, XML se tornar a linguagem universal para a representao de dados.
Recurso (Sujeito) )
Propriedade
Recurso (Objeto)
Os arcos simulam propriedades, enquanto os ns simulam recursos. A direo da seta relevante: o arco sempre comea no sujeito e aponta para o objeto da declarao. Em um exemplo, seja a sentena: http://www.info.ufrn.br/html tem um criador cujo valor Universidade Federal do Rio Grande do Norte A sentena poderia ser representada pela seguinte declarao RDF: O sujeito http://www.info.ufrn.br/html O predicado a palavra criador. O objeto Instituto de Informtica.
O pedao que identifica o recurso da declarao chamado de sujeito, um atributo de um recurso chamado de predicado (propriedade) e o valor de uma propriedade chamado de objeto (valor de propriedade). Em outro exemplo, analise as sentenas a seguir: O autor do documento TEXTO o indivduo FERNANDA. O indivduo FERNANDA autor do documento TEXTO.
Um indivduo que conhea o idioma portugus asseguraria que as duas sentenas tm o mesmo significado, contudo o computador no capaz de analis-las. Na primeira sentena o recurso documento TEXTO, a propriedade autor e o valor para a propriedade indivduo FERNANDA. Na segunda sentena o recurso indivduo FERNANDA, a propriedade autor e valor da propriedade documento TEXTO. Nas duas sentenas o sujeito documento TEXTO, o predicado autor e o objeto indivduo FERNANDA. O Cdigo 2 expe um exemplo em RDF/XML, uma reproduo formal de dados RDF em formato XML, usando as sentenas empregadas no exemplo anterior: Cdigo 2 Exemplo de arquivo RDF /XML
1 2 3 4 5 6 7 8
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ex1="http://ex1.com/elements/1.0"> <rdf:Description rdf:about="http://ex1.com/documento1"> <ex1:titulo>Documento TEXTO</ex1:titulo> <ex1:autor>Individuo FERNANDA</ex1:autor> </rdf:Description> </rdf:RDF>
propriedades do objeto e definies das relaes entre elementos das classes, instncias das classes e instncias das propriedades. A sugesto do W3C possui trs verses da OWL, que est amarrado a capacidade de expressividade requerida. As verses menos expressivas (OWL Lite e DL) esto inclusas dentro das mais expressivas (OWL DL e Full). Uma ontologia em uma linguagem menos expressiva acolhida por uma linguagem mais expressiva, contudo a recproca no aceita. A adoo da linguagem OWL vem crescendo a cada dia, apesar disso existem poucas ferramentas e ambientes de desenvolvimento de software para dar apoio s suas produes e aplicaes.
3.3 INFERNCIA
Em termos gerais, o conceito de inferncia na web semntica pode ser caracterizado como um mecanismo para descobrir novos relacionamentos. Dados so modelados sobre a web semntica como um conjunto de relaes (nomeadas) entre
recursos. "Inferncia" significa que procedimentos automticos podem gerar novas relaes baseadas nos dados e com base em algumas informaes adicionais sob a forma de um vocabulrio, por exemplo, um conjunto de regras. Se as novas relaes so explicitamente adicionadas ao conjunto de dados, ou so retornadas no momento da consulta, uma questo de implementao. Na web semntica, a fonte dessas informaes extras pode ser definida por meio de vocabulrios ou conjuntos de regra. Ambas destas abordagens baseiam-se em tcnicas de representao do conhecimento Segundo a W3C, CORUJA ou SKOS so as ferramentas de escolha para a definio de ontologias. Assim, a inferncia um dos mecanismos escolhidos para melhorar a qualidade da integrao de dados na Web, por sua capacidade de descobrir novos relacionamentos, e de analisar o contedo dos dados automaticamente ou de gerir conhecimento na web em geral. Tcnicas de inferncia tambm so importantes na descoberta de possveis inconsistncias nos dados (integrados).
3.4 CONSULTAS
"Consulta" na web semntica significa tecnologias e protocolos que podem programaticamente recuperar informaes na web de dados. RDF fornece a base para a publicao e vinculao de dados. Vrias tecnologias permitem que voc incorpore dados em documentos (RDFa, GRDDL), expor o que voc tem nos bancos de dados SQL, ou disponibiliz-los como arquivos RDF. No entanto, assim como os bancos de dados relacionais precisam de linguagens de consulta especficas (SQL), a web de dados - geralmente representados usando RDF como formato de dados - precisa de sua prpria linguagem de consulta. Isso fornecido pela linguagem SPARQL. Essa linguagem torna possvel enviar consultas e receber os resultados, atravs de HTTP ou SOAP, por exemplo. Tecnicamente, consultas SPARQL so baseadas em padres. RDF pode ser visto como um conjunto de relaes entre os recursos; Consultas SPARQL fornecem um ou mais padres contra tais relaes. Esses padres chamados padres triplos so semelhantes aos triplos RDF, exceto que um ou mais dos elementos constitutivos dos recursos so variveis. Cabe a um motor SPARQL retornar os recursos para todos os triplos que correspondem a esses padres.
Exemplos consolidados de aplicaes verticais: The Health Care um grupo de interesse pela cincia da vida. Ele foi criado em 2005, para explorar a possibilidade de utilizao de tecnologias da web semntica no campo, como a descoberta de medicamentos, gesto no atendimento ao paciente e emisso de relatrios, publicao dos conhecimentos cientficos, processos de aprovao de drogas, etc. O grupo tem produzido vrias manifestaes, publicaes, organizando workshops e conferncias e conseguiu transformar este domnio de aplicao especfica em uma das comunidades de utilizadores mais ativas de tecnologias da web semntica. A maioria das empresas de pesquisa de drogas, laboratrios universitrios e centros de investigao, esto trabalhando na rea e produzindo ferramentas especializadas aos fornecedores que participam deste trabalho. Os feedbacks fornecidos por este grupo tambm foi significativo para as tecnologias da web semntica; como por exemplo, a definio de alguns dos perfis OWL2 foi fortemente influenciada pelas ontologias e vocabulrios desenvolvidos por esta comunidade.
determinados ramos, seria praticamente descontinuado, pelo fato de que voc ao invs de precisar utilizar este servio usaria os buscadores para encontrar a informao. Portanto, este tipo de sites sairia prejudicado. Outro problema seria a exposio de muitos dados de usurios na internet, como por exemplo, se for aplicar a semntica em redes sociais, imagine quantas informaes pessoais seriam visveis a usurios no ligados a voc? A prxima seo destinada ao conhecimento dos softwares semnticos que apostam em conectividade entre aplicaes e portabilidade de dados para contornar esses problemas.
5.1 FREEBASE
Freebase uma grande base de conhecimento colaborativa. um refgio de dados estruturados online colhidas de vrias fontes, inclusive a contribuio 'wiki' individual. O objetivo da Freebase, criar um recurso global que permita as pessoas (e mquinas) acessarem informao comum, mais efetivamente. desenvolvido pela empresa de software americana Metaweb e tem sido executado publicamente desde Maro de 2007. Dados Freebase esto disponveis para uso em uma "atribuio" de licena Creative Commons, e uma API, rdf endpoint, e database dump so fornecidos para programadores. Google's News Timeline inclui meios de comunicao de informaes Freebase. A pgina oficial da freebase www.freebase.com e seu lema : Um grfico de entidade de pessoas, lugares e coisas, construda por uma comunidade que ama dados abertos.
5.2 POWERSET
Adquirida recentemente pela Microsoft, um engenho de busca de linguagem natural. A Powerset estava trabalhando na construo de uma linguagem natural para motor de busca que pode encontrar respostas a perguntas especficas do usurio (em oposio a pesquisa por palavra).
A empresa licenciou a tecnologia de linguagem natural da PARC , o ex- Xerox Palo Alto Research Center . Em 11 de maio de 2008, a companhia revelou uma ferramenta para procurar um subconjunto fixo na Wikipedia usando frases de conversao em vez de palavraschave. Em 01 de julho de 2008, a Microsoft assinou um acordo para adquirir a Powerset por cerca de US$ 100 milhes.
5.3 BING
Bing, durante a etapa de testes, o motor de pesquisa da Microsoft, designado para competir com os lderes das indstrias Google e Yahoo!. Revelado pelo CEO da Microsoft, Steve Ballmer, em 28 de maio de 2009, na conferncia "All Things D", em San Diego. Bing um substituto do Live Search, e disponibilizado totalmente em 1 de junho de 2009. Em 4 de junho de 2009, com apenas trs dias em atividade, o Bing alcanou o segundo lugar na rea de pesquisas online, superando o Yahoo! Busca, e ficando atrs apenas do Google Search. No dia, o motor de pesquisa representou 16,2% das buscas nos Estados Unidos, enquanto o Yahoo! representou 10,2%. Globalmente, o Bing representa 5,6% contra 5,1% do Yahoo!. Os aperfeioamentos incluem adio de pesquisas relacionadas (chamado "Explorer panel", no lado esquerdo dos resultados da pesquisa, baseado na tecnologia semntica do PowerSet, empresa de busca da Microsoft comprada em 2008), e busca de sugestes ao digitar (aumenta o histrico de pesquisas). O Bing pode ser acessado atravs do link: br.bing.com
5.4 HAKIA
Apontado com um dos mais promissores engenhos de busca em alternativa ao Google, faz a anlise de sentenas na hora de fazer uma busca. Disponvel em portugus tambm, trouxe resultados relevantes em algumas buscas que fiz. A empresa hakia quem inventou a tecnologia QDEXing, uma infra-estrutura que surgiu como nova alternativa indexao de dados e que usa o algoritmo SemanticRank, uma mistura de soluo das disciplinas de semntica ontolgica e lgica fuzzy e lingstica computacional e matemtica . Fundada em 2004, a empresa uma empresa privada com sede em Nova York . A Hakia foi fundada por Riza Berkan , um cientista nuclear por formao, com especializao em inteligncia artificial e lgica fuzzy, e Kouri Pentti , um economista baseado em Nova York e capitalista de risco. Professor Victor Raskin , pai da semntica ontolgica e notvel autoridade internacional na rea de lingstica computacional. O Hakia poder ser acessado em: http://hakia.com
5.5 TALIS
Talis uma plataforma para criao de aplicaes semnticas na web. Os desenvolvedores podem criar, compartilhar e reutilizar informaes nessa plataforma, que tem como objetivo facilitar o desenvolvimento das aplicaes semnticas. A Plataforma Talis torna mais fcil para desenvolvedores criar aplicativos poderosos que utilizam tecnologias de Web Semntica e padres. Entregue como Software de Servio (SaaS), a plataforma reduz drasticamente a complexidade e custo de armazenamento, de indexao, de busca e aumenta grandes quantidades de dados. Ele fornece um ambiente confivel e seguro para suportar uma vasta gama de aplicaes de informaes ricas. A plataforma Talis pode ser acessada atravs do: www.talis.com
5.6 SWOOGLE
O Swoogle uma ferramenta de busca de documentos na Web Semntica. Ele aplica um sistema de rastreamento para achar documentos RDF e documentos HTML com contedo RDF embutido. O buscador compreende esses documentos e as suas partes constituintes (termos e triplas, por exemplo), registra e indexa metadados significativos sobre eles em seu banco de dados. Os documentos achados tambm so indexados por um sistema de recuperao de informao que pode usar referncias URL como palavras-chave para verificar a semelhana com um conjunto de documentos. Uma das funcionalidades interessantes que o Swoogle utiliza o ranking de ontologia, uma medida da importncia de documentos na Web Semntica. Seus servios so fornecidos para os usurios por meio de uma interface, que pode ser acessada a partir de qualquer navegador e para agentes de software via servios (Web Services). Vrias tcnicas so usadas para retornar os resultados e seu algoritmo inspirado no PageRank, desenvolvido pelo Google, mas adaptado ao modelo semntico dos documentos. O Swoogle foi desenvolvido com o objetivo de encontrar ontologias, instncia de dados e responder perguntas no contexto da Web Semntica. A figura 3 mostra a interface web com os usurios do Swoogle.
O servio reconhece mais de 5 milhes de URLs, sendo mais de 2 milhes de documentos semnticos, buscados diretamente em arquivos RDF,OWL, ou atravs de pginas HTML que podem conter documentos semnticos. Mais de 10.000 ontologias esto disponveis, armazenadas em uma base de dados MySQL em forma de URIs. O swoogle pode ser acessado atravs da url: swoogle.umbc.edu
6.1 ANOTAES
Nesta categoria sero apresentadas aplicaes que proporcionam gerar anotaes (explicaes, notas) sobre documentos ou imagens.
NOME
Dose MnM OntoMat Annotizer PhotoStuff SemanticWord Swangler
LICENA
MnM LGPL MPL GPL
LINGUAGEM
Java Java Java Visual Basic Java
DOSE: plataforma distribuda de preparao semntica que prov servios semnticos, como a anotao automatizada de recursos na Web. MnM: aplicao de anotao que mune o suporte automatizado e semi automatizado para anotao de pginas Web com contedo semntico. OntoMat Annotizer: aplicao que permite a anotao de uma pgina Web em OWL. Ela ampara os trabalhos de criao e conservao de ontologias OWLs, seus atributos e relaes. Contm um navegador para descobrir a ontologia e exibir partes anotadas do texto. PhotoStuff: aplicao para anotao de imagens, admitindo ao usurio anotar pedaos da imagem de acordo com conceitos definidos em ontologias. Alm disso, aceitvel publicar o metadado gerado automaticamente. SemanticWord: aplicao que proporciona realizar associaes entre marcaes OWL e regies especficas em documento do editor de texto Word. Swangler: aplicao que cria anotaes de documentos em formato RDF que podem ser indexados e em seguida serem pesquisados na Web a partir da sua substncia semntica.
Todas as ferramentas, menos a SemanticWord, so autnomas de sistema operacional. A ferramenta DOSE fornece um intercmbio com o usurio atravs do navegador. As ferramentas MnM, OntoMat-Annotizer, PhotoStuff e SemanticWord admitem um intercmbio com o usurio de forma grfica (GUI), j a ferramenta Swangler proporciona uma interao atravs de uma API.
NOME
CODIP HAWK NG4J OWL API
LICENA
BSD GPL BSD LGPL
LINGUAGEM
Java Java, PL/SQL Java Java
CODIP (Components for Ontology Processing): API que municia uma coleo de mdulos em Java para o processamento, criao e a gesto de ontologias. Ela prov suporte para OWL, XML/RDF e UML XMI (XML Metadata Interchange). HAWK: API para explanao, edio, manuseio e armazenamento de ontologias OWL. NG4J (Named Graphs API for Jena): API de expanso ao arcabouo Jena. Consente a interpretao, manuseio e a serializao de um unido de grafos. OWL API: interface e implementao Java para OWL. A API focaliza sobre o OWL Lite, OWL DL e OWL 1.1 e proporciona uma interface para inferncias. OWL-S API: prov as funes necessrias para criar e manusear arquivos OWL-S. Ripple Jun: linguagem de script que admite manusear e criar metadados RDF. SOFA (Simple Ontology Framework API): API que proporciona expressar uma ontologia pelo meio de um modelo de objetos abstratos e livre da linguagem de particularizao usada na ontologia;
As ferramentas CODIP, HAWK, NG4J, OWL API, OWL-S API, Ripple e SOFA so independentes de sistema operacional. A ferramenta CODIP disponibiliza uma influncia mtua pelo meio de uma API e linha de comandos.
NOME
RDFStore Sesame Kowari YARS
LICENA
BSD LGPL MPL BSD
LINGUAGEM
C Java Java Java
RDF Store: aplicao que proporciona guardar informaes RDF. Sesame: arcabouo RDF open source com apoio a consulta e inferncia sobre esquemas RDF. Foi desenvolvido com o objetivo de prover flexibilidade no desenvolvimento de ferramentas RDF.
Kowari: ferramenta que prov uma base de dados implementada para o armazenamento de metadados. escalvel e proporciona transaes seguras. YARS (Yet Another RDF Store): aplicao que possibilita armazenar informaes RDF.
Quanto maneira de reproduo da arquitetura RDF, as ferramentas RDFStore e YARS usam apenas modelos RDF, j a ferramenta Kowari, utiliza grafos, asseres e ontologias e a aplicao Sesame utiliza grafos e asseres. Quanto modelo de persistncia, a ferramenta RDFStore usa a memria principal e arquivos, a ferramenta Sesame usa a memria principal, arquivos e banco de dados MySQL, PostgreSQL, Oracle ou SQL Server. Quanto o uso para a consulta, a ferramenta Kowari utiliza a linguagem iTQL (Tucana SQL-like query language), a ferramenta RDFStore utiliza as linguagens RDQL e SPARQL, a ferramenta Sesame utiliza as linguagens RDFS e OWL-Lite e a aplicao YARS utiliza a linguagem N3QL (Notation3 Query Language). Como apoio ao mecanismo de inferncia, as aplicaes Kowari e Sesame usam as linguagens RDFS e OWL-Lite e a aplicao RDFStore utiliza somente a linguagem RDFS.
NOME
Protg Snoggle SMORE SWeDE SWOOP
LICENA
MPL BSD LGPL BSD LGPL
LINGUAGEM
Java Java Java Java Java
Prtge: um editor que proporciona criar e manusear ontologias. implementado na linguagem Java e pode, ser definido de trs maneiras: como uma aplicao que proporciona a criao e manuseio de ontologias, como uma plataforma que pode ser alargada ou agrupada em outros sistemas de representao de conhecimento ou como uma biblioteca que pode ser usada por outros sistemas de representao de conhecimento. Snoggle: aplicao grfica fundamentada em mapeamento SWRL para auxiliar no trabalho de preparao de ontologias OWL. Proporciona aos usurios visualizar a ontologia e desenhar mapeamentos de forma grfica. Os usurios desenham os mapeamentos graficamente e o Snoggle permite convert-los em SWRL/RDF ou SWRL/XML.
SMORE : aplicao planejada para proporcionar a criao e utilizao de asseres RDF associadas a ontologias, a partir de documentos HTML. SWeDE: essa ferramenta na verdade um ambiente de desenvolvimento para a plataforma Eclipse. Inclui um editor de ontologias no formato OWL, um verificador de sintaxe OWL, um conversor de OWL para Java e um visualizador grfico. SWOOP: uma aplicaopara edio de ontologias. Contm uma interface simples para a criao e manuseio de ontologias OWL. Tem como caracterstica fundamental uma navegao simples, por meio das entidades definidas nas ontologias OWL.
As ferramentas Protg, Snoggle, SMORE, SWeDE e SWOOP so autnomas de sistema operacional e proporcionam o intercmbio com o usurio por meio de uma interface grfica (GUI).
NOME
Euler EulerMoz Metalog OWLJessKB Pellet
LICENA
W3C W3C W3C GPL MIT
LINGUAGEM
Java JavaScript Python Java Java
Euler: aplicao que disponibiliza um mecanismo de inferncia para a informao descrita em formato RDFS e OWL. EulerMoz: baseada na Euler, com as mesmas funes; porm, o motor de inferncia desenvolvido em JavaScript. Instance Store: aplicao que disponibiliza um motor de inferncia para a informao descrita em OWL-DL. MetaLog: aplicao que disponibiliza um motor de inferncia e um intercmbio simples com o usurio por meio da linguagem PNL (Pseudo Natural Language). OWLJessKB: aplicao que disponibiliza um motor de inferncia para a informao descrita em OWL. Pellet: aplicao que disponibiliza um motor de inferncia para a informao descrita em OWL-DL.
As ferramentas Euler, EulerMoz e OWLjessKB, como modelo de persistncia, usam a memria principal, a ferramenta MetaLog usa a memria principal e arquivos e a ferramenta Pellet usa arquivos. Analisando as ferramentas para consulta, a aplicao Euler utiliza a linguagem N3QL, a aplicao MetaLog utiliza a linguagem PNL (Pseudo Natural Language), a aplicao OWLJessKB utiliza a linguagem Jess e a aplicao Pellet utiliza SPARQL. Analisando as ferramentas como suporte ao motor de inferncia, as aplicaes Euler e EulerMoz usam as linguagens RDFS e OWL, a aplicao MetaLog usa a linguagem Prolog, a aplicao OWLJessKB utiliza as linguagens RDF e OWL-Lite e a aplicao Pellet utiliza OWL.
6.6 INTEGRAO
Nesta categoria sero apresentadas ferramentas que auxiliam o desenvolvimento de aplicaes semnticas.
NOME
4Suite Jena KAON RAP RDFGateway Redland RDF Wilbur Set
LICENA
Apache BSD LGPL LGPL Comercial LGPL -
LINGUAGEM
Python Java Java PHP C Common Lisp
4Suite: plataforma para processar e gerir os dados em arquivos XML, possui uma biblioteca de ferramentas integradas para o processamento de arquivos XML, um repositrio de dados XML e um servidor com um motor de regras. Jena: arcabouo open source para a criao de aplicaes semnticas. Ele prov uma API, ou seja, um conjunto de rotinas e padres estabelecidos, para extrair e escrever dados em grafos RDF. KAON: infraestrutura para a gesto de ontologias com foco em aplicativos de negcio. RAP: pacote de software para anlisar, consultar, manusear, a serializao e apresentao de modelos RDF. RDF Gateway: plataforma para o desenvolvimento e distribuio de aplicaes semnticas. Redland RDF: um unido de bibliotecas gratuitas que proporciona o desenvolvimento e manuseio de modelos RDF.
Wilbur Set: caixa de ferramentas (toolkit) para desenvolver aplicaes semnticas que utilizam RDF.
Para a representao da arquitetura RDF, a ferramenta Wilbur utiliza modelos e asseres, a aplicao 4Suite utiliza somente asseres, a aplicao RDF Gateway utiliza modelos, grafos e asseres e as ferramentas Jena, KAON, RAP e RedLand utilizam asseres,grafos e ontologias. Quanto a atuao das ferramentas como modelo de persistncia, a aplicao Wilbur utiliza somente a memria principal, a aplicao 4Suite utiliza a memria principal, arquivos e banco de dados PostgreSQL, a aplicao Jena utiliza a memria principal, arquivos e os banco de dados Berkeley, MySQL ou SQLite, a aplicao KAON utiliza a memria principal e banco de dados SQL Server, PostgreSQL, IBM DB2 ou Oracle 9i, a aplicao RAP utiliza a memria principal e qualquer banco de dados compatvel com o ADObd (ActiveX Data Objects Data Base), a aplicao RDF Gateway utiliza memria principal, arquivos e qualquer banco de dados compatvel com OleDB (Object Linking and Embedding Data Base) e a aplicao Redland utiliza memria principal, arquivos e banco de dados MySQL, PostgreSQL, Oracle, Berkeley, SQL Server ou DB2. Analisando nossas ferramentas quanto consulta, a aplicao 4Suite utiliza a linguagem Versa, as aplicaes Jena e Redland utilizam as linguagens RDQL e SPARQL, a aplicao KAON utiliza a linguagem KAON, a aplicao RAP utiliza a linguagem RDQL, a aplicao RDF Gateway utiliza a linguagem RDFQL (RDF Data Query Language) e a aplicao Wilbur utiliza a linguagem WQL (Windows Management Instrumentation Query Language). Como apoio ao motor de inferncia, a ferramenta KAON utiliza as linguagens RDFS e OWL-Lite, as ferramentas RAP e RDF Gateway utilizam a linguagem RDFS e OWL, a ferramenta Redland utiliza as linguagens RDFS, OWL-Lite e DIG e a ferramenta Wilbur usa a linguagem RDFS.
NOME
Cwm OWL-QL OWLS-TC
LICENA
W3C BSD GPL
LINGUAGEM
Python Java Java
Cwm (Closed World Machine): aplicao que proporciona consultar, verificar e filtrar informaes descritas em RDF/XML e N3. OWL-QL (OWL-S Service Retrieval Test Collection): aplicao que utiliza uma linguagem e um protocolo de consulta formal, especificados em OWL, para a interao entre agentes inteligentes.
As ferramentas Cwm, OWL-QL e OWLS-TC so autnomas de sistema operacional. Analisando essas ferramentas quanto maneira de interagir com o usurio, a ferramenta Cwm disponibiliza entrada via API e linha de comandos. Para a reproduo da arquitetura RDF, a aplicao Cwm usa apenas modelos e para consulta a aplicao Cwm utiliza a linguagem N3.
NOME
ConsVISor OWL Validator SWRL Validator
LICENA
BSD BSD
LINGUAGEM
Java Java Java
ConsVISor: aplicao que faz a verificao da consistncia de documentos OWL. Os resultados so colocados em uma pgina Web ou atravs de anotaes OWL. OWL Validator: aplicao para a verificao da consistncia de documentos OWL. SWRL Validator: aplicao para a verificao da consistncia de anotaes em SWRL (Semantic Web Rule Language).
As ferramentas ConsVISor, OWLValidator e SWRLValidator so autnomas de sistema operacional. Quanto maneira de interagir com o usurio, as ferramentas OWL Validator e SWRL Validator contm acesso via Web, uma API e linha de comandos. A ferramenta ConsVISor disponibiliza acesso via Web.
NOME
DumpOnt IsaViz
LICENA
BSD -
LINGUAGEM
Java Java
BSD MPL
DumpOnt: aplicao para expor graficamente, por meio da Web, a hierarquia de classes e propriedades presentes em uma ontologia OWL. IsaViz: aplicao que proporciona o manuseio de modelos RDF graficamente. ObjectViewer: aplicao para apresentao graficamente, por meio da Web, grafos RDF. OWL-P: uma aplicao que determina uma ontologia OWL que pode ser utlizada como um protocolo para ontologias OWL. SVG-OWL Viewer: aplicao que proporciona a exibio de ontologias graficamente usando o formato SVG. VIVID: aplicao que proporciona a visualizao e publicao de estruturas em OWL e RDF.
A ferramenta VIVID (Visual Variable-Depth Info Display) foi feita para executar no sistema operacional Windows NT/2000, j as outras aplicaes DumpOnt, IsaViz, Object Viewer, OWL-P e SVG-OWL Viewer so autnomas de sistema operacional. Quanto forma de intercmbio com o usurio, a ferramenta VIVID disponibiliza a interao por meio da Web, as aplicaes IsaViz, Object Viewer, OWL-P e SVG-OWL Viewer disponibilizam a interao por meio de interfaces desktops do tipo GUI e a ferramenta DumpOnt disponibiliza a interao por meio da Web, via API ou linha de comandos.
CONSIDERAES FINAIS
Os conceitos bsicos da Web Semntica para o desenvolvimento deste trabalho foram vistos, tais como as tecnologias difundidas, as aplicaes que usa ideologias semnticas e a explanao tcnica de como o alicerce semntico. Todo esse conhecimento descrito aliado ao conhecimento tcnico possibilitou que fosse feita uma anlise das aplicaes que do apoio a Web Semntica. Por fim, a didtica ligada ao trabalho inferiu em um captulo dedicado aos benefcios da aplicao desta nova web aos estudiosos da informao e a prpria cincia da informao.
ANEXOS
REFERNCIAS BIBLIOGRFICAS
[1] Semantic Web and Other W3C Technologies to Watch. http://www.w3.org/2006/Talks/1023-sb-W3CTechSemWeb/, ltimo acesso em maio de 2012. [ANEXO] JARDIM, Andr Desessards. Ferramentas e Aplicaes para a Web Semntica. Universidade Catlica de Pelotas . Mini Curso Web Semntica (Mdulo 09) DECKER, S. et al. The semantic web: the roles of XML and RDF. IEEE Expert, v. 15, n. 3. Oct. 2000. HYACINTH, Nwana. Software Agents: An Overview. Engineering Review, Vol. 11, Num. 3. Cambridge University Press, 1996. LAMPING, J; RAO, R.; PIROLLI, P. A Focus+context technique based on hyperbolic geometry for visualizing large hierarchies. Disponvel em: <http://www.acm.org/sigchi/chi95/proceedings/papers/jl_bdy.htm>. Acesso em: maio de 2012. LANCASTER, F. W.; WARNER, A. J. Information retrieval today. Information Resources, 1993. MARCHIORI, Massimo. The limits of web metadata, and beyond. In: INTERNATIONAL WORLD WIDE WEB CONFERENCE, 7., 1998. Computer networks and ISDN systems. Proceedings... [S. l. : s.n. ], 1998. v. 30. p. 1-9. MOF 2.0/XMI Mapping, Version 2.1.1. MOF2.0/XMIMapping,Version2.1.1, ltimo acesso em maio de 2012. MOREIRA, Daniele. Ajude a construir a Web Semntica. Disponvel em: http://info.abril.com.br/professional/desenvolvimento/ajude-a-construir-a-websemantica.shtml. Acesso em: abril de 2012. NOVAK, J. D. A theory of education. Ithaca, NY : Cornell University, 1977. PICKLER, M. Web Semntica: Ontologias como Ferramentas de Representao do Conhecimento. Perspectivas em Cincia da Informao, 2007. PRADA, Rodrigo. O que web semntica? Disponvel em: http://www.tecmundo.com.br/800-o-que-e-web-semantica-.htm. Acesso em: abril de 2012
Semantic Web and Other W3C Technologies to Watch. http://www.w3.org/2006/Talks/1023-sb-W3CTechSemWeb/, ltimo acesso em abril de 2012 SILVA, Alberto Sales e. Web Semntica: o estado da arte. Disponvel em: http://pt.scribd.com/doc/7253958/Web-Semantica-Estado-Da-Arte. Acesso em: maio de 2012. SMORE. http://www.mindswap.org/2005/SMORE, ltimo acesso em abril de 2012. SNOOGLE. http://snoggle.projects.semwebcentral.org/, ltimo acesso em maio de 2012. SOFA. http://projects.semwebcentral.org/projects/sofa/, ltimo acesso em abril de 2012. SOUZA, R; ALVARENGA, L. A. Web Semntica e Suas Contribuies para a Cincia da Informao. Cincia da Informao, 2004. SOUZA, Renato Rocha e ALVARENGA, Ldia. A Web Semntica e suas contribuies para a cincia da informao. Ci. Inf. [online]. 2004, vol.33, n.1, pp. 132-141. ISSN 0100-1965. Start-Up Aims for Database to Automate Web Searching, The New York Times, 09-032007. Pgina visitada em maio de 2012. SWRL Validator. http://projects.semwebcentral.org/projects/swrl-val/, ltimo acesso em abril de 2012. TEIXEIRA FILHO, J. Gerenciando conhecimento. Rio de Janeiro : Senac, 2000. VIVID. http://projects.semwebcentral.org/projects/vivid/, ltimo acesso em abril de 2012. W3C. Architecture of the World Wide Web, Volume1. Disponvel em: http://www.w3.org/TR/webarch/,ltimo acesso em abril de 2012. W3C. Extensible Markup Language (XML) 1.0 (Fourth Edition). http://www.w3.org/TR/2006/REC-xml-20060816/,ltimo acesso em abril de 2012. W3C. SPARQL Query Language for RDF. http://www.w3.org/TR/rdf-sparqlquery,ltimo acesso em abril de 2012.
W3C.WorldWideWeb Consortium. http://www.w3.org/,ltimo acesso em abril de 2012. Web Semntica ou web 3.0, o que e para que serve?, disponvel em: http://www.oficinadanet.com.br/artigo/1831/web_semantica_ou_web_3.0_o_que_e _e_para_que_serve, ltimo acesso em: maio de 2012. Welkin. http://simile.mit.edu/welkin/, ltimo acesso em abril de 2012. Wilbur. http://wilbur-rdf.sourceforge.net/, ltimo acesso em abril de 2012. WILSON, Tracy V. Como funciona a web semntica. Disponvel em: http://informatica.hsw.uol.com.br/web-semantica.htm.Acesso em: maio de 2012 YARS. http://sw.deri.org/2004/06/yars/, ltimo acesso em maio de 2012.