Você está na página 1de 8

Introduo Web Semntica

Andr Desessards Jardim Universidade Catlica de Pelotas Centro Politcnico Mini Curso Web Semntica

1. Introduo
A organizao da imensa vastido de contedo disponvel atualmente na Internet, de uma forma simples, eficiente e focada em nossas necessidades, se tornou um problema. Dessa necessidade surgiu a Web Semntica. Sua principal aplicao se refere capacidade de os sistemas computacionais interpretarem o contedo disponvel nos sites da Internet e conseguir entender de forma diferenciada uma pgina em que a palavra bala um doce ou um projtil de armas, por exemplo. Ou seja, o contedo interpretado de acordo com seu contexto (Clicko, 2008). A Web Semntica representa a evoluo da Web atual. Enquanto a Web tradicional foi desenvolvida para ser compreendida somente pelos usurios, a Web Semntica est sendo projetada para ser entendida tambm pelas mquinas. Este entendimento se d na forma de agentes computacionais, que so capazes de operar eficientemente sobre as informaes, podendo entender seus significados. Portanto, auxiliando os usurios em operaes na Web (Dziekaniak et al., 2004). A Web Semntica tem como objetivo incorporar semntica s informaes. Com isso, no somente os usurios entendero as informaes como tambm as mquinas. Ela pretende fornecer estruturas e dar significado semntico ao contedo das pginas Web, criando assim um ambiente onde agentes de software possam trabalhar em conjunto com o usurio (Dziekaniak et al., 2004). Algumas tecnologias foram desenvolvidas para a Web Semntica, tais como o XML, linguagem de marcao que permite aos usurios criarem tags personalizadas sobre o documento criado. Outra tecnologia utilizada pela Web Semntica o RDF, que trabalha com um trio de informao o qual expressa o significado das informaes. Cada componente do trio tem sua prpria finalidade, em analogia ao sujeito, verbo e objeto de uma frase e recebe uma identificao URI. Estas tecnologias so fundamentais para o funcionamento da Web Semntica e sero abordadas de forma mais especfica nos mdulos seguintes.

2. Web Semntica
A Web Semntica consiste na materializao da proposta de Tim Berners-Lee, o criador da Web de dotar a Web com uma representao semntica compartilhada, de uma forma que pudesse ser interpretada simultaneamente por seres humanos e mquinas,

permitindo assim a inferncia automtica de contedo, futuros estados e aes. De acordo com Berners-Lee (2007), o modo mais simples de explicar a Web Semntica o seguinte: No seu computador voc tem seus arquivos, os documentos que voc l, e existem arquivos de dados como agendas, programas de planejamento financeiro, planilhas de clculo. Estes programas contm dados que so usados em documentos fora da web. Eles no podem ser colocados na Web. Segundo o mesmo autor, a Web Semntica sobre a colocao de arquivos de dados na Web. No apenas uma Web de documentos, mas tambm de dados. A tecnologia de dados da Web Semntica ter muitas aplicaes, todas interconectadas. Pela primeira vez haver um formato comum de dados para todos os aplicativos, permitindo que os bancos de dados e as pginas da Web troquem arquivos. Segundo Berners-Lee et al. (2001), grande parte do contedo da Web atual projetada para o entendimento humano apenas, no para programas de computador manipul-los significativamente, pois as mquinas ainda no possuem um mtodo seguro para processar a semntica. De acordo com ele, o objetivo da Web Semntica trazer estrutura para o contedo das pginas Web, aumentando-lhes o significado, criando um ambiente onde agentes de software podem fluir de pgina a pgina, cumprindo sofisticadas tarefas para os seus usurios. Ainda de acordo com Berners-Lee et al. (2001), e citado em Ramalho (2006), o primeiro passo para o desenvolvimento da Web Semntica a incluso de dados em um formato que os sistemas computacionais possam naturalmente compreender de forma direta ou indireta, tendo como principal objetivo possibilitar um melhor aproveitamento das potencialidades do ambiente Web, onde por meio do uso intensivo de linguagens computacionais e instrumentos de metadados espera-se obter o acesso automatizado s informaes de maneira mais precisa, utilizando-se para isso processamentos semnticos de dados e heursticas automticas. Conforme afirmam Berners-Lee et al. (2001): A Web Semntica uma extenso da Web atual, onde a informao possui um significado claro e bem definido, possibilitando uma melhor interao entre computadores e pessoas. Deste modo, evidente que o objetivo final da Web Semntica atender as pessoas e no os computadores, mas para isso torna-se necessrio construir instrumentos que forneam sentido lgico e semntico para as mquinas. Assim, pode-se verificar que a Web Semntica uma tentativa inversa de soluo, comparando-se com as tradicionalmente desenvolvidas, onde a idia pensar nas mquinas para que estas possam servir aos humanos de maneira mais eficiente (Ramalho, 2006). A Web Semntica representa a evoluo da Web atual. A Web tradicional foi desenvolvida para ser entendida apenas pelos usurios, j a Web Semntica foi idealizada para ser compreendida tambm pelas mquinas. Para isso utiliza diversas tecnologias, que so capazes de operar de maneira eficiente sobre as informaes, podendo entender seus significados, assim, auxiliando os usurios em operaes na Web (Dziekaniak et al., 2004). Ela

tem como objetivo fornecer estruturas e dar significado semntico ao contedo das pginas Web, criando um ambiente cooperativo, onde agentes de software e usurios possam atuar juntos. Esta evoluo ilustrada nas figuras 2.1 e 2.2.

Figura 2.1 Comparao entre Web 1.0, 2.0 e 3.0 A figura 2 mostra a evoluo da Web, com uma projeo at o ano de 2020. O eixo horizontal mostra o aumento da conectividade social, enquanto o eixo vertical mostra o aumento da conectividade de conhecimento e raciocnio. Comea no canto inferior esquerdo, mostrando a Web, que conecta informaes. No canto inferior direito est e Web Social, que conecta pessoas. No canto superior esquerdo se encontra a Web Semntica, que conecta conhecimento. E por fim, no canto superior direito est a Web Ubqua, que conecta inteligncia. Dentro de cada quadro se encontram termos descrevendo caractersticas de casa tipo de Web.

Figura 2.2 A evoluo da Web (Fonte Semantic Wave 2008) Segundo Golbeck et al. (2003), e citado em Jorge (2005), a Web Semntica uma viso de futuro da Web que ir dar significado a todos os dados, assim como tornar as informaes pblicas e acessveis a qualquer um que tenha interesse nelas. Enquanto muitos

sites da Web iro querer manter seus dados proprietrios, muitos outros iro optar por tornar suas informaes pblicas e abertas, usando marcaes semnticas nos contedos disponibilizados. Desta forma, continua a autora, a Web Semntica oferece novas capacidades, tornando possvel a adio de documentos que representam o 'conhecimento' sobre uma pgina, foto ou base de dados, pblico e de acesso livre, em um formato capaz de ser interpretado tambm pelas mquinas. De acordo com Ramalho (2006), uma das bases da Web Semntica reside na utilizao de ontologias, de modo que se espera que, com o desenvolvimento de ontologias formais, seja possvel descrever as informaes semnticas dos recursos Web, possibilitando o compartilhamento e a manipulao de informaes que possam ser interpretadas

computacionalmente de maneira automtica, a partir da utilizao de regras lgicas. Ontologias sero estudadas mais detalhadamente no mdulo 5. A Web Semntica construda de acordo com princpios que so implementados em camadas de tecnologias e de padres Web. Na Figura 2.3, podemos observar as camadas da Web Semntica.

Figura 2.3 As camadas da Web Semntica A camada Unicode/URI (Uniform Resource Identifier) fornece a interoperabilidade em relao codificao de caracteres e ao endereamento e nomeao de recursos da Web Semntica. O Unicode um padro de codificao para fornecer uma representao numrica universal e sem ambigidade para cada caractere de maneira independente da plataforma de software e do idioma. O URI (Uniform Resource Identifier) um padro para identificar um recurso fsico ou abstrato de maneira nica e global. Um identificador URL (Uniform

Resource Locator) um caso especfico de URI, formado pela concatenao de seqncias de caracteres para identificar o protocolo de acesso ao recurso, o endereo da mquina na qual o recurso pode ser encontrado e o prprio recurso em questo. o elemento bsico da

estruturas a partir dos quais os demais componentes so construdos. A camada XML, com as definies de namespace e schema, torna possvel a integrao das definies da Web Semntica com outros padres baseados em XML. XML tambm permite a criao de novas tags para atender aplicaes especficas. Fornece a interoperabilidade em relao sintaxe de descrio de recursos da Web Semntica. A Extensible Markup Language (XML) uma linguagem para representao sinttica de recursos de maneira independente de plataforma. Os documentos que tem sua estrutura e contedo representados na linguagem XML so denominados de documentos XML. A XML Schema uma linguagem de definio para descrever uma gramtica (ou esquema) para uma classe de documentos XML. A linguagem XML Schema fornece elementos para descrever a estrutura e restringir o contedo de documentos XML. Os espaos de nomes (namespaces) fornecem um mtodo para qualificar os nomes de elementos e atributos, utilizados nos documentos XML, atravs da associao destes nomes com os espaos de nomes identificados por referncias de URI. Os espaos de nomes so teis para distinguir entre dois elementos definidos com um mesmo nome, mas que pertencem a esquemas diferentes. Alem disso, um documento pode associar elementos previamente definidos sua estrutura, desde que utilize referencias aos esquemas que definem esses elementos. As camadas RDF e RDF Schema tornam possvel a definio de vocabulrios que podem ser atribudos por URIs e tambm possibilitam estabelecer declaraes sobre objetos com URIs. A camada RDF permite a representao de metadados e acessvel por mquinas. RDF Schema um modelo de tipos de dados simples que permite a criao de classes e propriedades. Permite obter estruturas de informao sem ambigidades. Fornece um framework para representar informao (metadados) sobre recursos. As principais

especificaes do Resource Description Framework (RDF) abrangem um modelo de dados (para expressar declaraes sobre os recursos), uma sintaxe baseada em XML (para o intercmbio das declaraes) e uma linguagem de definio de esquemas para vocabulrios. A RDF fornece um modelo de dados fundamentado na idia de expressar declaraes simples sobre recursos; cada declarao consiste de uma tripla (sujeito, predicado, objeto). Por exemplo na declarao: a data de criao da pgina http://ia.ucpel.tche.br/~lpallazo/Aulas/IIS 13/03/2009 Sujeito : http://ia.ucpel.tche.br/~lpallazo/Aulas/IIS

Predicado : data de criao Objeto : 13/03/2009

Um conjunto de triplas (ou declaraes) chamado de grafo RFD, que pode ser ilustrado como um diagrama de ns e arcos orientados, no qual cada tripla representada como uma ligao n-arco-n. O RDF fornece uma sintaxe baseada na linguagem XML, denominada de RDF/XML, para realizar o intercmbio desses grafos.

Alem do modelo e da sintaxe, a RDF tambm fornece uma linguagem, denominada RDF/Schema, para a definio de esquemas para os vocabulrios (termos) utilizados nas declaraes. A RDF-Schema estende a especificao bsica do RDF para permitir a definio de vocabulrios. Assim, o RDF-Schema uma linguagem mnima para a representao de Ontologias simples. Basicamente, essa linguagem fornece o suporte necessrio para descrever classes e propriedades, e tambm para indicar quais propriedades so utilizadas para a descrio de uma classe. A camada denominada Ontologia fornece suporte para a evoluo de vocabulrios e para processar e integrar a informao existente sem problemas de indefinio ou conflito de terminologia e tambm pode definir relaes entre conceitos diferentes. A linguagem RDFSchema permite a construo de ontologias com expressividade e inferncia limitadas, pois fornece um conjunto bsico de elementos para a modelagem, e poucos desses elementos podem ser utilizados para inferncia. A Web Ontology Language (OWL) estende o vocabulrio da RDF Schema para a incluso de elementos com maior poder com relao a expressividade e inferncia. Alem disso, a linguagem OWL fornece trs mdulos (ou dialetos), OWL Lite, OWL DL e OWL Full, para permitir o uso da linguagem por aplicaes com diferentes requisitos de expressividade e inferncia. O desenvolvedor pode escolher o mdulo OWL adequado, de acordo com os requisitos da sua aplicao. Esta camada o ncleo da Web Semntica, que no pode ser construda sem ela. SPARQL uma linguagem de consulta para os padres de grafos RDF/RDFS. Est para a Web Semntica assim como SQL est para as bases de dados relacionais. formada por padres de consultas, por um protocolo para uso na Web e formato XML para a sada dos resultados. A especificao SPARQL funciona com outras tecnologias de Web Semntica da W3C. Entre elas, est a RDF, para representar dados; a RDF Schema; a OWL, para construir vocabulrios; e a Gleaning Resource Descriptions Dialects of Languages (GRDDL), para extrao automtica de dados semnticos de documentos. RIF (Rule Interchange Format) uma proposta de um formato padronizado para o compartilhamento de regras entre diferentes comunidades: acadmicas, governamentais, empresariais, etc. Lgica Unificadora (Unifying Logic) uma representao unificada de expresses SPARQL, RIF e ontologias (descritas em OWL). O grande objetivo desta camada oferecer um framework nico para possibilitar a combinao dos elementos das camadas inferiores. Na camada de prova (Proof), mecanismos de inferncia devem especificados para o uso das regras previamente definidas. realizada a validao de informaes com o uso de agentes (Palazzo, 2008): software executado sem controle humano direto ou superviso constante para cumprir objetivos definidos por um usurio; coletam, filtram e processam informaes na Web, eventualmente com o auxlio de outros agentes. Na camada de Criptografia (Crypto), situada transversalmente s diversas camadas da

Web Semntica, muitas vezes necessrio garantir a segurana e privacidade das informaes. Com esta finalidade, mecanismos de criptografia so integrados s camadas, especialmente em aplicaes mais sensveis. Na camada de Confiana (Trust), aps a informao desejada ser obtida, necessrio determinar a sua autenticidade Declaraes de confiabilidade podem ser verificadas se houver confirmao de outra entidade (tambm confivel). No que diz respeito camada de Interface com o Usurio e Aplicaes (User Interface & Applications), segundo Palazzo (2008), uma das metas da Web Semntica a personalizao da interface do usurio em suas aplicaes. Para isso necessrio modelar as preferncias, necessidades e interesses de cada usurio Contribuem para essa meta o desenvolvimento (semi-) automatizado de ontologias pessoais com o uso de vocabulrios controlados como o Dublin Core e o FOAF. A importncia do estudo da Web Semntica reside no fato de que aplicaes baseadas na estrutura usual da Web tendem a incorporar cada vez mais os recursos da Web Semntica (metadados, ontologias, ndices de pesquisa e servios em geral), uma vez que tais recursos beneficiam, facilitam e viabilizam grandes aplicaes distribudas. O principal desafio da Web Semntica criar uma linguagem que consiga ao mesmo tempo expressar o significado e estabelecer regras para processar esse significado de forma a inferir novos dados e regras. As regras para o processamento do significado devem ser exportadas para a Web de forma a permitir que outros sistemas inteligentes possam interagir (Morais et al., 2003). Atualmente, novas formas de representao e recuperao de informao so cada vez mais necessrias, fundamentando pesquisas em diversas reas da cincia, como a cincia da computao, a cincia da informao e a lingstica. A Web Semntica uma extenso da Web atual e no uma substituio. Ilhas dessa nova tecnologia (nichos de conhecimento especficos para alguma aplicao mas que, atravs de interoperabilidade entre ontologias podero interagir) podero existir e serem desenvolvidas de forma a se incrementarem continuamente. Em outras palavras, no se deve pensar em termos de reconstruo da Web.

Referncias Bibliogrficas
BERNERS-LEE, T., HENDLER, J., and LASSILA, O., The Semantic Web, Scientific American, 284(5), pp.34-43, 2001(5). BERNERS-LEE, T., Qual o futuro da Web, segundo Tim Berners-Lee. Por Peter Moon, especial para o IDG Now! Publicada em 07 de julho de 2007 s 13h56. Atualizada em 18 de setembro de 2007 s 21h04. Disponvel por WWW em http://idgnow.uol.com.br/10anos/2007/07/07/idgnoticia.2007-07-06.9935975377/ CLICKO, O incio Web 3.0 Web Semntica. Disponvel por WWW http://clicko.blogspot.com/2008/01/o-inicio-web-30-web-semantica.html, 2008. em

DZIEKANIAK, G. V., KIRINUS, J. B., Web Semntica. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n.18, 2 sem. Disponvel por WWW em http://www.encontrosbibli.ufsc.br/Edicao_18/2_Web_Semantica.pdf, 2004 GOLBECK, J.; ALFORD, A.; HENDLER, J. Handbook of Human Factors in Web Design, chapter Organization and Structure of Information using Semantic Web Technologies, 2003. Disponvel por WWW em http://www.mindswap.org/papers/Handbook.pdf JORGE, A. M. Ontologias no Suporte a Portais Semnticos. Dissertao de Mestrado, Programa de Ps-Graduao em Cincia da Informao, Escola de Cincia da Informao, Universidade Federal de Minas Gerais, Belo Horizonte, junho de 2005. MORAIS, E. F., SOARES, M. B., Web Semntica para Mquinas de Busca. Curso de PsGraduao em Cincia da Computao, Projeto e Anlise de Algoritmos, Universidade Federal de Minas Gerais, 2003. Disponvel por WWW em http://homepages.dcc.ufmg.br/~nivio/cursos/pa03/seminarios/seminario7/seminario7.pdf PALAZZO, L. A. M., Tpicos Especiais em Web Semntica. Mestrado em Cincia da Computao, Centro Politcnico, Universidade Catlica de Pelotas, Pelotas, 2008. Notas de Aula. RAMALHO, R. A. S., Web Semntica: aspectos interdisciplinares da gesto de recursos informacionais no mbito da Cincia da Informao. Dissertao de Mestrado, Faculdade de Filosofia e Cincias, Mestrado em Cincia da Informao. Universidade Estadual Paulista, 2006. WIKIPEDIA, Web Semntica. Disponvel http://pt.wikipedia.org/wiki/Web_semantica, 2009 por WWW em