Escolar Documentos
Profissional Documentos
Cultura Documentos
Conteúdo
1. Introdução 2.
Apresentando o sonho da Web Semântica 3.
Método para a loucura?
4. Web Semântica: as tecnologias 5.
Problemas e possíveis problemas 6.
Conclusão 7. Referências
1. Introdução
Todos nós sabemos o que é a Internet. É uma enorme e complexa rede de computadores e vários outros
dispositivos inteligentes, todos conectados, compartilhando informações entre si em uma variedade de meios de
telecomunicações. É uma importante ferramenta de negócios e informação acessível a partir de locais locais e
remotos que utiliza o conjunto de protocolos TCP/IP para servir páginas da Web via HTTP, arquivos via FTP,
sistemas de gerenciamento de recursos eletrônicos via SNMP, correio eletrônico via POP3, SMTP e IMAP4 e
dados para dispositivos sem fio via WAP, etc. O que não é, no entanto, é inteligente.
O ambiente atual da Internet é fundamentalmente um meio de publicação. É um mecanismo por meio do qual
os dados, na forma de imagens e texto, são disponibilizados para consumo público ou pessoal. Assim como
uma revista não pode interagir com o conteúdo de outra revista, o conteúdo típico de um site também não pode
interagir com o conteúdo de outro site, a menos que mecanismos específicos sejam incorporados a cada um
para permitir essa interação.
A World-Wide Web é um emaranhado de informações que, por meio da implementação de hiperlinks,
permite que um navegador navegue – geralmente de forma bastante aleatória – de um site para outro. O
significado, contexto e aplicabilidade do conteúdo de cada página da Web precisam ser interpretados pelo
leitor humano.
Para usuários leigos que acessam a Internet a partir de seus computadores domésticos, parece que o servidor
Web, por meio do fornecimento de páginas e informações da Web para seu PC de mesa, está interagindo com
seu computador pessoal. Na verdade, porém, este não é o caso. Tudo o que normalmente ocorre é um servidor
Web respondendo com uma página pré-formatada – ou formato pré-determinado – de texto estático,
independentemente de quão dinâmico seja o conteúdo visível. Este texto pré-formatado é então
Machine Translated by Google
interpretado – em termos computacionais, o que não deve ser confundido com o conceito humano de
compreensão – pelo cliente Web e exibido de acordo com esse formato predeterminado. O computador de
navegação entende e reage às marcas de marcação usadas para formatar a página, mas não tem noção do
conteúdo real da página da Web. Para interpretar o conteúdo, é necessária alguma forma de interação humana.
Mas tudo isso está prestes a mudar, ou não?
principal
O conceito de Web Semântica é uma criação do criador original da World Wide Web, Tim Berners-Lee. A
idéia por trás da Web Semântica é 'tecer uma Web que não apenas vincule documentos uns aos outros, mas
também reconheça o significado das informações nesses documentos'. (Frauenfelder 2001); em outras
palavras, transformar a Web atual de uma série de ilhas de dados interconectadas, mas isoladas semanticamente,
em um gigantesco banco de dados de armazenamento, manipulação e recuperação de informações pessoais.
De acordo com Berners-Lee, Hendler e Lissila (2001), 'a maior parte do conteúdo da Web... é projetada
para que os humanos leiam, não para que os programas de computador manipulem de forma significativa.
Os computadores podem analisar habilmente páginas da Web para layout e processamento de rotina – aqui
um cabeçalho, ali um link para outra página, mas, em geral, os computadores não têm uma maneira confiável
de processar a Semântica…', ou o significado do conteúdo da página.
Tim Berners-Lee o vê como uma extensão da atual World-Wide Web que trará uma estrutura comum ao
conteúdo das páginas da Web, dando a esse conteúdo um significado que permitirá que agentes externos de
software executem tarefas sofisticadas em nome
do leitor ou usuário e, como tal, promover um maior grau de cooperação entre humanos e computadores. Ao
fazê-lo, uma nova era da computação será inaugurada em que as máquinas serão mais capazes de 'processar
e 'entender' os dados que apenas exibem no momento' (Berners-Lee et al. 2001).
Essa visão de uma Web Semântica pode, portanto, ser vista a partir de três perspectivas diferentes: (a) um
tipo de biblioteca universal que pode ser facilmente acessada e utilizada pelo ser humano na aquisição de
informações do dia-a-dia; (b) o backbone para software ou agentes computacionais utilizarem de forma
autônoma para realizar atividades particulares em nome de seus homólogos humanos; e (c) um 'método para
federar bases de conhecimento e bancos de dados particulares para realizar tarefas antecipadas para
humanos e seus agentes' (Marshall e Shipman nd).
A ideia por trás disso é marcar o conteúdo de uma página da Web de forma a criar simultaneamente uma
versão legível por humanos e por máquina da página da Web. A versão legível por máquina pode então ser
usada por agentes de software para filtrar, pesquisar e preparar dados de maneiras que possam ajudar o
usuário humano durante a navegação.
“A Web Semântica fornecerá uma infraestrutura que permite não apenas páginas da Web, mas bancos
de dados, serviços, programas, sensores, dispositivos pessoais e até eletrodomésticos para consumir e
produzir dados na Web” (Berners-Lee, Hendler e Miller 2002) .
principal
De acordo com Berners-Lee et al. (2001) para 'para que a Semântica funcione, os computadores devem
ter acesso a coleções estruturadas de informações e conjuntos de regras de inferência que possam usar
para conduzir o raciocínio automatizado'. Essa ideia não é nova, na verdade, os pesquisadores de
inteligência artificial estavam brincando e estudando esses tipos de sistemas antes mesmo da Web existir.
O que é necessário é uma maneira de representar o conhecimento que permita que os computadores o
interpretem no sentido tradicional de exibi-lo na tela em um formato legível por humanos, bem como
compreendê-lo em um nível de computador, permitindo assim que o computador reaja de forma autônoma
a tais conhecimento.
Em termos de computador, um sistema de conhecimento centralizado, como este, com suas próprias regras
idiossincráticas, limita severamente os tipos e a extensão das perguntas que o computador pode responder
de forma confiável – ou até mesmo responder. Felizmente, o objetivo não é eliminar todos os paradoxos e
perguntas sem resposta; em vez disso, é criar regras que sejam 'tão expressivas quanto necessário para
permitir que os computadores raciocinem tão amplamente quanto desejado'. Isso significa que, para reduzir
a 'confusão', a linguagem utilizada precisa não apenas expressar os dados, mas também expressar as regras
que regem a interpretação e o raciocínio sobre tais dados. Efetivamente, isso implica que a Web Semântica
seguirá a Web tradicional, no sentido de que também será baseada em um modelo descentralizado em que
cada provedor de conteúdo também fornecerá os mecanismos necessários para que qualquer máquina ou
dispositivo inteligente ou appliance interprete o conteúdo que está sendo fornecido.
Machine Translated by Google
De acordo com Tim Berners-Lee, o conceito e a filosofia em torno da Web Semântica não são diferentes da Web
original. 'No início do desenvolvimento da Web, os detratores apontaram que ela [a Web] nunca poderia ser uma
biblioteca bem organizada; sem um banco de dados central e uma estrutura em árvore, nunca se teria certeza
de encontrar algo. Eles estavam certos!
Mas o poder expressivo do sistema disponibilizou vastas quantidades de informação, e os motores de busca
(o que teria parecido impraticável uma década atrás) agora produzem índices notavelmente completos de
grande parte do material disponível” (Berners-Lee et al. 2001 ). ).
principal
Para revelar os dados que geralmente estão escondidos em arquivos HTML, Tim Berners-Lee et al. (2001)
conta com cinco tecnologias que, em graus variados, já estão sendo implementadas na Web. Essas
tecnologias são as seguintes:
4.1 Identificadores
Para identificar itens na Internet, são usados identificadores conhecidos como Identificadores de Recursos
Universais (URIs); o mais comum ou familiar deles é o Universal Resource Locator (URL), que é usado
para identificar o endereço de uma página da Web. Dividido, um URL consiste em uma seção que identifica o
computador e o domínio no qual a página reside, informações do diretório virtual e o nome real do arquivo da
página que está sendo visitada. Os URIs funcionam naturalmente da mesma forma, mas, nesse sentido, são
usados não como endereço de um ponto, mas como identificadores de recursos. Embora a sintaxe para criar
URIs seja cuidadosamente governada pelo IETF, o controle real sobre URIs é descentralizado, pois nenhuma
pessoa ou organização controla quem os faz ou como eles são usados, o que significa que nenhuma permissão
é necessária para criar um URI. Infelizmente, isso traz alguns problemas imediatamente aparentes, como vários
URIs apontando para a mesma coisa, ou URIs semelhantes apontando para coisas diferentes, etc. -offs como
estes seriam males necessários.
É importante ter em mente que um URI não funciona como um roteiro que informa ao computador como obter
um arquivo específico (mesmo que essa possa ser uma das funções que ele executa, como em uma URL). Em
vez disso, é apenas um nome para um recurso. 'Este recurso pode ou não ser acessível pela Internet. O URI
pode ou não fornecer um meio para o seu computador obter mais informações sobre aquele recurso' (Swartz nd)
Efetivamente, mesmo que um URI possa desempenhar outras funções, sua função principal é identificar um
recurso da Internet.
4.2 Documentos
4.2.1 XML – linguagem de marcação eXtensible
O XML foi projetado como uma maneira simples de armazenar ou enviar documentos pela Web, o que
permite ao desenvolvedor adicionar significado aos dados armazenados ou transmitidos. Essa funcionalidade é
disponibilizada ao permitir que um desenvolvedor crie suas próprias tags significativas que contêm dados. Quando
o arquivo XML é então interpretado, um aplicativo de computador pode analisar as tags e executar determinadas
funções nesses dados conforme determinado pelo conteúdo e atributos da tag, que a inclui.
Além disso, o XML permite que as declarações de namespace dentro de cada tag contenham
informações de URI, garantindo assim que as tags de nome criadas por uma pessoa não entrem em conflito
com as criadas por outra pessoa e, além disso, tornando-o o mecanismo perfeito para a Web Semântica. Um
namespace, mesmo que soe muito tecno-falado, nada mais é do que uma maneira de identificar uma parte
da Web da qual o significado dos nomes das tags é derivado.
Machine Translated by Google
XHTML está apenas aplicando essas mesmas regras de XML bem formado a páginas HTML tradicionais,
garantindo assim que a página não seja apenas HTML e navegável na Web, mas também XML bem
formado que possa ser usado por outros aplicativos como se fosse XML – o que, em essência, agora é.
Além disso, o atributo class do HTML normalmente usado para a aplicação de folhas de estilo em cascata
agora pode ser usado para inferir informações semânticas sobre o texto incluído nas tags.
A combinação de XSLT, XML e XHTML cria um ambiente poderoso para enviar e interpretar dados
semanticamente ricos e fornecer mecanismos para permitir que um aplicativo entenda melhor as informações
que está recebendo.
4.2.4 Declarações
A principal pedra angular da visão de Berners-Lee de criar uma Web inteligente e significativa está em uma
tecnologia conhecida como estrutura de descrição de recursos (RDF). RDFs usam um modelo de dados muito
simples que consiste em triplos de URI; em outras palavras, uma combinação de três URIs em uma ordem
específica, cada um representando identificadores para o sujeito, predicado e objeto dos dados que estão
sendo descritos. O URI de assunto geralmente constituirá um identificador que representa a origem do RDF
ou de onde o documento veio, enquanto o URI de objeto atua como os dados reais, um ponteiro para os dados
reais ou um identificador dos dados reais. O URI do objeto não precisa assumir a forma de um URI e pode ser
uma string literal. O URI de predicado relaciona o URI do sujeito ao URI do objeto.
Por exemplo:
<http://gregk.com>
<http://personalTaste.com/likes_dislikes/reallyLikes> <http://
SABmiller.co.za/beers/MillersGenuineDraught>
Este triplo ilustra claramente o modelo sujeito-predicado-objeto, ou a Web Semântica, e indica que Greg
Kuck (sujeito), realmente gosta (predicado) da cerveja Millers Genuine Draft, produzida pela SAB Miller (objeto).
A única coisa que deveria aparecer imediatamente é que agora é possível que "qualquer coisa diga qualquer
coisa sobre qualquer coisa" (Swartz nd). Aqui reside o poder por trás das declarações RDF: como o RDF é
um formato adequado para publicar informações de banco de dados na Web, outros aplicativos podem agora
utilizar ou redirecionar essas informações semanticamente ricas para suas próprias necessidades.
Machine Translated by Google
Embora XML seja normalmente usado para serializar dados RDF, conhecidos como RDF/XML, outras
tecnologias da Web, como SOAP, podem ser usadas com a mesma facilidade para modelos RDF – talvez isso
seja chamado de RDF/SOAP! RDF. Os esquemas diferem bastante dos esquemas XML e DTDs, pois, em vez de
definir a sintaxe permitida que pode residir em uma tag, eles definem classes, propriedades e suas inter-relações
e operam em um nível de modelo de dados em vez de em um nível de sintaxe.
É importante observar que XML, XHTML e XSLT juntos podem executar uma função muito semelhante à de
instruções RDF, pois as informações de conteúdo semântico podem ser incorporadas nas tags. Essas
informações semânticas podem então ser analisadas pelo aplicativo da Web receptor, permitindo que ele infira
um significado específico para o conteúdo. O problema com isso está no fato de que cada desenvolvedor Web
pode criar seus próprios aplicativos proprietários da Web Semântica. Esse significado, no entanto, não estará
disponível para outros aplicativos da Web, a menos que seja comunicado diretamente a outros desenvolvedores.
Como há pouco ou nenhum controle sobre como essas inferências semânticas são criadas, não pode haver
uniformidade e, portanto, a Internet já caótica pode se tornar mais uma bagunça emaranhada do que a World Wide
Web.
4.2.5 Ontologias
Como dois bancos de dados diferentes podem usar identificadores completamente diferentes para identificar
o mesmo conceito, como sobrenome e sobrenome, um programa que queira comparar esses dois conceitos
precisa saber que esses dois termos estão sendo usados para significar a mesma coisa. Para fazer isso, um
aplicativo precisa ter um método para descobrir esses significados comuns para qualquer banco de dados que
ele consulte.
Este método de descoberta é disponibilizado através do que é conhecido como 'ontologias'. Uma ontologia,
nesse sentido, refere-se a um documento ou arquivo que 'define formalmente as relações entre os
termos' (Berners-Lee et al. 2001). A ontologia típica da Web consiste em uma taxonomia e um conjunto de
regras de inferência. A taxonomia define todas as classes de objetos e quaisquer relacionamentos entre eles,
por exemplo, 'um endereço pode ser definido como um tipo de local e códigos de cidade podem ser definidos
para se aplicarem apenas a locais e assim por diante' (Berners-Lee et al. 2001). O uso de classes, subclasses e
relações são ferramentas muito poderosas para uso na Web, pois permitem que os desenvolvedores expressem
um grande número de relações entre diferentes entidades atribuindo propriedades às classes e permitindo que as
subclasses herdem essas propriedades.
As regras de inferência permitem que um aplicativo tome decisões com base nas classes fornecidas sem
precisar realmente entender nenhuma das informações fornecidas. Por exemplo, uma ontologia pode expressar
a regra de que 'se um código de cidade está associado a um código de estado, e um endereço usa esse
código de cidade, então esse código de endereço tem o código de estado associado' (Berners Lee et al. 2001).
O aplicativo receptor pode então inferir que, se um código de cidade específico for fornecido, esse endereço
deve estar em uma província ou estado específico. Efetivamente, tudo o que as ontologias permitem que uma
aplicação faça é manipular as informações fornecidas de acordo com regras predeterminadas e chegar a uma
conclusão lógica sobre esses dados no formato que ela exige.
Além disso, as ontologias podem ser usadas para executar uma variedade de funções diferentes além de
simples deduções. Como mais informações são apresentadas sobre um conceito, eles podem atuar para
melhorar a precisão das solicitações dos mecanismos de pesquisa e permitir que os aplicativos executem uma
ampla variedade de tarefas de forma autônoma, além de abordar questões complicadas que os mecanismos de
pesquisa atuais não estão preparados para responder.
4.2.6 Agentes
A chave final para a visão de Tim Berners-Lee de uma Web Semântica está nos agentes. Esses agentes são os
aplicativos de software reais que coletam conteúdo de toda a Web, processam o
Machine Translated by Google
informações e trocar os resultados com outros agentes de software. Esses agentes fornecerão a espinha
dorsal da Web Semântica, na medida em que poderão trocar dados com outros agentes mesmo que os
dados não sejam projetados especificamente para o agente em particular, eventualmente promovendo o
tipo de sinergia que toda a comunidade Web vem procurando por.
Além disso, esses agentes de software não são apenas responsáveis por mover informações
para trás e para frente, mas também por trocar assinaturas e provas digitais. Assinaturas digitais
são blocos de código criptografados que verificam se as informações transmitidas vêm de uma fonte
confiável e, por meio do uso de verificações CRC, garantem que os dados não foram adulterados,
enquanto as provas envolvem a verificação de que os dados transmitidos são válidos e verdadeiros.
Para fazer isso, o agente de software pode realizar verificações com base nas triplas e regras de inferência
do RDF para garantir que os dados recebidos sejam precisos.
principal
Para ilustrar possíveis problemas com a Web Semântica proposta, é necessário retornar às três
perspectivas básicas sobre o que se espera alcançar, a saber, (a) uma biblioteca universal; (b) o pano
de fundo para o trabalho dos agentes computacionais; e (c) um método para federar conhecimento e
bancos de dados para realizar certas tarefas previstas. Lidando com cada uma dessas perspectivas
individualmente, é possível, segundo Marshall e Shipman (sd), avaliá-las e determinar os possíveis
resultados e a plausibilidade da Web Semântica em atingir seus objetivos. A primeira dessas perspectivas,
a de domar a Web ou gerar uma biblioteca universal da Web, tornou-se praticamente obsoleta no âmbito
da Web Semântica, porque entidades como Google e AltaVista conseguiram criar mecanismos avançados
de indexação e recuperação de sites. A segunda e a terceira perspectivas, no entanto, ainda fazem parte
do foco dos grupos de atividades da Web Semântica e do W3C.
Esses problemas, no entanto, não são novidade. Os defensores da inteligência artificial lutam com os
problemas de aquisição, representação e uso do conhecimento há mais de 50 anos, com soluções
implementadas sendo criadas para entender problemas especializados. A própria natureza do
conhecimento significa que não é possível chegar a qualquer representação de um conceito que se
aplique igualmente a todas as circunstâncias, criando assim um problema de definições e contextos
intermináveis, bem como a possibilidade muito real de representações conflitantes desse conhecimento. .
As implicações disso no conceito de Web Semântica são tremendas, especialmente no que diz respeito
ao desenvolvimento e eficiência de processamento. Incluído nas despesas gerais está o tempo que leva
para um autor da Web aprender, não apenas a melhor forma de representar o conhecimento, mas também
a sintaxe, semântica, métodos de abstração, etc. para um único recurso alocar e analisar quaisquer
representações RDF estranhas.
Não só o conhecimento evolui, mas também existem certas formas de conhecimento que são
tácitas e, como tal, são difíceis de expressar, quanto mais representar. Isso significa que, embora a
Web Semântica tenha pouco ou nenhum problema em representar conceitos físicos, como produtos
e serviços, materiais e conceitos abstratos provarão ser outra questão.
Além disso, para minimizar os overheads, será necessário saber quais conhecimentos devem
ser enumerados e o que constitui fluff.
principal
6. Conclusão
A visão de Tim Berners-Lee de uma biblioteca de informações legível por máquina acessível a
humanos e máquinas, embora expansiva em escopo, infelizmente é limitada em aplicabilidade devido,
predominantemente, à natureza e à mutabilidade do conhecimento. Isso não quer dizer que não seja
uma solução viável, apenas que sua aplicabilidade provavelmente não será capaz de abranger toda a
Web; em vez disso, encontrará seu lugar em nichos de mercado específicos ou como meio de troca de
informações em setores específicos. É duvidoso que algum dia faça a transição para a aquisição,
disseminação e uso de informações convencionais.
principal
7 Referências
Berners-Lee, T., Hendler, J. e Lissila, O. 2001. A Web Semântica. [Conectados]. Disponível WWW:
http://sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21.
Isenção de responsabilidade
ISSN 1560-683X
Publicado pela InterWord Communications para o Center for Research in Web-based Applications,
Rand Afrikaans University