Você está na página 1de 10

Machine Translated by Google

Trabalho de estudante Vol.6(1) Março de 2004

Web Semântica de Tim Berners-Lee


G Kück
gregk@leafwireless.com
Leaf Wireless (Pty) Ltd Pós-
graduação em Gestão da Informação Rand Afrikaans University

Conteúdo

1. Introdução 2.
Apresentando o sonho da Web Semântica 3.
Método para a loucura?
4. Web Semântica: as tecnologias 5.
Problemas e possíveis problemas 6.
Conclusão 7. Referências

1. Introdução

Todos nós sabemos o que é a Internet. É uma enorme e complexa rede de computadores e vários outros
dispositivos inteligentes, todos conectados, compartilhando informações entre si em uma variedade de meios de
telecomunicações. É uma importante ferramenta de negócios e informação acessível a partir de locais locais e
remotos que utiliza o conjunto de protocolos TCP/IP para servir páginas da Web via HTTP, arquivos via FTP,
sistemas de gerenciamento de recursos eletrônicos via SNMP, correio eletrônico via POP3, SMTP e IMAP4 e
dados para dispositivos sem fio via WAP, etc. O que não é, no entanto, é inteligente.

O ambiente atual da Internet é fundamentalmente um meio de publicação. É um mecanismo por meio do qual
os dados, na forma de imagens e texto, são disponibilizados para consumo público ou pessoal. Assim como
uma revista não pode interagir com o conteúdo de outra revista, o conteúdo típico de um site também não pode
interagir com o conteúdo de outro site, a menos que mecanismos específicos sejam incorporados a cada um
para permitir essa interação.
A World-Wide Web é um emaranhado de informações que, por meio da implementação de hiperlinks,
permite que um navegador navegue – geralmente de forma bastante aleatória – de um site para outro. O
significado, contexto e aplicabilidade do conteúdo de cada página da Web precisam ser interpretados pelo
leitor humano.

Para usuários leigos que acessam a Internet a partir de seus computadores domésticos, parece que o servidor
Web, por meio do fornecimento de páginas e informações da Web para seu PC de mesa, está interagindo com
seu computador pessoal. Na verdade, porém, este não é o caso. Tudo o que normalmente ocorre é um servidor
Web respondendo com uma página pré-formatada – ou formato pré-determinado – de texto estático,
independentemente de quão dinâmico seja o conteúdo visível. Este texto pré-formatado é então
Machine Translated by Google

interpretado – em termos computacionais, o que não deve ser confundido com o conceito humano de
compreensão – pelo cliente Web e exibido de acordo com esse formato predeterminado. O computador de
navegação entende e reage às marcas de marcação usadas para formatar a página, mas não tem noção do
conteúdo real da página da Web. Para interpretar o conteúdo, é necessária alguma forma de interação humana.
Mas tudo isso está prestes a mudar, ou não?

principal

2 Apresentando o sonho da Web Semântica

O conceito de Web Semântica é uma criação do criador original da World Wide Web, Tim Berners-Lee. A
idéia por trás da Web Semântica é 'tecer uma Web que não apenas vincule documentos uns aos outros, mas
também reconheça o significado das informações nesses documentos'. (Frauenfelder 2001); em outras
palavras, transformar a Web atual de uma série de ilhas de dados interconectadas, mas isoladas semanticamente,
em um gigantesco banco de dados de armazenamento, manipulação e recuperação de informações pessoais.

De acordo com Berners-Lee, Hendler e Lissila (2001), 'a maior parte do conteúdo da Web... é projetada
para que os humanos leiam, não para que os programas de computador manipulem de forma significativa.
Os computadores podem analisar habilmente páginas da Web para layout e processamento de rotina – aqui
um cabeçalho, ali um link para outra página, mas, em geral, os computadores não têm uma maneira confiável
de processar a Semântica…', ou o significado do conteúdo da página.

Tim Berners-Lee o vê como uma extensão da atual World-Wide Web que trará uma estrutura comum ao
conteúdo das páginas da Web, dando a esse conteúdo um significado que permitirá que agentes externos de
software executem tarefas sofisticadas em nome
do leitor ou usuário e, como tal, promover um maior grau de cooperação entre humanos e computadores. Ao
fazê-lo, uma nova era da computação será inaugurada em que as máquinas serão mais capazes de 'processar
e 'entender' os dados que apenas exibem no momento' (Berners-Lee et al. 2001).

Essa visão de uma Web Semântica pode, portanto, ser vista a partir de três perspectivas diferentes: (a) um
tipo de biblioteca universal que pode ser facilmente acessada e utilizada pelo ser humano na aquisição de
informações do dia-a-dia; (b) o backbone para software ou agentes computacionais utilizarem de forma
autônoma para realizar atividades particulares em nome de seus homólogos humanos; e (c) um 'método para
federar bases de conhecimento e bancos de dados particulares para realizar tarefas antecipadas para
humanos e seus agentes' (Marshall e Shipman nd).

2.1 Biblioteca universal


O conceito de transformar a Web em uma biblioteca universal estava no centro da primeira visão de uma Web
Semântica e surgiu como uma reação ao caos e desordem da World-Wide Web. Naquela época, havia uma
ameaça muito real de grandes volumes de dados serem inacessíveis ou acessados de maneira ineficiente, e um
impulso geral para domar a Web foi favorecido. Felizmente, o Google e o AltaVista vieram com algoritmos de
indexação e recuperação aprimorados e, em grande parte, resolveram esse problema. Desde então, o foco dos
visionários da Web Semântica mudou ligeiramente de um sistema de catálogo universal para um que consiste na
cooperação global de autores da Web, vendo-o mais como uma extensão do sistema atual, em vez de uma
remodelação da Web existente.

2.2 Navegador de conhecimento


“A Web Semântica trará estrutura ao conteúdo significativo das páginas da Web, criando um ambiente onde os
agentes de software que percorrem uma página a outra podem prontamente realizar tarefas sofisticadas para os
usuários” (Berners-Lee et al. 2001).
Machine Translated by Google

A ideia por trás disso é marcar o conteúdo de uma página da Web de forma a criar simultaneamente uma
versão legível por humanos e por máquina da página da Web. A versão legível por máquina pode então ser
usada por agentes de software para filtrar, pesquisar e preparar dados de maneiras que possam ajudar o
usuário humano durante a navegação.

2.3 Dados federados ou base de conhecimento


Dados federados ou base de conhecimento envolvem componentes da Web sendo construídos de forma
a ter um conhecimento prévio uns dos outros ou, no mínimo, descobrir uns aos outros ou antecipar os
tipos de aplicativos que usarão as informações que eles fornecem.

“A Web Semântica fornecerá uma infraestrutura que permite não apenas páginas da Web, mas bancos
de dados, serviços, programas, sensores, dispositivos pessoais e até eletrodomésticos para consumir e
produzir dados na Web” (Berners-Lee, Hendler e Miller 2002) .

principal

3 Método para a loucura?

De acordo com Berners-Lee et al. (2001) para 'para que a Semântica funcione, os computadores devem
ter acesso a coleções estruturadas de informações e conjuntos de regras de inferência que possam usar
para conduzir o raciocínio automatizado'. Essa ideia não é nova, na verdade, os pesquisadores de
inteligência artificial estavam brincando e estudando esses tipos de sistemas antes mesmo da Web existir.
O que é necessário é uma maneira de representar o conhecimento que permita que os computadores o
interpretem no sentido tradicional de exibi-lo na tela em um formato legível por humanos, bem como
compreendê-lo em um nível de computador, permitindo assim que o computador reaja de forma autônoma
a tais conhecimento.

Tradicionalmente, os sistemas de representação do conhecimento têm sido centralizados, o que significa


que para que cada pessoa – ou coisa – para compartilhar o mesmo significado de um conceito, todos eles
precisam compartilhar a mesma definição desse conceito. Em outras palavras, para que as entidades se
comuniquem de forma eficiente, todas elas precisam entender o que se entende por um determinado
conceito, falar a mesma linguagem e ser capaz de participar, ou pelo menos se associar, ao contexto
específico em que o conceito é usado. Por exemplo, para compreender o conceito de 'can', o intérprete
precisa primeiro estar familiarizado com o idioma em que o conceito é expresso – neste caso o inglês – para
poder gerar significados. Mas o que significa o conceito? É um recipiente, como em uma lata de feijão?
Relaciona-se a uma habilidade do falante, como em 'ele pode beber muita cerveja'? Ou está sendo usado
como um eufemismo para outra coisa, como 'ir à lata'? Para determinar isso, o intérprete precisa acessar
outras informações externas ou contextuais. Infelizmente, é fácil ver que um sistema como esse pode sair
rapidamente do controle, tornando o gerenciamento e o controle mais desafiador do que compreendê-lo. Os
moradores das Ilhas Britânicas e da América do Norte aparentemente falam a mesma língua, mas o 'tronco'
de um país é a 'bota' de outro e a 'cor' de um é a 'cor' do outro.

Em termos de computador, um sistema de conhecimento centralizado, como este, com suas próprias regras
idiossincráticas, limita severamente os tipos e a extensão das perguntas que o computador pode responder
de forma confiável – ou até mesmo responder. Felizmente, o objetivo não é eliminar todos os paradoxos e
perguntas sem resposta; em vez disso, é criar regras que sejam 'tão expressivas quanto necessário para
permitir que os computadores raciocinem tão amplamente quanto desejado'. Isso significa que, para reduzir
a 'confusão', a linguagem utilizada precisa não apenas expressar os dados, mas também expressar as regras
que regem a interpretação e o raciocínio sobre tais dados. Efetivamente, isso implica que a Web Semântica
seguirá a Web tradicional, no sentido de que também será baseada em um modelo descentralizado em que
cada provedor de conteúdo também fornecerá os mecanismos necessários para que qualquer máquina ou
dispositivo inteligente ou appliance interprete o conteúdo que está sendo fornecido.
Machine Translated by Google

De acordo com Tim Berners-Lee, o conceito e a filosofia em torno da Web Semântica não são diferentes da Web
original. 'No início do desenvolvimento da Web, os detratores apontaram que ela [a Web] nunca poderia ser uma
biblioteca bem organizada; sem um banco de dados central e uma estrutura em árvore, nunca se teria certeza
de encontrar algo. Eles estavam certos!
Mas o poder expressivo do sistema disponibilizou vastas quantidades de informação, e os motores de busca
(o que teria parecido impraticável uma década atrás) agora produzem índices notavelmente completos de
grande parte do material disponível” (Berners-Lee et al. 2001 ). ).

principal

4 Web Semântica: as tecnologias

Para revelar os dados que geralmente estão escondidos em arquivos HTML, Tim Berners-Lee et al. (2001)
conta com cinco tecnologias que, em graus variados, já estão sendo implementadas na Web. Essas
tecnologias são as seguintes:

4.1 Identificadores
Para identificar itens na Internet, são usados identificadores conhecidos como Identificadores de Recursos
Universais (URIs); o mais comum ou familiar deles é o Universal Resource Locator (URL), que é usado
para identificar o endereço de uma página da Web. Dividido, um URL consiste em uma seção que identifica o
computador e o domínio no qual a página reside, informações do diretório virtual e o nome real do arquivo da
página que está sendo visitada. Os URIs funcionam naturalmente da mesma forma, mas, nesse sentido, são
usados não como endereço de um ponto, mas como identificadores de recursos. Embora a sintaxe para criar
URIs seja cuidadosamente governada pelo IETF, o controle real sobre URIs é descentralizado, pois nenhuma
pessoa ou organização controla quem os faz ou como eles são usados, o que significa que nenhuma permissão
é necessária para criar um URI. Infelizmente, isso traz alguns problemas imediatamente aparentes, como vários
URIs apontando para a mesma coisa, ou URIs semelhantes apontando para coisas diferentes, etc. -offs como
estes seriam males necessários.

É importante ter em mente que um URI não funciona como um roteiro que informa ao computador como obter
um arquivo específico (mesmo que essa possa ser uma das funções que ele executa, como em uma URL). Em
vez disso, é apenas um nome para um recurso. 'Este recurso pode ou não ser acessível pela Internet. O URI
pode ou não fornecer um meio para o seu computador obter mais informações sobre aquele recurso' (Swartz nd)
Efetivamente, mesmo que um URI possa desempenhar outras funções, sua função principal é identificar um
recurso da Internet.

4.2 Documentos
4.2.1 XML – linguagem de marcação eXtensible
O XML foi projetado como uma maneira simples de armazenar ou enviar documentos pela Web, o que
permite ao desenvolvedor adicionar significado aos dados armazenados ou transmitidos. Essa funcionalidade é
disponibilizada ao permitir que um desenvolvedor crie suas próprias tags significativas que contêm dados. Quando
o arquivo XML é então interpretado, um aplicativo de computador pode analisar as tags e executar determinadas
funções nesses dados conforme determinado pelo conteúdo e atributos da tag, que a inclui.

Além disso, o XML permite que as declarações de namespace dentro de cada tag contenham
informações de URI, garantindo assim que as tags de nome criadas por uma pessoa não entrem em conflito
com as criadas por outra pessoa e, além disso, tornando-o o mecanismo perfeito para a Web Semântica. Um
namespace, mesmo que soe muito tecno-falado, nada mais é do que uma maneira de identificar uma parte
da Web da qual o significado dos nomes das tags é derivado.
Machine Translated by Google

4.2.2 XHTML – HTML eXtensible ou bem formado


XML é uma linguagem de marcação estritamente tipada, pois diferencia maiúsculas de minúsculas e regras
estritas se aplicam ao formato necessário para constituir um XML bem formado. Para cada tag XML de
abertura precisa haver uma tag de fechamento. Além disso, devido aos relacionamentos pai-filho dos nós
dentro do XML, as tags filhas aninhadas precisam ser totalmente encapsuladas dentro das tags de abertura e
fechamento de seus nós pais. Em outras palavras, as tags filhas em um nó pai precisam ser fechadas no nó
pai na ordem em que foram abertas.

XHTML está apenas aplicando essas mesmas regras de XML bem formado a páginas HTML tradicionais,
garantindo assim que a página não seja apenas HTML e navegável na Web, mas também XML bem
formado que possa ser usado por outros aplicativos como se fosse XML – o que, em essência, agora é.
Além disso, o atributo class do HTML normalmente usado para a aplicação de folhas de estilo em cascata
agora pode ser usado para inferir informações semânticas sobre o texto incluído nas tags.

4.2.3 XSLT – transformações de linguagem de folha de estilo eXtensible


XSLT é uma linguagem de marcação normalmente aplicada a um arquivo XML, que transforma as
informações mais ricas que residem nesse arquivo em um formato que um aplicativo requer. O XSLT está
em conformidade com todas as regras do XML e também contém várias tags especializadas que permitem
que um aplicativo execute uma ampla variedade de funções nos dados XML, como instruções condicionais
como <XSL:IF>, <XSL:WHEN> e < XSL:OTHERWISE> e tags de seleção de valor como <XSL:VALUE-OF>,
bem como tags de processamento não linear como <XSL:TEMPLATE>.

A combinação de XSLT, XML e XHTML cria um ambiente poderoso para enviar e interpretar dados
semanticamente ricos e fornecer mecanismos para permitir que um aplicativo entenda melhor as informações
que está recebendo.

4.2.4 Declarações
A principal pedra angular da visão de Berners-Lee de criar uma Web inteligente e significativa está em uma
tecnologia conhecida como estrutura de descrição de recursos (RDF). RDFs usam um modelo de dados muito
simples que consiste em triplos de URI; em outras palavras, uma combinação de três URIs em uma ordem
específica, cada um representando identificadores para o sujeito, predicado e objeto dos dados que estão
sendo descritos. O URI de assunto geralmente constituirá um identificador que representa a origem do RDF
ou de onde o documento veio, enquanto o URI de objeto atua como os dados reais, um ponteiro para os dados
reais ou um identificador dos dados reais. O URI do objeto não precisa assumir a forma de um URI e pode ser
uma string literal. O URI de predicado relaciona o URI do sujeito ao URI do objeto.

Por exemplo:
<http://gregk.com>
<http://personalTaste.com/likes_dislikes/reallyLikes> <http://
SABmiller.co.za/beers/MillersGenuineDraught>

Este triplo ilustra claramente o modelo sujeito-predicado-objeto, ou a Web Semântica, e indica que Greg
Kuck (sujeito), realmente gosta (predicado) da cerveja Millers Genuine Draft, produzida pela SAB Miller (objeto).

A única coisa que deveria aparecer imediatamente é que agora é possível que "qualquer coisa diga qualquer
coisa sobre qualquer coisa" (Swartz nd). Aqui reside o poder por trás das declarações RDF: como o RDF é
um formato adequado para publicar informações de banco de dados na Web, outros aplicativos podem agora
utilizar ou redirecionar essas informações semanticamente ricas para suas próprias necessidades.
Machine Translated by Google

Embora XML seja normalmente usado para serializar dados RDF, conhecidos como RDF/XML, outras
tecnologias da Web, como SOAP, podem ser usadas com a mesma facilidade para modelos RDF – talvez isso
seja chamado de RDF/SOAP! RDF. Os esquemas diferem bastante dos esquemas XML e DTDs, pois, em vez de
definir a sintaxe permitida que pode residir em uma tag, eles definem classes, propriedades e suas inter-relações
e operam em um nível de modelo de dados em vez de em um nível de sintaxe.

É importante observar que XML, XHTML e XSLT juntos podem executar uma função muito semelhante à de
instruções RDF, pois as informações de conteúdo semântico podem ser incorporadas nas tags. Essas
informações semânticas podem então ser analisadas pelo aplicativo da Web receptor, permitindo que ele infira
um significado específico para o conteúdo. O problema com isso está no fato de que cada desenvolvedor Web
pode criar seus próprios aplicativos proprietários da Web Semântica. Esse significado, no entanto, não estará
disponível para outros aplicativos da Web, a menos que seja comunicado diretamente a outros desenvolvedores.
Como há pouco ou nenhum controle sobre como essas inferências semânticas são criadas, não pode haver
uniformidade e, portanto, a Internet já caótica pode se tornar mais uma bagunça emaranhada do que a World Wide
Web.

4.2.5 Ontologias
Como dois bancos de dados diferentes podem usar identificadores completamente diferentes para identificar
o mesmo conceito, como sobrenome e sobrenome, um programa que queira comparar esses dois conceitos
precisa saber que esses dois termos estão sendo usados para significar a mesma coisa. Para fazer isso, um
aplicativo precisa ter um método para descobrir esses significados comuns para qualquer banco de dados que
ele consulte.

Este método de descoberta é disponibilizado através do que é conhecido como 'ontologias'. Uma ontologia,
nesse sentido, refere-se a um documento ou arquivo que 'define formalmente as relações entre os
termos' (Berners-Lee et al. 2001). A ontologia típica da Web consiste em uma taxonomia e um conjunto de
regras de inferência. A taxonomia define todas as classes de objetos e quaisquer relacionamentos entre eles,
por exemplo, 'um endereço pode ser definido como um tipo de local e códigos de cidade podem ser definidos
para se aplicarem apenas a locais e assim por diante' (Berners-Lee et al. 2001). O uso de classes, subclasses e
relações são ferramentas muito poderosas para uso na Web, pois permitem que os desenvolvedores expressem
um grande número de relações entre diferentes entidades atribuindo propriedades às classes e permitindo que as
subclasses herdem essas propriedades.

As regras de inferência permitem que um aplicativo tome decisões com base nas classes fornecidas sem
precisar realmente entender nenhuma das informações fornecidas. Por exemplo, uma ontologia pode expressar
a regra de que 'se um código de cidade está associado a um código de estado, e um endereço usa esse
código de cidade, então esse código de endereço tem o código de estado associado' (Berners Lee et al. 2001).
O aplicativo receptor pode então inferir que, se um código de cidade específico for fornecido, esse endereço
deve estar em uma província ou estado específico. Efetivamente, tudo o que as ontologias permitem que uma
aplicação faça é manipular as informações fornecidas de acordo com regras predeterminadas e chegar a uma
conclusão lógica sobre esses dados no formato que ela exige.

Além disso, as ontologias podem ser usadas para executar uma variedade de funções diferentes além de
simples deduções. Como mais informações são apresentadas sobre um conceito, eles podem atuar para
melhorar a precisão das solicitações dos mecanismos de pesquisa e permitir que os aplicativos executem uma
ampla variedade de tarefas de forma autônoma, além de abordar questões complicadas que os mecanismos de
pesquisa atuais não estão preparados para responder.

4.2.6 Agentes
A chave final para a visão de Tim Berners-Lee de uma Web Semântica está nos agentes. Esses agentes são os
aplicativos de software reais que coletam conteúdo de toda a Web, processam o
Machine Translated by Google

informações e trocar os resultados com outros agentes de software. Esses agentes fornecerão a espinha
dorsal da Web Semântica, na medida em que poderão trocar dados com outros agentes mesmo que os
dados não sejam projetados especificamente para o agente em particular, eventualmente promovendo o
tipo de sinergia que toda a comunidade Web vem procurando por.

Além disso, esses agentes de software não são apenas responsáveis por mover informações
para trás e para frente, mas também por trocar assinaturas e provas digitais. Assinaturas digitais
são blocos de código criptografados que verificam se as informações transmitidas vêm de uma fonte
confiável e, por meio do uso de verificações CRC, garantem que os dados não foram adulterados,
enquanto as provas envolvem a verificação de que os dados transmitidos são válidos e verdadeiros.
Para fazer isso, o agente de software pode realizar verificações com base nas triplas e regras de inferência
do RDF para garantir que os dados recebidos sejam precisos.

principal

5 Problemas e possíveis problemas

Para ilustrar possíveis problemas com a Web Semântica proposta, é necessário retornar às três
perspectivas básicas sobre o que se espera alcançar, a saber, (a) uma biblioteca universal; (b) o pano
de fundo para o trabalho dos agentes computacionais; e (c) um método para federar conhecimento e
bancos de dados para realizar certas tarefas previstas. Lidando com cada uma dessas perspectivas
individualmente, é possível, segundo Marshall e Shipman (sd), avaliá-las e determinar os possíveis
resultados e a plausibilidade da Web Semântica em atingir seus objetivos. A primeira dessas perspectivas,
a de domar a Web ou gerar uma biblioteca universal da Web, tornou-se praticamente obsoleta no âmbito
da Web Semântica, porque entidades como Google e AltaVista conseguiram criar mecanismos avançados
de indexação e recuperação de sites. A segunda e a terceira perspectivas, no entanto, ainda fazem parte
do foco dos grupos de atividades da Web Semântica e do W3C.

Um dos maiores problemas decorrentes da criação de um tipo de navegador do conhecimento reside no


fato de que o conteúdo da Web deve atender a duas necessidades distintas: as do leitor humano e as do
leitor de máquina. Certos conceitos orientados para o ser humano, particularmente os abstratos (por
exemplo, amor, ódio e ciúme), são quase impossíveis de expressar em termos legíveis por máquina.
Além disso, os conceitos que se aplicam a uma situação muitas vezes não são tão aplicáveis em
outras situações; por exemplo, uma pessoa pode confiar em um site para entregar um determinado livro
dentro de um prazo especificado em boas condições, mas não necessariamente confiar nas opiniões
expressas com base no gosto e julgamento pessoal desse livro (Marshall e Shipman nd).

Esses problemas, no entanto, não são novidade. Os defensores da inteligência artificial lutam com os
problemas de aquisição, representação e uso do conhecimento há mais de 50 anos, com soluções
implementadas sendo criadas para entender problemas especializados. A própria natureza do
conhecimento significa que não é possível chegar a qualquer representação de um conceito que se
aplique igualmente a todas as circunstâncias, criando assim um problema de definições e contextos
intermináveis, bem como a possibilidade muito real de representações conflitantes desse conhecimento. .
As implicações disso no conceito de Web Semântica são tremendas, especialmente no que diz respeito
ao desenvolvimento e eficiência de processamento. Incluído nas despesas gerais está o tempo que leva
para um autor da Web aprender, não apenas a melhor forma de representar o conhecimento, mas também
a sintaxe, semântica, métodos de abstração, etc. para um único recurso alocar e analisar quaisquer
representações RDF estranhas.

Outra questão levantada pela representação do conhecimento reside no fato de que o


conhecimento está em constante evolução. O contexto de uma determinada informação muitas vezes
muda ao longo do tempo, às vezes essa evolução pode ser relativamente direta, mas
Machine Translated by Google

ocasionalmente exigirá a revisão completa de conceitos inteiros e suas inter-relações.


Um bom exemplo é levantado por Marshall e Shipman: “Considere a adição do forno
de micro-ondas à classe de fornos na década de 1970. Um forno de micro-ondas tem a
mesma finalidade (aquecer coisas), mas usa métodos tão diferentes que a hierarquia de conceitos
para fornos provavelmente terá que mudar, resultando na criação de classes abstratas adicionais
para expressar essas semelhanças e diferenças” (Marshall e Shipman sd)

Não só o conhecimento evolui, mas também existem certas formas de conhecimento que são
tácitas e, como tal, são difíceis de expressar, quanto mais representar. Isso significa que, embora a
Web Semântica tenha pouco ou nenhum problema em representar conceitos físicos, como produtos
e serviços, materiais e conceitos abstratos provarão ser outra questão.
Além disso, para minimizar os overheads, será necessário saber quais conhecimentos devem
ser enumerados e o que constitui fluff.

A última perspectiva, a de um conhecimento federado ou banco de dados, exige que


todos os componentes desenvolvidos tenham algum conhecimento uns dos outros e exige que,
no mínimo, esses componentes sejam capazes de negociar as informações que serão trocadas,
quais os dados são representados e como eles serão disponibilizados. Embora não seja um
problema em si, isso requer alguma forma de padronização e comunicação sobre como, onde e
por que os dados são compartilhados, o que, como todos sabemos, já apresentou problemas na
curta história da Internet – não é preciso procurar além da maneira como vários navegadores
implementam os padrões javascript do W3C ou as grandes diferenças entre a implementação do
SQL pela Microsoft e outros fornecedores para ver até que ponto as corporações estão dispostas
a se adequar a esses padrões.

Fora dessas perspectivas, o conceito de Web Semântica também levanta algumas


questões menos teóricas e mais pragmáticas. A primeira delas gira em torno do uso de
metadados. A visão de Tim Berners-Lee é amplamente baseada no uso descentralizado de
metadados para criar dados legíveis por máquina. Infelizmente, a experiência anterior na Web
mostrou que, sem alguma forma de controle sobre o uso dessas metatags, torna-se muito difícil
determinar a validade e precisão de seu conteúdo. Isso vale ainda mais para uma máquina, pois
ela não possui poder de raciocínio e, portanto, só pode basear decisões no conteúdo real. Além
disso, a sintaxe especificada para uso na Web Semântica é bastante complexa e, como o XML já
revelou, se não for formatada corretamente, levará a todos os tipos de problemas. O que um
aplicativo automatizado faz quando encontra uma sintaxe que não pode ser analisada? Ele o
ignora ou os desenvolvedores de agentes de software precisam construir super analisadores que
verificarão, corrigirão e interpretarão o código formado de maneira flexível? Com base em que
uma máquina tomará essas decisões? Precisaremos de um RDF e regras de inferência para
descrever outro RDF e suas regras de inferência, e onde traçamos a linha?

principal

6. Conclusão

O potencial da Web Semântica para resolver problemas do mundo real na


comunicação entre dispositivos, encontrando, classificando e classificando informações é enorme.
Infelizmente, para isso é necessário entender que seu poder é mais aplicável a certos tipos de
informação do que a outros. A esse respeito, é duvidoso que se torne a grande panacéia que livrará
a Web de todos os seus males e trará à tona seu verdadeiro potencial. Mesmo em situações em
que a aplicação de conteúdo semântico é aplicável, existe uma grande necessidade de que o
conceito seja reduzido, bem padronizado e melhor definido para que desenvolvedores e autores da
Web estejam em condições de aplicá-lo.
Machine Translated by Google

A visão de Tim Berners-Lee de uma biblioteca de informações legível por máquina acessível a
humanos e máquinas, embora expansiva em escopo, infelizmente é limitada em aplicabilidade devido,
predominantemente, à natureza e à mutabilidade do conhecimento. Isso não quer dizer que não seja
uma solução viável, apenas que sua aplicabilidade provavelmente não será capaz de abranger toda a
Web; em vez disso, encontrará seu lugar em nichos de mercado específicos ou como meio de troca de
informações em setores específicos. É duvidoso que algum dia faça a transição para a aquisição,
disseminação e uso de informações convencionais.

principal

7 Referências

Berners-Lee, T., Hendler, J. e Lissila, O. 2001. A Web Semântica. [Conectados]. Disponível WWW:
http://sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21.

Berners-Lee, T., Hendler, J. e Miller, E. 2002. Integração de aplicativos na Web Semântica.


[Conectados]. WWW: http://www.w3.org/2002/07/swint.

Frauenfelder, M. 2001. Uma Web mais inteligente. [Conectados]. Disponível


WWW: http://www.technologyreview.com/articles/frauenfelder1101.asp.

Marshall, CC e Shipman, FM e Qual Web Semântica. [Conectados]. Disponível WWW: http://


www.csdl.tamu.edu/~marshall/ht03-sw-4.pdf.

Swartz, A. nd A Web Semântica em amplitude. [Conectados]. Disponível WWW:


http://logicerror.com/SemanticWeb-long.

Isenção de responsabilidade

Os artigos publicados no SAJIM são as opiniões dos autores e não refletem


necessariamente a opinião do Editor, Conselho, Editor, Webmaster ou da Rand
Afrikaans University. O usuário renuncia a qualquer reclamação que possa ter ou
adquirir contra o editor, seus fornecedores, licenciados e sublicenciados e indeniza
todas as referidas pessoas de quaisquer reclamações, ações judiciais, processos,
custos, danos especiais, incidentais, consequenciais ou indiretos, incluindo danos
por lucros cessantes, perda de negócios ou tempo de inatividade decorrentes ou
relacionados ao uso do site pelo usuário.
Machine Translated by Google

ISSN 1560-683X
Publicado pela InterWord Communications para o Center for Research in Web-based Applications,
Rand Afrikaans University

Você também pode gostar