Você está na página 1de 12

A Web Semântica: Uma nova forma de conteúdo Web que é significativo para computadores irá desencadear uma revolução de novas possibilidades.

Berners-Lee, Tim; James Hendler and Ora Lassila Livre tradução do artigo homônimo publicado na Scientific American Magazine de 17 de maio de 2001

O aparelho de som estava tocando "We Can Work It Out" dos Beatles quando o telefone tocou. Quando Pete atendeu, seu telefone baixou o volume enviando uma mensagem a todos os outros dispositivos locais que tinham um controle de volume. Sua irmã, Lucy, estava ligando do consultório do médico: "Mamãe precisa ver um especialista e então ter uma série de sessões de fisioterapia. Duas vezes por semana ou algo assim. Vou fazer com que o meu agente marque as consultas." Pete concordou imediatamente em dividir a tarefa de motorista.

No consultório do médico, Lucy instruiu o seu agente da Web Semântica através de seu navegador Web de mão. O agente imediatamente recuperou informações sobre o tratamento prescrito para a Mamãe com o agente do médico, verificou diversos provedores e procurou por aqueles cobertos pelo plano médico da Mamãe, dentro de um raio de 32 km da sua casa e com uma avaliação de excelente ou muito bom em serviços de avaliação confiáveis. Começou então a tentar fazer o casamento entre os horários de consulta disponíveis (fornecidos pelos agentes dos provedores individualmente através de seus sites na Web) e as ocupadas agendas de Pete e Lucy. (As palavras-chave enfatizadas indicam termos cuja semântica, ou significado, foi definida para o agente através da Web Semântica).

Em poucos minutos o agente lhes apresentou um plano. Pete não gostou - O Hospital Universitário ficava do outro lado da cidade e ele iria dirigir de volta no meio da hora do rush. Ele configurou seu próprio agente para refazer a busca com preferências mais estritas quanto a localização e horário. O agente de Lucy, tendo total confiança no agente de Pete no contexto da tarefa atual, automaticamente auxiliou fornecendo certificados de acesso e atalhos para os dados que já havia garimpado.

Quase instantaneamente o novo plano foi apresentado: uma clínica muito mais próxima e horários mais cedo - mas haviam duas notas de advertência. Primeiro, Pete teria que reagendar alguns de seus compromissos menos importantes. Ele verificou o que eram - sem problema. A outra era sobre o plano de saúde não ter esse provedor listado como fisioterapeuta: "Tipo de serviço e situação do plano

verificado seguramente por outros meios," o agente lhe assegurou. "(Detalhes?)"

Lucy registrou seu consentimento quase ao mesmo tempo em que Pete murmurava, "Poupe-me dos detalhes," e ficou tudo resolvido. (É claro que Pete não pode resistir aos detalhes e mais tarde naquela noite pediu a seu agente para explicar como encontrou aquele provedor mesmo sem estar na lista apropriada.)

Expressando Significado

Pete e Lucy puderam usar seus agentes para desempenhar todas essas tarefas graças não à World Wide Web de hoje, mas à Web Semântica para a qual ela evoluirá amanhã. A maior parte do conteúdo da Web hoje é desenhado para que os humanos leiam, não para que programas de computador o manipulem de forma significativa. Os computadores podem verificar com perícia páginas Web quanto a layout e processamento de rotina - aqui há um cabeçalho, há um link para outra página ali - mas em geral, os computadores não possuem uma forma confiável de processar a semântica: esta é a home page da Clínica Fisioterápica Hartman e Strauss, este link leva ao curriculum vitae do Dr. Hartman.

A Web Semântica trará estrutura ao conteúdo significativo das páginas

Web, criando um ambiente onde agentes de softwares vagando de uma página para outra podem rapidamente desempenhar tarefas sofisticadas para os usuários. Um tal agente chegando à página Web da clínica saberia não somente que a página tem palavras-chave como "tratamento, medicamento, físico, terapia" (como poderia estar codificado hoje), mas também que o Dr. Hartman trabalha nesta clínica às Segundas, Quartas e Sextas e que o script aceita uma faixa de datas no formato yyyy-mm-aa e retorna os horários de consultas. E ele "saberia" tudo isso sem a necessidade de uma inteligência artificial na escala do Hal de "2001 - Uma Odisséia no Espaço" ou do C-3PO de "Guerra nas Estrelas". Ao invés disso, essa semântica seria codificada na página Web quando o gerente da clínica (que nunca teve aulas de ciência da computação) a fizesse tomar forma usando um software padrão para criar páginas da Web Semântica juntamente com recursos listados no site do Conselho de Fisioterapia.

A Web Semântica não é uma Web separada, mas uma extensão da

atual, na qual é dado um significado bem definido à informação, permitindo uma melhor cooperação entre computadores e pessoas. Os

primeiros passos para tecer a Web Semântica na estrutura da Web existente já estão em andamento. No futuro próximo esses

desenvolvimentos irão levar a uma significantemente nova funcionalidade, à medida que as máquinas se tornarem melhor capacitadas a processar e "entender" os dados que elas meramente apresentam no momento.

A propriedade essencial da World Wide Web é a sua universalidade. O

poder de um link de hipertexto é que "qualquer coisa pode se ligar a qualquer coisa". A tecnologia da Web, portanto, não deve discriminar

entre a performance do rascunho e a do texto acabado, entre a informação comercial e a acadêmica, ou entre culturas, linguas, meios

e assim por diante. A informação varia sobre muitos eixos. Um deles é a diferença entre a informação produzida primariamente para o consumo humano e aquela produzida principalmente para máquinas. Em uma ponta da escala temos tudo, desde o comercial de TV de 5 segundos até a poesia. Na outra ponta temos bancos de dados, programas e saídas de sensores. Até a presente data, a Web tem-se desenvolvido mais rapidamente como uma mídia para documentos para as pessoas e não para dados e informações que podem ser processados automaticamente. A Web Semântica busca cobrir esta parte.

Como a Internet, a Web Semântica será tão descentralizada quanto possível. Tais sistemas Web-like geram muita excitação em todos os níveis, das grandes corporações até os usuários individuais, e geram benefícios que são difíceis ou impossíveis de se predizer. A descentralização exige compromissos: a Web teve que lançar fora o ideal da consistência total de todas as suas interconexões, levando à infame mensagem "Erro 404: Não encontrado", mas permitindo ilimitado crescimento exponencial.

Representação do Conhecimento

Para que a Web Semântica funcione, os computadores precisam ter acesso a coleções estruturadas de informações e conjuntos de regras de inferência que possam usar para conduzir arrazoamento automatizado. Pesquisadores de inteligência artificial têm estudado tais sistemas desde muito antes de a Web ser desenvolvida. A representação do conhecimento, como essa tecnologia é freqüentemente chamada, está atualmente em um estado comparável com o do hipertexto antes do advento da Web: é claramente uma boa idéia, e existem algumas demonstrações muito boas, mas ainda não mudou o mundo. Ela contem as sementes de aplicativos importantes, mas para descobrir seu potencial total precisa estar ligada em um sistema global único.

Sistemas tradicionais de representação de conhecimento tipicamente têm sido centralizados, exigindo que todos compartilhem exatamente a mesma definição de conceitos comuns tais como "pais" ou "veículo".

Mas controle centralizado é sufocante, e aumentar o tamanho e o alcance de um tal sistema rapidamente se torna igerenciável.

Além disso, esses sistemas normalmente limitam cuidadosamente as perguntas que podem ser feitas para que o computador possa responder confiavelmente - ou simplesmente responder. O problema é reminiscente do teorema de G'del da matemática: qualquer sistema que seja complexo o bastante para ser útil também engloba respostas impossíveis de responder, assim como versões sofisticadas do paradoxo básico "Esta sentença é falsa". Para evitar tais problemas, os sistemas tradicionais de representação do conhecimento geralmente têm cada um seu próprio estreito e idiosincrático conjunto de regras para fazer inferências sobre seus dados. Por exemplo, um sistema de genealogia, atuando sobre um banco de dados de árvores de famílias, pode incluir a regra "uma esposa de um tio é uma tia". Mesmo que os dados pudessem ser transferidos de um sistema para outro, as regras, existindo em forma completamente diferente, normalmente não poderiam.

Pesquisadores da Web Semântica, em contraste, aceitam que paradoxos e perguntas sem respostas sejam um preço que precisa ser pago para alcançar versatilidade. Fazemos a linguagem para as regras tão expressivas quento necessário para permitir à Web arrazoar tão amplamente quanto desejado. Essa filosofia é similar à da Web convencional: no início do desenvolvimento da Web, os difamadores apontavam que ela jamais poderia ser uma biblioteca bem organizada; sem um banco de dados central e uma estrutura em árvore, ninguém

jamais poderia ter certeza de encontrar tudo. Eles estavam certos. Mas

o poder expressivo do sistema tornou vastas quantidades de

informações disponíveis, e os motores de busca (que teriam parecido

bastante impraticáveis uma década atrás) agora produzem índices notavelmente completos de muito material por ai. O desafio da Web Semântica, portanto, é fornecer uma linguagem que expresse tanto dados quanto regras para arrazoamento sobre os dados e que permitam que as regras de qualquer sistema de representação do conhecimento existente sejam exportadas para a Web.

Adicionar lógica à Web - os meios para utilizar regras para fazer

inferências, escolher cursos de ação e responder perguntas - é a tarefa diante da comunidade da Web Semântica no momento. Uma mistura

de decisões matemáticas e de engenharia complicam a tarefa. A lógica

precisa ser poderosa o suficiente para descrever propriedades complexas dos objetos, mas não tão poderosa que os agentes possam ser enganados ao ser-lhes pedido que considerem um paradoxo. Felizmente, uma grande maioria das informações que queremos

expressar está na linha de "um parafuso sextavado é um tipo de parafuso de máquina", que é prontamente escrito nas linguagens existentes com um pouco de vocabulário extra. Duas tecnologias importantes para desenvolver a Web Semântica já estão implantadas: eXtensible Markup Language (XML) e Resource Description Framework (RDF). XML permite a todos criar suas próprias tags - rótulos ocultos tais como ou que comentam páginas Web ou seções de texte em uma página. Scripts, ou programas, podem fazer uso dessas tags de formas sofisticadas, mas o ecritor do script tem que saber para que o escritor da página usa cada tag. Em resumo, XML permite aos usuários adicionar uma estrutura arbitrária a seus documentos mas não diz nada sobre o que a estrutura significa.

A Web Semântica capacitará as máquinas a COMPREENDER documentos e dados semânticos, não a fala ou escrita humana.

O significado é expresso pelo RDF, que ocodifica em uma série de

trios, cada trio sendo mais como sujeito, verbo e objeto de uma sentença elementar. Esses trios podem ser escritos usando tags XML. Em RDF, um documento faz declarações de que certas coisass (pessoas, páginas Web ou o que quer que seja) têm propriedades (tais como "é irmã de", "é autor de") com certos valores (outra pessoa, outra página Web). Essa estrutura acaba sendo uma forma natural de descrever a vasta maioria dos dados processados pelas máquinas. Sujeito e objeto são, cada um, identificados por um Universal Resource Identifier (URI), exatamente como usado em um link em uma página Web. (URLs, Uniform Resource Locators, são os tipos mais comuns de URI.) Os verbos também são identificados por URIs, o que possibilita a qualquer um definir um novo conceito, um novo verbo, simplesmente definindo uma URI para ele em algum lugar da Web.

A linguagem humana é prolífera quanto a usar o mesmo termo para

significar coisas bem diferentes, mas a automação não. Imagine que eu contrate um serviço de mensageiro palhaço para entregar balões aos meus clientes em seu aniversário. Infelizmente, o serviço transfere o endereço do meu banco de dados para o seu banco de dados, sem saber que "endereços" no meu são para onde as contas são enviadas e que muitos deles são caixas postais. Meus palhaços contratados acabam entretendo um monte de trabalhadores do serviço postal - não necessáriamente uma coisa ruim mas certamente não o efeito pretendido. Usando uma URI diferente para cada conceito específico resolve esse problema. Um endereço que seja um endereço postal

pode ser distinto de um que seja um endereço residencial ou comercial,

e ambos podem ser distintos de um endereço que seja uma fala (NT - como endereçar a uma platéia, mais comum na lingua inglesa).

Os trios do RDF formam teias (webs) de informações sobre coisas relacionadas. Como o RDF usa URIs para codificar essa informação em um documento, as URIs asseguram que os conceitos não sejam somente palavras em um documento mas estejam atadas a uma definição única que todos podem encontrar na Web. Por exemplo, imagine que tenhamos acesso a uma variedade de bancos de dados com informações sobre pessoas, incluindo seus endereços. Se quisermos encontrar pessoas que vivam em um código postal específico, precisamos saber quais campos em quais bancos de dados representam nomes e quais representam códigos postais. o RDF pode especificar que "(o campo 5 no banco de dados A) (é um campo do tipo) (código postal)", usando URIs ao invés de frases para cada termo.

Ontologias

Claro, este não é o fim da história, pois dois bancos de dados podem usar identificadores diferentes para o que é de fato o mesmo conceito, tal como um código postal. Um programa que queira comparar ou combinar informações entre os dois bancos de dados tem que saber que esses dois termos estão sendo usados para significar a mesma coisa. Idelamente, o programa precisa ter uma maneira de descobrir tais significados comuns para quaisquer bancos de dados que encontre.

Uma solução para esse problema é fornecida pelo terceiro componente básico da Web Semântica, coleções de informações chamadas ontologias. Em filosofia, uma ontologia é uma teoria sobre a natureza da existência, de quais tipos de coisas existem; ontologia como disciplina estuda tais teorias. Pesquisadores de inteligência artificial e da Web assimilaram o termo em seu próprio jargão, e para eles uma antologia é um documento ou arquivo que define formalmente as relações entre termos. O tipo mais comum de antologia para a Web tem uma taxonomia e um conjunto de regras de inferência.

A taxonomia define classes de objetos e relações entre eles. Por

exemplo, um endereço pode ser definido como um tipo de localização,

e códigos de cidades podem ser definidos como se aplicando somente

a localizações e assim por diante. Classes, sub-classes e relações

entre entidades são uma ferramenta poderosa para o uso da Web. Podemos expressar um grande número de relações entre entidades atribuindo propriedades às classe e permitindo que subclasse herdem

tais propriedades. Se códigos de cidades têm que ser do tipo cidade e cidade geralmente têm sites da Web, podemos discutir o site da Web associado com um código de cidade mesmo que nenhum banco de dados ligue um código de cidade diretamente a um site da Web.

Regras de inferência fornecem ainda mais poder. Uma antologia pode expressar a regra "Se um código de cidade está associado a um código de estado, e um endereço usa esse código de cidade, então o endereço tem o código de estado associado". Um programa poderia então prontamente deduzir, por exemplo, que o endereço da Universidade de Cornell, estando em Ithaca, deve estar no Estado de New York, o qual está nos Estados Unidos, e portanto deve ser formatado para os padrões dos Estados Unidos. O computador não "entende" verdadeiramente essa informação, mas pode agora manipular os termos muito mais efetivamente de formas que sejam úteis e significativas para o usuário humano.

Com páginas de ontologia na Web, soluções para problemas de terminologia (e outros) começam a emergir. O significado de termos ou códigos XML usados em uma página da Web pode ser definido por ponteiros daquela página para uma ontologia. Claro, os mesmos problemas de antes agora emergem se eu aponto para uma antologia que define endereços como contendo um CEP e você aponta para uma que usa código postal. Esse tipo de confusão pode ser resolvido se as ontologias (ou outros serviços da Web) fornecerem relações de equivalência: uma ou ambas as nossas antologias podem conter a informação de que o meu CEP é equivalente ao seu código postal.

O nosso esquema para enviar os palhaços para entreter meus clientes

é parcialmente resolvido quando os dois bancos de dados apontam

para definições diferentes de endereço. O programa, utilizando URIs distintas para conceitos diferentes de endereços, não os confundirá e de fato não precisará descobrir que os conceitos estão sequer relacionados. O programa poderia então usar um serviço que toma

uma lista de endereços postais (definidos na primeira antologia) e convertê-la em uma lista de endereços físicos (a segunda antologia) reconhecendo e removendo as caixas postais e outros endereços que não encaixem. A estrutura e semântica fornecidas pelas ontologias tornam mais fácil para um empreendedor fornecer tal serviço e podem tornar seu uso completamente transparente.

As ontologias podem ampliar a funcionalidade da Web de várias formas. Elas podem ser usadas de forma simples para melhorar a precisão das buscas na Web - os programas de busca podem procurar somente por aquelas páginas que se referem a um conceito preciso ao invés de todos aqueles que utilizam palavras-chave anbiguas. Aplicativos mais avançados utilizarão ontologias para relacionar a

informação em uma página com estruturas de conhecimento regras de inferência associadas. Um exemplo de um página preparada para tal uso está online em http://www.cs.umd.edu/~hendler. Se direcionar o seu navegador para essa página, você verá a página Web normal intitulada "Dr. James A. Hendler". Como humano você pode prontamente encontrar o link para uma curta nota biográfica e ler lá que Hendler recebeu seu Ph.D. da Universidade Brown. Um programa de computador tentando encontrar essa informação, entretanto, teria que ser muito complexo para imaginar que essa informação possa estar em uma biografia e entender a lingua Inglesa usada lá.

Para os computadores, a página está ligada a uma página de ontologia que define informações sobre departamentos de ciência da computação. Por exemplo, professores trabalham em universidades e eles geralmente têm doutorados. Outro markup na página (não mostrado pelo navegador típico) usa os conceitos da ontologia para especificar que Hendler recebeu seu Ph.D. de uma entidade descrita na URI http://www.brown.edu - a página Web da Universidade Brown. Os computadores também podem descobrir que Hendler é um membro de um projeto de pesquisa em particular, tem um endereço de e-mail em particular, e assim por diante. Toda essa informação é prontamente processada por um computador e poderia ser usada para responder consultas (tal como onde o Dr. Hendler recebeu sua graduação) que atualmente exigiriam que um humano inspecionasse o conteúdo de várias páginas apresentada por um motor de busca.

Adicionalmente, esse markup torna muito mais fácil desenvolver programas que possam atacar questões complicadas cujas respostas não residem em uma única página Web. Suponha que você queira encontrar a Sra Cook que você conheceu em uma conferência no ano passado. Você não se lembra seu primeiro nome, mas se lembra que ela trabalhou para um de seus clientes e que o filho dela era aluno da faculdade em que você se formou. Um programa inteligente de busca pode inspecionar todas as páginas de pessoas cujo nome é "Cook" (deixando de lado todas as páginas relacionadas a cozinheiros <cooks>, cozinha <cooking>, as Ilhas Cook e assim por diante), encontrar aquelas que mencionam trabalhar para uma companhia que está em sua lista de clientes e seguir links para páginas Web de seus filhos para investigar se algum está na escola o lugar certo.

Agentes

O real poder da Web Semântica será descoberto quando as pessoas criarem muitos programas que coletam conteúdo da Web de diversas fontes, processam a informação e compartilham os resultados com outros programas. A efetividade de tais agentes de software crescerá exponencialmente à medida em que mais conteúdo Web e legível pelas

máquinas e serviços automatizados (incluindo outros agentes) se tornem disponíveis. A Web Semântica promove esta sinergia: até mesmo agentes não expressamente desenhados para trabalhar em conjunto podem transferir dados entre si quando os dados vêm com semântica.

Uma importante faceta do funcionamento dos agentes será a troca de "provas" escritas na linguagem de unificação da Web Semântica (a linguagem que expressa inferências lógicas feitas usando regras e informações tais como as especificadas em ontologias). Por exemplo, suponha que a informação de contato da Sra Cook foi localizada por um serviço online, e para sua grande surpresa ela a coloca em Johannesburgo. Naturalmente, você quer verificar isso, então seu computador pede ao serviço uma prova de sua resposta, a qual ele prontamente fornece traduzindo seu arrazoamento interno na linguagem de unificação da Web Semântica. Um motor de inferência em seu computador verifica imediatamente que essa Sra Cook realmente coincide com a que você estava procurando e pode mostrar as páginas Web relevantes se você ainda tiver dúvidas. Apesar de ainda estarem longe de canalizar as profundezas do potencial da Web Semântica, alguns programas já podem trocar provas desta forma, usando as versões preliminares atuais da linguagem de unificação.

Outra característica vital serão as assinaturas digitais, que são blocos criptografados de dados que computadores e agentes podem usar para verificar que uma informação anexada foi fornecida por uma fonte acreditada específica. Você quer ter total certeza de que uma declaração enviada ao seu programa de contabilidade de que você deve dinheiro a uma loja online não seja forjada um nerd adolescente vizinho seu. Os agentes devem ser céticos a declarações que lêem na Web Semântica até que tenha checado as fontes da informação. (Gostariamos que mais pessoas pudessem aprender a fazer isto na Web como está!)

Muitos serviços automatizados baseados na Web já existem sem semântica, mas outros programas tais como os agentes não têm como localizar um que irá desempenhar uma função específica. Esse processo, chamado de descoberta de serviço, pode acontecer somente quando existe uma linguagem comum para descrever um serviço de forma a permitir que outros agentes "entendam" a funçao oferecida e como tirar vantagem disso. Serviços e agentes podem divulgar sua função, por exemplo, depositando tais descrições em diretórios análogos às Páginas Amarelas.

Alguns esquemas de descoberta de serviços de baixo nível estão atualmente disponíveis, tais quais o Universal Plug and Play da Microsoft, que focaliza em conectar diferentes tipos de dispositivos, e o

Jini da Sun Microsystems, que busca conectar serviços. Essas iniciativas, entretanto, atacam o problema em um nível estrutural ou sintático e dependem pesadamente de uma padronização de um conjunto predeterminadoo de descrições de funcionalidades. A padronização só pode chegar até aí, porque não podemos antecipar todas as possíveis necessidades futuras.

Desenhada apropriadamente, a Web Semântica pode ajudar na evolução do conhecimento humano como um todo.

A Web Semântica, em contraste, é mais flexível. Os agentes do

consumidor e do produtor podem alcançar e compartilhar entendimento compartilhando ontologias, que fornecem o vocabulário necessário para a discussão. Os agentes podem até mesmo "criar" novas capacidades de racionalização ao descobrirem novas ontologias. A semântica também torna mais fácil tirar vantagem de um serviço que se encaixa somente parcialmente em um pedido.

Um processo típico envolverá a criação de uma "corrente de valor" na qual sub-grupos de informações são passados de um agente para outro, cada um "adicionado valor", para construir o produto final solicitado pelo usuário final. Não se engane: para criar correntes de valor complicadas automaticamente sob solicitação, alguns agentes explorarão tecnologias de inteligência artificial juntamente com a Web Semântica. Mas a Web Semântica fornecerá as fundações e a estrutura para tornar tais tecnologias mais viáveis.

Colocar todas essas características juntas resulta nas habilidades

exibidas pelos agente de Pete e Lucy no cenário que abriu este atigo. Seus agentes teriam delegado a tarefa de forma fragmentada para outros serviços e agentes descobertos através das divulgações de serviços. Por exemplo, eles poderiam ter usado um serviço acreditado para tirar uma lista de provedores e determinar quais deles estão cobertos por um plano de saúde e curso de tratamento específicos. Essa lista de provedores teria sido fornecida a outro serviço de busca,

et cetera. Essas atividades forariam correntes nas quais uma grande

quantidade de dados distribuídos através da Web (e quase impraticáveis nessa forma) fossem progressivamente reduzidos à pequena quantidade de dados de alto valor para Pete e Lucy - um plano de consultas que se encaixe em suas agendas e outros requisitos.

No próximo passo, a Web Semântica ultrapassará o reino virtual e se estenderá para o nosso mundo físico. As URIs podem apontar para

qualquer coisa, inclusive entidades físicas, o que significa que podemos usar a linguagem RDF para descrever dispositivos como telefones celulares e TVs. Tais dispositivos podem divulgar suas funcionalidades - o que eles podem fazer e como são controlados - muito parecido com agentes de software. Sendo muito mais flexível do que esquemas de baixo nível como o Universal Plug and Play, essa abordagem semântica abre um mundo de possibilidades excitantes.

Por exemplo, o que hoje é chamado de automação residencial requer configuração cuidadosa para que os aparelhos funcionem juntos. Descrições semânticas das capacidades e funcionalidades de dispositivos nos permitirá alançar essa automação com mínma intervenção humana. Um exemplo trivial ocorre quando Pete atende seu telefone e o som é abaixado. Ao invés de ter que programar cada aparelho individualmente, ele poderia programar essa função de uma vez por todas para cobrir todos os dispositivos locais que anunciam ter um controle de volume - a TV, o DVD e até mesmo os tocadores de media no laptop que ele trouxe para casa do trabalha nesta tarde.

Os primeiros passos concretos já foram dados nesta área, com trabalhos no desenvolvimento de um padrão para descrever capacidades funcionais de dispositivos (como tamanhos de telas) e preferências do usuário. Construído em RDF, esse padrão é chamado de Composite Capability/Preference Profile (CC/PP - Capacidade Composta/Padrão de Preferência). Inicialmente ele permitirá que telefones celulares e outros clientes Web não padrão descrevam suas características para que conteúdo Web possa ser moldado para eles automaticamente. Depois, quando adicionarmos a total versatilidade das linguagens para manipular ontologias e lógica, os dispositivos poderão automaticamente buscar e empregar serviços e outros dispositivos para informação ou funcionalidade adicional. Não é difícil imaginar nosso forno de micro-ondas habilitado para a Web consultando o site Web do fabricante de alimentos congelados em busca de parâmetros ótimos de cozimento.

Evolução do Conhecimento

A Web Semântica não é "meramente" a ferramenta para conduzir as tarefas individuais que discutimos até aqui. Em adição, se propriamente desenhada, a Web Semântica pode auxiliar na evolução do conhecimento humano como um todo.

O esforço humano está preso em uma tensão eterna entre a efetividade de pequenos grupos agindo independentemente e a necessidade de engrenar-se com a comunidade mais ampla. Um pequeno grupo pode inovar rápida e eficientemente, mas isso produz uma sub-cultura cujos conceitos não são entendidos por outros.

Coordenar ações em um grupo maios, no entanto, é dolorosamente

lento e requer enormes quantidades de comunicação. O mundo trabalha através do espectro entre esses extremos, com uma tendência

a começar pequeno - a partir da idéia pessoal - e se mover em direção

a um entendimento mais amplo ao longo do tempo.

Um processo essencial é a união de subculturas quando uma linguagem comum mais ampla é necessária. Freqüentemente dois grupos desenvolvem independentemente conceitos muito similares, e descrever a rela~çao entre eles traz grandes benefícios. Como um dicionário Finlandês-Inglês, ou uma tabela de conversão de pesos e medidas, as relações permitem comunicação e colaboração quando a comunidade de conceito não levou (ainda) à comunidade de termos.

A Web Semântica, ao nomear todos os conceitos simplesmente por uma URI, permite a todos expressar novos conceitos que inventarem com mínimo esforço. Sua linguagem lógica unificadora permitirá que esses conceito sejam progressivamente conectados à Web universal. Essa estrutura abrirá o conhecimento e obras da humanidade à análise significativa por agentes de software, fornecendo uma nova classe de ferramentas pelas quais podemos viver, trabalhar e aprender juntos.

Maiores Informações:

Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor.

Tim Berners-Lee, with Mark Fischetti. Harper San Francisco, 1999.

Uma versão ampliada deste artigo está no Web site da Scientific American, com material e links adicionais.

World Wide Web Consortium (W3C): www.w3.org/

W3C Semantic Web Activity: www.w3.org/2001/sw/

An

www.SemanticWeb.org/knowmarkup.html

introduction

to

ontologies:

Simple HTML Ontology Extensions Frequently Asked Questions (SHOE FAQ): www.cs.umd.edu/projects/plus/SHOE/faq.html

DARPA Agent Markup Language (DAML) home page: www.daml.org/