Escolar Documentos
Profissional Documentos
Cultura Documentos
Recuperação da Informação
Prof. Fábio Assis Pinho.
Corina
Nascimento
A História da Internet
Fatos históricos
• Biblioteca de Alexandria, criada por Ptolomeu I (289
a.C.);
• Mundaneum, idealizado por Paul Otlet e Henri de La
Fontaine, eles começaram a coletar dados de todos os
livros, revistas, artigos já publicados, usando cartões de
índice de 7 a 12 cm (o que havia de mais avançado na
tecnologia de armazenamento)criando um banco de
dados com mais de 12 milhões de entradas individuais ;
• Memex, máquina capaz de estocar grande quantidade
de informação de forma fácil que permitisse uma rápida
recuperação. Nunca foi construída, embora Vannevar
Bush a enxergasse como a extensão natural das
tecnologias existentes em 1945;
• Projeto Xanadu, criado por Theodore Nelson imaginando
uma imensa rede de informações acessível em tempo
real, contendo todo o saber literário e científico do
mundo.
A Evolução da Internet
• Durante a Guerra Fria, o departamento de defesa dos EUA,
pensou em um sistema que interligasse vários pontos, de
modo que não centralizasse o comando,(Anos 60/70);
• 1969 surge a ARPAnet (Advanced Research Projects Agency),
rede que interligava originalmente vários centros de pesquisa;
• Início dos anos 80, foi desenvolvida uma nova utilidade para a
ARPnet, interligar laboratórios e universidade nos EUA, surgiu
o nome Internet;
• Final dos anos 80, a Internet passa a ser vista como um
eficiente veículo de comunicação mundial, onde cientistas e
acadêmicos passaram a utilizá-la mais intensamente (existia
apenas em formato de texto, antigos arquivos Gopher;
• O Protocolo de comutação de pacotes originais usado pela
ARPAnet era o NCP (Network Control Protocol), mudado para
o TCP/IP (Transfer Control Protocol/Internet Protocol)
desenvolvido pela UNIX.
• Anos 90, Tim Berners-Lee com sua equipe de pesquisadores,
teve a idéia de desenvolver um sistema de hipertexto que
deveria funcionar em redes de computadores;
A Evolução da Internet
http://www.ufpe.br/dci/site
200.146.172.1
Aurélio Fernando
Introdução
A internet tornou-se um fenômeno mundial, sendo possível
acessar informações em diversas partes do mundo
instantaneamente. O volume destas informações alcançaram
números impressionantes nos dias atuais.Entretanto o vasto
número de documentos Web e a falta de padronização dessas
informações originaram um problema para os usuários na hora
de navegar na Internet e assim achar as informações
desejadas. Esse problema é chamado de Information
Overload. Esse problema é caracterizado quando uma
pessoa, ao realizar uma consulta, obtém um número
excessivo de informações como resposta e não consegue
absorvê-las ou tratá-las, tendo que examinar todos os
documentos resultantes para encontrar as informações
desejadas. Como a maior parte das informações disponíveis
na Internet, está disposta em linguagem natural, sendo
compreensíveis apenas por humanos, houve a necessidade
de uma semântica que permitisse uma padronização das
informações sendo possível o processamento dessas
informações por humanos e máquinas, surgindo assim a idéia
do desenvolvimento da Web Semântica.
O termo "Semântica" é definido como sendo
o estudo do sentido das palavras.
Arquitetura
• A Web Semântica introduz estrutura e significado ao
conteúdo disponível na internet, visando transformar
uma rede de documentos em uma rede de dados,
compreensível tanto para humanos quanto para
computadores, de maneira a possibilitar que os últimos
cooperem melhor durante a realizacão de tarefas, ou
quando da realização de um serviço aos usuários.
Web Semântica
Camada
Lógica Regras de Inferência
Camada de
Ontologia
Camada de
Estrutura Dados
Web Semântica
Camada
Lógica Regras de Inferência
Camada de
Ontologia
Camada de
Estrutura Dados
Camada de Estutura
Arquitetura
A camada de Estrutura:
• A camada de estrutura provê uma forma de definir os dados
do documento e o significado associado a esses dados. Trata
também da estruturação e disposição dos dados de forma que
os programas que rodam na web possam fazer inferência a
partir dos mesmos.
Para que haja a representacão do conhecimento são necessarias
três condições:
Interoperabilidade estrutural: Permite que os dados sejam
representados de forma distinta, permitindo especicar tipos e
possíveis valores para cada forma de representação;
Web Semântica
Camada
Lógica Regras de Inferência
Camada de
Ontologia
Camada de
Estrutura Dados
Camada de Ontologia
Arquitetura
A camada Ontologia:
Web Semântica
Camada
Lógica Regras de Inferência
Camada de
Ontologia
Camada de
Estrutura Dados
Camada Lógica
Arquitetura
• É através da camada lógica que são possíveis os
relacionamentos de informação e as inferências de
conhecimento da Web Semântica. As regras de
inferência fornecem aos agentes(programas) poder de
raciocinar sobre os termos e seus significados, que
foram definidos na camada esquema e de raciocinar a
respeito dos relacionamentos entre os conceitos
segundo a sua definição na camada ontologia.
• Os agentes são sistemas computacionais capazes de
interagir autonomamente para atingir os objetivos do
seu criador. Os agentes possuem algumas
características como autonomia, reatividade (percebem
• o ambiente tomam as decisões), têm comportamento
colaborativo, possuem objetivos, são flexíveis, sociáveis
e têm a capacidade de aprender.
• A Web Semântica possuirá vários agentes interagindo
entre si, compreendendo, trocando ontologias,
adquirindo novas capacidades racionais quando
adquirirem novas ontologias e formando cadeias
Fonte: Tim Berners-Lee, James Hendler, and Ora Lassila. The semantic web. Scientic
American, pages 35{43, May 2001.
Arquitetura
da Web
Semântica Parte 2
AÍlton Pedro
Arquitetura Web Semântica
• Primeira proposta divulgada publicamente no
ano de 2000 pelo W3C (Tim Berners-Lee)
• Preocupação em desenvolver linguagens
computacionais para estruturar recursos e
descrever aspectos semânticos
• Não era suficiente apenas descrever os
recursos informacionais sintaticamente, mas
desenvolver tecnologias que permitissem
descrever o significado das informações
• URI (Uniform Resource Identifier) – forma
como identificamos um ponto de conteúdo na
internet
Linguagens de Representação de Recursos
Informacionais
• XML
– Objetivos da linguagem:
1. Direta e Objetiva
2. Suporta ampla gama de
aplicativos
3. Compatível com SGML
4. Fácil de desenvolver
programas
5. Número de recursos
adicionais mínimos
6. Documetos legíveis e claros
7. Preparado rapidamente Importante característica: permite ao
8. Design formal e conciso autor do documento a definição das
9. Documentos fáceis de suas próprias marcas, o que confere
serem criados ao XML habilidades semânticas que
10. A concisão na marcação é possibilitam melhorias nos processos
de importância mínima de recuperação e disseminação da
informação
Linguagens de Representação de Recursos
Informacionais
• RDF
– Modelo para descrever
recursos
– Baseado em um modelo
de grafo no lugar de
árvore
– Sintaxe: (Sujeito,
Predicado, Objeto)
– Usa XML como sintaxe
– Melhora a descoberta, o
acesso e o
gerenciamento das
informações da Web
Linguagens de Representação de Recursos
Informacionais
• OWL
– Recomendada pelo W3C para o
desenvolvimento de ontologias, definida a partir
de:
• RDF e RDF Schema
• DAML+OIL
– Estrutura baseada nos seguintes elementos
básicos:
• Namespaces; Cabeçalhos; Classes; Indivíduos;
Propriedades; Restrições
Linguagens de Representação de Recursos
Informacionais
• OWL lite:
– versão simplificada de OWL
– oferece primariamente hierarquias e restrições
simples
• OWL DL
– aumenta a expressividade, mantendo
decidibilidade
• OWL Full
– expressividade, sem garantia de decidibilidade
CONTEXTUALIZANDO A
WEB SEMÂNTICA
NO ÂMBITO DA
CIÊNCIA DA INFORMAÇÃO
José Aniceto
CONTEXTUALIZANDO A WEB SEMÂNTICA
NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO.
ATUALIZAÇÃO DA WEB
COMO RECUPERAR
• Estratégia:
Arte de aplicar os meios disponíveis com vista à
consecução de objetivos
específicos.
• Busca:
Procura com o fim de encontrar alguma coisa
• Tática:
Processo empregado para sair-se bem num
empreendimento
ESTRATÉGIA DE BUSCA
Oldroyd & Citroen (1977) identificaram três grandes etapas
para decisão no processo de planejamento da estratégia de
busca: decisão sobre qual a melhor base de dados para um
determinado tema; decisão referente à seleção dos termos
de busca e sua adequação para a base a ser consultada;
decisão sobre a formulação lógica da estratégia.
• 5ª Etapa: Interdisciplinaridade
Realizar a expansão da busca em outros campos,
aumentando consequentemente as possibilidades
de documentos de interesse virem a ser
recuperados.
ESTRATÉGIA DE BUSCA – ETAPAS