Escolar Documentos
Profissional Documentos
Cultura Documentos
Recuperação da Informação
Prof. Fábio Assis Pinho.
Pinho
Corina
Nascimento
A História da Internet
Fatos históricos
• Biblioteca de Alexandria, criada por Ptolomeu I (289
a.C.);
• Mundaneum, idealizado por Paul Otlet e Henri de La
Fontaine, eles começaram a coletar dados de todos os
livros, revistas, artigos já publicados, usando cartões de
índice de 7 a 12 cm (o que havia de mais avançado na
tecnologia de armazenamento)criando um banco de
dados com mais de 12 milhões de entradas individuais ;
• Memex, máquina capaz de estocar grande quantidade
de informação de forma fácil que permitisse uma rápida
recuperação. Nunca foi construída, embora Vannevar
Bush a enxergasse como a extensão natural das
tecnologias existentes em 1945;
• Projeto Xanadu, criado por Theodore Nelson imaginando
uma imensa rede de informações acessível em tempo
real, contendo todo o saber literário e científico do
mundo.
A Evolução da Internet
• Durante a Guerra Fria, o departamento de defesa dos EUA,
pensou em um sistema que interligasse vários pontos, de
modo que não centralizasse o comando,(Anos 60/70);
• 1969 surge a ARPAnet (Advanced Research Projects Agency),
rede que interligava originalmente vários centros de pesquisa;
• Início dos anos 80, foi desenvolvida uma nova utilidade para a
ARPnet, interligar laboratórios e universidade nos EUA, surgiu
o nome Internet;
• Final dos anos 80, a Internet passa a ser vista como um
eficiente veículo de comunicação mundial, onde cientistas e
acadêmicos passaram a utilizá-la mais intensamente (existia
apenas em formato de texto, antigos arquivos Gopher;
• O Protocolo de comutação de pacotes originais usado pela
ARPAnet era o NCP (Network Control Protocol), mudado para
o TCP/IP (Transfer Control Protocol/Internet Protocol)
desenvolvido pela UNIX.
• Anos 90, Tim Berners-Lee com sua equipe de pesquisadores,
teve a idéia de desenvolver um sistema de hipertexto que
deveria funcionar em redes de computadores;
A Evolução da Internet
http://www.ufpe.br/dci/site
200.146.172.1
Aurélio Fernando
Introdução
A internet tornou-se um fenômeno mundial, sendo possível
acessar informações em diversas partes do mundo
instantaneamente. O volume destas informações alcançaram
números impressionantes nos dias atuais.Entretanto o vasto
número de documentos Web e a falta de padronização dessas
informações originaram um problema para os usuários na hora
de navegar na Internet e assim achar as informações
desejadas. Esse problema é chamado de Information
Overload. Esse problema é caracterizado quando uma
pessoa, ao realizar uma consulta, obtém um número
excessivo de informações como resposta e não consegue
absorvê-las ou tratá-las, tendo que examinar todos os
documentos resultantes para encontrar as informações
desejadas. Como a maior parte das informações disponíveis
na Internet, está disposta em linguagem natural, sendo
compreensíveis apenas por humanos, houve a necessidade
de uma semântica que permitisse uma padronização das
informações sendo possível o processamento dessas
informações por humanos e máquinas, surgindo assim a idéia
do desenvolvimento da Web Semântica.
O termo "Semântica" é definido como sendo
o estudo do sentido das palavras.
Arquitetura
• A Web Semântica introduz estrutura e significado ao
conteúdo disponível na internet, visando transformar
uma rede de documentos em uma rede de dados,
compreensível tanto para humanos quanto para
computadores, de maneira a possibilitar que os últimos
cooperem melhor durante a realizacão de tarefas, ou
quando da realização de um serviço aos usuários.
W e b S e m â n t ic a
Cam ada
L ó g ic a R e g r a s d e I n fe r ê n c ia
Cam ada de
O n t o lo g ia
Cam ada de
E stru tu ra Dados
Web Semântica
Camada
Lógica Regras de Inferência
Camada de
Ontologia
Camada de
Estrutura Dados
Camada de Estutura
Arquitetura
A camada de Estrutura:
• A camada de estrutura provê uma forma de definir os dados
do documento e o significado associado a esses dados. Trata
também da estruturação e disposição dos dados de forma que
os programas que rodam na web possam fazer inferência a
partir dos mesmos.
Para que haja a representacão do conhecimento são necessarias
três condições:
Interoperabilidade estrutural: Permite que os dados sejam
representados de forma distinta, permitindo especicar tipos e
possíveis valores para cada forma de representação;
Web Semântica
Camada
Lógica Regras de Inferência
Camada de
Ontologia
Camada de
Estrutura Dados
Camada de Ontologia
Arquitetura
A camada Ontologia:
Web Semântica
Camada
Lógica Regras de Inferência
Camada de
Ontologia
Camada de
Estrutura Dados
Camada Lógica
Arquitetura
• É através da camada lógica que são possíveis os
relacionamentos de informação e as inferências de
conhecimento da Web Semântica. As regras de
inferência fornecem aos agentes(programas) poder de
raciocinar sobre os termos e seus significados, que
foram definidos na camada esquema e de raciocinar a
respeito dos relacionamentos entre os conceitos
segundo a sua definição na camada ontologia.
• Os agentes são sistemas computacionais capazes de
interagir autonomamente para atingir os objetivos do
seu criador. Os agentes possuem algumas
características como autonomia, reatividade (percebem
• o ambiente tomam as decisões), têm comportamento
colaborativo, possuem objetivos, são flexíveis, sociáveis
e têm a capacidade de aprender.
• A Web Semântica possuirá vários agentes interagindo
entre si, compreendendo, trocando ontologias,
adquirindo novas capacidades racionais quando
adquirirem novas ontologias e formando cadeias
Fonte: Tim Berners-Lee, James Hendler, and Ora Lassila. The semantic web. Scientic American, pages
35{43, May 2001.
Arquitetura
da Web
Semântica Parte 2
AÍlton Pedro
Arquitetura Web Semântica
• Primeira proposta divulgada publicamente no
ano de 2000 pelo W3C (Tim Berners-Lee)
• Preocupação em desenvolver linguagens
computacionais para estruturar recursos e
descrever aspectos semânticos
• Não era suficiente apenas descrever os
recursos informacionais sintaticamente, mas
desenvolver tecnologias que permitissem
descrever o significado das informações
• URI (Uniform Resource Identifier) – forma
como identificamos um ponto de conteúdo na
internet
Linguagens de Representação de Recursos
Informacionais
• XML
– Objetivos da linguagem:
1. Direta e Objetiva
2. Suporta ampla gama de
aplicativos
3. Compatível com SGML
4. Fácil de desenvolver
programas
5. Número de recursos
adicionais mínimos
6. Documetos legíveis e claros
7. Preparado rapidamente Importante característica: permite ao
8. Design formal e conciso autor do documento a definição das
9. Documentos fáceis de suas próprias marcas, o que confere
serem criados ao XML habilidades semânticas que
10. A concisão na marcação é possibilitam melhorias nos processos
de importância mínima de recuperação e disseminação da
informação
Linguagens de Representação de Recursos
Informacionais
• RDF
– Modelo para descrever
recursos
– Baseado em um modelo
de grafo no lugar de
árvore
– Sintaxe: (Sujeito,
Predicado, Objeto)
– Usa XML como sintaxe
– Melhora a descoberta, o
acesso e o
gerenciamento das
informações da Web
Linguagens de Representação de Recursos
Informacionais
• OWL
– Recomendada pelo W3C para o
desenvolvimento de ontologias, definida a partir
de:
• RDF e RDF Schema
• DAML+OIL
– Estrutura baseada nos seguintes elementos
básicos:
• Namespaces; Cabeçalhos; Classes; Indivíduos;
Propriedades; Restrições
Linguagens de Representação de Recursos
Informacionais
• OWL lite:
– versão simplificada de OWL
– oferece primariamente hierarquias e restrições
simples
• OWL DL
– aumenta a expressividade, mantendo
decidibilidade
• OWL Full
– expressividade, sem garantia de decidibilidade
CONTEXTUALIZANDO A
WEB SEMÂNTICA
NO ÂMBITO DA
CIÊNCIA DA INFORMAÇÃO
José Aniceto
CONTEXTUALIZANDO A WEB SEMÂNTICA
NO ÂMBITO DA CIÊNCIA DA
INFORMAÇÃO.
DIMINUIR O CAOS DE EXCESSO DE INFORMAÇÕES
ESTRUTURAR A INFORMAÇÃO COM BASES SÓLIDAS
DINAMIZAR O RELACONAMENTO HOMEM-MÁQUINA
MELHOR QUALIDADE DE REVOCAÇÃO E PRECISÃO
O QUE FALTA ?
ATUALIZAÇÃO DA WEB
COMO RECUPERAR
• Estratégia:
Arte de aplicar os meios disponíveis com vista à
consecução de objetivos
específicos.
• Busca:
Procura com o fim de encontrar alguma coisa
• Tática:
Processo empregado para sair-se bem num
empreendimento
ESTRATÉGIA DE BUSCA
Oldroyd & Citroen (1977) identificaram três grandes
etapas para decisão no processo de planejamento da
estratégia de busca: decisão sobre qual a melhor base de
dados para um determinado tema; decisão referente à
seleção dos termos de busca e sua adequação para a base
a ser consultada; decisão sobre a formulação lógica da
estratégia.
• 5ª Etapa: Interdisciplinaridade
Realizar a expansão da busca em outros campos,
aumentando consequentemente as possibilidades
de documentos de interesse virem a ser
recuperados.
ESTRATÉGIA DE BUSCA – ETAPAS