Escolar Documentos
Profissional Documentos
Cultura Documentos
1
ACESSO A INTERNET NO BRASIL - Indicadores Gerais
Dezembro - 2006
Brasil
Internautas c/ acesso doméstico - (milhões) 22,1
Usuários Ativos (milhões) 14,4
Número médio de sessões na Internet por mês 32
Número de sites visitados por mês 57
Tempo de navegação no mês (hs) 21:38
Tempo médio gasto em cada página visualizada (seg) 00:47
Informática 4,7% 6% 7%
Natal 2003 204,0 55% 1.180,0
Outros - - 37%
* 15/11 a 23/12 Fonte: Levantamento mensal realizado pela empresa e-Bit www.ebitempresa.com.br
Compilação: www.e-commerce.org.br
2
Outras estatísticas - Brasil A Internet como fonte de informação
http://www.cg.org.br/index.html
3
Como acontece a busca? Outra alternativa de busca
• O serviço de busca coleta páginas na Web e gera um
índice com as palavras contidas nestas páginas;
• O usuário escreve uma consulta com as palavras que
julga serem adequadas para achar a página desejada;
• O usuário envia estas palavras para o sistema de busca;
• O sistema de busca compara estas palavras (consulta)
com o índice das páginas Web catalogadas;
• As páginas mais semelhantes com a consulta (as que
tem mais palavras comuns com o texto enviado na
consulta) são escolhidas e enviadas ao usuário;
• O usuário verifica a qualidade da resposta e escolhe as
páginas recuperadas de atendam a sua consulta.
O resultado será:
O resultado é:
4
Obtemos:
ALTAVISTA
Exemplificando…
• Utilizar apenas um serviço de busca não garante • A palavra “computational” pesquisada no:
que conseguirá recuperar todas as páginas sobre
– Google: 36.400.000 ocorrências
desejado;
– Altavista: 17.800.000 ocorrências
• Nenhum serviço cobre todas as páginas da Web.
– Msn: 3.408.749 ocorrências
5
Você deseja comprar um computador. Realize uma busca nos
serviços listados. Utilize a palavra computador. Complete a tabela As cinco primeiras páginas recuperadas em cada serviço de busca
com os resultados obtidos e escreva um pequeno texto resumindo foram as mesmas?
sua avaliação sobre esta pesquisa. Este exercício permitirá compreender as diferenças nos sistemas de
ordenação por relevância das páginas dos diferentes serviços de
busca.
As primeiras páginas encontradas
Serviço Nº atendem a necessidade da busca?
páginas
1ª 2ª 3ª 4ª Páginas Googl Altavista Yaho Window Ask
e o s
Google Live
www.xxx.yyy.com S N N S N
Altavista
Yahoo
Windows
Live
Ask
6
Melhorando ainda mais as buscas
Exercício
• Encontre o texto completo do Hino Nacional Brasileiro;
• Comece pesquisando com Ipiranga
Tem o Hino
Tem o Hino
Tem o Hino
7
Pesquisa Booleana - AND Pesquisa Booleana - OR
• Combina palavras (frases), permitindo que • Combina palavras (frases), trazendo resultados
ambas estejam presentes nos resultados; que possuam pelo menos uma das
• Exemplo: combinações;
– “você quer pesquisar sobre produtos derivados da soja • Exemplo:
e que sejam transgênicos”. – “você quer pesquisar sobre produtos derivados da soja
• Forma da pesquisa: ou produtos que sejam transgênicos”.
“soja AND transgênico ” • Forma da pesquisa:
“soja OR transgênico ”
• Exclui palavras (frases) dos resultados da • Exclui palavras (frases) dos resultados da
pesquisa; pesquisa;
• Exemplo: • Exemplo:
– “você quer pesquisar sobre produtos derivados da soja – “Eu quero aprender a cozinhar com ervas ou pimenta”.
excluindo-se documentos que citam problemas • 1ª Forma da pesquisa:
transgênicos”.
“cozinhar AND (ervas OR pimenta)”
• Forma da pesquisa: • 2ª Forma da pesquisa:
“soja NOT transgênico ” “receita AND (ervas OR pimenta)”
Os resultados...
Imagens e Fotos
8
Refinando a pesquisa de imagens
Como funciona a busca por
imagens?
• A busca está baseada no nome das figuras
existentes nas páginas Web;
• É realizada, também, uma pesquisa sobre os
textos próximos às figuras;
• O Google recupera as imagens com nomes de
computador.jpg, computador.gif ou qualquer
outro arquivo de imagem ou que tenham esta
palavra em um texto de legenda.
Busca avançada no
Google
9
Funções especiais Funções especiais
• TITLE - pesquisar por título do documento • LINK - identifica todas as páginas que possuem
• TITLE:Gazeta Mercantil um link definido neste parâmetro.
• HOST - traz páginas indexadas de um site • LINK: fema
• HOST:www.unicamp.br
• URL - traz páginas que contém este parâmetro • IMAGE - traz páginas que contém arquivos com
no texto da URL os nome definidos neste parâmetro.
• URL:microsoft
• IMAGE:presidente.*
(traz TODAS as páginas indexadas que contém
“microsoft” no endereço). • IMAGE:da vinci
10
Busca em Portais Exemplos de Portais
• Portal: • Geral
– É um site que serve como porta de entrada para um – Google
tema específico.
• Domínio: • Dicionários e Enciclopédias
– Um portal pode ser limitado a um assunto ou forma – www.webopedia.com (dicionário de termos de tecnologia)
de acesso ou pode ser amplo;
• Exemplos: – http://pt.wikipedia.org/
– Enciclopédias • Revistas científicas
– Dicionários
– Serviços de busca orientados para um tema – http://www2.uol.com.br/sciam/ (Scientific American Brasil)
– Outros são verdadeiros sistemas de gestão de – http://www.sciencemag.org/magazine.dtl (Science
conhecimento. magazine)
Exemplos de Portais
Copernic
• Tecnologia Informática
– http://br.tecnologia.yahoo.com/ (Portal YAHOO sobre
tecnologia) • O software mantém uma cópia em disco
– http://www.cnn.com/TECH/ (Portal CNN sobre tecnologia) local do resultado e permite a
• Turismo e Geografia recuperação das páginas para leitura
– http://www.wikimapia.org/ (Fotos de satélite da Terra) posterior (sem acesso à Internet);
• A mesma consulta pode ser repetida mais
tarde e os resultados atualizados.
Serviços pesquisados
11
Inteligência Competitiva Inteligência Competitiva
• A Web representa um acervo gigantesco de informação;
• É o resultado da análise de informações e dados • O grande desafio para a Inteligência Competitiva consiste
coletados na Web; em acessar, recuperar e organizar estes dados de forma a
transforma-los em informação relevante;
• Objetivo: dar suporte ao administrador na tomada • O administrador deseja saber:
de decisão; – O que publicam sobre minha empresa na Internet?
• Distinção entre: – O que meus concorrentes informam ao público através da Internet?
– Quais as novas tendências em minha área de atuação?
– Dado (valor sem significado) – Onde estão os principais centros de competência?
– Informação (dado com significado) – Quais as associações - formais ou informais - em minha área de
atuação?
– Conhecimento (informação estruturada e contextualizada).
• Kartoo
• “São representações gráficas semelhantes a
– http://www.kartoo.com/
diagramas, que indicam relações entre conceitos
ligados por palavras”. • CMap Tools (Univ. de West Florida)
• Uma boa fonte para aprofundar os estudos nesta – http://cmap.ihmc.us/
área é:
– http://penta2.ufrgs.br/edutools/mapasconceituais/
• Há uma série de ferramentas para a geração e
manutenção destes mapas.
12
Referências
• Página do Dr. José Palazzo M. de Oliveira
– http://palazzo.pro.br/buscas.htm
• Centro de Treinamento da Unicamp
– http://www.ccuec.unicamp.br/treinamentos/inde
x_html?focomenu=Treinamentos&foco2=Trein
amentos/66108
• Informal Informática
– http://www.informal.com.br
13