Você está na página 1de 25

Recursos de Pesquisa na Web

Apresentao
A Internet j deixou de ser uma novidade h muito tempo. Em muitas situaes j no conseguimos obter as informaes que precisamos sem realizar uma profunda pesquisa na Web. Em novembro de 2006, foi anunciado que a Internet mundial atingiu o incrvel nmero de 100 milhes de sites. Por isso, uma das grandes questes : como encontrar a informao que desejamos, dentro do excesso de material contido na rede? De uma forma geral, os recursos de busca mais simples costumam retornar informaes irrelevantes ou inconsistentes. Isso acontece porque os mecanismos de busca so recursos de tecnologia, enquanto que a informao na Internet est organizada em pginas feitas por humanos, ou seja, para humanos entenderem. Uma no foi originalmente preparada para a outra. Por isso, uma grande quantidade de pginas sem nenhuma ligao com a informao esperada pode ser apresentada juntamente com os bons resultados. Torna-se difcil separar o que realmente queremos. Para se obter resultados mais adequados, enquanto no se pode contar com mecanismos de busca perfeitos s nossas necessidades, vamos conhecer como funcionam os processos de catalogao de informaes na Web e como podemos tirar proveito dos recursos oferecidos pelas mquinas de busca mais utilizadas. Com o objetivo de criar oportunidades para o desenvolvimento de prticas pedaggicas - que integrem tecnologias -, esta oficina quer oferecer um espao para a prtica de pesquisa na Web. Isso deve acontecer de tal forma que seja possvel articular o que se est aprendendo com a sua prpria experincia prtica. A oficina est organizada em seis unidades: Unidade 1 - Introduo; Unidade 2 - Diretrios; Unidade 3 - Mquinas de Busca;

Unidade 4 - Trfego e Acessos; Unidade 5 - Dicas de Pesquisa; Unidade 6 - Bibliotecas Virtuais. Estaro disponveis, nas primeiras unidades, conceitos bsicos sobre os tipos de ferramentas de pesquisa e organizao de informaes na Internet. Em seguida, exerccios prticos iro orient-los para um uso prtico dos recursos de busca. O importante que voc desenvolva, progressivamente, suas prprias pesquisas na Web. J na ltima unidade, voc ter acesso a algumas bibliotecas virtuais que podem facilitar e maximizar sua prtica na localizao de mais informaes na Internet. No esquea que o tempo previsto para esta oficina de 15 dias. Aconselha-se, por isso, o planejamento de um esquema considerando uma distribuio de horas para estudo que considere a sua realidade cotidiana. Esta oficina contar com dois momentos de avaliao, alm de um Frum permanentemente aberto para que todos possam socializar suas percepes e experincias. Caso tenha alguma dvida referente ao contedo, tambm possvel usar este mesmo espao para se comunicar com o seu tutor. BOM TRABALHO!

Diretrios
Os diretrios foram criados para organizar os recursos da Web. Eles surgiram quando o contedo da Internet ainda era pequeno o suficiente de forma que pudesse ser coletado por pessoas. Um diretrio nada mais do que uma lista de sites e pginas da Web, manualmente selecionados, e separados hierarquicamente por categorias. Para localizar uma informao, os usurios precisam navegar pelas categorias e subcategorias, at encontrar uma lista especfica o suficiente, que contenha os links de seu interesse.

Nos diretrios no existe um ordenamento de sites por relevncia da informao desejada: todos os sites de uma dada categoria so exibidos ao usurio (normalmente em ordem alfabtica). O Cad? www.cade.com.br originalmente era um diretrio. Atualmente, o maior de todos os diretrios o Dmoz dmoz.org, em ingls. Diretrios

Os sites coletados passam pela seleo de editores, que tomam conhecimento de novos recursos por meio de sugestes de usurios, de pesquisas na Internet, ou ainda, pelo uso de programas para coletar novos endereos.

Normalmente, apenas os melhores recursos so escolhidos para incluso. Por conta desta triagem, e devido enorme quantidade de sugestes, poucos sites podem ser acrescentados semanalmente.
Nem todos os diretrios so genricos e cobrem todos os assuntos. Alguns diretrios cobrem reas especficas e so chamados de diretrios

temticos ou especializados. Existem, por exemplo, diretrios especializados em imagens, jornais e revistas, software, listas de discusso; outros coletam sites sobre assuntos especficos como sade, cincias, legislao, educao, entre outros.

Mquinas de Busca
Uma Mquina de Busca um sistema capaz de rastrear a Web para localizar e catalogar novas pginas e sites. A ordenao das informaes apresentadas ao usurio feita por algoritmos implementados em programas de computador. No h, originalmente, interveno humana direta na ordem das listas montadas. Alm disso, ao contrrio dos diretrios, as mquinas de busca no organizam hierarquicamente as pginas que colecionam e, sim, apresentam uma lista nica de resultados. Algoritmo Um algoritmo uma seqncia de instrues que executada para se realizar uma tarefa ou atingir um objetivo. Os programas de computadores utilizam algoritmos para resolver os problemas ou comandos solicitados. Por exemplo: existem algoritmos que dizem ao computador os passos que devem ser seguidos para colocar uma lista de palavras em ordem alfabtica.

Elas procuram sempre colecionar o maior nmero possvel de recursos por meio do uso de softwares chamados robs. Como suas bases de dados so extremamente grandes, podendo alcanar bilhes de itens, permitem aos usurios localizar os itens desejados mediante buscas por palavras-chave, ou, s vezes, em linguagem natural.

Robs Os robs tambm so conhecidos como spiders ou crawlers.

As mquinas de busca comearam a surgir quando o nmero de recursos na Web cresceu de tal forma que a sua coleta por meios manuais tornou-se muito complexa. A maioria dessas mquinas de busca derivou do trabalho de pesquisadores e estudantes interessados na Web. Como os projetos passaram cada vez mais a exigir maiores recursos humanos e tcnicos, muitos pesquisadores no continuaram seus investimentos. Com a Internet comercial, os que progrediram foram adquiridos por empresas ou financiados por propagandas e investidores.

Os robs so programas que a mquina de busca lana, de tempos em tempos na Web, para obter dados sobre o maior nmero possvel de documentos e sites disponveis.
Os robs se locomovem de um documento a outro, utilizando-se dos links existentes nas prprias pginas da Web. Geralmente, eles iniciam a busca a partir de sites conhecidos, especialmente daqueles que possuem muitos links, recuperam a sua pgina inicial e seguem os encontrados. O Google (www.google.com.br) a mquina de busca mais utilizada atualmente.

O programa da mquina de busca tambm responsvel pela ordenao dos resultados, de maneira que os mais relevantes apaream em primeiro lugar na lista.
Embora gigantescas, as bases de dados de cada mquina de busca no so iguais. Assim, para a mesma pesquisa, cada mecanismo trar bons resultados que outros no encontraram. Para uma busca ser completa, pode ser necessrio se usar mais de uma mquina de busca.

Aps a leitura do material acima, realize a atividade.

Trfego e Acessos
Diante de bilhes de pginas disponibilizadas na Web (em mais de 100 milhes de sites), como identificar quais as mais relevantes? Atualmente, a Internet tornou-se muito comercial e o sucesso de um site est relacionado sua quantidade de trfego. As mquinas de busca levam isso em considerao.

Elas desenvolveram recursos para pr-qualificar o trfego de um site cadastrado. Se o tema de um site , por exemplo, Histria do Brasil, no faz muito sentido receber visitantes interessados em compra de equipamentos de informtica. Uma boa mquina de busca garante que os visitantes estejam em busca de algo que seu site oferece (aumentando, portanto, as chances de sucesso na procura).

Portanto, os robs visitam com mais freqncia as pginas que as mquinas de busca consideram mais relevantes e/ou que sejam atualizadas mais freqentemente.
As mquinas de busca tambm sabem que os sites listados em Diretrios foram selecionados por editores humanos (e a influncia que isso tem na qualidade). Por isso, ao avaliar o ranking de uma pgina, dado um peso especial a sites listados em diretrios bem conceituados. Durante algum tempo, links no Dmoz e no Yahoo! tinham peso especial nos algoritmos do Google.

Atualmente, alguns poucos sites controlam o


trfego de Mquinas de Busca na Web.

Trfego de Mquinas de Busca


Ferramentas de Busca na Web (julho/2006 )

Yahoo 22%

MSN 12%

Outros 6%

Google 60%

Fonte: Hitwise Pty. Ltd. / Search Engine Ratings 2006

Dicas de Pesquisa
O Google a mquina de busca mais estudada e conhecida de todas. Por ter sido projetado e implementado no meio acadmico (enquanto as outras mquinas de busca desde cedo tomaram um rumo comercial), o Google teve vrios documentos a respeito de sua estrutura divulgados. O fato que o seu mecanismo de busca contm caractersticas especiais para avaliao das pginas encontradas, sintetizadas por uma tcnica denominada PageRank. Este foi o principal fator do sucesso do Google. Ele tornou-se o que hoje porque seus resultados agradam os usurios. Agradam porque so mais relevantes.

PageRank A tcnica PageRank usada pelo Google para ajudar a determinar a relevncia ou importncia de uma pgina. O nome foi dado em homenagem a Larry Page, autor da idia, e foi desenvolvida em conjunto com Sergey Brin (os 2 fundadores do Google), na Universidade de Stanford - EUA, em 1998.

Para Saber Mais Para conhecer um pouco mais sobre o mecanismo do Google e qual a idia bsica da tcnica PageRank, acesse a leitura complementar, disponvel em Biblioteca Material do Professor, Como o Google funciona. A leitura deste material no obrigatria, mas ajuda a explicar o sucesso do Google.

Itens especiais do Google As mquinas de busca atualmente disponibilizam recursos e facilidades de pesquisa muito semelhantes entre si, com pequenas variaes no uso das suas funes.

Vamos, aqui, conhecer algumas das facilidades do Google, que a mquina de busca mais utilizada no mundo atualmente. Posteriormente, voc pode procurar conhecer tambm os recursos de outras mquinas de busca na Internet (Yahoo!, MSN, Altavista, entre outros).

Pesquisa de Imagens A pesquisa de Imagens do Google de fcil compreenso, com milhes de imagens indexadas e disponveis para visualizao. Para utilizar este recurso, basta acessar a opo Imagens, na pgina principal do Google, e inserir os termos de referncia da imagem desejada na caixa de pesquisa. Na pgina de resultados, so localizadas as imagens que se encontram em pginas que contm os textos procurados. Imagens

As imagens identificadas pelo servio de Pesquisa de Imagens do Google podem ter direitos de uso. Ento, se for de interesse do usurio utilizar qualquer imagem localizada atravs do servio, ser necessrio contactar o responsvel pelo site onde a imagem est publicada, para obteno das devidas permisses.

Exerccio Prtico Utilize e experimente a ferramenta de pesquisa de imagens do Google (http://www.google.com.br) opo Imagens para localizar sites com ilustraes de educao a distncia, sala de aula, arte na escola, entre outras.

Localizao de informaes em arquivos PDF, DOC, RTF, etc. Os resultados das pesquisas no Google incluem tambm arquivos do tipo

Adobe Portable Document Format (PDF), Microsoft Word (DOC), Rich Text Format
(RTF), entre outros. Apesar da publicao de arquivos com estes formatos no ser to comum como a de arquivos HTML, pode haver informaes de alta qualidade disponveis nestes documentos.

HTML Termo de Informtica: linguagem digital padro em que so escritas as informaes das pginas e sites publicados na Internet.

Essa busca automtica no Google e os arquivos so identificados na listagem dos resultados, para o usurio saber que um programa especfico (Acrobat Reader, Word, etc.) ser executado para abrir o arquivo.

Para ver o seu resultado somente em arquivos DOC, simplesmente digite filetype:doc, dentro do box de procura, diante do termo de sua pesquisa. Isso vale para qualquer outro formato (PDF, RTF, etc.).

Exerccio Prtico Utilize e experimente a busca de textos no interior de documentos do Google (http://www.google.com.br) para localizar arquivos PDF com os termos tecnologia e educao. Faa o mesmo para arquivos DOC.

Pginas Semelhantes

Quando se clica no link Pginas Semelhantes no resultado de uma busca, o Google vasculha automaticamente a Web atrs de outras pginas que esto fortemente relacionadas a este mesmo resultado. Se o contedo de um site especfico for relevante sua procura e voc desejar ter mais informaes, este link pode encontrar outros sites com contedo similar. Pginas Semelhantes

Exerccio Prtico

Utilize e experimente a busca de Pginas Semelhantes a resultados do Google (http://www.google.com.br) para localizar outros sites aps uma busca pelos termos pesquisa na web.

Domnio Restrito Para procurar informaes dentro de um domnio ou site especfico, basta acrescentar o operador site:<dominio>, s informaes digitadas na caixa de pesquisa do Google.

Domnio Um domnio o nome utilizado para localizar um endereo ou um computador na Internet. Por exemplo, o site do MEC encontra-se no domnio mec.gov.br.

Exerccio Prtico Utilize e experimente a busca do Google (http://www.google.com.br) em um Domnio Restrito para localizar informaes e documentos sobre ensino fundamental e outros termos, somente no site do MEC. Exemplo: ensino fundamental site:mec.gov.br. Procura por expresses Para restringir a busca de informaes, localizando apenas documentos que contenham uma expresso ou trecho de uma frase especfica, basta digitar os termos da procura entre aspas. entre aspas

Exerccio Prtico Utilize e experimente a procura por expresses do Google (http://www.google.com.br) para localizar informaes e documentos sobre, por exemplo, educao infantil indgena. Digite a expresso sem aspas e pesquise. Depois, faa o mesmo inserindo aspas no incio e no final do texto e verifique se os resultados se alteram. Incluso e eliminao de palavras Para que o Google localize documentos que no contenham determinadas palavras, basta acrescentar o caractere - na frente do termo indesejado. Isso vale para operadores tambm: -site: (para eliminar os documentos que estejam

em determinado site ou domnio), -filetype: (para eliminar os documentos em determinado formato), etc. Caractere -

Exerccio Prtico Utilize e experimente a eliminao de expresses na procura do Google (http://www.google.com.br) para localizar informaes e documentos sobre, por exemplo, jogos educativos, que no contenham o termo infantis, ou seja, procure por: jogos educativos infantis. Depois, faa o mesmo com outros termos de sua escolha, inserindo o caractere - antes de algumas palavras e verifique se os resultados se alteram.

Outro filtro que pode ser aplicado aos resultados de uma busca pode ser includo com o uso do caractere "+" antes do termo a ser utilizado na filtragem. Se for usado em conjunto com o sinal -, aps a eliminao de expresses, feita uma

nova filtragem para considerar apenas os resultados com o termo desejado. Caractere "+"

Exerccio Prtico Utilize e experimente a filtragem de resultados de busca do Google (http://www.google.com.br) para localizar informaes e documentos sobre, por exemplo, borracha. Em seguida, faa uma filtragem para eliminar os resultados sobre borracha escolar e uma refiltragem para borracha vegetal, ou seja, procure por: borracha -escolar +vegetal. Faa o mesmo com outros termos de sua escolha.

Definies de termos

Para encontrar alguns conceitos e definies de termos encontrados em alguns glossrios on-line ou enciclopdias, basta incluir a expresso define: antes do termo desejado. Os resultados so obtidos dos sites mais utilizados para consulta a esses termos. Expresso define:

Exerccio Prtico Utilize e experimente a consulta a conceitos de termos no Google (http://www.google.com.br) para localizar algumas definies para o termo educao, ou seja, procure por: define: educao. Faa o mesmo com outros termos de sua escolha.

Combinaes de Recursos Uma das maiores vantagens dos recursos de pesquisa do Google que eles podem ser combinados entre si, aumentando o poder de localizao de informaes

medida que a busca se torna mais especifica. Quanto mais recursos de pesquisa se incluem na mesma busca, mais restrita se torna a quantidade de resultados, aproximando a relevncia dos sites encontrados com o que se deseja buscar.

Exerccio Prtico Utilize e experimente a combinao dos recursos de pesquisa do Google (http://www.google.com.br) para localizar, por exemplo, documentos com a frase tecnologias em educao, localizados no portal do MEC, no formato PDF, que no incluam o termo infantil e que somente estejam relacionados a educao a distncia. Resumindo, procure por: "tecnologias em educao" site:mec.gov.br filetype:pdf -infantil +distncia. Veja o total de documentos encontrados. Depois, faa o mesmo com outros termos de sua escolha.

Maisculas, minsculas, acentuao e pedaos de palavras

As buscas no Google no so sensveis a maisculas e minsculas e nem a acentuaes. Todas as palavras, independentemente da forma como forem escritas, sero entendidas como minsculas e sem acentos. Por exemplo, buscas por "Educao", "EdUCaO" ou "educacao" traro os mesmos resultados.
Para conseguir resultados mais precisos, o Google no utiliza radicais de palavras nem caracteres substitutos. Em outras palavras, o Google procura exatamente pelas palavras inseridas no campo de busca. Se for inserida educ ou educa, o Google no procurar por educao. Pesquisa avanada

Freqentemente, adicionar mais palavras e atributos a uma busca ampla ajuda a estreit-la at voc encontrar o que quer. Entretanto, o Google oferece uma pgina de pesquisa avanada, que facilita a aplicao dos atributos descritos acima sua pesquisa, por meio de formulrios. Para utilizar este recurso, basta acessar a opo Pesquisa avanada, na pgina principal do Google, e inserir os termos de referncia em cada caixa de pesquisa, de acordo com sua funcionalidade e descrio.

Pesquisa Avanada

Aps a leitura do material acima, realize a atividade.

Bibliotecas Virtuais
Na Internet podemos encontrar, alm de informao, muito material educacional pronto e disponvel para uso em sala de aula e/ou on-line. So bibliotecas virtuais, sites de educao, repositrios de objetos de aprendizagem, etc. Nesta unidade, vamos apresentar alguns destes ambientes, mas sugerimos fortemente que voc esteja sempre fazendo uso dos recursos de pesquisa das mquinas de busca na Web para localizar e acessar outros sites e portais de contedo semelhante.

Em todo caso, sempre importante levar em considerao os direitos de uso de qualquer material disponibilizado na Internet. Nunca faa uso de materiais ou informaes que no tm suas regras de utilizao descritas claramente.
Para Saber Mais Recomenda-se a leitura de um artigo que descreve esta preocupao no uso de objetos de aprendizagem. Leitura Complementar, em Biblioteca Material do Professor, A Propriedade Intelectual e Objetos de Aprendizagem. A leitura deste material no obrigatria.

Wikipdia A Wikipdia (www.wikipedia.org) uma enciclopdia on-line livre, baseada na edio do seu contedo de forma colaborativa. Qualquer pessoa pode se tornar um editor de um determinado contedo na Wikipdia; basta ser voluntrio. Alm disso, uma enciclopdia multilinge e pode ser escrita internacionalmente em diversas regies do mundo. Por ser livre, entende-se sem fins lucrativos; e qualquer artigo da obra pode ser transcrito, modificado e ampliado, desde que os direitos de cpia e modificaes sejam preservados. Inicialmente, esse modelo foi bastante polmico, pois se acreditava que o fato de qualquer um poder editar o seu contedo pudesse transformar a Wikipdia em um conjunto de artigos de pouca confiabilidade. Porm, os resultados obtidos em testes de qualidade das informaes, realizados por renomadas instituies (como

a Revista Nature da Inglaterra, por exemplo), mostraram que a Wikipdia confivel e que as imperfeies podem ser administradas.

Porm, h sempre riscos. Em caso de dvidas, uma boa recomendao verificar sempre o histrico de edio de um determinado artigo da Wikipdia. Quanto mais editado e refinado pelos wikipedistas, maiores as chances do seu contedo ser confivel.
Wikipedistas Editores voluntrios responsveis pela incluso e atualizao das informaes disponveis na Wikipdia.

Para Saber Mais

Para conhecer algumas outras bibliotecas virtuais disponveis na Internet brasileira, acesse a Leitura Complementar, em Biblioteca - Material do Professor, Algumas Bibliotecas Virtuais. A leitura deste material no obrigatria, mas apresenta tambm repositrios de objetos de aprendizagem, de acesso gratuito.

Você também pode gostar