Você está na página 1de 19

FERRAMENTAS DE BUSCA NA INTERNET:

PARA QU, POR QU E COMO UTILIZ-LAS? BUENO, Mrcia Correa Bibliotecria CRB 8/5694 Seo de Aquisio e Tratamento da Informao Servio de Biblioteca e Documentao Instituto de Biocincias - UNESP / Campus de Rio Claro Av. 24-A n.1515 - Bela Vista CEP 13.506-900 Rio Claro - SP / Brasil E-mail: mcbueno@rc.unesp.br VIDOTTI, Silvana Aparecida Borsetti Gregorio Depto. Biblioteconomia e Documentao Grupo de Pesquisa Novas Tecnologias em Informao Faculdade de Filosofia e Cincias UNESP / Campus de Marlia Av. Hygino Muzzi Filho, 737 - Cx.P. 420 CEP 17525-900 Marlia - SP / Brasil E-mail: vidotti@marilia.unesp.br RESUMO: A evoluo das tecnologias de informtica e de comunicao aplicadas informao tornou possvel a indexao, recuperao e disseminao automtica da informao, em especial na rede Internet com a utilizao das ferramentas de busca - programas que manipulam base de dados com informaes sobre documentos disponveis na rede. A Internet uma grande fonte eletrnica de informao que, por meio da World Wide Web, coloca disposio documentos hipertextuais dos mais variados assuntos e de diferentes arquiteturas de informaes textuais, sonoras e imagticas. Para que esse universo possa ser acessado por pessoas de diferentes culturas e territrios, softwares percorrem essa rede indexando as pginas informacionais disponveis pelos e para os usurios e as ferramentas de busca, atravs de estratgias de busca fornecidas pelos usurios, consultam bases de dados com o objetivo de fornecer endereos de sites ou pginas pertinentes ao assunto solicitado. As ferramentas de busca se diferenciam na forma de estruturar as bases de dados, nos recursos referentes s estratgias de busca, nos nveis de busca e na apresentao dos resultados. Como objetivos deste trabalho de pesquisa temos a delimitao das caractersticas fundamentais dos diversos

tipos de ferramentas de busca e avaliao das respostas oferecidas mediante as estratgias de busca e nveis de busca pr-estabelecidos. Como resultados, apontamos algumas diretrizes para a otimizao do uso estratgico das ferramentas de busca com relao aos tipos de consulta e assuntos desejados. Podemos concluir que existe um campo de pesquisa amplo para os profissionais da Biblioteconomia, com relao aos tratamentos descritivo e temtico dos documentos disponveis na Internet que so catalogados em bases de dados pelas ferramentas de busca de forma automtica ou manual, para que esses documentos possam ser recuperados de maneira a atender as expectativas do usurio numa relao eficaz de relevncia x pertinncia x tempo de busca. PALAVRAS-CHAVE: Search Engines, Ferramentas de busca, Acesso informao eletrnica - Internet

Com a evoluo das tecnologias de informtica e comunicao e a aplicao destas em Unidades de Informao, as informaes bibliogrficas e catalogrficas passaram a ser armazenadas, manipuladas e recuperadas em vrios locais e por diferentes pessoas, sem a limitao de tempo e espao. As Bibliotecas, como Unidades de Informao, passaram a implantar softwares integrados para automao/informatizao de seus servios como aquisio, circulao, representao descritiva e temtica e recuperao dos documentos pertencentes ao acervo local ou a acervos de acesso remoto. A introduo destas tecnologias em bibliotecas nos faz lembrar de Vannevar Bush que, em 1945, baseado na estrutura convencional de uma biblioteca, antecipando a exploso da informao e motivado a desenvolver suas idias pela necessidade de suportar formas naturais de indexao e recuperao de informaes, idealizou o sistema MEMEX, que seria, segundo o autor

"um dispositivo no qual um indivduo armazenaria todos os seus livros, registros e comunicaes, e seria mecanizado de tal forma que pudesse ser consultado com alta flexibilidade e velocidade ... um suplemento da prpria memria do indivduo." (Bush, 1945)

O sistema de recuperao proposto por Bush era o de associao de idias, objetos ou itens, semelhante ao que ocorre no crebro humano:
"a mente humana ... opera por associao. Com um item enfocado, ela pula instantaneamente, para o prximo item sugerido pela associao de pensamentos, de acordo com alguma teia intrincada de caminhos formada pelas clulas do crebro. A mente tem naturalmente outras caractersticas: trilhas que no so seguidas freqentemente podem ser apagadas, os itens no so totalmente permanentes, a memria transitria. Ainda assim, a velocidade de ao, a complexidade das trilhas, os detalhes das imagens mentais so mais espantosos que qualquer coisa na natureza ... o homem no pode esperar que esse processo mental seja completamente reproduzido artificialmente, mas deve ser capaz de aprender com isto. Ningum pode esperar igualar a velocidade e flexibilidade com a qual a mente humana segue um caminho associativo, mas deve ser possvel vencer decisivamente a mente no que diz respeito permanncia e a clareza dos itens recuperados do armazenamento". (Bush, 1945)

O armazenamento das informaes, no sistema proposto por Bush, seria feito em microformas e o acesso a essas informaes seria mecnico e atravs de ndices. Dois itens quaisquer seriam codificados para associao atravs de uma trilha, que poderia ser gerada e/ou manipulada pelo sistema. Apesar do sistema MEMEX ter sido projetado em detalhes, a tecnologia adequada para a sua implantao apareceu apenas vinte anos depois com o surgimento dos computadores digitais. As atuais tecnologias de informtica e os novos suportes de informao possibilitaram novos processos de organizao, anlise, recuperao e disseminao da

informao, baseados na estrutura humana de associao de idias, objetos ou itens, apontada por Bush, com a vantagem de que as informaes contidas em uma biblioteca possam figurar simultaneamente em tantos locais quantos forem necessrios, via Internet e/ou Intranet, e em ambientes informacionais hipertextuais e multisensoriais, nos quais o usurio um gerenciador ativo do processo de armazenamento e principalmente de recuperao das informaes interrelacionadas por meio do multidimensionamento dos pontos de acesso informacionais. Lancaster (1994, p.9), alertava para a mudana de filosofia proveniente deste novo tempo para a Biblioteconomia: a importncia do acesso informao ao invs da propriedade da informao, ou seja,
... os bibliotecrios tm reconhecido que eles no mais controlam tudo o que o usurio necessita, e nem deveriam. Ao contrrio, o seu papel fornecer o acesso aos recursos, em quaisquer formas que eles se apresentam, medida que a necessidade por eles aparecer. (1994, p.9)

Com esta nova postura, as mudanas exigidas na administrao e planejamento de biblioteca so certas, pois os investimentos so voltados para equipamentos, acessos, catlogos cooperativos, convnios como por exemplo a SciELO (Scientific Electronic Library Online) biblioteca virtual que abrange uma coleo selecionada de peridicos cientficos brasileiros e o ProBE (Programa Biblioteca Eletrnica) que oferece para a comunidade cientfica, acadmica e administrativa das instituies consorciadas a consulta gil e atualizada, por meio eletrnico, a textos completos de revistas cientficas internacionais atravs da Rede ANSP (Academic Network at So Paulo). Se para Lancaster (1994), no incio da dcada de 90, o investimento em acervo fsico se tornava uma questo a ser amplamente discutida, hoje ela j se torna uma realidade principalmente com relao formao da coleo de peridicos, visto que os peridicos eletrnicos esto sendo amplamente difundidos e utilizados no meio acadmico, ainda que a verso em papel no tenha sido encerrada.
4

Diante deste quadro atual, o atendimento s necessidades informacionais dos usurios torna-se um procedimento mais dinmico, considerando-se o tempo de acesso e de atualizao da informao eletrnica, o formato eletrnico do documento que pode ser facilmente copiado e/ou transferido (resguardados os direitos autorais), a comunicao entre pessoas feita pelo correio eletrnico, as listas de discusso, o crescente nmero de bases/bancos de dados on-line com textos completos, a facilidade em se trabalhar com imagens devido ao aumento de memria das mquinas e das unidades de armazenamento, os novos softwares grficos, a transmisso de dados via rede de computadores local e/ou remota, e as novas interfaces grficas cada vez mais amigveis. Tambm, diante da automao/informatizao de servios, das novas formas de documentos, novos suportes e acesso eletrnico informao, mudanas na execuo de atividades tcnicas das Bibliotecas passam a ser fundamentais. A indexao, a recuperao e a disseminao da informao, que so processos totalmente inter-relacionados, sofrem grandes mudanas com a insero de tecnologias de informtica. A atividade de indexao, se realizada manualmente, leva tempo, alm de ser subjetiva, ou seja, de depender do tipo de documento, e da capacidade e experincia do indexador. Alm disto, existem vrios tipos de indexaes, que dependem dos tipos de documentos e de usurios. Em oposio ao processo de indexao humana, a forma automtica ganha rapidez, porm exige maiores cuidados, como em alguns casos de sinnimos e hierarquia de assuntos, onde, a partir do documento indexado, cria-se um ndice geral indicando a quais documentos esto relacionados cada termo extrado da indexao. A recuperao automtica da informao possvel a partir do uso deste ndice por meio das estratgias de busca e de acordo com a necessidade informacional do usurio.

A disseminao da informao objetiva divulgar as novas fontes e/ou informaes existentes a partir da insero de novos documentos e da atualizao dos ndices de indexao, criando uma dinmica constante. Um grande facilitador na recuperao automtica da informao a interface grfica dos novos sistemas, embutindo as estratgias de busca em opes grficas para o usurio, principalmente para o leigo, tornando mais agradvel e descomplicada a sua interao com o sistema automatizado. Atualmente, o acesso informao eletrnica o ponto alto das tecnologias de informtica aplicadas s Bibliotecas, pois, com a tecnologia das redes eletrnicas, torna-se possvel o surgimento de novos documentos e produtos e, por consequncia, a criao de novos servios, como a orientao aos usurios na utilizao de seus recursos, o desenvolvimento de home-pages, o agendamento e o atendimento de novos servios on-line, como a comutao, o emprstimo entre bibliotecas, a disseminao da informao e o catlogo. Como fonte eletrnica de informaes, a Internet tornou possvel o acesso a instituies como museus, rgos pblicos, empresas, bibliotecas e aos mais variados tipos de documentos eletrnicos. Podemos citar, receitas culinrias, artigos e livros cientfico, homepages pessoais e institucionais, catlogos de bibliotecas tradicionais, bibliotecas digitais e/ou virtuais. Assim, a procura pela informao desejada, mesmo que no se saiba exatamente o que se quer e nem onde a informao se encontra armazenada, ganha uma dimenso maior principalmente em tempo de procura-resposta. A World Wide Web, tambm conhecida como WWW ou Web, a forma mais comum de acesso a Internet e corresponde sua parte grfica, com documentos hipertextuais dos mais variados assuntos e de diferentes arquiteturas de informaes textuais, sonoras e de imagens. O acesso informao disponvel na Web se d por diferentes pessoas de diferentes idades, culturas, territrios e necessidades, sejam cientistas, profissionais liberais, estudantes ou

professores, que possuem tambm uma necessidade de informao diversificada, ou seja, profissional, cultural, lazer ou entretenimento. Podemos pensar na Internet como uma grande biblioteca, na qual os usurios so agentes ativos do processo de armazenamento, indexao, recuperao e disseminao de documentos eletrnicos hipertextuais. Uma biblioteca auto-organizada em permanente mutao. Atualmente, o crescimento exponencial do nmero de documentos e informaes dos mais diversos assuntos disponveis na WWW, se d pela facilidade de se elaborar um documento eletrnico em forma de home-page, da maneira que se desejar e disponibiliz-lo ao mundo em um servidor/provedor de acesso a Internet, muitas vezes gratuito. Como esses documentos inseridos na rede Internet diariamente so descritos e indexados? Como os usurios tm acesso a esses documentos? As atividades de indexao e recuperao dos documentos so feitas pelas Ferramentas de Busca, que possibilitam aos usurios a busca de informaes disponveis na rede Internet. As Ferramentas de Busca, conhecidas tambm como Mquinas de Busca ou Search Engines, so programas computacionais desenvolvidos com o objetivo de indexar informaes descritivas e temticas das pginas e/ou sites da Internet em bases de dados, com a finalidade de possibilitar a recuperao de documentos solicitados, pelos usurios da Internet, segundo as estratgias de busca e os critrios adotados. Suas origens datam de 1994, por iniciativa das Universidades Norte-Americanas e, atualmente, as iniciativas particulares e/ou privadas esto tambm atuando nesta rea, disponibilizando suas prprias ferramentas, muitas delas com acesso gratuito. Preocupados com a construo de ferramentas de busca na Internet para usurios diversificados, Rosenfeld e Morville (1999, p.102-103) indicam alguns fatores a serem considerados com relao s necessidades informacionais dos usurios:

alguns usurios tm claramente definido o tipo de informao que precisam e onde ela pode ser localizada;

- alguns usurios sabem as informaes que querem, mas no sabem exatamente onde existem ou mesmo se existem; alguns usurios no sabem exatamente o que esperam encontrar, pois no sabem exatamente o que existe sobre o assunto; alguns usurios querem tudo sobre um assunto especfico. A navegao pela Internet torna-se um grande problema quando no h tempo disponvel para se visitar todos os sites interessantes conhecidos e, principalmente, avaliar a qualidade do contedo de cada um, e quando no se conhece o que h disponvel na Internet sobre o assunto desejado. Porm, recuperar informaes na WWW sem uma estratgia e um instrumento adequado significa obter milhares de documentos irrelevantes. Portanto, imprescindvel conhecer os recursos disponveis pela prpria WWW para se ter a resposta desejada. Quando se utiliza qualquer uma das Ferramentas de Busca, na verdade o que est sendo consultando no a Internet propriamente dita, e sim uma Base de Dados Referencial dos documentos existentes na Internet, que retorna como resposta os endereos das pginas relevantes consulta. As Ferramentas de Busca procuram ser de fcil utilizao, atravs de uma interface amigvel, e a busca concretizada em segundos com as respostas apresentadas diretamente pelos links das pginas ou por categorias de assuntos ou, ainda, pela forma de exibio dos resultados. Apresentam roteiro de ajuda e exemplos de estratgias de busca. Quanto ao tipos de Ferramentas de Busca, podemos classific-las em Catlogos, ndices e Metapesquisadores. Os Catlogos so organizados a partir de pginas cadastradas por seus criadores, que informam dados como ttulo, resumo ou descrio, palavras-chave e

endereo de localizao da pgina (URL). A partir de seu cadastro, a pgina analisada e recebe um tratamento manual, sendo classificada por assunto ou categoria. A partir de ento, so disponibilizadas as informaes descritivas e temticas da pgina, tornando o seu acesso recupervel na Base de Dados. Os catlogos frequentemente possibilitam ao usurio a procura por sites de interesse segundo categorias e permitem a solicitao de incluso de novos documentos e/ou categorias. Tm como grande caracterstica o tratamento temtico manual das pginas cadastradas criando categorias e sub-categorias de assunto. Alguns exemplos de catlogos so: Cad?, Excite, Onde ir?, Surf e Yahoo!. Os ndices so, geralmente, criados automaticamente a partir de uma busca na Internet realizada por robs de busca ou tambm conhecidos como spiders (aranhas). Os robs de busca percorrem a Internet, efetuando uma varredura peridica, procurando pginas e criando, automaticamente, bases de dados com informaes recuperveis sobre a pgina. Estas informaes compreendem ttulo, texto, URL, porm no recebem nenhuma classificao temtica manual. Tm como grande caracterstica a constante atualizao de seus dados. Alguns ndices so: AltaVista, Bookmark, Infoseek, RadarUOL, Todobr e o Netscopio. Algumas Ferramentas de Busca j possuem os chamados sites regionais para um determinado pas, como por exemplo o Yahoo! e o AltaVista para o Brasil. Numa terceira categoria, tem-se os Metapesquisadores, que so Ferramentas de Busca que no possuem sua prpria Base de Dados, mas que acionam as Bases de outras Ferramentas de Busca. Uma srie de Ferramentas de Busca so arroladas ao usurio e ele define se a busca percorrer todas ou apenas algumas. Como exemplos temos o MetaCrawler dos Estados Unidos da Amrica e o Metaminer do Brasil. Hoje, o MetaCrawler faz pesquisas, simultaneamente, no AltaVista, Infoseek, WebCrawler, Thunderstone, Excite, Google, Lycos, LookSmart, GoTo DirectHit e RealNames,

enquanto que o Metaminer utiliza as Ferramentas de Busca AltaVista, AOLNetfind, Excite, Lycos, WebCrawler, Yahoo! e Fast e as nacionais: RadarUOL, Zeek, Achei, Cad?, Yahoo! Brasil.
A utilizao dos metapesquisadores no elimina a necessidade de conhecer as caractersticas individuais dos diversos mecanismos de busca. Quanto mais se conhece sobre as formas de funcionamento das ferramentas que os alimentam, melhor julgamento quanto a confiabilidade dos resultados obtidos. Se, por exemplo, a pesquisa exige determinados refinamentos no processveis pelas ferramentas que constituem o metapesquisador pode resultar erros e resultados inadequados. (Branski, 1998)

10

Bueno e Vidotti (1999, p.48) salientam ainda que:


"... no metapesquisador, a restrio do nmero mximo de resultados obtidos por ferramenta e a delimitao do tempo de busca para a pesquisa so fatores a serem considerados no resultado da busca, pois pode no haver tempo hbil para conectar ou consultar de forma integral/abrangente todas as Ferramentas de Busca selecionadas e ainda o resultado obtido pode ser superior ao delimitado na estratgia."

Com o aumento constante e exponencial dos documentos da Internet, as Ferramentas de Busca passaram a se especializar quanto ao assunto ou rea de abrangncia. So exemplos de Ferramentas especficas:
-

Todobr (http://www.todobr.com.br/) para assuntos relacionados ao pas ou ainda por regio

Biolinks (http://www.biolinks.com/ ) para artigos cientficos Cora (http://www.cora.justresearch.com/ ) para Cincia da Computao Chemie.De (http://www.chemie.de/?language=e) para Qumica Whowhere (http://www.whowhere.lycos.com/) para procurar pessoas

Os conceitos de recuperao da informao esto presentes no uso das Ferramentas de Busca, onde os fatores de pertinncia e exaustividade devem estar claros diante de uma estratgia de busca, e onde o resultado deve ser o desejado com relao quantidade de documentos recuperados e sua qualidade, ou seja, a relevncia de seu contedo. Aps a elaborao da estratgia de busca e a consulta a base de dados de uma Ferramenta de Busca comum obter como resposta milhares ou centenas de informaes referenciais dos documentos que contenham ou no as informaes solicitadas. Isto acontece por se tratar de um assunto geral ou em funo da estrutura organizacional da Base de Dados da Ferramenta de Busca, que pode considerar como respostas, aproximaes ao termo consultado, plural, ocorrncia do termo no documento, diferenciao ou no de palavras maisculas e

11

minsculas, e que podem levar a obteno de documentos pertinentes, porm estes nem sempre satisfazem as expectativas e necessidades dos usurios. Lynch (1997) classifica o acesso informao atravs do uso das Ferramentas de Busca como altamente democrtico devido ao acesso nico e igual todas as informaes da rede, porm questiona a irrelevncia frequente dos resultados nas consultas realizadas. As diferenas bsicas entre as Ferramentas de Busca decorrem dos critrios adotados na construo de suas Bases de Dados e dos recursos disponveis para a elaborao de estratgias de busca. Branski (1998, p.2) aponta os seguintes critrios de diferenciao na construo da base de dados: -

a relao de pginas iniciais a partir do qual o spider percorrer a rede


em busca de informao, as informaes enviadas pelos autores que escolhem as ferramentas onde pediro a incluso, de como indexa as informaes de cada site (se armazena o texto integral, se somente o ttulo e um pequeno resumo algoritmicamente construdo do contedo, se o ttulo e as primeiras linhas do site, etc.) e no caso dos catlogos, os critrios humanos utilizados para a indexao e classificao das informaes.

Para se elaborar estratgias que correspondam s expectativas informacionais dos usurios, preciso entender como as Ferramentas de Busca indexam e quais so os recursos disponveis para a elaborao das estratgias de busca adequadas. Bueno e Vidotti (1999) explicam a utilizao de alguns operadores e relacionam alguns recursos, apontando diferenas entre as Ferramentas Alta Vista, Yahoo! Brasil, Cad?, Netscopio, Metacrawler e Metaminer. As Ferramentas de Busca, geralmente, trabalham com operadores booleanos, posicionais, truncamento e a combinao destes, alm de recursos adicionais como a busca

12

por linguagem natural, obrigatoriedade ou no da ocorrncia do termo, diferenciao entre maiscula e minscula, diferenciao de acentos e caracteres especiais, alm de outros que exigem conhecimento de conceitos prvios e da sintaxe da busca, como busca por data, por domnio, por URL, por ttulo, por outros idiomas, tipo de documento. A utilizao correta dos operadores e dos demais recursos interferem na qualidade das respostas obtidas com relao sua pertinncia e exaustividade, como uma busca por nome prprio que pode ser otimizada levando-se em conta a diferenciao que a Ferramenta faz ou no para esta busca. Quanto ao nvel de busca, geralmente, as Ferramentas de Busca oferecem mais de um nvel de busca, conhecidos por busca simples e avanada dependendo do conhecimento e experincia do usurio. A busca avanada fornece maiores opes e recursos para elaborao das estratgias de busca. As buscas nestes nveis podem variar, ou seja, uma mesma busca efetuada nos nveis simples e avanado pode obter respostas diferentes, ou seja, algumas opes podem estar disponveis apenas em um nvel de pesquisa, como no exemplo a seguir:

13

Busca Simples Estratgia frank sinatra Frank Sinatra +frank +sinatra frank and sinatra Frank and Sinatra Web Pages Ocorrncias encontradas (palavras encontradas) 51.352 frank sinatra: 112557 56.316 33.924 120.560 107.545 Frank Sinatra: 98521 sinatra: 231330; frank: 5293791 sinatra: 231330; frank: 5293791 ignoradas (and): 1623918405 Sinatra: 196221; Frank: 4647454 Ignoradas (and): 1623918405 frank sinatra: 112557 Frank Sinatra: 98521 sinatra: 231330; frank: 5293791; near: 10182866 near 1: about 7000; sinatra: 231330; frank: 5293791 near 5: about 3000; sinatra: 231330; frank: 5293791

Busca Avanada Web Pages encontradas 66.485 60.277 66.485 74.224 66.949

frank sinatra Frank Sinatra frank near sinatra frank sinatra frank sinatra near(1) near(5)

51.352 56.316 1.075.220 1.655.679 1.641.360

66.485 60.277 69.186 124 35

Tabela 1: Busca simples e avanada, sem restries e respostas apenas Web Pages

Este simples exemplo nos informa que devemos conhecer as ferramentas de buscas, seus recursos e operadores para a formulao de estratgias, atravs de seus textos explicativos e de ajuda. importante observar que informaes so manipuladas de forma diferente pela mesma ferramenta, o que conduz a estudos detalhados da estrutura de armazenamento e indexao da mesma, e como, em geral, estas informaes organizacionais no so divulgadas, tornam-se necessrios estudos experimentais e dedues por inferncias. Como forma de facilitar a pesquisa, principalmente para o usurio leigo, algumas Ferramentas de Busca fornecem uma interface grfica mais amigvel, embutindo

14

em opes de escolha os operadores que utilizam para busca. Assim, no exigido do usurio o conhecimento prvio para elaborar a sintaxe da busca. A forma de apresentao dos resultados tambm se diferencia, pois algumas Ferramentas de Busca oferecerem opes de melhor visualizao e ordenao dos resultados que podem ser parametrizveis pelo prprio usurio. Rosenfeld e Morville (1999, p.113-115), colocam como fatores para a apresentao dos resultados da consulta de uma ferramenta de busca, o grau de estrutura do contedo das Bases de Dados e a escolha do usurio, ou seja, como o usurio deseja ordenada a informao que ele procura? Algumas Ferramentas de Busca permitem que o prprio usurio determine a exibio dos resultados dentre as opes existentes, tais como: quantas e quais informaes devem ser exibidas para cada documento recuperado? Quantos documentos devem ser exibidos? Como devem estar ordenados os resultados dentre as opes: cronolgica, alfabtica ou relevncia? Em estudo realizado em dezembro de 1997, dois pesquisadores do NEC Research Institute, localizado em Princeton, New Jersey, Estados Unidos da Amrica, Lawrence e Giles (1998), avaliaram as respostas oferecidas por seis Ferramentas de Busca que indexam texto completo: Alta Vista, Excite, HotBot, Infoseek, Lycos e Nothern Light. As consultas correspondiam a questes da rotina de trabalho dos pesquisadores do mesmo Instituto e foram avaliadas um total de 575 respostas. Atravs de uma metodologia previamente determinada, foram considerados: somente as resposta cujos documentos pudessem ser carregados e/ou acessados; nmero mximo de 600 respostas por consulta (eliminando as duplicaes); respostas obtidas em at 60 segundos;

15

documentos que continham exatamente todos os termos pesquisados, eliminando-se o plural por exemplo, devido forma diferente de tratamento que as Ferramentas do a estas particularidades;

e, foram desconsiderados:
-

consultas com stop words (por exemplo, artigos, preposies), uso de caracteres especiais porque cada Ferramentas de Busca trata-os de forma diferenciada;

respostas duplicadas entre as Ferramentas, ou seja, documentos que tinham a mesma URL. Como resultados, tem-se que:

HotBot a Ferramenta mais abrangente nesta avaliao, seguido por Alta Vista, Northern Light, Excite, Infoseek e Lycos.

dois fatores so importantes para o resultado alcanado: o estado das Bases de Dados de cada Ferramenta no momento da consulta e a forma que cada Ferramentas de Busca indexa as palavras de um documento, uma vez que cada uma possui sua prpria metodologia;

o alcance das Ferramentas de Busca crescente de acordo com o nmero de Ferramentas utilizadas, assim, o nmero de documentos retornados maior tanto quanto maior for o nmero de ferramentas consultadas, fator que privilegia grandemente os

Metapesquisadores;
-

o ranking das Ferramentas de Busca que apresentam nas suas respostas documentos invlidos, ou seja, pginas alteradas ou que no existem mais, estabeleceu-se em: Lycos, 1,6%; Excite 2,0%; AltaVista, 2,5%; Infoseek, 2,6%; Northen Light, 5,0% e HotBot, 5,3%;

o tamanho da Web indexvel tambm foi calculada em um total de 320 milhes de pginas; Lawrence e Giles (1999) deram continuidade sua pesquisa com as Ferramentas de

Busca, ampliando o nmero de ferramentas e consultas num total de 11 ferramentas (Alta Vista, Euro Seek, Excite, Google, HotBot, Infoseek, Lycos, Microsoft, Northern Light, Snap e Yahoo)

16

e 1.050 consultas e, calculando o tamanho estimado da Web indexvel em 800 milhes de pginas, 180 milhes de imagens, 3 milhes de servidores, onde 83% so comerciais. As concluses deste estudo realizado em fevereiro de 1999 foram: alcance que as Ferramentas de Busca atingem na Web no superior a 38.3% pela ferramenta Northern Light, seguido de 37.1% pelas Snap e Alta Vista; alcance das Ferramentas de Busca com relao ao tamanho estimado da Web corresponde a 16% tambm pela ferramenta Northern Light, seguido por 15.5% com Snap e Alta Vista, ou seja, pelo tamanho da Web nenhuma ferramenta consegue cobrir mais que 16% o crescimento da Internet; - a porcentagem de links invlidos chega a 14% pelo Lycos e a menor porcentagem de 2.2% pelo HotBot; a mdia em dias da atualizao de novos documentos chega a 235 pelo Yahoo e, como menor valor, 141, pelo Northern Light. Diante deste quadro, conclui-se que as Ferramentas indexam apenas uma frao da Web e o seu alcance significativamente limitado, devido s limitaes tcnicas que envolvem o desempenho de cada Ferramentas de Busca em particular. Na literatura cientfica no h a indicao de uma Ferramenta de Busca ideal ou completa, assim, para se decidir por qual ferramenta escolher, deve-se considerar o assunto desejado, a resposta esperada e as caractersticas funcionais e operacionais da mesma, e como estratgia pode-se utilizar mais de uma Ferramenta para a mesma pesquisa pela diversidade dos documentos indexados em suas Bases de Dados.

O acompanhamento da evoluo das Ferramentas de Busca e das formas de uso de seus operadores so essenciais para uma busca estratgica de informaes na Internet, pois o usurio pode atravs delas usufruir criteriosa e conscientemente do que de melhor a WWW oferece. (Bueno e Vidotti, 1999, p.48).

17

A cada dia, novas Ferramentas de Busca so criadas e disponibilizadas, porm esta tecnologia no est acompanhando o crescimento exponencial da WWW, principalmente com relao atualizao de suas Base de Dados, o que proporciona um grau de instabilidade (ou insegurana) ao se consultar a Internet com a utilizao deste instrumento. Diante do exposto, e considerando a complexidade da rede Internet, torna-se necessrio o estabelecimento de programas de capacitao do
profissional de informao, de modo a torn-lo apto a usar os recursos da Internet e identificar estratgias eficientes para sanar necessidades informacionais de seus clientes, ou ainda para capacitar esses clientes no uso mais adequado daqueles recursos" FERREIRA, (1994, p.260).

As atuais tecnologias de informtica e comunicao esto possibilitando uma reorganizao das atividades biblioteconmicas com o objetivo principal de atender de forma precisa e rpida as necessidades dos usurios de bibliotecas tradicionais, digitais, virtuais, e da Internet. O profissional de biblioteconomia, prtico ou terico, no pode ficar margem deste mundo globalizado e tecnolgico, mas sim propor metodologias eficazes de representaes descritivas e temticas automticas, a fim de permitir a recuperao de documentos eletrnicos relevantes e pertinentes, existentes especialmente nesta imensa Torre de Babel que a Internet. Podemos concluir que existe um campo de pesquisa amplo e pouco explorado para os profissionais da Biblioteconomia, com relao aos tratamentos descritivos e temticos dos documentos disponveis na Internet, que so catalogados em bases de dados pelas ferramentas de busca de forma automtica ou manual, para que esses documentos possam ser recuperados de maneira a atender as expectativas do usurio numa relao eficaz de relevncia x pertinncia x tempo de busca.

18

Referncias Bibliogrficas BRANSKI, Regina Meyer. Localizao de informao na Internet : caractersticas e formas de funcionamento dos mecanismos de busca. Campinas : UNICAMP, 1998 BUENO, Mrcia Correa, VIDOTTI, Silvana Aparecida Borsetti Gregorio. Uso estratgico das Ferramentas de Busca na Internet. In: SIMPSIO INTERNACIONAL PROF. DR. PAULO TARCSIO MAYRINK, 3, 1999, Marlia. Anais... Marlia : Faculdade de Filosofia e Cincias, 1999. p.39-49 BUSH, V. As We May Think. The Atlantic Monthly. [on-line]. Jul. 1945. Verso eletrnica preparada por Denys Duchier, abril/1994. Available from World Wide Web: <http://www.isg.sfu.ca/~duchier/misc/vbush> FERREIRA, Sueli Mara Soares Pinto. Introduo s redes eletrnicas de comunicao. Cincia da Informao, v.23, n.2, p.258-263, maio/ago. 1994. LANCASTER, F.W. Ameaa ou oportunidade? O futuro dos servios de biblioteca luz das inovaes tecnolgicas. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v.23, n.1, p.7-27, jan-jun.1994 LAWRENCE, Steve, GILES, C. Lee. Searching the World Wide Web. Science, Washington, v.280, n. 5360, p.98-100, 1998 LAWRENCE, Steve, GILES, C. Lee. Accessibility of information on the Web. Nature, v.400, n. 6740, p.107-109, 1999 LYNCH, Clifford. Searching the Internet. Scientific American. [on-line]. 1997, v.276, n.3 [cited 1999-11-14]. Available from World Wide Web: <http://www.sciam.com/0397issue/0397lynch.html> ROSENFELD, Louis, MORVILLE, Peter. Searching systems. In: _______ . Information architeture for the World Wide Web. Sebastopol, CA : OReilly, 1999. cap.6, p.99-130 ROWLEY, Jennifer. Informtica para bibliotecas. Braslia : Briquet Lemos, 1994.

19

Você também pode gostar