Escolar Documentos
Profissional Documentos
Cultura Documentos
Um motor de busca, motor de pesquisa ou mquina de busca um sistema de software projetado para encontrar informaes armazenadas em um sistema computacional a partir de palavras-chave indicadas pelo utilizador, reduzindo o tempo necessrio para encontrar informaes. Os motores de busca surgiram logo aps o aparecimento da Internet, com a inteno de prestar um servio extremamente importante: a busca de qualquer informao na rede, apresentando os resultados de uma forma organizada, e tambm com a proposta de fazer isto de uma maneira rpida e eficiente. A partir deste preceito bsico, diversas empresas se desenvolveram, chegando algumas a valer milhes de dlares. Entre as maiores empresas encontram-se o Google, o Yahoo, o Lycos, oCad e, mais recentemente, a Amazon.com com o seu mecanismo de busca A9. Os buscadores se mostraram imprescindveis para o fluxo de acesso e a conquista novos visitantes. Antes do advento da Web, havia sistemas para outros protocolos ou usos, como o Archie para sites FTP annimos e o Veronica para o Gopher (protocolo de redes de computadores que foi desenhado para indexar repositrios de documentos na Internet, baseando-se em menus).
Conceito
Um motor de busca um programa feito para auxiliar a procura de informaes armazenadas na rede mundial (WWW), dentro de uma rede corporativa ou de um computador pessoal. Ele permite que uma pessoa solicite contedo de acordo com um critrio especfico (tipicamente contendo uma dada palavra ou frase) e responde com uma lista de referncias que combinam com tal critrio, ou seja uma espcie de catlogo mgico. Mas, diferentemente dos livros de referncias comuns, nos quais est acessvel a informao que algum organizou e registrou, o catlogo do motor de busca est em branco, como um livro vazio. Ao se realizar uma consulta, a lista de ocorrncias de assuntos criada em poucos segundos por meio de um conjunto de softwares de computadores, conhecidos como spiders, que vasculham toda a Web em busca de ocorrncias de um determinado assunto em uma pgina. Ao encontrar uma pgina com muitos links, os spiders embrenham-se por eles, conseguindo, inclusive, vasculhar os diretrios internos - aqueles que tenham permisso de leitura para usurios - dos sites nos quais esto trabalhando. Os motores de busca usam regularmente ndices atualizados para funcionar de forma rpida e eficiente. Sem maior especificao, ele normalmente refere-se ao servio de busca Web, que procura informaes na rede pblica da Internet. Outros tipos incluem motores de busca para empresas (Intranets), motores de busca pessoais e motores de busca mveis. De qualquer forma, enquanto diferente seleo e relevncia podem aplicar-se em diferentes ambientes, o utilizador provavelmente perceber uma pequena diferena entre as operaes neles. Alguns motores tambm extraem dados disponveis em grupos de notcias, grandes bancos de dados ou diretrios abertos como a DMOZ.org. Ao contrrio dos diretrios Web, que so mantidos por editores humanos, os servios de busca funcionam algoritmicamente. A maioria dos sites que chamam os motores de busca so, na verdade, uma "interface" (front end) para os sistemas de busca de outras empresas.
Histria
Os primeiros motores de busca (como o Yahoo) baseavam-se na indexao de pginas atravs da sua categorizao. Posteriormente surgiram as meta-buscas. A mais recente gerao de motores de busca (como a do Google) utiliza tecnologias diversas, como a procura por palavras-chave diretamente nas pginas e o uso de referncias externas espalhadas pela web, permitindo at a traduo direta de pginas (embora de forma bsica ou errada) para a lngua do utilizador. O Google, alm de fazer a busca pela Internet, oferece tambm o recurso de se efetuar a busca somente dentro de um site especfico. essa a ferramenta usada na comunidade Wiki.
Os motores de busca so buscadores que baseiam sua coleta de pginas em um rob que varre a Internet procura de pginas novas para introduzir em sua base de dados automaticamente. Motores de busca tpicos so Google, Yahoo e Altavista. A primeira ferramenta utilizada para busca na Internet foi o Archie (da palavra em Ingls, "archive" sem a letra "v"). Foi criado em 1990 por Alan Emtage, um estudante da McGill University em Montreal. O programa baixava as listas de diretrio de todos arquivos localizados em sites pblicos de FTP (File Transfer Protocol) annimos, criando uma base de dados que permitia busca por nome de arquivos. Enquanto o Archie indexava arquivos de computador, o Gopher indexava documentos de texto. Ele foi criado em 1991, por Mark McCahill da Universidade de Minessota, cujo nome veio do mascote da escola. Devido ao fato de serem arquivos de texto, a maior parte dos sites Gopher tornaram-se websites aps a criao da World Wide Web. Dois outros programas, Veronica e Jughead, buscavam os arquivos armazenados nos sistemas de ndice do Gopher. Veronica (Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) provia uma busca por palavras para a maioria dos ttulos de menu em todas listas do Gopher. Jughead (Jonzy's Universal Gopher Hierarchy Excavation And Display) era uma ferramenta para obter informaes de menu de vrios servidores Gopher. O primeiro search engine Web foi o Wandex, um ndice atualmente extinto feito pela World Wide Web Wanderer, um web crawler (programa automatizado que acessa e percorre os sites seguindo os links presentes nas pginas.) desenvolvido por Matthew Gray no MIT, em 1993. Outro sistema antigo, Aliweb, tambm apareceu no mesmo ano e existe at hoje. O primeiro sistema "full text" baseado em crawler foi o WebCrawler, que saiu em 1994. Ao contrrio de seus predecessores, ele permite aos usurios buscar por qualquer palavra em qualquer pgina, o que tornou-se padro para todos servios de busca desde ento. Tambm foi o primeiro a ser conhecido pelo grande pblico. Ainda em 1994, o Lycos (que comeou na Carnegie Mellon University) foi lanado e tornou-se um grande sucesso comercial. Logo depois, muitos sistemas apareceram, incluindo Excite, Infoseek, Inktomi, Northern Light, e AltaVista. De certa forma, eles competiram com diretrios populares como o Yahoo!. Posteriormente, os diretrios integraram ou adicionaram a tecnologia de search engine para maior funcionalidade. Os sistemas de busca tambm eram conhecidos como a "mina de ouro" no frenesi de investimento na Internet que ocorreu no fim dos anos 1990s. Vrias empresas entraram no mercado de forma espetacular, com recorde em ganhos durante seus primeiros anos de existncia. Algumas fecharam seu sistema pblico, e esto oferecendo verses corporativas somente, como a Northern Light. Mais recentemente, os sistemas de busca tambm esto utilizando XML ou RSS, permitindo indexar dados de sites com eficcia, sem a necessidade de um crawler complexo. Os sites simplesmente provm um xml feed o qual indexado pelo sistema de busca. Os XML feeds esto sendo cada vez mais fornecidos de forma automtica por weblogs. Exemplos so o feedster, que inclui o LjFind Search que prov servios para os blogs do site LiveJournal.
Tipos de buscador
Existem variados tipos de buscadores: Buscadores globais so buscadores que pesquisam todos os documentos na rede, e a apresentao do resultado aleatria, dependendo do ranking de acessos aos sites. As informaes podem referir-se a qualquer tema. Google, Yahoo e Bing so os buscadores globais mais acessados.
Buscadores verticais so buscadores que realizam pesquisas "especializadas" em bases de dados prprias de acordo com suas propenses. Geralmente, a incluso em um buscador vertical est relacionada ao pagamento de uma mensalidade ou de um valor por clique. Trovit, BizRate, AchaNoticias, Oodle, Catho, SAPO, BuscaP, Zura e Become.com so alguns exemplos de buscadores verticais. Guias locais so buscadores exclusivamente locais ou regionais. As informaes se referem a endereos de empresas ou prestadores de servios. O resultado priorizados pelo destaque de quem contrata o servio. Listo, GuiaMais, AcheCerto, EuAcheiFcil, Zeen! entre outras. Geralmente so cadastros e publicaes pagas. indicado para profissionais e empresas que desejam oferecer seus produtos ou servios em uma regio, Estado ou Cidade. Guias de busca local ou buscador local so buscadores de abrangncia nacional que lista as empresas e prestadores de servios prximas ao endereo do internauta a partir de um texto digitado. A proximidade avaliada normalmente pelo cep, Donavera.com, ou por coordenadas de GPs. Os cadastros Bsicos so gratuitos para que as micros empresas ou profissionais liberais possam estar presente na WEB sem que invistam em um sites prprio. indicado para profissionais e empresas que desejam oferecer seus produtos ou servios em uma Localidade, rua, bairro, cidade ou Estado e possibilitando ainda a forma mais rpida de atualizao dos registros de contatos por seus clientes ou fornecedores. Diretrios de websites so ndices de sites, usualmente organizados por categorias e subcategorias. Tem como finalidade principal permitir ao usurio encontrar rapidamente sites que desejar, buscando por categorias, e no por palavras-chave. Os diretrios de sites geralmente possuem uma busca interna, para que usurios possam encontrar sites dentro de seu prprio ndice. Diretrios podem ser a nvel regional, nacional (como o Achei no Brasil) ou global, e at mesmo especializados em determinado assunto. Open Directory Project exemplo de diretrios de sites.
A divulgao de sites de empresas com negcios regionais so acessados em sua grande maioria quando os profissionais da WEB cadastram seus sites nos Buscadores Locais para aumentarem as visitas de internautas, pois no h um sistema de atualizao automtica dos dados que abranja todos os tipos de categorias e em rapidez necessria. Por esta razo, somente cerca de 20% a 25% de tudo que existe na WEB publicada nos buscadores. A novidade agora so os ontobuscadores, isto , buscadores baseados em Ontologias, como o Ontoweb. Ano Engine 1993 Wandex 1993 Aliweb 1994 WebCrawler Infoseek Lycos 1995 AltaVista Evento Lanamento Lanamento Lanamento Lanamento Lanamento Lanamento (parte do DEC)
1995 Sapo.pt Excite 1996 Dogpile Inktomi Ask Jeeves 1997 Sapo.pt 1998 Google 1999 AlltheWeb 1999 Baidu 2000 Singingfish 2000 Teoma 2000 Vivisimo
Lanamento Lanamento Lanamento Fundado Fundado Fundado Lanamento Lanamento Fundado Lanamento Fundado Fundado
2003 Objects Search Lanamento 2004 Yahoo! Search Lanamento final (primeiros resultados originais) MSN Search 2005 MSN Search 2005 Bupor 2006 Quaero 2006 Trovit 2007 Ask.com 2008 Cuil 2009 Bing 2009 Zeen.com.br Lanamento beta Lanamento final Lanamento Fundado Fundado Fundado Fundado Fundado Fundado
Funcionamento
Um search engine opera na seguinte ordem: 1. Web crawling (percorrer por links) 2. Indexao 3. Busca Os sistemas de busca trabalham armazenando informaes sobre um grande nmero de pginas, as quais eles obtm da prpria WWW. Estas pginas so recuperadas por um Web crawler (tambm conhecido como spider) um Web browser automatizado que segue cada link que v. As excluses podem ser feitas pelo uso do robots.txt. O contedo de cada pgina ento analisado para determinar como dever ser indexado (por exemplo, as palavras so extradas de ttulos, cabealhos ou campos especiais chamados meta tags). Os dados sobre as pginas so armazenados em um banco de dados indexado para uso nas pesquisas futuras. Alguns sistemas, como o do Google, armazenam todo ou parte da pgina de origem (referido como um cache) assim como informaes sobre as pginas, no qual alguns armazenam cada palavra de cada pgina encontrada, como o AltaVista. Esta pgina em cache sempre guarda o prprio texto de busca pois, como ele mesmo foi indexado, pode ser til quando o contedo da pgina atual foi atualizado e os termos de pesquisa no mais esto contidos nela. Este problema pode ser considerado uma forma moderada de linkrot (perda de links em documentos da Internet, ou seja, quando os sites deixaram de existir ou mudaram de endereo), e a maneira como o Google lida com isso aumenta a usabilidade ao satisfazer as expectativas dos usurios pelo fato de o termo de busca estaro na pgina retornada. Isto satisfaz o princpio de menos surpresa, pois o usurio normalmente espera que os termos de
pesquisa estejam nas pginas retornadas. A relevncia crescente das buscas torna muito til estas pginas em cache, mesmo com o fato de que podem manter dados que no mais esto disponveis em outro lugar. Quando um usurio faz uma busca, tipicamente digitando palavras-chave, o sistema procura o ndice e fornece uma lista das pginas que melhor combinam ao critrio, normalmente com um breve resumo contendo o ttulo do documento e, s vezes, partes do seu texto. A maior parte dos sistemas suportam o uso de termos booleanos AND, OR e NOT para melhor especificar a busca. E uma funcionalidade avanada a busca aproximada, que permite definir a distncia entre as palavras-chave. A utilidade de um sistema de busca depende da relevncia do resultado que retorna. Enquanto pode haver milhes de pginas que incluam uma palavra ou frase em particular, alguns sites podem ser mais relevantes ou populares do que outros. A maioria dos sistemas de busca usam mtodos para criar um ranking dos resultados para prover o "melhor" resultado primeiro. Como um sistema decide quais pginas so melhores combinaes, e qual ordem os resultados aparecero, varia muito de um sistema para outro. Os mtodos tambm modificam-se ao longo do tempo, enquanto o uso da Internet muda e novas tcnicas evoluem. A maior parte dos sistemas de busca so iniciativas comerciais suportadas por rendimentos de propaganda e, como resultado, alguns usam a prtica controversa de permitir aos anunciantes pagar para ter sua listagem mais alta no ranking nos resultados da busca. A vasta maioria dos servios de pesquisa so rodados por empresas privadas usando algoritmos proprietrios e bancos de dados fechados, sendo os mais populares o Google, Bing e Yahoo! Search. De qualquer forma, a tecnologia de cdigo-aberto para sistemas de busca existe, tal como ht://Dig, Nutch, Senas, Egothor, OpenFTS, DataparkSearch e muitos outros.
O Google , sem a menor sombra de dvidas, um dos servios mais utilizados em toda a internet. Por trs da simples e simptica aparncia se esconde uma poderosa ferramenta para buscas de informaes de todos os tipos. O que muita gente no sabe que, com pequenos macetes, possvel aproveitar ainda mais os recursos oferecidos pelo buscador. E justamente para ajud-lo a usufruir melhor do Google que o InfoWester apresenta as dicas a seguir.
Pesquisa Simples:
V at o site do Google, digitando http://www.google.com.br. Voc ver uma pgina com uma caixa de texto no centro da tela. Nessa caixa, digite o termo procurado e depois clique no boto "Pesquisa Google". Espere alguns instantes e logo ters a pgina de resposta. Agora, basta clicar sobre os links que parecem ser os mais interessantes.
operaes bsicas at algumas mais complexas. Tudo o que necessrio fazer informar o tipo de clculo desejado. Eis alguns exemplos: Digite: 5^3 sin(45 degrees) tan(45 degrees) cos(45 degrees) sqrt (90) ln (13) log (1,000) 50! 4a raiz de 64 O Google far: 5 elevado a 3 o seno de 45 * a tangente de 45 * o cosseno de 45 * a raiz quadrada de 90 o logaritmo base e de 13 o logaritmo base 10 o fatorial de 50 o clculo da quarta raiz de 64
* O termo degrees no obrigatrio. Digite-o somente quando desejar o valor em graus. Sem a palavra degrees, o resultado fornecido em radianos. Note que voc no precisa realizar cada operao por vez. possvel fazer combinaes. Por exemplo, digite(14+554)*ln(13)/tan(90)+ 1. O Google dar como resultado -729.197942.
Se voc fizer pesquisas "logado" em sua conta do Google, poder consultar as buscas realizadas nos ltimos meses a partir do histrico do servio. Trata-se de uma possibilidade til para vrios fins, como relembrar um nome pesquisado anteriormente, verificar em quais dias voc fez mais buscas e assim por diante. Para acessar o seu histrico, basta efetuar login na pgina www.google.com/history. O servio tambm mostra dados sobre a utilizao de outras ferramentas do Google. bing (www.bing.com.br)
Bing, anteriormente Live Search, Windows Live Search e MSN Busca, identificado pelo codenome Kumo durante a etapa de testes, o motor de pesquisa da Microsoft, designado para competir com os lderes das indstrias Google e Yahoo!. Revelado pelo CEO da Microsoft, Steve Ballmer, em 28 de maio de 2009, na conferncia "All Things D", em San Diego. Bing um substituto do Live Search, e disponibilizado totalmente em 1 de junho de 2009.
crianas, podemos remover recursos especficos do ndice de informaes disponveis. Em cada caso em que formos exigidos a faz-lo por lei, tentaremos limitar nossa remoo de resultados de pesquisa a um conjunto limitado de circunstncias, de modo a cumprir com a lei aplicvel, mas no restringir excessivamente o acesso de usurios do Bing a informaes pertinentes. Yahoo! (www.yahoo.com.br)
A Yahoo! Inc. (NYSE: YHOO) uma empresa norte-americana de servios de Internet com a misso de ser "o servio de Internet global mais essencial para consumidores e negcios". Opera um portal de Internet, um diretrio web, e outros servios, incluindo o popular Yahoo! Mail. Foi fundado por David Filo e Jerry Yang, formandos da Universidade de Stanford em janeiro de 1994 e incorporado no dia 2 de maro de 1995. A sede da empresa em Sunnyvale, Califrnia. De acordo com a Alexa Internet, uma empresa de tendncias da web, a Yahoo! a segunda pgina mais visitada da Internet nos Estados Unidos depois do Google, sendo tambm a 3 pgina mais visitada do mundo em 2009. A rede global de pginas do Yahoo! receberam 3 bilhes de page views por dia em outubro de 2004. No "Ad Planner Top 1000 Sites", que registra os sites mais acessados do mundo, atravs do mecanismo de busca do Google, divulgado em junho de 2010, o Yahoo! aparece como 2 colocado, com 490 milhes de visitas e um alcance global de 32% registrados no ms de abril, atrs apenas do site de relacionamentos Facebook. Enquanto a popularidade do Yahoo! crescia, novos servios iam surgindo, tornando o Yahoo! uma parada obrigatria para todas novas tendncias da Internet. Estes incluem: o Yahoo! Messenger, um mensageiro instantneo, o Yahoo! Groups, servio muito popular de criao de mailing lists por assunto de interesse, bate-papo e jogos online, vrios portais de notcias e informao, compras online e leiles. Muitos destes so baseados em servios independentes, dos quais o Yahoo! comprou, como o EGroups, o popular GeoCities, para hospedagem de sites da web, e o Rocketmail. Muitas destas aes desagradaram a alguns usurios que j usavam estes servios antes de serem comprados pela Yahoo!, j que a empresa costumava sempre alterar os termos de servio. Um dos casos marcantes nesse sentido foi a incorporao do servio de webring, em 2000. Em 1 de fevereiro de 2008, a Microsoft desejou comprar a Yahoo! por 44,6 bilhes de dlares, porm a Yahoo! rejeitou oficialmente a oferta dizendo que a oferta subestima o valor da
empresa no mercado. Agora, a Microsoft vai tentar convencer o conselho da Yahoo! a substituir os cargos da diretoria para pessoas que aprovem a venda.