Escolar Documentos
Profissional Documentos
Cultura Documentos
Contedo
Introduo Uma breve introduo pesquisa na Web Novidades na pesquisa na Web do Google? O Google vai encontrar o seu Web site? O Google vai indexar o seu Web site?
Controlar o que o Google indexa Robots.txt versus meta tags Controlar o armazenamento em cache e snippets
2 3 4 5 6
7 9 10
O seu Web site apresenta contedo exclusivo e til? Aumentar a visibilidade: prticas recomendadas Centro para webmasters
Sitemaps
11 12 13
14
15 19
Introduo
Se procura visibilidade, a Internet o lugar ideal. Pergunte a qualquer anunciante que tenha aumentado as vendas utilizando anncios on-line, a um blogger cuja popularidade o tenha levado publicao de um livro ou a um jornal que tenha ampliado o seu pblico ao nvel internacional graas ao aumento de trfego. Recebemos frequentemente perguntas sobre como funciona a pesquisa na Web e como os editores da Web podem maximizar a sua visibilidade na Internet. Preparmos este folheto para o ajudar a compreender como um mecanismo de pesquisa percepciona o seu contedo, e como pode anar a sua presena na Web, disponibilizando o que pretende que seja visualizado e ocultando o que deseja manter oculto. Desde sugestes de webmasters e ferramentas on-line a um manual passoa-passo com perguntas frequentes, este folheto foi desenvolvido tanto para pequenos editores da Web como para proprietrios de grandes Web sites. Assim como a prpria Internet evoluiu drasticamente na ltima dcada, a abordagem do prprio Google em relao pesquisa na Web e o seu relacionamento com os proprietrios de Web sites tambm evoluram. Crimos diversas ferramentas para ajudar os webmasters a maximizar a visibilidade do seu contedo, bem como a controlar a forma como as suas pginas da Web so indexadas. Mas h sempre mais que podemos fazer e por isso esperamos que este folheto o incentive a partilhar connosco os seus comentrios e as informarnos sobre o que podemos fazer para tornar a Web um lugar ainda melhor para utilizadores e editores. - A equipa de webmasters do Google
Antes da pesquisa
Rastrear a web Calcular o PageRank
Durante a pesquisa
Submeter termo de pesquisa Vericar ndice
Apresentar resultados
3 Resultados de posicionamento
Seleccionar documentos
O proprietrio do Web site especicou que nenhuma das pginas no directrio de logs deve ser exibida nos resultados de pesquisa do Google. Todos os principais mecanismos de pesquisa iro vericar e seguir as instrues inseridas no robots.txt; alm disso, se desejar, poder especicar diferentes regras para diferentes mecanismos de pesquisa. Meta tags: controlo mais especco Alm do arquivo robots.txt que permite que especique instrues precisas para um grande nmero de arquivos no seu Web site poder utilizar a meta tag de rob para ter um controlo mais especco sobre cada uma das pginas do seu Web site. Para implementar, basta adicionar meta tags especcas a uma pgina HTML, a m de controlar a forma como essa pgina dever ser indexada. Juntos, o robots.txt e as meta tags, proporcionam exibilidade para expressar de maneira relativamente fcil as polticas de acesso complexas. Tenho um artigo especco de notcias no meu Web site que est acessvel apenas para utilizadores registrados. Como impeo que ele seja includo nos resultados de pesquisa do Google? Para fazer isto, basta adicionar a meta tag NOINDEX primeira <head> seco do artigo. Dever ter o seguinte formato:
<html> <head> <meta [...] name=googlebot content=noindex>
Isto ir impedir que o Google indexe o respectivo arquivo. No entanto, note que nalguns casos, poder querer que o Google indexe este tipo de pginas por exemplo, um artigo de notcias em arquivo que os utilizadores pagam para a leitura on-line. Embora este tipo de contedo premium no seja exibido nos resultados de pesquisa do Google, determinados servios do Google, como a Pesquisa no arquivo do Google Notcias, incluiro o artigo nos seus ndices, com as informaes de pagamento claramente visveis para os utilizadores.
Em alternativa, se o seu Sistema de gesto de contedo (CMS, Content Management System) armazenar imagens num directrio separado, poder excluir o directrio completo. Se as suas imagens estiverem num directrio intitulado /imagens, poder excluir esse directrio de todos os mecanismos de pesquisa utilizando:
User-agent: Disallow: * /images/
Outra opo seria adicionar uma tag NOINDEX a cada arquivo que incluir uma imagem. Todas estas abordagens iro impedir que as suas imagens sejam indexadas; a nica questo o quo ampla gostaria que fosse esta excluso de imagens.
Snippet um excerto de texto da pgina da Web Link em cache este link direcciona os utilizadores para uma cpia da pgina armazenada nos servidores do Google Porqu ter um snippet? mais provvel que os utilizadores acedam um Web site se os resultados de pesquisa mostrarem um snippet desse Web site. Isto acontece pelo facto de os snippets facilitarem a identicao da relevncia do resultado da sua pesquisa por parte dos utilizadores. Se um utilizador no puder ter esta percepo rapidamente,haver uma maior probabilidade de passar para o resultado de pesquisa seguinte. Porqu ter um link em cache? O link em cache til em vrios casos como, por exemplo: quando os Web sites cam temporariamente indisponveis, quando os Web sites de notcias cam sobrecarregados devido a um evento importante; ou quando os Web sites so acidentalmente excludos. Outra vantagem que a cpia em cache do Google destaca as palavras utilizadas pelo utilizador na sua pesquisa, permitindo uma rpida avaliao da relevncia da pgina. A maioria dos editores da Web prefere que o Google exiba o snippet e o link em cache. No entanto, h alguns casos em que um proprietrio do Web site pode desejar desabilitar uma ou ambas as opes: O contedo do meu jornal alterado vrias vezes ao dia. Parece que o Googlebot no est a indexar este contedo to rapidamente quanto ns o actualizamos, e o link em cache est a apontar para uma pgina que no a mais recente. Como posso impedir que o Google crie um link em cache? O proprietrio do Web site de notcias poder impedir que este link em cache seja exibido nos resultados de pesquisa adicionando a tag NOARCHIVE sua pgina:
<META NAME=GOOGLEBOT CONTENT=NOARCHIVE>
Tambm poder indicar ao Google que no dever exibir um snippet para uma pgina utilizando a tag NOSNIPPET:
<META NAME=GOOGLEBOT CONTENT=NOSNIPPET>
Observao: Adicionar a tag NOSNIPPET tambm tem o efeito de impedir que um link em cache seja exibido, pelo que, se especicar NOSNIPPET, obter automaticamente tambm a tag NOARCHIVE. 10
11
Veja uma exemplo do que pode encontrar no Centro para webmasters. Diagnosticar potenciais problemas no acesso a pginas e fornecimento de solues Solicitar a excluso de pginas especcas do nosso ndice Garantir que o arquivo robots.txt esteja a permitir e bloquear as pginas que pretende. Consultar as estatsticas de termos de pesquisa e de pginas relacionadas com o seu Web site: Estatsticas de termos de pesquisa: verique quais os termos de pesquisa que direccionam mais visitantes para o seu Web site, e quais os tpicos que poderiam ser ampliados no seu Web site para conseguir mais trfego. Anlise da pgina: veja a sua pgina da Web como o Google a v. Veja as palavras mais comuns no seu Web site, os links incorporados no Web site e como os outros descrevem o seu Web site quando o visitam. Taxa de rastreio : veja com que frequncia o seu Web site est a ser rastreado pelo Googlebot e d indicaes ao Google para rastrear com menor ou maior rapidez.
13
Sitemaps
O Centro para webmasters tambm disponibiliza o Sitemaps aos editores para resultados de pesquisa na Web, por telemovel e de notcias. O Sitemaps um protocolo compatvel com outros mecanismos de pesquisa, a m de ajudar os webmasters a fornecer mais informaes sobre as suas pginas. O Sitemaps complementa os mecanismos padro de rastreio na Web; os webmasters podem utiliz-lo para dar informaes ao Google sobre as pginas de seu Web site, a m de melhorar o rastreio e a visibilidade das suas pginas nos resultados de pesquisa do Google. Alm do Sitemaps para pesquisa na Web, tambm oferecemos o Google Mobile Sitemaps, permitindo aos editores enviar URLs com contedo para dispositivos mveis para o nosso ndice para telemoveis. Alm disso, para estes editores cujos Web sites de notcias estejam includos no Google Notcias, o Sitemaps do Google Notcias pode ajudar a fornecer estatsticas sobre os artigos do editor, desde as consultas frequncia de visualizao. Se utilizado com as ferramentas de diagnstico do Centro para webmasters, o Sitemaps do Google Notcias tambm poder disponibilizar relatrios de erros que ajudam a explicar quaisquer problemas que o Google possa ter ao rastrear ou extrair artigos de notcias do Web site de um editor. Alm disso, um editor pode enviar um Sitemap do Google Notcias contendo URLs que gostaria que fossem considerados para incluso no Google Notcias. Os Sitemaps do Google Notcias, ao contrrio dos Sitemaps da Web e mvel, esto actualmente disponveis apenas em ingls, embora esperemos disponibiliz-los em breve noutros idiomas.
14
Perguntas frequentes
Por que motivo no possvel ter um apoio individualizado para o meu Web site? De acordo com algumas estimativas, existem aproximadamente 100 milhes de Web sites na Web. Cada um destes Web sites importante para ns, pois sem eles, no importa se pequenos ou grandes, o nosso ndice seria menos abrangente e, por m, menos til para os nossos utilizadores. O Centro para webmasters uma excelente fonte de apoio para todos os tipos de Web sites. Publicamos e respondemos s dvidas dos editores, de forma a que todos possam beneciar das informaes. No Centro para webmasters, tambm poder encontrar uma comunidade amigvel e til de webmasters com quem pode partilhar sugestes e obter ajuda para a soluo de diversos problemas. Os anncios exibidos inuenciam o posicionamento dos resultados? As listagens de anncios so totalmente separadas dos resultados de pesquisa? Os posicionamentos dos anncios e dos resultados de pesquisa no esto minimamente relacionados; Na realidade, temos equipas totalmente separadas que trabalham em cada um dos servios, de forma a que no haja qualquer interferncia. Acreditamos que a objectividade dos nossos resultados de pesquisa crucial para fornecer a melhor experincia para os nossos utilizadores. Como adiciono um Web site ao ndice de pesquisa do Google? A incluso nos resultados de pesquisa do Google gratuita e fcil; alm disso, no requer um envio manual do Web site para o Google. O Google um mecanismo de pesquisa totalmente automatizado; ele rastreia a Web regularmente e detecta Web sites para adicionar ao nosso ndice. Assim, a grande maioria dos Web sites relacionados nos nossos resultados de pesquisa no so enviados manualmente para incluso, mas localizados e adicionados automaticamente quando os nossos robs rastreiam a Web. Alm disso, as Ferramentas para webmasters do Google (no Centro para webmasters) fornecem um mtodo fcil para que os webmasters enviem um sitemap dos seus URLs ao ndice do Google e obtenham relatrios detalhados sobre a visibilidade das suas pginas no Google. Com as Ferramentas para webmasters do Google, os proprietrios de Web sites podem manter o Google automaticamente informado sobre todas as pginas actuais e sobre quaisquer actualizaes feitas nas mesmas. Quanto tempo demora, em mdia, a que o Google detecte um Web site recm-criado, e com que frequncia o Google rastreia a Web em geral? No existe um perodo de tempo denido para que o Google detecte um novo Web site. O Googlebot rastreia regularmente a Web para recriar o nosso ndice. Ao utilizar o Centro para webmasters, um webmaster pode ver com que frequncia o seu Web site est a ser rastreado pelo Googlebot e inform-lo se deve rastrear de forma mais rpida ou mais lenta.
15
E se eu quiser que o meu Web site seja exibido nos resultados de pesquisa da Web, mas no em servios separados, como o Google Notcias ou no Google Pesquisa de Imagens? O Google permite que os editores da Web escolham participar ou no dos servios; alm disso, um editor pode entrar em contacto com a equipa de apoio de um produto especco e fazer esta solicitao. Como abordado anteriormente neste folheto, o Protocolo de excluso de robs pode ser utilizado para bloquear a indexao das pginas de imagens e da Web. O recurso de remoo de URL no Centro para webmasters tambm pode ser utilizado com este objectivo e abrange a pesquisa na Web e por imagens Alm disso, como o Googlebot conta com vrios robs diferentes, poder segmentar o que deseja bloquear: Googlebot: rastreia pginas do nosso ndice da Web e de nosso ndice de notcias Googlebot-Mobile: rastreia pginas do nosso ndice para telemvel Googlebot-Image: rastreia pginas do nosso ndice de imagens Mediapartners-Google: rastreia as pginas para denir o contedo do AdSense. Utilizamos este rob apenas para rastrear o seu Web site se exibir anncios do AdSense no seu Web site. rastreia pginas para avaliar a qualidade da pgina de destino do AdWords. Utilizamos este rob apenas se utilizar o Google AdWords para anunciar o seu Web site. Por exemplo, para bloquear totalmente o Googlebot, poder usar a seguinte sintaxe:
User-agent: Disallow: / Googlebot
Posso escolher que texto desejo que seja especicado como um snippet? No. No uma boa ideia, tanto para o utilizador como para o prprio criador do contedo. Escolhemos um snippet de texto a partir do Web site que mostra o termo de pesquisa do utilizador no contexto, o que por sua vez demonstra a relevncia do resultado. Os estudos mostram que mais provvel que os utilizadores acedam a um Web site se os resultados de pesquisa mostrarem o snippet. Isto acontece pelo facto de os snippets facilitarem muito a identicao por parte dos utilizadores da relevncia do resultado para a sua pesquisa. Se um utilizador no puder denir isto rapidamente, a probabilidade de passar para o resultado de pesquisa seguinte maior. Os editores da Web podem incluir uma meta tag nas suas pginas, a m de fornecer ao Google informaes adicionais nos casos em que no puderem gerar algoritmicamente um snippet til a partir do contedo na pgina. Para fazer isso, basta adicionar o seguinte seco <head> da pgina:
16
<meta name=description content=Por que Ana no gosta de coelhos? Estamos prestes a descobrir.>
Qualquer editor da Web que no quiser que um snippet das suas pginas seja criado ,pode utilizar a tag NOSNIPPET, com descrito a seguinte:
<meta name=robots content=nosnippet>
Finalmente, s vezes, utilizamos uma descrio do Web site a partir do Open Directory Project do snippet do resultado de pesquisa. Se no desejar que esta descrio seja utilizada, basta adicionar a seguinte meta tag:
<meta name=robots content=noodp>
Os artigos com notcias mais recentes no meu Web site so exibidos apenas durante algumas horas antes de serem actualizados e movidos para uma seco de artigos padro. Quero que o artigo completo aparea no ndice do Google, no as ltimas notcias. Uma opo colocar todos os artigos com as ltimas notcias num directrio e utilizar o robots.txt para no permitir que o Googlebot aceda a esse diretrio. Outra opo adicionar a tag NOFOLLOW seco <HEAD> do html da sua seco de ltimas notcias. Isto ir dar indicao ao Googlebot de que no dever seguir quaisquer links que detecte nessa pgina. Note, porm, que a tag NOFOLLOW impede apenas que o Googlebot siga os links de uma pgina para outra. Se outra pgina da Web estiver associada a esse artigo, o Google ir detectar o artigo quando a indexar. Se eu tiver vrios nomes de domnio e divulgar o mesmo contedo nesses diferentes domnios serei excludo dos resultados de pesquisa? Embora alguns editores possam tentar enganar os mecanismos de pesquisa ao duplicar o contedo e divulgar Web sites espelhados, tambm h um contedo legtimo que pode ser duplicado por bons motivos. O Google no quer penalizar estes sites. Por exemplo, no tratamos contedo semelhante expresso em diferentes idiomas (digamos, ingls num Web site e francs noutro) como contedo duplicado. Ter o mesmo contedo em diversos Web sites (p. ex., distribuio de artigos) no resulta necessariamente na remoo total de um ou mais Web sites dos resultados de pesquisa. No entanto, lembre-se de que provvel que cada ocorrncia do artigo aparea mais abaixo no posicionamento, dado que tem apenas uma parte dos links provenientes do que teria uma nica cpia. Em geral, uma nica cpia de um artigo ter um posicionamento mais elevado e, portanto, poder ser visto por mais utilizadores do que vrias cpias do mesmo contedo. Alm disso, para garantir a qualidade da pesquisa, o Google no inclui vrias cpias de uma pgina nos resultados de pesquisa. Em vez disso, habitual escolher uma verso da pgina a ser visualizada. No entanto, os webmasters podem indicar ao Google a sua verso preferida utilizando o robots.txt ou uma meta tag para bloquear quaisquer cpias que eles no queiram mostrar nos resultados de pesquisa.
17
Porque que o meu Web site est a ser bloqueado do ndice do Google? Antes de mais, possvel que o seu Web site no tenha sido bloqueado. H vrios motivos pelos quais um Web site pode no aparecer nos resultados de pesquisa (consulte as pginas 5 a 11). Se o seu Web site no tiver obstculos para a descoberta ou indexao, pode ter sido bloqueado. Os Web sites podem ser bloqueados do ndice por no atenderem aos padres de qualidade descritos nas diretrizes para webmasters (disponveis no Centro para webmasters). Isto ocorre com maior frequncia quando um Web site est a utilizar mtodos desonestos para tentar aparecer em posies superiores na pesquisa. As violaes comuns das directrizes incluem camuagem (texto escrito de tal forma que possa ser visto pelos mecanismos de pesquisa mas no pelos utilizador) ou congurao de pginas/links com o nico objectivo de enganar os mecanismos de pesquisa e manipular os resultados desses mecanismos. Quando os webmasters suspeitarem que estes Web sites violam as directrizes de qualidade, podero modicar os Web sites para que respeitem estas directrizes e, em seguida, clicar no link solicitar reincluso no interface de Ferramentas para webmasters para solicitar a reavaliao do Web site.
18
Glossrio
A indexar
O processo de adicionar o contedo do seu Web site a um mecanismo de pesquisa.
Camuagem
Mostrar aos mecanismos de pesquisa contedo diferente do que mostra aos utilizadores.
Contedo dinmico
Contedo, como imagens, animaes ou vdeos, que conta com o Flash, JavaScript, frames ou URLs criados dinamicamente.
Directrio raiz
O principal directrio ou directrio superior num sistema de arquivos de computador.
Extenso de arquivo
Nome de um arquivo de computador (.doc, .txt, .pdf, etc.) frequentemente utilizado para indicar o tipo de dados armazenados.
Link em cache
Um instantneo de como uma pgina foi exibida aquando a ltima vez que o Google a acedeu. Uma cpia em cache permite que os utilizadores visualizem uma pgina quando a verso dinmica no estiver disponvel, embora o contedo possa ser ligeiramente diferente. Para visualizar uma cpia em cache, clique no link em cache que aparece abaixo de um resultado de pesquisa.
Meta tags
Uma tag no HTML que descreve o contedo de uma pgina da Web. As meta tags podem ser utilizadas para controlar a indexao de pginas individuais num Web site.
Page Rank
Um recurso do Google que ajuda a denir o posicionamento de um Web site nos nossos resultados de pesquisa. O PageRank conta com a natureza exclusivamente democrtica da Web ao utilizar a sua vasta estrutura de links como um indicador do valor de uma pgina individual. Ainda mais importante que os Web sites de alta qualidade recebem um PageRank superior, que tido em conta sempre que o Google realiza uma pesquisa. O Google combina o PageRank com tcnicas sosticadas de correspondncia de texto, a m de encontrar pginas que sejam importantes e relevantes para as pesquisas.
19
Palavra-chave
Um termo que inserido na caixa de pesquisa de um mecanismo de pesquisa. O mecanismo de pesquisa ento pesquisa pginas que incluam a palavra-chave ou frase.
Rastreador
Software utilizado para detectar e indexar URLs na Web ou numa intranet.
Rastreio
Processo utilizado pelos mecanismos de pesquisa para aceder a pginas da Web.
Robots.txt
Um arquivo de texto que permite que um editor da Web controle o acesso ao seu Web site em vrios nveis, desde o Web site completo a directrios individuais, pginas de um tipo especco ou at mesmo pginas individuais. Este arquivo mostra aos rastreadores quais os directrios que eles podem ou no rastrear.
Site espelhado
Uma pgina da Web duplicada; s vezes, utilizada para enganar os mecanismos de pesquisa e tentar optimizar a indexao e a classicao na Web de um Web site.
20
www.google.com/webmasters
Copyright 2008.A Google e o Google Maps so marcas registadas da Google Inc. Todos os outros nomes de empresas e produtos podem ser marcas registadas das respectivas empresas s quais esto associados.