Você está na página 1de 24

Tire o mximo partido do seu contedo

Um manual para editores da Web

Contedo

Introduo Uma breve introduo pesquisa na Web Novidades na pesquisa na Web do Google? O Google vai encontrar o seu Web site? O Google vai indexar o seu Web site?
Controlar o que o Google indexa Robots.txt versus meta tags Controlar o armazenamento em cache e snippets

2 3 4 5 6
7 9 10

O seu Web site apresenta contedo exclusivo e til? Aumentar a visibilidade: prticas recomendadas Centro para webmasters
Sitemaps

11 12 13
14

Perguntas frequentes Glossrio

15 19

Introduo
Se procura visibilidade, a Internet o lugar ideal. Pergunte a qualquer anunciante que tenha aumentado as vendas utilizando anncios on-line, a um blogger cuja popularidade o tenha levado publicao de um livro ou a um jornal que tenha ampliado o seu pblico ao nvel internacional graas ao aumento de trfego. Recebemos frequentemente perguntas sobre como funciona a pesquisa na Web e como os editores da Web podem maximizar a sua visibilidade na Internet. Preparmos este folheto para o ajudar a compreender como um mecanismo de pesquisa percepciona o seu contedo, e como pode anar a sua presena na Web, disponibilizando o que pretende que seja visualizado e ocultando o que deseja manter oculto. Desde sugestes de webmasters e ferramentas on-line a um manual passoa-passo com perguntas frequentes, este folheto foi desenvolvido tanto para pequenos editores da Web como para proprietrios de grandes Web sites. Assim como a prpria Internet evoluiu drasticamente na ltima dcada, a abordagem do prprio Google em relao pesquisa na Web e o seu relacionamento com os proprietrios de Web sites tambm evoluram. Crimos diversas ferramentas para ajudar os webmasters a maximizar a visibilidade do seu contedo, bem como a controlar a forma como as suas pginas da Web so indexadas. Mas h sempre mais que podemos fazer e por isso esperamos que este folheto o incentive a partilhar connosco os seus comentrios e as informarnos sobre o que podemos fazer para tornar a Web um lugar ainda melhor para utilizadores e editores. - A equipa de webmasters do Google

Uma breve introduo pesquisa na Web: como funciona


De forma simples, pode imaginar a Web como um enorme livro, com um ndice de grandes dimenses que indica exactamente onde que tudo est localizado. O Google tem um grupo de computadores o Googlebot que esto continuamente a rastrear (a navegar ) bilhes de pginas na Web. Este processo de rastreio algortmico: os programas de computador determinam quais os Web sites que devem ser rastreados, com que frequncia e quantas pginas de cada Web site devem ser analisadas. No aceitamos pagamento para rastrear um Web site com maior frequncia; alm disso, mantemos a parte de pesquisa perfeitamente independente do nosso servio de publicidade Google AdWords. O processo de rastreio do Google inicia com uma lista de URLs de pginas da Web. medida que o Googlebot navega nestes Web sites, ele detecta os links de cada pgina e adiciona-os sua lista de pginas a serem rastreadas. O Googlebot faz uma cpia de cada uma das pginas que rastreia, a m de compilar um ndice de grande proporo de todas as palavras que visualiza. Esta lista tambm indica o local onde cada palavra surge em cada pgina. Quando um utilizador insere um termo de pesquisa, as nossas mquinas pesquisam no ndice pginas relacionadas com o mesmo e apresentam ao utilizador os resultados mais relevantes. A relevncia denida por mais de 200 factores, sendo um deles o PageRank da pgina. O PageRank uma medida de importncia de uma pgina com base nos links provenientes de outras pginas. Em resumo, cada pgina que possua um link para uma pgina XYZ aumenta o PageRank dessa pgina XYZ.

Antes da pesquisa
Rastrear a web Calcular o PageRank

Durante a pesquisa
Submeter termo de pesquisa Vericar ndice

Apresentar resultados

3 Resultados de posicionamento

Seleccionar documentos

O que h de novo na pesquisa na Web do Google?


Embora os princpios bsicos da pesquisa na Web tenham permanecido constantes, o Google est continuamente a trabalhar no sentido de melhorar os resultados de pesquisa. Por exemplo, o que que h de diferente na pesquisa na Web, desde os ltimos cinco anos? Bem, para comear, est muito mais rpida. Alm disso, em comparao a cincos anos atrs, os nossos sistemas de rastreio e indexao esto muito mais inteligentes. Por exemplo, agora navegamos continuamente na Web e programamos visitas a cada pgina de forma mais inteligente a m de manter o contedo sempre actualizado. Esta abordagem mais eciente considera o facto do Web site de um jornal on-line, por exemplo, precisar de ser rastreado com maior frequncia do que um Web site esttico que seja actualizado uma vez por ms . Para mais, permitimos ainda que os webmasters controlem com que frequncia os seus Web sites so rastreados utilizando as nossas ferramentas para webmasters. De um modo geral, isto resulta num ndice mais actualizado e abrangente. Ainda que actualmente a pesquisa na Web esteja mais rpida e mais eciente do que nunca, os principais factores para determinar a visibilidade de um Web site nos resultados de pesquisa do Google tm sido uma prioridade desde o dia em que o nosso mecanismo de pesquisa foi inaugurado: O Google vai encontrar o Web site? (pgina 5) O Google vai indexar o Web site? (pgina 6) O Web site apresenta contedo exclusivo e til? (pgina 11)

O Google vai encontrar o Web seu site?


A incluso nos resultados de pesquisa do Google gratuita e simples; nem sequer necessrio enviar o seu Web site para o Google. Na verdade, a grande maioria dos Web sites relacionados nos nossos resultados de pesquisa no so enviados manualmente para incluso, mas localizados e adicionados automaticamente quando o Googlebot rastreia a Web. Embora o Google rastreie bilhes de pginas, inevitvel que alguns Web sites no sejam visualizados. Quando isto acontece, geralmente devido a um dos seguintes motivos: o Web site no est associado atravs de links includos noutros Web sites na Web; o Web site foi iniciado depois da concluso do mais recente rastreio do Google; o Web site estava temporariamente indisponvel ou recebemos uma mensagem de erro quando o tentamos rastrear. Com as ferramentas para webmasters do Google, como o Sitemaps, poder vericar se o Web site est includo no ndice do Google ou se recebemos erros quando o tentamos rastrear (consulte a pgina 14). Tambm poder utilizar estas ferramentas para adicionar o seu URL manualmente ao ndice do Google, ou fornecer ao Google um Sitemap com mais informaes sobre o seu contedo. Isso ir ajudar a encontrar novas seces e contedos do seu Web site.

O Google vai indexar o seu Web site?


Por vezes, os webmasters descobrem que os seus Web sites no esto a aparecer nos resultados de pesquisa. O problema poder estar relacionado com a capacidade de indexao, ou seja, a capacidade de o Google fazer ou no uma cpia de uma pgina da Web para incluso nos nossos resultados de pesquisa. Estrutura e contedo Uma razo para a no incluso nos resultados de pesquisa est relacionada com a estrutura e o contedo da pgina. Por exemplo, uma pgina que requer que o utilizador preencha um formulrio pode no ser indexada pelo Google. Da mesma forma, uma pgina utilizando contedo dinmico (Flash, JavaScript, frames ou URLs criados dinamicamente) pode no ser indexada facilmente pelos mecanismos de pesquisa. Se quiser conrmar que este o problema do seu Web site, tente visualiz-lo num navegador de texto, como o Lynx, ou num navegador com imagens, Javascript e Flash desactivados, o que indicar se todo o seu contedo est acessvel ou no. Se o seu Web site utilizar muitas imagens, certique-se de que inclui uma descrio do contedo de cada imagem no texto. Isto permite que os mecanismos de pesquisa indexem a imagem correctamente e disponibiliza a imagem para acesso por parte dos utilizadores com problemas na visualizao. Tambm poder utilizar o texto alternativo da imagem e nomes de arquivos descritivos, como mostrado neste exemplo (que uma imagem de um logotipo de uma empresa intitulada Buffys House of Pies - algo como Casa de tortas do Buffy): <img src=buffyshouseofpies.jpg alt=Bem-vindo a Buffys House of Pies!> URLs Um outro obstculo poderia ser o prprio URL. Se houver IDs de sesso ou vrios parmetros no URL ou se o URL efectuar vrios redireccionamentos, possvel que o Google no consiga indexar a pgina. Servidor e rede Problemas com o servidor ou com a rede podem impedir o acesso a determinadas pginas do seu Web site. Ao utilizar as ferramentas disponveis no Centro para webmasters do Google, os editores podem ver a lista das pginas que no puderam ser acedidas pelo Googlebot. Para saber mais sobre o Centro para webmasters, consulte a pgina 13. Protocolo de excluso de robs Por vezes, as pginas so bloqueadas pelo Protocolo de excluso de robs, um padro tcnico que permite que os editores da Web dem indicao aos mecanismos de pesquisa para no indexar o contedo do Web site (consulte a pgina 7). Se o seu Web site no estiver a ser exibido nos resultados de pesquisa do Google, verique se o robots.txt ou uma meta tag no esto a bloquear o acesso aos nossos rastreadores.

Controlar o que o Google indexa


Cada editor da Web tem um objectivo diferente em relao ao que est a tentar alcanar na Internet. Editores de alguns jornais, por exemplo, optaram por disponibilizar o acesso gratuito aos seus artigos mais recentes, oferecendo um servio premium pago para acesso aos arquivos anteriores. Alguns querem visibilidade em todas as propriedades de um mecanismo de pesquisa (como o Google Mobile, o Google Imagens, etc.), enquanto outros preferem aparecer apenas nos resultados de pesquisa na Web. Os mecanismos de pesquisa respeitam os desejos dos editores anal de contas, o contedo deles. No entanto, no podemos adivinhar estes desejos, de forma que essencial que os webmasters nos informem como desejam que o seu contedo seja indexado. Isto pode ser feito atravs do Protocolo de excluso de robs, uma especicao tcnica bem denida que informa aos mecanismos de pesquisa qual o Web site ou partes do mesmo que no devem ser pesquisveis, bem como quais partes que devem permanecer visveis nos resultados de pesquisa. Robots.txt: controlo alargado dentro de cada Web site A base do Protocolo de excluso de robs um arquivo de texto simples intitulado robots.txt, o qual tem sido o padro do sector h muitos anos. Com o robots.txt, poder controlar o acesso a vrios nveis, desde um Web site inteiro a directrios individuais, pginas de um tipo especco ou at mesmo pginas individuais. H algumas pginas no meu Web site que eu no quero que estejam no ndice do Google. Como fao para que elas no apaream nos resultados de pesquisa do Google? Normalmente, a maioria dos proprietrios quer que o Googlebot aceda aos seus Web sites para que as suas pginas da Web sejam encontradas pelos utilizadores que pesquisam no Google. No entanto, talvez no queira indexar determinadas pginas: por exemplo, logs internos ou artigos de notcias que estejam associadas a um acesso pago. Poder excluir pginas do ndice do Google ao criar um arquivo robots.txt e posicion-lo no directrio raiz no seu servidor da Web. O arquivo robots.txt relaciona as pginas que os mecanismos de pesquisa no devem indexar. A criao de um arquivo robots.txt simples e proporciona aos editores um nvel sosticado de controlo em relao forma pela qual os mecanismos de pesquisa iro aceder aos seus Web sites. Por exemplo, se um webmaster quiser impedir a indexao dos seus logs internos, o arquivo robots.txt deve conter:
User-Agent:Googlebot a linha User-Agent especica que a prxima seco

um conjunto de instrues especcas para o Googlebot.


Disallow: /logs/ a linha Disallow instrui o Googlebot a no aceder a

arquivos no subdirectrio logs do seu Web site.

O proprietrio do Web site especicou que nenhuma das pginas no directrio de logs deve ser exibida nos resultados de pesquisa do Google. Todos os principais mecanismos de pesquisa iro vericar e seguir as instrues inseridas no robots.txt; alm disso, se desejar, poder especicar diferentes regras para diferentes mecanismos de pesquisa. Meta tags: controlo mais especco Alm do arquivo robots.txt que permite que especique instrues precisas para um grande nmero de arquivos no seu Web site poder utilizar a meta tag de rob para ter um controlo mais especco sobre cada uma das pginas do seu Web site. Para implementar, basta adicionar meta tags especcas a uma pgina HTML, a m de controlar a forma como essa pgina dever ser indexada. Juntos, o robots.txt e as meta tags, proporcionam exibilidade para expressar de maneira relativamente fcil as polticas de acesso complexas. Tenho um artigo especco de notcias no meu Web site que est acessvel apenas para utilizadores registrados. Como impeo que ele seja includo nos resultados de pesquisa do Google? Para fazer isto, basta adicionar a meta tag NOINDEX primeira <head> seco do artigo. Dever ter o seguinte formato:
<html> <head> <meta [...] name=googlebot content=noindex>

Isto ir impedir que o Google indexe o respectivo arquivo. No entanto, note que nalguns casos, poder querer que o Google indexe este tipo de pginas por exemplo, um artigo de notcias em arquivo que os utilizadores pagam para a leitura on-line. Embora este tipo de contedo premium no seja exibido nos resultados de pesquisa do Google, determinados servios do Google, como a Pesquisa no arquivo do Google Notcias, incluiro o artigo nos seus ndices, com as informaes de pagamento claramente visveis para os utilizadores.

Robots.txt versus meta tags


Em geral, o robots.txt um bom modo de obter o controlo sobre todo o Web site e que as meta tags de fornecer o controlo mais especco sobre arquivos individuais. As meta tags so especialmente teis se tiver permisso para editar arquivos individuais mas no todo o Web site. As meta tags tambm permitem que especique polticas complexas de controlo de acesso em cada uma das pginas. s vezes, qualquer uma das duas ferramentas pode resolver o mesmo problema. Como posso ter certeza de que o texto de uma pgina ser indexado, mas no as imagens? Uma opo seria bloquear o acesso s imagens por extenso de arquivo em todo o seu Web site utilizando o robots.txt. As seguintes linhas num arquivo robots.txt indicam ao Google que no dever indexar quaisquer arquivos com a extenso *.jpg ou *.jpeg:
User-agent: Disallow: Disallow: Googlebot /*.jpg$ /*.jpeg$

Em alternativa, se o seu Sistema de gesto de contedo (CMS, Content Management System) armazenar imagens num directrio separado, poder excluir o directrio completo. Se as suas imagens estiverem num directrio intitulado /imagens, poder excluir esse directrio de todos os mecanismos de pesquisa utilizando:
User-agent: Disallow: * /images/

Outra opo seria adicionar uma tag NOINDEX a cada arquivo que incluir uma imagem. Todas estas abordagens iro impedir que as suas imagens sejam indexadas; a nica questo o quo ampla gostaria que fosse esta excluso de imagens.

Controlar o armazenamento em cache e snippets


Os resultados de pesquisa geralmente mostram um link de pgina em cache e um snippet. Veja a seguir, por exemplo, um dos primeiros resultados visualizados quando pesquisamos por arara:

Snippet um excerto de texto da pgina da Web Link em cache este link direcciona os utilizadores para uma cpia da pgina armazenada nos servidores do Google Porqu ter um snippet? mais provvel que os utilizadores acedam um Web site se os resultados de pesquisa mostrarem um snippet desse Web site. Isto acontece pelo facto de os snippets facilitarem a identicao da relevncia do resultado da sua pesquisa por parte dos utilizadores. Se um utilizador no puder ter esta percepo rapidamente,haver uma maior probabilidade de passar para o resultado de pesquisa seguinte. Porqu ter um link em cache? O link em cache til em vrios casos como, por exemplo: quando os Web sites cam temporariamente indisponveis, quando os Web sites de notcias cam sobrecarregados devido a um evento importante; ou quando os Web sites so acidentalmente excludos. Outra vantagem que a cpia em cache do Google destaca as palavras utilizadas pelo utilizador na sua pesquisa, permitindo uma rpida avaliao da relevncia da pgina. A maioria dos editores da Web prefere que o Google exiba o snippet e o link em cache. No entanto, h alguns casos em que um proprietrio do Web site pode desejar desabilitar uma ou ambas as opes: O contedo do meu jornal alterado vrias vezes ao dia. Parece que o Googlebot no est a indexar este contedo to rapidamente quanto ns o actualizamos, e o link em cache est a apontar para uma pgina que no a mais recente. Como posso impedir que o Google crie um link em cache? O proprietrio do Web site de notcias poder impedir que este link em cache seja exibido nos resultados de pesquisa adicionando a tag NOARCHIVE sua pgina:
<META NAME=GOOGLEBOT CONTENT=NOARCHIVE>

Tambm poder indicar ao Google que no dever exibir um snippet para uma pgina utilizando a tag NOSNIPPET:
<META NAME=GOOGLEBOT CONTENT=NOSNIPPET>

Observao: Adicionar a tag NOSNIPPET tambm tem o efeito de impedir que um link em cache seja exibido, pelo que, se especicar NOSNIPPET, obter automaticamente tambm a tag NOARCHIVE. 10

O seu Web site apresenta contedo exclusivo e til?


Assim que o Web site puder ser detectado e indexado, a pergunta nal se o contedo das pginas da Web exclusivo e til. Antes de mais, olhe para o seu texto como um todo. O seu ttulo e os links de texto so descritivos? O texto ui naturalmente, de forma clara e intuitiva? Da mesma forma que o captulo de um livro organizado por reas e temas especcos, cada pgina da Web deve estar centralizada numa rea ou num tpico especco. As palavras-chave e frases surgem naturalmente deste tipo de texto, e muito mais provvel que os utilizadores permaneam numa pgina da Web que disponibilize contedo e links relevantes. No entanto, certique-se de que as frases que utilizar incluem as frases que os visitantes provavelmente iro pesquisar. Por exemplo, se o seu Web site for direccionado para um clube de fs dos carros da MG, certique-se de que as palavras MG e carros aparecem de facto no texto, em vez de apenas em termos como automveis britnicos.

11

Aumentar a visibilidade: prticas recomendadas


Os proprietrios de Web sites perguntam-nos com frequncia quais as melhores formas de aumentar a visibilidade e o posicionamento dos seus Web sites nos nossos resultados de pesquisa. A nossa resposta simples: Pense como um utilizador, pois assim que tentamos pensar. O que que isto signica na prtica? Acima de tudo, certique-se de que fornece aos visitantes o contedo que eles esto procura, pois a relevncia que ir direccionar o trfego para o seu Web site e que o ir ajudar a mant-lo. Muitos proprietrios de Web sites concentram-se na forma como as suas pginas da Web iro ser posicionadas. Porm, a posio determinada por mais de 200 critrios alm do PageRank. muito melhor investir o seu tempo na qualidade do seu contedo e na respectiva acessibilidade do que tentar descobrir formas de inuenciar um algoritmo do mecanismo de pesquisa. Se um Web site no atender s nossas directrizes de qualidade, ele poder ser bloqueado do ndice. O que fazer: 1. Crie contedo relevante e atraente: os visitantes iro aceder s suas pginas atravs de vrios links; portanto, certique-se de que cada pgina chama a ateno. 2. Envolva os utilizadores: pode adicionar uma seco de comentrios ou um blog no seu Web site? A criao de uma comunidade ajuda a estimular a utilizao regular do seu Web site. Envolva os seus visitantes para acelerar a visibilidade e a lealdade dos utilizadores. 3. Acompanhe o seu Web site: utilize o Centro para webmasters (consulte a pgina 13) para ver quais os termos de pesquisa que esto a direccionar os visitantes para o seu Web site, ou para controlar as alteraes no posicionamento nos resultados de pesquisa em relao a alteraes efectuadas no Web site. 4. Tenha links de alta qualidade incorporados. 5. Fornea links de texto claros: posicione os links de texto adequadamente no seu Web site e certique-se de que eles incluem termos que descrevem o tpico. O que evitar: 1. No encha a sua pgina com listas de palavras-chave. 2. No tente camuar pginas com texto que possam ser visto pelos mecanismos de pesquisa mas no pelos utilizadores. 3. No insira pginas apenas para rastreio ao denir pginas ou links cujo nico objectivo seja enganar os mecanismos de pesquisa. 4. No utilize imagens para exibir nomes, contedo ou links importantes os mecanismos de pesquisa no lem imagens. 5. No crie vrias cpias de uma pgina em URLs diferentes com a inteno de enganar os mecanismos de pesquisa. Quando tiver dvidas, consulte as directrizes para os nossos webmasters, disponveis em: www.google.com/webmasters/guidelines.html 12

Centro para webmasters


Como uma empresa que pretende fornecer os resultados de pesquisa mais relevantes e teis na Web, empenhamo-nos em fornecer um apoio generalizado e justo para todos os webmasters e todos os Web sites, independentemente da sua dimenso. por isso que crimos o Centro para webmasters, localizado em google.pt/webmasters. O Centro para webmasters um excelente recurso para todos os editores da Web. Este responde a questes sobre rastreio, indexao e posicionamento; dispe de um canal para trocar comentrios e alertar para problemas; e oferece ferramentas de diagnstico que apoiam os webmasters na deteco de potenciais problemas de rastreio.

Veja uma exemplo do que pode encontrar no Centro para webmasters. Diagnosticar potenciais problemas no acesso a pginas e fornecimento de solues Solicitar a excluso de pginas especcas do nosso ndice Garantir que o arquivo robots.txt esteja a permitir e bloquear as pginas que pretende. Consultar as estatsticas de termos de pesquisa e de pginas relacionadas com o seu Web site: Estatsticas de termos de pesquisa: verique quais os termos de pesquisa que direccionam mais visitantes para o seu Web site, e quais os tpicos que poderiam ser ampliados no seu Web site para conseguir mais trfego. Anlise da pgina: veja a sua pgina da Web como o Google a v. Veja as palavras mais comuns no seu Web site, os links incorporados no Web site e como os outros descrevem o seu Web site quando o visitam. Taxa de rastreio : veja com que frequncia o seu Web site est a ser rastreado pelo Googlebot e d indicaes ao Google para rastrear com menor ou maior rapidez.

13

Sitemaps
O Centro para webmasters tambm disponibiliza o Sitemaps aos editores para resultados de pesquisa na Web, por telemovel e de notcias. O Sitemaps um protocolo compatvel com outros mecanismos de pesquisa, a m de ajudar os webmasters a fornecer mais informaes sobre as suas pginas. O Sitemaps complementa os mecanismos padro de rastreio na Web; os webmasters podem utiliz-lo para dar informaes ao Google sobre as pginas de seu Web site, a m de melhorar o rastreio e a visibilidade das suas pginas nos resultados de pesquisa do Google. Alm do Sitemaps para pesquisa na Web, tambm oferecemos o Google Mobile Sitemaps, permitindo aos editores enviar URLs com contedo para dispositivos mveis para o nosso ndice para telemoveis. Alm disso, para estes editores cujos Web sites de notcias estejam includos no Google Notcias, o Sitemaps do Google Notcias pode ajudar a fornecer estatsticas sobre os artigos do editor, desde as consultas frequncia de visualizao. Se utilizado com as ferramentas de diagnstico do Centro para webmasters, o Sitemaps do Google Notcias tambm poder disponibilizar relatrios de erros que ajudam a explicar quaisquer problemas que o Google possa ter ao rastrear ou extrair artigos de notcias do Web site de um editor. Alm disso, um editor pode enviar um Sitemap do Google Notcias contendo URLs que gostaria que fossem considerados para incluso no Google Notcias. Os Sitemaps do Google Notcias, ao contrrio dos Sitemaps da Web e mvel, esto actualmente disponveis apenas em ingls, embora esperemos disponibiliz-los em breve noutros idiomas.

14

Perguntas frequentes
Por que motivo no possvel ter um apoio individualizado para o meu Web site? De acordo com algumas estimativas, existem aproximadamente 100 milhes de Web sites na Web. Cada um destes Web sites importante para ns, pois sem eles, no importa se pequenos ou grandes, o nosso ndice seria menos abrangente e, por m, menos til para os nossos utilizadores. O Centro para webmasters uma excelente fonte de apoio para todos os tipos de Web sites. Publicamos e respondemos s dvidas dos editores, de forma a que todos possam beneciar das informaes. No Centro para webmasters, tambm poder encontrar uma comunidade amigvel e til de webmasters com quem pode partilhar sugestes e obter ajuda para a soluo de diversos problemas. Os anncios exibidos inuenciam o posicionamento dos resultados? As listagens de anncios so totalmente separadas dos resultados de pesquisa? Os posicionamentos dos anncios e dos resultados de pesquisa no esto minimamente relacionados; Na realidade, temos equipas totalmente separadas que trabalham em cada um dos servios, de forma a que no haja qualquer interferncia. Acreditamos que a objectividade dos nossos resultados de pesquisa crucial para fornecer a melhor experincia para os nossos utilizadores. Como adiciono um Web site ao ndice de pesquisa do Google? A incluso nos resultados de pesquisa do Google gratuita e fcil; alm disso, no requer um envio manual do Web site para o Google. O Google um mecanismo de pesquisa totalmente automatizado; ele rastreia a Web regularmente e detecta Web sites para adicionar ao nosso ndice. Assim, a grande maioria dos Web sites relacionados nos nossos resultados de pesquisa no so enviados manualmente para incluso, mas localizados e adicionados automaticamente quando os nossos robs rastreiam a Web. Alm disso, as Ferramentas para webmasters do Google (no Centro para webmasters) fornecem um mtodo fcil para que os webmasters enviem um sitemap dos seus URLs ao ndice do Google e obtenham relatrios detalhados sobre a visibilidade das suas pginas no Google. Com as Ferramentas para webmasters do Google, os proprietrios de Web sites podem manter o Google automaticamente informado sobre todas as pginas actuais e sobre quaisquer actualizaes feitas nas mesmas. Quanto tempo demora, em mdia, a que o Google detecte um Web site recm-criado, e com que frequncia o Google rastreia a Web em geral? No existe um perodo de tempo denido para que o Google detecte um novo Web site. O Googlebot rastreia regularmente a Web para recriar o nosso ndice. Ao utilizar o Centro para webmasters, um webmaster pode ver com que frequncia o seu Web site est a ser rastreado pelo Googlebot e inform-lo se deve rastrear de forma mais rpida ou mais lenta.

15

E se eu quiser que o meu Web site seja exibido nos resultados de pesquisa da Web, mas no em servios separados, como o Google Notcias ou no Google Pesquisa de Imagens? O Google permite que os editores da Web escolham participar ou no dos servios; alm disso, um editor pode entrar em contacto com a equipa de apoio de um produto especco e fazer esta solicitao. Como abordado anteriormente neste folheto, o Protocolo de excluso de robs pode ser utilizado para bloquear a indexao das pginas de imagens e da Web. O recurso de remoo de URL no Centro para webmasters tambm pode ser utilizado com este objectivo e abrange a pesquisa na Web e por imagens Alm disso, como o Googlebot conta com vrios robs diferentes, poder segmentar o que deseja bloquear: Googlebot: rastreia pginas do nosso ndice da Web e de nosso ndice de notcias Googlebot-Mobile: rastreia pginas do nosso ndice para telemvel Googlebot-Image: rastreia pginas do nosso ndice de imagens Mediapartners-Google: rastreia as pginas para denir o contedo do AdSense. Utilizamos este rob apenas para rastrear o seu Web site se exibir anncios do AdSense no seu Web site. rastreia pginas para avaliar a qualidade da pgina de destino do AdWords. Utilizamos este rob apenas se utilizar o Google AdWords para anunciar o seu Web site. Por exemplo, para bloquear totalmente o Googlebot, poder usar a seguinte sintaxe:
User-agent: Disallow: / Googlebot

Posso escolher que texto desejo que seja especicado como um snippet? No. No uma boa ideia, tanto para o utilizador como para o prprio criador do contedo. Escolhemos um snippet de texto a partir do Web site que mostra o termo de pesquisa do utilizador no contexto, o que por sua vez demonstra a relevncia do resultado. Os estudos mostram que mais provvel que os utilizadores acedam a um Web site se os resultados de pesquisa mostrarem o snippet. Isto acontece pelo facto de os snippets facilitarem muito a identicao por parte dos utilizadores da relevncia do resultado para a sua pesquisa. Se um utilizador no puder denir isto rapidamente, a probabilidade de passar para o resultado de pesquisa seguinte maior. Os editores da Web podem incluir uma meta tag nas suas pginas, a m de fornecer ao Google informaes adicionais nos casos em que no puderem gerar algoritmicamente um snippet til a partir do contedo na pgina. Para fazer isso, basta adicionar o seguinte seco <head> da pgina:

16

<meta name=description content=Por que Ana no gosta de coelhos? Estamos prestes a descobrir.>

Qualquer editor da Web que no quiser que um snippet das suas pginas seja criado ,pode utilizar a tag NOSNIPPET, com descrito a seguinte:
<meta name=robots content=nosnippet>

Finalmente, s vezes, utilizamos uma descrio do Web site a partir do Open Directory Project do snippet do resultado de pesquisa. Se no desejar que esta descrio seja utilizada, basta adicionar a seguinte meta tag:
<meta name=robots content=noodp>

Os artigos com notcias mais recentes no meu Web site so exibidos apenas durante algumas horas antes de serem actualizados e movidos para uma seco de artigos padro. Quero que o artigo completo aparea no ndice do Google, no as ltimas notcias. Uma opo colocar todos os artigos com as ltimas notcias num directrio e utilizar o robots.txt para no permitir que o Googlebot aceda a esse diretrio. Outra opo adicionar a tag NOFOLLOW seco <HEAD> do html da sua seco de ltimas notcias. Isto ir dar indicao ao Googlebot de que no dever seguir quaisquer links que detecte nessa pgina. Note, porm, que a tag NOFOLLOW impede apenas que o Googlebot siga os links de uma pgina para outra. Se outra pgina da Web estiver associada a esse artigo, o Google ir detectar o artigo quando a indexar. Se eu tiver vrios nomes de domnio e divulgar o mesmo contedo nesses diferentes domnios serei excludo dos resultados de pesquisa? Embora alguns editores possam tentar enganar os mecanismos de pesquisa ao duplicar o contedo e divulgar Web sites espelhados, tambm h um contedo legtimo que pode ser duplicado por bons motivos. O Google no quer penalizar estes sites. Por exemplo, no tratamos contedo semelhante expresso em diferentes idiomas (digamos, ingls num Web site e francs noutro) como contedo duplicado. Ter o mesmo contedo em diversos Web sites (p. ex., distribuio de artigos) no resulta necessariamente na remoo total de um ou mais Web sites dos resultados de pesquisa. No entanto, lembre-se de que provvel que cada ocorrncia do artigo aparea mais abaixo no posicionamento, dado que tem apenas uma parte dos links provenientes do que teria uma nica cpia. Em geral, uma nica cpia de um artigo ter um posicionamento mais elevado e, portanto, poder ser visto por mais utilizadores do que vrias cpias do mesmo contedo. Alm disso, para garantir a qualidade da pesquisa, o Google no inclui vrias cpias de uma pgina nos resultados de pesquisa. Em vez disso, habitual escolher uma verso da pgina a ser visualizada. No entanto, os webmasters podem indicar ao Google a sua verso preferida utilizando o robots.txt ou uma meta tag para bloquear quaisquer cpias que eles no queiram mostrar nos resultados de pesquisa.

17

Porque que o meu Web site est a ser bloqueado do ndice do Google? Antes de mais, possvel que o seu Web site no tenha sido bloqueado. H vrios motivos pelos quais um Web site pode no aparecer nos resultados de pesquisa (consulte as pginas 5 a 11). Se o seu Web site no tiver obstculos para a descoberta ou indexao, pode ter sido bloqueado. Os Web sites podem ser bloqueados do ndice por no atenderem aos padres de qualidade descritos nas diretrizes para webmasters (disponveis no Centro para webmasters). Isto ocorre com maior frequncia quando um Web site est a utilizar mtodos desonestos para tentar aparecer em posies superiores na pesquisa. As violaes comuns das directrizes incluem camuagem (texto escrito de tal forma que possa ser visto pelos mecanismos de pesquisa mas no pelos utilizador) ou congurao de pginas/links com o nico objectivo de enganar os mecanismos de pesquisa e manipular os resultados desses mecanismos. Quando os webmasters suspeitarem que estes Web sites violam as directrizes de qualidade, podero modicar os Web sites para que respeitem estas directrizes e, em seguida, clicar no link solicitar reincluso no interface de Ferramentas para webmasters para solicitar a reavaliao do Web site.

18

Glossrio
A indexar
O processo de adicionar o contedo do seu Web site a um mecanismo de pesquisa.

Camuagem
Mostrar aos mecanismos de pesquisa contedo diferente do que mostra aos utilizadores.

Contedo dinmico
Contedo, como imagens, animaes ou vdeos, que conta com o Flash, JavaScript, frames ou URLs criados dinamicamente.

Directrio raiz
O principal directrio ou directrio superior num sistema de arquivos de computador.

Extenso de arquivo
Nome de um arquivo de computador (.doc, .txt, .pdf, etc.) frequentemente utilizado para indicar o tipo de dados armazenados.

HTML (Hypertext Markup Language)


Linguagem de marcao utilizada na Web para estruturar o texto.

Link em cache
Um instantneo de como uma pgina foi exibida aquando a ltima vez que o Google a acedeu. Uma cpia em cache permite que os utilizadores visualizem uma pgina quando a verso dinmica no estiver disponvel, embora o contedo possa ser ligeiramente diferente. Para visualizar uma cpia em cache, clique no link em cache que aparece abaixo de um resultado de pesquisa.

Meta tags
Uma tag no HTML que descreve o contedo de uma pgina da Web. As meta tags podem ser utilizadas para controlar a indexao de pginas individuais num Web site.

Page Rank
Um recurso do Google que ajuda a denir o posicionamento de um Web site nos nossos resultados de pesquisa. O PageRank conta com a natureza exclusivamente democrtica da Web ao utilizar a sua vasta estrutura de links como um indicador do valor de uma pgina individual. Ainda mais importante que os Web sites de alta qualidade recebem um PageRank superior, que tido em conta sempre que o Google realiza uma pesquisa. O Google combina o PageRank com tcnicas sosticadas de correspondncia de texto, a m de encontrar pginas que sejam importantes e relevantes para as pesquisas.

19

Palavra-chave
Um termo que inserido na caixa de pesquisa de um mecanismo de pesquisa. O mecanismo de pesquisa ento pesquisa pginas que incluam a palavra-chave ou frase.

Protocolo de excluso de robs


Uma especicao tcnica que d indicao aos mecanismos de pesquisa de que Web site ou partes de um Web site no devem ser pesquisveis, e quais as partes que devem permanecer visveis nos resultados de pesquisa.

Rastreador
Software utilizado para detectar e indexar URLs na Web ou numa intranet.

Rastreio
Processo utilizado pelos mecanismos de pesquisa para aceder a pginas da Web.

Robots.txt
Um arquivo de texto que permite que um editor da Web controle o acesso ao seu Web site em vrios nveis, desde o Web site completo a directrios individuais, pginas de um tipo especco ou at mesmo pginas individuais. Este arquivo mostra aos rastreadores quais os directrios que eles podem ou no rastrear.

Sistema de gesto de contedo (CMS, Content Management System)


Sistema de software utilizado para gerir o contedo a partir de arquivos do computador, de imagem e som para o contedo da Web.

Site espelhado
Uma pgina da Web duplicada; s vezes, utilizada para enganar os mecanismos de pesquisa e tentar optimizar a indexao e a classicao na Web de um Web site.

URL (Uniform Resource Locator)


O endereo de um Web site na Internet, o qual consiste no protocolo de acesso (http), nome de domnio (www.google.pt) e, em alguns casos, a localizao de outro arquivo (www.google.com/webmasters).

20

Para mais informaes sobre o Centro para webmasters, visite

www.google.com/webmasters

Copyright 2008.A Google e o Google Maps so marcas registadas da Google Inc. Todos os outros nomes de empresas e produtos podem ser marcas registadas das respectivas empresas s quais esto associados.

Você também pode gostar