Escolar Documentos
Profissional Documentos
Cultura Documentos
Webmaster
Webmaster
partido do seu
contedo
Um manual para editores da Web
Contedo
Introduo
10
11
12
13
Sitemaps
14
Perguntas frequentes
15
Glossrio
19
Introduo
Se procura visibilidade, a Internet o lugar ideal. Pergunte a qualquer anunciante
que tenha aumentado as vendas utilizando anncios on-line, a um blogger cuja
popularidade o tenha levado publicao de um livro ou a um jornal que tenha
ampliado o seu pblico ao nvel internacional graas ao aumento de trfego.
Recebemos frequentemente perguntas sobre como funciona a pesquisa na Web e
como os editores da Web podem maximizar a sua visibilidade na Internet.
Preparmos este folheto para o ajudar a compreender como um mecanismo de
pesquisa percepciona o seu contedo, e como pode afinar a sua presena na
Web, disponibilizando o que pretende que seja visualizado e ocultando o que
deseja manter oculto.
Desde sugestes de webmasters e ferramentas on-line a um manual passoa-passo com perguntas frequentes, este folheto foi desenvolvido tanto para
pequenos editores da Web como para proprietrios de grandes Web sites.
Assim como a prpria Internet evoluiu drasticamente na ltima dcada,
a abordagem do prprio Google em relao pesquisa na Web e o seu
relacionamento com os proprietrios de Web sites tambm evoluram. Crimos
diversas ferramentas para ajudar os webmasters a maximizar a visibilidade do
seu contedo, bem como a controlar a forma como as suas pginas da Web so
indexadas. Mas h sempre mais que podemos fazer e por isso esperamos que
este folheto o incentive a partilhar connosco os seus comentrios e as informarnos sobre o que podemos fazer para tornar a Web um lugar ainda melhor para
utilizadores e editores.
- A equipa de webmasters do Google
Antes da pesquisa
Rastrear a web
Calcular o
PageRank
Durante a pesquisa
Submeter termo de pesquisa
Verificar
ndice
Apresentar resultados
3
Resultados
de
posicionamento
Seleccionar documentos
O proprietrio do Web site especificou que nenhuma das pginas no directrio de logs
deve ser exibida nos resultados de pesquisa do Google.
Todos os principais mecanismos de pesquisa iro verificar e seguir as instrues inseridas
no robots.txt; alm disso, se desejar, poder especificar diferentes regras para diferentes
mecanismos de pesquisa.
Meta tags: controlo mais especfico
Alm do arquivo robots.txt que permite que especifique instrues precisas para um
grande nmero de arquivos no seu Web site poder utilizar a meta tag de rob para
ter um controlo mais especfico sobre cada uma das pginas do seu Web site. Para
implementar, basta adicionar meta tags especficas a uma pgina HTML, a fim de
controlar a forma como essa pgina dever ser indexada. Juntos, o robots.txt e as meta
tags, proporcionam flexibilidade para expressar de maneira relativamente fcil as polticas
de acesso complexas.
Tenho um artigo especfico de notcias no meu Web site que est acessvel apenas
para utilizadores registrados. Como impeo que ele seja includo nos resultados de
pesquisa do Google?
Para fazer isto, basta adicionar a meta tag NOINDEX primeira <head> seco do artigo.
Dever ter o seguinte formato:
<html>
<head>
<meta
name=googlebot
content=noindex>
[...]
Googlebot
Disallow:
/*.jpg$
Disallow:
/*.jpeg$
*
/images/
Outra opo seria adicionar uma tag NOINDEX a cada arquivo que incluir uma imagem.
Todas estas abordagens iro impedir que as suas imagens sejam indexadas; a nica
questo o quo ampla gostaria que fosse esta excluso de imagens.
NAME=GOOGLEBOT
CONTENT=NOARCHIVE>
Tambm poder indicar ao Google que no dever exibir um snippet para uma pgina
utilizando a tag NOSNIPPET:
<META
NAME=GOOGLEBOT
CONTENT=NOSNIPPET>
Observao: Adicionar a tag NOSNIPPET tambm tem o efeito de impedir que um link em
cache seja exibido, pelo que, se especificar NOSNIPPET, obter automaticamente tambm
a tag NOARCHIVE.
10
11
13
Sitemaps
O Centro para webmasters tambm disponibiliza o Sitemaps aos editores para resultados
de pesquisa na Web, por telemovel e de notcias.
O Sitemaps um protocolo compatvel com outros mecanismos de pesquisa, a fim de
ajudar os webmasters a fornecer mais informaes sobre as suas pginas. O Sitemaps
complementa os mecanismos padro de rastreio na Web; os webmasters podem utiliz-lo
para dar informaes ao Google sobre as pginas de seu Web site, a fim de melhorar o
rastreio e a visibilidade das suas pginas nos resultados de pesquisa do Google.
Alm do Sitemaps para pesquisa na Web, tambm oferecemos o Google Mobile Sitemaps,
permitindo aos editores enviar URLs com contedo para dispositivos mveis para o nosso
ndice para telemoveis.
Alm disso, para estes editores cujos Web sites de notcias estejam includos no Google
Notcias, o Sitemaps do Google Notcias pode ajudar a fornecer estatsticas sobre os
artigos do editor, desde as consultas frequncia de visualizao. Se utilizado com as
ferramentas de diagnstico do Centro para webmasters, o Sitemaps do Google Notcias
tambm poder disponibilizar relatrios de erros que ajudam a explicar quaisquer
problemas que o Google possa ter ao rastrear ou extrair artigos de notcias do Web
site de um editor. Alm disso, um editor pode enviar um Sitemap do Google Notcias
contendo URLs que gostaria que fossem considerados para incluso no Google Notcias.
Os Sitemaps do Google Notcias, ao contrrio dos Sitemaps da Web e mvel, esto
actualmente disponveis apenas em ingls, embora esperemos disponibiliz-los em breve
noutros idiomas.
14
Perguntas frequentes
Por que motivo no possvel ter um apoio individualizado para o meu Web site?
De acordo com algumas estimativas, existem aproximadamente 100 milhes de Web sites
na Web. Cada um destes Web sites importante para ns, pois sem eles, no importa se
pequenos ou grandes, o nosso ndice seria menos abrangente e, por fim, menos til para
os nossos utilizadores.
O Centro para webmasters uma excelente fonte de apoio para todos os tipos de Web
sites. Publicamos e respondemos s dvidas dos editores, de forma a que todos possam
beneficiar das informaes. No Centro para webmasters, tambm poder encontrar uma
comunidade amigvel e til de webmasters com quem pode partilhar sugestes e obter
ajuda para a soluo de diversos problemas.
Os anncios exibidos influenciam o posicionamento dos resultados? As listagens de
anncios so totalmente separadas dos resultados de pesquisa?
Os posicionamentos dos anncios e dos resultados de pesquisa no esto minimamente
relacionados; Na realidade, temos equipas totalmente separadas que trabalham em
cada um dos servios, de forma a que no haja qualquer interferncia. Acreditamos
que a objectividade dos nossos resultados de pesquisa crucial para fornecer a melhor
experincia para os nossos utilizadores.
Como adiciono um Web site ao ndice de pesquisa do Google?
A incluso nos resultados de pesquisa do Google gratuita e fcil; alm disso, no requer
um envio manual do Web site para o Google. O Google um mecanismo de pesquisa
totalmente automatizado; ele rastreia a Web regularmente e detecta Web sites para
adicionar ao nosso ndice. Assim, a grande maioria dos Web sites relacionados nos nossos
resultados de pesquisa no so enviados manualmente para incluso, mas localizados e
adicionados automaticamente quando os nossos robs rastreiam a Web.
Alm disso, as Ferramentas para webmasters do Google (no Centro para webmasters)
fornecem um mtodo fcil para que os webmasters enviem um sitemap dos seus URLs ao
ndice do Google e obtenham relatrios detalhados sobre a visibilidade das suas pginas
no Google. Com as Ferramentas para webmasters do Google, os proprietrios de Web sites
podem manter o Google automaticamente informado sobre todas as pginas actuais e
sobre quaisquer actualizaes feitas nas mesmas.
Quanto tempo demora, em mdia, a que o Google detecte um Web site recm-criado, e
com que frequncia o Google rastreia a Web em geral?
No existe um perodo de tempo definido para que o Google detecte um novo Web site.
O Googlebot rastreia regularmente a Web para recriar o nosso ndice. Ao utilizar o Centro
para webmasters, um webmaster pode ver com que frequncia o seu Web site est a ser
rastreado pelo Googlebot e inform-lo se deve rastrear de forma mais rpida ou mais lenta.
15
E se eu quiser que o meu Web site seja exibido nos resultados de pesquisa da Web, mas
no em servios separados, como o Google Notcias ou no Google Pesquisa de Imagens?
O Google permite que os editores da Web escolham participar ou no dos servios;
alm disso, um editor pode entrar em contacto com a equipa de apoio de um produto
especfico e fazer esta solicitao.
Como abordado anteriormente neste folheto, o Protocolo de excluso de robs pode
ser utilizado para bloquear a indexao das pginas de imagens e da Web. O recurso
de remoo de URL no Centro para webmasters tambm pode ser utilizado com este
objectivo e abrange a pesquisa na Web e por imagens
Alm disso, como o Googlebot conta com vrios robs diferentes, poder segmentar o que
deseja bloquear:
Googlebot: rastreia pginas do nosso ndice da Web e de nosso ndice de notcias
Googlebot-Mobile: rastreia pginas do nosso ndice para telemvel
Googlebot-Image: rastreia pginas do nosso ndice de imagens
Mediapartners-Google: rastreia as pginas para definir o contedo do AdSense.
Utilizamos este rob apenas para rastrear o seu Web site se exibir anncios do
AdSense no seu Web site.
rastreia pginas para avaliar a qualidade da pgina de destino do AdWords.
Utilizamos este rob apenas se utilizar o Google AdWords para anunciar o seu Web
site.
Por exemplo, para bloquear totalmente o Googlebot, poder usar a seguinte sintaxe:
User-agent:
Disallow:
Googlebot
/
Posso escolher que texto desejo que seja especificado como um snippet?
No. No uma boa ideia, tanto para o utilizador como para o prprio criador do
contedo. Escolhemos um snippet de texto a partir do Web site que mostra o termo de
pesquisa do utilizador no contexto, o que por sua vez demonstra a relevncia do resultado.
Os estudos mostram que mais provvel que os utilizadores acedam a um Web site se
os resultados de pesquisa mostrarem o snippet. Isto acontece pelo facto de os snippets
facilitarem muito a identificao por parte dos utilizadores da relevncia do resultado para
a sua pesquisa. Se um utilizador no puder definir isto rapidamente, a probabilidade de
passar para o resultado de pesquisa seguinte maior.
Os editores da Web podem incluir uma meta tag nas suas pginas, a fim de fornecer ao
Google informaes adicionais nos casos em que no puderem gerar algoritmicamente um
snippet til a partir do contedo na pgina. Para fazer isso, basta adicionar o seguinte
seco <head> da pgina:
16
<meta
name=description
content=Por que Ana no
gosta de coelhos? Estamos prestes a descobrir.>
Qualquer editor da Web que no quiser que um snippet das suas pginas seja criado ,pode
utilizar a tag NOSNIPPET, com descrito a seguinte:
<meta name=robots content=nosnippet>
Finalmente, s vezes, utilizamos uma descrio do Web site a partir do Open Directory
Project do snippet do resultado de pesquisa. Se no desejar que esta descrio seja
utilizada, basta adicionar a seguinte meta tag:
<meta name=robots content=noodp>
Os artigos com notcias mais recentes no meu Web site so exibidos apenas durante
algumas horas antes de serem actualizados e movidos para uma seco de artigos padro.
Quero que o artigo completo aparea no ndice do Google, no as ltimas notcias.
Uma opo colocar todos os artigos com as ltimas notcias num directrio e utilizar o
robots.txt para no permitir que o Googlebot aceda a esse diretrio.
Outra opo adicionar a tag NOFOLLOW seco <HEAD> do html da sua seco de
ltimas notcias. Isto ir dar indicao ao Googlebot de que no dever seguir quaisquer
links que detecte nessa pgina. Note, porm, que a tag NOFOLLOW impede apenas
que o Googlebot siga os links de uma pgina para outra. Se outra pgina da Web estiver
associada a esse artigo, o Google ir detectar o artigo quando a indexar.
Se eu tiver vrios nomes de domnio e divulgar o mesmo contedo nesses diferentes
domnios serei excludo dos resultados de pesquisa?
Embora alguns editores possam tentar enganar os mecanismos de pesquisa ao duplicar
o contedo e divulgar Web sites espelhados, tambm h um contedo legtimo que pode
ser duplicado por bons motivos. O Google no quer penalizar estes sites. Por exemplo, no
tratamos contedo semelhante expresso em diferentes idiomas (digamos, ingls num Web
site e francs noutro) como contedo duplicado.
Ter o mesmo contedo em diversos Web sites (p. ex., distribuio de artigos) no resulta
necessariamente na remoo total de um ou mais Web sites dos resultados de pesquisa.
No entanto, lembre-se de que provvel que cada ocorrncia do artigo aparea mais
abaixo no posicionamento, dado que tem apenas uma parte dos links provenientes do que
teria uma nica cpia. Em geral, uma nica cpia de um artigo ter um posicionamento
mais elevado e, portanto, poder ser visto por mais utilizadores do que vrias cpias do
mesmo contedo.
Alm disso, para garantir a qualidade da pesquisa, o Google no inclui vrias cpias de
uma pgina nos resultados de pesquisa. Em vez disso, habitual escolher uma verso da
pgina a ser visualizada. No entanto, os webmasters podem indicar ao Google a sua verso
preferida utilizando o robots.txt ou uma meta tag para bloquear quaisquer cpias que eles
no queiram mostrar nos resultados de pesquisa.
17
Porque que o meu Web site est a ser bloqueado do ndice do Google?
Antes de mais, possvel que o seu Web site no tenha sido bloqueado. H vrios motivos
pelos quais um Web site pode no aparecer nos resultados de pesquisa (consulte as
pginas 5 a 11).
Se o seu Web site no tiver obstculos para a descoberta ou indexao, pode ter sido
bloqueado. Os Web sites podem ser bloqueados do ndice por no atenderem aos
padres de qualidade descritos nas diretrizes para webmasters (disponveis no Centro
para webmasters). Isto ocorre com maior frequncia quando um Web site est a utilizar
mtodos desonestos para tentar aparecer em posies superiores na pesquisa. As
violaes comuns das directrizes incluem camuflagem (texto escrito de tal forma que
possa ser visto pelos mecanismos de pesquisa mas no pelos utilizador) ou configurao
de pginas/links com o nico objectivo de enganar os mecanismos de pesquisa e
manipular os resultados desses mecanismos.
Quando os webmasters suspeitarem que estes Web sites violam as directrizes de
qualidade, podero modificar os Web sites para que respeitem estas directrizes e, em
seguida, clicar no link solicitar reincluso no interface de Ferramentas para webmasters
para solicitar a reavaliao do Web site.
18
Glossrio
A indexar
O processo de adicionar o contedo do seu Web site a um mecanismo de pesquisa.
Camuflagem
Mostrar aos mecanismos de pesquisa contedo diferente do que mostra aos utilizadores.
Contedo dinmico
Contedo, como imagens, animaes ou vdeos, que conta com o Flash, JavaScript,
frames ou URLs criados dinamicamente.
Directrio raiz
O principal directrio ou directrio superior num sistema de arquivos de computador.
Extenso de arquivo
Nome de um arquivo de computador (.doc, .txt, .pdf, etc.) frequentemente utilizado para
indicar o tipo de dados armazenados.
Link em cache
Um instantneo de como uma pgina foi exibida aquando a ltima vez que o Google a
acedeu. Uma cpia em cache permite que os utilizadores visualizem uma pgina quando
a verso dinmica no estiver disponvel, embora o contedo possa ser ligeiramente
diferente. Para visualizar uma cpia em cache, clique no link em cache que aparece
abaixo de um resultado de pesquisa.
Meta tags
Uma tag no HTML que descreve o contedo de uma pgina da Web. As meta tags podem
ser utilizadas para controlar a indexao de pginas individuais num Web site.
Page Rank
Um recurso do Google que ajuda a definir o posicionamento de um Web site nos nossos
resultados de pesquisa. O PageRank conta com a natureza exclusivamente democrtica
da Web ao utilizar a sua vasta estrutura de links como um indicador do valor de uma
pgina individual. Ainda mais importante que os Web sites de alta qualidade recebem
um PageRank superior, que tido em conta sempre que o Google realiza uma pesquisa. O
Google combina o PageRank com tcnicas sofisticadas de correspondncia de texto, a fim
de encontrar pginas que sejam importantes e relevantes para as pesquisas.
19
Palavra-chave
Um termo que inserido na caixa de pesquisa de um mecanismo de pesquisa. O
mecanismo de pesquisa ento pesquisa pginas que incluam a palavra-chave ou frase.
Rastreador
Software utilizado para detectar e indexar URLs na Web ou numa intranet.
Rastreio
Processo utilizado pelos mecanismos de pesquisa para aceder a pginas da Web.
Robots.txt
Um arquivo de texto que permite que um editor da Web controle o acesso ao seu Web site
em vrios nveis, desde o Web site completo a directrios individuais, pginas de um tipo
especfico ou at mesmo pginas individuais. Este arquivo mostra aos rastreadores quais
os directrios que eles podem ou no rastrear.
Site espelhado
Uma pgina da Web duplicada; s vezes, utilizada para enganar os mecanismos de
pesquisa e tentar optimizar a indexao e a classificao na Web de um Web site.
20
www.google.com/webmasters
Copyright 2008.A Google e o Google Maps so marcas registadas da Google Inc. Todos os outros nomes de
empresas e produtos podem ser marcas registadas das respectivas empresas s quais esto associados.