Você está na página 1de 24

Tire o mximo

partido do seu
contedo
Um manual para editores da Web
1
Contedo
Introduo 2
Uma breve introduo pesquisa na Web 3
Novidades na pesquisa na Web do Google? 4
O Google vai encontrar o seu Web site? 5
O Google vai indexar o seu Web site? 6
Controlar o que o Google indexa 7
Robots.txt versus meta tags 9
Controlar o armazenamento em cache e snippets 10
O seu Web site apresenta contedo exclusivo e til? 11
Aumentar a visibilidade: prticas recomendadas 12
Centro para webmasters 13
Sitemaps 14
Perguntas frequentes 15
Glossrio 19
2
Introduo
Se procura visibilidade, a Internet o lugar ideal. Pergunte a qualquer anunciante
que tenha aumentado as vendas utilizando anncios on-line, a um blogger cuja
popularidade o tenha levado publicao de um livro ou a um jornal que tenha
ampliado o seu pblico ao nvel internacional graas ao aumento de trfego.
Recebemos frequentemente perguntas sobre como funciona a pesquisa na Web e
como os editores da Web podem maximizar a sua visibilidade na Internet.
Preparmos este folheto para o ajudar a compreender como um mecanismo de
pesquisa percepciona o seu contedo, e como pode a nar a sua presena na
Web, disponibilizando o que pretende que seja visualizado e ocultando o que
deseja manter oculto.
Desde sugestes de webmasters e ferramentas on-line a um manual passo-
a-passo com perguntas frequentes, este folheto foi desenvolvido tanto para
pequenos editores da Web como para proprietrios de grandes Web sites.
Assim como a prpria Internet evoluiu drasticamente na ltima dcada,
a abordagem do prprio Google em relao pesquisa na Web e o seu
relacionamento com os proprietrios de Web sites tambm evoluram. Crimos
diversas ferramentas para ajudar os webmasters a maximizar a visibilidade do
seu contedo, bem como a controlar a forma como as suas pginas da Web so
indexadas. Mas h sempre mais que podemos fazer e por isso esperamos que
este folheto o incentive a partilhar connosco os seus comentrios e as informar-
nos sobre o que podemos fazer para tornar a Web um lugar ainda melhor para
utilizadores e editores.
- A equipa de webmasters do Google
3
Uma breve introduo pesquisa na Web:
como funciona
De forma simples, pode imaginar a Web como um enorme livro, com um ndice de
grandes dimenses que indica exactamente onde que tudo est localizado.
O Google tem um grupo de computadores o Googlebot que esto continuamente a
rastrear (a navegar ) bilhes de pginas na Web. Este processo de rastreio algortmico:
os programas de computador determinam quais os Web sites que devem ser rastreados,
com que frequncia e quantas pginas de cada Web site devem ser analisadas. No
aceitamos pagamento para rastrear um Web site com maior frequncia; alm disso,
mantemos a parte de pesquisa perfeitamente independente do nosso servio de
publicidade Google AdWords.
O processo de rastreio do Google inicia com uma lista de URLs de pginas da Web.
medida que o Googlebot navega nestes Web sites, ele detecta os links de cada pgina e
adiciona-os sua lista de pginas a serem rastreadas. O Googlebot faz uma cpia de cada
uma das pginas que rastreia, a m de compilar um ndice de grande proporo de todas
as palavras que visualiza. Esta lista tambm indica o local onde cada palavra surge em
cada pgina.
Quando um utilizador insere um termo de pesquisa, as nossas mquinas pesquisam
no ndice pginas relacionadas com o mesmo e apresentam ao utilizador os resultados
mais relevantes. A relevncia denida por mais de 200 factores, sendo um deles o
PageRank da pgina. O PageRank uma medida de importncia de uma pgina com
base nos links provenientes de outras pginas. Em resumo, cada pgina que possua um
link para uma pgina XYZ aumenta o PageRank dessa pgina XYZ.
3
Antes da pesquisa
Durante a pesquisa
Rastrear a web
Calcular o
PageRank
Submeter termo de pesquisa
Vericar
ndice
Apresentar resultados
Resultados de
posicionamento
Seleccionar documentos
4
O que h de novo na pesquisa na Web do Google?
Embora os princpios bsicos da pesquisa na Web tenham permanecido constantes, o
Google est continuamente a trabalhar no sentido de melhorar os resultados de pesquisa.
Por exemplo, o que que h de diferente na pesquisa na Web, desde os ltimos cinco
anos? Bem, para comear, est muito mais rpida.
Alm disso, em comparao a cincos anos atrs, os nossos sistemas de rastreio e
indexao esto muito mais inteligentes. Por exemplo, agora navegamos continuamente
na Web e programamos visitas a cada pgina de forma mais inteligente a m de manter
o contedo sempre actualizado. Esta abordagem mais eciente considera o facto do Web
site de um jornal on-line, por exemplo, precisar de ser rastreado com maior frequncia do
que um Web site esttico que seja actualizado uma vez por ms . Para mais, permitimos
ainda que os webmasters controlem com que frequncia os seus Web sites so rastreados
utilizando as nossas ferramentas para webmasters. De um modo geral, isto resulta num
ndice mais actualizado e abrangente.
Ainda que actualmente a pesquisa na Web esteja mais rpida e mais eciente do
que nunca, os principais factores para determinar a visibilidade de um Web site nos
resultados de pesquisa do Google tm sido uma prioridade desde o dia em que o nosso
mecanismo de pesquisa foi inaugurado:
O Google vai encontrar o Web site? (pgina 5)
O Google vai indexar o Web site? (pgina 6)
O Web site apresenta contedo exclusivo e til? (pgina 11)
5
O Google vai encontrar o Web seu site?
A incluso nos resultados de pesquisa do Google gratuita e simples; nem sequer
necessrio enviar o seu Web site para o Google. Na verdade, a grande maioria dos Web
sites relacionados nos nossos resultados de pesquisa no so enviados manualmente
para incluso, mas localizados e adicionados automaticamente quando o Googlebot
rastreia a Web.
Embora o Google rastreie bilhes de pginas, inevitvel que alguns Web sites no
sejam visualizados. Quando isto acontece, geralmente devido a um dos seguintes
motivos:
o Web site no est associado atravs de links includos noutros Web sites na Web;
o Web site foi iniciado depois da concluso do mais recente rastreio do Google;
o Web site estava temporariamente indisponvel ou recebemos uma mensagem
de erro quando o tentamos rastrear.
Com as ferramentas para webmasters do Google, como o Sitemaps, poder vericar
se o Web site est includo no ndice do Google ou se recebemos erros quando o
tentamos rastrear (consulte a pgina 14). Tambm poder utilizar estas ferramentas
para adicionar o seu URL manualmente ao ndice do Google, ou fornecer ao Google um
Sitemap com mais informaes sobre o seu contedo. Isso ir ajudar a encontrar novas
seces e contedos do seu Web site.
6
O Google vai indexar o seu Web site?
Por vezes, os webmasters descobrem que os seus Web sites no esto a aparecer nos
resultados de pesquisa. O problema poder estar relacionado com a capacidade de
indexao, ou seja, a capacidade de o Google fazer ou no uma cpia de uma pgina da
Web para incluso nos nossos resultados de pesquisa.
Estrutura e contedo
Uma razo para a no incluso nos resultados de pesquisa est relacionada com a
estrutura e o contedo da pgina. Por exemplo, uma pgina que requer que o utilizador
preencha um formulrio pode no ser indexada pelo Google. Da mesma forma, uma
pgina utilizando contedo dinmico (Flash, JavaScript, frames ou URLs criados
dinamicamente) pode no ser indexada facilmente pelos mecanismos de pesquisa. Se
quiser conrmar que este o problema do seu Web site, tente visualiz-lo num navegador
de texto, como o Lynx, ou num navegador com imagens, Javascript e Flash desactivados,
o que indicar se todo o seu contedo est acessvel ou no.
Se o seu Web site utilizar muitas imagens, certique-se de que inclui uma descrio
do contedo de cada imagem no texto. Isto permite que os mecanismos de pesquisa
indexem a imagem correctamente e disponibiliza a imagem para acesso por parte dos
utilizadores com problemas na visualizao. Tambm poder utilizar o texto alternativo
da imagem e nomes de arquivos descritivos, como mostrado neste exemplo (que uma
imagem de um logotipo de uma empresa intitulada Buffys House of Pies - algo como
Casa de tortas do Buffy):
<img src=buffyshouseofpies.jpg alt=Bem-vindo a
Buffys House of Pies!>
URLs
Um outro obstculo poderia ser o prprio URL. Se houver IDs de sesso ou vrios
parmetros no URL ou se o URL efectuar vrios redireccionamentos, possvel que o
Google no consiga indexar a pgina.
Servidor e rede
Problemas com o servidor ou com a rede podem impedir o acesso a determinadas pginas
do seu Web site. Ao utilizar as ferramentas disponveis no Centro para webmasters do
Google, os editores podem ver a lista das pginas que no puderam ser acedidas pelo
Googlebot. Para saber mais sobre o Centro para webmasters, consulte a pgina 13.
Protocolo de excluso de robs
Por vezes, as pginas so bloqueadas pelo Protocolo de excluso de robs, um padro
tcnico que permite que os editores da Web dem indicao aos mecanismos de pesquisa
para no indexar o contedo do Web site (consulte a pgina 7). Se o seu Web site no
estiver a ser exibido nos resultados de pesquisa do Google, verique se o robots.txt ou
uma meta tag no esto a bloquear o acesso aos nossos rastreadores.
7
Controlar o que o Google indexa
Cada editor da Web tem um objectivo diferente em relao ao que est a tentar
alcanar na Internet. Editores de alguns jornais, por exemplo, optaram por
disponibilizar o acesso gratuito aos seus artigos mais recentes, oferecendo um servio
premium pago para acesso aos arquivos anteriores. Alguns querem visibilidade em
todas as propriedades de um mecanismo de pesquisa (como o Google Mobile, o Google
Imagens, etc.), enquanto outros preferem aparecer apenas nos resultados de pesquisa
na Web.
Os mecanismos de pesquisa respeitam os desejos dos editores anal de contas, o
contedo deles. No entanto, no podemos adivinhar estes desejos, de forma que
essencial que os webmasters nos informem como desejam que o seu contedo
seja indexado. Isto pode ser feito atravs do Protocolo de excluso de robs, uma
especicao tcnica bem denida que informa aos mecanismos de pesquisa qual o
Web site ou partes do mesmo que no devem ser pesquisveis, bem como quais partes
que devem permanecer visveis nos resultados de pesquisa.
Robots.txt: controlo alargado dentro de cada Web site
A base do Protocolo de excluso de robs um arquivo de texto simples intitulado
robots.txt, o qual tem sido o padro do sector h muitos anos. Com o robots.txt, poder
controlar o acesso a vrios nveis, desde um Web site inteiro a directrios individuais,
pginas de um tipo especco ou at mesmo pginas individuais.
H algumas pginas no meu Web site que eu no quero que estejam no ndice
do Google. Como fao para que elas no apaream nos resultados de pesquisa do
Google?
Normalmente, a maioria dos proprietrios quer que o Googlebot aceda aos seus Web sites
para que as suas pginas da Web sejam encontradas pelos utilizadores que pesquisam no
Google. No entanto, talvez no queira indexar determinadas pginas: por exemplo, logs
internos ou artigos de notcias que estejam associadas a um acesso pago.
Poder excluir pginas do ndice do Google ao criar um arquivo robots.txt e posicion-lo
no directrio raiz no seu servidor da Web. O arquivo robots.txt relaciona as pginas que os
mecanismos de pesquisa no devem indexar. A criao de um arquivo robots.txt simples
e proporciona aos editores um nvel sosticado de controlo em relao forma pela qual
os mecanismos de pesquisa iro aceder aos seus Web sites.
Por exemplo, se um webmaster quiser impedir a indexao dos seus logs internos, o
arquivo robots.txt deve conter:
User-Agent:Googlebot a linha User-Agent especica que a prxima seco
um conjunto de instrues especcas para o Googlebot.
Disallow: /logs/ a linha Disallow instrui o Googlebot a no aceder a
arquivos no subdirectrio logs do seu Web site.
8
O proprietrio do Web site especicou que nenhuma das pginas no directrio de logs
deve ser exibida nos resultados de pesquisa do Google.
Todos os principais mecanismos de pesquisa iro vericar e seguir as instrues inseridas
no robots.txt; alm disso, se desejar, poder especicar diferentes regras para diferentes
mecanismos de pesquisa.
Meta tags: controlo mais especco
Alm do arquivo robots.txt que permite que especique instrues precisas para um
grande nmero de arquivos no seu Web site poder utilizar a meta tag de rob para
ter um controlo mais especco sobre cada uma das pginas do seu Web site. Para
implementar, basta adicionar meta tags especcas a uma pgina HTML, a m de
controlar a forma como essa pgina dever ser indexada. Juntos, o robots.txt e as meta
tags, proporcionam exibilidade para expressar de maneira relativamente fcil as polticas
de acesso complexas.
Tenho um artigo especco de notcias no meu Web site que est acessvel apenas
para utilizadores registrados. Como impeo que ele seja includo nos resultados de
pesquisa do Google?
Para fazer isto, basta adicionar a meta tag NOINDEX primeira <head> seco do artigo.
Dever ter o seguinte formato:
<html>
<head>
<meta name=googlebot content=noindex>
[...]
Isto ir impedir que o Google indexe o respectivo arquivo.
No entanto, note que nalguns casos, poder querer que o Google indexe este tipo de
pginas por exemplo, um artigo de notcias em arquivo que os utilizadores pagam para a
leitura on-line. Embora este tipo de contedo premium no seja exibido nos resultados
de pesquisa do Google, determinados servios do Google, como a Pesquisa no arquivo do
Google Notcias, incluiro o artigo nos seus ndices, com as informaes de pagamento
claramente visveis para os utilizadores.
9
Robots.txt versus meta tags
Em geral, o robots.txt um bom modo de obter o controlo sobre todo o Web site e que as
meta tags de fornecer o controlo mais especco sobre arquivos individuais. As meta tags
so especialmente teis se tiver permisso para editar arquivos individuais mas no todo o
Web site. As meta tags tambm permitem que especique polticas complexas de controlo
de acesso em cada uma das pginas.
s vezes, qualquer uma das duas ferramentas pode resolver o mesmo problema.
Como posso ter certeza de que o texto de uma pgina ser indexado, mas no as
imagens?
Uma opo seria bloquear o acesso s imagens por extenso de arquivo em todo o seu
Web site utilizando o robots.txt. As seguintes linhas num arquivo robots.txt indicam ao
Google que no dever indexar quaisquer arquivos com a extenso *.jpg ou *.jpeg:
User-agent: Googlebot
Disallow: /*.jpg$
Disallow: /*.jpeg$
Em alternativa, se o seu Sistema de gesto de contedo (CMS, Content Management
System) armazenar imagens num directrio separado, poder excluir o directrio completo.
Se as suas imagens estiverem num directrio intitulado /imagens, poder excluir esse
directrio de todos os mecanismos de pesquisa utilizando:
User-agent: *
Disallow: /images/
Outra opo seria adicionar uma tag NOINDEX a cada arquivo que incluir uma imagem.
Todas estas abordagens iro impedir que as suas imagens sejam indexadas; a nica
questo o quo ampla gostaria que fosse esta excluso de imagens.
10
Controlar o armazenamento em cache e snippets
Os resultados de pesquisa geralmente mostram um link de pgina em cache e um
snippet. Veja a seguir, por exemplo, um dos primeiros resultados visualizados quando
pesquisamos por arara:
Snippet um excerto de texto da pgina da Web
Link em cache este link direcciona os utilizadores para uma cpia
da pgina armazenada nos servidores do Google
Porqu ter um snippet? mais provvel que os utilizadores acedam um Web site se os
resultados de pesquisa mostrarem um snippet desse Web site. Isto acontece pelo facto
de os snippets facilitarem a identicao da relevncia do resultado da sua pesquisa por
parte dos utilizadores. Se um utilizador no puder ter esta percepo rapidamente,haver
uma maior probabilidade de passar para o resultado de pesquisa seguinte.
Porqu ter um link em cache? O link em cache til em vrios casos como, por exemplo:
quando os Web sites cam temporariamente indisponveis, quando os Web sites de
notcias cam sobrecarregados devido a um evento importante; ou quando os Web sites
so acidentalmente excludos. Outra vantagem que a cpia em cache do Google destaca
as palavras utilizadas pelo utilizador na sua pesquisa, permitindo uma rpida avaliao da
relevncia da pgina.
A maioria dos editores da Web prefere que o Google exiba o snippet e o link em cache.
No entanto, h alguns casos em que um proprietrio do Web site pode desejar desabilitar
uma ou ambas as opes:
O contedo do meu jornal alterado vrias vezes ao dia. Parece que o Googlebot no
est a indexar este contedo to rapidamente quanto ns o actualizamos, e o link em
cache est a apontar para uma pgina que no a mais recente. Como posso impedir
que o Google crie um link em cache?
O proprietrio do Web site de notcias poder impedir que este link em cache seja exibido
nos resultados de pesquisa adicionando a tag NOARCHIVE sua pgina:
<META NAME=GOOGLEBOT CONTENT=NOARCHIVE>
Tambm poder indicar ao Google que no dever exibir um snippet para uma pgina
utilizando a tag NOSNIPPET:
<META NAME=GOOGLEBOT CONTENT=NOSNIPPET>
Observao: Adicionar a tag NOSNIPPET tambm tem o efeito de impedir que um link em
cache seja exibido, pelo que, se especicar NOSNIPPET, obter automaticamente tambm
a tag NOARCHIVE.
11
O seu Web site apresenta contedo exclusivo e til?
Assim que o Web site puder ser detectado e indexado, a pergunta nal se o contedo
das pginas da Web exclusivo e til.
Antes de mais, olhe para o seu texto como um todo. O seu ttulo e os links de texto so
descritivos? O texto ui naturalmente, de forma clara e intuitiva?
Da mesma forma que o captulo de um livro organizado por reas e temas especcos,
cada pgina da Web deve estar centralizada numa rea ou num tpico especco. As
palavras-chave e frases surgem naturalmente deste tipo de texto, e muito mais provvel
que os utilizadores permaneam numa pgina da Web que disponibilize contedo e links
relevantes.
No entanto, certique-se de que as frases que utilizar incluem as frases que os visitantes
provavelmente iro pesquisar. Por exemplo, se o seu Web site for direccionado para
um clube de fs dos carros da MG, certique-se de que as palavras MG e carros
aparecem de facto no texto, em vez de apenas em termos como automveis britnicos.
12
Aumentar a visibilidade: prticas recomendadas
Os proprietrios de Web sites perguntam-nos com frequncia quais as melhores formas
de aumentar a visibilidade e o posicionamento dos seus Web sites nos nossos resultados
de pesquisa. A nossa resposta simples: Pense como um utilizador, pois assim que
tentamos pensar.
O que que isto signica na prtica? Acima de tudo, certique-se de que fornece aos
visitantes o contedo que eles esto procura, pois a relevncia que ir direccionar o
trfego para o seu Web site e que o ir ajudar a mant-lo.
Muitos proprietrios de Web sites concentram-se na forma como as suas pginas da Web
iro ser posicionadas. Porm, a posio determinada por mais de 200 critrios alm
do PageRank. muito melhor investir o seu tempo na qualidade do seu contedo e na
respectiva acessibilidade do que tentar descobrir formas de inuenciar um algoritmo do
mecanismo de pesquisa. Se um Web site no atender s nossas directrizes de qualidade,
ele poder ser bloqueado do ndice.
O que fazer:
1. Crie contedo relevante e atraente: os visitantes iro aceder s suas pginas atravs de
vrios links; portanto, certique-se de que cada pgina chama a ateno.
2. Envolva os utilizadores: pode adicionar uma seco de comentrios ou um blog no
seu Web site? A criao de uma comunidade ajuda a estimular a utilizao regular do
seu Web site. Envolva os seus visitantes para acelerar a visibilidade e a lealdade dos
utilizadores.
3. Acompanhe o seu Web site: utilize o Centro para webmasters (consulte a pgina 13)
para ver quais os termos de pesquisa que esto a direccionar os visitantes para o
seu Web site, ou para controlar as alteraes no posicionamento nos resultados de
pesquisa em relao a alteraes efectuadas no Web site.
4. Tenha links de alta qualidade incorporados.
5. Fornea links de texto claros: posicione os links de texto adequadamente no seu Web
site e certique-se de que eles incluem termos que descrevem o tpico.
O que evitar:
1. No encha a sua pgina com listas de palavras-chave.
2. No tente camuar pginas com texto que possam ser visto pelos mecanismos de
pesquisa mas no pelos utilizadores.
3. No insira pginas apenas para rastreio ao denir pginas ou links cujo nico
objectivo seja enganar os mecanismos de pesquisa.
4. No utilize imagens para exibir nomes, contedo ou links importantes os mecanismos
de pesquisa no lem imagens.
5. No crie vrias cpias de uma pgina em URLs diferentes com a inteno de enganar
os mecanismos de pesquisa.
Quando tiver dvidas, consulte as directrizes para os nossos webmasters, disponveis em:
www.google.com/webmasters/guidelines.html
13
Centro para webmasters
Como uma empresa que pretende fornecer os resultados de pesquisa mais relevantes e
teis na Web, empenhamo-nos em fornecer um apoio generalizado e justo para todos os
webmasters e todos os Web sites, independentemente da sua dimenso. por isso que
crimos o Centro para webmasters, localizado em google.pt/webmasters.
O Centro para webmasters um excelente recurso para todos os editores da Web. Este
responde a questes sobre rastreio, indexao e posicionamento; dispe de um canal para
trocar comentrios e alertar para problemas; e oferece ferramentas de diagnstico que
apoiam os webmasters na deteco de potenciais problemas de rastreio.
Veja uma exemplo do que pode encontrar no Centro para webmasters.
Diagnosticar potenciais problemas no acesso a pginas e fornecimento de solues
Solicitar a excluso de pginas especcas do nosso ndice
Garantir que o arquivo robots.txt esteja a permitir e bloquear as pginas que pretende.
Consultar as estatsticas de termos de pesquisa e de pginas relacionadas com o seu Web
site:
Estatsticas de termos de pesquisa: verique quais os termos de pesquisa que
direccionam mais visitantes para o seu Web site, e quais os tpicos que poderiam ser
ampliados no seu Web site para conseguir mais trfego.
Anlise da pgina: veja a sua pgina da Web como o Google a v. Veja as palavras mais
comuns no seu Web site, os links incorporados no Web site e como os outros descrevem o
seu Web site quando o visitam.
Taxa de rastreio : veja com que frequncia o seu Web site est a ser rastreado pelo
Googlebot e d indicaes ao Google para rastrear com menor ou maior rapidez.
14
Sitemaps
O Centro para webmasters tambm disponibiliza o Sitemaps aos editores para resultados
de pesquisa na Web, por telemovel e de notcias.
O Sitemaps um protocolo compatvel com outros mecanismos de pesquisa, a m de
ajudar os webmasters a fornecer mais informaes sobre as suas pginas. O Sitemaps
complementa os mecanismos padro de rastreio na Web; os webmasters podem utiliz-lo
para dar informaes ao Google sobre as pginas de seu Web site, a m de melhorar o
rastreio e a visibilidade das suas pginas nos resultados de pesquisa do Google.
Alm do Sitemaps para pesquisa na Web, tambm oferecemos o Google Mobile Sitemaps,
permitindo aos editores enviar URLs com contedo para dispositivos mveis para o nosso
ndice para telemoveis.
Alm disso, para estes editores cujos Web sites de notcias estejam includos no Google
Notcias, o Sitemaps do Google Notcias pode ajudar a fornecer estatsticas sobre os
artigos do editor, desde as consultas frequncia de visualizao. Se utilizado com as
ferramentas de diagnstico do Centro para webmasters, o Sitemaps do Google Notcias
tambm poder disponibilizar relatrios de erros que ajudam a explicar quaisquer
problemas que o Google possa ter ao rastrear ou extrair artigos de notcias do Web
site de um editor. Alm disso, um editor pode enviar um Sitemap do Google Notcias
contendo URLs que gostaria que fossem considerados para incluso no Google Notcias.
Os Sitemaps do Google Notcias, ao contrrio dos Sitemaps da Web e mvel, esto
actualmente disponveis apenas em ingls, embora esperemos disponibiliz-los em breve
noutros idiomas.
15
Perguntas frequentes
Por que motivo no possvel ter um apoio individualizado para o meu Web site?
De acordo com algumas estimativas, existem aproximadamente 100 milhes de Web sites
na Web. Cada um destes Web sites importante para ns, pois sem eles, no importa se
pequenos ou grandes, o nosso ndice seria menos abrangente e, por m, menos til para
os nossos utilizadores.
O Centro para webmasters uma excelente fonte de apoio para todos os tipos de Web
sites. Publicamos e respondemos s dvidas dos editores, de forma a que todos possam
beneciar das informaes. No Centro para webmasters, tambm poder encontrar uma
comunidade amigvel e til de webmasters com quem pode partilhar sugestes e obter
ajuda para a soluo de diversos problemas.
Os anncios exibidos inuenciam o posicionamento dos resultados? As listagens de
anncios so totalmente separadas dos resultados de pesquisa?
Os posicionamentos dos anncios e dos resultados de pesquisa no esto minimamente
relacionados; Na realidade, temos equipas totalmente separadas que trabalham em
cada um dos servios, de forma a que no haja qualquer interferncia. Acreditamos
que a objectividade dos nossos resultados de pesquisa crucial para fornecer a melhor
experincia para os nossos utilizadores.
Como adiciono um Web site ao ndice de pesquisa do Google?
A incluso nos resultados de pesquisa do Google gratuita e fcil; alm disso, no requer
um envio manual do Web site para o Google. O Google um mecanismo de pesquisa
totalmente automatizado; ele rastreia a Web regularmente e detecta Web sites para
adicionar ao nosso ndice. Assim, a grande maioria dos Web sites relacionados nos nossos
resultados de pesquisa no so enviados manualmente para incluso, mas localizados e
adicionados automaticamente quando os nossos robs rastreiam a Web.
Alm disso, as Ferramentas para webmasters do Google (no Centro para webmasters)
fornecem um mtodo fcil para que os webmasters enviem um sitemap dos seus URLs ao
ndice do Google e obtenham relatrios detalhados sobre a visibilidade das suas pginas
no Google. Com as Ferramentas para webmasters do Google, os proprietrios de Web sites
podem manter o Google automaticamente informado sobre todas as pginas actuais e
sobre quaisquer actualizaes feitas nas mesmas.
Quanto tempo demora, em mdia, a que o Google detecte um Web site recm-criado, e
com que frequncia o Google rastreia a Web em geral?
No existe um perodo de tempo denido para que o Google detecte um novo Web site.
O Googlebot rastreia regularmente a Web para recriar o nosso ndice. Ao utilizar o Centro
para webmasters, um webmaster pode ver com que frequncia o seu Web site est a ser
rastreado pelo Googlebot e inform-lo se deve rastrear de forma mais rpida ou mais lenta.
16
E se eu quiser que o meu Web site seja exibido nos resultados de pesquisa da Web, mas
no em servios separados, como o Google Notcias ou no Google Pesquisa de Imagens?
O Google permite que os editores da Web escolham participar ou no dos servios;
alm disso, um editor pode entrar em contacto com a equipa de apoio de um produto
especco e fazer esta solicitao.
Como abordado anteriormente neste folheto, o Protocolo de excluso de robs pode
ser utilizado para bloquear a indexao das pginas de imagens e da Web. O recurso
de remoo de URL no Centro para webmasters tambm pode ser utilizado com este
objectivo e abrange a pesquisa na Web e por imagens
Alm disso, como o Googlebot conta com vrios robs diferentes, poder segmentar o que
deseja bloquear:
Googlebot: rastreia pginas do nosso ndice da Web e de nosso ndice de notcias
Googlebot-Mobile: rastreia pginas do nosso ndice para telemvel
Googlebot-Image: rastreia pginas do nosso ndice de imagens
Mediapartners-Google: rastreia as pginas para denir o contedo do AdSense.
Utilizamos este rob apenas para rastrear o seu Web site se exibir anncios do
AdSense no seu Web site.
rastreia pginas para avaliar a qualidade da pgina de destino do AdWords.
Utilizamos este rob apenas se utilizar o Google AdWords para anunciar o seu Web
site.
Por exemplo, para bloquear totalmente o Googlebot, poder usar a seguinte sintaxe:
User-agent: Googlebot
Disallow: /
Posso escolher que texto desejo que seja especicado como um snippet?
No. No uma boa ideia, tanto para o utilizador como para o prprio criador do
contedo. Escolhemos um snippet de texto a partir do Web site que mostra o termo de
pesquisa do utilizador no contexto, o que por sua vez demonstra a relevncia do resultado.
Os estudos mostram que mais provvel que os utilizadores acedam a um Web site se
os resultados de pesquisa mostrarem o snippet. Isto acontece pelo facto de os snippets
facilitarem muito a identicao por parte dos utilizadores da relevncia do resultado para
a sua pesquisa. Se um utilizador no puder denir isto rapidamente, a probabilidade de
passar para o resultado de pesquisa seguinte maior.
Os editores da Web podem incluir uma meta tag nas suas pginas, a m de fornecer ao
Google informaes adicionais nos casos em que no puderem gerar algoritmicamente um
snippet til a partir do contedo na pgina. Para fazer isso, basta adicionar o seguinte
seco <head> da pgina:
17
<meta name=description content=Por que Ana no
gosta de coelhos? Estamos prestes a descobrir.>
Qualquer editor da Web que no quiser que um snippet das suas pginas seja criado ,pode
utilizar a tag NOSNIPPET, com descrito a seguinte:
<meta name=robots content=nosnippet>
Finalmente, s vezes, utilizamos uma descrio do Web site a partir do Open Directory
Project do snippet do resultado de pesquisa. Se no desejar que esta descrio seja
utilizada, basta adicionar a seguinte meta tag:
<meta name=robots content=noodp>
Os artigos com notcias mais recentes no meu Web site so exibidos apenas durante
algumas horas antes de serem actualizados e movidos para uma seco de artigos padro.
Quero que o artigo completo aparea no ndice do Google, no as ltimas notcias.
Uma opo colocar todos os artigos com as ltimas notcias num directrio e utilizar o
robots.txt para no permitir que o Googlebot aceda a esse diretrio.
Outra opo adicionar a tag NOFOLLOW seco <HEAD> do html da sua seco de
ltimas notcias. Isto ir dar indicao ao Googlebot de que no dever seguir quaisquer
links que detecte nessa pgina. Note, porm, que a tag NOFOLLOW impede apenas
que o Googlebot siga os links de uma pgina para outra. Se outra pgina da Web estiver
associada a esse artigo, o Google ir detectar o artigo quando a indexar.
Se eu tiver vrios nomes de domnio e divulgar o mesmo contedo nesses diferentes
domnios serei excludo dos resultados de pesquisa?
Embora alguns editores possam tentar enganar os mecanismos de pesquisa ao duplicar
o contedo e divulgar Web sites espelhados, tambm h um contedo legtimo que pode
ser duplicado por bons motivos. O Google no quer penalizar estes sites. Por exemplo, no
tratamos contedo semelhante expresso em diferentes idiomas (digamos, ingls num Web
site e francs noutro) como contedo duplicado.
Ter o mesmo contedo em diversos Web sites (p. ex., distribuio de artigos) no resulta
necessariamente na remoo total de um ou mais Web sites dos resultados de pesquisa.
No entanto, lembre-se de que provvel que cada ocorrncia do artigo aparea mais
abaixo no posicionamento, dado que tem apenas uma parte dos links provenientes do que
teria uma nica cpia. Em geral, uma nica cpia de um artigo ter um posicionamento
mais elevado e, portanto, poder ser visto por mais utilizadores do que vrias cpias do
mesmo contedo.
Alm disso, para garantir a qualidade da pesquisa, o Google no inclui vrias cpias de
uma pgina nos resultados de pesquisa. Em vez disso, habitual escolher uma verso da
pgina a ser visualizada. No entanto, os webmasters podem indicar ao Google a sua verso
preferida utilizando o robots.txt ou uma meta tag para bloquear quaisquer cpias que eles
no queiram mostrar nos resultados de pesquisa.
18
Porque que o meu Web site est a ser bloqueado do ndice do Google?
Antes de mais, possvel que o seu Web site no tenha sido bloqueado. H vrios motivos
pelos quais um Web site pode no aparecer nos resultados de pesquisa (consulte as
pginas 5 a 11).
Se o seu Web site no tiver obstculos para a descoberta ou indexao, pode ter sido
bloqueado. Os Web sites podem ser bloqueados do ndice por no atenderem aos
padres de qualidade descritos nas diretrizes para webmasters (disponveis no Centro
para webmasters). Isto ocorre com maior frequncia quando um Web site est a utilizar
mtodos desonestos para tentar aparecer em posies superiores na pesquisa. As
violaes comuns das directrizes incluem camuagem (texto escrito de tal forma que
possa ser visto pelos mecanismos de pesquisa mas no pelos utilizador) ou congurao
de pginas/links com o nico objectivo de enganar os mecanismos de pesquisa e
manipular os resultados desses mecanismos.
Quando os webmasters suspeitarem que estes Web sites violam as directrizes de
qualidade, podero modicar os Web sites para que respeitem estas directrizes e, em
seguida, clicar no link solicitar reincluso no interface de Ferramentas para webmasters
para solicitar a reavaliao do Web site.
19
Glossrio
A indexar
O processo de adicionar o contedo do seu Web site a um mecanismo de pesquisa.
Camuagem
Mostrar aos mecanismos de pesquisa contedo diferente do que mostra aos utilizadores.
Contedo dinmico
Contedo, como imagens, animaes ou vdeos, que conta com o Flash, JavaScript,
frames ou URLs criados dinamicamente.
Directrio raiz
O principal directrio ou directrio superior num sistema de arquivos de computador.
Extenso de arquivo
Nome de um arquivo de computador (.doc, .txt, .pdf, etc.) frequentemente utilizado para
indicar o tipo de dados armazenados.
HTML (Hypertext Markup Language)
Linguagem de marcao utilizada na Web para estruturar o texto.
Link em cache
Um instantneo de como uma pgina foi exibida aquando a ltima vez que o Google a
acedeu. Uma cpia em cache permite que os utilizadores visualizem uma pgina quando
a verso dinmica no estiver disponvel, embora o contedo possa ser ligeiramente
diferente. Para visualizar uma cpia em cache, clique no link em cache que aparece
abaixo de um resultado de pesquisa.
Meta tags
Uma tag no HTML que descreve o contedo de uma pgina da Web. As meta tags podem
ser utilizadas para controlar a indexao de pginas individuais num Web site.
Page Rank
Um recurso do Google que ajuda a denir o posicionamento de um Web site nos nossos
resultados de pesquisa. O PageRank conta com a natureza exclusivamente democrtica
da Web ao utilizar a sua vasta estrutura de links como um indicador do valor de uma
pgina individual. Ainda mais importante que os Web sites de alta qualidade recebem
um PageRank superior, que tido em conta sempre que o Google realiza uma pesquisa. O
Google combina o PageRank com tcnicas sosticadas de correspondncia de texto, a m
de encontrar pginas que sejam importantes e relevantes para as pesquisas.
20
Palavra-chave
Um termo que inserido na caixa de pesquisa de um mecanismo de pesquisa. O
mecanismo de pesquisa ento pesquisa pginas que incluam a palavra-chave ou frase.
Protocolo de excluso de robs
Uma especicao tcnica que d indicao aos mecanismos de pesquisa de que Web
site ou partes de um Web site no devem ser pesquisveis, e quais as partes que devem
permanecer visveis nos resultados de pesquisa.
Rastreador
Software utilizado para detectar e indexar URLs na Web ou numa intranet.
Rastreio
Processo utilizado pelos mecanismos de pesquisa para aceder a pginas da Web.
Robots.txt
Um arquivo de texto que permite que um editor da Web controle o acesso ao seu Web site
em vrios nveis, desde o Web site completo a directrios individuais, pginas de um tipo
especco ou at mesmo pginas individuais. Este arquivo mostra aos rastreadores quais
os directrios que eles podem ou no rastrear.
Sistema de gesto de contedo (CMS, Content Management System)
Sistema de software utilizado para gerir o contedo a partir de arquivos do computador, de
imagem e som para o contedo da Web.
Site espelhado
Uma pgina da Web duplicada; s vezes, utilizada para enganar os mecanismos de
pesquisa e tentar optimizar a indexao e a classicao na Web de um Web site.
URL (Uniform Resource Locator)
O endereo de um Web site na Internet, o qual consiste no protocolo de acesso (http),
nome de domnio (www.google.pt) e, em alguns casos, a localizao de outro arquivo
(www.google.com/webmasters).
Para mais informaes sobre o Centro para webmasters, visite
www.google.com/webmasters
Copyright 2008.A Google e o Google Maps so marcas registadas da Google Inc. Todos os outros nomes de
empresas e produtos podem ser marcas registadas das respectivas empresas s quais esto associados.

Você também pode gostar