Escolar Documentos
Profissional Documentos
Cultura Documentos
1 MOTORES DE BUSCA
acesso à internet o encontro de informações está se tornando cada vez mais fácil.
arquivo. A única forma de facilitar isso era conhecer as pessoas certas, as pessoas
(LEADFORD,2008).
passaram a se parecer cada vez mais com a que conhecemos hoje. Mas o primeiro
desenvolvido por Matthew Gray e com nome de Wandex. Foi o primeiro programa a
Excite em 1993
Yahoo em 1994
Lycos em 1994
Infoseek em 1995
Inktomi em 1996
Google em 1997
busca por quase todos os tipos de arquivos e documentos usando a mesma palavra
resultados, que podem ser compostos por sites, imagens, mapas, entre outros tipos.
Armazenamento
Indexação
Ordenação
Apresentação
3
informações, este rastreamento é feito pelo Crawler, conhecido também por Spider
como características, armazenar vários tipos de dados em cache 2, para que sejam
encontradas e sua localização em cada página. É este índice que permite fazer
pesquisas rápidas.
dificuldades de acessar alguns tipos de conteúdo, tais como Flash, Java Script e
formatos proprietários
Devido ao índice gerado pelo indexador ser gigantesco e para cada keyword
2
Cache é uma cópia arquivada que pode ser acessada mesmo que a informação não esteja mais
online.
4
Após todo este trabalho do motor de busca, o usuário recebe uma lista de
são aqueles que já conhecemos como o Google, o Yahoo ou o Bing. São eles quem
indexam milhares de sites e que podem gerar muito tráfego para o site e é por este
motivo que este trabalho está focado neles. As empresas gestoras destes
esta categoria de motor de busca não tem tanta capacidade de geração de tráfego
como os Motores Primários, mas são uteis em buscas regionais e mais focadas. No
Brasil os mais famosos buscadores desta categoria (Ask.com, Lycos.com) não são
muito usados, mas se a campanha de SEO for para um site internacional, este tipo
bom potencial de fonte de tráfego. Metamotores de busca são motores que buscam
6
pois retiram os primeiros resultados de uma série de outros motores, fazendo assim
FIGURA 3, mas com apenas um e-mail você poderá ter uma interface rica, com
3
Widget é um componente de uma interface gráfica.
4
Feed é um formato de dados usado em formas de comunicação com conteúdo atualizado
frequentemente.
7
mesmo que é encontrar algo de forma fácil, e parte do mesmo princípio a mais de
uma década, um campo para digitar o texto e um botão para executar a busca.
9
dessa busca que um motor de busca atualiza ou adiciona novo conteúdo a seu
banco de dados.
O Robô parte de uma lista inicial de sites, a cada site analisado ele gera uma
nova lista de sites para visitar e assim sucessivamente, formando uma gigantesca
rede interligada. Para alguns algoritmos busca, essas ligações vão servir para
Este Robô percorre esse caminho até ficar preso, ou seja, até não haver
nenhuma ligação nova ou que ele já não tenha percorrido nesse momento o Robô
volta à lista inicial e começa o processo novamente, esse ciclo não para. Em alto
funcionamento na FIGURA 6.
10
Teoricamente todo e qualquer site pode ser encontrado por Robôs sem a
de sites que são criados a cada momento o motor de busca pode demorar a
temporariamente indisponível.
pela sua estrutura ou pelo seu conteúdo. Por exemplo, páginas que precisam de
login para ser acessadas, conteúdos dinâmicos descendente das tecnologias Flash,
Para saber qual o conteúdo do site pode ser indexado pelo Robô, precisa-se
imagens desabilitadas, desta forma, pode-se ver da mesma forma que um Robô vê
o site.
2.3 INDEXAÇÃO
(RICOTTA, 2008).
tivesse um índice, a resposta para uma pesquisa poderia durar horas ou até mesmo
dias.
Árvores de sufixo
Árvores
Índices invertidos:
Índices de citação
Índices Ngram
Matriz de termos
de documentos que contém certa palavra chave podemos ver isso na FIGURA 7.
12
Mas um índice não é feito apenas de conteúdo, ele é composto também por
keyword ou uma frase, avalia uma cadeia de respostas possíveis no banco de dados
respostas ou resultado são diferentes em cada motor de busca, pois, cada um tem
Busca por lista: Com resultado restrito, este tipo de busca não é
específico.
Estes são apenas alguns dos tipos de algoritmo de busca, muitas empresas
optam por criar os seus próprios algoritmos visando sempre o aperfeiçoamento das
técnicas.
O rank é o resultado da pesquisa feita pelo motor de busca, cada motor tem
porém este resultado não é formado apenas por páginas que são ranqueadas por
é composta por várias partes, na FIGURA 9 está o menu principal, onde pode-se
acessar vários outros serviços, a caixa de busca para uma nova consulta está na
FIGURA 10, as estatísticas da busca podem ser vista na FIGURA 11, os links
3 PROCESSO DE OTIMIZAÇÃO
3.1 SEO
“Search engine optimization (or SEO for short) is the art of getting your
(GRAPPONE,2008).
empresa, pois cada motor de busca funciona de uma forma diferente, sempre há
de busca, eles são chamados de Black Hat Seo ou Search Spam. São técnicas que
diferenciado para o motor de busca, etc. Chega ao ponto de ser anti ético e os
18
motores de busca estão bem evoluídos quanto a isso, seus benefícios podem ser
bons a curto prazo, mas corre-se o risco de ser banido para sempre de um motor de
busca.
seu plano de SEO. Tendo em vista o público-alvo pode-se traçar os caminhos para
do site. Desta forma, a arquitetura do site pode ser mudada, entre muitas outras
coisas que podem sofrer mudanças, por esses motivos este ponto é muito
importante e deve receber uma grande atenção, mudanças são sempre possíveis,
Para ajudar a definir para qual caminho será o foco da otimização, faz-se
brinquedos:
19
valores elevados (classe social), com conteúdo de compreensão simples, mas com
geográfica).
“venda de brinquedos”:
geográfica) mas sem necessidade de ser culta (status social), as keywords poderiam
ser:
Sem dinheiro
Brinquedos financiados
diferentes. O trabalho de SEO nunca será igual em nenhum projeto, como cada
site são os objetivos principais de uma campanha SEO, é justamente para isso que
é criado um plano de SEO, para que visitantes encontrem o site e façam alguma
Compra de produto
Comentário em um blog
receber especial atenção, é através destes pontos específicos que vai ser possível
Muitas vezes estes pontos não serão fáceis de se descobrir, algumas vezes
sempre uma pessoa que entra no site pela primeira vez vai efetuar a compra mas*
este mesmo visitante pode voltar um mês depois e realizar a compra, a principio o
plano de SEO não deu certo, pois o visitante não efetuou a compra quando
o objetivo era apenas vender o objetivo foi cumprido. Outro exemplo são compras
21
visitante não efetua a compra de imediato, mas fica sabendo das novidades do site e
plano de SEO, por isso deve-se tomar muito cuidado no que fixar como objetivo
principal, e não se pode esquecer os caminhos possíveis para atingir este objetivo.
de entrada do site ou landing pages, são elas que receberão a maior parte do
tráfego vindo de um buscador. As melhores situações são quando estas páginas são
Quando algum visitante chegar ao site através de uma keyword como “Tosa
de cão” é justamente a página de tosa de cães que deve ser mostrada e não a raiz 5
do site do PET SHOP. Fazer a otimização desta palavra para a raiz do site pode
pois se o PET SHOP não tratar apenas de cães, a página inicial poderá mostrar
conteúdo sobre gatos ou outros animais, e a busca não foi feita com esse objetivo.
Um bom exemplo pode ser visto na FIGURA 14. Para a página inicial poderia ser
feito a otimização da keyword “Banho e tosa”, desta forma sendo genérica e serviria
5
Raiz de um site é a página inicial.
22
abordagem deve ser feita página a página separadamente, dando uma pontuação
todo.
“Ao definir a prioridade das páginas, você estará também criando um mapa
estas devem trazer um fácil caminho até a conversão desejada, este tipo de página
por mais que sejam genéricas não devem esquecer a (parte especifica da consulta)
23
página que deverá receber essa otimização deverá ser uma página genérica de
identificar em qual parte do site está assim dando a escolha para que conheça
outras áreas.
empresa Google também disponibiliza uma versão grátis do seu web analytics que
Fonte de tráfego
Quantidade de visitas
o Novos visitantes
o Retorno de visitante
24
o Visitantes únicos
Pageviews
Tempo no site
Taxa de rejeição
Localização geográfica
pode encontrar problemas ao fazer a medição dos resultados, eles geralmente são
causados por:
falta.
25
básicos de HTML6.
3.6.1 TITULOS
on-site (feita no código do site). Muitos livros dedicam várias páginas para essa tag 7.
“Probably the most important of the visible text elements is your HTML page
“There is one place on a web page where your keywords MUST be present,
“The title of your web page is probably the most important of all the on-page
“As tags title (título) são talvez as mais importantes, no que se refere à SEO
O próprio W3C diz em seu site que a tag title é o elemento de maior
qualidade da página, “the most important element of a quality Web Page” (W3C).
sumário da página.
6
HyperText Markup Language – é uma linguagem de marcação de texto utilizada para criar páginas
web.
7
São estruturas do HTML que consiste em breves instruções.
26
O título deve estar dentro das tags <title> e </title> e essa tag deve estar
<head>
</head>
Cada página deverá ter um título único e conter as melhores keywords que
representam a página.
recomenda que os títulos devam ter no máximo 80 caracteres justificando que vários
navegadores não interpretam mais do que isso. Não podemos esquecer também
caracteres em um título, apesar do Google nunca ter confirmado que isso ocorra,
nos resultados das SERPs, não é possível ver mais que 66 caracteres em um link,
Caso não seja esse o objetivo o nome da empresa deve ficar no final do
título como:
Assim como a tag de título as meta tags também ficam no header8 da página
dentro das tags <head> e </head> e elas representam informações sobre dados.
As metas tags podem ser criadas por qualquer pessoa ou agente 9, existem
várias meta tags definidas, algumas das criadas pelo W3C são;
8
Cabeçalho da página HTML fica entre as tags <head> e </head> da página.
9
Um agente pode ser um motor de busca um navegador ou até um sistema operacional.
29
Todas as meta tags tem lang como atributo, permitindo assim que uma meta
Para SEO existem a meta tag ROBOTS, que pode ser usada para vários
fins, assim como permitir e bloquear que um robô de busca indexe a página ou que
<head>
<meta name="verify-v1"
content="3hhos4KjJSKf1dhHFWa1I21bv5rgXGwtlnhkLMvjMyo=" />
<title>Título da página</title>
</head>
meta tag DESCRIPTION. A meta tag DESCRIPTION é a meta tag que descreve a
página que está sendo acessada, é a partir dela que o Google e outros buscadores
irão talvez gerar os snippets ou resumo do site, que é o parágrafo abaixo do link nas
SERPS, ver na FIGURA 17. Esse resumo também pode ser retirado de trechos do
Não só para o Google assim como para o navegante essa meta tag é
importante, pois é através deste resumo que o visitante irá ficar sabendo sobre o
Recomenda-se que esta tag por ser um resumo, não seja muito grande, até
por que na SERP aparecem apenas 2 linhas, que cada página tenha uma descrição
Evitar:
DESCRIPTION como fator para o posicionamento nas SERPs, assim como fizeram
O Google e o Bing já declaram em seus sites que não usam mais a meta tag
keyword como critério de posicionamento. A meta tag ainda é usada, pois os outros
O texto do site é o conteúdo em si, porém nem todo conteúdo é texto. E este
texto é o local ideal para colocar as keywords da página. Alias é por esse conteúdo
O texto deve ser colocado entre as tags <body> e </body> ou seja, no corpo
<b>Negrito</b>.
<i>Itálico</i>
<strong>Forte ênfase</strong>
<em>Ênfase</em>
<p>Parágrafo</p>
<span>conjunto de palavras</span>
texto deve ser escrito para o visitante e não para o motor de busca, se a keyword
não fizer sentido não a coloque no texto. Caso uma keyword esteja em algum texto
e que essa não tenha destaque, deve-se utilizar a tag <strong> para que se dê a
ênfase desejada.
“O que muitas pessoas não percebem, ao fazer a otimização dos seus sites,
é que qualquer estratégia de SEO pode ser ruim se usada em exagero, e isso inclui
o uso das suas palavras chave no texto do corpo do seu site”. (LEDFORD, 2008).
ou até um cliente detectar que na sua página contém qualquer uma destas técnicas,
Títulos
Estruturas de URLs
Navegabilidade
Conteúdo de qualidade
Texto ancora
Tags de cabeçalho
Estes fatores são os mais básicos para a otimização e não são todos.
recomenda usá-los.
visitante memorizar, fica mais elegante e a URL irá representar melhor o conteúdo
tags de cabeçalho são divididas em 6 níveis, sendo que a <h1> é para títulos </h1>
página de Tosa para Cães com a tag title <title>Tosa de cães | Pet Shop</title>:
URL: http://sitedopetshop.com.br/tosa-de-cães/
contrário da tag <title> a tag <h1> pode ser usada mais de uma vez. Deve se
observar que o uso dela é restrito para suas atribuições e não deve ser usado em
excesso.
A estrutura do site também faz parte dos fatores que devem ser otimizados,
Existem vários motivos para não querer que uma página seja indexada seja
ela por fazer parte de uma sessão restrita como paginas de login ou por
simplesmente o conteúdo delas não ter relação com o conteúdo do site. Para evitar
que estas páginas sejam indexadas e que apareçam na SERP do Google existem
várias formas:
robots.txt
.htaccess10
O bloqueio via meta tag ROBOTS é individual e deve ser feito em cada
ROBOTS.
cache dela
robots.txt e adicioná-lo na raiz do site. Ele deve ser acessível desta forma
http://site.com.br/robots.txt
user-agent: *
Disallow: /imagens/
10
Acesso de hipertexto, arquivo de configuração de acesso a arquivos.
35
Disallow: /busca
representado pelo * não deverão acessar a pasta imagens e nem o conteúdo que
está dentro dela e não deverá acessar nenhuma URL que comece por /busca.
Vale lembrar que nem todos os motores de busca são compatíveis com
robots.txt, por este motivo ele não deve ser o único meio de bloquear o acesso a
conteúdo duplicado e a partindo deste ponto, caso exista conteúdo duplicado no site
Tags em URL
Entre outros.
simples, basta utilizar a meta tag ROBOTS ou o arquivo Robots.txt. Fazer com que
cada página tenha conteúdo, títulos e descrição diferentes é uma arte e quando não
www.site.com.br
36
site.com.br
site.com.br/índex.html
www.site.com.br/index.html
conteúdo duplicado e deve ser evitado também. Para este tipo de URL deve ser
definida uma canonical que será a URL que será indexada pelo motor de busca.
mais simples foi criada pelo próprio Google. Basta adicionar o seguinte código no
canonical, e em todos os links novos e antigos devem estar apontando para esta
URL, deve-se fazer um redirecionamento das outras URLs para a URL canonical.
Este processo é um pouco desgastante, mas serve para vários outros motores de
vetoriais, com ele se pode criar animações interativas, também é chamado de Flash
o seu produto final, ou seja, a animação. Por sua facilidade de trabalhar com RIA
começaram a criar sites inteiros em Flash, porém, Flash não é um site, e sim uma
animação, por este conteúdo não ser HTML os motores de buscas tem dificuldade
de indexá-lo.
37
uma parceria para que estes sites sejam indexados e desde 2008 a Google trabalha
Para que um site em Flash seja indexado o mesmo deverá seguir padrões
do HTML aonde textos deverão ser representados por textos e não por imagens,
continua-se a ter grandes dificuldades de se conseguir uma boa posição nos SERPs
contendo o conteúdo do site que está em Flash. Esta página também serviria para
web site, porém não se deve usar em exagero, muitos sites utilizam AJAX para fazer
Pelo conteúdo do AJAX ser dinâmico, ou seja, não existir na página principal
e por esta página não conter links feitos com as tags do próprio HTML o motor de
11
Asynchronous Javascript And XML – JavaScript e XML assíncronos
38
3.7.4 DOMÍNIOS
domínio que ela é feita. Os domínios podem mudar de nome, mas nem sempre
Um site pode ser composto por vários domínios, mas para SEO devem ser
considerado múltiplos sites. Em SEO dois domínios não podem ter o mesmo
conteúdo, pois é considerado conteúdo duplicado e podem ser banidos pelo Google.
Quando o site for novo, a escolha do nome do domínio pode fazer uma
grande diferença, pois por ele ser uma URL ele deve representar o que é o site em
si. Mas esta representação pode trazer dúvidas na hora do registro do domínio. Um
exemplo seria uma empresa que quer otimizar o seu site para uma keyword, mas
Caso a empresa não queira registrar um domínio com seu nome deverá
Uma técnica boa para trazer mais visitantes ao site é fazer ponderação de
pet-shop.com.br.
pet-chope.com.br.
petchope.com.br.
sopetshop.com.br.
meupetshop.com.br;
Entre outros
ela seria a mesma, mas o endereço seria diferente. Nestas ocasiões não só para os
visitantes que ainda acessam o site pelo endereço antigo, mas também para os
permanentemente.
Para fazer este aviso é bem simples, basta fazer um redirecionamento 301,
Eric Enge que o redirecionamento 301 nem sempre vai passar todo o Page Rank
para a nova URL, mas não foi apresentada outra forma de se fazer isso, então
opções de buscas. Também existem técnicas de otimização para estas buscas que
12
Algoritmo do Google que pontua os sites.
40
vão desde imagem, passam pelo vídeo e chegam até em documentos. Alguns dos
principais buscadores oferecem uma página específica para cara tipo de busca.
Com uma simples busca por “cães” no Google conseguimos ver essa
Lembrando que essa otimização faz parte da SEO e deve ser feita utilizando
estar fazendo pesquisas sobre como identificar imagens, ela ainda não anuncio
nada sobre este assunto, então devemos voltar ao princípio que o motor de busca
41
não consegue ler a imagem, mas que ele sabe que nossa imagem é uma imagem,
As buscas locais são aquelas que o usuário define o seu intuito e região, por
exemplo: “Pizzaria em Curitiba” como na FIGURA 19. Para uma pizzaria que só tem
como “Pizza” ou “Pizzaria”. Neste caso seria mais conveniente fazer uma otimização
Curitiba”.
13
Programa que cegos utilizam para navegar na internet
42
resultados mais apropriados para o usuário de acordo com sua localização FIGURA
20, para isso o Google verifica qual a linguagem q o usuário esta usando, qual o
buscador ele está utilizando como google.com ou google.com.br e as vezes até sua
localização física.
43
Mas apenas isso não basta, até por que deve existir mais do que sete
empresas do mesmo ramo nesta mesma região, e por isso o Google também utiliza
no resultado local.
do site, como por exemplo: “A pizzaria A fica localizada na Rua abc do bairro Y na
44
cidade H, nossas pizzas são feitas com o mais branco trigo...”. Deve transformar o
pelas empresas, pois pela sua fácil interação entre empresa e seus clientes caiu ao
gosto popular.
O Google também tem uma busca especifica para blogs, mas um blog pode
Alem dos buscadores de blogs, um blog pode ter um artigo que também é
chamado de post indexado pelo buscador normal do Google, sendo assim seu
Essa é a grande vantagem do blog, com novo conteúdo, novas idéias, novas
keywords que possam ser tratadas, ou uma fixação das keywords já escolhida. O
importante é manter o mesmo foco em todos os posts. Não faria sentido para o
inteiro, o recomendado é criar um site para cada país. A justificativa para isso se dá
pela cultura, costumes e pelo seu idioma. Caso o idioma e a cultura das pessoas
desses outros países forem iguais ou parecidos com o das pessoas do país matriz,
desde o começo para esse site, pois o mesmo deverá ser no idioma nativo desse
país, o domínio deve incluir keywords nessa língua entre outras coisas que também
deve alterar como a meta tag DESCRIPTION. Um site que utiliza de meios como
JavaScript para alterar a língua pode não ter esse conteúdo indexado.
2009 levantou que 50% dos click em uma SERP vão para as 4 primeiras posições
capturar a maior quantidade possível de clicks para uma keyword, essa não é a
única função, mas é a de maior importância. SERP domination também tem como
22 pode-se ver que a falta de SERP domination abre oportunidade pare resultados
indesejados.
46
Mas SERP domination não é apenas feita de resultados textuais, ela pode
14
Sitelinks são resultados agregados ao link mãe através de seu valor para esta página.
48
subdomínios outras usam subdiretórios, mas o essencial para que isso ocorra é:
chave.
3.9.2 KEYWORDS
essenciais para SEO, não as únicas, mas as que mais são e serão usadas, pois são
Segundo Dan Sisson (2006) o Google trata as palavras separadas por hífen
como duas palavras como exemplo “pet-shop” é tratado como “pet shop” já as
http://www.w3.org/QA/Tips/good-titles.html
http://www.w3.org/TR/html4/struct/global.html
http://help.yahoo.com/l/us/yahoo/search/indexing/ranking-02.html?
pir=KaIZ0ihibUkt9IRxtBdRjxC3ClkT_RyHHxnQ1akxAzLXHqlgQIKZiQe4wKbxZbn3Zs
vHWDyZWQmIjMPNF7aNi2bBOe6YB9HjWc0B
http://www.bing.com/community/blogs/webmaster/archive/2009/07/18/head-
s-up-on-lt-head-gt-tag-optimization-sem-101.aspx
http://googlewebmastercentral.blogspot.com/2009/09/google-does-not-use-
keywords-meta-tag.html
http://googleblog.blogspot.com/2008/06/google-learns-to-crawl-flash.html
http://www.stonetemple.com/articles/interview-matt-cutts-012510.shtml