Escolar Documentos
Profissional Documentos
Cultura Documentos
Centro Tecnolgico
Engenharia de Computao
Vitria - ES
Julho de 2013
RESUMO
ABSTRACT
The research conducted by keywords in search engines is the main way to the websites.
Being placed in top search engine rankings results conveys credibility and confidence to those who
perform the research and, therefore, the work to develop websites with features that provide better
researches rankings is a promising task. Many companies have tried to "optimize" their sites to top
search positions, known as SEO (Search Engine Optimization). The SEO involves different
knowledge areas integration (information technology, marketing, economics, else), constant monitoring, keep content updated, and else. Thus, SEO is more than a research ranking improvement,
but mostly to make the search engines offer better and accurate results to those who are searching.
The main objective of this project is to study and apply techniques, metrics and SEO strategies to
verify impact keywords search rankings in the major search engines: Google, Yahoo and Bing,
checking the results and functioning tools. The motivation for this final project is to show that SEO
techniques can be employed in a company website to allow it to be among the top 10 search ranking
for the set of strings "SEO Web Vitria" in any Web search engine.
Keywords: Search Engine Optimization, SEO, SEO techniques and procedures.
Lista de Figuras
Figura 1 - Situao inicial de pesquisa para um negcio local .......................................................11
Figura 2 - Representao da mtrica do PageRank usando percentuais de probabilidade de acesso
a uma pgina. Fonte: [1] ................................................................................................................ 16
Figura 3 - Pginas sem ligaes e ciclo de links ........................................................................... 17
Figura 4 - Arquitetura em alto nvel do Google. Fonte: [7]........................................................... 19
Figura 5 - Links patrocinados / Busca orgnica. Fonte: [8] .......................................................... 23
Figura 6 - Detalhamento de consultas ........................................................................................... 24
Figura 7 - Comparao de palavras no Google Trends ................................................................. 25
Figura 8 - Sugesto de palavras no Google ................................................................................... 25
Figura 9 - Meta tag description em uma pgina Web. Fonte: [8] .................................................. 27
Figura 10 Descrio/ttulo exibidos como snippet no resultado da pesquisa. Fonte: [8] ........... 27
Figura 11 - Usurio podem subir de diretrio removendo a ltima parte da URL ........................ 28
Figura 12 - Uso de Breadcrumbs ................................................................................................... 29
Figura 13 - Nuvem de Tags no site da Amazon - http://www.amazon.com/gp/tagging/cloud ...... 33
Figura 14 - Rich Snippets. Fonte: [10] .......................................................................................... 35
Figura 15 - Exemplo de site map. Fonte: [8] ................................................................................. 39
Figura 16 - Exemplo de um XML Sitemap. Fonte: [8] ................................................................. 41
Figura 17 Exemplo do Google Analytics para um site. .............................................................. 49
Figura 18 - Resultado do PageSpeed da pgina www.ufes.br ....................................................... 50
Figura 19 - Anncios nos resultados de busca ............................................................................... 51
Figura 20 - Anlise de palavras-chave com o Google Trends ....................................................... 53
Figura 21 - Teste SEO com a ferramenta SEOquake .................................................................... 56
Figura 22- Teste de velocidade de navegao com o PageSpeed .................................................. 57
Figura 23 - Response da pgina smartsti.com.br verificado com o Web-Sniffer .......................... 57
Figura 24 Screenhoot do Google Webmaster Tools [14] ............................................................ 58
Figura 25 - Bing Webmaster [15] .................................................................................................. 59
Figura 26 - Estrutura de diretrios do site ..................................................................................... 59
Figura 27 - sitemap.xml do site smartsti.com.br ........................................................................... 60
Figura 28- robots.txt ...................................................................................................................... 61
Figura 29 - Envio do Sitemap pelo Bing ....................................................................................... 61
Figura 30 - Menu do Bing Webmaster .......................................................................................... 62
Figura 31 - Envio de URLs pelo o Bing Webmaster ..................................................................... 62
Figura 32 - Situao do site aps 3 semanas segundo o Bing ....................................................... 62
Figura 33 - Atividades do site ........................................................................................................ 63
Figura 34 - Verificao de marcao de dados pelo Bing Webmaster........................................... 63
Figura 35 - Consulta do cache do Bing ......................................................................................... 64
Figura 36 - Resultado no Bing em 1 lugar ................................................................................... 65
Figura 37 - Resultado no Bing em 5 lugar ................................................................................... 65
Figura 38 - Resultado no Bing em 3 lugar ................................................................................... 65
Figura 39 - Cache do Bing aps alguns dias ................................................................................. 66
Figura 40 - Menu de opes do Google Webmaster Tools ............................................................ 67
Figura 41 - Estado do Sipemap enviado no Google Webmaster Tools ......................................... 67
Figura 42 - Painel do robots.txt no Google Webmaster Tools ....................................................... 68
SUMRIO
1.
Introduo ................................................................................................................. 8
1.1.
Motivao ............................................................................................................ 10
1.2.
Justificativa .......................................................................................................... 12
1.3.
Objetivos.............................................................................................................. 13
2.
2.1.
PageRank ............................................................................................................. 14
2.2.
2.3.
2.3.1.
Crawlers ........................................................................................................... 19
2.3.2.
Indexadores ...................................................................................................... 20
2.3.3.
Armazenamento ............................................................................................... 21
Contedo e Palavras-chave................................................................................... 23
3.2.
3.2.1.
3.2.2.
3.2.3.
3.2.4.
3.2.5.
3.2.6.
Imagens ........................................................................................................... 30
3.2.7.
Heading tag...................................................................................................... 31
3.2.8.
3.3.
3.4.
3.4.1.
Marcao ......................................................................................................... 35
3.4.1.1.
Microdados................................................................................................... 36
3.4.1.2.
Microformatos .............................................................................................. 37
3.4.1.3.
RDFa ............................................................................................................. 38
3.5.
Sitemaps .............................................................................................................. 39
3.6.
3.6.1.
3.6.2.
X-Robots-Tag .................................................................................................... 43
3.7.
3.8.
3.8.1.
3.8.2.
3.8.3.
3.8.4.
3.8.5.
3.8.6.
3.8.7.
3.9.
4.1.
Resultados Obtidos............................................................................................... 58
4.1.1.
4.1.2.
4.2.
5.
Concluso ................................................................................................................ 76
6.
Referncias .............................................................................................................. 78
1. Introduo
O acesso informao e a servios um dos principais motivos pelo uso crescente do
uso da Internet. A informao est sendo rapidamente difundida, havendo uma produo
generalizada de contedo digital, onde todos participam de alguma forma, seja produzindo, seja
consumindo, seja distribuindo. As redes sociais, blogs, sites de notcias e os agregadores de
contedo enriquecem a experincia que os usurios obtm ao navegarem na Web.
Dado o volume de dados difundidos na Web elevado, premente a necessidade de
serem criados mecanismos facilitem a caminhada do usurio ao seu destino: a informao
desejada. Os mecanismos de busca (Google, Yahoo, Bing, etc.) tornaram essenciais, uma vez
que praticamente impossvel para um usurio chegar ao seu objetivo final sem conhecer o
endereo do destino. Alm disso, a possibilidade de se encontrar uma diversidade de
informaes ligadas a um determinado assunto bastante elevada, alm das buscas serem
cmodas, simples e rpidas. A relao entre navegar na Web e buscar a informao tornou-se
to estreita que muitas pessoas confundem Internet (e a prpria Web) com mecanismos de busca,
no conseguindo sequer navegar na rede sem uso de buscadores.
As primeiras verses das ferramentas de busca na Web foram desenvolvidas com o
propsito de criar listas por categorias a serem exploradas. Cada site receberia ento uma
atribuio segundo a sua particularidade. Estas listas eram controladas por seres humanos,
demandando uma exaustiva anlise para cada pgina na Web a ser includa em uma categoria.
O mecanismo era funcional apenas em pequena escala. Alm disso, a anlise era lenta e no
podia atribuir especificaes quanto aos assuntos e objetivos do site. A evoluo trouxe novos
conceitos relacionados busca na Web, mostrando a necessidade e tendncia a existir um
mecanismo que identificasse e classificasse as categorias e os assuntos de forma automtica e
inteligente. Com isso, comearam a surgir os precursores dos motores de busca, na qual j era
possvel realizar buscas com base em palavras-chave. Esta tendncia evoluiu e originou os
mecanismos de busca automticos que at hoje continuam sendo utilizados.
O principal (e o mais utilizado) motor de busca o Google, devido a sua simplicidade,
eficincia e qualidade nos resultados obtidos. Seu algoritmo tem sido constantemente otimizado
levando em conta diversos quesitos. Os outros motores tm obtido um crescimento de uso
razovel, porm ainda esto bem distantes da hegemonia do principal buscador. O principal
mtodo conhecido para a classificao e ordenao das pginas o PageRank [1]. O PageRank,
que foi desenvolvido pelos fundadores do Google Larry Page e Sergey Brin, um algoritmo
matemtico que atribui notas aos sites segundo as suas caractersticas e propriedades. Alm do
PageRank, o Google realiza diversas operaes, como indexao das pginas, punio por m
qualidade (contedo, referencias, etc.), classificao das pginas. Quando uma pesquisa feita,
o algoritmo do Google realiza uma classificao das pginas baseado nas palavras-chave e a
partir disso so exibidos os resultados de pesquisa baseados no que o algoritmo classificou
como mais relevante como resultado.
Um bom posicionamento no ranking das pginas retornadas numa operao de busca
um negcio que desperta grande interesse em quem os publica, principalmente empresas. Uma
boa colocao pode significar maior credibilidade, difuso, conhecimento, publicidade,
arrecadao, entre outras vantagens significativas para empresas e pessoas. Com isso, surgiram
tcnicas e procedimentos que visam otimizar1 websites (Web e mobile) para que conquistem
os primeiros lugares na classificao dos resultados de pesquisa. Estas tcnicas de otimizao
so conhecidas pelo nome SEO (Search Engine Optimization otimizao dos
motores/mecanismos de busca). SEO envolve um trabalho minucioso de pesquisa, estudo de
tendncias, integrao de diversas reas do conhecimento (tecnologia da informao, marketing,
economia, etc), constante monitoramento dos resultados de classificao, manuteno
permanente do contedo, entre outros. Alm disso, o uso de dispositivos mveis (smartphones
e tablets) tem traado diretrizes ainda mais abrangentes e complexas para as estratgias de SEO,
principalmente na forma e na experincia do usurio em lidar com a informao e seus
resultados. Outras tcnicas de otimizao diretamente ligadas ao SEO so: (i) SMM (Search
Media Marketing) a rea responsvel por toda estratgia de marketing dentro das mdias
sociais; (ii) SEM (Search Engine Marketing) utilizando como estratgia o prprio SEO, alm
dos links patrocinados e outras ferramentas e (iii) SMO (Social Media Optimization)
otimizao utilizando mdias sociais para promover acessos a pginas Web.
O termo otimizar neste projeto entendido como aplicar tcnicas em SEO numa pgina Web que podero
apresentar melhores classificaes nas buscas por palavras-chave.
1
10
1.1. Motivao
As pesquisas atravs de dispositivos mveis cresceram cerca de 30 vezes nos ltimos
dois anos [3]. Estatsticas indicam que os usurios passaram a realizar mais buscas, uma vez
que, com dispositivos mveis usurios pesquisam em qualquer lugar e em qualquer hora. Com
isso, o trabalho de SEO adquire diversas propriedades como localizao, resultados especficos
para Web/celular/tablet diferenciados uns dos outros, manipulao de resultados segundo perfil
do usurio, estratgias de marketing diferenciadas, entre outras. Existe uma previso de que a
partir de 2013 existiro mais pessoas usando celulares do que computadores para o acesso
Web [4]. Isso mostra que existe um grande mercado de trabalho em SEO, marketing digital e
determinao de perfis de usurios. Outro fato que existem poucos profissionais e empresas
que realizam este tipo de servio atualmente. A unio de recursos de TI com estratgias de
marketing e publicidade pode ser um aliado valioso para gerar lucro para as empresas, pois
atravs destes possvel difuso da informao (interesse essencial de todas as empresas). A
conquista das melhores colocaes nos rankings no depende unicamente do esforo dos
mecanismos de busca, mas tambm do trabalho intenso em SEO no desenvolvimento dos
websites das empresas. Estar entre os primeiros (de preferncia na primeira ou segunda
colocao) aps uma busca significa transmitir credibilidade e confiabilidade aos clientes em
potencial, alm de gerar um maior nmero de acessos ao site de empresa, o que pode resultar
em crescimento nos seus negcios e no seus lucros.
A Figura 1 mostra o resultado produzido pelo Google, Bing e Yahoo (respectivamente,
da esquerda para a direita) para uma possvel busca de empresas especializadas em SEO, na
cidade de VitriaES, a partir das strings SEO Vitoria. No est em discusso aqui se a string
a mais adequada para isso. Entretanto, trata-se de um procedimento tpico de usurios que
buscariam esse tipo de servio. Como pode ser observado, nenhum dos resultados apresentado
se refere a uma empresa que realize este tipo de servio.
11
12
as 10 primeiras posies do ranking de busca pelo conjunto de strings SEO Web Vitria em
qualquer um dos buscadores anteriores. Do ponto de vista de empresa, a melhoria na posio
do ranking tem o potencial de aumentar o retorno nos negcios realizados com clientes que
chegam empresa atravs da busca por strings com palavras-chave usando um navegador Web.
1.2. Justificativa
O trabalho de desenvolver websites com recursos que propiciem melhores classificaes
nas pesquisas constitui-se num excelente mercado para profissionais de TI. As empresas tm
procurado otimizar seus sites para melhores posicionamentos nas buscas. Alm disso, a
otimizao tem ferramentas que auxiliam estratgias de marketing podendo ser implementada
em conjunto com o trabalho de SEO. O SEO mais que uma melhoria no ranking de pesquisas,
mas principalmente fazer com que os mecanismos de busca ofeream resultados mais bem
direcionados e precisos a quem est pesquisando.
No Brasil, poucas empresas esto realizando este tipo de trabalho, muito menos no
estado do Esprito Santo. A procura de servios especializados em SEO tem sido alta, o que
comprova que um mercado amplo e promissor para se atuar. Outra questo que o uso de
dispositivos mveis tem ampliado o interesse das empresas adaptarem seus contedos Web para
as plataformas mveis melhorando a experincia do usurio e direcionando as buscas com
resultados interessantes para quem usa estes dispositivos (resultados influenciados pela
localizao, opo de ligar diretamente pelo resultado da busca, etc.). A partir do conhecimento
e pesquisa nesta rea, surge o interesse e possvel adquirir experincia e atuar neste negcio
podendo ao longo do tempo conquistar clientes potenciais. Para desenvolver um bom trabalho
nesta rea, preciso domnio das tcnicas e mtodos, alm de um bom conhecimento do nicho
que o cliente atua, e minha atuao no meu Projeto de Graduao me auxiliar no
aperfeioamento e desenvolvimento na empresa.
13
1.3. Objetivos
O objetivo principal estudar e aplicar tcnicas, mtricas e estratgias para verificar a
repercusso na classificao de busca por palavras-chave na busca orgnica nos principais
mecanismos de busca Google, Yahoo e Bing verificando o resultado e o funcionamento das
ferramentas.
Os objetivos especficos que apoiam a realizao do SEO so:
14
2. Conceitos Tericos
Os mecanismos de busca na Web so extremamente robustos e envolvem integrao de
diversos sistemas de computao e reas do conhecimento, como a matemtica e a estatstica.
Para que estes mecanismos de busca sejam viveis para o uso em grande escala preciso que
haja uma tecnologia de rastreamento rpida para adquirir os documentos da Web e os manterem
atualizados (dezenas de milhes de pginas adicionadas e alteradas por ano [5]), o
armazenamento de dados deve ser eficiente para armazenar os ndices gerados pelo
rastreamento, o processamento das informaes indexadas devem ser eficiente e tambm as
consultas devem suportar uma alta taxa de pesquisas (atualmente o Google processa mais de
um bilho de consultas por dia [6]). O custo e desempenho de hardware como busca em disco,
e robustez em sistemas operacionais so fatores extremamente relevantes para esses
mecanismos, considerando a taxa de crescimento da Web e das mudanas tecnolgicas.
O Google foi projetado para lidar com dados em larga escala, fazendo uso eficiente do
espao de armazenamento para armazenar os ndices e as estruturas de dados so otimizadas
para rpido acesso (ser detalhado posteriormente). Os detalhes a seguir mostram detalhes sobre
a arquitetura e o funcionamento de Google, mas tambm enquadra os principais mecanismos
de busca atuais que seguem a mesma linha de tecnologia.
A partir dos diversos quesitos de projeto, foram desenvolvidos alguns conceitos e
arquiteturas para o projeto de um mecanismo de buscas na Web eficaz que sero abordados a
seguir. Todo o texto a seguir deste captulo est fundamentado na referncia [7].
2.1. PageRank
O principal e primordial indicador de classificao utilizado pelos mecanismos de busca na
Web o PageRank, que foi introduzido por Sergey Brin2 e Lawrence Page2 em 1998 em um
artigo cientfico [1]. O PageRank um modelo matemtico probabilstico que foi adaptado s
necessidades para um conceito de classificao. Antes dos mecanismos de busca, as pginas
eram localizadas atravs de listas classificadas por categorias e eram definidas atravs da
anlise humana no sendo um processo vivel para uma alta escala e oferecendo resultados, na
Fundadores do Google
15
maioria das vezes, irrelevantes aos usurios. Para se criar um modelo de classificao por
relevncia de uma determinada pgina na Web preciso compreender de que maneira ser
definida uma pgina relevante. As pginas da Web possuem referncias entre as mesmas
criando uma estrutura encadeada que define seus relacionamentos. A partir de ento, percebeuse que uma estrutura de links e os textos de link disponibilizam muitas informaes para anlise
e julgamento da qualidade e relevncia de uma pgina na Web.
O Google definiu como essncia de classificao dois principais fatores: (1) a estrutura de
links na Web para calcular a classificao de relevncia em cada pgina na Web (que foi dado
o nome de PageRank) e (2) os textos nos links para melhorar esta classificao. Alm destes
dois, atualmente o Google considera mais de duzentos outros fatores para determinar a
relevncia de uma pgina na Web, sendo que parte destes sero descritos posteriormente neste
trabalho.
Uma pgina na Web possui um bom PageRank se possui boas referncias que direcionam
a ela, ou seja, pginas relevantes (bem classificadas) apontam para esta. Com relao ao modelo
matemtico do PageRank, pode ser entendido a partir de um modelo de comportamento de um
usurio. Supondo que um usurio aleatrio ir acessar uma pgina na Web aleatria e este
usurio ir permanecer clicando em links sem voltar em momento algum pgina anterior,
conforme mostra a Figura 2. A probabilidade deste usurio acessar uma determinada pgina
ser o seu PageRank. Portanto, o PageRank um ndice que calculado atravs da estrutura de
links que indica a probabilidade de acesso a uma determinada pgina na Web e tambm sua
importncia em relao s demais pginas na Web.
16
Figura 2 - Representao da mtrica do PageRank usando percentuais de probabilidade de acesso a uma pgina. Fonte: [1]
(1 ) (2 )
( )
+
+ +
(1 )
(2 )
( )
17
()
()
B
D
(1 )
()
+
()
18
momento.
(1 , )
(1 )
(2 , 1 )
(1 )
=[
]+
( , )
(1 )
( , )]
[( , 1 )
Equao 3 - Forma matricial do PageRank. Fonte: [1]
19
2.3.1. Crawlers
O processo de rastrear o contedo da Web, chamado pelo Google de Web Crawling. O
rastreamento feito atravs de um conjunto de aplicaes denominadas Googlebots (conhecido
tambm como bots, robs ou spiders), que descobrem pginas novas e/ou atualizadas para
serem includas no ndice do Google.
Para adquirir o contedo das pginas, o Googlebot realiza uma espcie de simulao de
navegao da mesma forma que um usurio atravs do navegador Web, conhecido como postprocessing. Um endereo requisitado, e ento devolvido uma resposta que extrada e
armazenada.
O Web Crawling uma aplicao complexa, pois exige interao com milhes de
servidores Web e diversos name servers o que est fora de controle do sistema. Ele realizado
atravs de um sistema de rastreadores distribudos para que este rastreamento se realize em
tempo til. Os crawlers so alimentados atravs do URL Server que disponibiliza endereos
para serem rastreados. Cada crawler pode manter aproximadamente trezentas conexes abertas
ao mesmo tempo, melhorando o desempenho para adquirir as pginas Web e lidar com outras
20
2.3.2. Indexadores
O sistema de indexao um sistema complexo e envolve diversas funcionalidades.
Como seu prprio nome diz, o objetivo da indexao criar ndices a partir dos dados e
informaes contidos no repositrio e distribuir ndices de maneira que possa ser criada uma
estrutura sistematizada para o relacionamento das partes que fazem parte da arquitetura do
mecanismo de busca.
A indexao composta por trs procedimentos: indexador, ordenador e parser. Uma
vez disponibilizados os dados no repositrio, o indexador realiza a leitura dos chamados
documentos, que so os diferentes tipos de dados armazenados no repositrio, como: texto,
HTML, PDF, imagens, sons, arquivos de log, entre outros. Estes so descompactados, para em
seguida passarem por uma anlise de palavras que feita pelo parser. Esta anlise feita,
convertendo cada documento para uma estrutura de dados chamada hits que armazena o
conjunto de ocorrncia das palavras. Nos hits ficam registradas a sua posio no documento e
dados de formatao (tamanho da fonte, maiscula/minscula, etc.). O indexador distribui os
21
hits em uma estrutura denominada barrel que uma espcie de banco de hits, onde estes so
inseridos de forma ordenada segundo seus ndices de documento (docID 3 ). Alm disso, o
indexador analisa os links presentes em cada pgina Web extraindo e armazenando as
informaes importantes nos arquivos anchors que mantm registrado informao de onde cada
link pertence, para onde ele aponta e o texto ancorado a este link. Os anchors so lidos pelo
URL Resolver e as URLs so convertidas para URLs absolutas e associando um docID. O URL
Resolver tambm cria um ndice para os textos do link e o associa ao docID no qual o link
aponta e tambm gera uma base de dados com os links que fazem parte de um docID. Essa base
de dados utilizada para computar o PageRank das pginas na Web e documentos.
O ordenador tem a funo de reordenar os hits contidos nos barrels segundo wordID4
para gerar um ndice invertido com as palavras, produzindo uma lista de wordIDs e o offset dos
ndices invertidos.
2.3.3. Armazenamento
O armazenamento de todos documentos so feitos no repositrio. Neste, todos os dados
antes de serem inseridos passam por um sistema de compresso realizado pelo Store Server que
utiliza a biblioteca de compresso de dados zlib que funciona em multiplataformas. A escolha
desta ferramenta deu-se em razo do excelente desempenho, em termos de tempo, nas
compresses realizadas em relao outras ferramentas. Essas compresses conseguem reduzir
o espao em disco em torno de trs vezes.
No repositrio, os documentos so armazenados sequencialmente e em cada pacote
(estrutura de dados que contm os dados comprimidos e informaes sobre estes dados) so
registradas informaes como docID, tamanho e URL.
docID uma identificao que cada pgina na Web recebe quando uma nova URL analisada durante a indexao de uma pgina.
4 Identificao que cada palavra distinta possui que atribuda pelo indexador.
3
22
23
24
para que corresponda s suas expectativas. Deve-se ter o cuidado, por exemplo, para que no
haja uso excessivo de palavras-chave repetidas para tentar enganar os mecanismos de busca.
Isto no considerada uma prtica honesta, gerando uma penalizao na classificao. Outro
ponto a ser considerado que quanto mais especfico, melhor o contedo, pois contedos muito
abrangentes e genricos aumentam a possibilidade da obteno de resultados inadequados na
hora da pesquisa. Por exemplo, uma pgina de uma loja de sapatos deve informar no apenas
conter informaes institucionais e produtos, mas deve especificar os tipos de sapato, materiais
usados, se vendem masculino e/ou feminino, detalhes sobre cada produto, localidade, etc.
Quando usurios fazem pesquisas mais especficas (principalmente, buscando produtos),
pginas com contedo mais bem especificados so melhores classificadas. A Figura 6 mostra a
diferena entre resultados de buscas genricas e especficas na busca por sapatos, por exemplo.
Para que seja feito um estudo sobre a melhor possibilidade de uso de palavras-chave, o
25
26
27
pgina> (Figura 9). Ela deve ser escrita levando em conta as palavras-chave que melhor
representam o contedo da pgina, oferecendo um breve resumo de aproximadamente um
pargrafo. Deve-se ter o cuidado de no elaborar uma descrio muito longa, nem mesmo
pequena ao ponto de no descrever corretamente o contedo ou assunto. Alm disso, a descrio
de cada pgina deve ser nica. O Google penaliza pginas com descries sem relao com o
contedo, descries genricas (como: Pgina sobre sapatos), descries preenchidas apenas
com palavras-chave e contedo da pgina copiado para a descrio. Sites que possuem centenas
ou milhes de pginas so tratados de uma maneira um pouco diferenciada, no penalizando a
gerao automtica de descries.
Outro ponto importante sobre as descries que elas podem ser utilizadas, na maioria
das vezes, como snippets5, sendo que as palavras correspondentes pesquisa so indicadas em
negrito, sendo assim uma excelente oportunidade para atrair cliques, como mostra a Figura 10.
Nome dado ao resumo apresentado como resultado da pesquisa, abaixo de cada link listado como resultado.
28
Breadcrumbs so auxiliares de navegao que aparecem geralmente no topo da pgina, indicando o nvel
hierrquico do site em que se encontra o internauta, permitindo que este facilmente retorne s pginas navegadas
anteriormente.
6
29
30
referenciada, alm de mascarar endereos. O texto ancorado deve ser produzido seguindo as
mtricas de elaborao de contedo e palavras-chave. Este texto deve ser descritivo e conciso,
de maneira que contenha ao menos uma ideia bsica a respeito do que se refere pgina linkada,
evitando o uso de textos no relacionados com o contexto, textos genricos (clique aqui),
usando a prpria URL e textos longos como um pargrafo. Deve-se sempre distinguir uma ancora de um texto comum, para no prejudicar a experincia dos usurios, fazendo-os perder
links ou clica-los acidentalmente. Links quebrados tambm devem ser verificados e removidos
para no ser penalizado na classificao de busca.
Os links externos possuem um peso no clculo do PageRank, porm determinadas pginas com m reputao ou maliciosas prejudicam a classificao de um site nas pesquisas. Em
pginas que apenas um administrador controla o contedo no necessrio se preocupar com
esse aspecto, porm em pginas que contm iterao com usurios e colaborao de terceiros
importante ter cautela com o uso de links. Para isso existe o atributo rel=nofollow que quando
os robs de busca realizam a indexao e classificao de um site, quando eles enxergam este
atributo em um link, eles desconsideram aquela referncia. Em blogs, fruns e outros extremamente importante tomar o cuidado de inserir este atributo nos links para que usurio mal
intencionados no prejudiquem a classificao com links de m reputao e spam.
3.2.6. Imagens
Imagens no podem ser compreendidas pelos mecanismos de busca. Elas podem exercer
um papel importante na melhoria da classificao em um site se tratadas de maneira correta,
pois esto presentes em quase todos os sites na Web. Para que os mecanismos de busca
compreendam do que se trata uma imagem so necessrios trs procedimentos bsicos. O
primeiro o uso do atributo alt que tem a finalidade de descrever um texto alternativo imagem
e os mecanismos de busca o utilizam para indexar aquela imagem para pesquisa de imagens e
relacionar a imagem com o contexto em que ela est imersa. Essa descrio deve ser curtas,
porm descritivas. O segundo procedimento atribuir um nome associativo ao arquivo, por
exemplo: em um site de compras de sapatos, interessante atribuir imagem de um sapato algo
como sapato-couro-masculino-ref01.jpg. O ltimo procedimento organizar os arquivos de
imagem de forma centralizada, inserindo todos em um nico diretrio, pois facilita os
mecanismos de busca encontrarem imagens no site.
31
Extenses das imagens devem ser JPEG, GIF, PNG ou BMP que so os formatos
suportados pela maioria dos navegadores;
As imagens tambm podem ser usadas como links, porm somente quando for realmente
necessrio que recomendado o uso deste recurso, pois seu uso excessivo atrapalha os
mecanismos de busca compreenderem as referncias com seu contedo. Neste caso, o atributo
alt funciona de maneira similar ncora nos links.
32
33
34
page, calculavam o PageRank atravs do esquema de links e ento as pginas eram classificadas.
O universo da Web trouxe diversas propriedades que aperfeioaram essa classificao,
adicionando outros fatores que envolvem o relacionamento das pessoas com um site. Esse
relacionamento dado atravs das mdias sociais, blogs, e-mails e outros. A essncia dos fatores
off-page que quando uma pgina visitada, se esta apresenta contedos de qualidade,
relevantes e nicos, a tendncia que haja uma difuso daquela pgina gerando uma certa
publicidade. Funciona da mesma forma quando uma pessoa compra algum produto e se
satisfeito faz recomendaes a amigos. Portanto, cada recomendao vista como uma citao,
ou um voto de confiana perante outros usurios de que aquele contedo relevante. Com isso,
quanto mais citada uma pgina, maior ser sua popularidade, e ento esta recebe maior
importncia na ordem de classificao. Exemplos de fatores off-page so: comentrios em blogs
sugerindo link, anncios (banners, blogs), e-mail marketing (Newsletter), links em pginas de
parceiros (desde que no seja realizado esquema de troca ou aluguel de links), feed de notcias
(RSS) e marcao de localizao no Google Places (auxilia nas pesquisas locais). Outro fator
extremamente relevante so as mdias sociais. Existe um campo em SEO que promove a
otimizao nos resultados de busca atravs das redes scias, conhecido como SMO (Social
Media Optimization). Este segmento realiza atividades em torno de um negcio, realizando um
trabalho publicitrio, criando pginas sociais associadas ao negcio, publicando notcias e
informaes referentes ao contexto, atraindo um pblico para aquele segmento.
Consequentemente, gera converses (visita seguida de venda) para o site. Permitir
compartilhamento de contedo diretamente de uma pgina importante para possibilitar
divulgao, desde que no seja aderido a um esquema de promoo artificial. O resultado deste
trabalho reconhecido pelos mecanismos de busca que ponderam a popularidade e considera
este fator no momento da classificao.
35
3.4.1. Marcao
O termo utilizado para fazer as especificaes do contedo das pginas chamado de
marcao, que podem ser feitas utilizando trs formatos: Microdados, Microformatos e RDFa
que podem ser verificados e testados com o link da pgina, antes que sejam exibidos como
resultado de pesquisa. Aps a marcao, na prxima indexao do Google ele j ir detectar os
rich snippets.
A marcao de rich snippets deve no apenas descrever o contedo de uma pgina, mas
36
3.4.1.1. Microdados
Os microdados usam atributos simples em tags HTML para atribuir nomes curtos e
descritivos a itens e propriedades. Um exemplo de um bloco pequeno de HTML mostrando as
informaes bsicas de um contato:
<div>
Meu nome Bob Smith, mas todos me chamam de Smithy. Esta a minha pgina inicial:
<a href="http://www.example.com">www.example.com</a>
Moro em Albuquerque, Novo Mxico, e trabalho como engenheiro na ACME
Corp.
</div>
37
I.
Na primeira linha, o itemscope indica que o contedo um item. itemtype="http://data-vocabulary.org/Person indica que o item uma pessoa.
II.
Cada propriedade do item Pessoa identificada com o atributo itemprop. Por exemplo, itemprop="name" descreve o nome da pessoa.
III.
3.4.1.2. Microformatos
Os microformatos so convenes simples (conhecidas como entidades) utilizadas para
descrever um tipo especfico de informao, por exemplo, uma avaliao, um evento, um
produto, uma empresa ou uma pessoa. Cada entidade tem suas prprias propriedades, por
exemplo, uma pessoa tem as propriedades nome, endereo, cargo, empresa e endereo de email. Em geral, os microformatos usam o atributo class em tags HTML para atribuir nomes
curtos e descritivos a entidades e suas propriedades. Um exemplo de um bloco pequeno de
HTML mostrando as informaes bsicas de um contato.
<div>
<img src="www.example.com/bobsmith.jpg" />
<strong>Bob Smith</strong>
Editor snior da ACME Reviews
200 Main St
Desertville, Arizona 12345
</div>
38
I.
Na primeira linha, class="vcard" indica que o HTML includo descreve uma pessoa.
II.
O exemplo descreve propriedades do item pessoa, como uma foto, nome, cargo, organizao e endereo.
3.4.1.3. RDFa
RDFa uma forma de nomear o contedo de modo a descrever um tipo especfico de
informao, como uma resenha de restaurante, um evento, uma pessoa ou uma listagem de
produtos. Estes tipos de informaes so chamados entidades ou itens. Cada entidade tem um
nmero de propriedades. Por exemplo, uma pessoa tem as propriedades nome, endereo, cargo,
empresa e endereo de e-mail.
Em geral, RDFa usa atributos simples em tags XHTML para atribuir nomes curtos e
descritivos a entidades e propriedades. Um exemplo de um bloco pequeno de HTML mostrando
as informaes bsicas de um contato mostrado a seguir.
<div>
Meu nome Bob Smith, mas todos me chamam de Smithy. Esta a minha pgina
inicial:
<a href="http://www.example.com">www.example.com</a>.
Moro em Albuquerque, Novo Mxico, e trabalho como engenheiro na ACME Corp.
</div>
39
O exemplo comea com uma declarao de namespace usando xmlns. Isso indica o na-
I.
III.
IV.
3.5. Sitemaps
Existem dois tipos de mapas de site que so utilizados e ambos com finalidades distintas. O
primeiro, site map (mapa de site) uma simples pgina em um site que exibe a estrutura do site,
listando uma hierarquia das pginas de um site, que so teis aos usurios quando estes tem
alguma dificuldade em encontrar alguma pgina. Mesmo que os mecanismos de busca rastreiam
esta pgina, ela voltada principalmente para os usurios, podendo melhorar sua experincia.
40
41
Alm do formato padro acima, possvel produzir Sitemaps mais simples em formato
txt que incluem somente URLs de pginas da web, e no imagens, vdeo ou outros dados
especializados. Basta informar uma URL por linha e salvar no modo txt antes de enviar.
Para informar aos mecanismos de pesquisa sobre o local e a existncia de um Sitemap,
deve-se incluir a seguinte linha no arquivo robots.txt:
sitemap: http://www.example.com/sitemap.xml
42
Neste exemplo, apenas os URLs que correspondem a /pasta2/ no sero permitidos para
o Googlebot.
Alm das duas regras, pode-se usar outra pouco usada: Allow que til quando desejase criar excees alguma regra determinada pelo Disallow.
Existe uma lista de mais de trezentos robs em operao que rastreiam a Web que pode
ser encontrada na pgina www.botsvsbrowsers.com. Os detalhes de definio de bloqueio de
user-agents e padres de correspondncia podem ser encontrados na facilmente em diversas
documentaes na Web. Para utilizar o robots.txt preciso apenas coloc-lo na raiz do site, por
exemplo: http://www.example.com/robots.txt .
43
Para permitir que outros robs indexem a pgina de um site, impedindo somente os
robs do Google de indexar sua pgina:
<meta name="googlebot" content="noindex">
Ao usar a meta tag noindex em uma pgina, o Google remover a pgina por completo
de seus resultados de pesquisa, mesmo se houver outras pginas vinculadas. No entanto, outros
mecanismos de pesquisa podem interpretar essa instruo de modo diferente, podendo aparecer
nos resultados de pesquisa.
3.6.2. X-Robots-Tag
O X-Robosts-Tag pode ser usado como um elemento de HTTP response para uma dada
URL. Qualquer tipo de restrio e bloqueio realizado pela metatag pode ser realizado pelo XRobots-Tag.
Para definio das restries pode ser feita atravs do servidor Web utilizado, como por
exemplo o Apache. Para adicionar o X-Robots-Tag ao HTTP response de um site usando
o .htaccess e httpd.conf que so padres em servidores Web baseados no Apache. A vantagem
de do uso de X-Robots-Tag que pode-se aplicar regras de rastreamento por todo o site, pelo
grande suporte a expresses regulares. Por exemplo, para adicionar um noindex ou nofollow
ao HTTP response para todos arquivos com extenso PDF em todo o site deve-se inserir o
seguinte cdigo nos arquivos .htaccess e no httpd.conf:
44
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>
45
46
47
Texto traduzido por uma ferramenta automtica sem reviso humana antes da publicao.
48
49
Outra ferramenta importante para anlise dos resultados a PageSpeed (Figura 18) do
Google que faz uma anlise da qualidade de desempenho de navegao. Com ela possvel
verificar o que pode ser feito para melhorar a velocidade de navegao, com instrues de como
faz-las. Alm disso, uma nota dada a pgina avaliando a qualidade de otimizao para
navegao.
50
3.10.
Alm da busca orgnica, existe a possibilidade de criar campanhas para links patrocinados.
Os links patrocinados do Google so exibidos como resultados de pesquisa, porm so
destacadas do resultado da busca orgnica e podem aparecer em outros sites como banner ou
em forma de link. Esta uma soluo que pode ter um custo alto, tendo a possibilidade de
alcance segmentado, utilizando o Google Adwords (Figura 19).
51
Para criar campanhas de links patrocinados preciso criar uma conta no Google e seguir
os passos no Google Adwords de maneira bem simples. Alm disso, possvel monitorar e
acompanhar o desempenho e verificar sugestes e fatores indicativos que podem gerar
resultados positivos para maior acesso.
Tendo apresentado os principais desafios e fatores que influenciam na classificao dos sites
pelos mecanismos de busca, possvel iniciar o trabalho a ser desenvolvido por um profissional
de SEO. O prximo captulo apresenta o estudo de caso deste projeto, aplicando as tcnicas
apresentadas neste captulo. No estudo de caso, um site real de uma empresa ter sua
classificao melhorada com a aplicao das tcnicas e procedimentos apresentados neste
projeto e os resultados sero analisados comparando os principais mecanismos de busca.
52
4. Estudo de Caso
O
estudo
de
caso
foi
realizado
utilizando
um
site
preexistente
na Web
(http://smartsti.com.br), que foi desenvolvido inicialmente sem nenhum tipo de otimizao para
mecanismos de busca. Este site foi reestruturado e foram aplicadas as tcnicas on-page e offpage descritas nos tpicos anteriores com o objetivo de analisar a melhoria da classificao
orgnica nos resultados de busca no Google, Bing e Yahoo.
Como a empresa tem um foco no mercado local, as otimizaes no site foram feitas tendo
em vista este tipo de cliente potencial, ou seja, aquele que realiza a busca de um contedo
(informao) associado a algo com proximidade fsica do local onde a pesquisa realizada.
Para realizar o trabalho de SEO, foi necessrio seguir algumas etapas fundamentadas nos
princpios citados nos captulos anteriores, e assim permitir que os robs rastreiem as URLs e
informaes do site da empresa e que os resultados produzidos pelos mecanismos de busca
coloquem o site da empresa o mais prximo do topo dos seus ndices.
O primeiro passo realizado foi a pesquisa e o planejamento de contedo. A pesquisa foi
baseada numa anlise do mercado, verificando como os concorrentes trabalham, a qualidade
dos seus sites, o tempo de permanncia da Web, a imerso nas redes sociais e, em alguns casos,
inspecionar o cdigo HTML de pginas concorrentes para verificar se foi feito SEO para que
na fase de planejamento possa tomar algumas medidas para aprimorar o que foi feito por
concorrentes.
Na fase de planejamento foram definidas as estratgias de contedo, que definem os
assuntos abordados, quais pginas seriam criadas, analise de palavras-chave (Figura 20) e
demais tarefas referentes ao contedo (assunto, texto e imagens). Alm disso, importante
definir uma lista de pesquisas por palavras-chave como meta de classificao, definindo a
posio nos resultados de busca e o tempo desejado para este objetivo, por exemplo: uma
pgina A de um site tem o assunto B e eu desejo que nas pesquisas com as palavras (C D E)
tragam esta pgina entre os 10 primeiros resultados nos prximos seis meses. Estas atividades
so importantes pois: (i) auxiliam a elaborao de textos fundamentados no que foi definido,
propiciando contedos mais relevantes, evitando que sejam criadas pginas com assuntos
genricos, com pouco contedo ou irrelevantes e (ii) definem mtricas para analisar os
resultados.
53
54
Fatores On-Page
Tarefas
Situao Inicial
Aps SEO
NO
NO
SIM
NO
NO
NO
NO
SIM
NO
SIM
SIM
NO
NO
NO
NO
SIM
SIM
NO
SIM
NO
SIM
SIM
NO
SIM
NO
SIM
NO
NO
SIM
NO
NO
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
NO
SIM
SIM
SIM
SIM
SIM
NO
SIM
SIM
NO
NO
NO
NO
SIM
SIM
SIM
SIM
SIM
SIM
55
Fatores Off-Page
Tarefas
Situao Inicial
Aps SEO
SIM
NO
SIM
NO
NO
NO
SIM
SIM
SIM
SIM
SIM
SIM
Aps a realizao das atividades do checklist, todo o site foi publicado (submetido ao
servidor de hospedagem) para em seguida fazer uma srie de testes para conferir erros, verificar
a qualidade de navegao (se existem problemas de sobrecarga para navegao) e algumas
medidas que, por algum motivo, no foram realizadas.
O SEOquake [11] (plugin instalado no navegador Firefox) faz diversas verificaes,
disponibiliza estatsticas de rastreamento e indexao, analise de SEO, informaes de redes
sociais e diversos outros detalhes. importante destacar que estas ferramentas de SEO so
simplesmente para auxiliar o trabalho de SEO e, portanto, algumas informaes
disponibilizadas nem sempre so necessrias cabendo ao profissional discernir o melhor a ser
feito.
O PageSpeed [12] uma ferramenta do Google que d uma nota de 0 a 100 da qualidade
relacionada ao tempo e desempenho de navegao de uma pgina e informa os problemas,
detalhando o nvel de relevncia de cada um, sugerindo solues reais que podem trazer
resultados importantes para a navegao do site, que uma mtrica adotada pelos mecanismos
de busca como classificao nos resultados de busca.
Outra ferramenta importante para verificao dos resultados obtidos a partir das
requisies das URLs de um site o HTTP Web-Sniffer [13]. Ele permite analisar o Header
do Request e o Response de uma pgina que til para verificar se o servidor est realizando a
compresso corretamente, bloqueio de agentes e robs, codificao, cache, formato de conexo
56
57
58
Uma vez realizados os testes e verificaes, devem ser tomadas medidas necessrias para
correo dos problemas pendentes para que esteja tudo pronto para a ltima fase que a de
monitoramento dos robs de busca e do estado dos ndices dos mecanismos de busca e
verificao dos resultados.
O Webmaster um profissional capaz de realizar tarefas tanto de um web designer (elaborao do projeto esttico e funcional de um web
site) quanto de um web developer (que faz a parte da programao, como sistemas de login, cadastro, rea administrativa).
59
O site http://smartsti.com.br possui uma estrutura simples, conforme mostra a Figura 26.
Ele contm um diretrio para as imagens (/images), outros dois com folhas de estilo
(/stylesheets) e scripts (/scripts), um com as pginas de servios, e os demais foram
configurados para no serem rastreados, pois no tem utilidade para este site. Alguns arquivos
na raiz compem pginas e os demais so para configurao do servidor, controle de
rastreamento, Sitemap e verificao de autoridade de pgina, exigida para o monitoramento
pelas ferramentas para webmasters. No total os site contm 5 pginas e a pgina 404. Alm
disso, contm 130 arquivos de imagens, 15 arquivos de scripts e 6 folhas de estilo (CSS),
totalizando 3.07MB de contedo publicado.
60
O robots.txt foi definido de forma bem simples restringindo algumas URLs e diretrios que
no eram desejados que fossem rastreados por nenhum rob de busca e nenhum mecanismo de
busca, alm de definir a localizao do sitemap.xml .
61
O Bing Webmaster disponibiliza algumas outras funcionalidades, como: enviar URLs para
serem indexadas (solicitao); bloquear URLs; remover cache e diversas informaes de
estatsticas sobre o site; alm de diagnsticos e ferramentas.
62
Conforme pode ser observado na Figura 32, extrada do Bing Webmaster, a situao aps 3
semanas foi de 5 pginas rastreadas (total de 5) e 10 pginas indexadas (total de 5,
possivelmente as pginas antigas ainda esto contabilizadas no ndice) e 18 URLs rastreadas (o
total varia de acordo com o que cada mecanismo de busca considera como URL, por exemplo:
imagem, folha de estilo, XML, PDF, etc.).
63
Foram enviadas as URLs das pginas do site, conforme mostra a Figura 31, solicitando o
Bing rastrear e indexar estas pginas. O resultado foi praticamente imediato. Em algumas horas
o ndice do Bing j continha as novas pginas (conforme a consulta especial mostrada na
64
Figura 35) mesclados com URLs j removidas presentes na verso antiga do site.
Os resultados obtidos durante as buscas pelo Bing foram satisfatrias. Como pode ser
observado nos exemplos de busca das Figuras 36, 37 e 38, foi conquistado o resultado entre
as 10 primeiras posies para mais de uma pesquisa no Bing.
65
Observou-se que, cerca de dois dias aps efetuar a indexao, o Bing desenvolve algum tipo
de verificao de spams e de polticas de privacidade e segurana, que remove algumas URLs
do ndice (ver Figura 39). Segundo o manual de instrues para webmasters do Bing este
comportamento comum e, aps algum tempo, os resultados iniciais voltam ao ndice, desde
que no haja violao de nenhuma diretriz.
66
67
Observa-se que todas URLs contidas no Sitemap foram enviadas e apenas 2 indexadas (aps
3 semanas de envio). Portanto, no momento, existem apenas 2 (das 5 enviadas) pginas no
ndice do Google segundo o Google Webmaster Tools.
Diferente do Bing, a ferramenta do Google permite o envio de robots.txt e testar URLs do
site para verificar se sero bloqueadas ou no segundo a poltica de rastreamento definida pelo
robots.txt. O envio foi realizado com sucesso e conforme os testes realizados, o bloqueio das
URLs desejadas est funcionando corretamente.
68
Outra funcionalidade importante desta ferramenta a opo Buscar como o Google, que
busca uma URL e, quando processado, permite solicitar o envio para o ndice. A URL de todas
as pginas foi submetida, porm no influenciou de fato no ndice do Google.
69
Quanto ao rastreamento das URLs pelos robs de busca e a incluso no ndice de pesquisas
do Google, a situao aps 3 semanas da publicao do site e submisso do Sitemap foi a
seguinte: foram rastreados 67 URLs (o total varia de acordo com o que cada mecanismo de busca
considera como URL, tais como, imagem, folha de estilo, XML, PDF, etc.) e deste total 7 pginas
indexadas, o que mostra uma pequena incluso no ndice do Google mediante o total.
As URLs presentes no site, antes de aplicar o trabalho de SEO, que no existem no site atual
podem ser solicitadas para remoo do ndice do Google bem como solicitar a mesma do cache
70
de qualquer pgina que estiver no ndice, o que til quando uma pgina alterada. Esta opo
no se mostrou muito eficiente, pois diversas URLs solicitadas para remoo do ndice se
mantiveram nos resultados, conforme se observa nas Figuras 46 e 47.
71
A consulta especial (site:url) feita para consultar o estado do ndice dos mecanismos de
busca. Alm desta, o Google permite o uso de outras consultas especiais (ver Tabela 3).
72
Resultado
Consulta Especial
site:url
link:url
cache:url
related:url
info:url
Observando a consulta especial do Google sobre o ndice do site, percebe-se que todas as
pginas novas (inclusive algumas antigas j solicitadas de serem removidas) esto includas no
ndice e, portanto indexadas. Entretanto a informao disponibilizada pelo Google Webmaster
Tools sobre as URLs indexadas que foram submetidas pelo Sitemap (as mesmas URLs
mostradas na consulta especial), conforme a Figura 41, contrape o resultado da consulta
especial, informando apenas 2 pginas indexadas.
Seguido desses resultados, os testes de pesquisa por palavras-chave no Google foram
realizados (Figura 48), no apresentando resultados satisfatrios, pois o objetivo era estar entre
os 10 primeiros resultados, atingindo a 30 posio na mesma pesquisa que no Bing atingiu
a 1 posio. Alm disso, pode-se observar que nos 10 primeiros resultados do Google no
retornaram resultados relevantes para a consulta sobre o negcio local, mostrando anncios,
perfis pessoais, vdeo no relacionado, oferta de empregos, etc.
73
74
75
76
5. Concluso
A otimizao de Websites para buscas orgnicas uma tarefa que exige muito trabalho no
apenas tcnico, mas outras reas importantes como pesquisa de mercado, anlise do consumidor
e os resultados no so imediatos, podendo levar meses para alcanar uma meta desejada. Alm
disso, necessrio estar sempre realizando um acompanhamento e melhorias para que os
resultados no percam classificao, pois eles variam diariamente. Estar entre os primeiros
um resultado de um trabalho constante.
Os resultados obtidos no intervalo de tempo de um ms mostraram que os mecanismos de
busca, especialmente o Google, apresentam diversas diretrizes que prometem destacar o site ou
relevar, mas na prtica no funcionam de maneira conforme prometido. Na busca por uma
empresa de SEO em Vitria pode-se observar que no Google foram exibidos diversos resultados
irrelevantes sem qualquer relao com as palavras-chave, mostrando anncios e currculos
pessoais e sites desenvolvidos sem qualquer diretriz de qualidade recomendada pelos
mecanismos de busca. Outro ponto, que a marcao de dados para rich snippets no foi
considerada nas pesquisas locais, nem mesmo a marcao de locais no Google Places.
O Google Webmaster Tools apresentou uma srie de inconsistncias relacionadas s
informaes disponibilizadas pela ferramenta para webmasters e as consultas especiais. Foi
verificada uma divergncia de informaes comuns, como quantidade de pginas indexadas,
URLs informadas de terem sido removidas pelo Google Webmaster Tools sendo exibidas no
ndice do Google, marcao de dados com problema de deteco, conflito de cache de pginas
indexadas exibindo cache da pgina antiga, alm de gastar um tempo muito maior (semanas
para indexar poucas URLs) que o Bing Webmaster (menos de uma semana para indexar as
principais URLs) para rastreamento e indexao. Outras observaes foram feitas, como um
erro de rastreamento de uma URL que j havia sido removida e notificada ao Google, ttulo de
pginas no ndice inexistentes, snippet de uma pgina aparecendo em outra, informaes
mudando em tempo real (somente atualizando a pgina da ferramenta de webmaster do Google),
entre outros. Alm disso, o Google exibiu resultados totalmente irrelevantes frente das pginas
do site colocado como estudo de caso.
Conforme foi visto no captulo 2, possvel fazer um relacionamento dos resultados com o
que a arquitetura dos mecanismos de busca modernos tem como referncia. A inconsistncia de
77
78
6. Referncias
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
79
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]
[34]
[35]
[36]
[37]
[38]
[39]
[40]
index/docs/robots_meta_tag?hl=pt-BR.
Contedo gerado automaticamente, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721306.
Esquemas de link, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66356.
Cloaking, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66355.
Texto e links ocultos, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66353.
Pginas de entrada, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721311.
Programas de afiliao, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=76465.
Contedo copiado, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721312.
Preenchimento de palavra-chave, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66358.
Criao de pginas com comportamento malicioso, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721313.
Diretrizes para rich snippets, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2722261#3.
Sobre microdados, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=176035.
Sobre microformatos, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=146897&topic=1088472&ctx=topic.
Sobre RDFa, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=146898.
Rich Snippets for Local Search, Google, [Online]. Available:
http://maps.google.com/help/maps/richsnippetslocal/.
Consultas automticas, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66357.
Sobre Sitemaps, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=156184&from=40318&rd=1.
Como adicionar mais informaes a um Sitemap, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=71936.
Sitemap index file, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=71453&topic=8476&ctx=topic.
Como criar Sitemaps, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-
80
[41]
[42]
[43]
[44]
[45]
[46]
BR&answer=183668&topic=8476&ctx=topic.
Como enviar Sitemaps, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=183669&topic=8476&ctx=topic.
Imagens, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=114016.
Desempenho do site, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=158541#1.
Search Engine Optimization (SEO), Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=en&answer=35291.
Web Performance Best Practices, Google, [Online]. Available:
https://developers.google.com/speed/docs/best-practices/rules_intro.
E. Enge, S. Spencer e R. Fishkin, The Art of SEO, O'Reilly, 2012.