Você está na página 1de 81

UNIVERSIDADE FEDERAL DO ESPRITO SANTO

Centro Tecnolgico
Engenharia de Computao

Aplicao de tcnicas e procedimentos em SEO para melhorar a classificao


de um site a partir de resultados de busca por palavras-chave

Acadmico: Fbio Polola Mamede


Orientador: Celso Alberto Saibel Santos

Vitria - ES
Julho de 2013

Aplicao de tcnicas e procedimentos em SEO para melhorar a classificao


de um site a partir de resultados de busca por palavras-chave

Fbio Polola Mamede

Projeto de Concluso do apresentado


Universidade Federal do Esprito Santo, como
requisito parcial para o obteno de ttulo de
bacharel em Engenharia de Computao.

RESUMO

As pesquisas por palavras-chave realizadas nos mecanismos de busca caracterizam um dos


principais mtodos de acesso a sites na Web. Estar entre os primeiros resultados de classificao
nos mecanismos de busca transmite credibilidade e confiana para quem realiza a pesquisa e, com
isso, o trabalho de desenvolver websites com recursos que propiciam melhores classificaes nas
pesquisas uma tarefa promissora. Muitas empresas tm procurado otimizar seus sites para melhores posicionamentos nas buscas, num processo conhecido como SEO (Search Engine Optimization otimizao dos motores/mecanismos de busca). O SEO envolve a integrao de diversas
reas do conhecimento (tecnologia da informao, marketing, economia, etc.), constante monitoramento, manuteno permanente do contedo, entre outros. Assim, o SEO mais que uma melhoria no ranking de pesquisas, mas principalmente fazer com que os mecanismos de busca ofeream resultados mais bem direcionados e precisos a quem est pesquisando. O objetivo principal
deste projeto estudar e aplicar tcnicas, mtricas e estratgias de SEO para verificar a repercusso
na classificao de busca por palavras-chave na busca orgnica nos principais mecanismos de busca:
Google, Yahoo e Bing, verificando o resultado e o funcionamento das ferramentas. A principal
motivao para a sua realizao mostrar que tcnicas e procedimentos de SEO podem ser empregados no site de uma empresa para permitir que ele esteja entre as dez primeiras posies do ranking de busca pelo conjunto de strings SEO Web Vitria em qualquer buscador.
Palavras-chave: Otimizao de mecanismos de busca, SEO, tcnicas e procedimentos em SEO.

ABSTRACT

The research conducted by keywords in search engines is the main way to the websites.
Being placed in top search engine rankings results conveys credibility and confidence to those who
perform the research and, therefore, the work to develop websites with features that provide better
researches rankings is a promising task. Many companies have tried to "optimize" their sites to top
search positions, known as SEO (Search Engine Optimization). The SEO involves different
knowledge areas integration (information technology, marketing, economics, else), constant monitoring, keep content updated, and else. Thus, SEO is more than a research ranking improvement,
but mostly to make the search engines offer better and accurate results to those who are searching.
The main objective of this project is to study and apply techniques, metrics and SEO strategies to
verify impact keywords search rankings in the major search engines: Google, Yahoo and Bing,
checking the results and functioning tools. The motivation for this final project is to show that SEO
techniques can be employed in a company website to allow it to be among the top 10 search ranking
for the set of strings "SEO Web Vitria" in any Web search engine.
Keywords: Search Engine Optimization, SEO, SEO techniques and procedures.

Lista de Figuras
Figura 1 - Situao inicial de pesquisa para um negcio local .......................................................11
Figura 2 - Representao da mtrica do PageRank usando percentuais de probabilidade de acesso
a uma pgina. Fonte: [1] ................................................................................................................ 16
Figura 3 - Pginas sem ligaes e ciclo de links ........................................................................... 17
Figura 4 - Arquitetura em alto nvel do Google. Fonte: [7]........................................................... 19
Figura 5 - Links patrocinados / Busca orgnica. Fonte: [8] .......................................................... 23
Figura 6 - Detalhamento de consultas ........................................................................................... 24
Figura 7 - Comparao de palavras no Google Trends ................................................................. 25
Figura 8 - Sugesto de palavras no Google ................................................................................... 25
Figura 9 - Meta tag description em uma pgina Web. Fonte: [8] .................................................. 27
Figura 10 Descrio/ttulo exibidos como snippet no resultado da pesquisa. Fonte: [8] ........... 27
Figura 11 - Usurio podem subir de diretrio removendo a ltima parte da URL ........................ 28
Figura 12 - Uso de Breadcrumbs ................................................................................................... 29
Figura 13 - Nuvem de Tags no site da Amazon - http://www.amazon.com/gp/tagging/cloud ...... 33
Figura 14 - Rich Snippets. Fonte: [10] .......................................................................................... 35
Figura 15 - Exemplo de site map. Fonte: [8] ................................................................................. 39
Figura 16 - Exemplo de um XML Sitemap. Fonte: [8] ................................................................. 41
Figura 17 Exemplo do Google Analytics para um site. .............................................................. 49
Figura 18 - Resultado do PageSpeed da pgina www.ufes.br ....................................................... 50
Figura 19 - Anncios nos resultados de busca ............................................................................... 51
Figura 20 - Anlise de palavras-chave com o Google Trends ....................................................... 53
Figura 21 - Teste SEO com a ferramenta SEOquake .................................................................... 56
Figura 22- Teste de velocidade de navegao com o PageSpeed .................................................. 57
Figura 23 - Response da pgina smartsti.com.br verificado com o Web-Sniffer .......................... 57
Figura 24 Screenhoot do Google Webmaster Tools [14] ............................................................ 58
Figura 25 - Bing Webmaster [15] .................................................................................................. 59
Figura 26 - Estrutura de diretrios do site ..................................................................................... 59
Figura 27 - sitemap.xml do site smartsti.com.br ........................................................................... 60
Figura 28- robots.txt ...................................................................................................................... 61
Figura 29 - Envio do Sitemap pelo Bing ....................................................................................... 61
Figura 30 - Menu do Bing Webmaster .......................................................................................... 62
Figura 31 - Envio de URLs pelo o Bing Webmaster ..................................................................... 62
Figura 32 - Situao do site aps 3 semanas segundo o Bing ....................................................... 62
Figura 33 - Atividades do site ........................................................................................................ 63
Figura 34 - Verificao de marcao de dados pelo Bing Webmaster........................................... 63
Figura 35 - Consulta do cache do Bing ......................................................................................... 64
Figura 36 - Resultado no Bing em 1 lugar ................................................................................... 65
Figura 37 - Resultado no Bing em 5 lugar ................................................................................... 65
Figura 38 - Resultado no Bing em 3 lugar ................................................................................... 65
Figura 39 - Cache do Bing aps alguns dias ................................................................................. 66
Figura 40 - Menu de opes do Google Webmaster Tools ............................................................ 67
Figura 41 - Estado do Sipemap enviado no Google Webmaster Tools ......................................... 67
Figura 42 - Painel do robots.txt no Google Webmaster Tools ....................................................... 68

Figura 43 - Opo " Buscar como o Google" ............................................................................... 68


Figura 44 - Estado da marcao de dados no Google.................................................................... 69
Figura 45 - URLs rastreadas, indexadas e bloqueadas pelo Google ............................................. 69
Figura 46 - URLs removidas do ndice do Google........................................................................ 70
Figura 47 - URLs mantiveram no ndice mesmo aps remoo no Google ................................. 71
Figura 48 - Resultado de pesquisa no Google ............................................................................... 72
Figura 49 - 10 primeiros resultados no Google para a pesquisa .................................................... 73
Figura 50 - Resultado de pesquisa mais especfica no Google apareceu na primeira pgina o
resultado ........................................................................................................................................ 73
Figura 51 - Resultado de pesquisa no Yahoo ................................................................................. 74

SUMRIO

1.

Introduo ................................................................................................................. 8

1.1.

Motivao ............................................................................................................ 10

1.2.

Justificativa .......................................................................................................... 12

1.3.

Objetivos.............................................................................................................. 13

2.

Conceitos Tericos .................................................................................................... 14

2.1.

PageRank ............................................................................................................. 14

2.2.

Modelagem Matemtica do PageRank ................................................................. 16

2.3.

Arquitetura em alto nvel do Google ..................................................................... 18

2.3.1.

Crawlers ........................................................................................................... 19

2.3.2.

Indexadores ...................................................................................................... 20

2.3.3.

Armazenamento ............................................................................................... 21

3. Tcnicas e Procedimentos que Influenciam a Classificao dos Resultados dos


Mecanismos de Busca ...................................................................................................... 22
3.1.

Contedo e Palavras-chave................................................................................... 23

3.2.

Fatores on-page ................................................................................................... 26

3.2.1.

Tag <title> ........................................................................................................ 26

3.2.2.

Descrio (description meta tag).................................................................... 26

3.2.3.

URLs e Estrutura de Navegao ........................................................................ 28

3.2.4.

Pgina 404 ....................................................................................................... 29

3.2.5.

Links e ncoras ................................................................................................. 29

3.2.6.

Imagens ........................................................................................................... 30

3.2.7.

Heading tag...................................................................................................... 31

3.2.8.

Outras Medidas on-page .................................................................................. 31

3.3.

Fatores off-page ................................................................................................... 33

3.4.

Rich Snippets ........................................................................................................ 34

3.4.1.

Marcao ......................................................................................................... 35

3.4.1.1.

Microdados................................................................................................... 36

3.4.1.2.

Microformatos .............................................................................................. 37

3.4.1.3.

RDFa ............................................................................................................. 38

3.5.

Sitemaps .............................................................................................................. 39

3.6.

Controle de rastreamento ..................................................................................... 41

3.6.1.

Meta tags para bloqueio................................................................................... 43

3.6.2.

X-Robots-Tag .................................................................................................... 43

3.7.

Fatores de desempenho (otimizao do tempo de navegao) .............................. 44

3.8.

White Hat x Black Hat .......................................................................................... 46

3.8.1.

Cloaking (camuflagem de contedo) ................................................................. 47

3.8.2.

Texto e links ocultos .......................................................................................... 47

3.8.3.

Contedo gerado automaticamente .................................................................. 47

3.8.4.

Preenchimento de palavra-chave ...................................................................... 48

3.8.5.

Doorway Pages ................................................................................................ 48

3.8.6.

Pgina com comportamento malicioso.............................................................. 48

3.8.7.

Esquemas de Link ............................................................................................. 48

3.9.

Ferramentas de Apoio ao Trabalho de SEO............................................................ 49

3.10. Melhoria das classificaes na Web usando solues pagas .................................. 50


4.

Estudo de Caso ......................................................................................................... 52

4.1.

Resultados Obtidos............................................................................................... 58

4.1.1.

Anlise com o Bing ........................................................................................... 61

4.1.2.

Anlise com o Google ....................................................................................... 66

4.2.

Melhoria dos Resultados ...................................................................................... 75

5.

Concluso ................................................................................................................ 76

6.

Referncias .............................................................................................................. 78

1. Introduo
O acesso informao e a servios um dos principais motivos pelo uso crescente do
uso da Internet. A informao est sendo rapidamente difundida, havendo uma produo
generalizada de contedo digital, onde todos participam de alguma forma, seja produzindo, seja
consumindo, seja distribuindo. As redes sociais, blogs, sites de notcias e os agregadores de
contedo enriquecem a experincia que os usurios obtm ao navegarem na Web.
Dado o volume de dados difundidos na Web elevado, premente a necessidade de
serem criados mecanismos facilitem a caminhada do usurio ao seu destino: a informao
desejada. Os mecanismos de busca (Google, Yahoo, Bing, etc.) tornaram essenciais, uma vez
que praticamente impossvel para um usurio chegar ao seu objetivo final sem conhecer o
endereo do destino. Alm disso, a possibilidade de se encontrar uma diversidade de
informaes ligadas a um determinado assunto bastante elevada, alm das buscas serem
cmodas, simples e rpidas. A relao entre navegar na Web e buscar a informao tornou-se
to estreita que muitas pessoas confundem Internet (e a prpria Web) com mecanismos de busca,
no conseguindo sequer navegar na rede sem uso de buscadores.
As primeiras verses das ferramentas de busca na Web foram desenvolvidas com o
propsito de criar listas por categorias a serem exploradas. Cada site receberia ento uma
atribuio segundo a sua particularidade. Estas listas eram controladas por seres humanos,
demandando uma exaustiva anlise para cada pgina na Web a ser includa em uma categoria.
O mecanismo era funcional apenas em pequena escala. Alm disso, a anlise era lenta e no
podia atribuir especificaes quanto aos assuntos e objetivos do site. A evoluo trouxe novos
conceitos relacionados busca na Web, mostrando a necessidade e tendncia a existir um
mecanismo que identificasse e classificasse as categorias e os assuntos de forma automtica e
inteligente. Com isso, comearam a surgir os precursores dos motores de busca, na qual j era
possvel realizar buscas com base em palavras-chave. Esta tendncia evoluiu e originou os
mecanismos de busca automticos que at hoje continuam sendo utilizados.
O principal (e o mais utilizado) motor de busca o Google, devido a sua simplicidade,
eficincia e qualidade nos resultados obtidos. Seu algoritmo tem sido constantemente otimizado
levando em conta diversos quesitos. Os outros motores tm obtido um crescimento de uso
razovel, porm ainda esto bem distantes da hegemonia do principal buscador. O principal

mtodo conhecido para a classificao e ordenao das pginas o PageRank [1]. O PageRank,
que foi desenvolvido pelos fundadores do Google Larry Page e Sergey Brin, um algoritmo
matemtico que atribui notas aos sites segundo as suas caractersticas e propriedades. Alm do
PageRank, o Google realiza diversas operaes, como indexao das pginas, punio por m
qualidade (contedo, referencias, etc.), classificao das pginas. Quando uma pesquisa feita,
o algoritmo do Google realiza uma classificao das pginas baseado nas palavras-chave e a
partir disso so exibidos os resultados de pesquisa baseados no que o algoritmo classificou
como mais relevante como resultado.
Um bom posicionamento no ranking das pginas retornadas numa operao de busca
um negcio que desperta grande interesse em quem os publica, principalmente empresas. Uma
boa colocao pode significar maior credibilidade, difuso, conhecimento, publicidade,
arrecadao, entre outras vantagens significativas para empresas e pessoas. Com isso, surgiram
tcnicas e procedimentos que visam otimizar1 websites (Web e mobile) para que conquistem
os primeiros lugares na classificao dos resultados de pesquisa. Estas tcnicas de otimizao
so conhecidas pelo nome SEO (Search Engine Optimization otimizao dos
motores/mecanismos de busca). SEO envolve um trabalho minucioso de pesquisa, estudo de
tendncias, integrao de diversas reas do conhecimento (tecnologia da informao, marketing,
economia, etc), constante monitoramento dos resultados de classificao, manuteno
permanente do contedo, entre outros. Alm disso, o uso de dispositivos mveis (smartphones
e tablets) tem traado diretrizes ainda mais abrangentes e complexas para as estratgias de SEO,
principalmente na forma e na experincia do usurio em lidar com a informao e seus
resultados. Outras tcnicas de otimizao diretamente ligadas ao SEO so: (i) SMM (Search
Media Marketing) a rea responsvel por toda estratgia de marketing dentro das mdias
sociais; (ii) SEM (Search Engine Marketing) utilizando como estratgia o prprio SEO, alm
dos links patrocinados e outras ferramentas e (iii) SMO (Social Media Optimization)
otimizao utilizando mdias sociais para promover acessos a pginas Web.

O termo otimizar neste projeto entendido como aplicar tcnicas em SEO numa pgina Web que podero
apresentar melhores classificaes nas buscas por palavras-chave.
1

10

1.1. Motivao
As pesquisas atravs de dispositivos mveis cresceram cerca de 30 vezes nos ltimos
dois anos [3]. Estatsticas indicam que os usurios passaram a realizar mais buscas, uma vez
que, com dispositivos mveis usurios pesquisam em qualquer lugar e em qualquer hora. Com
isso, o trabalho de SEO adquire diversas propriedades como localizao, resultados especficos
para Web/celular/tablet diferenciados uns dos outros, manipulao de resultados segundo perfil
do usurio, estratgias de marketing diferenciadas, entre outras. Existe uma previso de que a
partir de 2013 existiro mais pessoas usando celulares do que computadores para o acesso
Web [4]. Isso mostra que existe um grande mercado de trabalho em SEO, marketing digital e
determinao de perfis de usurios. Outro fato que existem poucos profissionais e empresas
que realizam este tipo de servio atualmente. A unio de recursos de TI com estratgias de
marketing e publicidade pode ser um aliado valioso para gerar lucro para as empresas, pois
atravs destes possvel difuso da informao (interesse essencial de todas as empresas). A
conquista das melhores colocaes nos rankings no depende unicamente do esforo dos
mecanismos de busca, mas tambm do trabalho intenso em SEO no desenvolvimento dos
websites das empresas. Estar entre os primeiros (de preferncia na primeira ou segunda
colocao) aps uma busca significa transmitir credibilidade e confiabilidade aos clientes em
potencial, alm de gerar um maior nmero de acessos ao site de empresa, o que pode resultar
em crescimento nos seus negcios e no seus lucros.
A Figura 1 mostra o resultado produzido pelo Google, Bing e Yahoo (respectivamente,
da esquerda para a direita) para uma possvel busca de empresas especializadas em SEO, na
cidade de VitriaES, a partir das strings SEO Vitoria. No est em discusso aqui se a string
a mais adequada para isso. Entretanto, trata-se de um procedimento tpico de usurios que
buscariam esse tipo de servio. Como pode ser observado, nenhum dos resultados apresentado
se refere a uma empresa que realize este tipo de servio.

11

Figura 1 - Situao inicial de pesquisa para um negcio local

A principal motivao para realizao deste projeto de concluso mostrar como


tcnicas e procedimentos de SEO podem ser empregados no site de uma empresa real (uma
empresa existente no mercado, que realiza servios em SEO) para permitir que este esteja entre

12

as 10 primeiras posies do ranking de busca pelo conjunto de strings SEO Web Vitria em
qualquer um dos buscadores anteriores. Do ponto de vista de empresa, a melhoria na posio
do ranking tem o potencial de aumentar o retorno nos negcios realizados com clientes que
chegam empresa atravs da busca por strings com palavras-chave usando um navegador Web.

1.2. Justificativa
O trabalho de desenvolver websites com recursos que propiciem melhores classificaes
nas pesquisas constitui-se num excelente mercado para profissionais de TI. As empresas tm
procurado otimizar seus sites para melhores posicionamentos nas buscas. Alm disso, a
otimizao tem ferramentas que auxiliam estratgias de marketing podendo ser implementada
em conjunto com o trabalho de SEO. O SEO mais que uma melhoria no ranking de pesquisas,
mas principalmente fazer com que os mecanismos de busca ofeream resultados mais bem
direcionados e precisos a quem est pesquisando.
No Brasil, poucas empresas esto realizando este tipo de trabalho, muito menos no
estado do Esprito Santo. A procura de servios especializados em SEO tem sido alta, o que
comprova que um mercado amplo e promissor para se atuar. Outra questo que o uso de
dispositivos mveis tem ampliado o interesse das empresas adaptarem seus contedos Web para
as plataformas mveis melhorando a experincia do usurio e direcionando as buscas com
resultados interessantes para quem usa estes dispositivos (resultados influenciados pela
localizao, opo de ligar diretamente pelo resultado da busca, etc.). A partir do conhecimento
e pesquisa nesta rea, surge o interesse e possvel adquirir experincia e atuar neste negcio
podendo ao longo do tempo conquistar clientes potenciais. Para desenvolver um bom trabalho
nesta rea, preciso domnio das tcnicas e mtodos, alm de um bom conhecimento do nicho
que o cliente atua, e minha atuao no meu Projeto de Graduao me auxiliar no
aperfeioamento e desenvolvimento na empresa.

13

1.3. Objetivos
O objetivo principal estudar e aplicar tcnicas, mtricas e estratgias para verificar a
repercusso na classificao de busca por palavras-chave na busca orgnica nos principais
mecanismos de busca Google, Yahoo e Bing verificando o resultado e o funcionamento das
ferramentas.
Os objetivos especficos que apoiam a realizao do SEO so:

Colocar o site smartsti.com.br nas 10 primeiras posies dos resultados de busca


nos principais mecanismos de busca da Web;

Entender o comportamento dos algoritmos de busca dos principais motores de


busca;

Estudar as mtricas e procedimentos para otimizao de pginas para busca;

Estudar as ferramentas de SEO que fazem parte do processo de desenvolvimento


de SEO e na anlise dos resultados;

Aplicar as tcnicas e procedimentos em um estudo de caso, realizado no site


smartsti.com.br;

Analisar e comparar os resultados com o uso dos diferentes mecanismos de


busca.

14

2. Conceitos Tericos
Os mecanismos de busca na Web so extremamente robustos e envolvem integrao de
diversos sistemas de computao e reas do conhecimento, como a matemtica e a estatstica.
Para que estes mecanismos de busca sejam viveis para o uso em grande escala preciso que
haja uma tecnologia de rastreamento rpida para adquirir os documentos da Web e os manterem
atualizados (dezenas de milhes de pginas adicionadas e alteradas por ano [5]), o
armazenamento de dados deve ser eficiente para armazenar os ndices gerados pelo
rastreamento, o processamento das informaes indexadas devem ser eficiente e tambm as
consultas devem suportar uma alta taxa de pesquisas (atualmente o Google processa mais de
um bilho de consultas por dia [6]). O custo e desempenho de hardware como busca em disco,
e robustez em sistemas operacionais so fatores extremamente relevantes para esses
mecanismos, considerando a taxa de crescimento da Web e das mudanas tecnolgicas.
O Google foi projetado para lidar com dados em larga escala, fazendo uso eficiente do
espao de armazenamento para armazenar os ndices e as estruturas de dados so otimizadas
para rpido acesso (ser detalhado posteriormente). Os detalhes a seguir mostram detalhes sobre
a arquitetura e o funcionamento de Google, mas tambm enquadra os principais mecanismos
de busca atuais que seguem a mesma linha de tecnologia.
A partir dos diversos quesitos de projeto, foram desenvolvidos alguns conceitos e
arquiteturas para o projeto de um mecanismo de buscas na Web eficaz que sero abordados a
seguir. Todo o texto a seguir deste captulo est fundamentado na referncia [7].

2.1. PageRank
O principal e primordial indicador de classificao utilizado pelos mecanismos de busca na
Web o PageRank, que foi introduzido por Sergey Brin2 e Lawrence Page2 em 1998 em um
artigo cientfico [1]. O PageRank um modelo matemtico probabilstico que foi adaptado s
necessidades para um conceito de classificao. Antes dos mecanismos de busca, as pginas
eram localizadas atravs de listas classificadas por categorias e eram definidas atravs da
anlise humana no sendo um processo vivel para uma alta escala e oferecendo resultados, na

Fundadores do Google

15

maioria das vezes, irrelevantes aos usurios. Para se criar um modelo de classificao por
relevncia de uma determinada pgina na Web preciso compreender de que maneira ser
definida uma pgina relevante. As pginas da Web possuem referncias entre as mesmas
criando uma estrutura encadeada que define seus relacionamentos. A partir de ento, percebeuse que uma estrutura de links e os textos de link disponibilizam muitas informaes para anlise
e julgamento da qualidade e relevncia de uma pgina na Web.
O Google definiu como essncia de classificao dois principais fatores: (1) a estrutura de
links na Web para calcular a classificao de relevncia em cada pgina na Web (que foi dado
o nome de PageRank) e (2) os textos nos links para melhorar esta classificao. Alm destes
dois, atualmente o Google considera mais de duzentos outros fatores para determinar a
relevncia de uma pgina na Web, sendo que parte destes sero descritos posteriormente neste
trabalho.
Uma pgina na Web possui um bom PageRank se possui boas referncias que direcionam
a ela, ou seja, pginas relevantes (bem classificadas) apontam para esta. Com relao ao modelo
matemtico do PageRank, pode ser entendido a partir de um modelo de comportamento de um
usurio. Supondo que um usurio aleatrio ir acessar uma pgina na Web aleatria e este
usurio ir permanecer clicando em links sem voltar em momento algum pgina anterior,
conforme mostra a Figura 2. A probabilidade deste usurio acessar uma determinada pgina
ser o seu PageRank. Portanto, o PageRank um ndice que calculado atravs da estrutura de
links que indica a probabilidade de acesso a uma determinada pgina na Web e tambm sua
importncia em relao s demais pginas na Web.

16

Figura 2 - Representao da mtrica do PageRank usando percentuais de probabilidade de acesso a uma pgina. Fonte: [1]

2.2. Modelagem Matemtica do PageRank


O clculo do PageRank possui duas propriedades fundamentais para a aplicabilidade
nos mecanismos de busca: escalvel e iterativo. Portanto, o algoritmo executvel em tempo
til (tempo significativamente suficiente para fins comerciais) com o aumento significativo do
nmero de pginas na Web e as iteraes so finitas convergindo para um valor final do
PageRank. Ele forma uma distribuio de probabilidade entre as pginas na Web, tornando a
soma do PageRank de todas a pginas igual a um. Na primeira iterao todas as pginas
1

recebem o mesmo PageRank e atribudo , onde nmero total de pginas. A descrio


matemtica conforme a seguir:
Supondo A uma pgina qualquer na Web e esta pgina possua 1 , 2 , , ( so pginas na
Web) pginas referenciando a ela e definido uma funo ( ), que representa o nmero de
links externos que uma pgina possui. Sendo assim, o valor do PageRank ser:
() =

(1 ) (2 )
( )
+
+ +
(1 )
(2 )
( )

17

que na forma geral :


() =

()
()

Equao 1 - Forma simplificada do clculo do PageRank. Fonte: [7]

onde o conjunto de todas as pginas que referenciam u e () o nmero de referncia


em v.
Este clculo simplificado do PageRank apresenta alguns problemas em determinadas
situaes, como pginas sem ligaes e ciclo de links (iteraes ficam infinitas para o clculo
do PageRank). A soluo dada foi o acrscimo de uma constante chamada fator de
amortecimento que a probabilidade (em cada passo) de dado um usurio qualquer que esteja
navegando na Web seguindo um fluxo de links manter este fluxo sem que haja interrupo
(desistncia de continuidade em uma sequncia de links).

B
D

Figura 3 - Pginas sem ligaes e ciclo de links

Com isso, a equao que define o PageRank () incorpora uma componente


correspondente contribuio das pginas que referenciam para A, ponderado pela
probabilidade do usurio seguir as ligaes das pginas e uma componente correspondente
ao usurio ter selecionado a pgina aleatoriamente ponderado pela probabilidade de o utilizador
no seguir as ligaes das pginas (1 ). Portanto a equao do PageRank ser:
() =

(1 )
()
+

()

Equao 2 - Clculo do PageRank com o fator de amortecimento. Fonte [1]

O fator de amortecimento acrescenta as seguintes propriedades importantes ao clculo


do PageRank:

Todas pginas possuem a mesma probabilidade de um usurio acessar a qualquer

18

momento.

Pginas sem ligao possuem PageRank no nulos e portanto, recebem uma


classificao.

Nos ciclos de links as iteraes iro convergir.


A equao para o clculo do PageRank normalmente utilizada na forma de matrizes,

para aprimorar os procedimentos computacionais e apresenta algumas variaes que permitem


otimizao nas iteraes, agregando em alguns casos outros parmetros que no esto
contemplados no escopo deste projeto.
(1 , 1 ) (1 , 2 )

(1 , )
(1 )
(2 , 1 )

(1 )
=[
]+

( , )

(1 )

( , )]
[( , 1 )
Equao 3 - Forma matricial do PageRank. Fonte: [1]

onde ( , ) o inverso do nmero de referncias de uma pgina para uma pgina .

2.3. Arquitetura em alto nvel do Google


A arquitetura do Google foi apresentada em alto nvel em 1998, relatando os sistemas
principais que integram o motor de busca e a maneira geral como eles se relacionam, assim
como suas principais funcionalidades. Os detalhes de projeto e implementao so
considerados pela empresa como segredo comercial e com isso, no est disponibilizado para
consulta. Alm disso, seu algoritmo sofre em torno de quinhentas alteraes anualmente.
Contudo, pode-se obter um entendimento da complexidade e como o funcionamento de um
mecanismo de busca atravs dos mdulos de arquitetura como indexadores, os crawlers
(rastreadores de contedo na Web), buscadores, entre outros mdulos do motor de busca. O
clculo do PageRank, por exemplo, um dos vrios procedimentos que compem os complexos
mecanismos de busca.
O Google foi desenvolvido nas plataformas Linux e Solaris, podendo funcionar em qualquer
uma delas independentemente. Com o amadurecimento da empresa foi desenvolvida uma
verso prpria de sistema operacional baseado em Linux para o uso nos seus Data Centers. A
maior parte do motor de busca foi desenvolvido em C, C++ e Python, tendo em vista a

19

necessidade de eficincia computacional.


A Figura 4 relata em alto nvel o procedimento que os mecanismos de busca fazem para
realizarem as consultas, desde o rastreamento das pginas na Web, criao dos ndices, buscas,
etc.

Figura 4 - Arquitetura em alto nvel do Google. Fonte: [7]

2.3.1. Crawlers
O processo de rastrear o contedo da Web, chamado pelo Google de Web Crawling. O
rastreamento feito atravs de um conjunto de aplicaes denominadas Googlebots (conhecido
tambm como bots, robs ou spiders), que descobrem pginas novas e/ou atualizadas para
serem includas no ndice do Google.
Para adquirir o contedo das pginas, o Googlebot realiza uma espcie de simulao de
navegao da mesma forma que um usurio atravs do navegador Web, conhecido como postprocessing. Um endereo requisitado, e ento devolvido uma resposta que extrada e
armazenada.
O Web Crawling uma aplicao complexa, pois exige interao com milhes de
servidores Web e diversos name servers o que est fora de controle do sistema. Ele realizado
atravs de um sistema de rastreadores distribudos para que este rastreamento se realize em
tempo til. Os crawlers so alimentados atravs do URL Server que disponibiliza endereos
para serem rastreados. Cada crawler pode manter aproximadamente trezentas conexes abertas
ao mesmo tempo, melhorando o desempenho para adquirir as pginas Web e lidar com outras

20

informaes simultaneamente. Nas primeiras implementaes, era possvel realizar o


rastreamento de mais de cem pginas por segundo utilizando apenas quatro crawlers. Outro
quesito a resoluo de nomes que feita atravs de DNS servers, o que pode reduzir o
desempenho e portanto, cada crawler mantm um DNS cache. Com isso, as diversas conexes
abertas em cada crawler podem estar em diferentes estados ao mesmo tempo: resoluo de
nomes, conexo com hosts, envio de requisies e recebendo respostas.
Algumas dificuldades so pertinentes quanto ao Web Crawling, como direitos autorais,
contedos dinmicos, cloaking (entrega de contedos diferentes de uma mesma URL para
visitantes especficos, como por exemplo usurios humanos e rastreadores da Web), interao
com o usurio, sites com bugs, entre outros.
Aps o envio da lista de URLs pelo URL Server para os crawlers, eles rastreiam as
pginas na Web e em seguida todo contedo adquirido no processo de Web Crawling
encaminhado ao Store Server que tem a funo de compactar e armazenar as pginas da Web
em um repositrio. Em seguida, inicia-se o processo de indexao, que ser abordado no
prximo item.

2.3.2. Indexadores
O sistema de indexao um sistema complexo e envolve diversas funcionalidades.
Como seu prprio nome diz, o objetivo da indexao criar ndices a partir dos dados e
informaes contidos no repositrio e distribuir ndices de maneira que possa ser criada uma
estrutura sistematizada para o relacionamento das partes que fazem parte da arquitetura do
mecanismo de busca.
A indexao composta por trs procedimentos: indexador, ordenador e parser. Uma
vez disponibilizados os dados no repositrio, o indexador realiza a leitura dos chamados
documentos, que so os diferentes tipos de dados armazenados no repositrio, como: texto,
HTML, PDF, imagens, sons, arquivos de log, entre outros. Estes so descompactados, para em
seguida passarem por uma anlise de palavras que feita pelo parser. Esta anlise feita,
convertendo cada documento para uma estrutura de dados chamada hits que armazena o
conjunto de ocorrncia das palavras. Nos hits ficam registradas a sua posio no documento e
dados de formatao (tamanho da fonte, maiscula/minscula, etc.). O indexador distribui os

21

hits em uma estrutura denominada barrel que uma espcie de banco de hits, onde estes so
inseridos de forma ordenada segundo seus ndices de documento (docID 3 ). Alm disso, o
indexador analisa os links presentes em cada pgina Web extraindo e armazenando as
informaes importantes nos arquivos anchors que mantm registrado informao de onde cada
link pertence, para onde ele aponta e o texto ancorado a este link. Os anchors so lidos pelo
URL Resolver e as URLs so convertidas para URLs absolutas e associando um docID. O URL
Resolver tambm cria um ndice para os textos do link e o associa ao docID no qual o link
aponta e tambm gera uma base de dados com os links que fazem parte de um docID. Essa base
de dados utilizada para computar o PageRank das pginas na Web e documentos.
O ordenador tem a funo de reordenar os hits contidos nos barrels segundo wordID4
para gerar um ndice invertido com as palavras, produzindo uma lista de wordIDs e o offset dos
ndices invertidos.

2.3.3. Armazenamento
O armazenamento de todos documentos so feitos no repositrio. Neste, todos os dados
antes de serem inseridos passam por um sistema de compresso realizado pelo Store Server que
utiliza a biblioteca de compresso de dados zlib que funciona em multiplataformas. A escolha
desta ferramenta deu-se em razo do excelente desempenho, em termos de tempo, nas
compresses realizadas em relao outras ferramentas. Essas compresses conseguem reduzir
o espao em disco em torno de trs vezes.
No repositrio, os documentos so armazenados sequencialmente e em cada pacote
(estrutura de dados que contm os dados comprimidos e informaes sobre estes dados) so
registradas informaes como docID, tamanho e URL.

docID uma identificao que cada pgina na Web recebe quando uma nova URL analisada durante a indexao de uma pgina.
4 Identificao que cada palavra distinta possui que atribuda pelo indexador.
3

22

3. Tcnicas e Procedimentos que Influenciam a Classificao dos


Resultados dos Mecanismos de Busca
Para introduzir as tcnicas e procedimentos em SEO necessrio conhecer as diretrizes
fundamentais para mecanismos de busca, especialmente para o Google, que so: (i) oferecer a
melhor experincia ao usurio; (ii) oferecer contedos mais relevantes a partir dos resultados
da sua pesquisa (contedos realmente importantes para sua pesquisa, sendo estes originais e
bem produzidos) e (iii) oferecer estes contedos de forma rpida e segura (livre de contedo
malicioso e suspeito). Tendo essas premissas em mente possvel entender melhor o porqu de
cada tcnica e diretriz usadas na melhoria da classificao nos resultados.
Outro ponto importante a ser considerado que as prticas de SEO no devem levar em
conta exclusivamente os mecanismos empregados por mquinas e robs de busca. Cada ponto
considerado na elaborao de uma pgina na Web deve ser pensado em termos dos usurios,
zelando pelas diretrizes fundamentais. Esta um problema negligenciado por muitos
profissionais e que pode, na maioria dos casos, prejudicar a classificao dos sites nas pesquisas,
conforme ser apresentado posteriormente.
Os resultados das pesquisas no Google so divididos em dois setores (Figura 5): (i) os links
patrocinados e (ii) a busca orgnica, sendo esta ltima o foco deste trabalho. A pesquisa orgnica
realizada baseada no contedo do site, disponibilizando ao usurio o melhor resultado
segundo seus critrios de classificao. As tcnicas em SEO tentam otimizar um site de forma
que este conquiste melhor classificao em relao ao contexto de pesquisa, porm no
possvel garantir em momento algum a ordem de classificao, nem mesmo que ir aparecer
entre os primeiros. Entretanto fundamental seguir as tcnicas, pois oferecem uma
probabilidade maior de que este site seja encontrado.

23

Figura 5 - Links patrocinados / Busca orgnica. Fonte: [8]

Os mais de duzentos fatores de classificao [9] no so completamente conhecidos.


Entretanto, aqueles essenciais para o trabalho de SEO e aplicados neste projeto sero abordados
na sequncia do texto.

3.1. Contedo e Palavras-chave


O contedo e as palavras-chave merecem um tpico especial a seu respeito, pois fazem
parte de um importante e indispensvel procedimento no trabalho de SEO. Todo contedo em
um site deve ser elaborado de maneira nica, totalmente original, dispensando qualquer cpia
ou plgio de algum outro site ou documento da Web. O algoritmo do Google inteligente
suficiente para verificar qualquer tipo de plgio e tambm consegue analisar a qualidade do
contedo, como concordncias, erros gramaticais e sem dvida erros de digitao. Isso tudo
para que seja primado ao usurio uma boa experincia (resultados relevantes e convenientes
busca). Pginas com contedo duplicado, copiado e mal redigido so penalizadas na
classificao. Para que a pgina obtenha um bom contedo necessrio que quem esteja
redigindo seja cuidadoso e produza textos de qualidade, originais e teis a um determinado
pblico.
As palavras-chave em um site so palavras utilizadas em textos, ttulos, subttulos, links,
descries, ou seja, qualquer parte do contedo. Ao redigir contedo de um site, alm de uma
boa elaborao, deve se pensar no uso adequado de palavras e no na forma como os
mecanismos de busca iro tratar o site, mas sim no que seria til para quem visita aquela pgina

24

para que corresponda s suas expectativas. Deve-se ter o cuidado, por exemplo, para que no
haja uso excessivo de palavras-chave repetidas para tentar enganar os mecanismos de busca.
Isto no considerada uma prtica honesta, gerando uma penalizao na classificao. Outro
ponto a ser considerado que quanto mais especfico, melhor o contedo, pois contedos muito
abrangentes e genricos aumentam a possibilidade da obteno de resultados inadequados na
hora da pesquisa. Por exemplo, uma pgina de uma loja de sapatos deve informar no apenas
conter informaes institucionais e produtos, mas deve especificar os tipos de sapato, materiais
usados, se vendem masculino e/ou feminino, detalhes sobre cada produto, localidade, etc.
Quando usurios fazem pesquisas mais especficas (principalmente, buscando produtos),
pginas com contedo mais bem especificados so melhores classificadas. A Figura 6 mostra a
diferena entre resultados de buscas genricas e especficas na busca por sapatos, por exemplo.

Figura 6 - Detalhamento de consultas

Para que seja feito um estudo sobre a melhor possibilidade de uso de palavras-chave, o

25

Google disponibiliza de uma ferramenta chamada Google Trends (http://google.com/trends).


Com a ferramenta possvel fazer se comparaes de palavras em relao s tendncias de
pesquisa, permitindo ao elaborar o contedo melhor colocao, escolha de palavras e/ou
sinnimos que sejam mais relevantes para pesquisa de usurios. Alm disso, o Google oferece
sugestes baseadas naquilo que digitado. As palavras que seguem o que est sendo digitado
so baseadas em frequncias e tendncias de palavras em pesquisa, permitindo um outro tipo
de anlise de palavras-chave, como visto na Figura 7.

Figura 7 - Comparao de palavras no Google Trends

Figura 8 - Sugesto de palavras no Google

26

3.2. Fatores on-page


As tcnicas aplicadas diretamente pgina Web, como o alteraes no cdigo HTML so
conhecidas como fatores on-page. Estes fatores so os mais relevantes considerando o contedo
do site, pois determinam sua estrutura hierrquica, descrio de elementos e outros detalhes na
pgina. Nas subsees seguintes sero descritos os fatores on-page e a maneira que cada um
deve ser tratado nas pginas Web.

3.2.1. Tag <title>


Esta tag indispensvel para obter relevncia pelo Google, pois ela determina no
apenas o ttulo da pgina corrente, mas tambm exibida nos resultados de classificao nos
resultados da busca. Os ttulos que contm as palavras-chave pesquisadas obtm maior
relevncia para aquela pesquisa.
Para determinar o melhor ttulo para uma pgina, devem ser seguidos os critrios j
mencionados para elaborao de contedo e palavras-chave, fazendo uma anlise em cada
pgina, visando a essncia de cada. Os ttulos devem ser nicos, precisos e a quantidade de
texto deve ser moderada, evitando textos muitos longos e aqueles demasiadamente desprovidos
de informaes. preciso ter um bom senso, indicando o que til em um ttulo. Nas
homepages podem tambm conter o nome do site ou negcio e outras pequenas informaes
como localizao fsica e resumo do que se trata o negcio. Os ttulos de cada pgina de um
site devem ser diferenciados entre si para que o Google possa distinguir o contedo de cada
pgina individualmente. Outro ponto importante colocar as palavras-chave prioritrias mais
esquerda, pois os mecanismos de busca colocam maior peso s palavras mais esquerda, uma
vez que usurios leem da esquerda para a direita.

3.2.2. Descrio (description meta tag)


Alm do ttulo, existe a possibilidade de declarar uma descrio de uma pgina
descrevendo um breve resumo. Esta descrio no obrigatria, porm ajuda aos mecanismos
de busca a compreenderem melhor o contedo correspondente a esta determinada pgina. A
descrio feita dentro da tag <meta name=description contente=descrio/resumo da

27

pgina> (Figura 9). Ela deve ser escrita levando em conta as palavras-chave que melhor
representam o contedo da pgina, oferecendo um breve resumo de aproximadamente um
pargrafo. Deve-se ter o cuidado de no elaborar uma descrio muito longa, nem mesmo
pequena ao ponto de no descrever corretamente o contedo ou assunto. Alm disso, a descrio
de cada pgina deve ser nica. O Google penaliza pginas com descries sem relao com o
contedo, descries genricas (como: Pgina sobre sapatos), descries preenchidas apenas
com palavras-chave e contedo da pgina copiado para a descrio. Sites que possuem centenas
ou milhes de pginas so tratados de uma maneira um pouco diferenciada, no penalizando a
gerao automtica de descries.

Figura 9 - Meta tag description em uma pgina Web. Fonte: [8]

Outro ponto importante sobre as descries que elas podem ser utilizadas, na maioria
das vezes, como snippets5, sendo que as palavras correspondentes pesquisa so indicadas em
negrito, sendo assim uma excelente oportunidade para atrair cliques, como mostra a Figura 10.

Figura 10 Descrio/ttulo exibidos como snippet no resultado da pesquisa. Fonte: [8]

Nome dado ao resumo apresentado como resultado da pesquisa, abaixo de cada link listado como resultado.

28

3.2.3. URLs e Estrutura de Navegao


Cada pgina em um site possui em endereo conhecido como URL. Estes endereos
tambm devem ser planejados de maneira que sejam simples de entender (em muitos casos,
possveis de serem memorizados) e, se possvel, auto descritivos. Usurios se sentem mais confortveis ao acessar links com endereos amigveis e que disponibilize de palavras reconhecveis. As palavras relevantes inseridas em uma URL forcenem aos mecanismos de busca informaes sobre aquela pgina. As URLs tambm so exibidas nos resultados de busca e as
palavras-chave so marcadas quando correspondidas, o que consequentemente melhora a classificao da pgina nos resultados.
As URLs dinmicas podem prejudicar a classificao, gerando endereos com Ids de
sesso, parmetros, palavras sem sentido, etc. importante que sejam tratados esses quesitos
de maneira que mantenha somente o necessrio para a URL. O uso de palavras genricas (pagina1.html) e de palavras-chave em excesso tambm no so recomendados para as URLs.
A estrutura de diretrios de um site na Web deve ser feita de maneira organizada e
estruturada ao passo que esta estrutura diferencie categorias, documentos, tipos de arquivo, etc.
Os diretrios iro determinar o formato da URL, sendo necessrio definir nomes intuitivos, pois
alm de ajudar os usurios encontrarem rapidamente o que procuram, auxilia os mecanismos
de busca compreenderem melhor o contexto e o que cada pgina representa em um site
completo. Alm disso, preciso ter o cuidado de deixar a estrutura muito bem definida, pois
usurios comumente removem trechos da URL para subirem um nvel no site, como na Figura
11.

Figura 11 - Usurio podem subir de diretrio removendo a ltima parte da URL

Os mecanismos de busca recomendam o uso de breadcrumbs lists6 (Figura 12) pois so


bons para visualizao da hierarquia da pgina que est situado, permitindo uma melhor
experincia aos usurios.

Breadcrumbs so auxiliares de navegao que aparecem geralmente no topo da pgina, indicando o nvel
hierrquico do site em que se encontra o internauta, permitindo que este facilmente retorne s pginas navegadas
anteriormente.
6

29

Figura 12 - Uso de Breadcrumbs

3.2.4. Pgina 404


A pgina 404 no deve apenas indicar que a pgina solicitada no foi encontrada, mas
tem que guiar os usurios para a pgina raiz e oferecer links para pginas populares e pginas
relacionadas no site, aperfeioando a experincia do usurio. importante configurar que a
pgina 404 no seja indexada pelos mecanismos de busca.

3.2.5. Links e ncoras


Os links so fundamentais para o clculo do PageRank e evidenciam a relao entre o
site e o universo da Web. A quantidade, qualidade e relevncia dos links influenciam sua classificao. Os links em uma pgina podem apontar para pginas internas ao site ou pginas de
outros sites. Com isso, possvel relacionar o contedo da pgina com o da pgina que est
sendo apontada, auxiliando os mecanismos de busca na compreenso do contexto da pgina.
Pginas com um contedo de qualidade e com bons relacionamentos (referencias para sites de
qualidade) so priorizados na classificao de busca. No uma regra inserir links externos em
todas as pginas. Isso deve ser feito somente quando necessrio.
Os links so formados por uma URL e pode ter um texto ancorado. Este texto tambm
transmite alguma informao para os mecanismos de busca a respeito do que se trata a pgina

30

referenciada, alm de mascarar endereos. O texto ancorado deve ser produzido seguindo as
mtricas de elaborao de contedo e palavras-chave. Este texto deve ser descritivo e conciso,
de maneira que contenha ao menos uma ideia bsica a respeito do que se refere pgina linkada,
evitando o uso de textos no relacionados com o contexto, textos genricos (clique aqui),
usando a prpria URL e textos longos como um pargrafo. Deve-se sempre distinguir uma ancora de um texto comum, para no prejudicar a experincia dos usurios, fazendo-os perder
links ou clica-los acidentalmente. Links quebrados tambm devem ser verificados e removidos
para no ser penalizado na classificao de busca.
Os links externos possuem um peso no clculo do PageRank, porm determinadas pginas com m reputao ou maliciosas prejudicam a classificao de um site nas pesquisas. Em
pginas que apenas um administrador controla o contedo no necessrio se preocupar com
esse aspecto, porm em pginas que contm iterao com usurios e colaborao de terceiros
importante ter cautela com o uso de links. Para isso existe o atributo rel=nofollow que quando
os robs de busca realizam a indexao e classificao de um site, quando eles enxergam este
atributo em um link, eles desconsideram aquela referncia. Em blogs, fruns e outros extremamente importante tomar o cuidado de inserir este atributo nos links para que usurio mal
intencionados no prejudiquem a classificao com links de m reputao e spam.

3.2.6. Imagens
Imagens no podem ser compreendidas pelos mecanismos de busca. Elas podem exercer
um papel importante na melhoria da classificao em um site se tratadas de maneira correta,
pois esto presentes em quase todos os sites na Web. Para que os mecanismos de busca
compreendam do que se trata uma imagem so necessrios trs procedimentos bsicos. O
primeiro o uso do atributo alt que tem a finalidade de descrever um texto alternativo imagem
e os mecanismos de busca o utilizam para indexar aquela imagem para pesquisa de imagens e
relacionar a imagem com o contexto em que ela est imersa. Essa descrio deve ser curtas,
porm descritivas. O segundo procedimento atribuir um nome associativo ao arquivo, por
exemplo: em um site de compras de sapatos, interessante atribuir imagem de um sapato algo
como sapato-couro-masculino-ref01.jpg. O ltimo procedimento organizar os arquivos de
imagem de forma centralizada, inserindo todos em um nico diretrio, pois facilita os
mecanismos de busca encontrarem imagens no site.

31

Outras observaes so importantes como:

Extenses das imagens devem ser JPEG, GIF, PNG ou BMP que so os formatos
suportados pela maioria dos navegadores;

Evitar nomes como imagem1.jpg , a.jpg , etc;

Nomes de arquivos muito longos;

Colocar somente palavras-chave no atributo alt ou cpia de trechos do contedo;

As imagens tambm podem ser usadas como links, porm somente quando for realmente
necessrio que recomendado o uso deste recurso, pois seu uso excessivo atrapalha os
mecanismos de busca compreenderem as referncias com seu contedo. Neste caso, o atributo
alt funciona de maneira similar ncora nos links.

3.2.7. Heading tag


Em todas pginas importante manter uma estrutura hierrquica bem definida, pois
auxilia o usurio visualmente, criando um ambiente organizado. Uma maneira de implementar
um tipo de hierarquia utilizando heading tags. Elas variam de <h1>, a mais importante at
<h6> com menos importncia. Essas tags indicam algo importante, que merece destaque
perante o texto. Para os mecanismos de busca essencial utilizar em cada pgina, se possvel,
ao menos a tag <h1>, pois ela utilizada para fins de ttulo interno ou cabealho, o que
disponibiliza o conhecimento do escopo ou assunto que a pgina ou texto se trata e que seja
utilizado apenas uma vez por pgina. A tag <h2> vista como um nvel abaixo de importncia
do <h2> e importante para definir subttulos. As demais devem ser utilizadas para
implementar a estrutura hierrquica no contedo, indicando destaques e pontos importantes no
texto.
Deve-se tomar cuidado com a utilizao dessas tags evitando evidenciar textos
desnecessrios, fazer uso quando pode-se ser substitudo por um negrito ou itlico, desrespeitar
a sequncia correta no uso das tags, fazer uso excessivo, etc.

3.2.8. Outras Medidas on-page


Existem alguns detalhes minuciosos que auxiliam na otimizao de um site para os

32

mecanismos de busca. Muitas vezes pequenos cuidados e providencias conseguem melhorar a


classificao nas pesquisas.
No contedo de um site altamente recomendado no utilizar imagens como textos,
pois os mecanismos de busca no interpretam contedo de imagens.
No deve ser criada uma pgina sem que esta tenha contedo suficiente, ou que seja
desnecessrio, ou pouco diferenciada de alguma outra j existente ou que dispense uma pgina
exclusiva, pois para os mecanismos de busca interpretado como pginas que no trazem uma
boa experincia para os usurios e consequentemente so penalizadas.
O uso de recursos para organizao visual do contedo e do texto beneficia os usurios
permitindo uma navegao mais confortvel, o que visto como um ponto positivo aos
mecanismos de busca que so beneficiados tambm por uma facilidade maior de compreenso
do contedo. Com isso, o uso de pargrafos (<p>), ttulos (<h1>), subttulos (<h2>) e divisrias
(<div>). Alm disso, o uso de negrito e itlico trazem indcios para o mecanismo de busca que
aquela palavra est recebendo um destaque importante naquele contexto, aprimorando sua
classificao, porm importante ter cautela com o uso para no ser penalizado. Separaes
(<hr>) tambm indica que existe uma diviso de contextos, permitindo agregao maior de
contextos diferentes relacionados ao escopo da pgina.
Pginas que mantem seu contedo atualizado e com certa frequncia modificados
ganham prioridade na classificao, pois evidencia que o site procura manter o contedo atual
e de qualidade. Pginas com contedos similares em um site no so bem vistos pelos
mecanismos de busca, o que deve ser evitado.
A meta tag keywords deve ser desconsiderada quando a SEO tem objetivo simplesmente
o Google (quase a totalidade), pois este no a utiliza como fator de classificao. Alm disso,
permite que outros profissionais de SEO vejam no cdigo as palavras-chave que foram
selecionadas que muitas vezes exige muito tempo de trabalho para determinar as melhores.
O uso do atributo style nas tags em HTML deixa o cdigo confuso, atrapalhando a
organizao e legibilidade, alm de deixar o tempo de carregamento da pgina maior que
quando utilizado a estilizao em CSS.
Nuvem de tags uma lista hierarquizada visualmente, uma forma de apresentar os itens
de contedo de um website, conforme mostra a Figura 13. Uma nuvem de tags em geral rene
um conjunto de etiquetas utilizadas em um determinado website disposto em ordem alfabtica,

33

e a quantidade de contedos que o site apresenta em cada etiqueta mostrado


proporcionalmente pelo tamanho da fonte. Dessa forma, em uma mesma interface possvel
localizar uma determinada etiqueta tanto pela ordem alfabtica como pela frequncia da
incidncia de contedos marcados com a mesma etiqueta no referido site. As etiquetas
disponibilizadas na nuvem so links que levam a itens relacionados s palavras da etiqueta.
Como isto ajuda o usurio, sugerindo itens para ele navegar, ento pode aumentar o trafego no
site, o que pode aprimorar a classificao nas buscas.

Figura 13 - Nuvem de Tags no site da Amazon - http://www.amazon.com/gp/tagging/cloud

Os rodaps exercem um papel importante em SEO. Ao navegar em uma pgina na Web,


pessoas veem em formato de F (esquerda para direita e de cima para baixo), onde a ltima
parte vista o rodap. Com isso, deve ser explorada uma boa estratgia de contedo para sugerir
o que o usurio pode fazer para dar continuidade navegao, aumentado o fluxo de acesso nas
pginas e gerando converses.

3.3. Fatores off-page


Os fatores off-page esto relacionados a tcnicas que podem melhorar a classificao de um
site atravs de medidas que no envolvem diretamente o contedo do site, ou seja, nenhuma
atividade que realize alterao no layout, na estrutura muito menos no cdigo HTML das
pginas. Nos primeiros robs de rastreamento, os algoritmos levavam em conta os fatores on-

34

page, calculavam o PageRank atravs do esquema de links e ento as pginas eram classificadas.
O universo da Web trouxe diversas propriedades que aperfeioaram essa classificao,
adicionando outros fatores que envolvem o relacionamento das pessoas com um site. Esse
relacionamento dado atravs das mdias sociais, blogs, e-mails e outros. A essncia dos fatores
off-page que quando uma pgina visitada, se esta apresenta contedos de qualidade,
relevantes e nicos, a tendncia que haja uma difuso daquela pgina gerando uma certa
publicidade. Funciona da mesma forma quando uma pessoa compra algum produto e se
satisfeito faz recomendaes a amigos. Portanto, cada recomendao vista como uma citao,
ou um voto de confiana perante outros usurios de que aquele contedo relevante. Com isso,
quanto mais citada uma pgina, maior ser sua popularidade, e ento esta recebe maior
importncia na ordem de classificao. Exemplos de fatores off-page so: comentrios em blogs
sugerindo link, anncios (banners, blogs), e-mail marketing (Newsletter), links em pginas de
parceiros (desde que no seja realizado esquema de troca ou aluguel de links), feed de notcias
(RSS) e marcao de localizao no Google Places (auxilia nas pesquisas locais). Outro fator
extremamente relevante so as mdias sociais. Existe um campo em SEO que promove a
otimizao nos resultados de busca atravs das redes scias, conhecido como SMO (Social
Media Optimization). Este segmento realiza atividades em torno de um negcio, realizando um
trabalho publicitrio, criando pginas sociais associadas ao negcio, publicando notcias e
informaes referentes ao contexto, atraindo um pblico para aquele segmento.
Consequentemente, gera converses (visita seguida de venda) para o site. Permitir
compartilhamento de contedo diretamente de uma pgina importante para possibilitar
divulgao, desde que no seja aderido a um esquema de promoo artificial. O resultado deste
trabalho reconhecido pelos mecanismos de busca que ponderam a popularidade e considera
este fator no momento da classificao.

3.4. Rich Snippets


As descries dos resultados de busca no Google so conhecidas como snippets, que
transmitem ao usurio um importante resumo do que se trata uma dada pgina. Geralmente
mostrado nos resultados o que foi definido na meta tag description, caso este tenha sido definido,
ou trechos contidos no contedo da pgina. Contudo, possvel descrever detalhes sobre o

35

contedo de maneira que os mecanismos de busca ofeream resultados de maior qualidade e


identificao para os usurios, que chamado de rich snippet.
Os Rich Snippets (Figura 14) so utilizados para resumir o contedo de uma pgina de forma
que torne mais fcil para os usurios entenderem no que consiste a pgina nos resultados de
pesquisa. Tudo que importante como informao disponibilizar durante os resultados,
permitindo oferecer um resumo ainda mais til do contedo de uma pgina, deve utilizar os
rich snippets.
Se os mecanismos de busca compreenderem o contedo de uma pgina, podem criar rich
snippets adequados associados a ela. Por exemplo, o snippet de um restaurante pode mostrar a
avaliao mdia e a faixa de preo, o snippet de uma pgina de receita pode mostrar o tempo
total de preparao, uma foto e a classificao da avaliao da receita, e o snippet de um lbum
de msica pode listar as msicas junto com um link para reproduzir cada uma. Esses rich
snippets ajudam os usurios a identificar se o site relevante para a pesquisa e podem resultar
em mais cliques em uma pgina.

Figura 14 - Rich Snippets. Fonte: [10]

3.4.1. Marcao
O termo utilizado para fazer as especificaes do contedo das pginas chamado de
marcao, que podem ser feitas utilizando trs formatos: Microdados, Microformatos e RDFa
que podem ser verificados e testados com o link da pgina, antes que sejam exibidos como
resultado de pesquisa. Aps a marcao, na prxima indexao do Google ele j ir detectar os
rich snippets.
A marcao de rich snippets deve no apenas descrever o contedo de uma pgina, mas

36

tambm descrever informaes atualizadas, contedo original e de maneira alguma vinculada


a outra pgina que no esteja disponvel integralmente na pgina. Alm disso, no garantido
o uso dos rich snippets nos resultados de classificao, pois devem atender os critrios do
Google. Abusos de marcao, fraude, contedo invisvel aos usurios, contedo irrelevante ou
enganoso (fora do escopo da pgina) so alguns critrios que inutilizam seu uso. A marcao
de dados para os rich snippets no afetar a classificao de uma pgina nos resultados de
pesquisa, mas extremamente importante para o aumento da taxa de cliques.
O Google suporta rich snippets para os seguintes tipos de contedo: resenhas, pessoas,
produtos, negcios e organizaes, receitas, eventos, msicas, vdeo, aplicativos e locais. Cada
tipo tem seus atributos e propriedades de acordo com o formato a ser utilizado. Nos exemplos
mostrados a seguir, esto abordados exemplos simples para compreenso do que pode ser feito,
para produzir rich snippets para os demais tipos alm dos exemplos basta procurar a
documentao de cada formato para o tipo especifico que se deseja marcar.

3.4.1.1. Microdados
Os microdados usam atributos simples em tags HTML para atribuir nomes curtos e
descritivos a itens e propriedades. Um exemplo de um bloco pequeno de HTML mostrando as
informaes bsicas de um contato:

<div>
Meu nome Bob Smith, mas todos me chamam de Smithy. Esta a minha pgina inicial:
<a href="http://www.example.com">www.example.com</a>
Moro em Albuquerque, Novo Mxico, e trabalho como engenheiro na ACME
Corp.
</div>

O mesmo HTML marcado com microdados:


<div itemscope itemtype="http://data-vocabulary.org/Person">
Meu nome <span itemprop="name">Bob Smith</span>,
mas todos me chamam de <span itemprop="nickname">Smithy</span>.
Esta a minha pgina inicial:

37

<a href="http://www.example.com" itemprop="url">www.example.com</a>.


Moro em
<span itemprop="address" itemscope
itemtype="http://data-vocabulary.org/Address">
<span itemprop="locality">Albuquerque</span>,
<span itemprop="region">Novo Mxico</span>
</span>
e trabalho como <span itemprop="title">engenheiro</span>
na <span itemprop="affiliation">ACME Corp</span>.
</div>

I.

Na primeira linha, o itemscope indica que o contedo um item. itemtype="http://data-vocabulary.org/Person indica que o item uma pessoa.

II.

Cada propriedade do item Pessoa identificada com o atributo itemprop. Por exemplo, itemprop="name" descreve o nome da pessoa.

III.

A propriedade address um item que contm seu prprio conjunto de propriedades.


Isso indicado colocando o atributo itemscope no item que declara a propriedade address e usando o atributo itemtype para especificar o tipo de item que est
sendo descrito.

3.4.1.2. Microformatos
Os microformatos so convenes simples (conhecidas como entidades) utilizadas para
descrever um tipo especfico de informao, por exemplo, uma avaliao, um evento, um
produto, uma empresa ou uma pessoa. Cada entidade tem suas prprias propriedades, por
exemplo, uma pessoa tem as propriedades nome, endereo, cargo, empresa e endereo de email. Em geral, os microformatos usam o atributo class em tags HTML para atribuir nomes
curtos e descritivos a entidades e suas propriedades. Um exemplo de um bloco pequeno de
HTML mostrando as informaes bsicas de um contato.
<div>
<img src="www.example.com/bobsmith.jpg" />
<strong>Bob Smith</strong>
Editor snior da ACME Reviews
200 Main St
Desertville, Arizona 12345
</div>

38

O mesmo HTML marcado com microformato hCard (pessoa).


<div class="vcard">
<img class="photo" src="www.example.com/bobsmith.jpg" />
<strong class="fn">Bob Smith</strong>
<span class="title">Editor snior</span> na <span class="org">ACME Reviews</span>
<span class="adr">
<span class="street-address">200 Main St</span>
<span class="locality">Desertville</span>, <span class="region">Arizona</span>
<span class="postal-code">12345</span>
</span>
</div>

I.

Na primeira linha, class="vcard" indica que o HTML includo descreve uma pessoa.

II.

O exemplo descreve propriedades do item pessoa, como uma foto, nome, cargo, organizao e endereo.

3.4.1.3. RDFa
RDFa uma forma de nomear o contedo de modo a descrever um tipo especfico de
informao, como uma resenha de restaurante, um evento, uma pessoa ou uma listagem de
produtos. Estes tipos de informaes so chamados entidades ou itens. Cada entidade tem um
nmero de propriedades. Por exemplo, uma pessoa tem as propriedades nome, endereo, cargo,
empresa e endereo de e-mail.
Em geral, RDFa usa atributos simples em tags XHTML para atribuir nomes curtos e
descritivos a entidades e propriedades. Um exemplo de um bloco pequeno de HTML mostrando
as informaes bsicas de um contato mostrado a seguir.
<div>
Meu nome Bob Smith, mas todos me chamam de Smithy. Esta a minha pgina
inicial:
<a href="http://www.example.com">www.example.com</a>.
Moro em Albuquerque, Novo Mxico, e trabalho como engenheiro na ACME Corp.
</div>

O mesmo HTML marcado com RDFa.

39

<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person">


Meu nome <span property="v:name">Bob Smith</span>,
mas todos me chamam de <span property="v:nickname">Smithy</span>.
Esta a minha pgina inicial:
<a href="http://www.example.com" rel="v:url">www.example.com</a>.
Moro em Albuquerque, Novo Mxico, e trabalho como <span property="v:title">engenheiro</span>
na <span property="v:affiliation">ACME Corp</span>.
</div>

O exemplo comea com uma declarao de namespace usando xmlns. Isso indica o na-

I.

mespace onde o vocabulrio (uma lista de entidades e seus componentes) especificado.


Pode-se usar a declarao de namespace xmlns:v="http://rdf.data-vocabulary.org/#" sempre que
II.

marcar pginas para pessoas, revises ou dados de locais.

Na primeira linha, typeof="v:Person" indica que o contedo marcado representa uma


pessoa. O nome de propriedade typeof prefixado com v: (typeof="v:Person")

III.

Cada propriedade da pessoa (como nome e apelido) rotulada usando property. O


nome da propriedade prefixado com v: (<span property="v:nickname">).

IV.

Para indicar um URL, usado rel em vez de property.

3.5. Sitemaps
Existem dois tipos de mapas de site que so utilizados e ambos com finalidades distintas. O
primeiro, site map (mapa de site) uma simples pgina em um site que exibe a estrutura do site,
listando uma hierarquia das pginas de um site, que so teis aos usurios quando estes tem
alguma dificuldade em encontrar alguma pgina. Mesmo que os mecanismos de busca rastreiam
esta pgina, ela voltada principalmente para os usurios, podendo melhorar sua experincia.

Figura 15 - Exemplo de site map. Fonte: [8]

Os XML Sitemaps (Figura 16) so um modo de informar e declarar aos mecanismos de


busca sobre todas as pginas de um site que no poderiam ser rastreadas de outra forma. Criar

40

e enviar um Sitemap ajuda a garantir que os mecanismos de busca tenham conhecimento de


todas as pginas de um site, incluindo URLs que no seriam encontrados por meio do processo
normal de rastreamento.
Alm disso, possvel usar Sitemaps para fornecer metadados sobre tipos especficos de
contedo, como vdeo, imagem, celular e notcias. Por exemplo, uma entrada de Sitemap de
vdeo pode especificar o tempo de execuo, categoria e status de "indicado para menores" de
um vdeo. Uma entrada de Sitemap de imagem pode fornecer informaes sobre o assunto, tipo
e licena de uma imagem.
Sites com contedo dinmico, AJAX, sites recm-criados so essenciais o uso de Sitemaps,
pois facilita os robs de busca rastrearem estes tipos de situaes que poderiam provocar algum
tipo de dificuldade nos procedimentos padres de rastreamento.
O Google no garante que todos os URLs so rastreados ou indexados. No entanto, os dados
no Sitemap so usados para aprender sobre a estrutura de um site, beneficiando, na maioria dos
casos, quem envia o Sitemap, e jamais so penalizados por faz-lo.
possvel definir a prioridade relativa de todas as pginas em um site de modo que informe
ao rastreador quais pginas so mais (e tambm menos) importantes dentro do site. Definir a
prioridade de pginas no afeta a classificao do site nos resultados de pesquisa. Os
mecanismos de busca usam essa informao ao selecionar URLs no mesmo site. Com isso,
aumenta a possibilidade de que as pginas mais importantes estejam em um ndice de pesquisa
e obtenham mais acessos dentro de um site.
Os Sitemaps seguem padres como o protocolo de Sitemaps e podem ser criados
manualmente ou utilizando ferramentas para gerao de Sitemaps disponveis na Web. O XML
a seguir um Sitemap bsico com algumas URLs e definio de prioridade e frequncia de
atualizao de uma pgina.

41

Figura 16 - Exemplo de um XML Sitemap. Fonte: [8]

Alm do formato padro acima, possvel produzir Sitemaps mais simples em formato
txt que incluem somente URLs de pginas da web, e no imagens, vdeo ou outros dados
especializados. Basta informar uma URL por linha e salvar no modo txt antes de enviar.
Para informar aos mecanismos de pesquisa sobre o local e a existncia de um Sitemap,
deve-se incluir a seguinte linha no arquivo robots.txt:
sitemap: http://www.example.com/sitemap.xml

3.6. Controle de rastreamento


Em muitos casos til definir o que deve ser rastreado pelos mecanismos de busca ou no,
pois em um domnio pode conter pginas no interessantes aos usurios, diretrios apenas para
backup ou arquivos no necessrios para indexao do site, subdomnios e outros. Para isso,
existem trs maneiras de bloquear o rastreamento: utilizando metatags, o arquivo robots.txt e
x-robots-tag.
Quando se tem acesso raiz do domnio pode-se usar simplesmente o robots.txt, caso
contrrio, possvel restringir o acesso usando os outros dois modos. Para impedir
completamente que o contedo de uma pgina seja rastreado, mesmo que outros sites estejam

42

vinculados a ela, utiliza-se a metatag noindex ou uma x-robots-tag. Quando os mecanismos de


busca rastrearem a pgina, encontrar a metatag noindex e impedir que a pgina aparea no
ndice da web. O cabealho HTTP x-robots-tag til principalmente quando se deseja limitar a
indexao de arquivos no HTML, como grficos e outros tipos de documentos.
O robots.txt um arquivo utilizado para definir como as URLs de um site sero tratadas
durante o rastreamento. O arquivo robots.txt necessrio apenas para o caso de incluir algum
contedo que voc no queira que no os mecanismos de pesquisa indexem. Caso deseja-se que
os mecanismos de pesquisa indexem tudo o que h em um site, o arquivo robots.txt no ser
necessrio (nem mesmo um arquivo em branco). No robots.txt possvel definir quais robs
deseja-se aplicar alguma regra, regras de padres de arquivos e extenses, URLs, recurso para
diretrios e outros. Alm disso, possvel informar a existncia do Sitemap.
O robots.txt criado de uma maneira simples contendo apenas duas clausulas: Disallow
e User-agent, sendo o primeiro para determinar qual o rob se deseja aplicar a regra e o segundo
a URL que deseja bloquear, por exemplo:
User-agent: *
Disallow: /folder1/
User-agent: Googlebot
Disallow: /folder2/

Neste exemplo, apenas os URLs que correspondem a /pasta2/ no sero permitidos para
o Googlebot.
Alm das duas regras, pode-se usar outra pouco usada: Allow que til quando desejase criar excees alguma regra determinada pelo Disallow.
Existe uma lista de mais de trezentos robs em operao que rastreiam a Web que pode
ser encontrada na pgina www.botsvsbrowsers.com. Os detalhes de definio de bloqueio de
user-agents e padres de correspondncia podem ser encontrados na facilmente em diversas
documentaes na Web. Para utilizar o robots.txt preciso apenas coloc-lo na raiz do site, por
exemplo: http://www.example.com/robots.txt .

43

3.6.1. Meta tags para bloqueio


Para impedir completamente que o contedo de uma pgina seja rastreado, mesmo que
outros sites levem a ela, pode-se usar a meta tag noindex. Quando os robs rastrearem a pgina,
encontrar a meta tag noindex e impedir que a pgina aparea nos resultados de pesquisa.
O padro de meta noindex est descrito em http://www.robotstxt.org/meta.html. Esse
mtodo til no se tem acesso raiz do servidor, pois permite controlar o acesso a cada pgina
do site. Para impedir todos os robs de indexarem uma pgina em um site, coloca-se a seguinte
meta tag na seo <head> da pgina:
<meta name="robots" content="noindex">

Para permitir que outros robs indexem a pgina de um site, impedindo somente os
robs do Google de indexar sua pgina:
<meta name="googlebot" content="noindex">

Ao usar a meta tag noindex em uma pgina, o Google remover a pgina por completo
de seus resultados de pesquisa, mesmo se houver outras pginas vinculadas. No entanto, outros
mecanismos de pesquisa podem interpretar essa instruo de modo diferente, podendo aparecer
nos resultados de pesquisa.

3.6.2. X-Robots-Tag
O X-Robosts-Tag pode ser usado como um elemento de HTTP response para uma dada
URL. Qualquer tipo de restrio e bloqueio realizado pela metatag pode ser realizado pelo XRobots-Tag.
Para definio das restries pode ser feita atravs do servidor Web utilizado, como por
exemplo o Apache. Para adicionar o X-Robots-Tag ao HTTP response de um site usando
o .htaccess e httpd.conf que so padres em servidores Web baseados no Apache. A vantagem
de do uso de X-Robots-Tag que pode-se aplicar regras de rastreamento por todo o site, pelo
grande suporte a expresses regulares. Por exemplo, para adicionar um noindex ou nofollow
ao HTTP response para todos arquivos com extenso PDF em todo o site deve-se inserir o
seguinte cdigo nos arquivos .htaccess e no httpd.conf:

44

<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>

3.7. Fatores de desempenho (otimizao do tempo de navegao)


Um site com um bom desempenho em relao ao tempo de navegao oferece aos usurios
uma melhor experincia. A meta do Google fornecer aos usurios resultados mais relevantes
e uma tima experincia. Sites mais rpidos aumentam a satisfao do usurio e melhoram a
qualidade geral da Web (especialmente para os usurios com conexes lentas com a Internet).
Algumas prticas simples podem otimizar o tempo de navegao e existem ferramentas de
anlise de desempenho (relativo ao tempo) para verificar diversos parmetros e indicar o que
pode ser melhorado. O desempenho na navegao um critrio de avaliao dos mecanismos
de busca, especialmente o Google para classificar pginas nos resultados de busca.
Para aprimorar o tempo de navegao preciso seguir uma srie de fatores, detalhados as
seguir:
a) Minimizar o tamanho de carga nos pacotes: minimizando o tamanho da carga dos
recursos dinmicos pode reduzir significativamente a latncia de rede.
i) Habilitar compresso: A maioria dos navegadores modernos suportam compresso
de dados para arquivos HTML, CSS e JavaScript. Isto permite que o contedo a ser
enviado atravs da rede de forma mais compacta e pode resultar em uma reduo no
tempo de transferncia.
ii) Remover CSS no utilizados
iii) Minimizar JavaScripts, CSS e HTML: Minimizar o cdigo refere-se a eliminao
de espaos extras, quebras de linha, indentao, tornando o cdigo compacto. Essa
pratica poder reduzir a quantidade de bytes de um cdigo. Existem diversas
ferramentas para efetuar a minimizao.
iv) Adiar carregamento de JavaScript: Adiando o carregamento de funes
JavaScript que no so chamados na inicializao reduz o tamanho inicial de

45

download, permitindo outros recursos serem baixados em paralelo, e acelerar a


execuo e tempo de renderizao.
v) Otimizar imagens: Formatando imagens de maneira correta pode reduzir o tempo
de carregamento. A extenso indicada para imagens (no fotografias) .gif. e
fotos .jpg, pois so mais compactas. Alm disso, comprimir as imagens para uma
resoluo que atenda s necessidades, evitando deixar imagens em alta resoluo se
no necessrio.
vi) Centralizar recursos: Imagens, estilos e scripts podem ser referenciados em
diversas pginas em um site. Determinar uma nica URL para cada um destes
recursos evita cpias.
b) Minimizar RTT (Round-Trip Time)
i) Minimizar pesquisa DNS: Reduzir o nmero de nomes de host nicos a partir do
qual os recursos so servidos reduz o nmero de resolues DNS que o navegador
tem de fazer e, portanto, atrasos RTT.
ii) Evitar requisies invlidas: Remover links quebrados ou requisies que
resultem em erro 404/410.
iii) Combinar JavaScripts e CSS externos: Combinar diversos scripts externos
fragmentados no mnimo possvel potencialmente reduz o RTT.
iv) Otimizar a ordem dos estilos e scripts: Ordenar corretamente a declarao de
folhas de estilo e scripts permite uma melhor paralelizao de donwloads e acelera
o tempo de renderizao do navegador.
v) Evitar uso de document.write()
vi) Evitar uso de CSS @import: Em vez de @import, usar a tag <link> para cada
estilo. Isso permite que o navegador para baixar folhas de estilo em paralelo, o que
resulta em tempos de carregamento mais rpido da pgina.
vii) Recursos assncronos: Buscando recursos de forma assncrona impede que
recursos bloqueiam o carregamento da pgina.
c) Otimizar renderizao no navegador: Uma vez que os recursos foram transferidos
para o cliente, o navegador ainda precisa carregar, interpretar e renderizar HTML, CSS

46

e JavaScript. Formatando o cdigo e pginas de forma que exploram as caractersticas


dos navegadores atuais, possvel melhorar o desempenho no lado do cliente.
i) Uso eficiente de seletores CSS: Evitar o uso de chaves que abrangem um grande
nmero de elementos.
ii) Colocar CSS no cabealho do documento
iii) Especificar dimenses das imagens: Especificando a largura e a altura de todas as
imagens permite uma renderizao mais rpida, eliminando a necessidade de
redimencionamentos desnecessrios e reconstrues.
iv) Especificar a codificao de caracteres

3.8. White Hat x Black Hat


A otimizao para os mecanismos de busca realizada atravs de uma srie de tcnicas e
estratgias, como foi visto anteriormente. O objetivo de fazer SEO sempre deve ser em levar
aos usurios um contedo original e de qualidade e no otimizar para mecanismos de busca. A
tentativa de utilizar o conhecimento do funcionamento dos mecanismos de busca para realizar
atividades que possam de alguma maneira trazer benefcios na classificao de uma pgina nos
resultados de pesquisa, mas que no sejam benficas aos usurios, conhecido como Black Hat.
Este utiliza artifcios que violam as diretrizes em fazer SEO: oferecer uma boa experincia aos
usurios, com contedo relevante e de qualidade. Utilizar essas tcnicas pode trazer algum
retorno curto prazo, mas que ao serem percebidos pelos mecanismos de busca, podem ser
severamente penalizados ou at mesmo banidos do ndice de busca. O Google combate
arduamente o uso de Black Hat e seus robs de busca so capazes de detectar grande parte das
violaes imediatamente. Outras mais sutis so detectadas em pouco tempo.
Ao contrrio do Black Hat, o White Hat conhecido pela utilizao das estratgias e
tcnicas em SEO sempre respeitando as recomendaes e tendo como objetivo melhorar a Web
e trazer a melhor experincia possvel aos usurios.
A seguir esto relatadas as principais tcnicas de Black Hat e como evitar seu uso.

47

3.8.1. Cloaking (camuflagem de contedo)


Cloaking uma tcnica utilizada para entregarem contedos diferentes de uma mesma
URL para visitantes especficos do site. Os visitantes podem ser classificados por tipo (Web
Crawler ou Human User) ou por localidade (regio do mundo ou Endereo IP). Para isso
existem 3 mtodos de cloaking:

Cloaking Por User-Agent: Detecta o user-agent e o classifica.

Cloaking Por IP Delivery: Entrega um contedo diferente para um usurio de IP


especfico.

Cloaking Por Geo-Targeting: Entrega um contedo diferente para usurios dentro de


uma faixa de IPs que delimitam uma regio do mundo especfica.

3.8.2. Texto e links ocultos


Ocultar texto ou links no contedo para manipular as classificaes de pesquisa dos
mecanismos de busca pode ser visto como enganoso, sendo uma violao. O texto pode ser
ocultado de diversas formas, como:

Uso de texto com fonte branca em fundo branco;

Localizao de texto atrs de imagens;

Usar CSS para posicionar texto fora da tela;

Configurao do tamanho da fonte para zero;

Ocultar um link vinculando apenas um pequeno caractere, por exemplo, um hfen no


meio de um pargrafo.

3.8.3. Contedo gerado automaticamente


Contedo gerado automaticamente o contedo que foi gerado de maneira programtica,
consistindo em pargrafos aleatrios de texto que no fazem nenhum sentido ao leitor, mas que
podem conter palavras-chave de pesquisa, como:

Texto traduzido por uma ferramenta automtica sem reviso humana antes da publicao.

48

Texto gerado por processos automatizados.

Texto gerado usando sincronizao automatizada ou tcnicas de ocultamento.

Texto gerado copiando feeds Atom/RSS ou resultados de pesquisa.

Agrupamento ou combinao de contedos de diferentes pginas da web sem acrscimo de


valor suficiente.

3.8.4. Preenchimento de palavra-chave


Preenchimento de palavra-chave refere-se prtica de encher uma pgina web com
palavras-chave ou nmeros na tentativa de manipular a classificao do site em um resultado
de pesquisa. O uso excessivo de palavras e sinnimos visto como uma experincia negativa
para os usurios.

3.8.5. Doorway Pages


As pginas de entrada geralmente so grandes conjuntos de pginas de pouca qualidade
em que cada pgina otimizada para uma palavra-chave ou frase especfica, levando aos
usurios pouca informao e contedos irrelevantes.

3.8.6. Pgina com comportamento malicioso


Distribuir contedo ou software em um site que se comporte de forma diferente do
esperado pelo usurio, manipulando contedo na pgina de maneira inesperada ou faa o
download ou execute arquivos no computador de um usurio de forma involuntria, gerao de
SPAMs, consultas automticas, considerado Black Hat.

3.8.7. Esquemas de Link


Existem diversas maneiras de violar as diretrizes de qualidade dos mecanismos de busca
atravs do uso de links. Utilizar compra de links sem uso da tag nofollow, troca de links com
sites parceiros que no tenham relao ao escopo da pgina (pode ser usado com nofollow),
link farms esquema de criao de sites somente com a finalidade de linkar outros sites, links
com redirecionamento, links em blogs sem nofollow, entre outros.

49

3.9. Ferramentas de Apoio ao Trabalho de SEO


Algumas ferramentas so uteis para o trabalho de SEO a respeito da elaborao do contedo
e anlise dos resultados segundo diversos aspectos. Para estratgia baseada na
melhoria/otimizao de contedo, sugere-se o uso da ferramenta Google Trends, conforme
mostrado na sesso 3.1.
Para anlise dos resultados, sugere-se o uso do Google Analytics (Figura 17). Ela uma
ferramenta muito poderosa, pois disponibiliza informaes detalhadas sobre as impresses nas
pginas, como pblico alvo, informaes demogrficas, horrios, idiomas de busca, navegador,
sistema operacional, tipo de dispositivo, tempo de permanncia, palavras-chave que levaram a
pgina, qualidade no contedo e diversas outra informaes que podem ser analisadas para
melhoria das estratgias de SEO.

Figura 17 Exemplo do Google Analytics para um site.

Outra ferramenta importante para anlise dos resultados a PageSpeed (Figura 18) do
Google que faz uma anlise da qualidade de desempenho de navegao. Com ela possvel
verificar o que pode ser feito para melhorar a velocidade de navegao, com instrues de como
faz-las. Alm disso, uma nota dada a pgina avaliando a qualidade de otimizao para
navegao.

50

Figura 18 - Resultado do PageSpeed da pgina www.ufes.br

3.10.

Melhoria das classificaes na Web usando solues pagas

Alm da busca orgnica, existe a possibilidade de criar campanhas para links patrocinados.
Os links patrocinados do Google so exibidos como resultados de pesquisa, porm so
destacadas do resultado da busca orgnica e podem aparecer em outros sites como banner ou
em forma de link. Esta uma soluo que pode ter um custo alto, tendo a possibilidade de
alcance segmentado, utilizando o Google Adwords (Figura 19).

51

Figura 19 - Anncios nos resultados de busca

Para criar campanhas de links patrocinados preciso criar uma conta no Google e seguir
os passos no Google Adwords de maneira bem simples. Alm disso, possvel monitorar e
acompanhar o desempenho e verificar sugestes e fatores indicativos que podem gerar
resultados positivos para maior acesso.
Tendo apresentado os principais desafios e fatores que influenciam na classificao dos sites
pelos mecanismos de busca, possvel iniciar o trabalho a ser desenvolvido por um profissional
de SEO. O prximo captulo apresenta o estudo de caso deste projeto, aplicando as tcnicas
apresentadas neste captulo. No estudo de caso, um site real de uma empresa ter sua
classificao melhorada com a aplicao das tcnicas e procedimentos apresentados neste
projeto e os resultados sero analisados comparando os principais mecanismos de busca.

52

4. Estudo de Caso
O

estudo

de

caso

foi

realizado

utilizando

um

site

preexistente

na Web

(http://smartsti.com.br), que foi desenvolvido inicialmente sem nenhum tipo de otimizao para
mecanismos de busca. Este site foi reestruturado e foram aplicadas as tcnicas on-page e offpage descritas nos tpicos anteriores com o objetivo de analisar a melhoria da classificao
orgnica nos resultados de busca no Google, Bing e Yahoo.
Como a empresa tem um foco no mercado local, as otimizaes no site foram feitas tendo
em vista este tipo de cliente potencial, ou seja, aquele que realiza a busca de um contedo
(informao) associado a algo com proximidade fsica do local onde a pesquisa realizada.
Para realizar o trabalho de SEO, foi necessrio seguir algumas etapas fundamentadas nos
princpios citados nos captulos anteriores, e assim permitir que os robs rastreiem as URLs e
informaes do site da empresa e que os resultados produzidos pelos mecanismos de busca
coloquem o site da empresa o mais prximo do topo dos seus ndices.
O primeiro passo realizado foi a pesquisa e o planejamento de contedo. A pesquisa foi
baseada numa anlise do mercado, verificando como os concorrentes trabalham, a qualidade
dos seus sites, o tempo de permanncia da Web, a imerso nas redes sociais e, em alguns casos,
inspecionar o cdigo HTML de pginas concorrentes para verificar se foi feito SEO para que
na fase de planejamento possa tomar algumas medidas para aprimorar o que foi feito por
concorrentes.
Na fase de planejamento foram definidas as estratgias de contedo, que definem os
assuntos abordados, quais pginas seriam criadas, analise de palavras-chave (Figura 20) e
demais tarefas referentes ao contedo (assunto, texto e imagens). Alm disso, importante
definir uma lista de pesquisas por palavras-chave como meta de classificao, definindo a
posio nos resultados de busca e o tempo desejado para este objetivo, por exemplo: uma
pgina A de um site tem o assunto B e eu desejo que nas pesquisas com as palavras (C D E)
tragam esta pgina entre os 10 primeiros resultados nos prximos seis meses. Estas atividades
so importantes pois: (i) auxiliam a elaborao de textos fundamentados no que foi definido,
propiciando contedos mais relevantes, evitando que sejam criadas pginas com assuntos
genricos, com pouco contedo ou irrelevantes e (ii) definem mtricas para analisar os
resultados.

53

Figura 20 - Anlise de palavras-chave com o Google Trends

54

Aps o planejamento, inicia-se o desenvolvimento das atividades planejadas na fase anterior,


elaborando os textos, selecionando as imagens e fazendo as mudanas de layout necessrias
para as alteraes e atualizaes de contedo definidas. Nesta etapa, no necessrio
implementar as tcnicas de SEO ainda, pois trata-se apenas de remodelar os site para absorver
as alteraes definidas no planejamento.
Em seguida, todas as tcnicas de SEO foram abordadas e implantadas quando necessrio,
como todos os detalhes necessrios no cdigo HTML, marcao de dados, controle de
rastreamento, esquema de links, hierarquias, etc. Com isso, interessante fazer um checklist
com todas as atividades a serem realizadas para obter um controle do que foi feito. As tabelas
a seguir mostram a comparao entre a situao inicial e aps a otimizao.
Tabela 1 - Check list fatores on-page

Fatores On-Page
Tarefas

Situao Inicial

Aps SEO

Pginas com contedo relevante


Otimizao de palavras-chave
Ttulo (<title>)
Ttulo otimizado
Descrio (description)
URLs descritivas
Estruturas de navegao e diretrios
Breadcrumbs Lists
Pgina 404
Links internos
Links externos
Contedo com links indicativos e ncoras
Uso de nofollow em links
Atributo alt em imagens
Diretrios para imagens
Imagens em extenses recomendadas
Heading Tags
Hierarquia de heading tags
Imagens como texto
Pginas relevantes
Pargrafos, ttulos, divises, hierarquia
Pginas similares
Meta tag keywords
Style nas tags HTML
Nuvem de Tags
Rodap
Rodap sugestivo
Marcao microdados
XML Sitemap
Controle de rastreamento
Compresso habilitada

NO
NO
SIM
NO
NO
NO
NO
SIM
NO
SIM
SIM
NO
NO
NO
NO
SIM
SIM
NO
SIM
NO
SIM
SIM
NO
SIM
NO
SIM
NO
NO
SIM
NO
NO

SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
SIM
NO
SIM
SIM
SIM
SIM
SIM
NO
SIM
SIM
NO
NO
NO
NO
SIM
SIM
SIM
SIM
SIM
SIM

55

Remoo de arquivos desnecessrios


NO
SIM
Imagens otimizadas
NO
SIM
Links quebrados
NO
NO
Contedo irrastrevel (Flash, JavaScript)
SIM
NO
Recursos assncronos
SIM
SIM
Codificao de caracteres especificada
NO
SIM
Idioma especificado
NO
SIM
(*) As linhas selecionadas com fundo cinza representam aspectos e prticas ruins que prejudicam a classificao
de um site nos resultados de busca.
Tabela 2 - Check list fatores off-page

Fatores Off-Page
Tarefas

Situao Inicial

Aps SEO

Links em sites parceiros


Marcao Google Places
Pgina Facebook
Conta Twitter
Pgina Google +
Pgina Linkedin

SIM
NO
SIM
NO
NO
NO

SIM
SIM
SIM
SIM
SIM
SIM

Aps a realizao das atividades do checklist, todo o site foi publicado (submetido ao
servidor de hospedagem) para em seguida fazer uma srie de testes para conferir erros, verificar
a qualidade de navegao (se existem problemas de sobrecarga para navegao) e algumas
medidas que, por algum motivo, no foram realizadas.
O SEOquake [11] (plugin instalado no navegador Firefox) faz diversas verificaes,
disponibiliza estatsticas de rastreamento e indexao, analise de SEO, informaes de redes
sociais e diversos outros detalhes. importante destacar que estas ferramentas de SEO so
simplesmente para auxiliar o trabalho de SEO e, portanto, algumas informaes
disponibilizadas nem sempre so necessrias cabendo ao profissional discernir o melhor a ser
feito.
O PageSpeed [12] uma ferramenta do Google que d uma nota de 0 a 100 da qualidade
relacionada ao tempo e desempenho de navegao de uma pgina e informa os problemas,
detalhando o nvel de relevncia de cada um, sugerindo solues reais que podem trazer
resultados importantes para a navegao do site, que uma mtrica adotada pelos mecanismos
de busca como classificao nos resultados de busca.
Outra ferramenta importante para verificao dos resultados obtidos a partir das
requisies das URLs de um site o HTTP Web-Sniffer [13]. Ele permite analisar o Header
do Request e o Response de uma pgina que til para verificar se o servidor est realizando a
compresso corretamente, bloqueio de agentes e robs, codificao, cache, formato de conexo

56

com o servidor e diversas outras configuraes que podem ser feitas.

Figura 21 - Teste SEO com a ferramenta SEOquake

57

Figura 22- Teste de velocidade de navegao com o PageSpeed

Figura 23 - Response da pgina smartsti.com.br verificado com o Web-Sniffer

58

Uma vez realizados os testes e verificaes, devem ser tomadas medidas necessrias para
correo dos problemas pendentes para que esteja tudo pronto para a ltima fase que a de
monitoramento dos robs de busca e do estado dos ndices dos mecanismos de busca e
verificao dos resultados.

4.1. Resultados Obtidos


O rastreamento pelos robs de busca e a incluso nos ndices so processos naturais e,
portanto, so tarefas clssicas dos mecanismos de busca. Os manuais de SEO disponibilizados
pelos principais buscadores no preveem nenhum tipo de prazo ou periodicidade, nem mesmo
uma garantia que as URLs de um site sero rastreadas e/ou indexadas. Por isso, na maioria das
vezes exige-se pacincia para aguardar os resultados da incluso nos ndices de busca, o que
pode levar at meses de espera.
Uma forma de possibilitar o acompanhamento e o monitoramento dos resultados feita
atravs de alguns recursos e ferramentas disponveis pelos mecanismos de busca para que o
webmaster no fique aguardando os resultados sem qualquer tipo de informao, que so (i) as
buscas especiais e (ii) as ferramentas disponibilizadas pelo Google e o Bing para webmasters7
que possibilitam uma srie de atividades de monitoramento. O Yahoo no possui uma
ferramenta prpria de monitoramento e combina os dados de navegao com o Bing.

Figura 24 Screenhoot do Google Webmaster Tools [14]

O Webmaster um profissional capaz de realizar tarefas tanto de um web designer (elaborao do projeto esttico e funcional de um web
site) quanto de um web developer (que faz a parte da programao, como sistemas de login, cadastro, rea administrativa).

59

Figura 25 - Bing Webmaster [15]

O site http://smartsti.com.br possui uma estrutura simples, conforme mostra a Figura 26.
Ele contm um diretrio para as imagens (/images), outros dois com folhas de estilo
(/stylesheets) e scripts (/scripts), um com as pginas de servios, e os demais foram
configurados para no serem rastreados, pois no tem utilidade para este site. Alguns arquivos
na raiz compem pginas e os demais so para configurao do servidor, controle de
rastreamento, Sitemap e verificao de autoridade de pgina, exigida para o monitoramento
pelas ferramentas para webmasters. No total os site contm 5 pginas e a pgina 404. Alm
disso, contm 130 arquivos de imagens, 15 arquivos de scripts e 6 folhas de estilo (CSS),
totalizando 3.07MB de contedo publicado.

Figura 26 - Estrutura de diretrios do site

60

O sitemap.xml e o robots.txt so definies do comportamento desejado pelos robs de


busca, e podem ( recomendado) ser submetidos atravs das ferramentas para webmasters. O
Sitemap, por exemplo, prope aos mecanismos de busca uma srie de recomendaes e
informaes respeito de algumas URLs do site, mas nenhum mecanismo de busca garante que
ser tratado exatamente daquela maneira, mas recomendam seu uso.

Figura 27 - sitemap.xml do site smartsti.com.br

O robots.txt foi definido de forma bem simples restringindo algumas URLs e diretrios que
no eram desejados que fossem rastreados por nenhum rob de busca e nenhum mecanismo de
busca, alm de definir a localizao do sitemap.xml .

61

Figura 28- robots.txt

A seguir sero mostrados os resultados e o comportamento dos mecanismos de busca nos


rastreamento pelos robs de busca e a indexao das pginas por cada uma das ferramentas de
busca consideradas (Bing/Yahoo e Google) para webmasters e as consultas nas busca especiais.

4.1.1. Anlise com o Bing


Primeiramente o Bing Webmaster foi bem consistente, simples, rpido e eficiente nos
resultados. O sitemap.xml foi submetido (Figura 29) e processado com xito no mesmo dia. O
Bing Webmaster no possui opo de envio do robots.txt, supostamente detectando durante o
rastreamento por seus robs de busca.

Figura 29 - Envio do Sitemap pelo Bing

O Bing Webmaster disponibiliza algumas outras funcionalidades, como: enviar URLs para
serem indexadas (solicitao); bloquear URLs; remover cache e diversas informaes de
estatsticas sobre o site; alm de diagnsticos e ferramentas.

62

Figura 31 - Envio de URLs pelo o Bing Webmaster

Figura 30 - Menu do Bing


Webmaster

Conforme pode ser observado na Figura 32, extrada do Bing Webmaster, a situao aps 3
semanas foi de 5 pginas rastreadas (total de 5) e 10 pginas indexadas (total de 5,
possivelmente as pginas antigas ainda esto contabilizadas no ndice) e 18 URLs rastreadas (o
total varia de acordo com o que cada mecanismo de busca considera como URL, por exemplo:
imagem, folha de estilo, XML, PDF, etc.).

Figura 32 - Situao do site aps 3 semanas segundo o Bing

63

Figura 33 - Atividades do site

A marcao de dados detectada sem dificuldades, sendo possvel a conferncia


inserindo a URL de uma pgina e verificando a marcao de dados, como mostra a Figura 34.

Figura 34 - Verificao de marcao de dados pelo Bing Webmaster

Foram enviadas as URLs das pginas do site, conforme mostra a Figura 31, solicitando o
Bing rastrear e indexar estas pginas. O resultado foi praticamente imediato. Em algumas horas
o ndice do Bing j continha as novas pginas (conforme a consulta especial mostrada na

64

Figura 35) mesclados com URLs j removidas presentes na verso antiga do site.

Figura 35 - Consulta do cache do Bing

Os resultados obtidos durante as buscas pelo Bing foram satisfatrias. Como pode ser
observado nos exemplos de busca das Figuras 36, 37 e 38, foi conquistado o resultado entre
as 10 primeiras posies para mais de uma pesquisa no Bing.

65

Figura 36 - Resultado no Bing em 1 lugar

Figura 38 - Resultado no Bing em 3 lugar

Figura 37 - Resultado no Bing em 5 lugar

Observou-se que, cerca de dois dias aps efetuar a indexao, o Bing desenvolve algum tipo
de verificao de spams e de polticas de privacidade e segurana, que remove algumas URLs
do ndice (ver Figura 39). Segundo o manual de instrues para webmasters do Bing este
comportamento comum e, aps algum tempo, os resultados iniciais voltam ao ndice, desde
que no haja violao de nenhuma diretriz.

66

Figura 39 - Cache do Bing aps alguns dias

4.1.2. Anlise com o Google


Semelhante forma que foi trabalhada no Bing, foi realizado um monitoramento com o
Google para acompanhar o processo de rastreamento dos robs e a indexao. Estes dois
procedimentos so feitos sem uma previso, podendo ser rpidos (alguns dias) ou demandando
um prazo maior (alguns meses). Alm disso, o Google no garante o rastreamento e indexao
de nenhum site. Sites com poucos ou nenhum link externo tendem a levar um tempo maior para
o rastreamento, justificado pela maneira que o algoritmo do PageRank trabalha. Entretanto, a
ferramenta de webmasters do Google [14], permite (semelhante ferramenta do Bing) um
acompanhamento das informaes dos robs e o ndice.
O Google no seu manual de SEO [8], recomenda o uso de Sitemaps, mas tambm no
garante que as URLs do Sitemap sero rastreadas e indexadas. O Sitemap e o robots.txt podem
ser detectados pelo processo natural dos robs de busca, mas possvel fazer o envio destes
atravs do Google Webmaster Tools, o que foi feito como mostra a Figura 41.

67

Figura 41 - Estado do Sipemap enviado no Google


Webmaster Tools

Figura 40 - Menu de opes do Google Webmaster Tools

Observa-se que todas URLs contidas no Sitemap foram enviadas e apenas 2 indexadas (aps
3 semanas de envio). Portanto, no momento, existem apenas 2 (das 5 enviadas) pginas no
ndice do Google segundo o Google Webmaster Tools.
Diferente do Bing, a ferramenta do Google permite o envio de robots.txt e testar URLs do
site para verificar se sero bloqueadas ou no segundo a poltica de rastreamento definida pelo
robots.txt. O envio foi realizado com sucesso e conforme os testes realizados, o bloqueio das
URLs desejadas est funcionando corretamente.

68

Figura 42 - Painel do robots.txt no Google Webmaster Tools

Outra funcionalidade importante desta ferramenta a opo Buscar como o Google, que
busca uma URL e, quando processado, permite solicitar o envio para o ndice. A URL de todas
as pginas foi submetida, porm no influenciou de fato no ndice do Google.

Figura 43 - Opo " Buscar como o Google"

A marcao de dados estruturados foi detectada duas semanas aps a concluso da


modificao e submisso do Sitemap. Esta marcao foi feita utilizando microdados com a
coleo de esquemas do schema.org e foi mantida inalterada desde a publicao do site. Mesmo

69

assim, percebeu-se que a quantidade de pginas detectadas com marcao inexplicavelmente


variou na ferramenta, conforme mostra a Figura 44.

Figura 44 - Estado da marcao de dados no Google

Quanto ao rastreamento das URLs pelos robs de busca e a incluso no ndice de pesquisas
do Google, a situao aps 3 semanas da publicao do site e submisso do Sitemap foi a
seguinte: foram rastreados 67 URLs (o total varia de acordo com o que cada mecanismo de busca
considera como URL, tais como, imagem, folha de estilo, XML, PDF, etc.) e deste total 7 pginas
indexadas, o que mostra uma pequena incluso no ndice do Google mediante o total.

Figura 45 - URLs rastreadas, indexadas e bloqueadas pelo Google

As URLs presentes no site, antes de aplicar o trabalho de SEO, que no existem no site atual
podem ser solicitadas para remoo do ndice do Google bem como solicitar a mesma do cache

70

de qualquer pgina que estiver no ndice, o que til quando uma pgina alterada. Esta opo
no se mostrou muito eficiente, pois diversas URLs solicitadas para remoo do ndice se
mantiveram nos resultados, conforme se observa nas Figuras 46 e 47.

Figura 46 - URLs removidas do ndice do Google

71

Figura 47 - URLs mantiveram no ndice mesmo aps remoo no Google

A consulta especial (site:url) feita para consultar o estado do ndice dos mecanismos de
busca. Alm desta, o Google permite o uso de outras consultas especiais (ver Tabela 3).

72

Tabela 3 - Consultas Especiais do Google

Resultado

Consulta Especial

Verificar pginas indexadas de um site

site:url

Verificar pginas que possuem links para um site

link:url

Verificar cache de uma pgina

cache:url

Verificar pginas similares

related:url

Verificar relao das opes anteriores

info:url

Observando a consulta especial do Google sobre o ndice do site, percebe-se que todas as
pginas novas (inclusive algumas antigas j solicitadas de serem removidas) esto includas no
ndice e, portanto indexadas. Entretanto a informao disponibilizada pelo Google Webmaster
Tools sobre as URLs indexadas que foram submetidas pelo Sitemap (as mesmas URLs
mostradas na consulta especial), conforme a Figura 41, contrape o resultado da consulta
especial, informando apenas 2 pginas indexadas.
Seguido desses resultados, os testes de pesquisa por palavras-chave no Google foram
realizados (Figura 48), no apresentando resultados satisfatrios, pois o objetivo era estar entre
os 10 primeiros resultados, atingindo a 30 posio na mesma pesquisa que no Bing atingiu
a 1 posio. Alm disso, pode-se observar que nos 10 primeiros resultados do Google no
retornaram resultados relevantes para a consulta sobre o negcio local, mostrando anncios,
perfis pessoais, vdeo no relacionado, oferta de empregos, etc.

Figura 48 - Resultado de pesquisa no Google

73

Figura 49 - 10 primeiros resultados no Google para a pesquisa

Figura 50 - Resultado de pesquisa mais especfica no Google apareceu na


primeira pgina o resultado

74

Inserindo uma palavra-chave (Web) a mais o resultado da busca colocou o site da


empresa entre os 10 primeiros conforme a Figura 50. Quanto mais palavras-chave inseridas
nas pesquisas, menor o universo que engloba um contexto, ou seja, determinada uma
especificao maior para o que est se pesquisando. Alm disso, a palavra Web, possui uma
relevncia grande no contexto que o site est inserido, conforme foi visto nas pesquisas por
palavras-chave na ferramenta Google Trend (Figura 20) e, com isso, o Google interpretou
melhor a pesquisa retornando o site entre as primeiras posies.
Outra observao realizada que durante as pesquisas os rich snippets a marcao do
Google Places foi considerada, mostrando os resultados como snippets comuns, no
diferenciando a marcao de dados feita no site dos demais (supostamente deveria ser relevado
mediante os demais sem marcao).
O Yahoo compartilha informaes de ndice do Bing e apresentou exatamente os
mesmos resultados do Bing.

Figura 51 - Resultado de pesquisa no Yahoo

75

4.2. Melhoria dos Resultados


A seo anterior mostrou que os resultados obtidos foram satisfatrios, especialmente com
o Bing. Os resultados devem ser trabalhados de forma que seja mantida a classificao
alcanada e/ou at mesmo melhorada, especialmente no Google que em determinada pesquisa
no foi atingido uma posio esperada na classificao dos resultados de busca.
Uma anlise crtica para os resultados que o site apresenta poucas pginas com contedo,
e ainda tem pouca reputao relativa s redes sociais, o que pode ter prejudicado o resultado
para algumas consultas.
Para melhorar os resultados necessrio realizar uma anlise do que foi feito e o que
possvel fazer para melhorar a classificao, baseado no que foi proposto neste projeto. Alm
disso, trabalhar nas redes sociais e manter o contedo do site atualizado ou modificado
contribuem para resultados melhores. As ferramentas mostradas, como as de webmasters so
importantes para o monitoramento e diagnstico do estado das pginas e sugestes de melhorias.

76

5. Concluso
A otimizao de Websites para buscas orgnicas uma tarefa que exige muito trabalho no
apenas tcnico, mas outras reas importantes como pesquisa de mercado, anlise do consumidor
e os resultados no so imediatos, podendo levar meses para alcanar uma meta desejada. Alm
disso, necessrio estar sempre realizando um acompanhamento e melhorias para que os
resultados no percam classificao, pois eles variam diariamente. Estar entre os primeiros
um resultado de um trabalho constante.
Os resultados obtidos no intervalo de tempo de um ms mostraram que os mecanismos de
busca, especialmente o Google, apresentam diversas diretrizes que prometem destacar o site ou
relevar, mas na prtica no funcionam de maneira conforme prometido. Na busca por uma
empresa de SEO em Vitria pode-se observar que no Google foram exibidos diversos resultados
irrelevantes sem qualquer relao com as palavras-chave, mostrando anncios e currculos
pessoais e sites desenvolvidos sem qualquer diretriz de qualidade recomendada pelos
mecanismos de busca. Outro ponto, que a marcao de dados para rich snippets no foi
considerada nas pesquisas locais, nem mesmo a marcao de locais no Google Places.
O Google Webmaster Tools apresentou uma srie de inconsistncias relacionadas s
informaes disponibilizadas pela ferramenta para webmasters e as consultas especiais. Foi
verificada uma divergncia de informaes comuns, como quantidade de pginas indexadas,
URLs informadas de terem sido removidas pelo Google Webmaster Tools sendo exibidas no
ndice do Google, marcao de dados com problema de deteco, conflito de cache de pginas
indexadas exibindo cache da pgina antiga, alm de gastar um tempo muito maior (semanas
para indexar poucas URLs) que o Bing Webmaster (menos de uma semana para indexar as
principais URLs) para rastreamento e indexao. Outras observaes foram feitas, como um
erro de rastreamento de uma URL que j havia sido removida e notificada ao Google, ttulo de
pginas no ndice inexistentes, snippet de uma pgina aparecendo em outra, informaes
mudando em tempo real (somente atualizando a pgina da ferramenta de webmaster do Google),
entre outros. Alm disso, o Google exibiu resultados totalmente irrelevantes frente das pginas
do site colocado como estudo de caso.
Conforme foi visto no captulo 2, possvel fazer um relacionamento dos resultados com o
que a arquitetura dos mecanismos de busca modernos tem como referncia. A inconsistncia de

77

informaes confirma que as informaes so coletadas por mquinas distintas (crawlers) e


que existe um atraso de sincronizao de dados entre servidores que armazenam os documentos
(repository) quando realizado algum tipo de consulta (at mesmo a coleta de dados das
ferramentas de webmasters), ou algum problema de cache, possivelmente pelo fato que os
barrels no esto sempre atualizados, pois o indexer no entra em ao sempre que documentos
so adicionados ao repositrio, e sim com certa periodicidade definida pela arquitetura. Estes
fatos so caractersticos da arquitetura dos mecanismos de busca modernos tendo em vista que
so descentralizadas diversas operaes e em seguida sincronizadas, pois com isso, possvel
obter melhor desempenho computacional para processamento de informaes na Web. Alm
disso, o Google apresentou uma maneira diferente de rastrear as pginas, coletando dados
parciais em cada rastreamento e no a pgina como um todo, identificando detalhes em
sequncia em cada pgina, o contribuiu gerando uma srie de divergncias e inconsistncias
nas informaes disponibilizadas.
Os mecanismos de busca, especialmente o Google alcanaram muita credibilidade pela sua
eficincia e resultados, entretanto, foi observado que ainda existem falhas e problemas de
atualizao e sincronizao de informaes de pginas na Web que em muitos casos podem
prejudicar ou no trazerem resultados relevantes aos usurios e tambm para quem os pblica.
De maneira alguma possvel garantir uma posio na classificao orgnica de pesquisa.
O uso de solues pagas, como Links patrocinados uma forma que pode garantir a exibio
nos resultados de busca, diferente da busca orgnica. Existem vantagens dos Links patrocinados
em relao fazer SEO e vice-versa. Fazer SEO interessante, pois estar entre os primeiros na
busca orgnica demonstra credibilidade, alm de permitir realizar uma otimizao de quantas
palavras-chave se desejar. J os links patrocinados tem a vantagem de obter resultados imediatos,
alm de que muito difcil fazer pginas otimizadas para todas as palavras-chave desejadas.
Portanto no possvel determinar qual melhor em relao ao outro, pois depende da inteno
e dos objetivos de cada pgina.

78

6. Referncias
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]

[9]
[10]

[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]

PageRank, [Online]. Available: http://pt.wikipedia.org/wiki/PageRank.


D. Ivo, PageRank, Conversion, [Online]. Available:
http://www.conversion.com.br/otimizacao-de-sites-seo/PageRank/.
The Mobile PlayBook, Google, [Online]. Available:
http://www.themobileplaybook.com/br/#/cover.
Gartner, GoMobile, Google, 2011. [Online]. Available:
http://www.howtogomo.com/br/d/porque-virar-mobile/#reasons-mobile-matters.
pingdom, 16 Janeiro 2013. [Online]. Available:
http://royal.pingdom.com/2013/01/16/Internet-2012-in-numbers/.
Google, Facts about Google and Competition, Google, [Online]. Available:
http://www.google.com/competition/howgooglesearchworks.html.
S. a. L. P. Brin, The anatomy of a large-scale hypertextual web search engine., 2000.
Google SEO starter Guide, [Online]. Available:
http://static.googleusercontent.com/external_content/untrusted_dlcp/www.google.com/
pt-BR//webmasters/docs/search-engine-optimization-starter-guide.pdf.
Google Basics, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=70897.
Rich snippets (microdados, microformatos, RDFa e Marcador de dados), [Online].
Available: http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=99170.
SEOquake, [Online]. Available: http://www.seoquake.com/.
Make the Web Faster, Google, [Online]. Available:
https://developers.google.com/speed.
View HTTP Request and Response Header, [Online]. Available: http://websniffer.net/.
Google Webmaster Tools, Google, [Online]. Available:
http://www.google.com/webmasters/tools.
Bing - Ferramenta do Webmaster, Microsoft, [Online]. Available:
http://www.bing.com/toolbox/webmaster.
Google Analytics, Google, [Online]. Available: http://www.google.com/analytics/.
Server-side scripting, [Online]. Available: http://en.wikipedia.org/wiki/Serverside_scripting.
K. Ramirez, Build Ajax-based Web sites with PHP, IBM, 2 Setembro 2008. [Online].
Available: https://www.ibm.com/developerworks/library/wa-aj-php/.
D. Ivo, Open SEO, Conversion, [Online]. Available:
http://www.conversion.com.br/openseo/.
About the Robots <META> tag, [Online]. Available:
http://www.robotstxt.org/meta.html.
Robots meta tag and X-Robots-Tag HTTP header specifications, Google, [Online].
Available: https://developers.google.com/webmasters/control-crawl-

79

[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]

[34]
[35]
[36]
[37]

[38]
[39]

[40]

index/docs/robots_meta_tag?hl=pt-BR.
Contedo gerado automaticamente, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721306.
Esquemas de link, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66356.
Cloaking, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66355.
Texto e links ocultos, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66353.
Pginas de entrada, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721311.
Programas de afiliao, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=76465.
Contedo copiado, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721312.
Preenchimento de palavra-chave, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66358.
Criao de pginas com comportamento malicioso, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2721313.
Diretrizes para rich snippets, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=2722261#3.
Sobre microdados, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=176035.
Sobre microformatos, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=146897&topic=1088472&ctx=topic.
Sobre RDFa, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=146898.
Rich Snippets for Local Search, Google, [Online]. Available:
http://maps.google.com/help/maps/richsnippetslocal/.
Consultas automticas, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=66357.
Sobre Sitemaps, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=156184&from=40318&rd=1.
Como adicionar mais informaes a um Sitemap, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=71936.
Sitemap index file, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=71453&topic=8476&ctx=topic.
Como criar Sitemaps, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-

80

[41]

[42]
[43]
[44]
[45]
[46]

BR&answer=183668&topic=8476&ctx=topic.
Como enviar Sitemaps, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=ptBR&answer=183669&topic=8476&ctx=topic.
Imagens, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=114016.
Desempenho do site, Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=158541#1.
Search Engine Optimization (SEO), Google, [Online]. Available:
http://support.google.com/webmasters/bin/answer.py?hl=en&answer=35291.
Web Performance Best Practices, Google, [Online]. Available:
https://developers.google.com/speed/docs/best-practices/rules_intro.
E. Enge, S. Spencer e R. Fishkin, The Art of SEO, O'Reilly, 2012.

Você também pode gostar