Você está na página 1de 2

Mecanismos de Busca

• Como funciona?
Antes de um mecanismo de busca poder dizer a você onde um arquivo ou documento
está, ele deve ser encontrado. Para encontrar informações em centenas de milhões de
páginas da Web, um mecanismo de busca emprega robôs de software especiais,
chamados aranhas, para construir listas de palavras encontradas nos sites da Web.
Quando uma aranha está construindo suas listas, o processo é chamado de rastejamento
da Web. Para construir e manter uma lista útil de palavras, as aranhas de um mecanismo
de busca precisam olhar várias páginas.
Como qualquer aranha começa suas viagens na Web? Os pontos iniciais usuais são as
listas de servidores muito usados e páginas muito procuradas. A aranha começará por um
site popular, indexando as palavras em suas páginas e seguindo cada link encontrado
dentro do site. Dessa forma, o sistema de aranhas inicia rapidamente a viagem,
alastrando-se pelas partes mais amplamente usadas da Web.
Quando a aranha olha para uma página HTML, ela anotou duas coisas:
• as palavras dentro da página;
• onde as palavras foram encontradas.
As palavras que ocorrem no título, subtítulos, meta tags e outras posições de relativa
importância foram anotadas para consideração especial durante a busca de usuário
subseqüente. Algumas aranha foram criada para indexar toda palavra significante em uma
página, desconsiderando os "um", "uma", "o" e "a". Outras aranhas seguem abordagens
diferentes.

Meta tags

• O que são?

As meta tags permitem aos proprietários de uma página especificar palavras-chave e


determinar sob quais delas a página será indexada. Isso pode ser útil, especialmente nos
casos em que as palavras na página podem ter significados duplos ou triplos: as meta tags
podem guiar o mecanismo de busca para escolher qual desses vários possíveis
significados para essas palavras é o correto. Existe, porém, um perigo em se confiar em
excesso nas meta tags, porque um dono de página inescrupuloso ou descuidado pode
acrescentar meta tags que se encaixem em tópicos muitos populares, mas que não
tenham nada a ver com o real conteúdo da página. Para se proteger contra isso, as
aranhas correlacionam as meta tags com o conteúdo da página, rejeitando aquelas que
não coincidam com as palavras na página.

• Como utilizar?
Se você está pensando em colocar suas páginas em ferramentas de busca você vai
precisar adicionar Meta tags à sua página. As duas Meta tags mais comuns deixam você
descrever a página e especificar um conjunto de palavras-chave para ela, além de declarar
várias outras coisas. As Meta tags sempre aparecem entre as tags <HEAD> e </HEAD>
do código-fonte HTML.

<html>

<head>

<title> Aprendendo sobre as meta tags </title>

<meta name="author" content="Unip">

<meta name="description" content="Meta Tags - O que são


e como utilizá-las ">

<meta name="keywords" content="sites, web, desenvolvimento">

<meta http-equiv="PICS-Label" content='(PICS-1.1 "http://www.rsac.org/ratingsv01.html" l


gen true comment "RSACi North America Server" for "http://www.hsw.com.br" on
"1998.09.23T01:29-0800" r (n 0 s 0 v 0 l 0))'>

</head>

A primeira tag é uma descrição da página. As ferramentas de busca usam este texto
diretamente em suas listagens. Se você não tiver uma meta tag de descrição, de duas,
uma: ou a ferramenta de busca deixa sua descrição em branco ou usa uma ou duas frases
do início da sua página como descrição.
A segunda tag indica um conjunto de palavras-chave extras para a página. As ferramentas
de busca geralmente indexam cada palavra na página, mas em muitos casos você não vai
usar no texto da sua página uma determinada palavra que pode ser usada por alguém à
procura da sua página. Se você sabe que as pessoas geralmente escrevem errado uma
determinada palavra, você pode também colocá-la na lista de palavras-chave.
A terceira tag é uma tag de classificação da RSAC, alguns navegadores são configurados
para bloquear páginas que não estejam classificadas, então, ao classificar seu site você
evita problemas com estes navegadores. Ao classificar seu conteúdo pela RSAC, você
mostra para as pessoas exatamente que tipo de conteúdo está fornecendo.

Você também pode gostar