Você está na página 1de 13

Mdulo I

MOTORES DE BUSCA NA INTERNET


Introduo
Pesquisa de Informao de carcter
genrico
Pesquisa de Informao em Bases de
Dados
Utilizao de dicionrios on-line
Ferramentas de traduo on-line

DI@2006

Diapositivo

Internet
O que ?
A Internet a rede mundial de redes de computadores
que permite a comunicao em tempo real com
qualquer computador do mundo, permitindo ao mesmo
tempo partilhar recursos.

Como funciona?
Atravs de um conjunto de protocolos (regras de
comunicao TCP/IP) que tm a grande vantagem de
ser entendidos por qualquer mquina (PC, Unix,
Mac...).
O sucesso da Internet assenta na facilidade de
pesquisa, consulta e transmisso de informao.
DI@2006

Diapositivo

Web
O que ?
A World Wide Web, ou simplesmente web, uma das
maneiras de aceder informao na Internet.
um modelo de partilha de informao que funciona
sobre a Internet.
A web representa um sistema de servidores da Internet
que suportam documentos num formato especfico.

DI@2006

Diapositivo

Web
Como funciona?
A web utiliza navegadores para aceder a
documentos web (pginas web) que esto
interligados entre si atravs de hiper-ligaes.
As pginas web utilizam a linguagem HTML
para apresentarem tambm texto, imagens,
som e vdeo.
A web utiliza ainda o protocolo HTTP para a
transferncia dos dados.
DI@2006

Diapositivo

Informao na web
Que tipo de informao est disponvel?
No h limites para o tipo de informao que se pode
encontrar na web.
Para estudo e investigao, os recursos mais
pertinentes so: bibliografia geral ou especializada,
dados estatsticos, actas de congressos, legislao,
notcias e informao jornalstica, bases de dados,
directrios e relatrios de empresas e de instituies,
informao acadmica...
DI@2006

Diapositivo

Informao na web
Precaues
A informao que se publica na web pode no ser
sujeita a nenhum tipo de avaliao prvia por parte de
editores ou profissionais especializados, nem a
quaisquer normas de qualidade.
A fiabilidade da informao obtida na rede deve ser
submetida a anlise rigorosa, sobretudo no que diz
respeito origem dos contedos, cronologia de
actualizao dos contedos, mtodos e objectivos,
aplicabilidade, etc.
DI@2006

Diapositivo

Endereo na internet - URL


Cada site tem o seu prprio endereo URL (Uniform
Resource Locator) que identifica o nome do computador
ligado Internet. O site disponibiliza o documento e o
nome dos ficheiros nesse computador, tal como refere o
exemplo seguinte:
http://www.estv.ipv.pt/saestv/index.htm

Tipo de Protocolo

Nome do Dominio

Caminho

ficheiro

(ftp://, telnet://, http://)

(Nem sempre antecede


www)

(directrios ou pastas)

(html, htm,
asp)

http://

www.estv.ipv.pt

/saestv/

DI@2006

index.htm

Diapositivo

Motores de busca
Os motores de busca so a chave para encontrar
informao especfica na vastido da web.
Sem eles seria virtualmente impossvel encontrar o que se
pretende sem conhecer a URL especfica.
Utilizam algoritmos sofisticados para indexar
automaticamente a informao da web, descrita ou no
por meta-comandos, em bases de dados locais.

DI@2006

Diapositivo

Motores de busca

Um motor de busca consiste, essencialmente, numa base


de dados de sites na Internet, e software (conhecidos
como spiders, crawlers, worms ou web robots) que
percorrem continuamente a Internet para recolherem
dados para processamento e possvel incluso nas suas
listas.

A maioria dos spiders encontra pginas web seguindo


ligaes dentro de documentos, e depois novas ligaes
dentro desses documentos ligados, e assim
sucessivamente.

Os spiders tambm verificam websites submetidos ao


motor de busca.
DI@2006

Diapositivo

Motores de busca
Quando se questiona um motor de buscas, est-se a
questionar a BD local e no a web. Deste modo as
respostas so rpidas.
No entanto, o resultado pode conter hiper-ligaes que j
no so vlidas.
Ao efectuar a mesma pergunta em vrios motores de
busca as respostas podem no coincidir devido
utilizao de diferentes:
algoritmos de pesquisa; formas de classificao (relevncia) das
pginas; frequncia de actualizao; etc.

DI@2006

Diapositivo

10

Pesquisa de Informao de
carcter genrico
Que motores de busca utilizar?

Percentagem de utilizao nos EUA em Julho de 2006

DI@2006

Diapositivo

11

Motores de busca
Exemplos de motores de busca:
www.sapo.pt

www.altavista.com

DI@2006

www.google.pt

www.aeiou.pt

www.excite.com

www.yahoo.com

www.lycos.com

www.hotbot.com

Diapositivo

12

Programas de meta pesquisa


Os programas de meta pesquisa permitem
interrogar vrios operadores de pesquisas
simultaneamente, e oferecem, quer motores
de busca quer directorias web.
Os operadores de meta pesquisa no detm
usualmente as suas prprias bases de dados
de websites ou URLs.
Fornecem o portal de entrada para serem
levadas a cabo pesquisas simultneas nos
servios com que lidam.
Exemplos:
www.metacrawler.com
www.ask.com
www.dogpile.com
DI@2006

Diapositivo

13

Pesquisa de Informao de
carcter genrico

Pesquisa simples: como pesquisar

Incluir palavras (+): como pesquisar +operadores

Resposta: os resultados no podem conter a palavra

Procurar termos exactos/frase (): definio de internet

Resposta: os resultados tm de conter a palavra


Dica: no pode haver espaos entre o sinal e a palavra

Excluir palavra (-): definir internet -wikipdia

Resposta: normalmente os primeiros resultados contm a frase,


os seguintes ambas as palavras, os ltimos uma das palavras.
Dica: devemos ser o mais preciso possvel.

Resposta: os resultados tm de conter a expresso/frase


Dica: podem ser utilizadas mltiplas vezes e juntamente com os
outros operadores para sofisticar a pesquisa

Pesquisa combinada:
internet definition -wikipdia +webopedia
DI@2006

Diapositivo

14

Pesquisa de Informao de
carcter genrico

Comandos de pesquisa avanada


A disponibilidade dos comandos variam consoante o motor de
busca.

Pesquisa por ocorrncias

em qualquer lugar da pgina (valor predefinido)


no ttulo da pgina allintitle: / intitle: / title: / (etc.)
no corpo da pgina - allintext: / (etc.)
num determinado site/domnio site: / host: / domain: / (etc.)
num endereo/URL allinurl: inurl: / url: / in.url: / (etc.)
nas ligaes para a pgina link: / in.link: / (til quando se estiver
interessado em saber quantas pessoas ligaram a sua pgina nossa)

Outros

por domnio (apenas / no) / lngua / imagens / notcias / utilizao de


wildcards (* / ?),

Exemplo

site:ipv.pt informtica

DI@2006

Diapositivo

15

Pesquisa de Informao em
Bases de Dados
Na web existe informao no dispersa e
especfica em bases de dados prprias,
pertena de entidades/instituies que a
mantm, zelando para que a mesma seja
fidedigna:
O acesso a esta informao feito atravs de portais e
motores de busca prprios;
O acesso, por parte dos utilizadores, pode ser livre, ou
restrito. (Note-se que, quando o acesso livre,
normalmente exigido um registo do utilizador).

DI@2006

Diapositivo

16

Pesquisa de Informao em
Bases de Dados
Como se pesquisa neste tipo de BDs:
Normalmente, estas bases de dados tm regras
que so impostas pelos sistemas que as
suportam.
Assim, convm consultar a ajuda disponibilizada
pelo portal, principalmente quando
pretendemos fazer uma consulta avanada.
DI@2006

Diapositivo

17

Pesquisa de Informao em
Bases de Dados
Vantagens:
Sendo esta informao especfica e disponibilizada por
uma entidade (fidedigna), a mesma no dispersa;
Estas BDs renem informao de qualidade numa
grande variedade de formatos, nomeadamente
electrnico.
A sua coleco criada a pensar no tipo de pblico a
que se destina, pelo que no caso dos documentos
electrnicos, a grande distino entre os recursos aqui
existentes e os da Web (generalista) reside no facto de
terem sido avaliados, validados e recomendados pelos
tcnicos que a trabalham.
DI@2006

Diapositivo

18

Pesquisa de Informao em
Bases de Dados
Exemplos:

()
DI@2006

Diapositivo

19

Pesquisa de Informao em
Bases de Dados (Exemplo 1)

O que a b-on?
A b-on, Biblioteca do Conhecimento On-line, rene as principais editoras
de revistas cientficas internacionais, de modo a oferecer um conjunto
vasto de artigos cientficos disponveis on-line.

Quem pode aceder b-on?


Existem quatro tipos distintos de utilizadores :

Utilizadores institucionais - So todos aqueles que integram os quadros da


instituio aderente ou nela desenvolvem actividade, incluindo,
nomeadamente, investigadores, docentes, estudantes, bolseiros, pessoal
tcnico e, em geral, pessoas com um vnculo jurdico-laboral instituio
aderente;
Walk in users - So todos aqueles que, no sendo utilizadores institucionais,
podem aceder aos contedos a que tm acesso, atravs dos locais pblicos
de acesso da instituio aderente;
Visitantes nacionais - So todos os utilizadores que fazem o acesso a partir
de redes nacionais no aderentes ou de redes no nacionais no uso de
credenciais de acesso para o portal obtidas a partir de redes nacionais;
Visitantes internacionais -So todos os utilizadores no classificados como
"institucionais" que faam o acesso a partir de redes no nacionais sem
credenciais de acesso para o portal.

Fonte: www.b-on.pt
DI@2006

Diapositivo

20

10

Pesquisa de Informao em
Bases de Dados (Exemplo 2)

O que o INFOLINE?
O INFOLINE, servio de informao on-line do INE,
a pgina de referncia do Instituto Nacional de
Estatstica na Internet - www.ine.pt. Neste servio
possvel consultar online um conjunto muito vasto de
informao estatstica, desagregada at um nvel
mximo de freguesia.

Como se obtm acesso informao?


Toda a informao disponvel no INFOLINE de
acesso gratuito, sendo apenas necessrio efectuar um
registo prvio. O registo pode ser efectuado atravs
de formulrio electrnico, pessoalmente nas
Direces Regionais, por fax, correio ou e-mail.
Fonte: www.ine.pt
DI@2006

Diapositivo

21

Utilizao de dicionrios on-line


Vantagens:
Diminuio do tempo de pesquisa quando
comparados com os dicionrios convencionais
Permitem (nalguns casos) a correco
ortogrfica de texto completo
Fcil utilizao

Desvantagens:
Necessidade de ligao internet

Exemplos:
priberam.pt (ver ligao gramtica);
portoeditora.pt; universal.pt
DI@2006

Diapositivo

22

11

Ferramentas de traduo on-line


Um tradutor on-line gratuito pode ser um grande aliado
para quem deseja ampliar o vocabulrio noutros idiomas.
Mas no mgico, preciso ter um pouco de cuidado
antes de utilizar este tipo de ferramentas.

necessrio entender que estes instrumentos traduzem


os termos automaticamente e, por isso, no
aconselhvel colocarem-se frases inteiras e muito menos
textos inteiros. Portanto, so mais indicados para a
traduo de termos, palavras e verbos.

DI@2006

Diapositivo

23

Ferramentas de traduo on-line


Alguns tradutores on-line permitem captar o sentido geral
do texto original, mas no proporcionam uma traduo
perfeita.

Quando pretendemos utilizar estas ferramentas para


traduzir breves fragmentos de texto, devemos utilizar
correctamente a gramtica. O calo, as faltas de
ortografia, a m pontuao e as frases demasiado
complexas ou longas, podem fazer com que o texto seja
traduzido incorrectamente.

DI@2006

Diapositivo

24

12

Ferramentas de traduo on-line

Quem tem conhecimentos bsicos de gramtica em


algum idioma e sabe formar frases correctas, pode obter
grandes vantagens com a utilizao destes tradutores.
Porm, para quem precisa adquirir a base para
formao de frases e no tem nenhum conhecimento
gramatical no idioma, ser mais aconselhvel frequentar
primeiro um curso de lnguas.

Exemplos:

DI@2006

http://www.google.com/language_tools
http://babelfish.altavista.com/tr
http://dictionary.reference.com/translate/text.html
http://www.systranbox.com/systran/box
Diapositivo

25

13