Você está na página 1de 12

REVISO

35
As dobras semiticas do ciberespao:

DA WEB VISVEL
da web visvel invisvel

REVIEW INVISVEL
The semiotic fold of cyberespace: from
the visible to the invisible web

Silvana Drumond MONTEIRO1


Marcos Vinicius FIDENCIO2

Resumo
Aps a instituio do ciberespao, na dcada de 1990, a Web tornou-se o seu principal constructo e vem dobrando e desdobran-
do-se em vrios sentidos: Web Invisvel, Web Visvel, Web Semntica, Web Pragmtica, Web Social ou 2.0, entre outras. Em relao
Web Invisvel, de acordo com os autores que escrevem sobre o tema, existe a inquietante questo: que nome dar a esse
(des)territrio? Web Invisvel, Profunda, Oculta, Escura? A partir da compreenso do conceito de dobra, criado por Leibniz e
ressignificado por Deleuze, que explica os agenciamentos maqunicos e a viso pragmtica dos aspectos tcnicos e materiais das
semiticas, fez-se uma prospeco conceitual da Web Invisvel e de alguns mecanismos de busca que fazem a dobra com essa
Web no ciberespao. Para alm da literatura, descobriu-se uma Web verdadeiramente escura, a DarkWeb, paralela e underground
utilizada para o bem e para o mal, como previsvel da espcie humana.
Palavras-chave: Ciberespao. Dobra semitica. Web invisvel. Web visvel.

Abstract
After the institution of cyberspace in the 1990s, the Web has become its main construct and has been folding and unfolding in several
directions: Invisible Web, Visible Web, Semantic Web, Pragmatic Web, Web 2.0 or Social, among others. In particular, the Invisible Web,
according to the authors who write on the subject, there is a disturbing question: what to call this (un)territory? Invisible Web, Deep, Hidden,
Dark? From understanding the concept of fold, created by Leibniz and reframed by Deleuze, which explains the machinic assemblages
and pragmatic view of the technical aspects of semiotics and material, a conceptual exploration of the Invisible Web and of some search
engines was made that make the fold with these webs in cyberspace. Going beyond the literature, a Web truly dark was discovered, DarkWeb,
parallel and underground, used for good and for evil, as expected of the human species.
Keywords: Cyberspace. Semiotics fold. Invisible web. Visible web.

Introduo objetivando comprovar as mltiplas sintaxes de or-


ganizao, tendo como aporte terico a heteroge-
A partir da proposta epistemolgica de estudar neidade e a multiplicidade dos regimes de signos -
os agenciamentos maqunicos na organizao do conhe- princpios filosficos do Rizoma (Deleuze; Guattari, 1995)
cimento e da informao no ciberespao, uma catego- e as matrizes da linguagem-pensamento (Santaella,
rizao dos mecanismos foi elaborada e estudada 2005).

1
Professora Doutora, Universidade Estadual de Londrina, Departamento de Cincia da Informao. Rod. Celso Garcia, PR 445, km 380, Campus Universitrio,
86055-900, Londrina, PR, Brasil. Correspondncia para/Correspondence to: S.D. MONTEIRO. E-mail: <silvanadrumond@gmail.com>.
2
Acadmico, Universidade Estadual de Londrina, Departamento de Cincia da Informao, Curso de Biblioteconomia, Londrina, PR, Brasil.
Recebido em 14/9/2012, e aceito para publicao em 30/11/2012.

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


Assim, essas hipersintaxes tambm refletem o se confunde com esse desenvolvimento do signo, como
momento atual - designado ps-moderno (para alguns), o signo se confunde com o enrolamento do sentido
contemporneo (para outros) -, do qual no temos uma (Deleuze, 2010, p.84), assim o tambm em relao Web
viso esvaziadora, pois as Tecnologias da Informao e Visvel/Invisvel no ciberespao.
Comunicao (TIC) so mais que ferramentas, so peas
justamente nessa dobra semitica dos meca-
heterogneas que, conjugadas ou amalgamadas com os
nismos de busca que surgem as hibridizaes dos me-
homens, formam determinadas mquinas: mquina
canismos, das linguagens e da indexao; surgem
abstrata, mquina social, mquina de guerra etc., para
tambm as hipersintaxes e as intersemioses. Alm disso,
usar expresses deleuzianas.
ao categorizar os mecanismos de busca, em especial aque-
Ademais, as mquinas tambm formam a dobra, les especializados em Web Invisvel, descobriu-se uma
conceito com espessura epistmica complexa, criado por
dobra, uma Web maior, oculta, tambm designada
Leibniz e ressignificado por Deleuze (1991), que explica os
continente escuro, na qual esses mecanismos fazem a
agenciamentos maqunicos e a viso pragmtica dos
dobra com a Web Visvel e mostram apenas uma pequena
aspectos tcnicos e materiais das semiticas. A dobra
parte, mas insinuam a grande extenso que o cibe-
uma prega que, em latim, significa plica, implicar, e quer
respao.
dizer: dobrar, unir; j explicar desdobrar. Seu efeito
que: Se por um lado fcil definir a Web Visvel como
aquela composta de pginas da Web em HyperText Markup
A dobra, portanto, cria uma nova relao dentro-
-fora; uma nova topologia: quando o contato se Language (HTML), cujos motores de busca optaram por
realiza, isso equivale ao estabelecimento de inclu-las em seus ndices, a Web Invisvel muito mais
ligaes at ento no concretizadas, apenas difcil de se definir e de se classificar por vrias razes,
potenciais, entre os componentes dispersos sejam elas tecnolgicas, polticas ou operacionais.
originais (Oliveira, 2003, p.152, grifos do autor).
De acordo com os autores que escrevem sobre a
O prprio signo uma dobra, pois pode dobrar-
Web Invisvel, existe a inquietante profuso conceitual
-se, desdobrar-se e redobrar-se em vrios tipos e semiti-
sobre a Web: Invisvel, Profunda, Oculta e Escura. Pode-se
cas. A dobra do signo instaura mais que o desdobramento
considerar todos esses conceitos, de acordo com as
do significante/significado, pois pensar a significao
dobras de (in)visibilidade do ciberespao? Segundo
como ato (filosofia pragmtica) implica pensar o signo
Bergman (2001), mais adequado seria a Web Profunda
como agenciamento maqunico.
(para a Web Invisvel), uma vez que o termo invisvel no
Pode-se considerar, tambm, a Web Visvel e Invi- seria correto, pois a invisibilidade apenas uma questo
svel como partes de uma dobra, com fronteiras difusas,
tecnolgica ou mesmo poltica de indexao dos me-
s vezes ambguas, mas intrinsecamente unidas, sendo a
canismos de busca.
Web Visvel o (des)dobramento da interioridade da Web
Invisvel. Assim, pode-se inferir ainda que, nos agen- J Sherman e Price (2001), na descrio das vrias
ciamentos maqunicos, nas conexes com as TIC, as do- camadas da Web, deixam perceber que o termo invisvel
bras estejam sempre presentes, configurando novas no exatamente o par dicotmico da Web Visvel, mas
36
dimenses, novas topologias e novas possibilidades. apenas a existncia de planos de invisibilidade, como as
desdobras ou texturas do ciberespao.
O movimento das semiticas nas TIC produz novas
dobras, tanto dos signos quanto do sentido, uma vez Relacionou-se, em algum momento, a Web Visvel
S.D. MONTEIRO & M.V. FIDENCIO

que no h delimitao entre a estrutura fsica e lgica, com a indexvel, pois explicita bem o olhar e interesse
lembrando que a dobra a continuidade do avesso e do sobre esse objeto. No tocante a seu par, ou suas dobras, o
direito, e o sentido se distribui dos dois lados, ao mesmo artigo intenta desvelar seu campo semntico com mais
tempo, pois o signo im-plica o sentido e o sentido ex- vagar. Que nome dar a esse (des)territrio escuro? Web
-plica o signo (Machado, 2009). Profunda, Web Invisvel ou Oculta? Ou todos os nomes?
Implicao-explicao e envolvimento-desenvol- Dessa forma, para continuar a estudar a Web Visvel,
vimento so atributos do signo, pois O prprio sentido h a necessidade de desenvolver estudos sobre a Web

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


Profunda, como uma dobra semitica (ou vrias) que Web Top (hbrido, motor de busca e diretrio) indexavam, 37
compe o ciberespao e, especialmente, os buscadores respectivamente, 56% e 50% do contedo total do cibe-

DA WEB VISVEL INVISVEL


especficos nesse setor. respao (Cendn, 2001). De toda forma, boa parcela desse
Como nada to simples nos objetos contem- volume continua no indexado, ou seja, permanece
porneos, outra Web emerge, considerada Dark Web (the invisvel para a indexao mecanizada.
dark side of the cyberspace) ou a invisvel, de fato, posto Nesse sentido, Rajaraman (criador do Kosmix) con-
que servidores e a navegao feita sob o anonimato fazem fessa que os mecanismos de busca indexam uma frao
a dobra underground do ciberespao. muito pequena do ciberespao. Eu no sei, para ser ho-
Mais que uma questo terminolgica, esses agen- nesto, que frao. Ningum tem uma estimativa muito
ciamentos para a Cincia da Informao implicaro pen- boa de como grande a Web Profunda. De cinco a cem
sar a mquina resultante da conjuno de determinado vezes maior do que a Web de superfcie a nica estima-
corpo social e suas semiticas e a organizao em espaos tiva que conheo (Beckett, 2009, p.2).
digitais e, qui, explicaro, em parte, o ciberespao. A informao na Web pode ser categorizada, para
fins de indexao, em suas diretrizes: a parte visvel, ou
A web visvel seja, pginas que podem ser somadas ao banco de dados
dos buscadores, e a parte invisvel, cujo contedo, por
A preocupao com a indexao e a localizao razes expostas, no pode ser indexado pelos buscadores
de recursos na Web to antiga quanto o surgimento da tradicionais.
prpria. Nos seus primeiros anos, a informao na Web
Em 1994, Jill Ellsworth utilizou, pela primeira vez, o
era, basicamente, recuperada apenas mediante a memo-
termo Invisible Web para designar o contedo que no
rizao da Universal Resource Locator (URL).
era indexado pelos buscadores (Bergman, 2001). A pes-
Como mtodo pioneiro de indexar e facilitar a
quisa de Bergman (que prefere o termo Web Profunda
busca na Web, destacam-se as ferramentas de procura
Web Invisvel) tambm detectou que o contedo invisvel
em repositrios File Transfer Protocol (FTP) e os armaze-
na Web, ou a Web Invisvel, era de 400 a 550 vezes maior
nados nos Gophers, como o Archie (Cendn, 2001).
do que estava at ento na Web indexvel, com 7.500
A evoluo incipiente da quantidade de contedo terabytes de informao comparado com 19 da Web
fez novas formas de organizao ser construdas, apare- indexvel (visvel).
cendo ento os diretrios, hoje quase extintos no seu
interessante observar que os mecanismos de
modelo clssico, que consistiam em ndices de sites in-
dexados manualmente, nos quais novas pginas podiam busca investem grande soma de recursos para incre-
ser submetidas, na maioria das vezes, pelos prprios mentar seus algoritmos de indexao e busca, atuando
usurios por meio de critrios especficos. em uma plataforma de mltiplas sintaxes e semiticas,
trazendo superfcie arquivos que antes eram consi-
A indexao manual, contudo, mostrava-se cada
derados no indexveis, bem como gerando padres
vez mais ineficaz, em face do volume de informao na
semnticos de busca a partir da pragmtica dos leitores.
Web, e sua consequente necessidade de indexao fez
surgirem os mecanismos/motores de busca ou, simples- Vale ressaltar ainda que a Web Visvel vem se espe-
mente, buscadores (os pioneiros, HotBot, Altavista e cializando em nomenclaturas e prticas distintas, como
Northern Light, entre outros), cujos ndices eram e ainda Web 2.0 ou Social, Web Semntica, Web Pragmtica, entre
so feitos por intermdio da indexao mecanizada (ro- outras em devir no ciberespao.
bs), com a utilizao de algoritmos matemticos pr- Com o crescimento da Web, seus limites esto
prios para a localizao e a indexao do contedo tornando-se turvos. Beckett (2009) pergunta-se Agora a
disperso no ciberespao. Web tudo? Responder a esse questionamento im-plica
A evoluo dos diretrios e mecanismos de busca em explicar alguns conceitos, alm os pertinentes Web
significativa, em 2000, o Google (motor de busca) e o Invisvel.

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


Se em certo sentido sim, conceitualmente no, a - 95% da Web Profunda gratuita, acessvel ao
Web no tudo, mas o principal constructo (dobra) do pblico mediante assinaturas (Bergman, 2001,
p.2).
ciberespao e vem crescendo a passos largos.
Sherman e Price (2001), referindo-se ao relatrio
Ela pode ser definida como a interface de con-
Bright Planet, afirmam que Bergman incluiu, em seu estu-
vergncia entre as linguagens e a interoperabilidade
do, informaes efmeras, como sites de informaes
necessria para efetuao das trocas simblicas. J o
ciberespao um espao semntico/semitico, onde o sobre o tempo, entre outros. Excluindo essas bases de
signo se d em vrias semiticas, desterritorializado, dados e outras do gnero, estimam que a Web Invisvel
nmade, em escrita espacializada e com a memria em seja entre 2 e 50 vezes maior que a Web Visvel.
constante modificao. Se a Internet a rede mundial de Para ilustrar a indexao realizada pelos meca-
computadores, base tcnica do ciberespao, este a rede nismos gerais e especficos em Web Profunda, Bergman
de signos e pessoas. (2001) apresenta uma ilustrao clssica (Figura 1).
Antes de se considerar as camadas de invisi-
A web invisvel bilidade ou as dobras da Web Visvel, elencar-se alguns
motivos pelos quais o contedo do ciberespao no
A Web Invisvel nasce juntamente com a tecno- plenamente indexvel.
logia de banco de dados no ciberespao, posteriormente O primeiro motivo por questes tcnicas ou
com a incluso do e-commerce e, por ltimo, com a deliberadas; o segundo, por polticas de excluso ou
adaptao dos servidores para permitir a visualizao de impossibilidade tecnolgica. Algumas consideraes a
informaes por meio da gerao de pginas dinmicas. respeito de cada diretriz so tecidas baseadas no exposto
Buscando uma definio de partida, Sherman e por Sherman e Price (2001) e Branski (2004).
Price (2001, p.57, traduo nossa3) a definem como:
Pginas de textos, arquivos, muitas vezes de alta Questes tcnicas deliberadas
qualidade e com autoridade informacional dis-
ponveis na World Wide Web cujos motores de Os motores de busca alimentam seus ndices
buscas gerais no podem, devido a limitaes
atravs dos Spiders, Crawlers, ou Robots, termos cujo
tcnicas, ou no querem, por escolha deliberada,
adicionar aos seus ndices de pginas Web. s
vezes tambm referida como Web Profunda
ou material escuro.
SURFACE
Bergman, em um relatrio de 2001, afirma que a WEB

Web Profunda imensurvel e, no seu estudo, realizado


entre 13 a 30 de maro de 2000, apresentou alguns resul-
tados interessantes, a saber:
- a Web Profunda a maior categoria crescente
de informaes no ciberespao; THE
38
- existem mais de 200.000 sites profundos; DEEP
WEB
- o contedo da Web Profunda de alta quali-
dade;
S.D. MONTEIRO & M.V. FIDENCIO

- a qualidade do contedo total da Web Pro-


funda de 1.000 a 2.000 vezes maior que a
Web de superfcie; Figura 1. Harvesting the Deep and Surface Web with a Directed
- mais da metade do contedo da Web Profunda Query Engine.
reside em base de dados especializadas; Fonte: Bergman (2001, p.6).

3
Text pages, files, or other often high-quality authoritative information available via the World Wide Web that generalpurpose search engines cannot, due to technical
limitations, or will not, due to deliberate choice, add to their indices of Web pages. Sometimes also referred to as the Deep Web or dark matter.

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


significado refere-se a robs que efetuam uma varredura <META NAME=ROBOTS CONTENT=NOINDEX, 39
procura de novas pginas na Web. Tais robs trabalham NOFOLLOW>

DA WEB VISVEL INVISVEL


com lgicas prprias que, por motivos comerciais, nem </head>
sempre esto acessveis, embora sua funo bsica seja
O campo meta name indica para quem destina a
pesquisar, relacionar, adentrar diretrios e subdiretrios
instruo (nesse caso, para os robs), enquanto content
na Web e som-los aos ndices dos buscadores para os
a tag com a instruo especfica, seguida, aps a vrgula,
quais operam. Leem linguagens e instrues, as quais
com nofollow, que instrui os robs a no analisar o site
podem ser escritas exclusivamente para eles nos sites, no
em questo.
momento de sua construo.
H algumas complicaes com a utilizao da
As instrues esto nos arquivos robots.txt em
metatag noindex. A The Web Robots Page, pgina dedi-
operao com o Robots Exclusion Protocol, arquivo pre-
parado pelo mantenedor de determinado site espe- cada aos robs desde 1995, aponta duas complicaes
cialmente para informar os robs sobre a no indexao principais:
de determinada pgina/recurso aos ndices dos meca- 1) os robs podem ignorar a metatag noindex,
nismos. principalmente aqueles que trabalham como malware,
Essa informao lgica interpretada pelo rob alm de spams que varrem a rede procurando endereos
como a atribuio de instrues especficas mediante o de e-mails;
que programado aps as linhas User-agent e Disallow 2) a instruo nofollow s se aplica pgina em
dentro do arquivo robots.txt. A lgica simples: aps questo. possvel que um rob encontre algum link de
User-agent, se houver asterisco, a instruo serve para entrada para a pgina instruo de impedimento.
qualquer mecanismo de busca, contudo, se houver
Outra forma de excluso de determinada pgina
alguma especificao, por exemplo, googlebot, o
do campo da visibilidade tem relao com a forma de
robots.txt ser aplicado apenas para o Google. J a linha
disponibilidade de informao. Sites cujos contedos so
Disallow instrui o rob de que tudo o que estiver depois
acessados por meio de senhas enquadram-se nessa
da barra inclinada no poder ser indexado: o webmaster,
situao, como tambm as pginas cuja natureza do con-
ento, poder tornar parcial ou totalmente invisvel deter-
tedo exige privacidade.
minado site <http://robotstxt.org/robotstxt.html>. Essa
situao pode ser observada no Quadro 1.
Excluso por poltica ou por limitao tecnolgica
H tambm a possibilidade de restringir um site
aos robs com a metatag noindex, colocada no cabealho Essas questes tm grande conexo com o for-
de pginas HTML. Seu funcionamento bastante simples: mato de apresentao da informao, que impossibilita
<html> a leitura do contedo pelos robs e, consequentemente,
<head> a indexao. Os mecanismos de busca tm uma sria
<title>...</title> dificuldade em indexar materiais no verbais ou que no

Quadro 1. O arquivo robots.txt.

www.site.com.br.html www.site.com.br/videos.hmtl www.site.com.br/noticias.html www.site.com.br/esportes.html

Arquivo robots.txt (sempre na raiz


do servidor)

User-agent: Instruo cumulativa Instruo cumulativa Instruo cumulativa

Disallow:/

Contedo invisvel Contedo invisvel Contedo invisvel Contedo invisvel

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


esto em Hypertext Markup Language (HTML), e a maioria Como dito anteriormente, os textos da Web
deles no consegue indexar os seguintes tipos (Sherman; costumam estar armazenados em diretrios de
modo bastante semelhante forma como guar-
Price, 2001, p.58):
damos textos em pastas em nossos PC. Uma pasta
- PDF ou Postscript (exceto o Google); (diretrio) pode conter outras pastas e assim por
- Flash; diante em uma relao de incluso que pode
- Shockwave; alcanar vrios nveis de profundidade. O fato
- Programas executveis; relevante que os motores de busca nem sem-
- Material comprimido. pre so programados para fazer uma pesquisa
Em todos os casos, a informao encontra-se em profundidade nos servidores da Web e param
comprimida dentro de um formato de arquivo ou exten- em determinado nvel. O que estiver alm dele
so (respectivamente, de acordo com os itens supra- no ser encontrado nem indexado e, portanto,
citados, .pdf, .ps, .flv, .swf, .exe/deb/bat etc, .zip/t.ar.gz/.rar estar fora de alcance para o usurio (Arajo, 2001,
online).
etc.).
Pode-se deduzir, ento, de acordo com Arajo
A dificuldade como um rob poder ler e indexar
(2001), que essas trs realidades coexistem: invisvel, oculta
a informao comprimida em um formato no verbal.
e profunda. Esta ltima seria a Web Opaca, de acordo
No caso de PDF, o Google um dos nicos que conseguem
com Sherman e Price (2001). Ainda, segundo Sherman e
estender seus robs para efetuar a leitura do arquivo
formatado, contudo, ler e interpretar multimdia como Price (2001), esse o paradoxo da Web Invisvel, pois
os arquivos de vdeo (Flash, Shockwave e outros) no fcil compreender sua existncia, mas difcil defini-la
tarefa tecnologicamente fcil. concretamente com termos especficos.

Alguns buscadores da Web Invisvel dedicam-se a A literatura sobre o assunto, via de regra, inter-
buscar informaes desses tipos. nacional, ademais h uma discusso sobre a terminologia
mais adequada. Em respeito s tradues, usou-se a
terminologia empregada por seus respectivos autores,
A web invisvel: alguns apontamentos conceituais
em algumas citaes, mesmo sendo estas parafraseadas.
Que nome dar a esse (des)territrio escuro? Web Traar uma linha entre a Web Visvel e a Invisvel
Profunda, Web Invisvel ou Oculta? Arajo (2001) ques- no to simples assim e, mais uma vez, o conceito da
tiona-se: invisvel ou oculta? Para o autor, o termo invisvel dobra reaparece, posto que os buscadores podem trazer
parece ser inadequado por denotar algo completamente superfcie alguns contedos.
inacessvel, fora de alcance, o que no totalmente ver-
Para Sherman e Price (2001) no existe uma clas-
dadeiro, pois basta que se saiba uma ferramenta de busca
sificao dicotmica entre visvel e invisvel, mas cama-
especializada ou mesmo a URL para ter acesso a esses
das, gradaes de invisibilidade e acesso aos contedos
contedos. Nesse sentido, o termo oculta seria mais
apropriado. no ciberespao. Nesse sentido, apresentam quatro tipos
de invisibilidade, comeam com a opaca, relativamente
40 H, de fato, uma parcela que permanece invisvel
acessvel aos mecanismos, at chegarem verdadeira-
aos mecanismos de busca. Essa parcela da Web com-
mente invisvel (Figura 2). Dito de outro modo, os motivos
posta por banco de dados aos quais o acesso possvel
pelos quais os mecanismos no podem ver o contedo
por meio de pagamento e/ou inscrio, pois Por serem
S.D. MONTEIRO & M.V. FIDENCIO

profundo, que so: a Web Opaca; Web Privada; a Web Pro-


guardados em diretrios protegidos por senha, eles se
encontram fora do alcance dos motores de busca (Arajo, prietria e; a Web realmente Invisvel.
2001, online). Sherman e Price (2001) afirmam que essa clas-
J o termo Web Profunda, de certa forma, tambm sificao diz menos respeito s distines rpidas e com-
est relacionado a uma limitao de muitos motores de plexas e mais ao limite amorfo da Web que, de todo modo,
busca; o fato de eles no varrerem todo o contedo de torna sua definio difcil, a no ser, para ns, pela aproxi-
um site, pois: mao de conceito de dobra semitica.

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


41

Web Invisvel

DA WEB VISVEL INVISVEL


Web Web Web
Web
verdadeiramente
Opaca Privada Proprietria
Invisvel Dark Web

Profundidade Assinatura ou
do Pginas que login Restries
rasteador exigem requerido tecnolgicas
senhas

URL
desconectadas robots.txt Acesso Pginas
mediante dinmicas
Visualizao pagamento
mxima metatag de taxa
atingida NOINDEX
Informaes
armazenadas em
Frequncia bancos de dados
do
rastreador

Figura 2. As vrias Web.


Fonte: Adaptado de Ford e Mansourian (2006, p.585).

Web opaca em resposta a uma pergunta, o mecanismo de busca


retorna um nmero limite de resultados visveis. As
A Web Opaca compe-se de sites que misturam pginas que os algoritmos no incluram, em ordem de
arquivos e mdias, dentre os quais alguns so facilmente relevncia, tornam-se irrecuperveis para aquela query
indexveis e outros so incompreensveis aos rastreadores. em especial. Esse tipo de limitao cada vez menos
Por isso mesmo, pela dificuldade em classificar esses sites comum. Na maioria das vezes, os mecanismos mostram
em Web Visvel ou Invisvel, so designados como Web a quantidade de pginas recuperadas e, de toda forma,
Opaca. Alm disso, segundo Sherman e Price (2001), h algumas cifras mostram a impossibilidade de percorrer
outros motivos de cunho tecnolgico para a existncia at a ltima delas. Uma rpida pesquisa por USA no
dela, ou seja, arquivos que podem ser, mas no so in- Google tem uma revocao prxima de 5 bilhes de
cludos nos ndices dos mecanismos de busca, por vrias resultados;
razes, a saber:
c) frequncia do rastreador: pode ocultar pginas
a) profundidade do rastreador (crawler): reduzir a da Web Visvel por algum tempo. Por isso importante
profundidade ajuda a reduzir os custos de indexao. No que a frequncia seja eficiente, especialmente em sites
passado, era comum trazer apenas pginas exemplares que j foram indexados, devido a sua idade mdia;
de um site como citao de (boa) representao de sua Sherman e Price (2001) explicam: depois de dois anos,
existncia. Apesar de os mecanismos no revelarem sua um site at pode ter o mesmo nmero de URL, mas apenas
profundidade de rastreamento, h uma tendncia para a metade das pginas originais permanecem, as demais
rastrear mais profundamente e indexar mais pginas; so novas;
b)nmero mximo de resultados visveis: quando d) URL desconectadas ou pginas que no tm
o nmero mximo de pginas visualizveis for atingido, links: isso ocorre porque existem duas formas bsicas

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


para indexar o contedo da Web: ou o autor envia um A web verdadeiramente invisvel
pedido de submisso a um mecanismo ou o rob
descobre por si prprio. Para que o segundo seja possvel, Pode ser caracterizada por quatro motivos, de
necessrio que outras pginas, j indexadas, apontem acordo com Sherman e Price (2001), embora admitam
para a nova e, dessa forma, quando o rob visitar uma que os mecanismos sempre esto desenvolvendo seus
pgina indexada verificar a existncia de um novo link e, algoritmos e adaptando mtodos para indexar novos
consequen-temente, a acrescentar em seus ndices tipos de formatos, o que torna essa caracterizao fluida.
(Sherman; Price, 2001). Seguem os quatro motivos que caracterizam a Web In-
visvel.
A web privada 1) formatos de arquivos como o PDF, Postscript,
Flash, Shocwave, programas executveis e arquivos com-
A Web Privada consiste em pginas que so deli-
primidos;
beradamente excludas dos mecanismos, ou seja, o con-
tedo possui restrio deliberada pelos mantenedores, 2) poltica de excluso dos mecanismos, uma vez
por trs motivos: que alguns arquivos podem ser indexados, mas no o
so, como os formatos PDF;
1) pginas protegidas por password: o contedo
s acessvel para associados ou pessoas que tenham 3) pginas dinmicas que so geradas mediante
algum tipo de senha. A maioria dos fruns de discusso solicitao ou consultas;
se inclui nesse quesito e, mais recentemente, as redes 4) informaes armazenadas em banco de dados.
sociais;
Como o livro The Invisible Web foi publicado em
2) o uso de no index: impede que o rob indexe a
2001, os arquivos em formato PDF no eram indexados
pgina;
pela falta de estrutura de metadados nos documentos
3) o uso de arquivos robots.txt para impedir o armazenados nas Intranets, embora, poca, o Google j
acesso de buscadores na pgina. o fizesse.
A diferena entre no index e robots.txt basi-
Especialmente as imagens e vdeos com pouco
camente a abrangncia do limite de proibio da in-
ou nenhum texto constituem outro tipo de linguagem
dexao. Enquanto o primeiro restringe o rastreamento
para a Web Invisvel. Eles podem ser includos (uma dcada
de pginas, o segundo pode proibir a visita de um bus-
depois j so), entretanto, por fornecerem pouca pista
cador no site inteiro, mediante uma lista de arquivos ou
sobre o seu assunto, os mecanismos hbridos trazem
partes chamada robots.txt.
superfcie resultados com problemas intersemiticos, isto
, de traduo, embora os desenvolvedores estejam
A web proprietria
trabalhando para superar essas limitaes.
Trata-se de contedo indexvel, entretanto, restrito
42
por ser propriedade de seus mantenedores (instituies Dark web: o continente (verdadeiramente)
e rgos, entre outros), acessvel mediante registro, em escuro do ciberespao
muitos casos gratuitos, assinatura e/ou pagamento de
S.D. MONTEIRO & M.V. FIDENCIO

taxas. Outra forma de invisibilidade foi criada por um


projeto ambicioso, como tese, em 2000, de autoria de Ian
Portais de contedo cuja visualizao realizada
Clarke, ento estudante da Edinburgh University, cujo
mediante assinatura enquadram-se nessa parcela da Web
resultado foi a criao do programa FreeNet (Becket, 2009).
Invisvel. A visualizao geralmente feita por meio de
um nome de usurio e senha fornecidos para o assinante, O FreeNet foi criado pensado na liberdade de
o que lhe garante o direito de ter acesso informao expresso e de contedo, como o prottipo perfeito de
proprietria. informao livre e sem restries - principalmente judi-

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


ciais -, para seus usurios. Um usurio do FreeNet com- para aqueles que procuram trfego de informao 43
partilha, ao participar da rede, uma parcela do seu disco annima na Internet (Beckett, 2009). O desenvolvimento

DA WEB VISVEL INVISVEL


rgido para armazenar informaes criptografadas que inicial do Thor era para o Laboratrio de Pesquisa Naval
ele mesmo jamais saber do que se trata. Basicamente, o Americano, para proteger a comunicao governamental.
FreeNet uma Internet paralela dentro da prpria Internet, Hoje, o Thor pode ser utilizado por qualquer pessoa,
para usurios que querem privacidade sem rastreabi- embora essa liberdade tenha causado problemas legais,
lidade. como aponta Beckett (2009).
Na prtica, como funciona o Thor? Com seu uso, o
Tambm chamada Dark Net, Web Invisvel e espao
roteamento de pacotes randmico e a informao
de endereo escuro (embora no sejam exatamente
encriptografada, ou seja, perde-se a identidade do
sinnimos), essas metforas servem para ilustrar e reforar
solicitante.
o carter realmente invisvel dessa modalidade da Web e
significam, de certo modo, [...] para alm dos limites da Atravs do Thor, surgiu uma iniciativa de constru-
o de sites utilizando o sufixo onion. Todo site que possui
vida da maioria das pessoas online [...] ignorada pela mdia
tal sufixo inacessvel e ilegvel a qualquer navegador
e bem compreendida por apenas alguns cientistas da
Web normal, sendo exclusivo dos usurios da rede Thor.
computao (Beckett, 2009, p.3).
Os motivos de permanecerem praticamente na total invi-
Iniciativa semelhante ocorreu com a criao do sibilidade, na maioria das vezes, referem-se ao fato de seu
programa The Onion Router (Thor), um projeto voluntrio contedo ser judicialmente ilegal.

Quadro 2. As dobras semnticas da Web Visvel/Invisvel.

Significado Conceito Conceito

Parte da Web Visvel, ou seja, pginas que podem ser somadas ao banco de dados Web Visvel Web de superfcie
dos buscadores. Sherman e Price (2001) Bergman (2001)
Pginas de textos, arquivos (muitas vezes de alta qualidade e com autoridade Web Invisvel Web Profunda
informacional) disponveis na Web, os quais os motores de buscas no podem, devi- Sherman e Price (2001) Arajo (2001)
do a limitaes tcnicas, ou no querem, por escolha deliberada, adicionar aos ndi- Bergman (2001)
ces de pginas Web.
A Web Opaca consiste em sites que misturam arquivos e mdias, dentre os quais Web Opaca Web Oculta
alguns so facilmente indexveis e outros so incompreensveis aos rastreadores. A Sherman e Price (2001) Arajo (2001)
profundidade, a frequncia do rastreador e as pginas desconectadas (URL) podem
ser motivos da opacidade de pginas na Web.
A Web Privada consiste em pginas deliberadamente excludas dos mecanismos Web Privada
pelo mantenedor (protegidas por password, noindex ou robots.txt). Sherman e Price (2001)
A Web Proprietria diz respeito ao contedo indexvel, mas restrito por ser pro- Web Proprietria
priedade de seus mantenedores (instituies e rgos, entre outros), acessvel me- Sherman e Price (2001)
diante registro, em muitos casos gratuitos, assinatura e/ou pagamento de taxas.
Algo que aparentemente est completamente inacessvel, mas, mediante o uso de Web Oculta Web Profunda
uma ferramenta, possvel localizar. Melhor seria, portanto, dizer que existe signifi- Arajo (2001) Bergman (2001)
cativa parte da Web Oculta para os motores de busca mais populares. Web Opaca
Sherman e Price (2001)
Rede global de usurios e computadores que operam margem da visibilidade e Dark Web Web Invisvel, espao de
das agncias fiscalizadoras, com contedos intencionalmente escondidos e proto- (Sem autoria determinada) endereo escuro, espao
colos de comunicao inacessveis para um sistema sem configurao correta. de endereo sujo
Beckett (2009)
A Dark Net o conjunto de redes e tecnologias utilizadas para compartilhar contedo Dark Net
digital, como peer-to-peer de compartilhamento de arquivos, CD e DVD. A Dark Net Biddle et al. (2002)
no uma rede independente, mas uma camada de aplicao e protocolo montados
em redes fsicas j existentes.

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


A Dark Web ilustra bem a tenso entre a priva- outros tipos de informaes similares. A pgina inicial do
cidade e a publicidade; a liberdade de expresso e at buscador aceita pesquisas livres e a possibilidade de
valores maniquesta do bem e do mal, arqutipos huma- percorrer por reas do conhecimento (ou diretrios)
nos ressignificados ou virtualizados no ciberespao. <http://infomine.ucr.edu/>.
Embora o Freenet tenha sido pensado para uma Dark Net, Internet Archive: seu propsito ser uma grande
ou seja, rede para compartilhamento de contedos e biblioteca do ciberespao para acesso de pesquisadores,
arquivos livres na Web (Biddle et al., 2002) seu uso tem historiadores e o pblico interessado em seu contedo.
sido feito, em grande parte, por criminosos, para a pedo- O Internet Archive faz a indexao de pginas antigas de
filia, trfico e satanismos. sites que no mais existem ou foram atualizados. O projeto
teve incio em 1996, em So Francisco, e ilustra o interes-
Para efeito de sntese, o Quadro 2 apresenta uma
sante estatuto da memria no ciberespao, em constante
comparao entre os conceitos da Web Visvel/Invisvel,
modificao <http://www.archive.org/>.
de acordo com os autores (indicados no quadro), para
estabelecer as relaes entre eles. Hakia: os mantenedores do Hakia o denominam
semntico, por ser um buscador que procura resolver os
problemas morfolgicos da lngua. Oferece para a compra
Descobrindo a web invisvel: mecanismos dois outros mecanismos otimizados para negcios e
de busca especializados informaes aeroespaciais, ao que tudo indica, rela-
cionando termos polissmicos s reas especializadas
Se a Web a dobra semitica do ciberespao, este,
em questo. O interessante que seus resultados de busca
por sua vez, apresenta mquinas dentro de mquinas.
so separados por Deep Web, Surface Web e Regular Web
Assim, os mecanismos de busca so as redobras, tra-
<http://www.hakia.com/>.
zendo visibilidade a Web Invisvel.
DeepDyve: a busca nos ndices do DeepDyve livre,
Esses buscadores da Web Invisvel so especficos contudo o acesso aos documentos recuperados faz-se
e acessam uma variedade de interfaces (Sherman; Price, mediante pagamento. A associao a esse buscador tem
2001). A Figura 3 apresenta alguns mecanismos de busca um perodo bastante limitado, at 14 dias. Indexa qual-
da Web Invisvel e suas principais caractersticas de fun- quer tipo de informao textual, inclusive grande quan-
cionamento. tidade de informao tambm visvel para os mecanis-
Infomine: um buscador desenvolvido por bi- mos tradicionais <http://www.deepdyve.com/>.
bliotecrios da Universidade da Califrnia. Indexa livros e Complete Planet: desenvolvido pelos mantene-
peridicos eletrnicos, boletins, listas de discusses, cat- dores site BrightPlanet <www.brightplanet.com>, de
logos de bibliotecas e diretrios de pesquisadores, entre Michael Bergman, permite a busca de arquivos invisveis
de todos os tipos, seja por busca simples, avanada ou
diretrios.
44
Biznar: a empresa criadora do BizNar (Deep
WebTechnologies) tambm possui mais buscadores com
o intuito de indexar outros tipos de informao no liga-
S.D. MONTEIRO & M.V. FIDENCIO

Mecanismo de busca
(Web invisvel) das ao mundo dos negcios. O que faz do BizNar muito
til so suas relaes semnticas que eliminam boa parte
da polissemia dos buscadores tradicionais, ligando qual-
quer palavra-chave aos negcios. Alm disso, quando o
mecanismo finaliza a busca, ele mostra categorias dentro
Figura 3. Mecanismos de busca da Web Invisvel. do mundo dos negcios em que o tpico pesquisado
Fonte: Elaborada pelos autores. mais apareceu, os Result Topics, como, por exemplo,

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


Marketing, Publicidade & Propaganda etc. <http://biznar. Na tona dessas discusses, atualmente, est o site WikiLeaks 45
com/biznar/search.html>. e suas transgresses ticas, pauta de reflexes a respeito

DA WEB VISVEL INVISVEL


Family Search: uma das maiores e mais comple- do aspecto pblico e privado das informaes que
tas bases genealgicas disponveis no ciberespao. O circulam na Web Invisvel e as complexidades dos objetos
Family Search forma seus ndices com censos de vrias virtuais e simblicos da sociedade contempornea.
pocas, listas telefnicas e at mesmo listas de obiturios Boa parte das dificuldades, contudo, ainda ligada
de todo o mundo. Traz dados de nascimento, morte, resi- forma de indexar o contedo no verbal e s questes
dncia, telefone, data de casamento, filiao e at mesmo legais. Muitas informaes, que na dcada passada eram
o nome do navio em que a pessoa imigrou no caso de invisveis, j foram implementadas nos buscadores tradi-
no ser nativo de determinada regio/pas <https:// cionais, o que demonstra que a evoluo tecnolgica
www.familysearch.org/>. uma forma de trazer maior quantidade de contedo invi-
Metabuscadores da Web Invisvel: (ou metamo- svel para o campo da visibilidade. o caso das infor-
tores) so mecanismos que utilizam os ndices de vrios maes a respeito de temperatura (fornecidas mediante
buscadores para responder uma query. Essas ferramentas a estratgia temperatura + local em buscadores como
no possuem nenhuma base de dados, utilizando exclu- Yahoo! e Google) e informaes geoespaciais ou geopo-
sivamente dados de outras ferramentas de busca (Cendn, lticas de locais j cartografados (Google Maps,
2001). No caso de metabuscadores da Web Invisvel, o DuckDuckGo).
funcionamento basicamente o mesmo: uma interface Os recursos da chamada Web 2.0 tambm ajudam
tratar de buscar nos ndices de buscadores de contedo na procura de informaes invisveis. Um sujeito pes-
invisvel. quisador pode utilizar servios de perguntas e respostas
Turbo10: agrega uma variedade de fontes e o para buscar questes j formuladas idnticas s suas e
acesso exclusivo para assinantes. O Turbo10 prefere usar encontrar o que procura. Exemplos desses tipos so as
o termo deep net a outros para designar o contedo redes sociais e o Yahoo Answers, este ltimo, em especial,
invisvel, pois, segundo Hamilton (2003, online, traduo com vrias perguntas do tipo como eu acho, como
nossa4): encontro.
[...] o Turbo10, no entanto, prefere usar o termo Um pouco de familiaridade com os mecanismos
Deep Net porque algumas dessas fontes de tradicionais tambm pode ser um mtodo de busca, query
informao no so baseadas na Web (por exem-
como site: <www.site_que_quero_encontrar_algo
plo, redes par-a-par) e os contedos dessas bases
no esto escondidos ou invisveis para os meta- palavra-chave> buscar nos ndices apenas do site espe-
motores de busca. O desafio para um metamotor cificado na maioria dos buscadores, o que muito til
de busca comercial so, primeiro, conectar-se a em sites que no fornecem campos de busca.
essas fontes da Deep Net; segundo, selecionar o
que mais relevante; terceiro, retornar resul- A evoluo desse tipo de estratgia muito esti-
tados relevantes o mais rpido possvel. mulante e muitos mecanismos fornecem uma interface
grfica para esse tipo de busca custom search, podendo
ser implementados dentro do prprio site pelo webmaster.
Consideraes Finais
Enfim, os mecanismos de busca so considerados
Muita coisa j mudou desde que os primeiros o ponto dobra no ciberespao, mquina dentro de m-
artigos a respeito da Web Invisvel foram escritos e parcela quina, desdobrando a Web Invisvel para a Visvel, a loca-
de informao invisvel tornou-se visvel, novos mtodos lizao de uma na outra, em um continuum semitico
de invisibilidade, como o FreeNet e Onion, foram criados. que o ciberespao.

4
Turbo10, however, prefers to use the term Deep Net because some of these information sources are not web-based (e.g., peer to peer networks) and the contents
of these databases are not hidden or invisible to metasearch engines. The challenges for a commercial metasearch engine are, first, to connect to these Deep Net
sources, second, to select the most relevant, and third, to return relevant results as fast as possible.

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013


Referncias
ARAJO, J.P. Invisvel, oculta ou profunda?: a web que poucas DELEUZE, G.; GUATTARI, F. Mil plats: capitalismo e esquizo-
ferramentas enxergam. 2001. Disponvel em: <http://www. frenia. So Paulo: Editora 34, 1995.
comunicar.pro.br/artigos/weboculta.htm>. Acesso em: 21
DELEUZE, G. Proust e os signos. 2.ed. Rio de Janeiro: Forense
jun. 2012. Universitria, 2010.
BECKETT, A. The dark side of the internet. 2009. Available from: FORD, N.; MANSOURIAN, Y. The invisible web: na empirical
<http://www.guardian.co.uk/technology/2009/nov/26/dark- study of cognitive invisibility. Journal of Documentation, v.62,
side-internet-freenet>. Cited: 21 Dec. 2011. n.5, p.584-596, 2006.
BERGMAN, M.K. White paper: the deep we surfacing hidden HAMILTON, N. The mechanics of a deep net metasearch engine.
value. Journal of Eletronic Publishing, v.7, n.1, 2001. Available 2003. Available from: <http://www2003.org/cdrom/papers/
from: <http://dx.doi.org/10.3998/3336451.0007.104>. Cited: poster/p170/poster/poster.html>. Cited: 21 Dec. 2011.
23 Sept. 2011.
MACHADO, R. Deleuze, a arte e a filosofia. Rio de Janeiro: Jorge
BIDDLE, P. et al. The darknet and the future of content distribution. Zahar, 2009.
2002. Available from: <http://msl1.mit.edu/ESD10/docs/
darknet5.pdf>. Cited: 16 July. 2012. OLIVEIRA, L.A. Biontes, biides e borgues. In: NOVAES, A. O
homem-mquina: a cincia manipula o corpo. So Paulo:
BRANSKI, R.M. Recuperao da informao na web. Perspecti- Companhia das Letras, 2003. p.139-174.
vas em Cincia da Informao, v.9, n.1, p.70-87, 2004.
SANTAELLA, L. As matrizes da linguagem e pensamento: sonora,
CENDN, B.V. Ferramentas de busca na web. Cincia da Infor- visual e verbal. So Paulo: FAPESP, 2005.
mao, v.30, n.1, p. 39-49, 2001.
SHERMAN, C.; PRICE, G. The invisible web: uncovering
DELEUZE, G. A dobra: Leibniz e o barroco. Campinas: Papirus, information sources: search engines cant see. Medford:
1991. Cyberage Books, 2001.

46
S.D. MONTEIRO & M.V. FIDENCIO

TransInformao, Campinas, 25(1):35-46, jan./abr., 2013

Você também pode gostar