Você está na página 1de 11

FRAGOSO, Suely .

Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web Resumo O presente texto revisa quatro abordagens quantitativas do ciberespao (cibergeografia, teoria matemtica das redes, anlise de hiperlinks e webometria) destacando seus pontos fortes e fracos e culminando com o diagnstico de que suas maiores falhas derivam de no levarem em conta o carter miditico da World Wide Web. Prope-se, ento, que a confluncia de pressupostos e tcnicas presentes nas quatro abordagens, se devidamente orientada pelo estado-da-arte dos estudos de mdia, pode resultar numa metodologia extremamente potente para apoiar empiricamente investigaes do conjunto de informaes em trnsito nas redes digitais. Palavras-chave World Wide Web; Cibergeografia; Anlise de Hiperlinks, Teoria Matemtica das Redes, Webometria O carter dinmico, a extenso e a heterogeneidade das redes digitais de comunicao dificultam bastante as investigaes cientficas da Internet. Sobretudo quando se trata de trabalhos empricos, que demandam a construo de amostragens representativas e a seleo ou o desenvolvimento de metodologias de pesquisa suficientemente robustas, o ciberespao se oferece como um investigvel particularmente arisco. Diante de um conjunto de impasses que em muitos casos parecem ser intransponveis, as solues tm oscilado entre o desenvolvimento de pesquisas estritamente quantitativas e a escolha de observveis notadamente anedticos. Prestando tributo importante gama de investigaes que tm conseguido evitar as armadilhas situadas em cada um desses extremos e procurando contribuir para a longevidade das mesmas, este texto se prope a explicitar e discutir quatro tipos de abordagem quantitativa do ciberespao considerados particularmente produtivos: a Cibergeografia (que alguns textos equiparam Geografia Virtual), a Teoria Matemtica das Redes, a Anlise de Hiperlinks e a Webometria. O grande motivador desta empreitada a anteviso de que, se orientada pelo reconhecimento do carter miditico da World Wide Web, a confluncia de pressupostos e tcnicas daquelas linhas de investigao pode resultar num arcabouo terico-metodolgico extremamente potente para os estudos do ciberespao. Introduo: Cibergeografia At recentemente, as anlises e discusses sobre o impacto das tecnologias digitais da comunicao (TICs) na organizao socioeconmica e cultural mundial caracterizaramse pela polarizao. Ainda na dcada de 1990, as bvias diferenas entre entusiastas e apocalpticos chegavam a obscurecer as fragilidades da viso que os irmanava: para ambos, o futuro acenava com um planeta homogeneamente enredado pelos fios e cabos das redes digitais e, conseqentemente, com o espraiamento dos padres e valores por elas incorporados, at a completa eroso das singularidades e diferenas regionais. O final dos anos 90 viu ruir o determinismo de tais abordagens, que tendiam a

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

compreender as intricadas relaes e interdependncias entre o chamado ciberespao 1 e o mundo 'fora' das redes digitais em termos do impacto das foras daquele ('virtual') sobre a fragilidade deste ('real'). A partir do reconhecimento das disparidades na disponibilidade de acesso e das diferentes escalas e padres de utilizao das TICs ao redor do mundo, constata-se uma distribuio francamente heterognea da infra-estrutura de suporte comunicao digital, inclusive dos terminais e aplicativos essenciais para o acesso. J era sabido que a grandeza dos nmeros absolutos de usurios e os indicadores que apontam o crescimento acelerado das redes digitais escondiam o fato de que as TICs constituem privilgio de uma pequenssima proporo de pessoas ao redor do globo2. No surpreende, tambm, que os padres de acesso s TICs reflitam as disparidades econmicas entre os continentes (com bvia concentrao do acesso s redes digitais de comunicao nos pases do hemisfrio norte) e, em escalas mais prximas, tambm reiterem as diferenas em desempenho econmico dos diferentes pases de cada continente e das diferentes regies de cada pas3 (autor, ano, p. 110-111). De fato, a proporcionalidade entre a abundncia quantitativa e qualitativa de infra-estrutura para acesso s redes digitais de comunicao e o poder econmico dos diferentes continentes, naes e regies inegvel. Ocorre que, apesar da intangibilidade do espao informacional perpetrado pela circulao de dados nas redes telemticas, as redes digitais de comunicao permanecem ancoradas a diversas instncias do mundo fsico, sendo imprescindvel atentar para a interferncia do espao geogrfico 'tradicional' sobre os fluxos informacionais e vice-versa. Dado que os principais centros metropolitanos em todo o mundo continuam a acumular fatores indutores de inovao e a gerar sinergia na indstria e servios avanados (autor, ano, p. 416), cai por terra a suposio de que, com a compresso espao-temporal, na era das comunicaes digitais 'a geografia no mais importa' 4. Afinal, existe um mundo entre as TICs e o ciberespao na forma de outras infraestruturas, redes sociais face-a-face, trabalhadores capacitados, acesso a materiais e mercados globais e locais (autor, ano, p. 14) que impede o mero desaparecimento da 'antiga geopoltica'. Embora possa tender a tornar-se menos polarizada entre os hemisfrios Norte e o Sul do planeta, a existncia de desigualdades locais e regionais tende a persistir graas acentuao do desenvolvimento dos segmentos e territrios dinmicos das sociedades em todos os lugares versus aqueles que correm o risco de tornar-se no pertinentes sob a perspectiva da lgica do sistema (autor, ano, p. 22). Voltada para a problemtica das injunes do espao geogrfico tradicional sobre o ciberespao e vice-versa, a cibergeografia tem se concentrado sobre a distribuio espacial da infra-estrutura que garante a existncia do ciberespao e sobre o trfego de informao entre servidores. Os resultados dessa linha de investigaes vem
1

A palavra ciberespao utilizada aqui para denominar o conjunto de informaes codificadas binariamente que transita em circuitos digitais e redes de transmisso, inclusive sem fio. A efetiva espacialidade desse construto, que o presente texto toma por pressuposta, foi discutida em trabalhos anteriores, particularmente Fragoso, 2001 e Fragoso, 2003. 2 Em nmeros absolutos, estima-se que a quantidade de pessoas com acesso s redes tenha saltado de cerca de 21 milhes em 1995 (NUA, 2003, s.p.) para espantosos 934 milhes em 2004 (ClicZ Network, 2005, s.p.). Proporcionalmente, no entanto, trata-se ainda de menos de 15% da populao total do planeta, estimada em 6.4 bilhes de pessoas em meados de 2005 (IBGE, 2005, s.p.). 3 No Brasil, por exemplo, dados de 2003 (Mapa da Excluso Digital) apontam para 13,5% e 10,41% dos domiclios com computadores e acesso Internet nas regies Sul e Sudeste (respectivamente) contra apenas 3,68% na regio Norte. A mdia nacional estimada por aquele estudo foi de 8% das casas com computadores e acesso Internet (GAID-FGV, 2003, pp. 43-45.) 4 Afirmaes quetais marcaram um perodo das anlises do ciberespao e podem ser encontradas em diversos autores que discutem o impacto sociocultural das tecnologias digitais de informao e comunicao, sobretudo na dcada de 1990 (por exemplo Lvy, 1998 e 1999; Trivinho, 1998 e Virilio, 1999). 2

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

demonstrando, de forma bastante consistente, que as redes digitais de comunicao operam como variveis geogrficas complementares, capazes de afetar o processo de configurao das novas centralidades e novas periferias (autor, ano) no mundo contemporneo conforme reiterem ou contradigam as configuraes anteriormente em vigor (independente de as mesmas terem sido resultantes de aes polticas ou de acidentes geolgicos). A World Wide Web e a Teoria Matemtica das Redes Em paralelo interseco entre o ciberespao e o mundo fsico, que constitui o objeto mais freqentemente abordado pela cibergeografia, uma outra configurao espacial aguarda para ser confrontada com a geografia tradicional. Trata-se da espacialidade instituda pelas relaes entre os vrios elementos que constituem o ciberespao, e que pode ser traduzida graficamente em mapas dos espaos informacionais propriamente ditos. Embora a complexidade espacial das relaes estruturantes do ciberespao convide elaborao de grficos com um nmero cada vez maior de variveis e dimenses (mapas dinmicos, tridimensionais, hiperblicos, etc), a espacialidade de fraes especificas dos diferentes tipos de espao informacional envolvidos na configurao do ciberespao pode, muitas vezes, ser apreendida com mapeamentos relativamente simples, inclusive os bidimensionais e estticos. Muitos e distintos tipos de elementos (caracterizados por diferentes modos de articular as unidades informacionais) compem tipos diversos de espaos informacionais (WWW, WAIS, telnet, email, etc) os quais, em conjunto, instituem o ciberespao. Dentre eles, a World Wide Web se oferece, com mxima proeminncia, ao mapeamento. A criao da WWW foi a principal alavanca do crescimento exponencial do ciberespao (e do acesso a ele) durante a dcada de 90. Incorporando o conceito de hipertexto a um sistema de domnio pblico, o projeto da Web garantiu no apenas a viabilizao da transferncia de arquivos entre computadores com sistemas operacionais incompatveis (caracterstica fundamental do projeto original, cf. Berners-Lee, 1996, s.p) mas tambm a integrao de texto, imagem e som a documentos inter-relacionados por hiperconexes possveis de percorrer com o apoio de navegadores5. Impulsionada pela convergncia de vrios fatores de induo (tecnolgicos, polticos, econmicos e culturais), a utilizao da Web aumentou vertiginosamente em poucos anos, introduzindo para milhes de pessoas ao redor do mundo as prticas da comunicao mediada por computador e a hipermdia. Atualmente, a grande maioria dos usurios da Internet acessa apenas a Web e a identifica genericamente como sendo o ciberespao. A espacialidade da WWW instituda pelas hiperconexes (autor, ano) entre elementos com dimensionalidades diversas: 'pginas' estritamente bidimensionais se conectam a outras nas quais textos convivem com animaes e seqncias de vdeo e com representaes em perspectiva de modelos tridimensionais e assim por diante. Do lado de c da tela, o usurio percorre com os olhos a superfcie na qual as diferentes pginas so enunciadas separadamente (uma por janela do browser) e seleciona links que deslocam aquela parcela do ciberespao relativamente a seu observador. Uma vez que os caminhos percorridos na WWW fazem parte de uma estrutura espacial particularmente complexa, ao contrrio do que ocorre com as travessias s cegas no mundo fsico (por exemplo em elevadores ou veculos sem janelas), bastante difcil para o usurio prever os destinos de links semelhantes, ou os vrios pontos de chegada disponveis a partir de cada pgina. O desnorteamento da decorrente uma das foras
5

O primeiro navegador, o Mosaic, foi desenvolvido pela equipe do National Center for Supercomputing Applications da University of Illinois e disponibilizado pela universidade em 1993. Sua interface grfica altamente intuitiva foi fundamental para a popularizao da Web Web. 3

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

impulsionadoras do desenvolvimento de diversas estratgias para o mapeamento de web sites, que variam desde singelas realizaes artesanais, planas e bidimensionais at as mais elaboradas ferramentas para gerao de mapas de sites tridimensionais e dinmicos6. Mesmo porque em sua maioria concebidos como ferramentas para auxiliar a navegao, grande parte dos mapas de websites baseiam-se em analogias com espacialidades conhecidas, por exemplo o espao tridimensional euclidiano, a crosta terrestre ou o espao sideral (Figura 1). Entre as excees, destacam-se alguns dos mapeadores concebidos para ajudar os webmasters na manuteno dos sites. Ao concentrar-se sobre as relaes entre os diferentes documentos de um dado site e no sobre o contedo dos mesmos, muitos desses aplicativos colocam a nfase nos elementos em funo e a partir dos quais realmente se institui a espacialidade da Web: os links. Os mapas resultantes no raro revelam as irregularidades da essncia relacional do ciberespao na mesma medida em que se afastam de noes anteriores de espao: caem por terra, no processo, tanto concepes mais conservadoras, que antevem na Web um grande espao tridimensional de cunho euclidiano, quanto as atraentes proposies de espaos rizomticos onde tudo se conecta com tudo7 de forma essencialmente aleatria. Ainda em 1997, quando era comum encontrar autores que consideravam a Internet uma rede descentralizada e igualitria, na qual nenhum n poderia ser considerado central ou principal, um trabalho seminal de Jakob Nielsen alertava para o fato de que o acesso Web se d conforme uma distribuio do tipo Zipf8. O autor intua, poca, que tambm seguiriam uma distribuio Zipf as participaes em grupos da Usenet (poucas pessoas postam a maioria das mensagens e muitas raramente se manifestam) e os links entre websites (tanto no sentido de que existem alguns poucos sites para os quais todo mundo envia links e muitos sites com os quais quase ningum estabelece links quanto no sentido de que a maior parte das visitas a qualquer dado site chegam a partir de links enviados por alguns poucos outros sites, enquanto pequenas quantidades de trfego vm de uma grande variedade de sites cf. autor, ano). A confirmao emprica (e em vrias frentes) desta hiptese veio confirmar a suspeita de que as redes digitais de comunicao no esto constitudas de forma aleatria. Afinal, se as conexes entre as diferentes pginas da Web (os ns da rede Web) fossem estabelecidas aleatoriamente, a projeo em grfico do nmero de links de um conjunto de Websites suficientemente grande e diversificado para ser representativo deveria resultar em uma curva em forma de sino (a maioria dos sites teria um nmero mdio de links, enquanto alguns poucos teriam muitos links e outro pequeno grupo teria poucos links). Uma tal distribuio implicaria, por outro lado, que a maior parte dos sites tivesse mais ou menos o mesmo nmero de links. H indicadores de que, de fato, a distribuio de links na Web segue uma distribuio do tipo Zipf, o que se traduz em um pequeno nmero de pginas com um nmero muito elevado de links, um nmero mdio de pginas com um nmero
6

Um conjunto de exemplos variados e que ainda no perderam sua atualidade descrito em Dodge e Kitchin, 2001, pp. 113-124. Parte deste material encontra-se tambm no website An Atlas of Cyberspace, disponvel em http://www.cybergeography.org/atlas/atlas.htm [jun 2005] 7 A metfora do rizoma teria sido proposta por Deleuze e Guatarri como um exemplo de estutura natural em que, ao contrrio do que ocorre com as razes [e caules, troncos, ramos], pontos quaisquer conectam-se a outros, independente inclusive de serem de naturezas distintas. Aplicada ao hipertexto digital por Lvy, a imagem passou a ser evocada principalmente em discursos laudatrios do potencial libertador e anrquico das tecnologias, em especial a Internet. (Primo e Recuero, 2004, s.p.). 8 Aplicvel a uma srie de fenmenos, a distribuio denominada Zipf em homenagem a George Kingsley Zipf (1902-1950). Trata-se de uma distribuio em que a frequncia de ocorrncia de um evento (P), como funo do escalo (i), quando (i) determinado pela mesma frequncia de ocorrncia, uma funo exponencial P i~1/ia em que o expoente a se aproxima da unidade. 4

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

mdio de links e um grande nmero de pginas com pouqussimos links. (autor, ano, p 70). A distribuio exponencial da curva que representa a distribuio dos links por website evidencia a no aplicabilidade de alguns pressupostos do modelo aleatrio das redes Web. Em primeiro lugar, a Web uma rede em desenvolvimento, isto , novos ns continuam a ser adicionados a todo instante. Isoladamente este fator implicaria, no entanto, que os sites mais antigos teriam sempre maior nmero de links que os sites mais novos, pois numa rede em desenvolvimento verdadeiramente aleatria, todos os ns teriam igual oportunidade de receber um link a cada momento, o que implicaria em vantagem para os ns mais antigos (cuja longevidade garantiria a presena em um maior nmero de eventos de distribuio de links). No difcil perceber, no entanto, que este no o caso na WWW: basta pensar no grande nmero de links que apontam para sites relativamente jovens, como o Google, em oposio a uma quantidade certamente mais modesta de conexes para o mais antigo n da Web, no CERN.

Figura 1: Exemplos de mapas do ciberespao que lanam mo de analogias com noes conhecidas de espao: esquerda, Cidade de Texto, uma concepo ficcional (do filme Hackers, dirigido por autor, ano). Ao centro, projeo topogrfica dos padres de acesso a um website (Alexandria Digital), por autor, ano. direita, representao grfica do trfego da WWW em tempo real, por autor e autor, ano. Os mapas da esquerda e da direita foram reproduzidos desde o site An Atlas of Cyberspace (http://www.cybergeography.org/atlas/atlas.html). O mapa central foi reproduzido de Spatialization... (http://www.geog.ucsb.edu/%7Esara/html/research/diss/spatialization.html) Ocorre que a Web no uma estrutura igualitria: seus diversos ns (pginas) recebem valoraes distintas: quando escolhem entre duas pginas, uma com duas vezes mais links que a outra, quase o dobro das pessoas linkam para a pgina mais conectada (autor, ano, p. 85). Estabelece-se assim um padro preferencial de conectibilidade, que ajuda a compreender porque a arquitetura da Web dominada por alguns poucos ns altamente conectados. Esses sites que abrigam uma grande quantidade de conexes, chamados conectores ou hubs, so extremamente visveis. A esse respeito, Barabsi afirma: [p]ara todos os propsitos prticos, pginas linkadas por um ou dois documentos no existem. quase impossvel encontr-las (autor, ano, p. 58). preciso ressaltar que, evidentemente, tal colocao desconsidera o fato que constituiu o ponto de partida do presente texto, a saber: que as redes digitais de comunicao (includa a a World Wide Web) no existem isoladas do mundo dito real. Assim como as mltiplas interferncias dos espaos informacionais sobre a vida social e cultural no podem ser desprezadas, tambm no se pode deixar de levar em conta as ingerncias da vida fora da rede sobre o ciberespao. Ao voltar os olhos apenas para a World Wide Web propriamente dita, isolando-a de seu contexto de existncia e apreenso, Barabsi deixa escapar algumas evidncias um tanto bvias, por exemplo a de que os websites no
5

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

recebem indicaes apenas de outros sites, a partir de links, mas tambm de outras fontes, miditicas ou no, muitas delas externas WWW. Enquanto permanecer garantida aos usurios a possibilidade de digitar endereos (URLs) e acessar diretamente qualquer documento na Web, ser sempre elevado o nvel de perturbao que o mundo do lado de c da tela haver de impor ordem um tanto cristalina que as teorias matemticas procuram encontrar na rede. No deixa de ser verdadeiro, entretanto, que especificidades relativas ao tipo de hiperconexo possvel de estabelecer entre webpages contribuem para o estabelecimento de hierarquias na WWW. Segundo Barabsi, o fato de que os links possveis de estabelecer na Web como a conhecemos hoje so unidirecionais (ou seja, estabelecem uma nica mo de direo na qual possvel prosseguir) implica em sua necessria fragmentao: [r]edes direcionadas como a World Wide Web se repartem naturalmente em alguns continentes facilmente identificveis O primeiro desses continentes, chamado Ncleo Central, abrigaria todos os grandes sites (Yahoo!, CNN.com, Amazon.com etc). A caracterstica mais marcante do Ncleo Central que ele facilmente navegvel, pois h um caminho entre quaisquer dois documentos que pertenam a ele. Isto no significa que haja um link direto entre quaisquer dois ns do ncleo central, mas que h [pelo menos] um caminho atravs de ns pertencentes ao ncleo que permite surfar entre quaisquer dois ns (autor, ano, p. 167). Outros dois principais continentes, chamados de In e Out, caracterizam-se pela existncia de 'mos de direo': [a] partir das pginas do continente In possvel chegar ao ncleo central, mas uma vez no ncleo no h caminhos que levem de volta ao continente In. Em contraste, os ns que pertencem ao continente Out podem ser facilmente atingidos a partir do ncleo central, mas uma vez fora do ncleo no h caminhos de retorno (autor, ano, p. 167). O quarto continente um arquiplago de pequenas ilhas desconectadas, grupos isolados de pginas interconectadas que so impossveis de alcanar desde o Ncleo Central e no possuem links que levem a ele. (autor, ano, p. 166) Decorre que a acessibilidade de uma webpage depende em grande parte de sua localizao 'continental' na Web: uma pgina localizada no Ncleo Central tem muito mais chance de ser alcanada a partir de hiperconexes do que uma outra, situada no continente Out. Pginas do continente In e dos 'arquiplagos', por sua vez, s sero acessveis para quem souber seu endereo: apenas digitando a URL possvel atingilas. Em outras palavras, embora seja verdadeiro que qualquer um (que disponha de aparatos e alfabetidade tecnolgicos suficientes) pode publicar na WWW, preciso lembrar que no apenas a profuso de informaes disponveis nas redes digitais garante a manuteno da diferena entre publicar e ser visto ou ouvido (autor, ano, s.p. e autor, ano, s.d., s.p.), mas tambm a topologia e estrutura das redes influenciam a acessibilidade de um documento na Web.

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

Figura 2: Representao esquemtica dos principais 'continentes' em que se dividem as redes direcionais (conforme autor, ano, p. 166). Com isso, o estabelecimento de uma hiperconexo implica como que um 'endosso' da pgina de destino pelo site que abriga o link de sada (outlink): quando coloco um outlink para a Intercom em minha pgina pessoal crio valor para o site da Intercom pois o demarco como um destino que considero pertinente para o pblico de minha pgina Web. evidente que o valor que uma dada pgina capaz de agregar a outra pelo estabelecimento de um link ser proporcional ao valor da prpria pgina que abriga o outlink: uma conexo na primeira pgina do Yahoo! (que recebe uma grande quantidade de visitantes por dia) agrega mais valor ao site da Intercom do que uma conexo em minha pgina pessoal (que passa dias sem receber uma s visita). tambm evidente que a maior visibilidade do Yahoo! faz com que ele seja alvo de muito mais links de chegada (inlinks), ofertados por outros sites, do que minha pgina pessoal: assim, a visibilidade do Yahoo! aumenta muito mais rapidamente que a de minha pgina pessoal e a diferena entre a visibilidade daquele portal e a minha pgina pessoal tende sempre a aumentar. Desenvolve-se assim, na Web, uma economia peculiar, cuja unidade simblica de valor o hiperlink. Com esse valor [quase] econmico, eles [os links] tm tambm poder, afetando a acessibilidade e o conhecimento na Web (autor, ano). Caracteriza-se assim uma poltica de linkagem em que a criao de um link para alm de um site seria uma concesso intencional de poder. Ou seja, no se trata apenas do exerccio de uma possibilidade tecnolgica, mas tambm de um ato de solidariedade com o criador da pgina-destino... (autor e autor, ano, s.p.) Nos termos de Walker, quando eu estabeleo um link da minha pgina A para uma outra pgina B eu estou dando um link para B. Esse link se traduz em um valor preciso em diversos sistemas de indexao, e portanto o link tem um valor mais claro para B do que o contedo da pgina B tem para mim ou para meus leitores. Eu pago B pelo contedo de B com o meu link (autor, ano, s.p.) Ferramentas de Busca, Anlise de Hiperlinks e Webometria Herdeiros dos antigos indexadores Archie, Gopher e Veronica, os sistemas de busca baseiam-se largamente em bots9 que percorrem a Web saltando de um site para o outro e coletando dados sobre as pginas que encontram. A primeira ferramenta possvel de ser assim definida teria sido o World Wide Web Wanderer, que entrou em operao em
9

As verses para ferramentas de busca so tambm conhecidas como spiders ou crawlers.

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

junho de 1993. Concebido para medir o crescimento da Web, o Wanderer no permitia que os usurios acrescentassem pginas a seu banco de dados. Esta lacuna logo seria suprida pelo ALIWEB, do mesmo ano, que permitiu tambm que os usurios acrescentassem uma breve descrio aos registros das pginas. Antes do final de 1993, novas ferramentas refinaram a busca na Web lanando mo de anlises estatsticas de ocorrncias de palavras e organizando os resultados encontrados conforme critrios de relevncia. A maior parte delas armazenava apenas o ttulo, o cabealho e/ou a URL das pginas que encontravam, mas as primeiras ferramentas que armazenavam o contedo completo das pginas no demorariam a surgir10. Concebido no final da dcada de 90, o Google introduziu uma profunda alterao no paradigma das buscas na web. Pioneiro na incorporao de tcnicas de anlise de links para realizar no s as buscas, mas principalmente a hierarquizao de resultados, o Google calcula uma classificao para cada pgina que encontra baseando-se no apenas no contedo dos documentos, mas sobretudo em sua posio na estrutura de links da Web. O procedimento realizado conforme um algoritmo sugestivamente denominado PageRank: O PageRank pode ser pensado como um modelo de comportamento de usurio. Ns assumimos que existe um internauta randmico que recebe uma pgina aleatria e continua clicando em links, nunca selecionando voltar, mas que eventualmente se aborrece e recomea em outra pgina aleatria. A probabilidade que o internauta randmico visite uma dada pgina o PageRank dela. ... Outra justificativa intuitiva que uma pgina pode ter um PageRank alto se existirem muitas [outras] pginas apontando para ela ou se algumas pginas que apontam para ela tiverem um PageRank alto. Intuitivamente, pginas que so bem citadas por muitas outras na Web valem a pena. Tambm as pginas que tm talvez uma nica citao vinda de um lugar como a pgina inicial do Yahoo! geralmente valem a pena. Se uma pgina no fosse de grande qualidade, ou fosse um link quebrado, o mais provvel que a homepage do Yahoo! no se linkaria com ela. O PageRank lida com ambos esses casos e toda a gama entre um e o outro recursivamente propagando pesos atravs da estrutura da web (autor e autor, ano, s.p.) Num cenrio em que a quase totalidade (98,8%) dos usurios da Internet afirmam utilizar ferramentas de busca e a grande maioria (81,7%) dos usurios s d ateno no mximo s trs primeiras pginas de resultados (autor, ano, p. 6 e p. 4 respectivamente), o sucesso do Google deu novo flego a toda uma srie de investigaes sobre o ciberespao que tinham como foco os hiperlinks. Aspectos da funcionalidade do PageRank foram apropriados por diversas pesquisas, especialmente as filiadas Hyperlink Analysis (Anlise de Hiperlinks ou AH) e Webometria. A Anlise de Hiperlinks considera os links entre websites (ou webpages) como indicativos de vnculos sociais e procura estudar as relaes a representadas aplicando tcnicas-padro da Anlise de Redes Sociais (Social Networks Analysis) a esta nova fonte de dados que a WWW. A Webometria, por outro lado, tem primado pela combinao de tcnicas bastante mais simples e concentrado esforos na investigao
10

Datam de 1993 o Jump Station, que coletava informaes do ttulo e do cabealho das pginas e o WWW Worm, que indexava os ttulos e as URLs. Ambos listavam os resultados conforme a ordem em que encontravam os sites, mas no mesmo ano surgiria o RSBE, com um sistema classificatrio. O WebCrawler viria inaugurar a coleta de dados em toda a pgina toda. No ano seguinte (1994) surgiria o Yahoo!, talvez o mais longevo sistema de buscas que permanece popular ainda hoje. 8

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

da confiabilidade e validade dos dados e das hipteses aventadas sobre as interpretaes dos mesmos (autor e autor, ano, 2003, s.p.). Tanto a Anlise de Hiperlinks quanto a Webometria tm como premissa fundamental que as configuraes de hiperlinks representam conexes entre pessoas, empresas, organizaes, cidades ou naes, e como tal podem fornecer indicadores sobre as relaes sociais estabelecidas por atores nesses diversos nveis. Um subconjunto particularmente interessante da AH prope o cruzamento dos dados de linkagem com os mapas geopolticos tradicionais enfatizando as trocas entre naes. Exemplos desse tipo de aplicao so os trabalhos de autor (ano) e autor e autor (ano). Os autores que trabalham nesta linha no consideram os links como um sistema de referncia (valorao por citao) mas como indicadores da existncia de relaes extraciberespao entre os pases que sediam os websites interconectados. Assim, os padres de linkagem internacional constituem verdadeiras fronteiras geogrficas no ciberespao. Embora no sem problemas metodolgicos, sobretudo no que se refere coleta de dados sobre os padres de linkagem, as projees dos resultados de investigaes desse tipo sobre os mapas geopolticos tem fornecido indicadores intrigantes. Tipicamente filiadas World System Theory (autor, ano), tais pesquisas tm interpretado os resultados conforme uma noo de globalizao que se caracteriza por trocas desiguais entre os pases informacionalmente ricos e os informacionalmente pobres, deixando de lado outras formulaes. Por uma Cibergeografia Miditica Em consonncia com o diagnstico traado por autor e autor (ano) em sua anlise comparativa da Anlise de Hiperlinks e Webometria, possvel afirmar que a primeira (AH) parte de um arcabouo terico-metodolgico extremamente poderoso (a Anlise de Redes Sociais), mas tem suas concluses fragilizadas pelo uso de tcnicas um tanto precrias para a coleta de dados e pela tendncia a assumir que o significado dos links evidente ou, por vezes, at mesmo independente de seu contexto de ocorrncia. A Webometria, por outro lado, tem se esmerado no desenvolvimento de mtodos para processamento e validao de dados e tem procurado relacionar cuidadosamente os significados dos links a suas condies de criao e existncia. No processo tem tambm, no entanto, restringido seu campo de aplicao s Cincias da Informao (sua filiao original), com o que toma um tanto literalmente (e, muitas vezes, sem maiores questionamentos) a analogia entre hiperlinks e citaes, entendendo-os como resultados de atos de valorao de um documento por outro11. Descarta, assim, toda uma outra srie de possibilidades de interpretao dos padres de linkagem, derivada da compreenso dos links como ndices de outras ordens de relao social estabelecidas dentro ou fora do ciberespao. De qualquer modo, a crena de que as configuraes de hiperlinks entre sites que representam pessoas, empresas, organizaes, cidades ou naes podem fornecer indicadores sobre as relaes sociais por eles estabelecidas vale tanto para as abordagens mais amplas praticadas pela Anlise de Hiperlinks quanto para as mais restritas, da Webometria. Porque no do a devida ateno a quanto a noo de representao fundamental para a compreenso e operacionalidade de tal premissa, as pesquisas de ambas as filiaes constantemente desconsideram o carter comunicacional de problemticas que se propem a abordar.

11

Uma medida do quanto essa analogia tomada de forma literal advm da constatao de que a maioria absoluta dos trabalhos de Webometria tem se detido justamente sobre os padres de linkagem verificados em websites acadmicos (Park e Thelwall, 2003, s.p.).
9

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

Reconhecer o carter miditico da World Wide Web significa admitir que os websites representam no apenas elementos estritamente vinculados aos contedos que seus enunciadores efetivamente desejaram expressar, mas que incorporam tambm todo um outro conjunto de marcos e indicativos de suas condies de produo e existncia. Em outras palavras, implica reconhecer a efetiva existncia e atuao, em todas as fases do processo comunicacional estabelecido em torno dos produtos miditicos disponveis na Web, dos agentes (aquelas mesmas pessoas, empresas, organizaes, cidades ou naes) representados pelos websites. Em paralelo ao instrumental quantitativo que hoje lhe tradicional, uma Anlise de Hiperlinks orientada por tal pressuposto logo se veria conclamada a convocar tambm o apoio de mtodos qualitativos, por exemplo para iluminar a opo (sempre necessria e difcil) entre montar o corpus utilizando ferramentas de busca pblicas (Google, Yahoo, AltaVista) ou crawlers ou para discernir com maior nvel de detalhe o que caracteriza os diferentes agrupamentos de pginas cujos padres de linkagem se procura averiguar. Orientada pela mesma premissa, a confluncia de pressuposies e tcnicas de pesquisa pode ir, no entanto, mais alm: entende-se que o reconhecimento do carter miditico dos websites permitiria mobilizar de forma um tanto mais produtiva a Teoria Matemtica das Redes, pois funcionaria como um antdoto para os desvios tipicamente decorrentes do tratamento da WWW como uma mera abstrao. Finalmente, a proposta de uma Anlise de Hiperlinks com os olhos voltados para a interface entre o mundo real e o ciberespao convida, tambm, incorporao do conjunto de conhecimento hoje abrigado pela Cibergeografia. Mais uma vez, a abordagem dos websites como produtos miditicos ajudaria a compreender porque a projeo dos mapeamentos de hiperlinks sobre dados da geografia fsica e poltica tem se mostrado capaz de fornecer indicadores relevantes sobre a atuao de condicionantes culturais, econmicos e polticos na interface entre o ciberespao e o mundo real, como o caso por exemplo das pesquisas j mencionadas de autor (ano) e autor e autor (ano). Uma vez que o reconhecimento do carter miditico da WWW proposto como espinha dorsal da confluncia entre os instrumentais terico-metodolgicos da Cibergeografia, da Teoria Matemtica das Redes, da Anlise de Hiperlinks e da Webometria, sugere-se denominar a abordagem da originada Cibergeografia Miditica. Resta enfrentar a tarefa, nada singela, de dar corpo ao conjunto de pressupostos e tcnicas quantiqualitativas que se anuncia a partir de um tal movimento de convergncia. _________________ Referncias bibliogrficas AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano.

10

FRAGOSO, Suely . Cibergeografia Miditica: proposta de confluncia de quatro abordagens quantitativas com vistas construo de uma metodologia quanti-qualitativa para investigaes empricas da World Wide Web. Contracampo (UFF), v. 14, p. 56-70, 2006

AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano. AUTOR, Ttulo, Ano.

11

Você também pode gostar