Você está na página 1de 5

PONTO DE VISTA

Bases de dados: a metfora da memria cientfica


Fernando Sayo
GUISA DE INTRODUO "Fazemos apelo aos testemunhos para fortalecer ou debilitar, mas tambm para completar, o que sabemos de um evento do qual j estamos informados de alguma forma, embora muitas circunstncias nos permaneam obscuras". com essas exatas palavras que Maurice Halbwachs inicia seu livro publicado postumamente, a Memria Coletiva\ Por uma coincidncia extremamente provocante, tambm desta forma, ou melhor, no estado que poderia ser descrito precisamente por essas mesmas palavras de Halbwachs, que um pesquisador, um cientista interroga um banco de dados procura de informaes que insiram seu trabalho de pesquisa na cincia feita pelo seu grupo. Isto , ele procura um azimute, um quadro de referncias que faa com que ele possa reconstruir seu conhecimento sob a luz dos testemunhos dos seus pares e orientar o seu trabalho no sentido estabelecido pela comunidade cientfica ou acadmica em que ele est ou deseja estar inserido. Resumo
Traa um paralelo entre as formas de incorporao de conhecimento nas bases de dados internacionais e o conceito de memria coletiva dentro do mbito da produo cientfica mundial. Analisa as bases de dados, seus esquemas de representao e recuperao, sua seletividade e as barreiras impostas pelas linguagens de indexao cincia produzida no Terceiro Mundo. Conclui que as bases de dados so os repositrios dos conhecimentos consensuais gerados pela cincia moderna, constituindo, dessa forma, a memria da cincia oficialmente aceita.

seus prprios conhecimentos, recria cenrios de conhecimentos mais ntidos. Wittgenstein 3 diz no seu Tractatus Logico-Philosophicus (1922) que "a dvida, pois, s existe onde existe uma questo, uma questo apenas onde existe uma resposta, e esta somente onde algo pode ser dito". Ningum interroga uma base de dados sobre o que no conhece. Quando um cientista busca informaes em uma base de dados, ele s est querendo validar as suas dvidas, traduzindo-as por questes autenticadas por seus pares, por questes presentes na memria coletiva de sua tribo. A resposta j existe. Fundamentar sua questo sobre o que j foi estabelecido uma imposio do mtodo cientfico, da natureza tribal e cumulativa da cincia, sem o que o pesquisador est condenado ao limbo da rejeio e do esquecimento, e o seu saber ao descrdito. O que ele busca fundamentalmente enquadrar sua contribuio cincia comum, consensual. Isto no quer dizer em absoluto que os debates e as controvrsias se aniquilam diante dessa imposio; quer dizer sim que toda discusso, por mais dramtica e acalorada que seja, est submetida a um ritual, cuja consulta aos antecedentes, memria coletiva comum, uma das etapas privilegiadas. Quando um pesquisador, diante de um microcomputador ligado a um banco de dados que pode estar em qualquer parte do mundo, vasculha suas estantes eletrnicas procura de informaes que definam, completem ou estabeleam as fronteiras do seu trabalho de pesquisa, ele repete o mesmo gesto de quem mergulha na memria de seu grupo para reconstruir as lembranas comuns e dessa forma manter ntegra a sua comunidade.

Palavras-chave
Bases de dados; Memria coletiva; Memria cientifica; Representao de conhecimento; Linguagem de indexao; Indstria da informao.

Este estado transitrio, no qual se encontra este pesquisador, chamado por alguns autores da rea de cincia da informao de "estado anmalo de conhecimento"2. Ele caracterizado por um alto grau de indefinio em relao ao assunto sobre o qual o pesquisador procura informaes. O seu prprio desejo de informao absolutamente nebuloso, fazendo com que suas interrogaes s consigam se realizar durante o ato da busca. O processo de interao com os conhecimentos armazenados na base que estabelece o foco da questo. A percepo do pesquisador sobre o conhecimento, fatos e dados armazenados nestes meios eletrnicos, articulados com os

314

Ci. Inf., Braslia, v. 25, n. 3, p. 314-318, set./dez. 1996

Bases de dados: a metfora da memria cientfica

Isto nos leva a pensar que as bases de dados, com seus complexos esquemas de representao e de recuperao de informao, que hoje encerram praticamente todos os testemunhos' da cincia moderna, constituem a memria consensual desta cincia; a memria eletrnica de que nenhum cientista pode prescindir para ordenar e reconstruir seus conhecimentos e onde, obrigatoriamente, precisa haver suas contribuies, seus testemunhos inseridos, sob pena de no participar dessa memria coletiva e no ser jamais "lembrado", ou melhor, citado por seus colegas. Talvez pudssemos pensar nas bibliotecas especializadas cumprindo este mesmo papel de memria dos saberes cientficos. Mas, por mais universal que seja seu acervo, ele no consegue reunir todas as obras de uma rea do conhecimento e sua seletividade est baseada em critrios "domsticos", especficos de uma instituio ou um programa. Porm, a diferena mais marcante que as bases de dados so suportadas por uma tecnologia que permite a simulao, a iluso de um dilogo, de uma interao em tempo real em uma linguagem que est cada vez mais prxima das linguagens naturais. Existem as interfaces inteligentes, o hipertexto, ajudas sensveis ao contexto, janelas que criam uma atmosfera conversacional. Esta interao pode ser feita de qualquer lugar onde se tenha um microcomputador e um telefone. um gesto solitrio do cientista procura dos seus antecedentes; ao passo que a biblioteca interpe sempre, entre o pesquisador e o acervo, intermedirios, vidraas, catlogos, cdigos indecifrveis como so as referncias bibliogrficas. sobre este simulacro da memria coletiva cientfica engendrado pela sociedade ps-industrial - que so as bases de dados e sua relao com os aspectos cumulativo, social e institucional da cincia - que eu gostaria de discutir rapidamente neste texto. Em especial, no que diz respeito contribuio da memria virtual ao controle e enquadramento da produo cientfica, que vo desde os limites impostos pelos mecanismos de representao do conhecimento at os desvios ideolgicos que conduzem deliberadamente marginalizao de autores, conhecimentos, fatos no identificados com os padres da cincia oficial.

A FORMAO DA MEMRIA ELETRNICA O carter cumulativo da cincia, que se apropria de uma forma rigorosamente seletiva das contribuies de seus pesquisadores, resulta em um corpo de conhecimento baseado no consenso. Este corpo de conhecimento representado pela literatura tcnico-cientfica, fruto mais bvio e mais facilmente sujeito mensurao da atividade cientfica. So os livros, os artigos de revistas, os trabalhos de congresso, as patentes, portadoras das inovaes tecnolgicas, os mais autnticos registros da faina diria dos cientistas. O crescimento vertiginoso da capacidade de armazenamento de dados em meios legveis por computador- meios magnticos e, mais recentemente, meios ticos - no foi ainda suficiente para tornar vivel o armazenamento generalizado em computador dos conhecimentos gerados pela atividade cientfica. Esta impossibilidade implica que, para se colocar disponvel em sistemas on-line, ou seja, sistemas que permitam um certo grau de interao, de conversao em tempo real, mandatrio que o conhecimento registrado na literatura sofra um processo de traduo, de representao, transformando-se em metaconhecimento. Esta traduo realizada por intermdio de esquemas simblicos que descrevem tanto a forma fsica, quanto o contedo informacional das obras que esto sendo registradas. O que vai ser armazenado nas grandes bases de dados uma metfora da informao original, o conhecimento virtual, que s existe em funo do seu referente, da sua vinculao remota com algum conhecimento real. A criao dessas representaes factvel via linguagens documentrias, que so linguagens artificiais geralmente derivadas da linguagem natural. Essas linguagens so chamadas artificiais no sentido em que no resultam de processo evolutivo e necessitam de regras explcitas para seu uso. Normalmente as linguagens documentrias estabelecem uma relao unvoca entre o termo e o conceito, isto , entre o significante e o significado. Cada termo corresponde a um conceito do sistema de conceitos da rea especfica com

que se est trabalhando. A construo dessas linguagens um processo complexo e longo4. As linguagens documentrias so, pela sua prpria artificialidade, extremamente redutoras de significado e s podem cobrir conceitos de um domnio especfico do conhecimento humano, no havendo, portanto, linguagens documentrias gerais. Elas fazem parte intrnseca dos sistemas de informao, afetando e sendo por eles afetada. Qualquer linguagem, j se sabe, uma forma de poder, de dominao. As nossas prprias contradies culturais so um exemplo disso. A linguagem documentria no exceo. O poder avassalador no sentido da ordenao, da organizao que ela exerce sobre a produo literria, especialmente a cientfica, chamado pelo semilogo Umberto Eco de a "ditadura dos resumos". Esta caracterstica de dramtica importncia na construo da memria eletrnica da cincia, pois o grau de resoluo e entendimento dos conhecimentos que ela apropria est limitado pela capacidade de representao do cdigo. Mas muita ateno: a propriedade redutora de significado dessas linguagens, antes de ser uma deficincia, o sustentculo da identidade, do poder de ordenao e classificao, do qual a cincia no pode prescindir, e , sobretudo, o canal de expresso da ideologia que a cincia suporta. o seu poder uniformizador que elimina as diferenas desagregadoras, que garante a harmonia na formao das diversas memrias possveis. Um exemplo corriqueiro pode deixar mais clara essa relao entre poder uniformizador e controlador da linguagem, a ideologia que ela representa e a formao da memria eletrnica. Apenas 5% da produo cientfica dos pases perifricos est presente nas grandes bases de dados internacionais5. Nestas bases, est representada essencialmente a cincia do Primeiro Mundo e os cdigos de representao existentes esto voltados para a problemtica desses pases. Este fato tem grande impacto no armazenamento e recuperao de informaes e conhecimentos que esto fora do domnio da cincia e tecnologia primeiromundistas. Por exemplo:

Ci. Inf., Braslia, v. 25, n. 3, p. 314-318, set./dez. 1996

315

Bases de dados: a metfora da memria cientfica

o desejo de incorporar, em uma base de dados internacional sobre fontes de energia, um artigo importante sobre o uso de leo de dend e de jojoba produzidos no interior da Bahia como combustvel automotivo em substituio ao leo diesel poder esbarrar na falta de termos adequados para a representao correta desses leos e de sua ambientao, resultando em distores na representao e conseqentes desvios na recuperao. Isto significa que os prprios limites da linguagem documentria faro com que sejam preservados a uniformidade e o carter primeiromundista dessa memria eletrnica. Se este artigo chegar um dia a fazer parte dessa base, ele dificilmente ser recuperado e, como desdobramento, no ser citado por seus pares, ou pelo paralelo que traa este texto, no ser "lembrado", pois, insisto, os limites da linguagem determinam o seu esquecimento medida que o esquema simblico utilizado incapaz de expressar com nitidez o conhecimento que ele porta. Neste ponto, talvez, caiba um parntese. Aprofundando um grau a mais o paralelo que aqui se traa, quando penso no inverso de tudo isto, ou seja, no acesso a bases de dados internacionais e na recuperao de suas informaes, penso sempre que podemos estar, quem sabe, apropriando-nos da memria cientfica de outras tribos com todas as suas idiossincrasias. Dependendo do uso que se faa das informaes contidas nestas bases, esta prtica pode constituir um reforo na dependncia de paradigmas cientficos e tecnolgicos, com os quais somos obrigados a conviver por todas as nossas contradies culturais, histricas e polticas. O acesso a estas bases nos deixa sempre a um passo de importao de problemas cientficos e tecnolgicos estranhos e, muitas vezes, irrelevantes para a nossa realidade terceiromundista, que pode estender nosso esforo de pesquisa para limites irreais e indesejveis. Mesmo assim, o acesso a estas informaes de dramtica importncia para os pesquisadores dos pases menos desenvolvidos. Na maioria das vezes, elas so as nicas fontes estruturadas de informaes disponveis, seja pela via on-line ou em bases de dados em CD-ROM, posto que ainda

no est plenamente presente, na conscincia dos que conduzem a poltica de informao desses pases, a preocupao com a formao de bases de dados nacionais que sigam padres internacionais, que faam uso de linguagens documentrias adequadas e que sejam a expresso mais completa da cincia e tecnologia praticada por esses pases. Essas bases de dados nacionais deveriam reunir os testemunhos da atividade de pesquisa de pases ou de regies, tal como faz a base de dados Lilacs, de forma a reconstruir, para quem as consulta, conhecimentos, cenrios, ambientes, fatos e dados pertinentes a um universo prprio. Uma outra questo possvel que a criao de bases de dados bem estruturadas e com um nvel de padronizao satisfatria talvez seja a forma mais conveniente de tornar visveis para a comunidade cientfica internacional a atividade de pesquisa de pases ou regies em desenvolvimento e inserila com identidade prpria e autenticidade na "grande memria eletrnica". Entretanto, os processos de excluso dos conhecimentos gerados nos pases perifricos da mainstream science so ainda mais variados e esto muito alm dos limites impostos pelos cdigos de representao. A argumentao sobre a qualidade dos trabalhos, sobre os critrios, ou a falta deles, adotados pelos referees das revistas, sobre o carter regional dessas publicaes so ciclicamente utilizados como barreiras para incorporao desses saberes nas memrias eletrnicas. Sem pensar no reducionismo e na ideologia das linguagens de indexao, de uma forma geral, tudo que escrito em outro idioma que no o ingls desfavorecido pelos mecanismos de coleta das bases de dados comerciais. Contudo, muitos estudos pem em evidncia que uma proporo significativa da pesquisa cientfica produzida dentro das fronteiras dos pases em desenvolvimento, em domnios especficos, mas pertinentes a problemas universais da cincia moderna, so de grande importncia tanto para o conjunto desses pases, quanto para a cincia em geral. Temas como energia solar, doenas tropicais, agricultura, pecuria so exemplos relevantes que despertam curiosidade cientfica em qualquer parte do mundo.

Voltando s linguagens documentrias, elas so, em sntese, metalinguagens derivadas da linguagem natural, com semntica e sintaxe prpria. Dessa estrutura de representao simblica, depende, como j foi enfatizado, a formao da memria eletrnica e tambm das suas possveis parties. Quero dizer com isto que um nico trabalho cientfico pode ser incorporado em vrias memrias, ou seja, ele pode pertencer a vrias bases de dados. Os registros em bases de dados distintas das vrias leituras possveis de um documento so viabilizados por cdigos de representao especficos e diferenciados, que interpretam este documento mediante regras internas de um sistema de informao qualquer. Esses cdigos possibilitam tambm que esses trabalhos possam ser "lembrados" por diferentes grupos que os valorizem segundo uma tica prpria. como se um mesmo fato estivesse em memrias coletivas de vrios grupos e fosse lembrado de forma distinta em cada um deles. Suponhamos que um pesquisador escreva um trabalho sobre compreenso de linguagem natural por robs. Supondo tambm que esse trabalho ultrapasse todos os filtros de seleo e garanta a sua homologao pela comunidade, ele poder ser incorporado em uma base de Inteligncia Artificial, onde um vocabulrio especfico far a representao do seu contedo nformacional, enfatizando a sua ligao com os problemas dessa rea; ao passo que, por um outro cdigo, os lingistas registraro nas suas bases de dados os fatos sobre lingstica computacional presentes no trabalho e, exagerando um pouco, os pesquisadores da rea de robtica fariam uma terceira interpretao. Como vimos, um trabalho individual, que faz parte do curriculum vitae, da biografia de uma criatura, submetido a vrias interpretaes e absorvido por memrias de vrios grupos. Esta partio viabilizada pela linguagem. Obviamente, os mecanismos de lembrana, isto , de recuperao e citao, vo estar submetidos s mesmas regras dessa linguagem. Mas, se este trabalho no est em nenhuma memria, no pertence a nenhum grupo, no tem existncia

316

Ci. Inf., Braslia, v. 25, n. 3, p. 314-318, set./dez. 1996

Bases de dados: a metfora da memria cientfica

reconhecida pela comunidade, ele na verdade no existe. s um segredo indecifrvel na gaveta e no corao de seu autor. Halbwachs1 diz que a memria individual um ponto de vista da memria coletiva. Dentro desta mesma perspectiva, talvez no fosse um exagero dizer que um trabalho cientfico cumpre o mesmo pressuposto. Ainda sobre o exemplo anterior, poderamos dizer que um lingista pode recordar esse trabalho apenas pela gramtica especial que ele props; um pesquisador de inteligncia artificial estar atento s formas de representao de conhecimento necessrias representao das regras da gramtica proposta; algum da rea de ergonomia tem sua ateno desviada pelos fatores que proporcionam melhor interao homem-mquina; os impactos psicossociais sero recordados por um pesquisador em psicologia. Na verdade, porm, incorporar-se a uma base de dados - na nossa memria eletrnica - a ltima etapa de todas por que deve passar uma contribuio cincia. O ritual se inicia no momento em que o pesquisador determina o escopo de seu trabalho, cujos graus de liberdade esto determinados por constrangimentos sociais, polticos, econmicos e, como veremos adiante, por aspectos mercadolgicos. Ao elaborar um projeto de pesquisa, o pesquisador deve estar sensvel ao fato de que algumas reas so oficialmente apoiadas pelos rgos de fomento pesquisa e que essas reas j foram previamente definidas e somente os projetos que estiverem enquadrados nestes planos recebero aval institucional, recursos e financiamentos dos rgos de apoio pesquisa. o caso do Plano Bsico de Desenvolvimento Cientfico e Tecnolgico (PADCT), que define no pas o que os pesquisadores tm de pesquisar. Estes planos cumprem um papel importante na estruturao, ordenao e homologao da cincia oficial que estaro refletidas nas diversas memrias eletrnicas.

Os autores que logram publicar seus trabalhos em revistas ou em anais de eventos considerados importantes para sua comunidade so aqueles com possibilidade de ter os seus trabalhos incorporados nas bases de dados. Dentro dessa perspectiva, o conhecimento selecionado, representado e registrado nas grandes bases de dados internacionais constitui a documentao sobre a atividade cientfica oficialmente aceita pela comunidade que a gerou. Essas contribuies receberam o endosso, a homologao dos pares, e receberam, portanto, o direito de pertencer memria oficial da cincia. Dessa maneira, as bases de dados se constituem na forma mais fiel dos testemunhos dos cientistas. a esta memria eletrnica que os pesquisadores se dirigem em busca dos referenciais tericos para as suas atividades. Um outro fator que tem um impacto determinante na construo da memria eletrnica que ela constitui um grande negcio. Um negcio que movimenta anualmente milhes de dlares. A informao deixou de ser um bem puramente cultural e transformou-se em bem econmico. Dessa transformao, que modificou totalmente a percepo do valor da informao, apropriou-se o capitalismo, engendrando o que chamamos "indstria da informao", que tem, em outro plano, uma trajetria bastante semelhante da indstria da cultura no que diz respeito sua incorporao estrutura capitalista ou ps-capitalista, como querem alguns, e sua definitiva transformao em bem comercializvel. Qualquer abordagem do fenmeno da informao a partir da perspectiva econmica implica estar diante de um paradoxo tpico do nosso tempo: a informao livre, perene e longeva materializando-se em um bem mutvel, temporal, detentor de valor de troca e situado dentro do espao de relaes de um mercado. No contexto da nossa discusso, isto faz com que interesses econmicos e mercadolgicos entrem na composio da memria eletrnica.

A construo desta memria, como j foi dito vrias vezes, depende fortemente do poder de representao das linguagens documentrias. De acordo com as circunstncias, elas podem enfatizar fatos e descobertas, como h pouco tempo aconteceu com as descobertas de fatos novos sobre a supercondutividade, ou, mais recentemente, sobre a fecundao de mulheres idosas. Mas tambm, promover o silncio, o esquecimento, como vimos no exemplo do leo de dend. No entanto, as "zonas de sombras e silncios", na expresso de Michael Pollak6, podem anteceder a linguagem e se instalar como desdobramento de outros problemas, principalmente os ideolgicos. Quantos cientistas no mundo inteiro, por suas posies antagnicas aos regimes polticos de suas ptrias, vtimas do totalitarismo, de ditaduras e de intransigncias, no tiveram seus trabalhos de pesquisa impedidos de serem divulgados e banidos da memria de sua poca? As bases de dados so, pois, a metfora da memria da cincia que se pratica hoje. Elas renem os testemunhos de pesquisadores com uma linguagem prpria, que parece ser mais um instrumento na eterna busca da pedra filosofal da cincia, que a busca da ordem, do enquadramento, da classificao em um mundo cada vez mais desordenado e mais entrpico.

Ci. Inf., Braslia, v. 25, n. 3, p. 314-318, set./dez. 1996

317

Bases de dados: a metfora da memria cientfica REFERNCIAS BIBLIOGRFICAS 1. HALBWACHS, Maurice. A memria coletiva. So Paulo : Vrtice, 1990. 189 p. 2. BELKIN, Niccholas J. Anomalous state of knowledges as a basis for information retrieval. Canadian Journal of Information Science, v.5, p.133-140, 1980.

3. WITTGENSTEIN, L. Tractatus logicophilosophicus, 1961. 4. GOMES, Hagar E. Manual de elaborao de


tesauros monolnges. Braslia : PNBU, 1990. 78 p. 5. GAILLARD, Jacques. La science du tiers monde est-elle visible? La Recherche, n.210, p. 636-640, 1989. 6. POLLAK, M. Memria, esquecimento, silncio. Estudos Histricos, v.2, n.3, p. 3-15, 1989

Databases: the metaphor of scientific memory Abstract


Comparison between the ways of knowledge incorporation into international databases and the concept of colective memory within the world scientific production is drawn. Barriers imposed on the Third World science by databases selectivity, representation and retrieval scheme as well as indexing languages are analized. The conclusions are that data bases are consensual knowledge repositories, generated by modem science and therefore constitute the memory of officialy accepted science. Keywords Databases; Collective memory; Knowledge representation; Indexing languages, Information industry

Lus Fernando Sayo Doutor em cincia da informao. Chefe da Diviso de Tecnologia da Informao do Centro de Informaes Nucleares da Comisso Nacional de Energia Nuclear (CNEN/CIN) Professor-adjunto da Universidade do Rio de Janeiro (UNI-RIO) e-mail: lsayo@enen.gov.br

318

Ci. Inf., Braslia, v. 25, n. 3, p. 314-318, set./dez. 1996

Você também pode gostar