Você está na página 1de 18

155

Grupo de Trabalho 7: PRODUO E COMUNICAO DA INFORMAO EM CT&I BIBLIOMETRIA, CIENTOMETRIA, INFOMETRIA: CONCEITOS E APLICAES BIBLIOMETRICS, SCIENTOMETRICS, INFORMETRICS: CONCEPTS AND APPLICATIONS
Raimundo Nonato Macedo dos Santos Universidade Federal de Santa Catarina e-mail: raimundo@cin.ufsc.br Nair Yumiko Kobashi Universidade de So Paulo e-mail: nykobash@usp.br Resumo Anlise da constituio e institucionalizao da bibliometria, da cientometria e da infometria. O estudo teve como objetivos principais identificar os conceitos-chave dessas disciplinas, suas semelhanas e diferenas, suas potencialidades e limites e as tendncias contemporneas da pesquisa. De natureza exploratria, o estudo se apoiou em literatura clssica e recente da rea. Observou-se que, num primeiro momento, com o nome de bibliometria, os estudos procuravam quantificar os produtos da atividade cientfica (livros, artigos e revistas) para fins de gesto de bibliotecas e bases de dados; a cientometria, por sua vez, se constituiu como modelo que se preocupa com a interpretao dos dados quantitativos, luz das teorias construdas no mbito das cincias humanas e sociais (CHS). Seu objetivo principal fornecer insumos para o planejamento e a avaliao de polticas cientficas. A infometria, modelo mais recente, se apropria dos mtodos bibliomtricos e cientomtricos para apreender os aspectos cognitivos da atividade cientfica. Nesse sentido, tem como preocupao central conhecer o estado-da-arte dos diferentes domnios do conhecimento. Observou-se, tambm, interesse crescente por tcnicas de visualizao da informao, com a finalidade de elaborar mapas que possam representar adequadamente os aspectos quantitativos e cognitivos da cincia. Conclui-se que os estudos mtricos da informao se aproximam, desde Price, das CHS em busca de teorias e modelos que sustentem a interpretao dos dados quantitativos. Nesse sentido, os estudos mtricos da informao, em sua configurao contempornea, se configuram como campo interdisciplinar que se fertiliza entrecruzando as teorias e os mtodos de quantificao com as teorias sociais. Palavras-chave Estudos mtricos da informao; Bibliometria; Cientometria; Infometria. Abstract Analysis of the constitution and institutionalization of bibliometrics, scientometrics and informetrics. The researchs main objective was to identify the key concepts of these
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

156 scientific domains, their similarities and differences, their potentialities and limits, and their contemporary research trends. The study was exploratory in nature and based on classic and recent literature. It was observed that, at first, the research on Bibliometrics tried to quantify the products of the scientific activities (books, papers and journals), for the purpose of libraries and database management. Scientometrics, on the other hand, was established as a model concerned with the interpretation of quantitative data, in face of Humanities and Social Sciences theories. Its main goal was to supply information for the planning and evaluation of scientific policies. The most recent model, informetrics, borrowed methodologies from bibliomtricos and cientomtricos to study the cognitive aspects of scientific activities. To this end, informetrics central concern is the state of the art of the knowledge domains. In addition, a growing interest for information visualization techniques was observed, with the aim at preparing maps that may adequately represent the quantitative and cognitive aspects of science. It is concluded that the information measurement research is leaning, since Price, towards the Humanities and Social Sciences, in search of theories and models that may support the interpretation of quantitative data. Therefore, the information measurements research, in its contemporary form, is set as a multidisciplinary field that is fermented by the crossover of quantitative methods with social theories. Keywords Quantitative studies of information; Bibliometrics; Scientometrics; Informetrics.

Introduo Aqueles que necessitam reunir informaes sobre o desenvolvimento da cincia enfrentam, por vezes, enormes desafios para localizar os itens mais pertinentes para subsidiar determinada tarefa. Os desafios se tornaram ainda mais agudos, na sociedade contempornea, provocados pela progressiva informatizao dos mtodos de trabalho e a crescente ampliao das formas de armazenamento e de circulao do texto escrito, seja ele impresso, digital ou eletrnico. (LE COADIC, 2004a, 2004b). Esse lado desafiador vem sendo compensado, porm, pela criao de mtodos e tcnicas de tratamento, anlise e visualizao de informao, de naturezas diversas, baseados em princpios estatsticos e / ou lingsticos. Segundo Boustany (1997), a anlise estatstica de informaes bibliogrficas e a formulao de modelos ou leis vm sendo feitas desde o sculo XIX. Sua expresso mais sistemtica, porm, teve incio no sculo XX, com os trabalhos de Lotka. A partir da, as informaes bibliogrficas ou factuais, reunidas em bancos de dados pblicos, de acesso gratuito ou mantidos por servios comerciais, foram objeto de inmeros estudos que resgataram ou deram origem a novas designaes, de acordo com o objeto em foco: cientometria, infometria, tecnometria, museometria, arquiometria, iconometria, biblioteconometria, webmetria, entre outras. (ROSTAING, 1996). Essas designaes, certamente sintomas de crescimento do campo, geram controvrsias. Mesmo entre os especialistas da rea no h consenso sobre a terminologia empregada no campo e sobre os limites que demarcam cada denominao utilizada. Esse cenrio de crescimento expressivo dos estudos mtricos da informao cria a oportunidade e, tambm, a necessidade de refletir criticamente sobre as
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

157 questes conceituais, terminolgicas e metodolgicas da rea. No se tem aqui a pretenso de apresentar quadro exaustivo dos estudos j realizados na rea ou viso histrica abrangente. Procuramos, apenas, resgatar aspectos do processo de constituio da rea, seus conceitos e termos centrais, ao mesmo tempo em que lanamos um olhar crtico sobre estudos e aplicaes contemporneos. Assim, o artigo apresenta, inicialmente, breve histrico da constituio do campo, os principais conceitos da bibliometria, da cientometria e da infometria para, em seguida, abordar algumas tendncias atuais dos estudos mtricos da informao. Bibliometria, cientometria e infometria: breve histrico O uso de mtodos estatsticos e matemticos para mapear informaes, a partir de registros bibliogrficos de documentos (livros, peridicos, artigos), no constitui fato novo. o que Boustany (1997) aponta, ao se referir a um autor desconhecido, citado no Manuel du Bibliophile ou, trait du choix des livres, editado em1823, de autoria de Gabriel Peignol, que pesquisou a produo universal de livros no perodo compreendido entre a metade do sculo XV e incio do sculo XIX. No entanto, no sculo XX que esses mtodos ganham densidade e legitimidade. bastante conhecida, por pesquisadores da Cincia da Informao, a proposta de Paul Otlet, considerado por historiadores franceses como o criador da bibliometria. Na obra seminal Trait de documentation: le livre sur le livre, o autor belga definiu a bibliometria como a rea que se ocupa da medida ou da quantidade aplicada a livros. (OTLET, 1934, apud BOUSTANY, 1997). Autores de origem anglo-saxnica, no entanto, atribuem a criao do termo bibliometria a Pritchard, que props sua utilizao em substituio bibliografia estatstica, cunhado em 1923 por Hulme, como Rostaing (1996) retoma. A bibliometria foi caracterizada por Pritchard (1969) como conjunto de mtodos e tcnicas quantitativos para a gesto de bibliotecas e instituies envolvidas com o tratamento de informao. Os resultados das anlises bibliomtricas foram, nessa medida, considerados importantes coadjuvantes da definio de estratgias de gesto de unidades de informao e de bases de dados. No mbito dos esforos para quantificar os produtos da atividade cientfica, citar Lotka, Bradford, Zipf e Price se torna obrigatrio. A lei do quadrado inverso, de Lotka (1926), refere-se ao clculo da produtividade de autores de artigos cientficos. Segundo essa hiptese, numa especialidade cientfica, coexiste pequeno nmero de pesquisadores extremamente produtivos com uma grande quantidade de cientistas menos produtivos. A lei de Bradford (1934), por sua vez, trata da disperso dos autores em diferentes publicaes peridicas. O que lhe interessava, poca, era determinar o ncleo dos peridicos que melhor se concentrassem em determinado tema. Essa lei resultou de estudos que visavam propor critrios de seleo de peridicos para uma dada coleo, de modo a equilibrar custo x benefcio. , portanto, uma lei voltada para fins gerenciais. Em se tratando da lei de Zipf, apresentada em 1935, refere-se freqncia da ocorrncia de palavras num texto longo. Lei quantitativa fundamental da atividade humana, Zipf extraiu sua lei de um princpio geral do esforo mnimo: palavra cujo custo de utilizao seja pequeno ou cuja transmisso demande esforo mnimo so frequentemente usadas em texto grande. Por fim, no caso de Price, ele ser objeto de discusso mais ampla em contraposio aos estudos dos trs primeiros,
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

158 por demais conhecidos, os quais sero citados apenas quando necessrios para sustentar pontos de vista aqui defendidos. A partir de Price, que se valeu das propostas de Lotka, Bradford e Zipf para formular suas leis cienciomtricas, os estudos quantitativos adquiriram novos contornos, centrando-se fundamentalmente, na anlise da dinmica da atividade cientfica, incluindo tanto os produtos quanto os produtores de cincia. Uma nota: a abordagem do modelo de Price, aqui apresentada, beneficia-se largamente do trabalho de Polanco (1995). Este conhecido pesquisador da infometria, radicado na Frana, apresenta excelente balano crtico sobre os antecedentes e o estado atual dos estudos mtricos, em particular, sobre as contribuies de Price. Para Price (1969), a cientometria o estudo quantitativo da atividade cientfica. Semelhante caracterizao teve como ponto de partida a percepo de que certas leis economtricas, em especial, as relativas ao clculo da mo-de-obra, no mundo do trabalho, poderiam explicar, igualmente, o comportamento da literatura cientfica. Com base nesse raciocnio analgico, Price afirmou que os dados quantitativos sobre revistas e artigos cientficos obedecem a certas regras estveis, configurando-se como indicadores do estado da cincia. A anlise estatstica da literatura cientfica, na abordagem de Price, encontra na histria e na sociologia da cincia os contextos que do sentido aos dados quantitativos analisados. Segundo Meadows (1990, apud Polanco, 1995).
The key figure in this new quantitative studies was Price, whose writings, especially Little Science, Big Science had a major impact on thinking about the growth and evolution of scientific journals. In part, he drew together ideas already under discussion. For example, the rapid growth in the amount of scientific literature had been debated by librarians and others since the First World War. Similarly, but separately, there had been work on relevant statistical distributions, such as Lotka's work on scientific productivity and Zipf's on word distributions. Price extended this earlier work to provide an integrated, quantitative picture of the scientific literature [...] One important area of Price's work covered the applications of citation analysis. In this, he relied on the contemporaneous activities of Garfield in developing the concept of a citation index.

O pioneirismo de Price manifesta-se, portanto, na elaborao de novo modelo que integrou a bibliometria ao estudo da atividade cientfica. Deve-se a ele a formulao terica da cincia da cincia, campo que entrecruza a cientometria com a Cincia da Informao, como Garfield j percebera. Da mesma forma, Small e Garfield (1986) afirmaram que Price antecipara, nos anos 60, a idia de evidenciar, por meio de mapas da cincia, o grau de cobertura e a importncia relativa das revistas cientficas. Os referidos mapas tm por base, segundo Price (1965), as "relaes estruturais de uma rede de referncias e citaes", projeto que ser desenvolvido no Institute for Scientific Information (ISI), na dcada de 70, por meio de mtodos de co-citao. (POLANCO, 1995). Os modelos bibliomtricos e cientomtricos tm os artigos cientficos como objetos empricos privilegiados. Pode-se, certamente, discutir exausto a pertinncia destes ltimos para examinar a atividade cientfica e realizar inferncias sobre o
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

159 estado da cincia. Embora no discutamos as razes que levaram eleio desse tipo de produto como objeto principal dos estudos mtricos, fazemos uma ressalva: no se pode reduzir a atividade cientfica produo, circulao e ao consumo de artigos de peridicos e, muito menos, confundir o crescimento quantitativo de artigos com o desenvolvimento cognitivo da cincia. De fato, muitos autores j assinalaram que os modelos tradicionais tinham como foco a quantificao de artigos, de autores mais produtivos, de peridicos mais citados, etc., porm, no penetraram nas questes cognitivas, ou seja, no conhecimento contido nesses objetos. Como assinala Polanco (1995),
[...] le modle bibliomtrique de la science de Price ne saisissent pas directement le contenu cognitif des articles scientifiques, autrement dit les connaissances qu'ils vhiculent. Les informations prsentes dans le titre de l'article, dans son rsum, ou dans le texte lui-mme sont en ralit ignores dans l'approche scientomtrique instaur par Price [...] De ce fait, un tel dispositif ne ralise qu'une scientomtrie "externaliste". Par consquent, le dfi est maintenant de dvelopper une scientomtrie "internaliste" si l'on peut ainsi s'exprimer. Ce qui s'est fait en France avec la mise au point de la mthode des mots associs au dbut des annes quatre-vingts, utilisant justement les mots-cls comme indicateurs de connaissance [...]

Depreende-se do que foi dito, que a anlise multidimensional, aplicada s palavras-chave de registros bibliogrficos, configura-se como uma das contribuies tericas mais recentes aos mtodos quantitativos. Baseado no clculo matricial e na lgebra linear, esse mtodo supe a classificao automtica dos dados e sua representao por meio de cartografias temticas. O termo infometria, por sua vez, foi proposto em 1987, pela International Federation of Documentation / Federao Internacional de Documentao (FID), para designar o conjunto das atividades mtricas relativas informao, cobrindo tanto a bibliometria quanto a cientometria. (EGGE; ROUSSEAU, 1990). Semelhante caracterizao confirmada por Polanco (1995):
[...] a infometria comporta uma sntese da bibliometria e da cientometria, mas tambm como Brookes destacou to bem, ela significa uma abertura ao estudo matemtico da informao e sobre suas formas documentrias (Cincia social da informao) seja eletrnica ou fsica [...]

A partir do exposto acima, pode-se fazer uma primeira distino entre bibliometria, cientometria e infometria. A bibliometria tem como objetos de estudo os livros ou as revistas cientficas, cujas anlises se vinculam gesto de bibliotecas e bases de dados. A cientometria preocupa-se com a dinmica da cincia, como atividade social, tendo como objetos de anlise a produo, a circulao e o consumo da produo cientfica. A infometria, por sua vez, abarca as duas primeiras, tendo desenvolvido mtodos e ferramentas para mensurar e analisar os aspectos cognitivos da cincia. Constata-se, nessa medida, a aproximao crescente dos estudos mtricos da informao das cincias humanas e sociais (CHS). Trata-se, desse modo, no apenas de quantificar e constatar, mas de atribuir sentido aos dados, qualificando-os para que
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

160 possam ter melhor uso em polticas de cincia e tecnologia (C&T), por cada especialidade ou grupo de pesquisa, ou em contextos mais abrangentes, regionais, nacionais ou mundiais. Em resumo, permanecem como conceitos operacionais centrais: a produtividade de autores de artigos cientficos (com base nas leis de Lotka e Price); o ncleo e a disperso de artigos em peridicos cientficos (lei de Bradford); e a freqncia de palavras em textos longos (lei de Zipf). O clculo de co-ocorrncias (de autores, de palavras, de instituies), fundada em mtodos de anlise multidimensional uma das reas que vem crescendo de forma acentuada nos estudos mtricos contemporneos. Os estudos mtricos na contemporaneidade A partir do incio deste milnio, as tcnicas de visualizao de informao, em apoio aos mtodos e tcnicas de tratamento e anlise de informao, passaram a ser utilizadas de forma vigorosa e recorrente. Essas tcnicas tm sido importantes para melhor perceber e compreender dados manipulados por meios estatsticos. Com efeito, possvel, por meio de mapas da cincia e da tcnica, fazer mltiplas inferncias sobre os fatos que ocorrem na pesquisa cientfica. Essa tendncia evidente no programa da 12th International Conference on Scientometrics and Informetrics, Rio de Janeiro, julho de 2009. O evento, reunindo pesquisadores nacionais e internacionais do domnio da cientometria e infometria, incorporou em sua programao a realizao de trs workshops sobre a visualizao da informao: 1. WK1 (This workshop aims to contrast perspectives on how to measure and map interdisciplinary research ) este workshop objetiva identificar e avaliar pesquisas interdisciplinares: mtricas e mapas; 2. WK2 (This
workshop aims to provide an interactive forum for researchers and educators to share their experiences and needs for understanding and analyzing scientific literature using CiteSpace

) este workshop objetiva visualizar e analisar a literatura cientfica com CitySpace. Ressalta-se que CiteSpace uma aplicao Java para analisar e visualizar redes de cocita o, como Chen (2004) esclarece. A meta central do CiteSpace facilitar a anlise de tendncias emergentes num determinado campo de conhecimento. Permite ao usurio se informar com rapidez das novidades na rea e, ento, tirar proveito. 3. WK3 (This workshop aims to provide an interactive forum to discuss how maps of science can assist in the teaching of graduate-level course s) este workshop objetiva utilizar mapas de cincia para ensinar cincia. Segundo Nascimento e Ferreira (2005), os estudos das tcnicas de visualizao de informaes distribuem-se em dois eixos principais. O primeiro leva em considerao o modo como essas tcnicas exploram o substrato visual, as marcas e as propriedades visuais do desenho. No segundo caso, de particular interesse para os principais usurios de informao cientfica (comunidade cientfica e gestores de C&T),

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

161 as tcnicas so classificadas de acordo com as caractersticas dos dados a serem visualizados. As Figuras 1 e 2 so formas tradicionais de visualizao de informao. A Figura 1, estudo exploratrio de Momm (2009), mostra a distribuio de orientadores de dissertaes e teses de programas de ps-graduao stricto sensu de uma rea de avaliao da Coordenao de Aperfeioamento de Pessoal de Nvel Superior (CAPES). Dos 334 trabalhos defendidos, num perodo de seis anos, 20 docentes foram responsveis pela orientao de 66,2% enquanto os demais, aproximadamente 40, orientaram 33,8%.
Curva de distribuio da qtde. de orientaes pela qtde. de orientadores

120%

Freq. rel. acum. das orientaes realizadas

100%

80%

60%

20 66,2%

40%

20%

0% 0 10 20 30 40 50 60 70

Quant. acumulada de orientadores

Figura 1 Curva de distribuio de orientadores por dissertaes produzidas

A Figura 2, por sua vez, indica a distribuio mundial dos artigos em peridicos cientficos por regio, em 1993, obtido da fonte Science & Engineering Indicators, 1995.

Figura 2 Percentual de artigos cientficos publicados em 1993, por regies do mundo Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

162 Tcnicas mais elaboradas de visualizao so aplicadas a dados que possuem mltiplas dimenses (n dimenses, sendo n maior que trs). Uma tcnica consiste em mapear apenas dois atributos dos dados para as coordenadas X Y de um plano cartesiano e associar os demais atributos forma, cor e tamanho de objetos visuais. Pode-se, ainda, projetar o espao n-dimensional no plano cartesiano, atravs da tcnica conhecida por Multidimensionl scalling. (BORG; GROEMEN 199,7 apud NASCIMENTO; FERREIRA, 2005). Outras tcnicas difundidas na literatura so: (a) a das coordenadas paralelas, que consiste na associao das dimenses dos dados a eixos paralelos verticais eqidistantes, denominados coordenadas; (b) a dos Glyphs (ou cones), entendidos como representaes simblicas que evidenciam as caractersticas essenciais de um dado, segundo colocaes de Nascimento e Ferreira (2005). A Figura 3, por seu turno, consiste em exemplo de tcnica de visualizao. Representa o ranking de produo de artigos cientficos de pases da Amrica do Sul, Amrica Central e Caribe de Herrero-Solana (2005).

Figura 3 Ranking da produo de artigos cientficos de paises da Amrica Latina, Amrica Central e Caribe

H diversas formas de apresentao grfica de dados relacionados hierarquicamente. O chamado Tree-Map (Figura 4), criado por Johnson e Shneiderman (1991), do Laboratrio de Interao Humano-Computador (Maryland University), um exemplo de tcnica de representao hierrquica de dados. Os dendogramas constituem outra tcnica de visualizao de dados. Tambm conhecidos como diagrama de rvore, permitem visualizar, hierarquicamente, resultados de anlise de agrupamentos.

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

163

Figura 4 Exemplo de imagem gerada com a tcnica Tree-Map

As visualizaes apresentadas nas Figuras 5 e 6 so dendogramas que exemplificam experincias de anlise de dados, realizadas por Fachin e Santos (2009), que analisaram, com fins exploratrios, os registros da rea de organizao da informao e do conhecimento, armazenados em Library and Information Science Abstracts (LISA).
T ree Diagram for Variables Ward`s method 1-Pearson r Knowledge management Models Business management T hesauri World Wide Web Science Digital libraries Citation analysis Controlled vocabulary Indexing Information science T heories Information communication T axonomy Dewey Decimal Classification Semantic relations Ontologies Computer applications Cataloguing Bibliographic control Librarianship Software Computerized info stor retrive Data mining Multimedia T erminology Metadata Online information retrieval Electronic media International aspects Natural language processing 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5

Linkage Distance

Figura 5 Representao hierrquica de registros sobre knowledge organization, da base Library and Information Science Abstracts (LISA)

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

164
Tree Diagram for Variables Ward`s method 1-Pearson r Automatic classification Scaling Clustering Similarity measures Data mining Classification Tree structures Computer applications Expert systems Knowledg e representation Genetic algorithms Computers Human-computer interaction User interface Diagnosis Health care Learning Probability theory Machine learning Robotics Robots Neural networks Commonsense reasoning Interactive systems Intellig ent ag ents Ethics Knowledg e org anization Philosophy Intellig ent systems Uncertainty Semantic web World Wide Web Images Information communication Science Computer assisted instruction Education Educational technolog y Teaching Hypermedia 00 01 02 03 04 05

Linkage Distance

Figura 6 Representao hierrquica de registros sobre Knowledge representation da base Library and Information Science Abstracts (LISA)

As Figuras 5 e 6 sistematizam dados coletados utilizando os descritores Knowledge organization e knowledge representation, considerados representativos do objeto em anlise. Esses termos so coordenados, ou seja, so termos especficos de mesmo nvel, subordinados ao termo genrico Knowledge, no tesauro LISA. As referncias bibliogrficas coletadas foram armazenadas numa base de dados ad hoc e reformatadas para processamento bibliomtrico (contagem de objetos) e anlise cientomtrica (anlises multidimensionais dos descritores correlacionados). Nos dendogramas gerados, os descritores foram agrupados utilizando-se o mtodo Ward, a partir da distncia de 1-r de Pearson. Para comparar os agrupamentos, foi adotada a distncia igual a 1. Observa-se, nas duas figuras, que os ns esto agrupados dois a dois (thesauri, WWW), (controlled vocabulary, indexing) ou trs a trs (knowledge management, models, business management), (science, digital library, citation analysis). Da anlise dos agrupamentos, infere-se que, na Base LISA, os artigos indexados com o descritor knowledge organization tm contedos relativos aos fundamentos da organizao do conhecimento, enquanto os artigos indexados com o descritor knowledge representation so relativos s aplicaes ditas tecnolgicas da organizao do conhecimento. Os dendogramas tm sido utilizados tambm em pesquisas de institucionalizao social e cognitiva da cincia, desenvolvidos pelo Grupo de Pesquisa Scientia, cadastrado no Diretrio de Grupos de Pesquisas do Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico (CNPq) , Plataforma Lattes, sob a coordenao dos pesquisadores Raimundo Nonato Macedo dos Santos (Universidade Federal de Santa Catarina) e Nair Yumiko Kobashi (U niversidade de So Paulo). Nessas pesquisas, busca-se identificar, por meio da anlise de descritores de um corpus de registros bibliogrficos, o conhecimento neles inscrito
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

165 e interpret-lo luz das teorias sociais da cincia. Esses resultados podem ser teis para gesto da poltica cientfica ao nvel dos programas de pesquisa, particularmente em relao s prioridades a serem estabelecidas nos grupos de pesquisa, como tambm para fazer anlises do estado-da-arte de campos cientficos. O ncleo e a disperso na distribuio de dados Dois fenmenos podem ser destacados nas representaes visuais dos estudos bibliomtricos, cientomtricos e infomtricos: a conjuno e a disjuno de dados. A Figura 7 ilustra, de forma genrica, os fenmenos da conjuno (ncleo) e disjuno (disperso)

Freqncia das propriedades bibliogrficas

ncleo

disperso

Figura 7 O ncleo e a disperso de uma distribuio bibliomtrica

Na figura 7, O ncleo representa o grupo de dados que aparecem com as maiores freqncias, relativamente ao conjunto dos itens analisados. Levando-se em considerao a Lei de Lotka, o ncleo simboliza os autores mais frteis numa rea de especialidade. A disperso representa os dados de baixa freqncia relativamente ao conjunto de dados. Segundo a mesma lei de Lotka, a disperso corresponde grande diversidade de autores que publicam muito pouco dentro da rea de especialidade estudada. Nesta modelizao, o ncleo o espao no qual se distribuem os elementos bibliogrficos redundantes e / ou que identificam certa rea ou certo domnio de especializao. Na zona da disperso, onde se distribuem os elementos que representam a individualidade ou a variao da rea. O mesmo princpio da distribuio em ncleo e disperso observado nos estudos de citao: comum um autor reconhecido citar, principalmente, seus
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

166 prprios trabalhos, demonstrando que o ncleo cultiva a identidade. Por outro lado, os demais autores freqentemente citados guardam vnculos intelectuais com o autor e, assim, alimentam uma identidade social. O Science Citation Index (SCI) do ISI , talvez, o exemplo mais ilustrativo da aplicao dessa regra. Criado nos anos 1960, em sua concepo inicial, o SCI pretendia se colocar como alternativa para recuperar informaes cientficas por meio da indexao dos elementos bibliogrficos do campo citation index. Esse recurso permitia formular estratgias de busca pelo nome do autor e / ou do peridico mais citado, em determinada rea de conhecimento: trata-se, novamente, da idia de um ncleo que cultiva a identidade. (WORMELL, 1998). A facilidade de compreenso e aplicao dessa regra pode gerar ao menos um questionamento: porque os diferentes atores da comunicao de conhecimento cientfico tenderiam a se submeter a tal regra? Dos estudos realizados para responder a esta indagao, decorreram duas regras: 1. A vantagem do acmulo (cumulative advantage) subentende-se que quanto maior a freqncia de uma referncia bibliogrfica, maior a tendncia a reutiliz-la; 2. A especializao quanto maior a freqncia de uma referncia bibliogrfica, menor a quantidade de informao a ela associada e, portanto, maior a probabilidade de que seja rejeitada em favor de uma referncia mais especfica ou inovadora. Em princpio, essas regras de comportamento antagnico parecem aplicveis aos demais elementos bibliogrficos de um registro: a vantagem do acmulo tende para o efeito do ncleo e a especializao, para o efeito da disperso. Os colgios invisveis tambm se comportam segundo as regras do ncleo e da disperso. O comportamento dos pesquisadores, conforme as regras abaixo descritas, sinalizam, tambm, o que a rea entende como uma caracterstica perversa da cincia: Efeito ncleo quando se pesquisa, se interage dentro de um grupo de trabalho, o que pode gerar o monoplio de um peridico. Efeito disperso prprio, do processo de criao cientfica, o desafio permanente para a novidade. Promove-se, assim, a extenso contnua de redes de trabalho como forma de evitar a redundncia. Ligaes ou relacionamentos entre dados A anlise das redes de colaborao um campo em crescimento. Conhecida tambm como pesquisas de redes sociais (MARTELETO, 2001), a noo remonta aos estudos de citaes e de co-autoria. Contemporaneamente, os estudos de redes sociais se beneficiam de modelos matemticos e de softwares de tratamento e manipulao de dados, cujo cerne so os conceitos de entidade e relacionamentos.

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

167 Certamente, entidades de apreenso instantnea, como nomes de autores, de instituies e de revistas so mais fceis de ser mapeados. A Figura 8 um exemplo de grafo ou rede de relacionamento entre empresas depositantes de patentes sobre catalisadores. O estudo de Santos (1998) apresenta rede de relacionamentos entre grandes empresas petrolferas que, at 1996, compartilhavam a prioridade de depsito de patentes de tecnologias de produo de catalisadores de refino de petrleo para fabricao de leo diesel. As Figuras 9 e 10, por seu turno, constituem exemplos de grafos de relacionamentos entre palavraschave. (SANTOS, 2009). Os estudos com entidades semnticas, como os descritores de uma base de dados, requerem intenso tratamento prvio de consolidao dos dados antes de submetidos ao processamento bibliomtrico. Desse modo, necessrio olhar, com cautela, a classificao automtica de dados porque podem fornecer resultados pouco confiveis.

Figura 8 Grafo ou rede de relacionamentos entre empresas depositantes de patentes sobre catalisadores

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

168

Figura 9 Rede de relacionamentos de descritores dos registros de uma base de dados

Figura 10 Rede de relacionamentos dos descritores de registros de uma base de dados

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

169 Consideraes finais Apresentamos, neste texto, breve histrico dos estudos quantitativos da informao para, em seguida, abordar as tendncias dos estudos contemporneos sobre o tema. Esse percurso permite tirar algumas concluses: 1. O campo dos estudos mtricos, embora tenha origens remotas, se consolidou a partir da dcada de 50. 2. Os objetos de estudo passaram, gradativamente, da contagem de livros e revistas, para fins de gesto, para a interpretao da atividade cientfica e para orientar polticas de cincia. 3. Novos mtodos de abordagem e tecnologias foram sendo criados para correlacionar dados, como estudos de citao, co-autorias e co-words. 4. A visualizao de informaes ganha, desde os anos 90, lugar de destaque. 5. Os estudos mtricos se aproximam, cada vez mais, das cincias ditas moles (CHS) porque estas ltimas oferecem teorias e modelos que permitem interpretar os dados em contextos culturais, polticos, ideolgicos e econmicos distintos. 6. Ao lado dos estudos de natureza externalista, vm crescendo os estudos internalistas. Significa, portanto, que aos estudos de quantificao de autores, de artigos e de citaes, agregam-se estudos sobre os contedos dos trabalhos cientficos. crescente, portanto, a conscincia de que os estudos da cincia no podem se orientar por critrios meramente quantitativos. A incorporao da sociologia e da histria da cincia inaugura a aproximao entre estudos quantitativos e estudos qualitativos. Atualmente, os trabalhos de mapeamento cognitivo da cincia se colocam como tendncia importante para aprofundar a compreenso sobre a dinmica da cincia. Como o texto cientfico se expressa pela linguagem, parece ser imprescindvel incorporar, ao campo dos estudos mtricos, as teorias e mtodos da rea da organizao da informao e do conhecimento para construir os corpora de anlise. Nesses estudos, os mapas de co-words, para serem confiveis, devem resultar de compreenso rigorosa dos processos semnticos e pragmticos da representao de informao, abandonando os procedimentos ingnuos de contagem da freqncia de palavras do texto. Para finalizar, destaca-se um fato auspicioso. O Brasil tem seguido a tendncia internacional de crescimento dos estudos quantitativos da cincia. No perodo 19902006, segundo Meneghini e Packer (2008), as publicaes em cientometria e bibliometria, de autores brasileiros, cresceram exponencialmente. Da mesma forma, a quantidade de estudos em nvel de ps-graduao (doutorado, mestrado), as comunicaes em congresso e demais formas de manifestao e expresso da produo cientfica demonstram o vivo interesse da comunidade cientfica, dos mais
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

170 diferentes campos de pesquisa, em utilizar os procedimentos metodolgicos e as tcnicas prprias dos estudos mtricos da informao. importante, porm, realizar estudos empricos para identificar o grau de participao e a natureza dos trabalhos dos pesquisadores do campo da Cincia da Informao, nesse conjunto.

REFERNCIAS

BOUSTANY, Joumana. La production des imprims non-priodiques au Liban de 1733 1920: tude bibliomtrique. 1997. Tese (Doutorado em Sciences de l'Information et de la Communication ) Universit Michel de Montaigne Bordeaux III, Bordeaux. 1997. CHEN, Chaomei. Searching for intellectual turning points: progressive knowledge domain visualization. Proceedings of the National Academy of Sciences, [S. l.], n. 101 Suppl., p. 5303-5310, 2004. EGGE; Leo; ROUSSEAU, Ronald. Introduction to informetrics: quantitative methods in Library, Documentation and Information Science. Amsterdam: Elsevier Science, 1990. FACHIN, Gleisy R. B; SANTOS, Raimundo Nonato Macedo. Scientific communication and ontology: bibliometric analysis of the Library and Information Science Abstracts. In: INTERNATIONAL CONFERENCE ON SCIENTOMETRICS AND INFORMETRICS 12., 2009, Rio de Janeiro. 2009. (No prelo). GARFIELD, E. In tribute to Derek John de Solla Price: a citation analysis of Little Science, Big Science. Scientometrics , [S. l.], v. 7, n. 3-6, p. 487-503, 1985. HERRERO-SOLANA, Victor. A representao grfica da informao como meio de acesso. Marlia: UNESP / campus de Marlia, 2005. 56 eslaides: color. Eslaides gerados a partir do software PowerPoint. HULME, E. Wyndham. Statistical bibliography in relation to the growth of modern civilization. London: Grafton, 1923. p. 44. JOHNSON, Brian; SHNEIDERMAN, B. Tree-maps: a space-filling approach to the visualization of hierarchical information structures. CONFERENCE ON VISUALIZATION, 2., 1991, San Diego. Proceedings... San Diego: [s. n.], 1991. LE COADIC, Yves-Franois. A Cincia da Informao. 2. ed. Braslia DF: Briquet de Lemos, 2004a. ____. Princpios cientficos que direcionam a cincia e a tecnologia da informao digital. Transinformao, Campinas, v.16, n. 3, p. 205-213, set. / dez. 2004b.
Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

171 MARTELETO, Regina Maria. Anlise de redes sociais: aplicao nos estudos de transferncia da informao. Cincia da Informao, Braslia DF, v. 30, n. 1, p. 71-81, jan. / abr. 2001. MEADOWS, A. J. Theory in information science. Journal of Information Science, [S. l.], v. 16, n. 1, p. 59-63, 1990. MENEGHINI, Rogrio; PACKER, Abel. A amplitude da autoria multidisciplinar de artigos sobre cienciometria no Brasil. So Paulo: BIREME OPASOMS, 2008. MOMM, Christiane Fabola. O conhecimento cientfico em turismo no Brasil: cursos de ps-graduao (stricto sensu); perodo de 2000 a 2006. 2009. 128 f. Dissertao (Mestrado em Cincia da Informao) Universidade Federal de Santa Catarina, Florianpolis. 2009. NASCIMENTO, Hugo A. D.; FERREIRA, Cristiane, B. R. Visualizao de informaes: uma abordagem prtica. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAO, 25., 2005, So Leopoldo. Anais... So Leopoldo: UNISINOS, 2005. POLANCO, Xavier. Aux sources de la scientomtrie: bibliometrie, scientometrie, infometrie, [S. l.], n. 2, 1995. Disponvel em: <http://www.info.unicaen.fr/bnum/jelec/Solaris/ d02/2polanco1.html>. Acesso em: 16 jan. 2003. PRICE, D. J. de Solla. The structures of publication in science and technology. In: GRUBER, H.; MARQUIS, D. G. (Org.). Factors in the transfer of technology. Cambridge, Mass.: MIT Press, 1969. p. 91-104. PRITCHARD, Alan. Statistical bibliography or bibliometrics. Journal of Documentation, [S. l.], v. 25, n. 4, p.348-349, 1969. ROSTAING, Herv. La bibliomtrie et ses techniques. Tolouse: Sciences de la Socit, 1996. 131 p. SANTOS, Raimundo N. Macedo. Grafo de relacionamento entre descritores: referncias bibliogrficas da LISA (busca "DE=CONSUMER HEALTH INFORMATION"). Florianpolis: UFSC, 2009. 6 eslaides: color. Eslaides gerados a partir de softwares grficos. ____. Propriedade industrial. Natal. UFRN, 1998. 13 eslaides: color. Eslaides gerados a partir do software PowerPoint. SMALL H., GARFIELD E. The geography of science: disciplinary and national mappings. Journal of Information Science, [S. l.], v. 11, n. 4, p. 147-159, 1986. WORMELL, Irene. Informetria: explorando bases de dados como instrumentos de anlise. Cincia da Informao, Braslia DF, v. 27, n. 2, p. 210-216, 1998.

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009

172 BIBLIOGRAFIA

CALLON, M.; COURTIAL, J.P.; PENAN, H. La scientomtrie. Paris: Presses Universitaires de France, 1993. COURTIAL, J. P. Introduction la scientomtrie: de la bibliomtrie la veille technologique. Paris: Anthropos-Economica, 1990.

Pesq. bras. Ci. Inf., Braslia, v.2, n.1, p.155-172, jan./dez. 2009