Você está na página 1de 22

ORGANIZAO DA INFORMAO E BIBLIOMETRIA

INFORMATION ORGANIZATION AND BIBLIOMETRY

Lgia Caf - ligia@cin.ufsc.br


Universidade Federal de Santa Catarina
Marisa Brscher - marisab@unb.br
Universidade de Braslia

Resumo
Padres de organizao da informao so necessrios em pesquisas bibliomtricas
para que documentos que possuam caractersticas similares possam ser recolhidos em
fontes primrias e secundrias e para que se possa atingir confiabilidade na anlise dos
dados. Com o objetivo de identificar as dificuldades encontradas por pesquisadores
quanto aos aspectos de organizao da informao, efetuou-se um levantamento de 59
relatos de teses e dissertaes e realizaram-se entrevistas com especialistas da rea.
Conclui-se que, de maneira geral, as dificuldades se concentram principalmente na
padronizao de ttulos de peridicos e de nomes de autor (descrio fsica), assim
como na diversidade de representaes de assunto (descrio de contedo). A
necessidade de controle da literatura por meio da manuteno de bases de dados
atualizadas apontada pelos especialistas entrevistados como uma das principais
dificuldades encontradas na realizao de pesquisas na rea de bibliometria no Brasil.

Palavras-chave: Bibliometria. Organizao da Informao

1 INTRODUO
De maneira geral, a Bibliometria pode ser definida como um conjunto de leis e
princpios aplicados a mtodos estatsticos e matemticos que visam o mapeamento da
produtividade cientfica de peridicos, autores e representao da informao. Para
cada um destes campos de estudos so adotadas respectivamente as leis de Bradford,
de Lotka e de Zipf. Outros estudos que examinam, por exemplo, a anlise de citaes
(identificao de frentes de pesquisa e colgios invisveis, fator de imediatismo ou de
impacto, acoplamento bibliogrfico e co-citao, obsolescncia da literatura e vida-
mdia, lei do elitismo e teoria epidmica de Goffman) tambm se inserem no contexto
das pesquisas bibliomtricas. A grosso modo, estas leis sintetizam-se da seguinte
forma: Bradford objetiva conhecer o ncleo de peridicos produzido em determinado
tema, Lotka visa definir as maiores contribuies de pesquisadores em determinadas
reas do conhecimento e Zipf pontua a freqncia com que certas palavras aparecem
nos textos cientficos de maneira a definir sua representatividade neste contexto.

As trs leis citadas lidam com distribuies e recenseamentos de documentos


cientficos que possuem propriedades similares. Estas distribuies so interpretadas
sob a luz de dois conceitos principais: o ncleo e a disperso. Segundo Rostaing
(1996, 26),

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 54
Ncleo: representa o grupo de elementos que aparecem mais
freqentemente em um conjunto de referncias bibliogrficas estudadas.
Por exemplo, no caso da lei de Lotka, o ncleo simboliza os autores mais
produtivos em determinada rea do conhecimento.
Disperso: representa o nmero de elementos de baixa freqncia no
conjunto de referncias bibliogrficas estudadas. No caso da lei de
Lotka, a disperso corresponde a uma grande diversidade de autores
que publicaram pouco nessa mesma rea do conhecimento.

Para que se possam recolher documentos cientficos que contenham propriedades


similares, essencial a padronizao da descrio fsica e de contedo desses
documentos. Uma organizao padronizada da informao em bases de dados
proporciona a recuperao de itens relevantes que revelaro uma distribuio mais
prxima da realidade e, conseqentemente, a verificao adequada dos conceitos de
ncleo e disperso.

2 ORGANIZAO DA INFORMAO
Ao associar organizao e recuperao da informao, Svenonius (2000) enfatiza que
a eficcia de um sistema de recuperao da informao est diretamente relacionada
inteligncia adotada para sua organizao. Nesta direo, a autora afirma que o
objetivo essencial e que define um sistema de organizao da informao o de
agrupar informao semelhante e diferenciar aquela que no exatamente
semelhante. (SVENOUNIUS, 2000, p.11.)

Shera e Egan (1961) so ainda mais precisos ao definir que o objetivo dos processos
de documentao bibliografias, servios de resumos, ndices e classificao a
individualizao de um determinado item entre o vasto nmero dos que formam o
conjunto de literatura.

A individualizao de um item de informao obtida por meio da descrio fsica e


de contedo. Svenonius (2000) lembra que, para ser organizada, a informao precisa
ser descrita. Uma descrio, por sua vez, necessita de uma linguagem. Segundo a
mesma autora, a descrio bibliogrfica utiliza a linguagem bibliogrfica, que se
desdobra em linguagens que descrevem a informao (contedo) e linguagens que
descrevem o documento (suporte fsico).

Le Coadic (2004) tambm faz a distino entre a descrio fsica e de contedo


quando se refere aos mtodos de anlise dos documentos e da informao, ao afirmar
que esses mtodos visam a extrair do documento um conjunto de palavras que sirvam
para represent-lo de forma condensada. Dois tipos de conjuntos podem ser obtidos: o
primeiro remete origem do documento e o segundo, ao seu contedo. (LE
COADIC, 2004, p. 64)

Nas definies citadas, observa-se que a descrio o elemento chave da organizao


da informao. Na recuperao da informao, a descrio tambm fundamental,

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 55
pois cumpre a funo de possibilitar o acesso a itens especficos que se encontram
armazenados.

Da mesma forma que para a recuperao da informao, a descrio fsica e de


contedo essencial para os estudos bibliomtricos. O produto dessa descrio a
individualizao de um item de informao e a identificao das suas caractersticas e
propriedades. Sem a descrio e, conseqentemente, sem a identificao nica de um
item de informao, no possvel realizar anlises bibliomtricas, pois, como ressalta
Alvarenga (1998), os elementos textuais, paratextuais e contextuais referentes a
monografias e artigos de peridicos se constituem em variveis comumente abordadas
nos estudos bibliomtricos.

Na literatura da rea de Cincia da Informao consagrado que os sistemas de


recuperao da informao devem ser desenhados em funo de seus usurios.
Geralmente, quando se organiza informao, se tem em vista o usurio final de um
sistema de informao, que recorre ao sistema para satisfazer uma necessidade
especfica de informao. No entanto, os pesquisadores que desenvolvem estudos
bibliomtricos tambm necessitam de um conjunto de descries padronizadas para
constituir seu corpus de pesquisa e realizar suas anlises.

Neste artigo, procura-se mostrar a importncia da organizao de informao para os


usurios que necessitam recuperar e individualizar itens de informao para a
realizao de estudos bibliomtricos. O objetivo do artigo identificar dificuldades no
que se refere descrio fsica e de contedo das fontes utilizadas nesses estudos.

3 METODOLOGIA
Para colher evidncias quanto existncia de dificuldades relativas ausncia de
padronizao da descrio bibliogrfica na realizao de estudos bibliomtricos, e,
ainda, com o objetivo de identificar a natureza dessas dificuldades, realizou-se um
levantamento de relatos de pesquisas de mestrado e doutorado na rea de
Bibliometria.

Analisaram-se 49 teses e dissertaes obtidas como resultado de busca realizada na


base de dados de literatura em Cincia da Informao - LICI, do IBICT. A estratgia
de busca utilizada foi o descritor bibliometria no campo assunto e dissertao e tese
no campo tipo de documento da base de dados.

Visando a anlise de pesquisas mais recentes do que aquelas recuperadas na LICI,


consultou-se a Biblioteca Digital de Teses e Dissertaes (BDTD) 1 do IBICT
utilizando-se a palavra-chave bibliometria. Dos 17 registros recuperados, quatro j
haviam sido recuperados na LICI, dois apresentaram erro de link que impediu o acesso
ao documento integral e um registro estava duplicado. Da BDTD restaram, portanto,
10 documentos a serem analisados. O conjunto de documentos recuperados nas duas
fontes citadas encontra-se referenciado ao final deste artigo.

1
http://bdtd.ibict.br (acesso em 05/09/2007)

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 56
Procedeu-se leitura dos itens metodologia, universo de coleta de dados, anlise dos
dados e concluses de cada tese e dissertao recuperada na LICI e na BDTD.
Realizou-se o registro e agrupamento das dificuldades segundo sua natureza, isto , se
eram relativos a problemas de descrio fsica ou de descrio de contedo.

Este levantamento no teve a inteno de ser exaustivo e tampouco de apresentar


dados quantitativos relacionados s dificuldades levantadas pelos pesquisadores. As
informaes obtidas possibilitaram uma anlise qualitativa das dificuldades relatadas e
sua caracterizao quanto aos aspectos de organizao da informao.

Ainda como parte da metodologia, realizou-se entrevista com 4 pesquisadores


brasileiros 2 da rea de Bibliometria, com o objetivo de identificar se encontravam ou
no dificuldades relativas descrio fsica e de contedo nas fontes utilizadas nos
estudos bibliomtricos e, em caso afirmativo, de obter o relato das dificuldades
encontradas.

4 A DESCRIO BIBLIOGRFICA E OS ESTUDOS BIBLIOMTRICOS


Das 59 teses e dissertaes analisadas, 30 apontaram algum tipo de problema quanto
descrio fsica ou de contedo das fontes utilizadas para coleta de dados. No se pode
afirmar que a ausncia de relatos nos demais trabalhos significa que os autores dessas
pesquisas no encontraram dificuldades, talvez apenas no as tenham mencionado.

Apesar de extrado de um universo reduzido de trabalhos de pesquisa, este dado


fornece um indcio de que, em pesquisas da rea de Bibliometria, ocorrem
efetivamente problemas oriundos da ausncia de padronizao de descries
bibliogrficas.

a. Problemas de descrio fsica


A qualidade da descrio fsica nas bases de dados afeta diretamente a recuperao
para efeito de pesquisa bibliomtrica, principalmente quando se lida com as leis de
Bradford e de Lotka. Isto porque a primeira, ao procurar verificar a capacidade de um
peridico em representar uma determinada rea do conhecimento, utiliza a
recuperao por ttulo dos artigos e peridicos. Quanto lei de Lotka, a falta de
padronizao da descrio fsica afeta principalmente a recuperao dos nomes de
autores, uma vez que esta lei procura medir a produtividade cientfica dos
pesquisadores como elemento de representatividade nas diversas reas cientficas.

Rostaing (1996, p.28) aponta as seguintes questes relacionadas ao tema.

a) Quanto avaliao de revistas, o maior problema relaciona-se ao


uso de uma diversidade de abreviaes no ttulo;
b) Quanto avaliao de pesquisadores (apud MCROBERTS, 1989):
. somente o primeiro autor do artigo citado considerado
2
Agradecemos a valiosa colaborao dos professores pesquisadores Gilda Braga, Jaime
Robredo, Lena Vnia Ribeiro Pinheiro e Raimundo Nonato.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 57
. risco de homonima
. risco de auto-citao
. erros ortogrficos.

Para a anlise de citaes necessrio, portanto, identificar de forma nica um ttulo e


um autor quando este aparece nas diversas citaes analisadas. Caso no esteja
padronizado, um mesmo ttulo ou um mesmo autor poder ser contabilizado como
diferente.

Quanto a este aspecto, foi possvel registrar que a ausncia de padronizao dos ttulos
de peridicos e nomes de autores apresenta-se como uma dificuldade para os estudos
que trabalham com anlise de citaes, como exemplificado em alguns relatos
descritos a seguir.

Cavalcante (1989) aponta a necessidade de uniformizar e completar os dados das


referncias bibliogrficas, pois algumas bibliografias no seguiam os padres
estabelecidos.

Lopes (1992) indica que grande parte das citaes no trazia local de edio, havendo
necessidade de consulta a fontes de referncia. Quanto aos ttulos de peridicos,
observou que Ora grande parte dos ttulos vinham abreviados de forma incorreta, ora
traziam as nomes grafados de forma errnea, com as palavras trocadas de lugar.
(LOPES, 1992, p.60)

Decourt (1993) relata que uma etapa importante da pesquisa, aps a seleo de artigos
a serem includos, foi a uniformizao dos nomes dos autores e a codificao dos
ttulos de peridicos. As regras do AACR2 foram aplicadas a fim de uniformizar as
entradas e, assim, evitar a ocorrncia de homnimos.

Para atingir o objetivo de recuperar toda a produo cientfica de um mesmo autor,


Fernandes (1973) ressalta que, em seu estudo, houve necessidade de investigar o nome
completo dos autores e supor todas as possveis entradas para um mesmo autor nas
fontes primria e secundria.

Costa (2007) observa a falta de padronizao das referncias bibliogrficas, ttulos


com abreviaes diferentes, referncias colocadas ora no corpo do documento, ora no
final. Magalhes (2006) menciona a omisso e troca de dados em referncias
bibliogrficas e Leal (2005) refere-se a autores que apareciam mais de uma vez, nomes
escritos de forma diferente e assuntos com grafia diferente que remetem ao mesmo
conceito.

Acerca da padronizao do nome do autor, alm dos exemplos mencionados, a


ausncia de dados completos relativos a outras caractersticas da autoria como a
titulao e a afiliao, por exemplo, tambm se encontra relatada nos estudos.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 58
Souza (1982) aponta que a insuficincia de dados sobre os professores/pesquisadores
da instituio objeto de sua pesquisa dificultou o estudo e afirma que as informaes
referentes titulao, por exemplo, enriqueceriam as anlises.

Segundo Lopes (1974), os autores do peridico analisado em sua pesquisa no traziam


dados completos sobre titulao e local de graduao e, portanto, houve necessidade
de completar esses dados em consulta rea de recursos humanos das respectivas
instituies de origem.

Carvalho (2006) chama a ateno para a incluso, a partir de 2002, de um campo


especfico na base de dados Bibliografia Brasileira de Odontologia (BBO) para
cadastramento da afiliao do autor. Por outro lado, a ausncia de dados da afiliao
de autores secundrios no Medline apontada como uma dificuldade pela autora. Dos
90 autores analisados em sua pesquisa, 21 no tiveram esse dado preenchido.

Diante dos problemas encontrados, alguns relatos enfatizam a importncia da


padronizao da descrio fsica dos documentos para as anlises de citao. Nesse
aspecto, Souza (1992) destaca a necessidade de aplicao das normas de descrio:

Merecem ateno especial os problemas que prejudicam a coleta de


dados da literatura citada e que so resultantes da falta de
normalizao das citaes dentro dos padres estabelecidos pelos
rgos normativos, nesse caso a NBR 6023 da ABNT que, ao que
parece, no exigida, o que impossibilita e dificulta o cotejamento
entre as informaes citantes e as informaes citadas. (SOUZA, 1992,
p.78)

Em sua pesquisa de mestrado, a viso de Braga (1977, p.16), como uma das grandes
especialistas na rea de Bibliometria no Brasil, resume a problemtica:

As formas de citar, embora indicadas na maioria dos peridicos, no


so, freqentemente, normalizadas, completas e precisas: citaes com
mais de um autor tm o segundo autor e demais autores substitudos
por et allii, et al. etc. ou omitidos; as indicaes de volume, fascculo
e data dos peridicos variam enormemente, sendo muitas vezes
errneas.

Outro aspecto levantado nos estudos analisados refere-se ausncia de


padronizao na estrutura dos peridicos, como indicado por Pinheiro (1982), que
identifica o problema em diferentes fascculos de uma mesma revista. Este fato
constitui-se em obstculo para identificar, nos peridicos, quais sees devem ser
consideradas para levantamento dos artigos cientficos e de suas citaes.

Essa mesma dificuldade encontra-se relatada em estudo recente sobre o peridico


Cincia da Informao, realizado por Pinheiro; Brscher e Burnier (2005, p.33), que
identifica 22 tipos de sees na revista. Ressaltam as autoras que

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 59
...no significa que o peridico no passe por nenhuma modificao,
ao longo dos anos, nem que possa ser criada uma nova seo, mas o
desejvel que mantenha um padro estrutural e terminolgico que,
inclusive, identifique-o.

Nesse estudo de Pinheiro; Brscher e Burnier (2005), os dados relativos autoria,


revelam dificuldades semelhantes s relatadas nas teses e dissertaes levantadas neste
artigo. Das 856 ocorrncias de autores da revista, 42,52% no indicava o grau de
formao dos autores. Alm disso, os nomes de autores e de suas instituies de
origem tambm tiveram que ser padronizados para possibilitar a contagem de
ocorrncia de autoria e para identificar as instituies de origem que mais
contriburam com a revista.

Nos estudos analisados, as deficincias de padronizao da descrio fsica so


apontadas como uma dificuldade pelos pesquisadores. A ausncia dessa padronizao
exige um esforo adicional dos autores das pesquisas, que necessitam recorrer a vrias
fontes de consulta para completar e confirmar dados necessrios s anlises
bibliomtricas.

Como ressalta Mugnaini (2006, p.), o uso de referncias bibliogrficas para anlises
bibliomtricas impe a transformao de dados bibliogrficos em dados
bibliomtricos. Desta forma, a padronizao da informao uma exigncia, j que se
deve garantir a homogeneidade das informaes a serem compatibilizadas. Um dado
interessante relatado em seu estudo mostra que, aps a padronizao do ttulo,
determinada revista que ocupava a primeira posio no ranking passou a ocupar o
sexto lugar.

Mugnaini (2006, p.), apoiado na opinio de diversos autores, chama a ateno para o
fato de, no Brasil, muitos estudos se limitarem aos dados fornecidos no ISI
(Information Sciences Institute) em funo de grande parte do esforo de realizao
das anlises bibliomtricas centrar-se na padronizao dos dados, quase sempre
obtidos de bases de dados bibliogrficas onde a falta de uniformidade extrema.

b. Problemas de descrio de contedo


Um dos aspectos relativos descrio de contedo diz respeito coleta, em bases de
dados, bibliografias ou catlogos, das publicaes dedicadas rea de conhecimento
objeto do estudo bibliomtrico e que comporo o corpus de pesquisa.

Nesse aspecto, as origens das dificuldades para os estudos bibliomtricos so


semelhantes quelas encontradas em sistemas de recuperao da informao. Isto se
deve ao fato de que a descrio e a recuperao de contedo supem o cruzamento das
noes de especificidade e exaustividade, assim como de relevncia, revocao e
preciso.

Segundo o princpio da especificidade, os assuntos devem ser representados da forma


mais especfica possvel. Assim, como exemplifica Lancaster (2004), um documento

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 60
sobre "laranja" ser descrito pela etiqueta "laranja" e no por "fruta ctrica ou fruta.
A exaustividade refere-e ao nvel de profundidade dado descrio de contedo de um
documento. De acordo com Lancaster (2204), a indexao exaustiva abrange o
contedo temtico do documento de modo bastante completo e a indexao seletiva
abrange somente o contedo temtico principal do documento. Estes princpios visam
melhorar a relevncia, segundo as necessidades de informao dos usurios de um
sistema de informao.

Como afirma Le Coadic (2004), a relevncia uma relao entre um documento e


uma questo do usurio. Dessa forma, Lancaster (2004) define que um documento
pertinente (til) aquele que contribui para satisfazer alguma necessidade de
informao. O conceito de relevncia se relaciona, portanto, com os significados de
revocao e preciso, medidas de avaliao de sistemas de recuperao da informao.

A revocao a relao entre o nmero total de documentos relevantes contidos no


sistema de informao e o nmero de documentos relevantes recuperados pelo
sistema. A preciso, por sua vez, a relao entre o nmero de documentos relevantes
recuperados pelo sistema e o nmero total de documentos recuperados. A preciso,
portanto, diz respeito capacidade do sistema de recuperar apenas os documentos
relevantes, ou seja, sua capacidade de descartar documentos inteis e assim diminuir o
rudo na recuperao da informao. (ROBREDO, 2005).

Atingir ndices adequados de revocao e de preciso uma condio importante para


a recuperao de informao em pesquisas bibliomtricas, uma vez que o conjunto de
documentos recuperados que constitui o corpus de pesquisa afeta diretamente o
resultado das anlises de distribuio realizadas.

A articulao dos conceitos de especificidade, exaustividade, revocao e preciso


deve ter como orientao maior a relevncia do assunto para aquele que est buscando
a informao, o que nem sempre evidente. Nesse sentido, a adoo de linguagens
documentrias pode auxiliar os processos de representao e recuperao da
informao. muito importante salientar que as linguagens documentrias, ao visarem
padronizao, no devem representar a terminologia de uma rea do conhecimento
de forma prescritiva como se as lnguas de especialidades pudessem ser controladas.
necessrio padronizar respeitando a diversidade denominativa e nocional da rea
descrita, levando em conta o uso social da lngua para a comunidade qual se destina.
Esse aspecto, no entanto, pode ocasionar alteraes na estrutura da linguagem, o que
vem muitas vezes dispersar a informao representada, dificultando o trabalho
bibliomtrico.

Com relao ao uso de linguagens documentrias, os relatos encontrados nas teses e


dissertaes referem-se ausncia de padronizao na representao dos assuntos; s
alteraes na estrutura da linguagem documentria utilizada ou s deficincias da
linguagem. Nesse sentido, o retrabalho ou a adoo de remissivas nas bases de dados
muito importante para que a determinao dos recenseamentos seja a mais prxima da
realidade.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 61
Dentre os estudos analisados, Rolim (1976, p.63) ressalta a importncia da
padronizao de assunto ao relatar que Com os dados obtidos e organizados, a
primeira preocupao foi a normalizao de cabealhos de assunto sob nmeros
idnticos de classificao, a fim de se efetuar o tratamento estatstico. A pesquisadora
aponta, ainda, dificuldades com a alterao na estrutura da linguagem documentria
utilizada pela bibliografia analisada em seu estudo.

Obviamente, no seria possvel distinguir, sem acesso s publicaes,


qual a razo de se encontrarem reunidos assuntos como Arquitetura e
Escultura, que aparecem juntos em 1952, embora depois passem a ser
indicados isoladamente.

Constata-se ainda que o assunto poesia e poemas musicais a partir do


ano XXI, 1960, passou a figurar sob o ttulo POEMAS e que o assunto
CINEMA foi omitido, a partir de 1959, ano XX, da rubrica PEAS DE
TEATRO, RADIOTEATRO, CINEMA E TELEVISO. (ROLIM, 1976,
p.64)

A necessidade de padronizao da descrio reconhecida tambm por Fernandes


(1973), ao analisar a literatura de Fsica, quando afirma ter sido necessrio, a fim de
obter todos os dados classificados de uma mesma maneira, escolher uma lista
classificada de cabealhos de assunto.

Do relato de Coutinho (1990), possvel identificar como os problemas de indexao


afetam os estudos. A autora observa que artigos sobre ferrovia tema de sua pesquisa
- deixaram de ser indexados na base de dados estudada, por se referirem a assuntos
mais complexos e, portanto, com maior grau de dificuldade para identificao do
assunto tratado e, conseqentemente, mais difceis de atribuir cabealhos de assunto
satisfatrios. A autora atribui esses problemas de indexao excessiva especializao
do assunto e existncia de um tesauro especializado em ferrovia que, possivelmente,
no estava sendo usado adequadamente ou no atendia s necessidades de indexao.

Por outro lado, alguns relatos apontam que descries padronizadas de assunto
contribuem para a coleta de dados em estudos bibliomtricos. Pinheiro (1982, p.43)
utiliza a base LISA (Library Information Science Abstract) em seu estudo
bibliomtrico e no encontra dificuldades ao selecionar os registros relativos ao tema
de sua pesquisa classificao, pois, como afirma, essa rea mostrou ser de fcil
recuperao porque os descritores tm seus limites fixados sem o uso excessivo de
remissivas e referncias.

A base de dados LISA utiliza linguagem documentria para a descrio dos assuntos.
Dessa maneira, o pesquisador da rea de Bibliometria, assim como um usurio que
deseja recuperar informao nessa base de dados, orientado a selecionar os
descritores que melhor representam os assuntos de seu interesse.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 62
Faria (2001) menciona as facilidades com o uso de descritores e modificadores do
tesauro para obter maior preciso na busca no Web of Science e, por outro lado,
aponta como dificuldade a ausncia de um campo de classificao por reas do
conhecimento para permitir a recuperao de todos os artigos de uma rea, de forma
mais abrangente do que a possibilitada pelos descritores especficos.

Os relatos de pesquisa revelam que a qualidade da descrio de contedo afeta a


qualidade da recuperao da informao e tambm os estudos bibliomtricos que
dependem dessa descrio para delimitar seu corpus de pesquisa.

Alm dos fatores ligados recuperao de documentos por assunto em bases de dados,
outro tipo de dificuldade apontada nos estudos analisados diz respeito aplicao da
lei de Zipf, conforme ressaltam os relatos citados a seguir.

Como aponta Silva (1995), a lei de Zipf trabalha com palavras tratadas isoladamente e
os resultados obtidos poderiam ser significativamente alterados utilizando-se outros
critrios de contagem de palavras ou adotando-se conceitos. O autor ressalta ainda a
necessidade de considerar o problema dos quase-sinnimos, apontando como exemplo
os termos soropositivo, AIDS, HIV.

No entanto, ao considerar os quase-sinnimos em um mesmo conjunto de dados


recuperados sem levar em considerao suas proximidades e naturezas semnticas e
pragmticas, pode-se chegar a resultados errneos. Os conceitos citados acima, mesmo
que relacionados, tm significados diferentes dependendo do contexto no qual esto
inseridos. Isso deve ser levado em considerao no momento da anlise dos dados
recuperados.

Maranho (1996), ao aplicar a lei de Zipf em dois textos, um em portugus, e sua


traduo para o ingls, e vice-versa, confirma o que Silva infere, pois ao aplicar a
frmula de transio de Goffman ao conjunto de palavras extrado do texto em ingls
e, posteriormente, ao conjunto extrado da sua traduo para o portugus, observa que
o termo information encontra-se na faixa de palavras representativas do contedo, ou
seja, aquelas que se encontram no ponto T da frmula de transio de Goffman (usa a
variao da frmula conforme proposto por Mamfrim). Ao aplicar a lei no texto em
portugus, o termo correspondente em portugus informao no includo entre as
palavras do ponto T.

A autora observa que isso se deve ao fato de a palavra inglesa no possuir flexo de
nmero enquanto que na lngua portuguesa ela sofre flexo e, caso no ocorra reduo
ao radical, as freqncias das duas formas so contadas distintamente, levando a
diferenas significativas de resultados.

Charles Muller apud Quemel (1983) chama a ateno para a necessidade de regras
precisas para a delimitao da palavra, unidade de texto e de vocbulo, unidade do
lxico:

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 63
quantificar o vocabulrio de um texto proceder a duas operaes
distintas, sejam elas sucessivas ou simultneas:
1) a enumerao das palavras que compem o texto, e cujo nmero
representado por N, d uma medida de extenso do texto;
2) a enumerao dos vocbulos empregados no texto, e cujo nmero,
representado por V, mede a extenso do vocabulrio.
necessrio, ento, regras precisas para a delimitao da palavra,
unidade do texto, e de vocbulo, unidade de lxico. (MULLER, apud
QUEMEL, 1983, p.31)

Como conclui Quemel (1983), as leis de Zipf so referentes extenso do texto, ou


seja, a verificao feita pela enumerao das palavras e no de vocbulos. Dessa
forma, so computados separadamente os sinnimos, palavras no singular e plural,
diversos tempos do mesmo verbo, palavras de gnero diferentes, enfim, todas as
flexes de um vocbulo.

A anlise da autora se refere diferena entre duas abordagens de tratamento textual


presentes na literatura: a abordagem estatstica e a lingstica. A primeira faz uso de
recursos estatsticos e se baseia na freqncia de ocorrncia das palavras no texto e na
base de dados analisada. Apesar das vantagens de serem mais rpidas e necessitarem
de menores recursos de informtica e de conhecimento, estudos em Lingstica tm
apontado as seguintes desvantagens em relao a esta abordagem:

a) dificuldade em estabelecer uma medida ideal de freqncia para medir a


representatividade da palavra no contexto estudado;
b) falta de controle de ambigidades semnticas;
c) a recuperao afetada negativamente no que diz respeito aos nveis de preciso
e revocao.

Por outro lado, a abordagem lingstica se fundamenta em tcnicas mais sofisticadas,


chegando por vezes a adotar recursos de manipulao da linguagem natural chamados
de processamento automtico da linguagem natural. A descrio de contedo de
abordagem conceitual pode resolver ambigidades morfolgicas, lexicais, sintticas e
semnticas. Em contrapartida, obtm-se um conjunto mais significativo de itens de
dados para o trabalho bibliomtrico, aproximando-o da realidade.

Baslio, apud Ramos (1992), defende a abordagem lingstica ao ressaltar a


necessidade de considerar que

a contagem das palavras de um texto deve ser feita no em termos das


palavras propriamente ditas, e sim em termos do que ela chama de
contemas, ou seja, de unidades de contedo informativo, pois como a
lngua portuguesa rica em palavras de forma grfica e funo
sinttica diferentes, mas equivalentes quanto ao contedo informativo,
uma contagem que separasse estas diversas formas de um mesmo
contedo produziria resultados distorcidos. (RAMOS, 1992, p.320)

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 64
Em estudos que utilizam mtodos estatsticos de tratamento as palavras do texto, como
no caso dos que aplicam a Lei de Zipf, os resultados podem ser significativamente
alterados dependendo do tipo de tratamento lingstico aplicado ao texto. necessrio,
portanto, que os procedimentos adotados na pesquisa estejam bem especificados na
metodologia, como foi o caso de vrias teses e dissertaes analisadas, que apresentam
as regras adotadas para o tratamento textual, tais como a reduo das palavras ao
radical e o tratamento de termos compostos e de nomes prprios.

Quanto descrio de contedo, a anlise das dissertaes e teses revela que os


estudos bibliomtricos so afetados por fatores lingsticos da linguagem natural
semelhantes aos que afetam o processo de indexao e de elaborao de linguagens
documentrias, tais como a sinonmia, a homografia e o tratamento de termos
compostos.

5 A OPINIO DOS ESPECIALISTAS DA REA DE BIBLIOMETRIA NO


BRASIL
Nas entrevistas com especialistas brasileiros da rea de Bibliometria, algumas opinies
corroboram os relatos encontrados nas teses e dissertaes analisadas quanto
necessidade de padronizao dos ttulos de peridicos e de nomes de autores. Ressalta-
se o risco de se contar o mesmo peridico como peridicos distintos, quando a fonte
adotada para coleta dos dados no recupera os diferentes ttulos, fuses etc. Em
relao autoria, alm do aspecto da padronizao dos nomes, um dos especialistas
lembra ainda que as abreviaturas de nomes podem tambm induzir a erros quando,
coincidentemente, o mesmo sobrenome tambm apresenta as mesmas letras no pr-
nome. Nesse caso, como alerta o pesquisador, somente especialistas da rea estudada
so capazes de identificar essas idiossincrasias.

A viso de um segundo especialista entrevistado confirma que os problemas se


agravam quando os estudos so realizados em reas que o pesquisador desconhece,
pela dificuldade de reconhecer ttulos e autores. Esse especialista afirma que o
trabalho bibliomtrico elaborado na prpria rea menos rduo, pois conhecemos o
que estamos analisando. O problema aparece quando vamos para outras reas do
conhecimento.

Outro aspecto relativo a autoria diz respeito orientao de uso do et al dada pela
NBR 6023 da ABNT (ASSOCIAO BRASILEIRA DE NORMAS TCNICAS,
2002), identificada como uma das dificuldades encontrada pelos especialistas, pois, a
ausncia do nome dos co-autores inviabiliza estudos de produtividade ou de citao.

Alm dos problemas de ttulos e nomes e autores, um dos especialistas aponta ainda a
falta de padronizao do nome de instituies. Uma breve consulta ao Web of
Science 3 para levantar a produo oriunda da Fundao Oswaldo Cruz (Fiocruz), por
exemplo, revela a falta de padronizao no nome de instituies brasileiras. Com o
nome completo da instituio recuperaram-se 3564 registros e com a sigla 3.329.
3
http://portal.isiknowledge.com/portal.cgi?DestApp=WOS&Func=Frame (acesso em 10 de
setembro de 2007)

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 65
Pde-se observar nessa rpida consulta, que o mesmo ocorre com outras instituies
pesquisadas, como a Universidade de Braslia, que ora aparece abreviada - Univ
Braslia, e ora representada pela sigla UNB. O levantamento de dados de instituies
requer, portanto, que o pesquisador imagine todas as possibilidades de registro do
nome da instituio que deseja estudar.

Segundo um dos entrevistados, com a aplicao de ferramentas de processamento


automtico de texto possvel formar agrupamentos de nomes semelhantes, o que
facilita a identificao de autores, ttulos e instituies e sua contagem nica nas
anlises bibliomtricas. Esse mesmo especialista ressalta que os agrupamentos se
comportam de maneira diferente em reas do conhecimento distintas.

Uma soluo descrita na tese de Mugnaini (2206) tambm aponta na direo do uso de
ferramentas para correo automtica de diversos campos, como o mdulo de
bibliometria do Scielo, utilizado em sua pesquisa, que trabalha com associaes por
trigramas e buscas booleanas. No entanto, o prprio autor reconhece que este processo
de correo pode falhar em funo da insuficincia de dados nas fontes utilizadas.

Sobre a descrio de contedo, apenas um especialista se manifestou e identificou o


seguinte problema em relao Lei de Zipf:

O maior problema atual, em aplicaes da lei de Zipf, encontrar


software apropriado para operar como os contedos semnticos
(algumas vezes palavras compostas), enfim, um trabalho intelectual
realizado bem por um ser humano. O trabalho, quando manual, exigia
um grande esforo para este tipo de detalhamento.

No contexto deste artigo, as caractersticas de softwares aplicados aos estudos


bibliomtricos no foram analisadas. Uma sugesto para estudo futuro verificar o
quanto esses softwares so capazes de resolver os aspectos mencionados pelo
especialista.

Sobre as questes relativas padronizao dos dados, um dos especialistas opina que
estes no so o maior problema das pesquisas bibliomtricas, mas sim a carncia de
fontes secundrias. Segundo ele,

as principais dificuldades no se referem aplicao de determinadas


leis como Bradford, Zipf ou Lotka, mas sim existncia de fontes
secundrias adequadas e quando estas existem, acesso s fontes
primrias. Padronizao luxo e no incomoda muito. Um certo
rudo nos dados inevitvel, como em qualquer levantamento ou
pesquisa sobre esses dados um pesquisador deve saber lidar com
isso.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 66
Trs dos especialistas entrevistados concordam que a maior dificuldade para os
estudos refere-se necessidade de controle da literatura, principalmente por meio da
manuteno de bases de dados atualizadas da literatura brasileira.

At a dcada de 60, o IBICT compilava bibliografias manualmente depois


automatizadas a duras penas, ainda via cartes perfurados. Hoje em dia, com todo o
poder de computao disponvel, a literatura cientfica e tecnolgica brasileira uma
grande incgnita.

Sem bases de dados com padres, completas e atualizadas, no h possibilidade de


obter indicadores de C&T confiveis e, conseqentemente, de planejamento de
Cincia e Tecnologia, com base nesses indicadores.

Muitas das dificuldades de trabalhar com bibliometria no Brasil devem-se a


deficincias das bases de dados nacionais.

Sobre o uso de bases de dados como fontes de coleta de dados em pesquisas da rea de
Bibliometria, um especialista ressalta que um dos problemas encontrados que essas
geralmente no so construdas para essa finalidade e, portanto, h dificuldade na
coleta e padronizao de dados.

Um apontamento interessante feito por um dos entrevistados refere-se ao


endereamento das sugestes aos rgos do governo responsveis pelas polticas
pblicas em informao cientfica e tecnolgica ICT, sobretudo o IBICT, que a
instituio brasileira com esta competncia, no somente de orientao para a adoo
de padres nacionais, compatveis com os internacionais, mas de apoio a essas
iniciativas, evitando a situao de descontinuidade e desatualizao, que muito
comum no Brasil.

Quanto ao uso de et al na normalizao da referncia bibliogrfica pela ABNT, um


dos entrevistados prope que esta instituio seja orientada sobre estas questes, que
atingem diretamente estudos quantitativos como os bibliomtricos.

Finalmente, outra questo citada nas entrevistas diz respeito importncia do


levantamento de teses e dissertaes com abordagem bibliomtrica, uma vez que os
procedimentos metodolgicos, de um modo geral, so muito detalhados, exatamente
para superar esses problemas apontados chegando, s vezes, a constituir captulos.
Sobre este assunto, um entrevistado cita uma pesquisa que embora antiga ainda hoje
atual quanto ao registro da problemtica. Diz o entrevistado

oportuno lembrar a dissertao de mestrado de Helena Dodd Ferrez,


na rea de Histria que, ao enfrentar tantos problemas de citao,
inseriu na dissertao um captulo intitulado patologia de citaes.
Mesmo que esta dissertao seja do incio da dcada de 80, passados
mais de 20 anos ainda h muitos problemas que persistem e
permanecem.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 67
A consulta dissertao de Ferrez (1981) leva compreenso da nfase dada s
patologias de citaes. Pois, em seu estudo de citaes na rea de Histria, a autora
encontrou 75% de referncias incompletas, o que a motivou a escrever um captulo
especfico sobre esse problema (FERREZ, 1981). Dentre as possveis causas dessa
ausncia de padronizao e completeza das citaes, a pesquisadora ressalta o grau de
maturidade em que se encontrava a rea de Histria poca; a inexistncia de um
corpo editorial que efetivamente opere a partir de normas pr-determinadas, que
assegurem um padro qualitativo homogneo; a complexidade das referncias da rea
e o desconhecimento da importncia da referncia no sistema de comunicao
cientfica.

Com base na anlise de teses e dissertaes realizada neste artigo, pode-se afirmar que
problemas de descrio bibliogrfica continuam a ser apontados em estudos
bibliomtricos, mesmo nos mais recentes, apesar de nenhum relato se comparar
situao enfrentada por Ferrez (1981).

6 CONCLUSES
Ainda que preliminarmente, o estudo realizado revela que questes relativas
padronizao da descrio bibliogrfica causam dificuldades na coleta e anlise de
dados em pesquisas bibliomtricas.

No levantamento e anlise realizados constataram-se dificuldades dos estudos de


anlise de citao no que se refere descrio bibliogrfica, mais especificamente,
aquelas relativas padronizao de ttulos de peridicos e nomes de autores. Os
problemas de descrio de contedo dizem respeito representao de assunto nas
bases de dados ou outras fontes utilizadas para a coleta dos documentos que compem
o corpus de pesquisa. Na aplicao da Lei de Zipf, h ainda questes relacionadas s
caractersticas da linguagem natural que necessitam de tratamento lingstico, tais
como variao de nmero, sinonmia, homografia e nomes compostos.

Tomando por base algumas sugestes de autores de teses e dissertaes e de


especialistas entrevistados, enumeramos abaixo algumas iniciativas que podem
contribuir com a coleta e anlise de dados em pesquisas bibliomtricas.

o Autores: observar a legitimidade e fazer corretamente a transcrio dos dados nas


citaes, segundo as normas estabelecidas.
o Editores de peridicos cientficos: definio de padro para identificao dos
nomes de autores e exigncia de dados completos de filiao e titulao. Definio
de normas de citao e controle de qualidade na sua aplicao em artigos
submetidos revista sob sua responsabilidade.
o Bases de dados: alm da padronizao relativa aos dados de descrio fsica, a
necessidade de utilizao de linguagens padronizadas para descrio de contedo,
visando auxiliar no levantamento da literatura de uma determinada rea e na
anlise de assunto de artigos de peridicos.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 68
Padres de organizao da informao so essenciais para a identificao correta das
variveis analisadas em pesquisas bibliomtricas. No entanto, no basta que esses
padres estejam definidos para atingir os objetivos de recuperao da informao e de
gerao de indicadores de comunicao cientfica. Eles necessitam ser efetivamente
empregados nas fontes de informao. Para tanto, faz-se necessria atuao firme de
editores cientficos e administradores de bases de dados e a colaborao e
sensibilizao dos autores para aplicao correta dos padres de descrio
bibliogrfica. Nessa direo, gestes junto a rgos de fomento e rgos de
normalizao visando organizao da informao e ao controle da literatura nacional
contribuiriam para a produo de anlises de indicadores da produo cientfica
brasileira.

REFERNCIAS

ALVARENGA, L. Bibliometria e arqueologia do saber de Michel Foucault: traos de


identidade terico-metodolgica. Ci. Inf. , Braslia, v.27 n.3 , set. 1998. Disponvel em
<http://www.scielo.br/scielo.php?pid=S0100-19651998000300002&script=sci_arttext&tlng=pt>. Acesso em:
06/09/2007.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR6023: Informao e
documentao: referncias: elaborao. Procedimentos. Rio de Janeiro, 2002. 22p.
FERREZ, H.D. Anlise da literatura peridica brasileira na rea de Histria.
1981. 168 p. Dissertao (Mestrado em Cincia da Informao)- Universidade Federal
do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia e Tecnologia, Rio de
Janeiro, 1981.
LANCASTER, F. W. Indexao e resumos: teoria e prtica. Traduo Antnio
Agenor Briquet de Lemos. 2. ed. rev. e aum. Braslia: Briquet de Lemos/Livros, 2004.
452 p.
LE COADIC, Y-F. A Cincia da Informao. 2. ed. Braslia: Briquet de Lemos
Livros, 2004. 124 p.
PINHEIRO, L.V.R.; BRSCHER, M.; BURNIER,S. Cincia da Informao: 32 anos
(1972-2004) no caminho da histria e horizontes de um peridico cientfico brasileiro.
Cincia da Informao, Braslia v.34, n. 3, p.1-52. set./dez. 2005.

ROBREDO, J. Documentao de hoje e de Amanh: uma abordagem revisitada e


contempornea da Cincia da Informao e de suas aplicaes biblioteconmicas,
documentrias, arquivsticas e museolgicas. 4.ed.rev. e ampl. Braslia, Edio de
autor, 2005. 410p.
ROSTAING, Herv. La bibliomtrie et ses techniques.. Toulouse: Sciences de la
Socit; Marselle: Centre de Recherche Rtrospective de Marseille, 1996. 131 p
(Outils et mthodes, 38).
SHERA, J.H.; EGAN, M.E. Exame do estado atual da Biblioteconomia e da
Documentao. In: BRADFORD, S.C. Documentao. Rio de Janeiro, Fundo de
Cultura, 1961. p. 15-61.
SVENONIUS, E. The Intellectual Foundation of Information Organization. 2000.
255p.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 69
REFERNCIAS DAS TESES E DISSERTAES COLETADAS

AGUIARI, Carmen Sylvia Arantes Leal. Lista bsica de peridicos para o curso de
graduao em enfermagem e obstetrcia no Brasil: estudo bibliomtrico, 1966-
1976. 1980. 132 p. Dissertao (Mestrado em Cincias da Comunicao)-
Universidade de So Paulo, So Paulo, 1980.
AMATUZZI, Maria Luiza Lotumulo. Avaliao metodolgica dos artigos
publicados na rea de ortopedia e traumatologia nos anos de 2004 e 2005. 2007.
93 p. Tese (Doutorado em Cincias)-Universidade de So Paulo, So Paulo, 2007.
BARRETO, Maria de Ftima. Anlise bibliomtrica da estrutura e o padro da
produo bibliogrfica dos professores dos Departamentos de Cincias
Fisiolgicas e Fsica da UFES, 1984-1987. 1990. 139. p. Dissertao (Mestrado em
Cincia da Informao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro
de Informao em Cincia e Tecnologia, Rio de Janeiro, 1990.
BIASOTTI, Miriam Mara Dantur de la Rocha. El uso de la informacion
documental: concepto y criterios para su medicion, en el ambito de los sistemas de
informacion. 1994. 310 p. Dissertao (Mestrado em Cincia da Informao)-Univ.
Complutense de Madrid, Madrid, 1994.
BRAGA, Gilda Maria. Dynamics of scientific communication: an application to
science funding policy. 1977. 76 p. Tese (Doutorado em Cincia da Informao)-Case
Western Reserve University, Columbus, 1977.
BRAGA, Gilda Maria. Relaes bibliomtricas entre a frente de pesquisa
(research front) e revises da literatura (reviews): estudo aplicado a cincia da
informao. 1972. 37 p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1972.
BRASIL, Maria Irene. Estruturas bibliomtricas e fontes historiogrficas do setor
de histria da Fundao Casa de Rui Barbosa: um estudo de caso. 1992. 210 p.
Dissertao (Mestrado em Cincia da Informao)-Universidade Federal do Rio de
Janeiro, Instituto Brasileiro de Informao em Cincia e Tecnologia, Rio de Janeiro,
1992.
CALDEIRA, Paulo da Terra. Crescimento da literatura brasileira de doena de
chagas: anlise bibliomtrica. 1974. 61 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Bibliografia e Documentao, Rio de Janeiro, 1974.
CARVALHO, Maria Martha de. Anlises bibliomtricas da literatura de qumica
no Brasil. 1975. 71 p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Bibliografia e
Documentao, Rio de Janeiro,1975.
CARVALHO, Telma de. A produo cientfica brasileira em odontologia e sua
visibilidade nacional e internacional. 2006. 156 p. Tese (Doutorado em Cincias da
Comunicao)- Universidade de So Paulo, So Paulo, 2006.
CAVALCANTI, Ilce Goncalves Milet. Padres de citao em comunicao: anlise
das dissertaes apresentadas a ECO/UFRJ. 1989. 135 p. Dissertao (Mestrado em

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 70
Cincia da Informao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro
de Informao em Cincia e Tecnologia, Rio de Janeiro, 1989.
CELIS, Adriana Roa. A dinmica da comunidade cientifica na produo do
conhecimento: um estudo da imunologia no Brasil e na Colmbia. 2002. Tese
(Doutorado)- Universidade Estadual de Campinas, Campinas, 2002.
COELHO, Beatriz Amaral de Salles. Literatura, assunto: anlise de citaes em
cincia poltica. 1991. 178. p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1991.
COSTA, Rubenildo Oliveira da. Anlise do uso de peridicos cientficos na
transio do meio impresso ao eletrnico em dissertaes e teses: o impacto do
portal de Peridicos/CAPES na produo do conhecimento. 2007. 143 p. Dissertao
(Mestrado em Cincia da Informao)_Universidade Catlica de Campinas,
Campinas, 2007.
COUTINHO, Eliana. Aplicao da lei de Bradford a literatura tcnica sobre
ferrovia: anlise de peridicos e avaliao da base de dados de Rede Ferroviria
Federal S.A. 1991. 158 p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1991.
DECOURT, Beatriz Aparecida Boselli. O uso da tcnica de citao no estudo dos
processos de desenvolvimento e de comunicao de grupos de pesquisa em cincia
no Brasil: um estudo de caso. 1993. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Informao em Cincia e Tecnologia, Rio de Janeiro, 1993.
DI GIORGI, Maria Luiza Andrade. Anlises da comunicao entre autores no
campo da literatura brasileira de tecnologia de alimentos. 1974. 133 p. Dissertao
(Mestrado em Cincia da Informao)-Universidade Federal do Rio de Janeiro,
Instituto Brasileiro de Bibliografia e Documentao, Rio de Janeiro,1974.
DUSILEK, Darci. Investigao sobre a influncia das variveis tempo e assunto no
vocabulrio de um autor. 1974. 102 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Bibliografia e Documentao, Rio de Janeiro,1974.
ESPIRITO SANTO, Alexandre do. A measure of the dimensions of
interdisciplinarity of two applied sciences: a scientometric model. 1978. 136 p.
Dissertao (Mestrado em Cincia da Informao)-University of Winsconsin ,
Madison, 1978.
FARIA, Leandro Innocentini Lopes. Prospeco tecnolgica em materiais: aumento
da eficincia do tratamento bibliomtrico. 2001. Tese (Doutorado em Cincia e
Engenharia de materiais)-Universidade Federal de So Carlos, So Carlos, 2001.
FERNANDES, Rosali Pacheco. Anlises bibliomtricas da produo cientfica dos
grupos de pesquisa sobre fsica do estado solido na America Latina. 1973.
Dissertao (Mestrado em Cincia da Informao)-Universidade Federal do Rio de
Janeiro, Instituto Brasileiro de Bibliografia e Documentao, Rio de Janeiro,1973.
FIGUEIREDO, Laura Maia de. Distribuio da literatura geolgica brasileira:
estudo bibliomtrico. 1972. 32 p. Dissertao (Mestrado em Cincia da Informao)-

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 71
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Bibliografia e
Documentao, Rio de Janeiro,1972.
FONSECA JNIOR, Wilson Corra da. A comunicao organizacional: um estudo
epistemolgico. 2007. Tese (Doutorado em Comunicao Social)_Universidade
Metodista de So Paulo, So Paulo, 2007.
FORESTI, Noris Almeida Bethonico. Estudo da contribuio das revistas
brasileiras de Biblioteconomia e Cincia da Informao enquanto fonte de
referncia para a pesquisa. 1989. 209 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade de Braslia, Braslia, 1989.
GOMES, Samuel. Distribuio da literatura cientfica brasileira: estudo
bibliomtrico. 1977. 53 p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1977.
GUSMAO, Heloisa Rios. Anlise da literatura brasileira de siderurgia. 1977. 58 p.
Dissertao (Mestrado em Cincia da Informao)-Universidade Federal do Rio de
Janeiro, Instituto Brasileiro de Bibliografia e Documentao, Rio de Janeiro,1977.
HERNANDEZ CANADAS, Patrcia Liset. Os periodicos "Ciencia Hoje" e
"Ciencia e Cultura" e a divulgao da cincia no Brasil. 1987. 190 p. Dissertao
(Mestrado em Cincia da Informao)-Universidade Federal do Rio de Janeiro,
Instituto Brasileiro de Informao em Cincia e Tecnologia, Rio de Janeiro, 1987.
HIRATA, Geni Rodrigues da Costa. Do texto cientfico ao texto de divulgao: um
estudo quantitativo exploratrio. 1994. 175 p. Dissertao (Mestrado em Cincia da
Informao)- Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Informao em Cincia e Tecnologia, Rio de Janeiro, 1994.
IPPOLITO, Celina. Analise comparativa da aquisio e circulao de peridicos
em bibliotecas da Universidade de So Paulo na rea medica e afim: uma
metodologia bibliomtrica. 1973. 164 p. Dissertao (Mestrado em Cincias da
Comunicao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Bibliografia e Documentao, Rio de Janeiro,1973.
JOB, Ivone. Educao Fsica no PPGMH/UFRGS: uma viso a partir da anlise de
citaes e perfil dos pesquisadores. 2006. 136 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal de Minas Gerais, Belo Horizonte, 2006.
LEAL, Igor Campos. Anlise de citaes da produo cientfica de uma
comunidade: a construo de uma ferramenta e sua aplicao em um acervo de teses e
dissertaes do PPGCI-UFMG. 2005. 94 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal de Minas Gerais, Belo Horizonte, 2005.
LOPES, Anna de Souza Ayres. Estudo das citaes da revista Pesquisa
Agropecuria brasileira como instrumento para conhecimento do perfil dos
autores. 1992. 138 p. Dissertao (Mestrado em Cincia da Informao)-
Universidade de Braslia, Braslia, 1992.
LOPEZ ROBLEDO, Edgar Leonel. Estudo do desenvolvimento da literatura sobre
fsica do estado slido no Mxico no perodo 1959-1971. 1974. 188 p. Dissertao
(Mestrado em Cincia da Informao)-Universidade Federal do Rio de Janeiro,
Instituto Brasileiro de Bibliografia e Documentao, Rio de Janeiro,1974
MAGALHES, Francyslene Abreu Costa. Construo do saber no programa de
doutorado em contabilidade no Brasil: plataformas tericas e motivaes. 2006.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 72
108 p. Dissertao (Mestrado em Cincias Contbeis)-Universidade de So Paulo, So
Paulo, 2006.
MAIA, Elza Lima e Silva. Comportamento bibliomtrico da lngua portuguesa,
como veculo de representao da informao. 1973. 57 p. Dissertao (Mestrado
em Cincia da Informao)- Universidade Federal do Rio de Janeiro, Instituto
Brasileiro de Bibliografia e Documentao, Rio de Janeiro,1973.
MAMFRIM, Flvia Pereira Braga. Indexao automtica derivativa em textos
integrais em lngua portuguesa. 1990. 260 p. Dissertao (Mestrado em Cincia da
Informao)- Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Informao em Cincia e Tecnologia, Rio de Janeiro, 1990.
MARANHO, Ana Maria Neves. Identidades semnticas analisadas
bibliometricamente em textos bilnges: estudo exploratrio. 1996. 159 p.
Dissertao (Mestrado em Cincia da Informao)-Universidade Federal do Rio de
Janeiro, Instituto Brasileiro de Informao em Cincia e Tecnologia, Rio de Janeiro,
1996.
MARTINS, Helio Braga. Produo cientfica dos professores do Centro de
Geocincias da UFPA: um estudo bibliomtrico. 2000. 104 p. Dissertao (Mestrado
em Cincia da Informao)-Universidade Federal do Rio de Janeiro, Instituto
Brasileiro de Informao em Cincia e Tecnologia, Rio de Janeiro, 2000.
MELLO, Paula Maria Abrantes Cotta de. A citaao bibliogrfica no contexto da
comunicaao cientfica: um estudo exploratrio na rea da Botnica. 1990. 105 p.
Dissertao (Mestrado em Cincia da Informao)-Universidade Federal do Rio de
Janeiro, Instituto Brasileiro de Informao em Cincia e Tecnologia, Rio de Janeiro,
1990.
MUGNAINI, Rogrio. Caminhos para adequao da avaliao da produo
cientfica brasileira: impacto nacional versus internacional. 2006. 254 p. Tese
(Doutorado em Cultura e Informao)-Universidade de So Paulo, So Paulo, 2006.
MUGNAINI, Rogrio. Indicadores bibliomtricos da base de dados Pascal como
fonte de informao da produo cientfica e tecnolgica do Brasil. 2003. 133 p.
Dissertao (Mestrado em Cincia da Informao)-Pontifcia Universidade Catlica de
Campinas, Campinas, 2003.
OBERHOFER, Cecilia Malizia Alves. Uso da informao cientfica: obsolescncia
do objeto vs. obsolescncia do contedo. 1989. 164 p. Dissertao (Mestrado em
Cincias da Comunicao)-Universidade de So Paulo, So Paulo, 1989.
OLIVEIRA, Margarida Pinto. Estudo bibliomtrico da literatura brasileira de
esquistossomose. 1975. 78 p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Bibliografia e
Documentao, Rio de Janeiro,1975.
OLIVEIRA, Silas Marques de. Comportamento da literatura brasileira de teologia
adventista: anlise bibliomtrica. 1981. 147 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal de Minas Gerais, Belo Horizonte, 1981.
PINTO, Aloisio de Arruda. International savanna literature: a comparison of
sources relevant to Brazilian researchers. 1981. 98 p. Dissertao (Mestrado em
Cincia da Informao)- University of Denver, Denver, 1981.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 73
PITTELLA, Mnica Cardoso. Anlise de citao dos peridicos brasileiros de
Biblioteconomia, 1972-1982. 1990. 167 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal de Minas Gerais, Belo Horizonte, 1990.
QUEMEL, Maria Anglica Rodrigues. Cruz e Sousa: do estudo bibliomtrico ao
estudo bibliogrfico. 1983. Dissertao (Mestrado em Cincias da Comunicao)-
Universidade de So Paulo, So Paulo, 1983.
RAMOS, Virginia Maria Vasconcellos Prisco Paraso. Indexao automtica
derivativa de textos em lngua, portuguesa baseada em seus ttulos e resumos:
estudo exploratrio. 1992. 361 p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1992.
RODRIGUEZ GARCIA, Marina Elvira del Socorro. Qumica e qumicos: estrutura
da literatura e padres de comunicao atravs da anlise de citao da Revista
Colombiana de Qumica. 1988. 176 p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Informao em Cincia e Tecnologia, Rio de Janeiro, 1988.
ROLIM, Ivanilda Fernandes Costa. A criao intelectual e artstica no Brasil: uma
anlise da bibliografia nacional corrente, durante o perodo de 1951-1962. 1976. 126
p. Dissertao (Mestrado em Cincia da Informao)-Universidade Federal do Rio de
Janeiro, Instituto Brasileiro de Bibliografia e Documentao, Rio de Janeiro,1976.
RUSSO, Mariza. O padro de comunicao na rea de administrao: o caso
brasileiro e o caso americano. 1991. 181. p. Dissertao (Mestrado em Cincia da
Informao)-Universidade Federal do Rio de Janeiro, Instituto Brasileiro de
Informao em Cincia e Tecnologia, Rio de Janeiro, 1991.
SAES, Sueli Gonsalez. Estudo bibliomtrico das publicaes em economia da
sade, no Brasil, 1989-1998. 2000 p. 115 p. Dissertao (Mestrado em Servios de
Sade Pblica)- Universidade de So Paulo, So Paulo, 2000.
SANTOS, Maria Jos Veloso da Costa. A poltica brasileira de informao em
geocincia e tecnologia mineral: uma contribuio a sua implementao via anlise
bibliomtrica da literatura. 1992. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1992.
SILVA, Jussara Ferreira da. Anlise da disseminao e da divulgao cientfica na
sade coletiva do Instituto de Medicina Social da Universidade do Estado do Rio
de Janeiro, tendo como instrumento a Lei de Zipf. 1995. Dissertao (Mestrado em
Cincia da Informao)- Universidade Federal do Rio de Janeiro, Instituto Brasileiro
de Informao em Cincia e Tecnologia, Rio de Janeiro, 1995.
SILVA, Maurila Bentes de Mello e. Estudo bibliomtrico da produo cientfica do
Ncleo de Altos Estudos Amaznicos (NAE) da Universidade Federal do Par.
2000. 159 p. Dissertao (Mestrado em Cincia da Informao)-Universidade Federal
do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia e Tecnologia, Rio de
Janeiro, 2000.
SOUZA, Alfredo A. C. Mendona de. Arqueologia brasileira (1975-1985): anlise
bibliomtrica da literatura. 1988. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1988.

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 74
SOUZA, Luiz Antonio de. Padres de comunicao em sade coletiva: anlise de
citaes das dissertaes apresentadas do IMS-UERJ-1977-1992. 1995. Dissertao
(Mestrado em Cincia da Informao)- Universidade Federal do Rio de Janeiro,
Instituto Brasileiro de Informao em Cincia e Tecnologia, Rio de Janeiro, 1995.
VALOIS, Eliana Candeira. Anlise da produo tcnico-cientfica dos
pesquisadores do Programa Nacional de Pesquisa de Caprinos, no perodo de
1977 a 1988. 1990. 214. p. Dissertao (Mestrado em Cincia da Informao)-
Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informao em Cincia
e Tecnologia, Rio de Janeiro, 1990.
ZIMBA, Horcio Francisco. A pesquisa sobre medicina veterinria em
Moambique: anlise do desenvolvimento da produo cientfica 1947-2002. 2003.
114 p. Dissertao (Mestrado em Cincia da Informao)-Universidade de Braslia,
Braslia, 2003.

ABSTRACT
Standards of information organization are imperative in bibliometric research, so that
documents with similar characteristics may be efficiently collected from primary and
secondary sources. Standards are also needed in order to improve the reliability of the
data analysed. In order to identify the difficulties encountered by researchers within
the field of information organization, we examined 59 reports of thesis and
dissertations, as well as conducted a series of interviews with area experts. In general,
the main difficulties were found in the standardization of journal titles and author
names (physical description), and in the diversity of subject representation (subject
description). The need to literature control by access to regularly updated databases
was emphasized by most experts as one of the main difficulties for the conduction of
research in the field of bibliometrics in Brazil

KEYWORDS: Bibliometry. Information Organization

Originais recebidos em: 08/02/2008


Texto aprovado em: 13/03/2008

Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1 sem. 2008 75