Você está na página 1de 119

VERA LUCIA DOYLE DODEBEI

TESAURO
linguagem de representao da memria documentria

RIO DE JANEIRO
2001

Ao Mestre
MANOEL ADOLPHO WANDERLEY

Aos meus alunos da


Universidade do Rio de Janeiro -UNIRIO

SUMRIO

Em defesa das linguagens documentrias, P.

Representao e meta-representao, p.

Lngua e linguagem, p.

Tesauro parte 1 : anlise do domnio. p.

Tesauro parte 2 : relaes conceituais, p.

A propsito, p.

Referncias bibliogrficas, p.

1 Em defesa das linguagens documentrias

At a primeira metade do sculo XX, a prtica biblioteconmica demonstrava que a


organizao de documentos podia ser conduzida por instrumentos previamente construdos,
de mbito geral e com total independncia do uso efetivo que se pudesse fazer dos acervos.
Nesse sentido, o papel do bibliotecrio era, fundamentalmente, o de guardio dos bens documentais, embora j existisse a conscincia da sua funo de intermediao entre a necessidade de informao do usurio e a efetiva disponibilizao desta pela biblioteca.
A formao profissional do bibliotecrio era, assim, centrada em dois eixos principais. O primeiro, indicava a forte presena dos contedos de cultura geral, tais como o domnio de idiomas, a Filosofia e a Histria, na tentativa de assegurar que a intermediao se
procedesse com bom ndice de sucesso. O conhecimento profundo do acervo fazia do bibliotecrio o prprio instrumento de interao entre documento e usurio. O segundo eixo,
das tcnicas de organizao do acervo, era representado por um conjunto de normas, tais
como os cdigos de catalogao e as tabelas de classificao. Nesse caso, o papel do bibliotecrio se restringia ao de adaptar o contedo dos documentos ao instrumento codificador1.
Por volta de 1940, a exploso documental gerada pelo processo de especializao
do saber obriga os bibliotecrios a questionar no s o seu objeto de estudo, como os procedimentos utilizados na organizao dos acervos documentais2. O livro, at ento considerado o objeto de estudo inquestionvel da Biblioteconomia, passa a disputar espao com
outros gneros e suportes documentais, principalmente artigos de peridicos e relatrios de
pesquisa, sendo esses ltimos os que mais enfaticamente representaram a era da especializao do conhecimento.
Essa primeira mudana de paradigma no mbito da organizao e disponibilizao
do conhecimento produz discusses sobre as tcnicas de anlise documentria3 vigentes. Se
no passado, a leitura que se podia fazer dos documentos (representao genrica) no atendia mais s necessidades de especificidade dos temas produzidos pela comunidade cientfica, era necessrio o desenvolvimento de instrumentos que, ainda no plano da representao
de contedo, dessem conta do saber ultra-especializado. Como conseqncia, os especialistas em anlise documentria no encontram nas linguagens documentrias tradicionais (or-

ganizao do conhecimento geral) as condies necessrias para representar os contedos


informativos dos textos tcnico-cientficos produzidos e que deveriam constituir uma nova memria documentria.
nesta ocasio que so estimulados estudos e experincias sobre a construo de
linguagens artificiais que pudessem representar o universo conceitual de campos especficos do conhecimento. Essas linguagens, genericamente denominadas /linguagens documentrias/, passam a ser objeto de estudo, no s dos bibliotecrios, como de lingistas e outros profissionais preocupados com a representao de contedos informativos para fins de
recuperao e disseminao da informao, traduo automtica, anlise de contedo4,
anlises literrias, semiticas e lingsticas, realizadas manualmente ou de forma automtica. No entanto, rapidamente verifica-se que, a despeito de sua eficaz funo de recuperao da informao, a construo de linguagens documentrias para campos especficos do
conhecimento vem a representar tarefa interdisciplinar extremamente onerosa.
Aliados ao problema da interdisciplinaridade na produo de conhecimentos, da
dificuldade de indexar documentos utilizando linguagens universais e do elevado custo de
construo de linguagens especializadas, dois fatores - o aumento de documentos em suporte eletrnico e a informatizao do armazenamento dos registros desse mesmo conhecimento - conduziram as atenes dos especialistas para a anttese da representao sinttica, ou seja, o acesso direto ao documento primrio, em linguagem natural. No entanto, a
recuperao da informao em linguagem natural deve considerar a digitalizao de textos
completos e o uso de operadores lingsticos, sendo que esses ltimos so ainda objeto de
estudos experimentais5.
Ao considerarmos que o acesso informao armazenada em bases de dados digitalizados possa ser feito mediante a busca do texto completo, temos que forosamente refletir sobre algumas questes. Em primeiro lugar, o problema diz respeito ao tempo despendido na localizao da informao desejada. Tomando como exemplo uma biblioteca
tradicional contendo cerca de cem mil volumes, dispostos fisicamente por data de registro
no acervo, e sem qualquer instrumento de busca representativo do contedo, como ndices
ou catlogos, quanto tempo um usurio levaria para localizar as informaes necessrias?
Seria necessrio percorrer milhes de pginas para selecionar aquelas que satisfizessem a
sua necessidade de informao. Transportando o exemplo para uma biblioteca virtual, onde
esses mesmos textos sofreram um processo de infografia6, a questo do acesso ainda per-

manece no mbito da velocidade. Mesmo tendo como atenuantes do tempo despendido na


busca, a possibilidade de utilizar todo o lxico disponibilizado, ou seja, selecionar palavras-chaves em lngua natural, e, ainda, considerar que o tempo de comparao da mquina
muito superior ao visual humano, o resultado da busca fica comprometido pelas caractersticas prprias das lnguas naturais. Essas caractersticas das lnguas naturais, principalmente a polissemia, a homonmia, a sinonmia, alm da funo sinttica, interferem no
resultado significativo da busca, quer dizer, no garantem que a informao recuperada
possa ser a mais prxima possvel da informao desejada, dentro do mesmo campo semntico.
Um outro aspecto a ser considerado em defesa das linguagens documentrias a sua funo referencial. Como disse Samuel Johnson7, o conhecimento de
dois tipos: conhecemos um assunto por ns mesmos ou sabemos onde podemos encontrar a
informao sobre ele. No ltimo caso, o conhecimento torna-se pblico, formando estoques
de informao que precisam estar organizados para a socializao do seu uso8. Essa organizao do conhecimento pblico, principalmente no que diz respeito disponibilizao
deste pelas grandes redes de comunicao, implica em processos de normalizao na
apresentao da informao. A normalizao temtica seria, portanto, mais uma funo das
linguagens documentrias, definida por Wanderley9 como: a capacidade de obter, por
ocasio das respostas aos pedidos de informao, um mximo de indicaes relevantes ou
pertinentes e, para tal, de coincidncia entre as descries de autoria do indexador e as do
usurio, numa palavra, a normalizao.
Quanto normalizao descritiva, a grande contribuio para o compartilhamento
da informao foi dada por Paul Otlet. Rayward10, em artigo publicado no Journal of American Society of Information Science (JASIS), afirma que Paul Otlet uma importante e
negligenciada parte da histria da Cincia da Informao, uma vez que, junto com os colegas belgas, criou um complexo de organizaes em tudo semelhantes aos atuais sistemas
de hipertexto/hipermdia. No seu Trait de Documentation (1934), um dos primeiros tratados sistemticos do que hoje pode-se chamar de Cincia da Informao, Otlet especula
sobre telecomunicaes, converso texto-voz e sobre o que era necessrio para as estaes de trabalho computadorizadas, embora, claro, ele no tivesse usado essa teminologia.

Uma das grandes contribuies de Otlet, alm de ampliar o conceito tradicional de


documento, foi a de estender essa ampliao ao conceito de bibliografia, hoje nomeada de
base de dados, quando em meio digital ou at mesmo webgrafia, se disponibilizada virtualmente nas grandes redes (web). O desenvolvimento de um sistema que permitisse uma
racional organizao do conhecimento foi a meta de Otlet, que iniciava o convvio com a
exploso documental, ou, como chamou posteriormente Bradford, o Caos Documentrio11.
O sistema idealizado partia de um princpio que Otlet chamou de princpio monogrfico.
A idia era a de registrar partes do contedo de uma obra isoladamente em fichas, o que
permitiria uma organizao temtica hierarquizada. Essa tcnica pode ser comparada hoje
construo dos hipertextos, onde o usurio no percorre o texto de forma linear, mas
navega, a partir da construo de estratgias de busca singulares das cadeias de informao, pelas partes, ou ns de classes de informao. Assim, o usurio pode se movimentar
da referncia bibliogrfica ao texto completo, imagem, ao som, a outras referncias, a
outras imagens; parafraseando Umberto Eco12, numa navegao in progress.
Alm disso, no que diz respeito representao da informao para a recuperao
posterior por mltiplos usurios, ou forma de descrever a informao de modo a manter
uma sntese do pensamento do autor, Otlet sugeria que o princpio monogrfico deveria
ser aplicado aos resumos (abstracts) que acompanhavam as referncias bibliogrficas, e
que serviam como um refinamento pesquisa de fontes. A idia era destacar o que o livro
amalgamava, para reduzir tudo que fosse complexo a unidades passveis de serem descritas em folhas ou fichas separadas. O sentido, portanto, era o de recuperar apenas o que fosse de novo no conhecimento j disseminado. Assim, Otlet sugeria a desconstruo do
texto para sua reconstruo, a partir das seguintes constataes:
a) os livros apresentam apenas parte do conhecimento cientfico (completude)
b) apresentam conhecimentos falsos e verdadeiros (erro)
c) apresentam a mesma coisa mais de uma vez (repetio)
d) dividem a mesma informao por vrios setores ou captulos (disperso)
e) no apresentam a informao por graus de importncia (valor)

Sem dvida, mesmo quando se busca a imparcialidade, s se pode desconstruir e


refazer um texto em funo de determinaes arbitrrias, uma vez que toda e qualquer classificao s opera no sentido da arbitrariedade. O sonho de Otlet em relao construo

do Livro Universal, organizado por reas particulares do conhecimento, nunca foi concretizado e embora o objetivo de Otlet no tenha sido alcanado nesse sentido, as suas idias foram extremamente teis no que se refere anlise e sntese dos contedos informativos. O princpio da indexao da informao e da construo de resumos para facilitar a
recuperao da informao contou com as regras de anlise documentria criadas para a
organizao do Biblion ou Livro Universal, ou seja, a literatura deve ser analisada, isolando-se quatro categorias gerais: fatos - interpretao dos fatos - estatsticas - fontes.
Alm disso, outra contribuio importante ao acesso s

fontes bibliogrfi-

cas foi o desenvolvimento das normas tcnicas para a descrio da forma e do contedo
bibliogrfico. Inegavelmente, Otlet e sua equipe nos legaram as bases do que chamamos
hoje de redes de informao, que funcionam interligando as representaes do conhecimento em todos os campos do saber, para todos os tipos de objetos e relatos, ainda necessitando
urgentemente de normalizao. Essa normalizao diz respeito aos formatos de apresentao da informao, aos protocolos de acesso s bases de dados, enfim, a uma nova linguagem que de documentria passa a ciberntica e que, em alguns casos, se aproxima da linguagem pictrica, dos hierglifos.
Se considerarmos as possibilidades de localizao da informao desejada na Web,
tal como sintetiza SADANI13, vemos que as melhores chances de obt-la so aquelas que
utilizam operadores matemticos na combinao e a restrio de conceitos representativos
da pergunta para a qual se deseja uma resposta. No uma resposta objetiva, mas a indicao
de fontes de informao moduladas isto , de uma cadeia de complexidade que parte dos
sites at se chegar ao texto primrio. Vale lembrar que, neste momento, temos a possibilidade de encontrar ou no o texto primrio digitalizado.
Caso j pudssemos utilizar os operadores lingsticos ainda em estudo, tais como
os sintagmas nominais discutidos por Brito14, a pergunta feita em lingua natural no precisaria ser decomposta em conceitos organizados por operadores matemticos. Na prtica, no
entanto, ao pesquisarmos um assunto na Web, chegamos a duas concluses: a primeira a
de que os engines (programas de busca de informaes) so especialmente eficientes na
localizao de sites genricos sobre o domnio do campo semntico de interesse; a segunda concluso a de que um bom resultado refinado para um assunto especfico s oferecido pelas bases de dados que operam com operadores matemticos, isto , que utilizam a
interface da linguagem documentrias entre documentos e usurios. Seria prematuro, con-

tudo, afirmar que ambos os sistemas se complementam e continuaro a coexistir por longo
tempo.
Enquanto aguardamos os resultados dos estudos nos campos da Lingstica e das
Cincias Cognitivas, a utilizao das linguagens documentrias nos parece, ainda, indispensvel para a organizao e o acesso ao conhecimento pblico.

NOTAS E CITAES
1

O primeiro Curso de Biblioteconomia no Brasil foi criado pelo Decreto n. 8.835, de 11/07/1911. Iniciou em
abril de 1915 na Biblioteca Nacional do Rio de Janeiro, tendo como diretor Manuel Ccero Peregrino Silva.
O programa deste curso pioneiro se inspirava no modelo francs (cole de Chartes), dando nfase ao aspecto cultural e informativo. Em 1929, o "Mackenzie College", hoje Universidade Mackenzie, de So Paulo,
criou um Curso de Biblioteconomia, inspirado no modelo norte-americano, que enfatizava os aspectos tcnicos da profisso. Cf. http://www.ced.ufsc.br/bibliote/encontro/bibli7/eb7art2.html

Sobre a impacto desta questo na Biblioteconomia Cf. DODEBEI, V.L., MENDONA DE SOUZA, Alfredo. Cincia da Informao: formao e interdisciplinaridade. Rio de Janeiro: IBICT/CNPQ/ ECO/USP,
1992.

Coyaud define (traduo livre) Anlise Documentria como toda operao efetuada sobre o documento
bruto, a fim de torn-lo utilizvel (i.e. recupervel) para a pesquisa documentria. Cf. COYAUD, Maurice. Analyse et recherche documentaire. In: __________. Linguistic et documentation: les articulations logiques du discours. Paris: Larousse, 1972. p130

O conceito de anlise de contedo apresentado pela autora diz respeito ao conjunto de tcnicas destinadas
a ressaltar do contedo de diversas categorias de documentos escritos, certos elementos singulares de onde
se inferem caractersticas psico-sociolgicas do objeto analisado. Cf. CUNHA, Isabel M. R. Ferin. Anlise
documentria : parmetros tericos. In: ANLISE documentria: a anlise da sntese. So Paulo: USP,
1986. p. 42.

Estudos fundamentados na Inteligncia Artificial, na Sintaxe e em menor escala na Semntica. Cf. COULON, Daniel. Informtica e linguagem natural: uma viso geral dos mtodos de interpretao de textos
escritos. Braslia, IBICT; Rio de Janeiro, SENAI, 1992.

O conceito de infografia para o autor o de digitalizao computadorizada. VIRILIO, Paul. A mquina de


viso. Rio de Janeiro: Jos Olympio, 1994. p. 9

VICKERY, B. C. Knowledge representation: a brief review. Journal of Documentation, 42, n. 3, p. 145159, Sept. 1982.
A esse respeito consultar um novo campo de especializao denominado Arquitetura da Informao. Em
Matthew Cutler: O que exatamente arquitetura de informao? Para os webmasters, a organizao consciente de grandes volumes de informao, de forma que os usurios possam navegar de forma fcil e eficiente em seus site - funo semelhante ao design... A criao de uma estrutura de informao slida deveria
fazer parte da estratgia de Internet desde o incio. O fio condutor deveria ser a criao da noo de hierarquia, um conceito de localizao de cada item em termos de importncia e sua relao com o todo. O objeti-

10

vo oferecer informao suficiente para os visitantes decidirem facilmente onde ir, mas no a ponto de ficarem sobrecarregados de dados e confusos, ou de serem levados para onde no querem ir. Cf.
http://www.uol.com.br/webworld/tecnologia/arquitet2.htm
9

WANDERLEY, Manoel Adolfo. Linguagem documentria: acesso informao. Rio de Janeiro, Ci. Inf.,
v. 2, n. 2 , p. 175-217, 1973. p. 180

10

RAYWARD, W. Boyd. Visions of Xanadu: Paul Otlet (1868-1944) and hypertext. Journal of the American Society for Information Science, v. 45, n. 4, p. 235-250, 1994.

11

BRADFORD, S. C. The documentary chaos. In: ____. Documentation. London: Crosby Lockwood & Son,
1953. cap. IX.

12

ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo: Perspectiva, 1991. p.
90, 91.

13

SADANI, Lalthoum; BERTRAND-GASTALDY, Suzanne. La reprsentation dans Internet des comnaissances dn domaine. Documentation et bibliothques, jan./mars, p. 27 42, 2000.

14

BRITO, Marclio de. Sistemas de informao em linguagem natural: em busca de uma indexao automtica. Ci. Inf., Braslia, v. 21, n. 3, p. 223-232, set./dez., 1992.

2 Representao e meta-representao

Neste captulo pretendemos discutir os modelos de organizao do conhecimento, a


partir das interfaces dos conceitos de conhecimento, representao, informao e memria.
Essa discusso tem por objetivo delinear o funcionamento das memrias documentrias no
universo das representaes sociais e, particularmente, fundamentar o papel das linguagens documentrias como metalnguagens na produo de conhecimentos.
No mbito da Cincia da Informao, o conhecimento discutido no seu aspecto
representacional, tal como em Vickery1, que o distingue em dois tipos: conhecimento pessoal e conhecimento pblico. Neste enfoque, o significado mais apropriado de pblico leva
em considerao a idia de conhecimento pessoal publicado, disponvel para uso e, portanto, intencionalmente acumulado. O conjunto das representaes do conhecimento vai, assim, se transformar em estoques de informao que de algum modo precisam estar ordenados para melhor serem utilizados. nesse momento que se formam as memrias documentrias, consideradas construes simblicas do conhecimento.
As memrias documentrias, como constructos do conhecimento gerado pela sociedade, renem cadeias de representaes presentes na dinmica social, desde a produo do
conhecimento at a sua assimilao e reproduo. Essas representaes so objeto de estudos de vrios campos do saber que as analisam a partir de fundamentos tericos diversificados, as quais podem ser estruturadas em modelos, por exemplo, matemticos, psicocognitivos, sistmicos2. Os modelos derivam da necessidade humana de entender a realidade, aparentemente complexa e so, portanto, representaes simplificadas e inteligveis do
mundo, permitindo vislumbrar as caractersticas essenciais de um domnio ou campo de
estudo. Esta simplificao exige criatividade, tanto sensorial quanto intelectual, o que implica em admitir-se que, na construo de modelos, algumas caractersticas da realidade,
que no se referem diretamente aos objetos buscados, so desprezadas ou abandonadas, em
funo da maior inteligibilidade ou facilidade de compreenso. De fato, no teria sentido
substituir a realidade (aparentemente complexa) por modelos ainda mais complexos.
Como observam Haggett e Chorley3, os modelos so aproximaes altamente subjetivas, no sentido de no inclurem todas as observaes e mensuraes associadas, mas,
como tais, so valiosos por ocultarem detalhes secundrios e permitir o aparecimento dos

12

aspectos fundamentais da realidade. Desta forma, os modelos so, sempre, aproximaes


seletivas que, eliminando aspectos acidentais, permitem o aparecimento dos aspectos fundamentais, relevantes ou interessantes, do mundo real, sob alguma forma generalizada.
Alm da simplificao/simplicidade, os modelos tm como caracterstica, o fato de
serem estruturados, isto , os aspectos selecionados da realidade so explorados em termos de suas relaes com outros modelos e aspectos dessa realidade. Uma outra caracterstica, tambm muito importante, dos modelos, a sua natureza sugestiva (a viso global de
um modelo) que permite ao conhecimento um avano mais significativo do que aquele que
se poderia obter pela anlise de apenas uma das suas partes. Na medida, no entanto, em que
um modelo apenas uma aproximao realidade, ele uma analogia, que permite reformular o conhecimento sobre alguns aspectos do mundo real.
Os modelos tm por essncia, o fato de serem simples, acurados, estruturados, sugestivos, representando analogias ao mundo real, que podem ser reaplicados a novos conjuntos de observaes e nesse sentido, so necessrios por constiturem uma ponte entre os
nveis da observao e do terico. Os modelos so, portanto, construces da mente humana, que tm funo psicolgica, aquisitiva, organizacional, normativa, sistemtica, construtiva e de parentesco, o que permite a comunicao das idias cientficas, na medida em que
muitos modelos se aplicam a mais de um conjunto de observaes, de mais de uma rea do
conhecimento. Como observa Clarke4, a existncia de um modelo pressupe a existncia
de uma teoria subjacente, uma vez que um modelo apenas uma expresso simplificada,
formal e esquemtica de uma teoria, implcita ou explcita, desenvolvida para uma situao
particular. Um estudo cuidadoso de grupos de modelos, aparentemente expressando um
delineamento comum de teorias para diferentes situaes pode, assim, ajudar a expor e a
articular teorias latentes, de um modo poderoso e concreto. ainda Clarke quem afirma
que as hipteses so geradas a partir da expresso modelada de uma teoria, surgindo a explanao das hipteses testadas, as quais so testadas usando-se anlises relevantes em categorias significativas de dados.
Os modelos so tipificados de vrias formas, em funo das prprias ideologias
inerentes de cada autor ou rea de conhecimento. Assim, para Haggett e Chorley, os modelos podem ser descritivos e normativos - o primeiro trata de certa descrio estilstica da
realidade, e o segundo, do que se pode esperar que acorra sob certas condies estabelecidas. J para Clarke, podem ser operacionais e de controle, o que, em essncia, no altera a

13

proposio de Haggett e Chorley. Tambm em Cincia da Informao tais classificaes


so variadas. Burt e Kinnucan5 agrupam os modelos em cognitivos (ou mentais), conceituais e semticos, mas, de um modo geral, este padro classificatrio no modifica os anteriores.
Em termos pragmticos, no entanto, considerando-se forma e expresso, os modelos podem ser agrupados ou classificados em uma srie interminvel de tipos. Sem se pretender a exaustividade, pode-se reconhecer, ainda de acordo com Clarke, os seguintes tipos
de modelos: fsicos/concretos, ou mentais/lgicos. Dentre os primeiros destacam-se os modelos em escala real ou reduzida, dinmicos ou estticos. Dentre os segundos deve-se mencionar os modelos lgico-conceituais, os matemticos e estatsticos, os grficos, os sistmicos, os semnticos e as simulaes por computador, para mencionar apenas os mais importantes.
Um modelo que se revela correto ou til numa infinidade de aplicaes, em circunstncias distintas e sobre dados diferentes, que apresenta, ao mesmo tempo, um amplo poder
explanatrio, pode ser definido como um paradigma. Como observam Haggett e Chorley,
os paradigmas podem ser considerados como modelos estveis da atividade cientfica, sendo, em certo sentido, modelos em escala ampla, mas diferindo dos modelos no sentido de
que raramente so formulados to especialmente, tratando-se de modelos de busca do
mundo real, e no de modelos limitados a alguma rea especfica do conhecimento humano. Neste sentido, os paradigmas podem ser entendidos como super-modelos, dentro dos
quais os modelos so colocados em escala mais reduzida.
Um paradigma deve ser analisado, e entendido, em funo da sua escala, domnio e
poder explanatrio. Nas cincias sociais, costumam ser agrupados de acordo com seus nexos essenciais. Desta forma, os vrios autores reconhecem paradigmas ecolgicos, locacionais/geogrficos, morfolgicos, antropolgicos/etnolgicos, evolucionistas e sistmicos,
dentre outros.
Em Cincia da Informao, aparentemente, o paradigma sistmico, que deriva da
teoria geral de sistemas de Von Bertalanffy, aquele que mais empregado. Opondo-se
viso extremamente mecanicista do mundo, que predominava na cincia, Von Bertalanffy
apud6 desenvolveu uma teoria a que designou Teoria Geral dos Sistemas, propondo-se a
visualizar o mundo, e o universo, em termos de um grande conjunto interconectado, dentro
do qual poder-se-ia separar subconjuntos (ou subsistemas) para anlise. De acordo com

14

Marcondes e Sayo7, inicialmente Bertalanffy abordou o problema de sistemas dentro de


uma perspectiva quase utilitria, dando a impresso de que a viso sistmica se provou
necessria a partir do instante em que se tornou essencial lidar com complexidade.
A tecnologia nos conduziu a pensar no em termos de mquinas simples, mas em
termos de sistemas... Uma mquina a vapor, um automvel, um aparelho de rdio, estavam dentro da rea de competncia de um engenheiro, mas quando comeamos a lidar
com msseis, veculos espacias, isto , problemas que envolvem tecnologias heterogneas,
como por exemplo, relacionamento homem-mquina, mecnica, eletrnica, problemas
financeiros, econmicos, sociais e polticos, torna-se necessria uma outra forma de abordagem.
Para Bertalanffy isto significa uma mudana nas categorias bsicas de pensamento,
da qual a complexidade da tecnologia moderna unicamente uma manifestao, possivelmente no a mais importante. De um jeito ou de outro, ns somos forados a lidar com
complexidade, com o todo ou sistemas. A implicao disso uma reorientao bsica
do pensamento cientfico. O conceito de sistema no novo, remontando filosofia da
Grcia clssica. No entanto, foi com a 2 Guerra Mundial que tal termo passou a ser usado
como sinnimo de metodologia, ou seja, o arranjo lgico de processos ou meios para atingir fins. Na atualidade, um sistema visto como um conjunto de elementos, propriedades e
relaes, podendo ser definido como um conjunto de elementos em interao, que realizam
determinadas funes para determinados propsitos.
Sistemas suportam processos, e mesmo que se faa distino entre sistemas naturais
e aqueles feitos pelo homem, na verdade, estes ltimos sempre apresentam algo dos primeiros. Um processo, por sua vez, uma seqncia de eventos, sob controle, para a obteno
de resultados especficos, sendo um fenmeno dependente do tempo. Fundamentalmente,
envolve troca, transformao, transmisso de energia, matria, informao. A distino
fundamental entre sistema e processo que este ltimo o aspecto dinmico do primeiro.
Todo sistema inclui um processo, e, como sistemas no existem no vcuo, interagem com
seu meio ambiente, podendo ser difcil estabelecer-se os limites entre ambos. So os propsitos ou objetivos que, alm de estabelecerem as razes de existncia do sistema, descrevem-lhe os limites com o meio ambiente, sendo bvio que este tambm est sujeito a mudanas. A adaptao de um sistema ao meio ambiente, em geral, crucial, e depende integralmente da retro-alimentao.
Ainda de acordo com Marcondes e Sayo, o fato de a cincia moderna ser caracterizada por um alto grau de especializao, um alto grau de compartimentao, de fragmenta-

15

o dos papis e responsabilidades dos cientistas, engendra, entre outras coisas, uma necessidade vital de estruturas tcnicas e de tcnicas complexas para cada disciplina. Dessa forma, os fsicos, os bilogos, os psiclogos e os cientistas sociais esto encapsulados em
seus universos particulares. difcil estabelecer um dilogo entre um casulo e outro. Essa
fragmentao se contrape a um outro aspecto interessante, que possivelmente foi o fato
determinante no processo de concepo da teoria geral dos sistemas por Bertalanffy. Fazendo um levantamento na evoluo da cincia moderna, nos deparamos com um fenmeno surpreendente. De forma independente, problemas e concepes similares foram trabalhados e desenvolvidos em reas completamente diferentes. Dessa forma, existem modelos, princpios e leis que se aplicam a sistemas generalizados ou suas subclasses, no importando sua rea, a natureza de seus elementos componentes, nem a relao ou foras
entre eles. Parece ento legtimo aspirar a uma teoria de princpios universais passvel de
ser aplicada aos sistemas em geral. nesse sentido que Bertalanffy postula uma nova disciplina nomeada Teoria Geral dos Sistemas, cujo objetivo e formulao derivaro de princpios vlidos para sistemas em geral.
A conseqncia de se aceitar a existncia de propriedades gerais dos sistemas o
aparecimento de similaridades estruturais, ou seja, isomorfismo entre diferentes reas. Existe uma correspondncia nos princpios que governam o comportamento de entidades
intrinsecamente distintas. Um exemplo simples a lei do crescimento exponencial, que se
aplica ao crescimento de bactrias, animais ou humanos, ao mesmo tempo que ao crescimento da pesquisa cientfica, medido pelo nmero de publicaes. A partir destas proposies, Bertalanffy conclui que esta correspondncia proporcionada pelo fato de que as
entidades envolvidas podem ser consideradas como sistemas, isto , um complexo de elementos em interao. Isto faz com que estes fenmenos, embora tendo origens distintas,
estejam subjugados a um princpio geral comum. De fato, so muitos os exemplos de
princpios idnticos que so descobertos vrias vezes, pois os pesquisadores de um campo
desconhecem que a estrutura terica do seu trabalho ou pesquisa j est desenvolvida em
outro campo. Bertalanffy bastante enftico quando afirma que a teoria geral de sistemas
uma ferramenta til na transferncia de modelos de uma rea para outra.
Indo mais adiante, Bertalanffy afirma que existe um outro aspecto ainda mais importante na teoria de sistemas, o qual est relacionado com o conceito de complexidade
organizada (organized complexity). A fsica clssica, diz Bertalanffy, resolve com sucesso

16

os problemas concernentes complexidade desorganizada (unorganized complexity), atravs da segunda lei da termodinmica e das leis da probabilidade. Um exemplo disso o
comportamento de um gs. Em oposio, o problema fundamental atual o relacionamento complexidade organizada. Conceitos tais como organizao, holstica, diretividade
(directivness), teleologia e diferenciao, fogem ao escopo da fsica convencional. Entretanto, eles surgem a todo instante, na biologia, nas cincias comportamentais e sociais; e
so indispensveis quando se trata de organismos vivos e grupos sociais. Dessa forma, um
problema bsico proposto pela cincia moderna a teoria geral da organizao. A teoria
geral de sistemas est, em princpio, capacitada a delinear tais conceitos e, em alguns casos
especficos, estabelecer para eles anlises quantitativas.
Como Bertalanffy observou, com muita propriedade, a fsica convencional, modelo
para todas as cincias, apresenta limitaes graves, geralmente ignoradas pelos cientistas.
De fato, a fsica convencional lida somente com sistemas fechados, isto , sistemas isolados de seu meio ambiente. A segunda lei da termodinmica, por exemplo, s se aplica a
sistemas fechados. Os sistemas vivos, entretanto, so sistemas abertos. O mesmo se pode
afirmar quando se trata da teoria geral da comunicao, ou da informao, que incorporam
a noo de feedback e de rudo, portanto, sistemas abertos ao seu meio ambiente.
Neste sentido, como observaram Haggett e Chorley8, discutindo a Nova Geografia,
a informao suscetvel de tratamento em termos da teoria geral da informao. Nesse
contexto, as informaes concretas, factuais, s tm relevncia dentro de um corpo de referncia mais geral, e esta operao bsica de como definir um fato relevante s pode ser
realizada com base num arcabouo terico. H tambm nveis diferentes de organizao
das informaes relevantes.
Burt e Kinnucan9, analisando os modelos utilizados em Cincia da Informao para
o Annual Review of Information Science and Technology, dizem que a modelagem da informao refere-se identificao de componentes de modelos e seus elos, aos modos de
expresso, ao processo de construo do modelo, e ainda ao delineamento dos paradigmas
que afetam aos modelos que esto sendo construdos. Paradigmas refletem ao mesmo tempo os propsitos e as fronteiras de um modelo. Lyytinen10 considera dois paradigmas para a
modelagem. O primeiro refere-se ou um mapeamento da realidade, e essencialmente
uma tcnica descritiva para representar alguma coisa que claramente compreendida mas

17

que apresenta um comportamento ambguo. A necessidade de certeza nesse enfoque traz


uma limitao severa sua aplicabilidade.
O segundo paradigma de Lyytinen diz respeito ao desenvolvimento da linguagem
formal, e concentrado na representao da estrutura, contedo e uso da mensagem lingstica, j que ele pode tratar mais acuradamente com a natureza ambgua das configuraes da realidade.
Considerando-se a totalidade dos modelos de informao, tem-se idia de um continuum, no qual em um extremo est o ser humano, com suas idiossincrasias, que podem ser
entendidas como o seu conhecimento, e no outro extremo est o sistema de informao.
Entre essses extremos, encontram-se representaes que oscilam entre um ou outro plo, as
quais procuram explicar as diferenas entre eles. Modelos do primeiro plo so os modelos
cognitivos. Do segundo, so modelos de dados. Na faixa intermediria, aparecem os modelos conceituais (mentais, estruturais, semnticos, etc).
Em Cincia da Informao, o modelo mais amplamente utilizado foi, ao longo dos
anos, o de Shannon e Weaver11, que propuseram um modelo matemtico para explicar a
comunicao entre dois plos - o emissor e o receptor. Tal modelo, criticado, adaptado,
modificado, continua, ainda hoje, sendo amplamente utilizado, na medida em que, de modo
acurado, simples e preditivo, propicia uma boa idia de como se d a comunicao humana. , em essncia, um modelo matemtico, da mesma forma que as leis de Zipf, Bradford
e outras, amplamente utilizadas na Bibliometria, mas , tambm, um modelo sistmico, na
sua concepo geral, interligando o emissor ao receptor. Outros modelos valem-se de comparaes com o funcionamento de computadores, ou voltam-se para a representao do
conhecimento; h modelos envolvidos com inteligncia artificial, outros com tomada de
deciso. Em resumo, a Cincia da Informao absorve ou importa numerosos gneros de
modelos, que, de ngulos distintos, descrevem a sua realidade.
Para estudar as representaes documentrias destacamos o modelo de carter sistmico denominado Ciclo da informao, ou modelo de transferncia da informao, que
reduz a realidade da representao do conhecimento a seis etapas: produo, registro, aquisio, organizao, disseminao e assimilao. Essas etapas, amplamente apresentadas
como paradigmticas na Cincia da Informao, procuram simplificar os processos criados
pela produo, acumulao e uso de conhecimentos e os produtos gerados em suas vrias
formas representacionais, quer sejam fontes primrias, secundrias ou tercirias. Este o

18

modelo, at o momento, mais adequado para representar o processo de transferncia da


informao, o papel exercido por cada segmento social envolvido nesta transferncia e a
estrutura das instituies de preservao da memria social. Com alguns acrscimos proposta original de Lancaster12, a figura abaixo incorpora ao modelo o conceito de memria
documentria, dividindo o universo do conhecimento em dois subconjuntos: informao e
documento.

O primeiro universo, inscrito na parte superior do crculo, descreve a dimenso na


qual se do as trocas de informao, sendo essa realidade representada pelas etapas de produo, registro e assimilao. Esse subconjunto, que existe independentemente das etapas
inferiores, permite a anlise das aes decorrentes da gerao de novos conhecimentos disseminados de modo informal ou formalizados em registros materias (includos os eletrnicos), em redes eventuais ou organizadas sistematicamente. Seu campo de estudo, interdisciplinar, rene principalmente os fundamentos da psico-cognio, da comunicao, da sociologia de redes de informao, da economia e mercadologia.

19

 Produo de conhecimentos
Com a mudana do paradigma da cincia, que deixa de se pautar pela verticalidade (especializao), se conduzindo mais no sentido da horizontalidade das abordagens transdisciplinares,

as

informaes

produzidas

pela sociedade dificilmente podem

ser

antecipadamente organizadas por campos de interesse, em categorias fixas e imutveis.


Essas informaes so disponibilizadas por vrios segmentos da sociedade e no momento
da procura ou busca que as intersees de significado vo ocorrer. Isto , a priori, no se
pode afirmar que um texto de medicina possa somente interessar aos mdicos, assim como
uma foto da clonagem de ovelhas ser til apenas aos geneticistas. Aliados ao fator de
gnero, os atributos de qualidade (valor intrnseco), quantidade e convenincia da
informao produzida na atualidade devem ser considerados nesse universo dependente
dos produtos (informao), o qual se configura no que

chamamos de sociedade da

informao.
 Registro
Quanto diversificao dos suportes (registro), as informaes produzidas poderiam,
grosso modo, ser classificadas em textuais, visuais, sonoras ou tridimensionais e, ainda, por
uma combinao dessas categorias. Com efeito, os suportes vo se desenvolvendo em funo dos avanos tecnolgicos, configurando-se a no s a sua diversidade como tambm a
duplicidade. Hoje temos condies de acessar uma revista cientfica em papel, em CDROM e at em microformas (tcnica muito utilizada preservao e reproduo de documentos) ou em arquivo eletrnico, que parece ser o meio mais rpido e de baixo custo para
a disseminao da informao. Temos a possibilidade de analisar uma escultura, com todos
os detalhes tcnicos, em um museu virtual, como em um museu tradicional. Pode-se ter
acesso a um acontecimento em torno de um produto como por exemplo a mostra Monet, no
Museu de Belas Artes do Rio de Janeiro, que intercalou a pintura original, fotos da tela e
vdeos temticos das seqncias inspiradoras do pintor na confeco de um grupo de obras
sob um mesmo tema. Os suportes so os mais variados e, s vezes, passam a se constituir
em acessrios localizao da informao, ou seja, fazem parte do universo de restrio
uma estratgia de busca temtica, exceo das pesquisas que visam ao suporte como objeto de interesse, passando o tema a ser secundrio.
 Assimilao
A assimilao das informaes geradas pelo conhecimento e que proporcionaro a
produo de conhecimentos novos pode ser estudada, entre outros, sob o ngulo da veloci-

20

dade de sua obsolescncia. Como cita Virilio13, ao lado das dimenses espao e tempo,
existe hoje uma outra dimenso, que a luz. No a luz no sentido puro da claridade, da
viso, do entendimento, mas a luz em sua verso de trajeto. Para Virilio, o que nos move
hoje no sentido das representaes sociais no mais o espao e o tempo, mas o movimento, o trajeto, invertendo assim o conceito de velocidade da luz para a luz da velocidade. o
tempo real que importa. No mais uma questo de localizao absoluta, mas de percepo relativa, a qual Virilio nomeia de energia cinemtica da relatividade. Quanto mais veloz a apresentao dos produtos sociedade, mais rpido estes ficam obsoletos. O sentimento predominante da sociedade atual pode ser caracterizado pela ansiedade de informao. Ansiedade no sentido de saber que existe uma informao relevante e no conseguir
acess-la em tempo hbil, ou de produzir uma informao importante e no conseguir disponibiliz-la. Qual informao e quanto dela assimilada, uma questo complexa, mensurvel apenas indiretamente pela quantidade e qualidade dos novos conhecimentos produzidos.
O segundo subconjunto, representado pela parte inferior do crculo, ao contrrio do
primeiro, no tem existncia independente. As seis etapas completas so necessrias ao
ciclo de vida da informao, embora s o subconjunto representado pela seleo, representao e disseminao se configurar em memria documentria. O campo de estudo da
memria documentria e seus fundamentos mais especficos so a teoria da classificao, a
teoria do conceito e as teorias da comunicao, que so denominadas, no seu conjunto,
teorias da organizao do conhecimento e, especificamente, teoria da memria documentria.
Segundo Wanderley14, toda coleo documentria pode ser representada por um
quadro de entrada dupla chamado usualmente matriz documentria, em que se atribui cada
linha a um documento e cada coluna a uma das mltiplas caractersticas a partir das quais
sero ulteriormente procurados os documentos. Com base nessa representao simblica,
seria possvel edificar a teoria geral da organizao das memrias documentrias ou o
conjunto de elementos que permite o acesso aos documentos de uma coleo a partir de
suas caractersticas, e a sistemtica dos processos de seleo.

21

A representao da informao composta, assim, dos seguintes elementos:


Objetos (coisas que queremos representar)
Propriedades (caratersticas de tais coisas)

Para uma eficaz memria seletiva possvel levar-se a segmentao da matriz at


aos elementos, linhas ou colunas tomadas isoladamente, a cada uma das quais se atribuir
um elemento seletivo, isto , uma clula de memria.

22

Usam-se os objetos e as propriedades por pertinncia recproca, isto : o objeto


constitui um conjunto ou uma classe de propriedades e, portanto, um conjunto ou uma classe de objetos constitui uma propriedade. Cada termo divide o conjunto de termos perpendicularmente em duas partes - os que lhe pertencem e os que no lhe pertencem.
Os processos informacionais de representao do objeto tratam, portanto, das relaes entre as coisas e as suas caractersticas, e da maneira de manipular as representaes
em seus vrios suportes, em vez de manipular as prprias coisas. A memria documentria pode ser explorada tradicionalmente, como o caso das fichas unitermo, ou eletronicamente, nos arquivos seriais e invertidos que esto presentes nos modelos de busca em bases
de dados bibliogrficos e nos motores de busca (search engines) da Internet.
O primeiro aspecto sob o qual a memria documentria pode ser percebida, o concreto, torna tal representao uma imagem geomtrica da estrutura material da memria; o
outro, o abstrato, prende-se ao contedo ideolgico da coleo, isto , organizao de
dados e das noes caractersticas dos documentos contidos nela. Salvo rarssimas excees, as colees documentrias ultrapassam, quer horizontal, quer verticalmente, a possibilidade de utilizao de semelhante matriz materializada de modo direto no papel, num
espao e em duas dimenses.
Cada clula de memria igualada ao elemento seletivo obtido pela escolha do cruzamento de atributos ideolgicos com a seqncia material da disposio dos documentos.
Tal cruzamento , no entanto, limitado escolha de atributos feita pelo analista da infor-

23

mao e, ainda, dificuldade imposta pela prpria natureza da lngua natural, na qual se
apresentam tanto os documentos como os pedidos de busca de um documento na coleo.
Tanto pelo aspecto quantitativo, isto , o nmero de atributos escolhidos, como pelo qualitativo - possibilidades de interpretaes semnticas - , a memria documentria ainda se
caracteriza como memria virtual de acesso ao documento primrio. Ela no oferece a
garantia do acesso, apenas a possibilidade.
Montgomery15 descreve a estrutura da memria documentria em um modelo de
concepo sistmica, denominado Sistema de Recuperao da Informao (SRI), no qual
os dados de entrada so, ao mesmo tempo, as representaes das demandas de informao
pelo pblico e as representaes do acervo ou coleo. O sistema processa essas representaes, comparando-as e devolvendo-as sob a forma de novas representaes direcionadas
a cada demanda. A retroalimentao garantida pelas novas produes de conhecimento
que sero selecionadas para o ingresso no sistema de informao. Esse processo, denominado de Recuperao da Informao, pode ser considerado como um filtro, pelo qual s
transitam as informaes demandadas, embora nem sempre essas se configurem como as
mais necessrias.
O modelo abaixo toma por base as simplificaes apresentadas por Montgomery,
que j demonstrava a inteno de salientar a importncia das representaes documentrias
no sucesso do casamento entre pblico e acervo.

24

A anlise do modelo SRI nos conduz s etapas inscritas na parte inferior do crculo, j
configurada como memria documentria.
 Seleo
A primeira etapa do subconjunto da memria documentria e terceira etapa do ciclo da
informao identificada pelos processos de seleo e aquisio que no so processos ao
acaso, ao contrrio, devem ser planejados em funo das caractersticas da instituio que
mantm acervos documentais. Ambos valem-se do princpio da economia. Quer dizer, funcionam como filtros da sociedade da informao, a fim de favorecer o equilbrio entre as
necessidades de informao do pblico usurio e a oferta da sociedade. Segundo Mc Garry16, necessidade um conceito bsico nos estudos de informao mas difcil de definir
satisfatoriamente. Essencialmente, ele implica a falta de algo que se estivesse presente
contribuiria para nosso bem-estar e para facilitar o alcance de quaisquer objetivos que tenhamos em mente. O conceito de necessidade passa pelos termos vontade, desejo, anseio e exigncia e est intimamente ligado idia de motivao.
Assim, a seleo, principalmente, um processo redutor, e como tal faz uso da
comparao como indicador de tomada de deciso para a aquisio. A funo das unidades

25

que gerenciam a seleo e a aquisio de documentos , pois, voltada comparao entre a


oferta de informaes com as demandas da comunidade usuria. No plano quantitativo, o
processo de aquisio ainda mais redutor, uma vez que deve ajustar as escolhas qualitativas aos recursos postos disposio pela instituio. Sem dvida, este primeiro componente do que chamamos universo documental, dentro do ciclo de vida da produo de conhecimentos, o que vai influenciar com maior peso a representatividade das memrias documentrias em relao s trocas de informao na sociedade.
Se a seleo j implica em reduo de informao, a prxima etapa, representao
do conhecimento, ainda mais redutora. A complexidade do tema aliada a interdisciplinaridade das abordagens nos leva a uma discusso mais detalhada do que possa ser o conceito
de representao para a Cincia da Informao, seus fundamentos tericos e seu uso na
organizao da memria documentria.
 Representao do conhecimento
Fala-se em representao hoje como um conceito redentor que poderia dar conta de todo gnero de discusso. Discutir o conceito isoladamente, sem impor limitaes de domnios e de espao-tempo seria o mesmo que tentar conceituar cultura, liberdade, memria,
expresses metafricas e complexas que, sem o cuidado da reflexo, passam a ocupar o
lugar de todos os significados. Do ponto de vista desse espaco-tempo-acontecimento, a
literatura nos mostra que vem existindo uma frtil discusso sobre o conceito de representao em cada domnio, na tentativa de explicitar a operao interna de um campo do conhecimento e sua interao com as bordas ou os limites de campos vizinhos. Na Cincia da
Informao, particularmente, podemos observar o nascimento e a evoluo das expresses
/representao do conhecimento/ e /representao da informao/ bastando para isso efetuar um estudo da literatura17. Quanto ltima expresso, /representao da informao/,
uma busca direta na Internet resultou em 34.000 referncias, na forma de artigos acadmicos, programas de disciplina, consultorias comerciais, encontros e eventos em vrios domnios com nfase porm, na esfera da organizao do conhecimento.
As abordagens que traam uma genealogia do conceito representao, especialmente sobre o binmio conhecer-representar, se inscrevem no campo da filosofia tal como em
Foucault18 que leva ao extremo essa discusso ao resgatar pela linguagem a idia do mundo
com representao. Mas exatamente na filosofia da linguagem que as interpretaes ou
leituras feitas de filsofos sobre esta questo ora privilegiam a noo de representao, ora

26

a excluem como condio necessria do conhecer. No campo da Lingstica, por exemplo,


Magro19 considera a noo de representao como um desses recursos explicativos que tem
integrado as reflexes dos fenmenos humanos, especialmente os fraseveis em termos
cognitivos e esses vo desde os fenmenos evolutivos, genticos, imunolgicos e neurolgicos, at os psicolgicos, cognitivos e lingsticos. Nesse mesmo texto, a autora conclui
que a atribuio de significado a nossas experincias uma conseqncia , e no um prrequisito, de nosso estar nas interaes no meio, nas coordenaes de atividades que constituem o linguajar e que, portanto a noo de representao pode e deve ser dispensada.
As acepes de representao e representao do conhecimento so inmeras, tais
como a noo de representao sob a tica da construo como em Gomez20, ou com o
significado de intermediao, considerando que a as representaes se colocam entre o
meio e o homem. Kobashi21 destaca que a Cincia da Informao adota essa ltima acepo, ao considerar representao como um conceito mediador entre emissor e receptor,
objetivado pelos processos e produtos da condensao de contedos informativos e, neste
caso opta pela expresso representao da informao.
No mbito das produes sociais de sentido, Becker22 discute a idia de representao social (absorvendo algumas acepes do conceito mencionadas anteriormente) no sentido durkheimiano de representaes coletivas, as quais so referenciadas nos campos da
histria da cultura, antropologia, sociologia e psicologia, e indica que as possibilidades
tericas e metodolgicas de operarmos as representaes sociais implicam nos seguintes
aspectos:
qualquer representao da realidade social necessariamente parcial, menor do
que aquilo que se poderia vivenciar e achar disponvel no real;
a mesma realidade pode ser descrita de um enorme nmero de maneiras, visto
que descries podem ser respostas para qualquer uma dentre uma multido de
questes;
representaes s tm existncia completa quando algum as est usando, lendo
ou assistindo, ou escutando e, assim, completando a comunicao atravs da interpretao dos resultados e da construo para si prprio da realidade que o produtor pretendeu mostrar.
Esses aspectos, por estarem referenciados ao estgio mais complexo da cadeia de
representaes, isto , o social, so atributos inerentes a todos os demais estgios ou nveis

27

de representao e podem ser sintetizados por trs conceitos: reduo semntica, pluralidade de significados e produo de sentido.

 Reduo semntica
A mediao exercida pela Cincia da Informao entre indivduos e representaes sociais faz com que a reduo semntica se imponha pluralidade de significados
como forma de garantir a produo de sentido. Toda intermediao em si um fenmeno redutor de significados. O menor nvel de reduo semntica se daria, por exemplo, em uma comunicao teleptica entre dois indivduos. Qualquer meio que se
interpusesse entre emissor e receptor j representaria uma alterao na fonte, como o
caso da linguagem. A escrita acrescenta mais um nvel de reduo em relao mesma
fonte e, portanto, toda proposta de representao de linguagens de representao reduz
a informao na fonte. Se a linguagem, em si, j redutora do pensamento, todas as
formas de sntese da linguagem com o propsito de acesso informao so, tambm,
formas ainda mais acentuadas de reduo de significado. Inegavelmente, a cadeia de
redues semnticas faz parte da base terica da memria documentria para que a organizao do conhecimento em unidades mnimas seja passvel de decodificao. O
princpio da economia de smbolos o que nos permite usufruir do conhecimento configurado nessas memrias. nesse momento que faz sentido incorporar um novo conceito, o da meta-representao. A representao do conhecimento com esta acepo
pode ser entendida como uma cadeia necessria de redues que se inicia com a concepo indo at a representao da representao, meta-representao ou representao
documentria.
Representao sensvel
Representao conceitual
Representao verbal
Representao social
Representao documentaria (meta-representao)

 Pluralidade de significados
O pensamento humano, que opera com contedos dependentes da palavra, implica
sempre uma influncia recproca entre o sujeito pensante e o contedo que a palavra encer-

28

ra. A linguagem vista como o instrumento do pensar, sua realidade imediata, tanto para o
ouvinte quanto para o falante. Merleau Ponty23 amplia esse conceito e afirma que a palavra
no a traduo de um sentido mudo, mas criao de sentido. A linguagem no veste
idias: ela encarna significaes, estabelece a mediao entre o eu e o outro e sedimenta
os significados que constituem a cultura. O pensamento, segundo Spirkin24, nasce junto
com a linguagem e constitui a atividade cognoscitiva do sujeito feita imediatamente por
meio da palavra. A linguagem cumpre, ento, dois papis: um como fator de comunicao
(objeto - relao do sujeito com o objeto - relao existente entre sujeitos), outro como
organizador do pensamento. Gorsky25 confirma o discurso de Spirkin, dizendo que a linguagem est vinculada ao pensamento direta e indissoluvelmente e essa conexo essencial que determina o papel que a linguagem desempenha na esfera do conhecimento. Richaudeau26 adiciona nfase tese, considerando que a riqueza do aparelho lingstico permitiu a
transcendncia da sua funo inicial e a linguagem se transformou em suporte do conhecimento, da imaginao, do sonho, dos prazeres. A linguagem no exprime somente o pensamento humano pr-existente, mas se constitui no prprio pensamento.27
Sobre o segundo aspecto, observa Spirkin28 que a escrita constitui a forma visual de
fixar a linguagem, surgindo quando a sociedade j havia alcanado um nvel elevado de
desenvolvimento. Portanto, um produto normal da ampliao dos meios de intercomunicao das pessoas, estimuladas pelas necessidades prticas da vida social. A escrita , assim,
resultado da atividade criadora e consciente dos seres humanos. Como linguagem articulada, adquire um carter at certo ponto independente e constitui uma forma de atividade
extremamente abstrata. A escritura pictogrfica evoluiu gradativamente no sentido da significao. Da representao completa do objeto, o homem passou representao esquemtica. Por sua vez, a escrita ideogrfica ou hieroglfica constituiu um sistema de signos e
regras acerca de seu emprego que serviu para comunicar um pensamento qualquer.
Do ponto de vista do desenvolvimento do pensamento, o aparecimento do alfabeto
significou que o homem chegou a ter a idia de que a palavra consta de elementos particulares. O sistema alfabtico, portanto, surgiu no estgio em que a linguagem fontica e o
pensamento abstrato haviam alcanado seu pleno desenvolvimento. A escrita fontica, atravs da linguagem, se converteu em realidade material do pensamento. Ento, ao proporcionar ao pensamento um carter de certo modo independente (da realidade fsica dos obje-

29

tos), a linguagem foi uma das foras que contriburam para criar no somente uma cultura
espiritual, como para desenvolver a cultura material.
Ainda em Gorsky, a linguagem no s constitui uma condio necessria para a
formao de nossos pensamentos, como tambm permite consolidar os xitos da atividade
cognoscitiva do indivduo, fixar a experincia adquirida por uma gerao e transmitida s
geraes futuras. Portanto, o papel da linguagem para o conhecimento se revela a partir da
transmisso dos conhecimentos adquiridos, na passagem do nvel sensorial para o racional
e no processo de formao de conceitos, tanto do discurso da ontognese, como da filognese. O pensamento pode ento ser igualado concepo, dentro da escala associativa sensao percepo concepo, no sentido de criao e, portanto, com independncia do
real objetivo. O pensamento no se dissocia do real, mesmo considerando os conceitos de
juzos e raciocnios. A reflexo sobre a realidade natural existe, dado que tanto o contedo
como a forma de cada conceito, de cada juzo e de cada raciocnio particulares so um reflexo do mundo material.
Gorsky trata, ainda, do problema correspondente ao sentido da palavra, da correlao que existe entre o sentido e o significado e ainda entre sentido e conhecimento. Usa,
para tal, o raciocnio aristotlico de propriedades ou caractersticas e diferena na identificao de grupos ou classes de conceitos e seus possveis relacionamentos. A aproximao
de um objeto sob o aspecto da sensao, percepo ou representao nos conduz ao objeto
nico e no sua classe. As sensaes e percepes no precisam ser fixadas materialmente, mas as concepes sim. A suposio de que existam estrelas e o sol da ordem da percepo. A relao, ou seja, as estrelas so sis, da ordem da concepo. Para tanto, h a
necessidade de atribuio do signo, no caso a palavra, para expressar ou fixar o pensamento (ou concepo). Logo, o processo de pensar se caracteriza pela capacidade de formar
conceitos, de generalizar. E, nesse sentido, o processo de pensamento , por sua vez, um
processo no qual se opera com palavras.
Ainda assim, embora possamos afirmar que o signo representa o pensamento, o fato
mesmo da representao conduz idia de reduo semitica, tal que as representaes
variam no s pela forma de apresentao como pelo modo de interpretao. Do mesmo
modo que posso representar uma relao por meio de uma abstrao pictrica, como por
exemplo: a rosa maior que o livro - e desenhar uma rosa grande e um livro pequeno, a

30

interpretao vai variar conforme o universo retrico presente comparao. O desenho


poderia ser interpretado como: gosto de rosas grandes e de livros pequenos, etc.

 Produo de sentido
Sem dvida que, se nas etapas anteriores j h uma configurao de reduo semitica, o acesso ao conhecimento mediado por representaes documentrias intensifica essa
perda, considerada por Lara29 uma questo crucial do tipo: Como representar adequadamente as informaes sem comprometer o seu significado? ou Como resolver o problema da quase ausncia de articulao entre os descritores para a recuperao de informaes
veiculadas pelos textos?. As palavras so neutras. Elas assumem significados conforme
sua insero contextual. As palavras isoladas no significam nada, ou significam, virtualmente, tudo. a condio de referncia a determinados contextos que lhes confere significado.
Se considerarmos, como em Gomez30, que a busca de uma informao que seja
uma resposta pertinente e relevante s nossas perguntas requer, na modernidade, a reconstruo de um complexo cenrio onde sejam agregadas as populaes de fontes e canais de
informao de modo a permitir processos seletivos, organizados e econmicos de busca e
recuperao, tal reconstruo vai forosamente fazer uso de atalhos semnticos no sentido
clssico do processo operacional presente na idealizao das representaes documentrias.
Quer dizer, desconstruir o texto para reconstru-lo de forma reduzida. Sem dvida que ao
lado da reduo simblica fica configurada a reduo de significado. O paradoxo da produo de sentido no campo das memrias documentrias deve ser entendido como uma tenso necessria: reduzir informao para obter conhecimento.
Os produtos obtidos pelos processos de representao documentria, em seus vrios
graus de reduo semntica, quer sejam: o texto ou objeto na ntegra, resumos, referncias
bibliogrficas, ndices temticos ou notaes de classes sob as formas de codificaes textuais, imagticas, sonoras e digitais, organizadas em inventrios, catlogos, repertrios,
ndices, bibliografias vo ser disseminados sociedade em funo da sua demanda por
informaes.

 Disseminao da Informao

31

O processo de transmisso do conhecimento no exclusivo ao modelo de organizao


da memria documentria. Ao contrrio, faz parte da natureza humana a transferncia de
informaes adquiridas para a gerao de novos conhecimentos. No passado, a tradio
oral era o nico meio de transmisso ou difuso da informao. Segundo Mc Garry31, para
facilitar a memorizao e a evoluo, a tradio coletiva era conservada na poesia ou na
prosa rtmica e os mitos e lendas eram usados como uma espcie de enciclopdia tribal.
Sem quaisquer outros registros paralelos para comparar, o mito, a histria e a realidade
social fundem-se num s, configurando a era da oralidade mtica. Aps as escritas cuneiformes e hieroglficas, o alfabeto permitiu humanidade registrar e comunicar idias
por meio de smbolos visuais, caracterizando a era da escrita. Por fim, o desenvolvimento tecnolgico dos meios de comunicao visual, sonoro e eletrnico, encurtou as distncias espao-temporais, criando uma realidade em espao virtual e em tempo real, correspondendo era da informtica-meditica, ou simulao32.
O conceito de disseminao da informao se subordina aos conceitos de transmisso, divulgao ou veiculao de informaes. Contudo, apresenta um diferenciador, ou
seja, o atributo de domnio especfico e geral ao mesmo tempo, ou campo de interao entre o que as memrias documentrias adquirem e representam e o que necessita o ator que
delas faz uso. A rede de relaes que se estabelece entre as representaes da memria
documentria permite que a disseminao de um item extrapole a sua unidade material
(forma e contedo), levando o usurio possibilidade de obteno de vrios itens pertinentes sua necessidade de informao. Latour33 exemplifica essa caracterstica das redes de
informao utilizando a expresso centros de clculo, nos quais cada informao nova,
cada sistema de projeo favorece todos os outros.
Paradoxalmente a essa capacidade de extenso referencial de um item, a disseminao de informaes faz uso de estratgias redutoras para impedir a oferta de informaes
no desejadas. Essas estratgias, consideradas atalhos ou filtros, no diferem daquelas
utilizadas no nosso cotidiano quando recebemos e enviamos informaes por correio tradicional, correio eletrnico, telefone, fax ou por transferncia eletrnica de arquivos. Nesse
sentido, fazemos uso de guias e catlogos, geralmente organizados por temas de interesse
ou domnios, assim como os catlogos de produtos e servios, editores de livros e revistas
tcnicas.

32

No poderia ser diferente nos acervos de bibliotecas, arquivos, museus, como tambm no universo virtual das grandes redes de informao. Para este ltimo, hoje nos valemos de pginas de ndices temticos, organizadas em sistema hipertexto, que nada mais so
do que uma sucesso de filtros ou de atalhos pelos quais o usurio vai selecionando o caminho mais propcio localizao de uma dada informao. Tais atalhos visam, portanto, a
diminuir a ansiedade de informao, facilitando o acesso mais rpido aos contedos que
venham a satisfazer uma determinada necessidade de informao. Do ponto de vista das
instituies de memria, a disseminao no s o estgio final do ciclo de vida do documento, como a tarefa social de garantir o direito informao. Sem a disseminao o ciclo
total se rompe, impedindo as novas construes e a gerao de novos conhecimentos.
A meta-representao ou representao documentria, explicitada pelos modelos do
ciclo de vida da informao e do sistema de recuperao da informao (SRI), deve ainda
sofrer uma anlise, no sentido de ser isolado o conceito de linguagem de comunicao, em
especial o conceito de linguagem documentria, discusso que organizar o prximo captulo.

NOTAS E CITAES
1

VICKERY, B. C. Knowledge representation: a brief review. Op. cit., p. 145

MENDONA DE SOUZA, Alfredo, DODEBEI, Vera Lucia. Modelos e sistemas em Cincia da Informao. Rio de Janeiro, UFRJ/ECO, 1992. (Terceiro Seminrio apresentado diciplina Linguagem e Cincia
da Informao III).

HAGGETT, P., Chorley, R. J. Modelos, paradigmas e a nova Geografia. In: ________. Modelos scioeconmicos en Geografia. Rio de Janeiro: Livros Tcnicos e Cientficos / USP, 1975.

CLARKE, D. Models in archaeology. London : Methuen, 1972.

BURT, P. V. , KINNUCAN, M. T. Information models and modeling techniques for information systems.
Annual Review of Information Sciences and Technology. Holanda: Elsevier, v. 25

MARCONDES, C. H. , SAYO, L. F. Teoria Geral dos Sistemas: Sistemas de Informao Rio de Janeiro:
UFRJ/ECO, 1992. (Seminrio apresentado disciplina Linguagem e Cincia da Informao V, Curso de
Doutorado em Cincia da Informao)

MARCONDES, C.H. , SAYO, L.F. Op. cit., p. 15

HAGGET, P., Chorley, R.J. op. cit.

BURT, P.V., KINNUCAN, M.T op. cit.

10

LYYTINEN, K. Two views of information modelling. Information & Management, v. 12, n. 1, jan. 1987.

33

11

SHANONN, C. E., WEAVER, W. The mathematical theory of communication. Urbana: Univesity of


Illinois Press, 1949.

12

LANCASTER, F. W. Information retrieval systems: characteristics, testing and evaluation. 2. ed. New
York: Wiley, 1979.

13

VIRILIO, Paul. A mquina de viso. Rio de Janeiro: Jos Olympio, 1994. p. 9

14

WANDERLEY, Manoel Adolfo. Organizao da memria documentria: a matriz documentria. Rio de


Janeiro: UNIRIO/CCH, 1980. (Notas de Aula)

15

MONTGOMERY, Christine A. Automated language processing. Annual Review of Information Science


and Technology. v. 4, p.145-174, 1969.

16

Mc GARRY, K. J. Da documentao informao: um contexto em evoluo. Lisboa: Editorial Reserva,


1984.

17

Cf. MARCONDES, Carlos Henrique. Representao e economia da informao. Ci. Inf., Brasilia, v. 30, n.
1, p. 61-70, jan./abr. 2001.

18

FOUCAULT, Michel. A palavra e as coisas: uma arqueologia das Cincias Humanas. So Paulo: Martins
Fontes, 1994.

19

MAGRO, Cristina. Representao, Virtus Dormitiva e linguagem. In: OLIVEIRA. P. ; BENN-IBLER, V.


e MENDES, E. (orgs) Revisitaes: Edio Comemorativa dos 30 anos da Faculdade de Letras. Belo Horizonte: Editora FALE/UFMG. 1999. p. 29 44.

20

GOMEZ, Maria Nelida Gonalez. A representao do conhecimento e o conhecimento da representao:


algumas questes epistemolgicas. Ci. Inf., Brasilia, v. 22, n. 3 p. 217-222, set./dez. 1993.

21

KOBASHI, Nayr Yumiko. Anlise documentria e representao da informao. INFORMARE Cad.


Prog.Ps-Grad. Ci.Inf., Rio de Janeiro, v.2, n.2 p. 5-27, jul./dez. 1996.

22

BECKER, Howard S. Apud. JARDIM, Jos Maria. Cartografia de uma ordem imaginria: uma anlise do
sistema nacional de arquivos. Dissertao de Mestrado em Cincia da Informao. Escola de Comunicao,
Universidade Federal do Rio de Janeiro, 1994. p.98

23

MERLEAU PONTY, Maurice. O visvel e o invisvel. So Paulo: Perspectiva, 1992. p22

24

SPIRKIN, A.G. Origen del lenguaje y su papel en la formacio del pensamiento. In: Les theories de
laction. Paris, Hachette, 1972

25
26

GORSKY, D. P. Lenguaje y conocimiento. In: Pensamiento y lenguaje. Mexico: Grijalbo, 1966. p. 68-105.
RICHAUDEAU, F. Langage et action. In: LES THORIES de laction. Paris : Hachette, 1972.

27

Alguns lingistas e psiclogos contestam essa tese, principalmente os discpulos de Piaget, que deduziram
de seus trabalhos experimentais a pr-existncia do pensamento sobre a linguagem. Cf. Richaudeau, op. cit.
p. 208. No entanto, vale a pena investigar se os experimentos piagetianos so da ordem da ontognese apenas, ou se estedem-se tambm filognese.

28

SPIRKIN, A. G. op. cit., p. 114.

29

LARA, Marilda Lopes Ginez de. Algumas contribuies da semiolologia e da semitica para a anlise das
linguagens documentrias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993.

30

GOMEZ, Maria Nlida Gonzalez de. Op. cit.

34

31

Na opinio de Claude Levi-Strauss, a diferena essencial entre sociedades com escrita e sociedades sem
escrita que as primeiras so pluralistas e contm sempre mais de um ponto de vista, mais de uma possibilidade de ao. As sociedades primitivas, ou sem escrita, tendem a ser monolticas; os modos de fazer vigentes no so postos em questo e a tradio fornece definitivamente o plano de como as coisas devem fazerse. O pluralismo cria tenso e debate e desencadeia o futuro. Cf. Mc GARRY, K. J. op. cit., p. 43, 44.

32

DODEBEI, Vera Lucia Doyle. Espaos mtico e imagtico da memria social. In: Memria e espao. Rio
de Janeiro: 7 Letras, 2000. p. 63-71.

33

LATOUR, Bruno. Redes que a razo desconhece: laboratrios, bibliotecas, colees. In: O poder das
bibliotecas: a memria dos livros no Ocidente. Rio de Janeiro: Editora UFRJ, 2000. p. 29

3 Lngua e Linguagem

De acordo com a escala de complexidade das representaes sociais, as linguagens


documentrias so consideradas meta-representaes ou representaes documentrias, ao
lado de outras formas de representao da informao, como resumos, catlogos, bibliografias, ndices, inventrios, repertrios. Embora todos esses produtos pertenam ao gnero das representaes documentrias, uma vez que so construdos para referenciar um
objeto, a fim de permitir a sua distribuio e localizao na memria documentria, eles
no devem ser classificados como linguagem documentria. Os conceitos de linguagem
documentria encontrados na literatura reduzem, por vezes, todas as formas de representao documentria linguagem documentria, igualando assim, os dois conceitos.
A primeira explicao possvel para esse fato reside no emprego indiscriminado da
terminologia utilizada pelos campos terico-conceituais da representao documentria
importados do modelo europeu, cujo foco est centrado na analyse documementaire e do
modelo americano, que utiliza a information indexing como expresso genrica para as
operaes documentrias. A dicotomia conceitual documentao/ informao tambm fica
clara na preferncia dos dois modelos. Coyaud1, na introduo de seu trabalho, interroga o
uso da expresso Cincia da Informao para as atividades documentrias, de vez que considera o problema da documentao complexo demais para ser reduzido aos mtodos matemticos ou simplesmente cientficos e, ainda instveis para constituir uma possvel cincia documentria. Organiza seu discurso, definindo as expresses analyse documentaire,
indexation e langages documentaires , reservando anlise documentria o conceito genrico de processo documental que pode ser descrito em trs nveis de complexidade crescente:
1 extrao de palavras-chaves (i.e. de palavras naturais, no transformadas) do ttulo ou do corpo do documento;
2 indexao (i.e. anlise feita com a ajuda de descritores que, diferentemente das
palavras-chaves naturais so palavras que simbolizam os conceitos organizados
em um lxico documentrio tais como as linguagens documentrias hierrquicas
e/ou facetadas)

36

3 constituio de resumo (construo de texto novo, podendo ser indicativo dos


temas essenciais ou detalhado).
Essa complexidade crescente, mencionada por Coyaud, lana uma luz em parte dos
descaminhos da terminologia utilizada sem reflexo no campo das representaes documentrias. Pode-se admitir, por exemplo, que no devemos falar em indexao, quando a
anlise for feita por extrao de palavras naturais do texto analisado. No entanto, a expresso indexao h muito tempo vem sendo utilizada para indicar os dois processos, tanto o
de extrao de palavras naturais como o de extrao somado traduo em descritores. O
que fica esclarecido, neste caso, que os ndices (naturais ou transformados) e os resumos
resultantes destas anlises no so linguagens documentrias. So, apenas, produtos da
representao documentria. Essa a idia de Coyaud, que coloca a linguagem documentria na ordem dos produtos necessrios operao de transformao da lngua natural em
uma linguagem artificialmente construda para favorecer a comunicao documentria,
preservando nestas as funes semnticas e sintticas da primeira. Reserva-se, assim, a
caraterstica natural para a lngua2 e a caracterstica documentria para a linguagem, justificando a impreciso da expresso linguagem de indexao em lngua natural.
Segundo Wanderley3, as linguagens documentrias recebem denominaes diversas, tais como linguagens de indexao (Melton, J.); linguagens descritoras (Vickery, B.);
codificaes documentrias (Grolier, E.); linguagens de informao (Soergel); vocabulrios
controlados (Lancaster, F.W); lista de assuntos autorizados (Montgomery, C.); e, ainda,
linguagens de recuperao da informao, linguagens de descrio da informao. Analisando os substantivos utilizados, temos: linguagem, codificao, vocabulrio e lista. Para
os qualificadores: descritoras, documentrias, informao, (termos) controlados, assuntos
autorizados. De um modo geral, poder-se-a afirmar que nas expresses, tanto os substantivos como os adjetivos so sinnimos. As escolhas deixam transparecer as orientaes terico-metodolgicas adotadas pelos autores, refletidas no binmio observado anteriormente,
isto : informao/documentao, alm da demonstrao da igualdade do peso conceitual
entre os objetos da anlise: assunto, informao, descritor e, tambm entre as estruturas
das representaes: cdigo, linguagem, vocabulrio e lista.
As imprecises terminolgicas situam-se em trs nveis da abordagem ao problema
da representao documentria: no objeto da anlise, nos processos e nos produtos da representao. Lancaster4, menciona o problema da instabilidade terminolgica ao afirmar

37

que na bibliografia de Biblioteconomia e Cincia da Informao faz-se uma distino entre


as expresses, indexao de assuntos, catalogao de assuntos e classificao e que essas
diferenas so inexpressivas, servindo apenas para causar confuso. Sem dvida, o processo maior que permeia e fundamenta todas essas operaes o da classificao, vista como
a condio do pensamento de operar comparaes, identificando semelhanas e diferenas
entre os objetos e seus conceitos, tal como em Grolier5: todos os sistemas de organizao
intelectual da informao tm uma base comum e esta a classificao, e em Ranganathan6: classificao o processo de traduo do nome de um determinado objeto da
linguagem natural para uma linguagem classificatria. J para Wanderley7, a indexao a representao dos elementos dos documentos e a classificao a representao
do documento como um todo, definio mais prxima das observaes de Lancaster, nas
quais afirma que todas essas expresses dizem respeito ao processo de classificao de um
objeto em um campo conceitual, mediante a atribuio de um rtulo que pode ser um assunto, um termo/descritor ou uma notao, mas que, objetivamente, a confuso terminolgica se deve incapacidade de distino entre as etapas de anlise conceitual e de traduo
na indexao.
Essa concluso de Lancaster, da qual compartilhamos, nos leva segunda explicao que aponta o escasso interesse por parte dos bibliotecrios nas discusses sobre o campo terico da representao documentria, resultando em poucas contribuies na produo
literria. O maior nmero de textos existentes volta-se para as aplicaes das representaes e das linguagens a domnios especializados, sem manifestar o interesse em abordagens
conceituais.
No Brasil, um dos primeiros trabalhos que se vale das contribuies tericas de outros campos do conhecimento, em especial da Lingstica, tambm uma das primeiras
dissertaes do Mestrado em Cincia da Informao do Instituto Brasileiro de informao
em Cincia e Tecnologia (IBICT). Em 1973, seu autor, Manoel Adolpho Wanderley, busca
na escola francesa autores preocupados com a relao entre a Lingstica e a Documentao, em especial Grolier, Coyaud e Gardin, para discutir o processo especfico da comunicao documentria do ponto de vista das relaes entre a linguagem e o universo da representao documentria. A partir de 1980, Kobashi, Smit, Lara, Cintra, Tlamo e Cunha
retomam a discusso das relaes entre a Lingstica e a Documentao, significando, para
a atualidade, os autores brasileiros mais produtivos no campo da representao document-

38

ria8. Com base na anlise dessa literatura, arriscamo-nos a discutir o campo tericoconceitual e metodolgico das representaes documentrias, no de forma exaustiva mas,
ao contrrio, pontuando as reflexes nas relaes entre seus conceitos principais a fim de
destacar aqueles imprescindveis construo de seus produtos, em particular, das linguagens documentrias.
As operaes efetuadas nos documentos a fim de torn-los teis a uma pesquisa
documentria podem ser observadas sob dois aspectos: o primeiro relativo aos processos
que ocorrem na transformao do objeto em item documentrio, passvel de ser recuperado
da memria documentria; o segundo aspecto diz respeito aos produtos, quer sejam gerados por esses processos, quer sejam construdos para melhorar a comunicao entre usurio
e documento.
Considera-se como processos a anlise, a sntese e a traduo em cdigos documentrios. Destes, a anlise e a sntese vo constituir o que se denomina Anlise Documentria e a traduo ou processo de codificao documentria vai variar em funo do
objetivo especfico da criao de cdigos documentrios, isto : catalogao, classificao,
indexao ou condensao informativa. Os produtos gerados por esses processos so, portanto: catlogos, ndices e resumos. E os produtos construdos para melhorar a comunicao constituem as Linguagens Documentrias. O grfico abaixo representa uma das inmeras possibilidades de leitura deste campo de estudos. Sua construo teve por objetivo
principal organizar os conceitos j consagrados na literatura, apresentando as relaes existentes entre eles, quer sejam de subordinao ou paradigmticas, quer sejam de coordenao ou sintagmticas.

39

O grfico conceitual da Representao Documentria, organizado em facetas mutuamente exclusivas, no est completo, isto , no rene todas as possibilidades conceituais
deste domnio. A rede de relaes conceituais pode ser ampliada tanto no eixo paradigmtico, quanto no sintagmtico. No entanto, esta estrutura mnima j nos favorvel ao entendimento do lugar ocupado pelas linguagens documentrias no espao da representao,
o que nos vai permitir organizar a discusso com maior cuidado no que se refere, principalmente, ao emprego da terminologia.
A anlise da primeira faceta, ou os processos que concorrem para a realizao das
representaes documentrias, indica um campo de estudos importantssimo na compreenso da complexidade e da interdisciplinaridade das abordagens conceituais. O primeiro
deles, denominado de Anlise Documentria (AD), definido por Cunha9 como o estudo
do conjunto de procedimentos efetuados com o fim de expressar o contedo de documentos
sob formas destinadas a facilitar a recuperao da informao. A AD, embora no seja
um campo novo de interesse da Biblioteconomia e da Cincia da Informao, experimentou um desenvolvimento maior no Brasil, a partir de um grupo de pesquisa formado pela
Escola de Comunicao e Artes de Universidade de So Paulo, tendo como propsito dar

40

subsdios terico-metodolgicos prtica da codificao bibliogrfica, em especial indexao de documentos textuais. Nas palavras de Cunha10, esse procedimento de traduo
(tradicionalmente) realiza-se... com base no bom senso bibliotecrio, e envolve grande
nmero de pr-conceitos comuns rea de Biblioteconomia/Documentao. So eles: a
idia de que os textos/documentos a analisar/indexar so absolutos; que possvel chegar-se a palavras neutras; que o analista/indexador passivo; que o trabalho de anlise
documentria pode ser realizado sem o conhecimento da rea.
Essas observaes de Isabel Cunha, de fato, refletem uma importante questo da
intermediao nas representaes documentrias, isto , a familiaridade com o campo conceitual dos objetos sujeitos anlise. Nesse sentido, explicam-se as tentativas de frmulas
para a codificao dos textos e o peso que o ttulo dos documentos apresenta como segmento de maior valor semntico, principalmente quando o tempo despendido para efetuar a
codificao est na razo inversa da velocidade de alimentao da memria documentria.
A neutralidade, tanto do texto quanto do analista, muitas vezes imaginada como uma desculpa interveno no processo seletivo, o que, de resto, no contribui, em absoluto, para
melhorar a qualidade da oferta de informaes. Com maior ou menor nfase neutralidade
da anlise, fato que as etapas consideradas pela AD so realizadas, no plano lgico, por
toda a intermediao entre objeto e sua representao, seja qual for o cdigo escolhido.
Essas etapas so representadas pela leitura e posterior segmentao do texto em unidades
que sintetizam o contedo dos documentos. A expresso usada por Wanderley11 desconstruir o texto para referenciar o contedo reflete as etapas discutidas em profundidade por
Cunha12, que apresenta um quadro terico-conceitual da Anlise Documentria e outro de
seus modelos, onde se l a seguinte frase: leitura segmentao representao.
A leitura , assim, o incio dos processos de catalogao, classificao, indexao
ou condensao informativa de objetos. Cintra13 argumenta que na leitura para fins documentrios o princpio da cooperao autor/leitor rompido uma vez que o autor no previu
o documentalista como leitor. Portanto, a intermediao presente no ato de ler cria mais um
universo retrico a ser considerado o do analista, alm daquele existente para o autor, e
aquele existente para o leitor objeto da criao do texto. Esses universos retricos ou tbuas14 de conhecimentos formam um quadro de referncias necessrio no s segmentao do texto como sua reconstruo, como diz Cunha15, remontagem do discurso. Outros aspectos que devem ser considerados so a capacidade preditiva do leitor que extrai do

41

texto mais do que est expresso lingsticamente, graas s aoes mentais estruturadas e as
estratgias de leitura adotadas e, contrariamente, a tendncia natural de reduzir o cenrio
para reter as informaes principais. A incluso das estratgias de leitura, tanto textuais
como imagticas16, no mundo das representaes documentrias parece ser de vital importncia qualidade da memria documentria e eficcia do sistema de recuperao das
informaes.
A segmentao do texto objeto da AD pode ser considerada a sntese da leitura, fase
que antecede da codificao. Nesta etapa, o analista pode valer-se dos fundamentos da
sintaxe ou da semntica. No que se refere anlise automtica de textos, Coulon17 indica
que as pesquisas que visam a associar a informtica ao processamento de textos podem ser
classificadas em quatro fases: fase estatstico-morfolgica (1945-1955); fase sinttica
(1955-1070); fase lgica (1963- ); e fase cognitiva (1974-

). V-se nesta classificao

uma evoluo de abordagens que indicam os graus de complexidade da tecnologia de segmentao de textos, ou seja: anlise morfolgica (lxico) anlise sinttica (estrutura)
interpretao lgica das estruturas sintticas (semntica) anlise conceitual (simulao). Essa ltima fase representa os esforos conjuntos da psicologia cognitiva e da informtica (inteligncia artificial) na soluo da representao automtica do conhecimento.
Os processos de atribuio de cdigos ou rtulos aos segmentos da leitura documental, como denominou Lancaster, podem ser discutidos sob o aspecto normativo. Quer
dizer que eles se dividem em dois universos: os processos que se abstm de orientaes
normativas e os que se valem das estruturas dos cdigos para controlar as funes sintticas e semnticas da lngua natural. Os primeiros so nomeados de indexao livre, indexao natural, indexao por palavras-chaves (no sentido de extrato empregado por Coyaud),
pois utilizam as palavras naturais, encontradas no texto, como pontos de acesso ao contedo. Essa modalidade de indexao a utilizada como parte integrante de compndios e
manuais tcnicos e objetiva a localizao de conceitos, assuntos, nomes de pessoas ao longo da exposio. A indexao natural usada tambm com o objetivo de localizao de um
objeto na memria documentria, porm sofre todos os tipos de restrio dos sistemas abertos de comunicao dos quais a lngua natural a principal representante. O segundo
universo representado pelos processos de catalogao, classificao e indexao que
utilizam instrumentos normalizadores das representaes, a partir de regras sintticas e
semnticas. No nos cabe neste trabalho analisar tais processos em profundidade, mas to

42

somente refletir sobre a influncia dos controles sintticos e semnticos, no apenas no


momento da atribuio do cdigo, como tambm na segmentao do texto.
Pode-se dizer que a indexao natural faz uso da escolha de palavras simples, compostas ou articuladas em frases que, extradas do texto vo se transformar em uma representao reduzida do objeto. Independentemente das tecnologias da AD empregadas nessa
segmentao, no h, nesta fase, o processo de traduo do texto original em um outro reduzido, representado e traduzido. O processo de traduo, no nosso entender, implica a
interao de lngua e linguagem, dois sistemas de comunicao que mutuamente se referenciam. Portanto, s h o processo de traduo quando a lngua natural e a linguagem
documentria so confrontadas. De outro lado, pode-se considerar que a indexao natural
uma indexao incompleta (melhor seria utilizar outra expresso) pois, nesse processo,
apenas a anlise/sntese mental considerada na segmentao do texto, ignorando-se o
plano conceitual da representao. Neste caso, todas as vantagens tanto da lngua natural
quanto das linguagens documentrias so desprezadas, uma vez que as palavras so retiradas de um contexto significativo para constiturem uma lista ou um ndice de pouco valor
para a identificao dos conceitos que representavam no texto.
Vale observar, ainda, que os processos de representao documentria sofrem uma
variao significativa na leitura e segmentao dos objetos em anlise dependendo da utilizao ou no de uma linguagem documentria. A linguagem documentria proporciona no
s um controle das disperses semnticas e sintticas da lngua natural como delimita o
domnio conceitual do campo de estudo em questo. Essa delimitao do domnio guia a
leitura e influencia a segmentao do texto, no sentido de que esta ltima deva se ajustar
linguagem documentria para a qual ser traduzida. O compromisso que a indexao assume com o campo de estudo muito mais forte quando ela completa, isto , quando ela
cumpre integralmente as etapas da leitura, da segmentao e da codificao documentria.
Dos produtos da representao documentria, componentes da segunda faceta do
esquema conceitual apresentado, vamos nos ocupar das Linguagens Documentrias (LD).
Antes de serem analisadas sob o ponto de vista de linguagens artificialmente construdas
para facilitar o acesso s colees de uma memria documentria, devemos observar que as
LD pertencem categoria das linguagens comunicao, ao lado da lngua natural oral e
escrita, das linguagens gestuais, sonoras e visuais. As LD guardam traos caractersticos

43

comuns s linguagens de comunicao e traos diferenciados, o que as tornam singulares,


justificando sua existncia.
Das inmeras abordagens existentes sobre os fundamentos tericos das LD, as contribuies da Lingstica e das teorias da Comunicao no podem ser omitidas. Por ser
complexa a separao conceitual entre Lingstica e Comunicao adota-se freqentemente, e tambm neste trabalho, a expresso linguagem de comunicao como um conceito
que percorre as linguagens orais, escritas, visuais, sonoras e gestuais, analisando-as sob o
fenmeno da comunicao. Uma limitao, ou melhor uma diferena, poder-se-ia impor
Lingstica, se no de modo absoluto mas de forma relativa, que a preferncia pela lngua
(em seus cdigos convencionais, principalmente a escrita), sendo esta o seu principal material de estudo. Para Nocetti e Figueiredo18, h entre os lingistas um consenso no sentido
de considerar a linguagem como a capacidade humana de criar mensagens para a comunicao e lngua como sistema de signos vocais utilizados pelas comunidades lingsticas.
De todas as consideraes sobre as caractersticas da lngua natural pode-se identificar uma
estrutura comum a todas elas, denominada de universais da linguagem:
a natureza oral das lnguas;
o carter linear (transmisso direcional);
o carter significativo (trabalham com smbolos e signos que remetem a um determinado contedo);
o carter arbitrrio (no h uma relao intrnseca entre as coisas e os nomes dados a elas;
a criatividade (fundamentalmente humana, o que faz com que a linguagem adquira um carter dinmico, de evoluo ou involuo); e,

a dupla articulao19.
Hughes citado por Nocetti e Figueiredo20 define a lngua natural como um sistema
de smbolos vocais arbitrrios pelos quais o pensamento transmitido de um ser para o
outro, podendo ser entendida dos pontos de vista:
sistmico cdigo ou conjunto de regras em que cada item o que em virtude de seu lugar no sistema. Poderamos ter como exemplo as duas frases seguin-

44

tes, que, embora sejam constitudas pelos mesmos smbolos, podem ter significado diferente.
O menino l alto (l em voz alta)
O menino alto l (o menino alto)
arbitrrio No h necessidade intrnseca de que cada palavra signifique o
que significa, ou para que cada lngua tenha a estrutura que tem.

ex:

Corao, ou Coeur, ou Heart

vocal formada pelos sons produzidos pelos rgos da fala dos seres humanos.
simblico o poder de simbolizar e de distinguir smbolos um pr-requisito.
meditico (representao do pensamento) a forma de representar as idias.
De acordo com Cintra21, a prtica da linguagem marcada por uma tendncia natural do homem de compreender, governar e modificar o mundo. Essa necessidade de dominar os fenmenos sociais implica em dois processos, o de apreenso e o de compreenso.
O primeiro pode ser representado por uma catalogao do mundo e o segundo pela sua
hierarquizao. Esses dois processos indicam a arbitrariedade da lngua, uma vez que
desde a fase de nomeao, caracterstica do desenvolvimento da espcie humana, a funo
classificatria se fez presente. O fato de atribuir um smbolo a um referente j o isola conceitualmente de outros referentes. Como a memria documentria formada, preponderantemente, por documentos textuais, as principais questes apontadas para a eficcia dos processos de representao documentria repousam na criatividade, arbitrariedade e simbolismo da lngua natural, o que vai gerar alternativas de escolha no processo de traduo e de
codificao. Essas alternativas de escolha podem ser representadas pela caracterstica de
disperso da LN que vai dificultar a eficcia do processo comunicativo restrito recuperao da informao documentria. A disperso na LN pode ser classificada por: disperso

45

lxica ou terminolgica (sinonmia e polissemia), disperso sinttica (estrutura das frases)


e disperso simblica (vrios smbolos para o mesmo referente), tal como os exemplos:
professor e docente sinonmia
manga (fruta) e manga (parte de vesturio) polissemia
/o aluno rabiscou a prova/ e /a prova foi rabiscada pelo aluno/ disperso sinttica

ou gato, ou cat, ou chat disperso simblica

As LD, a par de guardar uma relao estreita com a lngua natural, de vez que possuem um vocabulrio ou lxico documentrio e uma estrutura ou sintaxe, representam o
contedo informativo de um documento, operando por anlise e sntese. Quer dizer, a lingua natural traduzida para uma linguagem sinttica - descritores - a qual, retida na memria do catlogo tradicional ou da mquina, significa economia verbal, economia de smbolos, economia de espao. Mas, certamente, significa tambm economia de significado.
Do ponto de vista dos fundamentos tericos da Comunicao ao nosso propsito de
estabelecer as relaes entre LN e LD, identificamos no discurso de Umberto Eco em Semitica e Filosofia da Linguagem22 alguns conceitos que, de certo modo, dominam as discusses semiticas, principalmente sob a perspectiva da filosofia. So eles: signo e significado, smbolo e cdigo.
Eco v o mundo como fato de cultura, uma mensagem a desvendar e considera que
todos os fenmenos de cultura podem ser vistos como fatos de comunicao, para os
quais as mensagens isoladas se organizam e se tornam compreensveis em referncia a cdigos. Partindo da suposio do mundo como um fenmeno semitico, Eco procura identificar na histria da filosofia a discusso sobre a lngua e outros sistemas de signos e mediante essa releitura, afirma que cada grande filsofo do passado elaborou, de alguma forma, uma semitica. Dos esticos a Cassirer, dos medievais a Vico, de Santo Agostinho a
Wittgenstein, todos abordaram os sistemas de signos. Mas com Aristteles que a idia de
ser percebida como expresso de vrios modos, ou que o ser o que a linguagem expressa de muitas maneiras. Usando a figura que viria a ser mais tarde conhecida como o trin-

46

gulo semntico de Ogden e Richard, Eco rel semioticamente alguns filsofos: onde Y
uma expresso, Z uma coisa ou estados de coisas e X o significado.

Para Plato o Z era uma experincia do mundo, mas efmera e enganosa, dotada de
"realidade" apenas enquanto imitao de uma realidade situada no mundo das idias; para
Aristteles era uma susbtncia primeira, em toda a sua concretude; para os esticos era
um corpo. Para Plato o X era um conceito; para Aristteles, uma disposio da mente;
para os esticos uma criao do esprito humano. Embora a definio dessas entidades
mudasse segundo o contexto filosfico, a diferena entre significado e referncia foi de
algum modo enunciada.
Para Ogden e Richard o Y o smbolo, o Z o referente, o X a referncia. No que concerne semiologia s interessa o lado esquerdo do tringulo pois, o problema do referente no tem pertinncia, uma vez que existem smbolos que possuem uma referncia e
no tm referente (como o unicrnio, que se refere a um animal fantstico, mas inexistente). H ainda smbolos diferentes, com significado diferente, que dizem respeito ao
mesmo referente (Vnus, como estrela-da-manh e estrela-da-tarde, ou ainda as expresses "meu padrasto" e "o pai de meu meio-irmo").
J Peirce, ao entender o signo como alguma coisa que est para algum em lugar de
outra, sob algum aspecto ou capacidade, trata essas relaes numa estrutura tridica, que
lembra o tringulo richardsiano onde, alterando as conceituaes saussurianas de significante e significado, introduz a idia do Interpretante. Onde o Y o smbolo ou "representmen", o Z o objeto que representa e o X interpretante (tese essa mais prxima de Aristteles e dos esticos). A idia do interpretante, como diz Eco, pode ser identificada com o
significado, mas a hiptese mais fecunda a que v o Interpretante como uma outra repre-

47

sentao relativa ao mesmo objeto, numa cadeia de semiose ilimitada, uma vez que para
estabelecermos o que seja o interpretante de um signo necessrio design-lo mediante
outro signo, o qual tem por sua vez outro interpretante, designvel por outro signo, e assim
por diante.

Esse crculo vicioso se d em relao aos diversos contextos ou culturas a que o significante se direciona, como por exemplo o significado do significante vaca para o hindu
ou os significantes beleza, unicrnio e Deus. Esta relao cultural provoca na mente do
indivduo o interpretante, existindo, portanto, diferentes interpretantes a partir do contato
com um cdigo ou cultura. Assim, com base num dado cdigo, um significante denota um
significado num certo grau de extenso e, ainda, conota um significado em relao ao prprio cdigo. A relao de conotao se estabelece quando um par formado pelo significante e pelo significado denotado, conjuntamente, se torna o significante de um significado
adjunto. O termo co, por exemplo, denota certo tipo de animal, mas para o italiano tambm conota "mau tenor". A relao entre smbolo e referncia estudada em profundidade, uma vez que dessa relao que ocorrem os fenmenos de significao. A relao
entre smbolo e significado pode mudar, crescer, deformar-se; o smbolo permanece constante e o significado torna-se mais rico ou mais pobre. A esse processo dinmico e contnuo Eco denomina sentido.
A lngua natural (LN) faz parte desse modelo comunicacional "aberto", onde a mensagem varia conforme os cdigos. Estes so postos em pauta conforme as ideologias e circunstncias, e todo sistema de signos se reestrutura continuamente com base na experincia de decodificao que o processo institui como semiosi in progress. O processo de comunicao se d, portanto, quando o indivduo reduz o que pensa e quer a um sistema de
convenes comunicativas, ou seja, quando o que pensa e quer socializado. O sistema de
saber, por sua vez, tem que se transformar em um sistema de signos, onde a ideologia soci-

48

alizada se torna cdigo. Nasce assim uma estreita relao entre o mundo dos cdigos e o
mundo do saber preexistente, onde esse saber torna-se visvel, controlvel, quando se faz
cdigo, conveno comunicativa.
LN atribudo um sistema de signos compreendido pelo que se designa de gramtica. Para Eco a gramtica composta da sinttica, da semntica e da pragmtica. A sinttica diz respeito ao sentido estrutural da lngua e envolve a morfologia e a sintaxe. A
semntica se ocupa do sentido lexical e a pragmtica do sentido situacional. Esta ltima, a
pragmtica, segundo Bar-Hidel citado por Eco23
o estudo da dependncia essencial da comunicao, em linguagem natural, do
falante e do ouvinte, do contexto lingstico e do contexto extralingstico e da disponibilidade dos conhecimentos fundamentais, da prontido em obter esse conhecimento fundamental e da boa vontade dos participantes do ato de comunicao.

Essa classificao da gramtica, impe apenas uma diferena quela feita por Saussure24, ao afirmar que tudo o que compe um estado de lngua pode apenas ser reduzido a
uma teoria dos sintagmas e a uma teoria das associaes. Tal diferena diz respeito ao nvel
de extenso das relaes entre os conceitos, isto , as relaes sintagmticas e as relaes
associativas (ou paradigmticas) implicam a sintaxe (incluindo a morfologia) , a semntica
e a pragmtica. Sem dvida que no modelo de semiose, a pragmtica exerce um importante papel no sucesso da comunicao pois, somada semntica, vai possibilitar o aparecimento do significado contextual, em detrimento apenas do significado lexical.
Nesse sentido, Eco utiliza uma metfora muito interessante para analisar a gramtica da LN e que corresponde a dois modelos: o do dicionrio e o da enciclopdia. Do ponto
de vista da representao da LN como um dicionrio, o conceito de estrutura classificatria
utilizado, na qual os significados de cada palavra so impostos por sua posio num esquema arborescente composto de gneros e espcies. Assim que /casa/ um tipo de moradia; /macieira/ um tipo de rvore frutfera que, por sua vez uma espcie de rvore.
Esse tipo de representao pressupe o uso de estruturas hierrquicas rgidas que consideram as propriedades conceituais, atributivas e necessrias dos objetos. Do ponto de vista da
representao enciclopdica, a LN pode se analisada como uma rede de relaes infinitas
que faz maior uso de propriedades factuais, descritivas ou acidentais dos objetos. Se para o
modelo de dicionrio h um consenso e uma finitude conceitual, para a enciclopdia h um

49

conjunto no ordenado, situacional e pragmtico. A enciclopdia supe uma moldura ou


um roteiro local, que parte de um recorte temtico e vai articulando os significados em uma
rede rizomtica25. Assim, /casa/ implica no somente a moradia, mas de que material
feita, quem a habita, em que espaos geogrficos, numa rede de associaes infinita.
Desta forma, o modelo do dicionrio tem maior identificao com a semntica e o
da enciclopdia com a pragmtica. No entanto, os modelos no so mutuamente exclusivos. Eles podem coexistir, sem o compromisso da descrio da totalidade do universo conceitual, uma vez que, com base na teoria do interpretante, o destinatrio constri a poro
da enciclopdia com a qual decodifica a mensagem. Poder-se-ia, neste momento, relacionar
dicionrio ordem (hierarquia) e enciclopdia desordem (rede), cuja coexistncia possvel pela introduo da noo de cdigo (conveno e regras).
As vrias acepes de cdigo existentes, segundo o roteiro ou a moldura construda
do universo das representaes sociais, aparecem, de acordo com Eco26, na reformulao
da oposio saussuriana lngua-fala para cdigo-mensagem e na terminologia de vrios
domnios do conhecimento tais como: cdigo fonolgico, cdigo lingstico, cdigo semntico, cdigo gentico, cdigo esttico, cdigo tico, cdigos gestuais, cdigos musicais,
cdigos culinrios ... A exploso do termo, tal como ocorreu com outros: informao, cultura, por exemplo, podem demonstrar instabilidade conceitual, mas podem tambm indicar
uma certa fecundidade nas abordagens interdisciplinares. Parece ter sido esta ltima a conseqncia do surgimento da expresso cdigo documentrio, a qual nos interessa discutir
na configurao das linguagens documentrias. De todo modo, a noo de cdigo implica
sempre a de conveno, de acordo social, de um lado, e de mecanismo regido por regras,
de outro.
As LD so, portanto, metacdigos ou metalinguagens, pois so construes artificiais ou convenes criadas para facilitar o conhecimento de um domnio, regidas por regras
de utilizao a exemplo daquelas existentes para a lngua natural da qual representam uma
imagem reduzida. Voltemos s metforas de Eco, criadas no intuito de encontrar os fundamentos tericos para justificar o modelo do interpretante/ semiose. O que nos chama a ateno nessa perspectiva de anlise da lngua natural como meio de comunicao exatamente a semelhana apresentada pelas estruturas adotadas pelas linguagens documentrias.
No poderia ser diferente, uma vez que as LD so construdas a partir da LN, quer dizer,
tomam como modelo as relaes paradigmticas e as relaes sintagmticas existentes en-

50

tre as palavras. Para as primeiras, o conceito de hierarquia est sempre presente pois, o significado de cada palavra traz consigo a sua insero em uma classe de objetos, inferindo-se
da a posio da palavra na ordem de gneros e espcies: /rvore/ supe /vegetais/ e tambm /macieira/. Para as relaes sintagmticas, a reunio de palavras representa a busca de
um sentido, isto , classes distintas de palavras que intencionalmente reunidas vo compor
uma mensagem: /rvore/ e /madeira/ e /casa/ e /incndio/ e ... Essa reunio da natureza de
redes, representada pela possibilidade infinita de combinaes entre as palavras, enquanto
as inferncias nas relaes paradigmticas so finitas, contidas numa escala entre o maior
gnero e a menor espcie. Esses so os sentidos de ordem/hierarquia e de desordem/rede.
Vale ressaltar que a idia de enciclopdia ligada desordem e portanto rede, simboliza a
forma como os temas so reunidos circunstancialmente ou pragmaticamente, a partir de um
roteiro, como uma das inmeras possibilidades de anlise do conhecimento.
Todas as LD incluem, em maior ou menor grau, as imagens de hierarquia e rede, o
que torna complexa uma classificao segundo esses critrios. No entanto, isolando-se alguns atributos compartilhados pelas principais LD, pode-se tentar compreend-las sob essa
nova perspectiva, ao menos no que se refere s suas propostas de utilizao no espaotempo. Os trs momentos que se seguem devem ser compreendidos como segmentaes
arbitrrias e, portanto, circunstanciais, na anlise das LD, no significando que os atributos
utilizados para a classificao sejam mutuamente exclusivos.

1 momento: domnio
A classificao tradicional das LD isolava dois atributos, at ento, considerados
antagnicos: universal, correspondendo a redues da totalidade do conhecimento e especializada, representando a totalidade de alguns domnios do conhecimento. No primeiro,
encontram-se as classificaes bibliogrficas universais, os macrotesauros, as listas de cabealhos de assunto construdas com base nas classificaes universais; no segundo atributo, os tesauros, as classificaes e listas de assuntos de domnios especficos. Do ponto de
vista da condio hierrquica dessas linguagens, a dicotomia universo/espcie verdadeira.
Quanto s suas redes de relaes associativas ou sintagmticas, a totalidade/especialidade
fica comprometida, uma vez que no se consegue analisar um aspecto do conhecimento
sem envolv-lo com as circunstncias nas quais ele ocorre. Nesse caso, o modelo da enciclopdia como roteirizao de um domnio mais adequado pois implica, ao mesmo tem-

51

po, a idia de todo e tambm a de parte. como se do todo escolhssemos uma poro
nuclear e, a partir dela, estabelecssemos as relaes necessrias com esse todo. Por exemplo: se o meu interesse sobre /energia nuclear/ qual a rede de relaes necessrias para
efetuar uma moldura, um roteiro de anlise dessa poro do todo? Certamente, vrios aspectos presentes no todo, tais como: fsica, qumica, biologia, economia, religio, educao ... Em vez de efetuar-se simplesmente um recorte do universo, construi-se uma rede de
referncias que deve estar representada na lngua natural (escrita e oral) e na metalnguagem documentria.

2 momento: objeto
Tem-se por certo que as LD podem estruturar-se por conceitos, isto , por abstraes de objetos representados por um smbolo da lngua natural, de carter unvoco e restrito, ou por assuntos, que definiramos como a representao da soma de vrios conceitos.
Tradicionalmente, as LD foram concebidas a partir da anlise dos assuntos presentes na
literatura, portanto a unidade referencial das classes e subclasses era formada por prcoordenaes conceituais. Do mesmo modo, as Listas de Cabealhos de Assunto adotaram
este mesmo princpio, j que seu objetivo o de codificar, por palavras, o que a Classificao havia codificado com a notao. A noo de conceito como unidade estrutural das LD
surge com a proposta de Ranghanathan seguida por Sayers, Bliss, Mills e os trabalhos do
Classification Research Group, culminando, na atualidade, com um campo de estudos denominado Organizao do Conhecimento cuja base terica repousa na Teoria Analtica
do Conceito de Ingetrat Dhalberg27. As LD mais representativas das estruturas pscoordenadas, isto , estruturas que se formam por relaes conceituais e no por relaes
de assuntos, so as classificaes facetadas e os tesauros. Wanderley28 , discute a correlao dessas estruturas, com base no modelo de Gardin para os lxicos documentrios, distinguindo-os em classificaes unidimensionais e pluridimensionais, conforme se estruturam numa s, ou em mais de uma dimenso. Por dimenso de uma organizao, explica o
autor, entende-se a natureza das relaes analticas, paradigmticas, que a constituem, ou,
em outras palavras, da relao dos termos classe a que pertencem. As unidimensionais
podem ser representadas pelos sistemas taxonmicos no estilo das Cincias Naturais, onde,
de fato uma s relao informa todos os nveis: reino classe subclasse ordem
subordem famlia gnero espcie nome comum, quando se diz que so unidi-

52

mensionais reais. Para aquelas em que a multiplicidade se esconde em uma unidade, como
o caso das classificaes decimais (ex: Dewey Decimal Classification CDD), diz-se que
so unidimensionais aparentes. As pluridimensionais renem as organizaes semnticas
(essncia, definies) e as sintticas (acidentes, funes) e so denominadas de classificaes facetadas (Colon Classification). Wanderley inclui, ainda, o conceito de mistas, no
qual se inserem as classificaes que alternam os pontos de vista essenciais e funcionais, e,
entre elas os esquemas ditos analtico-sintticos (Decimal Universal Classification CDU),
tais como o concebe Gardin. Desta proposta de anlise das estruturas de classificaes
bibliogrficas nota-se a que a preferncia da organizao pluridimensional denota uma
tendncia de considerar o conceito, perspectivado pelos vrios domnios do conhecimento,
como a unidade principal e necessria representao documentria.

3 momento: ordem
Se a ordem nica representada pelas taxonomias, como no caso das cincias naturais, ou as aparentes estabelecidas pelas LD que hierarquizam assuntos, no nos servem
para estabelecer as representaes, ao mesmo tempo, essenciais e funcionais dos objetos
que nos so indicados pela pragmtica, no sentido de efetuar a plenitude da semiose, devemos nos valer ento da multiplicidade de ordens, conforme os ns da rede de conhecimentos que queremos representar. Partindo do suposto de que a Rede de Conhecimentos
que vai indicar a melhor organizao de sua representao, a constituio das LD vai pressupor a identificao e a segmentao do domnio do conhecimento, a fim de poder efetuar
a anlise de seus conceitos chaves. Se a literatura monogrfica foi a nica responsvel pelo
desenho das classificaes unidimensionais, cujo objetivo principal era o do arranjo fsico
dos documentos e da recuperao do todo temtico, e a literatura peridica proporcionou o
surgimento de LD especializadas, de cunho semntico, como foi o caso dos tesauros meramente alfabticos, a produo do conhecimento armazenada na memria documentria
da atualidade vai necessitar de instrumentos que no s delimitem campos conceituais, mas
que os organize em segmentos hierrquicos. As listas de cabealhos de assunto, como espelho da estrutura classificatria utilizada na organizao de acervos da memria documentria, s tm sua sobrevivncia assegurada pelo domnio que os grandes acervos bibliogrficos impem como paradigmas, por exemplo, a biblioteca do congresso americano (Library of Congress). Nesse caso, o domnio est dado pela ideologia de acumulao da insti-

53

tuio, o que significa que as pr-coordenaes conceituais existentes na linguagem, embora de fcil acesso por estarem prontas ao uso, no so adequadas a outras perspectivas de
anlise. A escolha ou construo de um roteiro situacional vem a ser a tarefa mais complexa da constituio de linguagens documentrias e os tesauros, assim como as classificaes
bibliogrficas (facetados) construdos com base nesses pressupostos, so as linguagens que
podem orientar com maior eficincia os processos de representao da informao.
Resta, ainda, discorrer como as LD operam no quadro das representaes documentrias, vistas como linguagens de comunicao entre a informao documentria e o usurio que dela necessita. Para Maria Cristina Pinto29, as LD atuam nos sistemas de recuperao de informaes em dois nveis: orientando o analista sobre quais os melhores termos
para representar o assunto de um documento, e orientando o pesquisador sobre a escolha
dos termos que corresponderiam representao do assunto por ele procurado. Essas orientaes vo desde o simples controle semntico de termos sinnimos at a construo de
complexas redes pragmticas de referncias cruzadas, dando ao usurio outras opes de
busca em relao ao assunto procurado. Correspondem, portanto, s linguagens documentrias as seguintes funes:
a) organizar o campo conceitual da representao documentria, pois, segundo La30

ra , ...pode-se afirmar que as linguagens documentrias devem possibilitar a condio de


referncia, para que se estabeleam as articulaes necessrias ao engendramento de significados. Vrios fatores so apresentados por Lara para que essas condies aconteam.
Em uma leitura sinttica, pode-se afirmar que dois aspectos permeiam tais fatores. O primeiro a correspondncia entre o sistema de significao do domnio em questo e a linguagem documentria, o que configura, no plano conceitual, a chamada garantia literria.
Quer dizer, o sistema conceitual aparente na literatura observada deve ser o mesmo da linguagem documentria. O segundo a adequao da linguagem documentria ao perfil do
grupo de usurios em questo, o que representa a garantia conceitual do uso, ou garantia
do usurio. Essas duas garantias (Literria e do Usurio) refletem um contexto onde tanto o
universo documental quanto as necessidades de informao do usurio so consideradas.31
b) servir de instrumento para a distribuio til dos livros ou documentos. Essa
funo cumprida pelas classificaes bibliogrficas, sendo que as mais utilizadas at
hoje so a CDD (Dewey Decimal Classification) e a CDU (Classificao Decimal Universal), as quais foram construdas pelo mtodo dedutivo, unidimensional e misto respectiva-

54

mente, onde se agrupam os assuntos de acordo com as disciplinas do conhecimento. Estas


classificaes, basicamente construdas com a finalidade de organizar os documentos em
bibliotecas, tem ainda hoje uma utilidade indiscutvel, quando se trata de localizar fisicamente o documento em sua classe de assunto. As classificaes de assuntos atendem plenamente s exigncias do arranjo dos documentos em bibliotecas mas, exatamente por organizarem assuntos e no conceitos, elas no possuem a complexidade necessria para organizar, por exemplo, um acervo documentrio representado por uma s classe, subclasse,
ou at mesmo um tema especial, j que o nvel requerido para a anlise dos conceitos ocorre a um grau de especificidade muito superior ao da sua formao estrutural. Durante muitos anos, as bibliotecas especializadas preferiram usar a Classificao Decimal Universal
que, embora no possa ser considerada uma classificao facetada em sua plenitude, oferece uma maior flexibilidade na composio dos assuntos, apresentando snteses notacionais
mais subjetivas.

c) controlar as disperses lxicas, sintticas e simblicas no processo de anlise


documentria. Ao contrrio da funo de dispor e localizar o documento na sua forma fsica
integral, as linguagens documentrias - listas de cabealhos de assunto e tesauros, orientam
a organizao intelectual para a desconstruo do texto em lngua natural e sua representao codificada e sinttica, constituindo-se em instrumento de anlise semntica e sinttica.
Visam, portanto, a obter por ocasio das respostas aos pedidos de informao, um mximo de indicaes relevantes ou pertinentes e, para tal, de coincidncia entre as descries de
autoria do classificador ou do indexador e as do usurio, em sntese, a normalizao. Alm
de economizar smbolos, eliminar redundncias e condensar informaes, as linguagens
documentrias facilitam a modulao das questes (hierarquizao da informao), generalizando-lhes ou especificando-lhes a compreenso, mediante a organizao semntica. Por
exemplo, posso iniciar a busca por um conceito especfico /manga espada/ e verificar, pela
estrutura hierrquica do conceito, que o conceito de /manga/ mais interessante para a minha pesquisa. Quando as linguagens desse tipo so consideradas linguagens-produtos do
processo de catalogao, temos as listas de cabealhos de assunto. As listas de cabealhos de
assunto so linguagens documentrias que organizam uma rede de relaes temticas (modelo da enciclopdia), de carter conceitual pr-coordenado, uma vez que refletem no os
conceitos principais de um domnio do conhecimento, mas os assuntos estruturados no

55

sistema de classificao bibliogrfica utilizado como representao do item documentrio.


Como cdigos documentrios, renem regras de unio de cabealhos e sub-cabealhos e de
controle semntico (sinonmia, homonmia). Os assuntos atribudos a cada documento so de
cunho geral, representando a sntese temtica efetuada no momento de atribuir a notao
classificatria. Segundo Shera32, o fator central de xito ou insucesso de um catlogo a
eficcia do sistema de classificao no qual se baseia. Isto vem a comprovar que a atribuio
de cabealhos de assunto a um documento est irremediavelmente presa ao cdigo de assunto atribudo a ele.
Na verdade, poder-se-ia questionar que no h um limite terico para atribuio de
cabealhos de assunto a um determinado documento. Mas, o que ocorre que o sistema de
catalogao fundamentalmente um sistema desenhado para recuperao manual na sua
essncia, no permitindo, assim, estender em demasia o nmero de fichas catalogrficas
para cada documento. A praticabilidade no manuseio do catlogo fator relevante no tempo despendido para recuperar um assunto, sendo, portanto, utilizado para recuperar documentos somente em seus assuntos dominantes. Por outro lado, as listas de cabealhos de
assunto desenvolveram-se a partir dos catlogos de bibliotecas, sendo constitudas para
sistemas em funcionamento e s utilizadas em funo das necessidades dos mesmos. Em
sua maioria, traduzem a experincia particular de cada sistema para o qual foram construdas, tornando-se instrumentos limitados, dada a caracterstica de funcionamento e utilizao dos catlogos bibliogrficos33 e ineficientes quando transpostas a outros sistemas ou
quando utilizadas a um grau de profundidade de indexao superior capacidade de controle, sem ferir a relevncia na recuperao.
Por outro lado, quando as linguagens so consideradas linguagens-produtos do processo de indexao, temos os tesauros. Os tesauros possuem uma caracterstica singular no
mbito das LD que a organizao do seu campo terminolgico. Segundo Leska34, o desenvolvimento de terminologias direcionado melhor designao para o significado dos
conceitos individuais e, consequentemente, para a mais precisa limitao deste significado.
O sentido de normalizao vem, sem dvida, desta reduo de significado. Assim, os tesauros renem conceitos, que, embora sejam representados por smbolos lingsticos, tm
restrito o significado. Este , precisamente, o campo onde os tesauros se identificam com
os sistemas conceituais, ou seja, para cada conceito s pode existir uma representao simblica, designada de termo ou descritor.

56

Aos tesauros, sua histria, desenvolvimento no mbito da Cincia da Informao e,


particularmente, sobre os fundamentos tericos para a sua construo, manuteno e utilizao, dedicaremos o prximo captulo.

Notas e citaes
1

COYAUD, M. Linguistique et documentation: les articulations logiques du discours. Paris: Larousse, 1972.
173 p.p. 130

Neste trabalho, usaremos a expresso /lngua/ com o sentido de lngua natural e /linguagem/ para linguagens
de comunicao. Sobre as diferenas semnticas entre lngua e linguagem Martinet afirma que, h meio sculo, as definies de linguagem vm apresentando uma certa coerncia, pois partem todas do princpio de que
a linguagem um sistema de signos utilizados para estabelecer a comunicao. Mas, o autor estabelece uma
oposio entre lngua e linguagem. A lngua definida pelo carter vocal, a linearidade e a dupla articulao,
e a linguagem um conceito mais vasto identificado com o sistema de signos que permite efetivar a comunicao. Saussure, por sua vez, alm de distinguir lngua e linguagem, observa que lngua (langue) e fala (parole) so partes de um todo que a linguagem. A primeira se situa no campo social e a segunda na esfera do
indivduo. Cf. NOCETTI, Milton A., FIGUEIREDO, R. C. Lnguas naturais e linguagens documentrias:
traos inerentes e ocorrncias de interao. R. Bibliotecon. Braslia, v. 6, n. 1. p. 23-37.

WANDERLEY.M. A. Linguagem documentria. op. cit. p. 176.

LANCASTER, F. W. Indexo e resumos: teoria e prtica. Braslia: Briqut de Lemos, 1993. p. 15-17.

GROLIER, Eric de. tude sur les catgories gnrales applicables aux classifications et codifications
documentaires. Paris : UNESCO, 1962. p. 262.

RANGANATHAN, S. R. Philosophy of library classification. Copenhagen: Ejnar Munksgaard, 1951. p. 33

WANDERLEY, M. A. op. cit. p. 188.

As referncias a esses autores se encontram ao logo do texto, em citaes, ou na bibliografia.

CUNHA, Maria Isabel R. Ferin. Do mito anlise documentria. So Paulo: EDUSP, 1990. (Tese de
doutorado) p. 59
10

CUNHA, Maria Isabel R. Ferin. Do mito ....Op. cit. p. 19

11

WANDERLEY, Manoel Adolpho. op. cit. p. 187

12

CUNHA, Maria Isabel R. Ferin. (Coord.) Anlise documentria: consideraes tericas e experimentaes.
So Paulo: FEBAP, 1989. p. 28 e 29

13

CINTRA, Ana Maria Marques. Estratgias de leitura em documentao. In: SMIT, Joahanna W. (coord.)
Anlise documentria: a anlise da sntese. Braslia: SCT-PR/CNPq/IBICT, 1898. p. 30-38.
14
Cf, ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo: Perspectiva, 1991.
15

16

CUNHA, Maria Isabel R. Ferin. Do mito .....Op. cit.p. 111

SMIT, Johanna, W. A anlise da imagem: um primeiro plano. In: Anlise documentria: consideraes
tericas e experimentaes. So Paulo: FEBAP, 1989. p. 102-113

57

17

COULON, Daniel, KAYSER, Daniel. Informtica e linguagem natural: uma viso geral dos mtodos de
interpretao de textos escritos. Braslia: SCT-PR/CNPq/IBICT, 1992. p.11
18

NOCETTI, Milton A., FIGUEIREDO, R. C. Lnguas naturais e linguagens documentrias: traos inerentes
e ocorrncias de interao. R. Bibliotecon. Braslia, v. 6, n. 1. p. 23-37.
19

Vrias correntes da lingstica contempornea reconhecem uma dupla articulao da lngua. Na lngua,
articulam-se entre si unidades de primeira articulao, dotadas de significado (a lngstica europia
chama-as monemas e a lingstica norte-americana, morfemas) e identificveis, embora nem sempre, com a
palavra. Tais unidades combinam-se entre si e formam unidades mais vastas chamadas sintagmas. Mas as
unidades de primeira articulao, que podem ser numerosssimas no interior de uma lngua, como o
demonstram os dicionrios, constroem-se combinando entre si unidades de segunda articulao, os
fonemas, dotados de valor diferencial uns em relao aos outros, mas desprovidos de significado. Cf.
MARTINET, apud ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo:
Perspectiva, 1991. p. 32.

20

NOCETTI, Milton A., FIGUEIREDO, R. C. Op. cit.

21

CINTRA, Ana Maria Marques et al. Para entender as linguagens documentrias. So Paulo : Polis : APB,
1994. p. 18
22

ECO, Umberto. Semitica e filosofia da linguagem. So Paulo: tica , 1991.

23

ECO, Umberto. op. cit. p. 75

24

SAUSSURE, Ferdinand de. Curso de Lingstica geral. So Paulo: Cultrix, 1974. p. 136-139.

25

Cf. DELEUZE, G., GUATTARI, F. Rhizome. Paris: Minuit, 1976.

26

ECO, Umberto. Semitica e filosofia da linguagem. op. cit. p. 245-290.

27

A discusso maior sobre organizao conceitual se dar no prximo captulo.

28

WANDERLEY, M.A . Linguagem documentria: acesso informao. Ci. Inf., Rio de Janeiro, v. 2, n. 2. p.
175-217, 1973. p. 204
29

PINTO, Maria Cristina Mello Ferreira. Anlise e representao de assuntos em sistemas de recuperao da
informao; linguagens de indexao. R.. Esc. Bibliotecon., UFMG, Belo Horizonte, v. 14, n. 2 p. 169-186,
set. 1985.
30

LARA, Marilda Lopes Ginez de. Algumas contribuies da semiolologia e da semitica para a anlise das
linguagens documentrias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993
31

Voltaremos a esta questo posteriormente, quando da anlise das fontes para a construo de tesauros.

32

SHERA, J. H., EGAN, M. E. op. cit., p. 37

33

Shera ressalta dois objetivos principais do catlogo de biblioteca: inventrio e recuperao da informao,
sendo que o ltimo a sua funo mais importante.
34
LESKA, B. M. Theoretical and methodological problems of therminology In: PROCEEDINGS of
international symposium, Nov. 27-30, 1979, Warsaw.

4 Tesauro - parte 1: anlise do domnio

58

Um pouco da histria

59

Segundo Vickery1, a palavra tesauro (latim = thesauru, grego = thesaurs) teve origem na Grcia significando Treasury or Storehouse (tesouro ou armazenagem / repositrio), sendo que em 1936 o Oxford English Dictionary definiu a expresso inglesa como um
dicionrio, enciclopdia e similares. Em 1852, Peter Mark Roget publicou o Thesaurus of
English Words and Phrases, uma coleo de termos organizada no em ordem alfabtica,
como em um dicionrio, mas de acordo com as idias que expressavam. O objetivo de tal
estrutura era o de encontrar as palavras pelas quais as idias pudessem ser mais bem expressas em textos.

De acordo com Gomes2, Roget era secretrio da Royal Society e

pretendia, com aquela obra, facilitar sua atividade literria. Levou nesse trabalho cerca de
50 anos. Argumentava Roget que o propsito de um dicionrio comum simplesmente
explicar o significado das palavras, mas o problema para o qual ele pretendia oferecer a
soluo poderia ser apresentado assim: sendo dada uma palavra, pode-se encontrar seu
significado ou a idia que ela pretende trazer consigo, em um dicionrio. Mas, ao contrrio:
tendo-se uma idia, qual/quais palavras podem melhor expressar seu significado? Com esse
objetivo, as palavras e frases da lngua foram arranjadas no Rogets Thesaurus no de acordo com seu som ou ortografia, mas estritamente de acordo com seu significado.
Peter Mark Roget organizou as palavras da lngua inglesa em seis categorias conceituais: relaes abstratas espao matria intelecto volio afeies. Essas categorias foram subdivididas em classes, que por sua vez foram divididas em sees, subsees e
conceitos isolados, tal como no recorte abaixo:
Classe 1 - Palavras que expressam Relaes Abstratas
Seo 1 - Existncia
1.1. Ser, no abstrato
1.1.1. Existncia
1.1.2. Sem existncia
1.2. Ser, no concreto
1.3. Existncia Formal
1.4. Existncia modal
1.5. etc.

60

A figura abaixo um recorte do hipertexto3 para a expresso Existncia, que inicia


o Roget Thesaurus, tal como a pgina manuscrita.
NOUN: EXISTENCE, being, entity, ens [L.], esse [L.], subsistence; quid, hypaxis [rare], automaton.
REALITY, actuality; positiveness &c. adj.; fact, matter of fact, sober reality; truth [See
Truth]; actual existence.
PRESENCE (existence in space) [See Presence]; coexistence [See Synchronism].
STUBBORN FACT; not a dream [See Imagination]; no joke.
ESSENCE, inmost nature, center of life, inner reality, vital principle.
[SCIENCE OF EXISTENCE] ontology.

VERB: EXIST, be; have being &c. n.; subsist, live, breathe, stand, obtain, be the case; occur
(event) [See Eventuality]; have place, rank, prevail; find oneself, pass the time, vegetate.
come into existence &c. n.; arise (begin) [See Beginning]; come forth (appear) [See
Visibility].
BECOME (be converted) [See Conversion]; bring into existence [See Production];
coexist, postexist [rare], prexist [rare].
CONSIST IN, lie in; be comprised in, be contained in, be constituted by.
ABIDE, continue, endure, last, remain.
ADJECTIVE: EXISTING &c. v.; existent, subsistent, under the sun; in existence &c. n.; extant; afloat,
on foot, current, prevalent; undestroyed.
REAL, actual, positive, absolute; factual, veritable, true [See Truth]; substantial, substantive; self-existing, self-existent; essential, bent.
WELL-FOUNDED, well-grounded; unideal, unimagined; not potential [See
Nonexistence]; authentic.
ADVERB: ACTUALLY &c. adj.; in fact, in point of fact, in reality; indeed; de facto [L.], ipso
facto [L.].
QUOTATIONS:

1. Ens rationi.
2. cogito ergo sum.
3. Thinkst thou existence doth depend on time?Byron
4. All is concenterd in a life intense.Byron
5. To live is not merely to breathe, it is to act.Rousseau
6. The mainspring of life is in the heart.Amiel
7. I came like Water, and like Wind I go.Omar KhayymFitzgerald

Vale ressaltar que ao RogetThesaurus so dedicados vrios endereos na Internet,


no s com contedos histricos, mas com as edies recentes do tesauro para consulta em

61

tela. O campo ou domnio desse tesauro a lngua inglesa e seu propsito continua a ser
aquele imaginado por Roget ou seja, o de auxiliar na escolha de uma expresso que melhor
reflita o conceito existente na mente do escritor. Por outro lado, como concepo, o modelo do RogetThesaurus utilizado no ensino da lngua inglesa, em pesquisas de natureza
lingstica e filolgica, jogos e lazer, propaganda e marketing de empresas comerciais.
No Brasil, alm das iniciativas comentadas por Gomes, descobrimos uma obra intitulada Dicionrio inverso4, cujo objetivo era o de proporcionar maior facilidade de consulta aqueles que se dedicam arte-cincia educativa e recreativa das palavras cruzadas e
das charadas e enigmas em geral. A sua ordenao deve ser vista sob o prisma inverso dos
lxicos usuais - do significado para a palavra que o expressa. Embora este lxico (elaborado somente at a letra B) seja distinto do tesauro de Roget quanto ao uso, os dois tm em
comum o fato de organizarem os significados em detrimento dos smbolos utilizados na
linguagem natural para represent-los.
A partir de 1940, o termo tesauro comeou a ser utilizado na esfera da Cincia da
Informao e, em especial, no processo de recuperao da informao, como sendo um
instrumento capaz de transportar conceitos e suas relaes mtuas, tal como expressos na
linguagem dos documentos, em uma lngua regular, com controle de sinnimos e estruturas
sintticas simplificadas. Ainda segundo Gomes, o tesauro documentrio surgiu da necessidade de manipular grande quantidade de documentos especializados. Era preciso trabalhar
com vocabulrio mais especfico e com uma estrutura mais depurada do que aquela presente nos cabealhos de assunto (remissivas e referncias cruzadas tipo ver e ver tambm).
Assim, alm da especificidade, cuidou-se de melhorar a estrutura, e as referncias cruzadas
(ver tambm) deram lugar s relaes hierquicas (paradigmticas) e associativas (sintagmticas). Pelo fato desse novo instrumento da documentao possibilitar, atravs do agrupamento dos termos, o acesso a uma idia, mesmo sem saber nome-la de sada, as novas
listas estruturadas de termos passaram a ser chamadas de tesauros, por analogia com a obra
de Roget, embora com a funo de indexar/recuperar informao. E a esto presentes as
duas grandes caractersticas do tesauro de documentao: os conceitos, representados por
termos (descritores ou preferidos) e as relaes entre eles.
O desenvolvimento acelerado dos tesauros documentrios se deu mediante vrios
aspectos. Luhn5 ressaltou a possibilidade de automatizar a indexao, onde tal instrumento
se fazia necessrio dado que a passagem de palavras de texto para palavras-chaves s pode-

62

ria ser obtida por processos automticos se as associaes de palavras fossem previamente
armazenadas em uma memria. Bernier e Heumann6 propuseram o uso do tesauro com o
sentido de coincidir os vocabulrios de uma solicitao de pesquisa com o do sistema de
recuperao de informaes, formando trs tipos de ajuda: restrio do nmero de palavras-chaves, lista classificada de termos e definies de palavras-chaves. Wall7 listou alfabeticamente as palavras-chaves, provendo-as de referncias cruzadas dos seguintes tipos:
sinnimos, termo genrico, termo especfico e termo relacionado. A caracterstica de abrangncia no uso de relaes entre os termos foi enfocada por M. Taube8, que props um
esquema de associaes entre o termo a indexar com outras palavras-chaves que pudessem
ser relevantes e utilizadas tanto para a indexao como para a recuperao de informaes.
Heald9 descreveu o tesauro como um instrumento dividido em duas partes: a primeira
uma lista alfabtica de palavras-chaves e referncias cruzadas para indicar a hierarquia de
conceitos, e a segunda a prprio estrutura hierrquica, apresentando as categorias ou facetas do vocabulrio. Por fim, a UNESCO10 define o tesauro com sendo vocabulrio controlado e dinmico de termos relacionados semntica e genericamente, que cobre de forma
extensiva um campo especfico do conhecimento e a COSATI11 como uma recompilao
de termos selecionados com as apropriadas relaes mtuas e expostos de maneira a obter
mxima coerncia na descrio de conceitos para a confeco de ndices ou recuperao de
informaes.
O emprego de tesauros nas tarefas de indexao e recuperao de informaes tenta
resolver o problema da alocao de documentos em classes de assuntos, no s por sua
capacidade de controlar o vocabulrio, mas porque um instrumento que relaciona os descritores/termos de forma mais consistente, apresentando uma estrutura sinttica simplificada e uma complexa rede de referncias cruzadas. Isto permite ao especialista localizar com
mais facilidade a palavra-chave requerida para uma busca. Apresenta, ainda, um relacionamento lgico e hierrquico dos descritores, o que contribui para a indexao dos documentos ao nvel especfico e/ou genrico (modulao). Segundo Foskett12, o principal objetivo do tesauro o de controle terminolgico e, em concordncia com Lancaster13, lista
suas principais funes: controlar sinnimos e quase sinnimos; distinguir homgrafos;
facilitar a conduo da busca por meio dos termos relacionados e das referncias cruzadas
(estrutura sinttica), melhorando a consistncia da indexao e transportando a linguagem

63

de busca para a linguagem de indexao; e, reduzir o tempo e aumentar a eficincia nas


tarefas de indexao e recuperao de informaes.
Partindo do princpio de que no existe uma linguagem documentria adequada ao
campo conceitual para o qual se deseja representar os documentos de uma coleo, a tarefa
mais produtiva a construo de uma nova linguagem que seja til representao dos
dois universos integrantes do sistema de recuperao da informao: universo das demandas de informao e universo dos documentos disponveis. Essa necessidade de interao
do documento com o usurio faz com que o fluxo do trabalho na construo de uma linguagem documentria, especificamente de uma estrutura conceitual como o tesauro, obedea a uma seqncia lgica de passos que, embora comum maioria dos mtodos utilizados para a construo de linguagens documentrias, deve ter por base alguns princpios
gerais que regem a construo deste tipo de vocabulrio controlado.

Determinao do universo conceitual


De acordo com Gomes14, existem vrias possibilidades para o estabelecimento do
universo conceitual, dependendo das circunstncias na utilizao da linguagem e das caractersticas do sistema de informaes para o qual esta ser concebida. Por exemplo, existir
uma diferena substancial na concepo de uma linguagem para um novo servio de informao, que no apresentou formalmente o universo de demandas de informao, e de
um sistema em operao, onde j existe um universo terminolgico em uso. No primeiro
caso, necessrio desenvolver um estudo preliminar sobre o campo conceitual de interesse
dos usurios atuais e potenciais do sistema de informao para o qual o tesauro ser
desenvolvido. Tais estudos, como dissemos no captulo anterior, constituem-se na tarefa
mais complexa da elaborao de uma linguagem documentria e, na maioria das vezes no
conduzida com a propriedade de uma anlise abrangente, tanto dos documentos
produzidos quanto do interesse informacional dos seus utilizadores. Se por um lado, existe
um consenso de que a melhor fonte de informao a literatura produzida, por outro, os
estudos de usurios dificilmente fazem parte do planejamento para a construo de
linguagens documentrias. E, alm desses, a preocupao com a classe de problemas
existentes no campo conceitual de interesse da comunidade para a qual o sistema e a
linguagem estariam sendo desenhados s vem a ocorrer a partir de 1990.

64

As contribuies para a determinao de fontes se iniciam com Soergel15, para


quem a seleo dos termos pode ser obtida atravs de uma srie de fontes de informao,
compreendidas em dois tipos distintos:
1. Fontes primrias
 lista de pesquisas retrospectivas e perfis de interesse;
 discusses com usurios em potencial, a fim de identificar seus interesses e determinar possveis pesquisas, resultando numa lista de termos;
 reunio de documentos representativos da rea especfica do tesauro para discusso
e eleio dos termos por comit de especialistas;
 indexao de vrios documentos feita por especialistas ou indexadores de centros de
informao.
2. Fontes secundrias
 listas de descritores, esquemas de classificao, outros tesauros;
 tratados de terminologia acerca de um campo de assunto especfico;
 enciclopdias, dicionrios, glossrios e similares;
 sumrios e ndices de manuais e livros tcnicos;
 ndices e abstracts de publicaes peridicas;
 ndices de outros tipos de publicaes na rea.
Esses dois conjuntos indicados por Soergel, na verdade, podem ser explicitados
pelo significado que as expresses primrio e secundrio assumem na Cincia da Informao. As fontes primrias so representadas pela comunicao do conhecimento que est
expressa em linguagem natural. As fontes secundrias so representaes sintetizadas do
conhecimento, apresentando uma interpretao estruturada em uma linguagem documentria. No que diz respeito determinao do universo terminolgico que se vai dispor para
construir uma linguagem, a preferncia deve ser dada ao uso das fontes primrias, uma vez
que essas apresentam, de acordo com a escala de reduo de significado, uma fidelidade
maior ao sentido da comunicao expressa nos documentos ou na formulao de uma necessidade de informao.
Gomes16 afirma que a escolha dos termos feita a partir da literatura, por exemplo,
permite obter o termo com o significado que lhe atribuem os especialistas da rea. Esse
significado, apreendido a partir do contexto em que o termo aparece, o que vai ser levado
em conta no momento de estruturar os conceitos em suas diversas relaes. Por outro lado,

65

quando a terminologia levantada a partir de fontes secundrias, isto , de outras linguagens documentrias, deve-se ter em mente as diferenas conceituais entre termos j estruturados e os significados destes presentes na comunicao em linguagem natural. Normalmente, uma classificao bibliogrfica construda pelo mtodo hierquico apresenta termos
estruturados em assuntos pr-coordenados, merecendo, portanto, a anlise conceitual que
transformar um assunto numa soma de conceitos principais.
Embora existam classificao facetadas que estruturam os conceitos e no os assuntos, ainda assim os conceitos e idias muitas vezes no esto explicitados numa forma verbal correta. Como exemplifica Gomes, a sntese conceitual se d apenas na notao:
Nq Instalao de esgoto
Nq2 Esgoto sanitrio

A expresso esgoto sanitrio representa a idia de instalao de esgoto sanitrio e


no o prprio esgoto. Nesse caso, se aquela forma verbal for mantida, deve-se acrescentar
uma nota explicativa informando que sob aquele termo devem ser indexados documentos
sobre instalao de esgotos sanitrios, ou adicionar um qualificador para tornar o termo
mais expressivo, como, por exemplo: esgoto sanitrio (instalao).
Dodebei17, ultrapassando a discusso isolada da natureza das fontes, considera que
a determinao do universo conceitual pode ser obtido tanto por conhecimento prvio do
domnio, como por observao do campo conceitual, reconhecendo, no campo da metodologia, a induo e a deduo como os mtodos de escolha para a composio desse universo.
Mtodo emprico
A obteno da terminologia se faz mediante a identificao de termos provveis,
a partir do exame da literatura corrente, tendo como princpio bsico de eleio a freqncia de ocorrncia terminolgica e a conseqente incidncia desses termos nas perguntas
que sero feitas ao sistema de informao. O mtodo chamado Emprico por Lancaster18,
Estalagmite por Wooster e Analtico pelo American National Standard Institute (ANSI)
apud44, expressa o processo de construo a ser levado em considerao no desenvolvimento do tesauro, onde as rvores hierrquicas so construdas a partir dos termos coletados na
literatura, at se obter mximos gneros e mnimas espcies, que daro origem s classes
gerais ou facetas principais.

66

Mtodo consensual
A obteno da terminologia se faz por consenso de peritos no assunto, mediante a
formao de comits para discusso acerca dos termos que iro compor a estrutura do lxico documentrio e tendo como justificativa a garantia dos produtores e utilizadores do sistema de informao; da decorre um processo de deduo das espcies a serem includas, a
partir da definio, baseada no conhecimento, das classes gerais ou facetas principais. O
mtodo chamado tambm de Gestalt, em contraposio a Analtico; Estalactite, em contraposio a Estalagmite; ou ainda Commitee Aproach, em contraposio a Emprico.
Os mtodos Emprico e Consensual derivam, por sua vez, de dois princpios que
regem o levantamento dos termos e que so, respectivamente, a Garantia Literria e o Endosso do Usurio.

Garantia literria
A expresso Garantia Literria (Literary Warrant ou Bibliographic Warrant) foi
usada por Wyndhan Hulme19 em 1911, que defendia que a determinao de classes na
construo de linguagens documentrias no deveria ser baseada na classificao do conhecimento e sim nas classes em que existe literatura; isto , as caractersticas da literatura
em si que determinam as classes definidas no sistema. Foskett20 assume o princpio da
Garantia Literria ao afirmar que os sistemas de recuperao de informao devem basearse no material que nele introduzimos e no em consideraes puramente lgicas. Goodman21, por sua vez, ao discutir o Thesaurus of Eric Descriptors, enfatizou o princpio da

67

Garantia Literria, ao ponto de afirmar que ningum pode, nunca, incluir um descritor no
tesauro, a no ser que um documento tenha sido nele classificado. Como exemplo, ainda,
de aplicao deste princpio, temos o sistema de classificao da Biblioteca do Congresso
Americano, que foi desenvolvido, pragmticamente, a partir do estudo de seu acervo bibliogrfico.

Endosso do usurio
A expresso Endosso do Usurio (User Warrant ou Personal Warrant), usada por
Lancaster22, uma confirmao direta dos produtores e utilizadores das informaes de um
campo de atividades de que os termos escolhidos so, efetivamente, aqueles utilizados na
comunidade e, portanto, sero eles utilizados nas solicitaes de pesquisa no acervo bibliogrfico. Chai Kim23, em artigo que discute os dois mtodos de levantamento dos termos,
Emprico e Consensual, observou, atravs de experimento, que a relevncia na recuperao
das informaes se d no mesmo grau quando utilizado uma linguagem construda a partir
de termos selecionados da literatura corrente (Emprico) ou um vocabulrio cujos termos
foram obtidos atravs do consenso de um grupo de peritos no assunto (Consensual). Kim
conclui seu trabalho com a argumentao de que o conhecimento e a comunicao deste
no podem ser conceituados separadamente, no sendo verdadeiro que o conhecimento
baseado no consenso de peritos seja fundamentalmente diferente do conhecimento expresso na literatura, j que a literatura a formalizao do conhecimento produzido. Kim, no
entanto, deixou de considerar que o conhecimento pode ainda no estar retratado na literatura, dado o hiato existente entre conhecimento e comunicao formal.
Na verdade, quando se trata de construo de linguagens documentrias, o ideal
seria que se pudesse absorver os dois princpios concomitantemente, isto , certificar-se de
que a terminologia levantada possui as duas garantias: literria e do usurio. A esse respeito pode-se citar a experincia de Pickford24, que desenvolveu uma linguagem documentria
para a Biomedicina no National Institute for Medical Research, Inglaterra. O lxico documentrio foi construdo, tomando-se por fonte uma coleo literria abrangendo peridicos especializados. Aps a indicao feita pelos usurios do centro de pesquisa acerca dos
peridicos que deveriam pertencer a uma coleo de engenharia biomdica (1/3 do material
coletado), foram feitas cpias dos artigos que circularam entre os usurios em potencial. A
esses colaboradores foi solicitado que indexassem as cpias de acordo com uma srie de

68

normas, sendo que cada cpia circulou por dois especialistas de modo que dois pontos de
vista fossem obtidos. As respostas coletadas foram tratadas eletronicamente, sendo a escolha dos termos definida pela freqncia de uso na indexao. Esta metodologia obrigou
formulao de instrues rigorosas acerca da indexao de documentos, utilizando, portanto, o conhecimento do usurio acerca da matria, somado tcnica da indexao.
Nos Estados Unidos da Amrica, Dym25 desenvolveu o Thesaurus for Paint Technology para a Federation of Paint Technology, coletando os termos a partir do envio de
cpias de artigos de revistas tcnicas para os membros da Federao e solicitando que cada
colaborador sublinhasse os termos que considerasse representativos do contedo de cada
artigo. O processamento da terminologia se deu do mesmo modo que o adotado por Pickford.
Tanto Pickford quanto Dym utilizaram a um s tempo os princpios da Garantia
Literria e do Endosso do Usurio, obtendo, como resultado do mtodo, a terminologia
preferida por usurios em potencial do sistema de informao, o nvel de especificidade e o
grau de exaustividade requeridos para a indexao dos documentos, alm de envolverem os
usurios no processo, despertando o interesse e a participao mais efetiva nos programas
de documentao e informao.

Com base nessas duas experincias Dodebei26 desenvolveu uma pesquisa que visava a estabelecer uma metodologia de levantamento de termos para a construo de tesauros
contemplada com as duas garantias: literria e do endosso do usurio. O domnio escolhido

69

para testar a metodologia foi a Formao Profissional nas suas aes desenvolvidas no Brasil. A escolha de tal campo de assunto de deveu ao fato de que os estudos sobre a terminologia dessa especializao da Educao eram no s escassos, como disciplinares. Os instrumentos terminolgicos existentes ora se apresentavam no contexto geral da Educao,
ora no contexto da Economia. A inadequao dos instrumentos desenvolvidos para a rea
de Formao Profissional fez com que os diversos organismos interessados duplicassem
esforos para sistematizar vocabulrios tcnicos, de modo a minimizar suas prprias dificuldades internas de comunicao em uma mesma linguagem.
As instituies ligadas Formao Profissional procediam ao desenvolvimento de
seus prprios vocabulrios, criando-se um impasse no momento de trocar informaes entre si, dada a caracterstica de diversificao da linguagem quando do emprego de conceitos, tendo-se em vista, de uma lado, a extenso territorial do Brasil e seus regionalismos
lingsticos, e, de outro, as diversas posies tericas tradicionalmente adotadas. Aps o
estudo da comunidade atuante no campo da Formao Profissional, e da identificao da
classe de problema existente no seu campo de interesse, decidiu-se envolver as trs maiores
instituies para-governamentais que cobriam os setores primrio, secundrio e tercirio de
atividades econmicas, ou seja, o Servio Nacional de Aprendizagem Rural (SENAR), o
Servio Nacional de Aprendizagem Industrial (SENAI) e o Servio Nacional de Aprendizagem Comercial (SENAC).
A deciso baseou-se no fato de que essas instituies congregavam um nmero relevante de tcnicos em Formao Profissional, assim como possuam um acervo bsico de
obras e documentos sobre o assunto, sendo na sua maioria as produtoras dessa literatura.
Foram selecionados 250 artigos de peridicos nacionais e 250 tcnicos em Formao Profissional. Cada tcnico recebeu um artigo acompanhado de instrues. A seleo dos termos deveria ser feita aps a leitura (anlise de contedo), devendo-se sublinhar os conceitos (representados por palavras simples ou compostas) que fossem representativos do texto
em seu contedo global.
Aps a escolha dos termos, o colaborador deveria orden-los segundo a importncia
no texto, ou seja: em primeiro lugar os conceitos que se referissem ao contedo global do
artigo e, em seguida, aqueles que representassem aspectos particulares da matria tratada,
perfazendo um mnimo de dez conceitos ordenados dentro desse esquema. A seguir o colaborador deveria dar uma definio do primeiro conceito (desde que no fosse o assunto

70

geral Formao Profissional) na ordem de importncia, ou seja, o termo n. 1, redigindo de


maneira informal o que, para ele, seria o seu significado. Desta forma, obteve-se um conjunto de conceitos retirados da literatura corrente, escolhidos pelos tcnicos do domnio em
questo, sendo delimitado o campo conceitual principal, visto, exclusivamente, na tica da
Formao Profissional.
A unio dos princpios da Garantia Literria e do Endosso do Usurio um forte
indicador de que a linguagem documentria a ser construda para a indexao e recuperao da informao ser eficiente na traduo da linguagem natural, tanto do universo de
documentos que entram no sistema de informao, quanto do universo de possveis perguntas que sero formuladas acerca da existncia de documentos registrados no acervo.
A experincia metodolgica levada a efeito para a Formao Profissional no Brasil,
antecipou de certo modo e, ao menos no campo das linguagens documentrias, um conceito
de anlise situacional, o qual, a partir de 1990, reconhecido como anlise de domnio.
Beghtol27 e Hjorjand28 discorrem sobre a natureza do conceito, sobre as discusses que
antecederam o seu surgimento, tais como s que se referiam ao assunto/ aboutness (Saracevic, 1975), ao binmio relevncia e pertinncia (Lancaster, 1979), ao ambiente do uso
da informao (Taylor, 1991), e aquelas sobre as implicaes do conceito para a Cincia da
Informao, deslocando seu polo de ateno do documento/indivduo, para o acervo/grupo
social. Se a anlise de domnio o processo de identificar e organizar o conhecimento sobre alguma classe de problema, em que medida ela ultrapassaria, no campo da construo
de linguagens documentrias, a soma das garantia literria e do usurio? Na verdade, a pergunta que se pode fazer na atualidade a seguinte: como o profissional da informao pode
substituir, face s novas tecnologias, o modelo tradicional da anlise de interesses de cada
usurio para a anlise de interesse de um determinado grupo social? Certamente, devem ser
includos no modelo de estudo de usurio, no apenas a terminologia especializada, mas os
gostos, as tendncias, as preferncias por suportes, as demandas e as oportunidades dos
mercados. No importa se o objetivo a avaliao do campo conceitual para a construo
de uma linguagem documentria para um novo sistema de informao ou para um j existente.
Independentemente do mtodo escolhido para a determinao do universo conceitual, vale ainda uma observao sobre a dinmica de cada um deles, do ponto de vista terico. Os processos de induo e deduo no devem ser tomados com absolutos e indepen-

71

dentes entre si, isto , se a escolha recair pela utilizao de um grupo de peritos que vai
estabelecer, dedutivamente, as hierarquias representativas de um dado campo conceitual,
isto no deve eliminar a comprovao de que tais hierarquias esto refletidas nas fontes,
tanto documentais como pessoais. O processo, nesse caso, deve partir de uma suposta hiptese, ou suposio hipottica, passvel de verificao particular, para ento ser confirmada.
Sob o ponto de vista da induo, improvvel que no se faa suposies, ao longo do
processo, j que algum conhecimento antecipado o construtor da linguagem documentria
deve possuir. O modelo de Pierce citado por Eco29, para o entendimento das regras de significao, pode ilustrar esta tenso entre induo e deduo:

Peirce considera a abduo como a hiptese que, comparada com a deduo e a induo, d origem aos trs diferentes esquemas inferenciais em que as casas de linha contnua expressam os estgios argumentativos pelos quais temos proposies verificadas, e as
casas de linha tracejada, os estgios argumentativos produzidos pelo raciocnio. Assim
que a Abduo, naturalmente deve ser verificada.
O que se distingue nesta etapa de definio do universo conceitual que os conceitos podem ser criados dedutivamente, ou identificados indutivamente, nas fontes primrias
e secundrias. O modelo de Peirce nos ajuda a compreender que os conceitos criados devem ter uma correspondncia com as fontes, na etapa da delimitao do universo conceitual, e que o processo das inferncias vai fundamentar toda a organizao conceitual descrita
nas etapas seguintes.
Se a deciso tiver sido a do mtodo dedutivo, o grupo de especialistas no estar
simplesmente determinando quais conceitos faro parte da linguagem documentria, mas j

72

estar determinando a estrutura conceitual em suas hierarquias principais. A deduo implica em um conhecimento global do campo de assunto, no qual possvel efetuar derivaes conceituais, do geral para o particular. Nesse caso, necessrio possuir um conhecimento profundo do domnio para o qual se est elaborando uma linguagem artificial, a fim
de evitar todos os riscos naturais, no s da subjetividade na seleo, definio e relacionamento entre conceitos, como tambm na identidade entre conhecimento e comunicao,
tal como mencionado anteriormente.
Por outro lado, na organizao conceitual para a construo de linguagens documentrias fica evidente a tenso existente entre induo e deduo nas etapas de classificao, ou seja, nas aes de aproximao e afastamento de conceitos, por suas semelhanas e
diferenas dos atributos de apreenso conceitual. Mas, quando se diz que o mtodo escolhido o dedutivo, quer-se dizer tambm que a anlise de um domnio se deu por diviso
lgica, repartindo o universo em subconjuntos especficos, e que as classes principais, ou
primeiras categorias, no surgem por aproximaes especficas do conjunto de conceitos
daquele domnio, caractersticas da induo, mas por deciso antecipada do especialista. A
discusso sobre o emprego dos mtodos no relacionamento conceitual se dar no prximo
captulo.
NOTAS E CITAES
1

VICKERY, B. C. Thesaurus : a new world in documentation. Journal of Documentation, v. 16, n. 4, p.


181-189, dec. 1960.
2

GOMES, Hagar Espanha (Org.) Manual de elaborao de tesauros monolnges. Braslia : PNBU, 1990.

Rogets International Thesaurus. Mawson, C.O.S., ed. (18701938) 1922.


http://www.bartleby.com/110/1.html. Capturada em 24 de setembro de 2001.
4

DOYLE SILVA, Ernani, FERREIRA, Llio. Dicionrio inverso. Rio de Janeiro : Abril, 1956. fasc. 1.

LUHN, H. P. apud VICKERY, B. C. op. cit., p. 183

BERNIER, C. L. , HEUMANN, K. F. apud VICKERY, B. C. op. cit., p. 185

WALL, E. A. ibid.

TAUBE, M. ibid.

HEALD, J. H. ibid.

10

UNESCO. Guia para la creacin y desenvolvimiento de thesaurus multilingues, tcnicos y cientficos,


destinados a la recuperacin de dados. CINTERFOR Documentation, Montevideo, v. 32, p. 13-17, 1973.

73

11

COMMITTEE ON SCIENTIFIC AND TECHNICAL INFORMATION. Guidelines for the development


of information retrieval thesauri. Washington : Government Printing Office, 1967.

12

FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documentation. Strasbourg
: Council of Europe, 1972.
13

LANCASTER, F. W. Vocabulary control for information retrieval. Washington : Information Resources


Press, 1972.
14

GOMES, H. E. op. cit. p. 20

15

SOERGEL, D. Indexing languages and thesauri : construction and maintenance. Los Angeles : Wiley Becker & Hayes, 1974.
16

GOMES, op. cit., p.30

17

DODEBEI, Vera Lucia D. L. de M. Construo de thesauri: experimento emprico para a coleta de termos
em formao profissional. Rio de Janeiro, 1979. Dissertao apresentada ao Instituto Brasileiro de
Informao em Cincia e Tecnologia / Universidade Federal do Rio de Janeiro para a obteno do grau de
mestre em Cincia da Informao.
18

LANCASTER, F.W. Vocabulary control for information retrieval. Washington : Information Resources
Press, 1972.
19

HULME, E. W. Principals of book classification. Association of Assistant Librarians, 1950.

20

FOSKETT, A. C. A abordagem temtica da informao. So Paulo : Polgono, 1973. p. 10, 20, 40.

21

GOODMAN, F. The role and function of thesaurus in education. In: THESAURUS of ERIC descriptors.
New York : CCM Information Corporation, 1972. p. IX-X.
22

LANCASTER, F. W. op. cit.

23

CHAI KIM, SOON KIM. Consensus vs frequency: an empirical investigation of theories for identifying
descriptors in designing retrieval thesauri. Information Processing Management, London, v. 13, n. 4, p. 253258, 1977.
24

PICKFORD, A. G. A. FAIR (Fast Access Information Retieval) Project. Aslib Procedings, London. v. 19,
n. 3, p. 79-95, 1976.

25

DYM, E. D. A new approach to the development of a technical thesaurus. Proceedings of the American
Documentation Institute, Washington, D.C. n. 4, p. 126 -131, 1967.
26

DODEBEI, V. L. D. L. de M. Construo de thesauri. op. cit.

27

BEGHTOL, Claire. Domain analysis, literary warrant andconsensus: the case of fiction studies. Journal of
the American Society for Information Science. v. 46, n. 1, p. 30-44, 1995.
28

HJORLAND, Birger, ALBRECHTSEN, Hanne. Toward a new-horizon inInformation Science: DomainAnalysis. Journal of the American Society for Information Science. v. 46, n. 6, p. 400-425, 1995.
29

ECO, Umberto. Semitica e filosofia da linguagem. op.cit. p. 50

5 Tesauro - Parte 2:organizao de conceitos


As linguagens documentrias construdas para indexao e recuperao da informao devem ser baseadas na estrutura conceitual de um determinado campo temtico ou reas de domnio e no em assuntos representados por palavras, j que cada significado deve
ser representado por uma nica forma verbal. Cada conceito um item do conhecimento e
reflete este conhecimento do mundo real dos objetos e dos fenmenos, com seus atributos e
relacionamentos essenciais e acidentais. Mas, afinal o que vem a ser um conceito?
Se consultarmos um dicionrio geral1, vamos encontrar as seguintes acepes para
o verbete conceito: representao de um objeto pelo pensamento, por meio de suas caratersticas gerais; ao de formular uma idia por meio de palavras; pensamento, idia, opinio; noo, idia, concepo; apreciao, julgamento, avaliao, opinio; avaliao da conduta e/ou aproveitamento escolar; ponto de vista, opinio, concepo; reputao, fama.
Na filosofia, pode-se distinguir duas naturezas para o conceito. A primeira, de acordo com a filosofia grega, indica que o conceito a essncia, a substncia das coisas e, ainda, todo o processo que torne possvel a descrio, a classificao e a previso dos objetos
cognoscveis. A segunda considera que o conceito um sinal, ou procedimento semntico.
1 CONCEITO = ESSNCIA
Abbagnamo2 traa um quadro de relaes em que, tanto para Hegel como para Aristteles, o conceito a essncia necessria da realidade, o que faz que ela no possa ser diferente do que . Aristteles refora a idia de conceito de Plato quando diz que o conceito
(logos) o que circunscreve ou define a substncia ou a essncia necessria de uma coisa,
classificando-o em: conceitos comuns, prprios e materiais. Kant, em sua obra Crtica da
razo pura, afirma que, se os conceitos se referem s coisas s mediante a sensao, os
conceitos puros ou categorias constituem as prprias coisas enquanto percebidas, isto ,
aparentes na experincia. Para os fenomenologistas, o conceito uma formao psquica,
cuja representao varia de momento a momento, de indivduo a indivduo, porm conservando a mesma essncia. Logo, reduz-se a essncia razo.
2 CONCEITO = SIGNO

75

Na segunda acepo, Abbagnamo considera que o conceito um signo do objeto e


se acha em relao (significao) com ele. Por essa interpretao, apresentada pela primeira
vez pelos esticos, a doutrina do conceito torna-se uma teoria dos signos, a qual constitui o
modelo da lgica terminstica medieval e o antecedente da moderna semitica. Por signo
entende-se, de resto, uma proposio que, sendo antecedente em uma conexo verdadeira,
descobridora da conseqente. Pela lgica terminstica a funo do termo, tanto o universal
como o particular, definida mediante a noo de suposio, pela qual os termos esto no
lugar da coisa suposta. Assim, por exemplo, na proposio o homem corre, o termo Homem est para Scrates, Plato etc. Dewey, por sua vez, chama aos conceitos termos ou
significados, e Quine indicou exatamente o ponto crtico da transformao da noo de
conceito quando disse: o significado o que a essncia se torna quando se divorciou do
objeto de referncia e se casou com a palavra. Para Carnap o conceito implica em propriedade, atributo e funo, e indica mais conotao do que denotao. Abbagnamo lista, assim, as funes do conceito:
a) final de exprimir ou revelar a substncia das coisas.
b) instrumental, que se classifica ainda em:
b1 ) referencial

descrever os objetos da experincia para


permitir seu reconhecimento.

b2 ) econmica

classificar os fatos nos conceitos.

b3) organizao

estabelecer relaes lgicas para os dados


da experincia.

b4) previso

antecipar ou projetar a soluo de um


problema formulado.

No campo das teorias da linguagem, Wanderley3, ao discutir o desenvolvimento da


semntica, indica que estas j no se concentram mais em modelos gramaticais conduzindo
apenas s estruturas superficiais, mas incluem outras estruturas relativas situaes conceituais adjacentes. O autor exemplifica com o modelo de Langacker apud58 que esquematiza
tal organizao lingstica como na figura:

76

Do ponto de vista da relao entre lngua natural e linguagem artificial, comenta


ainda Wanderley que tudo se passa, na verdade, como se houvesse entre os domnios da
linguagem comum, da linguagem artificial e do pensamento, respectivamente da alada da
lingustica, da lgica e epistemologia e da psicologia - a correspondncia que Clouzot apud59 resume no quadro abaixo:

Assim, no que se refere construo de linguagens documentrias, a unidade informacional o conceito, embora, claro, ela deva estar expressa por termos, simbolicamente representados por palavras. Desta forma, os conceitos podem estar representados por
apenas uma palavra, ou por uma composio de palavras, desde que esta composio designe um nico conceito. Por exemplo: Cincia da Informao = termo que representa apenas um conceito de um objeto, formado por duas palavras = um termo; Estudo de lnguas =
dois conceitos, dois objetos (estudo e lnguas) = dois termos.

77

A identificao dessas estruturas conceituais obedece a dois princpios:


a) princpio da monorreferencialidade, no qual a denominao do conceito um
termo que guarda com ele uma relao unvoca, isto , para cada conceito existe apenas
uma denominao e cada denominao vale apenas para um conceito. O conceito o significado do termo.4
b) princpio da contextualizao diz respeito ao contexto (isto , ao ambiente no
qual se encontra em lngua natural) que vai especificar o significado da palavra, diminuindo desta forma a ambigidade inerente s palavras representativas desta mesma linguagem
natural. Por exemplo, num texto sobre culinria, a palavra manga tem o significado de fruta e, num texto sobre moda, o significado de manga muda para componente do vesturio.
Uma vez que fazemos uso da reduo de significado para escolher uma dentre as vrias
acepes que uma palavra possa ter, a fim de isolar os conceitos representativos de um
domnio temtico, o contexto no qual ela est inserida que vai determinar seu significado.
De acordo com Eco5, a presso exercida pelo contexto para a obteno do significado deriva tanto da identificao de um tema ou tpico e consequentemente pela escolha de um
percurso de interpretao ou isotopia, quanto pela referncia a roteiros intertextuais que
permitem estabelecer no s do que estamos falando, como sob que aspecto, com que objetivo e em que direo. A contextualizao devolve, assim, o sentido que a monoreferncia
reduziu.

Relaes conceituais
Mudando o foco de nossa ateno das esferas ontolgica e metodolgica na identificao dos conceitos que constituiro uma linguagem documentria para o espao lgico
das suas relaes, duas abordagens tericas devem ser consideradas: a da diviso lgica
prpria do processo dedutivo, representado pela diferena e a da predicao conceitual,
que compreende tanto a induo quanto a deduo, num processo relacional de semelhanas, tal como a proposta de Peirce para a abduo/hiptese.

A diviso lgica
A hierarquizao conceitual um processo analtico, que considera a diviso do
tema geral em suas espcies. As espcies so, portanto, obtidas pela diferena especfica,
ou seja, as qualidades ou atributos que, somados aos prprios do gnero, as distinguem.

78

Diremos, ento, que a cada derivao conceitual as espcies da decorrentes adquirem pelo
menos um atributo a mais que seu gnero prximo, tornando-se mais intensas ou compreensveis na medida em que aumenta o nmero das diferenas.
A questo da diferena estudada na teoria da classificao a partir das categorias
aristotlicas que, reformuladas por Porfrio, representam: gnero, espcie, diferena, propriedade e acidente. Porfrio (sc. IV), na sua obra Isagoge ou Introduo s categorias,
aplicando o princpio da oposio de Plato e Aristteles, apresentou uma classificao
dicotmica constando de cinco predicveis ou categoremas representados na famosa classificao rvore de Porfrio ou Arvore de Reme (divulgada no sculo XVI pelo filsofo
francs Pierre de la Reme):

A diferena especfica , portanto, o atributo a mais que distingue as espcies. No


caso do gnero maior /subtncia/, a diferena Corpo gerou duas espcies: corprea e incorprea. A cada derivao conceitual, as espcies tornam-se gneros das derivaes subseqentes, at que uma espcie seja to pouco extensa e to intensa que no possa ser mais
subdividida, como o caso de Plato, Scrates e Aristteles, no exemplo de Porfrio.
Na literatura de Teoria da Classificao6, a diferena nomeada de qualidade, atributo, ou caracterstica escolhida para servir de base classificao ou diviso lgica. Pode tambm ser considerado como princpio da classificao ou princpio da diviso. A

79

expresso /caracterstica/ , no entanto, a mais freqentemente utilizada. Se tomarmos o


exemplo abaixo:

Objeto (matria)
Objeto material (+ essncia : forma e contedo)
Suporte da informao (+ memria)
Documento (+ tempo de publicao)
Peridico

Reconhecidas as caractersticas que serviram de base para a diviso conceitual: matria, essncia, memria e tempo, elas podem ser identificadas com os pontos de vista,
ou diferenas escolhidas pelas quais pode-se analisar um objeto. A observao da cadeia
conceitual resultante, demonstra a intencionalidade na escolha das diferenas, quer dizer, a
partir de objeto poderamos tambm chegar a mesa, casa, filme etc. O que vai determinar o
sucesso na obteno de todas as derivaes necessrias organizao do universo conceitual a aplicao de regras lgicas de diviso, as quais, muitas vezes, se configuram como
obstculos na utilizao prtica de tal processo de anlise conceitual. Existem, portanto,
qualidades e limitaes na aplicao da diviso lgica conceitual. Para o primeiro caso,
contamos com trs princpios que regem a organizao de conceitos no aspecto da estrutura
classificatria. Podem, assim, ser considerados como:

a) Completude
A diviso do conceito deve ser completa, adequada e ordenada por complexidade
crescente, isto , enumerar todos as espcies de que o gnero se compe, do simples ao
complexo ou do abstrato ao concreto. Por exemplo, aplicando-se a caracterstica nvel de
ensino, a diviso abaixo est completa, com todas as espcies enumeradas.

80

b) Irredutibilidade
A diviso deve garantir que a cada deduo conceitual os contedos sejam irredutveis entre si, isto , no se deve enumerar mais do que os elementos verdadeiramente distintos entre si, de maneira que nenhum esteja compreendido no outro. Se, tal como no exemplo, o conceito de inteligncia est contido no conceito de alma, ele no pode integrar
o primeiro nvel de derivao conceitual, coordenado alma e ao corpo. O conceito de
inteligncia um conceito subordinado alma.

c) Mtua exclusividade
A diviso deve ser fundada no mesmo princpio, isto , servir-se de membros verdadeiramente opostos entre si. Para cada derivao conceitual deve-se usar apenas uma
caracterstica do conceito. No exemplo abaixo, a diviso do conceito biblioteca considerou
duas caractersticas de derivao ao mesmo tempo: disciplina e tamanho. Embora a espcie
esteja de acordo com o gnero, uso de duas diferenas concomitantes configura um erro
lgico.

81

A organizao conceitual deve garantir que a classificao obtida tenha por qualidades: ser completa; ser irredutvel; e, ser mutuamente exclusiva.
Com a diviso lgica, os conceitos vo se relacionar pela hierarquia do processo de
derivao conceitual, sendo fundamental o domnio de seu contedo. Para tanto, devemos
considerar uma idia ou conceito do ponto de vista de sua intenso (ou compreenso) e de
sua extenso. Se tomarmos como exemplo a diviso:

Verificamos que os conceitos se relacionam por:


Coordenao de classes, ou relacionamento sintagmtico ( Eixo C )
Observa-se o uso de uma caracterstica de cada vez para a derivao de um conceito
(regras da diviso lgica), resultando em classes associadas ou coordenadas. Nos diversos
domnios do saber esta relao denominada de sintagmtica (lingstica); diviso em fileira array (Ranganathan); assuntos correlatos (classificaes bibliogrficas, em geral).

82

Subordinao de classes, ou relacionamento paradigmtico ( Eixo S )


Para Jolivet7, a idia ou conceito a simples representao intelectual de um objeto, diferindo essencialmente da imagem, que a representao determinada do objeto
sensvel. A compreenso , portanto, o contedo de uma idia, o conjunto de elementos de
que uma idia se compe. A idia de Homem implica os elementos: ser, vivente, sensvel,
racional.

A extenso o conjunto de sujeitos a que a idia convm. A idia de Homem convm aos: canadenses, aos franceses, aos negros, a Pedro. Portanto, a relao entre compreenso e extenso se d numa tenso da razo inversa.

Existe, pois, uma relao entre gnero/espcie - hierarquia - intenso e extenso.


possvel, portanto, ordenar as idias segundo uma hierarquia baseada em sua extenso. A

83

idia superior em extenso se chama gnero em relao idia inferior, e esta, espcie em
relao primeira. Assim, quanto maior a intenso (nmero de caratersticas do conceito), menor a extenso (nmero de membros ou espcies) de uma classe, e vive-versa.
Embora as relaes hierrquicas sejam as mais freqentes na organizao de conceitos para a construo de linguagens documentrias, elas no devem ser as nicas a serem consideradas no processo de construo de linguagens documentrias.
Wanderley8, citando Mills, considera as seguintes limitaes impostas pelo uso da
diviso lgica na concepo de classificaes bibliogrficas:
a) a relao de gnero para espcie, de uma coisa para suas variedades, apenas
uma das relaes de fato utilizadas nas classificaes bibliogrficas;
b) inadequado limitar-se a diviso s caractersticas que constituem qualidades
genricas essenciais.
c) comum o uso de caractersticas acidentais, quando mais apropriadas para o entendimento do contexto, sem que isto fira a lgica da derivao conceitual;
d) no sempre exeqvel, ao dividir-se um gnero por caractersticas sucessivas,
ater-se a uma regra de todo coerente;
e) a diviso lgica no pode impor uma ordem privilegiada de aplicao de caractersticas.
f) o mesmo ocorre quanto ao arranjo das classes, o qual teoricamente no obrigaria
anteposio do geral para o particular, do abstrato ao concreto, nem privilegiaria qualquer
ordem dentro de uma srie de subclasses coordenadas;
g) por fim, no existe uma correspondncia biunvoca entre documentos e termos
de classes, o que se soma natural complexidade das relaes entre as prprias cincias e
ao carter interdisciplinar da pesquisa moderna.
Tais limitaes, no entanto, s fazem demonstrar o carter subjetivo, arbitrrio das
classificaes, quer dizer: a deciso quanto ao ponto de vista a se adotar na diviso lgica;
o nvel de modulao conceitual para cada domnio do conhecimento; a extenso do domnio e suas interfaces com outros fronteirios. No h como afirmar que uma classificao
melhor do que outra, a avaliao se d pelo uso e pelos resultados obtidos, sempre tendo-se
em mente a representatividade do campo conceitual a se representado. As regras e os princpios delineados pela literatura indicam que a concepo de linguagens documentrias

84

deve ser lgica na formao e relacionamento conceituais, mas flexvel nas aplicaes objetivas.

Predicao conceitual
De acordo com Dahlberg9, a linguagem permitiu ao homem relacionar-se com os
vrios objetos que o circundavam e permitiu tambm que ele elaborasse enunciados sobre
eles. Toda vez que o objeto pensado como nico, distinto dos demais, constituindo uma
unidade inconfundvel (coisas, fenmenos, processos, acontecimentos, atributos) pode-se
falar em objetos individuais, isto : objetos nicos, definidos, distintos de outros, com presena de tempo e espao , por exemplo: O menino (este menino especfico). Mas, alm dos
objetos individuais, podemos referir-nos a objetos gerais, quando no se trata de nada nico, mas de algo que ocorre em vrias situaes, de um tipo geral, que, de certo modo, prescindem das dimenses tempo e espao - Um menino (qualquer menino).
Com a ajuda das lnguas naturais possvel formular enunciados a respeito tanto
dos objetos individuais como dos objetos gerais. Cada enunciado verdadeiro representa um
elemento, atributo ou caracterstica do conceito. Efetuando-se a predicao de um objeto
individual, identificam-se os elementos, como abaixo:

O conceito de UNIRIO a soma de seus enunciados. Portanto, a soma total dos


enunciados verdadeiros de um objeto individual resulta no conceito individual deste objeto.

85

Se tomarmos o objeto geral /Instituio/, sobre ele poderemos formular os seguintes enunciados verdadeiros:

Do mesmo modo, a soma total dos enunciados verdadeiros de um objeto geral resulta no conceito geral deste objeto. No entanto, ao comparar o elenco de atributos dos dois
tipos de conceitos, podemos perceber que nos conceitos individuais h sempre elementos
dos conceitos gerais, o que significa que possvel, portanto, inferir conceitos gerais a partir de conceitos individuais. Isto o que permite que no processo indutivo, por inferncia,
possa-se chegar uma classe geral, partindo-se de um objeto particular. Pode-se, assim,
considerar a formao dos conceitos como a reunio e a compilao de enunciados verdadeiros a respeito de determinado objeto. Para fixar o resultado dessa compilao, usamos a
palavra ou qualquer signo que possa traduzir ou fixar essa compilao. possvel, ento,
definir conceito como a compilao de enunciados verdadeiros sobre determinado objeto,
fixada por um smbolo lingstico.
Se o conceito pode ser compreendido como um portador de elementos/caractersticas, obtidos pela predicao de seu referente, para fins de comunicao
necessrio sintetizar os elementos do conceito em uma expresso, ou combinao de palavras, a fim de que se possa manipul-lo ou, at mesmo, design-lo por um cdigo ou sinal.
Dahlberg10 apresenta, assim, um modelo conceitual para a organizao do conhecimento e
estudos terminolgicos, denominado Teoria Analtica do Conceito (orientada para referente), visando comunicao entre indivduos, tendo como intermedirio a informao registrada. Utilizando o significado de conceito como sinal e contedo, Dahlberg defende que
as caractersticas do conceito so entendidas como elementos de conhecimento, e a soma

86

total das predicaes pode ser sintetizada na unidade de conhecimento correspondente. Os


conceitos so, desta forma, entendidos como unidades de conhecimento.

Considerando que todo enunciado sobre objetos contm um elemento do respectivo


conceito, pode-se afirmar que esses elementos identificam-se com as chamadas caractersticas dos conceitos. Assim, as caractersticas dos conceitos so obtidas pela formulao dos
enunciados sobre os atributos necessrios ou possveis dos objetos. Esse processo de identificao das caractersticas de um conceito denominado de predicao conceitual.

87

Segundo Dahlberg, muitas vezes no se trata de um atributo a que corresponde uma


caracterstica, mas de uma hierarquia de caractersticas, j que o predicado de um enunciado pode tornar-se sujeito de novo enunciado, e assim sucessivamente, at que se atinja uma
caracterstica to geral que possa ser igualada a uma categoria, como abaixo:

Peridico um documento que se publica periodicamente


Documento que se publica periodicamente um documento
Documento um suporte da informao
Suporte da informao um objeto material
Objeto material um objeto
O exemplo considera os mesmos conceitos utilizados para demonstrar a derivao
conceitual na diviso lgica. Embora o resultado seja o mesmo, em relao ao nmero de
objetos, a predicao de peridico o classifica na categoria geral de objetos, naturalmente e
a partir das cadeias de definio a ele atribuda. Nesse sentido, tendo o contexto a funo
de delimitar o significado do conceito, as cadeias construdas vo melhor representar o
campo conceitual no qual sero utilizadas como linguagem documentria.
Gomes11, exemplifica a caracterstica como o elemento de um conceito que serve
para descrever ou identificar uma determinada qualidade de um objeto. As caractersticas
so elementos fundamentais na sistematizao dos conceitos, pois atravs delas que se
faz a comparao dos conceitos em classes, subclasses, ou ainda em conjuntos no hierrquicos. Exemplifica Gomes: os conceitos /Abadia/, /Baslica/, /Catedral/, /Mesquita/ e
/Mosteiro/, pertencem classe /Edifcio religioso/, pois esta a caracterstica comum a
estes conceitos. A literatura aponta, ainda, uma variada tipologia de caractersticas conceituais. De um modo geral, pode-se reduzir tais classificaes a duas categorias: Caractersticas intrnsecas ou naturais - so as caractersticas inerentes ou inseparveis do conceito de
um objeto e podem ser constitutivas ou consecutivas da essncia; e, Caractersticas extrnsecas ou acidentais - so caractersticas que dependem de fatores externos e de condies
acidentais e podem ser gerais ou individualizantes. Dahlberg apresenta o exemplo a seguir:

88

Objetos materiais em geral

MINERAIS

Caractersticas essenciais constitutivas


- ser natural

composio qumica

- ter uma estrutura

estrutura cristalina

Caractersticas essenciais consecutivas


- propriedades fsicas

desvio dos raios luminosos; dureza

- propriedades eltricas

condutividade

Caractersticas acidentais gerais


- determinada forma

formas externas dos minerais

- falhas

deformaes

- cor

cor

Caractersticas acidentais individualizantes


- relao com determinado lugar

tempo

- relao com determinado tempo

espao

De acordo ainda com Dahlberg, outras espcies de objetos, como as plantas, podem
ter caractersticas diferentes. O mesmo ocorre com os produtos, como mquinas, equipamentos. Nesse caso, as caractersticas essenciais so determinadas pelas finalidades e pela
aplicao, e as caractersticas acidentais dependem da respectiva eficincia ou valores, em
geral prticos. Essa tambm a opinio de Gomes12, que acrescenta s duas categorias
gerais (naturais e acidentais) outras em funo do tipo de objeto, tais como caractersticas
equivalentes e no-equivalentes; caractersticas independentes e dependentes.
O conhecimento das carctersticas conceituais vai permitir realizar, com maior propriedade as aes de: definio dos conceitos; formao dos nomes dos conceitos; e, ordenao classificatria. Para o estabelecimento de comparaes por semelhanas e diferenas
entre os conceitos, quer seja para defini-los, nome-los ou orden-los, h que se falar em
relaes conceituais. Do ponto de vista epistemolgico, o conceito pode ser analisado segundo as aes mentais, ou seja, a habilidade da mente em comparar algo novo com conhecimento adquirido. Esse tipo de conhecimento subjetivo necessita tornar-se acessvel e
verificvel, explcito, objetivo. As possveis comparaes, segundo Dahlberg, podem ser
classificadas em lgicas ou formais; categorias formais; e materiais ou de contedo, sendo
esta ltima baseada na primeira. Com a finalidade de demonstrar o carter deduti-

89

vo/indutivo da proposta de Dahlberg para a predicao conceitual, reorganizamos as relaes conceituais, levando-se em considerao tanto o modo de ser dos objetos, quanto as
suas identidades e diferenas.
Em funo de seu contedo ou significado, as relaes entre os conceitos se do
mediante comparaes: lgicas, formais, abstratas ou semnticas
Relaes de equivalncia (identidade)
Quando um conceito pode ser representado por vrios smbolos distintos ou quando
se quer reduzir, por questes pragmticas, os nveis de implicao conceitual, estabelecemse as relaes de equivalncia semntica. Tais relaes vo permitir controlar os trs conjuntos de disperses semnticas, caractersticos da lngua natural; lxicas, simblicas e
sintticas.
Disperso lxica
 sinnimos (professor e docente)
 quase sinnimos ( linguagem documentria e tesauro)
Disperso simblica
 grafias diferentes (conceptual e conceitual)
 abreviaturas (Unirio e Universidade do Rio de Janeiro)
 razo social e nome fantasia (Telefonica celular e TELERJ Celular SA)
 traduo (software e programa)
Disperso sinttica
 coordenao (instituies de ensino e ensino, instituio; aprendizagem e ensino/aprendizagem)
 gnero e nmero (casa e casas; aluno e aluna)
A equivalncia entre dois smbolos representada pela identidade de suas caractersticas, de modo que a soma dos atributos verdadeiros, resultado da anlise de cada um,
possa gerar um nico e mesmo conceito. Ao contrrio, quando um mesmo smbolo identificado com dois ou mais conjuntos de caractersticas distintas, o que se configura a polissemia, isto , dois ou mais significados nomeados por um mesmo smbolo. Neste caso,
os smbolos devem ser distinguidos por meio de qualificadores, o que os transformar em
novos smbolos, cada um no lugar de um nico significado conceitual. Por exemplo:


venda (processo) e venda (produto)

cedo(verbo ceder) e cedo (advrbio de tempo)

90

manga (fruta) e manga (parte de vesturio)

Relaes hierrquicas (implicao)


Se dois conceitos diferentes possuem caractersticas idnticas e um deles possui
uma caracterstica a mais do que o outro, ento entre eles se estabelece a relao hierrquica ou relao de gnero-espcie. Pode-se falar de conceitos mais amplos ou extensos e
mais restritos ou intensos. Este tipo de relao pode tambm ser chamada de relao de
abstrao, uma vez que a cada degrau hierrquico abstrai-se uma caracterstica a mais, como no exemplo: uma macieira uma rvore frutfera que, por sua vez, uma rvore.
rvore
rvore frutfera (todos as caractersticas do anterior + 1= frutas)
Macieira (todos as caractersticas do anterior + 1= ma)

Outra forma de visualizarmos o relacionamento hierrquico, que significa implicao conceitual:

91

Vale ressaltar, que devemos sempre preferir relacionar os conceitos por suas caractersticas essenciais, de modo que sejam evitados os relacionamentos acidentais do tipo:
animais de estimao (gnero) gatos (espcie), j que todos os gatos so animais, mas nem
todos os gatos so animais de estimao.

Relaes partitivas
A relao partitiva existe entre um todo e suas partes. Em relao aos conceitos e
suas caractersticas, isto significa que o conceito de um todo, por exemplo, um corpo, um
organismo, um sistema, inclui como suas caractersticas os conceitos de suas partes. Por

92

exemplo: A rvore composta de razes, tronco, galhos, folhas, flor e frutos. As caractersticas de /raiz/ integram as caractersticas de /rvore/.

As relaes partitivas podem ser reconhecidas pela especificao das partes de um


objeto natural (uma planta, um animal, um mineral); ou pela identificao dos elementos
de construo de um produto (uma bicicleta, uma casa, um telefone); ou ainda pela constituio de uma unidade organizacional (um pas e seus estados, um campo de estudo e seus
subcampos). Por exemplo, a relao entre Brasil e Rio de Janeiro uma relao de parte/todo. No se configura, neste caso, a relao de gnero/espcie, uma vez que no se pode
afirmar que Rio de Janeiro uma espcie de Brasil.
Relaes de oposio (negao)
A oposio entre conceitos pode acontecer por contradio: numrico/no numrico, presena/ausncia; contrariedade: branco/preto, amizade/inimizade; ou por gradao:
favorvel - neutro desfavorvel, (valor) alto - igual baixo. No se lhes atribuem destaque na apresentao do tesauro, podendo tais relaes aparecer tanto em categorias distintas, quanto fazendo parte de uma mesma estrutura hierquica, tal como as hierarquias chamadas dicotmicas.

93

Relaes funcionais (interseo)


Se as relaes abstratas e as relaes partitivas se aplicam a conceitos que expressam objetos e as relaes de oposio se aplicam, principalmente a conceitos que expressam propriedades, as relaes funcionais aplicam-se sobretudo a conceitos que expressam
processos. Pode-se conhecer o carter semntico de tais relaes tendo por base as chamadas valncias semnticas dos verbos, dando ateno aos verbos e seus respectivos complementos. Por exemplo: produo produto - produtor comprador; medio objeto
medido - fins da medio - instrumento de medio - graus de medio. A valncia semntica do verbo a soma dos lugares a serem preenchidos de acordo com a ligao deste conceito com outros. O RogetThesaurus aplica no s a valncia semntica para relacionar as
palavras da lngua inglesa, como as categorias gramaticais (nome, verbo, adjetivo, advrbio) nas quais so classificados os conceitos.
Caso se trate da valncia semntica do verbo medir, teremos que responder s seguintes questes:

94

- o que medido? ex: a temperatura;


- com que instrumento feita a medio? ex: o termmetro;
- de acordo com que sistema? ex: Celsius;
- de que coisa medida a temperatura? ex: de uma clula viva.

Pode-se ento considerar que entre o conceito do processo medio e os conceitos


dos complementos mencionados existem relaes funcionais. Vale ressaltar que, se por um
lado existe toda uma base terica para o estabelecimento das relaes abstratas e partitivas
independentemente ao contexto, as relaes funcionais ou associativas so estabelecidas
pelo empirismo, quer dizer pelo conhecimento do campo conceitual. No limite, pode-se
afirmar que todos os conceitos se relacionam entre si. Qual a relao existente entre cachorro e rvore? No uma relao de gnero/espcie - cachorro no uma espcie de
rvore e vice-versa. No uma relao de parte/todo - cachorro no uma parte da rvore e
vice-versa. Mas o cachorro tende a urinar nas rvores. Esta uma relao do tipo associativo. Pinto13 enumera algumas possibilidades de associao entre os conceitos:
a)

causa e efeito

medicamento/cura de doenas

b)

concorrncia

ensino/aprendizagem

c)

constituio

janelas/alumnio

d)

agente

iluminador/iluminao

Motta14 identifica os seguintes tipos de relaes associativas, a partir da anlise


conceitual de 61 termos no domnio da Economia: associao implcita; interfaceta; instrumental; coordenao lgica; causalidade; influncia; oposio; atribuio; coordenao
partitiva. Tal identificao resultado pragmtico da anlise conceitual dos termos levantados, especficos para o campo da Economia. Isto no quer dizer que esta tipologia possa

95

ser aplicada a todas as reas do conhecimento. As relaes conceituais de natureza funcional ou associativa podem ser estabelecidas antecedente ou posteriormente construo do
tesauro, conforme o mtodo adotado para dar incio ao processo de relacionamento conceitual, mas, sem dvida, devem se pautar pelas categorias, classes superiores ou facetas que
organizam a rede conceitual.
Em complemento s relaes conceituais de natureza lgico-semntica, outra possibilidade de efetuar-se comparaes entre os conceitos a que estabelece as categorias nas
quais os conceitos se identificam e se organizam, nomeada por Dahlberg de relaes de
categorias formais. Assim que a contribuio ontolgica ao seu modelo conceitual representada pelas dez categorias aristotlicas ou as classes gerais pelas quais pode-se olhar o
ser. Piedade15 resume o pensamento aristotlico ao afirmar que a idia que temos das coisas no simples, mas um composto de vrios aspectos, que temos que conhecer para tornar posssvel uma descrio. Aristteles deu o nome de categorias ou predicveis s classes gerais em que, segundo ele, podemos situar, ordenadamente, as idias que temos das
coisas e que constituem os dez gneros supremos, as dez essncias mais gerais. Assim, se
considerarmos as perguntas que podem ser feitas s coisas: o que isso? que tamanho tem?
que tipo de coisa ?, as respostas especificaro:

Substncia (homem, cachorro, pedra, casa etc.)

Qualidade (azul, virtuoso etc.)


Quantidade (grande, comprido, dois quilos etc.)
Relao (mais pesado, escravo, duplo, mais barulhento etc.)
Durao (ontem, 1970, de manh etc.)
Lugar (aqui, Brasil, no ptio etc.)
Ao (correndo, cortando, falando etc.)
Paixo ou sofrimento (derrotado, cortado etc.)
Maneira de ser (saudvel, febril etc.)
Posio (horizontal, sentado etc.)
Tais categorias representam o modo de ser das coisas, de forma que, fixadas pela
linguagem, formam proposies atravs da combinao de substantivos e verbos. A substncia a categoria bsica identificada com o sujeito, o substantivo. As demais so consideradas predicados do sujeito tal como a organizao das categorias gramaticais (adjetivos,
verbos e advrbios). Para Aristteles a substncia a categoria bsica, as outras so decor-

96

rentes desta, pois se no houvesse o objeto no haveria a relao, paixo etc. Aristteles
reduz, posteriormente, as dez categorias a trs:
Substncia - o ser que existe
Modo - ou acidente, o que existe na substncia, seus modos de ser
Relao - o que liga um ser a outro
Piedade apresenta a relao das categorias aristotlicas com as categorias gramaticais, o que, de fato, muito importante para a anlise conceitual do texto que se quer indexar e, consequentemente, para o estabelecimento das relaes conceituais em um tesauro.

Substantivo, sujeito

substncia

Adjetivo qualitativo

qualidade

Adjetivo quantitativo

quantidade

Pronome relativo, adjun-

relao

Verbo na voz ativa

ao

Verbo na voz passiva

paixo

Advrbio de lugar

lugar, posio

Advrbio de tempo

durao

Advrbio de modo

maneira de ser

to adnominal

Para o Padre Leme Lopes apud70 , poder-se-ia formular o seguinte exemplo de interseo entre as categorias gramaticais e aristotlicas:
O grande

quantidade

adjetivo quantitativo

cavalo

substncia

substantivo

qualidade

adjetivo qualitativo

relao

adjunto adnominal

ao

verbo ativo

maneira de ser

advrbio de modo

tempo

advrbio de tempo

lugar

advrbio de lugar

castanho
do cavaleiro
est
arreado
de manh
no ptio

Dahlberg tambm faz uma releitura dessas categorias, reagrupando-as no que de-

97

nomina super categorias, que correspondem s categorias necessrias ao estabelecimento


da estrutura sinttica para a formao de frases:
 Entidades: princpios, objetos imateriais, objetos materiais
 Propriedades: quantidades, qualidades, relaes
 Atividades: operaes, processos, estados
 Dimenses: tempo, espao, posio
A relao do objeto com a categoria deve ser entendida como circunstancial,
denotando o sentido de contextualizao do modelo semitico de Eco. Um mesmo conceito pode pertencer a uma categoria num contexto e a outra em contexto diverso. Astrio de
Campos citado por Piedade16 apresenta como exemplo deste fato o conceito /algodo/, que
pertence categoria /Substncia ou Personalidade/ no contexto da Agricultura ou em Botnica, mas pertence categoria /Matria/, quando o campo conceitual for a Indstria Txtil.
Existiro, portanto, tantas espcies de categorias quanto os contextos escolhidos para relacionar conceitos. Tal so os exemplos em Roget, que identificou seis categorias principais
para seu tesauro (relaes abstratas, espao, matria, intelecto, afeies e volies); Ranganathan, que estabeleceu cinco facetas para a sua classificao (personalidade, matria, energia, espao e tempo); Grolier (tempo, espao e ao); Classification Research Group
(tipos de produto final, partes, materiais, propriedades, processos, operaes, agentes,
espao, tempo, forma de apresentao) Dodebei, para a Formao Profissional (processos,
recursos, grupos, caractersticas humanas, ambiente). Vickery mostra como proceder
anlise da terminologia de um assunto, partindo dos conceitos individuais para se chegar s
categorias ou facetas principais. Tomando como exemplo a Cincia do Solo, o processo
analtico se faria considerando:
TERMOS

DEFINIES

CATEGORIAS

Coeso

Propriedade das partculas de se Propriedade


ligarem para formar compostos

Areia

Gros de 2 a 20 mm de dimetro

Partes do solo

Ponto de viscosidade

Grau mximo de umidade que Medida de propriedade do solo


atinge o solo antes de deixar de
aderir ao corte

Lama

Matria

orgnica

parcialmente Constituinte original do solo

decomposta
Minerao

Separao de matria mineral de Processo intervindo no solo


uma combinao orgnica

98

Adubao

Trabalho sobre o solo para aumen- Operao sobre o solo.


tar sua produtividade

Ainda em Dahlberg, uma categorizao formal dos conceitos que tm importncia


na formao dos sistemas e na combinao dos mesmos conceitos pode ser a seguinte:
objetos

ex: plantas, produtos, papel

fenmenos

ex: crescimento, chuva, trfego

processos

ex: imprimir, sintetizar

propriedades

ex: cego/cegueira, suave/suavidade

relaes

ex: causalidade, necessidade

dimenso

ex: espao, tempo, posio

Em relao a esse tipo de categorizao importante notar que existem possiilidades inmeras de combinao destas categorias de conceitos. Por exemplo: objetos + fenmenos = crescimento de plantas; objetos + processos = impresso em papel.
Do ponto de vista de categorias universais a linguagem que exercer maior influncia na concepo e desenvolvimento de sistemas de organizao do conhecimento. A
lingstica, segundo o modelo de Dahlberg, oferece as bases necessrias designao de
conceitos, sendo os seguintes critrios aqueles considerados de mais significao: conformidade com o referente; representao das caractersticas; mnima extenso; capacidade de
derivao verbal; internacionalidade.
Finalmente, na organizao de sistemas de conceitos podem ser considerados dois
processos. O primeiro, denominado hierarquizao ou enumerao, tem por base a Teoria
da Diviso Lgica. O segundo, nomeado de facetao, se fundamenta na Teoria Analtica
de Conceitos. O conceito de Faceta foi definido por Ranganathan para indicar as manifestaes das categorias fundamentais em cada campo do conhecimento, reunindo conceitos
que tm determinada caracterstica em comum. O seu significado, representando o produto,
pode ser igualado Categoria, tal como as categorias aristotlicas, por exemplo. Considerando-se, no entanto, o processo de derivao conceitual, o significado de Faceta pode ser
igualado ao de Caracterstica.

99

Ranganathan, ao aplicar os princpios aristotlicos documentao, identificou quatro maneiras de desdobrar o conhecimento:

Embora as duas primeiras possam ser relacionadas ao processo de derivao conceitual, seja considerando-se os eixos de subordinao e coordenao, ou o relacionamento
conceitual hierrquivo e partitivo, as duas ltimas - Laminao e Justaposio ou Montagem flexvel - se referem ao produto obtido. Isto significa uma estrutura conceitual cuja
coordenao de conceitos possa ser efetuada no momento do uso e no, antecipadamente,
quando da construo e organizao dos conceitos. Assim, diz-se que as estruturas que
apresentam forte pr-coordenao conceitual so hierrquicas e enumerativas. E as estruturas que permitem coordenar conceitos no momento do uso so ps-cordenadas, facetadas
ou analtico sintticas.
Se tomarmos o exemplo de uma estrutura hierrquica para a organizao dos conceitos no campo da Educao, poderemos identificar as facetas principais pelas quais o
tema foi analisado e visualizar, no grfico, as limitaes das estruturas hierrquicas, princi-

100

palmente quanto enumerao ou repetio de conceitos, propriedade esta necessria


adequao da anlise quanto completude da enumerao conceitual.

No grfico, verificamos que no primeiro nvel hierrquico, a caracterstica que serviu de base para a diviso lgica do conceito /Educao/ foi nvel de ensino. Na segunda
derivao foi usada a caracterstica mtodo de ensino e, no terceiro nvel hierrquico, disciplina. Tais caractersticas so, portanto, os pontos de vista pelos quais o assunto /Educao/
pode ser analisado, transformando-se nas facetas principais de tal anlise, como abaixo:

Faceta 1
NVEL DE ENSINO
Pr-escolar
1 Grau
2 Grau
3 Grau
Faceta 2
MTODO DE ENSINO
Instruo Programada
Audiovisual
Faceta 3
DISCIPLINAS
Portugus
Ingls

101

A combinao dos conceitos em uma estrutura facetada feita no momento da classificao ou indexao, no sendo necessrio, como no caso da estrutura hierrquica, que
haja um local pr-determinado para todas as combinaes conceituais. Obtm-se, assim,
no s, uma economia de smbolos, como a liberdade de coordenar conceitos se, e quando
necessrio. Podemos confirmar que Faceta pode ser igualada Categoria como tambm
Caracterstica. O processo de organizao de conceitos usando a facetao nos indica que
o produto final mais sinttico, uma vez que os conceitos no precisam ser repetidos para
a correta estruturao do esquema classificatrio. Porquanto se diz que, a partir de um conceito geral s se pode enumerar as espcies, enquanto que a partir de um conceito individual pode-se inferir conceitos gerais, descobrindo-se as categorias ou facetas gerais que melhor se adeqem anlise do tema.

Organizao formal do tesauro


Independente do uso do software17 que vai gerenciar os processos de alfabetao,
correspondncias hierrquicas e inverses ou remissivas, o construtor de linguagens documentrias no pode fugir tarefa de fichar a terminologia, pois com base na anlise individual de cada termo escolhido para representar um conceito que a mente humana vai conseguir traar as sua relaes. A capacidade de estabelecer aproximaes e analogias entre
os conceitos prpria do raciocnio humano, cabendo mquina, nica e exclusivamente
(at que os modelos conceituais artificias estejam plenamente desenvolvidos), receber as
ordens sobre tais relacionamentos, os quais devem estar concludos antes do incio do uso
do software.
A primeira operao desta etapa , portanto, a alfabetao dos termos levantados.
Neste momento, so identificados aspectos tais como:
a) termos iguais em contedo, com grafias diferentes;
b) freqncia de ocorrncia de termos;
c) termos no singular e no plural;
d) termos em lnguas diferentes;
e) termos especializados;
f) termos genricos ou com multi-valncias.

102

Esse primeiro contato com o universo terminolgico permite ao especialista, neste


momento, tomar algumas decises antes de prosseguir para a etapa seguinte, que a da
definio conceitual. No que diz respeito a grafias distintas ou aos termos em duas ou mais
lnguas, um indicador de deciso pode ser o da freqncia de aparecimento, j ficando consignada uma relao de identidade entre eles. Quanto forma gramatical de desinncia
numrica, pode-se considerar o seguinte:
a) deve haver consistncia quanto a plural e singular;
b) nem sempre pode-se afirmar que o plural est para o gnero e o singular
para a espcie.
Na verdade, estamos construindo uma rede conceitual e no uma rede de palavras.
Assim, se a representao do conceito, na sua forma simblica, for mais geral quando a
palavra estiver no singular, tal forma deve ser a escolhida. Por exemplo: Administrao (+
geral) do que Administraes. Pode-se atribuir a esta figura o correspondente gramtica,
denominada concordncia mental ou silepse. Uma outra possibilidade a de considerar
para os substantivos, tal como na lngua inglesa, a propriedade de serem numericamente
contveis ou no (much e many), ex: dinheiro; casas. Os demais aspectos ou problemas
encontrados nesta etapa sero resolvidos com o estabelecimento das definies conceituais.

103

A nica possibilidade de relacionar conceitos quando conhecemos seu significado.


Para Gomes18, a definio do termo importante na medida em ela fornece as caractersticas do conceito, o que vai permitir seu agrupamento e a indicao das possveis relaes
com outros conceitos. Para Dahlberg19, as definies so pressupostos indispensveis na
argumentao e nas comunicaes verbais, pois pelo domnio perfeito das estruturas dos
conceitos que ser possvel obter tambm perfeita equivalncia verbal. Embora tenhamos
claro que a mesma palavra pode ter vrios sentidos, nosso objetivo encontrar uma definio adequada no palavra, mas ao conceito que queremos relacionar. Desse modo, o processo de definio conceitual passa por duas etapas. A primeira diz respeito ao entendimento do termo, no sentido de isolar as caractersticas essenciais para poder efetuar a comparao com outras caractersticas de outros termos. Podemos chamar esta operao de
compreenso conceitual. A segunda, aps organizarmos o termo dentro de uma rede de
relacionamento com outros termos, se refere definio propriamente dita, ou seja, efetuar
uma equao de sentido, indicar os limites semnticos do termo para a abordagem desejada. Por isso Gomes diz que na prtica, a definio no se dar no incio da estruturao,
mas no final, quando ento se domina o conceito e se sabe exatamente qual o significado
do termo com o qual se est trabalhando e qual a abrangncia do conceito til no tesauro.
Mas, se no possvel relacionar conceitos sem que se domine seu significado, ficaramos
num crculo vicioso. A soluo pode ser o uso prioritrio da definio real na primeira fase
e da definio nominal na segunda. Dahlberg explica a diferena: definio nominal tem
por fim a fixao do sentido da palavra, enquanto que definio real procura delimitar a
intenso de determinado conceito, distinguindo-o de outro com idnticas caractersticas.
Por exemplo:
Discografia = df. (nominal) catalogao de discos
df. (real) descrio metdica dos discos numa coleo

Ainda em Dahlberg, vale ressaltar que com a ajuda da distino aristotlica entre
gnero prximo e diferena especfica possvel estruturar as formas simples e complexas
das definies reais. Em todos os casos encontramos no definiens um conceito mais amplo
do que est contido no definiendum, seguido de uma caracterstica chamada diferena especfica ou caracterstica especificadora. Por exemplo: homem = df. mamfero bpede.

104

As definies acompanham tambm os tipos de relacionamento entre conceitos


apresentados por Dahlberg. Assim, temos por exemplo:
a) definio genrica
Bolo df = um produto de confeitaria
b) definio partitiva
Bolo

df =

um produto

composto de

farinha,

manteiga,

ovos,

leite, acar e fermento.


c) definio de oposio
Bolo df = um alimento que no po.
d) definio funcional ou operacional
Bolo df = um alimento que se confecciona batendo o acar com a
manteiga, adicionando as gemas, o leite e a farinha e etc.
exceo da definio de oposio, que no muito usual, a melhor definio de
um conceito ou a mais completa contemplar os tipos a), b) e d), ou seja:
Definio genrica + partitiva + funcional
Bolo df = um produto de confeitaria, composto de farinha, manteiga, ovos, leite, acar e fermento, que se confecciona batendo o acar
com a manteiga, adicionando as gemas, o leite e a farinha e etc.

Deve-se ressaltar que no h necessidade de definir todos os termos levantados. S


os conceitos gerais propriamente necessitam de definies. S eles necessitam ser bem
distinguidos dos demais conceitos, a fim de que aparea, com clareza, a quais objetos se
referem. Gomes20 nomeia os conceitos gerais de um determinado domnio de conceitos

105

bsicos e indica que, estatisticamente, esses no ultrapassam dez por cento do referido domnio. Para o campo da Engenharia, por exemplo, encontramos os seguintes conceitos bsicos: Edificao, Estrutura, Viga. Como conceitos derivados: Edificao militar, Edificao industrial, Supraestrutura, Viga hiperesttica. Assim, s os primeiros precisam ser definidos, uma vez que, do ponto de vista pragmtico, as dedues subseqentes so de fcil
apreenso, at porque Militar, Industrial, Supra etc. possuem multivalncias, sendo mais
fcil apreender a combinao. No resta dvida que, se no soubermos o sentido de Militar, por exemplo, teremos que, forosamente, considerar este termo combinatrio como um
conceito a ser compreendido. As definies devem ser anotadas na ficha terminolgica, a
fim de que, a qualquer momento, possamos recuper-las para decidir qual o mais adequado
relacionamento entre os conceitos.
A organizao dos conceitos conduzida por processo de induo/deduo ou relao. medida que as associaes vo se constituindo, novos conceitos podem surgir como
complemento organizao de cada faceta. Assim, somente ao final do processo, as facetas
sero conhecidas, embora se tenha, previamente, uma idia genrica das caractersticas
essenciais dos conceitos bsicos, uma vez que estes j sofreram o processo de definio
conceitual.

106

Efetuado o relacionamento entre os conceitos, de forma indutiva/dedutiva ou relacional, como preferem Dahlberg21 e Motta22, elas vo aparecer no tesauro com a seguinte
simbologia:
Para as relaes de equivalncia:
Archive
USE

ARQUIVO

(traduo)

Lambreta
USE

MOTONETAS

(sinonmia)

Universidade do Rio de Janeiro


USE

UNI-RIO

(abreviaturas)

107

Aprendizagem
USE

ENSINO APRENDIZAGEM

(coordenao)

Para as relaes hierrquicas, de gnero/espcie ou abstratas


ARQUIVO
TG

Organizao da informao

TE

Arquivos correntes
Arquivos intermedirios
Arquivos permanentes

Onde: TG = Termo genrico; TE = Termo especfico

Para as relaes partitivas


ARQUIVO
TEP

Gavetas
Pastas
Guias

Onde: TEP = termo especfico partitivo.

Para as relaes funcionais, associativas ou relacionadas


ARQUIVO
TR

Manuscritos
Tabela de temporalidade

Onde TR = Termo relacionado.

Para o uso de qualificadores


TNIS (calado)
TNIS (esporte)

AIDS ( Medicina experimental)


AIDS (Sade pblica)

Para nota explicativa, de escopo ou de aplicao

108

Como observao, importante ressaltar que as notas explicativas referem-se contextualizao do conceito. Elas indicam os pontos de vista pelos quais o conceito foi hierarquizado. Podem significar ampliao ou reduo do campo conceitual e so necessrias
para orientar o indexador na melhor correspondncia entre conceito e descritor.

ABSORO
NE

Fenmeno. Inclui a absoro de radiao eletromagntica.

ENSINO
NE

Processo de ensino aprendizagem.

Os softwares para construo de tesauros executam a tarefa de desdobramento das


fichas, sendo necessrio apenas que se tenha, em grfico, a estruturao e o relacionamento
dos conceitos. Os modelos mais comuns de apresentao planigrfica so do tipo diagrama
em rvore e diagrama em chave, ou a combinao destes.

De acordo com Gomes, recomendvel que os termos dos tesauros sejam apresentados em ordem sistemtica para:

109

a) permitir que o usurio encontre o termo que melhor represente o conceito que ele
deseja exprimir, sem que saiba, no incio da busca, qual o mais adequado;
b) facilitar a compreenso da lgica do relacionamento e permitir modular as questes no nvel da compreenso conceitual.
c) facilitar a manuteno do tesauro, uma vez que as caractersticas que levaram ao
relacionamento conceitual esto explicitadas.
Por fim, do ponto de vista do acompanhamento terminolgico, necessrio que se
tenha um registro de cada termo representativo do conceito, com suas relaes, faceta, data
de ingresso e responsvel23. O exemplo abaixo uma das opes:
notao
termo = Documentao
informao semntica
definio = conjunto de conhecimentos e tcnicas que tm por fim a pesquisa, a reunio, a descrio e a utilizao de documentos de qualquer natureza.
informao estrutural
tipo de natureza dos termos relacionados = difuso, processamento de dados
interpretao dessas relaes = parte do processo de ... mtodo mais usado para
...
faceta = Processos informacionais
informao operativa
frequncia de uso = 10
data de incluso = 5/10/84
data de excluso = 3/5/96

A construo de tesauro no tarefa fcil. Cada linguagem construda nica, especial para um domnio do conhecimento e, portanto, passvel de ser modificada na mesma
medida em que as lnguas naturais evoluem. Novos conceitos aparecero, representados
por novos smbolos. Velhos conceitos em desuso podem ser retomados. Os usurios do
sistema de informao para o qual a linguagem foi construda podem ter novas necessida-

110

des de informao mais ou menos disciplinares ou interdisciplinares. No importa se o tesauro vai ser gerado tradicional ou automaticamente, pois com certeza, todas estas hipteses vo estar refletidas na literatura, que o ponto de partida para a construo de novas
linguagens.

A anlise do domnio para o qual ser desenhado o tesauro, a identificao

dos conceitos necessrios sua compreenso e o processo de relacionamento conceitual,


etapas necessrias construo de qualquer linguagem artificial, so processos que, tanto
dedutiva quanto indutivamente, vo criar categorias que possibilitaro a desconstruo do
documento e sua reconstruo simblica, sinttica e representacional, em uma linguagem
documentria capaz de fazer coincidir as necessidades de informao do usurio com os
registros disponveis na memria documentria.

HOLANDA, Aurlio Buarque de. Novo dicionrio da lngua portuguesa. Rio de Janeiro: Nova Fronteira,
1975. p. 358
2

ABBAGNAMO, Nicola. Dicionrio de filosofia. So Paulo : Mestre Jou, 1970. p. 153-154

WANDERLEY, M. A. op. cit., p. 193.

GOMES, H. E. op. cit., p. 19

ECO, Umberto. Semitica e filosofia da linguagem. op. cit. p. 180.

Cf. PIEDADE, Maria Antonieta Requio. Introduo teoria da classificao. Rio de Janeiro :
Intercincia, 1983. p. 17
7

JOLIVET, Regis. op. cit.

WANDERLEY, M. A. Limitaes dos sistemas tradicionais e inovaes neles introduzidos. Rio de Janeiro
: Uni-Rio, 19. Notas de aula
9

DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Rio de Janeiro, v. 7,

10

n. 2, p.101-107, 1978.

DAHLBERG, Ingetraut. Knowledge organization and terminology : philosophical and linguistic bases.
International classification, v. 19, n. 2 , p. 65-71, 1992.
11

GOMES, op. cit., p. 20

12

GOMES, op. cit., p. 20-23

13

PINTO, Maria Cristina. op. cit.

14

Motta, Dilza Fonseca da. op. cit.

111

15

Piedade, M. A. R. op. cit. p. 20

16

PIEDADE, M. A . R. op. cit p. 21-22

17

TECER: programa de elaborao de tesauros em microcomputador. Braslia : CNPq/IBICT, 1989.

18

Gomes, H. E. op. cit., p. 25.

19

DAHLBERG, I. Teoria do conceito. Ci. Inf., Rio de Janeiro, v. 7, n. 2, p. 101-107, 1978.

20

GOMES, H, E. op. cit., p.

21

DAHLBERG, I. Structure and construction of classification systems. Rio de Janeiro, 1975. Notas de aula.

22

MOTTA, Dilza Fonseca da. Mtodo relacional como nova abordagem para a construo de tesauros. Rio
de Janeiro : SENAI, 1987.

23

Existem estudos para o desenvolvimento dos chamados tesauros dinmicos, que so construdos e
atualizados automaticamente medida em que as colees para as quais servem como instrumento de ajuda
na recuperao, incorporam e retiram documentos. Cf. http://dewey.yonsel.ac.kr/memexlee/doc/thes_ads.htm
Capturado em 09/10/2001.

6 A Propsito

Este livro comeou a ser escrito em 1983, ano em que ingressei na Universidade do
Rio de Janeiro (Unirio). O tema Tesauro j havia sido objeto de minha dissertao de mestrado, defendida em 1979 no Instituto Brasileiro de Informao em Cincia e Tecnologia
(IBICT), antigo Instituto Brasileiro de Bibliografia e Documentao (IBBD), sob a orientao de Frederic Wilfrid Lancaster. Ao aceitar o desafio de assumir a disciplina Classificaes especialidades, ministrada por Manoel Adolpho Wanderley, que se aposentava no
ensino universitrio, iniciei um percurso de estudos e reflexes sobre os fundamentos tericos do campo documental. Os resultados, entre outros, se concretizaram na criao das
disciplinas Organizao de Conceitos em Linguagens Documentrias e Anlise da Informao, oferecidas aos Cursos de Arquivologia, Biblioteconomia e Museologia da Unirio, e
na minha tese de doutoramento, defendida em 1997, na Escola de Comunicao da Universidade Federal do Rio de Janeiro (UFRJ), intitulada O sentido e o significado de documento para a memria social.
Os roteiros de aulas, aliados doao da biblioteca particular do Professor Wanderley para a Unirio, representam as fontes principais das discusses apresentadas neste trabalho. Com efeito, importante esclarecer que no houve a inteno de construir o texto com
a caracterstica de um manual de orientao para a construo de tesauros, pois j dispomos
de excelentes trabalhos, tais como os de Hagar Espanha Gomes, alm de normas nacionais
e internacionais. A proposta deste livro foi a de organizar os conceitos do campo documental, isto , traar um roteiro, construir uma moldura para a rede de relaes interdisciplinares, partindo do pressuposto que o tesauro o instrumento que melhor espelha a comunicao da informao, e que o especialista, principalmente o bibliotecrio, o principal
ator na intermediao entre a produo e a circulao da informao.
A defesa das linguagens documentrias, sua construo e crtica, no exemplo dos
tesauros, foi desencadeada pela discusso terica, considerando-se a importncia de ressaltar mais a sua essncia e seus modos de ser, do que os exemplos de sua utilizao, pois aos
ltimos, a dinmica da memria eletrnica aponta para o carter voltil, repetitivo e apcrifo dos registros. Contudo, a exemplo da experincia didtica, os contedos foram desenvolvidos em um encadeamento que permitiu identificar as contribuies da Cincia da In-

113

formao, principalmente no entendimento do modelo sistmico de transferncia da informao e o papel das linguagens documentrias nesse contexto. As teorias da Comunicao
foram fundamentais para a compreenso dos estgios de representao do conhecimento,
assim como para o desenvolvimento de um quadro terico-metodolgico de representao
simblica do conhecimento, a qual deve ser baseada nos sistemas de signos da linguagem.
Nas relaes entre lngua natural e linguagem documentria verificou-se a correspondncia
entre os domnios da linguagem comum, da linguagem artificial e do pensamento, respectivamente da alada da Lingstica, da Lgica, da Epistemologia e da Psicologia. A Filosofia
permeou toda a discusso sobre a organizao de conceitos, sendo a viso aristotlica do
Ser o ponto referencial de todas as abordagens, tornando-se at mesmo difcil a classificao dos discursos em lgicos e empricos.
Sem dvida, no possvel o exerccio de comportamento crtico isento do domnio
cognitivo. Ranganathan confirmaria essa afirmao, pois foi o primeiro bibliotecrio a apresentar solues para s discusses emergentes sobre a relatividade na anlise dos fenmenos fsicos e sociais, desencadeando a produo terica no campo da representao do
conhecimento, e tendo em Dahlberg sua melhor discpula, visto que ela se colocou na vanguarda da pesquisa em teoria da classificao, com uma produo cientfica disseminada
internacionalmente. Estes exemplos recuperam para a Biblioteconomia um campo filosfico de discusso esquecido durante anos de abordagens tecnicistas. No seu bojo, aparecem
no s as questes fundamentais ligadas organizao de conceitos em linguagens documentrias, mas aos demais aspectos da representao do conhecimento.
A certeza de que o tema complexo, no se esgotando com a discusso aqui apresentada, oferece tantas outras possibilidades de abordar o problema da organizao do conhecimento, quanto de considerar que o tesauro , neste momento, o modelo necessrio de
linguagem de representao da memria documentria.

REFERNCIAS BIBLIOGRFICAS

ABBAGNAMO, Nicola. Dicionrio de filosofia. So Paulo: Mestre Jou, 1970.


BEGHTOL, Claire. Domain analysis, literary warrant and consensus: the case of fiction
studies. Journal of the American Society for Information Science. v. 46, n. 1, p. 30-44,
1995.
BRADFORD, S. C. The documentary chaos. In: ____. Documentation. London: Crosby
Lockwood & Son, 1953. cap. IX.
BRITO, Marclio de. Sistemas de informao em linguagem natural: em busca de uma indexao automtica. Ci. Inf., Braslia, v. 21, n. 3, p. 223-232, set./dez., 1992.
BURT, P. V. , KINNUCAN, M. T. Information models and modeling techniques for information systems. Annual Review of Information Sciences and Technology. Holanda: Elsevier, v. 25
CHAI KIM, SOON KIM. Consensus vs frequency: an empirical investigation of theories
for identifying descriptors in designing retrieval thesauri. Information Processing Management, London, v. 13, n. 4, p. 253-258, 1977.
CINTRA, Ana Maria Marques et al. Para entender as linguagens documentrias. So
Paulo : Polis : APB, 1994.
CINTRA, Ana Maria Marques. Estratgias de leitura em documentao. In: SMIT, Joahanna W. (coord.) Anlise documentria: a anlise da sntese. Braslia: SCTPR/CNPq/IBICT, 1898. p. 30-38.
CLARKE, D. Models in archaeology. London : Methuen, 1972.
COMMITTEE ON SCIENTIFIC AND TECHNICAL INFORMATION. Guidelines for
the development of information retrieval thesauri. Washington : Government Printing Office, 1967.
COULON, Daniel, KAYSER, Daniel. Informtica e linguagem natural: uma viso geral
dos mtodos de interpretao de textos escritos. Braslia: SCT-PR/CNPq/IBICT, 1992.
COYAUD, Maurice. Analyse et recherche documentaire. In: __________. Linguistic et
documentation: les articulations logiques du discours. Paris: Larousse, 1972. p130
CUNHA, Isabel M. R. Ferin. Anlise documentria : parmetros tericos. In: SMIT, Joahanna W. (coord.) Anlise documentria: a anlise da sntese. So Paulo: USP, 1986.
CUNHA, Maria Isabel R. Ferin. Do mito anlise documentria. So Paulo: EDUSP,
1990. (Tese de doutorado)

115

CUNHA, Maria Isabel R. Ferin. (Coord.) Anlise documentria: consideraes tericas e


experimentaes. So Paulo: FEBAP, 1989.

DAHLBERG, Ingetraut. Knowledge organization and terminology: philosophical and linguistic bases. International classification, v. 19, n. 2 , p. 65-71, 1992.
DAHLBERG, Ingetraut. Structure and construction of classification systems. Rio de Janeiro, 1975. (Notas de aula).
DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Rio de Janeiro, v. 7, n. 2, p.101-107,
1978.
DEBONS, A. Information science: search for identity. Dekker, 1974.
DELEUZE, G., GUATTARI, F. Rhizome. Paris: Minuit, 1976.
DODEBEI, V. L. D. L. M., MENDONA DE SOUZA, Alfredo. Cincia da Informao:
formao e interdisciplinaridade. Rio de Janeiro: IBICT/CNPQ/ ECO/USP, 1992.
DODEBEI, V. L. D. L. M. Construo de thesauri: experimento emprico para a coleta
de termos em formao profissional. Rio de Janeiro, 1979. (Dissertao apresentada ao
Instituto Brasileiro de Informao em Cincia e Tecnologia / Universidade Federal do Rio
de Janeiro para a obteno do grau de mestre em Cincia da Informao).
DODEBEI, V. L. D. L. M. Espaos mtico e imagtico da memria social. In: Memria e
espao. Rio de Janeiro: 7 Letras, 2000. p. 63-71.
DOYLE SILVA, Ernani, FERREIRA, Llio. Dicionrio inverso. Rio de Janeiro: Abril,
1956. fasc. 1.
DYM, E. D. A new approach to the development of a technical thesaurus. Proceedings
of the American Documentation Institute, Washington, D.C. n. 4, p. 126 -131, 1967.
ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo: Perspectiva, 1991.
ECO, Umberto. Semitica e filosofia da linguagem. So Paulo: tica, 1991.
FOSKETT, A. C. A abordagem temtica da informao. So Paulo : Polgono, 1973. p.
10, 20, 40.
FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documentation. Strasbourg : Council of Europe, 1972.
FOUCAULT, Michel. A palavra e as coisas: uma arqueologia das Cincias Humanas.
So Paulo: Martins Fontes, 1994.

116

GOMES, Hagar Espanha (org.) Manual de elaborao de tesauros monolnges. Braslia: PNBU, 1990.
GOMEZ, Maria Nelida Gonalez. A representao do conhecimento e o conhecimento da
representao: algumas questes epistemolgicas. Ci. Inf., Brasilia, v. 22, n. 3 p. 217-222,
set./dez. 1993.
GOODMAN, F. The role and function of the thesaurus in education. In: THESAURUS
of ERIC descriptors. New York : CCM Information Corporation, 1972.
GORSKY, D. P. Lengaje y conocimiento. In: Pensamiento y lenguaje. Mexico : Grijalbo,
1966.
GROLIER, Eric de. tude sur les catgories gnrales applicables aux classifications et
codifications documentaires. Paris: UNESCO, 1962. p. 262.
HAGGET, P., Chorley, R.J. Modelos, paradigmas e a nova Geografia. In: ________.
Modelos scio-econmicos en Geografia. Rio de Janeiro: Livros Tcnicos e Cientficos /
USP, 1975.
HJORLAND, Birger, ALBRECHTSEN, Hanne. Toward a new-horizon inInformation
Science: Domain-Analysis. Journal of the American Society for Information Science. v.
46, n. 6, p. 400-425, 1995.
HOLANDA, Aurlio B. Novo dicionrio da lngua portuguesa. Rio de Janeiro: Nova
Fronteira, 1975.
HULME, E.W. Principals of book classification. Association of Assistant Librarians,
1950.
JARDIM, Jos Maria. Cartografia de uma ordem imaginria: uma anlise do sistema
nacional de arquivos. (Dissertao de Mestrado em Cincia da Informao. Escola de
Comunicao, Universidade Federal do Rio de Janeiro, 1994)
JOLIVET, Rgis. Curso de filosofia. Rio de Janeiro : Agir, 1965.
KOBASHI, Nayr Yumiko. Anlise documentria e representao da informao. INFORMARE Cad. Prog.Ps-Grad. Ci.Inf., Rio de Janeiro, v.2, n.2 p. 5-27, jul./dez. 1996.
LANCASTER, F. W. Indexo e resumos: teoria e prtica. Braslia: Briquet de Lemos,
1993. p. 15-17.
LANCASTER, F. W. Information retrieval systems: characteristics, testing and evaluation. 2. ed. New York: Wiley, 1979.
LANCASTER, F. W. Vocabulary control for information retrieval. Washington : Information Resources Press, 1972.

117

LARA, Marilda Lopes Ginez de. Algumas contribuies da semiolologia e da semitica


para a anlise das linguagens documentrias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226,
set./dez. 1993.
LATOUR, Bruno. Redes que a razo desconhece: laboratrios, bibliotecas, colees. In:
O poder das bibliotecas: a memria dos livros no Ocidente. Rio de Janeiro: Editora UFRJ, 2000. p. 29
LESKA, B. M. Theoretical and methodological problems of therminology In: PROCEEDINGS of inter international symposium, Nov. 27-30, 1979, Warsaw
LYYTINEN, K. Two views of information modelling. Information & Management, v.
12, n. 1, jan. 1987.
MAGRO, Cristina. Representao, Virtus Dormitiva e linguagem. In: OLIVEIRA. P. ;
BENN-IBLER, V. e MENDES, E. (orgs) Revisitaes: Edio Comemorativa dos 30 anos
da Faculdade de Letras. Belo Horizonte: Editora FALE/UFMG. 1999. p. 29 44.
MARCONDES, C. H. , SAYO, L. F. Teoria Geral dos Sistemas: Sistemas de Informao Rio de Janeiro: UFRJ/ECO, 1992. (Seminrio apresentado disciplina Linguagem e
Cincia da Informao V, Curso de Doutorado em Cincia da Informao)
MARCONDES, Carlos Henrique. Representao e economia da informao. Ci. Inf., Brasilia, v. 30, n. 1, p. 61-70, jan./abr. 2001.
Mc GARRY, K. J. Da documentao informao : um contexto em evoluo. Lisboa :
Editorial Reserva, 1984.
MENDONA DE SOUZA, Alfredo, DODEBEI, Vera Lucia. Modelos e sistemas em Cincia da Informao. Rio de Janeiro, UFRJ/ECO, 1992. (Terceiro Seminrio apresentado
diciplina Linguagem e Cincia da Informao III).
MERLEAU PONTY, Maurice. O visvel e o invisvel. So Paulo: Perspectiva, 1992. p22
MONTGOMERY, Christine A. Automated language processing. Annual Review of Information Science and Technology. v. 4, p.145-174, 1969.
MOTTA, Dilza Fonseca da. Mtodo relacional como nova abordagem para a construo
de tesauros. Rio de Janeiro : SENAI, 1987.
NOCETTI, Milton A., FIGUEIREDO, R. C. Lnguas naturais e linguagens documentrias: traos inerentes e ocorrncias de interao. R. Bibliotecon. Braslia, v. 6, n. 1. p. 2337.
PICKFORD, A. G. A. FAIR (Fast Access Information Retieval) Project. Aslib Procedings, London. v. 19, n. 3, p. 79-95, 1976.
PIEDADE, Maria Antonieta Requio. Introduo teoria da classificao. Rio de Janeiro : Intercincia, 1983. p. 17

118

PINTO, Maria Cristina Mello Ferreira. Anlise e representao de assuntos em sistemas


de recuperao da informao; linguagens de indexao. R.. Esc. Bibliotecon., UFMG,
Belo Horizonte, v. 14, n. 2 p. 169-186, set. 1985.
RANGANATHAN, S. R. Philosophy of library classification. Copenhagen : Ejnar
Munksgaard, 1951.
RANGANATHAN, S. R. Prolegomena to library classification. Bombaim : Asia Publishin House, 1967.
RAYWARD, W. Boyd. Visions of Xanadu : Paul Otlet (1868-1944) and hypertext.
Journal of the American Society for Information Science, v. 45, n. 4, p. 235-250, 1994.
RICHAUDEAU, F. Langage et action. In: LES THORIES de laction. Paris : Hachette,
1972.
SADANI, Lalthoum; BERTRAND-GASTALDY, Suzanne. La reprsentation dans Internet des comnaissances dn domaine. Documentation et bibliothques, jan./mars, p. 27
42, 2000.
SAUSSURE, Ferdinand de. Curso de Lingstica geral. So Paulo: Cultrix, 1974. p.
136-139.
SHANONN, C. E., WEAVER, W. The mathematical theory of communication. Urbana:
Univesity of Illinois Press, 1949.
SHERA, J. H., EGAN, M. E. Catlogo sistemtico: princpios bsicos e utilizao. Braslia : Editora Universidade de Braslia , 1969.
SMIT, Johanna, W. A anlise da imagem: um primeiro plano. In: Anlise documentria:
consideraes tericas e experimentaes. So Paulo: FEBAP, 1989. p. 102-113
SOERGEL, D. Indexing languages and thesauri : construction and maintenance. Los Angeles : Wiley - Becker & Hayes, 1974.
SPIRKIN, A. G. Origen del lenguaje y su papel en la formacin del pensamiento. In: Les
thories de laction. Paris, Hachette, 1972.
TECER: programa de elaborao de tesauros em microcomputador. Braslia :
CNPq/IBICT, 1989.
UNESCO. Guia para la creacin y desenvolvimiento de thesaurus multilingues, tcnicos y
cientficos, destinados a la recuperacin de dados. CINTERFOR Documentation, Montevideo, v. 32, p. 13-17, 1973.
VICKERY, B. C. Knowledge representation : a brief review. Journal of Documentation,
42, n. 3, p. 145-159, Sept. 1982.

119

VICKERY, B. C. Thesaurus - a new world in documentation. Journal of Documentation,


v. 16, n. 4, p. 181-189, Dec. 1960.
VIRILIO, Paul. A mquina de viso. Rio de Janeiro : Jos Olympio, 1994.
WANDERLEY, M. A. Limitaes dos sistemas tradicionais e inovaes neles introduzidos. Rio de Janeiro: UNIRIO, 1980. (Notas de aula)
WANDERLEY, M.A . Linguagem documentria: acesso informao. Ci. Inf., Rio de
Janeiro, v. 2, n. 2. p. 175-217, 1973.
WANDERLEY, Manoel Adolfo. Organizao da memria documentria: a matriz documentria. Rio de Janeiro: UNIRIO/CCH, 1980. (Notas de Aula)