Você está na página 1de 50

ndices Alfabticos da Classificao Decimal Universal

Eimar Tby Ohman

Traduo de Giorgio Bullaty Reviso de Padre Astrio Campos Membro d a I B B D / C D U

RESUMO Tenho a impresso que, entre os especialistas em C D U , existe uma subestima dos ndices alfabticos, como mais ou menos est expresso na segunda das citaes acima mencionadas. Nada h, evidentemente, que objetar contra a seguinte advertncia que se encontra na Edio Mdia Alem da C D U : "A experincia de muitos anos adverte que jamais devemos efetuar classificaes exclusivamente pelo ndice". Com muita freqncia ouvem-se tambm opinies como esta: "Nunca utilizo o ndice alfabtico; quem conhece bem as tabelas hierrquicas pode arranjar-se exclusivamente com elas". Este um exagero que no ajuda aos principiantes. Desejo mencionar aqui uma citao da mesma introduo de Dewey: Mesmo o usurio, que sabe exatamente onde encontrar nas tabelas o material procurado, pode, pela consulta ao ndice, descobrir material afim, que, de outro modo, lhe passaria despercebido". Ser esta afirmao vlida em relao aos ndices atualmente existentes nas vrias edies da C D U ? No o sempre, como a seguir demonstraremos; existem, alm disso, edies sem ndice. Os conceitos afins, de que fala Dewey, so por ele chamados "distributed relatives" e em alemo receberam o nome de "verstreute Verwandte" e em portugus chamaremos de "afins dispersos". Quando, a seguir, estabelecer discusso sobre os ndices de assunto, estarei tentando responder pergunta sobre a maneira como esses "parentes pobres" so considerados nos ndices da C D U . melhor comearmos pela edio abreviada trilingue ( 1 9 5 8 ) , na qual se encontram, lado a lado, trs ndices alfabticos de assunto (alemo, ingls e francs).

Discusso em torno dos ndices alfabticos da classificao Decimal Universal C D U uma vez que diferentes trabalhos apresentados, nos ltimos anos, tem abordado problemas referentes s tabelas. O estudo dos ndices feito nas edies abreviadas, desenvolvidas e mdias.

A classificao Decimal Universal tem sido muito discutida e criticada nestes ltimos anos ( 1 - 5 ) . Mas essa discusso tem versado, quase exclusivamente, sobre as tabelas sistemticas. Dos ndices alfabticos quase no se fez meno. Por outro lado, fizeram-se, durante estes anos, interessantes publicaes sobre os mtodos de elaborao de fichrios e registros de palavras-chaves, que so efetivamente indispensveis aos usurios ( 6 - 9 ) , assim como sobre a confeco mecnica dos ndices da C D U ( 1 0 ) . Neste artigo sero tratados apenas os ndices alfabticos impressos. Gostaria de comear com duas citaes: "Este ndice alfabtico, que a parte mais importante do sistema, consta de ttulos tirados de uma multiplicidade de fontes, cuja aceitao os usurios consideraram oportuna no decursos de 54 anos". " parte sistemtica das tabelas da C D U costuma-se juntar uma parte alfabtica. Mas esse registro serve, apenas, como orientao geral e aproximada do lugar em que se deve procurar na parte sistemtica. " A primeira citao de Melvil Dewey, tirada da introduo por ele escrita, no ano de 1926, e repetida nas edies posteriores da "Classificao D e cimal de Dewey" ( C D D ) . A segunda deriva da "10. Edio Abreviada Holandesa da C D U " ( 1 9 7 0 ) . Trata-se de duas concepes essencialmente diversas sobre a importncia dos ndices alfabticos.
a

Traduo autorizada pela FID. Artigo publicado em DK-Mitteilung 16 ( 2 ) : 7-10, 1972.

Ci. Inf., Rio de Janeiro, 2(2): 169-174, 1973

169

EIMAR OHMAN

Edies

Abreviadas

A edio abreviada trilingue muitas vezes considerada padro das edies abreviadas. Entretanto, os trs ndices respectivos no se correspondem entre si como era de esperar. Isto pode ser explicado por razes lingsticas, mas s em parte. V-se, por exemplo, primeira vista, que o ndice francs muito mais curto que os outros dois: 56 pginas contra 83. Outras diferenas sero mencionadas a seguir. O ndice ingls foi elaborado, em grande parte, segundo as idias de Dewey. Quando consultamos, por exemplo, a palavra "Furnaces" ( F o r n o s ) , encontramos imediatamente remissiva para dois outros termos: "Ovens" e "Kilns", que, na realidade, podem ser considerados como quase-sinnimos. Na palavra "Ovens" encontramos os seguintes nmeros de classificao que no se encontram no termo "Furnaces" ( traduzido aqui o texto alemo da edio abreviada trilingue ) : Fomos. Foges. Aparelhos de cozinha e de aquecimento 6 6 6 . 3. 041 Fornos. Cozimento ( C e r m i c a ) 683. 95 Foges e fornos de cozinha (Ferragens) Em "Knils" encontramos de novo 6 6 6 . 3. 0 4 1 ; este termo muitas vezes usado em ingls para indicar fornos da cermica. Poder-se-ia talvez observar que as remissivas mencionadas no so completas. Se tivssemos encontrado tambm "Stoves", teramos chegado a 6 8 3 . 94, o que reproduzido no texto alemo com "Ofen". Alm disto teramos gostado de encontrar referncias a "Heaths" e "Grates". O ltimo termo nos leva a 6 6 2 . 932 Grelhas. Apesar disto, as remissivas inglesas so muito teis. No h cousa parecida nos ndices alemes e franceses. Sc em "Ofen" encontrssemos, p. ex., referncias a "Herde" (foges), "Hochfen" (altosf o r n o s ) ) . "Kamine" (chamins) e "Kuchenfen" (fornos de cozinha), assim como em "Fours" (fornos) referncia a "Fourneaux", "Peles", etc. aumentaria consideravelmente o valor dos dois ltimos ndices mencionados. Causam estranheza as lacunas do ndice alemo. Em "Ofen" s encontramos trs nmeros, 6 2 1 . 783, 6 6 . 041 e 6 6 9 . 0 4 1 . Sente-se a a falta de 6 8 3 . 9 Fornos. Aparelhos de aquecimento. Mas, continuemos com o termo "Furnace" do ndice ingls. Encontramos, ento, duas importantes remissivas, no para quase-sinnimos, mas para conceitos afins. A mais importante, sem dvida, a de 6 6 2 . 9 Tecnologia da combusto. A seguir, temos em 6 6 . 043, portanto em materiais de construo para fornos, uma referncia a 6 6 6 . 76 Materiais refratrios. Os leitores podero chamar a ateno para o fato que nas tabelas existem remissivas e estas podem ser suficientes. Voltarei a isto mais tarde; alis, na edio abreviada as 6 4 3 . 33

remissivas so bem poucas. No existem, ento, remissivas no ndice alemo da edio abreviada trilingue? Existem, mas so poucas. Por outro lado, podem ser descobertas com facilidade por serem impressas em itlico. Em mdia, porm, s existem trs destas remissivas para cada pgina de trs colunas. Elas se dividem, por partes quase iguais, cm dois tipos diferentes, como os exemplos seguintes indicam: Abbildungen (Gravuras) siehe auch (ver tambm) Lichtbilder (Fotografias), Photographien, Portraits Ackerbden (Solo arvel) siehe ( v e r ) Bodenkunde Cincia do solo) No primeiro caso ("Ver tambm") trata-se de remissivas para palavras-chaves usadas no ndice com o mesmo significado, tais como se encontram em grande quantidade no ndice ingls (indicadas com "Cf. " = Ver t a m b m ) . Para uma, duas ou talvez trs remissivas de "Ver tambm de cada pgina do ndice alemo existem de 20 para trinta no ndice ingls. No segundo caso, ao invs, trata-se de termos que no se encontram nas tabelas sistemticas, mas provavelmente so procurados por muitos usurios. Faz-se ento referncias a uma palavra-chave que leva ao ponto exato nas tabelas. Tambm este tipo de remissiva aparece mais freqentemente no ndice ingls do que no alemo, mas a diferena no to marcante. No ndice francs no existem remissivas. Edies desenvolvidas

Todos os utilizadores da C D U tm, por motivos lingsticos, que limitar-se a duas ou, talvez, trs edies. Por motivos bvios se d preferncia lngua materna. Quando, por exemplo, se trata de um sueco, como o caso do autor, e no existe edio desenvolvida em sueco, foroso fazer uso de edies em lngua estrangeira, nos casos em que a edio abreviada no suficiente. Devo limitar-se s edies desenvolvidas alem, inglesa e francesa. Os ndices da segunda edio francesa e da terceira alem tm, aproximadamente, 40 e 20 anos de idade respectivamente. Esto, evidentemente, antiquados. Contudo, deve-se admitir que o trabalho de Carl Walther, que se encontra no ndice da edio desenvolvida alem, presta ainda bons servios. Se, atravs deste ndice, somos conduzidos a um nmero j eliminado, h sempre a possibilidade de encontrar o nmero novo, sendo a maneira mais fcil de faz-lo a consulta ao "Comulated U D C Supplement", publicado pela F I D em 1967. A a maioria dos nmeros acompanhada de texto alemo. Consideravelmente mais complicada a utilizao da segunda edio francesa, h muito esgotada e muito desatualizada. Infelizmente, agora est esgotado tambm o ndice alemo.

Ci. Inf., Rio de Janeiro, 2(2): 169-174, 1973

170

NDICES ALFABTICOS DA CLASSIFICAO DECIMAL UNIVERSAL

A edio desenvolvida inglesa no tem, infelizmente, ndice uniforme e completo. Esta edio publicada em fascculos, sendo que a maioria deles, mas no todos, tem ndice alfabtico resumido. Merecem especial interesse os ndices dos fascculos publicados seguidamente a partir de 1968. Tomo como exemplos o fascculo que contm a classe 618 Qynaecology. Obstetrics e o que contm a classe 6 3 6 / 6 3 9 Animal Breeding. Animal Produce. Hunting. Fislting. Encontramos, naturalmente, aqui, como em geral nos ndices antigos das tabelas desenvolvidas, forte ligao com a terminologia das tabelas sistemticas. Mas os seguintes fatos devem ser observados. Encontram-se remissivas "Ver" e "Ver tambm". Por exemplo: Insemination, artificial see ( V e r ) Artificial insemina mination Abnormalities see also ( V e r t a m b m ) Anomalies Alm disso, encontram-se, s vezes, sinnimos dos termos usados no texto da tabela. Exemplo: na tabela 6 1 8 . 156 Wall between urinary bladder and vagina no ndice "Paries vesico-vaginalis" 6 1 8 . 156. Deparamos, ento, com dispositivos, mesmo que no sejam numerosos, introduzidos com a finalidade de facilitar a utilizao das tabelas. Por outro lado, a separao dos ndices importa numa grande limitao das remissivas. De 618 nunca se faz remissiva para outras partes de 61 Medicina. Para descobrirmos, p. ex., que inseminao artificial se encontra tambm em 636, devemos, examinar o ndice de 6 3 6 / 6 3 9 . Os conhecedores da lngua russa podem tirar proveito do ndice da edio desenvolvida russa publicada em 1970. Consta de dois tomos, tendo no total mais de setecentas pginas. Pelo que sei, no se tenciona publicar, no momento, novo ndice da edio desenvolvida alem. Os usurios de lngua alem devem, por conseguinte, contentar-se, para o futuro, com o ndice da edio mdia. Edies mdias

No momento, s existem trs edies mdias da C D U : a alem (DK-Handausgabe), a francesa (Edition Moyenne) e a russa (Srednee Izdanie). Sobre esta ltima no me possvel, infelizmente, entrar aqui em detalhes. As duas primeiras foram publicadas em 1967. J no ano seguinte foi editado o segundo volume que o ndice alfabtico da edio alem. O respectivo ndice francs ainda no foi publicado. Devo, por conseguinte, limitar-me ao ndice da edio mdia alem. Este ndice foi preparado por meio de um computador eletrnico. Os mtodos utilizados acham-se descritos no prefcio de Karl Fill ao ndice. Outros detalhes podem ser fornecidos pelas diversas publicaes da "Zentralstelle fr maschinelle Dokumentation"

(rgo Central de Documentao por meio de mquinas) ( 1 0 ) . Hoje parece natural que os ndices futuros sejam elaborados por meio de mquinas. , portanto, tambm desejvel que esta primeira tentativa seja submetida a um exame crtico. Esta edio apresenta, inegavelmente, muitas falhas, que no podem, de certo, ser atribudas mquina. Elas so, antes, devidas insuficiente elaborao do material apresentado. Antes de tudo, de lamentar que faltem aqui completamente as remissivas ("Ver" tambm") existentes na edio abreviada trilingue. Em "Ofen" ( F o r n o s ) encontramos (para tomar o mesmo exemplo) onze entradas, desde "Ofen" (Bauhandwerk) (Ofcio de pedreiro) at "Ofen" (Zentralheizungen) (Aquecimentos centrais). Seriam aqui muito teis ao usurio remissivas para "Glasschmelzfen" ( F o r nos de fundio de vidro) e "Hoch-fen" (Altosfornos). No se pode, naturalmente, fazer remissiva para todos os termos em que "Ofen" aparece como segundo ou terceiro elemento, mas nos casos mencionados trata-se de setores tcnicos importantes. As remissivas existentes nas tabelas sistemticas, mesmo sendo abundantes, no do, infelizmente, uma viso geral de que se necessita muitas vezes. Se, p. ex., examinarmos nas tabelas todos os onze nmeros para "Ofen" ( F o r n o s ) , que encontramos no ndice, verificamos que em nenhum lugar se faz remissiva para 5 4 2 . 41 "Ofen" (Experimentalchemie) (Fornos Qumica experimental), para 6 2 1 . 7 4 5 . 3 "Ofen" (Giessereitechnfk) (Fornos Tcnica de fundio) e para 6 8 3 . 9 "Ofen" (Heizgerate) (Fornos Aparelhos de aquecimento). Destes trs nmeros, por outro lado, se faz remissiva para outros nmeros indicados no ndice. As remissivas so, portanto, muitas vezes, unilaterais, o que dificulta a viso de conjunto. Mais importantes seriam sinnimos para os verbetes que se encontram nas tabelas, mas estes faltam completamente. Para que seja verdade que "o ndice alfabtico torna a C D U um Thesaurus universal, como Fill afirma no prefcio, preciso que os sinnimos estejam presentes em grande abundncia. Outro exemplo. Encontramos trs lugares para "Khlen (Refrigerar), p. ex., na indstria do vidro 6 6 6 . 1. 038, cinco lugares para "Khlung" (Refrigerao) nos altos fornos 6 6 9 . 162. 214, quatro lugares para "Abkhlen" (Esfriar) na tcnica qumica 6 6 . 0 6 5 . 3 e dois lugares para "Abklung" (Esfriamento) na tcnica de fundio 6 2 1 . 7 4 6 . 6. Aqui deve o pobre usurio procurar sempre e sempre mais, pois h ainda uma grande quantidade de outros verbetes que fazem remissivas para subdivises das tabelas que no se encontram absolutamente nas quatro entradas acima mencionadas, p. ex., as seguintes: "Khlanlagen" (Kltetechnik) (Instalaes frigorficas Tcnica de refrigerao) 6 2 1 . 565, "Khler" (Pneumatische Maschinen) (Refrigerador Mquinas pneumti-

Ci. Inf., Rio de Janeiro, 2(2): 169-174, 1973

171

EIMAR OHMAN

cas) 6 2 1 . 5. 048, "Khlgruben" (Warmebehandlung) (Poos de refrigerao Tratamento trmico) 6 2 1 . 7 8 4 . 8, "Khlmitter (Kerntechnik) (Agentes frigorficos Tcnica nuclear) 6 2 1 . 0 3 9 . 534, "Abkhlungsgrosse" (Klimatechnik) (Grandeza de esfriamento Tcnica de ar condicionado) 6 2 8 . 862, "Ofenabkhlung" (Warmebehandlung) (Esfriamento de fornos Tratamento trmico) 6 2 1 . 7 8 4 . 8. Aqui um sistema de remissivas teria facilitado muito a procura penosa dos usurios. bastante surpreendente que os verbetes utilizados sejam por demais incompletos. "Khlung" ( R e frigerao) ou "Abkhlung" (Esfriamento) so mtodos importantes no tratamento trmico de materiais metlicos. Este assunto includo em 6 2 1 . 78. Nas tabelas encontramos: 6 2 1 . 7 8 . 081 Esfriamento lento, p. ex. em fornos . 082 Esfriamento normal, p. ex. em ar parado . 084 Arrefecimento em lquidos Temos, alm disto, o seguinte nmero principal: 6 2 1 . 7 8 4 . 8 Instalaes c dispositivos para esfriamento lento e normal. Esfriamento de fomos. Poos de refrigerao Em "Abschrecken" (Arrefecimento) h no ndice remissiva para 6 2 1 . 7 8 . 0 8 4 . Por outro lado, apesar de cuidadosa busca, no pude encontrar nenhuma remissiva p a r a . 081 e . 0 8 2 . O nmero principal 6 2 1 . 7 8 4 . 8 encontrado em "Ofenabkhlung" ( E s friamento de fomos) e em "Khlgruben" (Poos de refrigerao), mas no se encontra em "Abkhlung" (Esfriamento), onde certamente se procura cm primeiro lugar. Entradas compostas de adjetivo e substantivo so muitas vezes invertidas. Assim, se encontra 6 1 5 . 8 1 6 no somente em "Knstliche Atmung" (Respirao artificial), como tambm em "Atmung, knstliche" (Artificial, respirao), como tambm, porm, estas inverses so incompreensveis e levam a confuses. Exemplo: Knstliche Augen (Glasindustrie) (Olhos artificiais Indstria do vidro) 6 6 6 . 189. 1 Augen, knstliche (Augenheilkunde) (Artificiais, olhos - Oftalmologia) 6 1 7 . 7-089. 28 Pflege der Tiere (Zoologie) (Tratamento dos animais Zoologia) 591. 615 Tiere, Pflege ( T i e r z u c h t ) (Animais, tratamento Criao de animais) 6 3 6 . 0 8 3 . 3 Quando procuramos "Knstliche Augen" (Olhos artificiais) e encontramos somente 6 6 6 . 1 8 9 . 1, somos levados a crer que no h outro nmero. Mas se procuramos "Augen, knstliche" (Olhos artificiais), obtemos s o nmero de medicina. No segundo exemplo, a cousa algo diferente. Chega-se tanto atravs de "Pflege" ( T r a t a m e n t o ) , como atravs de "Tiere" (Animais), enquanto que "Zoologie" (Zoologia) chega-se apenas atravs do "Pflege".

Muitas vezes faltam inverses nos lugares onde se esperava que estivessem. Encontramos, assim: Legiertes Stahl (Eisenhttenkunde) (Aos especiais - Siderurgia) 6 6 9 . 15-194 Legiertes Gusseisen (Eisenhttenkund e ) Ferro gusa Siderurgia) 6 6 9 . 15-196 Acredito que a maioria dos usurios neste caso procura em primeiro lugar por "Stahl" ( A o ) e por "Gusseisen" ( F e r r o g u s a ) . Mas nesses lugares no encontram os respectivos materiais de liga. Convm observar, a esta altura, que o termo "Stahl" ( A o ) se apresenta no ndice de maneira muito incompleta. Encontramos apenas: Stahl (Baustoffe) (Ao Materiais de construo) 6 9 1 . 714 Todos sabem que o ao no s material de construo e o nmero mais importante para este conceito 6 6 9 . 14. S encontramos este nmero no ndice em ligas de ferro com carbono (Eisenlegierungen mit Kohlenstoff). O texto nas tabelas diz "Legierungen des Eisens mit Kohlenstoff (ausser Gusseisen). Stahl im allgemeinen" (Ligas de ferro com carbono, exceto ferro gusa. Aos em geral). O que gera ainda muita confuso que em "Farben" ( T i n t u r a ) se encontra a tintura de vidro, papel, manteiga e t c , enquanto que a tintura importante dos txteis se esconde algumas colunas adiante cm "Frberei" (Tinturaria). Os seguintes itens esto tambm bastante confusos: Frben (Glasindustrie) (Colorao - Indstria do vidro) 6 6 6 . 1. 0 3 1 . 1 Frben von Glas (Glasindustrie) Colorao de vidros Indstria do vidro) 6 6 6 . 1. 0 5 8 . 7 O primeiro nmero usado para colorao de fundentes de vidro, enquanto o segundo se aplica pintura sobre vidro. No seria possvel especificar melhor os conceitos colocados entre parntese? Esclarecerei melhor esta ltima pergunta com alguns exemplos. Encontramos: Knstliche Befruchtung (Frauenkrankheiten) (Inseminao artificial Doenas de senhoras) 6 1 8 . 177-089. 11 Trata-se aqui de uma doena? Se indispensvel usar um conceito superior, melhor seria usar "Gynkologie" (Ginecologia), ou talvez fosse bastante especfico "Medizin" ( M e d i c i n a ) . Aqui s necessrio estabelecer a devida diferena entre este conceito e "Knstliche Besamung" (Tiersucht) (Inseminao artificial Criao de animais). Este mais um caso em que as remissivas recprocas so necessrias. No seria mais indicado adotar aqui o termo internacional "Insemination"? Por vezes, os conceitos colocados entre parnteses so inteiramente dispensveis: Blindenschreibmaschinen ( S c h r e i b maschinen) (Mquinas de escrever para cegos Mquinas cie escrever 681. 613. 1 Blindenschciftdruckmaschinen (Vervielfltigung)

Ci. Inf., Rio cie Janeiro, 2(2): 169-174, 1973

172

NDICES ALFABTICOS DA CLASSIFICAO DECIMAL UNIVERSAL

(Mquinas impressoras para cegos Reproduo) 6 8 1 . 6 2 5 . 92 No segundo exemplo foi escolhido um conceito superior inadequado. O conceito imediato "Sonderdruck maschinen" (Mquinas impressoras especiais), mas que, nestes casos, se trata de mquinas de escrever ou de mquinas impressoras, depreende-se diretamente dos termos. Posso apontar ainda alguns exemplos que no necessitam de muita explicao. No ndice alfabtico, os exemplos que seguem encontram-se na ordem aqui reproduzida: Slavische Schriften (Escritas eslavas) 0 0 3 . 349 Slavische Strophen (Sprachwissenschaft) (Estrofes eslavas Lingstica) 8 0 1 . 676 Slawen (Rasscnanhngezahl) (Eslavos Nmero auxiliar de r a a ) ( = 81) Slawische Sprachen (Sprachwissenschaft) Lnguas eslavas Lingstica) 808. 1 As duas formas de escrever que aparecem nas tabelas foram reproduzidas inalteradas no ndice. Tambm as seguintes entradas aparecem uma aps a outra no ndice: Holland (Ortsanchngezahl) (Holanda Nmero auxiliar de lugar) 425. 3 Hollandisch (Sprachanhngezahl) (Holands Nmero auxiliar de lngua) = 339 Que "Holland" aqui mencionado se encontra na Gr-Bretanha e que ali no se fala holands deveria ser indicado de alguma forma no ndice. Para se encontrar Holanda nos Pases-Baixos deve-se procurar em "Niederlande", ou em ortografia holandesa, ou em "Noord-Holland", ou em "ZuidHolland". Tal cousa no pode agradar muito o usurio. Espero que os exemplos apresentados acima mostrem de maneira suficiente que o ndice alfabtico da Edio Mdia da C D U , apesar das boas qualidades que tem, apresenta muitas falhas. Para que possa ser utilizado com xito, necessrio j ter timo conhecimento da C D U . Em suma, com ele no se consegue nenhum novo adepto da C D U . Conforme j foi dito, as causas das falhas residem a meu ver na superestima do trabalho da mquina e, consequentemente, no insuficiente trabalho red acionai. Que esperam os usurios? A crtica do ndice alfabtico existente, como foi feita aqui, baseia-se, naturalmente, no presssuposto de que os usurios esperam realmente algo melhor. Que isto verdade, experimentei vrias vezes nos ltimos tempos. Na Sucia preparamos atualmente uma nova abreviada. Diversos grupos de usurios expressaram a opinio de que a mais

importante melhora seria uma considervel ampliao do ndice alfabtico, que alis bem extenso. Foi proposta a aceitao de uma grande quantidade dos termos que aparecem freqentemente e que na C D U s podem ser expressos por meio de dois pontos (sinal de relao). At que ponto isto possvel, s poder ser dito aps ulterior exame. Hermann ( 8 ) afirma que s praticvel em edies especiais para matrias limitadas. A meu ver deve-se partir do pressuposto dc que os usurios esperam encontrar, de futuro, na C D U tantos termos quantos podem procurar agora nos Thesauri (permitidos e proibidos). No se deve esquecer que no grande Thesaurus americano T E S T cerca de um tero dos descritores so combinaes pre-coordenadas de conceitos que no podem ser expressos por simples nmeros da CDU (11). Mesmo que no se possa atender a todos os desejos dos usurios, dever-se-ia levar cm conta que os documentalistas pela utilizao dos Thesauri e da indexao coordenada baseiam-se nas palavras, mais do que antes. Esta realidade deve levar a ndices muito melhores para a C D U , cujo emprego seja mais fcil e d aos usurios a sensao de confiana. 1 - S A M U L O W I T Z , H. DK-Abgesang oder Neubeginn? Nachr. Doh, 2 1 ( 4 ) : 138, 1970. 2 - ARNTZ, Helmut. Die DK-eine Vielfacettcnklassification. Nachr. Doh, 21 ( 4 ) : 139-42, 1970. 3 - D A H L B E R G , Ingetraut. Mglichkeiten einer Neugestaltung der D K . Nachr. Dok., 2 1 ( 4 ) : 143-51, 1970. 4 F I L L , Karl. Dezimalklassification positiv geschen. DK-Mitt., 1 5 ( 5 ) : 17-20, 1970. 5 - HMAN, Einar. Die DK-Kritik von H. Arntz im Lichte von Konkordanzuntersuchungen zwischen DK und Thesauren. Nachr. Doh, 2 3 ( 2 ) : 65-8, 1972. 6 - BRITISH STANDARD INSTITUTION, London. Guide to the Universal Decimal Classificaion (UDC). London, 1963. ( F I D 345) 7 M I L L S , ]. Universal Decimal Classificaion. New Brunswick, 1964. (Rutgcrs Series on System for the Intellectual Organization of Information, 6) 8 - H E R R M A N , P. Pratische Anwenclung der Dezimalklassification. 6. Aufl. Lepzig. 1970.

Ci. Inf., Rio de Janeiro, 2(2): 169-174, 1973

173

EIMAR OHMAN

9 B O S E , H. Chaim indexing and Universal Decimal Classification. Indian Librarian: 235-9, Mar. 1968.

1] W E L L I S C H , H. A concordance between U D C and Thesaurus of Engineering and Scientific Terms. Herce Novi Symposium on UDC, Proceedings, June 1971. 30 p. ABSTRACT

10 K O C H , K . -H. Ein Verfahren zur Maschinellen Herstellung von DK-Sachregistern. Proceedings of Second Seminar on UDC and Mechanized Information Systems, Frankfurt M., 1-5 Tune 1970, Copenhagen, 1971. p. 21-42.

Discussion about the alphabetical indexes of the Universal Decimal Classification U D C Since different publications presented, in the last years, have dealt with problems related to the tables. This study is based on the different editions of U D C .

Ci. Inf., Rio de Janeiro, 2(2): 169-174, 1973

174

Linguagem Documentria: Acesso Informao


Aspectos do problema
Manoel Adolpho Wanderley Biblioteca Nacional Escola de Biblioteconomia e Documentao da F E F I E G SINOPSE O processo especfico da comunicao documentria encarado do ponto de vista das relaes entre a Linguagem e o universo da representao grfica, objeto da documentao. Descreve-se uma amostra dos meios de pesquisa bibliogrfica criados para tal forma, dos quais as linguagens documentrias constituem a forma mais elaborada. Acentuam-se as implicaes lingsticas da anlise do contedo, destacando-se as interpretaes do plano sinttico e do semntico. Culminam tais consideraes no exame das relaes lgicas e categorias fundamentais das linguagens naturais e documentrias, bem assim na referncia sumria a algumas estruturas intelectuais bsicas subjacentes a ambas. O - INTRODUO Procede o presente trabalho de surpresa muito feio da de M. Jourdain. Ento no teramos estado, ns bibliotecrios e documentaristas, a fazer lingstica sem o saber quase diramos sem a saber? a criarmos linguagens que desejamos to significativas quanto a natural? a traduzirmos em cdigos os textos em nossa custdia? a parafrasear-lhes o contedo em resumos sinalticos ou informativos, produzindo documentos derivados que do acesso aos primrios, numa palavra, a comunicarmos ao leitor mensagens que, no intuito de Dissertao apresentada ao Instituto Brasileiro de Bibliografia e Documentao/Universidade Federal do Rio de Janeiro para obteno do grau de Mestre em Bibl. oteconomia e Documentao, em 19. 10. 1973. Orientador: Prof. Sylvio Edmundo Elia, Faculdade de Humanidades Pedro II. lhe responderem s questes, os autores confiaram ao nosso zelo e guarda? Eis algumas das perguntas que seria lcito reduzir to s a uma: quais as relaes entre a documentao e a lingstica? Melhor ainda: se ali onde se entrosa uma com a outra se situam tambm as chamadas "linguagens documentrias", as L D , tudo se cifraria em sondar-lhes a ndole e a condio frente s naturais, bem assim em fixar o papel destas no gerar aquelas, no servir-lhes de modelo, ou no dispensar-lhes o uso. Ora, os conceitos remetem aos conceitos e, para sustarmos o ressurgir de questes, mister cingi-las ao problema no que tenha este de crucial. Mas descobrir onde lhe apertam os sapatos, eis uma das mais rduas tarefas do filsofo, como observou Wittgenstein, que justamente se comprouve em sondar os jogos "lingsticos" a que igualou os sistemas de comunicao. Para os que no so filsofos ser mais fcil, por vezes, dizer que perguntas no se faro, que outras j se tm por respondidas ainda que a ttulo de hiptese de trabalho. Nesse ltimo caso se incluem as referentes ao significado mesmo da comunicao e ao da linguagem natural, da L N . Demos por tacitamente aceito um conjunto de caracterizaes dessa ltima, que poderamos sintetizar, a partir de G. Mounin, nos traos que a seguir esboamos. O que especfico das lnguas naturais no a comunicao h para esse comrcio humano meios diferentes com a mesma funo; nem o arbitrrio dos seus signos muitos outros tambm o so; nem a noo de sistema valemo-nos de sistemas, parciais ou no, de smbolos no lingsticos; nem a linearidade da men107

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

175

MANOEL ADOLPHO WANDERLEY

sagem - a msica e o cinema transcorrem no tempo; nem tampouco o carter discreto dos sinais, j que a mensagem tambm se faz pelo ritmo, pelo tom, e assim por diante. Prprio das lnguas naturais , em termos de Martinet, a dupla articulao, ou seja, o fato de que toda lngua falada "articula a realidade" sob duas formas: em unidades significativas (morfemas) e, no interior de cada unidade significativa, em unidades sonoras mnimas (fonemas)", no dizer d e D . Fleury.
22

Devida ateno foi sempre prestada, no fio das presentes cogitaes, distino entre eixo horizontal, relativo combinao sintagmtica de duas ou mais unidades significativas na cadeia falada, e eixo vertical, paradigmtico, atinente s relaes associativas de S a u s s u r e ou sistemticas de Hjelmslev, no caso vertente porm, em referncia s L D , s "representaes indexadas" e organizao do "universo dos conhecimentos" que lhes so prprias.
22 22

Note-se que, ao nos reportarmos, de modo explcito ou no, a tais conceitos face s L D , exclumos qualquer considerao metdica do que nelas corresponderia diretamente aos grafemas e, indiretamente, aos fonemas, isto , segunda articulao. T a l restrio, adotamo-la cnscios embora de quanto possa haver de elucidativo, para o nosso tema, no que viria a ser a "comunicao grfica" das L D , tpico em que se estudassem a escolha dos signos e o seu modo de combinao. Mais absoluta ainda "et pour cause" foi a limitao, dentre as funes lingsticas de R. J a kobson, funo referencial, de tipo cognitivo e objetivo.
53

Ao contrrio, inclumos sem vacilar a semntica, cuja reintegrao na lingstica demos por definitivamente assente, at mesmo como pretende G. Mounin, "no domnio de uma lingstica estrutural de que algo apressadamente a tinham excludo a priori". Assim quanto anlise do significado mesmo, temos entre os mais vlidos os processos suscetveis de objetivao formal, usados para identificar a estrutura interna da unidade significativa mnima, numa palavra, entre outros, os critrios da teoria lgica do significado que deriva de IIjelmslev. Como acentua fortemente, a esse propsito, S. Elia, "entre logstica e lingstica deve existir ntima colaborao. Na prtica uma lngua uma semitica em que todas as outras semiticas podem ser traduzidas. No s todas as outras lnguas, mas tambm todas as outras estruturas semiticas imaginveis".
71

Assim, dois dentre os autores em que buscamos as mais copiosas e ricas informaes Grolier e Coyaud discrepam, por exemplo, ao apontar o primeiro no segundo, a fidelidade a "une linguist i q u e . . . assez dpasse" ou em criticar-lhe, em termos de Hjelmslev, preferindo o outro os de Martinet, a considerao exclusiva da "forma da linguagem" com negligencia da sua substncia. Mas questes semelhantes, de sumo interesse, fugiriam quase por definio ao escopo de nosso trabalho, que antes delimitar uma rea de observaes e circunscrever o espao de um problema. Por outro lado, na tica da anlise dos sistemas, e j que nos cingimos interface "linguagens documentrias linguagem natural", no remontamos s totalidades mais amplas, ao processo de comunicao como tal, nem sequer, dentro dele, ao que, desde J. Moreno, se vem chamando "conserva cultural" ou, humanisticamente, "memria cultural". No insistiremos, assim, sobre o fascinante tema da biblioteca, da enciclopdia ou "documentatriz" universal, como o expe A. Moles, tese em que ressurge, a nosso ver, em estilo de diagrama, a metfora clssica de Ortega Y Gasset, do "bibliotecrio como filtro", mormente, acrescentemos, no seu af de que se concretize em proveito social, o "savoir tout, tout de suite, partout" e na sua misso de provedor da cultura. Na expresso de Moles, as diferentes lnguas que funcionariam como "filtros das coisas de importncia" e o "velho sonho da enciclopdia universal" viria a realizar-se graas "s memrias mecnicas e s tcnicas de anlise de contedo, aptas a exprimir, em "maquines", a totalidade das idias e dos semantemas novos produzidos pelo homem a cada instante".
22 22 22

Bem sabemos que, sem denunciar, ao dize-lo, algum excesso de controvrsia no cenrio lingstico, seria fcil contrapor tal ou qual teoria a tal outra.

Para anlise do contedo, sim, se voltar a nossa ateno. Como no nos move, todavia, o exame da lngua universal, mas antes, ao nvel das LD que talvez lhe venham preparando o caminho, as relaes com a linguagem e o seu estudo, limitar-nos-emos, para tornar explcitas as nossas ordenadas conceptuais, a esquematizar aqui o sentido da representao e anlise de contedo que tomamos por guia. Estas, de acordo com C. Montgomery, que tanta luz lanou sobre a questo em foco, constituem um dos componentes do sistema de informao total, com "input" da "aquisio" e "output" para a "utilizao da informao", via "tratamento dos dados". Os registros ou documentos em LN adquiridos pelo sistema, bem assim os pedidos nela gerados pelo usurio, so traduzidos em alguma linguagem formal, meio de comunicao entre este e aquele e base para a comunicao no sistema. O diagrama seguinte, da autora citada, dispensa qualquer comentrio adicional:
70

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

176

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

Resta, quanto a sistemas, um esclarecimento: o mtodo da anlise quantitativa, da avaliao, no o adotamos, em princpio, nas presentes consideraes. A medida, por exemplo, dos ndices de recuperao ou de pertinncia, ou a estimativa de quaisquer outros parmetros, julgamo-las estranhas a nosso ponto de vista, ao qual subordinamos e reduzimos, tambm, a faceta computacional e estatstica, tanto da documentao quanto da lingstica. Para apresentar, por fim, em dois ou trs traos, a marcha da nossa investigao, diremos que o sentido geral que lhe imprimimos foi, no campo da documentao, o de irmos do significante para o significado. Partimos, assim das interpenetraes dos domnios da linguagem e do documento, a propsito do que analisamos o universo da representao escrita e a natureza lingstica dos meios de pesquisa. Voltamos, em seguida, a ateno para as gradaes entre a linguagem natural e as linguagens documentrias, em relao s quais examinamos a natureza, as classes de smbolos, os componentes e as tentativas de tipologia. Na "busca de mtodos e modelos" atentamos no s para a relatividade dos conceitos que lhes tm sido dados face linguagem natural, mas tambm para a concatenao maior ou menor dos descritores e a formalizao decorrente da automao. Segue-se a anlise do contedo, como atividade documentria essencial, o que significa que a sintaxe propriamente o alvo das cogitaes. Aps discriminarmos o conceito de indexao e de classificao sob esse ngulo, esboamos um modelo abstrato proposto para as gramticas em questo, de que se enumeram alguns tipos. Alcanamos o nvel do significado, indo das estruturas superficiais

para as profundas. Delineam-se a algumas teorias lingsticas com base semntica, em especial as de F i l l m o r e e a metateoria de C. Montgomery. Um dos pontos de convergncia das linguagens naturais e das documentrias so, nessa altura, os problemas da polissemia, da homonmia, da sinonmia e da definio. Ocupamo-nos, cingindo-nos a algumas consideraes genricas, das relaes lgicas e categorias bsicas das linguagens naturais, das conjunes em particular e dos componentes semnticos. Delimitada a rea das conexes entre lingstica e lgica formal, e a das estruturas intelectuais, retomamos os mesmos tpicos no que concerne s linguagens documentrias, stricto sensu. Comparam-se, para esse fim, os pontos de vista relacionais de diversos sistemas significativos, sublinhando-se no que lhes concerne, o aspecto lexicogrfico, o papel dos "operadores" e alguns casos de estruturas tridicas.
70 70

Duas palavras, por fim, quanto aos termos tcnicos e s citaes ou melhor forma de exposio. Iniciamo-la sob o manto de um Molire por assim dizer "lingista". Mas nem por isso haveria fugir, sem boa causa, e no o fizemos ao risco de incorrer num dos preciosismos que o seu riso castigou para sempre, o das grias especializadas avessas ao natural da linguagem. No vacilamos, pois, em usar, com moderao, os tecnicismos e, at mesmo, eventualmente, a simbologia matemtica. Mais para temer seria, a esse respeito, a conhecida e candente crtica da lgica de Bar-Hillel aos formalismos em voga e sem razo de ser, de que no raro se revestem os estudos devotados recuperao da informao. Todavia essa mesma trivialidade, que lhe parece logicamente argvel em tantos casos, que nos

Ci. Inf., Rio de Janeiro, 2(2)-. 175-217, 1973

177

MANOEL ADOLPHO WANDERLEY

fez aceit-la aqui, se os especialistas dela se valeram para economia de expresso e preciso dos conceitos. Nem outro motivo nos moveu quanto aos termos que se lhes afigurou oportuno cunhar. Se um autor fixa, como A. Moles, e a substncia da proposio que. a seguir, dele daremos outro dos pressupostos a que acima aludimos para a medida da cultura, tanto individual quanto coletiva, a frmula: " C = n de culturemas x de associaes realizadas entre eles", por que, nesse passo, "descrever" tudo o que o smbolo "produto" implica, c trocar "culturema" por "elemento de conhecimento ou de percepo memorizada como unidades simples"? No que toca a citaes e voltando urna ltima vez a Molire que disse "je prends mon bien partout o je le trouve" exploramo-las sem restries, j que a natureza das presentes observaes beira a da "resenha" ou do "state-of-the-art report". Respeitamos as normas em uso, sem declinar as pginas do item referido, por facilmente localizveis em todos os casos. Limitamo-nos, outrossim, a referenciar o autor citante, no caso dc citao.
22

plo: "o Brasil tri-campeo". Por fim, e muito especialmente, timbramos em tornar pblica a nossa dvida Professora Gilda Maria Braga, sem cujo esprito crtico e sentido de exatido jamais teramos chegado a proporcionar as nossas possibilidades ao empreendimento em que nos lanamos. 1 DOCUMENTAO E LINGSTICA: INTERPRETAES DOS DOMNIOS Afiguram-se particularmente ricas as relaes entre o documento, como suporte da atividade que lhe explora e difunde o potencial de informao, e a linguagem, como objeto previlegiado do domnio da cincia que estuda a "vida dos signos no seio da vida social" (Saussure, 5 3 ) . Com efeito, no mbito do universo bibliogrfico e da representao escrita das idias, por intermdio de cdigos lingsticos naturais ou artificiais usados no decurso da comunicao grfica, como esteio para a anlise e indexao do contedo e o subsequente ciclo das questesrespostas. nesse triplo plano abstrao feita de outras discriminaes que se d o processo documentrio. 1. 1 Universo da representao escrita Observe-se, desde logo, que do livro microforma mais compacta que a biblioteca coloca na mo dos leitores, o que prevalece como veculo das mensagens que ele divulga so textos e registros de natureza predominantemente escrita, ; bem verdade que sua custdia se confia, outrossim, o que interessa antes semiologia lato sensu, ou seja, outros cdigos em outros suportes fsicos no apenas documentos audiovisuais de toda sorte, mas tambm, por exemplo, cartes perfurados ou fitas e discos magnticos, em que se armazenam dados. Entretanto, o que continua a constituir o ncleo mais relevante do seu acervo, o que a preocupa mais genuinamente, fiel, como permanece, advertncia clssica "verba volant, scripta manent", a documentao sob forma grfica. No consiste a escrita, com efeito, "numa representao visual e durvel da linguagem que a torna transportvel", como a qualificou C o h e n ( 6 2 ) ? Em modalidades mais ou menos cotidianas ou cultas, para grupos mais ou menos restritos, atinentes a domnios c disciplinas mais ou menos formalizados ou especiais, consoante a funo social a que os registros se destinam em princpio nada se exclui dos repositrios bibliogrficos as linguagens neles preservadas aproximam-se, em maior ou menor grau, das naturais, em cuja definio Cardin ( 2 6 ) as engloba, inclusive suas ramificaes apropriadas aos textos cientficos.

Fora de regra ficar a que acrescentamos nesse ponto, j que nos escapa quem disse algo parecido com o seguinte: "um bom ou seria um mau? trabalho cientfico o mais curto caminho entre vrias citaes". Mas preferimos que, ao nosso, no se venha a aplicar nenhuma das verses possveis, ou para verber-lo ou para elogi-lo. Pelo que houver aqui de positivo, vo os nossos agradecimentos ao Instituto Brasileiro de Bibliografia e Documentao que, em boa hora, proporcionou esse convvio profissionalmente fecundo, com tantos especialistas de nomeada no domnio da Cincia da Informao, inclusive com alguns dos mais representativos que enriquecem a lista de autores citados. A nossa gratido, pois, ao Professor Silvio Elia, cuja solicitude impediu, nesse sentar "entre deux chaises" que a nossa dissertao, onde se aproximam documentao e lingstica. (3 cairmos de todo fora da ltima. Tambm o nosso vivo reconhecimento Presidente do I B B D , Senhora Professora Hagar Espanha Gomes, c Diretora da Biblioteca Nacional, Senhora Jannice Monte-Mr. Favoreceu-nos nesse caso, no propriamente o permitirem e como ordenarem utilizssemos em proveito de nossas indagaes as imensas reservas de saber, respectivamente tcnico e humanstico, das Instituies a que tambm pertencemos por tantos elos. Devemo-lhes, antes, em definitivo, o encorajamento de colegas com quem penamos em nossa primeira incurso no domnio dos "pushdown-stores", sob a orientao do saudoso Professor James W. Perry, ao destrinarmos os segredos lingsticos os outros ns os conhecamos do "string" por ele proposto como exem-

CL Inf., Rio dc Janeiro, 2(2): 175-217, 1973

173

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

Tanto verdade que, no dizer de Gleason ( 6 6 ) constitui a lngua oral "a realidade ltima do que se l ou escreve". Dela, o cdigo escrito seria o substitutivo. Aproxima-os, de fato, marcado paralelismo, capaz - segundo L. Prieto de alcanar no "Fonematismo" uma tal correspondncia que para cada fonema de uma teramos um grafema na outra, e vice-versa. No surgiria, ademais, em certos casos, uma espcie de paralelismo e substituio dupla entre as linguagens naturais, as L N , e as documentrias, as L D , s quais aludiremos adiante? 1. 2 Natureza lingstica dos meios de busca documentrios Por outro lado, para o acesso massa de noes acumuladas em semelhante processo, sempre lanou mo o especialista nele empenhado do bibliotecrio tradicional sua variante atual, afeita informtica de instrumentos, em ltima anlise, igualmente lingsticos. No "descriptive continuum" a que se reporta F. Jonker ( 3 9 ) como base qualitativa da sua teoria "generalizada" da indexao, o espectro desta se estende dos ndices e repertrios multidimensionais de palavras-chave s classificaes ditas hierrquicas. Sem dvida, teramos, num extremo, elementos extrados dos prprios textos, de partes suas tidas como reveladoras do contedo, quando no de resumos, que, de certa forma, os parafraseiam. Tomados dentre os demais termos, porque mais significativos estatstica ou semanticamente, confere-se-lhes, ou no, estrutura combinatria global, verbi gratia, a ps-coordenao em moldes simplesmente booleanos. Atuam as palavras-chave como no raro se chamam na condio de ndices referentes ao teor de presumvel interesse. Manual ou automaticamente destacados do contexto, ao recorrermos a tais segmentos de frases ou meras palavras isoladas, constitumo-nos, claro, em tributrios das linguagens naturais aludidas. Nada mais espontneo, a bem pensar, que semelhante expediente. A ele se aparenta a prtica, que no de hoje, de nos valermos de "ttulos" para sugerir, em poucas palavras, o que dizem muitas. De hoje, porm, o explor-las por permutao ou "rotativamente" nos computadores, como o fazem os vrios programas para gerao do K W I C ( P A C T ) ou K W O C e os meios similares de pronta notificao, com as palavras-chave preservadas ou no, no contexto imediato. A naturalidade do intitular e as deficincias, tambm, de nos atermos s auto-designaes dos textos aliam-se, de algum modo, celeridade e cega obedincia das unidades eletrnicas, numa "chave" cmoda para a comunicao do que encerram os escritos.

Mas no se cinge o analista de assunto a essa espcie, por assim dizer, de amostragem dos contedos. Vemo-lo, desde que se formaram as primeiras bibliotecas, refinar tal matria-prima vocabular e elaborar esquemas cada vez mais afastados da linguagem natural para indexar ou referenciar a informao armazenada. Labora-se a no outro extremo do espectro, na regio das classificaes hierrquicas, to familiares ao mundo bibliogrfico. Que estas constituem uma linguagem artificial S. R. Ranganathan quem o afirma, o criador da Colon Classification, que abriu amplas perspectivas teoria e tcnica documentria. "Classification is the process of translation of the naine of a specific subject from a natural language to a classificatory language". Em suma, a culminar no polo representado por tais esquemas e pelos "cdigos semnticos", e a partir dos precedentemente assinalados, h pois, toda uma gradao de "linguagens". Fazem-se explcitas, no seu conjunto, articulao cada vez mais ricas, que a crescente formalizao no fixar-lhes as descries, os princpios e os modelos, tambm torna mais racionais. Uma ocorrncia de cabal, porque deliberada, similitude entre as estruturas desses sistemas "artificiais" e os da comunicao corrente, ao nvel das palavras do discurso e dos termos do cdigo, fornece-a o "Semantic Code" de Perry, para a Western Reserve University. Assim, nele corresponde uma noo como "numeroso" a L Y M N , onde L-MN o fator semntico" unidade e Y, a "relao analtica" atributiva. Salta vista a analogia se, num confronto, usarmos para fris-la, o esquema com que K. Baldinger mostra o jogo complexo de unidades da palavra "apasionado". 4 2 3 2 2 4 4 3 2 3 3 4 ...L Y M N . . . . 1 la l a la la

. . . a-p-a-s-i-o-n-a-d-o... 1. 1 1 1 1 1 1

1 = fonemas (unidade distintiva mnima) 2 = morfemas (unidade significativa mnima, em lista fechada) 3 = lexema (idem, em lista aberta) 4 = contexto (quadro sintagmtico) Propomos la para os grafemas. 1. 3. Implicaes lingsticas das operaes documentrias Tambm encerram implicaes marcadamente lingsticas as operaes mesmas ligadas ao armazenar e ao recuperar das informaes. Nos sistemas correspondentes, apreendidos na sua feio global, a indexao e a anlise do "input" anteci-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

179

MANOEL ADOLPHO WANDERLEY

pam certas "questes" hipotticas e relaes conccptuais estabelecidas pelos seus usurios ( R . Taylor). Ao ser descrito o assunto dos textos, tm incio as transformaes documentrias a que se submete, durante a anlise, a forma de representao dos contedos, bem assim a dos "pedidos" de informao, na fase subsequente. Enceta-se, numa palavra, a sua traduo para os termos da L D , quando no a mera reduo do teor dos documentos, com que se lhes faculta a seleo futura, e isso no grau de pertinncia desejado. Que h forte afinidade dessas com as transformaes lingsticas, pelas quais se converte a construes Cannicas a estrutura das frases formuladas em LN, provam-no a possibilidade e o fato de se aplicarem ao tratamento dos textos, para objetivos documentrios, as gramticas mesmas e os algoritmos da lingstica dita computacional e os instrumentos da chamada traduo automtica. Esse tipo de correlaes, bem manifestas, por exemplo, aos autores do S Y N T O L , que os levou a perfilh-las na sua "Syntagmatic Organization Language". Para o que decorre de semelhante representao documentria, para os extratos, indexaes e resumos que a integram, atentaremos um pouco mais longamente em outros pontos. Neste, cabe notar to s, quanto estratgia da busca fator do xito nas respostas fornecidas como resultado da recuperao da informao como se condicionam, at mesmo nessa etapa final, os fatores operacionais e os elementos do discurso. Assim, as variveis da estrutura sinttica das "questes" se cifram, justamente, como as enumera R. Taylor: no nmero de termos; no nmero, tipo e "direo" dos verbos modificadores e conectivos; no nvel de complexidade lgica nas interrelaes entre os termos, e no grau de similitude da "linguagem de questo" com a do sistema. 2 - DA L I N G U A G E M N A T U R A L L I N G U A GEM DOCUMENTRIA Nos sistemas de comunicao assim delineados, destacam-se, portanto, entre os componentes necessrios no a ponto, porm, de excluir as prprias linguagens naturais os que vm recebendo, genericamente, quer a denominao de linguagens documentrias ou a de linguagens de indexao "index language", como prefere J. Melton quer a de linguagens descritoras, "descriptor language", de B. Vickery ( 6 8 ) ou, ainda, a de codificaes documentrias, de E. de Grolier ( 4 9 ) . Parece-nos dispensvel, para o fim que nos move, procurar critrios pelos quais se venha a reconhecer sentidos diferentes entre tais designaes. Aplicar-lhes-emos o que decidiu D. Soergel ( 9 7 ) sobre questo terminolgica similar: " W e take

the following terms as synonymous: information language ( I L ) , information retrieval language, information description language, documentary language". 2. 1 Natureza e situao das LD Ao se lhes fixar o conceito sob qualquer desses nomes, ter-se-ia em mente expressar no s a finalidade essencial a que visam, a saber, a "descrio da informao para a armazenagem, a recuperao, o processamento e a comunicao", mas tambm uma srie de funes bsicas que as condicionam ao nvel mesmo da prtica bibliogrfica. Entre elas destaca-se, de acordo com os que lhes perscrutaram o alcance, como B. Vickery ( 6 8 ) e R. C. Cros: a) A capacidade de obter, por ocasio das respostas aos pedidos de informao, um mximo de indicaes relevantes ou pertinentes e, para tal, de coincidncia entre as descries de autoria do indexador e as do usurio, numa palavra, a normalizao. b) A economia nos smbolos, a eliminao de redundncias, a condensao. c) A facilidade de "modular" as questes, tpica do S Y N T O L , ou seja, a de transform-las, na fase de seleo, generalizando-lhes ou especificando-lhes a compreenso mediante a organizao semntica. Tentaremos, pois, em traos amplos, expor-lhes: a natureza e a situao em face das L N ; os smbolos de que lanam mo; os seus componentes usuais de maior significado; alguns ensaios com que se procurou discriminar-lhes os tipos mais acentuados. Qual a natureza de semelhantes codificaes bibliogrficas, a sua razo de ser e justificativa lgica? A resposta a esse tipo de interrogaes, oferece-a a prpria dinmica do universo de comunicao a que pertencem. Se o tomarmos como referente ou, melhor, nele, o conjunto das linguagens naturais, salta vista, j o insinuamos, a relatividade das que se qualificam de documentrias. Na medida mesma em que estas se afirmam em oposio riqueza daquelas e isso, via de regra, restringindo-lhes, com mira na representao indexada, o vocabulrio ou a gramtica, quando no ambos assumem a condio de linguagem artificial, isto de sistema de signos "deliberadameate construdo, por uma pessoa ou grupo pequeno de pessoas, e num perodo de tempo comparativamente curto, para determinado objetivo", segundo C. H. Kellog. Preciso, conciso e adequao ao processamento, sobretudo ao automtico, alm do poder inferencial, eis o que provem em contrapartida. Compete a quem as projeta, erigir tais qualidades em

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

180

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

parmetros a serem considerados na sua construo e definio. bem de ver que, a tambm, no formul-las e descrev-las, se revela a tendncia metodolgica crescente para a formalizao, cujas conexes gerais com o domnio das LD consignaremos em outra parte. Basta-nos mencionar, de passagem, porque incide sobre a caracterizao que aqui tentamos, a proposta de um modelo, com base na teoria dos conjuntos, por F. B. Thompson, no "Seminar on computational Linguistics", 1966. Conforme o seu ponto de vista, algo paradoxal, "a natural language N is an unending chain { L }
i

atua como intermedirio entre aquele e o destinatrio. O primeiro , sob esse ngulo, original. A LD C o y a u d o demonstra fartamente em sua tese o ser em maior ou menor grau e, nisso, ela se assemelha s linguagens intermedirias ( L I ) propostas, por vezes, para a traduo automtica entre duas lnguas naturais. De menor significado a distino devida a J. C. Gardin ( 2 3 ) entre LD diretas e indiretas ( L D D e L D I ) , diferenciveis por se reportarem, umas a documentos originais (objetos ou textos quaisquer) e as outras, a documentos no segundo grau ou secundrios, isto , a documentos que descrevem, eles prprios os documentos originais.
23

i e I of more and more discriminating formal languages". Dada uma linguagem formal L
j

2. 2. Smbolos das LD Quanto aos smbolos a que recorrem, as LD dizem respeito, sobretudo, comunicao escrita. Aproveitam de preferncia o cdigo alfabtico e o numrico, ou ambos, mas no lhes estranho o valerem-se de significantes outros, como o diagrama. Cros f-las corresponder, no seu Glossaire a "um sistema de smbolos utilizados na indexao dos documentos", equivalente esta ltima, " anlise documentria em que se tende a exprimir o contedo dos textos mediante "descritores", com ou sem indicaes sintticas". A acepo dada aos "signos" da LD via de regra sensivelmente ampla, j que nela se abarcam " s y m b o l e s . . . emprunts ou non une langue naturelle, "en clair" ou " c o d e s " . . . etc. ( 4 4 ) . Observe-se que no obstante essa "hospitalidade" quanto aos grafemas, a notao questo crucial para a codificao eficaz. 2. 3 Componentes e princpios das LD Encaradas do ponto de vista no j da sua finalidade, c sim dos componentes que integram num dado sistema e rea, as LD acusam so concordes no registrar o fato quase todos os autores citados uma dupla ordem de fatores, suscetveis, ambas, de assumirem diversos graus de elaborao e articulao ou de ostentarem feio rudimentar, redutvel o segundo, nas formas mais frustas, quase nulidade: a) um dicionrio ou lxico documentrio, ou seja, o conjunto de "signos" ou "descritores" (palavras naturais, smbolos alfa-numricos etc. ) concernentes representao das informaes documentrias, e b) uma gramtica ou sintaxe, ou srie de regras para combinar os termos. Cabe notar a, de imediato, em correspondncia acentuada com os dois eixos vertical e horizontal em que se estruturam quer o pensamento subjacente ao discurso, quer este prprio: a organizao

h sempre outra

L i + 1 mais discriminativa, e isso ad infinitum, de tal forma q Eis uma cadeia, ou seja um subconjunto linearmente ordenado de um conjunto parcialmente ordenado, definindo-se a linguagem natural como uma cadeia mxima de linguagens formais. A "articulao" do que sabemos sobre um assunto particular no jamais completa: "se se afirma de um "corpus" de sentenas de N, que ele est e m L , pode afirmar-se que est tambm numa linguagem mais discriminativa L de X. Para uma palavra W, de X, embora de sentido especfico nas sentenas de L haver matizes adicionais na segunda, mais discriminativa. Do mesmo modo no h propriamente a gramtica de N, mas nveis cada vez mais discriminativos de "gramaticidade". De modo geral, se no denotam sempre a existncia de modelos explcitos e formais concernentes ao processo de comunicao em causa, refletem contudo, as definies propostas para as linguagens documentrias, caractersticas estruturais e lingsticas do tipo das que acabamos de investigar, implicadas, de fato, no seu conceito e traduzidas por termos como "smbolos, descries, questes, indexaes, lxicos, gramticas" e similares. Quem as dissecou detidamente M. Coyaud ( 2 3 ) considera a LD "instrumento de comunicao mediata entre os usurios e os autores do documento", ou melhor, entre aqueles e os "documentalistas (ou bibliotecrios)" graas ao qual venham os primeiros a obter "nos menores prazos possveis, os documentos escritos ou no, ou as referncias aos documentos que os interessam". Mediata, esclarece, porque pe em jogo dois cdigos, e no um s, como a comunicao imediata, em que h transcrio condicionada to s pela natureza do canal. Um cdigo (fonte) transforma-se organicamente em outro no caso da L D , que
i j i 24

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

181

MANOEL ADOLPHO WANDERLEY

paradigmtica atinente ao lxico documentrio e significativa de certas relaes semnticas estabelecidas a priori, segundo Cros; a organizao sinta gmtica, prpria das representaes documentrias, "expresso de certas relaes lgicas observadas" entre os elementos. A proporo varivel entre o ingrediente lxico e o sinttico decorre da prpria diversidade do panorama das classificaes e codificaes, e Coyaud ( 2 3 ) que lhes fez, com mincia, o levantamento, v na possibilidade de significarem-se quase as mesmas coisas com "mais ou menos lexemas e operaes sobre esses lexemas", uma das explicaes para o fato. Reduzindo a uma espcie de formato nico as diferenas nos processos de expresso sinttica, N. Bely formula-lhes a estrutura como ( R a, b) em que a e b designam dois descritores, R, a existncia de uma relao sinttica, e o ndice i, uma interpretao particular dessa relao, por exemplo, "causalidade" a agente do evento b; "finalidade" a o destino de b etc. Donde, do ponto de vista da "gramtica", diferentes L D s consoante os valores de i:
j ,

i = 0 i = l

linguagens sem sintaxe linguagens com relaes sintticas no especficas i = 2, 3 . . . n linguagens cujas ligaes sintticas prevem 2, 3 . . . n categorias. 2. 4 Ensaios de tipologia das LD Conviria, ainda, considerar antes do breve exame, na seo seguinte, de alguns mtodos dc que se valem os especialistas para descrever os cdigos em apreo duas ou trs tentativas de discriminar-lhes as variedades principais. H os que pem cm foco a totalidade dos sistemas, para distinguir os enciclopdicos dos especializados, como o fazem Grolier ( 4 9 ) e a taxonomia tradicional no mundo bibliogrfico. Afastada qualquer presuno de exaustividade, seria possvel adotar, para a classificao do gnero de linguagens a que pertencem as documentrias, o critrio proposto por Coyaud ( 2 3 ) , a saber, a dosagem, nelas, dos elementos lgicos e lingsticos. Definir-se-iam, assim trs categorias de sistemas: a) os lgico-lingsticos, mais tradicionais, com ou sem relaes sintticas, as quais, se presentes se regem, a seu turno, por uma sintaxe livre ou rgida; b) os fundados na lgica matemtica; c) os puramente lingsticos, para operar no quadro das L N . C. H. Kellog situa-se mais decididamente na rea

da comunicao homem-mquina e distingue, atinente s " I R languages", isto , s linguagens de recuperao da informao, os sistemas com base em dados estruturados, com base lgica e com base na cooperao "on line" entre o usurio e a unidade de processamento. Tambm da simulao, pela mquina, das atividades do homem no campo da informao, ou melhor, dentro deste, do processo em que se realiza a traduo da LN para a linguagem formal e viceversa, parte C. Montgomery ( 7 0 ) para quem esta ltima um "system of content categorization represented by a subject authority list, or in a more advanced application, a complex system which specifies the syntactic and semantic content e. g: some enriehed version of the propositional calculus". No levantamento que faz de modelos e tcnicas na lingstica computacional h para assinalar, alm de algoritmos para a anlise morfolgica, sistemas para a anlise sinttica, limitados ou globais (fullscale), para a anlise semntica, e para a combinao da anlise sinttica e semntica, onde se enquadram os destinados ao processamento do texto c do ciclo das questes-respostas, bem assim, os que visam recuperao de "fatos". Todavia , talvez, mais comum se aterem os autores no campo, por assim dizer, da lingstica documentria, a um aspecto preferencial sobre o qual incide a sua tipologia. Contaramos, assim, num setor, com lxicos especiais, para cuja metodologia oferece Gardin um modelo, e no conjunto das quais quadrariam, dc certa forma os textos clssicos, isto , os grandes sistemas bibliogrficos. No outro setor no da sintaxe proliferam os inventrios e categorizaes de gramticas, ou dos modelos e teorias que se lhes reportam. Eis a o domnio, por excelncia, das formalizaes, s quais teremos oportunidade de retornar em outro passo.

3 - EM B U S C A DE PARA AS LD

MTODOS

E MODELOS

Com o escopo de firmar o modelo de linguagem documentria, fixar-lhe as funes e estruturas ou descrever-lhe as caractersticas h uma profuso de tentativas e a busca constante de critrios, na literatura especializada. Que metodologia se esboa nesta, quais as tendncias a reinantes, que castas de teorias vm a prevalecer? Eis os tpicos que, muito por alto, nos propomos perlustrar, sempre com fito de frisar as conexes da Lingstica com a Documentao. Com prvia considerao conviria, contudo, lembrar algumas correlaes acima entrevistas, e referir sempre o estudo de quaisquer cdigos de indexao ao que eqivaleria, quase, a umas tantas regras triviais para interpret-los.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

182

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

3. 1 Distncia varivel entre as LD e as LN a) Enquanto linguagens intermedirias "metalinguagens" para Zinkin ( 2 3 ) as LD distam desigualmente das LN, isto , da sua matriz e sentido final.

Ao tentarmos dar conta das conexes de umas com as outras tornou-se manifesta a acentuada mobilidade, ou melhor, a relatividade dos respectivos conceitos. Constatou-se a passagem contnua dos sistemas em que sobrelevam elementos no formais, calcados na ordem espontnea, para construes mais e mais artificiais, embora conversveis no fundo, a estruturas lingsticas tpicas da comunicao natural. "Chassez le naturel, il revient au galop" ainda uma vez valeria a velha observao. Da mesma forma, sob o prisma dos significantes, se deparamos com descritores onde o alfabeto ocorre tal como na escrita corrente, verificamos, igualmente, o destinarem-se as letras a notaes de cdigos especiais, ou o aliarem-se, no raro. aos nmeros e a recursos grficos vrios. Isso quando no meramente substitudas por esses ltimos na codificao dos termos. Quanto dimenso vertical ou paradigmtica, a mera lista no estruturada vem a cambiar-se, por gradaes incessantes, nas hierarquias classificatrias e nas relaes semnticas complexas, subjacentes ao discurso usual. Assim, tambm, no tocante ao eixo horizontal, fora reconhecer-se o recurso a sintaxes documentrias apartadas ou aproximadas das que se formulam para as LN. Fala-se no S Y N T O L , por exemplo, em "esquema sintxico" representao da estrutura de uma expresso natural sob forma de um esquema ou na atribuio de categorias "quase-gramaticais" s palavras-chave. Da a incluso freqente, no plano em questo, de gramticas e modelos lingsticos propostos para as LN. 3. 2 Coneatenao tores maior ou menor dos descri-

globar este, de um lado, os que derivam da simples seleo de certos elementos includos nos documentos, e de outro, os provenientes das transformaes das noes mais relevantes neles contidas, j que os produtos, em ambos os casos, podem consistir, quer em dados isolados, quer em seqncias de termos concatenados ou em frases, torna-se disponvel enfim, ao usurio, uma gama de meios de busca onde se abarcam, quanto aos primeiros, ndices, como os de permutao e selees de frases extradas dos textos, e, em referncia s transposies, grafos de frases naturais integrais; conjuntos de termos definidos num lxico organizado, com ou sem relaes sintticas; resumo. Veramos, nesses ltimos, a verso abreviada dos textos, em LN ou no, ou ainda, o "telegraph abstract". No seu Glossaire, Cros define de modo algo parecido, a respeito da anlise documentria: o extrato mera seleo de palavras ou frases; a indexao feita por meio de descritores, com ou sem indicaes sintticas e o resumo, texto abreviado em LN.

3. 3 Formalizao das LD e automao c) O reforo das estruturas lgicas e operacionais uma funo do grau de automao previsto para o sistema. A circunstncia de apoiar-se ou no, um dado sistema, em aparelhamento automtico, pode significar a consolidao ou a atenuao no modelo que o informa, das articulaes lgicas, e uma elucidao maior ou menor das relaes essenciais no que concerne ao ingrediente lingstico. Como observa L. Schultz, atribuir as tarefas de processar a linguagem s mquinas implica em conhecer aquela a ponto de permitir o "design" dos processos e a avaliao do processamento. E um dos mestres da lingstica computacional, P. Garvin ( 4 5 ) ao sugerir uma taxonomia para os problemas que lhe so essenciais chega a distines prximas das precedentes ao identificar questes de ordem estatstica e de ordem no estatstica, diferenciando nessas ltimas, dois tipos os textuais e no textuais "textual data coherent text of some or another or anything else". Se bem verdade o que postula Upenskii (apud Soergel, 9 7 ) , que "evcrything which can be formalized can be automatic". no menos verdade que tudo que mecanizado deve ser de antemo formalizado. Cnscios, por conseguinte, das flutuaes que manifestam, em sua estrutura, os meios disponveis para a informao documentria, cujas implicaes, enquanto linguagens, nosso intuito sondar, e sensveis ao impacto da automao mas no voltados para ela, passemos em revista, sob o ponto

b) Nos produtos da anlise documentria, o grau de concatenao dos descritores varia da ausncia desta complexidade da LN. Quando atentamos para as operaes em jogo na anlise do contedo ou, se quisermos, na representao indexada, verificamos de pronto, ainda uma vez, a maior on menor preservao dos textos e contextos de origem. Na massa de instrumentos gerados para o acesso informao bibliogrfica discriminar-se-ia sempre uma dupla vertente bem caracterizada, no que concerne indexao, por Coyaud ( 2 4 ) , ao en-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

183

MANOEL ADOLPHO WANDERLEY

de vista do mtodo, o que montaria to s a uma amostra de como tm sido tratadas. E o faremos, como a propsito de sua classificao, reportando-nos aos que as encaram na sua realidade global concreta e, em seguida, aos que se cingiram de preferncia a esquemas formais ou a modelos e abstraes que lhes dizem respeito. 3. 4 As categorias fundamentais de Grolier Se, nalgum momento, tornou-se mais clara a conscincia de que h urna zona crtica de correlaes entre Lingstica e a Documentao, pode-se afianar que quem o marcou foi, aps os debates da Conferncia de Dorking, E r i c de Grolier com o seu trabalho para a U N E S C O , "tudc sur les catcgories gnrales applicables aux classifications et codifications documentaires" ( 4 9 ) . O centro de interesse so os cdigos, definidos como sistemas de "smbolos para representar a informao e de regras para combin-los". Deles, a classificao representa a variedade cujas "palavras conjuntos de smbolos que designam um conceito, ou semantemas se acham adstritas a relaes de ordem entre si". F i e l ao ttulo, e com viva sensibilidade aos aspectos estruturais das linguagens em apreo, de que testemunho a terceira parte dedicada ao estudo de processos anlogos usados nas lnguas naturais ou artificiais esmiua Grolier certas classificaes documentrias enciclopdicas e as codificaes especializadas, do ngulo, sobretudo, das "categorias gerais". Destarte, o que de mtodo ali se esboa com respeito descrio consiste de um lado, em analis-las quanto extenso, tomando-as na sua qualidade de universais, ou no, antes de o fazer na sua distribuio geogrfica; e dc outro, em identificar-lhes as relaes entre os termos e os processos que tendem a constru-las como um todo, e no como meras enumeraes. De fato, na considerao de sistemas conceptuais funda os seus trabalhos a prpria lexicologia, mais e mais estruturalista. Que o documentalista fere ali um ponto crucial da ndole lingstica da informao bibliogrfica no h necessidade de sublinhar. As relaes entre os termos de uma LD no plano sintagmtico como no paradigmtico eis a rea mesma em que se imbricam as facetas lxicas e sintticas, para no falar na lgica e na semntica, da comunicao. Embora com a prudncia de evitar qualquer categorizao prematura, so copiosas as suas observaes sobre os pressupostos das codificaes correntes no universo documentrio e valiosa a sua crtica do modo por que se interrelacionam com as linguagens em geral, haja vista os comentrios nas notas ao fim da obra.

3. 5 Modelo garviniano de J. Melton Preocupaes metodolgicas manifestas constituem o prprio cerne das sugestes de J. S. Melton, inspiradas num "definitional model of language" do referido Garvin ( 6 8 ) . A seu ver. impe-se tal conceito estrutural porque apto a definir a linguagem e a discrimin-la como "natural" ou como atinente a outros simbolismos, inclusive matemticos ou lgicos. Dando conta da associao da forma ao sentido, vale para o discurso oral ou escrito, e no s para identificar-lhes os elementos discretos, mas tambm para faz-lo em termos de relaes c no de mera listagem. Acresce, por fim, que satisfaz aos requisitos estritos do processamento no computador. O modelo garviniano envolve trs conjuntos de nveis: o de estruturao, com o plano fonmico (ou grafmco) e o morfmico, onde se identificam as unidades, os signos da linguagem dotados de forma e sentido; o da integrao, em que estes valem no por formarem meras cadeias seqenciais, mas por atuarem como um todo (fused-units); o da organizao, o grupo mais elevado. A ttulo dc exemplo, atente-se para um dentre os que oferece J. Melton com o fito de mostrar como entram em jogo tais fatores numa L D . Assim, para o documento "A study showing the effects of the use of the tape recorder upon individual spelling", o cdigo facetado no esquema de Tauber e Lilley ( 6 8 ) seria: R D E X P L S I T S C M M D L P MVPN M S T R T L D P MSED T C I T PEAC PEO Nele, a ordem das expresses no significativa como o na frase inglesa "students learn French" ou "Franca students learn". A primeira letra determina o tipo da categoria "gramatical", ou seja nota a autora "R est para P" assim como "P est para R". J no "telegraphic abstract" do mesmo ttulo de que reproduzimos apenas trechos os "interfixos", indicados por dois pontos, operam ao nvel de integrao de Garvin, dos "fused-units", e reforam-se as analogias com o conceito gramatical de concordncia: o "indicador de funo" de ordem inferior (. ) concorda "gramaticalmente" com o de ordem superior ( . . ) . .. K E J , experimental group, control group, student, . K I S , intermediate, g r a d e , . . K E C , spelling, . K Q J . textbook, lecture, d e m o n s t r a t i o n . . KAM, t e s t i n g , . K Q J , Calif A t . . KAP, experimental group, spelling, a c h i e v e m e n t , . . KUP, student, teacher, attitude. Nota: "English words uncoded" Em suma, realizado ou no, o modelo em questo no pudemos apur-lo afigura-se-nos, no entanto, rico de sugestes, como o reconhece a pr-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

184

LINGUAGEM DOCUMENTARIA: ACESSO A INFORMAO

pria crtica algo rigorosa de Grolier ( 5 0 ) T h i s sign [Mrs. Meltons paper] will be promising for the application of structural linguistics to documentation". 3. 6 Modelo de descrio de Coyaud Empreendimento dos mais sistemticos levou-o a termo, sob forma de descrio lingstica, M. Coyaud ( 2 3 ) na sua tese de doutorado. Adaptando terminologia e conceitos de A. Martinet ( 2 3 ) , submeteu a exame um "corpus" correspondente ao domnio das L D , tal como historicamente ele se afirmou e expandiu. Nele, de fato, algumas das grandes classificaes bibliogrficas que se sucederam a partir do sculo X I X , figuram ao lado de sistemas que a pesquisa vem inovando na rea da documentao, da informtica, ou melhor, da recuperao da informao, bem assim da traduo automtica e de outros setores fecundados pelo computador a servio da linguagem. J que a segunda articulao da linguagem, a dos significantes, fonemas ou grafemas desperta-lhe pouco interesse, concentrou o autor sua ateno na primeira, na "face dos significados" ( L . Prieto), atendo-se a ela nos "semas" cujas unidades era seu objetivo identificar, e isso segundo a ordem crescente em que se estruturam para cada LD. Como seqncia tpica, tm-se, pois, -das menores as maiores, os monemas, tanto os lexemas quanto os morfemas, e as unidades sintticas, isto , a palavra, o sintagma distinto da precedente por razoes prticas o enunciado e o discurso. Partindo, assim da forma mnima, isto , dos monemas, considera, no que lhes toca: os semantemas, ou melhor, como os designa Coyaud ( 2 3 ) , os "lexemes", a que, por vezes, tambm se refere, obediente praxe documentria, sob o nome de termos; os morfemas de que, pela mesma razo, discrimina sob a denominao de relaes, as analticas, explcitas e a priori, e as sintticas, estabelecidas a posteriori, entre as unidades do lxico, no momento da indexao. Espcimes de lexemas seriam, por exemplo: na C D U , 491 "lnguas indo-europias diversas", em que 4 lingstica; no SYNTOL, a forma cannica de um termo da LN, e, na classificao para o Bureau International de Travail, de Foskett ( 2 3 ) , Bbr "reumticos, cardacos, diabticos, tuberculosos", onde B significa "Indstrias". Quanto aos morfemas, a relao analtica do indivduo atividade exprime-a, neste ltimo cdigo, a minscula b; na C D U , com respeito classe 4 apontada acima, o "ponto de vista gentico" aparece atravs de 91, ou o "tipolgico", de 4 9 4 / 4 9 9 , lnguas isolantes e aglutinantes". Com a funo dos morfemas sintticos, o smbolo

": " indica, na C D U , "relao geral" no orientada, entre os morfemas, e " + " , a "relao de reunio". Se, por um lado, no esquema de Foskett, as nove facetas traduzem "relaes sintticas", como A, "Occupational safety and Health: General"; B, j mencionado, "Industries, special classes of workers"; C, "Sources of Hazards" e assim por diante, por outro lado, no SYNTOL, a forma geral para as estruturas em exame :

Amostras, enfim, das relaes sintticas, ou seja, das que surgem ao deixarmos o plano dos monemas, so as que apresentamos a seguir, atinentes combinao das formas mnimas em unidades superiores. No que diz respeito s palavras, teramos bem caracterizadas, no cdigo semntico da Western Reserve University como um conjunto de lexemas afetados de um caso, B W F L . 5X. N U B T . 001, "anti-hemorrgico" e, no tocante a smiagmas, em SYNTOL, para "ao do hormnio sobre o rim", "hormnio > rim". No cdigo de Pags ( 2 3 ) iw eqivale a "propriedade ( w ) do comportamento ( i ) " . A formulao, em SYNTOL, do enunciado completo "o vinho ativa o cortex":

comportaria, como expanso, o sintagma suplementar E l E 2

De modo geral, do ponto de vista da metodologia e da capacidade de penetrao nas estruturas lingsticas analisadas, nada existe de comparvel ao trabalho de Coyaud. Podemos afirm-lo sem nos opor, contudo, observao de Grolier ( 5 0 ) : "La thse de Maurice C o y a u d . . . est une utile mise au point qui s attache cependant beaucoup

Ci Inf., Rio de Janeiro, 2(2): 175-217, 1973

185

MANOEL ADOLPHO WANDERLEY

plus la dimension syntagmatique de ces langages qu' leur dimension paradigmatique". 3. 7 _ Modelos matemticos em lingstica

Uma das mais fortes tendncias na lingstica em geral, por certo, a formalizao, isto , no tocante a seus objetos, a representao esteiada numa linguagem formal, a que se alia a construo de modelos, notadamente dos matemticos. Nesse quadrante das cincias humanas, as entidades e processos que lhes constituem o interesse especfico podem ser expressos e o vm sendo crescente em termos de teorias lgicas c quantitativas recrutadas na bateria de meios disposio, hoje, do rigor da anlise. Axiomas, definies, teoremas, por um lado, modelos determinsticos ou probabilsticos do outro: eis o instrumental que se oferece ao investigador. As vantagens inegveis e os inconvenientes eventuais da adoo de tais mtodos, pesou-os E d mundson com a preciso requerida por quem lhes sintetiza o espectro amplo e esboa, por assim dizer, um modelo do prprio modelo. A seu favor h a compatibilidade que asseguram com as demais teorias e modelos, o indicarem o tipo de dados e de mtodos a serem usados, o permitirem a manipulao das variveis ou o enfoque global, sem contar, o facultarem o recurso s tcnicas de processamento eletrnico. Os erros eventuais a que podem conduzir, so, de certa forma, o reverso de suas qualidades: omisso ou no-pertinncia das variveis, incorreo nas relaes ou nos valores atribudos aos parmetros, inflexibilidade e incoerncia, quando no a abusiva identificao com o mundo real. Tem-se beneficiado, por conseqncia, o estudo das LD com a incessante dialtica ousamos diz-lo entre os modelos, propostos no plano dedutivo,

e o mundo real, donde resulta, como frisa Edmundson, o perene reformul-los por via tambm indutiva. Os formalismos mltiplos agrupa-os o mencionado autor em modelos determinsticos, a saber, os lgicos, analticos, algbricos, geomtricos, e modelos estocsticos, ou seja, probalsticos e estatsticos. Desde a lgica das proposies e dos predicados (Bar-Hillel, 3 2 ) , da teoria dos conjuntos (Mooers, 3 2 ) , das relaes (Hillmann, 3 2 ) , das transformaes (Chomsky 3 2 ) , ou da lgebra dos semigrupos, at a lgebra booleana, a topologia, a teoria dos grafos (Tesnire 32, L c c e r f 3 2 ) e a probabilidade lgica (Carnap 32, Bar-Hillel 3 2 ) , toda uma gama de instrumentos matemticos tem prestado eventualmente a sua contribuio fecunda. Menos, sem dvida, do que em teorias gerais, redunda o recurso a tais instrumentos metodolgicos cm formalizaes parciais atinentes ao que Edmundson denomina entidades lingsticas. Colima-se, no modelo matemtico, a representao abstrata de um objeto ou processo da LN ou da L D . Gramticas transformacionais, categoriais, anlise de dependncias, sinonmia, informao semntica, indexao documentria citamos ao acaso eis alguns processos e entidades traduzidos numas ou noutras das citadas linguagens lgicas ou quantitativas. guisa de ilustrao no apenas dessa ordem de modelos, mas do modo por que o citado autor os apresenta, escolheramos o que R. Fairthorne ( 3 2 ) props, com base num reticulado, isto , num sistema parcialmente ordenado ( S ; R) em que cada par de elementos x e y possui uma interseo x ^ y e uma reunio x u y. "Quando os elementos x, y . . . so interpretados como "entradas" ( h e a d s ) do "Thesaurus" e a relao de ordem parcial como "menos geral que", expressam-se as relaes hierrquicas como propriedades dos reticulados":

Reticulado

Thesaurus

elemento x relao de ordem parcial R interseo x^y

"entrada" do Thesaurus x relao "menos geral que"

a mais geral das "entradas" que menos geral que x e y a menos geral das "entradas" que mais geral que x ou y

reunio

xuy

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

186

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

D E S C O N S T R U I R O T E X T O PARA REFERENCIAR O CONTEDO Delineado ao menos como tentativa o espao em que atuam as L D , ressaltadas as feies que as caracterizam e o esforo envidado para dotar de metodologia adequada a sua formulao e estruturao, voltaremos a ateno dentro das fronteiras que demarcamos, para determinados componentes do sistema de informao quase diramos, para convert-la escala do mundo moderno e inspirando-nos em Servan-Schreiber ( 9 3 ) do sistema de "superinformao". Assim, as relaes entre a lingstica e a documentao, pe-nas a nu, de certo modo, a anlise do contedo, a bem conhecida atividade cujo fim "a pesquisa tcnica, com mira na descrio objetiva, sistemtica e quantitativa, do contedo de um documento". 4. 1 Indexao e classificao na anlise do contedo Tal operao entrelaa-se, ao que vimos, com a recuperao da informao, onde desempenham funo capital o indexar e o classificar o teor dos textos, bem assim o das questes que se lhes reportam. Problema crucial, mas que transcende o plano estritamente lingstico , nessa esfera da comunicao, o da "aboutness" a que se refere Fairthorne ( 3 4 ) , ou seja, o da "atinncia" dos documentos, o da natureza daquilo sobre que versam e a propsito de que os solicitam os usurios. O julgamento do contedo tem por substrato um fundo amplo de experincia social e psicolgica, mas apoia-se na evidncia dos textos quanto s regras de linguagem, conceitos, interpretaes, classe e relaes. Ora, a indexao segundo o mesmo autor ( 3 4 ) , processo extremamente complexo, "inextricvel da classificao isto estrutura" do campo do discurso sobre que incide, e da expresso verbal dessa estrutura. No entanto, a fim de ordenar o exame que motiva o presente trabalho, centraremos, nesta seo, sobre o primeiro tipo de anlise, as nossas observaes, cingindo-nos, na prxima, ao segundo. Para isso viria a calhar lembrssemos as argutas reflexes de J. Perreault ( 7 6 ) com o fito de formar possvel critrio para distinguir a indexao de quanto est, antes, na alada da taxonomia dos assuntos. A traduo dos registros e materiais escritos numa representao em linguagem documentria eis o que tanto define uma quanto a outra das citadas modalidades de tratamento bibliogrfico. E o criador de um sucedneo ou substituto (surrogate) para o texto, que coisa tenta seno indicar, de antemo, as orientaes de cada "item", com mira

no liberar a mensagem virtual e no faz-la alcanar o receptor a que se destina? Antecipa-se a pertinncia ao "documento Z para a questo A", o que traz consigo, alis toda a problemtica do julgamento de valor a que aludimos. Dentro desse gerar subprodutos representativos dessa ao de escrever "( ) scription", como curiosamente a designa Perreault ( 7 6 ) , teramos, na indexao, a representao dos elementos dos documentos, na classificao, a dos documentos como um todo e do "corpus" como um todo. Mais precisamente, no primeiro caso, surgem duas eventualidades: ou bem o indexador adscreve (a-scribes) conceitos aos textos, com base num vocabulrio externo, ou bem descreve-os (fe-scribes) com as palavras que lhes so prprias, extradas, pois, do vocabulrio interno. Na classificao, ao contrrio, tpica a "hierarquia". Nela, ao menos, com um objetivo ltimo, colima-se a prescrio (prescription) de posies dentro de uma organizao conceptual sistemtica, bem assim a inscrio (in-scription) dos documentos em semelhantes posies e a das respectivas "indicaes de posies" nos documentos. Note-se, todavia, que, para indexar, quando se compila lxico documentrio controlado, do tipo do thesaurus, onde os conceitos, em forma cannica, se estruturam tambm por relaes de gnero a espcie, introduz-se, implicitamente, um esquema de classe, no integradas verdade num todo nico, mas, nem por isso, menos articuladas. No obstante, a indexao, via de regra, aparece como a atribuio de um conjunto de identificaes, etiquetas, palavras-chave, unitermos, descritores, ou o que for aos elementos significativos dos documentos quando ela no os assinala to s pelo destaque tudo com o escopo de assegurar a identificao do contedo e um meio de "recuper-lo" oportunamente. Tambm para o processo em causa tm sido aventadas formalizaes com que se lhe busca acrescer o rigor, e o dos sistemas que o abarcam. Landry e Rush julgam, por exemplo, que a "teoria geral da armazenagem e recuperao da informao" se formularia, com mais justeza, em termos de uma "teoria geral da indexao" e, essa, nos d teoria dos conjuntos. Redefinem, assim, a coleo ou acervo como um "espao documental D", um "document space D", unio de dois conjuntos: o dos "documentos entrados" (input documents), D . , e o dos "documentos de anlise", D j isto "o prprio ndice, o thesaurus, o analisador sinttico e semntico etc": D = { D U D }
i n a n a n a n a l

Trata-se, como se depreende, de conjunto que contm a sua prpria descrio: o ndice dos documentos da coleo , tambm, "um documento e, portanto, um membro do espao documental".

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

187

MANOEL ADOLPHO WANDERLEY

Os "dados" - quaisquer entidades, digamos, as "palavras" vo ter ao ndice sob forma de L N , com fortes relaes sintticas e semnticas que se reduzem, marcadamente, aps a indexao. A linguagem do ndice, a seu turno, consiste do conjunto de elementos de vocabulrios que surgem, no raro, como uma lista ordenada de palavras (smbolos), conjunto esse reunido ao de relaes de diferena, de equivalncia, do tipo parte/todo, genricas e intencionais. O modelo atinge, por via de noes e teorias como a da comunicao, da entropia e outras da mesma ordem, elevado grau de refinamento, embora o conceito em que culmina a de que a "funo essencial do ndice a representao acurada e completa do documento" seja, na opinio mesma dos autores, altamente intuitivo. No nos deteremos, entretanto, em tais formulaes abstratas. Inclinados, como estamos, a prosseguir do menos para o mais complexo, ou do discreto para o unificado, e a seguir o trajeto "palavra conceito assunto" ( 1 0 4 ) , relegaremos para comentrio posterior os fatores predominantemente semnticos e as relaes que eles ensejam. Em conseqncia, ocupar-nos-am desde logo, aps o exame sumrio de algumas tcnicas fundadas em correlaes estatsticas, que aproveitam anlise do contedo, os aspectos nitidamente sintticos. No a que se situa aquela "armature sacre de Ia syntaxe (sujet/prdicat)" a que se refere Roland Barthes? Ainda a esse propsito conviria advertir para o que acarreta, ou exclui, a mediao da mquina. Como hoje se d em quase todos os passos da atividade bibliogrfica, ocorre igualmente, na sorte de anlise em foco, a par da persistncia dos procedimentos "manuais", prevalecentes, sem dvida, at o presente, o recurso cada vez mais franco ao processamento automtico da informao lingstica. Dentro desta, com efeito, pode-se delimitar, com Garvin ( 4 6 ) , ao lado da sub-rea da traduo automtica, outra, concernente ao "content processing", elaborao mecanizada de resumos e produo de meios de seleo afins. E l a partilharia com a precedente a necessidade de rotinas de reconhecimento lingstico que gerem a anlise da estrutura no tocante s "sentenas" do texto submetido unidade de processamento. Se na primeira de regra o apoio em dicionrio bilnge, na segunda o lxico ser monolnge e incluir, alm de cdigo para a gramtica, um cdigo semntico capaz de chamar a subrotina apropriada. 4. 2 Aspectos da indexao e classificao automticas Mencionaremos antes, contudo, a existncia de uma famlia de mtodos com que, no domnio em

pauta, se efetuam a indexao e a classificao automticas. H. Borko estuda quatro espcies destas ltimas: estatstica, por permutao, por citao e por associao. Pressuposto da primeira a estatstica que h uma relao, constatada por Luhn ( 1 0 5 ) , entre a freqncia com que ocorre determinada palavra no teor de um documento salvo, naturalmente, a pertencente a categorias genricas e a medida em que um "indicador significativo de um assunto, e vice-versa" ( 4 1 ) . Que h, nisso, o risco de excessiva simplificao, eis o que, de imediato, se patenteia. Donde vrias tcnicas para acrescer o rigor da indexao, mediante o cmputo de co-ocorrncias de termos, porque mais significativas que o das meras palavras isoladas, a seleo, no texto, das "sentenas com a maior concentrao de freqncia dos termos e dos pares de termos" ( 1 0 5 ) , ou, ainda, o correlacionamento da freqncia de um termo no texto com a sua freqncia no uso geral. J tratamos pela rama, em outro ponto, do mtodo de permutao das palavras, adotado nos ndices do tipo K W I C e similares. O da associao, pretendemos retom-lo, de relance, sob o prisma da classificao. Quanto citao, se j foi argumento, ao tempo do "magister dixit", se ela o prprio pulso e o deleite do pensamento montaigneano, vmo-la, hoje, assumir a condio de instrumento preciso para a anlise do contedo. Em toda uma "cincia das cincias", numa sociologia da pesquisa, num clculo bibliomtrico se funda o seu valor como indcio do que encerram os textos. Como bem sintetiza G. M. Braga: "as citaes de ordem de srie mais alta levariam determinao [de um assunto] e as mais baixas das reas correlatas". No entra, porm, no quadro da presente exposio, voltada antes para os aspectos sistemticos do cdigo lingstico, aprofundar essa faceta da comunicao humana, embora nos parea indiscutvel para citar uma das autoridades na matria, Guiraud ( 6 3 ) "que se deve considerar a estabilidade dos signos lingsticos como uma evidncia, um fato cuja observao adquiriu doravante o carter constante e universal". 4. 3 Modelo abstrato e tipos de gramticas A interveno da mquina na indexao fez sobressair o papel da anlise sinttica e da gramtica que esta presume quando o que se tem em vista inquirir o contedo do discurso atravs de cuja concretizao e coerncia formal se d a fluidez da comunicao. Se determinar os conceitos que o texto a descrever contm quer o dos documentos, quer o dos pedidos interessa a anlise semntica, identificar

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

188

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

as relaes que ligam tais conceitos no plano da linguagem o prprio da anlise sinttica. O contedo assim caracterizado, urge "especific-lo nos termos do formalismo que constitui a linguagem interna do sistema". o que mostra C. Montgomery ( 7 0 ) evidenciando, a cada passo, o necessrio entrosamento entre os dois processos, como j tivemos a oportunidade de assinalar. Mas no h esquivar-se nesse setor ainda menos do que nos demais aos requisitos da formalizao, razo pela qual M. Gross, por exemplo, busca construir, com referncia a L, isto , linguagem natural, uma gramtica que "enumere ( g e r e ) as sentenas de L e as reconhea, quando associada a uma rotina de reconhecimentos". O resultado, te-lo-emos sob forma de descrio estrutural. O conjunto finito de palavras (morfemas) de L constitui o lxico V de L e, em V, a operao de concatenao define o conjunto C ( V ) de "strings" ou cadeias. Como modelo abstrato geral postularemos com Gross: a) o subconjunto L de C ( V ) uma linguagem em V: L < G ( V ) b) a cadeia S tal que Se L uma sentena de L; c) o conjunto finito de regras que caracteriza todas as sentenas de L e apenas L, uma gramtica de L ; d) duas gramticas so equivalentes se caracterizam a mesma linguagem L. Quais os critrios para avali-las? Garvin ( 4 6 ) , seguindo os passos de C. Montgomery, assinala entre as qualidades empricas a "de darem conta de todas as sentenas gramaticais e apenas delas",

e entre as formais a de se conformarem simplicidade, recursividade, isto o facultarem um conjunto particularmente infinito de condies a partir de umas poucas operaes lgicas ou aritmticas, e a "algoritmicidade", a que se deve seja a computao exata, garantida e nica. Dois grandes grupos englobam a multiplicidade de gramticas: as formais, fortemente orientadas para um modelo, e as descritivas, que o so francamente. Formais so as de estados finitos (Hockett, 4 6 ) , de estrutura da frase (Harris 4 6 ) , de dependncia (Hays 4 6 ) , as "formacionais", transformacionais (Chomsky 4 6 ) , estratificacionais ( L a m b 4 6 ) . Pertenceriam s descritivas as tagmmicas (Elson e Pickett 4 6 ) , as glossemticas (Hjelmslev 4 6 ) , de item-e-arranjo (Trager 4 6 ) e de palavra-paradigma (Oettinger 4 6 ) . 4. 4 Exemplos de gramticas Proliferam, pois, ao que se v, as gramticas de que a resenha de Garvin constitui um levantamento at 1965. Estaria fora de qualquer cogitao esmiu-las na sua riqueza e variedade. Mas sem ir alm de um relance sobre o modo como uma delas vem a operar, verbi gratia, para a recuperao da informao, no descabido reproduzir-se aqui as regras de escrita com que ilustra S. Kuno, valendo-se de um exemplo clssico, uma "phrase structure grammar". A partir das regras extradas da coluna 1, proceder-se-ia a derivao descrita na coluna 2. Dentro da prpria cadeia d-se uma "left-to-right expansion":

Coluna

1 VP

Coluna S

Regra 1 S - > N P Regra 2

NP -> Det N

NP VP Det N V P the N V P the man the man VP V NP

Regra 3 [Regra 4 Regra 5

VP - > V D e t - > a] D e t - > the

NP

Regra 6 N > man Regra 7 Regra 8 N > bali V - > hit

the man hit the man hit the man hit

Det N the N the bali

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

189

MANOEL ADOLFHO WANDERLEY

Como observa E. Arcaini "a derivao pode ser representada tambm pelo diagrama, que fornece

menos informaes que a coluna 1, pois nele no se precisa a ordem em que se "re-escreve" a cadeia.

Det

A correspondncia com o portugus damo-la a seguir: S = Sentena NP = grupo nominal VP = grupo verbal Det = artigo N = nome S. Kuno mostra que se alcana, assim, estrutura de todo equivalente atribuda frase em apreo pela anlise dos "componentes imediatos", ou seja, segundo a notao adotada, ( ( the m a n ) ( Ut ( the ball) ) ) The II man I hit II the HI ball tlie man hit the ball Quanto a formalizaes, acrescente-se apenas a seguinte: uma gramtica "sensvel ao contexto" abarca um conjunto P de regras de "re-escrita do tipo: A membro do vocabulrio no terminal Vn, ao passo que so cadeias de smbolos de VN e do vocabulrio terminal Vt, podendo <* e ser nulos, no porm U m a gramtica "context-free", independente do contexto, eqivaleria a isto , seriam nulos; outra, mais restrita ainda, compreen-

deria regras da forma A > X, onde X seria, uma cadeia de smbolos de Vt apenas. No caso acima, Vt = the man, bit, ball; Vn = S, NP, VP, Det, N. Ainda que descartada tomamos a diz-lo qualquer veleidade de retratar aqui a incessante evoluo de tais gramticas, bastaria para dar vaga idia de como se ampliam com elas as perspectivas para a documentao, lembrar com S. Kuno ou C. Montgomery ( 7 0 ) , o significado, por exemplo, da obra extremamente fecunda de Chomsky ( 5 8 ) , e o poder acrescido, por seu intermdio, - que os "transformational parsers", ou melhor, as gramticas em que se fundam, adquirem em face das de "estrutura de frase". Com efeito, a gramtica transformacional atribui dupla estrutura a cada sentena que venha a gerar: uma profunda que lhe determina a interpretao semntica e outra, superficial, sua realizao efetiva e fontica no discurso. Destarte, a estrutura profunda que corresponde superficial, expressa pela frase "John is easy to please", a que indica que "John" objeto de "please", que o sujeito de "please" "someone" e que o sujeito de "is easy" no "John", mas " s o m e o n e . . . please John". No se trataria, pois, de

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

190

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

vlida, tambm, para "John is eager to please", mas de:

Resolve-se, por esse modo, uma srie de ambigidades, uma vez que a estrutura profunda de "John is eager to please" difere dessa ltima, embora as superficiais de uma e outra sejam, como se mostrou, iguais. 4. 5 Um sistema de anlise de contedo

Como se integram, na prtica, os mtodos de anlise de contedo? Dentre os sistemas de informao fartamente descritos na literatura, sobressai, como um quase prottipo, o SMART, a que se vincula o nome de G. Salton ( 9 1 ) . Utilizando um IBM 7097 e um 360 - modelo 6 5 , a sua organizao destina-se inclusive a avaliar a eficincia dos vrios processos mediante a medida da proporo de material de fato recuperado (recall) e a do material recuperado e pertinente (precision). Para avaliar-se algo do que, em matria de meios e facilidades, a indexao automtica sem nenhuma anlise manual prvia vem a requerer, note-se que o SMART compreende: dicionrio de razes (stems), de afixos (sufixos) nos documentos, de palavras comuns, a serem suprimidas no verso da indexao, um thesaurus, com que se eliminam os sinnimos graas atribuio de "concept numbers", reduzindo-os, pois, a conceitos; arranjo hierrquico dos termos do Thesaurus, a fim de generalizar, especificar ou correlacionar os conceitos; associao estatstica, para o cmputo das co-ocorrncias a que j nos reportamos; mtodos de anlise sinttica, destinados a confrontar sentenas e questes com um dicionrio de estruturas sintticas "Criterion trees" conferindo-lhes no caso de igualdade semntica o mesmo nmero;

mtodos de reconhecimento estatstico das frases. Salta vista o carter ecltico do sistema, construdo para assegurar at mesmo o controle dos conceitos e significaes, aspecto que nosso intuito considerar adiante. Um dos seus limites e isso nos conduz questo semntica o de que o Syntactic Analyzer de Kuno-Oettinger, nele aplicado, a saber, uma gramtica "independente do contexto" e processamento de cima para baixo com estrutura de pilha ( 6 4 ) ("pushdown store") tende a produzir mltiplas anlises de sentenas antes simples. 5 - DAS E S T R U T U R A S S U P E R F I C I A I S AO NVEL SEMNTICO Ao isolar certos grupos de palavras nos limites da sentena, a anlise sinttica no consegue sempre gerar uma interpretao semntica nica: fogem-lhe, no raro, as relaes mais finas entre os componentes das frases e, em particular, entre as frases. Se as gramticas transformacionais so capazes de relacionar proposies como: "Smith wrote the report" e "the report was written by Smith", nenhuma delas capaz de relacionar ambas com "Smith prepared the report" relao que crucial para a cincia da informao, ao que observa C. Montgomery ( 7 0 ) . Donde a procura de solues para semelhantes impasses e a tentativa de chegar efetivamente ao nvel semntico na anlise do contedo. H, para registrar, at o presente momento, alm do tradicional e preponderante recurso a um vocabulrio de indexao dos assuntos, que a lxico grafia e

Ci. Inf., Rio de Janeiro, 2 ( 2 ) ; 175-2r7, 1973

191

MANOEL ADOLPHO WANDERLEY

a prtica bibhoteconmica consagraram de longa data, uma srie de experincia e, desde logo, as atinentes anlise por associao, a que j aludimos, ou classificao automtica.

5. 1 Anlise de assunto: associao e classificao automtica Esteia-se a primeira na possibilidade sugerida por Doyle de representar, derivando-as do texto por computador, associaes entre os termos dos ndices. D-se-lhes um formato de diagrama ou mapa, de que o segmento reproduzido a seguir, com respeito "Literatura psicolgica", fornece uma imagem ( 1 4 ) :

> co-ocorrncia alta correlao baixa correlao

O usurio explora o mapa at encontrar o "cluster" (conglomerado) de palavras atinentes a seu tpico. Com respeito ao outro processo, tambm se lana mo, nele, da tcnica de co-ocorrncia, mas para a construo de matrizes de conceitos correlativos. Os "clumps" da resultantes formam "uma espcie de classificao firmada estritamente na coleo de documentos. " A seguinte mostra de associao dada por Foskett ( 4 1 ) "gramtica, paradigma, classes gramaticais, adjetivos, proposies, frase, indicador de frase, tempo, fim, raiz, sintaxe, diacrtico. " faria as vezes de uma classe, anloga convencional, onde, sem embargo, "faltariam muitos focos" (nome, verbo, clusula) simplesmente porque no ocorrem na coleo documentria. Por valiosas que sejam tais anlises estatsticas e incorporveis a sistemas mais amplos, onde se lhes confia funo como a do "feedback" no parecem proporcionar a almejada descrio do contedo semntico. J demos, em sntese, configuraes do tipo SMART,

de Salton ( 9 1 ) , onde se mesclam facilidades de ordem sinttica a meios especficos de acesso significao e aos conceitos das sentenas. Todavia, uma das objees que C. Montgomery ( 7 0 ) lhe ope, alm da apontada, a de que sistema com potencial maior de anlise seria imprescindvel em reas documentrias mais homogneas quanto ao assunto, no tocante s quais "representaes do contedo e das questes sob forma de combinaes booleanas de termos revelam-se claramente insatisfatrias". 5. 2 Teorias lingsticas com bases semnticas

Setor rico de sugestes para a criao de modelos mais sensveis aos fatores conceptuais o da "recuperao de fatos" e o da produo de respostas a questes em L N , de que Simmons apresentou clssica resenha. O prprio autor usa o "procedimento econmico de tomar cada componente to logo se venha a consider-lo sintaticamente aceitvel e a test-lo quanto boa formao (wellformedness) semntica".

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

192

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

Por outro k d o vem recrudescendo a atividade lexico-lgica no abandonada, alis, pelos investigadores soviticos que, ao que consta, jamais sacrificaram a semntica fonologia e gramtica. Passa a teoria lingstica a no concentrar-se apenas em modelos gramaticais, to ao sabor da orientao reinante, e conformes preferncia marcante da formulao matemtica pela sintaxe.

J nos reportamos, anteriormente, nova dimenso conferida a essa ordem de investigaes ao se introduzirem, no modelo da linguagem, estruturas ditas superficiais, a par de outras, atinentes "situao conceptual subjacente". R. W. Langacker, que assim se exprime, esquematiza tal organizao lingstica na figura:

ESTRUTURA

CONCEPTUAL A I

Escolha das unidades

Regras sintticas

ESTRUTURA

SUPERFICIAL

Regras fonolgicas

V MANIFESTAO

FONTICA

Constata-se no obstante que, ao fascnio da sintaxe, no escapou at mesmo, na sua faceta mais recente, a investigao Chomskyana, to frtil indiscutivelmente. "A noo de estrutura profunda como nvel bsico do componente sinttico, no se acha bastante apartada da estrutura idiosincrsica de superfcie para refletir categorias e relaes de fatos universais", como a argcia de C. Montgomery ( 7 0 ) acentua. A busca dos universais acusa menos universalidade que era lcito esperar, poderamos diz-lo. No entanto, a conscincia de que no h rejeitar a

semntica como extralingstica, ou separ-la do componente sinttico, se torna to imperativa que D. Varga ( 7 0 ) afirma, sem hesitar: "no erraramos em representar o processo do entendimento como uma seqncia de transformaes semnticas que modificam e interrelacionam blocos semnticos distintos". Tudo se passa, na verdade, como se houvesse entre os domnios da linguagem comum, da linguagem artificial e do pensamento respectivamente da alada da lingstica, da lgica c epistemologia e da psicologia a correspondncia que O. Clouzot resume no quadro abaixo:

Linguagem comum Palavra Frase

Linguagem artificial Termo Proposio

Pensamento Conceito Julgamento

Ci. Inf., Rio de Janeiro, 2(2)-. 175-217, 1973

193

MANOEL ADOLPHO WANDERLEY

A rea de tenso se situa percebe-se logo entre o plano conceptual, num extremo, e o das relaes entre os monemas, no outro. Um dos problemas capitais o paralelismo entre os significados e a organizao sinttica. 5. 3 Predicado: Formalismo de Fillmore De interesse para a questo em foco, tem havido a proposta de sistemas numerosos de processamento do texto, onde a noo de predicado assume o valor privilegiado de ncleo de toda a anlise. Ao contrrio do que se admitia na lexicografia tradicional, em que somente as conjunes e os elementos semanticamente pobres, denominados por Pags de "mots-outils" palavras-ferramenta eram tidos como termos de ligao, deve-se considerar, alm do tradicional predicado univalente, com um s argumento, predicados com dois ou mais argumentos. "Pedro come po", ou, "consumo de po por Pedro", eis uma relao do tipo P (x, t ) . Numa linguagem de informao que visa sumarizao" (langue de rsum), os termos de ligao da mensagem o seu tecido conjuntivo, na imagem de Pags embora participem da sua substncia podem ser representados pelo predicado apenas, omitindo-se os argumentos. Assim, "consumo" viria a satisfazer, em economia, e uma notao optativa seria R. e no do tipo ( x ) como po = x. O sistema proposto por Nol, em 1966 C. Montgomery ( 7 0 ) toma-o como referncia para a sua "Metateoria" relaciona as estruturas de superfcie dos resumos a "linguagem-objeto" com as das "entradas" providas pela classificao a "metalinguagem". Surgem ali as estruturas profundas como instrues ou proposies "relacionais", na mesma linha das relaes de "funo" ( r o l e ) de Fillmore ( 7 0 ) , e das relaes sintagmticas e paradigmticas do S Y N T O L , a que j aludimos. A prpria C. Montgomery ( 7 0 ) analisa o formalismo de Fillmore ( 7 0 ) , que lhe parece possuir a "maior fora explanatria, bem como o mais explcito mecanismo para vincular a linguagem formal LN". Proposio e modalidade estruturam as sentenas, a primeira constituda pelo predicado e os respectivos argumentos nominais, inclusive outras oraes, a segunda pelo tempo, modo e negao. O conjunto ordenado de categorias dc "casos" atinentes estrutura profunda enfeixa consoante a inovao de Fillmore as noes bsicas atinentes "funo" e aptas a refletir os julgamentos humanos sobre eventos e situaes. Eis algumas delas: agente ( A ) , causa animada do evento; instrumento ( I ) , causa eficiente, instrumento; paciente (E "experiencer"), quem recebe o efeito da ao; objeto ( 0 ) , o contedo neutro da experincia; fonte (S - "source"), estado, local

de origem; fim (G "goal"). A ttulo de ilustrao, teramos: a) Harvey quebrou o espelho com um martelo (A) (O) (I)

b) O martelo quebrou o espelho (I) (O) c) O espelho quebrou-[se] (O) d) Anne deu dinheiro a Claire (A) (O) (E) Classificam-se os predicados em termos de "estruturas de casos" (case frames). Assim, para "dar" notar-se-ia [ A O E j , para "quebrar", [ ( A ) ( 1 ) O ] , expressos os "roles" facultativos pelos parnteses. Toda uma rede de articulaes no propriamente sintticas, mas de significados, vem configurar-se dessa maneira, tanto mais complexa quanto outros nveis de descrio semntica entram em jogo, alm da "gramtica de casos" e das noes de funo subjacentes. Com efeito, o prprio Fillmore ( 7 0 ) esmiuou as "pre-condies" para o uso apropriado das sentenas as "pressuposies" implcitas em certos verbos. Assim, cm "julgar", "criticar", "censurar" e similares, os parmetros da situao de "incorreo" (badness) envolvem os de "responsabilidade". Por outro lado, Leech ( 7 0 ) definiu relaes lgico-semntieas, por exemplo, a implicao "dedutiva" (a inclui c, se a assero aRb implica a assero cRb), e a "indutiva", que incide sobre argumentos e predicados. "Gosto de frutas" implica, "dedutivamente", "gosto de mas". 5. 4 Metateoria de C. Montgomery Ao integrar essa ordem de elementos na sua "Metateoria", postula C. Montgomery ( 7 0 ) que tanto as relaes lgicas quanto as outras podem ser representadas por proposies "relacionais" concernentes estrutura profunda, e requerem traduo "em termos de metalinguagem que especifique um universo particular do discurso, um subconjunto de enciclopdia". a que interviriam as classificaes documentrias, de grande relevncia para a anlise de contedo da linguagem natural e, mais especialmente, do ponto de vista que nos inetressa, para a integrao da teoria lingstica da cincia da informao. O que prprio delas fornecerem explicitamente relaes dc classes com que se definam os superconjuntos em face dos subconjuntos e vice-versa.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

194

LINGUAGEM DOCUMENTRIA: ACESSO

FORMAO

Discrepando, no obstante, de Nol ( 7 0 ) , que v em semelhantes classificaes, metalinguagens propriamente ditas, de natureza "pblica", elas mesmas caracterizadas por estruturas superficiais e profundas, C. Montgomery ( 7 0 ) julga-as antes representaes to somente aproximadas de uma metalinguagem em "linguagem-objeto", isto , linguagem natural. No incluem todos os termos desta, que inclui, ao contrrio, todos os da metalinguagem. Se algumas "relaes semnticas" so expressas na chamada "estrutura de superfcie" da metalinguagem, e no na da linguagem-objeto, nem toda a informao relacionai o , como as pressuposies e os "roles" a que nos referimos. Portanto, o que se afigura de maior significao para a autora citada, o que tm omitido as investigaes semnticas a urgncia de fundamentar, numa classificao documentria, a elaborao sistemtica de metalinguagem apta, pelo fato de especificar um subconjunto particular da "enciclopdia", a definir as relaes lgico-semnticas e a interpretar as sentenas em L N . Atingido, como acabamos de faz-lo, o plano da semntica, intentamos mostrar como esta, se a investirmos de suas conexes com a ordem conceptual e lgica, vem a fundar e a informar, por assim dizer, a teoria ou se quisermos, a "meta-

teoria" e a prtica documentria, em especial quanto anlise dos assuntos. 5. 5 Polissemia, Jiomonmia, sinonmia, definio Na rea de problemas assim demarcada, algumas questes, j emergentes em outros pontos das presentes consideraes, parecem encontrar o terreno de eleio. Embora sem analis-las sistemtica ou exaustivamente, no nos esquivaremos a examinar, num relance, suas incidncias na esfera, em apreo, da informao bibliogrfica. No fosse essa cautela e nos deteramos a tentar expor, a seu respeito, o af generalizado de construir-se um modelo semntico do signo lingstico. K. Heger, justamente, adota como pedra de toque para a sua teoria nada menos do que meta-metalingstica os problemas da polissemia, da homonmia e da sinonmia. E no so outros os tpicos que, aps tratarmos da definio e antes de nos alarmos aos das relaes ainda nos resta perlustrar rapidamente do ngulo das L D . Mostrou-lhes as interconexes a conhecida verso trapezoidal do modelo de Heger, mais elaborada que a triangular, e resultantes ambas das transmutaes da herana famosa de Ogden e Richards ( 5 4 ) e dos estudos de Baldinger, b e m como de outros representantes da onomasiologia de tradio germnica.

O signema o signo enquanto unidade da lngua. Como sabido, Pottier designa por sema, o trao distintivo semntico desde que seja mnimo, e por semema, o conjunto de semas especficos: Sema e Semema. Lembremos o exemplo familiar, onde S = "para sentar", S = "com ps", S = "uma pessoa", S = "com encosto". S = semema de cadeira = S , S , S , S Estaramos a ouvir o eco, na lingstica, de noes tambm triviais no domnio da classificao bibhoteconmica. Com o prprio Pottier, reconheceramos tal similitude. No afirma ele que o semema eqivale s "diferenas especficas"? Donde passaramos s "caractersticas" da taxonomia, ao "gnero prximo" e teoria tradicional da "diviso" com suas razes platnico-aristotlicas, para no
1 2 3 4 1 2 3 4

falar do seu parentesco com a definio. Esta apresentar, como um semema, cada um dos conceitos, verbi gratia, os de "casa" e "cabana", com que Baldinger exemplifica a operao intelectual em apreo: S
1

(casa) = ( S + S 1 2

+ S ) 3

(cabana) = ( S 1

+ S + S ) 2 3

Atente-se, como prova final, para o seguinte esquema de Pottier ( 5 ) : "Todo lexema (significante mnimo de designao) ter como significado:

Ci. Inf. Rio de Janeiro, 2(2): 175-217, 1973


;

195

MANOEL ADOLPHO WANDERLEY

definio independente ou semantema

definio relativa Resta acrescentar que o classema vem a ser o conjunto de classes conceptuais gerais e o arquissemema o conjunto de semas comuns a vrios sememas: Ou, na curiosa ilustrao que lhe d Pottier: "2 caniches + 3 "pagneuls" = 5 ces + 3 gatos = 8 animais; 8 animais + 2 homens = 10 seres". D-se a sinonmia quando o "essencial de vrios sememas, pertencentes a outros tantos significados, constitudo pelo mesmo noema", isto , "sema independente de uma lngua dada, considerado como universal semntico", no dizer de Heger. Eis uma sinonmia parcial (incluso): barco S , S , S navio S , S , S , S
1 2 3 1 2 8 4

Se houver um ou vrios semas comuns a diferentes sememas parcialmente anlogos, ocorre a polissemia, como, no exemplo tambm do lingista francs: couverture (coberta) S , , S couverture ( c a p a ) S , S , S Na homona, enfim, os sememas so de todo independentes, como os de l n g u a ( r g o ) e lngua (termo da lingstica). Num esquema prximo ao que, com tal fim, adota Baldinger, prope Soergel ( 9 6 ) um exemplo que torna evidentes as relaes tpicas dos sinnimos e dos quase-sinnimos.
20 2 1 2 2 20 30 3 1 i 2

Ci. Inf,, Rio de Janeiro, 2(2): 175-217, 1973

196

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

5. 6 Polissemia, homonmia, sinonmia, definio nas LD Vejamos, pois, no universo dos documentos e dos textos o reflexo dessas equivalncias, redues a elementos mnimos e relaes entre termos e/ou significados, ou grupos de tais unidades. Uma vez que, na definio nominal, se fixa a compreenso da palavra em funo da de outras palavras, fora indagar se fugindo, bvio, ao crculo "vicioso" clssico no seria possvel reduzir-lhes o nmero. Porque no reconstruir sempre um cabealho recurso tpico na documentao pela coordenao, ou melhor, ps-coordenao dos termos que lhe integram o significado, em vez dc us-lo como unidade no lxico? O mesmo valeria mutatis mutandis para os cdigos documentrios. Segundo R. Pages h de fato, uma linguagem natural de termos de definio. Nem julgam diferentemente os originadores do General Inquirer ( 7 5 ) ao buscarem identificar elementos constantes "building blocks" de definies, com vistas a exprimir um conceito como o produto lgico dos "primitivos" na definio em causa. De que forma, quanto a esta, se traduziriam tais noes? que em virtude de sua estrutura supracitada, do tipo P ( x ) , P ( x , y ) , P ( x , y, z) ou P [ P ( x , y, z ) ] , ou, ainda, sob outra forma, do tipo xRi yR z, a fragmentao ou partio dos cabealhos daria mltiplos subcabealhos. Estes, Pags frisa-o, embora menos freqentes que aqueles, que os combinam diversamente, poderiam corresponder efetivamente s questes dos usurios se as fizermos variar sistematicamente, "modulando-as" como diria Gardin ( 2 6 ) . R. Moss ( 7 2 ) lembra a assero de B. Russell: "I call a vocabulary a "minimum" one if it contains no word which is capable of a verbal definition in terms of other words of the vocabulary". No que se refere fixao da linguagem "defini-cionai", como a qualifica o pesquisador francs, fora levar-se em conta a LN "veicular", que prove as "palavras-ferramenta" e as outras, alm do repertrio de "geradores", procedentes no s do idioma cientfico geral, mas tambm do dialecto especfico de uma disciplina.
2

ainda, nos "Subject Headings" da Library of Congress, para Simplification in Industry: "here are entered works on the elimination of excess varieties of products and procedures by a manufacturer... " Assim tambm, o "non-descriptor" (n. d. ): "Wingfuselage Interference Effects (n. d. )'" vem definido, no sistema Zator, pela "nota de escopo": "use "Wings plus "Fusclage plus "Interference", com * a indicar os "descriptors" de C. Mooers ( 1 7 ) , que cunhou o termo hoje to generalizado para tormento seu. No temos a algo como, na LN, a definio "introdutria": GN isto G N , GN ou
1 2 X

GN , GN GN ?
2 1 2

Para determinar esse componente do sistema de informao, o requisito a anlise scio-psicolgica, lgica, operacional, mas, sobretudo, lingstica do comportamento tpico do processo do documentrio. Note-se que, nas L D , a definio traduz-se implicitamente por essa opo fundamental dos "termos", "descritores", classes" cannicos, a que as lista dos "Thesauri", esquemas classificatrios, ou meios de busca afins, apem, se necessrio, para definir-lhes a denotao, as "notas de escopo" (scope notes, dfinitions), como por exemplo: Revista (documento) e Revista (espetculo), ou, melhor

Tratamos as definies de forma que sc cifrasse nelas a referncia parfrase de Coyaud ( 2 4 ) e Mattoso Gamara. Imposio dos limites que fixamos, eis a razo disso, e no que seja raro o uso da parfrase, para nada dizer da braquilogia e da abreviatura com fins documentrios. Ao contrrio, nos resumos, na condensao, na indexao h transformaes parafrsticas a gerarem sucedneos do texto e a resumi-los. Como aponta Coyaud ( 2 4 ) , "no limite, o nmero de classificao a definio de um livro, radicalmente abreviado". O estudo dos critrios de equivalncia, das interrelaes da parfrase com a sinonmia e a polissemia interessaria, pois, no s a semntica como tal, se no tambm a documentao. No caberia dizer dela o que disse Mounin ( 5 ) da definio, a saber, que ela "la vraie voie de passage entre smantique et logique"? Na medida mesma em que se afirma o carter artificial da LD em que ela se d como construda e se aparta da natural, a sinonmia dela excluda. No, porm, de todo, quando a forma expontnea da comunicao lhe serve de substrato. Demais, se admitirmos que na definio de sinonmia se abarcam a equivalncia, o paralelismo ou correspondncia ao nvel das locues e frases e das combinaes de elementos significativos nem sempre se pode consider-la descartada a priori. o que se reconhecer a propsito dos sinnimos extensionais, a cerca dos quais Baldinger lembra o dito de Pascal: "il y a des lieux o il faut appeler Paris, Paris, et dautres o on lappelera capitule de la France". Algo similar ocorreria no mbito da LD. Assim Grolier ( 4 9 ) assinala saciedade, no tocante a esquemas como a C D U e outros, a confuso possvel entre "ndices diferentes de sentido muito prximo", como entre psicologia sexual (159. 9 2 2 1 ) ou da criana (159. 922. 7) e a expresso dos mesmos conceitos pela adio, Psicologia, da subdiviso "-055 segundo o sexo", ou "-053 segundo a idade". De modo geral, o expediente clssico para a reduo da sinonmia ou "quase-sinonmia" a remisso da forma climinvel cannica. Para citar um exemplo de van Dijk e van Slype, teramos o

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

197

. MANOEL ADOLPHO WANDERLEY

clssico "ver" ou "use" e UP (usado para) em Revista ver Documento Documento UP Revista As relaes entre a sinonmia nominal e a definio so imediatamente perceptveis, o que corrobora a assero de Coyaud ( 2 3 ) de que o seu estudo nas LD de grande proveito para o "smanticien". Mostra-lhe em que contexto, tais ou tais sinnimos so substituveis ou no, com mira na classificao que lhes seja adequada e para evidenciar a lei de atrao sinonmica de Ullmann
(23).
,

sunto principal". 10 para "meios utilizados para realizar o assunto", a indexao do documento em apreo daria "Organizao 10" e "Contabilidade 8". Nenhuma confuso, pois, com "Organizao 8 e Contabilidade 10", correspondente ao tpico procurado. Discriminam-se, desde modo, os vrios matizes dos termos. O preo a multiplicao real dos descritores. 6 - O N D E AS E S T R U T U R A S I N T E L E C T U A I S HABITAM E N T R E AS LINGSTICAS Por vrios trajetos, as interrogaes que nos moveram presente anlise, convergiram para um ncleo de relaes subjacentes aos textos e que lhes servem de arcabouo. A viemos ter reiteradamente, ao sondar determinadas estruturas comuns linguagem e aos sistemas graas aos quais realizam o seu destino os documentos mantidos nessa "conserve culturelle", a que se refere A. Moles ( 2 2 ) , como a uma das etapas do processo de comunicao. No se insinuam elas na organizao paradigmtica ou sintagmtica, no se lhes deve a trama central na articulao dos vrios nveis dc elementos lingsticos, no conduz a anlise semntica busca de um "subconjunto da enciclopdia que lhe sirva de metalinguagem" onde prover-se das categorias mais gerais? Ocorre naturalmente interrogar se, ao tom-las por tema de estudo, se atinge um plano extralingstico. um risco a correr-se, de qualquer modo, uma vez que o caminho da linguagem um caminho dc crista, a referir-se sempre a objetos de que se alheia ao signific-los . . . "uma rosa uma rosa uma r o s a " . . . e a fundar-se sempre, por outro lado, em significados e estruturas profundas, algo em que no quer perder-se " . . . as palavras para diz-lo "deixam de ser um p r o b l e m a . . . " 6. 1 Relaes lgicas e conjunes nas LN

No quadro de anlise semntica dos contedos documentrios que a polissemia, o seu reconhecimento e resoluo, se revestem de importncia, sobretudo no curso do processamento automtico dos textos. Qual seria, se no essa, a razo de freqncia com que, por exemplo, a expresso "ambiguities" surge na literatura sobre a matria? Como observa N. Bely operatria a definio que prope, ao qualificar de polissmico "todo termo ou grupo de termos da LN cujo equivalente na LD varivel". Tanto as palavras quanto os grupos dc palavras daquela podem corresponder quer a um descritor simples, quer a um grupo de descritores desta. Acentua o autor o carter condicional de sua traduo, isto , o fato de depender de fatores incorporados a regras em conexo com os cinco tipos de polissemia que enumera. Assim "freqncia" seria do tipo 1, isto , palavras-chaves unvocas, mas polivalentes; "complexo", do tipo 2. categorias gramaticais mltiplas, no caso substantivo /adjetivo; "hipocampo", do tipo 3, termo preciso em mais de um domnio; "fibras", do tipo 4, vrios sentidos numa mesma rea; "centro", do tipo 5, descritores obrigatrios. Diferentes algoritmos se aplicam a cada caso: anlise sinttica apenas, anlise semntica e sinttica, anlise das palavras vizinhas, do contexto de dependncia, e assim por diante. Coyaud ( 2 4 ) d o exemplo de uma regra contextual no campo da oftalmologia. Se o termo "chamber" vier precedido de "in vitro", "slored in", "moist" no h ret-lo; nos outros casos "chamber" parte anatmica do olho, e traduzvel pela forma normalizada. Ao nvel da lexicografia, por outro lado, a polissemia virtual obviada, no raro, por recurso qualificado de "sinttico" por van Dijk e van Slype e destinado a evitar as chamadas "falsas combinaes". Destas ltimas, os citados autores do como ilustrao, o apresentar-se um documento sobre "organizao da contabilidade" como resposta a pedido sobre "contabilidade dos trabalhos de organizao". Se adotarmos a tcnica dos "indicadores de funes", no caso os "roles" da E J C , com 8 para "as-

Qual, pois, a natureza de tais relaes? Grolier ( 5 . 1) prefere a definio que lhes deu Lvy, ao identific-las como conectivos lgicos e ao ver nelas os elementos da significao capazes de vincular todos os termos de indexao constantes do vocabulrio, ressalvadas as limitaes devidas ao sentido dos termos concatenados. No mbito das L N , elas constituem j o dissemos um como tecido conjuntivo responsvel pelas formas combinadas que se estendem do sintagma lexical at o super-oracional, o pargrafo, o captulo, toda esta cadeia infinda de smbolos e informaes a que monta o grande texto do saber humano. Que a sua funo tem valor nuclear pressentira-o esse poeta da inteleco meridiana que foi Valry.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

198

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

Nos seus "Cahiers" lemos, com efeito, que "ce qui caractrise le plus le langage, ce ne sont pas les substantifs, adjectifs e t c , mais les mots de relation, les si, les que, les or et les d o n e . . . " Mas de observar-se com F. Francois, e com seu mestre Martinet ( 4 3 ) , que as relaes que so evidenciadas ao atualizar-se o sentido latente dos elementos constitutivos dos enunciados vm a s-lo por trs processos: umas poucas marcam, elas prprias, suas relaes com o resto do enunciado; certos monemas tm por funo marcar as relaes de outros; a ordem dos termos pode indicar as funes. Inclusas em tal quadro teramos, por um lado, prprias para manifestar as relaes lgicas entre as unidades lexemticas, funetores que agem em todos os nveis. Por outro, entre as atinentes ao discurso, h as que, em particular, se aplicam necessariamente, consoante Coyaud ( 2 4 ) , a unidades iguais ou superiores frase. Englobam-se, a, preposies, certos advrbios, pronomes relativos, conjunes. Estas, ele as toma numa acepo ampla e as encara como monemas que, acrescentados s frases completas, lhes fazem erder a independncia, tornam-nas abertas e as gam a um enunciado mnimo situado esquerda ou direita. Vale-se, pois, o autor, que esmiua algumas com destaque ("e", " s e . . . ento") de critrios lgicos e lingsticos, como o da abertura em questo. "Paulo a trouxe" no uma frase independente:

abre-a o pronome "a". Os anafricos, os pronomes tornariam aberta esquerda a frase em questo. "Pois" ( c a r ) abre esquerda, "se X ento Y" abre direita. As conjunes exprimem, assim, relaes entre as unidades do contedo em vrios nveis. No esqueamos, porm, que no caso vertente, como, alis, em todos os planos das formas lingsticas, h o ensejo de se empregarem, uma pela outra, duas ou mais unidades. O que ocorre com "voc-: fon " (semantemes sinnimos, como em vocal: fnico) ou com "tenho de s a i r : preciso sair" (locues sinnimas), segundo os exemplos de Mattoso Cmara, tambm se dar com a implicao, "se se corta o lobo, o gosto afetado: ao da lobectomia sobre o g o s t o : lobectomia, seus efeitos sobre o gosto", parfrases estas, de ndole documentria, propostas por Coyaud ( 2 4 ) a propsito das "conjunes". Para as conjunes, por conseguinte, ou melhor, para as relaes que nelas se traduzem uma vez que urge estud-ks, conjuntamente com as frmulas ou expresses, que lhe servem de parfrase estabelece ele, desde logo, uma dicotomia, a seu ver essencial: as "conjunes" submetidas ao tempo e as que no o so. Parece-nos que andou bem avisado ao excluir a implicao lgica, genuna, da seguinte assero que, sem tal, pecaria por falsa: Timplication est co-extensive la temporalit". A silhueta provisria das conjunes, no uma teoria geral delas, ei-la a seguir, como a prope o autor, para sintetizar o seu ponto de vista:

6. 2 Variedades das relaes nas LN Ao acenarmos para as "articukes lgicas" reconhecemo-lhes de pronto a variedade e a equivalncia de formas, suscetveis de se transformarem uma nas outras. Em face de tal multiplicidade no

seria racional reduzi-las a tipos ou at mesmo a categorias universais? Eis empreendimento em que muitos se tm empenhado. Garvin ( 2 4 ) , por exemplo, fixa dezessete tipos de predio, entre os quais: "1, statement of concern "concerns"; 2, of representation

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

199

MANOEL ADOLPHO WANDERLEY

"represents"; 3, of constituency " c o n s t i t u t e s " . . . 6, of logical basis "is based on"; 7, of source "comes from /stems f r o m / " . . . "Destarte, a sentena "our own studies were started as part of a plan", mediante a atribuio do tipo 7, geraria "our own studies stemmed from a plan". Mostra-se a, na reduo forma cannica, operao de largas perspectivas para a documentao automtica. No caberia, claro, registrar todas as tentativas feitas com objetivo idntico. No entanto, se o inventariar os tipos parece vlido, lcito perguntar se a busca dos universais tambm no o ? "Toda observao sobre qualquer linguagem , pelo menos parcialmente, um comentrio sobre a natureza da linguagem como tal", eis como Postal exprime o princpio fundamental nessa reformulao, hoje em voga, da gramtica dos universais. Chomsky no teria tambm avanado nesse sentido com a reavaliao da de Port-Royal? A tal gnero de investigaes, como notrio, prende-se o nome de Greenberg ( 2 4 ) que, em 1963, propunha 45 universais, como este, reproduzido por Coyaud ( 2 4 ) : "Nas frases declarativas com sujeito e objeto nominal, a ordem dominante quase sempre tal que o sujeito precede o objeto. Os tipos comuns so, pois, VSO, SVO, SOV. " Quase arriscaramos, de nossa parte, compulsando o prprio Greenberg, a afirmar a existncia de "universais de universais". Que outra coisa implicaria a sua assero pela qual a tipologia se vincula aos universais: "Sempre que a uma ou mais classes definveis numa tipologia faltar exemplifieaao emprica, tal fato logicamente equivalente a uma generalizao sobre todas as lnguas"? Mas h um tipo de universalidade cujas correlaes com a ordem lingstica devem ocupar "logicamente'' o primeiro plano. E dizemos "logicamente" de modo deliberado, porque de lgica, ou melhor, de suas interrelaes com a semntica que se trata. Reichenbach figura entre os pioneiros nesse terreno, por ele desbravado o bastante para declarar que "a lgica a anlise da linguagem", e que o termo "leis lgicas" deveria ser substitudo pelo termo "regras da linguagem". Obviamente o domnio mesmo dessa indagao vem a constitu-lo a semntica, que visa a dar conta do significado dos elementos lxicos, bem assim de como eles se interrelacionam numa "sentena S da lngua L", e isso - acima o indicamos - a partir das relaes de estrutura profunda, via de regra no presentes nas estruturas sintticas de superfcie. 6. 3 Componentes semnticos de Bierwisch Quanto anlise semntica adverte-o M. Bier wisch os pressupostos so: postulados de significao, ou regras semnticas, introduzidas for-

malmente por Carnap ( 1 0 ) ; componentes semnticos das significaes lxicas. Digno de nota o incluirem-se, tanto nuns quanto nos outros, constantes lgicas como "e", "ou", "no" etc. Assim, a forma dos "postulados" para as regras "rapaz sexo masculino" ( b o y implies m a l e ) , "moa sexo feminino", e assim por diante, viria a ser: "homem - sexo masculino e adulto", "mulher sexo feminino e adulto", "rapaz ou moa no adulto", "moa no rapaz", "homem ou mulher, rapaz ou moa ( s e r ) humano". A definio do significado em termos dos seus componentes semnticos exemplificar-se-ia como segue: "rapaz: animado e humano e do sexo masculino e no adulto"; "moa: animado e humano e do sexo feminino e no adulto"; "homem: animado e do sexo masculino e adulto". O significado de uma palavra pois "um complexo de componentes semnticos ou traos, ou indicadores postos em conexo por constantes lgicas". Da mesma forma, Bierwisch lana mo de componentes relacionais atinentes a verbos transitivos como "hit, meet, love", a verbos com dois objetos "give, take" ou nomes "relacionais", como "father, mother, brother". As entradas lexicais para este ltimo seriam: "brother: X child of parent of Y and male X". Em "give" o componente simples "have", isto , "X have Y", entra a seu turno numa combinao de componentes semnticos, passando "X cause P" a "Z cause (X have Y)", isto "Z quem produz o estado expresso por P". Assim a sentena ainda uma vez o verificamos esteia a sua representao na estrutura sinttica de superfcie, onde se combinam os significados lexicais da estrutura profunda; segundo as relaes sintticas em jogo ao que observa Bierwisch, Note-se com ele, pois, que as regras lgicas de transformao e deduo se aplicam s representaes semnticas, cujos princpios so universais e so os de lgica formal. Donde, formulaes, como a seguinte, para "o rapaz mata o co", onde se apem os mesmos ndices queles componentes referenciais que se reportam ao mesmo objeto: a) [ [o rapaz] NP, [mata [o co] N P ] V P ] S b) Humano X e sexo masculino X-i e no adulto Xi e X] causa ( X muda para (no vivo X ) ) e animado X e co X .
2 1 2 2 2 2

6. 4 Lingstica e lgica formal Justamente a vinculao da "estrutura profunda" com a lgica formal equivalente, esta, a "uma linguagem artificial explicitamente concebida e no raro com fim especial" perseruta-a, com finura a penetrao, J. Fodor. Aps mostrar "semelhanas formais" - as derivaes sintticas tm feio de provas lgicas -

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

200

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

destaca a autora, por mais importante, o fato de conterem tanto as descries lingsticas quanto os sistemas lgicos, determinadas regras com que definir um conjunto de cadeias "bem-formadas" de smbolos nos seus respectivos vocabulrios, e outras com que assegurar-lhes a interpretao. pergunta, que nossa aqui tambm, sobre o haver ou no, na gramtica, uma contraparte para as regras de inferncia lgica, responde a autora com Strawson ( 4 0 ) , para quem explicar a significncia, de uma sentena dizer quais as condies em que algum que enuncia faz uma proposio verdadeira, bem assim, mostrar as conseqncias (entailments) da sentena. Como estas podem ser infinitas no h enumer-las, mas sim dotar o componente semntico de regras de inferncia ou fazer com que sejam geradas de alguma formulao da sentena. Do ponto de vista do lgico h, outrossim, o interesse de confiar ao lingista a tarefa de prover meios para ligar as suas estruturas coerentes com as estruturas de superfcie, aparentemente incoerentes, da linguagem. O que J. Fodor demonstra no ser possvel, verbi gratia, em certos casos de especificao negativa de quantificadores lgicos a serem introduzidos no formato das regras gramaticais. Curioso que se supusermos, nessa troca de mtodos, que, da lgica, s proceder a unidade de critrios, encontraremos na prpria autora um desmentido, ei-la que afirma que pode o lingista embaraar-se quanto seleo dos vrios sistemas alternativos que se lhe pem disposio. Como decidir se dois sistemas lgicos diferem significativamente ou se o fazem por uma questo de notao? Sem nada dizer do problema crucial de fundarem-se as representaes semnticas numa opo entre sistemas igualmente lgicos que reduziriam os operadores uns aos outros, como o Ou ao E e ao No, ou E ao Ou e ao No. A tal ponto que se fala, ao que nota Blanche ( 1 1 ) , em sistema AN (disjuno e negao) para indicar o de Whitehead-Russell ( 1 1 ) , em sistema CN (conjuno e negao) para o de Lukasiewicz ( 1 1 ) , e assim por diante. J antes constatamos que na mesma LN a parfrase das conjunes faculta a equivalncia de construes como "Se no me engano voc j veio" e "ou eu me engano ou voc j veio"

especial, debruou-se sobre o problema das estruturas intelectuais, no sentido de identificar-lhes o que poderamos chamar o arqutipo universal. Julga o lgico francs que a conjuno e a negao ao nvel da L N , o e e o no se arraigam em estratos subjacentes ao prprio plano intelectual e traduzem funes da conscincia em geral: "a conscincia poder de adio e de composio, poder de aceitao e recusa". Assim, o princpio de contradio envolve ambos os conceitos: no se pode admitir, ao mesmo tempo, uma proposio e a sua negao: . Onde h agrupamento, h conjuno, at mesmo entre os termos que a disjuno relaciona. Quanto negao, lembra Blanch ( 1 2 ) o que disse Coirault das dades e trades. "Anttese (ou oposio), o que faz dois; meio e extremos, o que faz trs; tais so os princpios e os ritmos ou se quisermos, os fermentos das imagens construtivas de nosso pensamento v e r b a l . . . " Blanch ( 1 2 ) cita, igualmente, Jespersen, cujos exemplos, que constam de "The philosophy of grammar", lhe parecem esclarecedores: "branco, no branco; possvel, impossvel", ou seja, pares de contraditrios que formam alternativa; "branco, preto; doce, amargo", pares de contrrios que admitem termo mdio; "demonstrado, indeciso, refutado; anterior, simultneo, posterior", trades que comportam um meio entre extremos. Mas os conceitos se relacionam aos conceitos, como as palavras s palavras, num sistema global, e para tornar explcitas essas estruturas de parentesco, segundo as quais eles se ordenam j que nos valemos de escalas, espectros, rvores, chaves, estrelas, como de esquemas intuitivos de natureza geomtrica ou topolgica constri o autor, a seu turno, uma "generalizao esquematizante". Parte do quadrado das proposies opostas, da lgica tradicional, para consider-lo como forma frusta de um hexgono, onde cada trade deriva de insero de um novo "posto" na dade anterior que substitui. No nos cabe aqui esquadrinhar "essa estrutura formal do pensamento em geral", extremamente rica. Basta lembrar, com Blanch, que "ela pe em jogo duas ou trs operaes intelectuais de todo primitivas e elementares", deixando-se analisar ou como "uma dupla de trade ou como uma tripla dade". Em relao aos "conceitos-cpulas" igualmente, inerncia, incluso no ilustra o autor a trade, mediante um tringulo de contrrios Uma dade, perguntamos ns, no seria to s > < ? "A introduo da negao contraditria a partir da trade, engendra a hexade", ou seja, observa Blanch ( 1 2 ) , o sistema de seis smbolos disposio do matemtico:

6. 5 Estruturas intelectuais: trades de Blanche


A elaborao de um esquema unificador, com razes nas operaes essenciais ao pensamento, eis um imperativo se no categrico, pelo menos consolidador das categorias. O mesmo Blanche ( 1 2 ) , em

Ci. Inf., Rio. de Janeiro, 2(2): 175-217, 1973

201

MANOEL ADOLPHO WANDERLEY

"Instrumento que permite reconhecer, sob as lacunas e distores do vocabulrio, uma estruturao precisa das idias" mais perfeito, a nosso ver, que o "quadrado lgico" de Piaget ( 1 2 ) , que o autor francs disseca, e como retifica, ao projet-lo sobre o seu esquema tem o hexgono por domnio o universo dos conceitos, desde as relaes fundamentais, a que aludimos, aos "conectores binrios", desde as modalidades aos imperativos e valores, para no mencionar os atributos e qualidades. Demais, respeita-se ao us-lo, a coexistncia da organizao dos conceitos por pares contrastados, dicotomias, bipolaridades, com sua organizao em escalas graduadas e estruturas lineares, ambas na vanguarda da epistemologia e da tcnica moderna. Haja vista o que sublinha Blanch ( 1 2 ) , o estarem ante os nossos olhos, lado a lado, os computadores digitais e os analgicos. 6. 6 Relaes e conjunes nas LD De certa forma essa nervura de relaes mais finas e a trama de categorias em que se estruturam os significados interessa duplamente documentao. No opera esta sobre e com a linguagem? e ao faz-lo, no se extrema, por vezes, na criao das L D , a distarem mais ou menos das linguagens naturais? Os aspectos que tentamos por em foco tambm so pertinentes s codificaes documentrias. J mencionamos, nesta, a "interdefinibilidade" dos termos e a liberdade de investir no vocabulrio, como acentua Pags - portanto, no paradigma, - "as principais noes em cujo contexto o conceito se torna significativo". E sobretudo por construo que o fazemos e pela hierarquizao. s vezes, o serem aptas para tal as L D , pelo que nelas eqivaleria "flexo" ou "composio", leva at mesmo a incoerncias estruturais. Assim, no cdigo semntico, como aponta Grolier ( 4 9 ) , "isolar" SAPT. 003; "isolado", SWPT. 003; "isolante" (particpio), SU PT. 003; e "isolante" (substantivo), SPT. LWCT. PUTT. 001, o que significa "utilizando ( Q ) a separao ( S - P T ) , agindo sobre ( W ) a eletricidade ( L - C T ) , produzindo ( U ) uma proteo ( P - T T ) , e assim por diante. claro que se no formos alm da condensao documentria e da "codificao telegrfica", as relaes deixam, no raro, de ser expressas, por im-

plcitas ou dispensveis em face do grau de recuperao adotado. Em tal caso, e reduzidos os termos s razes, o texto "Give algorithms useful for numerical solution of ordinary differential equation" seria, conforme G. Saltan ( 9 1 ) , reduzido a "Give Algorithm Use Numer Ordin Differenti E q . . . " Se, ao contrrio, indagarmos como se exprimem, nas LD propriamente ditas, relaes do tipo das traduzidas, nas LN, pelo "e" ou "ou", e por outras conjunes e isso com maior ou menor preciso Jgica obteremos para ilustrao, smbolos como " + " e "/", da C D U , correspondentes, grosso modo, operao de reunio. Assim, "622 + 6 6 9 " significaria "Indstrias minerais e metalrgicas". No entanto, nela, a regra seria, por assim dizer, a "coordenao assindtica", j que se recomenda, no prprio sistema, evitar-se o uso de " + " . As entradas separadas tomariam mais rpida a pesquisa. 6. 7 0 ponto de vista relacionai em Pags Por outro lado, as relaes podem ser encaradas antes do ponto de vista paradigmtico. Os morfemas (ou monemas, ou semantemas) inclusos na parte estritamente lxica do C O D O C apresentam "classificao arborescente" do tipo clssico, embora com ramificaes breves. Trata-se, na verdade, de classificao combinatria, segundo Grolier (49). Na formulao que Pags prope, as letras direita de a indicam subdivises do mesmo tipo que a decimalizao, donde a relao expressa, quer a incluso estrita, quer outra relao hierrquica com propriedades formais correlatas. Assim, dado a a o valor de "cincia", viria: ab mtodo; ac problema; ad p e s q u i s a . . . am proposies cientficas; com subdivises, a seu turno, para: ame conceptualizado; ami axioma; amo hip t e s e . . . De A a Z sucedem-se vinte e duas categorias de noes, de modo que, em Y, figuram relaes em geral e em Z, negao. Com semelhante anlise do processo de conceptualizao, prev-se o lxico de algo que faculta, mediante a classificao hierrquica, "calibrar", "amplificar" ou "modular" a recuperao, de acordo com a variao das questes, reduzindo-as, por exemplo, de am para "ami", de "proposio" para "axioma". As relaes sintticas, em Pags, abarcam a "unio" e a "interseo", da teoria elementar dos conjuntos, bem assim a "tematizao" e a "subordinao", assimtricas e com dois aspectos, a saber, "tematizado = tratado por", "tematizante = reportando-se a" e "subordinado/ subordinante". E, j que i significa "conduta ou processo que se traduz por efeito comportamental no ser vivo" e a notao "tematizado" , no caso, 5, temos: "ame i" para "conceptualizao da psicologia". Equipara-se, pois, a marca predicativa 5 aos "ter5

Ci. Inf., Rio de Janeiro, 2(2): 17-217, 1973

202

LINGUAGEM DOCUMENTRIA: ACESSO A INFORMAO

mos relacionais", que indicam "classes" do discurso afins s preposies ou conjunes da L N . A transformao, pela anlise codificada C O D O C , de um texto natural em linguagem predicativa j vimos que o texto compreende argumentos e relaes como aR b R c R . . . traduz-se em representaes como a dos "estemas" de Tesnire ( 7 5 ) . Fornecem elas, no dizer de Pags, um "como
1 2 1

andaime para a anlise lgico-semntica da estrutura das linguagens naturais" e, na LD em apreo, ajudam, particularmente, a segmentar as frases e classificar as palavras em predicados, argumentos, termos lgicos. o que se infere, quanto s sentenas "a casa nova" e "le feu vert indique la voie libre" (o sinal verde indica a via livre), dos respectivos diagramas:

Pe predicado do tipo "epteto" Pa predicado do tipo "atributo" Pro i como "pro" em pronome, substituto d e . . . (double) 6. 8 Das palavras-chave Braffort e Leroy. s "frases-chave" em

No menos elucidativas se afiguram as observaes de Braffort e Leroy concernentes codificao documentria. Os sistemas de classificao implicam "a possibilidade de estabelecer uma hierarquia das disciplinas segundo a forma de "rvore", no sentido da teoria dos grafos. Ora, as interdisciplinas, as atividades cientficas "oblquas", levam atual transmutao da "rvore de Porfrio" em sistemas de mltiplos entrelaamentos (boucles) melhor "diramos" reticulados. Vejam-se as clssicas observaes de Piaget ( 7 9 ) sobre a epistemologia, bem assim a sntese de Queneau para a "Encyclopdie de la Pliade". Donde o aparecimento de esquemas no s com estruturas algo diversas das classificaes tradicionais mas tambm fundados em palavras-chave, umas e outras a serem denominadas "thesauri" e descritores" em termos documentrios mais recentes. "Rubricas" como Ferro(mina de), ferro (nos compostos qumicos), dotadas muitas vezes de esclarecimentos, ou seja, das citadas "notas de escopo" com que obviamos as polissemias, oferecem

em tais noes, inclusas entre parnteses, a base do sistema de relaes. Apem-se s palavras-chave esse grupo de elementos puramente relacionais, o que permite se conceba como a LN se amolda anlise documentria. "On a besoin du langage, mais pas de tout le langage. Le problme est donc de trouver une solution optimale", diz Braffort. de observar-se que tal linguagem se compe, de fato, de umas tantas sublinguagens relativamente diferentes, em consonncia com as subdivises do pensamento. Na classificao alfa-numrica de Braffort, o conjunto de ndices (cotes) associado a cada "rubrica" representa o vocabulrio, consistindo a sintaxe nas relaes algbricas a que satisfazem as "cotes". A estrutura bidimensional, com cinco colunas intituladas "Fenmenos inter-escalares, comunicaes", "Escala corpuscular", "nuclear", "atmica e molecular" e "macroscpica", e cinco linhas, atinentes respectivamente a "Problemas tericos", "Produo de fenmenos", "Medida de fenmenos", "Descrio de fenmenos" e "Utilizao de fenmenos". A denotaria "Problemas tericos inter-escalares"; B, "corpusculares"; F, "Produo de fenmenos inter-escalares", e assim por diante, omitindo-se o i. Subentende o sistema "propriedades sintticas do tipo inflexivo (declinao, conjugao)". Assim, "propriedades qumicas dos elementos" traduzir-se-ia por TABx, em que AB o smbolo clssico do elemento e x um sufixo numrico atinente prepa-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

203

MANOEL ADOLPHO WANDEKLEY

rao do corpo, seus xidos etc. Note-se que quando o vocabulrio e a sintaxe so ricos caso do domnio tcnico-cientfico atual urge fix-los acuradamente. Mais conveniente seria, ento, associ-los

ao diagrama, que para o artigo Tutilisation des racteurs nuclaires pour les productions des radiolments artificieis" poderia ter a disposio:

Inventariar a imensa famlia de classificaes e de relaes que as estruturam, enquanto organizaes paradigmticas, ou enquanto subjacentes s articulaes do discurso, no eixo sintagmtico, escaparia, por muitos ngulos, ao nosso propsito, que antes a interseo do plano da linguagem com o da documentao do que o levantamento exaustivo de ambos. No h, porm, como omitir duas ou trs ilustraes e comentrios finais a esse respeito, evitada, embora, qualquer insistncia quanto a obras de fato fundamentais para a taxonomia bibliogrfica, quais sejam as de Sayers, Bliss, Ranganathan, Mills e os trabalhos que resultaram do "Classification Research Group ( C R G ) " . Elas, sob muitos aspectos, poderiam ter sido tanto quanto as citadas anteriormente, o ponto de partida de nossa indagao. 6. 9 Modelo de Gardin para os lxicos documenmentrios Entre as ltimas, afigura-se-nos de primordial relevncia para o estudo da lexicografia "documentria", em sua oposio natural, o modelo proposto por Gardin, a que j nos reportamos. Os conjuntos de termos naturais vm a ser agrupados em ordem no-significativa, como a alfabtica, e teremos glossrios, vocabulrios especializados e similares; ou podem ser organizados graas a afinidades semntica, e teremos dicionrios de sinnimos, de idias afins, thesauri, entre outras formas. O mesmo ocorre com os "lxicos documentrios", em

referncia aos quais assinala-se o fato na tipologia em questo h duas correntes, uma tradicional, em que no se torne explcita a correspondncia entre os termos da LN e da LD, e outra que visa a inventari-las. Por outro lado, clssica a distino, endossada por Gardin, entre classificaes unidimensionais e pluridimensionais, conforme se estruturarem numa s, ou em mais do que uma dimenso. Por dimenses de uma organizao entende-se a natureza das relaes analticas, paradigmticas, que a constituem, ou, em outras palavras, da relao dos termos classe a que pertencem. Um passo adiante nessa caracterizao, e cabe enumerar, entre as unidimensionais, as reais, sistemas taxonmicos no estilo dos das cincias naturais, onde, de fato, uma s relao informa todos os nveis, e as aparentes, em que a multiplicidade se oculta sob a unidade. As multidimensionais abarcam, alm das organizaes semnticas, que refletem definies correntes e, em ltima anlise, a ordem natural, as "sintticas", fundadas no na essncia, mas na funo das entidades num dado campo de observao tais so as classificaes de facetas. H, por fim, classificaes mixtas, em que alternam os pontos de vista essenciais e funcionais, e, entre elas, os esquemas dito analticosintticos, tais como o concebe Gardin. No quadro esquerda, ao qual convertemos o diagrama de Gardin, tornam-se patentes algumas dessas relaes entre os "lxicos":

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

204

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

inorganizados listas LN correspondncias L N - L D implcitas LD correspondncias L N - L D explcitas glossrios

organizados

Relaes analticas nas L D classificao Tipo Forma 1 relao / real/ 1 relao aparente vrias relaes Contedo Unidimensional Pluridimensional Pluridimensional

Thesauri LN Thesauri L D positivas: Uniterm negativas: K W I C ( contra-dicionrio ) Vocabulrios

classificaes

B C

Quanto s letras do quadro direita, adaptado de Coyaud ( 2 4 ) para exemplificar os tipos de "relaes analticas" (paradigmticas) nas L D , h que acrescentar os comentrios respectivos. A concerne incluso pura "que s ocorre em certas classificaes tcnico-cientficas, como as anatmicas. Em B, caso geral, tpico o que se d com sistema de Foskett ( 2 4 ) , por exemplo: o morfema Dnb crneo" se inclui em "doenas industriais" quando de fato to s uma localizao delas. Nessa categoria teremos a C D U , os "grupos da W R U , as categorias do M E D L A R S , as hierarquias do S Y N T O L . Em C h tantas relaes quantas dimenses, como se d nas "palavras" da W R U , na "rede de noes" do S Y N T O L , no diagrama geral do G R I S A L . 6. 10 Relaes e categorias em sistemas recentes Se nos voltarmos, agora, para as categorias e relaes fundamentais salta vista que o estudo clssico de Grolier ( 4 9 ) , de que to amplamente nos valemos, no perdeu, com os anos, muito mais do que a atualidade. O prprio autor complementou-o com nova resenha em 1970 ( 5 0 ) , onde se descortina, alis, manifesto retorno classificao documentria enciclopdica. Assim, o Descriptive inventory, de J. K. Tykociner engloba doze "domnios de conhecimentos", agrupados em sries: Arte, Hilenergtica (fsico-quimica, astronomia, cincia da t e r r a ) , Exeligmologia (histria, no sentido de Bacon, espcie de cincia da evoluo), Pronotica ( t c n i c a s ) , domnio da re-

gulao (direito), da disseminao (educao e informao), e Zettica, domnio da integrao. A se acrescentam criatividade artstica, filosofia, religio, ao que hoje se vem definindo como a "cincia das cincias", ou como a "cientologia" dos soviticos. Tykociner valeu-se da interseo de vrios domnios para simbolizar-lhes as subdivises: A ( B B ) C D , "raios csmicos", onde A ( B B ) astrofsica, e C fsica da matria inter-estelar. "L'ide est bonne, la ralisation l'est moins", observa Grolier ( 5 0 ) . Respeito "classificao biblioteconmica bibliogrfica" sovitica a B R K de estrutura clssica, e inspirada na C D U e em Bliss, mostra-se-nos tambm, no referido artigo, que de 60% o seu grau de "modernismo", isto , a percentagem destinada s cincias exatas, contra 20% a C D D e na C D U . Os restantes 40% representam as "humanidades". No plano de conjunto, a saber, "A marxismo-leninismo", B-E, Z-R, SE, Ju Universo e seu conhecimento", "Ja Literatura enciclopdica", dicotomiza-se, por vezes, de modo "algo simples", na opinio do autor francs: " U R S S de um lado, mundo no sovitico de outro; ou, ainda, teoria marxista-leninista/teorias pre-marxistas e no marxistas". No raro h tricotomias: pases socialistas/pases em desenvolvimento/pases capitalistas.
3 1 3 3 1 3 1 3 3

6. 1 0 . 1 "Operadores" de Farradane e do Precis Uma vez vista as "categorias" da B R K , no h pas-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

205

MANOEL ADOLPHO WANDERLEY

sar em silncio, porque de maior interesse para o problema em foco, as pesquisas do C R G a que j aludimos, um dos resultados dos quais o P R E C I S Preserved Context Index System, a que se vincula o nome de Austin. Nas pegadas de Farradane, optou-se, nele, pela construo dos assuntos a partir dos "quanta" bsicos da linguagem, enfoque mais consentneo com as vistas atuais dos processos mentais" do que a mera subdiviso do universo dos conhecimentos at os conceitos individuais. H duas categorias destes: entidades, isto , construes mentais (mentefacts) e objetos concretos (artefacts); e atributos, isto , "propriedades, atividades e propriedades de atividades". Quatro relaes fundamentais servem de conexo entre os conceitos: gnero espcie, coberta pelas referncias cruzadas do tipo "ver tambm"; atributiva, entre entidades e atributos; possessiva, entre objetos e partes, e interativa, entre objetos. Nesse quadro, para unificar a estrutura gramatical das "sentenas do ndice", anlogas aos "analets" de Farradane ( 4 1 ) , e manter o grau de pre-coordenao que o nome P R E C I S sugere, fixaram-se vinte e dois "operadores", a serem aplicados de tal forma que os elementos, num assunto composto, obedeam estrutura A > B > C > D. Vale isso dizer que se considera o conceito de D no contexto de C; o de C, no de B; e o de B, no de A, isto , que "em termos de estrutura gramatical, tendemos a organizar a sentena de modo que se tenha esta na "forma passiva", quando se l a cadeia da esquerda para a direita", e na "forma ativa", se o fizermos no sentido inverso, permutando-se a posio do verbete inicial ( l e a d ) com a do modificador (qualifier). fora reconhecer-se a a influncia da teoria dos sistemas gerais, bem como a de Farradane na noo de "operadores". Os do P R E C I S so: ( a ) forma; ( b ) objeto, "target"; ( / ) relao quase-genrica, diferena, isto , forma adjetiva do conceito; ( p ) subsistema, material; ( q ) propriedade, percepto "percept"; ( o ) regio do estudo, populao amostragem, "sample population"; ( 1 ) ponto de vista, perspectiva, ( 2 ) conceito ativo; ( 3 ) efeito, ao; ( 4 ) sistema-chave, "key system"; ( 5 ) disciplina; ( 6 ) ambiente; ( v ) conceito coordenado; ( w ) conceito coordenado correlato; ( x ) tema coordenado. Destarte, para o assunto "Intervention by the British government in the dock strikes of 1973: report of a study conducted at Liverpool", a anlise dos conceitos seria: ( 6 ) Great Britain; ( 4 ) Docks industry; ( 3 ) strikes 1973; ( 3 ) Intervention by in; ( 2 ) Government; ( o ) study region; ( / ) Liverpool. Note-se o "elo" preposicional criado para ligar os termos "strikes" e "government". Na esteira das reflexes de Farradane, o P R E C I S , como alis, em geral, as pesquisas do C R G , tambm acusam, saciedade, a ao acabamos de

v-lo no s desse como fermento intelectual que a "teoria dos sistemas gerais", cuja formulao original devemos a von Bertalanffy ( 4 2 ) , se no tambm da concepo dos nveis de integrao ou de emergncia (integrative leveis). Considerando-se sistema lato sensu tudo que possa ser tido como entidade, sistema-M (major system), aquele que se pretende analisar, e conjunto-D, o conjunto de subsistemas resultantes da sua decomposio, a estrutura do sistema-M seria a totalidade das relaes vigentes entre os subsistemas que pertencem a determinado conjunto D. As relaes surgem, ento, como a totalidade das restries que incidem sobre as possveis combinaes de dois ou mais sistemas. So essas algumas das definies propostas por M. Toda, bem assim a de composies e decomposies, materiais ou conceptuais, a de "rvores e famlias de decomposio", todo um instrumental terico utilizvel na "anlise e sntese da informao". Num assunto verbi gratia, como "a influncia dos lares desfeitos sobre a incidncia da delinqncia juvenil", "delinqncia juvenil" o sistema "passivo", enquanto "lares desfeitos" o "ativo", conforme Foskett ( 4 2 ) e o que dissemos acima. Austin ( 4 2 ) introduziu igualmente a noo de "mudana de sistema", de forma que o conjunto de relaes, nessa tica "sistmica", vem a ser: 1 Propriedades dos sistemas; 2 Segundo sistema/ ambiente, relacionado a ( 3 ) ; 3 Atividades e interaes sem mudana material; 4 Subsistema ativo; 5 Subsistema passivo; 6 Introduo dentro do sistema; 7 Segundo sistema/ ambiente relacionado a ( 8 ) ; 8 Interaes com mudana do sistema; 9 Atributo que define "subclasse (entidade mudada)". De certa forma a teoria dos sistemas refora a dos nveis de integrao. tpico da primeira afirmar, como o faz M. Toda, que s pelo conhecimento das estruturas dos sistemas macroscpicos se pode, de fato, derivar do microscpico o macroscpico. E o que postula o "no-reducionismo" da teoria dos "integrative leveis" se no que o todo maior que a soma das partes? As entidades se ordenam numa seqncia linear tal que "as unidades constituintes de cada nvel, mais as relaes que as unem, determinam a natureza do "nvel superior", na sntese de Foskett ( 4 2 ) . Mais prximos da questo mesma das relaes, resta-nos ainda, do lado britnico, lanar rpido olhar aos trabalhos supracitados de Farradane, cujas idias procedem antes do prisma psicolgico e dos estudos de Vinacke, Isaacs, Piaget, e, principalmente, de Guilford ( 4 9 ) . Deste, o modelo de estrutura intelectual envolve trs planos: tipos bsicos de conceitos, mecanismos mentais e produtos do pensamento. Corresponderiam aos conceitos "figurativos" (figurai), simblicos e semnticos de

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

206

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

Guilford as facetas bsicas, do sistema de Farradane, "entidades", "abstratos" (abstracts), "atividades", a que ele teria acrescentado "propriedades". As "classes" se reportariam s combinaes de "unidades homogneas" quanto ao tipo de conceitos bsicos. "Termos do sistema", ou "termos heterogneos", eis como design-los no caso contrrio. "Um passo adiante na anlise da informao a dos assuntos complexos por meio de relaes explcitas entre os clareza de percepo

termos, onde no se aplicam as relaes mais fundamentais da classificao (nveis, classes, grupos heterogneos)", escreve Farradane. Temos ento o clssico quadro de "operadores", que a seguir reproduzimos, decorrente da conjuno de dois tipos de mecanismos mentais, o primeiro atinente natureza "temporal" da relao, o segundo ao grau de distino (distinctness) em que ela percebida. Tempo mental Temporria

No-temporal

Fixa

co-ocorrente

no-distinta

distinta

A indexao da sentena "Juno de chapas de ao endurecidas", mediante os respectivos "operadores", daria, no exemplo de Foskett ( 4 1 ) : A o / : Chapas/ Juno /; Endurecimento 10. 2 Sistema Universal de Whlin e relaes de Kervgant Quisssemos tentar resenha cabal dos estudos sobre estruturas classificatrias e categorias e faramos, como se percebe de pronto, longa dissertao. Eis porque nada diremos sobre obra to "sria, tcnica e refletida" quanto a de Z. Dobrowolski, voltada antes para a construo mesma dos sistemas de classificao e para o aspecto da notao, que deixamos de lado. Outras h que fora omitir, com as duas ressalvas seguintes, de que trataremos antes de terminarmos essa linha de consideraes num de seus pontos altos, o Simpsio sobre fatores relacionais. Para Whlin, "domnio dos conhecimentos" e "domnio dos termos" diferem quanto s estruturas, de modo que fora distinguirmos sistemas de

documentos e de termos. Isso porque, de fato, o objeto da classificao no so propriamente os conceitos, por muito que neles se fundem os documentos, mas estes mesmos, de que se deve levar em conta, no entanto, o contedo intelectual. Ressurge a a tese de Hulme ( 4 1 ) , da "abonao literria" (literary warrant): o documento o esteio da taxonomia bibliogrfica. Demais, o ponto de vista da ao no plano concreto requer igual ateno, donde a necessidade de "sistemas prticos", como os que se destinam a fins industriais e comerciais. Da um "campo universal", a par de supercampos, campos e subcampos. Dois princpios lgicos merecem meno: a classificao mediante sistema de documento com base nas estruturas hierrquicas, genricas ou outras, e na pr-coordenao (ab e Im), e a indexao por meio de certo nmero de termos equivalentes (a, b, 1, m ) . Para o arranjo dos termos, no eixo vertical, enumera o autor do US (Universal System of Classification) critrios como o alfabtico; o semntico, com base nos conceitos; o sistema de definio e a diviso gramatical de acordo com as classes de palavras. A trilogia coisas, atividade (processos) e pro-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

207

MANOEL ADOLPHO WANDERLEY

priedades corresponde grosso modo s trs classes substantivos, verbos e adjetivos. Preposies, conjunes e a declinao respondem pelo contexto sinttico. Note-se, enfim, que os "indicadores de funo" suprem a insuficincia da lgica do discurso. Da mesma forma, num retrospecto das reflexes significativas sobre as relaes e categorias, destaca-se incontestavelmente a anlise de D. Kervgant, do sinal ": " na C D U . notrio que, desde 1957, sugeriu o autor se tornassem explcitas as relaes entre os assuntos designados por tal smbolo, acrescentando-se-lhes flechas com orientaes diversas e nmeros de ordem. Assim, no tocante Pertinncia, " > 1 1 > " indicaria incluso; > 1 2 > , partes, r g o s . . . ; em Processo, " > 2 1 > " eqivaleria a ao; " > 211 > " ao favorvel, estmulo; " > 2 1 2 > " d e s f a v o r v e l . . . ; e m Dependncia, " > 3 < " teria o sentido de c a u s a l i d a d e . . . ; cm Orientao, usar-se-ia " > 41 >" para aspecto, caso particular; " > 4 2 > " , a p l i c a o . . . e em Comparao, " > 51 >" para semelhana etc. Um assunto complexo, ilustra-o Kervgant com o ttulo "Influncia do clima sobre a resistncia da batata s pragas de vrus", assim traduzido na C D U , colocando-se entre colchetes os "sistemas de conceitos" equivalentes a um termo: 5 5 1 . 8 - > 2 1 - > [ 6 3 1 . 5 2 1 . 6 - > 4 1 - > 6 3 2 . 38] (clima) (resistncia a vrus) - > 4 2 - > 6 3 3 . 491 (batata) 6. 10. 3 Levantamento das relaes: D. Soergel Manancial importante para o estudioso das categorias documentrias so, altm da obra de Grolier, contribuies como as de Pags, Farradane, Lvy, Perreault, apresentadas ao Simpsio Internacional sobre fatores relacionais na classificao. Entre eles, note-se h uma quase completa suma das relaes e indicadores de funo, em que se trata de "modo enciclopdico", informao contida, em boa parte, nos trabalhos de Grolier, Perreault, Vickery. a que devemos anlise exaustiva de D. Soergel. Perquirem-se e comparam-se, nela, os principais esquemas existentes no que toca a "indicadores de funo", isto , "conceitos extremamente gerais aplicveis a uma larga faixa de domnios (fields) do pensamento". Antes da lista mesma, apresenta o autor um modelo geral para a estrutura do conjunto de assuntos, partindo, para tal, do "conjunto (A + + ) de conceitos primitivos (predicados, atributos) e do con-

junto M de "constantes de relevncia", destinadas a especificar a importncia do assunto mais simples no quadro do mais complexo. A operao "conexo" prev a construo de uma rede representativa do assunto complexo: "Termmetro", por exemplo, seria expresso por "instrumentos: { finalidade: [ (operao: m e d i d a ) : ( < objeto: medida > : temperatura) ] | " . Quanto s relaes entre os assuntos A e B, enumera Soergel trs: a relao A ^ B dos sistemas parcialmente ordenados e equivalente a "A implica B " ; a proximidade (nearness) dos assuntos A e B dos sistemas descritos na primeira relao; as relaes do tipo "ver tambm. Atenta, ainda, o autor, para o fato, j apontado, de se distinguirem das relaes paradigmticas, "essenciais e universalmente aceitas e portanto implcitas", as sintagmticas, contigentes, ocasionais e explcitas. O esquema para a classificao dos "roles" ressalvado o que concerne ao tempo e espao, e aos pares "todo/parte", "classe/elemento", compreende os tipos bsicos: coisa, entidade; material, substncia; propriedade, condio; processos, agente; objeto ( t a r g e t ) , alm da Causalidade. 6. 10. 4 Natureza relativa dos fatores: F. Lvy Se quisssemos caracterizar outra opinio de interesse para o nosso tema, a saber, a que F. L v y externou no Simpsio mencionado, diramos que vem a marc-la e nisso se revela um porta-voz do S Y N T O L um sentido agudo do valor relativo das categorias, j que mister, ao que mostrou, firmar-lhes a interpretao no contexto semntico, de natureza lingstica e/ou epistemolgica, e que no h reduzi-las a fatores estritamente lgicos. Do contexto global, com efeito, depender o valor informativo do que significa a palavra "afeta" nos exemplos: " ( O lcool) afeta (a delinqncia)" e " ( O lcool) afeta (as clulas corticais)", valor metafrico no primeiro caso, relativo a processo bio-fsico no segundo. O fator lgico, por abstrato, oferece fraco teor de informao. Por outro lado, em si mesma "epistemologia" a lgica que faculte o se tornarem "significativas as noes na medida que reflitam os "comportamento" do campo em questo". A compatibilidade entre sistemas "possvel porque as categorias devero ser interpretadas em funo dos contextos documentrios" sugere-a o seguinte quadro, em que se ilustram "alguns dos denominadores comuns lgicos":

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

208

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

SYNTOL

WRU Categrico Intrnseco Incluso Compreenso Simulao AO

Caractersticas inerentes: (incluso, predicados, atributos) Esttico Interpretao modal

ATRIBUTIVO

EXPRESSIVO DO AGENTE PROCESSO

Agente, assunto do processo

Instrumental

Objetos do processo

DO PROCESSO AO P R O D U T O

Produo

Dinmico

Causalidade, interdependncia entre dois fenmenos ou elementos

CONSECUTIVO

Afetado por

6. 1 0 . 5 Trades de Perreault e outros Se algo, enfim, pode depreender-se dessa breve incurso pela selva das "relaes fundamentais", que ali onde a unidade lgica seria de regra, encontramos, quando muito, um ar de famlia entre categorias "nem de todo as mesmas, nem todo outras" em cada caso. Lograr-se-ia o geral consenso quanto a uma dade ou trade final, nos moldes da de Blanch ( 1 2 ) em que, de certa forma, culminou o exame das estruturas nas L N ? o que tentariam insinuar as reflexes de Perreault ( 7 7 ) , "Charmain" do j citado Simpsio sobre fatores relacionais, as quais no acusam, alis, qualquer referncia ao lgico francs. Ao sondar os fundamentos epistemolgicos da questo frisa o autor o fato de que o julgamento, constituem-nos no os conceitos isolados, mas a unio lgica e a cpula entre eles. "A articulao o que faculta o discurso. Operadores, sintagmas, morfemas, "correlatores" so d i d i c o s . . . criam uma cadeia articuladamente discursiva". Se se apem indicadores de funes (roles) aos substantivos, temos "Al, B 2 , Cl e D3"; se elos ( l i n k s ) , " [ A l , B 2 ]

( C l , D 3 ) " , mas em nenhum dos casos o grau de articulao de a, diz Perreault, substituem-se "links" e "roles" por smbolos tais que "oc" a relao copulativa, a relao de certeza moral, " > " a "supra-relao" antecedente/ conseqente. No que toca a articulao dos substitutos (surrogates) dos documentos, a que aludimos anteriormente, ou seja, dos documentos secundrios simplificaes pertinentes do discurso, j que no dizer de Mills ( 7 7 ) "o propsito da indexao dizer-nos o que ignorar" o desiderate a recuperao efetiva mediante estratgia apta a localizar os itens Y que respondem com preciso adequada questo X. O que se tem em vista so, pois, aspectos sintticos dessa "estratgia", isto , no estilo de Perreault, "a manipulao ritual" [entenda-se: operacional?]. Acena enfim o autor para uma sorte de tripartio reconhecvel em muitos dos sistemas relacionais. Teramos o quadro abaixo dos que compara para ilustrar tal similitude, excludo o nico explicitamente epistemolgico, o de Farradane ( 7 7 ) , onde h a dupla tripartio quase diramos a dupla

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

209

MANOEL ADOLPHO WANDERLEY

trade-que j consignamos. A propsito dele lembra Perreault o que disse R. Sokolowski: " . . . o conDE GROLIER (77) Objeto em si mesmo GARDIN (77) Coordenativo, Predicativo

ceito de constituio pressupe a historicidade do sujeito e o cmbio da realidade". Eis o quadro: PERREAULT (77) Subsumptivo H J E L M S L E V (77) Interdependncia

Objeto na relao ativa Objeto no ambiente 7 - CONCLUSES

Consecutivo

Determinativo

Determinao

Associativo

Ordinal

Constelao

Uma vez reconhecida a rea dos problemas em foco, a primeira pergunta que ocorre, espontaneamente, quanto condio lingstica da documentao, ou, em outros termos, quanto ao existirem, ou no, as chamadas L D , e no caso de as haver, quanto a seu estatuto, por assim dizer, em face das naturais. Consistiria em mera metfora a sua realidade ou haveria a lastre-las alguma consistncia ontolgica? Parece-nos que, do levantamento feito, se depreende a flexibilidade extrema do conceito. Registramos, no tocante ao "continuun" da indexao, toda uma seqncia de estruturas de lxicos e de sintaxes a constiturem trasio gradual das LN para as L D . Embora o elemento conceptual e os significados de umas e de outras no se diferenciem essencialmente, os significantes podem faz-lo e ir dos grafemas alfanumricos e usuais aos cdigos e diagramas de diversas sortes. Tampouco, na gama das L D , h uniformidade no que concerne a presena; ou no, de sintaxe, ao fato de se relacionarem ou serem discretas as unidades em que o contedo se traduz. Se nos ativermos, pois, ao polo da mxima coincidncia, encontraremos, bvio, boa parte da problemtica das LN, e a "essncia" das L D , se a houver, defini-la-emos, por fora, a partir da que fixamos para as primeiras. Questo tormentosa, dada a profuso de teorias concorrentes e a ressonncia transcendental logo provocada por tal ordem de cogitaes. Bastaria, no entanto, deixarmos os fatos serem os prprios intrpretes da condio que assumem. Estaramos deante de usos especficos dados aos componentes e comportamento das linguagens. Como assinala F. Mora, "Ias funciones lingisticas son muchas y mui variadas, porque son muchos y mui variados los tipos de actos lingisticos". Retomando idias wittgensteinianas ou, pelo menos, a respectiva terminologia e sem abolir a priori, contudo, os universais prprios a esse terreno acrescenta: "en puridad, no hay lenguaje, sino

juegos lingisticos". Ora, justamente os h bem ntidos no mbito da comunicao e do processo da informao ou, mais restritamente, da "conserva" documentria a que aludimos em vrios pontos. Bem precisas so, por exemplo, as funes da "recuperao da informao" e as dos sistemas de "question answering", com fortes afinidades a assemelh-los e uma nica teoria de seleo subjacente a ambos, mas discriminveis ao menos em opinio to balisada quanto a de C. Mooers ( 6 ) . No foi ele o criador da primeira, que tanto xito logrou? O sistema de recuperao da informao afirma Mooers ( 6 ) o sistema de informao que permite pessoa que necessita uma espcie de informao previamente descrita (prescribed) selecionar, da coleo de documentos que contm informao, os que quadram com a descrio. O escopo dos "question answering systems", dos de tipo "pergunta-resposta" prover respostas s questes que lhes so propostas. Destarte as funes determinantes de tais processos, e de outros que se lhes aliam no campo da comunicao, especializam as das L N . O mesmo se d, dentro delas, com outros jogos lingsticos. Assim, "Fogo!" nota-o F. Mora tanto vale para grito de alarme quanto, para "si no se es muy c o r t s . , . pedir lumbre y encender el cigarillo". Nem outra a multiplicidade decorrente das estruturas sintticas, como verificamos a respeito dos nveis profundos e superficiais dos enunciados. Haveria, perguntamos, algum fundamento para retirar s linguagens documentrias os foros de "jogo lingstico" ou, por outras palavras, de linguagem, conquanto artificial, em certos casos, e equivalente transposio ou codificao sui generis do discurso escrito, como este o do oral? A nosso ver no, e mister julg-la tal, ainda que fosse vlida a crtica de Bar-Hillel, ao arguir que "se o anzol com que se fisga o peixe no por fora um peixe em miniatura ou condensado, no h razo intrnseca pela qual um ndice deva ser um documento em miniatura ou condensado", nem para que o ndice, por muito que consista em

CL. Inf., Rio de Janeiro, 2(2): 175-217, 1973

210

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

frase constante do documento, lhe veicule o teor da informao. Porque tudo est a indicar, ao contrrio, que verdadeira a objeo que lhe fazem J. Perry ( 1 8 ) e outros pesquisadores da W R U quando mantm que "a informao recuperada no pode ser se no a informao originariamente armazenada. A equivalncia semntica deve realizar-se entre o pedido de informao e a informao armazenada". Eis a outro ponto que merece ser sublinhado em muito de quanto observamos nas pginas precedentes: o papel central que desempenha, tanto na LN propriamente dita, quanto na L D , a noo de equivalncia. Todo um campo conceptual de marcada relevncia para a nossa investigao, gira em torno dela: sinonmia, polissemia, ambigidade, homonmia, e aproxima o uso comum das estruturas lingsticas, do uso documentrio. Por outro lado, suas relaes so incontestveis com certos aspectos da "analiticidade", da definio, da parfrase e com outros traos das linguagens, entre os quais, a maior ou menor adaptabilidade traduo. Se o tradutor, ao que observa Olshewsky, se interessa pela equivalncia de significado entre expresses de duas lnguas diferentes, o analista lgico, entre duas expresses dentro da mesma lngua, no lcito afirmar que a essa segunda categoria pertence primordialmente quem lida na comunicao a fazer resumos, representaes indexadas, codificaes de documentos, no obstante participar tambm da primeira no seu af de transpor as barreiras lingsticas? Bastaria aduzir, para corroborar tal assero, o que frisamos repetidamente, a saber, as ligaes estreitas de traduo automtica com a recuperao da informao. Assim, contribuiriam para elucidar o problema das polissemias nesta ltima os algoritmos e programas de clculo mecnico aptos a resolver a ambigidade, definida por A. Janiotis como a "situao em que uma expresso na lngua-fonte comporta mais do que uma na lngua-objeto, ou como a situao em que no basta considerar as palavras ou grupos de palavras isoladamente, mas antes suas combinaes aptas a uma traduo com sentido". "Les progrs dans le dpistage des informations 1'aide de mots-cl iront de pair avec la solution des problmes lexicaux de la machine traduire", ao que prev E. Delavenay. A equivalncia estaria conferida, na teoria lingstica, funo similar identidade nas estruturas de ndole lgica, e isso inclusive do ngulo do significado, da intenso ou conotao. "Para descobrir se dada proposio logicamente verdadeira Bar-Hillel quem o diz se duas proposies so logicamente equivalentes, ou se duas expresses so sinonmicas, preciso conhecer to s a sua intenso (conotao, sentido)". Ousaramos adiantar que a outra face, a do valorverdade, a do referente, a da coextensividade

que em princpio exclumos de nossas consideraes encontra talvez, como contrapartida na documentao, dimenses e parmetros do tipo do ndice de pertinncia, de recuperao, de "atinncia", de preciso, a que, incidentalmente, fizemos aluso. Demais ao nvel da anlise do contedo, ao relacionarmos aos significados as estruturas gramaticais vimos aflorar a noo de correspondncias formais e no temos a, de novo, algo ligado equivalncia? entre sentenas includas na descrio da frase e outras que no o so. Ao que pondera Chomsky precisamente quem aprofundou a questo "tais correspondncias so de fcil descrio. No difcil definir o que se pode chamar de transformaes, isto , as operaes formais que convertem qualquer sentena de forma declarativa numa forma correspondente passiva, interrogativa ou outra". Note-se, por fim, o esforo envidado para a formalizao, aqui tambm, do conceito de equivalncia lingstica e verbi gratia do teor de sinonmia (sinonimity) de dois textos sinnimos, Te e Ti. Eles o so, para Shreider, "se corresponderem ao mesmo operador de transformao do Thesaurus A = A " . A determinao de tal "sinonimity" com respeito ao Thesaurus "desenvolvimento natural da idia de equivalncia intensional e igualdade de estrutura intensional de "Carnap", para o qual dois textos tero o mesmo significado (intenso) se o mantiverem em qualquer estado concebvel do mundo.
T T 1

Somente, obtempera Katz, "as previses feitas a partir de uma lngua artificial de tipo carnapiano s o . . . completamente v a z i a s . . . a s construes lingsticas inscritas sob os ttulos "analticas", "sinnimas" etc. so as que a lngua carnapiana "prev" como analticas, sinnimas etc. O acerto da previso de que uma frase P tem a propriedade P nada mais estabelece que o seguinte: esta frase tem a propriedade P". No estaramos a a identificar o mal de que padecem muitos dos formalismos? Constatamos, outrossim, na seo atinente anlise de contedo, a ocorrncia de sistemas em que a recuperao se faz, por um lado, mediante a mera justaposio de termos, cannicos ou no, isto , mediante LD "assintticas". Eis um modo de linguagem "tal como aparece na criana, ou para o qual tende a linguagem ao degenerar" observa-o G. Granger modo, porm, efetivo, at certo grau de experincia documentria. Por outro lado, afinando-se o reconhecimento do teor informacional, por mais acurada a "questo" do usurio, entram em jogo as sintaxes, as gramticas e algoritmos respectivos para a resoluo dos textos em seus componentes. Situa-se a o domnio rico das estruturas lingsticas e lgicas. Estas, com efeito, integram a informao ao articularem a que os termos do lxico veiculam, de tal sorte

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

211

MANOEL ADOLPHO WANDERLEY

que o todo do significado acaba por condicionar o significado dos elementos encarados de per si. Por outras palavras e consideradas as relaes de equivalncia a que acabamos de nos reportar a introduo de um contexto, dentro do qual estruturas profundas respondem pelas superficiais, atesta a interdependncia da sintaxe com respeito semntica, hoje incorporada na lingstica. Sem a remisso constante ao significado correr-se-ia o mesmo risco, a esse respeito, de nos limitarmos concepo gramatical da linguagem ou das "sintaxes lgicas" a que tende o nominalismo de teses como a que exprime o clebre conceito de Condlac,

da "cincia como lngua bem feita". A distino, alis, entre funo semntica e funo sinttica como o vimos ao escrutar-lhes as incidncias nas LD e como frisa magistralmente G. Granger a distino entre remisso, pelos termos, "aos objetos" e s estruturas lingsticas, essencialmente relativa e mvel. No quadro a seguir o autor citado elucida a maneira pela qual "dos sistemas sintticos tematizados como quaseobjetos reparte em seguida o processo". de observar-se que, no caso vertente, o autor considera a escrita em si mesma e no como transcrio de uma lngua falada.

Nem por outra razo, como tivemos o ensejo de verificar, que Salton faz depender a identificao do significado, no que diz respeito ao grupo de palavras, do "reconhecimento adequado das ambigidades sintticas e semnticas, da interpretao correta dos homgrafos, do reconhecimento das equivalncias semnticas, das relaes de palavra a palavra e de uma percepo geral do "background" e ambincia de cada enunciado". Como observao final, tudo nos leva a apontar para o que faz as vezes de fecho de abboda na complexa construo em que nos detivemos: precisamente as ligaes centrais, as articulaes mais genricas das linguagens. "No pensamos com palavras, pensamos com frases" notava Valry, e determinar as funes da unidade no julgamento, eis o objetivo de um esforo persistente, a que tambm tende, de alguma forma, a busca que descrevemos ao nvel das categorias documentrias. Com efeito, o problema das relaes fundamentais j revela, por si s, at que ponto se aproximam as formas lingsticas e as formas lgicas, como queria Cassirer e, a fortiori, a nosso ver, ambas e as L D , muito menos formalizados que aquelas ltimas e equiparveis no raro o que tentamos mostrar a "jogos lingsticos" ou usos especiais de umas e de outras, isto , do discurso e da lgica. No acusa origem comum, perguntamos, o longo es-

foro para lograr-se a tbua ideal das categorias fundamentais, quer no plano epistemolgico e do conhecimento em geral, quanto aos "modos mais universais do ser e os gneros supremos do discurso", quer no "espelho do mundo", que o microcosmo documentrio, quanto aos fatores relacionais das "linguagens descritoras"? To grande se afigura a semelhana que os componentes de toda sntese intelectual dissecada na teoria, e os das representaes indexadas, so objeto, por vezes, da mesma caracterizao. Destarte, teremos categorias como a "relao" propriamente dita, em Aristteles e Kant, e a "relao" na C D U ; 'lugar e tempo", nos Tpicos e na Colon Classification ou na C D U ; "causalidade", dentro da relao na Analtica Transcendental, e "causao" em Farradane, e assim por diante. Igualmente em Peirce, (74) as categorias "cinopitagoreanas" de "firstness", mode ser do que como sem referncia ao outro, de "secondness", do que com referncia a um segundo, mas no a um terceiro, de "thirdness", do que pondo em relao um segundo e um terceiro, no sugerem a "trade" do objeto em si mesmo, do objetivo na relao ativa e do objeto no ambiente, de um Groher, por exemplo?. De outras feitas, a identidade residiria no nmero de categorias arroladas e talvez, no fundo, na universalidade de certas operaes intelectuais que

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

212

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

informam estruturas lgicas como a de Blanche. Mas de modo geral notamo-lo quanto documentao ao tratar das idias de F. Lvy relativamente ao contexto semntico, e no que concerne antes epistemologia do que lgica stricto sensu que atuar o princpio de repartio em classes, o qual, em termos de Cassirer, "uma vez descoberto, rege no s a organizao do sistema nominal, mas estende-se totalidade do arranjo sinttico da lngua e torna-se a expresso verdadeira de sua coerncia, de sua "articulao espiritual". O que precede nos parece significar que h, de fato, e se afirma de modo crescente, uma funo nuclear que se refere, em todas as linguagens at mesmo em todas as semitcas como dissemos ao incio s estruturas de carter universal e em especial, s que interessam a lgica e o modo de ser racional da comunicao humana. Tratar-se-ia de capacidade e disposio inatas, como pretende Chomsky, para os universais lingsticos nos moldes do princpio "A sobre A"? Parece-nos mais avisado o que avana J. Lyons a comentar o pensamento Chomskiano que no "um conhecimento dos princpios formais da linguagem que inato, mas inata uma "faculdade" mais geral" que, em circunstncias adequadas, interage com ela para produzir a competncia lingstica. Em suma, de acordo com Piaget, as anlises estruturais dos lingistas evidenciam no h negar a originalidade de um sistema de sinais face ao de normas de pensamento ou verdades, e suscitam o problema das relaes. Mas "estas existem de fato, e os sinais tm por funo exprimir significaes cuja natureza lgica em diferentes graus". Eis por que isso nos traz de volta citao de S. Elia feita na introduo o lingista Hjelmslev veio a fazer a "hiptese de um nvel "sublgico", onde se estabelecem as coordenaes lgicas e as lingsticas". Seria, enfim, de ndole racional essa "linguagem de linguagem" que para Michel Deguy o prprio da funo potica do discurso, de todo excluda de nossas cogitaes?

AUSTIN, Derek - P R E C I S indexing. The Information Scientist, 5 ( 3 ) : 95-114, 1971. B A L D I N G E R , Kurt - Teoria semntica; hacia uma semntica moderna. Madrid, Alcal, 1970. 278 p. B A R - H I L L E L , Yehoshua Language and information; selected essays on their theory and application. Reading, Mass., Addison-Wesley; Jerusalem, Jerusalem Academic Press, 1964. 388 p. Comentrio por: M O O E R S , Calvin Comment on the paper by Bar-Hillel. American Documentation, 8 ( 2 ) : 114-6, 1957. & CARNAP - Semantic information. In: S A R A C E V I C , Tefko, ed. Introduction to Information Science. New York, Bowker, 1970. 751 p. B A R T H E S , Roland - Le plaisir du texte. Paris, Seuil, 1973. 105 p. B E L Y , N.; B O R I L L O , A.; V I R B E L , J . SIOTD E C A U V I L L E , N. - Procedures d'analyse smantique appliques la documentation scientifique. Paris, Gauthier Villars, 1970. 240 p.
;

10

B I E R W I S C H , Manfred - Semantics. In: LYONS, John, ed. New horizons in linguistics. Harmondsworth, Penguin books, 1971. 367 p. B L A N C H E , Robert - Introduction la logique contemporaine. Paris, Armand Colin, 1957. 208 p. _ Structures intellectuelles; essai sur Vorganization systmatique des concepts. Paris, J. Vrin, 1969. 147 p. B O R D E N , George A. & N E L S O N , William F. Toward a viable classification scheme: some theoretical consideration. American Documentation, 2 0 ( 4 ) : 298-301, 1969. B O R K O , Harold, ed. Automated language processing. New York, Wiley, 1967. 386 p. B R A F F O R T , Paul & L E R O Y , Andr - Des mots-cls aux phrases-cls; les progrs du codage et lautomatisation des functions documentaires. Bulletin des Bibliothques de France, 4 ( 9 ) : 383-391, 1959.

11

12

13 8 - CITAES BIBLIOGRFICAS 1 A D D R A D O S , Francisco R. Rasgos semnticos, rasgos gramaticales y rasgos sintticos. Revista Espaola de Lingstica, 2 ( 2 ) : 249-258, 1972. Subclases de palabras, campos semnticos y acepcimes. Revista Espaola de Lingstica, 1 ( 2 ) : 335-354, 1971. ARCAINI, Enrico Prncipes de linguistique aplique: structure fonction transformation. Paris, Payot, 1972. 302 p.

14

15

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

213

MANOEL ADOLPHO WANDERLEY

16

BRAGA, Gilda Maria Relaes bibliomtricas entre a Frente de Pesquisa (Research Front) e revises da literatura: estudo aplicado Cincia da Informao. Rio de Janeiro, 1972. 39 p. Tese. B R E N N E R , Claude W. - Experience in setting up and using Zatocoding system. In: S H E R A J. H. et alii. Information system in documentation. New York, Interscience Publishers Inc., 1957. p. 178-192. C E N T E R F O R D O C U M E N T A T I O N AND COMMUNICATION RESEARCH Comment on "A logician's reaction". American Documentation, 8 ( 2 ) : 117-122, 1957. CHOMSKY, Noam - Logical structures in language. American Documentation, 3 ( 4 ) : 284-91, 1957. C H R I S T E N S E N , N. E. - Sobre la naturaleza del significado. Barcelona, Editorial Labor, 1968. 228 p. C L O U Z O T , O. La mthode d'analyse smantique d'un contenu. Enseignement Programm, 6: 21-32, 1962. LA C O M M U N I C A T I O N les images, les sons, les signes, thories et techniques, de N. Wiener et C. Shannon a M. McLuhan. Sous la direction d'Abraham Moles. Paris, Centre d'Etude et de Promotion de la Lecture, 1971. 575 p. COYAUD, Maurice Intmduction l'tude des langages documentaires. Paris, C. Klincksieck, 1966. 148 p. Linguistique et documentation; les articulations logiques du discours. Paris, Larousse, 1972. 171 p. - & S I O T - D E C A U V I L L E , Nelly L'analyse automatique des documents. Paris, Mouton, 1967. 147. p. CROS, R. - C ; GARDIN, J. - C ; L E V Y , F L'automatisation des recherches documentaires; un modle gnerai "LE SYNTOL". Paris, Gauthier-Villars, 1968. 260 p. D E L A V E N A Y , Emile La machine traduire. Paris, Presses Universitaires de France, 1959.

28

DIAZ TE JE RA, Alberto - Puntos de contacte entre Sintaxis y Semntica. Revista Espahola de Lingstica, 1 ( 2 ) : 361-370, 1971. D O B R O W O L S K I , Z. - tudes sur les constructions des systmes de classification. Paris, Gauthier-Villars; Warsawa, P W N , 1969, 303 p. D O Y L E , Lauren B. Semantic road maps for literature searchers. In: S A R A C E V I C , Tefko, ed. Introduction to Information Science, New York, Bowker, 1970. p. 223-39. D U C R O T , O. Presupposes et sous entendus. Langue Franaise, 4: 44-66, 1965. E D M U N D S O N , H. P. - Mathematical models in linguistics and language processing. In: B O R K O , Harold, ed. -Automated language processing. New York, Wiley, p. 33-96. E L I A , Silvio Orientaes da Lingstica moderna. Rio de Janeiro, Acadmica, 1955. 244 p. F A I R T H O R N E , Robert A. - Content analysis, specification and control. Annual Review of Information Science and Technology, 4: 73-109, 1969. The patterns of retrieval. American Documentation, 7 ( 2 ) : 65-70, 1956. Toward information retrieval. London, Butterworths, 1961. 211 p. F A R R A D A N E , J. Concept organization for information retrieval. Information Storage and Retrieval, 3 ( 4 ) : 297-314, 1967. F E R R A T E R MORA, Jos - Indagaciones sobre el lenguaje. Madrid, Alianza Editorial, 1970. 223 p. F I D Manuel pratique de reproduction documentaire et de slection. Paris, Gauthier-Villars, 1964. 314 p. F O D O R , Janet Dean Formal linguistics and formal logic. In: L Y O N S , John, ed. New horizons in linguistics. Harmondsworth, Penguin books, 1971. p. 198-214. F O S K E T T , A. C. The subject approach to information. 2. ed. London, Clive Bingley, 1971. 429 p.

29

17

30

18

31

32

19

20

33

21

34

22

35

36

23

37

24

38

25

39

26

40

27

41

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

214

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

42

F O S K E T T , D. J. - Classification and indexing in the social sciences. Aslib Proceedings, 2 2 ( 3 ) : 90-101, 1970. F R A N O I S , Frederic Caractres gnraux de langage. In: LE L A N G A G E . Encyclopdie de la Pliade. Paris, Gallimard, 1968. p. 20-45. G A R D I N , Jean-Claude lments d'un modle pour la description des lexiques documentaires. Bulletin des Bibliothques de France, 1 1 ( 5 ) : 171-82, 1966. GARVIN, Paul L. - Computing natural language and natural language in computing. In: S E M I N A R on computational linguistics. Washington, Govt. Printing office, 1968. p. 74-83. An informal survey of modern linguistics. American Documentation, l l ( 4 ) : 291-8, 1965. G R A N G E R , Gilles-Gaston - Pense formelle et sciences de l'homme. Paris, Aubier - Montaigne, 1967. 226 p. G R E E N B E R G , Joseph H. - Language universais. In: S E M I N A R on computational linguistics. Washington, Govt. Printing Office, 1968. p. 84-90. G R O L I E R , Eric de - tude sur les catgories gnrales applicables aux classifications et codifications documentaires. Paris, U N E S C O , 1962. p. 262. Quelques travaux rcents en matire de classification encyclopdiques. Bulletin des Bibliothques de France, 1 5 ( 3 ) : 99-126, 1970. Synoptic critique. Information Storage and Retrieval, 3 ( 4 ) : 385-57, 1967. G R O S S , Maurice - On the equivalence of models of language use in the fields of mechanical translation and information retrieval. In: S A R A C E V I C , Tefko, ed. Introduction to information science. New York, Bowker, 1970. p. 210-8. G U I R A U D , Pierre - Langage et thorie de l a communication. In: L E L A N G A G E Encyclopdie de la Pliada. Paris, Gallimar, 1968. p. 145-67. H E G E R , Klaus - L'analyse smantique du signe linguistique. Langue Franaise, 4: 44-66, 1969.

55 56

KATZ, Jerrold J. La philosophie du langage. Paris, Payot, 1971. 269 p. K E L L O G , Charles H. Designing artificial languages for information storage and retrieval. In: B O R K O , Harold, ed. Automated language processing. New York, Wiley, 1967. p. 325-67. K E R V E G A N T , D - Classification et analyse des relations. Bulletin des Bibliothques de France, 4 ( 1 1 ) : 495-511, 1959. KUNO, Susumu Automatic syntatic analysis. In: S E M I N A R on computational linguistics. Washington, Govt. Printing Office, 1968, p. 19-41. L A N D R Y , Bertrand C. & R U S H , James E. Toward a theory of indexing. I I . American Documentation, 2 1 ( 5 ) : 358-67, 1970. L A N G A C K E R , Ronald W. A linguagem e sua estrutura; alguns conceitos lingsticos fundamentais. Petrpolis, Vozes, 1972. 262 p. L E V Y , Francis On the relative nature of relational factors in classification. Information Storage and Retrieval, 3 ( 4 ) : 315-29, 1967. L L O R A C H , Emilio Alarcos Les reprsentations graphiques du langage. In: LE L A N G A G E . Encyclopdie de la Pliade. Paris, Gallimard, 1968, p. 513-67. L O G I Q U E et connaissance scientifique Encyclopdie de la Pliade. Paris, Gallimard, 1967. 1345 p. L U C E N A , Carlos Jos Pereira de Introduo s estruturas da informao. Rio de Janeiro, Ao Livro Tcnico, 1970. 86 p. MANLY, Ron Detailed discussion of BarHillel's "Theoretical aspects of the mechanization of literature searching". American Documentation, 1 5 ( 2 ) : 126-31, 1964. M A T O S O CMARA Jr. J. - Dicionrio de filosofia e gramtica referente lngua portuguesa. 3. ed. Rio de Janeiro, Lozon, 1968. 383 p. M E E T H A M , Roger Informatique et documentation; le traitement automatique de Tinformation. Paris, Larousse, 1969. p. 192

43

44

57

58

45

59

46

60

47

48

61

49

62

50

63

64 51

52

65

66 53

67

54

Ci, Inf., Rio de Janeiro, 2(2): 175-217, 1973

215

MANOEL ADOLPHO WANDERLEY

68

M E L T O N , Jessica A use for the techniques of structural linguistics in documentation research. Cleveland, Western Reserve University, 1964. 20 f. M O N T G O M E R Y , Christine A - Automated language processing. Annual Review of Information Science and Technology, 4: 145-174, 1969. Linguistics and information science. Journal of the American Society for Information Science, 2 3 ( 3 ) : 195-21, 1972. MOSS, R. Minimum vocabularies in information indexing. In: S A R A C E V I C , Tefko, ed. Introduction to information science. New York, Bowker, 1970. p. 254-63 MOUNIN, Georges - Clefs pour la linguistique. Paris, Seghers, 1968. 189 p. M O Y N E , J. A. - Information retrieval language. ASIS Proceedings 6: 259-63, 1969. O L S H E W S K Y , Thomas M. - Problems of the philosophy of language. New York, Holt, 1969. 774 p. PAGES, Robert Relational aspects of conceptualization in message analysis. Information Storage and Retrieval, 3 ( 4 ) : 351-75, 1967. P E R R E A U L T , Jean M. - Documentary relevance and structural hierarchy. American Documentation, 1 7 ( 3 ) : 136-9, 1966. On the articulation of surrogates: an attempt at an epistemological foundation. Information Storage and Retrieval, 3 ( 4 ) ; 177-92, 1967.

82

P O S T A L , Paul M. - The method of universal grammar. In: G A R V I N , Paul L., ed. Method and theory in linguistic. The Staque, Monton, 1970. p. 113-31. P O T T I E R , Bernard Hacia una semntica moderna. In: Lingstica moderna y filologia hispnica. Madrid, Gredos, 1970. p. 99-133. P R I E T O , Louis J. - Le smiologie. In: LE L A N G A G E . Encyclopdie de la Pliade. Paris, Gallimard, 1968. p. 93-125. Q U E N E A U Raymond Prsentation de l'Encyclopdie de la Pliade. Paris, Gallimard, 1956. 62 p. RANGANATHAN, S. R. - Philosophy of library classification. Copenhagen, Ejnar Munksgaard, 1951. p. 133. R E I C H E N B A C H , Hans - Elements of symbolic logic. New York, MacMillan, 1947. p. 444. R E Y , Alain Remarques smantiques. Langue Franaise, 4: 44-66, 1965. R O D N , Eulalia Categorizacin, categoria, realizacin. Revista Espaola de Lingstica, 2 ( 2 ) : 389-406, 1972. S A L T O N , Gerard Automated language processing. Annual Review of Information Science and Technology, 3: 169-192. 1968. Automatic processing of foreign language documents. Journal of the American Society for Information Science, 2 1 ( 3 ) : 187-94, 1970. S C H U L T Z , Louise Language and the computer. In: Borko, Harold, ed. Automated language processing. New York, Wiley, 1967. p. 11-31. S E R V A N - S C H R E I B E R, Jean-Louis - Le pouvoir d'informer. Paris, R. Laffontt. 1972. p. 510. S H R E I D E R , Y. A. - On the semantic characteristics of information, In: SARAC E V I C , Tefko, ed. Introduction to information Science. New York, Bowker, 1970. S I M M O N S . Robert F. - Natural language question answering systems: 1969. In: S A R A C E V I C , Tefko, ed: Introduction to information science. New York, Bowker, 1970. p. 467-84.

69

83

70

84

85

71

86

72

87

73

88

74

89

75

90

76

91

92

78

Perry, James W. & K E N T , Allen - Tools for machine, literature searching; semantic code dictionary, equipment, procedures. New York, Intercience, 1958. 972 p. P I A G E T , Jean pistmologie des sciences de Thomme. Paris, Gallimard, 1970 380 p. Trait de logique; essai de logistique opratoire. Paris, 1949. 423 p. P I N I L L O S , Jos Luis - La significacin desde el punto de vista psicolgico. Revista Espaola de Lingstica, 1(1)97-117, 1971.

93

79

94

80

81

95

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

216

LINGUAGEM DOCUMENTRIA: ACESSO INFORMAO

96

S O E R G E L , Dagobert Klassifikationssysteme und Thesauri; eine Anleitung zur Herstellung von Klassifikationssysteme und Thesauri im Bereich der Dokumentation. Frankurt, Deutschen Gesellschaft fr Dokumentation, 1969. 224 p. Some remarks on information languages, their analysis and comparison. Information Storage and Retrieval, 3 ( 4 ) : 219-91, 1967. A Universal source thesaurus as classification generator. Journal of the American Society for Information Science, 2 3 ( 5 ) ; 299-305, 1972. T A U L B E E , Orrin E. - Content analysis, specification and control. Annual Review of Information Science and Technology, 3: 105-36, 1968. T A Y L O R , Robert S. - The process of asking questions. American Documentation, 1 3 ( 4 ) : 391-400, 1962. T H O M P S O N , Frederick B. - Man-machine communication. In: S E M I N A R on computational linguistics. Washington, Govt. Printing Office, 1968. p. 57-68. T O D A , Masano & S H U F F O R D Jr., Emir H. Logic of systems: introduction to a formal theory of structure. General Systems Yearbook of the Society for General Systems Research, 10: 3-27, 1965. T R A D U C T I O N automatique et linguistique applique. Choix de communications prsentes la Confrence Internationale sur la Traduction Mcanique et l'Analyse Linguistique Applique. Paris, Presses Universitaires de France, 1964. p. 286. VAN D I J K , Marcel & VAN S L Y P E , Georges Le service de documentation face l'explosion de l'information. Paris, Les ditions d'Organisation; Bruxelles, Les Presses Universitaires, 1969 p. 265. V I C 1s E R Y , Brian C. - Technique of information retrieval. London, Butterworth, 1970. 262 p. W A H L I N , Ejnar Classification systems and their subjects. American Documentation, 1 7 ( 4 ) : 199-205, 1966. W I T T G E N S T E I N , Ludwig. Notebooks. 1914 1916, Harper & Brothers, 1961.

108

ZULL, Carolyn G. On the possible relevance of linguistics to information retrieval. ASIS Proceedings, 5; 285-7, 1968.

NOTAS 1) Para o que se expe em 4. 1, lanamos mo de Landry e Rush que, em sua "teoria geral da indexao" ( 5 9 ) , consideram o "document space" como "an R-set (following Russell's notation, that is, it is a set that contains its own description". Interessante nota sobre o aspecto lgico dessa questo j a havia publicado no I B B D B. Inf. l ( 3 ) : 85-6, maio/jun. 1955, o Prof. Mario Tourasse Teixeira sob o ttulo "A contradio de Russell e a documentao". 2) Porque s eventualmente nos reportamos ao conceito de "recall", designamo-lo, em 4. 5 e em outras passagens, sob a forma corrente de "recuperao", ao invs de o traduzirmos por "revocao", termo proposto pelo Prof. Antonio A. Briquet de Lemos, prefervel por mais adequado e fiel ao sentido do original. 3) Ainda em 4. 5, optamos por "estrutura de pilha" para a expresso "pushdown store" que C. Montgomery ( 7 0 ) emprega a propsito do S M A R T e do Syntactic Analyzer. Valemo-nos da verso usada pelo Prof. Carlos J. F. de Lucena para "pushdown stack" em sua "Introduo s estruturas da informao" ( 6 4 ) , trabalho em que aprofunda estas ltimas quanto "forma em que as mesmas so implementadas na unidade de armazenamento de computadores digitais". 4 ) Sobre a "estrutura intelectual" objeto de 6. 5 consigna o prprio R. Blanch ( 1 2 ) o fato de que "ultrieurement, l'ide de l'hexagone est apparue dans un article de L. Hegenberg, A negao, Revista brasiliana de filosofia, 1957, p. 448-57". SYNOPSIS The specific process of documentary communication is envisaged from the point of view of the relations between language and the universe of graphic records which is the object of documentation. As a sample, several tools for bibliographical research, originated to this purpose, are descibed, attention being paid to the most elaborate of all, the documentary languages. Linguistic implications of content analysis are emphasized, as well as the interpenetrations of the syntatic and semantic levels. These considerations lead to the examination of the logical relations and fundamental categories of natural and documentary languages, and to a brief survey of some basic intellectual structures underlying both.

97

98

99

100

101

102

103

104

105

106

107

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973

217

Composto e Impresso no SERVIO DE PUBLICAES DO IBBD