Você está na página 1de 43

Linguagem Documentária: Acesso à Informação

Aspectos do problema

Manoel Adolpho Wanderley


Biblioteca Nacional
Escola de Biblioteconomia e Documentação
da F E F I E G

SINOPSE

O processo específico da comunicação documentá- lhe responderem às questões, os autores confiaram


ria é encarado do ponto de vista das relações ao nosso zelo e guarda?
entre a Linguagem e o universo da representação Eis algumas das perguntas que seria lícito reduzir
gráfica, objeto da documentação. Descreve-se uma tão só a uma: quais as relações entre a documen-
amostra dos meios de pesquisa bibliográfica tação e a lingüística? Melhor ainda: se ali onde se
criados para tal forma, dos quais as linguagens do- entrosa uma com a outra se situam também as
cumentárias constituem a forma mais elaborada. chamadas "linguagens documentárias", as L D , tudo
Acentuam-se as implicações lingüísticas da análise se cifraria em sondar-lhes a índole e a condição
do conteúdo, destacando-se as interpretações do frente às naturais, bem assim em fixar o papel des-
plano sintático e do semântico. Culminam tais con- tas no gerar aquelas, no servir-lhes de modelo,
siderações no exame das relações lógicas e cate- ou no dispensar-lhes o uso.
gorias fundamentais das linguagens naturais e do- Ora, os conceitos remetem aos conceitos e, para sus-
cumentárias, bem assim na referência sumária a tarmos o ressurgir de questões, é mister cingi-las
algumas estruturas intelectuais básicas subjacentes ao problema no que tenha este de crucial. Mas
a ambas. descobrir onde lhe apertam os sapatos, eis uma
das mais árduas tarefas do filósofo, como observou
107
O - INTRODUÇÃO Wittgenstein, que justamente se comprouve
em sondar os jogos "lingüísticos" a que igualou os
Procede o presente trabalho de surpresa muito à sistemas de comunicação.
feição da de M. Jourdain. Então não teríamos Para os que não são filósofos será mais fácil, por
estado, nós bibliotecários e documentaristas, a fazer vezes, dizer que perguntas não se farão, que ou-
lingüística sem o saber — quase diríamos sem a tras já se têm por respondidas ainda que a título
saber? — a criarmos linguagens que desejamos tão de hipótese de trabalho. Nesse último caso se
significativas quanto a natural? a traduzirmos incluem as referentes ao significado mesmo da co-
em códigos os textos em nossa custódia? a parafra- municação e ao da linguagem natural, da L N .
sear-lhes o conteúdo em resumos sinaléticos ou Demos por tacitamente aceito um conjunto de ca-
informativos, produzindo documentos derivados que racterizações dessa última, que poderíamos sin-
dão acesso aos primários, numa palavra, a comu- tetizar, a partir de G. Mounin, nos traços que a
nicarmos ao leitor mensagens que, no intuito de seguir esboçamos. O que é específico das línguas
naturais não é a comunicação — há para esse co-
Dissertação apresentada ao Instituto Brasileiro de mércio humano meios diferentes com a mesma fun-
Bibliografia e Documentação/Universidade Federal do ção; nem o arbitrário dos seus signos — muitos
Rio de Janeiro para obtenção do grau de Mestre em outros também o são; nem a noção de sistema —
Bibl. oteconomia e Documentação, em 19. 10. 1973. valemo-nos de sistemas, parciais ou não, de sím-
Orientador: Prof. Sylvio Edmundo Elia, Faculdade
de Humanidades Pedro II. bolos não lingüísticos; nem a linearidade da men-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 175


MANOEL ADOLPHO WANDERLEY

sagem - a música e o cinema transcorrem no Assim, dois dentre os autores em que buscamos
tempo; nem tampouco o caráter discreto dos sinais, as mais copiosas e ricas informações — Grolier e
já que a mensagem também se faz pelo ritmo, Coyaud — discrepam, por exemplo, ao apontar o
pelo tom, e assim por diante. primeiro no segundo, a fidelidade a "une linguis-
Próprio das línguas naturais é, em termos de Mar- t i q u e . . . assez dépassée" ou em criticar-lhe, em
tinet, a dupla articulação, ou seja, o fato de que termos de Hjelmslev, preferindo o outro os de Mar-
toda língua falada "articula a realidade" sob duas tinet, a consideração exclusiva da "forma da
formas: em unidades significativas (morfemas) linguagem" com negligencia da sua substância. Mas
e, no interior de cada unidade significativa, em questões semelhantes, de sumo interesse, fugiriam
unidades sonoras mínimas (fonemas)", no dizer quase por definição ao escopo de nosso trabalho,
22
d e D . Fleury. que é antes delimitar uma área de observações e
Devida atenção foi sempre prestada, no fio das pre- circunscrever o espaço de um problema.
sentes cogitações, à distinção entre eixo horizontal, Por outro lado, na ótica da análise dos sistemas,
relativo à combinação sintagmática de duas ou e já que nos cingimos à interface "linguagens do-
mais unidades significativas na cadeia falada, e eixo cumentárias — linguagem natural", não remontamos
vertical, paradigmático, atinente às relações as- às totalidades mais amplas, ao processo de co-
22
sociativas de S a u s s u r e ou sistemáticas de municação como tal, nem sequer, dentro dele, ao
22
22
Hjelmslev, no caso vertente porém, em referên- que, desde J. Moreno, se vem chamando "con-
cia às L D , às "representações indexadas" e à serva cultural" ou, humanisticamente, "memória
organização do "universo dos conhecimentos" que cultural".
lhes são próprias. Não insistiremos, assim, sobre o fascinante tema da
Note-se que, ao nos reportarmos, de modo explícito biblioteca, da enciclopédia ou "documentatriz"
22

ou não, a tais conceitos face às L D , excluímos universal, como o expõe A. Moles, tese em que
qualquer consideração metódica do que nelas cor- ressurge, a nosso ver, em estilo de diagrama, a
responderia diretamente aos grafemas e, indire- metáfora clássica de Ortega Y Gasset, do "biblio-
tamente, aos fonemas, isto é, à segunda articulação. tecário como filtro", mormente, acrescentemos, no
T a l restrição, adotamo-la cônscios embora de seu afã de que se concretize em proveito social, o
quanto possa haver de elucidativo, para o nosso "savoir tout, tout de suite, partout" e na sua missão
tema, no que viria a ser a "comunicação gráfica" de provedor da cultura.
22
das L D , tópico em que se estudassem a escolha Na expressão de Moles, as diferentes línguas é
dos signos e o seu modo de combinação. que funcionariam como "filtros das coisas de
Mais absoluta ainda — "et pour cause" — foi a li- importância" e o "velho sonho da enciclopédia uni-
mitação, dentre as funções lingüísticas de R. J a - versal" viria a realizar-se graças "às memórias
kobson, 53
à função referencial, de tipo cognitivo e mecânicas e às técnicas de análise de conteúdo,
objetivo. aptas a exprimir, em "maquines", a totalidade das
idéias e dos semantemas novos produzidos pelo
Ao contrário, incluímos sem vacilar a semântica, homem a cada instante".
cuja reintegração na lingüística demos por defini-
tivamente assente, até mesmo como pretende Para análise do conteúdo, sim, se voltará a nossa
G. Mounin, "no domínio de uma lingüística estru- atenção. Como não nos move, todavia, o exame
tural de que algo apressadamente a tinham ex- da língua universal, mas antes, ao nível das LD
cluído a priori". que talvez lhe venham preparando o caminho,
as relações com a linguagem e o seu estudo, limi-
Assim quanto à análise do significado mesmo, te-
tar-nos-emos, para tornar explícitas as nossas
mos entre os mais válidos os processos suscetíveis
ordenadas conceptuais, a esquematizar aqui o sen-
de objetivação formal, usados para identificar a
tido da representação e análise de conteúdo que
estrutura interna da unidade significativa mínima,
tomamos por guia. Estas, de acordo com C. Mont-
numa palavra, entre outros, os critérios da teoria 70
71 gomery, que tanta luz lançou sobre a questão
lógica do significado que deriva de IIjelmslev.
em foco, constituem um dos componentes do sis-
Como acentua fortemente, a esse propósito,
tema de informação total, com "input" da "aqui-
S. Elia, "entre logística e lingüística deve existir
íntima colaboração. Na prática uma língua é uma sição" e "output" para a "utilização da informa-
semiótica em que todas as outras semióticas podem ção", via "tratamento dos dados". Os registros ou
ser traduzidas. Não só todas as outras línguas, mas documentos em LN adquiridos pelo sistema, bem
também todas as outras estruturas semióticas assim os pedidos nela gerados pelo usuário, são
imagináveis". traduzidos em alguma linguagem formal, meio de
comunicação entre este e aquele e base para a
Bem sabemos que, sem denunciar, ao dize-lo, algum comunicação no sistema. O diagrama seguinte, da
excesso de controvérsia no cenário lingüístico, autora citada, dispensa qualquer comentário
seria fácil contrapor tal ou qual teoria a tal outra. adicional:

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


176
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

Resta, quanto a sistemas, um esclarecimento: o mé- para as profundas. Delineam-se aí algumas teorias
todo da análise quantitativa, da avaliação, não lingüísticas com base semântica, em especial as
70 70
o adotamos, em princípio, nas presentes considera- de F i l l m o r e e a metateoria de C. Montgomery.
ções. A medida, por exemplo, dos índices de re- Um dos pontos de convergência das linguagens
cuperação ou de pertinência, ou a estimativa de naturais e das documentárias são, nessa altura, os
quaisquer outros parâmetros, julgamo-las estranhas problemas da polissemia, da homonímia, da sino-
a nosso ponto de vista, ao qual subordinamos e nímia e da definição. Ocupamo-nos, cingindo-nos a
reduzimos, também, a faceta computacional e esta- algumas considerações genéricas, das relações ló-
tística, tanto da documentação quanto da lin- gicas e categorias básicas das linguagens naturais,
güística. das conjunções em particular e dos componentes
Para apresentar, por fim, em dois ou três traços, a semânticos. Delimitada a área das conexões entre
marcha da nossa investigação, diremos que o sen- lingüística e lógica formal, e a das estruturas
tido geral que lhe imprimimos foi, no campo da intelectuais, retomamos os mesmos tópicos no que
documentação, o de irmos do significante para o concerne às linguagens documentárias, stricto
significado. Partimos, assim das interpenetrações sensu. Comparam-se, para esse fim, os pontos de
dos domínios da linguagem e do documento, a pro- vista relacionais de diversos sistemas significativos,
pósito do que analisamos o universo da repre- sublinhando-se no que lhes concerne, o aspecto
sentação escrita e a natureza lingüística dos meios lexicográfico, o papel dos "operadores" e alguns
de pesquisa. Voltamos, em seguida, a atenção casos de estruturas triádicas.
para as gradações entre a linguagem natural e as Duas palavras, por fim, quanto aos termos técnicos
linguagens documentárias, em relação às quais e às citações — ou melhor — à forma de exposição.
examinamos a natureza, as classes de símbolos, os Iniciamo-la sob o manto de um Molière por assim
componentes e as tentativas de tipologia. Na dizer "lingüista". Mas nem por isso haveria fugir,
"busca de métodos e modelos" atentamos não só sem boa causa, — e não o fizemos — ao risco de
para a relatividade dos conceitos que lhes têm incorrer num dos preciosismos que o seu riso cas-
sido dados face à linguagem natural, mas também tigou para sempre, o das gírias especializadas
para a concatenação maior ou menor dos descri- avessas ao natural da linguagem.
tores e a formalização decorrente da automação. Não vacilamos, pois, em usar, com moderação, os
Segue-se a análise do conteúdo, como atividade tecnicismos e, até mesmo, eventualmente, a sim-
documentária essencial, o que significa que a sin- bologia matemática. Mais para temer seria, a esse
taxe é propriamente o alvo das cogitações. Após respeito, a conhecida e candente crítica da lógica
discriminarmos o conceito de indexação e de clas- de Bar-Hillel aos formalismos em voga e sem razão
sificação sob esse ângulo, esboçamos um modelo de ser, de que não raro se revestem os estudos
abstrato proposto para as gramáticas em questão, devotados à recuperação da informação.
de que se enumeram alguns tipos. Alcançamos o Todavia é essa mesma trivialidade, que lhe parece
nível do significado, indo das estruturas superficiais logicamente argüível em tantos casos, que nos

Ci. Inf., Rio de Janeiro, 2(2)-. 175-217, 1973 177


MANOEL ADOLPHO WANDERLEY

fez aceitá-la aqui, se os especialistas dela se vale- plo: "o Brasil tri-campeão".
ram para economia de expressão e precisão dos Por fim, e muito especialmente, timbramos em
conceitos. Nem outro motivo nos moveu quanto tornar pública a nossa dívida à Professora Gilda
aos termos que se lhes afigurou oportuno cunhar. Maria Braga, sem cujo espírito crítico e sentido
22
Se um autor fixa, como A. Moles, — e a subs- de exatidão jamais teríamos chegado a proporcio-
tância da proposição que. a seguir, dele daremos nar as nossas possibilidades ao empreendimento
é outro dos pressupostos a que acima aludimos — em que nos lançamos.
para a medida da cultura, tanto individual quanto
coletiva, a fórmula: " C = nº de culturemas x 1 DOCUMENTAÇÃO E LINGÜÍSTICA:
de associações realizadas entre eles", por que, INTERPRETAÇÕES DOS DOMÍNIOS
nesse passo, "descrever" tudo o que o símbolo "pro-
duto" implica, c trocar "culturema" por "elemento Afiguram-se particularmente ricas as relações en-
de conhecimento ou de percepção memorizada tre o documento, como suporte da atividade que
como unidades simples"? lhe explora e difunde o potencial de informação,
No que toca a citações — e voltando urna última e a linguagem, como objeto previlegiado do
vez a Molière que disse "je prends mon bien domínio da ciência que estuda a "vida dos signos
partout oú je le trouve" — exploramo-las sem res- no seio da vida social" (Saussure, 5 3 ) .
trições, já que a natureza das presentes observa- Com efeito, no âmbito do universo bibliográfico
ções beira a da "resenha" ou do "state-of-the-art e da representação escrita das idéias, por inter-
report". Respeitamos as normas em uso, sem médio de códigos lingüísticos — naturais ou arti-
declinar as páginas do item referido, por facilmen- ficiais — usados no decurso da comunicação
te localizáveis em todos os casos. Limitamo-nos, gráfica, como esteio para a análise e indexação
outrossim, a referenciar o autor citante, no caso do conteúdo e o subsequente ciclo das questões-
dc citação. respostas. nesse triplo plano — abstração feita de
Fora de regra ficará a que acrescentamos nesse outras discriminações — é que se dá o processo
ponto, já que nos escapa quem disse algo pare- documentário.
cido com o seguinte: "um bom — ou seria um mau?
— trabalho científico é o mais curto caminho 1. 1 — Universo da representação escrita
entre várias citações". Mas preferimos que, ao nosso,
não se venha a aplicar nenhuma das versões pos- Observe-se, desde logo, que do livro à microforma
síveis, ou para verberá-lo ou para elogiá-lo. mais compacta que a biblioteca coloca na mão
Pelo que houver aqui de positivo, vão os nossos dos leitores, o que prevalece como veículo das
agradecimentos ao Instituto Brasileiro de Biblio- mensagens que ele divulga são textos e registros
grafia e Documentação que, em boa hora, propor- de natureza predominantemente escrita,
cionou esse convívio profissionalmente fecundo, É; bem verdade que à sua custódia se confia, ou-
com tantos especialistas de nomeada no domínio da trossim, o que interessa antes à semiologia lato
Ciência da Informação, inclusive com alguns dos sensu, ou seja, outros códigos em outros suportes
mais representativos que enriquecem a lista de au- físicos — não apenas documentos audiovisuais de
tores citados. toda sorte, mas também, por exemplo, cartões perfu-
A nossa gratidão, pois, ao Professor Silvio Elia, rados ou fitas e discos magnéticos, em que se
cuja solicitude impediu, nesse sentar "entre deux armazenam dados.
chaises" que é a nossa dissertação, onde se apro- Entretanto, o que continua a constituir o núcleo
ximam documentação e lingüística. (3 cairmos de mais relevante do seu acervo, o que a preocupa
todo fora da última. mais genuinamente, fiel, como permanece, à ad-
Também o nosso vivo reconhecimento à Presidente vertência clássica "verba volant, scripta manent",
do I B B D , Senhora Professora Hagar Espanha Go- é a documentação sob forma gráfica. Não con-
mes, c à Diretora da Biblioteca Nacional, Senhora siste a escrita, com efeito, "numa representação
Jannice Monte-Mór. Favoreceu-nos nesse caso, não visual e durável da linguagem que a torna trans-
propriamente o permitirem e como ordenarem portável", como a qualificou C o h e n ( 6 2 ) ?
utilizássemos em proveito de nossas indagações as Em modalidades mais ou menos cotidianas ou
imensas reservas de saber, respectivamente técnico cultas, para grupos mais ou menos restritos, atinen-
e humanístico, das Instituições a que também per- tes a domínios c disciplinas mais ou menos for-
tencemos por tantos elos. Devemo-lhes, antes, em malizados ou especiais, consoante a função social
definitivo, o encorajamento de colegas com quem a que os registros se destinam — em princípio
penamos em nossa primeira incursão no domínio nada se exclui dos repositórios bibliográficos — as
dos "pushdown-stores", sob a orientação do saudoso linguagens neles preservadas aproximam-se, em
Professor James W. Perry, ao destrinçarmos os maior ou menor grau, das naturais, em cuja defi-
segredos lingüísticos — os outros nós os conhecí- nição Cardin ( 2 6 ) as engloba, inclusive suas
amos — do "string" por ele proposto como exem- ramificações apropriadas aos textos científicos.

CL Inf., Rio dc Janeiro, 2(2): 175-217, 1973


173
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

Tanto é verdade que, no dizer de Gleason ( 6 6 ) Mas não se cinge o analista de assunto a essa espé-
constitui a língua oral "a realidade última do que cie, por assim dizer, de amostragem dos conteú-
se lê ou escreve". Dela, o código escrito seria o dos. Vemo-lo, desde que se formaram as primeiras
substitutivo. Aproxima-os, de fato, marcado para- bibliotecas, refinar tal matéria-prima vocabular e
lelismo, capaz - segundo L. Prieto — de alcan- elaborar esquemas cada vez mais afastados da lin-
çar no "Fonematismo" uma tal correspondência guagem natural para indexar ou referenciar a
que para cada fonema de uma teríamos um grafema informação armazenada.
na outra, e vice-versa. Labora-se aí no outro extremo do espectro, na re-
Não surgiria, ademais, em certos casos, uma espé- gião das classificações hierárquicas, tão familiares
cie de paralelismo e substituição dupla entre as ao mundo bibliográfico.
linguagens naturais, as L N , e as documentárias, as Que estas constituem uma linguagem artificial é
L D , às quais aludiremos adiante? S. R. Ranganathan quem o afirma, o criador da
Colon Classification, que abriu amplas perspectivas
1. 2 — Natureza lingüística dos meios de busca à teoria e à técnica documentária. "Classification is
documentários the process of translation of the naine of a specific
subject from a natural language to a classificatory
Por outro lado, para o acesso à massa de noções language".
acumuladas em semelhante processo, sempre lan- Em suma, a culminar no polo representado por tais
çou mão o especialista nele empenhado — do bi- esquemas e pelos "códigos semânticos", e a partir
bliotecário tradicional à sua variante atual, afeita dos precedentemente assinalados, há pois, toda
à informática — de instrumentos, em última análise, uma gradação de "linguagens". Fazem-se explícitas,
igualmente lingüísticos. no seu conjunto, articulação cada vez mais ricas,
No "descriptive continuum" a que se reporta que a crescente formalização no fixar-lhes as des-
F. Jonker ( 3 9 ) como base qualitativa da sua teoria crições, os princípios e os modelos, também torna
"generalizada" da indexação, o espectro desta se mais racionais.
estende dos índices e repertórios multidimensionais Uma ocorrência de cabal, porque deliberada, si-
de palavras-chave às classificações ditas hierár- militude entre as estruturas desses sistemas "arti-
quicas. ficiais" e os da comunicação corrente, ao nível das
Sem dúvida, teríamos, num extremo, elementos palavras do discurso e dos termos do código, for-
extraídos dos próprios textos, de partes suas tidas nece-a o "Semantic Code" de Perry, para a Western
como reveladoras do conteúdo, quando não de Reserve University.
resumos, que, de certa forma, os parafraseiam. Assim, nele corresponde uma noção como "nume-
Tomados dentre os demais termos, porque mais roso" a L Y M N , onde L-MN é o fator semântico"
significativos estatística ou semanticamente, con- — unidade — e Y, a "relação analítica" atributiva.
fere-se-lhes, ou não, estrutura combinatória global, Salta à vista a analogia se, num confronto, usarmos
verbi gratia, a pós-coordenação em moldes sim- para frisá-la, o esquema com que K. Baldinger
plesmente booleanos. Atuam as palavras-chave — mostra o jogo complexo de unidades da palavra
como não raro se chamam — na condição de ín- "apasionado".
dices referentes ao teor de presumível interesse.
Manual ou automaticamente destacados do con- 4 2 3 2 2 4 4 3 2 3 3 4
texto, ao recorrermos a tais segmentos de frases
ou meras palavras isoladas, constituímo-nos, é claro, . . . a-p-a-s-i-o-n-a-d-o... ...L Y M N . . . .
em tributários das linguagens naturais aludidas. 1. 1 1 1 1 1 1 1 1 1 la l a la la
Nada mais espontâneo, a bem pensar, que seme-
lhante expediente. A ele se aparenta a prática, 1 = fonemas (unidade distintiva mínima)
que não é de hoje, de nos valermos de "títulos" 2 = morfemas (unidade significativa mínima, em
para sugerir, em poucas palavras, o que dizem mui- lista fechada)
tas. De hoje, porém, é o explorá-las por permuta- 3 = lexema (idem, em lista aberta)
ção ou "rotativamente" nos computadores, como o 4 = contexto (quadro sintagmático)
fazem os vários programas para geração do K W I C Propomos la para os grafemas.
( P A C T ) ou K W O C e os meios similares de pronta
notificação, com as palavras-chave preservadas 1. 3. — Implicações lingüísticas das operações
ou não, no contexto imediato. documentárias
A naturalidade do intitular — e as deficiências, tam-
bém, de nos atermos às auto-designações dos Também encerram implicações marcadamente lin-
textos — aliam-se, de algum modo, à celeridade e güísticas as operações mesmas ligadas ao arma-
à cega obediência das unidades eletrônicas, numa zenar e ao recuperar das informações. Nos siste-
"chave" cômoda para a comunicação do que encer- mas correspondentes, apreendidos na sua feição
ram os escritos. global, a indexação e a análise do "input" anteci-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 179


MANOEL ADOLPHO WANDERLEY

pam certas "questões" hipotéticas e relações con- the following terms as synonymous: information
ccptuais estabelecidas pelos seus usuários language ( I L ) , information retrieval language, in-
( R . Taylor). formation description language, documentary
Ao ser descrito o assunto dos textos, têm início as language".
transformações documentárias a que se submete,
durante a análise, a forma de representação dos 2. 1 — Natureza e situação das LD
conteúdos, bem assim a dos "pedidos" de informa-
ção, na fase subsequente. Enceta-se, numa pala- Ao se lhes fixar o conceito sob qualquer desses
vra, a sua tradução para os termos da L D , quando nomes, ter-se-ia em mente expressar não só a fi-
não a mera redução do teor dos documentos, nalidade essencial a que visam, a saber, a "descri-
com que se lhes faculta a seleção futura, e isso no ção da informação para a armazenagem, a recu-
grau de pertinência desejado. peração, o processamento e a comunicação", mas
Que há forte afinidade dessas com as transforma- também uma série de funções básicas que as
ções lingüísticas, pelas quais se converte a cons- condicionam ao nível mesmo da prática bibliográ-
truções Canônicas a estrutura das frases formuladas fica.
em LN, provam-no a possibilidade e o fato de Entre elas destaca-se, de acordo com os que lhes
se aplicarem ao tratamento dos textos, para obje- perscrutaram o alcance, como B. Vickery ( 6 8 ) e
tivos documentários, as gramáticas mesmas e os R. C. Cros:
algoritmos da lingüística dita computacional e os a) A capacidade de obter, por ocasião das respos-
instrumentos da chamada tradução automática. tas aos pedidos de informação, um máximo de
Esse tipo de correlações, bem manifestas, por exem- indicações relevantes ou pertinentes e, para tal,
plo, aos autores do S Y N T O L , é que os levou a de coincidência entre as descrições de autoria
perfilhá-las na sua "Syntagmatic Organization Lan- do indexador e as do usuário, numa palavra, a
guage". normalização.
Para o que decorre de semelhante representação b) A economia nos símbolos, a eliminação de re-
documentária, para os extratos, indexações e re- dundâncias, a condensação.
sumos que a integram, atentaremos um pouco mais c) A facilidade de "modular" as questões, típica do
longamente em outros pontos. S Y N T O L , ou seja, a de transformá-las, na fase
Neste, cabe notar tão só, quanto à estratégia da de seleção, generalizando-lhes ou especifican-
busca — fator do êxito nas respostas fornecidas do-lhes a compreensão mediante a organização
como resultado da recuperação da informação — semântica.
como se condicionam, até mesmo nessa etapa final, Tentaremos, pois, em traços amplos, expor-lhes:
os fatores operacionais e os elementos do discurso. — a natureza e a situação em face das L N ;
Assim, as variáveis da estrutura sintática das "ques- — os símbolos de que lançam mão;
tões" se cifram, justamente, como as enumera
— os seus componentes usuais de maior significado;
R. Taylor: no número de termos; no número, tipo
— alguns ensaios com que se procurou discrimi-
e "direção" dos verbos modificadores e conectivos;
nar-lhes os tipos mais acentuados.
no nível de complexidade lógica nas interrelações
Qual a natureza de semelhantes codificações biblio-
entre os termos, e no grau de similitude da "lin-
gráficas, a sua razão de ser e justificativa lógica?
guagem de questão" com a do sistema.
A resposta a esse tipo de interrogações, oferece-a
a própria dinâmica do universo de comunicação a
2 - DA L I N G U A G E M N A T U R A L À L I N G U A - que pertencem. Se o tomarmos como referente ou,
GEM DOCUMENTÁRIA melhor, nele, o conjunto das linguagens naturais,
salta à vista, já o insinuamos, a relatividade das
Nos sistemas de comunicação assim delineados, des- que se qualificam de documentárias.
tacam-se, portanto, entre os componentes neces- Na medida mesma em que estas se afirmam em
sários — não a ponto, porém, de excluir as próprias oposição à riqueza daquelas — e isso, via de regra,
linguagens naturais — os que vêm recebendo, restringindo-lhes, com mira na representação inde-
genericamente, quer a denominação de linguagens xada, o vocabulário ou a gramática, quando não
documentárias ou a de linguagens de indexação ambos — assumem a condição de linguagem arti-
— "index language", como prefere J. Melton — quer ficial, isto é de sistema de signos "deliberada-
a de linguagens descritoras, — "descriptor lan- meate construído, por uma pessoa ou grupo pe-
guage", de B. Vickery ( 6 8 ) ou, ainda, a de codi- queno de pessoas, e num período de tempo com-
ficações documentárias, de E. de Grolier ( 4 9 ) . parativamente curto, para determinado objetivo",
Parece-nos dispensável, para o fim que nos move, segundo C. H. Kellog.
procurar critérios pelos quais se venha a reco-
nhecer sentidos diferentes entre tais designações. Precisão, concisão e adequação ao processamento,
Aplicar-lhes-emos o que decidiu D. Soergel ( 9 7 ) sobretudo ao automático, além do poder inferen-
sobre questão terminológica similar: " W e take cial, eis o que provem em contrapartida. Compete
a quem as projeta, erigir tais qualidades em

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


180
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

parâmetros a serem considerados na sua construção atua como intermediário entre aquele e o desti-
e definição. natário.
É bem de ver que, aí também, no formulá-las e O primeiro é, sob esse ângulo, original. A LD —
descrevê-las, se revela a tendência metodológica 23
C o y a u d o demonstra fartamente em sua tese —
crescente para a formalização, cujas conexões gerais o será em maior ou menor grau e, nisso, ela se
com o domínio das LD consignaremos em outra assemelha às linguagens intermediárias ( L I ) pro-
parte. postas, por vezes, para a tradução automática
Basta-nos mencionar, de passagem, porque incide entre duas línguas naturais.
sobre a caracterização que aqui tentamos, a pro- De menor significado é a distinção devida a J. C.
posta de um modelo, com base na teoria dos con- Gardin ( 2 3 ) entre LD diretas e indiretas ( L D D
juntos, por F. B. Thompson, no "Seminar on com- e L D I ) , diferenciáveis por se reportarem, umas a
putational Linguistics", 1966. documentos originais (objetos ou textos quais-
Conforme o seu ponto de vista, algo paradoxal, "a quer) e as outras, a documentos no segundo grau
natural language N is an unending chain { L } i
ou secundários, isto é, a documentos que descre-
vem, eles próprios os documentos originais.
i e I of more and more discriminating formal lan-
guages". 2. 2. — Símbolos das LD
Dada uma linguagem formal L j há sempre outra
Quanto aos símbolos a que recorrem, as LD dizem
L i + 1 mais discriminativa, e isso ad infinitum, respeito, sobretudo, à comunicação escrita. Apro-
veitam de preferência o código alfabético e o nu-
de tal forma q Eis uma
mérico, ou ambos, mas não lhes é estranho o va-
cadeia, ou seja um subconjunto linearmente or- lerem-se de significantes outros, como o diagrama.
denado de um conjunto parcialmente ordenado, de- Cros fá-las corresponder, no seu Glossaire a "um
finindo-se a linguagem natural como uma cadeia sistema de símbolos utilizados na indexação dos
máxima de linguagens formais. documentos", equivalente esta última, "à análise
A "articulação" do que sabemos sobre um assunto documentária em que se tende a exprimir o con-
particular não é jamais completa: "se se afirma teúdo dos textos mediante "descritores", com ou
de um "corpus" de sentenças de N, que ele está sem indicações sintáticas".
e m L , pode afirmar-se que está também numa
i A acepção dada aos "signos" da LD é via de regra
linguagem mais discriminativa L de X. Para uma
j sensivelmente ampla, já que nela se abarcam
palavra W, de X, embora de sentido específico nas " s y m b o l e s . . . empruntés ou non à une langue na-
sentenças de L i haverá matizes adicionais na turelle, "en clair" ou " c o d e s " . . . etc. ( 4 4 ) . Obser-
segunda, mais discriminativa. ve-se que não obstante essa "hospitalidade" quanto
Do mesmo modo não há propriamente a gramática aos grafemas, a notação é questão crucial para
de N, mas níveis cada vez mais discriminativos a codificação eficaz.
de "gramaticidade".
De modo geral, se não denotam sempre a existên- 2. 3 — Componentes e princípios das LD
cia de modelos explícitos e formais concernentes
ao processo de comunicação em causa, refletem con- Encaradas do ponto de vista não já da sua finali-
tudo, as definições propostas para as linguagens dade, c sim dos componentes que integram num
documentárias, características estruturais e lingüís- dado sistema e área, as LD acusam — são concordes
ticas do tipo das que acabamos de investigar, im- no registrar o fato quase todos os autores citados
plicadas, de fato, no seu conceito e traduzidas por — uma dupla ordem de fatores, suscetíveis, ambas,
termos como "símbolos, descrições, questões, in- de assumirem diversos graus de elaboração e
dexações, léxicos, gramáticas" e similares. articulação ou de ostentarem feição rudimentar, re-
Quem as dissecou detidamente — M. Coyaud ( 2 3 ) dutível o segundo, nas formas mais frustas, à
— considera a LD "instrumento de comunicação quase nulidade:
mediata entre os usuários e os autores do docu- a) um dicionário ou léxico documentário, ou seja,
mento", ou melhor, entre aqueles e os "documen- o conjunto de "signos" ou "descritores" (pala-
talistas (ou bibliotecários)" graças ao qual venham vras naturais, símbolos alfa-numéricos etc. ) con-
os primeiros a obter "nos menores prazos possí- cernentes à representação das informações
veis, os documentos escritos ou não, ou as referên- documentárias, e
24
cias aos documentos que os interessam". b) uma gramática ou sintaxe, ou série de regras
Mediata, esclarece, porque põe em jogo dois códi- para combinar os termos.
gos, e não um só, como a comunicação imediata,
Cabe notar aí, de imediato, em correspondência
em que há transcrição condicionada tão só pela
acentuada com os dois eixos — vertical e horizontal
natureza do canal. Um código (fonte) transfor-
— em que se estruturam quer o pensamento sub-
ma-se organicamente em outro no caso da L D , que
jacente ao discurso, quer este próprio: a organização

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 181


MANOEL ADOLPHO WANDERLEY

paradigmática atinente ao léxico documentário e da comunicação homem-máquina e distingue,


significativa de certas relações semânticas estabele- atinente às " I R languages", isto é, às linguagens de
cidas a priori, segundo Cros; a organização sin- recuperação da informação, os sistemas com base
ta gmática, própria das representações documentá- em dados estruturados, com base lógica e com
rias, "expressão de certas relações lógicas obser- base na cooperação "on line" entre o usuário e a
vadas" entre os elementos. unidade de processamento.
A proporção variável entre o ingrediente léxico e o Também da simulação, pela máquina, das ativida-
sintático decorre da própria diversidade do pano- des do homem no campo da informação, ou me-
rama das classificações e codificações, e Coyaud lhor, dentro deste, do processo em que se realiza
( 2 3 ) que lhes fez, com minúcia, o levantamento, a tradução da LN para a linguagem formal e vice-
vè na possibilidade de significarem-se quase as versa, parte C. Montgomery ( 7 0 ) para quem esta
mesmas coisas com "mais ou menos lexemas e ope- última é um "system of content categorization re-
rações sobre esses lexemas", uma das explicações presented by a subject authority list, or in a more
para o fato. advanced application, a complex system which
Reduzindo a uma espécie de formato único as di- specifies the syntactic and semantic content — e. g:
ferenças nos processos de expressão sintática, some enriehed version of the propositional calculus".
N. Bely formula-lhes a estrutura como ( R a, b)
j , No levantamento que faz de modelos e técnicas na
em que a e b designam dois descritores, R, a exis- lingüística computacional há para assinalar, além
tência de uma relação sintática, e o índice i, uma de algoritmos para a análise morfológica, sistemas
interpretação particular dessa relação, por exem- para a análise sintática, limitados ou globais (full-
plo, "causalidade" — a é agente do evento b; "fina- scale), para a análise semântica, e para a combina-
lidade" — a é o destino de b — etc. Donde, do ção da análise sintática e semântica, onde se
ponto de vista da "gramática", diferentes L D s con- enquadram os destinados ao processamento do tex-
soante os valores de i: to c do ciclo das questões-respostas, bem assim,
os que visam à recuperação de "fatos".
i = 0 linguagens sem sintaxe Todavia é, talvez, mais comum se aterem os auto-
i = l linguagens com relações sintáticas não res no campo, por assim dizer, da lingüística do-
específicas cumentária, a um aspecto preferencial sobre o qual
i = 2, 3 . . . n linguagens cujas ligações sintá- incide a sua tipologia. Contaríamos, assim, num
ticas prevêem 2, 3 . . . n cate- setor, com léxicos especiais, para cuja metodologia
gorias. oferece Gardin um modelo, e no conjunto das
quais quadrariam, dc certa forma os textos clássicos,
2. 4 — Ensaios de tipologia das LD isto é, os grandes sistemas bibliográficos.
No outro setor — no da sintaxe — proliferam os in-
Conviria, ainda, considerar — antes do breve exame, ventários e categorizações de gramáticas, ou dos
na seção seguinte, de alguns métodos dc que se modelos e teorias que se lhes reportam. Eis aí o
valem os especialistas para descrever os códigos em domínio, por excelência, das formalizações, às
apreço — duas ou três tentativas de discrimi- quais teremos oportunidade de retornar em outro
nar-lhes as variedades principais. passo.
Há os que põem cm foco a totalidade dos sistemas,
para distinguir os enciclopédicos dos especializa-
dos, como o fazem Grolier ( 4 9 ) e a taxonomia tra- 3 - EM B U S C A DE MÉTODOS E MODELOS
dicional no mundo bibliográfico. PARA AS LD
Afastada qualquer presunção de exaustividade, se-
ria possível adotar, para a classificação do gênero
de linguagens a que pertencem as documentárias, Com o escopo de firmar o modelo de linguagem
o critério proposto por Coyaud ( 2 3 ) , a saber, a documentária, fixar-lhe as funções e estruturas ou
dosagem, nelas, dos elementos lógicos e lingüísti- descrever-lhe as características há uma profusão de
cos. tentativas e a busca constante de critérios, na li-
Definir-se-iam, assim três categorias de sistemas: teratura especializada.
Que metodologia se esboça nesta, quais as tendên-
a) os lógico-lingüísticos, mais tradicionais, com ou cias aí reinantes, que castas de teorias vêm a pre-
sem relações sintáticas, as quais, se presentes valecer? Eis os tópicos que, muito por alto, nos
se regem, a seu turno, por uma sintaxe livre ou propomos perlustrar, sempre com fito de frisar as
rígida; conexões da Lingüística com a Documentação.
b) os fundados na lógica matemática; Com prévia consideração conviria, contudo, lem-
c) os puramente lingüísticos, para operar no qua- brar algumas correlações acima entrevistas, e refe-
dro das L N . rir sempre o estudo de quaisquer códigos de in-
dexação ao que eqüivaleria, quase, a umas tantas
C. H. Kellog situa-se mais decididamente na área regras triviais para interpretá-los.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


182
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

3. 1 — Distância variável entre as LD e as LN globar este, de um lado, os que derivam da sim-


ples seleção de certos elementos incluídos nos do-
a) Enquanto linguagens intermediárias — "meta- cumentos, e de outro, os provenientes das transfor-
linguagens" para Zinkin ( 2 3 ) — as LD distam mações das noções mais relevantes neles contidas,
desigualmente das LN, isto é, da sua matriz já que os produtos, em ambos os casos, podem con-
e sentido final. sistir, quer em dados isolados, quer em seqüên-
cias de termos concatenados ou em frases, torna-se
Ao tentarmos dar conta das conexões de umas com disponível enfim, ao usuário, uma gama de meios
as outras tornou-se manifesta a acentuada mobi- de busca onde se abarcam, quanto aos primeiros,
lidade, ou melhor, a relatividade dos respectivos índices, como os de permutação e seleções de fra-
conceitos. ses extraídas dos textos, e, em referência às trans-
Constatou-se a passagem contínua dos sistemas em posições, grafos de frases naturais integrais; con-
que sobrelevam elementos não formais, calcados juntos de termos definidos num léxico organizado,
na ordem espontânea, para construções mais e mais com ou sem relações sintáticas; resumo. Veríamos,
artificiais, embora conversíveis no fundo, a estru- nesses últimos, a versão abreviada dos textos, em
turas lingüísticas típicas da comunicação natural. LN ou não, ou ainda, o "telegraph abstract".
"Chassez le naturel, il revient au galop" — ainda No seu Glossaire, Cros define de modo algo pare-
uma vez valeria a velha observação. cido, a respeito da análise documentária: o extrato
Da mesma forma, sob o prisma dos significantes, — mera seleção de palavras ou frases; a indexação
se deparamos com descritores onde o alfabeto feita por meio de descritores, com ou sem indi-
ocorre tal como na escrita corrente, verificamos, cações sintáticas e o resumo, texto abreviado em
igualmente, o destinarem-se as letras a notações LN.
de códigos especiais, ou o aliarem-se, não raro.
aos números e a recursos gráficos vários. Isso quan-
do não meramente substituídas por esses últimos
3. 3 — Formalização das LD e automação
na codificação dos termos.
Quanto à dimensão vertical ou paradigmática, a me- c) O reforço das estruturas lógicas e operacionais
ra lista não estruturada vem a cambiar-se, por é uma função do grau de automação previsto
gradações incessantes, nas hierarquias classificató- para o sistema.
rias e nas relações semânticas complexas, subja-
centes ao discurso usual. A circunstância de apoiar-se ou não, um dado sis-
Assim, também, no tocante ao eixo horizontal, é tema, em aparelhamento automático, pode sig-
força reconhecer-se o recurso a sintaxes docu- nificar a consolidação ou a atenuação no modelo
mentárias apartadas ou aproximadas das que se que o informa, das articulações lógicas, e uma elu-
formulam para as LN. Fala-se no S Y N T O L , por cidação maior ou menor das relações essenciais no
exemplo, em "esquema sintáxico" — representação que concerne ao ingrediente lingüístico.
da estrutura de uma expressão natural sob forma Como observa L. Schultz, atribuir as tarefas de
de um esquema — ou na atribuição de categorias processar a linguagem às máquinas implica em
"quase-gramaticais" às palavras-chave. conhecer aquela a ponto de permitir o "design" dos
Daí a inclusão freqüente, no plano em questão, de processos e a avaliação do processamento.
gramáticas e modelos lingüísticos propostos para E um dos mestres da lingüística computacional,
as LN. P. Garvin ( 4 5 ) ao sugerir uma taxonomia para
os problemas que lhe são essenciais chega a dis-
3. 2 — Coneatenação maior ou menor dos descri- tinções próximas das precedentes ao identificar
tores questões de ordem estatística e de ordem não esta-
tística, diferenciando nessas últimas, dois tipos —
b) Nos produtos da análise documentária, o grau os textuais e não textuais — "textual data — coher-
de concatenação dos descritores varia da au- ent text of some or another or anything else".
sência desta à complexidade da LN. Se é bem verdade o que postula Upenskii (apud
Soergel, 9 7 ) , que "evcrything which can be for-
Quando atentamos para as operações em jogo na malized can be automatic". não é menos verdade
análise do conteúdo ou, se quisermos, na repre- que tudo que é mecanizado deve ser de antemão
sentação indexada, verificamos de pronto, ainda formalizado.
uma vez, a maior on menor preservação dos textos Cônscios, por conseguinte, das flutuações que ma-
e contextos de origem. nifestam, em sua estrutura, os meios disponíveis
Na massa de instrumentos gerados para o acesso para a informação documentária, cujas implicações,
à informação bibliográfica discriminar-se-ia sem- enquanto linguagens, é nosso intuito sondar, e
pre uma dupla vertente bem caracterizada, no que sensíveis ao impacto da automação mas não volta-
concerne à indexação, por Coyaud ( 2 4 ) , ao en- dos para ela, passemos em revista, sob o ponto

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 183


MANOEL ADOLPHO WANDERLEY

de vista do método, o que montaria tão só a uma 3. 5 — Modelo garviniano de J. Melton


amostra de como têm sido tratadas. E o faremos,
como a propósito de sua classificação, reportan- Preocupações metodológicas manifestas constituem
do-nos aos que as encaram na sua realidade global o próprio cerne das sugestões de J. S. Melton, ins-
concreta e, em seguida, aos que se cingiram de piradas num "definitional model of language" do
preferência a esquemas formais ou a modelos e abs- referido Garvin ( 6 8 ) .
trações que lhes dizem respeito. A seu ver. impõe-se tal conceito estrutural porque
apto a definir a linguagem e a discriminá-la como
3. 4 — As categorias fundamentais de Grolier "natural" ou como atinente a outros simbolismos,
inclusive matemáticos ou lógicos. Dando conta da
Se, nalgum momento, tornou-se mais clara a cons- associação da forma ao sentido, vale para o dis-
ciência de que há urna zona crítica de correlações curso oral ou escrito, e não só para identificar-lhes
entre Lingüística e a Documentação, pode-se afian- os elementos discretos, mas também para fazê-lo
çar que quem o marcou foi, após os debates da em termos de relações c não de mera listagem.
Conferência de Dorking, E r i c de Grolier com o seu Acresce, por fim, que satisfaz aos requisitos estri-
trabalho para a U N E S C O , "Étudc sur les catc- tos do processamento no computador.
gories générales applicables aux classifications et O modelo garviniano envolve três conjuntos de ní-
codifications documentaires" ( 4 9 ) . veis: o de estruturação, com o plano fonêmico (ou
O centro de interesse são os códigos, definidos co- grafêmíco) e o morfèmico, onde se identificam as
mo sistemas de "símbolos para representar a in- unidades, os signos da linguagem dotados de
formação e de regras para combiná-los". Deles, a forma e sentido; o da integração, em que estes va-
classificação representa a variedade cujas "pala- lem não por formarem meras cadeias seqüenciais,
vras — conjuntos de símbolos que designam um mas por atuarem como um todo (fused-units); o
conceito, ou semantemas — se acham adstritas a re- da organização, o grupo mais elevado.
lações de ordem entre si". A título dc exemplo, atente-se para um dentre os
F i e l ao título, e com viva sensibilidade aos aspec- que oferece J. Melton com o fito de mostrar como
tos estruturais das linguagens em apreço, — de entram em jogo tais fatores numa L D . Assim, para
que é testemunho a terceira parte dedicada ao es- o documento "A study showing the effects of the
tudo de processos análogos usados nas línguas use of the tape recorder upon individual spelling",
naturais ou artificiais — esmiuça Grolier certas clas- o código facetado no esquema de Tauber e Lilley
sificações documentárias enciclopédicas e as co- ( 6 8 ) seria:
dificações especializadas, do ângulo, sobretudo, das
"categorias gerais". R D E X P L S I T S C M M D L P MVPN M S T R T L D P
Destarte, o que de método ali se esboça com res- MSED T C I T PEAC PEÃO
peito à descrição consiste de um lado, em anali-
sá-las quanto à extensão, tomando-as na sua qua- Nele, a ordem das expressões não é significativa
lidade de universais, ou não, antes de o fazer na como o é na frase inglesa "students learn French"
sua distribuição geográfica; e dc outro, em iden- ou "Franca students learn". A primeira letra deter-
tificar-lhes as relações entre os termos e os pro- mina o tipo da categoria "gramatical", ou seja —
cessos que tendem a construí-las como um todo, e nota a autora — "R está para P" assim como
não como meras enumerações. "P está para R".
De fato, na consideração de sistemas conceptuais Já no "telegraphic abstract" do mesmo título — de
funda os seus trabalhos a própria lexicologia, que reproduzimos apenas trechos — os "inter-
mais e mais estruturalista. fixos", indicados por dois pontos, operam ao nível
Que o documentalista fere ali um ponto crucial da de integração de Garvin, dos "fused-units", e re-
índole lingüística da informação bibliográfica forçam-se as analogias com o conceito gramatical de
não há necessidade de sublinhar. As relações entre concordância: o "indicador de função" de ordem
os termos de uma LD — no plano sintagmático inferior (. ) concorda "gramaticalmente" com o de
como no paradigmático — eis a área mesma em ordem superior ( . . ) .
que se imbricam as facetas léxicas e sintáticas, .. K E J , experimental group, control group, student,
para não falar na lógica e na semântica, da comu-
. K I S , intermediate, g r a d e , . . K E C , spelling,
nicação.
. K Q J . textbook, lecture, d e m o n s t r a t i o n . . KAM,
Embora com a prudência de evitar qualquer cate- t e s t i n g , . K Q J , Calif A t . . KAP, experimental
gorização prematura, são copiosas as suas obser- group, spelling, a c h i e v e m e n t , . . KUP, student,
vações sobre os pressupostos das codificações cor- teacher, attitude.
rentes no universo documentário e valiosa a sua Nota: "English words uncoded"
crítica do modo por que se interrelacionam com as
Em suma, realizado ou não, o modelo em questão
linguagens em geral, haja vista os comentários
— não pudemos apurá-lo — afigura-se-nos, no
nas notas ao fim da obra.
entanto, rico de sugestões, como o reconhece a pró-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


184
LINGUAGEM DOCUMENTARIA: ACESSO A INFORMAÇÃO

pria crítica algo rigorosa de Grolier ( 5 0 ) T h i s ": " indica, na C D U , "relação geral" não orientada,
sign [Mrs. Meltons paper] will be promising for entre os morfemas, e " + " , a "relação de reunião".
the application of structural linguistics to docu- Se, por um lado, no esquema de Foskett, as nove
mentation". facetas traduzem "relações sintéticas", como A,
"Occupational safety and Health: General"; B, já
3. 6 — Modelo de descrição de Coyaud mencionado, "Industries, special classes of workers";
C, "Sources of Hazards" e assim por diante, por
Empreendimento dos mais sistemáticos levou-o a outro lado, no SYNTOL, a forma geral para as es-
termo, sob forma de descrição lingüística, truturas em exame é:
M. Coyaud ( 2 3 ) na sua tese de doutorado. Adap-
tando terminologia e conceitos de A. Martinet
( 2 3 ) , submeteu a exame um "corpus" correspon-
dente ao domínio das L D , tal como historica-
mente ele se afirmou e expandiu.
Nele, de fato, algumas das grandes classificações
bibliográficas que se sucederam a partir do sé-
culo X I X , figuram ao lado de sistemas que a pes-
quisa vem inovando na área da documentação,
da informática, ou melhor, da recuperação da in-
formação, bem assim da tradução automática e
de outros setores fecundados pelo computador a
serviço da linguagem.
Já que a segunda articulação da linguagem, a dos
significantes, — fonemas ou grafemas — desper- Amostras, enfim, das relações sintáticas, ou seja, das
ta-lhe pouco interesse, concentrou o autor sua aten- que surgem ao deixarmos o plano dos monemas,
ção na primeira, na "face dos significados" são as que apresentamos a seguir, atinentes à com-
( L . Prieto), atendo-se a ela nos "semas" cujas uni- binação das formas mínimas em unidades supe-
dades era seu objetivo identificar, e isso segundo riores.
a ordem crescente em que se estruturam para cada No que diz respeito às palavras, teríamos bem ca-
LD. racterizadas, no código semântico da Western
Como seqüência típica, têm-se, pois, -das menores Reserve University como um conjunto de lexemas
as maiores, os monemas, tanto os lexemas quanto afetados de um caso, B W F L . 5X. N U B T . 001,
os morfemas, e as unidades sintáticas, isto é, a pa- "anti-hemorrágico" e, no tocante a smiagmas, em
lavra, o sintagma — distinto da precedente por SYNTOL, para "ação do hormônio sobre o rim",
razoes práticas — o enunciado e o discurso. "hormônio — > rim".
Partindo, assim da forma mínima, isto é, dos mo- No código de Pagès ( 2 3 ) iw eqüivale a "proprie-
nemas, considera, no que lhes toca: os semante- dade ( w ) do comportamento ( i ) " .
mas, ou melhor, como os designa Coyaud ( 2 3 ) , os A formulação, em SYNTOL, do enunciado com-
"lexemes", a que, por vezes, também se refere, pleto "o vinho ativa o cortex":
obediente à praxe documentária, sob o nome de
termos; os morfemas de que, pela mesma razão,
discrimina sob a denominação de relações, as
analíticas, explícitas e a priori, e as sintéticas, esta-
belecidas a posteriori, entre as unidades do léxico,
no momento da indexação. comportaria, como expansão, o sintagma suplemen-
Espécimes de lexemas seriam, por exemplo: na tar E l E 2
C D U , 491 "línguas indo-européias diversas", em
que 4 é lingüística; no SYNTOL, a forma canônica
de um termo da LN, e, na classificação para o
Bureau International de Travail, de Foskett ( 2 3 ) ,
Bbr "reumáticos, cardíacos, diabéticos, tubercu-
losos", onde B significa "Indústrias".
Quanto aos morfemas, a relação analítica do indi-
De modo geral, do ponto de vista da metodologia
víduo à atividade exprime-a, neste último código,
e da capacidade de penetração nas estruturas
a minúscula b; na C D U , com respeito à classe 4
lingüísticas analisadas, nada existe de comparável
apontada acima, o "ponto de vista genético"
ao trabalho de Coyaud. Podemos afirmá-lo sem
aparece através de 91, ou o "tipológico", de 4 9 4 / 4 9 9 ,
nos opor, contudo, à observação de Grolier ( 5 0 ) :
línguas isolantes e aglutinantes".
"La thèse de Maurice C o y a u d . . . est une utile
Com a função dos morfemas sintéticos, o símbolo
mise au point qui s attache cependant beaucoup

Ci Inf., Rio de Janeiro, 2(2): 175-217, 1973 185


MANOEL ADOLPHO WANDERLEY

plus à la dimension syntagmatique de ces langages e o mundo real, donde resulta, como frisa
qu'à leur dimension paradigmatique". Edmundson, o perene reformulá-los por via também
indutiva.
3. 7 _ Modelos matemáticos em lingüística Os formalismos múltiplos agrupa-os o mencionado
autor em modelos determinísticos, a saber, os
Uma das mais fortes tendências na lingüística em lógicos, analíticos, algébricos, geométricos, e mode-
geral, é por certo, a formalização, isto é, no to- los estocásticos, ou seja, probalísticos e estatísticos.
cante a seus objetos, a representação esteiada numa Desde a lógica das proposições e dos predicados
linguagem formal, a que se alia a construção de (Bar-Hillel, 3 2 ) , da teoria dos conjuntos (Mooers,
modelos, notadamente dos matemáticos. 3 2 ) , das relações (Hillmann, 3 2 ) , das transforma-
Nesse quadrante das ciências humanas, as entidades ções (Chomsky 3 2 ) , ou da álgebra dos semigru-
e processos que lhes constituem o interesse espe- pos, até a álgebra booleana, a topologia, a teoria
cífico podem ser expressos — e o vêm sendo cres- dos grafos (Tesnière 32, L c c e r f 3 2 ) e a probabi-
cente — em termos de teorias lógicas c quantita- lidade lógica (Carnap 32, Bar-Hillel 3 2 ) , toda uma
tivas recrutadas na bateria de meios à disposição, gama de instrumentos matemáticos tem prestado
hoje, do rigor da análise. Axiomas, definições, eventualmente a sua contribuição fecunda.
teoremas, por um lado, modelos determinísticos ou Menos, sem dúvida, do que em teorias gerais, re-
probabilísticos do outro: eis o instrumental que dunda o recurso a tais instrumentos metodológicos
se oferece ao investigador. cm formalizações parciais atinentes ao que Edmund-
As vantagens inegáveis e os inconvenientes even- son denomina entidades lingüísticas. Colima-se,
tuais da adoção de tais métodos, pesou-os E d - no modelo matemático, a representação abstrata de
mundson com a precisão requerida por quem lhes um objeto ou processo da LN ou da L D . Gramá-
sintetiza o espectro amplo e esboça, por assim ticas transformacionais, categoriais, análise de de-
dizer, um modelo do próprio modelo. pendências, sinonímia, informação semântica, in-
A seu favor há a compatibilidade que asseguram dexação documentária — citamos ao acaso — eis al-
com as demais teorias e modelos, o indicarem o guns processos e entidades traduzidos numas ou
tipo de dados e de métodos a serem usados, o per- noutras das citadas linguagens lógicas ou quantita-
mitirem a manipulação das variáveis ou o enfoque tivas.
global, sem contar, o facultarem o recurso às téc- Á guisa de ilustração não apenas dessa ordem de
nicas de processamento eletrônico. modelos, mas do modo por que o citado autor os
Os erros eventuais a que podem conduzir, são, de apresenta, escolheríamos o que R. Fairthorne ( 3 2 )
certa forma, o reverso de suas qualidades: omis- propôs, com base num reticulado, isto é, num sis-
são ou não-pertinència das variáveis, incorreção nas tema parcialmente ordenado ( S ; R) em que cada
relações ou nos valores atribuídos aos parâmetros, par de elementos x e y possui uma interseção x ^ y
inflexibilidade e incoerência, quando não a abusiva e uma reunião x u y. "Quando os elementos x, y . . .
identificação com o mundo real. são interpretados como "entradas" ( h e a d s ) do
Tem-se beneficiado, por conseqüência, o estudo das "Thesaurus" e a relação de ordem parcial como
LD com a incessante dialética — ousamos dizê-lo "menos geral que", expressam-se as relações hie-
— entre os modelos, propostos no plano dedutivo, rárquicas como propriedades dos reticulados":

Reticulado Thesaurus

elemento x
"entrada" do Thesaurus x

relação de ordem relação "menos geral que"


parcial R

interseção x^y
a mais geral das "entradas" que é menos
geral que x e y

reunião xuy a menos geral das "entradas" que é mais


geral que x ou y

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 186


LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

D E S C O N S T R U I R O T E X T O PARA no liberar a mensagem virtual e no fazê-la alcançar


REFERENCIAR O CONTEÜDO o receptor a que se destina?
Antecipa-se a pertinência ao "documento Z para a
Delineado — ao menos como tentativa — o espaço questão A", o que traz consigo, aliás toda a pro-
em que atuam as L D , ressaltadas as feições que blemática do julgamento de valor a que aludimos.
as caracterizam e o esforço envidado para dotar de Dentro desse gerar subprodutos representativos
metodologia adequada a sua formulação e estru- — dessa ação de escrever "( — ) scription", como
turação, voltaremos a atenção dentro das frontei- curiosamente a designa Perreault ( 7 6 ) , — tería-
ras que demarcamos, para determinados compo- mos, na indexação, a representação dos elementos
nentes do sistema de informação — quase diríamos, dos documentos, na classificação, a dos docu-
para convertê-la à escala do mundo moderno e mentos como um todo e do "corpus" como um todo.
inspirando-nos em Servan-Schreiber ( 9 3 ) — do sis- Mais precisamente, no primeiro caso, surgem duas
tema de "superinformação". eventualidades: ou bem o indexador adscreve
Assim, as relações entre a lingüística e a documen- (a-scribes) conceitos aos textos, com base num vo-
tação, põe-nas a nu, de certo modo, a análise do cabulário externo, ou bem descreve-os (ífe-scribes)
conteúdo, a bem conhecida atividade cujo fim é com as palavras que lhes são próprias, extraídas,
"a pesquisa técnica, com mira na descrição obje- pois, do vocabulário interno.
tiva, sistemática e quantitativa, do conteúdo de um
Na classificação, ao contrário, é típica a "hierar-
documento".
quia". Nela, ao menos, com um objetivo último,
4. 1 — Indexação e classificação na análise do con- colima-se a prescrição (prescription) de posições
teúdo dentro de uma organização conceptual sistemá-
tica, bem assim a inscrição (in-scription) dos docu-
Tal operação entrelaça-se, ao que vimos, com a
mentos em semelhantes posições e a das respectivas
recuperação da informação, onde desempenham "indicações de posições" nos documentos.
função capital o indexar e o classificar o teor dos Note-se, todavia, que, para indexar, quando se com-
textos, bem assim o das questões que se lhes re- pila léxico documentário controlado, do tipo do
portam. thesaurus, onde os conceitos, em forma canônica,
Problema crucial, mas que transcende o plano es- se estruturam também por relações de gênero a
tritamente lingüístico é, nessa esfera da comuni- espécie, introduz-se, implicitamente, um esquema
cação, o da "aboutness" a que se refere Fairthorne de classe, não integradas — é verdade — num todo
( 3 4 ) , ou seja, o da "atinência" dos documentos,
único, mas, nem por isso, menos articuladas.
o da natureza daquilo sobre que versam e a pro-
Não obstante, a indexação, via de regra, aparece
pósito de que os solicitam os usuários. O julga-
como a atribuição de um conjunto de identifica-
mento do conteúdo tem por substrato um fundo
ções, etiquetas, palavras-chave, unitermos, descri-
amplo de experiência social e psicológica, mas
tores, ou o que for — aos elementos significativos
apoia-se na evidência dos textos quanto às regras
dos documentos — quando ela não os assinala tão
de linguagem, conceitos, interpretações, classe e
só pelo destaque — tudo com o escopo de asse-
relações.
gurar a identificação do conteúdo e um meio de
Ora, a indexação é segundo o mesmo autor ( 3 4 ) ,
"recuperá-lo" oportunamente.
processo extremamente complexo, "inextricável da
Também para o processo em causa têm sido aven-
classificação — isto é — estrutura" do campo do dis-
tadas formalizações com que se lhe busca acrescer
curso sobre que incide, e da expressão verbal
o rigor, e o dos sistemas que o abarcam. Landry
dessa estrutura.
e Rush julgam, por exemplo, que a "teoria geral da
No entanto, a fim de ordenar o exame que motiva
armazenagem e recuperação da informação" se
o presente trabalho, centraremos, nesta seção,
formularia, com mais justeza, em termos de uma
sobre o primeiro tipo de análise, as nossas obser-
"teoria geral da indexação" e, essa, nos dá teoria
vações, cingindo-nos, na próxima, ao segundo.
Para isso viria a calhar lembrássemos as argutas dos conjuntos.
reflexões de J. Perreault ( 7 6 ) com o fito de formar Redefinem, assim, a coleção ou acervo como um
possível critério para distinguir a indexação de "espaço documental D", um "document space D",
quanto está, antes, na alçada da taxonomia dos união de dois conjuntos: o dos "documentos en-
assuntos. trados" (input documents), D . , e o dos "docu-
i n

A tradução dos registros e materiais escritos numa mentos de análise", D j isto é "o próprio índice,
a n a

representação em linguagem documentária — eis o thesaurus, o analisador sintático e semântico


o que tanto define uma quanto a outra das citadas etc": D = { D U D
í n }
a n a l

modalidades de tratamento bibliográfico. E o Trata-se, como se depreende, de conjunto que con-


criador de um sucedâneo ou substituto (surrogate) tém a sua própria descrição: o índice dos docu-
para o texto, que coisa tenta senão indicar, de mentos da coleção é, também, "um documento e,
antemão, as orientações de cada "item", com mira portanto, um membro do espaço documental".

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 187


MANOEL ADOLPHO WANDERLEY

Os "dados" - quaisquer entidades, digamos, as "pa- pauta, se efetuam a indexação e a classificação au-
lavras" — vão ter ao índice sob forma de L N , tomáticas. H. Borko estuda quatro espécies destas
com fortes relações sintáticas e semânticas que se últimas: estatística, por permutação, por citação e
reduzem, marcadamente, após a indexação. por associação.
A linguagem do índice, a seu turno, consiste do Pressuposto da primeira — a estatística — é que há
conjunto de elementos de vocabulários que surgem, uma relação, constatada por Luhn ( 1 0 5 ) , entre a
não raro, como uma lista ordenada de palavras freqüência com que ocorre determinada palavra
(símbolos), conjunto esse reunido ao de relações de no teor de um documento — salvo, naturalmente,
diferença, de equivalência, do tipo parte/todo, a pertencente a categorias genéricas — e a medida
genéricas e intencionais. em que é um "indicador significativo de um
O modelo atinge, por via de noções e teorias como assunto, e vice-versa" ( 4 1 ) .
a da comunicação, da entropia e outras da mesma Que há, nisso, o risco de excessiva simplificação,
ordem, elevado grau de refinamento, embora o con- eis o que, de imediato, se patenteia. Donde várias
ceito em que culmina — a de que a "função técnicas para acrescer o rigor da indexação, median-
essencial do índice é a representação acurada e te o cômputo de co-ocorrências de termos, porque
completa do documento" — seja, na opinião mesma mais significativas que o das meras palavras isola-
dos autores, altamente intuitivo. das, a seleção, no texto, das "sentenças com a
Não nos deteremos, entretanto, em tais formulações maior concentração de freqüência dos termos e dos
abstratas. Inclinados, como estamos, a prosseguir pares de termos" ( 1 0 5 ) , ou, ainda, o correlacio-
do menos para o mais complexo, ou do discreto namento da freqüência de um termo no texto com
para o unificado, e a seguir o trajeto "palavra — a sua freqüência no uso geral.
conceito — assunto" ( 1 0 4 ) , relegaremos para co- Já tratamos pela rama, em outro ponto, do método
mentário posterior os fatores predominantemente de permutação das palavras, adotado nos índices
semânticos e as relações que eles ensejam. do tipo K W I C e similares.
Em conseqüência, ocupar-nos-íam desde logo, após O da associação, pretendemos retomá-lo, de relance,
o exame sumário de algumas técnicas fundadas sob o prisma da classificação.
em correlações estatísticas, que aproveitam à aná- Quanto à citação, se já foi argumento, ao tempo
lise do conteúdo, os aspectos nitidamente sintá- do "magister dixit", se ela é o próprio pulso e o
ticos. Não é aí que se situa aquela "armature sacrée deleite do pensamento montaigneano, vêmo-la, hoje,
de Ia syntaxe (sujet/prédicat)" a que se refere assumir a condição de instrumento preciso para
Roland Barthes? a análise do conteúdo.
Ainda a esse propósito conviria advertir para o que Em toda uma "ciência das ciências", numa socio-
acarreta, ou exclui, a mediação da máquina. Como logia da pesquisa, num cálculo bibliométrico se
hoje se dá em quase todos os passos da atividade funda o seu valor como indício do que encerram os
bibliográfica, ocorre igualmente, na sorte de textos. Como bem sintetiza G. M. Braga: "as ci-
análise em foco, a par da persistência dos procedi- tações de ordem de série mais alta levariam à de-
mentos "manuais", prevalecentes, sem dúvida, até terminação [de um assunto] e as mais baixas à
o presente, o recurso cada vez mais franco ao pro- das áreas correlatas".
cessamento automático da informação lingüística. Não entra, porém, no quadro da presente exposição,
Dentro desta, com efeito, pode-se delimitar, com voltada antes para os aspectos sistemáticos do
Garvin ( 4 6 ) , ao lado da sub-área da tradução auto- código lingüístico, aprofundar essa faceta da comu-
mática, outra, concernente ao "content processing", nicação humana, embora nos pareça indiscutível
à elaboração mecanizada de resumos e à produ- — para citar uma das autoridades na matéria,
ção de meios de seleção afins. E l a partilharia com Guiraud ( 6 3 ) — "que se deve considerar a estabi-
a precedente a necessidade de rotinas de reconhe- lidade dos signos lingüísticos como uma evidência,
cimento lingüístico que gerem a análise da estru- um fato cuja observação adquiriu doravante o
tura no tocante às "sentenças" do texto submetido caráter constante e universal".
à unidade de processamento.
Se na primeira é de regra o apoio em dicionário 4. 3 — Modelo abstrato e tipos de gramáticas
bilíngüe, na segunda o léxico será monolíngüe
e incluirá, além de código para a gramática, um
A intervenção da máquina na indexação fez sobres-
código semântico capaz de chamar a subrotina
apropriada. sair o papel da análise sintática e da gramática
que esta presume quando o que se tem em vista é
inquirir o conteúdo do discurso através de cuja
4. 2 — Aspectos da indexação e classificação auto- concretização e coerência formal se dá a fluidez da
máticas comunicação.
Se determinar os conceitos que o texto a descrever
Mencionaremos antes, contudo, a existência de uma contém — quer o dos documentos, quer o dos pe-
família de métodos com que, no domínio em didos — interessa a análise semântica, identificar

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


188
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

as relações que ligam tais conceitos no plano da e entre as formais a de se conformarem à simplici-
linguagem é o próprio da análise sintática. O con- dade, à recursividade, isto é o facultarem um
teúdo assim caracterizado, urge "especificá-lo nos conjunto particularmente infinito de condições a
termos do formalismo que constitui a linguagem partir de umas poucas operações lógicas ou arit-
interna do sistema". É o que mostra C. Montgomery méticas, e a "algoritmicidade", a que se deve seja
( 7 0 ) evidenciando, a cada passo, o necessário en- a computação exata, garantida e única.
trosamento entre os dois processos, como já tivemos Dois grandes grupos englobam a multiplicidade de
a oportunidade de assinalar. gramáticas: as formais, fortemente orientadas
Mas não há esquivar-se — nesse setor ainda menos para um modelo, e as descritivas, que o são fran-
do que nos demais — aos requisitos da formali- camente.
zação, razão pela qual M. Gross, por exemplo, busca Formais são as de estados finitos (Hockett, 4 6 ) , de
construir, com referência a L, isto é, à linguagem estrutura da frase (Harris 4 6 ) , de dependência
natural, uma gramática que "enumere ( g e r e ) as (Hays 4 6 ) , as "formacionais", transformacionais
sentenças de L e as reconheça, quando associada (Chomsky 4 6 ) , estratificacionais ( L a m b 4 6 ) . Per-
a uma rotina de reconhecimentos". O resultado, tenceriam às descritivas as tagmêmicas (Elson e
te-lo-emos sob forma de descrição estrutural. O con- Pickett 4 6 ) , as glossemáticas (Hjelmslev 4 6 ) , de
junto finito de palavras (morfemas) de L constitui item-e-arranjo (Trager 4 6 ) e de palavra-paradigma
o léxico V de L e, em V, a operação de concate- (Oettinger 4 6 ) .
nação define o conjunto C ( V ) de "strings" ou
cadeias. 4. 4 — Exemplos de gramáticas
Como modelo abstrato geral postularemos com
Gross: Proliferam, pois, ao que se vê, as gramáticas de que
a) o subconjunto L de C ( V ) é uma linguagem em a resenha de Garvin constitui um levantamento
V: L < G ( V ) até 1965. Estaria fora de qualquer cogitação esmiu-
b) a cadeia S tal que Se L é uma sentença de L; çá-las na sua riqueza e variedade. Mas sem ir além
de um relance sobre o modo como uma delas vem
c) o conjunto finito de regras que caracteriza todas
a operar, verbi gratia, para a recuperação da in-
as sentenças de L e apenas L, é uma gramática
formação, não é descabido reproduzir-se aqui as
de L ;
regras de escrita com que ilustra S. Kuno, valen-
d) duas gramáticas são equivalentes se caracteri- do-se de um exemplo clássico, uma "phrase struc-
zam a mesma linguagem L. ture grammar".
Quais os critérios para avaliá-las? Garvin ( 4 6 ) , se- A partir das regras extraídas da coluna 1, proce-
guindo os passos de C. Montgomery, assinala der-se-ia a derivação descrita na coluna 2. Dentro
entre as qualidades empíricas a "de darem conta da própria cadeia dá-se uma "left-to-right expan-
de todas as sentenças gramaticais e apenas delas", sion":

Coluna 1 Coluna 2

Regra 1 S - > N P VP S

Regra 2 NP -> Det N NP VP


Det N V P

Regra 3 VP - > V NP the N V P

[Regra 4 D e t - > a] the man VP

Regra 5 D e t - > the the man V NP

Regra 6 N — > man the man hit Det N

Regra 7 N —> bali the man hit the N

Regra 8 V - > hit the man hit the bali

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 189


MANOEL ADOLFHO WANDERLEY

Como observa E. Arcaini "a derivação pode ser menos informações que a coluna 1, pois nele não
representada também pelo diagrama, que fornece se precisa a ordem em que se "re-escreve" a cadeia.

Det

A correspondência com o português damo-la a deria regras da forma A —> X, onde X seria, uma
seguir: cadeia de símbolos de Vt apenas. No caso acima,
Vt = the man, bit, ball; Vn = S, NP, VP, Det, N.
S = Sentença Ainda que descartada — tomamos a dizê-lo — qual-
NP = grupo nominal quer veleidade de retratar aqui a incessante evo-
VP = grupo verbal lução de tais gramáticas, bastaria para dar vaga
Det = artigo idéia de como se ampliam com elas as perspectivas
N = nome para a documentação, lembrar com S. Kuno ou
C. Montgomery ( 7 0 ) , o significado, por exemplo,
S. Kuno mostra que se alcança, assim, estrutura da obra extremamente fecunda de Chomsky ( 5 8 ) ,
de todo equivalente à atribuída à frase em apreço e o poder acrescido, por seu intermédio, - que os
pela análise dos "componentes imediatos", ou seja, "transformational parsers", ou melhor, as gramáticas
segundo a notação adotada, ( ( the m a n ) em que se fundam, adquirem em face das de
( Ut ( the ball) ) ) "estrutura de frase".
The II man I hit II the HI ball
Com efeito, a gramática transformacional atribui
tlie man hit the ball
dupla estrutura a cada sentença que venha a gerar:
Quanto a formalizações, acrescente-se apenas a se-
uma profunda — que lhe determina a interpreta-
guinte: uma gramática "sensível ao contexto"
ção semântica — e outra, superficial, sua realização
abarca um conjunto P de regras de "re-escrita do
efetiva e fonética no discurso. Destarte, a estru-
tipo:
tura profunda que corresponde à superficial, ex-
A é membro do vocabulário não terminal Vn, ao pressa pela frase "John is easy to please", é a que
passo que são cadeias de símbolos de VN indica que "John" é objeto de "please", que o
e do vocabulário terminal Vt, podendo <* e ß ser sujeito de "please" é "someone" e que o sujeito de
nulos, não porém "is easy" não é "John", mas " s o m e o n e . . . please
U m a gramática "context-free", independente do John".
contexto, eqüivaleria a isto é, se-
Não se trataria, pois, de
riam nulos; outra, mais restrita ainda, compreen-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 190


LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

válida, também, para "John is eager to please", mas de:

Resolve-se, por esse modo, uma série de ambigüi- métodos de reconhecimento estatístico das frases.
dades, uma vez que a estrutura profunda de Salta à vista o caráter eclético do sistema, construído
"John is eager to please" difere dessa última, em- para assegurar até mesmo o controle dos conceitos
bora as superficiais de uma e outra sejam, como e significações, aspecto que é nosso intuito consi-
se mostrou, iguais. derar adiante.
Um dos seus limites — e isso nos conduz à questão
4. 5 — Um sistema de análise de conteúdo semântica — é o de que o Syntactic Analyzer de
Kuno-Oettinger, nele aplicado, a saber, uma gra-
Como se integram, na prática, os métodos de aná- mática "independente do contexto" e processamen-
lise de conteúdo? Dentre os sistemas de informa- to de cima para baixo com estrutura de pilha ( 6 4 )
ção fartamente descritos na literatura, sobressai, ("pushdown store") tende a produzir múltiplas
como um quase protótipo, o SMART, a que se vin- análises de sentenças antes simples.
cula o nome de G. Salton ( 9 1 ) . Utilizando um
IBM 7097 e um 360 - modelo 6 5 , a sua organi- 5 - DAS E S T R U T U R A S S U P E R F I C I A I S AO
zação destina-se inclusive a avaliar a eficiência NÍVEL SEMÂNTICO
dos vários processos mediante a medida da propor-
ção de material de fato recuperado (recall) e a Ao isolar certos grupos de palavras nos limites da
do material recuperado e pertinente (precision). sentença, a análise sintática não consegue sempre
Para avaliar-se algo do que, em matéria de meios gerar uma interpretação semântica única: fo-
e facilidades, a indexação automática — sem ne- gem-lhe, não raro, as relações mais finas entre os
nhuma análise manual prévia — vem a requerer, componentes das frases e, em particular, entre
note-se que o SMART compreende: dicionário de as frases.
raízes (stems), de afixos (sufixos) nos documentos, Se as gramáticas transformacionais são capazes de
de palavras comuns, a serem suprimidas no verso relacionar proposições como: "Smith wrote the
da indexação, um thesaurus, com que se eliminam report" e "the report was written by Smith", ne-
os sinônimos graças à atribuição de "concept nhuma delas é capaz de relacionar ambas com
numbers", reduzindo-os, pois, a conceitos; arranjo "Smith prepared the report" — relação que é cru-
hierárquico dos termos do Thesaurus, a fim de cial para a ciência da informação, ao que ob-
generalizar, especificar ou correlacionar os concei- serva C. Montgomery ( 7 0 ) .
tos; associação estatística, para o cômputo das Donde a procura de soluções para semelhantes im-
co-ocorrências a que já nos reportamos; métodos passes e a tentativa de chegar efetivamente ao
de análise sintática, destinados a confrontar sen- nível semântico na análise do conteúdo. Há, para
tenças e questões com um dicionário de estruturas registrar, até o presente momento, além do tra-
sintáticas — "Criterion trees" — conferindo-lhes no dicional e preponderante recurso a um vocabulário
caso de igualdade semântica o mesmo número; de indexação dos assuntos, que a léxico grafia e

Ci. Inf., Rio de Janeiro, 2 ( 2 ) ; 175-2r7, 1973 191


MANOEL ADOLPHO WANDERLEY

a prática bibhoteconômica consagraram de longa 5. 1 — Análise de assunto: associação e classificação


data, uma série de experiência e, desde logo, as automática
atinentes à análise por associação, a que já alu-
dimos, ou à classificação automática. Esteia-se a primeira na possibilidade sugerida por
Doyle de representar, derivando-as do texto por
computador, associações entre os termos dos índi-
ces. Dá-se-lhes um formato de diagrama ou mapa,
de que o segmento reproduzido a seguir, com res-
peito à "Literatura psicológica", fornece uma
imagem ( 1 4 ) :

— > co-ocorrência

— alta correlação

— baixa correlação

O usuário explora o mapa até encontrar o "cluster" de Salton ( 9 1 ) , onde se mesclam facilidades de
(conglomerado) de palavras atinentes a seu tópico. ordem sintática a meios específicos de acesso à
Com respeito ao outro processo, também se lança significação e aos conceitos das sentenças. To-
mão, nele, da técnica de co-ocorrência, mas para davia, uma das objeções que C. Montgomery ( 7 0 )
a construção de matrizes de conceitos correlativos. lhe opõe, além da apontada, é a de que sistema
Os "clumps" daí resultantes formam "uma espécie com potencial maior de análise seria imprescindí-
de classificação firmada estritamente na coleção de vel em áreas documentárias mais homogêneas
documentos. " A seguinte mostra de associação
quanto ao assunto, no tocante às quais — "repre-
dada por Foskett ( 4 1 )
sentações do conteúdo e das questões sob forma
"gramática, paradigma, classes gramaticais, de combinações booleanas de termos revelam-se
adjetivos, proposições, frase, indicador de claramente insatisfatórias".
frase, tempo, fim, raiz, sintaxe, diacrítico. "
faria as vezes de uma classe, análoga à convencional, 5. 2 — Teorias lingüísticas com bases semânticas
onde, sem embargo, "faltariam muitos focos" Setor rico de sugestões para a criação de modelos
(nome, verbo, cláusula) simplesmente porque não mais sensíveis aos fatores conceptuais é o da "re-
ocorrem na coleção documentária. cuperação de fatos" e o da produção de respostas
Por valiosas que sejam tais análises estatísticas — a questões em L N , de que Simmons apresentou
e incorporáveis a sistemas mais amplos, onde se clássica resenha. O próprio autor usa o "procedi-
lhes confia função como a do "feedback" — não mento econômico de tomar cada componente tão
parecem proporcionar a almejada descrição do logo se venha a considerá-lo sintaticamente acei-
conteúdo semântico. tável e a testá-lo quanto à boa formação (well-
Já demos, em síntese, configurações do tipo SMART, formedness) semântica".

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


192
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

Por outro k d o vem recrudescendo a atividade le- Já nos reportamos, anteriormente, à nova dimensão
xico-lógica não abandonada, aliás, pelos investi- conferida a essa ordem de investigações ao se
gadores soviéticos que, ao que consta, jamais sa- introduzirem, no modelo da linguagem, estruturas
crificaram a semântica à fonologia e à gramática. ditas superficiais, a par de outras, atinentes à "si-
Passa a teoria lingüística a não concentrar-se apenas tuação conceptual subjacente". R. W. Langacker,
em modelos gramaticais, tão ao sabor da orienta- que assim se exprime, esquematiza tal organização
ção reinante, e conformes à preferência marcante lingüística na figura:
da formulação matemática pela sintaxe.

ESTRUTURA CONCEPTUAL
A
I

Escolha das unidades

Regras sintáticas

ESTRUTURA SUPERFICIAL

Regras fonológicas

V
MANIFESTAÇÃO FONÉTICA

Constata-se não obstante que, ao fascínio da sintaxe, semântica como extralingüística, ou separá-la do
não escapou até mesmo, na sua faceta mais re- componente sintático, se torna tão imperativa que
cente, a investigação Chomskyana, tão fértil indis- D. Varga ( 7 0 ) afirma, sem hesitar: "não erraría-
cutivelmente. mos em representar o processo do entendimento
"A noção de estrutura profunda como nível básico como uma seqüência de transformações semânticas
do componente sintático, não se acha bastante que modificam e interrelacionam blocos semân-
apartada da estrutura idiosincrásica de superfície ticos distintos".
para refletir categorias e relações de fatos univer- Tudo se passa, na verdade, como se houvesse entre
sais", como a argúcia de C. Montgomery ( 7 0 ) os domínios da linguagem comum, da linguagem
acentua. A busca dos universais acusa menos uni- artificial e do pensamento respectivamente da al-
versalidade que era lícito esperar, poderíamos çada da lingüística, da lógica c epistemologia e
da psicologia — a correspondência que O. Clouzot
dizê-lo.
No entanto, a consciência de que não há rejeitar a resume no quadro abaixo:

Linguagem comum Linguagem artificial Pensamento

Palavra Termo Conceito

Frase Proposição Julgamento

193
Ci. Inf., Rio de Janeiro, 2(2)-. 175-217, 1973
MANOEL ADOLPHO WANDERLEY

A área de tensão se situa — percebe-se logo — entre de origem; fim (G — "goal").


o plano conceptual, num extremo, e o das relações
entre os monemas, no outro. Um dos problemas A título de ilustração, teríamos:
capitais é o paralelismo entre os significados e a
organização sintática. a) Harvey quebrou o espelho com um martelo
(A) (O) (I)
5. 3 — Predicado: Formalismo de Fillmore
b) O martelo quebrou o espelho
De interesse para a questão em foco, tem havido (I) (O)
a proposta de sistemas numerosos de processa-
mento do texto, onde a noção de predicado assume c) O espelho quebrou-[se]
o valor privilegiado de núcleo de toda a análise. (O)
Ao contrário do que se admitia na lexicografia tra-
dicional, em que somente as conjunções e os ele- d) Anne deu dinheiro a Claire
mentos semanticamente pobres, denominados por (A) (O) (E)
Pagès de "mots-outils" — palavras-ferramenta—
eram tidos como termos de ligação, deve-se consi- Classificam-se os predicados em termos de "estru-
derar, além do tradicional predicado univalente, turas de casos" (case frames). Assim, para "dar"
com um só argumento, predicados com dois ou notar-se-ia [— A O E j , para "quebrar", [ — ( A )
mais argumentos. "Pedro come pão", ou, "consumo ( 1 ) O ] , expressos os "roles" facultativos pelos pa-
de pão por Pedro", eis uma relação do tipo P (x, t ) . rênteses.
Numa linguagem de informação que visa à suma- Toda uma rede de articulações não propriamente
rização" (langue de résumé), os termos de liga- sintáticas, mas de significados, vem configurar-se
ção da mensagem — o seu tecido conjuntivo, na dessa maneira, tanto mais complexa quanto outros
imagem de Pagès — embora participem da sua níveis de descrição semântica entram em jogo,
substância podem ser representados pelo predicado além da "gramática de casos" e das noções de fun-
apenas, omitindo-se os argumentos. Assim, "con- ção subjacentes.
sumo" viria a satisfazer, em economia, e uma nota-
Com efeito, o próprio Fillmore ( 7 0 ) esmiuçou as
ção optativa seria R. e não do tipo ( x ) como "pre-condições" para o uso apropriado das sen-
pão = x. tenças — as "pressuposições" implícitas em certos
O sistema proposto por Noël, em 1966 — C. Mont- verbos. Assim, cm "julgar", "criticar", "censurar"
gomery ( 7 0 ) toma-o como referência para a sua e similares, os parâmetros da situação de "incor-
"Metateoria" — relaciona as estruturas de superfície reção" (badness) envolvem os de "responsabili-
dos resumos — a "linguagem-objeto" — com as dade".
das "entradas" providas pela classificação — a "me- Por outro lado, Leech ( 7 0 ) definiu relações lógi-
talinguagem". Surgem ali as estruturas profundas co-semântieas, por exemplo, a implicação "dedu-
como instruções ou proposições "relacionais", na tiva" (a inclui c, se a asserção aRb implica a asser-
mesma linha das relações de "função" ( r o l e ) de ção cRb), e a "indutiva", que incide sobre argu-
Fillmore ( 7 0 ) , e das relações sintagmáticas e para- mentos e predicados. "Gosto de frutas" implica,
digmáticas do S Y N T O L , a que já aludimos. "dedutivamente", "gosto de maçãs".
A própria C. Montgomery ( 7 0 ) analisa o formalis-
mo de Fillmore ( 7 0 ) , que lhe parece possuir a 5. 4 — Metateoria de C. Montgomery
"maior força explanatória, bem como o mais ex-
plícito mecanismo para vincular a linguagem Ao integrar essa ordem de elementos na sua "Meta-
formal à LN". Proposição e modalidade estruturam teoria", postula C. Montgomery ( 7 0 ) que tanto
as sentenças, a primeira constituída pelo predi- as relações lógicas quanto as outras podem ser re-
cado e os respectivos argumentos nominais, inclu- presentadas por proposições "relacionais" con-
sive outras orações, a segunda pelo tempo, modo cernentes à estrutura profunda, e requerem tradu-
e negação. ção "em termos de metalinguagem que especi-
O conjunto ordenado de categorias dc "casos" ati- fique um universo particular do discurso, um sub-
nentes à estrutura profunda enfeixa — consoante conjunto de enciclopédia".
a inovação de Fillmore — as noções básicas atinen- É aí que interviriam as classificações documentárias,
tes à "função" e aptas a refletir os julgamentos de grande relevância para a análise de conteúdo
humanos sobre eventos e situações. da linguagem natural e, mais especialmente, do
Eis algumas delas: agente ( A ) , causa — animada — ponto de vista que nos inetressa, para a integração
do evento; instrumento ( I ) , causa eficiente, ins- da teoria lingüística à da ciência da informação.
trumento; paciente (E "experiencer"), quem recebe O que é próprio delas é fornecerem explicitamente
o efeito da ação; objeto ( 0 ) , o conteúdo neutro relações dc classes com que se definam os super-
da experiência; fonte (S - "source"), estado, local conjuntos em face dos subconjuntos e vice-versa.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


194
LINGUAGEM DOCUMENTÁRIA: ACESSO À FORMAÇÃO

Discrepando, não obstante, de Noël ( 7 0 ) , que vê teoria" — e a prática documentária, em especial


em semelhantes classificações, metalinguagens pro- quanto à análise dos assuntos.
priamente ditas, de natureza "pública", elas mes-
5. 5 — Polissemia, Jiomonímia, sinonímia, definição
mas caracterizadas por estruturas superficiais e
profundas, C. Montgomery ( 7 0 ) julga-as antes re- Na área de problemas assim demarcada, algumas
presentações tão somente aproximadas de uma questões, já emergentes em outros pontos das pre-
metalinguagem em "linguagem-objeto", isto é, lin- sentes considerações, parecem encontrar o terreno
guagem natural. Não incluem todos os termos de eleição. Embora sem analisá-las sistemática ou
desta, que inclui, ao contrário, todos os da meta- exaustivamente, não nos esquivaremos a examinar,
linguagem. num relance, suas incidências na esfera, em apreço,
Se algumas "relações semânticas" são expressas na da informação bibliográfica.
chamada "estrutura de superfície" da metalingua- Não fosse essa cautela e nos deteríamos a tentar
gem, e não na da linguagem-objeto, nem toda a expor, a seu respeito, o afã generalizado de cons-
informação relacionai o é, como as pressuposições truir-se um modelo semântico do signo lingüístico.
e os "roles" a que nos referimos. K. Heger, justamente, adota como pedra de toque
Portanto, o que se afigura de maior significação para a sua teoria — nada menos do que meta-me-
para a autora citada, o que têm omitido as inves- talingüística — os problemas da polissemia, da
tigações semânticas é a urgência de fundamentar, homonímia e da sinonímia. E não são outros os
numa classificação documentária, a elaboração tópicos que, após tratarmos da definição e antes
sistemática de metalinguagem apta, pelo fato de de nos alçarmos aos das relações ainda nos resta
especificar um subconjunto particular da "enciclo- perlustrar rapidamente do ângulo das L D .
pédia", a definir as relações lógico-semânticas e a Mostrou-lhes as interconexões a conhecida versão
interpretar as sentenças em L N . trapezoidal do modelo de Heger, mais elaborada
Atingido, como acabamos de fazê-lo, o plano da que a triangular, e resultantes ambas das trans-
semântica, intentamos mostrar como esta, se a mutações da herança famosa de Ogden e Richards
investirmos de suas conexões com a ordem concep- ( 5 4 ) e dos estudos de Baldinger, b e m como de
tual e lógica, vem a fundar e a informar, por outros representantes da onomasiologia de tradição
assim dizer, a teoria — ou se quisermos, a "meta- germânica.

O signema é o signo enquanto unidade da língua. falar do seu parentesco com a definição.
Como é sabido, Pottier designa por sema, o traço Esta apresentará, como um semema, cada um dos
distintivo semântico desde que seja mínimo, e por conceitos, verbi gratia, os de "casa" e "cabana",
semema, o conjunto de semas específicos: com que Baldinger exemplifica a operação intelec-
Sema e Semema. Lembremos o exemplo familiar, tual em apreço:
1 2 3
onde S = "para sentar", S = "com pés", S =
4
"uma pessoa", S = "com encosto". S 1
1
(casa) = ( S + S 1 1
+ S )
1 2 3 4
S = semema de cadeira = S , S , S , S 1 2 3
Estaríamos a ouvir o eco, na lingüística, de noções
também triviais no domínio da classificação bi-
bhoteconômica. Com o próprio Pottier, reconhece- S 2 (cabana) = ( S 2 2
+ S + S ) 2

ríamos tal similitude. Não afirma ele que o se- 1 2 3


mema eqüivale às "diferenças específicas"? Donde
passaríamos às "características" da taxonomia, ao Atente-se, como prova final, para o seguinte esque-
"gênero próximo" e à teoria tradicional da "divisão" ma de Pottier ( 5 ) : "Todo lexema (significante
com suas raízes platônico-aristotélicas, para não mínimo de designação) terá como significado:

Ci. Inf. Rio de Janeiro, 2(2): 175-217, 1973


;
195
MANOEL ADOLPHO WANDERLEY

definição
independente
ou semantema

definição
relativa

Resta acrescentar que o classema vem a ser o con- Se houver um ou vários semas comuns a diferentes
junto de classes conceptuais gerais e o arquissemema sememas parcialmente análogos, ocorre a polis-
o conjunto de semas comuns a vários sememas: semia, como, no exemplo também do lingüista
francês:
20 2 1 2 2

Ou, na curiosa ilustração que lhe dá Pottier: "2 ca- couverture (coberta) S , , S
20 30 3 1

niches + 3 "épagneuls" = 5 cães + 3 gatos = 8 couverture ( c a p a ) S , S , S


animais; 8 animais + 2 homens = 10 seres". Na homonía, enfim, os sememas são de todo inde-
Dá-se a sinonímia quando o "essencial de vários se- pendentes, como os de l í n g u a ( ó r g ã o ) e língua
i 2

memas, pertencentes a outros tantos significados, (termo da lingüística).


é constituído pelo mesmo noema", isto é, "sema in- Num esquema próximo ao que, com tal fim, adota
dependente de uma língua dada, considerado Baldinger, propõe Soergel ( 9 6 ) um exemplo que
como universal semântico", no dizer de Heger. torna evidentes as relações típicas dos sinônimos e
Eis uma sinonímia parcial (inclusão): dos quase-sinônimos.
1 2 3
barco S , S , S
1 2 8 4
navio S , S , S , S

Ci. Inf,, Rio de Janeiro, 2(2): 175-217, 1973


196
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

5. 6 — Polissemia, homonímia, sinonímia, definição ainda, nos "Subject Headings" da Library of


nas LD Congress, para Simplification in Industry: "here are
entered works on the elimination of excess varieties
Vejamos, pois, no universo dos documentos e dos of products and procedures by a manufacturer... "
textos o reflexo dessas equivalências, reduções a Assim também, o "non-descriptor" (n. d. ): "Wing-
elementos mínimos e relações entre termos e/ou fuselage Interference Effects (n. d. )'" vem definido,
significados, ou grupos de tais unidades. no sistema Zator, pela "nota de escopo": "use
Uma vez que, na definição nominal, se fixa a com- "Wings plus "Fusclage plus "Interference", com
preensão da palavra em função da de outras pala- * a indicar os "descriptors" de C. Mooers ( 1 7 ) , que
vras, é força indagar se fugindo, é óbvio, ao círculo cunhou o termo hoje tão generalizado para tor-
"vicioso" clássico — não seria possível reduzir-lhes mento seu. Não temos aí algo como, na LN, a de-
o número. Porque não reconstruir sempre um cabe- finição "introdutória": GN isto é G N , GN ou
1 2 X

çalho — recurso típico na documentação — pela GN , GN é GN ?


2 1 2

coordenação, ou melhor, pós-coordenação dos ter- Tratamos as definições de forma que sc cifrasse ne-
mos que lhe integram o significado, em vez dc las a referência à paráfrase de Coyaud ( 2 4 ) e
usá-lo como unidade no léxico? O mesmo valeria Mattoso Gamara. Imposição dos limites que fixa-
mutatis mutandis para os códigos documentários. mos, eis a razão disso, e não que seja raro o uso
Segundo R. Pages há de fato, uma linguagem na- da paráfrase, para nada dizer da braquilogia e da
tural de termos de definição. Nem julgam dife- abreviatura com fins documentários.
rentemente os originadores do General Inquirer ( 7 5 ) Ao contrário, nos resumos, na condensação, na in-
ao buscarem identificar elementos constantes dexação há transformações parafrásticas a gerarem
"building blocks" — de definições, com vistas a ex- sucedâneos do texto e a resumi-los. Como aponta
primir um conceito como o produto lógico dos Coyaud ( 2 4 ) , "no limite, o número de classifica-
"primitivos" na definição em causa. ção é a definição de um livro, radicalmente abre-
De que forma, quanto a esta, se traduziriam tais viado". O estudo dos critérios de equivalência, das
noções? É que em virtude de sua estrutura supra- interrelações da paráfrase com a sinonímia e a
citada, do tipo P ( x ) , P ( x , y ) , P ( x , y, z) ou polissemia interessaria, pois, não só a semântica
P [ P ( x , y, z ) ] , ou, ainda, sob outra forma, do tipo como tal, se não também a documentação.
xRi yR z, a fragmentação ou partição dos
2 Não caberia dizer dela o que disse Mounin ( 5 ) da
cabeçalhos daria múltiplos subcabeçalhos. Estes, — definição, a saber, que ela é "la vraie voie de
Pagès frisa-o, — embora menos freqüentes que passage entre sémantique et logique"?
aqueles, que os combinam diversamente, poderiam Na medida mesma em que se afirma o caráter ar-
corresponder efetivamente às questões dos usuários tificial da LD — em que ela se dá como construída
se as fizermos variar sistematicamente, "modulan- e se aparta da natural, — a sinonímia é dela ex-
do-as" como diria Gardin ( 2 6 ) . cluída. Não, porém, de todo, quando a forma
R. Moss ( 7 2 ) lembra a asserção de B. Russell: expontânea da comunicação lhe serve de substrato.
"I call a vocabulary a "minimum" one if it contains Demais, se admitirmos que na definição de sino-
no word which is capable of a verbal definition nímia se abarcam a equivalência, o paralelismo ou
in terms of other words of the vocabulary". correspondência ao nível das locuções e frases e das
No que se refere à fixação da linguagem "defini-- combinações de elementos significativos nem sem-
cionai", como a qualifica o pesquisador francês, pre se pode considerá-la descartada a priori.
é força levar-se em conta a LN "veicular", que É o que se reconhecerá a propósito dos sinônimos
prove as "palavras-ferramenta" e as outras, além do extensionais, a cerca dos quais Baldinger lembra
repertório de "geradores", procedentes não só do o dito de Pascal: "il y a des lieux oú il faut appeler
idioma científico geral, mas também do dialecto Paris, Paris, et dautres oú on lappelera capitule
específico de uma disciplina. de la France". Algo similar ocorreria no âmbito da
Para determinar esse componente do sistema de in- LD.
formação, o requisito é a análise sócio-psicológica, Assim Grolier ( 4 9 ) assinala à saciedade, no tocante
lógica, operacional, mas, sobretudo, lingüística do a esquemas como a C D U e outros, a confusão
comportamento típico do processo do documen- possível entre "índices diferentes de sentido muito
tário. próximo", como entre psicologia sexual (159. 9 2 2 1 )
Note-se que, nas L D , a definição traduz-se impli- ou da criança (159. 922. 7) e a expressão dos mes-
citamente por essa opção fundamental dos "ter- mos conceitos pela adição, à Psicologia, da sub-
mos", "descritores", classes" canônicos, a que as divisão "-055 segundo o sexo", ou "-053 segundo
lista dos "Thesauri", esquemas classificatórios, ou a idade".
meios de busca afins, apõem, se necessário, para De modo geral, o expediente clássico para a redu-
definir-lhes a denotação, as "notas de escopo" (scope ção da sinonímia ou "quase-sinonímia" é a remis-
notes, définitions), como por exemplo: Revista são da forma climinável à canônica. Para citar um
(documento) e Revista (espetáculo), ou, melhor exemplo de van Dijk e van Slype, teríamos o

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 197


. MANOEL ADOLPHO WANDERLEY

clássico "ver" ou "use" e UP (usado para) em sunto principal". 10 para "meios utilizados para
realizar o assunto", a indexação do documento em
Revista ver Documento apreço daria "Organização 10" e "Contabilidade 8".
Documento UP Revista Nenhuma confusão, pois, com "Organização 8 e
Contabilidade 10", correspondente ao tópico pro-
As relações entre a sinonímia nominal e a defi- curado.
nição são imediatamente perceptíveis, o que cor- Discriminam-se, desde modo, os vários matizes dos
robora a asserção de Coyaud ( 2 3 ) de que o seu termos. O preço é a multiplicação real dos des-
estudo nas LD é de grande proveito para o critores.
"sémanticien". Mostra-lhe em que contexto, tais ou
tais sinônimos são substituíveis ou não, com mira 6 - O N D E AS E S T R U T U R A S I N T E L E C T U A I S
na classificação que lhes seja adequada e para evi- HABITAM E N T R E AS LINGÜÍSTICAS
denciar a lei de atração sinonímica de Ullmann
(23). , Por vários trajetos, as interrogações que nos mo-
No quadro de análise semântica dos conteúdos do- veram à presente análise, convergiram para um
cumentários é que a polissemia, o seu reconheci- núcleo de relações subjacentes aos textos e que lhes
mento e resolução, se revestem de importância, so- servem de arcabouço. Aí viemos ter reiterada-
bretudo no curso do processamento automático mente, ao sondar determinadas estruturas comuns
dos textos. Qual seria, se não essa, a razão de fre- à linguagem e aos sistemas graças aos quais rea-
qüência com que, por exemplo, a expressão lizam o seu destino os documentos mantidos nessa
"ambiguities" surge na literatura sobre a matéria? "conserve culturelle", a que se refere A. Moles
Como observa N. Bely é operatória a definição que ( 2 2 ) , como a uma das etapas do processo de comu-
propõe, ao qualificar de polissêmico "todo termo nicação.
ou grupo de termos da LN cujo equivalente na LD
Não se insinuam elas na organização paradigmática
é variável". Tanto as palavras quanto os grupos
ou sintagmática, não se lhes deve a trama central
dc palavras daquela podem corresponder quer a
na articulação dos vários níveis dc elementos lin-
um descritor simples, quer a um grupo de descri-
güísticos, não conduz a análise semântica à busca
tores desta. Acentua o autor o caráter condicional
de sua tradução, isto é, o fato de depender de fa- de um "subconjunto da enciclopédia que lhe sirva
tores incorporados a regras em conexão com os de metalinguagem" onde prover-se das categorias
cinco tipos de polissemia que enumera. mais gerais?
Assim "freqüência" seria do tipo 1, isto é, pala- Ocorre naturalmente interrogar se, ao tomá-las por
vras-chaves unívocas, mas polivalentes; "comple- tema de estudo, se atinge um plano extralingüís-
xo", do tipo 2. categorias gramaticais múltiplas, no tico. É um risco a correr-se, de qualquer modo, uma
caso substantivo /adjetivo; "hipocampo", do tipo 3, vez que o caminho da linguagem é um caminho
termo preciso em mais de um domínio; "fibras", dc crista, a referir-se sempre a objetos de que se
do tipo 4, vários sentidos numa mesma área; alheia ao significá-los — . . . "uma rosa é uma rosa
"centro", do tipo 5, descritores obrigatórios. é uma r o s a " . . . e a fundar-se sempre, por outro
Diferentes algoritmos se aplicam a cada caso: aná- lado, em significados e estruturas profundas, algo
lise sintática apenas, análise semântica e sintática, em que não quer perder-se — " . . . as palavras
análise das palavras vizinhas, do contexto de depen- para dizê-lo "deixam de ser um p r o b l e m a . . . "
dência, e assim por diante.
6. 1 — Relações lógicas e conjunções nas LN
Coyaud ( 2 4 ) dá o exemplo de uma regra contextual
no campo da oftalmologia. Se o termo "chamber" Qual, pois, a natureza de tais relações? Grolier ( 5 . 1)
vier precedido de "in vitro", "slored in", "moist"
prefere a definição que lhes deu Lévy, ao identi-
não há retè-lo; nos outros casos "chamber" é parte
ficá-las como conectivos lógicos e ao ver nelas os
anatômica do olho, e traduzível pela forma nor-
elementos da significação capazes de vincular
malizada.
todos os termos de indexação constantes do voca-
Ao nível da lexicografia, por outro lado, a polisse- bulário, ressalvadas as limitações devidas ao sen-
mia virtual é obviada, não raro, por recurso qua- tido dos termos concatenados.
lificado de "sintático" por van Dijk e van Slype e No âmbito das L N , elas constituem — já o dissemos
destinado a evitar as chamadas "falsas combina- — um como tecido conjuntivo responsável pelas
ções". Destas últimas, os citados autores dão como formas combinadas que se estendem do sintagma
ilustração, o apresentar-se um documento sobre lexical até o super-oracional, o parágrafo, o capí-
"organização da contabilidade" como resposta a pe- tulo, toda esta cadeia infinda de símbolos e infor-
dido sobre "contabilidade dos trabalhos de orga- mações a que monta o grande texto do saber
nização". humano.
Se adotarmos a técnica dos "indicadores de fun- Que a sua função tem valor nuclear pressentira-o
ções", no caso os "roles" da E J C , com 8 para "as- esse poeta da intelecção meridiana que foi Valéry.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


198
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

Nos seus "Cahiers" lemos, com efeito, que abre-a o pronome "a". Os anafóricos, os pronomes
"ce qui caractérise le plus le langage, ce ne sont tornariam aberta à esquerda a frase em questão.
pas les substantifs, adjectifs e t c , mais les mots "Pois" ( c a r ) abre à esquerda, "se X então Y" abre
de relation, les si, les que, les or et les d o n e . . . " à direita. As conjunções exprimem, assim, relações
Mas é de observar-se com F. Francois, e com seu entre as unidades do conteúdo em vários níveis.
mestre Martinet ( 4 3 ) , que as relações que são Não esqueçamos, porém, que no caso vertente,
evidenciadas ao atualizar-se o sentido latente dos como, aliás, em todos os planos das formas lingüís-
elementos constitutivos dos enunciados vêm a sê-lo ticas, há o ensejo de se empregarem, uma pela
por três processos: umas poucas marcam, elas pró- outra, duas ou mais unidades. O que ocorre com
prias, suas relações com o resto do enunciado; "voc-: fon —" (semantemes sinônimos, como em
certos monemas têm por função marcar as relações vocal: fônico) ou com "tenho de s a i r : preciso sair"
de outros; a ordem dos termos pode indicar as (locuções sinônimas), segundo os exemplos de
funções. Mattoso Câmara, também se dará com a implicação,
Inclusas em tal quadro teríamos, por um lado, "se se corta o lobo, o gosto é afetado: ação da
próprias para manifestar as relações lógicas entre lobectomia sobre o g o s t o : lobectomia, seus efeitos
as unidades lexemáticas, funetores que agem em sobre o gosto", paráfrases estas, de índole docu-
todos os níveis. Por outro, entre as atinentes ao dis- mentária, propostas por Coyaud ( 2 4 ) a propósito
curso, há as que, em particular, se aplicam neces- das "conjunções".
sariamente, consoante Coyaud ( 2 4 ) , a unidades Para as conjunções, por conseguinte, ou melhor,
iguais ou superiores à frase. para as relações que nelas se traduzem — uma vez
Englobam-se, aí, preposições, certos advérbios, pro- que urge estudá-ks, conjuntamente com as fór-
nomes relativos, conjunções. Estas, ele as toma mulas ou expressões, que lhe servem de paráfrase
numa acepção ampla e as encara como monemas — estabelece ele, desde logo, uma dicotomia, a seu
que, acrescentados às frases completas, lhes fazem ver essencial: as "conjunções" submetidas ao tempo

S erder a independência, tornam-nas abertas e as


gam a um enunciado mínimo situado à esquerda
ou à direita.
e as que não o são. Parece-nos que andou bem
avisado ao excluir a implicação lógica, genuína, da
seguinte asserção que, sem tal, pecaria por falsa:
Vale-se, pois, o autor, que esmiuça algumas com Timplication est co-extensive à la temporalité". A
destaque ("e", " s e . . . então") de critérios lógicos e silhueta provisória das conjunções, não uma teoria
lingüísticos, como o da abertura em questão. geral delas, ei-la a seguir, como a propõe o autor,
"Paulo a trouxe" não é uma frase independente: para sintetizar o seu ponto de vista:

6. 2 — Variedades das relações nas LN seria racional reduzi-las a tipos ou até mesmo a
categorias universais?
Ao acenarmos para as "articukções lógicas" reco- Eis empreendimento em que muitos se têm empe-
nhecemo-lhes de pronto a variedade e a equivalên- nhado. Garvin ( 2 4 ) , por exemplo, fixa dezessete
cia de formas, suscetíveis de se transformarem tipos de predição, entre os quais: "1, statement
uma nas outras. Em face de tal multiplicidade não of concern — "concerns"; 2, of representation —

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 199


MANOEL ADOLPHO WANDERLEY

"represents"; 3, of constituency — " c o n s t i t u t e s " . . . malmente por Carnap ( 1 0 ) ; componentes semânti-


6, of logical basis — "is based on"; 7, of source — cos das significações léxicas.
"comes from /stems f r o m / " . . . "Destarte, a sen- Digno de nota é o incluirem-se, tanto nuns quanto
tença "our own studies were started as part of a nos outros, constantes lógicas como "e", "ou",
plan", mediante a atribuição do tipo 7, geraria "our "não" etc. Assim, a forma dos "postulados" para as
own studies stemmed from a plan". Mostra-se aí, regras "rapaz — sexo masculino" ( b o y implies
na redução à forma canônica, operação de largas m a l e ) , "moça — sexo feminino", e assim por diante,
perspectivas para a documentação automática. viria a ser: "homem - sexo masculino e adulto",
Não caberia, é claro, registrar todas as tentativas "mulher — sexo feminino e adulto", "rapaz ou moça
feitas com objetivo idêntico. No entanto, se o in- — não adulto", "moça — não rapaz", "homem ou
ventariar os tipos parece válido, é lícito perguntar mulher, rapaz ou moça — ( s e r ) humano".
se a busca dos universais também não o é? "Toda A definição do significado em termos dos seus com-
observação sobre qualquer linguagem é, pelo menos ponentes semânticos — exemplificar-se-ia como
parcialmente, um comentário sobre a natureza da segue: "rapaz: animado e humano e do sexo mas-
linguagem como tal", eis como Postal exprime o culino e não adulto"; "moça: animado e humano e
princípio fundamental nessa reformulação, hoje do sexo feminino e não adulto"; "homem: animado
em voga, da gramática dos universais. Chomsky e do sexo masculino e adulto".
não teria também avançado nesse sentido com a O significado de uma palavra é pois "um complexo
reavaliação da de Port-Royal? de componentes semânticos — ou traços, ou indi-
A tal gênero de investigações, como é notório, pren- cadores — postos em conexão por constantes lógi-
de-se o nome de Greenberg ( 2 4 ) que, em 1963, cas".
propunha 45 universais, como este, reproduzido por
Da mesma forma, Bierwisch lança mão de compo-
Coyaud ( 2 4 ) : "Nas frases declarativas com su-
nentes relacionais atinentes a verbos transitivos
jeito e objeto nominal, a ordem dominante é quase
como "hit, meet, love", a verbos com dois objetos
sempre tal que o sujeito precede o objeto. Os
"give, take" ou nomes "relacionais", como "father,
tipos comuns são, pois, VSO, SVO, SOV. "
mother, brother". As entradas lexicais para este úl-
Quase arriscaríamos, de nossa parte, compulsando
timo seriam: "brother: X child of parent of Y
o próprio Greenberg, a afirmar a existência de
and male X". Em "give" o componente simples
"universais de universais". Que outra coisa impli-
"have", isto é, "X have Y", entra a seu turno numa
caria a sua asserção pela qual a tipologia se vin-
combinação de componentes semânticos, passando
cula aos universais: "Sempre que a uma ou mais
"X cause P" a "Z cause (X have Y)", isto é "Z é
classes definíveis numa tipologia faltar exemplifi-
quem produz o estado expresso por P".
eaçao empírica, tal fato é logicamente equivalente
Assim a sentença — ainda uma vez o verificamos
a uma generalização sobre todas as línguas"?
Mas há um tipo de universalidade cujas correlações — esteia a sua representação na estrutura sintática
com a ordem lingüística devem ocupar "logica- de superfície, onde se combinam os significados
mente'' o primeiro plano. E dizemos "logicamente" lexicais da estrutura profunda; segundo as relações
de modo deliberado, porque é de lógica, ou me- sintáticas em jogo ao que observa Bierwisch,
lhor, de suas interrelações com a semântica que se Note-se com ele, pois, que as regras lógicas de
trata. transformação e dedução se aplicam às representa-
ções semânticas, cujos princípios são universais e
Reichenbach figura entre os pioneiros nesse ter- são os de lógica formal.
reno, por ele desbravado o bastante para declarar Donde, formulações, como a seguinte, para "o rapaz
que "a lógica é a análise da linguagem", e que o mata o cão", onde se apõem os mesmos índices
termo "leis lógicas" deveria ser substituído pelo
àqueles componentes referenciais que se reportam
termo "regras da linguagem".
ao mesmo objeto:
Obviamente o domínio mesmo dessa indagação
a) [ [o rapaz] NP, [mata [o cão] N P ] V P ] S
2
vem a constituí-lo a semântica, que visa a dar
b) Humano X e sexo masculino X-i e não adulto
conta do significado dos elementos léxicos, bem 1

Xi e X] causa ( X muda para (não vivo X ) )


assim de como eles se interrelacionam numa "sen- 2 2

tença S da língua L", e isso - acima o indicamos e animado X e cão X .


2 2

- a partir das relações de estrutura profunda, via


de regra não presentes nas estruturas sintáticas 6. 4 — Lingüística e lógica formal
de superfície.
Justamente a vinculação da "estrutura profunda"
com a lógica formal — equivalente, esta, a "uma
6. 3 — Componentes semânticos de Bierwisch linguagem artificial explicitamente concebida e
não raro com fim especial" — perseruta-a, com fi-
Quanto à análise semântica — adverte-o M. Bier¬ nura a penetração, J. Fodor.
wisch — os pressupostos são: postulados de signi- Após mostrar "semelhanças formais" - as deriva-
ficação, ou regras semânticas, introduzidas for- ções sintáticas têm feição de provas lógicas -

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


200
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

destaca a autora, por mais importante, o fato de especial, debruçou-se sobre o problema das estru-
conterem tanto as descrições lingüísticas quanto turas intelectuais, no sentido de identificar-lhes o
os sistemas lógicos, determinadas regras com que que poderíamos chamar o arquétipo universal.
definir um conjunto de cadeias "bem-formadas" Julga o lógico francês que a conjunção e a negação
de símbolos nos seus respectivos vocabulários, e ou- — ao nível da L N , o e e o não — se arraigam em
tras com que assegurar-lhes a interpretação. estratos subjacentes ao próprio plano intelectual e
À pergunta, que é nossa aqui também, sobre o traduzem funções da consciência em geral: "a
haver ou não, na gramática, uma contraparte para consciência poder de adição e de composição, poder
as regras de inferência lógica, responde a autora de aceitação e recusa". Assim, o princípio de con-
com Strawson ( 4 0 ) , para quem explicar a signi- tradição envolve ambos os conceitos: não se pode
ficância, de uma sentença é dizer quais as condições admitir, ao mesmo tempo, uma proposição e a
em que alguém que enuncia faz uma proposição sua negação: . Onde há agrupamento,
verdadeira, bem assim, mostrar as conseqüências há conjunção, até mesmo entre os termos que a dis-
(entailments) da sentença. Como estas podem ser junção relaciona.
infinitas não há enumerá-las, mas sim dotar o com- Quanto à negação, lembra Blanché ( 1 2 ) o que disse
ponente semântico de regras de inferência ou Coirault das díades e tríades. "Antítese (ou opo-
fazer com que sejam geradas de alguma formulação sição), o que faz dois; meio e extremos, o que faz
da sentença. três; tais são os princípios e os ritmos ou se qui-
Do ponto de vista do lógico há, outrossim, o inte- sermos, os fermentos das imagens construtivas de
resse de confiar ao lingüista a tarefa de prover nosso pensamento v e r b a l . . . "
meios para ligar as suas estruturas coerentes com Blanché ( 1 2 ) cita, igualmente, Jespersen, cujos
as estruturas de superfície, aparentemente incoe- exemplos, que constam de "The philosophy of
rentes, da linguagem. O que J. Fodor demonstra grammar", lhe parecem esclarecedores: "branco,
não ser possível, verbi gratia, em certos casos de não branco; possível, impossível", ou seja, pares de
especificação negativa de quantificadores lógicos a contraditórios que formam alternativa; "branco,
serem introduzidos no formato das regras grama- preto; doce, amargo", pares de contrários que ad-
ticais. mitem termo médio; "demonstrado, indeciso,
Curioso é que se supusermos, nessa troca de mé- refutado; anterior, simultâneo, posterior", tríades
todos, que, da lógica, só procederá a unidade de que comportam um meio entre extremos.
critérios, encontraremos na própria autora um des- Mas os conceitos se relacionam aos conceitos, como
mentido, ei-la que afirma que pode o lingüista as palavras às palavras, num sistema global, e para
embaraçar-se quanto à seleção dos vários sistemas tornar explícitas essas estruturas de parentesco,
alternativos que se lhe põem à disposição. Como segundo as quais eles se ordenam — já que nos va-
decidir se dois sistemas lógicos diferem significati- lemos de escalas, espectros, árvores, chaves,
vamente ou se o fazem por uma questão de no- estrelas, como de esquemas intuitivos de natureza
tação? geométrica ou topológica — constrói o autor, a seu
Sem nada dizer do problema crucial de fundarem-se turno, uma "generalização esquematizante".
as representações semânticas numa opção entre Parte do quadrado das proposições opostas, da ló-
sistemas igualmente lógicos que reduziriam os ope- gica tradicional, para considerá-lo como forma
radores uns aos outros, como o Ou ao E e ao Não, frusta de um hexágono, onde cada tríade deriva de
ou E ao Ou e ao Não. A tal ponto que se fala, ao inserção de um novo "posto" na díade anterior
que nota Blanche ( 1 1 ) , em sistema AN (disjunção que substitui.
e negação) para indicar o de Whitehead-Russell Não nos cabe aqui esquadrinhar "essa estrutura
( 1 1 ) , em sistema CN (conjunção e negação) para formal do pensamento em geral", extremamente
o de Lukasiewicz ( 1 1 ) , e assim por diante. rica. Basta lembrar, com Blanché, que "ela põe em
Já antes constatamos que na mesma LN a paráfrase jogo duas ou três operações intelectuais de todo
das conjunções faculta a equivalência de cons- primitivas e elementares", deixando-se analisar ou
truções como "Se não me engano você já veio" como "uma dupla de tríade ou como uma tripla
e "ou eu me engano ou você já veio" díade". Em relação aos "conceitos-cópulas" — igual-
mente, inerência, inclusão — não ilustra o autor
a tríade, mediante um triângulo de contrários
6. 5 — Estruturas intelectuais: tríades de Blanche
Uma díade, perguntamos nós, não seria
A elaboração de um esquema unificador, com raízes tão só > < ? "A introdução da negação contra-
nas operações essenciais ao pensamento, eis um ditória a partir da tríade, engendra a hexade", ou
imperativo se não categórico, pelo menos consoli- seja, observa Blanché ( 1 2 ) , o sistema de seis sím-
dador das categorias. O mesmo Blanche ( 1 2 ) , em bolos à disposição do matemático:

Ci. Inf., Rio. de Janeiro, 2(2): 175-217, 1973 201


MANOEL ADOLPHO WANDERLEY

plícitas ou dispensáveis em face do grau de recu-


peração adotado. Em tal caso, e reduzidos os ter-
mos às raízes, o texto "Give algorithms useful for
numerical solution of ordinary differential equation"
seria, conforme G. Saltan ( 9 1 ) , reduzido a "Give
Algorithm Use Numer Ordin Differenti E q . . . "
Se, ao contrário, indagarmos como se exprimem,
nas LD propriamente ditas, relações do tipo das
traduzidas, nas LN, pelo "e" ou "ou", e por outras
"Instrumento que permite reconhecer, sob as lacu- conjunções — e isso com maior ou menor precisão
nas e distorções do vocabulário, uma estruturação Jógica — obteremos para ilustração, símbolos como
precisa das idéias" — mais perfeito, a nosso ver, " + " e "/", da C D U , correspondentes, grosso modo,
que o "quadrado lógico" de Piaget ( 1 2 ) , que o à operação de reunião. Assim, "622 + 6 6 9 " signi-
autor francês disseca, e como retifica, ao projetá-lo ficaria "Indústrias minerais e metalúrgicas". No en-
sobre o seu esquema — tem o hexágono por domí- tanto, nela, a regra seria, por assim dizer, a
nio o universo dos conceitos, desde as relações fun- "coordenação assindética", já que se recomenda, no
damentais, a que aludimos, aos "conectores biná- próprio sistema, evitar-se o uso de " + " . As entra-
rios", desde as modalidades aos imperativos e va- das separadas tomariam mais rápida a pesquisa.
lores, para não mencionar os atributos e quali-
dades.
6. 7 — 0 ponto de vista relacionai em Pagès
Demais, respeita-se ao usá-lo, a coexistência da or-
ganização dos conceitos por pares contrastados, Por outro lado, as relações podem ser encaradas
dicotomias, bipolaridades, com sua organização em antes do ponto de vista paradigmático. Os mor-
escalas graduadas e estruturas lineares, ambas na femas (ou monemas, ou semantemas) inclusos na
vanguarda da epistemologia e da técnica moderna. parte estritamente léxica do C O D O C apresentam
Haja vista o que sublinha Blanché ( 1 2 ) , o esta- "classificação arborescente" do tipo clássico, embo-
rem ante os nossos olhos, lado a lado, os compu- ra com ramificações breves. Trata-se, na ver-
tadores digitais e os analógicos. dade, de classificação combinatória, segundo Grolier
(49).
6. 6 — Relações e conjunções nas LD Na formulação que Pagès propõe, as letras à di-
reita de a indicam subdivisões do mesmo tipo que
De certa forma essa nervura de relações mais finas a decimalização, donde a relação ex-
e a trama de categorias em que se estruturam os pressa, quer a inclusão estrita, quer outra relação
significados interessa duplamente à documentação. hierárquica com propriedades formais correlatas.
Não opera esta sobre e com a linguagem? e ao Assim, dado a a o valor de "ciência", viria: ab mé-
fazê-lo, não se extrema, por vezes, na criação das todo; ac problema; ad p e s q u i s a . . . am proposi-
L D , a distarem mais ou menos das linguagens ções científicas; com subdivisões, a seu turno,
naturais? para: ame conceptualizado; ami axioma; amo hi-
Os aspectos que tentamos por em foco também são p ó t e s e . . . De A a Z sucedem-se vinte e duas ca-
pertinentes às codificações documentárias. Já men- tegorias de noções, de modo que, em Y, figuram
cionamos, nesta, a "interdefinibilidade" dos termos relações em geral e em Z, negação.
e a liberdade de investir no vocabulário, como Com semelhante análise do processo de concep-
acentua Pagés - portanto, no paradigma, - "as tualização, prevê-se o léxico de algo que faculta,
principais noções em cujo contexto o conceito se mediante a classificação hierárquica, "calibrar",
torna significativo". E é sobretudo por construção "amplificar" ou "modular" a recuperação, de acordo
que o fazemos e pela hierarquização. com a variação das questões, reduzindo-as, por
Às vezes, o serem aptas para tal as L D , pelo que exemplo, de am para "ami", de "proposição" para
nelas eqüivaleria à "flexão" ou à "composição", "axioma".
leva até mesmo a incoerências estruturais. Assim,
As relações sintáticas, em Pagès, abarcam a "união"
no código semântico, como aponta Grolier ( 4 9 ) ,
e a "interseção", da teoria elementar dos conjun-
"isolar" é SAPT. 003; "isolado", SWPT. 003; "isolante"
tos, bem assim a "tematização" e a "subordinação",
(particípio), SU PT. 003; e "isolante" (substantivo),
SÇPT. LWCT. PUTT. 001, o que significa "utilizan- assimétricas e com dois aspectos, a saber, "tema-
do ( Q ) a separação ( S - P T ) , agindo sobre ( W ) a tizado = tratado por", "tematizante = reportan-
eletricidade ( L - C T ) , produzindo ( U ) uma proteção do-se a" e "subordinado/ subordinante". E, já que
( P - T T ) , e assim por diante. i significa "conduta ou processo que se traduz por
efeito comportamental no ser vivo" e a notação
É claro que se não formos além da condensação 5
"tematizado" é, no caso, 5, temos: "ame i" para
documentária e da "codificação telegráfica", as "conceptualização da psicologia".
relações deixam, não raro, de ser expressas, por im- Equipara-se, pois, a marca predicativa 5 aos "ter-

Ci. Inf., Rio de Janeiro, 2(2): 17õ-217, 1973


202
LINGUAGEM DOCUMENTÁRIA: ACESSO A INFORMAÇÃO

mos relacionais", que indicam "classes" do discurso andaime para a análise lógico-semântica da estru-
afins às preposições ou conjunções da L N . A trans- tura das linguagens naturais" e, na LD em apreço,
formação, pela análise codificada C O D O C , de ajudam, particularmente, a segmentar as frases e
um texto natural em linguagem predicativa — já classificar as palavras em predicados, argumentos,
vimos que o texto compreende argumentos e termos lógicos. É o que se infere, quanto às sen-
relações como aR b R c R . . . — traduz-se em re-
1 2 1 tenças "a casa é nova" e "le feu vert indique la
presentações como a dos "estemas" de Tesnière voie libre" (o sinal verde indica a via livre), dos
( 7 5 ) . Fornecem elas, no dizer de Pagès, um "como respectivos diagramas:

Pe predicado do tipo "epíteto" em tais noções, inclusas entre parênteses, a base do


Pa predicado do tipo "atributo" sistema de relações. Apõem-se às palavras-chave
Pro — i como "pro" em pronome, substituto d e . . . esse grupo de elementos puramente relacionais, o
(double) que permite se conceba como a LN se amolda à
análise documentária. "On a besoin du langage,
6. 8 — Das palavras-chave às "frases-chave" em mais pas de tout le langage. Le problème est donc
Braffort e Leroy. de trouver une solution optimale", diz Braffort.
É de observar-se que tal linguagem se compõe, de
Não menos elucidativas se afiguram as observações fato, de umas tantas sublinguagens relativamente
de Braffort e Leroy concernentes à codificação diferentes, em consonância com as subdivisões do
documentária. Os sistemas de classificação impli- pensamento. Na classificação alfa-numérica de
cam "a possibilidade de estabelecer uma hierar- Braffort, o conjunto de índices (cotes) associado a
quia das disciplinas segundo a forma de "árvore", cada "rubrica" representa o vocabulário, consis-
no sentido da teoria dos grafos. tindo a sintaxe nas relações algébricas a que satis-
Ora, as interdisciplinas, as atividades científicas fazem as "cotes". A estrutura é bidimensional, com
"oblíquas", levam à atual transmutação da "árvore cinco colunas intituladas "Fenômenos inter-escala-
de Porfírio" em sistemas de múltiplos entrelaça- res, comunicações", "Escala corpuscular", "nu-
mentos (boucles) — melhor "diríamos" reticulados. clear", "atômica e molecular" e "macroscópica", e
Vejam-se as clássicas observações de Piaget ( 7 9 ) cinco linhas, atinentes respectivamente a "Proble-
sobre a epistemologia, bem assim a síntese de mas teóricos", "Produção de fenômenos", "Medida
Queneau para a "Encyclopédie de la Pléiade". de fenômenos", "Descrição de fenômenos" e
Donde o aparecimento de esquemas não só com "Utilização de fenômenos". A denotaria "Problemas
estruturas algo diversas das classificações tradi- teóricos inter-escalares"; B, "corpusculares"; F,
cionais mas também fundados em palavras-chave, "Produção de fenômenos inter-escalares", e assim
umas e outras a serem denominadas "thesauri" e por diante, omitindo-se o i.
descritores" em termos documentários mais recen- Subentende o sistema "propriedades sintáticas do
tes. "Rubricas" como Ferro(mina de), ferro (nos tipo inflexivo (declinação, conjugação)". Assim,
compostos químicos), dotadas muitas vezes de "propriedades químicas dos elementos" traduzir-se-ia
esclarecimentos, ou seja, das citadas "notas de es- por TABx, em que AB é o símbolo clássico do
copo" com que obviamos as polissemias, oferecem elemento e x um sufixo numérico atinente à prepa-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 203


MANOEL ADOLPHO WANDEKLEY

ração do corpo, seus óxidos etc. Note-se que quando ao diagrama, que para o artigo Tutilisation des
o vocabulário e a sintaxe são ricos — caso do do- réacteurs nucléaires pour les productions des radio-
mínio técnico-científico atual — urge fixá-los acu- éléments artificieis" poderia ter a disposição:
radamente. Mais conveniente seria, então, associá-los

Inventariar a imensa família de classificações e de referência aos quais — assinala-se o fato na tipo-
relações que as estruturam, enquanto organizações logia em questão — há duas correntes, uma tradi-
paradigmáticas, ou enquanto subjacentes às arti- cional, em que não se torne explícita a corres-
culações do discurso, no eixo sintagmático, escapa- pondência entre os termos da LN e da LD, e outra
ria, por muitos ângulos, ao nosso propósito, que é que visa a inventariá-las.
antes a interseção do plano da linguagem com o Por outro lado, é clássica a distinção, endossada
da documentação do que o levantamento exaus- por Gardin, entre classificações unidimensionais
tivo de ambos.
e pluridimensionais, conforme se estruturarem numa
Não há, porém, como omitir duas ou três ilustrações só, ou em mais do que uma dimensão. Por dimen-
e comentários finais a esse respeito, evitada, em- sões de uma organização entende-se a natureza das
bora, qualquer insistência quanto a obras de fato relações analíticas, paradigmáticas, que a consti-
fundamentais para a taxonomia bibliográfica, quais tuem, ou, em outras palavras, da relação dos termos
sejam as de Sayers, Bliss, Ranganathan, Mills e os à classe a que pertencem.
trabalhos que resultaram do "Classification Research Um passo adiante nessa caracterização, e cabe enu-
Group ( C R G ) " . Elas, sob muitos aspectos, pode- merar, entre as unidimensionais, as reais, sistemas
riam ter sido tanto quanto as citadas anteriormente, taxonômicos no estilo dos das ciências naturais,
o ponto de partida de nossa indagação. onde, de fato, uma só relação informa todos os ní-
6. 9 — Modelo de Gardin para os léxicos documen- veis, e as aparentes, em que a multiplicidade se
mentários oculta sob a unidade. As multidimensionais abar-
cam, além das organizações semânticas, que refle-
Entre as últimas, afigura-se-nos de primordial re- tem definições correntes e, em última análise, a
levância para o estudo da lexicografia "documen- ordem natural, as "sintáticas", fundadas não na
tária", em sua oposição à natural, o modelo pro- essência, mas na função das entidades num dado
posto por Gardin, a que já nos reportamos. Os campo de observação — tais são as classificações
conjuntos de termos naturais vêm a ser agrupados de facetas. Há, por fim, classificações mixtas, em
em ordem não-significativa, como a alfabética, e que alternam os pontos de vista essenciais e fun-
teremos glossários, vocabulários especializados e si- cionais, e, entre elas, os esquemas dito analítico-
milares; ou podem ser organizados graças a afini- sintéticos, tais como o concebe Gardin.
dades semântica, e teremos dicionários de sinônimos, No quadro à esquerda, ao qual convertemos o dia-
de idéias afins, thesauri, entre outras formas. O grama de Gardin, tornam-se patentes algumas des-
mesmo ocorre com os "léxicos documentários", em sas relações entre os "léxicos":

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


204
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

inorganizados organizados Relações analíticas


nas L D
listas classificação

glossários
LN Tipo Forma Conteúdo
Thesauri LN
correspondências Unidi-
L N - L D implícitas Thesauri L D 1 relação
A mensio-
/ real/
LD nal
positivas: Uniterm
correspondências
negativas: K W I C classificações 1 relação Pluridi-
L N - L D explícitas B
( contra-dicionário ) aparente mensional
várias Pluridi-
Vocabulários C relações mensional

Quanto às letras do quadro à direita, adaptado de gulação (direito), da disseminação (educação e in-
Coyaud ( 2 4 ) para exemplificar os tipos de "rela- formação), e Zetética, domínio da integração. Aí
ções analíticas" (paradigmáticas) nas L D , há que se acrescentam criatividade artística, filosofia, reli-
acrescentar os comentários respectivos. A concerne gião, ao que hoje se vem definindo como a "ciên-
à inclusão pura "que só ocorre em certas classifi- cia das ciências", ou como a "cientologia" dos so-
cações técnico-científicas, como as anatômicas. viéticos.
Em B, caso geral, é típico o que se dá com sistema Tykociner valeu-se da interseção de vários domínios
de Foskett ( 2 4 ) , por exemplo: o morfema Dnb para simbolizar-lhes as subdivisões: A ( B B )
3 1 3

cràneo" se inclui em "doenças industriais" quando C D , "raios cósmicos", onde A ( B B ) é astro-


3 1 3 1 3

é de fato tão só uma localização delas. Nessa ca- física, e C física da matéria inter-estelar. "L'idée
3

tegoria teremos a C D U , os "grupos da W R U , as est bonne, la réalisation l'est moins", observa


categorias do M E D L A R S , as hierarquias do Grolier ( 5 0 ) .
S Y N T O L . Em C há tantas relações quantas dimen- Respeito à "classificação — biblioteconômica — bi-
sões, como se dá nas "palavras" da W R U , na bliográfica" soviética — a B R K — de estrutura clás-
"rede de noções" do S Y N T O L , no diagrama geral sica, e inspirada na C D U e em Bliss, mostra-se-nos
do G R I S A L . também, no referido artigo, que é de 60% o seu
grau de "modernismo", isto é, a percentagem desti-
6. 10 — Relações e categorias em sistemas recentes nada às ciências exatas, contra 20% a C D D e na
C D U . Os restantes 40% representam as "humani-
Se nos voltarmos, agora, para as categorias e rela- dades". No plano de conjunto, a saber, "A mar-
ções fundamentais salta à vista que o estudo xismo-leninismo", B-E, Z-R, SE, Ju Universo e seu
clássico de Grolier ( 4 9 ) , de que tão amplamente conhecimento", "Ja Literatura enciclopédica", di-
nos valemos, não perdeu, com os anos, muito cotomiza-se, por vezes, de modo "algo simples", na
mais do que a atualidade. O próprio autor com- opinião do autor francês: " U R S S de um lado,
plementou-o com nova resenha em 1970 ( 5 0 ) , mundo não soviético de outro; ou, ainda, teoria
onde se descortina, aliás, manifesto retorno à clas- marxista-leninista/teorias pre-marxistas e não
sificação documentária enciclopédica. Assim, o marxistas". Não raro há tricotomias: países socia-
Descriptive inventory, de J. K. Tykociner engloba listas/países em desenvolvimento/países capita-
doze "domínios de conhecimentos", agrupados listas.
em séries: Arte, Hilenergética (físico-quimica, as-
tronomia, ciência da t e r r a ) , Exeligmologia (his- 6. 1 0 . 1 — "Operadores" de Farradane e do Precis
tória, no sentido de Bacon, espécie de ciência da
evolução), Pronoética ( t é c n i c a s ) , domínio da re- Uma vez vista as "categorias" da B R K , não há pas-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 205


MANOEL ADOLPHO WANDERLEY

sar em silêncio, porque de maior interesse para o vê-lo — não só desse como fermento intelectual
problema em foco, as pesquisas do C R G a que já que é a "teoria dos sistemas gerais", cuja formula-
aludimos, um dos resultados dos quais é o P R E C I S ção original devemos a von Bertalanffy ( 4 2 ) , se
— Preserved Context Index System, a que se vin- não também da concepção dos níveis de integração
cula o nome de Austin. Nas pegadas de Farra- ou de emergência (integrative leveis).
dane, optou-se, nele, pela construção dos assuntos Considerando-se sistema lato sensu tudo que possa
a partir dos "quanta" básicos da linguagem, en- ser tido como entidade, sistema-M (major system),
foque mais consentâneo com as vistas atuais dos aquele que se pretende analisar, e conjunto-D, o
processos mentais" do que a mera subdivisão do conjunto de subsistemas resultantes da sua decom-
universo dos conhecimentos até os conceitos indi- posição, a estrutura do sistema-M seria a totali-
viduais. Há duas categorias destes: entidades, dade das relações vigentes entre os subsistemas que
isto é, construções mentais (mentefacts) e objetos pertencem a determinado conjunto D. As relações
concretos (artefacts); e atributos, isto é, "proprie- surgem, então, como a totalidade das restrições
dades, atividades e propriedades de atividades". que incidem sobre as possíveis combinações de dois
Quatro relações fundamentais servem de conexão ou mais sistemas.
entre os conceitos: gênero — espécie, coberta pelas São essas algumas das definições propostas por M.
referências cruzadas do tipo "ver também"; atribu- Toda, bem assim a de composições e decompo-
tiva, entre entidades e atributos; possessiva, entre sições, materiais ou conceptuais, a de "árvores e fa-
objetos e partes, e interativa, entre objetos. Nesse mílias de decomposição", todo um instrumental
quadro, para unificar a estrutura gramatical das teórico utilizável na "análise e síntese da informa-
"sentenças do índice", análogas aos "analets" de ção".
Farradane ( 4 1 ) , e manter o grau de pre-coorde- Num assunto verbi gratia, como "a influência dos
nação que o nome P R E C I S sugere, fixaram-se lares desfeitos sobre a incidência da delinqüência
vinte e dois "operadores", a serem aplicados de tal juvenil", "delinqüência juvenil" é o sistema "pas-
forma que os elementos, num assunto composto, sivo", enquanto "lares desfeitos" é o "ativo", con-
obedeçam à estrutura A > B > C > D. forme Foskett ( 4 2 ) e o que dissemos acima.
Vale isso dizer que se considera o conceito de D Austin ( 4 2 ) introduziu igualmente a noção de "mu-
no contexto de C; o de C, no de B; e o de B, no dança de sistema", de forma que o conjunto de
de A, isto é, que "em termos de estrutura grama- relações, nessa ótica "sistêmica", vem a ser: 1 —
tical, tendemos a organizar a sentença de modo Propriedades dos sistemas; 2 — Segundo sistema/
que se tenha esta na "forma passiva", quando se ambiente, relacionado a ( 3 ) ; 3 — Atividades e inte-
lê a cadeia da esquerda para a direita", e na rações sem mudança material; 4 — Subsistema
"forma ativa", se o fizermos no sentido inverso, per- ativo; 5 — Subsistema passivo; 6 — Introdução den-
mutando-se a posição do verbete inicial ( l e a d ) tro do sistema; 7 — Segundo sistema/ ambiente
com a do modificador (qualifier). relacionado a ( 8 ) ; 8 — Interações com mudança
É força reconhecer-se aí a influência da teoria dos do sistema; 9 — Atributo que define "subclasse
sistemas gerais, bem como a de Farradane na no- (entidade mudada)".
ção de "operadores". Os do P R E C I S são: ( a )
forma; ( b ) objeto, "target"; ( / ) relação quase-ge- De certa forma a teoria dos sistemas reforça a dos
nérica, diferença, isto é, forma adjetiva do con- níveis de integração. É típico da primeira afirmar,
ceito; ( p ) subsistema, material; ( q ) propriedade, como o faz M. Toda, que só pelo conhecimento
percepto "percept"; ( o ) região do estudo, popu- das estruturas dos sistemas macroscópicos se pode,
lação — amostragem, "sample population"; ( 1 ) de fato, derivar do microscópico o macroscópico.
ponto de vista, perspectiva, ( 2 ) conceito ativo; ( 3 ) E o que postula o "não-reducionismo" da teoria dos
efeito, ação; ( 4 ) sistema-chave, "key system"; ( 5 ) "integrative leveis" se não que o todo é maior que
disciplina; ( 6 ) ambiente; ( v ) conceito coordenado; a soma das partes? As entidades se ordenam numa
( w ) conceito coordenado correlato; ( x ) tema seqüência linear tal que "as unidades constituin-
coordenado. tes de cada nível, mais as relações que as unem,
determinam a natureza do "nível superior", na
Destarte, para o assunto "Intervention by the British síntese de Foskett ( 4 2 ) .
government in the dock strikes of 1973: report Mais próximos da questão mesma das relações, res-
of a study conducted at Liverpool", a análise dos ta-nos ainda, do lado britânico, lançar rápido olhar
conceitos seria: ( 6 ) Great Britain; ( 4 ) Docks aos trabalhos supracitados de Farradane, cujas
industry; ( 3 ) strikes 1973; ( 3 ) Intervention — by idéias procedem antes do prisma psicológico e dos
— in; ( 2 ) Government; ( o ) study region; ( / ) estudos de Vinacke, Isaacs, Piaget, e, principal-
Liverpool. Note-se o "elo" preposicional criado para mente, de Guilford ( 4 9 ) . Deste, o modelo de estru-
ligar os termos "strikes" e "government". tura intelectual envolve três planos: tipos básicos
Na esteira das reflexões de Farradane, o P R E C I S , de conceitos, mecanismos mentais e produtos do
como aliás, em geral, as pesquisas do C R G , tam- pensamento. Corresponderiam aos conceitos "figu-
bém acusam, à saciedade, a ação — acabamos de rativos" (figurai), simbólicos e semânticos de

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


206
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

Guilford as facetas básicas, do sistema de Farradane, termos, onde não se aplicam as relações mais
"entidades", "abstratos" (abstracts), "atividades", fundamentais da classificação (níveis, classes, gru-
a que ele teria acrescentado "propriedades". As pos heterogêneos)", escreve Farradane. Temos en-
"classes" se reportariam às combinações de "unidades tão o clássico quadro de "operadores", que a seguir
homogêneas" quanto ao tipo de conceitos básicos. reproduzimos, decorrente da conjunção de dois
"Termos do sistema", ou "termos heterogêneos", tipos de mecanismos mentais, o primeiro atinente
eis como designá-los no caso contrário. "Um passo à natureza "temporal" da relação, o segundo ao
adiante na análise da informação é a dos assuntos grau de distinção (distinctness) em que ela é per-
complexos por meio de relações explícitas entre os cebida.

clareza Tempo mental


de percepção Não-temporal Temporária Fixa

co-ocorrente

não-distinta

distinta

A indexação da sentença "Junção de chapas de aço documentos e de termos. Isso porque, de fato, o
endurecidas", mediante os respectivos "operado- objeto da classificação não são propriamente os
res", daria, no exemplo de Foskett ( 4 1 ) : conceitos, por muito que neles se fundem os docu-
A ç o / : Chapas/ — Junção mentos, mas estes mesmos, de que se deve levar
/; em conta, no entanto, o conteúdo intelectual. Res-
Endurecimento surge aí a tese de Hulme ( 4 1 ) , da "abonação
literária" (literary warrant): o documento é o es-
10. 2 — Sistema Universal de Wàhlin e relações de teio da taxonomia bibliográfica.
Kervégant Demais, o ponto de vista da ação no plano con-
creto requer igual atenção, donde a necessidade
Quiséssemos tentar resenha cabal dos estudos sobre de "sistemas práticos", como os que se destinam a
estruturas classificatórias e categorias e faríamos, fins industriais e comerciais. Daí um "campo uni-
como se percebe de pronto, longa dissertação. Eis versal", a par de supercampos, campos e subcam-
porque nada diremos sobre obra tão "séria, técnica pos. Dois princípios lógicos merecem menção:
e refletida" quanto a de Z. Dobrowolski, voltada a classificação mediante sistema de documento com
antes para a construção mesma dos sistemas de base nas estruturas hierárquicas, genéricas ou
classificação e para o aspecto da notação, que dei- outras, e na pré-coordenação (ab e Im), e a inde-
xamos de lado. Outras há que é força omitir, xação por meio de certo número de termos equi-
com as duas ressalvas seguintes, de que trataremos valentes (a, b, 1, m ) .
antes de terminarmos essa linha de considerações Para o arranjo dos termos, no eixo vertical, enumera
num de seus pontos altos, o Simpósio sobre fatores o autor do US (Universal System of Classification)
relacionais. critérios como o alfabético; o semântico, com base
Para Wàhlin, "domínio dos conhecimentos" e "do- nos conceitos; o sistema de definição e a divisão
mínio dos termos" diferem quanto às estruturas, gramatical de acordo com as classes de palavras.
de modo que é força distinguirmos sistemas de A trilogia — coisas, atividade (processos) e pro-

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 207


MANOEL ADOLPHO WANDERLEY

priedades — corresponde grosso modo às três clas- junto M de "constantes de relevância", destinadas
ses — substantivos, verbos e adjetivos. Preposi- a especificar a importância do assunto mais sim-
ções, conjunções — e a declinação — respondem ples no quadro do mais complexo. A operação
pelo contexto sintático. "conexão" prevê a construção de uma rede repre-
Note-se, enfim, que os "indicadores de função" su- sentativa do assunto complexo: "Termômetro",
prem a insuficiência da lógica do discurso. por exemplo, seria expresso por "instrumentos:
Da mesma forma, num retrospecto das reflexões { finalidade: [ (operação: m e d i d a ) : ( < objeto:
significativas sobre as relações e categorias, desta- medida > : temperatura) ] | " .
ca-se incontestavelmente a análise de D. Kervégant,
Quanto às relações entre os assuntos A e B, enu-
do sinal ": " na C D U . É notório que, desde 1957,
mera Soergel três: a relação A ^ B dos sistemas
sugeriu o autor se tornassem explícitas as relações
parcialmente ordenados e equivalente a "A implica
entre os assuntos designados por tal símbolo,
B " ; a proximidade (nearness) dos assuntos A e B
acrescentando-se-lhes flechas com orientações di-
dos sistemas descritos na primeira relação; as rela-
versas e números de ordem.
ções do tipo "ver também.
Assim, no tocante à Pertinência, "— > 1 1 — > " indi-
Atenta, ainda, o autor, para o fato, já apontado,
caria inclusão; — > 1 2 — > , partes, ó r g ã o s . . . ; em
de se distinguirem das relações paradigmáticas,
Processo, " — > 2 1 — > " eqüivaleria a ação;
"essenciais e universalmente aceitas — e portanto
" — > 211 — > " ação favorável, estímulo;
implícitas", — as sintagmáticas, contigentes, oca-
" — > 2 1 2 — > " d e s f a v o r á v e l . . . ; e m Dependência,
sionais e explícitas.
" — > 3 < — " teria o sentido de c a u s a l i d a d e . . . ;
O esquema para a classificação dos "roles" ressal-
cm Orientação, usar-se-ia " — > 41 — >" para aspecto,
vado o que concerne ao tempo e espaço, e aos
caso particular; " — > 4 2 — > " , a p l i c a ç ã o . . . e em
pares "todo/parte", "classe/elemento", compreende
Comparação, "— > 51 — >" para semelhança etc.
os tipos básicos: coisa, entidade; material, subs-
Um assunto complexo, ilustra-o Kervégant com o
tância; propriedade, condição; processos, agente;
título "Influência do clima sobre a resistência da
objeto ( t a r g e t ) , além da Causalidade.
batata às pragas de vírus", assim traduzido na C D U ,
colocando-se entre colchetes os "sistemas de con-
6. 10. 4 — Natureza relativa dos fatores: F. Lévy
ceitos" equivalentes a um termo:
5 5 1 . 8 - > 2 1 - > [ 6 3 1 . 5 2 1 . 6 - > 4 1 - > 6 3 2 . 38]
(clima) (resistência a vírus) Se quiséssemos caracterizar outra opinião de inte-
resse para o nosso tema, a saber, a que F. L é v y
- > 4 2 - > 6 3 3 . 491 externou no Simpósio mencionado, diríamos que vem
(batata) a marcá-la — e nisso se revela um porta-voz do
S Y N T O L — um sentido agudo do valor relativo
6. 10. 3 — Levantamento das relações: D. Soergel
das categorias, já que é mister, ao que mostrou,
Manancial importante para o estudioso das catego- firmar-lhes a interpretação no contexto semântico,
rias documentárias são, altm da obra de Grolier, de natureza lingüística e/ou epistemológica, e
contribuições como as de Pagès, Farradane, Lévy, que não há reduzi-las a fatores estritamente lógicos.
Perreault, apresentadas ao Simpósio Internacional Do contexto global, com efeito, dependerá o valor
sobre fatores relacionais na classificação. Entre informativo do que significa a palavra "afeta" nos
eles, note-se há uma quase completa suma das re- exemplos:
lações e indicadores de função, em que se trata " ( O álcool) afeta (a delinqüência)" e " ( O álcool)
de "modo enciclopédico", informação contida, em afeta (as células corticais)", valor metafórico no
boa parte, nos trabalhos de Grolier, Perreault, primeiro caso, relativo a processo bio-físico no se-
Vickery. É a que devemos à análise exaustiva de gundo. O fator lógico, por abstrato, oferece fraco
D. Soergel. Perquirem-se e comparam-se, nela, os teor de informação. Por outro lado, é em si mesma
principais esquemas existentes no que toca a "indi- "epistemologia" a lógica que faculte o se tornarem
cadores de função", isto é, "conceitos extremamente "significativas as noções na medida que reflitam
gerais aplicáveis a uma larga faixa de domínios os "comportamento" do campo em questão".
(fields) do pensamento". A compatibilidade entre sistemas — "possível porque
Antes da lista mesma, apresenta o autor um modelo as categorias deverão ser interpretadas em função
geral para a estrutura do conjunto de assuntos, dos contextos documentários" — sugere-a o seguinte
partindo, para tal, do "conjunto (A + + ) de con- quadro, em que se ilustram "alguns dos denomi-
ceitos primitivos (predicados, atributos) e do con- nadores comuns lógicos":

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 208


LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

SYNTOL WRU

Categórico
Características inerentes: Intrínseco
(inclusão, predicados, ATRIBUTIVO Inclusão
atributos) Compreensão
Estático
Interpretação modal EXPRESSIVO Simulação

DO AGENTE AO
Agente, assunto do processo Instrumental
PROCESSO

DO PROCESSO
Objetos do processo Produção
AO P R O D U T O

Dinâ- Causalidade, interdependên-


mico cia entre dois fenômenos CONSECUTIVO Afetado por
ou elementos

6. 1 0 . 5 — Tríades de Perreault e outros ( C l , D 3 ) " , mas em nenhum dos casos o grau de


articulação de aí, diz Perreault,
Se algo, enfim, pode depreender-se dessa breve in- substituem-se "links" e "roles" por símbolos tais
cursão pela selva das "relações fundamentais", é que "oc" é a relação copulativa, a relação de
que ali onde a unidade lógica seria de regra, encon- certeza moral, " — > " a "supra-relação" antece-
tramos, quando muito, um ar de família entre dente/ conseqüente.
categorias "nem de todo as mesmas, nem todo ou- No que toca a articulação dos substitutos (surroga-
tras" em cada caso. Lograr-se-ia o geral consenso tes) dos documentos, a que aludimos anterior-
quanto a uma díade ou tríade final, nos moldes mente, ou seja, dos documentos secundários — sim-
da de Blanché ( 1 2 ) em que, de certa forma, cul- plificações pertinentes do discurso, já que no dizer
minou o exame das estruturas nas L N ? É o que de Mills ( 7 7 ) "o propósito da indexação é dizer-nos
tentariam insinuar as reflexões de Perreault ( 7 7 ) , o que ignorar" — o desiderate é a recuperação
"Charmain" do já citado Simpósio sobre fatores efetiva mediante estratégia apta a localizar os itens
relacionais, as quais não acusam, aliás, qualquer Y que respondem com precisão adequada à ques-
referência ao lógico francês. tão X. O que se tem em vista são, pois, aspectos
Ao sondar os fundamentos epistemológicos da ques- sintáticos dessa "estratégia", isto é, no estilo de
tão frisa o autor o fato de que o julgamento, Perreault, "a manipulação ritual" [entenda-se: ope-
constituem-nos não os conceitos isolados, mas a racional?].
união lógica e a cópula entre eles. "A articulação Acena enfim o autor para uma sorte de tripartição
é o que faculta o discurso. Operadores, sintagmas, reconhecível em muitos dos sistemas relacionais.
morfemas, "correlatores" são d i á d i c o s . . . criam Teríamos o quadro abaixo dos que compara para
uma cadeia articuladamente discursiva". Se se apõem ilustrar tal similitude, excluído o único explicita-
indicadores de funções (roles) aos substantivos, mente epistemológico, o de Farradane ( 7 7 ) , onde
temos "Al, B 2 , Cl e D3"; se elos ( l i n k s ) , " [ A l , B 2 ] há a dupla tripartição — quase diríamos a dupla

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 209


MANOEL ADOLPHO WANDERLEY

tríade-que já consignamos. A propósito dele lembra ceito de constituição pressupõe a historicidade do


Perreault o que disse R. Sokolowski: " . . . o con- sujeito e o câmbio da realidade". Eis o quadro:

DE GROLIER (77) GARDIN (77) PERREAULT (77) H J E L M S L E V (77)

Objeto em si mes- Coordenativo, Subsumptivo Interdependência


mo Predicativo

Objeto na relação Consecutivo Determinativo Determinação


ativa

Objeto no ambiente Associativo Ordinal Constelação

7 - CONCLUSÕES juegos lingüisticos".


Ora, justamente os há bem nítidos no âmbito da
Uma vez reconhecida a área dos problemas em foco, comunicação e do processo da informação ou,
a primeira pergunta que ocorre, espontaneamente, mais restritamente, da "conserva" documentária a
é quanto à condição lingüística da documentação, que aludimos em vários pontos. Bem precisas são,
ou, em outros termos, quanto ao existirem, ou não, por exemplo, as funções da "recuperação da infor-
as chamadas L D , e no caso de as haver, quanto a mação" e as dos sistemas de "question answering",
seu estatuto, por assim dizer, em face das natu- com fortes afinidades a assemelhá-los e uma única
rais. Consistiria em mera metáfora a sua realidade teoria de seleção subjacente a ambos, mas discri-
ou haveria a lastreá-las alguma consistência onto- mináveis ao menos em opinião tão ábalisada
lógica?
quanto a de C. Mooers ( 6 ) . Não foi ele o criador
Parece-nos que, do levantamento feito, se depreende da primeira, que tanto êxito logrou? O sistema
a flexibilidade extrema do conceito. Registramos, de recuperação da informação — afirma Mooers ( 6 )
no tocante ao "continuun" da indexação, toda uma — é o sistema de informação que permite à pessoa
seqüência de estruturas de léxicos e de sintaxes que necessita uma espécie de informação previa-
a constituírem trasição gradual das LN para as L D . mente descrita (prescribed) selecionar, da coleção
Embora o elemento conceptual e os significados de documentos que contém informação, os que
de umas e de outras não se diferenciem essencial- quadram com a descrição. O escopo dos "question
mente, os significantes podem fazê-lo e ir dos gra- answering systems", dos de tipo "pergunta-res-
femas alfanuméricos e usuais aos códigos e diagra- posta" é prover respostas às questões que lhes são
mas de diversas sortes. Tampouco, na gama das propostas.
L D , há uniformidade no que concerne a presença; Destarte as funções determinantes de tais processos,
ou não, de sintaxe, ao fato de se relacionarem ou e de outros que se lhes aliam no campo da comu-
serem discretas as unidades em que o conteúdo se nicação, especializam as das L N . O mesmo se dá,
traduz. dentro delas, com outros jogos lingüísticos. Assim,
Se nos ativermos, pois, ao polo da máxima coinci- "Fogo!" — nota-o F. Mora — tanto vale para grito
dência, encontraremos, é óbvio, boa parte da pro- de alarme quanto, para "si no se es muy c o r t ê s . , .
blemática das LN, e a "essência" das L D , se a pedir lumbre y encender el cigarillo". Nem outra é
houver, defini-la-emos, por força, a partir da que a multiplicidade decorrente das estruturas sintá-
fixamos para as primeiras. Questão tormentosa, ticas, como verificamos a respeito dos níveis pro-
dada a profusão de teorias concorrentes e a resso- fundos e superficiais dos enunciados.
nância transcendental logo provocada por tal or- Haveria, perguntamos, algum fundamento para re-
dem de cogitações. tirar às linguagens documentárias os foros de
Bastaria, no entanto, deixarmos os fatos serem os "jogo lingüístico" ou, por outras palavras, de lin-
próprios intérpretes da condição que assumem. guagem, conquanto artificial, em certos casos, e
Estaríamos deante de usos específicos dados aos equivalente à transposição ou codificação sui generis
componentes e comportamento das linguagens. do discurso escrito, como este o é do oral? A
Como assinala F. Mora, "Ias funciones lingüisticas nosso ver não, e é mister julgá-la tal, ainda que
son muchas y mui variadas, porque son muchos fosse válida a crítica de Bar-Hillel, ao arguir que
y mui variados los tipos de actos lingüisticos". Re- "se o anzol com que se fisga o peixe não é por
tomando idéias wittgensteinianas ou, pelo menos, força um peixe em miniatura ou condensado, não
a respectiva terminologia — e sem abolir a priori, há razão intrínseca pela qual um índice deva ser
contudo, os universais próprios a esse terreno — um documento em miniatura ou condensado",
acrescenta: "en puridad, no hay lenguaje, sino nem para que o índice, por muito que consista em

CL. Inf., Rio de Janeiro, 2(2): 175-217, 1973


210
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

frase constante do documento, lhe veicule o teor que em princípio excluímos de nossas considerações
da informação. — encontra talvez, como contrapartida na docu-
Porque tudo está a indicar, ao contrário, que é mentação, dimensões e parâmetros do tipo do índice
verdadeira a objeção que lhe fazem J. Perry ( 1 8 ) de pertinência, de recuperação, de "atinência", de
e outros pesquisadores da W R U quando mantêm precisão, a que, incidentalmente, fizemos alusão.
que "a informação recuperada não pode ser se Demais ao nível da análise do conteúdo, ao rela-
não a informação originariamente armazenada. A cionarmos aos significados as estruturas gramati-
equivalência semântica deve realizar-se entre o cais vimos aflorar a noção de correspondências for-
pedido de informação e a informação armazenada". mais — e não temos aí, de novo, algo ligado à
Eis aí outro ponto que merece ser sublinhado em equivalência? — entre sentenças incluídas na des-
muito de quanto observamos nas páginas preceden- crição da frase e outras que não o são. Ao que
tes: o papel central que desempenha, tanto na pondera Chomsky — precisamente quem aprofun-
LN propriamente dita, quanto na L D , a noção de dou a questão — "tais correspondências são de
equivalência. Todo um campo conceptual de mar- fácil descrição. Não é difícil definir o que se pode
cada relevância para a nossa investigação, gira chamar de transformações, isto é, as operações
em torno dela: sinonímia, polissemia, ambigüidade, formais que convertem qualquer sentença de forma
homonímia, e aproxima o uso comum das estru- declarativa numa forma correspondente passiva,
turas lingüísticas, do uso documentário. interrogativa ou outra".
Por outro lado, suas relações são incontestáveis com Note-se, por fim, o esforço envidado para a forma-
certos aspectos da "analiticidade", da definição, lização, aqui também, do conceito de equivalência
da paráfrase e com outros traços das linguagens, lingüística e — verbi gratia do teor de sinonímia
entre os quais, a maior ou menor adaptabilidade (sinonimity) de dois textos sinônimos, Te e Ti.
à tradução. Se o tradutor, ao que observa Olshewsky, Eles o são, para Shreider, "se corresponderem ao
se interessa pela equivalência de significado entre mesmo operador de transformação do Thesaurus
expressões de duas línguas diferentes, o analista A = A " . A determinação de tal "sinonimity"
T T 1

lógico, entre duas expressões dentro da mesma com respeito ao Thesaurus — é "desenvolvimento
língua, não é lícito afirmar que a essa segunda ca- natural da idéia de equivalência intensional e igual-
tegoria pertence primordialmente quem lida na dade de estrutura intensional de "Carnap", para
comunicação a fazer resumos, representações inde- o qual dois textos terão o mesmo significado (in-
xadas, codificações de documentos, não obstante tensão) se o mantiverem em qualquer estado
participar também da primeira no seu afã de trans- concebível do mundo.
por as barreiras lingüísticas? Bastaria aduzir, para
Somente, obtempera Katz, "as previsões feitas a par-
corroborar tal asserção, o que frisamos repetida-
tir de uma língua artificial de tipo carnapiano
mente, a saber, as ligações estreitas de tradução
s ã o . . . completamente v a z i a s . . . a s construções
automática com a recuperação da informação.
lingüísticas inscritas sob os títulos "analíticas",
Assim, contribuiriam para elucidar o problema das
"sinônimas" etc. são as que a língua carnapiana
polissemias nesta última os algoritmos e progra-
"prevê" como analíticas, sinônimas etc. O acerto
mas de cálculo mecânico aptos a resolver a ambi-
da previsão de que uma frase P tem a propriedade
güidade, definida por A. Janiotis como a "situação
P nada mais estabelece que o seguinte: esta frase
em que uma expressão na língua-fonte comporta
tem a propriedade P".
mais do que uma na língua-objeto, ou como a si-
Não estaríamos aí a identificar o mal de que pa-
tuação em que não basta considerar as palavras
decem muitos dos formalismos?
ou grupos de palavras isoladamente, mas antes suas
Constatamos, outrossim, na seção atinente à análise
combinações aptas a uma tradução com sentido".
de conteúdo, a ocorrência de sistemas em que a
"Les progrès dans le dépistage des informations à
recuperação se faz, por um lado, mediante a mera
1'aide de mots-clé iront de pair avec la solution
justaposição de termos, canônicos ou não, isto é,
des problèmes lexicaux de la machine à traduire",
mediante LD "assintáticas". Eis um modo de lin-
ao que prevê E. Delavenay.
guagem "tal como aparece na criança, ou para o
A equivalência estaria conferida, na teoria lingüís- qual tende a linguagem ao degenerar" — observa-o
tica, função similar à identidade nas estruturas de G. Granger — modo, porém, efetivo, até certo grau
índole lógica, e isso inclusive do ângulo do signi- de experiência documentária.
ficado, da intensão ou conotação. "Para descobrir Por outro lado, afinando-se o reconhecimento do
se dada proposição é logicamente verdadeira — teor informacional, por mais acurada a "questão"
é Bar-Hillel quem o diz — se duas proposições são do usuário, entram em jogo as sintaxes, as gramá-
logicamente equivalentes, ou se duas expressões ticas e algoritmos respectivos para a resolução dos
são sinonímicas, é preciso conhecer tão só a sua in- textos em seus componentes. Situa-se aí o domínio
tensão (conotação, sentido)". rico das estruturas lingüísticas e lógicas. Estas,
Ousaríamos adiantar que a outra face, a do valor- com efeito, integram a informação ao articularem
verdade, a do referente, a da coextensividade — a que os termos do léxico veiculam, de tal sorte

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 211


MANOEL ADOLPHO WANDERLEY

que o todo do significado acaba por condicionar o da "ciência como língua bem feita".
significado dos elementos encarados de per si. Por A distinção, aliás, entre função semântica e função
outras palavras — e consideradas as relações de sintática — como o vimos ao escrutar-lhes as inci-
equivalência a que acabamos de nos reportar — a dências nas LD e como frisa magistralmente
introdução de um contexto, dentro do qual estru- G. Granger — a distinção entre remissão, pelos ter-
turas profundas respondem pelas superficiais, mos, "aos objetos" e às estruturas lingüísticas, é
atesta a interdependência da sintaxe com respeito essencialmente relativa e móvel. No quadro a se-
à semântica, hoje incorporada na lingüística. guir o autor citado elucida a maneira pela qual
Sem a remissão constante ao significado correr-se-ia "dos sistemas sintáticos tematizados como quase-
o mesmo risco, a esse respeito, de nos limitarmos objetos reparte em seguida o processo". É de
à concepção gramatical da linguagem ou das "sin- observar-se que, no caso vertente, o autor considera
taxes lógicas" a que tende o nominalismo de teses a escrita em si mesma e não como transcrição
como a que exprime o célebre conceito de Condülac, de uma língua falada.

Nem é por outra razão, como tivemos o ensejo de forço para lograr-se a tábua ideal das categorias
verificar, que Salton faz depender a identificação fundamentais, quer no plano epistemológico e do
do significado, no que diz respeito ao grupo de conhecimento em geral, quanto aos "modos mais
palavras, do "reconhecimento adequado das am- universais do ser e os gêneros supremos do dis-
bigüidades sintáticas e semânticas, da interpretação curso", quer no "espelho do mundo", que é o
correta dos homógrafos, do reconhecimento das microcosmo documentário, quanto aos fatores re-
equivalências semânticas, das relações de palavra lacionais das "linguagens descritoras"?
a palavra e de uma percepção geral do "back- Tão grande se afigura a semelhança que os com-
ground" e ambiência de cada enunciado". ponentes de toda síntese intelectual dissecada na
Como observação final, tudo nos leva a apontar teoria, e os das representações indexadas, são objeto,
para o que faz as vezes de fecho de abóboda na por vezes, da mesma caracterização. Destarte,
complexa construção em que nos detivemos: preci- teremos categorias como a "relação" propriamente
samente as ligações centrais, as articulações mais dita, em Aristóteles e Kant, e a "relação" na C D U ;
genéricas das linguagens. "Não pensamos com pa- 'lugar e tempo", nos Tópicos e na Colon Classi-
lavras, pensamos com frases" notava Valéry, e fication ou na C D U ; "causalidade", dentro da
determinar as funções da unidade no julgamento, relação na Analítica Transcendental, e "causação"
eis o objetivo de um esforço persistente, a que em Farradane, e assim por diante.
também tende, de alguma forma, a busca que des- Igualmente em Peirce, (74) as categorias "cinopi-
crevemos ao nível das categorias documentárias. tagoreanas" de "firstness", mode ser do que é como
Com efeito, o problema das relações fundamentais é sem referência ao outro, de "secondness", do que
já revela, por si só, até que ponto se aproximam é com referência a um segundo, mas não a um
as formas lingüísticas e as formas lógicas, como terceiro, de "thirdness", do que é pondo em relação
queria Cassirer e, a fortiori, a nosso ver, ambas e um segundo e um terceiro, não sugerem a "tríade"
as L D , muito menos formalizados que aquelas úl- do objeto em si mesmo, do objetivo na relação
timas e equiparáveis não raro — é o que tentamos ativa e do objeto no ambiente, de um Groher, por
mostrar — a "jogos lingüísticos" ou usos especiais exemplo?.
de umas e de outras, isto é, do discurso e da
lógica. De outras feitas, a identidade residiria no número
de categorias arroladas e talvez, no fundo, na
Não acusa origem comum, perguntamos, o longo es- universalidade de certas operações intelectuais que

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


212
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

informam estruturas lógicas como a de Blanche. 4 AUSTIN, Derek - P R E C I S indexing. The


Mas de modo geral — notamo-lo quanto à documen- Information Scientist, 5 ( 3 ) : 95-114,
tação ao tratar das idéias de F. Lévy — é relati- 1971.
vamente ao contexto semântico, e no que concerne
antes à epistemologia do que à lógica stricto sensu 5 B A L D I N G E R , Kurt - Teoria semântica;
que atuará o princípio de repartição em classes, o hacia uma semântica moderna. Madrid,
qual, em termos de Cassirer, "uma vez descoberto, Alcalá, 1970. 278 p.
rege não só a organização do sistema nominal, mas
estende-se à totalidade do arranjo sintático da 6 B A R - H I L L E L , Yehoshua — Language and
língua e torna-se a expressão verdadeira de sua information; selected essays on their
coerência, de sua "articulação espiritual". theory and application. Reading, Mass.,
O que precede nos parece significar que há, de Addison-Wesley; Jerusalem, Jerusalem
fato, e se afirma de modo crescente, uma função Academic Press, 1964. 388 p. Comentário
nuclear que se refere, em todas as linguagens — até por: M O O E R S , Calvin Comment on
mesmo em todas as semiótícas como dissemos ao the paper by Bar-Hillel. American Docu-
início — às estruturas de caráter universal e em mentation, 8 ( 2 ) : 114-6, 1957.
especial, às que interessam a lógica e o modo de
ser racional da comunicação humana. 7 & CARNAP - Semantic informa-
Tratar-se-ia de capacidade e disposição inatas, como tion. In: S A R A C E V I C , Tefko, ed.
pretende Chomsky, para os universais lingüísticos Introduction to Information Science.
nos moldes do princípio "A sobre A"? Parece-nos New York, Bowker, 1970. 751 p.
mais avisado o que avança J. Lyons a comentar
o pensamento Chomskiano — que não é "um conhe- 8 B A R T H E S , Roland - Le plaisir du texte.
cimento dos princípios formais da linguagem que Paris, Seuil, 1973. 105 p.
é inato, mas inata é uma "faculdade" mais geral"
que, em circunstâncias adequadas, interage com ela 9 B E L Y , N.; B O R I L L O , A.; V I R B E L , J . SIOT-
;
para produzir a competência lingüística. D E C A U V I L L E , N. - Procedures
Em suma, de acordo com Piaget, as análises estru- d'analyse sémantique appliquées à la
turais dos lingüistas evidenciam — não há negar documentation scientifique. Paris,
— a originalidade de um sistema de sinais face ao Gauthier Villars, 1970. 240 p.
de normas de pensamento ou verdades, e suscitam
o problema das relações. Mas "estas existem de 10 B I E R W I S C H , Manfred - Semantics. In:
fato, e os sinais têm por função exprimir signifi- LYONS, John, ed. New horizons in
cações cuja natureza é lógica em diferentes graus". linguistics. Harmondsworth, Penguin
Eis por que — isso nos traz de volta à citação de books, 1971. 367 p.
S. Elia feita na introdução — o lingüista Hjelmslev
veio a fazer a "hipótese de um nível "sublógico", 11 B L A N C H E , Robert - Introduction à la
onde se estabelecem as coordenações lógicas e as logique contemporaine. Paris, Armand
lingüísticas". Colin, 1957. 208 p.
Seria, enfim, de índole racional essa "linguagem de
linguagem" que para Michel Deguy é o próprio 12 _ Structures intellectuelles; essai
da função poética do discurso, de todo excluída de sur Vorganization systématique des
nossas cogitações? concepts. Paris, J. Vrin, 1969. 147 p.

13 B O R D E N , George A. & N E L S O N , William


F. — Toward a viable classification
8 - CITAÇÕES BIBLIOGRÁFICAS
scheme: some theoretical consideration.
American Documentation, 2 0 ( 4 ) :
1 A D D R A D O S , Francisco R. — Rasgos semân- 298-301, 1969.
ticos, rasgos gramaticales y rasgos sin-
táticos. Revista Española de Lingüística, 14 B O R K O , Harold, ed. Automated language
2 ( 2 ) : 249-258, 1972. processing. New York, Wiley, 1967.
386 p.
2 Subclases de palabras, campos
semânticos y acepcimes. Revista Espa- 15 B R A F F O R T , Paul & L E R O Y , André - Des
ñola de Lingüística, 1 ( 2 ) : 335-354, 1971. mots-clés aux phrases-clés; les progrès
du codage et lautomatisation des func-
3 ARCAINI, Enrico — Príncipes de linguistique tions documentaires. Bulletin des
apliquée: structure — fonction — Bibliothèques de France, 4 ( 9 ) : 383-391,
transformation. Paris, Payot, 1972. 302 p. 1959.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 213


MANOEL ADOLPHO WANDERLEY

16 BRAGA, Gilda Maria — Relações bibliomé- 28 DIAZ TE JE RA, Alberto - Puntos de con-
tricas entre a Frente de Pesquisa tacte entre Sintaxis y Semântica. Re-
(Research Front) e revisões da litera- vista Espahola de Lingüística, 1 ( 2 ) :
tura: estudo aplicado à Ciência da 361-370, 1971.
Informação. Rio de Janeiro, 1972. 39 p.
Tese. 29 D O B R O W O L S K I , Z. - Études sur les cons-
tructions des systèmes de classification.
17 B R E N N E R , Claude W. - Experience in Paris, Gauthier-Villars; Warsawa, P W N ,
setting up and using Zatocoding system. 1969, 303 p.
In: S H E R A J. H. et alii. — Information
system in documentation. New York, 30 D O Y L E , Lauren B. — Semantic road maps
Interscience Publishers Inc., 1957. for literature searchers. In: S A R A C E V I C ,
p. 178-192. Tefko, ed. — Introduction to Informa-
tion Science, New York, Bowker, 1970.
18 C E N T E R F O R D O C U M E N T A T I O N AND p. 223-39.
COMMUNICATION RESEARCH - 31 D U C R O T , O. — Presupposes et sous enten-
Comment on "A logician's reaction".
dus. Langue Française, 4: 44-66, 1965.
American Documentation, 8 ( 2 ) : 117-122,
1957. 32 E D M U N D S O N , H. P. - Mathematical models
in linguistics and language processing.
19 CHOMSKY, Noam - Logical structures in In: B O R K O , Harold, ed. -Automated
language. American Documentation, language processing. New York, Wiley,
3 ( 4 ) : 284-91, 1957. p. 33-96.

20 C H R I S T E N S E N , N. E. - Sobre la naturaleza 33 E L I A , Silvio — Orientações da Lingüística


del significado. Barcelona, Editorial moderna. Rio de Janeiro, Acadêmica,
Labor, 1968. 228 p. 1955. 244 p.

21 C L O U Z O T , O. — La méthode d'analyse 34 F A I R T H O R N E , Robert A. - Content anal-


sémantique d'un contenu. Enseignement ysis, specification and control. Annual
Programmé, 6: 21-32, 1962. Review of Information Science and
Technology, 4: 73-109, 1969.
22 LA C O M M U N I C A T I O N les images, les sons,
les signes, théories et techniques, de 35 The patterns of retrieval. Amer-
N. Wiener et C. Shannon a M. McLuhan. ican Documentation, 7 ( 2 ) : 65-70, 1956.
Sous la direction d'Abraham Moles.
Paris, Centre d'Etude et de Promotion 36 — Toward information retrieval.
de la Lecture, 1971. 575 p. London, Butterworths, 1961. 211 p.

37 F A R R A D A N E , J. — Concept organization for


23 COYAUD, Maurice — Intmduction à l'étude
information retrieval. Information
des langages documentaires. Paris,
Storage and Retrieval, 3 ( 4 ) : 297-314,
C. Klincksieck, 1966. 148 p.
1967.
24 Linguistique et documentation; 38 F E R R A T E R MORA, José - Indagaciones
les articulations logiques du discours.
sobre el lenguaje. Madrid, Alianza Edi-
Paris, Larousse, 1972. 171 p.
torial, 1970. 223 p.
25 - & S I O T - D E C A U V I L L E , Nelly 39 F I D — Manuel pratique de reproduction do-
— L'analyse automatique des documents.
cumentaire et de sélection. Paris, Gau-
Paris, Mouton, 1967. 147. p.
thier-Villars, 1964. 314 p.
26 CROS, R. - C ; GARDIN, J. - C ; L E V Y , F - 40 F O D O R , Janet Dean — Formal linguistics
L'automatisation des recherches docu- and formal logic. In: L Y O N S , John,
mentaires; un modèle gênerai "LE ed. — New horizons in linguistics. Har-
SYNTOL". Paris, Gauthier-Villars, 1968. mondsworth, Penguin books, 1971.
260 p. p. 198-214.
27 D E L A V E N A Y , Emile — La machine à tra- 41 F O S K E T T , A. C. — The subject approach to
duire. Paris, Presses Universitaires de information. 2. ed. London, Clive
France, 1959. Bingley, 1971. 429 p.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 214


LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

42 F O S K E T T , D. J. - Classification and index- 55 KATZ, Jerrold J. — La philosophie du lan-


ing in the social sciences. Aslib Procee- gage. Paris, Payot, 1971. 269 p.
dings, 2 2 ( 3 ) : 90-101, 1970.
56 K E L L O G , Charles H. — Designing artificial
43 F R A N Ç O I S , Frederic — Caractères généraux languages for information storage and
de langage. In: LE L A N G A G E . Ency- retrieval. In: B O R K O , Harold, ed.
clopédie de la Pléiade. Paris, Gallimard, Automated language processing. New
1968. p. 20-45. York, Wiley, 1967. p. 325-67.

57 K E R V E G A N T , D - Classification et analyse
44 G A R D I N , Jean-Claude — Éléments d'un
modèle pour la description des lexiques des relations. Bulletin des Bibliothèques
documentaires. Bulletin des Bibliothèques de France, 4 ( 1 1 ) : 495-511, 1959.
de France, 1 1 ( 5 ) : 171-82, 1966.
58 KUNO, Susumu — Automatic syntatic anal-
45 GARVIN, Paul L. - Computing natural ysis. In: S E M I N A R on computational
language and natural language in linguistics. Washington, Govt. Printing
computing. In: S E M I N A R on computa- Office, 1968, p. 19-41.
tional linguistics. Washington, Govt.
Printing office, 1968. p. 74-83. 59 L A N D R Y , Bertrand C. & R U S H , James E.
— Toward a theory of indexing. I I .
46 An informal survey of modern American Documentation, 2 1 ( 5 ) : 358-67,
linguistics. American Documentation, 1970.
l l ( 4 ) : 291-8, 1965.
60 L A N G A C K E R , Ronald W. — A linguagem
47 G R A N G E R , Gilles-Gaston - Pensée formelle e sua estrutura; alguns conceitos lin-
et sciences de l'homme. Paris, Aubier güísticos fundamentais. Petrópolis, Vo-
- Montaigne, 1967. 226 p. zes, 1972. 262 p.

48 G R E E N B E R G , Joseph H. - Language 61 L E V Y , Francis — On the relative nature of


universais. In: S E M I N A R on computa- relational factors in classification.
tional linguistics. Washington, Govt. Information Storage and Retrieval, 3 ( 4 ) :
Printing Office, 1968. p. 84-90. 315-29, 1967.

49 G R O L I E R , Eric de - Étude sur les caté- 62 L L O R A C H , Emilio Alarcos — Les représen-


gories générales applicables aux classi- tations graphiques du langage. In: LE
fications et codifications documentaires. L A N G A G E . Encyclopédie de la Pléiade.
Paris, U N E S C O , 1962. p. 262. Paris, Gallimard, 1968, p. 513-67.

50 — Quelques travaux récents en 63 L O G I Q U E et connaissance scientifique —


matière de classification encyclopédi- Encyclopédie de la Pléiade. Paris, Gal-
ques. Bulletin des Bibliothèques de limard, 1967. 1345 p.
France, 1 5 ( 3 ) : 99-126, 1970.
64 L U C E N A , Carlos José Pereira de — Intro-
51 — Synoptic critique. Information dução às estruturas da informação. Rio
Storage and Retrieval, 3 ( 4 ) : 385-57, 1967. de Janeiro, Ao Livro Técnico, 1970. 86 p.

52 G R O S S , Maurice - On the equivalence of 65 MANLY, Ron — Detailed discussion of Bar-


models of language use in the fields Hillel's "Theoretical aspects of the
of mechanical translation and informa- mechanization of literature searching".
tion retrieval. In: S A R A C E V I C , Tefko, American Documentation, 1 5 ( 2 ) : 126-31,
ed. Introduction to information science. 1964.
New York, Bowker, 1970. p. 210-8.
66 M A T O S O CÂMARA Jr. J. - Dicionário de
53 G U I R A U D , Pierre - Langage et théorie de filosofia e gramática referente à língua
l a communication. In: L E L A N G A G E portuguesa. 3. ed. Rio de Janeiro,
Encyclopédie de la Pléiada. Paris, Gal- Lozon, 1968. 383 p.
limar, 1968. p. 145-67.
67 M E E T H A M , Roger — Informatique et docu-
54 H E G E R , Klaus - L'analyse sémantique du mentation; le traitement automatique
signe linguistique. Langue Française, de Tinformation. Paris, Larousse, 1969.
4: 44-66, 1969. p. 192

Ci, Inf., Rio de Janeiro, 2(2): 175-217, 1973 215


MANOEL ADOLPHO WANDERLEY

68 M E L T O N , Jessica — A use for the techniques 82 P O S T A L , Paul M. - The method of uni-


of structural linguistics in documen- versal grammar. In: G A R V I N , Paul L.,
tation research. Cleveland, Western ed. — Method and theory in linguistic.
Reserve University, 1964. 20 f. The Staque, Monton, 1970. p. 113-31.

69 M O N T G O M E R Y , Christine A - Automated 83 P O T T I E R , Bernard — Hacia una semântica


language processing. Annual Review moderna. In: — Lingüística moderna
of Information Science and Technology, y filologia hispânica. Madrid, Gredos,
4: 145-174, 1969. 1970. p. 99-133.

70 — Linguistics and information 84 P R I E T O , Louis J. - Le sémiologie. In: LE


science. Journal of the American Society L A N G A G E . Encyclopédie de la Pléiade.
for Information Science, 2 3 ( 3 ) : 195-21, Paris, Gallimard, 1968. p. 93-125.
1972.
85 Q U E N E A U Raymond — Présentation de
71 MOSS, R. — Minimum vocabularies in infor- l'Encyclopédie de la Pléiade. Paris,
mation indexing. In: S A R A C E V I C , Gallimard, 1956. 62 p.
Tefko, ed. — Introduction to information
86 RANGANATHAN, S. R. - Philosophy of
science. New York, Bowker, 1970.
library classification. Copenhagen, Ejnar
p. 254-63
Munksgaard, 1951. p. 133.
72 MOUNIN, Georges - Clefs pour la linguis- 87 R E I C H E N B A C H , Hans - Elements of sym-
tique. Paris, Seghers, 1968. 189 p. bolic logic. New York, MacMillan,
1947. p. 444.
73 M O Y N E , J. A. - Information retrieval lan-
guage. ASIS Proceedings 6: 259-63, 1969. 88 R E Y , Alain — Remarques sémantiques. Lan-
gue Française, 4: 44-66, 1965.
74 O L S H E W S K Y , Thomas M. - Problems of
the philosophy of language. New York, 89 R O D Ó N , Eulalia — Categorización, categoria,
Holt, 1969. 774 p. realización. Revista Española de Lin-
güística, 2 ( 2 ) : 389-406, 1972.
75 PAGES, Robert — Relational aspects of con-
ceptualization in message analysis. 90 S A L T O N , Gerard — Automated language
Information Storage and Retrieval, processing. Annual Review of Informa-
3 ( 4 ) : 351-75, 1967. tion Science and Technology, 3: 169-192.
1968.
76 P E R R E A U L T , Jean M. - Documentary
relevance and structural hierarchy. Amer- 91 Automatic processing of foreign
ican Documentation, 1 7 ( 3 ) : 136-9, 1966. language documents. Journal of the
American Society for Information Sci-
On the articulation of surrogates: ence, 2 1 ( 3 ) : 187-94, 1970.
an attempt at an epistemological foun-
dation. Information Storage and Re- 92 S C H U L T Z , Louise — Language and the
trieval, 3 ( 4 ) ; 177-92, 1967. computer. In: Borko, Harold, ed. Auto-
mated language processing. New York,
78 Perry, James W. & K E N T , Allen - Tools for Wiley, 1967. p. 11-31.
machine, literature searching; semantic
93 S E R V A N - S C H R E I B E R, Jean-Louis - Le
code dictionary, equipment, procedures.
pouvoir d'informer. Paris, R. Laffontt.
New York, Intercience, 1958. 972 p.
1972. p. 510.
79 P I A G E T , Jean — Êpistémologie des sciences 94 S H R E I D E R , Y. A. - On the semantic cha-
de Thomme. Paris, Gallimard, 1970 racteristics of information, In: SARA-
380 p.
C E V I C , Tefko, ed. Introduction to in-
80 Traité de logique; essai de lo- formation Science. New York, Bowker,
1970.
gistique opératoire. Paris, 1949. 423 p.
95 S I M M O N S . Robert F. - Natural language
81 P I N I L L O S , José Luis - La significación question — answering systems: 1969.
desde el punto de vista psicológico. Re- In: S A R A C E V I C , Tefko, ed: Introduc-
vista Española de Lingüística, 1(1)-
tion to information science. New York,
97-117, 1971.
Bowker, 1970. p. 467-84.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973


216
LINGUAGEM DOCUMENTÁRIA: ACESSO À INFORMAÇÃO

96 S O E R G E L , Dagobert — Klassifikationssys- 108 ZULL, Carolyn G. — On the possible rele-


teme und Thesauri; eine Anleitung zur vance of linguistics to information
Herstellung von Klassifikationssysteme retrieval. ASIS Proceedings, 5; 285-7,
und Thesauri im Bereich der Dokumen- 1968.
tation. Frankurt, Deutschen Gesellschaft
für Dokumentation, 1969. 224 p. NOTAS

97 — Some remarks on information 1) Para o que se expõe em 4. 1, lançamos mão de


languages, their analysis and comparison. Landry e Rush que, em sua "teoria geral da inde-
Information Storage and Retrieval, xação" ( 5 9 ) , consideram o "document space" como
3 ( 4 ) : 219-91, 1967. "an R-set (following Russell's notation, that is, it
is a set that contains its own description". Interes-
98 A Universal source thesaurus as sante nota sobre o aspecto lógico dessa questão
classification generator. Journal of the já a havia publicado no I B B D B. Inf. l ( 3 ) : 85-6,
American Society for Information Sci- maio/jun. 1955, o Prof. Mario Tourasse Teixeira
ence, 2 3 ( 5 ) ; 299-305, 1972. sob o título "A contradição de Russell e a documen-
tação".
99 T A U L B E E , Orrin E. - Content analysis,
specification and control. Annual Review 2) Porque só eventualmente nos reportamos ao con-
of Information Science and Technol- ceito de "recall", designamo-lo, em 4. 5 e em outras
ogy, 3: 105-36, 1968. passagens, sob a forma corrente de "recuperação",
ao invés de o traduzirmos por "revocação", termo
100 T A Y L O R , Robert S. - The process of asking proposto pelo Prof. Antonio A. Briquet de Lemos,
questions. American Documentation, preferível por mais adequado e fiel ao sentido do
1 3 ( 4 ) : 391-400, 1962. original.

101 T H O M P S O N , Frederick B. - Man-machine 3) Ainda em 4. 5, optamos por "estrutura de pilha"


communication. In: S E M I N A R on com- para a expressão "pushdown store" que C. Mont-
putational linguistics. Washington, gomery ( 7 0 ) emprega a propósito do S M A R T e do
Govt. Printing Office, 1968. p. 57-68. Syntactic Analyzer. Valemo-nos da versão usada
pelo Prof. Carlos J. F. de Lucena para "pushdown
102 T O D A , Masano & S H U F F O R D Jr., Emir H. stack" em sua "Introdução às estruturas da infor-
— Logic of systems: introduction to a mação" ( 6 4 ) , trabalho em que aprofunda estas úl-
formal theory of structure. General Sys- timas quanto à "forma em que as mesmas são
tems Yearbook of the Society for implementadas na unidade de armazenamento de
General Systems Research, 10: 3-27, 1965. computadores digitais".
103 T R A D U C T I O N automatique et linguistique 4 ) Sobre a "estrutura intelectual" objeto de 6. 5 con-
appliquée. Choix de communications signa o próprio R. Blanché ( 1 2 ) o fato de que
présentées à la Conférence Internatio- "ultérieurement, l'idée de l'hexagone est apparue
nale sur la Traduction Mécanique et dans un article de L. Hegenberg, A negação, Re-
l'Analyse Linguistique Appliquée. Paris, vista brasiliana de filosofia, 1957, p. 448-57".
Presses Universitaires de France, 1964.
p. 286. SYNOPSIS
104 VAN D I J K , Marcel & VAN S L Y P E , Georges
The specific process of documentary communication
— Le service de documentation face
is envisaged from the point of view of the relations
à l'explosion de l'information. Paris, Les between language and the universe of graphic
Éditions d'Organisation; Bruxelles, Les records which is the object of documentation. As a
Presses Universitaires, 1969 p. 265. sample, several tools for bibliographical research,
originated to this purpose, are descibed, attention
105 V I C 1s E R Y , Brian C. - Technique of infor-
being paid to the most elaborate of all, the docu-
mation retrieval. London, Butterworth,
mentary languages. Linguistic implications of
1970. 262 p.
content analysis are emphasized, as well as the in-
106 W A H L I N , Ejnar — Classification systems terpenetrations of the syntatic and semantic levels.
and their subjects. American Documen- These considerations lead to the examination of the
tation, 1 7 ( 4 ) : 199-205, 1966. logical relations and fundamental categories of
natural and documentary languages, and to a brief
107 W I T T G E N S T E I N , Ludwig. Notebooks. 1914¬ survey of some basic intellectual structures under-
1916, Harper & Brothers, 1961. lying both.

Ci. Inf., Rio de Janeiro, 2(2): 175-217, 1973 217