Você está na página 1de 18

...

ESTUDOS

ELEMENTOS DE RESUMO
Na conversão da linguagem natural para a
LINGÜÍSTICA PARA linguagem documentária, intervém vários fenômenos
lingüfsticos. Para um estudo conceitual desses
ESTUDOS DE INDEXAQÃO fenômenos, procedeu-se a uma seleção de tópicos:
processo de leitura e problemas relativos à semântica
e à sintaxe.

Descritores: Linguagem natural; Linguagem


Anna Maria Marques Cintra documentária; Indexação; Semântica lexical; Lft.itura;
IBICT Smm~ .

A operação denominada indexação é definida como a leitura do documento e essa leitura tanto pode ser
tradução de um documento em termos processada por cérebro humano, quanto por
documentários, isto é, em descritores, cabeçalhos de máquina.
assunto, termos-chave, que têm por função expressar
o conteúdo do documento. A indexação assim Sabe-se que os custos da indexação automática ainda
definida é, pois; uma "tradução lexical" das unidades tornam o processo quase inviável. Freqüentemente
lexicaisda I(ngua em que está escrito o documento,
para unidades lexicais de uma linguagem
documentária. Em geral, as linguagens documentárias
o documento é lido por cérebro humano, processado
e só então entra em máquina. .
possuem uma gramática que corresponde a um Dada a rapidez com que um documento deve ser
conjunto de regras ou instruções (relações booleanas, processado, não é admiss(vel leitura lenta, nem
indicadores de funções, etc.) e a indexação se faz mesmo do documento integral. Muitas vezes o
levando em conta essas regras que expressam laços indexador limita-se ao trtulo, ao resumo e aos
sintáticos e semânticos entre os termos. parágrafos iniciais e finais do documento, na
suposição de que essas partes contenham as
Essas considerações evidenciam alguns aspectos da informações básicas para a sua "tradução" em termos
Lingü(stica Geral que merecem ser tratados num documentários.
trabalho de lingü(stica aplicada à indexação.
Seja numa leitura parcial, seja numa leitura global do
i: comumente admitido o interesse da Lingü(stica texto, o fato é que há um trabalho de identificação
como área de apoio aos trabalhos de documentação, de descritores ou palavras-chave que representem
de modo especial aos procedimentos de indexação. o documento.
Entretanto, não costuma ser claro o recorte que se
deve fazer na teoria, a fim de atender ao interesse Sabe-se, por pesquisas já realizadas* ,que a leitura
documentário. proficiente não se processa palavra por palavra,
mas como um todo reconhecido instantaneamente,
Nossa preocupação nesse trabalho é tentar, seja a n(vel de palavras, seja a n(vel de blocos ou
didaticamente, localizar, dentro do âmbito da segmentos maiores de informação.
lingü(stica Geral, aspectos auxiliares à indexação
em I(ngua portuguesa.

1 - lEITURA DO DOCUMENTO
KATO (1982) refere-se a pesquisas nesta área e amplia
Todo e qualquer trabalho de indexação supõe uma a análise a partir de Smith (1978).

CioInf., Brasma, 12 (1): 5-22, 1983. 5

~
....

Elementos de lingü ística para estudos de indexação


Anna Maria Marques Cintra

Paraum trabalho de indexação, a primeira questão processo de seleção sem dificuldades,


que se apresenta é a da própria proficiência. Será independentemente de análise e slntese. São unidades
proficiente a leitura que faz o indexador, mesmo já convencionalizadas pelo vocabulário especifico da
limitando-se a partes do documento? área que permhem a ativação da memória permanente
do leitor.
A nosso ver, sim. Na medida em que o tftulo é bem
atribuldo, o resumo representativo e os parágrafos Naturalmente, a prática do indexador numa
de introdução e conclusão colocados de forma determinada área do conhecimento amplia seu
adequada, o indexador terá oportunidade de glossário visual e torna o processo de indexação
selecionar palavras-chave indicadoras do conteúdo muito mais rápido.
do documento. Falhas nessas partes do texto
poderão acarretar defeitos de indexação. No entanto, Outras unidades, entretanto, embora apreendidas
não afetam a leitura. em bloco, exigem análise e slntese. Ocorre, então,
a ativação da memória temporária do leitor. São
Há, pois, dois problemas envolvidos: o da unidades desconhecidas que necessitam, para sua'
representatividade efetiva das partes selecionadas em interpretação, da aplicação de regras lexicais, de
relação ao documento e o do processo de leitura que um esforço a mais.
faz o indexador.
A rigor, esses dois tipos de apreensão deveriam
Não vamos discutir a representatividade das partes cobrir o procedimento de leitura a nlvel de
selecionadas. EIas costumam ser aceitas, até porque identificação e interpretação de blocos de
a imposição da rapidez num centro de informação informação. No entanto, uma terceira possibilidade
não permitiria esse tipo de questionamento. deve ser considerada. Trata-se da possibilidade de
ocorrerem seqüências de certa forma desordenadas
Quanto ao processo de leitura, entendemos que as para o leitor e por isso mesmo exigirem leitura
maneiras de ler apontadas por Kato 1 estão, de certa palavra por palavra. Neste caso, a depreensão dos
forma, presentes no procedimento de indexação, descritores é dificultada, ou até mesmo impedida,
como tentaremos apresentar. * a menos que o leitor consiga superar esse estágio
e atingir o da interpretação das unidades. ~
A leitura feita pelo indexador objetiva selecionar
palavras.chave ou descritores, que traduzam o Um dos aspectos tidos como indicador das
documento numa forma compativel com uma dada palavras-chave é a freqüência com que determinadas
linguagem documentária, de sorte a possibilitar a sua unidades ocorrem nas partes lidas. A leitura de uma
recuperação. unidade recorrente, tanto pode se dar por análise e
slntese na primeira ocorrência e depois se processar
Basicamente concorrem dois procedimentos para a por reconhecimento instantâneo, como através da
depreensão dos descritores: a apreensão instantânea memória temporária. Neste tipo de leitura dirigida
das unidadesde informação e a apreensão por análise para a execução de tarefa profissional, admitimos
e slntese. que a recorrência que normalmente ultrapassa o
nlvel da sentença, chegando, por vezes, ao texto,
Determinadas unidades, porque fazem parte do deva ser restrita a blocos de informação. E neste
glossário visual do indexador, são submetidas ao caso a recorrência que em linguagem comum se
identifica com "freqüência", tanto pode ser atribulda
*
à memória temporária, quanto à permanente.
Observando a leitura de um texto novo, feita por um
grupo de alunos de mestrado em Ciência da Informação, De qualquer forma, as unidades recorrentes
verificamos que ela se processa da macro estrutura do texto, permitem um reconhecimento instantâneo porque:
para estrutura menor em níveis diferentes, mas não

-
hierárquicos. A leitura integral do texto foi logo substitu ida
por leituras parciais, especialmente das partes tidas como - o leitor já interpretou o bloco anteriormente,
relevantes: introdução e conclusão. A busca dos termos quando a unidade apareceu pela primeira vez;
representativos se consubstanciou na organização de unidades
selecionadas para a elaboração de resumos do tipo indicativo - o conteúdo semântico da unidade estava no
e do tipo informativo. O procedimento de leitura não variou
para um ou outro tipo, o que se explica pelo fato de o "estado de consciência" do leitor e a primeira
resumo indicativo corresponder à topicalização do texto, ocorrência promoveu a interpretação.
podendo os mesmos tópicos serem colocados em linguagem
concatenada no resumo informativo. Em qualquer das duas situações há a intervenção do
"

6 Cio Inf., Brasllia, 12 (1): 5-22,1983.


Elemento5 de lingüfstica para estudos de indexação
Anna Maria Marques Cintra

que Kato 1 chama de memória rasa: dá conta de algo organização de seus termos e regras em sistema
já introduzido no texto e que mantém, dentro dele, próprio.
o "status" de informação velha.
No conjunto das linguagens, a linguagem
A atuação das três memórias justifica, a nosso ver, documentária decorre das dificuldades que a
a especialização de indexadores por áreas de assuntos, linguagem natural oferece para operar com a
não só por questões ligadas à rapidez do processo, descrição de documentos. De modo especial são
como também por aquelas que marcam a sua entraves a polissemia, a sinon(mia, a homon(mia,
eficiência. a antonímia, os modos e expressões de relações
complexas.
Logo a leitura por cérebro humano será tanto melhor
quando maior for o número de unidades de De fato, a linguagem verbal possui um caráter muito
informação que possam ser processadas pela memória peculiar e complexo, enquanto que para uma
permanente do leitor. estratégia de busca, todo o esforço é feito no sentido
de representar o documento através de processos
lógicos, nem sempre encontrados na linguagem
natural.
2 - CONCEITOSGERAIS
2.1 Linguageme Ungua Sob vários ângulos pode ser observada uma I(ngua.
Da( surgirem diferentes disciplinas Lingü(sticas,
Embora os problemas de tradução do inglês e mesmo dentre as quais destacamos as que decorrem dos três
do francês cheguem, por vezes a dificultar a distinção componentes básicos que integram uma dada I(ngua:
entre linguagem e I(ngua, em português podemos a fonologia, a sintaxe e a semântica.
dispor de significados bastante distintos para esses
termos. Para estudos de indexação importam de modo
especial a semântica, disciplina que se ocupa do
Enquanto linguagem nomeia uma faculdade natural, sentido ou da significação dos elementos * , a sintaxe,
Ifngua refere-se a um caso particular de linguagem. disciplina que se ocupa das relações que se
estabelecem a partir da organização sintagmáti~a dos
A linguagem é uma representação simbólica que
elementos e, de certo modo, a morfologia que,
expressa uma função psico-social complexa.
Corresponde a uma manifestação intelectual e sintetizando parcialmente aspectos da semântica e da
multiforme dos seres, que recobre inúmeras formas de sintaxe, se encarrega da identificação das partes
significar: linguagem verbal (oral e escrita), a pictórica, da palavra e de suas condições de ocorrência.
a musical, a cinética, a mímica, a documentária etc.
A linguagem verbal, embora seja um caso particular, 2.2 "Langue" e "parole"
constitui, na verdade um sistema de signos de
espectro tão amplo, que todos os outros sistemas Considerando que a I(ngua é em si um sistema uno,
de linguagem podem se repassar de I(ngua. DaI. a observação particular de suas partes e dos elementos
porque, freqüentemente, o termo linguagem seja que a organizam, constitui um esforço metodológico
usado por I(ngua, ou a expressão linguagem natural, em busca de aprofundamento do todo.
que normalmente se opõe a linguagem artificial ou
controlada, seja usada também em lugar de linguagem A análise dos dados concretos, dadas as variações
verbal. individuais, levaria a uma dispersão tal que
dificilmente se chegaria a conferir à I(ngua o atributo
Antes de falar tal ou quall(ngua, o homem é um de objeto de uma ciência - a Lingüística, como se
ser apto para estabelecer relações e é essa natureza procedeu a partir da publicação póstuma do Cours
relacional que está na base da linguagem, de Linguistique Générale de Ferdinand de Saussure,
concretização da sua capacidade lógico-simbólica. em 1916. Basta observar as variações de sons entre
pessoas e até numa mesma pessoa, as possibilidades
A linguagem é, pois, um sistema, uma organização de escolha lexical e as diversas atribuições de sentido
relacional, onde cada elemento existe, na medida que se pode dar às palavras.
mesma em que se relaciona a outro ou a outros do
mesmo conjunto. A linguagem documentá ria é pois
A Lexicologia está sendo tomada como disciplina que
linguagem, exatamente porque concretiza a recobre parte da semântica e da sintaxe, já que trata da
capacidade simbólica do homem, através da natureza e organizaça'o do vocabulário de uma língua.

Ci.lnf., Brasrlia, 12 (1): 5-22,1983. 7


Elementos de lingü(stica para estudos de indexação
Anna Maria Marques Cintra

De fato, a Lingüística busca traços invariantes que Esta velha discussãO que se originou na Grécia antiga,
permitam estabelecer modelos. E a oposição levou os lingüistas a admitirem que o atributo de
Saussureana "Iangue/parole" persegue essa análise arbitrária para a associação de um conceito a um
de invariantes. significante, no mínimo não seria adequada, uma vez
que ela era fruto de um conhecimento coletivo,
"Langue", objeto específico da Lingüística, é a numa dada língua. Seria, pois, mais apropriado dizer
abstração que sustenta o processo de comunicação que trata-se de uma relação imotivada, já que se
humana através de signos verbais, isto é, sinais que, estabelece sob a forma de um contrato social que
partilhando do sistema, se submetem a um conjunto não pode ser arbitrariamente alterado pelo indivíduo.
de regras (fonológicas, morfológicas, sintáticas e Assim, o signo lingüístico é arbitrário a priori, mas
semânticas) que tornam, até certo ponto, indiferente não a posteriori.
a matéria dos sinais utilizados.
À primeira vista, esse princípio poderia levar a pensar
Já a "parole" diz respeito à realização concreta, na possibilidade de fixação da relação imotivada entre
aos enunciados produzidos, às manifestações significado e significante, numa dada língua.
individuais, nas quais ficam evidenciadas, inclusive, Entretanto, tendo o signo uma existência apenas
as expressões de criatividade do falante. relacional e decorrendo o significado de dupla
relação: significante/significado e signo/contexto,.é a
2.3 Signo lingiHstico própria imotivação que explica toda a gama de
significados para uma mesma seqüência de unidades
Numa tentativa de síntese do fenômeno língua, do significante, nascendo daI', basicamente, a
podemos dizer que os atos concretos da fala polissemia e a sinonímia.
demonstram que a linguagem verbal consiste num
conjunto de signos verbais que se organizam Nas linguagens documentárias, os signos são também
conforme regras combinatórias. arbitrários a priori, na medida em que são utilizados
significados da linguagem verbal e fixados, ou
o signo lingüístico, na concepção saussureana é arbitrados seus significados no sistema construído.
entidade da "Iangue", constituído de um conceito
(significado) e uma imagem acústica (significante). O princípio da linearidade do significante
O conceito é coisa psíquica, abstrata, a imagem manifesta-se na realização temporal do signo
acústica é marca psíquica do som (não é o som lingüístico. A observação nos mostra que um signo
material). lingüístico qualquer, ao ser expresso, exige uma
seqüência linear de produção que se efetua no tempo
Na concepção saussureana, dois princípios básicos pela realização em língua oral de um som após o
ao nível do signo orientam a organização das outro e em língua escrita, da esquerda para a direita,
Irnguas; o da arbitrariedade do signo e o do caráter letra a letra.
linear do significante.
Nas linguagens documentárias, o princípio da
A chamada arbitrariedade do signo responde, como linearidade é mantido, até porque elas se valem,
veremos rapidamente, por problemas semânticos basicamente, de signos verbais que se transformam
a nívellexical como a polissemia, a sinonímia, as em signos documentários.
relações textuais, por oposição à fixação dos
significados nas linguagens documentárias.
2.4 Léxico, vocabulário, palavra e termo
O princípio da arbitrariedade, na sua formulação
inicial, defendia que a seleção dos sons que compõem Sendo ° signo unidade da "Iangue", julgaram os
um signo não é imposta por nenhum traço do sentido, lingüístas mais adequado analisar essa mesma unidade
isto é, o sentido de árvore, por exemplo, não nos é em diferentes planos de ocorrência. Desta forma, o
imposto pela forma/árvore/. signo é, num nível mais abstrato de consideração,
a unidade disponível no sistema e na própria ~

consciência do falante. Compõem os signos, portanto,


Posteriormente, Benveniste (1966)2 demonstrou que o Léxico da língua, enquanto sistema virtual e não
o arbitrário não é a relação entre o significado e o quantificável, composto das unidades que alimentam
significante, enquanto expressão, mas entre o o vocabulário ativo e passivo do indivíduo.
significante e a "coisa" significada, ou seja entre o
som de árvore e o objeto árvore. No momento em que uma unidade é atualizada,

8 Ci. Inf., Brasflia, 12 (1):5-22,1983.


Elementos de lingü(stica para estudos de indexação
Anna Maria Marques Cintra

tem-se um vocábulo. O vocabulário, então, pode ser Essa conceituação, de fato, autoriza o uso desse
analisado quantitativa e qualitativamente, enquanto elemento como unidade do vocabulário especifico
ato realizado. das linguagens documentárias, ao mesmo tempo
em que mostra a sua fragilidade para o uso
Palavra, por sua vez, é unidade de ditlcil especializado da Lingüistica.
conceituação, embora largamente usada na linguagem
comum e por isso mesmo detentora de um significado
ligado à organização gráfica da IIngua. 3 - LINGUAGEM NATURAL E LINGUAGEM
DOCUMENTÁRIA: SEMELHANÇA E
Pottier3 considera "palavra" a unidade formal, DIFERENÇAS
composta de morfemas e definida no quadro de uma
lingua determinada. Outros autores tomam palavra Observando as linguagens documentárias (LD) e o
como unidade de texto. comportamento das lI'nguas - linguagem natural
(LN) - evidencia-se um aspecto de semelhança
De qualquer forma, o que se observa é que, na entre elas: as LD trabalham com descritores e
prática, lidamos com palavra e no trabalho de termos-chave que são entidades bastante
indexação, de modo especial, em que se opera com semelhantes aos lexemas da LN, na medida em
língua escrita, o termo "palavra" é largamente usado. que nos sistemas dos quais fazem parte,
correspondem a unidades portadoras de forma e
Para a organização de vocabulários, concorrem dois significado.
tipos de unidades: as que contêm o significado lexical,
ou seja, aquelas que expressam o "suporte de Ao nivel formal, podemos analisar os descritores em
conceito" do mundo bio-social, e as que contêm termos de:
signifiçado gramatical, por isso mesmo denominadas
"indicadores de função". Essas unidades, a. sintagmas de simbolos notacionais (números,
respectivamente nomeadas morfema lexical e letras, pontuação, marcas) isto é, unidades resultantes
modema gramatical, tanto podem coincidir com da combinação de formas menores em unidades de
palavras da Iíngua, quanto com unidades morfológicas n(vel superior. Ex.: leit - eira ~ leiteira; o, vestido,
minimas, como mostram os exemplos: verde, de, Lúcia ~ O vestido verde de Lúcia. ..

morfemas lexicais morfemas gramaticais b. lexemas como combinação de fonemas, ou seja,


mar que como combinação de unidades capazes de promover
leit- -eria a distinção entre signos da lingua. Ex.: lago 1:lato
pela troca de um único elemento na seqüência,
o fonema g por t.
Na verdade, não há entre lingüistas grande
preocupação em conceituar palavra e muito menos Ao nivel semântico, os descritores têm um sentido
termo, porquanto são denominações fortemente (designata* ), semelhante aos sememas da LN,
ligadas à Iíngua escrita, código secundário para a ordenados em semas, ou seja, conjuntos de unidades
Lingüistica que trabalha prioritariamente com a minimas de significado.
lingua falada.
Algumas diferenças básicas, entretanto, podem ser
Ainda com relação a palavra há tentativas de anotadas:
conceituação, embora, na prática, freqüentemente
"palavra" e "vocábulo" sejam usados como a. Na LN a escrita é secundária, enquanto que nas
verdadeiros sinônimos. Termo, entretanto, não LD ela é fundamental.
costuma ser unidade de uso no vocabulário
especifico da Lingüística. b. Do ponto de vista semântico, as LD padronizam
e simplificam o relacionamento entre lexema e o
Mattoso Câmara Jr., no seu Dicionário de extrato semântico. Na LN há sinônimos e
Filologiae Gramática, informa que "termo" é "em
sentido gramatical estrito, vocábulo ou grupo de *
vocábulos que cor responde a uma unidade Na concepção semiótica de Ch. Morris, são necessários
de significação ou de função, como elemento três componentes para que algo funcione como signo: ter um
veículo, ter um sentido ou designatum que corresponde
constitutivo para a inteligibilidade do que se àquilo a que o veículo se refere e um interpretante que se
enuncia". refere ao efeito desta unidade sobre um intérprete.

Ci.lnf., Brasrtia, 12 (1):5-22, 1983. 9


..

Elementos de lingü(stica para estudos de indexação


Anna Maria Marques Cintra

homônimos, mostrando a não correspondência um incorpore isso, ou não, resvala continuamente em


a um entre significantes e sememas. fatores lógicos, antropológicos, sociológicos e
psicológicos.
c. A LN pode funcionar como sua própria
metalinguagem *. As LD, não. Elas necessitam da Assim, embora, por exemplo, a questão da verdade
do significado interesse diretamente ao filósofo, ela
LN, ou de outra linguagem artificial para falar delas.
não deixa de se emiscuir numa análise lingüfstica.
Para o lingüista, no entanto, o que importa é
d. As LD têm um propósito especifico de
circunscrever seu objeto de análise, no caso o
organização de funções e por isso mesmo pode-se
dizer que são governadas por regras de "JURE", significado, ao nfvel da palavra, da frase, ou do texto,
dependente ou independentemente do contexto
ou seja, por regras estabelecidas por um 'indivíduo
situacional, conforme a sua opção teórica.
ou grupo que cria o sistema. A LN, entretanto,
embora portadora de organização, apresenta uma
Sem dúvida, é a questão do significado o problema de
complexidade tal, que suas funções são governadas
por regras de "FATO", não de direito, na medida contorno mais complexo para as linguagens'
em que não são criadas no todo por um indivíduo, documentárias, no trato com termos da linguagem
mas atendem às diversas necessidades de natural. Reconceituar ou delimitar a significação de
um termo, mesmo que seja para incorporá-Ia num
comunicação do grupo social.
sistema, como é o caso das linguagens documentárias,
implica em escolha num quadro de possibilidades,
4 -SEMÂNTICA por vezes, amplo e variável, de grupo para grupo, de
região para região.
Os estudos semânticos que ficaram mais ou menos
estacionários até a década de 60, adquiriram uma Diante do complexo universo da Semântica,
dinamicidade muito grande, em especial nos últimos entendemos que o apoio teórico para trabalhos de
quinze anos. indexação teria de levar em conta, num primeiro
momento, a Semântica Lexical, que trabalha ao
Dentre os vários estudos de semântica, destacam-se, nfvel da palavra e atinge, no máximo a frase. ..
grosso modo, duas vertentes: a semântica estrutural
e a semântica gerativa. A semântica estrutural Nesta linha, começamos por fazer notar que os
ocupa-se, basicamente, com o estudo descritivo estudos semânticos podem analisar o significado das
da natureza e funcionamento do significado do unidades, buscando constantes e variáveis lexicais,
signo, visto como elemento do sistema lexical de a partir do mecanismo gerador (onomasiológico),
uma Ifngua. A semântica gerativa, de outra parte, centrado no emissor, ou a partir de mecanismo
se propõe a um estudo da competência do falante interpretador (semasiológico), centrado no receptor.
nativo, ao nfvel do significado. Segundo esse enfoque, No primeiro caso o foco fica sobre o significante
o falante é portador de um "dicionário" que contém e no segundo, sobre o significado.
informações semânticas básicas e regras de projeção
que lhe permitem produzir e reconhecer as frases Os signos lingüfsticos, por simbolizarem ou
de sua Ifngua, bem como interpretar frases amb{guas representarem as "coisas", através de uma relação
e identificar anomalias sintático-semânticas.* * arbitrária entre significante e significado, OIJ
imotivada em relação ao referente, alimentam toda
A Semântica como disciplina lingüfstica sempre se
a polissemia da linguagem natural, ao mesmo tempo
debateu com dificuldades de precisão metodológica,
em que propiciam construções denotativas e
pois que a identificação do significado, quer a teoria
conotativas. A denotação decorre de considerações
externas do signo, isto é, da consideração de seu
* Metalinguagem ti a linguagem usada para falar sobre
outra linguagem, a linguagem objeto, ou sobre si mesma. caráter referencial. A conotação, ao contrário, nasce
Ex.: a Ifngua portuguesa pode ser usada como metalinguagem de uma relação simbólica. ** *
para falar sobre s(mbolos matemáticos: "o sinal +significa
adiça'o". Também pode ser usada para falar dela mesma.
"a palavra menino ti composta de três sflabas, seis fonemas e A linguagem denotativa ti a C!ueexpressa o si~nificado
significa "ser humano", "jovem". "sexo masculino", etc. concebido "objetivamente", por oposiça'o ã linguagem
conotativa que expressa valores "subjetivos" ligados ao
.. A simplificaçãO que fizemos atende a objetivos próprio signo. O termo cloreto de .ódio, provavelmente,
práticos. De fato, tanto sob a tlgide da Lingü(stica Estrutural, denota um significado objetivo, o da própria substância
quanto da Gerativo-transformacional e mais recentemente que ele nomeia; o termo praia, no entanto, num dado
da Pragmática, o problema do significado lingü(stico tem contexto, pode conotar "descontraça'o", "Iazer", etc.,
recebido orientaçc5es bastante diversas. embora nllo se anule seu significado objetivo.

10
Ci. Inf., Bras(lia, 12 (1): 5-22,1983.
r----

Elementos de lingü(stica para estudos de indexação


Anna Maria Marques Cintra '

Nas linguagens de mdexação, no entanto, os signos devem ser reduzidos ao máximo, em função da
em geral, recortam o âmbito significativo dos termos fixação dos significados.
de uma língua particular, fixando significados, de
forma a anular a arbitrariedade do signo lingüístico. 4.2 Homonímia
São significados fixos, que por isso mesmo não
permitem a conotação. Corresponde a homonímia à igualdade entre
significantes de significados diferentes. É, pois,
Desta forma, os signos, documentários, por sua o estudo das formas que apenas se diferenciam
natureza mais estática, exigem do indexador um pela significação ou função, já que a estrutura
trabalho de percepção do universo onde atua, para fonológica é a mesma.
que não só a tradução do documento em termos
da linguagem documentá ria se faça com fidelidade, A homonímia pode ser:
mas para que essa tradução tenha um forte poder
de partilha na comunidade à qual o documento - total, como em fiar que tanto significa "tecer",
se destina. quanto "confiar";

A redução dos significados, por ser uma operação - parcial, como em coser e cozer.
de corte num universo praticamente ilimitado,
poderá se valer de alguns conceitos correntes em É poss(vel a um mesmo grupo de formas
linguagem natural. Dentre eles selecionamos a apresentar homon(mia total e parcial. Exemplo:
polissem ia, a homon(mia, a sinonímia e a era = "época" e "1 !'Ie JéI. pessoas do singular do
antonímia. pretérito imperfeito do indicativo de ser; hera =
"planta".
4.1 Polissemia
Nas linguagens de indexação, o homônimo parcial
A polissemia é o nome dado à plural idade de sentidos não gera nenhuma dificuldade, pois elas lidam
de uma mesma forma. Estuda as várias significações com I(ngua escrita e então a homon(mia se desfaz.
da significação lingüística, significações essas que Já a homonímia total pode representar alguma ..
se definem e precisam num determinado contexto. dificuldade, contornada, provavelmente, pela escolha
Só o contexto poderá precisar se a palavra paixão, de sinônimo de maior poder de recuperação.
por exemplo, se refere a "sofrimento", a "sentimento
imoderado", a "amor violento", a "falta de No caso de documentos especializados, é pouco
objetividade no julgar" etc. provável a presença de homônimos totais, pois o
recorte significativo da área dificulta a possibilidade
A polissemia pode se dar por: de duplo significado.

- extensão, como, por exemplo, em estação que 4.3 Sinonímia


pode significar: "parada", "épocas do ano", "cada
uma das catorze paradas da Via Sacra", "temporadas
da moda"; A sinonímia decorre de coincidência de significado
entre diversas palavras. É o estudo da substituição
- metáfora que é um tipo de extensão, no qual de termos, sem prejuízo da comunicação. Exemplos:
atua um componente analógico. Em serra, por o significado de "mar" pode ser expresso através dos
exemplo, o significado de "montes" decorreu da termos mar, oceano, pego, pélago; e de "ser alado"
analogia com o instrumento "serra"; por ave, pássaro.

- restrição, como, por exemplo, abrir (do latim A utilização do sinônimo é, provavelmente, uma
aperire) nos deu a palavra aperitivo, que por sua vez dificuldade mais séria para as linguagens de
corresponde a dois termos restritos a dois indexação. Basta observar que em lI'ngua portuguesa,
significados: "purgativo" na linguagem médica e nossos padrões estéticos não permitem, mesmo em
"beberete" na linguagem comum. linguagem científica, a constante repetição de um
mesmo termo. Isso gera no documento a presença
~ da mesma idéia convertida em várias seqüências
Enquanto na linguagem natural os mecanismos diferentes, isto é, em formas sinônimas. A escolha
polissêmicos são promotores de larga margem de de uma destas formas torna, por vezes, muito
rriatividade, nas linguagens documentá rias eles complexa a situação do indexador, que acaba tendo

CioInt., Brasrlia, 12 (1): 5-22, 1983. 11


...

Elementos de lingüfstica para estudos de indexação


Anna Maria Marques Cintra

desevalerde sinônimos mesmo, onerando o sistema A onomasiologia e a semasiologia deixaram de ser


de indexação com muitas informações. dois métodos diferentes e passaram a ser tomadas
como dois enfoques, ou dois movimentos de
4.4 Antonímia observação dentro da teoria semântica.

A antonímia decorre de significações contrárias de No enfoque semasiológico a análise cor responde ao


dois vocábulos ditos autônomos. ~ o estudo de agrupamento das palavras em torno de um nó de
palavras com significações opostas, como amor significação, de um campo de sem as. Exemplo:
/ódio; bom/mau; moral/imoral, progrediu/regrediu.
espalhar - "separar a palha" dos cereais
Neste caso importa lembrar que o indexador, muito "lançar para diferentes lados"
provavelmente, não usa o conceito de antônimo, "dispersar"
ou dito de outra forma, ele incorpora a forma "espargi r"
antônima ao sistema, como se fora um sinônimo, "aspergi r"
ou parte natural de um signo documentário. Assim, "divulgar"
um documento que tratasse, por exemplo, de "difundir"
problemas de imoralidade, seria identificado pelo "irradiar"
termo moral que recobriria o significado "tornar público", etc.
antonímico.
O nó semasiológico, ao que tudo indica, é o
Nas áreas especializadas, entretanto, o problema significado original "separar algo de algum ponto".
não é tão simples. À primeira vista, poderíamos
dizer que oxidação e redução, ou aquecimento e Constitui dificuldade para lidar com campo semântico
resfriamento expressam significações contrárias. a distinção entre significações correntes e
No entanto, correspondem a processos autonômos, significações esporádicas, além de interpretações
o que não nos permitiria, provavelmente, tratá-I os
como antônimos. .
diversas, tendo em vista o contexto lingüístico.

"Toda palavra é formada de um nó semântico


mais ou menos denso, ou mais ou menos
5 - CAMPOSSEMÂNTICOSE SINONfMIA
volumoso, cercado por uma auréola de
associações secundárias, afetivas ou sociais."
A teoria dos campos semânticos nasceu em 1930, Guiraud4
como uma corrente da onomasiologia sincrônica.
De acordo com esse enfoque, o semanticista parte
Segundo Jost Trier, o lingüista alemão que a de elementos lingüísticos (formas) e verifica o campo
concebeu, nenhuma palavra vive em estado de que criam com suas conexões e oposições; em
isolamento na consciência do falante, mas está seguida, estabelece, previamente, certos campos de
rodeada de toda uma série de expressões ligadas
significação, em função da vida social e estuda os
pelo significado, formando no interior do elementos lingüísticos que neles se dispõem.
conjunto lexical algo como um campo de palavras
mais ou menos fechado.
Nas linguagens documentá rias, esta concepção
semasiológica é que determina a organização de
O trabalho do semanticista corresponde, então,
conjuntos de termos em torno de nós semânticos,
em efetuar um corte horizontal, sincrônico num
que por sua vez determinam os cortes no campo
determinado campo conceitual e identificar um do significado.
conjunto de significações correlatas.
Desta forma, só dominando o universo do significado
Uma das vantagens que essa teoria trouxe para a é que se pode operar satisfatoriamente com restrições
semântica foi o alargamento da concepção que cubram um dado campo semântico e organizar
onomasiológica e semasiológica para estudos coleções finitas de palavras-chave.
sincrônicos, antes restritas apenas a análises
diacrônicas. Com a teoria dos campos semânticos, O enfoque onomasiológico pode ser encontrado nos
as palavras passaram a ser analisadas sincronicamente dicionários de sinônimos. Decorre das associações
e os estudos semânticos se libertaram de certa que uma palavra manifesta em relação a outras,
limitação, decorrente de estudos dirigidos a conceitos graças a significações correlatas. Vale observar que,
concretos, a palavras do campo material. neste caso, há distinções entre vocábulos de uso

12 Ci.lnf., Bras(lia, 12 (1):5-22, 1983.


-

Elementos de lingü(stica para estudos de indexação


Anna Maria Marques Cintra

corrente e de uso esporádico, além de usos Ex.: jerimum/abóbora (norte e sul)


diversificados em função do contexto lingüístico. vasca/tanque (passado e presente)
Exemplo: sol, astro, estrela, planeta; dinheiro, emagrecer/esmagrecer (nível social)
riqueza, fortuna, tutu, bufunfa. sal/cloreto de sódio (uso comum e uso técnico)
está bem/legal (velho e jovem)
o princípio básico é que o lugar semasiológico
determina a posição da significação no campo Nesses casos a homossemia é dita diassistemática.
onomasiológico.
Observando a diversidade de comportamento
Para o estabelecimento do campo semântico é semântico dos vocábulos, é possível identificar
prioritária uma análise sêmica, também chamada conceitos nos quais ocorre:
componencial pela Lingüística americana. Essa
análise visa a depreender os traços semânticos - delimitação bem precisa
mínimos (semas ou componentes) que relacionam Ex.: segunda-feira é diferente de domingo e de
e distinguem os elementos de um campo lexical e qualquer outro dia da semana.
consiste em estabelecer, no plano do conteúdo,
através de relações associativas, os semas constituintes - imprecisão expressa através de zonas fluídas de I
de determinadas unidades. transição
Ex.: dia e noite - "dia" é também o período de
Assim, um dado con'junto de palavras (vocábulos) 24 horas e inclui a noite;
constitui um campo semântico, na medida em que frio e calor
haja, pelo menós um sema que esteja presente em grande e pequeno
todas as unidades daquele conjunto.
A imprecisão e a sinonímia são, provavelmente os
Segundo Pottier5, a diversidade de relações dá ao aspectos da linguagem natural que oferecem maiores
falante (emissor) a possibilidade de, partindo de um dificuldades ao indexador. Para o lingüista esses
ponto de vista onomasiológico, poder fazer escolhas problemas, embora não satisfatoriamente .
em vários níveis: solucionados ao nível componencial (de modo
muito especial a imprecisão) são de tratamento
a. entre variantes combinatórias ou livres; relativamente mais simples, na medida em que se
tem como suposto que o significado decorre do
Ex.: louro/loiro (variantes livres) relacionamento das unidades que organizam a
eu vou, eu irei, nós vamos (variantes sentença. Logo, qualquer alteração que se faça
combinatórias) numa unidade acarretará modificações no
ler/leitura (Iexemas - variantes combinatórias) significado.

Nesses casos ocorre homossemia total, uma vez que Para o trabalho de indexação, o que nos parece claro
as formas manifestam absoluta identidade de é que uma análise componencial dos termos tornaria
significado. inviável o processo que exige eficiência num curto
espaço de tempo. Desta forma, entendemos que a
b. entre formas variadas para substância semântica compreensão da problemática do significado, ao
bastante semelhante: nível da "palavra", oferece ao indexador muito mais
a dimensão do problema, que a solução operacional.
O trabalho de indexação corre por conta da seleção
Ex.: faz dois dias/antes de ontem de palavras-chave num processo em que uma
fazer um erro/enganar-se linguagem controlada se associa à intuição do
Pedro vende vinho/O vinho é vendido por Pedro indexador.

Nesses casos a homossemia é parcial, porque há


diferenças de conotação na escolha de uma ou outra Na elaboração de um texto e mesmo na sua tradução,
forma. Dependendo do foco que se quer ressaltar, há situações de difícil troca de palavras e outras
da intensidade que se quer dar, usa-se uma ou outra. mais flexíveis.

c. entre forma especializada ou de uso corrente, O vocabulário técnico é, com certeza, o que exige
conforme a região geográfica, a época, o nível social, maior precisão, o que apresenta o fator emocional
o uso técnico, a faixa etária, etc. do emissor em estado mais próximo ao "neutro".

Ci.lnf., Brasflia, 12 (1): 5-22,1983. 13


Elementos de lingü{stica para estudos de indexação
Anna Maria Marques Cintra

o vocabulário comum, entretanto, só perde em - toda troca de vocábulo implica em troca de


imprecisão, ambigüidade e intervenção do fator semema e esse processo acarreta alteração na
emocional para a linguagem literária. comunicação, pela perda de alguns semas e/ou pela
introdução de outros.
Na observação de casos extremos cabe uma questão:
a possibilidade de troca de palavras num mesmo Já nas linguagens documentárias observa-se que:
contexto deve ser entendida como relação
sinonímica ou de variantes lexicais? - cada signo documentário se opõe a todos os
outros do sistema no qual se inscreve;
Com efeito, a maioria das permutações de palavras
gera alteração do significado objetivo, do tom - cada signo está inscrito numa rede semântica
sentimental, ou mesmo do valor evocativo. que permite ordenar os termos em organizações
do tipo de tesauros;
No caso de termo técnico, a escolha, por exemplo
entre Fonêmica e Fonologia, ou entre Ciência da - o significado de cada signo está previamente
Informação e Informática evidenciam, nas respectivas delimitado e assume precisão na relação que
áreas, posições teóricas, linhas de orientação do estabelece com todos os outros do sistema;
emissor. Já a opção entre Usuário, Leitor e
Consulente parece identificar, por um lado época - a troca de um termo não necessariamente implica
(usuário e leitor/consulente) e de outro, uso comum em alteração no resultado comunicativo, quer pela
e uso em situações de especialização (leitor/usuário), utilização de sinônimos, quer pela inclusão dos
decorrentes da evolução tecnológica que vem antônimos.
tornando o acesso à informação cada vez mais
dinâmico.

Os estudos lingüísticos levam a não admitir a 6 - VOCABULÁRIO ESPECIALIZADO


existência do sinônimo perfeito. ~ o interesse ou a
incerteza das apreciações que norteiam a escolha Afirma Benveniste6 que a história de uma ciê~cia
entre justo e eqüitativo, entre punir e castigar. se resume na história de seus termos próprios.

Por outro lado, há quem defenda a existência do De fato no âmbito da linguagem natural, as linguagens
sinônimo, respeitada a condição de que, ao nível do especializadas ou científicas apresentam como
sentido objetivo, seja possível obter uma peculiaridade a existência de um vocabulário próprio
representação diferente para o mesmo significado. que se caracteriza pela maior precisão de seus termos,
já que a expressão técnica ou especializada é centrada
Ex.: pediatra e médico de criança na função referencial da linguagem.
Eu chegarei após sua partida e Você partirá
antes de minha chegada. Em geral a palavra, neste uso, tem um significado
unívoco, daí podermos nos referir a ela como
Em termos de comunicação, não há prejuízo nem monovalente.
ganho com essas trocas. Com efeito, hoje, pediatra
é termo de domínio comum; a mudança do tópico No entanto é preciso considerar que mesmo no
nos dois enunciados dá a mesma informação objetiva. vocabulário técnico ocorrem áreas de imprecisão.
Como exemplo pode ser citado o espectro das cores,
Em síntese, e de um ponto de vista estrutural, o que onde temos matizes com limites absolutamente
se observa numa análise semântica ao nível lexical fluídos: cinza/cinza claro/cinza escuro/cinza chumbo;
é que: verde/verde claro/verde escuro/verde musgo/verde
água.
- cada signo lingüístico se opõe a todos os outros
da II'ngua; Freqüentemente, nas linguagens técnicas, as palavras,
por serem monovalentes, provocam uma
- todo signo está inscrito numa rede semântica e os hermetização, só rompida por processos de
trechos mais compactos formam famílias semânticas; vulgarização, especialmente hoje, através dos meios
de comunicação de massa (Ex.: acoplamento, 0.1.),
- só o contexto permite dominar e precisar o pois há natural tendência para perder a monovalência.
significado de um signo lingüístico; ~ o campo da imprecisão que se instaura.

14 Cio Inf., Bras(lia, 12 (1): 5-22,1983.


Elementosde lingüística para estudos de indexação
Anna Maria Marques Cintra

Basicamenteum vocabulário especializado se forma revista referência


por um dos três procedimentos abaixo: manuscrito base de dados
mapa
- a partir de vocábulos da linguagem comum que, livro raro
redefinidos,assumem sentido especial.
b. Lugar:
Naturalmente esse procedimento é o mais sujeito a biblioteca arquivo
ambigüidadese a única forma de minimizar essa biblioteca pública estante
tendência indesejável na Ciência é proceder a biblioteca universitária fichário
constantes redefinições. biblioteca central caixa-estante
biblioteca especializada
- pela criação de neologismos que se valem dos seção de circulação hemeroteca
processosde formação vocabular da Irngua. Ex.: consulta audio-visual
rádiodifusão. referência base de dados
aquisição banco de dados
- pela adoção de vocábulos estrangeiros,
aportuguesados ou nl.lo. Ex.: xerox, feed-back. c. Agente:
bibliotecário
6.1 À guiza de exerc(cio auxiliar de biblioteca
leitor
À guiza de exercício, escolhemos o vocabulário de usuário
Biblioteconomia e Ciência da Informação e tentamos consulente
organizá-Io em subáreas significativas.
d. Modo:
Inicialmente, fizemos um levantamento dos termos recuperação da biblioteconomla
em resumos e títulos de artigos publicados nas informação
quatro revistas da área (São Paulo, Brasília (duas) e catalogação depósito legal -
Belo Horizonte) e pudemos observar que boa parte divulgação de serviços
do vocabulário é formada pela especialização de bibliotecários
vocábulos da linguagem comum, ou por empréstimo treinamento de pessoal
a outras áreas. Ex.: recuperação da informação, sistema de biblioteca
sistema, rede. catalogação centralizada
serviço de alerta
Na tentativa de organizar núcleos semânticos dentro indexação
do vocabulário especializado da área, que de si já disseminação de informação
constitui um campo semântico, organizamos algumas processamento de informação
classes a partir do seguinte raci06.I'nio: a área lida com rede
um objeto, apresentado em detertninados suportes acesso
materiais, submetidos a determinad- 'pe rações , acesso on-line
para certos fins,
e. Instrumento:
A partir, pois desses quatro polos e sem nos ficha linguagem documentária
limitarmos ao vocabulário retirado do corpus *, máquina leitora audio-visual
buscamos ordenar os termos, segundo categorias carro biblioteca base de dados
semântisss, como segue:
f. Produto:
a. Objeto: catálogo informação
livro acervo informação índice levantamento bibliográfico
periódico documento linguagem documentária sumário corrente publicação
jornal coleção autor
g. Finalidade:
* acesso
Para um levantamento de vocabulário discriminante busca
de área, organizamos um corpus a partir de 73 artigos (título
e resumo) publicados entre 1978 e 1980, nas quatro revistas busca retrospectiva
brasileiras de maior divulgação nas áreas de Biblioteconomia recuperação
e Ciência da Informaça'o. disseminação da informação

Cio Inf., Brasflia, 12 (1): 5-22, 1983. 15


Elementos de lingüística para estudos de indexação
Anna Maria Marques Cintra

Como se observa, um mesmo termo pode, numa dada Na concepção mais tradicional, à gramática cabe o
categoria, ter capacidade referencial tal, que recobre estudo das relações sintagmáticas e associativas, por
outros. ~ o caso de documento que pode recobrir o isso mesmo os estudos de Morfologia (forma) não se
conjunto dos objetos com significado mais objetivo separam dos da Sintaxe (funções).
que acervo.
À Sintaxe, especificamente, compete estudar a
De outra parte, há elementos que podem participar
combinatória de unidades da I(ngua que permite,
de mais de uma categoria, como os referentes de
partindo de unidades menores, construir unidades
"lugar onde se colocam os documentos", ou algo
maiores. Assim, defonemas se constroem morfemas,
relativo a eles: arquivo, estante, fichário, que tanto
podem ser focalizados como "objetos", quanto como de morfemas, vocábulos, de vocábulos, sintagmas
"elementos do acervo". e, por fim, de sintagmas se constroem frases.

7 - SINTAXE Várias orientações ocorreram ao longo do tem'po,


tanto nos Estados Unidos, quanto na Europa.
A sintaxe, na mesma linha de simplificação que Mas, em linhas gerais, os métodos anal(ticos da
fizemos na parte de Semântica, pode ser enfocada sintaxe estrutural prevêem:
a partir de duas vertentes: a sintaxe estrutural e a
sintaxe gerativa-transformacional. a. a segmentação do texto em unidades
sintaticamente irredut(veis e a classificação das
A sintaxe das linguagens documentárias, que com mesmas;
certeza não oferece o grau de dificuldade das I(nguas
naturais, tanto tem se valido da visão estrutural, b. a identificação dos princ(pios ou regras que
quanto da transformacional. A sintaxe estrutural determinam as relações que se estabelecem num
pode servir de apoio aos trabalhos de análise da enunciado.
I(ngua com objetivos à automatização, enquanto
a sintaxe transformacional tem sido utilizada mais Alguns pressupostos sustentam a análise -
diretamente, através do modelo de Casos de Charles sintagmática. São eles:
Fillmore, para fins de indexação pelo PRECIS~
- a linearidade do discurso, decorrente da própria
Dentre os modelos estruturais parece-nos ser a linearidade do significante. Ex.: a, bela, casa, verde
Sintaxe Distribucional o mais interessante para ~ a bela casa verde;

trabalhar com enunciados concretos, sem dar ao


significado um valor central. - a consideração de n(veis de análise que se montam
numa hierarquia. O sintagma assim é formado por
Observando os processos de indexação a partir de unidades do mesmo n(vel hierárquico. Ex.: minha,
palavras-chave, algumas noções da sintaxe natural da bolsa ~ minha bolsa; cas-inh-ola ~ casinhola
I(ngua, merecem análise. Dentre elas, destacam-se
alguns aspectos da coordenação e da subordinação **. - a compatibilidade semântica entre o resultado
sintagmático e os significados dos componentes.
*
Preserved Context Index System. Sistema de Ex.: des-fazer (neg. + base); -colar (neg. + base)
indexação alfabética desenvolvido pela British Library, a A incompatibilidade semântica não autoriza
partir de 1971.
.. Noções como as de adiça"o, disjunça"o, inclusão,
exclusa"oetc. parecem básicas. A posição do adjetivo no
segmentar no mesmo paradigma: de-mente e
se-mente.
Sintagma Nominal (SN) costuma incomodar os indexadores.
Sabemos que vários estudos têm sido feitos a respeito da
- a recorrência dos componentes do sintagma,
posiça"odo adjetivo em português. Entretanto, a nosso ver, expressa através da possibilidade de um componente
na base da problemática abordada por indexadores não está integrar diferentes combinatórias. Ex.: fácil,
uma questão propriamente lingüística e sim o resultado de facilidade, facílimo, facilmente, desfazer, descolar,
nossa dependência científica e tecnológica. Grande parte, desmentir.
senão a maioria dos documentos nas áreas especializadas de
ciência e tecnologia são escritos em inglês, o que justifica a
casa
utilização de tesauros proveniente de países de Iíngua inglesa, minha casa
espeéialmente Estados Unidos. A utilização de uma margem a casa amarela
insignificante de documentos em português não justifica a nesta casa grande
construção de linguagens controladas adequadas à realidade
da língua portuguesa, permanecendo o desencontro entre a
estrutura da língua portuguesa e a da linguagem Embora as descrições sintáticas variem bastante, é
documentária adotada. poss(vel, em linhas gerais, dizer que na Europa a

16 Ci.lnf., Brasrlia,12 (1):5-22,1983.


Elementos de lingü(stica para estudos de indexação
Anna Maria Marques Cintra

concepção predominantenos trabalhos de descrição as unidades de um nível superior. Ex.: Idl e lei -* de;
era a de que "descrever é conhecer alguma coisa (a) e (casa) -* a casa; (a casa) e (é grande) -* a casa
pelosseus acidentes, ou marcas". é grande. '

A conseqüência disso é que toda análise sintática As classes, então, são ordenadas a partir de CI
européiatrabalhou menos na busca da essência idênticos, ou seja, a partir da distribuição dos
universaldos fenômenos, na medida em que ficou, elementos nos diversos níveis. Ex.: (Detj a e (Subs.)
de preferência, em fenômenos individualizados, casa se distribuem numa certa ordem no Sintagma
naquiloque distingue uma coisa de outra. Nominal (SN); a (Det) I a (Pron) porque o primeiro
ocorre no SN e o segundo no SV (Sintagma Verbal).
NosEstados Unidos, a preocupação foi com a
identificação de principios, de regularidades Também em função do Det. a observa-se que a e o
subjacentes aos atos de fala e como conseqüência, determinam duas classes de morfemas nominais, que
buscou a Lingüistica americana traços pertinentes se distribuem completamente: o menino/a menina".
que, ultrapassando o nivel dos individuos,
atingissempragmaticamente, a todos os falantes, No sentido de obter um método mais econômico para
ao sistema enfim. a organização das classes, o distribucionalismo se vale
da comutação que permite dizer, por exemplo, que
dois fonemas são diferentes, na medida em que, pela
troca dessas unidades entre si, são formadas, num
7.1 Análise Distribucional
segundo nível, unidades significativas diferentes.
Ex. : I I I e I m I
Teoria sistematizada na década de 30, dominou a l-ar l-ata
Lingüística americana até pouco mais de 1950. m-ar m-ata

Tendo por base a teoria psicológica behaviorista, Esse processo permite, ao nivel dos morfemas e dos
tomam os distribucionalistas o ato de fala como sintagmas, organizar as classes de Det. definidas pelas
um tipo especial de comportamento. A estrutura possiveis combinações com os nomes do mesmó
da lingua corresponde a uma arquitetura, onde os tipo. Ex.:
elementos existem em estado de interdependência. a casa era o popular Geraldo Boi
esta casa era o Geraldo
Disso decorre a possibilidade da linguagem a partir aquela casa era Geraldo BOI
de situações concretas. certa casa era Geraldo
mesma casa
Então o estudo de uma Iingua tem de ser feito alguma casa era o grande mentecapto
tomando-se um corpus, isto é, um conjunto de
enunciados homogêneos, efetivamente emitidos, A substituição pode se dar entre seqüências. Ex.:
que independentemente da sua significação o vaso quebrou.
evidenciam as regularidades da Iingua (as próprias o vaso de porcelana chinesa quebrou.
regras) num dado momento. o carro de minha filha quebrou.
o avião do presidente quebrou.
A análise, basicamente, sincrônica, realiza-se pela
exclusão da função, da significação e da situação. Pode-se observar também que, pelos exemplos,
A única noção levada em conta é a de contexto linear, determina-se uma classe de nomes femininos que
por isso importa conhecer num enunciado, quais aceita combinar com o~ Det. A distribuição de um
unidades seguem ou procedem um dado elemento. elemento é, pois, a soma de todos os seus contextos.

Logo, O'contexto é toda a série dos co-ocorrentes de Basicamente se organizam dois tipos de classes:
um dado elemento. E a distribuição de uma unidade
se define pelo conjunto de contextos em que ela a. as sintagmáticas, que correspondem à seqüência
é encontrada no corpus. linear, horizontal. Ex.: um elemento qualquer A é
definido pela sua relação na cadeia falada com
A segmentação do enunciado faz a sua decomposição elementos do tipo X e Y: a casa amarela
em unidades sucessivas menores, do que nasce a casa a amarela
noção de constituintes imediatos (CI), ou seja, de
ur idades de um nivel inferior é que são organizadas b. as paradigmáticas, que correspondem aos

Ci. Inf., Brasrlia, 12 (1): 5-22, 1983. 17


~LhYrf:K..A
" ,i:.L...,- ::'=, rlUf1"0'.-"_"
"
",q,,;. ~ '"
Elementos de lingürstica para estudos de indexação
Anna Maria Marques Cintra .

segmentos possíveis num mesmo contexto. Assim verbQs permite sua subdivisãO em transitivos e
A e B fazem parte da mesma classe, se forem intransitivos,.de acordo com a sua distribuição.
encontráveis no mesmo contexto. Ex.:
a casa amarela O mérito da Lingüística Estrutural, aqui representada
a pata amarela pela análise distribucional, pode ser resumido no fato
a rosa amarela de ter:

Esse método não exclui certas manifestações - ampliado o conhecimento das estruturas
sintáticas do tipo: Pedro vende vinho/ O vinho é lingüísticas;
vendido por Pedro. Neste caso, a distribuição dos
mesmos segmentos conduz a uma aproximação dos - aperfeiçoado as técnicas de coleta de dados;
dois enunciados, de sorte a se poder estabelecer um
paralelismo sistemático. O fato da forma passiva ser - demonstrado a possibilidade de generalização. de
menos freqüente que a ativa, leva o lingüista a determinadas estruturas.
considerá-Ia como transformação desta. Logo, o
próprio conceito de transformação é tirado da 7.2 Sintaxe Transformacional
distribuição.
Na década de 50, o modelo estrutural parecia esgotado
Além do contexto imediato, a análise distribucional para a Lingüística americana. E isso ocorreu porque,
leva em conta as co-ocorrências. Ex.: um SN sujeito na medida em que se buscou construir uma
plural implica em verbo plural. Portanto há gramática expll'cita, capaz de dar conta do
co-ocorrência das marcas de plural. funcionamento global da linguagem, não foi mais
possível isolar a parte semântica da formal.
Ao nível da comunicação essas marcas de
co-ocorrência exercem forte poder de tornar a Os métodos estruturais, excessivamente presos a
informação possível, pois como traços redundantes uma visão positivista de só operar com dados, não
que são, minimizam ruídos na transmissão e até permitia a formulação de questões perturbad~ras,
mesmo esquecimentos gerados pelas distâncias na como as que se faziam sobre a criatividade da
cadeia expressiva. linguagem.

O enunciado não é uma seqüência aleatória de Em 1957, N. Chomsk/ demonstrou a insuficiência


elementos, mas a escolha de um segmento é dos modelos estruturais e formulou uma nova teoria,
determinada pelo segmento precedente, num denominada gerativo-transformacional que colocava
conjunto limitado de elementos. É a concepção de no centro das preocupações lingüísticas a sintaxe e
que cada ato de fala se faz pela escolha dos membros procurava a todo custo encontrar critérios de
de classes que regularmente ocorrem juntas numa adequação e simplicidade para as descrições
ordem especIfica, que os estudos de distribuição lingüísticas*, de sorte a depreender quais se valem
estatística foram largamente amparados nos anos diuturnamente, na formulação de infinitos
da Lingüística Distribucional. enunciados.

Livre das peias de um corpus, a gramática gerativo-


Oesta forma é possível agrupar os elementos de uma transformacional usa processos de simulação na
língua em classes e estabelecer, precisamente, a busca dos fatos da linguagem. Vale lembrar que em
ocorrência relativa dessas classes. A ocorrência de
oposição aos dados de um corpus que são grandezas
um elemento de uma classe em relação a outra classe
conhecidas e por isso mesmo quantificáveis, os
deve ser vista em termos de probabilidade, baseada fatos não necessariamente são conhecidos, mesmo
na freqüência de ocorrência no corpus. porque podem ser reais ou potenciais.
As restrições de ocorrência relativa de cada elemento O componente sintático, responsável pelo processo
devem ser descritas por uma rede de afirmações
gerativo e criativo da linguagem passa a ser o centro
inter-relacionadas, de sorte que as restrições maiores
precedam as menores.
* A sintaxe estrutural não deu conta de problemas como
Também um item particular da análise pode concordância, constituintes desconthnuos, ordem livre dos
componentes, etc. Chomsky (1965) dá a necessidade de
contribuir para a simplicidade do sistema. Ex.: a adequação da gramática de certa forma superada pelo poder
classificação de determinados elementos como explicativo que uma gramática gerativa deve ter.

18 CLlnf., Bras(lia, 12 (1):5-22,1983.


Elementos de lingüfstica para estudos de indexação
Anna Maria Marques Cintra

de toda a análise lingüística que, contrariamente c. nem que suas manifestações sobre o conhecimento
às posições anteriores, passa a se ocupar, intuitivo qu~ ele tem da língua tenham de ser exatas.
prioritariamente com a conexão
linguagem-pensamento. Segundo Chomsky (1975)9 Isso porque a gramática gerativa trata de processos
tanto na percepção, quanto na aprendizagem, não se mentais que vão além do nível de consciência
pode desconsiderar o pensamento que desempenha efetiva.
papel ativo na determinação da natureza do
conhecimento adquirido. o falante sabe que "O governador eleito foi
empossado" está correto e que não o está
A observação do fato de que o falante de determinada "o governador foi empossado eleito". Também é essa
Ii'nguaconhece essa Iíngua, levou Chomsky a admitir capacidade que permite perceber a ambigüidade de
que a experiência contínua e apropriada do indivíduo "Bateu no cachorro de seu pai", ou a "equivalência
desenvolve nele uma gramática inata de sua língua. de:
~ essesistema de regras que permite ao falante
construir enunciados com propriedades formais e Ao terminar as apurações o juiz anunciou os
semânticas e é esse mesmo sistema que deve ser resultados.
desvendado pela análise lingüística.
Quando terminaram as apurações o juiz anunciou os
Para melhor compreender a teoria resultados.
gerativo-transformacional, basta pensar numa criança
exposta a determinada Iíngua. Naturalmente ela Terminadas as apurações o juiz anunciou os
manifesta uma capacidade para, num breve período, resu Itados.
inferir regras que regem os enunciados que ouve ao
seu redor. Então, unindo os estímulos à sua
capacidade inata, a criança formula uma gramática. Essas possibilidades todas devem estar presentes na
A esse conhecimento ativo, adquirido graças à teoria sintática da Iíngua. Mas é preciso ressaltar que
faculdade inata da linguagem, Chomsky denominou essa previsão teórica não implica em um levantamento
competência lingü ística. E é essa competência que da produtividade do falante e isto porque a de~rição
autoriza a produção ao infinito de enunciados. deverá dar conta de todos os enunciados da Iíngua a
À capacidade de produção denominou desempenho nível de regras poderosas. O problema da
(performance) . produtividade resulta da competência subjacente do
falante e esta não pode ser vista por inteiro, já que
A tarefa da Lingüística, então, é construir gramáticas o falante jamais terá oportunidade de usar sua
formalizadas que através da lógica simbólica competência lingüística inteiramente.
explicitem com maior clareza as estruturas lógicas do
pensamento. À vista disso, busca a Lingü(stica
gerativo-transformacional um conjunto finito de
Assim os enunciados da língua são o resultado da regras que responda pela produção dos enunciados,
aplicação pelo falante das regras sintáticas que devido ou dito de outra forma, é um conjunto de regras que
à própria natureza humana ocorre em etapas. faculta ligar o sentido à forma pela qual os
enunciados se expressam. A forma pode ser
observada em termos de constituintes; o sentido,
!:exatamente o domínio, ou a posse da gramática que no entanto exige um trabalho de abstração para o
o falante tem de sua língua que faculta a ele produzir atingimento da estrutura subjacente que responde
e entender uma infinidade de enunciados, pela interpretação semântica dos enunciados.
independentemente da sua capacidade consciente de
refletir sobre as regras. De fato ao dizermos que o Desta forma, a gramática da Iíngua contém
falante tem interiorizado o domínio da uma subjacentes as estruturas que submetidas à aplicação
gramática gerativa que expressa seu conhecimento de regras de transformação convertem-nas em
da I(ngua, não estamos subentendendo que: estruturas superficiais.

a. ele tenha consciência das regras da gramática Em resumo, uma gramática gerativa deve ter
que usa; capacidade para gerar todos os enunciados
gramaticais de uma língua e somente eles; ser capaz
b. que ele possa chegar, sozinho ou intuitivamente de explicar a compreensão intuitiva que o falante
riter consciência das regras; tem dos enunciados. Assim, "O menino feriu-se" é o

Ci. Inf., Bras(lia, 12 (1): 5-22, 1983. 19


Elementos de lingüística para estudos de indexação
Anna MariaMarquesCintra '

resultado da aplicação de algumas regras, inclusive a. a sintaxe é componente central e, portanto, toda
de transformação na estrutura subjacente: especificação feita o é com relação a conceitos
sintáticos;

SN S" SV b. há categorias subjacentes que mesmo sendo


destituídas de expressão mórtica, são propriedades
De! ~N AUX/ "\ SN gramaticais que determinam restrições ou selecionais
/~
Det N
ou possibilidades transformacionais.

I I
o menino pas ferir o menino
Ex.: Pedra amassou a gravura.
Pedro pintou a gravura.
condição para a reflexivização = o 2? SN = ao
Pedro desenhou a gravura.
1? SN, referindo-se à mesma pessoa = O menino
feriu-se.
No primeiro enunciado, o objeto existia antes da
ação de Pedro; no segundo, tanto poderia existir.
8 - GRAMÁTICADE CASOS quanto não; no terceiro, seguramente o objeto só
passou a existir a partir da ação de Pedro.
A revolução Chomskyana provocou a partir de 1957
As relações casuais são aquelas noções
grande desenvolvimento da Lingüística, ao mesmo
semanticamente relacionais que marcam as relações
tempo em que se avolumaram as polêmicas em
entre os participantes da situação. Não devem ser
torno dos problemas da linguagem. O próprio confundidas com as desinências casuais como as do
Chomsky reformulou seu modelo em 1965 e continua
latim ou do alemão. Constituem um conjunto
ainda hoje revendo suas recentes contribuições *.
universal finito, encontrado tanto nas línguas que
possuem desinências, como naquelas que não as
Em 1968, Charles Fillmore10 propôs, com base na
teoria gerativo-transformacional, uma nova teoria possuem. Trata-se, portanto, de relações ..
denominada Gramática de Casos. sintático-semânticas subjacentes às frases de
qualquer lI'ngua. Cada relação entre Verbo e SN é
representada por uma etiqueta correspondente a
Em sua proposta Fillmore levou em conta a
um caso.
necessidade de tornar a Estrutura Profunda (EP) mais
afastada da Estrutura de Superfície (ES), o que dá
à gramática maior poder de generalização e de
explicação e demonstrou o caráter pouco universal Ex.: A máquina quebrou.
das noções de sujeito e objeto - noções e ES. Pedro quebrou a máquina com o martelo.
O martelo quebrou a máquina.
Na revisão do conceito de EP, Fillmore defende a
Embora a máquina, Pedro e o martelo sejam os
consideração na análise lingüística dos fenômenos
sujeito de cada uma das frases acima, do ponto de
semânticos que expressam relações conceptuais
vista semântico expressam relações totalmente
universais, a que deu o nome de casos e definiu
diferentes: a máquina é o objeto atingido no
como "um conjunto de conceitos universais,
primeiro enunciado; Pedro, o agente da ação no
presumivelmente inatos que identificam certos
segundo e o martelo, o instrumento causador no
tipos de julgamentos que as pessoas são capazes
terceiro enunciado. Por outro lado, tanto o
de fazer sobre os acontecimentos que se realizam
martelo do terceiro enunciado, como com o
à sua volta, julgamentos a respeito de assuntos
martelo do segundo expressam a mesma relação
como quem fez isso, a quem aconteceu isso, o que semântica de instrumento.
foi mudado, etc.
A gramática de casos admite o mesmo princípio
A organização de uma gramática de casos apoia-se
básico da gramática gerativo-transformacional: sobre
em dois prindpios fundamentais:
a EP aplicam-se regras de transformação e se obtém
a frase superficial. Entre as transformações uma
* Um dos mais recentes trabalhos de Chomsky é On dá origem ao objeto, outra ao sujeito, etc. E o
Binding, distribuido para um pequeno grupo em 1978 e só sujeito então, sendo uma questão superficial, pode
publicado em 1980 no Linguistic Inquiry, v. 2, n. 1, p.146. ser:

20 CLlnf., Bras(lia, 12 (1):5-22,1983.


Elementos de lingü(stica para estudos de indexação
Anna Maria Marques Cintra .

agente: Ele bate na bola. do verbo; o conceito poderia ser limitado a coisas
paciente: Ele recebeu um golpe. que são afetadas pela ação. Ex.: Os meninos apagaram
beneficiário: Ele recebeu um presente. a luz.

A estrutura oracional básica contém uma locativo: localização da ação. Ex.: As idéias
Proposiçã'o(Prop) constituída de um verbo, adjetivo borbulhavam na minha cabeça.
ou nome em construçã'o com uma ou mais entidades
ligadasà proposição por uma funçã'o semântica ou Comitativo: aquela que acompanha o agente.
categoria casual. Os casos definem a atuação das (+ animado). Ex.: Cecília brinca com Roberta.
entidades na proposição e são representados por
símbolos categoriais dominantes. Experienciador: (+ animado) : ser que é submetido ou
experimenta o efeito de uma ação. Ocorre
As noções de caso compreendem um conjunto especialmente com verbos de acontecimento
universal, talvez inato, de conceitos que identificam psicológico, ou estado mental como pensar, sentir,
certos tipos de julgamento que os homens são capazes amar. Ex.: Pedro sente saudades do passado.
de fazer sobre o que fazem, ou sobre o que Ihes
acontece, ou sobre o que sofre mudança. Temporal: indica tempo pontual, ou em transição.'
Ex.: Em criança gostava de doces.
Fillmore deixa em aberto um número de casos
possíveis, uma vez que é bastante variável o número Origem: origem, causa, lugar a partir do qual algo
de relações que contraem entre si a proposição e os se desloca. Ex.: O foguete foi lançado da base aérea.
argumentos selecionados. Não deixa de admitir,
porém, que como universal, o número de casos será Destinação: meta, destino, finalidade, lugar em
obrigatoriamente finito. direçã'o ao qual algo se desloca. Ex.: O foguete
destinava-se à lua.
Quanto ao funcionamento dos casos, observa-se que:
Maneira: modo. Ex.: Saiu ã francesa. -
- numadada Prop. cada caso só pode ocorrer uma
vez,a menos que os SN sejam coordenados; Prolativo: lugar por onde, trajeto percorrido,
itinerário. Ex.: Andamos por toda a estrada.
- há casos de ocorrências facultativas;
Extensão: duraçã'o no tempo e no espaço. Ex.:
- existem regras especi'ficas capazes de promover Trabalhei o dia inteiro.
sujeitos. Ex.:
José quebrou a máquina. Possuidor: posse alienável ou inalienável. Ex.:
Um martelo quebrou a máquina. O braço do homem estava quebrado.
José quebrou a máquina com um martelo.
REFER~NCIAS BIBLIOGRÁFICAS
No primeiro enunciado o sujeito é o agente; no
segundo é um instrumento. Estando os dois reunidos,
como no terceiro enunciado, o sujeito será 1 KATO, M.A. Reconhecimento instantâneo e
necessariamente o agente. Sendo casos diferentes, processamento em leitura. In: língua Oral,
n1l0pode haver coordenação: José e um martelo língUa Escrita. Uberaba, p.9-17, 1982. Série
quebraram a máquina. Estudo-8.

2 BENVENISTE, E. Problemes de linguistique


Casos selecionados: générale. Paris, Gallimard, 1966.

Agentivo (+ animado): instigador da ação. Ex.: 3 POTTIER, B. Gramática dei espaneI. Madrid,
Cec(liadança bem. Alcalá, 1970.

4 GUI RAUD, O. A Semiologia. Lisboa, Presença,


I Instrumental (- animado): força ou objeto envolvido
1978. p.12
I 'naação.Ex. O liquidificador triturou o alimento.
Objetivo:coisa representável por nome, cujo papel 5 POTTIER, B. linguistique générale: thêorie et
naação é identificado pela interpretação semântica descripition. Paris, Klincksiek, 1974.

CLlnf., Brasrlia, 12 (1): 5-22,1983. 21


6 BENVENISTE, E. Problemes de linguistique 18 GALMICHE. M. A Semântica gerativa. Lisboa,
générale. Paris, Gallimard, 1974. Presença, 1979.

7 CHOMSKY, N. Syntactic Structures. La Haye, 19 HARRIS, Z. Discourse analysis. In: FODOR &
Mouton, 1957. KATZ, The Structure of language, Englewood
Cliffs, N.J., Prentice-Hall, 1964.
8 . Aspectos da teoria da sintaxe.
Coimbra, Arménio Amado, 1975. 20 HUTCHINS, W.J. Languages of indexing and
classification. Peter Peregrinus, UK.
9 . Reflexões sobre a linguagem.
Lisboa, Edições 70,1977. 21 JACOBSON, R. Lingüística e comunicação. São
Paulo, Cultrix, 1969.
10 FILLMORE, C. Em favor do caso.ln: LOBATO, 22 KOCK, I.G.V. Os si'ntagmas preposicionais c~mo
L.M.P. A semântica na Lingüística moderna; modificadores nominais. Dissertação de
O léxico. Rio de Janeiro, Francisco Alves, mestrado PUCSP, 1977.
1977.
23 LOPES, E. Fundamentos da lingüística
11 BARTHES, R. Elementos de Semiologia. S. Paulo, contemporânea. São Paulo, Cultrix.
Cultrix, 1972.
24 LYONS, J. An introduction to theoretical
12 BORBA, F .S. Teoria sintática. S.Paulo, Queiroz/ linguistic. Londres, Cambridge.
EDUSP.
25 MARTINET, A. Elementos de lingüística geral.
13 CARVALHO, S.W. Problemas e processos de Lisboa, Sã da Costa, 1964.
formação de linguagem técnica. In: TOLEDO
E S ILVA, M.R., org. Interrelacionamento das 26 ULLMAN, S. Semântica. Lisboa, Gulbenki,an,
ciências da linguagem. Rio, Gernasa, p.81-109. 1967.

14 CINTRA, A.M.M. & SI LVA, M.C.P.S. Morfologia


da I(ngua portuguesa. Revista da PUCSP, 49
(97): 34-57, jan./jun. 1979.

15 COYAUD, M. Linguistique et documentation.


Paris, Larousse.

16 DUBOIS, J. Grammaire distributionnelle. ABSTRACT


Langue Française 1, fev. 1969, Larousse,
p.41-8. Severallinguistical phenomena interfere in the
convertion of natural language to documentary
17 DUCROT, O. & TODOROV, T. Dictionnaire language. For a conceptual study of these phenomena
encyclopédique des sciences du langage. Paris, some topics were selected: The reading process and
Seuil. problems related to semantics and sintax.

22

Você também pode gostar