Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo:
Este artigo consiste em uma breve revisão na literatura referente aos estudos e pesquisas que vêm
sendo realizados no Brasil predominantemente nos últimos cinco anos a respeito da construção de
modelos de representação do conhecimento, mais popularmente conhecidos como linguagens
documentárias. O propósito é identificar quais as principais teorias vêm fornecendo subsídios para as
respectivas pesquisas. Antes de mapear parte do campo epistemológico das linguagens documentárias,
será explicitada uma breve contextualização histórica e conceitual a respeito das linguagens
documentárias. Almeja-se concluir com a identificação de possíveis linhas ou tendências de pesquisa
acerca da construção de modelos de representação do conhecimento.
Palavras-Chave:
Linguagem documentária, Terminologia, Lingüística
Keywords:
Documentary language, Terminology, Linguistics
1
Artigo apresentado como conclusão da Disciplina Modelo de Representação do Conhecimento do Curso de Mestrado
em Ciência da Informação da UFSC.
___________________________________________________________________________________________________________ 95
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
1 INTRODUÇÃO
2
O conceito de informação empregado neste artigo será semelhante ao de Buckland (1991, apud
ALVARENGA, 2001) que consiste na noção de informação como ‘coisa’, como algo usado para informar.
Porém, ressalta-se que o termo ‘coisa’, no referido conceito, não remete à noção de substância material,
mas sim, à noção de bem tangível ou intangível.
3
Antigamente as LDs eram consideradas produtos do processo de análise documentária, pois aquelas eram
geradas nesse processo.
___________________________________________________________________________________________________________ 96
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
indexação da informação. Dentre os diversos tipos de linguagens documentárias, pode-se
citar os cabeçalhos de assunto, os glossários, os dicionários, os vocabulários
controlados, os sistemas de classificação decimal, as taxonomias, os tesauros e as
ontologias. Para efeito de esclarecimento, os modelos de representação do conhecimento
focados neste artigo são aqueles que se fundamentam como um sistema complexo de
termos e relações entre os termos, como os tesauros e as ontologias.
Este artigo visa identificar na literatura da Ciência da Informação como vêm sendo
teoricamente embasados os estudos recentes realizados no Brasil sobre linguagens
documentárias, ou modelos de representação do conhecimento. Com o propósito não
somente de identificar os suportes teóricos, mas principalmente de identificar qual a
teoria que melhor fundamenta a realidade das linguagens documentárias, o artigo
apresenta uma breve análise sobre a Teoria Geral da Terminologia (TGT) e a Teoria
Comunicativa da Terminologia (TCT), por considerar necessária a aproximação da
Terminologia e da Ciência da Informação para estudos desta natureza. Para tanto, foram
consultados artigos de periódicos e relatórios de pesquisa, especialmente Teses e
Dissertações, publicados no Brasil nos últimos seis anos, correspondentes a linguagens
documentárias. Para a localização dos artigos e relatórios de pesquisa foi realizada uma
busca, livre de estratégias rigorosas, nos sítios das revistas científicas brasileiras da área
da Ciência da Informação e nas bases de Teses e Dissertações da Biblioteca Central da
Universidade Federal de Santa Catarina, além de consultas a Anais de Congresso. Livros
de autores/pesquisadores da temática em questão, foram utilizados principalmente para
embasar conceitualmente e teoricamente o respectivo trabalho
2 LINGUAGEM DOCUMENTÁRIA
Analisando sob uma ótica social, Cintra et al. (2002) afirma que a função das linguagens
documentárias vai além da simples tradução de conteúdos documentais; ela tem a função
de possibilitar que os diferentes segmentos sociais tenham adequado acesso aos estoques
de conhecimento. Sem as linguagens documentárias, não seria possível cumprir com o
caráter público da informação, pois são elas que garantem o compartilhamento social
entre estoques de conhecimento e usuários de informação. Numa visão também social
Lima (2004) reforça a afirmação acima alegando que a representação e a recuperação
eficientes da informação possibilitadas pelas linguagens documentárias potencializam a
construção de novos conhecimentos, fato este que contribui para o desenvolvimento da
sociedade, pois segundo a autora, os usuários de informações documentárias são
produtores de conhecimento em potencial. As afirmações de cunho social descritas
acima, demonstram a preocupação de fazer das linguagens documentárias verdadeiros
instrumentos capazes de possibilitar que a informação efetivamente cumpra seu papel
com a sociedade, ou seja, as linguagens documentárias se tornam imprescindíveis para
conectar a informação ao seu público, para daí poder exercer a transformação por meio
do conhecimento adquirido.
___________________________________________________________________________________________________________ 98
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
Lima (2004) faz uso do termo informação documentária para denominar o signo
documentário que possibilita a articulação entre conceitos e termos de um domínio de
conhecimento, melhor dizendo, a informação documentária é o signo que, auxiliado por
uma linguagem documentária, representa o conteúdo informacional de um documento.
Para a autora, a informação documentária é o resultado de um processo de codificação
(realizado pelo indexador) e de um processo de decodificação (realizado pelo usuário que
acessa a informação). Contudo, é possível afirmar que informações documentárias são
unidades significantes codificadas (descritores). Unidades significantes são entendidas
neste texto como sendo o código que representa um conceito (significado) tendo como
base um referente (objeto), este último proveniente de uma percepção e de uma
interpretação social.
4
Esta definição de ‘terno’ fornecida por Cabré (1999) é a definição mais coerente segundo a perspectiva
deste trabalho.
___________________________________________________________________________________________________________ 99
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
Em estudo mais aprofundado, Lima (2004) apresenta uma distinção entre termos e
descritores, pois não raramente se encontra na literatura um uso indiscriminado desses
dois signos que segunda Lima se distinguem em vários aspectos. Embasada por Lariviere,
Lima (2004) pontua o seguinte: os termos pertencem exclusivamente às linguagens de
especialidade, ao passo que os descritores podem pertencer às linguagens de
especialidade e à linguagem comum; os termos são geralmente extraídos dos
documentos, ao passo que os descritores geralmente são signos conhecidos dos usuários e
em hipótese alguma são criados; os termos remetem a um objeto da realidade, enquanto
que os descritores remetem a documentos que tratam dessa realidade; o termo se refere a
uma só realidade (monorreferencial), enquanto o descritor é escolhido
(preferencialmente) entre outros descritores para representar uma determinada realidade.
Lima (2004) aponta também algumas semelhanças entre termos e descritores, a saber:
ambos são unidades significantes que representam um conceito dentro de um domínio de
conhecimento; e ambos são unidades da linguagem natural e não códigos artificiais.
Outro trabalho que apresenta uma maior preocupação em definir o que é o termo dentro
de uma linguagem documentária, porém, menos detalhista em sua descrição, é o trabalho
realizado por Tristão; Fachin; Alarcon (2004). Nele as autoras alegam que o termo é o
elemento do conceito que sintetiza o próprio conceito, permitindo sua comunicação.
Afirmam ainda que o termo denota um referente, ou seja, trata-se de um signo que
representa um objeto. A tese de Lima (2004) converge com essa afirmação e
complementa que esse objeto/referente é percebido e interpretado numa práxis, numa
realidade social. Contrariando a afirmação de Tristão; Fachin; Alarcon (2004), o presente
trabalho adota como mais adequada a definição postulada por Cabré (1999), que enfatiza
ser o ‘conceito’ um elemento pertencente ao ‘termo’, pois o termo é composto por um
conceito e uma unidade lexical que o denomina.
Para um estudo consistente de linguagens documentárias, deve-se lançar mão, além das
disciplinas de Ciência da Informação, de duas práticas científicas, a Lingüística e a
Terminologia. Enquanto a Lingüística, de uma maneira geral, centra seus esforços
___________________________________________________________________________________________________________ 100
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
teóricos na “palavra” como elemento de um processo de significação amplo (a palavra
por si própria), a Terminologia visa utilizar a palavra como “termo”, elemento de um
processo de significação restrito. Enquanto a primeira estuda a palavra como elemento
lingüístico, em sua origem, estrutura e significado5, a segunda se preocupa apenas com o
significado (conceito) do termo. Na Lingüística, o contexto redacional em que se insere a
palavra não é a prioridade, tornando assim, seu significado amplo e variável. Na
Terminologia, o contexto de redação onde está inserido o termo é prioridade para
conceituar seu significado, ou seja, a terminologia faz uso do contexto para demarcar
território e delimitar o uso dos termos.
Nesta seção são apresentados alguns estudos recentes (relatados em artigos e relatórios de
pesquisa) realizados no Brasil correspondentes a linguagens documentárias de modo a
ressaltar os suportes teóricos adotados pelos pesquisadores.
A Teoria do Conceito de Ingetraut Dahlberg, que analisa o conceito como a soma total
dos enunciados verdadeiros de um objeto, pontuando informações a respeito de suas
características, relações, categorias e definições, é a teoria que vem freqüentemente
fornecendo subsídios teóricos aos estudos de representação do conhecimento na área da
Ciência da Informação.
5
É importante frisar que esta definição das características da Lingüística se inscreve no estudo etimológico
e principalmente na definição estruturalista de Ferdinand de Saussure, que serviu de suporte para Roland
___________________________________________________________________________________________________________ 101
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
Dentre as teorias da Terminologia que ancoram os estudos mais recentes de organização e
representação do conhecimento, merecem destaque a Teoria Geral da Terminologia
(TGT) de Eugen Wüster, Teoria da Socioterminologia de François Gaudin e a Teoria
Comunicativa da Terminologia (TCT) de Maria Teresa Cabré. A TGT, dotada de uma
perspectiva prescritiva e normativa, é responsável pelo fornecimento dos primeiros
supostos de trabalhos terminológicos. A Socioterminologia dotada de uma perspectiva
descritiva, dando ênfase ao uso social da língua, possibilita maior variação e flexibilidade
lexical e conceitual, o que proporciona uma maior aproximação entre mecanismos de
informação e usuários. A TCT, embasada pela Socioterminologia, fundamenta-se em
aspectos comunicativos das línguas naturais. Paralelo a isso, a Teoria da Gramática
Funcional de Simon Dik, também vêm sendo aplicada no campo da Ciência da
Informação, postulando fundamentos preciosos aos estudos de linguagens documentárias.
Essas perspectivas teóricas serão melhores descritas no decorrer deste artigo.
___________________________________________________________________________________________________________ 103
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
que englobe questões ligadas à epistemologia, à lógica, à teoria cognitiva, à
computação e à terminologia. (CAMPOS E GOMES, 2003, p. 162)
No âmbito da era digital, Gomes e Campos (2004), Moreira; Alvarenga; Oliveira (2004)
convergem em afirmar que a maioria dos trabalhos referentes à indexação e recuperação
___________________________________________________________________________________________________________ 104
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
de informação realizados com recursos automáticos, está operando somente com base na
freqüência de ocorrências de palavras pertencentes aos documentos submetidos à análise,
ou seja, abrangendo somente aspectos estatísticos. O emprego somente de dados
estatísticos não abrange os aspectos semânticos dos conteúdos dos documentos,
comprometendo a qualidade da indexação e permanecendo muito aquém da indexação
realizada por especialistas. Porém, os respectivos autores não mencionam trabalhos que
vêm sendo realizados por pesquisadores da área da ciência da informação empenhados
em desenvolver métodos de indexação automática considerando elementos semânticos
contidos nas informações textuais. Estudos de Kuramoto (1996) e Moreiro, Marzal e
Beltrán (2003) são exemplos de esforços voltados à qualidade da indexação e
recuperação da informação tomando por base estruturas da linguagem natural, como
sintagmas verbais e nominais, buscando identificar aspectos semânticos dos conteúdos
informacionais. Souza (2005), em trabalho realizado após as afirmações de Gomes e
Campos (2004), Moreira; Alvarenga; Oliveira (2004), avançando os estudos de Kuramoto
(1996) e Moreiro; Marzal ; Beltrán (2003) propõe uma nova metodologia para indexação
automática utilizando sintagmas nominais. Mesmo que os estudos de indexação e
recuperação pautados em sintagmas não sejam ainda uma tendência de pesquisa
amplamente difundida, a menção desses trabalhos deve ser incluída nas revisões de
literatura, e os seus esforços devem ser continuados, pois se o paradigma da ciência da
informação está voltado ao usuário da informação, não há mais como fugir da idéia de
que a recuperação da informação ancorada somente em indexações quantitativas não
facilitam a recuperação de informações pertinentes por parte do usuário.
Em estudo que visa determinar uma metodologia mais adequada para a representação de
domínios de conhecimento, levando em conta objetivos de aplicações ligados às áreas da
Ciência da Informação, da Ciência da Computação e à da Terminologia, Campos (2004)
investiga e discute a problemática representacional nas referidas áreas, fato que permite a
representação do conhecimento em diversos domínios, objetivando identificar um núcleo
comum de conceitos fundamentais para modelar o conhecimento. Para tanto a autora
resgata a teoria da classificação facetada de Ranganathan e a teoria do conceito de
Dahlberg (na ciência da informação), o modelo orientado a objetos e a ontologia formal
(na ciência da computação) e a teoria da terminologia de Wüester. No trabalho de
Campos (2004), a representação do conhecimento, em busca de uma modelização ideal
de domínios, é abordada com base no método de raciocínio, nos objetos de representação
e na relação entre os objetos de representação.
4 A TGT E A TCT
6
O paradigma formalista, que considera a linguagem como um objeto abstrato baseado no conjunto de
sentenças, acredita que só é possível entender o significado do discurso por meio da análise sintática, sendo
esta a responsável em reger a semântica e o pragmatismo do texto.
___________________________________________________________________________________________________________ 107
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
7
funcionalistas , pode-se afirmar em concomitância com Castilho (1994), Pezatti (1994),
Neves (1997) que a gramática sob a égide da perspectiva funcional é uma atividade
social.
Em síntese a TGT é uma teoria de caráter prescritivo, pautada em uma linguagem ‘ideal’
que desconsidera a flexibilidade efetiva do processo comunicativo no ambiente
especializado, e visa a normatização8 (padronização) internacional dos termos
especializados.
7
Neves (1997) discorre sobre o funcionalismo conservador (que apenas aponta os elementos inadequados
do formalismo), o funcionalismo moderado (que além de ressaltar os pontos inadequados do formalismo,
propõe uma análise funcionalista da estrutura) e, o funcionalismo extremado (que nega a estrutura e se
baseia unicamente na função, desconsiderando a sintaxe).
8
Entende-se o termo normatização como referente à ‘tornar norma’, pronta e acabada. Diferentemente do
que se entende por normalização, que remete à ‘tornar normal’, recomendação de uso.
___________________________________________________________________________________________________________ 108
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
Faulstich, da Universidade de Brasília, e de Maria Teresa Cabré, da Universidade
Pompeu Fabra de Barcelona, são exemplos dessa tendência teórica. Gaudin (1993),
afirmando que a terminologia não pode ser estudada isoladamente, sem se considerar o
contexto social, econômico e comercial, constrói os pilares da Socioterminologia. O autor
lança mão da sociolingüística, que considera o contexto social, cultural e político, para
analisar o emprego da língua francesa, e afirma que a prática terminológica não pode de
forma alguma ser dissociada do conhecimento do campo de atuação dessa prática,
levando em consideração o texto produzido nesse campo, seu público, sua ação e sua
utilidade. Segundo Gaudin (1993), as características da Socioterminologia possibilitam
estudar o funcionamento dos léxicos profissionais que efetivamente são utilizados na
comunicação entre os pares de um domínio de conhecimento ou profissional. Outra
característica marcante da Socioterminologia é se reportar à origem dos termos,
verificando não somente sua recepção e aceitação na comunidade especializada, mas
principalmente identificando as causas do fracasso ou as razões do sucesso de seu uso
efetivo. Tal fato, faz com que a respectiva teoria transcenda a terminologia escrita e
normativa. É evidente que a Socioterminologia atua nas práticas lingüísticas e sociais
concretas, e para tanto, localiza-se nas leis que unem trabalho e linguagem.
Concomitantemente ao desenvolvimento da Socioterminologia surge a TCT.
A criação da TCT ganha forças na segunda metade da década de 1990, momento em que
a Teoria Geral da Terminologia recebe inúmeras críticas por seu caráter reducionista e
idealista. Não deixando de considerar a importância da TGT para o estudo sistemático da
terminologia, mas sim, evoluindo o pensamento terminológico de acordo com as
necessidades reais de comunicação do universo tecno-científico, Cabré (1999) ressalta
que a perspectiva prescritiva e normativa da TGT limita a comunicação profissional
devido à inflexibilidade ao se tratar os termos, seus conceitos e características. Para a
autora, esse reducionismo ocorre devido às crenças idealistas de que os conceitos
preexistem às expressões; de que o conhecimento tecno-científico é uniforme e universal;
de que a estruturação de um campo de conhecimento independe de seu contexto; de que
os âmbitos especializados são neutros e consensuais; e a crença de que o termo
normalizado apresenta as características mais significativas para todas as situações.
Segundo Cabré (1999), a TCT não considera os termos como unidades isoladas que
constituem seu próprio sistema, mas sim, considera-os como unidades que se incorporam
no léxico de um falante no momento em que este adquire o know how de especialista por
meio da aprendizagem do conhecimento especializado.
5 CONCLUSÕES
Conforme exposto neste trabalho, são diversas as teorias que estão fornecendo subsídios
para a fundamentação teórica dos estudos de linguagens documentárias, como a Teoria do
Conceito, a Teoria da Classificação Facetada, a TGT, a Socioterminologia, a TCT,
Sociolingüística e a Lingüística Funcional. Por ser a linguagem documentária um
instrumento de controle terminológico, não é descabido afirmar que sua fundamentação
teórica deve ser pautada em teorias cujo objeto seja a unidade terminológica, ou seja, o
termo. O fato dessas linguagens documentárias serem empregadas em ambientes de
comunicação especializada, seja de um determinado campo do saber seja de uma
determinada área profissional, as tornam instrumentos requisitados em situações ‘reais’
___________________________________________________________________________________________________________ 110
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
de comunicação. Dessa forma, uma teoria de base lingüística, que leve em consideração
as variáveis possíveis em um processo de comunicação, e que opere sob uma abordagem
funcionalista, pautada no pragmatismo do discurso efetivamente proferido e consumido
nos ambientes especializados, é imprescindível para fundamentar as reflexões a cerca das
linguagens documentárias.
Como visto, a TGT zela pelo formalismos e pela idealização do discurso especializado,
ao passo que a ótica funcionalista da TCT se ocupa com a comunicação especializada
realmente utilizada. Isso permite inferir que, além de incorporar e complementar a Teoria
do Conceito, acrescentando a idéia de que o ‘conceito’ é parte do ‘termo’, e além de
avançar os estudos terminológicos apontando as insuficiências da TGT, a TCT progride
rumo a uma teoria que dialoga diretamente com a prática. Sendo assim, aponta-se a TCT
como uma teoria capaz de fundamentar os estudos de linguagens documentárias de modo
que essas operem como instrumentos pertinentes a situações reais da comunicação
especializada.
REFERÊNCIAS
___________________________________________________________________________________________________________ 111
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
CABRÉ, M. Teresa. La terminología: teoría, metodología, aplicaciones. Traducción
castellana de Carles Tebé. Barcelona: Editorial Antártida/ Empúries, 1993. 526 p.
CINTRA, Ana Maria et al. Para entender as linguagens documentárias. 2 ed. São
Paulo: Polis, 2002. 92 p. (Coleção Palavra-Chave, 4).
___________________________________________________________________________________________________________ 112
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.
______ _ ARTIGO
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. International
Standard. Terminology work: principles and methods. 2. ed. 2000. (ISO 704).
LARA, Marilda Lopez Ginez de. Diferenças conceituais sobre termos e definições e
implicações na organização da linguagem documentária. Ciência da Informação.
Brasília, v. 33, n. 2, p. 91-96, maio/ago. 2004a. Disponível em:
<http://www.ibict.br/cienciadainformacao/viewaarticle.php?id=304&layout=html>
Acesso em: 5 abril 2006.
NEVES, Maria Helena de Moura. A Gramática funcional. São Paulo: Martins Fontes,
1997. 160 p. (Texto e Linguagem).
TRISTÃO, Ana Maria Delazari; FACHIN, Gleisy Regina Bóries; ALARCON, Orestes
Estevam. Sistema de classificação facetada e tesauros: instrumentos para organização do
conhecimento. Ciência da Informação. Brasília, v. 33, n. 2, p.161/171, maio/ago. 2004.
Disponível em:
<http://www.ibict.br/cienciadainformacao/viewarticle.php?id=120&layout=abstract>.
Acesso em: 26 maio 2006.
Rodrigo de Sales
Mestrando em Ciência da Informação – UFSC
Bacharel em Biblioteconomia – UFSC
Bolsista de Desenvolvimento Tecnológico Industrial do CNPq - Nível G
Membro do Núcleo de Pesquisa em Informática, Literatura e Lingüística – NUPILL/UFSC.
rodrigo_biblio@yahoo.com.br
___________________________________________________________________________________________________________ 114
© Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.5, n. 1, p 95-114, jul/dez. 2007– ISSN: 1678-765X.