Você está na página 1de 12

LINGUAGENS DOCUMENTÁRIAS E

TESAUROS
Emylle Mayane Soares de Melo ¹
Josiane Aparecida de Paula ¹
Clarice Fonseca da Silva ²

RESUMO
O presente trabalho aborda as linguagens documentárias, tesauros e cabeçalhos de
assunto. Tem por objetivo analisar seus conceitos, estrutura e aplicações. A metodologia
utilizada foi a pesquisa bibliográfica e eletrônica, realizada em sites de buscas na
internet, portais especializados em Ciência da Informação, além de consulta em livros.
O caminho percorrido neste trabalho mostrou como a Ciência da Informação foi
trabalhando ao longo da história para atender a uma demanda crescente pelo acesso à
informação. Também ficou patente a necessidade de levar em conta não somente o
vocabulário especializado, mas também o a chamada linguagem natural. Além disso foi
constatado que os bibliotecários brasileiros direcionam suas atenções para as
aplicações das representações, demonstrando pouco interesse em estudar os aspectos
conceituais das linguagens documentárias, apresentando assim um caminho para
futuras pesquisas na área.

Palavras-chave: Ciência da Informação. Linguagens Documentárias. Tesauro

1. INTRODUÇÃO

As linguagens documentárias são ferramentas extremamente importantes para


auxiliar e dá suporte aos bibliotecários, tem como objetivo facilitar os conceitos e ajudar
a organizar as informações. Tem por função ampliar o objetivo da biblioteconomia.
Nas linguagens documentárias temos dois tipos de classificação, são os sistemas
mais utilizados no mundo que é a C lassificação Decimal de Dewey (CDD), e a Classificação
Decimal Universal (CDU) que também é dos tesauros. O tesauro também como uma forma de
linguagem documentária tem por finalidade auxiliar o bibliotecário e facilitar o acesso da
informação.
Sendo assim, a pesquisa tem por objetivo entender a teoria, metodologia e objetivos das
linguagens documentárias que inclui tesauros e cabeçalho de assuntos.
2. LINGUAGENS DOCUMENTÁRIAS

O aumento da produção de conhecimento fez com surgisse a necessidade de se


criar mecanismos para armazenar, disseminar e recuperar toda a informação produzida,
de maneira a tornar seu uso mais eficaz.
Diante disto, a ciência da informação “propõe metodologias e instrumentos, como
os vocabulários controlados que, com o tempo, se sofisticaram na forma de Linguagens
Documentárias para aperfeiçoar a indexação e a busca da informação” (Boiaski et al,
2009,p.2).
Cintra et al (1994) argumentam que, nas décadas de 1950 e 1960, devido ao
crescimento do conhecimento científico e tecnológico, começaram a surgir dificuldades
para armazenar e recuperar informações. A solução encontrada foi uma mudança de
enfoque e conceituação da recuperação da informação. Se antes, o foco estava na
recuperação bibliográfica e normalização classificatória e descritiva, agora passou a ser a
construção de linguagens próprias. Surgiu daí o uso das linguagens documentárias.
Linguagem documentária pode ser definida como “um conjunto de termos,
providos ou não de regras sintáticas, utilizado para representar conteúdos de documentos
técnico-científicos, com fins de classificação ou busca retrospectiva de informações”
(Gardin et al., citado por Cintra et al, 1994,p.25). Engloba, de maneira genérica, “os
sistemas de classificação bibliográfica, as listas de cabeçalho de assunto e os tesauros, os
quais surgiram estimulados pela necessidade de manipulação de grande quantidade de
documentos de conteúdos especializados” (Moreira,2006).
Ainda no que se refere ao campo conceitual, é importante destacar que linguagem
documentária é diferente de representação documentária. Produtos como catálogos,
índices, bibliografias, inventários e índices não são linguagens documentárias. Segundo
Dodebei:

(...)embora esses produtos pertençam ao gênero das representações


documentárias, uma vez que são construídos para referenciar um objeto fim de
permitir sua distribuição e localização na memória documentária, eles não
devem ser classificados como linguagem documentária (Dodebei,2014, p 40).
A autora explica que literatura especializada tende a reduzir as formas de
representação documentária à linguagem documentária, eliminando as diferenças entre
esses dois conceitos, causando, a impressão errônea, de que são sinônimos. Isso se dá
pelo fato de que entre os autores nacionais se usam dois termos ao se referir à linguagens
documentárias: Analyse documentaire, de origem europeia, que tem o foco no documento
e o Information indexing, de origem americana, centrado na informação.
Outra explicação possível se refere ao pouco interesse dos bibliotecários
brasileiros em pesquisar os aspectos conceituais das LD’s, concentrando seus estudos nas
aplicações das representações documentárias e domínios especializados. (Dodebei,2014)
Dodebei (2014) prossegue, fazendo alguns apontamentos sobre o campo teórico
conceitual. Explica que procedimentos feitos nos documentos com o objetivo de torná-
los úteis à pesquisa, recuperação de informação, podem ser analisadas sob dois aspectos:
processos e produtos. O primeiro refere-se a toda intervenção realizada no objeto
transformando-o em item documentário. Com relação aos produtos esses são o resultado
da intervenção realizada ou instrumentos para facilitar a comunicação documento
usuário, o que, neste caso, constituem as linguagens documentárias.
Após essas explicações iniciais sobre os conceitos de linguagens documentárias,
será discutida, na sequência deste trabalho, seu uso e funções.
De acordo com Oliveira e Araújo (2012,p.18), as linguagens documentárias
“mediante seus produtos, podem possibilitar a comunicação sistema-usuário, tendo em
vista que funcionam como instrumentos auxiliares no processo da representação da
informação.”
Dodebei (2014) elenca as seguintes funções para as linguagens documentárias:
organizar o campo conceitual: de acordo com Lara citada por Dodebei (2014,p.58)
“pode-se afirmar que as linguagens documentárias devem possibilitar a condição de
referência, para que se estabeleçam as articulações necessárias para o engendramento dos
significados”.
A segunda função apresentada pela autora é a linguagem documentária como
instrumento para a distribuição útil de livros de documentos, função que é feita pelas
classificações (CDD e CDU).
Por fim, a função de evitar as dispersões léxicas, sintáticas e simbólicas no
processo de análise documentária, ou seja, orientar no processo de desconstrução do
texto em linguagem natural e sua representação codificada e sintética. (Dodebei,2014).

a. TESAUROS

Dentre as linguagens documentárias, encontra-se o tesauro, que, de acordo com


Moreira e Moura (2006) já são amplamente utilizados nas atividades de organização da
informação. Tal instrumento apresenta uma vasta gama de usos, devido à sua
flexibilidade de criar relações entre os seus termos do uso de hierarquias e referências
cruzadas.
Ainda, segundo os autores:

A função do tesauro é representar os assuntos dos documentos e


das solicitações de busca. Esta representação é feita no momento da
indexação, através dos processos consecutivos de análise do
documento, identificação de seu conteúdo e da tradução para os termos
do tesauro de acordo com a política de indexação. Na recuperação, a
representação da solicitação é feita no momento em que o usuário
busca uma informação, quando o pedido é analisado, identificando-se
seu conteúdo. A seguir, busca-se o termo no tesauro através do
processo de tradução. A própria estrutura do tesauro, ou seja, os
relacionamentos nele existentes possibilitam este processo de tradução.
(Moreira; Moura,2006, p.5)

O tesauro é uma linguagem de documentação onde existe uma relação entre seus
termos e tem como função representar os assuntos de um documento. Além disto, eles
são feitos para um determinado assunto em específico, sendo bem raras as situações em
que são usados para assuntos diversos (Moreira; Moura,2006)
Fica evidenciada a importância dos tesauros na prática de recuperação de
informação e como essa ferramenta dispõe de atributos que o tornam um instrumento
chave no trabalho de representar a informação.
Uma das grandes dificuldades na construção de tesauro, é a escolha dos termos,
de modo que não haja ambiguidades, além do emprego de palavras que não são usadas
pelos usuários ou não fazem parte do cotidiano dos especialistas e estudiosos na área
pesquisada (Moreira; Moura,2006)
Para que esse impasse referente à dificuldade em escolher os termos para compor
os tesauros, deve-se observar alguns critérios, onde as palavras selecionadas podem se
basear na literatura especializada no assunto, no uso corrente pelos usuários e, ainda na
forma como se estrutura no próprio tesauro. São as garantias: literária, de usuário e
estrutural. A seguir, serão feitos alguns apontamentos sobre elas.
As diversas áreas do conhecimento possuem vocabulários específicos para
exprimirem suas ideias e conceitos. Tais palavras se incorporam na literatura
especializada no assunto. Sendo assim, é comum que quando algum pesquisador for
realizar uma busca de um determinado assunto, ele o faça através das palavras e termos
habitualmente usados em seu cotidiano.
A garantia literária, termo que, de acordo com Lima (2022) foi utilizado por
Hulme, em 1911, tem por princípio que a escolha dos termos a serem utilizados em um
vocabulário controlado deve ter como critério a literatura especializada na área. Pelo fato
de que nem sempre os termos que os autores usam na literatura especializada coincidem
com os utilizados pelos pesquisadores em suas buscas, a garantia literária, apesar de
importante, não é suficiente para tornar legítimo a adesão de um termo ao tesauro.
(Moreira; Moura,2006)
Além da literatura especializada, outro critério a ser utilizado na escolha dos
termos para um tesauro são as palavras que os usuários, que nem sempre são especialistas
ou entusiastas do assunto no qual desejam recuperar uma informação, utilizam em suas
buscas. A garantia do usuário se refere à premissa de que os termos a serem incluídos em
um tesauro devem estar de acordo com os termos usados por quem realiza as buscas
(Moreira; Moura,2006). Ainda, segundo o autor, a garantia de usuário é sempre levada
em conta ao se criar uma linguagem de documentação e que a resistência em o fazer é
algo raro entre os especialistas de linguagem.
A adesão de um termo ao tesauro nem sempre se baseia na garantia literária ou de
usuário, mas sim na possibilidade de exercerem uma função estrutural útil, facilitando
elos em uma hierarquia de termos ou para a dispor um conjunto mais específico de
termos. Trata-se da garantia estrutural. (Moreira; Moura,2006).

b. CABEÇALHO DE ASSUNTO
Quanto ao cabeçalho de assunto, pode-se dizer que é uma das formas mais antigas de
sistema alfabético das linguagens de indexação. Segundo (Cesarino; Pinto, 1978, p.273)
“o conceito mais difundido sobre cabeçalho de assunto o define como <<palavra ou
grupo de palavras que expressam o conteúdo de um documento>>”. E surgiu pela
necessidade de uma listagem de assunto, uma vez que a organização de bibliografias
listadas pelos autores das obras já não era suficiente, por haver várias inconsistências
nesse formato.
De acordo com (Silva; Fujita, 2004, p.143):
O aparecimento dos cabeçalhos de assuntos foi determinado pelos
seguintes fatores: os títulos das obras não representavam de forma
adequada o assunto nelas tratado; problemas relativos às subdivisões
de assunto; existiam obras com mais de um assunto; a
interdisciplinaridade dos assuntos em uma mesma obra; obras que
relacionavam os assuntos a lugares e épocas diferentes.

Foi Cutter que, em 1876, elaborou as primeiras regras para a criação de catálogos
alfabéticos de assunto, estabelecendo princípios fundamentais para a elaboração desses
catálogos que, de acordo com (Cesarino; Pinto, 1978, p.274), podem ser resumidos em
três: 1) princípio específico - a entrada dos assuntos se dão pelo termo mais específico e
não pela classe a que está subordinado; 2) princípio de uso - indica a necessidade dos
usuários; 3) princípio sindético - desenvolvimento nas listas de cabeçalhos de assunto de
estruturas sindéticas por meio de uma rede de referências cruzadas para transpor os
problemas com a entrada alfabética dos cabeçalhos de assunto.
Quanto as suas características, podemos descrevê-las como:

● Apresentam possibilidades limitadas de pesquisa por representarem uma

linguagem muito estruturada e pré-coordenada;

● São sistemas fechados de recuperação da informação, uma vez que utilizam

termos pré-definidos, com vocabulário controlado, contidos em dicionário já


existente;

● Devido ao controle de vocabulário, exerce função prescritiva;

● Possui linguagem não hierárquica;


● São enumerativos, com poucas possibilidades de síntese, que nesses casos, é

representada pelos sub-cabeçalhos;

● O arranjo é via de regra, alfabético;

● Por fim, possui aspecto linear, tornando aplicáveis apenas as pesquisas

unidimensionais.
Como podemos ver, os cabeçalhos de assunto possuem vocabulário e sintaxe
limitados, devido aos seus termos serem retirados de dicionário existente. Por outro lado,
possui menor ambiguidade em comparação a outras linguagens, como por exemplo a
linguagem facetada e a linguagem natural.
Por apresentar uma gramática bem estruturada, os cabeçalhos de assunto,
possuem um rígido controle de sinônimos, quase-sinônimos, homógrafos, permitindo
maior precisão na sua elaboração. Também prevê regras fixas como entrada direta ou
invertida, síntese através de subcabeçalho, uso de singular e plural, uso de palavras
abreviadas ou por extenso, sinais de pontuação e termos traduzidos.
Podemos observar também que os cabeçalhos de assunto possuem
inconsistências, por se tratar de uma linguagem subjetiva, o nível de especificidade varia
de acordo com o ponto de vista com o qual o autor trata o documento. Limitando, em
muitos casos, a eficácia dessa linguagem.
Para o profissional que escolhe os cabeçalhos de assunto como forma de
linguagem para o seu sistema de recuperação da informação, é primordial que se adote
instrumentos de controle, como forma de amenizar essas inconsistências. E as listas de
cabeçalho de assunto são instrumentos eficazes na construção desse sistema. As listas
mais conhecidas e utilizadas são:
Library of Congress Subject Headings – 1ª ed. (1911) – É a mais utilizada e possui
grande garantia literária;
Sears Listo f Subject Headings – adaptação da lista da Library of Congress para
bibliotecas menores;
No Brasil podemos destacar as seguintes listas:
C. Rovira e J. Aguayo. Lista de encabezamientos de materiais para bibliotecas (1967) –
adaptação para as bibliotecas latino-americanas;
W. Ferraz. Relação de assunto para cabeçalhos de fichas – lista limitada para suprir a
necessidade de pequenas coleções;
IBBD. Lista geral de cabeçalhos de assunto – publicada para ser uma lista nacional,
como forma de uniformizar os cabeçalhos através das fichas catalográficas.
(CESARINO; PINTO, 1978, p.283).

3. MATERIAIS E MÉTODOS

A pesquisa bibliográfica segundo Souza, Oliveira e Alves (2021) “está inserida


principalmente no meio acadêmico e tem a finalidade de aprimoramento e atualização do
conhecimento, através de uma investigação de obras já publicadas”. Ainda, de acordo
com os autores, a pesquisa bibliográfica é fundamental para a pesquisa científica, por se
tratar de um material relevante que irá embasar a construção do conhecimento do objeto
de estudo.
Para desenvolver esse trabalho foi realizada uma pesquisa bibliográfica em
artigos de periódicos, sites de internet e livros tanto no formato virtual, quanto no
formato físico. Houve um cuidado para que as buscas fossem realizadas em fontes
confiáveis e científicas, dando preferência a sites relacionados à universidades e eventos
de biblioteconomia.
O primeiro tema pesquisado foi linguagens documentárias: suas definições, usos e
estrutura. No site de buscas google.com foram colocados os termos “o que são
linguagens documentárias”, “linguagem documentária”. Dentre os resultados da procura
realizada, dos vários sites apresentados, deu-se preferência ao scielo.org, por ser uma
base de artigos científicos. Foi consultada mais de uma fonte, para enriquecer o trabalho
e aprofundar a compreensão do tema.
Finalizada esta primeira parte da pesquisa, o próximo passo foi entender os
produtos da linguagem documentária, mais especificamente, os tesauros. Como fonte de
consulta, foi acessado o site da BRAPICI (Base de Dados em Ciência da Informação),
por se tratar de um repositório com artigos acadêmicos específicos sobre a área da
biblioteconomia e ciência da informação. Os termos de buscas utilizados foram
“tesauros” e “o que são tesauros”.
Nesta pesquisa sobre os tesauros, surgiu uma questão importante para ser
aprofundada. Trata-se das garantias (literária, de usuário e estrutural). Para compreender
o que são, foi realizada outra busca tanto no site google.com quanto no site da BRAPICI,
usando as expressões “garantia literária”, “garantia de usuário”, “garantia estrutural” e
“garantias tesauro”. A leitura dos artigos também apresentou outras fontes bibliográficas
que ajudaram a ampliar a compreensão sobre a estrutura das linguagens documentárias,
trazendo grande contribuição ao trabalho.
Em seguida, pesquisou-se sobre os cabeçalhos de assunto. Para isso, foram
consultados sites scielo.org e Google.com, utilizando os termos “cabeçalho de assunto”,
“o que são cabeçalhos de assunto” e “linguagens documentárias”. Esta pesquisa trouxe
maior entendimento sobre o tema, suas características e estrutura, suas vantagens e
inconsistências, evidenciando certa inércia por parte dos profissionais da área em discutir
e melhorar essas fragilidades.
Sobre cabeçalhos de assunto, chegou-se à conclusão que apesar de ser um método
difundido e utilizado por muitos profissionais, desde sua criação até os dias atuais, pouco
se tem feito para modernizar essa prática. O que nos deixa o seguinte questionamento:
Como que nós, futuros profissionais bibliotecários podemos mudar essa realidade?
Esperamos ter a resposta para essa questão em breve.

4. RESULTADOS E DISCUSSÕES

A disponibilização da informação de forma democrática e organizada constitui


algo de extrema importância, sobretudo em uma sociedade onde é crescente a produção
científica e intelectual. Um conhecimento gerado que não é disseminado, torna-se inútil.
Diante disto, o trabalho de encontrar métodos de armazená-lo e torna-lo acessível é uma
tarefa que mobiliza a todos os envolvidos tanto da área de biblioteconomia, quanto
segmentos correlatos.
Sendo assim, as linguagens documentárias são ferramentas que contribuem de
maneira decisiva para a recuperação da informação, haja vista que elas buscam
padronizar os termos utilizados nas buscas, de maneira a evitar ambiguidades e
discrepâncias, tornando mais simples a tarefa de quem pesquisa e daqueles que trabalham
em seu tratamento.
O caminho percorrido neste trabalho mostrou como a Ciência da Informação foi
trabalhando para atender a uma demanda cada vez mais crescente pelo acesso ao
conhecimento, a começar pela mudança de enfoque, saindo da classificação de
recuperação bibliográfica para a construção de vocabulários controlados. Podemos dizer
que a materialização dessa mudança de rumo acima citada se dá na criação dos tesauros e
cabeçalhos de assunto.
É importante ressaltar que ao se criar os termos utilizados nessas ferramentas,
deve se levar em conta não somente os termos técnicos da área específica, mas também
as palavras, o vocabulário usado no cotidiano que, não raro, destoam destas primeiras. É
necessário abranger tanto o usuário especializado (pesquisador, um profissional da área)
quanto o usuário casual.
A preocupação em atender aos públicos diversos foi algo constatado na
construção deste paper, ao se estudar as garantias (literária, de usuário e estrutural) como
critérios para a criação dos tesauros. Ou seja, são levados em conta as terminologias
técnicas, específicas de cada área, o vocabulário usado no dia a dia e também a forma
como cada termo se encaixa na estrutura do tesauro.
No que se refere aos cabeçalhos de assunto, ainda que bastante utilizados, há uma
necessidade de modernização e atualização em seus termos e estrutura. Existem também,
inconsistências, já que é uma linguagem subjetiva. Daí surgem as questões: como
modernizar os cabeçalhos de assunto? Como padronizar e reduzir os aspectos subjetivos
na escolha dos termos utilizados?
Tais indagações podem abrir um grande leque de futuras pesquisas na área da
Ciência da Informação.
Outro ponto importante que serve como sugestão de pesquisas futuras está
relacionado aos aspectos conceituais sobre as Linguagens documentárias. Conforme
demonstrado ao longo deste trabalho, os bibliotecários brasileiros apresentam pouco
interesse em pesquisar tais aspectos, se concentrando em suas aplicações. Existe,
portanto, uma lacuna a ser preenchida, pois por mais que o domínio das aplicações
práticas seja essencial, o aprofundamento conceitual fornecerá subsídios teóricos
consistentes para o trabalho de aplicação prática.
Por fim, o objetivo deste trabalho, realizar um estudo bibliográfico a respeito das
linguagens documentárias, foi alcançado e proporcionou uma ampliação do olhar a
respeito de como a informação deve ser armazenada, tratada e disseminada, além de
trazer à tona outros caminhos de pesquisa e descoberta como foi apresentado acima.
5. REFERÊNCIAS

BOIASKI, Daniela ; GUIPSON, Larissa; MARTINS, Silvestre Gomes; MARIA, Taíse ;


VANTI, Nadia. Linguagens documentárias. In: SEMINÁRIO DE PESQUISA DO
CENTRO DE CIÊNCIAS SOCIAIS APLICADA,15., 2009, Natal. Anais
Eletrônico...Natal: CCSA, 2009. p. 1-17 Disponível em: <
https://repositorio.ufrn.br/jspui/handle/1/6168 > Acesso em: 14 ago. 2023

CESARINO, MARIA AUGUSTA DA NÓBREGA; PINTO, MARIA CRISTINA


MELLO FERREIRA. Cabeçalho de assunto como linguagem de indexação. Revista da
Escola de Biblioteconomia da UFMG, v. 7, n. 2, 1978.

CINTRA, Anna Maria et al. Para entender as linguagens documentárias. São Paulo:
Polis,1994. 72 p. (Coleção Palavra – Chave ,4).

DODEBEI, Vera Lúcia Doyle. Tesauro: linguagem de representação da memória


documentária. Niterói: Intertexto; Rio de Janeiro: Interciência,2014. 127 p.

LIMA, Gercina Ângela de. A Garantia Literária na Representação do Conhecimento: The


Literary Warrant in the Representation of Knowledge.. Fronteiras Da Representação
Do Conhecimento, 1(2), 164–195. Disponível em: <
https://periodicos.ufmg.br/index.php/fronteiras-rc/article/view/41831 > Acesso em: 14
ago. 2023

MOREIRA, M. P.; MOURA, M. A. Construindo tesauros a partir de tesauros existentes:


a experiência do tesauro em ciência da informação. DataGramaZero, v. 7, n. 4, 2006.
Disponível em: < http://hdl.handle.net/20.500.11959/brapci/6670> Acesso em: 14 ago.
2023.

OLIVEIRA, Dalgiza Andrade; ARAÚJO, Ronaldo Ferreira de. Construção de linguagens


documentárias em sistema de recuperação de informação: a importância da garantia de
usuário. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da
informação, Florianópolis, v. 17, n. 34, p.17-30, maio./ago., 2012 Disponível em: <
https://brapci.inf.br/index.php/res/v/38258 > Acesso em: 14 ago. 2023.

PIZZANI, L.; SILVA, R. C. da; BELLO, S. F.; HAYASHI, M. C. P. I. A arte da


pesquisa bibliográfica na busca do conhecimento. RDBCI: Revista Digital de
Biblioteconomia e Ciência da Informação, Campinas, SP, v. 10, n. 2, p. 53–66, 2012.
DOI: 10.20396/rdbci.v10i1.1896. Disponível em:
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/1896. Acesso em: 15
nov. 2023.

SILVA, Maria dos Remédios da; FUJITA, Mariângela Spotti Lopes. A prática de
indexação: análise da evolução de tendências teóricas e
metodológicas. Transinformação, v. 16, p. 133-161, 2004.

DE SOUSA, Angélica Silva; DE OLIVEIRA, Guilherme Saramago; ALVES, Laís


Hilário. A pesquisa bibliográfica: princípios e fundamentos. Cadernos da FUCAMP, v.
20, n. 43, 2021. <https://revistas.fucamp.edu.br/index.php/cadernos/article/view/2336>.
Acessado em 07/11/2023.

Você também pode gostar