Você está na página 1de 24

UNIVERSIDADE DE SÃO PAULO

ESCOLA DE COMUNICAÇÕES E ARTES

BARBARA APARECIDA ALVES FERREIRA DE CARVALHO PINA Nº USP 7619548


DIEGO RIBEIRO FORTUNATO FREIRE - Nº USP 8051537
ERNESTO JOSÉ DE CASTRO CANDIDO LOPES - Nº USP 3750980
GIOVANA PEREIRA BATISTA - Nº USP 10802031

ANÁLISE E REFLEXÕES ACERCA DO TESAURO UNESP

SÃO PAULO
2019
UNIVERSIDADE DE SÃO PAULO
ESCOLA DE COMUNICAÇÕES E ARTES

BARBARA APARECIDA ALVES FERREIRA DE CARVALHO PINA Nº USP 7619548


DIEGO RIBEIRO FORTUNATO FREIRE - Nº USP 8051537
ERNESTO JOSÉ C. C. LOPES - Nº USP 3750980
GIOVANA PEREIRA BATISTA - Nº USP 10802031

ANÁLISE E REFLEXÕES ACERCA DO TESAURO UNESP

Trabalho final da disciplina Linguagens


Documentárias II, do curso de graduação em
Biblioteconomia da Escola de Comunicações e Artes
(ECA) da Universidade de São Paulo (USP).
Professora Cibele Araújo C. M. dos Santos

SÃO PAULO
2019
SUMÁRIO

1. INTRODUÇÃO TEÓRICA ................................................................................................. 04


1.1 Linguagens Documentárias ​………………........................................................................... 04
1.2 Construção e gestão de Linguagens Documentárias​ ............................................................. 06
1.3 Tesauros ​…………………………………………................................................................. 09
2. DESCRIÇÃO ANALÍTICA …………................................................................................. 10
2.1 O Tesauro da UNESP​………………..……........................................................................... 10
2.2 Análise​………………..…….................................................................................................. 14
2.3 Comentários sobre a interface online ​………........................................................................ 17
3. REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................ 22
1. INTRODUÇÃO TEÓRICA

1.1 Linguagens Documentárias


Em meados do século XX, a explosão documental e os avanços das ciências e da
tecnologia fizeram surgir novos desafios para o tratamento e recuperação da informação, sendo
necessária a criação de novas ferramentas para ​atender às demandas existentes. ​Neste contexto,
surgem as Linguagens Documentárias, pensadas para facilitar o acesso dos usuários aos
documentos nas unidades de informação.
Entende-se por Linguagens Documentárias (LD), linguagens artificiais utilizadas por
unidades de informação, construídas para fins de representação documentária, ou seja, analisa-se
o conteúdo dos documentos “traduzindo-os” para um sistema de símbolos, para indexá-los,
armazená-los e recuperá-los. Este processo deve tornar possível a comunicação entre o usuário
do sistema de informação e o próprio sistema (CINTRA, p. 23-24).

Todas as linguagens documentais, sejam elas classificações, cabeçalhos de assunto,


palavras-chave, listas de descritores, tesauros, ou léxicos pertencem à mesma família, têm
o mesmo objetivo e apresentam vários caracteres comuns. A linguagem documental é
utilizada no momento do tratamento intelectual dos documentos, isto é, no momento das
operações de entrada no subsistema de armazenamento e de pesquisa da informação e no
momento das operações de saída e de difusão da informação. Os estudos sobre
linguagens documentais privilegiam seus aspectos lingüísticos. Entretanto, estas
linguagens são instrumentos destinados à realização de operações precisas, em condições
precisas, para responder a necessidades precisas; estas limitações funcionais são
essenciais e tão ou mais importantes que as considerações linguísticas (GUINCHAT e
MENOU, 1994, p.133).

A Análise Documentária, no âmbito da Ciência da Informação, procura responder às


necessidades de comunicação da informação por meio da elaboração de produtos que facilitem
sua recuperação. A representação documentária se materializa, por meio da análise, sob as
formas de “resumo, que é feito sem a intermediação de uma LD e o índice, que para maior
qualidade, deve ser elaborado a partir de uma LD determinada” (CINTRA, 1994, p. 28). Por
meio da representação, que consiste no “olhar” sobre determinado documento, sendo antecedida
por processos de análise e síntese de conteúdos, são promovidas situações de comunicação
documentária. É essencial considerar o público ao qual a LD ou síntese se destinam para que a
unidade de informação cumpra sua função.
De acordo com Gardin ​et al.,​ 1968 (​apud CINTRA, 1994, p. 25), as LDs possuem três
elementos básicos que a caracterizam: um léxico, que se manifesta como uma lista de elementos
descritores; uma rede paradigmática, que traduz relações entre os descritores; e uma rede
sintagmática, que expressa as relações entre os descritores, que por sua vez só são válidas nos
contextos específicos em que aparecem.
Em relação à sua estrutura interna, as LDs podem se organizar de forma hierárquica,
como as classificações tradicionais (CDD, CDU, Bliss), alfabética, como os tesauros e as listas
de cabeçalho de assunto, e associadas (ou relações não-hierárquicas). Outra característica de
diferenciação entre LDs, é que estas podem ser pré-coordenadas, quando os termos são
previamente estabelecidos de acordo com as regras sintáticas determinadas pela LD, como as
listas de cabeçalho de assunto e os sistemas tradicionais de classificação; e pós-coordenadas,
quando os termos são combinados de acordo com a sintaxe da lógica de busca, por exemplo,
como os tesauros.
Os sistemas de classificação são LDs bastante utilizadas não só para recuperação da
informação, como para seu armazenamento. Por ser de fácil organização e localização,
possibilita ao próprio usuário localizar o documento no seu modo físico, bem como aos
profissionais organizarem o acervo de forma menos complexa. ​A classificação do conhecimento
remonta à Antiguidade, sendo as chamadas classificações filosóficas influenciadoras das
posteriores classificações bibliográficas. Com o crescimento das universidades, e
consequentemente das bibliotecas universitárias no século XIX, os sistemas de classificação
tornaram-se mais elaborados e assertivos para seus contextos específicos.
Segundo Guinchat e Menou (1994, p.168), a classificação deve determinar o assunto
principal dos documentos, a classe ao qual este assunto pertence, outros aspectos do documento
como lugar, período, tipo, língua, a construção ou seleção da simbologia correspondente de
acordo com o sistema utilizado. ​Alguns profissionais formularam sistemas de classificação
bibliográficas, tanto para contextos específicos, quanto para abranger diversas áreas do
conhecimento. Destacam-se a ​Dewey Decimal Classification de Melvil Dewey, que
posteriormente influenciou a ​Universal Decimal Classification de Paul Otlet e Henri La
Fontaine; a ​Library of Congress Classification da Biblioteca do Congresso Americano, todas no
final do século XIX, e a mais recente ​Colon Classification de Shiyali Ranganathan do século
XX.
São linguagens documentárias, utilizadas como ferramentas para Indexação, as listas de
cabeçalho de assunto, os tesauros e os vocabulários controlados. Estas têm a finalidade de
auxiliar no controle terminológico utilizado na Indexação, promovendo melhores experiências de
recuperação da informação. De acordo com a norma ​ANSI/NISO Z39.19-2005, os vocabulários
controlados têm a função de descrever o conteúdo de um documento através da atribuição de
termos que representam metadados associados aos seus conceitos. Para tanto, traduz-se a
Linguagem Natural para termos utilizados nos vocabulários, com o objetivo de facilitar a
recuperação da informação. As listas de cabeçalho de assunto e os tesauros são tipos de
vocabulário controlado. A diferença entre eles é que, além do controle de ambiguidade e de
sinonímia, os tesauros apresentam relações hierárquicas e associativas entre os termos, ou seja,
são sistemas mais complexos.
Com o crescimento das universidades e da produção documental, acadêmica ou não, as
universidades passarem a adotar LDs para organização da informação, e construir LDs baseadas
nas já existentes, que se adequem ao seu contexto específico. Em uma mesma universidade, que
possui diversos campi, as LDs adotadas podem ser distintas, como no caso das classificações.
Dependendo das áreas de conhecimento abrangidas pelos documentos da biblioteca, é necessário
um tipo de organização. Algumas são pensadas e definidas coletivamente, como o tesauro objeto
desta análise.

1.2 Construção e gestão de Linguagens Documentárias


Com o desenvolvimento das linguagens documentárias, normas de padronização
internacional foram estabelecidas para auxiliar a construção desses vocabulários. Como exemplo,
temos a National Information Standards Organization (Niso) e sua norma para Construção,
Formatação e Gestão de Vocabulários Controlados Monolíngues (ANSI/NISO Z39.19-2005),
constantemente revisada com ênfase na organização terminológica, na interoperabilidade e na
manutenção (SANTOS, 2010).
Tais diretrizes representam um norteamento importante para a construção e gestão de
uma linguagem documentária, especialmente quando disponibilizam versões revisadas que
levam em conta o dinamismo dos sistemas utilizados para o acesso das informações. Como
destacam MacGregor e Mcclloch (2006, apud SANTOS, 2010) o surgimento de recursos
digitais, metadados, redes sociais e indexação colaborativa sinalizam novas possibilidades de
gestão de vocabulários controlados.
Note-se, para ilustrar essa realidade, a norma ANSI Z39.19 -1974 sobre Estrutura,
Construção e Uso de Tesauros, que foi revisada em 1980 e em 1993, sendo nesta última
equiparada a norma internacional ISO 2788 e a britânica BS 8733, passando a constituir-se na
Diretrizes para Construção, Formatação e Gestão de Tesauros Monolíngues. De acordo com
Fayen (2004, apud SANTOS, 2010) com as mudanças ocorridas na área da informação foi
necessário expandir o escopo dessa norma para inclusão de vocabulários controlados,
taxonomias e outras formas de linguagens documentárias.
Outro fator a ser levado em conta são as alterações nas terminologias das áreas do
conhecimento, um processo natural em todas os campos de estudo, que permanecem em
constante evolução. Assim, vocabulários controlados devem funcionar em permanente
manutenção, o que explica a necessidade de grupos gestores para administrar as necessárias
atualizações decorrentes de sua utilização. Um ponto interessante a ser destacado é que, com o
desenvolvimento tecnológico, essa função deixou de ser exclusiva de bibliotecários indexadores
e passou a abranger também uma rede colaborativa de usuários.
“Os sistemas de gestão de vocabulários controlados constituem uma área em
desenvolvimento, sendo que os sistemas desenvolvidos para a web, a partir de metadados,
permitem manutenção eficiente de grande quantidade de informação” (SANTOS, 2010). Diante
dessa tendência, sistemas de linguagens documentárias têm sido acrescidos de uma “base de
sugestões”, na qual é possível escolher inclusão, alteração e exclusão de itens. Após realizar uma
dessas ações, o usuário pode acompanhar o status de seu pedido, que é analisado pelos
bibliotecários de um grupo de gerenciamento responsável pela manutenção da linguagem.
Esse universo exige novas habilidades dos bibliotecários indexadores. Como explica
Leise (2004, apud SANTOS 2010), as técnicas utilizadas não se limitam mais à identificação de
conceitos e seleção de termos, aspectos centrais na indexação, mas também devem conhecer a
utilização de metadados e novas ferramentas para melhor captação de termos candidatos à
inserção nos vocabulários controlados.
É interessante que esses grupos de manutenção sejam compostos por técnicos que
participaram anteriormente do processo de construção das respectivas linguagens documentárias.
Esses profissionais não devem ser apenas bibliotecários, como também especialistas das áreas do
conhecimento abordadas em cada linguagem. A diretriz ANSI/NISO (2005) recomenda, por
exemplo, a atuação de um comitê composto por especialista no domínio dos assuntos, em
conjunto aos especialistas em criação de vocabulários para a obtenção dos melhores resultados.
Essa mesma diretriz identifica dois métodos para a atuação desse comitê no processo de
construção das linguagens. Essas metodologias são denominadas Top-down (descendente) e
Bottom-up (ascendente). No descendente, os termos mais genéricos ou de um vocabulário são
identificados inicialmente e depois são construídas as hierarquias de termos subordinados ou
mais específicos para atingir o nível de profundidade hierárquica necessário. Já no ascendente, é
mais característica a situação de vocabulários controlados já iniciados que precisam incorporar
termos derivados de novos conteúdos. Nesse processo, a estrutura de categorias e as relações
hierárquicas vão sendo construídas em outro sentido: iniciam-se pelos termos mais específicos e
avançam para os termos superordenados. (FUJITA; SANTOS, 2016).
Os métodos devem ser escolhidos levando em conta se já existe ou não um vocabulário
desenvolvido para a área em questão. No caso da construção de novos vocabulários sem uma
base anterior, o processo “top-down” é mais indicado, enquanto o “bottom-up” se adequa bem a
linguagens de indexação já publicadas e que necessitam do acréscimo de novos termos.
Para cumprir sua função, a atividade documentária deve organizar para transferir e
transferir para viabilizar a apropriação da informação. Nessa perspectiva, compreender como se
desenvolve o processo interpretativo de um determinado tema e identificar quais são as
condições mínimas para que ele se desenvolva com eficácia em contextos informacionais pode
significar a diferença entre simplesmente estocar e transmitir informação para o uso efetivo
(LARA, 2002). Assim percebemos a importância de contar com o apoio de especialistas dos
respectivos temas estudados.
A construção de linguagens de indexação possui procedimentos específicos abordados
por normatizações e literatura da área. As ​principais diretrizes, em diferentes momentos,
abordaram a construção de vocabulários controlados (FUJITA; SANTOS, 2016). Para a
construção de um sistema em que a taxonomia seja uma opção, precisa-se inicialmente saber que
esta é bem sucedida ao ser resultado da interação com os elementos do sistema, levando em
conta a finalidade do sistema e o público que usará a ferramenta (CARVALHO, 2015).

1.3 Tesauros
A norma ANSI/NISO Z39.19-2005 define tesauros como um vocabulário controlado
organizado em uma ordem conhecida e estruturada que permite diversas relações entre os
termos, de modo claramente identificado por indicadores de relacionamento padronizados. Os
relacionamentos e indicadores devem ser empregados de forma recíproca, como “termos gerais”
(por exemplo: uma área do conhecimento) e “termos específicos” (conceitos dentros desta área).
A proposta é de promover consistência na indexação de qualquer objeto de conteúdo,
com armazenamento de informações pós-coordenadas e sistemas de recuperação, voltados a
facilitar o manuseio (ou “navegação”, falando do ambiente online) e a procura de usuários. Uma
característica fundamental são os “links” entre os termos.
Em um comparativo com outros sistemas (listas, listas de sinînimos e taxonomias), a
norma ANSI/NISO Z39.19-2005 destaca as seguintes vantagens no uso de tesauros: 1) riqueza
informacional com a estrutura de relações hierárquicas entre os termos; 2) entradas de
vocabulários para auxiliar usuários a localizar os termos mais apropriados; 3) características úteis
tanto para indexadores quanto usuários que buscam o termo mais apropriado e específico para
seu propósito. Porém, a definição também expressa que tesauros são estruturas que “consomem
tempo” e “exigem trabalho intenso” para sua manutenção.
A norma prossegue afirmando que tesauros são o mais comum modelo de vocabulário
controlado para uso em indexação e aplicações de pesquisa, já que oferecem a mais rica estrutura
e possibilidade de referências cruzadas em seu ambiente. Tesauros podem alcançar um alto nível
de aprofundamento nos temas que se dispõem a cobrir.
A criação dos primeiros Tesauros está diretamente ligada ao acúmulo de publicações do
século XX, mas também à crescente especialização desses materiais. Vale destacar que a área
médica foi pioneira no desenvolvimento de Tesauros, tanto por causa do surgimento de novas
áreas da medicina e descobrimento de novas patologias e tratamentos, algo que se intensificou
nos dois últimos séculos, quanto pela necessidade latente de rapidez na recuperação da
informação, já que médicos e pesquisadores da área lidam com vidas humanas e qualquer
momento desperdiçado pode significar perdas humanas.
Os Tesauros não ficaram restritos à área médica, e muitas outras começaram a
desenvolver seus próprios Tesauros, hoje é possível encontrar tesauros na área do Direito, da
Veterinária, da Arquivologia, e da própria Ciência da Informação.
Tesauros normalmente cobrem áreas específicas do conhecimento, como já foi dito, eles
foram desenvolvidos visando a organização e recuperação de informações cada vez mais
específicas. Dessa forma, as Universidades, pólos de desenvolvimento e especialização de
pesquisas, também começaram a desenvolver seus próprios tesauros, como foi o caso da UNESP,
cujo Tesauro é aqui analisado.

2. DESCRIÇÃO ANALÍTICA

2.1 O Tesauro da UNESP


Criada em 1976, a Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP)
resultou da incorporação de institutos isolados de ensino pertencentes ao governo do Estado de
São Paulo, espalhados por diferentes cidades. Hoje a instituição possui campi em 24 municípios
paulistas, totalizando 32 faculdades e institutos voltados ao ensino de diversas áreas do
conhecimento. Em 2015 eram oferecidos 168 cursos de graduação e 114 de pós-graduação, aptos
a habilitar profissionais de 64 profissões de nível superior.
Com vasta estrutura e produção acadêmica, o desenvolvimento de um vocabulário
controlado sempre foi uma importante demanda da instituição, preenchida em 2013 com a
conclusão da criação de um tesauro próprio. Desde então, o sistema tem sua manutenção sob
responsabilidade do Grupo de Linguagem UNESP, composto por catalogadores das bibliotecas
da universidade e pesquisadores e áreas de organização do conhecimento. Em 2017, de acordo
com o Manual de Política de Indexação para as Bibliotecas Universitárias da UNESP, esse grupo
era composto por treze membros, responsáveis por dar continuidade à correção das
palavras-chaves e manter consistência dos relacionamentos hierárquicos entre os termos.
Em consulta em 29 de novembro de 2019, a página do tesauro na internet contabilizava
sua abrangência em 89.581 termos, 46.988 relações entre termos e 49.255 termos não preferidos.
Tal vocabulário é composto por termos especializados das áreas de conhecimento estudadas na
universidade, presentes em materiais como livros, teses e dissertações, entre outros. Como
observou ALVES (2018), o tesauro da UNESP apresenta um complexo nível de especificidade
em suas descrições, possibilitando uma recuperação eficiente de sua comunidade. A
disponibilização para consultas de palavras-chaves desse sistema é considerada parte crucial da
política de indexação das bibliotecas universitárias, que estão indicadas no já citado Manual de
Política de Indexação para as Bibliotecas Universitárias da UNESP, editado, em versão revista e
ampliada de 2017, sob coordenação da professora Mariângela Spotti Lopes Fujita.
O manual explica a cobertura temática do tesauro, que divide as três grandes áreas do
conhecimento presentes no acervo (Humanas, Exatas e Biológicas) em sete subdivisões.

TABELA 1 - SUBDIVISÕES DA COBERTURA TEMÁTICA DO ACERVO UNESP

Nº SUBDIVISÃO CURSOS DE GRADUAÇÃO

1 Engenharias Engenharias, Arquitetura, Desenho Industrial, Cartografia

2 Humanas Letras, Pedagogia, História, Geografia, Filosofia, Psicologia,


Tradução e Intérprete, Jornalismo, Radialismo, Relações Públicas,
Artes Visuais, Artes Cênicas e Música
3 Ciências Sociais Ciências Sociais, Direito, Serviço Social, Biblioteconomia,
Aplicadas
Arquivologia, Administração, Economia, Relações Internacionais
e Turismo

4 Ciências Biologia, Ecologia, Biotecnologia, Biologia Marinha,


Biológicas e
Gerenciamento Costeiro, Engenharia Ambiental e Química
Ambientais
Ambiental

5 Ciências Puras Química, Física, Matemática, Estatísticas, Ciência da Computação,


Análise de Sistemas

6 Ciências Agrárias Agronomia, Zootecnia, Medicina Veterinária, Engenharia


Florestal, Engenharia Industrial Madeireira e Geologia

7 Ciências de Saúde Medicina, Odontologia, Biomédicas, Física Médica,


Fonoaudiologia, Fisioterapia, Terapia Ocupacional, Enfermagem,
Farmácia, Educação Física e Nutrição

Fonte: Manual de Política de Indexação para as Bibliotecas Universitárias da Unesp - edição


revista e ampliada, 2017.

O manual lista, ainda, 25 tipos de documentos presentes no acervo do somatório de todas


as UNESP, cobertos pelo tesauro. São eles: livros; periódicos; teses; dissertações; TCCs;
monografias; memoriais; mapas; fotografias; partituras; catálogos; patentes; modelos
moleculares; testes psicológicos; separatas; folhetos; relatórios de estágio; CDs; CD-ROMs;
DVDs; fitas cassete; fitas de vídeo; discos de vinil; slides e microfilmes.
Como público-alvo dos serviços de indexação de suas bibliotecas - e, consequentemente,
de seu tesauro -, o grupo responsável define que o sistema deve atender prioritariamente à
comunidade universitária (docentes, discentes e servidores técnico-administrativos) e, um
segundo momento, profissionais que trabalham com organização da informação e todos que
acessarem Athena, catálogo online que dispõe de um sistema de buscas que reúne o acervo das
bibliotecas da UNESP.
A universidade dispõe de sua própria linguagem documentária, a A Linguagem UNESP,
implantada em novembro de 2012 com a criação da base de dados UEP10 (Autoridades) no
Aleph, é uma Linguagem multidisciplinar, fundamentada na LCSH, que incorpora termos novos
e modifica os termos importados da LCARB, com consulta às linguagens da Biblioteca
Nacional, da LCSH e MeSH.
Para as práticas de indexação e construção do Tesauro UNESP, os bibliotecários
responsáveis dispõem de um Manual de Linguagem, constantemente atualizado. As normas
apresentadas para indexadores sugerem um amplo aprofundamento dentro de cada temática,
definindo que “o profissional deve indexar cada item tão especificamente quanto o permita a
Linguagem UNESP” e atento à atualização do mesmo, “solicitando, sempre que preciso e
comprovado em fontes de pesquisa, a inclusão de remissivas, e a substituição do descritor em
virtude da obsolescência do termo”.
É destacado também o conceito de exaustividade, que refere-se ao número de conceitos
representados pelos termos atribuídos a um documento pelo indexador. Segundo o manual, no
desenvolvimento do tesauro, “para as áreas de assunto de cada biblioteca é necessário o emprego
de termos em número suficiente para abranger o conteúdo temático do documento de forma mais
completa possível. O número de descritores será limitado para no mínimo: três e no máximo: 12
para todo tipo de documento. Na impossibilidade de determinar mais de dois assuntos, incluir um
termo mais geral para completar o mínimo de três descritores”.
As bibliotecas da UNESP utilizam o sistema MARC em suas interfaces online e possuem
um detalhado guia interno de indexação, voltado a uniformizar as práticas de forma que uma
mesma lógica seja seguida independentemente da área do conhecimento em análise. Essa
padronização se converte em consistência na recuperação da informação por usuários que
buscam assuntos no tesauro da instituição.
Também de forma a facilitar o trabalho de pesquisa e recuperação de dados, o Tesauro
UNESP possui um mini-guia de pesquisa em sua página inicial, dividido em cinco passos
didáticos aqui resumidos: 1) Digite uma palavra, parte da palavra ou frase na caixa de pesquisa;
2) Escolha a palavra-chave; 3) Visualize os termos relacionados mais específicos e genéricos que
aparecerão como resultado dessa palavra-chave; 4) Ao lado direito da palavra-chave há um link
de acesso para a escolha dos registros bibliográficos.

2.2 Análise da estrutura hierárquica

Em toda Linguagem Documental há uma grande preocupação com o controle de


vocabulário. Nos tesauros, tal controle é garantido por uma rígida normalização gramatical e
semântica. Sendo que, essa última tem como objetivo “garantir a univocidade na representação
dos conceitos e noções de áreas de especialidade” (CINTRA ​et al.​, 1994, p. 31).
Cintra, ​et. al.,​ (1994, p. 32), observam que “quanto à sua configuração interna, as LDs
são estruturadas de maneira Lógico-semântica”. Tais estruturas são constituídas por “hierarquias
(na vertical), em torno das quais se agregam as unidades informacionais que se relacionam
horizontalmente, relações não-hierárquicas, convencionalmente denominadas associativas”
(CINTRA ​et al.​, 1994, p. 32). Veremos agora, com exemplos retirados da própria linguagem
documentária analisada, como essas relações estão presentes no Tesauro Unesp.
Mencionamos, linhas acima, que o Manual de Política de Indexação para as Bibliotecas
Universitárias da UNESP, de 2017, explica a cobertura temática do tesauro, que está estruturado
de acordo com divisão das três grandes áreas do conhecimento presentes no acervo (Humanas,
Exatas e Biológicas), e que, por sua vez, são subdivididas em sete domínios: Engenharias;
Humanas; Ciências Sociais Aplicadas; Ciências Biológicas e Ambientais; Ciências Puras;
Ciências Agrárias; Ciências da Saúde. Esses se subdividem em outros campos que representam
as disciplinas dos cursos de graduação de toda universidade. Como exemplo, podemos observar
a divisão existente dentro do domínio Ciências Sociais Aplicadas: Ciências Sociais, Direito,
Serviço Social, Biblioteconomia, Arquivologia, Administração, Economia, Relações
Internacionais e Turismo. Esta macroestrutura faz com que o tesauro se expresse em uma
estrutura semântica-hierárquica, com termos superordenados, que formam o vértice da estrutura,
e que cobrem as grandes áreas do conhecimento, e outros, subordinados a esses, formados pelos
cursos de graduação. Todos os termos superordenados, conhecidos pelo nome de Top-Terms,
representam os domínios e classes do conhecimento universitário que organizam os termos que
representam os conceitos das especialidades, isso é, os próprios termos descritores. Desta forma,
“a criação de termos novos depende da existência de uma macroestrutura de categorias temáticas
que oriente a inclusão e classificação dos termos para que se componha a estrutura lógica e
hierárquica dos termos superordenados e subordinados” (FUJITA e SANTOS, 2016, p. 39).
Cintra nos lembra que, comparativamente às demais linguagens documentárias, a
“ligação lógico-hierárquica entre descritores é, no caso dos tesauros, mais clara, uma vez que é
identificada pelos códigos TG (Termo Genérico ou Termo Geral). TE (Termo Específico)”
(1994, p. 33). Podemos verificar a forma como se configura as relações entre TG e TE no
Tesauro Unesp se considerarmos um termo específico, “Biblioteconomia”, por exemplo, e
analisarmos as relações hierárquicas que ele estabelece com outros termos:

No exemplo acima, “Biblioteconomia” é um TE (Termo Específico) dentro do TG


(Termo Geral) “Ciência da Informação”. Esse último, é por seu turno, TE do TG
“Comunicação”. Se formos ao termo mais geral da cadeia, no qual todos os outros estão
organizados, veremos que no Tesauro Unesp o termo “Biblioteconomia” faz parte de uma cadeia
hierárquica de termos subordinados, sendo que ele ocupa o quarto nível hierárquico da classe
“Ciências Sociais”. Biblioteconomia também forma uma campo próprio como termo
superordenado, organizando, como TG, outros TEs: Análise documentária; Bibliotecas e
usuários; Bibliotecas audiovisual; Biblioteconomia internacional; Sistemas de recuperação da
informação. Tais “unidades subordinadas ao mesmo vértice, quando no mesmo nível da cadeia,
denominam-se coordenadas” (CINTRA ​et al.​, 1994, p. 32).
Além das relações hierárquicas, vistas acima, os tesauros apresentam relações
não-hierárquicas, que “são normalmente denominadas associativas (...). Os relacionamentos
não-hierárquicos indicam a ligação entre termos que estão em campos semânticos distintos,
porém próximos” (CINTRA ​et. al.,​ 1994, p. 33). No Tesauro Unesp os termos relacionados são
explicitamente nomeados como tais e precedidos pela sigla TR. Em nosso exemplo, os TR de
“Biblioteconomia” são: Bibliografia; Documentação; Library Science.
Para facilitar a recuperação da informação por parte dos usuários que não tem o domínio
dos termos e conceitos especializados considerados como preferidos, os Tesauros apresentam
relações de equivalência que operam no nível da sinonímia e da polissemia. Essas relações de
equivalência “estabelecem as remissivas, definindo o conjunto dos não-termos ou não-
descritores e dos termos e descritores. A finalidade dessas remissivas é encaminhar os usuários
para os termos preferidos pelo sistema para os termos preferidos”(CINTRA ​et al.,​ 1994, p. 33).
Desta forma, “constitui-se a chave de acesso ao sistema” (CINTRA ​et al​., 1994, p. 34). No
Tesauro Unesp, as remissivas são nomeadas de Termos Não Preferidos, e são precedidas pela
sigla UP (Usado Para). Para o termo preferido “Biblioteconomia”, o tesauro apresenta os termos
não preferidos: Librarianship; Library economy; Library Organization.
Para finalizar nossa análise, podemos afirmar que diferentemente dos sistemas de
classificações tradicionais, CDD e CDU, os tesauros não pretendem abarcar o universo global do
conhecimento, mais às demandas de um contexto específico. Eles são mais flexíveis, já que
“voltam-se a domínios cada vez mais particulares, sendo construídos em função de universos
muito determinados” (CINTRA ​et. al.​, 1994, p. 42). Desta forma, o Tesauro Unesp tem seu
esquema classificatório básico modulado pelas necessidades informacionais da própria
instituição, se tornando uma ferramenta adequada ao atendimento das demandas de domínios
especializados. Assim, vinculado ao princípio de utilidade, o conjunto de relações que constitui
a estrutura do tesauro é, nas palavras de Gomes (1990, p. 16) “um elemento importante para que
ele possa cumprir sua função: ela permite ao usuário (indexador ou consulente) encontrar o(s)
termo(s) mais adequado(s), mesmo sem saber, de início, o nome específico para representar a
idéia ou o conceito que ele procura. A partir de um termo que o usuário conhece, o tesauro,
através de sua estrutura, mostra diversos outros que podem ser tão oportunos ou mais do que
aquele que lhe veio à mente” ​(​apud​ CINTRA ​et al,​ 1994, p. 34).

2.3 Comentários sobre a interface online


A página principal do Tesauro da Unesp conta com uma rápida explicação sobre tesauros
e sobre o vocabulário do Tesauro da UNESP para o usuário. Também faz uma breve explicação
de como o tesauro deve ser utilizado em quatro passos. O usuário deve digitar uma palavra e
escolher a palavra chave, nos resultados ele terá acesso não apenas à palavra chave escolhida,
mas termos relacionados, mais específicos ou mais genéricos que o escolhido.
Para o usuário não acostumado ao uso do tesauro a apresentação de outros termos
relacionados à palavra chave escolhida pode guiar sua pesquisa de forma mais eficaz. As
Linguagens de Indexação possuem duas funções, a de indexar, atividade realizada pelo
indexador, e a de recuperação da informação, geralmente realizada pelo usuário. No entanto, não
é comum que as interfaces de busca disponibilizem para o usuário a linguagem de indexação, a
fim de que ela sirva de guia de busca. Dessa forma o usuário acaba utilizando a linguagem
natural sem nenhum controle de vocabulário, podendo gerar buscas mal sucedidas quando a
busca é feita por assuntos. A apresentação de palavras chaves relacionadas ao termo utilizado
pelo usuário serve de guia para aproximação da linguagem natural do usuário para a linguagem
documentária do tesauro.
Ao fazer a busca pelo termo “consumo” a interface online apresentou outros 26 termos
relacionados, mostrando ao usuário opções mais específicas sobre o termo. Nota-se também o
uso do “USE” que direciona o usuário ao termo preferido.
Ao escolher o termo que melhor se encaixa à pesquisa, o usuário ainda tem acesso aos
termos não preferidos “UP”, termos genéricos, “TG”, termos específicos “TE2” e termos
relacionados “TR”. Toda essa apresentação permite ao usuário autonomia para a sua pesquisa.

Ao lado da apresentação dos termos o usuário já pode ser guiado para a pesquisa na
Busca Integrada da UNESP (avançada ou lista de assuntos), para pesquisa no catálogo Athena,
no repertório institucional da UNESP ou na biblioteca virtual da FAPESP.
Optando pela busca integrada por assuntos, o usuário ainda é redirecionado a uma lista de
termos relacionados com a quantidade de vezes que esse termos são registrado, permitindo o
maior direcionamento de sua pesquisa.
As ferramentas disponibilizadas na interface online do Tesauro da UNESP
conseguem direcionar a busca do usuário de forma mais eficaz, possibilitando que mesmo
alguém não habituado com a linguagem documentária empregada possa, a partir da sua
linguagem natural, se guiar pelos termos do tesauro facilitando a recuperação da informação.
3. REFERÊNCIAS BIBLIOGRÁFICAS

ALVES, Lizandra de Souza Santos. ​Vocabulário Controlado: Análise das funções do tesauro
UNESP​, Marília: 2019. <Disponível em
http://prope.unesp.br/cic/admin/ver_resumo.php?area=100095&subarea=30352&congresso=41&
CPF=46465594803​ > Acesso em 29 de Nov. de 2019.

ANSI/NISO Z39.19-2005. ​Guidelines for the Construction, Format and Management of


Monolingual Controlled Vocabularies​. Baltimore, Estados Unidos: National Information
Standards Organization, 2010. <Disponível em
https://groups.niso.org/apps/group_public/download.php/12591/z39-19-2005r2010.pdf​ > ​Acesso
em 29 de Nov. de 2019.

BARBOSA, Alice Príncipe. ​Teoria e prática dos sistemas de classificação bibliográfica​. Rio
de Janeiro: Instituto brasileiro de bibliografia e documentação, 1969.

CARVALHO, Luiza Lafosse Paes de. ​Construção de uma linguagem documentária para
organização de documentos do projeto Rota Cabiúnas da empresa Saipem do Brasil​,
Niterói : Universidade Federal Fluminense, 2016. <Disponível em
https://app.uff.br/riuff/bitstream/1/2681/1/CARVALHO%2C%20Luiza.pdf > Acesso em 29 de
Nov. de 2019.

CINTRA, Ana Maria et al. ​Para entender as linguagens documentárias​. São Paulo: Polis:
APB, 1994. (Coleção Palavra Chave, 4).

FUJITA, Mariângela Spotti Lopes; SANTOS, Luciana Beatriz Piovezan dos.​ A estrutura
lógico-hierárquica de linguagens de indexação utilizadas por bibliotecas universitárias​,
Marília : Universidade Estadual Paulista Júlio de Mesquita Filho, 2016. <Disponível em
https://edisciplinas.usp.br/pluginfile.php/4974550/mod_resource/content/1/4336-Texto%20del%
20art%C3%ADculo-6178-1-10-20161105.pdf​> Acesso em ​29 de Nov.. de 2019.

FUJITA, Mariângela Spotti Lopes. ​Manual de política de indexação para as bibliotecas


universitárias da Unesp - edição revista e ampliada​, São Paulo : UNESP, 2017. <Disponível
em ​https://www.biblioteca.unesp.br/portal/arquivos/manual-politica-indexacao-2017.pdf​>
Acesso em 29 de Nov. de 2019.

GUINCHAT, Claire; MENOU, Michel. ​Introdução geral às ciências e técnicas da informação


e documentação​. Brasília: IBICT, 1994.

KOBASHI, N. Y. Análise documentária e representação da informação. ​Informare: Cadernos


do Programa de Pós-Graduação em Ciência da Informação​, v. 2, n. 2, p. 5-27, 1996.
Disponível em: <http://www.brapci.inf.br/v/a/3190>. Acesso em: 18 Abr. 2019.

LARA, Maria Lopes Ginez de. ​O processo de construção da informação documentária e o


processo de conhecimento​, Belo Horizonte : Perspectivas em Ciência da Informação, v. 7, n.2,
2002. <Disponível em
http://www.brapci.inf.br/_repositorio/2010/11/pdf_0956cfbe75_0012805.pdf​> Acesso em 29 de
Nov. de 2019

SANTOS, Cibele Araújo Camargo Marques dos, et. al. ​Sistema de Gestão Para Linguagem
Documentária: Metadados e Rede Colaborativa no Vocabulário Controlado do Sibi/USP​.
2010. <Disponível em
https://edisciplinas.usp.br/pluginfile.php/4974552/mod_resource/content/1/sistema%20de%20ge
st%C3%A3o%20ld-snbu2010.pdf​> Acesso em 29 de Nov. de 2019.

SANTOS, José Carlos Francisco de, et al. ​Tesauro UNESP: Integração do registro de
autoridade para o TemaTres​. Londrina : Universidade Estadual de Londrina - XIX Encontro
de Pesquisa em Ciência da Informação, 2018. <Disponível em
http://enancib.marilia.unesp.br/index.php/XIXENANCIB/xixenancib/paper/viewFile/1495/1433
> Acesso em 29 de Nov. de 2019.

TÁLAMO, M. F. G. M. ​Linguagem Documentária​. São Paulo: APB - Associação Paulista de


Bibliotecários, v. 1., 1997.

UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO. ​História da


Criação da UNESP <Disponível em ​https://www2.unesp.br/portal#!/sobre-a-unesp/historico/​>
Acesso em 29 de Nov. de 2019.

UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO. ​Tesauro da


UNESP <Disponível em ​https://www.biblioteca.unesp.br/tesauro/vocab/index.php​> Acesso em
29 de Nov. de 2019.

VOCABULÁRIOS CONTROLADOS​ - Tesauro OC - ECA/USP. <Disponível em


http://www2.eca.usp.br/mapasconceituais/vocab/index.php?tema=171&/vocabulrios-controlados
>. Accesso em​ 29 de Nov. de 2019​.

Você também pode gostar