Você está na página 1de 19

Tratamento Documental

Indexao / Classificao
Margarida Custdio Fris 2011

Indexao
principal objectivo da indexao assegurar a recuperao de qualquer documento ou informao no momento em que o utilizador procura um assunto num catlogo bibliogrfico. A indexao de assuntos envolve duas etapas principais: a anlise do documento para definir que assuntos so tratados e fazer a transposio desses assuntos para conceitos e em seguida transformar estes conceitos em linguagem documental de termos controlados.

Linguagem natural
Comunicao imediata Ambgua Equvoca Arbitrria Livre

Linguagem documental

Comunicao diferida Precisa Unvoca Controlada

Processo de Indexao
Fazer a abordagem do documento, determinar o seu assunto principal, reconhecer os elementos essenciais que devem ser realados e descritos, extrair os conceitos, estabelecer a sua correspondncia em linguagem documental e verificar a pertinncia dessa representao, so as etapas sucessivas para transmitir, de forma inequvoca, o contedo do documento com o objectivo final da difuso correcta da informao.

Normalizao
As normas em que nos apoiamos: NP 3715, de 1989, e a NP 4036, de 1992 so pouco claras.

Estas normas so mais um corpo metodolgico de acompanhamento no processo de indexao.

Tipos de Linguagens
Linguagem Categorial 1 - Utiliza notaes 2 - As notaes integram-se num plano pr-estabelecido (prcoordenao) 3 - Ordenao sistemtica 3 - Ordenao alfabtica dos termos 4 - As notaes esto localizadas num ponto especifico do plano (tabela) 4 - Os termos podem ser usados soltos, combinando-se livremente entre si. (ps coordenao) Linguagem Combinatria 1 - Utiliza palavras 2 - Os termos podem no estar dependentes de uma estrutura hierrquica previamente estabelecida

Linguagem Categorial

A linguagem categorial estrutura-se no que vulgarmente se designa por classificaes. As classificaes no utilizam termos da linguagem natural, mas um cdigo (notao), que pode ser composto por algarismos, letras e outros smbolos gramaticais. Elaborada no incio do sculo XX, a CDU apresenta-se como um plano destinado classificao do conjunto do conhecimento humano. Permite reagrupar todas as referncias relativas a um determinado assunto e, posteriormente, localizar rapidamente essa documentao. Graas sua notao normalizada facilmente utilizvel aplicada universalmente, embora com maior relevncia na Europa.

Classificao Decimal Universal


Partindo do conceito considerado o mais geral, considera que lhe esto subordinados outros conceitos mais restritivos e especficos. O conceito mais geral determina a classe principal qual pertence o documento, podendo-se acrescentar tantas subclasses quantas o documento assim o permitir e o perfil do utilizador assim o determinar.

Linguagem Combinatria
uma linguagem ps-coordenada, expressa em thesaurus ou listas estruturadas de termos, cujo princpio repousa na combinao entre os termos.
As palavras (conceitos) no esto dependentes de uma estrutura hierrquica previamente estabelecida, podendo ser combinados livremente entre si (ps coordenao). Dentro deste grupo de linguagens documentais encontram-se: Listas de encabeamentos de assuntos; Thesaurus (no plural Thesauri)

Thesaurus
Numa definio sucinta, poder-se-ia dizer que o thesaurus composto por uma lista alfabtica de descritores que evidenciam as diferentes relaes existentes entre si. Para alm dos descritores o thesaurus contm tambm identificadores, na sua maior parte constitudos por nomes prprios, nomes de lugares e instituies.

Listas de termos
A lista de termos controlados constri-se medida que os conceitos vo sendo transformados em pontos de acesso para a recuperao da informao.

Vocabulrio controlado
o vocabulrio controlado estabelece a forma de representar os assuntos que compem uma rea limitada do conhecimento, tornando possvel maior coerncia entre os termos indexados. A partir do contedo real do documento o indexador dever decidir: a parte desse contedo que ser susceptvel de responder realmente s necessidades dos utilizadores; os conceitos importantes que devem ser conservados para representar este contedo; os descritores definidos para representar esses conceitos

Regras de Indexao
a) Nmero de palavras por descritor Os descritores podem ser formados por uma ou mais palavras, sendo importante que expressem adequadamente o conceito. Entretanto, recomenda-se que esse nmero de palavras seja o menor possvel.

Regras de Indexao
b) Uso de singular e do plural Os termos do vocabulrio controlado devem ser usados no singular, mas o plural admitido em determinadas circunstncias. A norma NP 4036 determina: Quando os termos so enumerveis (quantos) aplica-se o plural. Quando os termos no so enumerveis (quanto) aplica-se o singular

Regras de Indexao
c) Sinnimos
Quando um conceito pode ser expresso por dois ou mais termos diferentes, escolhe-se um deles como descritor, fazendo-se remissiva dos demais. O descritor mais conhecido pelo utilizador deve ser escolhido como termo indexador.
Ex.: arte sacra e no arte religiosa

Regras de Indexao
d) Descritores compostos Nos descritores compostos as palavras so apresentadas na sua ordem natural. Ex.: ensino em grupo e no grupo, ensino em

Regras de Indexao
e) Termos homgrafos ou inconsistentes
Os termos homgrafos ou inconsistentes podem ser definidos pelo acrscimo de palavras elucidativas. Esse acrscimo pode ser feito colocando-se palavras elucidativas aps o termo principal, que identifica o assunto de um documento separando os descritores por dois pontos ( : ) Ex.: surrealismo : arte surrealismo : literatura

Regras de Indexao
f) Identificadores geogrficos Os descritores geogrficos associados a um outro assunto devem ser representados em ordem indirecta, excepto no caso de estarem relacionados com a literatura. Ex.: filosofia : ocidente pintura renascentista : Itlia mas literatura alem

Você também pode gostar