Escolar Documentos
Profissional Documentos
Cultura Documentos
Guimaraes RECUPERAÇÃO TEMÁTICA DA INFORMAÇÃO
Guimaraes RECUPERAÇÃO TEMÁTICA DA INFORMAÇÃO
1. Análise documental
A análise documental, como processo de caracterização do documento, pode, conforme seu
objetivo, ser subdividida em duas espécies, a saber: (CESARINO 12:269)
Análise Descritiva Ou Bibliográfica: visa a registrar os dados referentes às características físicas
do documento, como autor, título, edição, local de publicação, editor, data de publicação, tradutor,
tamanho, volume(s), número de páginas etc.
Análise Temática Ou De Conteúdo (Notas 3 E 4): visa a registrar o(s) assunto(s) ao(s) qual(is)
o documento se refere.
A análise descritiva, em que pesem os numerosos estudos na área, tem-se deparado com maiores
entraves, "talvez por ser menos reduzível a regras e por trabalhar com fatores que não identificam
realmente determinada obra" (CESARINO 12:270), mas um conjunto, categoria ou classe de
documentos.
Enquadram-se nesse âmbito a CLASSIFICAÇÃO como "processo mental de agrupamento de
elementos portadores de características comuns e capazes de serem reconhecidos como uma entidade
ou conceito" (CAMPOS 6), e a INDEXAÇÃO, etapa subsequente, voltada para o estabelecimento de
índices ou noções do conteúdo temático do documento, visando a responder a indagações ou
solicitações dos usuários (disseminação) (AMAT-NOGUEIRA 1:127).
O processo de' análise temática segue uma metodologia, como mostram CESARINO (13:271),
CHAUMIER (14:43), CAVALCANTI (9:227) e COLL-VINENT (16:32), dentre outros,
comportando, via de regra, as seguintes etapas:
a) extração de conceitos representativos do conteúdo temático, baseada em uma "leitura técnica do
documento" (notas 6 e 7).
b) seleção dos conceitos extraídos, de acordo com a "política de indexação" do sistema (nota 8),
alertando-se para questões como profundidade de indexação, revocação e precisão, dentre outras.
c) tradução dos conceitos selecionados para uma linguagem artificial, chamada linguagem
documentária ou de indexação, visando ao controle do vocabulário e à padronização da linguagem
no processo de busca. Nessa fase, o documentalista promove a representação dos conceitos,
extraídos em linguagem natural (nota 9) para uma linguagem padronizada, denominada
"instrumento de indexação", por CHAUMIER (14:48).
As linguagens documentárias são comumente classificadas de acordo com dois critérios:
Quanto à coordenação dos conceitos:
A Sindicatos
B Bibliotecários
A B Sindicatos de Bibliotecários
Quanto à forma de apresentação dos conceitos:
b) Alfabéticas (ou de estrutura combinatória, como prefere CHAUMIER 14:48) De acordo com
CESARINO & PINTO (13:273), as linguagens alfabéticas utilizam-se de termos da própria
linguagem natural (nota 12) determinando, dessa forma, uma ordenação alfabética dos registros
informacionais. Nesse rol, incluem-se dois tipos básicos de linguagens: listas de cabeçalhos de
assunto e "thesauri".
As listas de cabeçalhos de assunto tiveram sua origem a partir dos trabalhos de CUTTER (EUA).
no final do século XIX e, mais especificamente, a partir de 1876, com a obra: Rules for a dictionnary
catalog, estabelecendo princípios para a construção de catálogos alfabéticos de assunto (nota 13).
Essas listas, na maioria das vezes, de abrangência geral, apresentam- se alfabeticamente,
utilizando sinais como traço, vírgula e parêntesis na caracterização de cabeçalhos invertidos, bem
como negrito para indicar os cabeçalhos autorizados ou adotados (VALE 28:15).
No tocante às relações entre assuntos, as listas de cabeçalhos limitam-se às relações de
equivalência (através de "x" ou "ver") e às relações de associação (através de "xx" ou "ver também"),
não se preocupando com as chamadas relações hierárquicas (gênero/espécie, todo/parte, etc.) (nota
14).
Reside justamente aí uma das diferenças entre ·as listas de cabeçalhos de assunto e os "thesauri".
Ainda no rol das linguagens alfabéticas e decorrentes de uma evolução (ou poderíamos dizer,
aperfeiçoamento) das listas de cabeçalhos de assunto, os "thesauri" apresentam em sua estrutura as três
relações identificadas por CHAUMIER (de equivalência, associativa e hierárquica), utilizando-se de
uma sinalização própria:
BT ou TG (termo genérico)
NT ou TE (termo específico)
RT ou TR (termo relacionado)
USE (usar)
UF ou UP (usado para)
SN ou NA (nota de aplicação) (nota 15)
FOSKETT (19:316) apresenta ainda como característica dos "thesauri", em contra posição às
listas de cabeçalhos de assunto, o fato de apresentarem tão-somente termos simples (sendo, assim,
instrumentos pós-coordenados), fato que não pode ser tornado como regra, face aos "thesauri"
comumente utilizados.
Vale salientar o desenvolvimento de "thesauri" em áreas muito específicas, atingindo, assim,
maior profundidade. São os chamados "thesauri" setoriais ou especializados (LAUREILHE 23:23)
(nota 16).
Como os "thesauri" preveem relações hierárquicas entre descritores, muitos deles possuem duplo
arranjo: alfabético e sistemático, alguns incluindo a classificação facetada (VALLE 28:23), como os
chamados "Classaurus" e o "Thesaurofacet" de Jean Aitchison. Quanto à forma de apresentação,
existem ainda os "thesauri de esquemas flexados", onde o assunto genérico encontra-se graficamente
disposto no centro do esquema (LAUREILHE 23:24).
Uma vez caracterizado o processo de análise documental, passemos agora a considerar sua etapa
subsequente ou, ainda diríamos, seu objetivo imediato: a busca ou recuperação da informação (nota
17).
2. Recuperação da Informação
BROWN (5) define recuperação da informação como o "processo que visa a satisfazer as
necessidades/pedidos dos usuários, fornecendo-lhes as informações relevantes existentes no acervo"
(nota 18).
Na definição apresentada, temos a destacar seus elementos:
A questão da informação relevante suscita que salientemos dois problemas básicos no processo
de recuperação da informação, ou seja, "Ruído" e "Silêncio".
RUÍDO: documentos fornecidos ao usuário e que não correspondem à solicitação feita, seja:
b) Pelo diferente grau de especificidade entre a questão e o tratamento temático dos documentos.
Ex:
a) o usuário deseja informações sobre o “Direito do Trabalho” e recebe "Direi.to ao Trabalho" (nota
19).
3. Especificidade
A questão da especificidade encontra-se presente toda vez que se abordam problemas atinentes
a linguagens de indexação. CARNEIRO (7:32) coloca o nível de especificidade como "uma importante
decisão política" a ser tomada pela biblioteca ou centro de documentação, tendo em vista suas
peculiaridades. Nesse sentido, coloca a questão como mais preponderante em entidades especializadas.
Acreditamos ser ponto pacífico que a especificidade no tratamento temático da informação (com
a consequente especificidade da informação recuperada) deve ser tanto maior quanto mais
especializada a biblioteca. Tal fato se dá em razão de fatores humanos (exigências ou "necessidade
informacional" da comunidade usuária) e documentais (características da informação a ser tratada).
PIEDADE (26:12) define especificidade como "a exatidão com que os descritores ou símbolos
de classificação utilizados permite representar o assunto dos documentos" (nota 22).
A ideia, desenvolvida a partir dos princípios de CUTTER (princípio sintético.!. princípio de uso
e - em especial - o princípio específico), tem influência direta sobre duas características de qualquer
processo de busca informacional: Revocação e Precisão, uma vez que maior especificidade na
representação temática acarreta menor revocação (nota 23) e maior precisão (FOSKETT 19:14 e
PIEDADE 26:12). Assim, o usuário terá em mãos um menor número de documentos mas por outro
lado, maior será a probabilidade de que os mesmos atendam satisfatoriamente à solicitação feita,
poupando-lhe tempo na seleção de documentos relevantes (nota 24).
CHAUMIER (14:43), ao referir-se à etapa de tradução de conceitos em linguagem de indexação,
refere-se à especificidade como regra a ser adotada a dois níveis:
a) Vertical: "o descritor deve se situar ao mesmo nível de especificidade do conceito".
b) Horizontal: "um conceito composto deve ser traduzido preferencialmente por um descritor
composto - caso exista - do que pela associação de descritores simples".
Na notação apresentada temos não um termo descritor, mas uma área de abrangência. Observe-
se que o significado atribuído à referida notação dificilmente consistir-se-á, em situação real, na
maneira pela qual um usuário acionará o sistema, uma vez que o pedido poderá ser feito, seja pelas
medidas, especificamente, ou pelo gênero: "Greve".
Alia-se aqui a questão das notações de função meramente estrutural, sem qualquer intuito de
representação temática.
Nas linguagens alfabéticas, uma vez que seus termos componentes visam a constituir-se em
descritores ou pontos de acesso, vale ressaltar a necessidade de os mesmos refletirem o linguajar da
área seguindo, assim, o léxico consolidado nas publicações existentes.
O exemplo, ainda que possa refletir uma preocupação em estabelecer paralelo entre as esferas
individual e coletiva do contrato do trabalho, não reflete o vocabulário da área, uma vez que a própria
CLT (2), em seus artigos 611v a 625 dispõe expressamente sobre a Convenção Coletiva do Trabalho.
A isso alia-se a existência de obras doutrinárias especificamente sob esse título.
Ficam prejudicadas maiores considerações sobre o fator expressividade em linguagens
estrangeiras, uma vez que visam a refletir uma realidade léxica e doutrinária de seu local de origem.
Vale salientar, por fim, a exemplo da indissociabilidade das etapas do fluxo da informação (tal
como argumentado no início deste artigo) que todos os procedimentos relativos à análise e à
recuperação temática da informação somente poderão ser efetivamente delineados em função de um
objetivo único: a DISSEMINAÇÃO DA INFORMAÇÃO.