Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Análise documental
A análise documental, como processo de caracterização do documento, pode, conforme seu
objetivo, ser subdividida em duas espécies, a saber: (CESARINO 12:269)
• Análise Descritiva Ou Bibliográfica: visa a registrar os dados referentes às características físicas
do documento, como autor, título, edição, local de publicação, editor, data de publicação, tradutor,
tamanho, volume(s), número de páginas etc.
• Análise Temática Ou De Conteúdo (Notas 3 E 4): visa a registrar o(s) assunto(s) ao(s) qual(is)
o documento se refere.
A análise descritiva, em que pesem os numerosos estudos na área, tem-se deparado com maiores
entraves, "talvez por ser menos reduzível a regras e por trabalhar com fatores que não identificam
realmente determinada obra" (CESARINO 12:270), mas um conjunto, categoria ou classe de
documentos.
Enquadram-se nesse âmbito a CLASSIFICAÇÃO como "processo mental de agrupamento de
elementos portadores de características comuns e capazes de serem reconhecidos como uma entidade
ou conceito" (CAMPOS 6), e a INDEXAÇÃO, etapa subsequente, voltada para o estabelecimento de
índices ou noções do conteúdo temático do documento, visando a responder a indagações ou
solicitações dos usuários (disseminação) (AMAT-NOGUEIRA 1:127).
O processo de' análise temática segue uma metodologia, como mostram CESARINO (13:271),
CHAUMIER (14:43), CAVALCANTI (9:227) e COLL-VINENT (16:32), dentre outros,
comportando, via de regra, as seguintes etapas:
a) extração de conceitos representativos do conteúdo temático, baseada em uma "leitura técnica do
documento" (notas 6 e 7).
b) seleção dos conceitos extraídos, de acordo com a "política de indexação" do sistema (nota 8),
alertando-se para questões como profundidade de indexação, revocação e precisão, dentre outras.
c) tradução dos conceitos selecionados para uma linguagem artificial, chamada linguagem
documentária ou de indexação, visando ao controle do vocabulário e à padronização da linguagem
no processo de busca. Nessa fase, o documentalista promove a representação dos conceitos,
extraídos em linguagem natural (nota 9) para uma linguagem padronizada, denominada
"instrumento de indexação", por CHAUMIER (14:48).
As linguagens documentárias são comumente classificadas de acordo com dois critérios:
• Quanto à coordenação dos conceitos:
A Sindicatos
B Bibliotecários
A B Sindicatos de Bibliotecários
• Quanto à forma de apresentação dos conceitos:
b) Alfabéticas (ou de estrutura combinatória, como prefere CHAUMIER 14:48) De acordo com
CESARINO & PINTO (13:273), as linguagens alfabéticas utilizam-se de termos da própria
linguagem natural (nota 12) determinando, dessa forma, uma ordenação alfabética dos registros
informacionais. Nesse rol, incluem-se dois tipos básicos de linguagens: listas de cabeçalhos de
assunto e "thesauri".
As listas de cabeçalhos de assunto tiveram sua origem a partir dos trabalhos de CUTTER (EUA).
no final do século XIX e, mais especificamente, a partir de 1876, com a obra: Rules for a dictionnary
catalog, estabelecendo princípios para a construção de catálogos alfabéticos de assunto (nota 13).
Essas listas, na maioria das vezes, de abrangência geral, apresentam- se alfabeticamente,
utilizando sinais como traço, vírgula e parêntesis na caracterização de cabeçalhos invertidos, bem
como negrito para indicar os cabeçalhos autorizados ou adotados (VALE 28:15).
No tocante às relações entre assuntos, as listas de cabeçalhos limitam-se às relações de
equivalência (através de "x" ou "ver") e às relações de associação (através de "xx" ou "ver também"),
não se preocupando com as chamadas relações hierárquicas (gênero/espécie, todo/parte, etc.) (nota
14).
Reside justamente aí uma das diferenças entre ·as listas de cabeçalhos de assunto e os "thesauri".
Ainda no rol das linguagens alfabéticas e decorrentes de uma evolução (ou poderíamos dizer,
aperfeiçoamento) das listas de cabeçalhos de assunto, os "thesauri" apresentam em sua estrutura as três
relações identificadas por CHAUMIER (de equivalência, associativa e hierárquica), utilizando-se de
uma sinalização própria:
BT ou TG (termo genérico)
NT ou TE (termo específico)
RT ou TR (termo relacionado)
USE (usar)
UF ou UP (usado para)
SN ou NA (nota de aplicação) (nota 15)
FOSKETT (19:316) apresenta ainda como característica dos "thesauri", em contra posição às
listas de cabeçalhos de assunto, o fato de apresentarem tão-somente termos simples (sendo, assim,
instrumentos pós-coordenados), fato que não pode ser tornado como regra, face aos "thesauri"
comumente utilizados.
Vale salientar o desenvolvimento de "thesauri" em áreas muito específicas, atingindo, assim,
maior profundidade. São os chamados "thesauri" setoriais ou especializados (LAUREILHE 23:23)
(nota 16).
Como os "thesauri" preveem relações hierárquicas entre descritores, muitos deles possuem duplo
arranjo: alfabético e sistemático, alguns incluindo a classificação facetada (VALLE 28:23), como os
chamados "Classaurus" e o "Thesaurofacet" de Jean Aitchison. Quanto à forma de apresentação,
existem ainda os "thesauri de esquemas flexados", onde o assunto genérico encontra-se graficamente
disposto no centro do esquema (LAUREILHE 23:24).
Uma vez caracterizado o processo de análise documental, passemos agora a considerar sua etapa
subsequente ou, ainda diríamos, seu objetivo imediato: a busca ou recuperação da informação (nota
17).
2. Recuperação da Informação
BROWN (5) define recuperação da informação como o "processo que visa a satisfazer as
necessidades/pedidos dos usuários, fornecendo-lhes as informações relevantes existentes no acervo"
(nota 18).
Na definição apresentada, temos a destacar seus elementos:
A questão da informação relevante suscita que salientemos dois problemas básicos no processo
de recuperação da informação, ou seja, "Ruído" e "Silêncio".
RUÍDO: documentos fornecidos ao usuário e que não correspondem à solicitação feita, seja:
b) Pelo diferente grau de especificidade entre a questão e o tratamento temático dos documentos.
Ex:
a) o usuário deseja informações sobre o “Direito do Trabalho” e recebe "Direi.to ao Trabalho" (nota
19).
3. Especificidade
A questão da especificidade encontra-se presente toda vez que se abordam problemas atinentes
a linguagens de indexação. CARNEIRO (7:32) coloca o nível de especificidade como "uma importante
decisão política" a ser tomada pela biblioteca ou centro de documentação, tendo em vista suas
peculiaridades. Nesse sentido, coloca a questão como mais preponderante em entidades especializadas.
Acreditamos ser ponto pacífico que a especificidade no tratamento temático da informação (com
a consequente especificidade da informação recuperada) deve ser tanto maior quanto mais
especializada a biblioteca. Tal fato se dá em razão de fatores humanos (exigências ou "necessidade
informacional" da comunidade usuária) e documentais (características da informação a ser tratada).
PIEDADE (26:12) define especificidade como "a exatidão com que os descritores ou símbolos
de classificação utilizados permite representar o assunto dos documentos" (nota 22).
A ideia, desenvolvida a partir dos princípios de CUTTER (princípio sintético.!. princípio de uso
e - em especial - o princípio específico), tem influência direta sobre duas características de qualquer
processo de busca informacional: Revocação e Precisão, uma vez que maior especificidade na
representação temática acarreta menor revocação (nota 23) e maior precisão (FOSKETT 19:14 e
PIEDADE 26:12). Assim, o usuário terá em mãos um menor número de documentos mas por outro
lado, maior será a probabilidade de que os mesmos atendam satisfatoriamente à solicitação feita,
poupando-lhe tempo na seleção de documentos relevantes (nota 24).
CHAUMIER (14:43), ao referir-se à etapa de tradução de conceitos em linguagem de indexação,
refere-se à especificidade como regra a ser adotada a dois níveis:
a) Vertical: "o descritor deve se situar ao mesmo nível de especificidade do conceito".
b) Horizontal: "um conceito composto deve ser traduzido preferencialmente por um descritor
composto - caso exista - do que pela associação de descritores simples".
Na notação apresentada temos não um termo descritor, mas uma área de abrangência. Observe-
se que o significado atribuído à referida notação dificilmente consistir-se-á, em situação real, na
maneira pela qual um usuário acionará o sistema, uma vez que o pedido poderá ser feito, seja pelas
medidas, especificamente, ou pelo gênero: "Greve".
Alia-se aqui a questão das notações de função meramente estrutural, sem qualquer intuito de
representação temática.
Nas linguagens alfabéticas, uma vez que seus termos componentes visam a constituir-se em
descritores ou pontos de acesso, vale ressaltar a necessidade de os mesmos refletirem o linguajar da
área seguindo, assim, o léxico consolidado nas publicações existentes.
O exemplo, ainda que possa refletir uma preocupação em estabelecer paralelo entre as esferas
individual e coletiva do contrato do trabalho, não reflete o vocabulário da área, uma vez que a própria
CLT (2), em seus artigos 611v a 625 dispõe expressamente sobre a Convenção Coletiva do Trabalho.
A isso alia-se a existência de obras doutrinárias especificamente sob esse título.
Ficam prejudicadas maiores considerações sobre o fator expressividade em linguagens
estrangeiras, uma vez que visam a refletir uma realidade léxica e doutrinária de seu local de origem.
Vale salientar, por fim, a exemplo da indissociabilidade das etapas do fluxo da informação (tal
como argumentado no início deste artigo) que todos os procedimentos relativos à análise e à
recuperação temática da informação somente poderão ser efetivamente delineados em função de um
objetivo único: a DISSEMINAÇÃO DA INFORMAÇÃO.