Você está na página 1de 37

Indexação: tipologia e

avaliação

1 Profa. Dra. Vânia Mara Alves Lima


CBD/ECA/USP
2015
Indexação
2
“Operação pela qual se escolhe os
termos mais apropriados para
descrever o conteúdo de um
documento”(GUINCHAT & MENOU, 1994).
 prevê:
 conhecimento do conteúdo do documento;
 escolha dos conceitos a serem representados;
 tradução dos conceitos selecionados;
 incorporação dos elementos sintáticos eventuais.
(CHAUMIER, 1973)
3 Definição de Indexação
Etapa do processo de Análise
documentária onde se procura
identificar e descrever o conteúdo
de um documento com termos
representativos dos seus assuntos
(descritores) os quais constituem
uma linguagem documentária.
4 Descritor

Ao atribuir um descritor a um


documento, o indexador declara que
esses descritor possui um alto grau de
relevância para o conteúdo do
documento;
quer dizer ele declara que o significado
do descritor está fortemente associado
a um conceito incorporado ao
documento e que é adequado à área
temática.
5
Para os termos que representam novos
conceitos, deve-se verificar sua precisão
e aceitabilidade em instrumentos de
referência:
 dicionários, enciclopédias de autoridade reconhecida nas suas
especialidades;
 tesauros especializados elaborados de acordo com as normas ISO;
 tabelas de classificação.

Quando não encontra o conceito


específico pode representá-lo
provisoriamente por termos mais
genéricos.
Indexação por extração
6
 palavras ou expressões que realmente
ocorrem num documento são
selecionadas para representar seu
conteúdo temático.

Indexação por atribuição


envolve a atribuição de termos a um
documento a partir de uma fonte que
não é o próprio documento. Estão na
linguagem documentária.
Exaustividade
7
Indexar um documento sobre a igreja
dos profetas em Congonhas do
Campo, MG sob os descritores:
 Arquitetura religiosa;
 Igrejas,
 Edifícios religiosos,
 Barroco,
 Profetas,
 Congonhas do Campo,
 Minas Gerais

> revocação < precisão


Especificidade
8
Quanto mais especializada a clientela
mais específica deve ser a indexação.
Um tópico deve ser indexado sob o
termo mais específico que o abranja
completamente.
O mesmo documento deveria ser
indexado em:
 Igrejas barrocas
 Congonhas do Campo, MG

> precisão < revocação


Consequências para a
9
Recuperação da informação
Quanto mais seletiva for a
indexação mais necessidade
haverá de combinar termos numa
relação tipo [OR] a fim de
melhorar a revocação.
Igrejas barrocas OR Conventos

Igrejas
barrocas
Conventos
Quanto mais termos forem
10
combinados numa relação tipo [AND]
menor o número de itens
recuperados.
Igrejas barrocas AND Conventos

Igrejas
barrocas
Conventos
Indexação redundante
11
Exemplo:
 quando usamos FRUTAS e LARANJAS.

Frutas Laranjas

Se atribuirmos termos genéricos toda


vez que atribuirmos um termo
específico ficará difícil diferenciar
artigos genéricos de artigos
específicos.
Quem procura FRUTAS espera
encontrar itens sobre frutas em geral
e não itens sobre frutas específicas.
Regras de indexação (Lancaster, 1993)
12

1- Inclua todos os tópicos reconhecidamente de


interesse do serviço de informação que sejam
tratados substantivamente no documento.
2- Indexe cada um desses tópicos tão
especificamente quanto permita o vocabulário
do sistema (LD) e o justifique as necessidades ou
interesses dos usuários.
3- Se um dado tópico merece ou não ser indexado
depende de três fatores:
 A quantidade de informação apresentada sobre o assunto.
 O grau de interesse do assunto.
 A quantidade de informação já existente sobre o assunto.
13 Controle de qualidade

Fatores que o garantem:


a imparcialidade do indexador;
o conhecimento do indexador sobre o
campo coberto pelos documentos a serem
indexados;
as vantagens do contato direto com o
usuário;
e a receptividade das linguagens
documentárias para novos termos.
14
A qualidade dos serviços de
disseminação da informação depende
da linguagem utilizada pelo sistema
para a indexação e recuperação dos
documentos.
Porque:
permite que se traduza a linguagem
do autor sem que se perca a ideia
principal;
permite que se traduza a linguagem
do usuário de modo que satisfaça
suas necessidades de informação.
15 Tipologia de indexação

Indexação pré-coordenada

Indexação pós-coordenada
Indexação pré-coordenada
16
Onde os termos são previamente
combinados de acordo com regras
sintáticas estabelecidas pela linguagem
documentária.
Exemplos:
Túneis - Escavação
Túneis - Projeto
Planejamento territorial urbano - Ocupação do solo
Planejamento territorial urbano – História
Amazônia - Queimadas

Tipos de LDs: Listas de cabeçalhos de


assunto e Sistemas tradicionais de
Classificação (CDD, CDU, LC)
17 Indexação pós-coordenada

Onde os termos serão combinados


de acordo com a sintaxe da lógica
de busca.
Exemplo um mesmo texto recebe os
seguintes descritores:
 Poluição do ar
 Monóxido de carbono
 Rodízio de veículos

Tipos de LDs: Vocabulários


controlados (Tesauros)
18
Sistema pré-coordenados: estabelecem a
coordenação dos vários tópicos
referentes a um assunto composto no
momento de indexação, e com grande
subjetividade determinam uma
prioridade na citação desses elementos.

Sistema pós-coordenado: as entradas


normalmente são conceitos únicos
(termos indexadores) e na saída
permite-se a comparação das entradas
de assunto, com o objetivo de
determinar coincidências que revelem
documentos pertinentes ao assunto
composto pesquisado.
19
Sistema pré-coordenado
A coordenação de termos envolve uma ordem de
citação dos termos.

Ordem de Citação dos Conceitos

 Entrada 1: Banco de dados - Ecologia


Cabeçalhos de Assuntos
 Entrada 2: Ecologia - Banco de dados
Características de Sistemas Pré-
20 Coordenados

É difícil representar a
multifuncionalidade dos termos.
Os termos somente podem ser listados
numa determinada sequência
(A,B,C,D,E) que implica que o primeiro
termo é mais importante do que os
outros.
Não dá pra combinar os termos no
momento da busca.
Exemplo:
 Trabalhadores migrantes – Moçambique – África do Sul
 Moçambique – Trabalhadores migrantes - África do Sul

É economicamente inviável.
Ordens de citação com prioridades para os
21 conceitos
 Cutter: ordem do mais significativo;
 Kaiser:
 concreto – processo (Tubos – Soldagem)
 concreto – localidade – processo (Café – Brasil –
Exportação)
 Coates: coisa – parte – material – ação
 Exemplo 1: Fabricação de sacos multifolhados de
papel Kraft
• Ação: fabricação
• Coisa: sacos
• Propriedade: multifolhados de papel Kraft
• Ordem de citação: sacos – papel – Kraft – multifolhados
– fabricação
Sistema pós-coordenado (surge na década 1940)
22
Entradas: Banco de dados
Ecologia

A entrada é feita por cada um dos termos sem a necessidade


de coordenação e prioridade na ordem de citação

Permite que a busca combine os


descritores de qualquer maneira.
23
A diferença entre os sistemas pré e pós-
coordenados

 Está no momento de combinação dos termos


pelo usuário durante a estratégia de busca em
sistemas de recuperação da informação.
 No Sistema pré-coordenando ela ocorre no
momento da representação.
 No Sistema pós-coordenado ela ocorre no
momento da busca.
Comparação entre os sistemas pré-
coordenados e pós-coordenados
24

SISTEMA PÓS-COORDENADO:

 LAGOS CONTAMINAÇÃO DA ÁGUA

 PEIXES COMPOSTOS DE MÉRCÚRIO

SISTEMA PRÉ-COORDENADO:

PEIXES – LAGOS – COMPOSTOS DE MERCÚRIO – CONTAMINAÇÃO DA ÁGUA

(LANCASTER, 1995)
25
A ordem de citação pela prioridade
poderia funcionar para organizar a
estratégia de busca em bases de dados :

 Exemplo:
• “Pousada de férias em ilhas brasileiras para pesca submarina”:

 Ordem de citação: coisa – parte – material – ação


• ilhas brasileiras – pousadas de férias – pesca submarina.
Falhas na Indexação
26

Na Análise:
Deixar de reconhecer um tópico que se
reveste de interesse potencial para o grupo
usuário atendido.
Interpretar erroneamente de que trata o
documento levando a atribuição de
termos inadequados.
27
Na Tradução:
Deixar de utilizar o termo mais
específico disponível para
representar um assunto.
Empregar um termo que seja
inadequado para o conteúdo
temático devido à falta de
conhecimento especializado ou por
causa de desatenção.
Devido
28
Desconhecimento da terminologia da
área.
Subjetividade do indexador.

Importante:
 A partir da análise do documento pelo indexador, é
realizado um processo de comunicação interativo entre três
variáveis: leitor, texto e contexto.
 O leitor é a variável mais influente porque precisa realizar a
compreensão da leitura mediante a sua cognição.
São 3 pontos de vista
29
 O autor trata o assunto em função dos
seus objetivos e finalidades e das suas
concepções pessoais.
 Os usuários consideram o produto
fornecido pelo autor em função de suas
preocupações próprias e das suas
necessidades de informação que estão
em constante mutação e são
heterogêneas.
 O sistema deve responder a uma
variedade de usuários que não são
iguais e têm níveis distintos de exigência.
 Portanto, é necessário método e regras
de descrição de conteúdo e a utilização
de uma LD.
Existem diferentes concepções de
30
indexação
Concepção simplista
Considera os assuntos como
entidades objetivas absolutas, que
podem derivar de uma abstração
linguística ou de somas utilizando
métodos estatísticos. Aqui a
indexação pode ser totalmente
automatizada.
31 Concepção orientada para o
conteúdo
Envolve uma interpretação do
conteúdo do documento que vai
além dos limites da estrutura
superficial léxica ou gramatical.
Envolve a identificação de assuntos
que não estão explicitamente
colocados na estrutura textual
superficial do documento, mas que
são facilmente identificados por
indexador humano.
32  Concepção orientada pela demanda
Considera o assunto como instrumento para
transferência de conhecimento, portanto,
direcionado para uma finalidade
pragmática de informação e
conhecimento.
Aqui os assuntos devem ser ajustados para
funcionar como instrumentos de mediação
e transmissão desse conhecimento para
qualquer pessoa interessada.
O indexador questiona-se: como posso
tornar esse conteúdo ou parte dele, visível
para o usuário potencial Que termos
deverei utilizar para levar esse
conhecimento até o leitor interessado
33  O documento mais pertinente à questão de
busca feita pelo usuário é aquele cuja
indexação proporcionou a identificação de
conceitos mais pertinentes ao seu
conteúdo, produzindo uma
correspondência precisa entre o assunto
pesquisado e os índices.
O indexador
34
 Deve ter em mente as consultas que podem
ser feitas ao sistema de informação.
 Escolher os conceitos que forem considerados
os mais apropriados para uma determinada
comunidade de usuários.
 Adaptar tanto os instrumentos de indexação
como os próprios procedimentos em função
dos pedidos de informação.
 Usar os descritores adequados já existentes na
linguagem documentária.
35 Avaliação da Indexação
A indexação é avaliada como bem
sucedida quando permite a quem
realiza as buscas localizar itens de que
precisa sem ter de examinar muitos de
que não precisa.
Em teoria a avaliação deveria ser feita
a partir de uma comparação do
método utilizado com as normas.
Critérios de avaliação
36
 Cobertura: quantos documentos sobre um assunto, publicados
durante determinado período se acham incluídos na base de
dados?
 Recuperabilidade: quantos documentos sobre o assunto,
incluídos na base de dados, são encontrados com o emprego
de estratégias de busca “razoáveis”?
 Previsibilidade: ao utilizar informações da base de dados, com
que eficiência o usuário pode aferir quais os itens que serão e
os que não serão úteis?
 Atualidade: os itens publicados recentemente são
recuperáveis, ou atrasos na indexação/redação de resumos
provocam uma situação em que os itens recuperados
mostram resultados de pesquisas “antigo” ao invés dos
“novos”
Bibliografia
37

 ABNT. NBR 12676 - Métodos para análise de documentos:


determinação de seus assuntos e seleção de termos de
indexação. Rio de Janeiro: ABNT, 1992.
 CHAUMIER, J. As técnicas documentais. Lisboa: Europa
América, 1973.
 GUINCHAT,C.; MENOU, M. Introdução geral às ciências e
técnicas da informação e documentação. Brasília: IBICT, 1994.
 LANCASTER, F.W. Indexação e resumos: teoria e prática. Brasília:
Briquet de Lemos, 1993.