Você está na página 1de 73

UNIVERSIDADE DE BRASÍLIA

Faculdade de Ciência da Informação (FCI)


Disciplina: LINGUAGENS DOCUMENTÁRIAS – Código 182.567
Créditos: 04 - Carga horária : 60 horas/aula
Profª Drª Rita de Cássia do Vale Caribé

INDEXAÇÃO
Indexação
• Uma das formas de descrição de conteúdo.
• É o processo por meio do qual o conteúdo de um recurso
informacional é analisado e seu assunto (aboutness) é
determinado e expresso de uma maneira concisa.
• Escolhe-se os termos mais apropriados para descrever o
conteúdo de um documento.
• Esses termos são extraídos da linguagem adotada pelo
sistema de informação.
• Os termos são ordenados para constituir índices que
serão utilizados para pesquisa.
Indexação
• A indexação é a operação central do sistema para
a armazenagem e pesquisa das informações
• Está inserida no ciclo documentário
• O produto da indexação é utilizado:
▫ Na entrada do documento no sistema
▫ Na consulta ao documento no sistema
Ciclo documentário - indexação
• Identificam-se os conceitos de que trata o
documento, expressando-os:
▫ na terminologia utilizada pelo autor (linguagem
natural) ou
▫ com ajuda de vocábulos ou termos de significação
unívoca ou ainda por meio de códigos
(linguagens documentárias, descritores,
sistemas de classificação etc.)

(Robredo, 2005)
Vocabulário

Termo A
Termo A – Doc. 3;
Termo B
Termo B – Doc. 1, 2;
Documento 1 Termo C
Termo C – Doc. 3
Documento 2 Termo D
Termo D – Doc. 2
Documento 3 Termo E
Termo E – Doc 1, 3;
.... Termo F
Termo F – Doc. 2
Termo G
Termo G – Doc. 1
...
Termo A Termo A – Doc. 3;
Termo C Termo B – Doc. 1, 2;
Termo E Termo C – Doc. 3
Termo D – Doc. 2
Termo E – Doc 1, 3;
Termo F – Doc. 2
Termo G – Doc. 1

Doc 3
Atenção
• Tudo é decidido no nível da entrada, input.
• Se a arquitetura dos registros dos
documentos e a indexação são de má
qualidade, a quantidade de informação
perdida para sempre será inimaginável.

A recuperação dependerá da entrada!!!!!


Quem faz a indexação?
• O próprio autor
▫ no momento da produção do documento primário
▫ indica os termos que representam o conteúdo do
documento
• O profissional da informação
▫ No momento da análise do conteúdo do
documento

Atenção: os termos escolhidos pelo autor devem ser submetidos à análise


com o objetivo de adequar à linguagem documentária adotada pelo sistema
de informação
Conceito - Indexação
• Indexação - processo de dar a cada item de informação
constante de uma coleção de documentos um rótulo
sintético e sugestivo (SILVA, 1972)
• Indexação – ato, processo ou resultado da elaboração de
entrada para um índice (Cavalcanti, 1978)
• É a representação dos conteúdos dos documentos, por
meio de símbolos especiais, retirados do texto original
(palavras-chave ou frases-chave extraídas do
documento) ou escolhidos em uma linguagem de
informação ou de indexação (UNISIT, 1972)
Conceito - Indexação
• É a atividade que consiste em representar o
conteúdo de um documento ou de uma consulta
de forma analítica, enumerando os conceitos ou
palavras (SLYPE, 1991)
Conceito - Indexação
• Indexação – é a arte de caracterizar determinado
item de informação mediante o recurso de
vincular a ele, coerentemente uma palavra-chave
ou uma frase-chave
• Indexar – é estabelecer uma estreita relação –
uma espécie de colchete semântico entre o índice
e a informação, de forma que a informação possa
ser fisgada e trazida rapidamente à tona tantas
vezes sejam necessárias
Finalidade da indexação
• Economizar tempo, esforço
• Evitar desperdício de dinheiro e material
• Prevenir a perpetração de erros
• Remediar o desapontamento de resultados
negativos e a irritação produzida pela
ineficiência e pelo superficialismo
• Indexação procura, dentro do possível imitar, o
processo mental da associação de idéias
• Estruturas mentais que estão no cérebro, na
mente
Cognição é categorização
• No cérebro de um bebê existem apenas duas
categorias, que vão se desenvolvendo ao longo
do desenvolvimento da criança.

Rostos
(faces)

Comida
(food)
• Na medida em que o indivíduo vai crescendo
várias categorias vão sendo construídas em sua
mente de acordo com o que ele aprende,
conhece, entra em contato com o mundo etc.
Sensação – Percepção - Cognição
Objeto
Cérebro
 Interpretação e
integração das
características do
objeto aos R
conhecimentos do e
sujeito s
Captação
pelo p
sistema Estruturas corticais o
sensorial  Memória s
 Categorização
t
 Atenção
 Resolução de
a
• Características: Sistema cognição problemas de s
▫ cor raciocínio
▫ textura  Linguagem
▫ tamanho
▫ formato
▫ profundidade
Processo cognitivo
Processo perceptivo
Nível da indexação
• O nível da indexação varia de acordo com as
necessidades e as possibilidades da unidade de
informação
• Indexação genérica
▫ é a indexação que referir-se apenas aos assuntos
principais
▫ Assemelha-se a classificação com diferenças:
 Indexação é múltipla, pode identificar vários
assuntos
 Classificação é única – identifica apenas o assunto
principal
Nível da indexação
• Indexação média
▫ A indexação refere-se ao conjunto de assuntos
tratados no documento, identificando-o com
termos relativamente gerais
▫ Pode conter até dez descritores
• Indexação em profundidade
▫ Refere-se aos assuntos descritos de forma
bastante detalhado
▫ Utiliza mais de dez descritores
Nível da indexação
• Indexação exaustiva
▫ Refere-se à totalidade do documento
▫ praticamente frase por frase
▫ Utilizada para um trabalho aprofundado nos
textos
▫ Ex. como em decisões de justiça

Atenção: o nível de indexação deve ser definido com o objetivo de


atender às necessidades de informação dos usuários com o menor custo
possível
Indexação

• A indexação é determinada, influenciada pelas


características do sistema de informação
• É um instrumento de trabalho – permite a
recuperação das informações úteis para
categorias de usuários bem precisas
• A indexação pode ser seletiva – reter apenas as
informações que interessam aos usuários da
unidade de informação.
• Indexação orientada para documento
• Indexação orientada para consulta
• Indexação centrada no usuário – baseia-se nos pedidos
que são esperados de determinada clientela
• Indexação por extração – palavras ou expressões que
realmente ocorrem no documento são selecionadas para
representar seu conteúdo temático
• Indexação por atribuição – atribuição de termos ao
documento a partir de uma fonte que não é o próprio
documento. Envolve o esforço de representar a
substância de análise conceitual mediante o emprego de
termos extraídos de alguma forma de vocabulário
controlado.
Competências do profissional da
informação
• O indexador deve:
▫ Ser especialista no assunto – é o ideal quando for uma
unidade de informação altamente especializada
▫ que tenha conhecimento razoável sobre o assunto que
está indexando
▫ Conhecer o público que a unidade de informação
atende e suas necessidades
▫ Ser capaz de dialogar com o público que atende para
identificar o que ele realmente deseja e decodificar a
demanda na linguagem do sistema
Instrumentos de suporte
necessários
• Linguagem documentária adotada pelo sistema
• Guias e/ou manual de indexação com:
▫ normas e procedimentos para transcrição dos
descritores
▫ Esquemas de análise para os diferentes tipos de
documentos com a lista dos vários elementos de
descrição
▫ Exemplos dos casos mais frequentes, principais
dificuldades e soluções concretas
• Política de indexação formalmente constituída
Identificação do assunto
• Três etapas para determinar o assunto do
documento:
▫ Análise do texto para sua compreensão,
delimitação das ideias nele contidas e
identificação dos objetivos do autor
▫ Decisão quanto aos conceitos susceptíveis de
representarem tema, os objetivos, as ideias
▫ Seleção dos conceitos mais adequados
• Tomar conhecimento do documento para
determinar sua natureza e seu objeto
• Ex.
▫ Uma tese – expõe os resultados de uma pesquisa
científica e, deve apresentar conhecimentos novos
▫ Um folheto de divulgação – é dirigido ao grande
público, apresenta aspectos essenciais do
conhecimento sobre um determinado assunto em
linguagem simples
Análise do documento
• 1ª etapa do processo de indexação
▫ Considerar o texto
▫ Série à qual pertence o texto
▫ Título
▫ Subtítulo
▫ Resumo
▫ Sumário
▫ Introdução
▫ Prefácio
▫ Conclusões
▫ Anexos
▫ Índices do documento
Análise do documento - texto
Analisar:
• Título dos capítulos
• Parágrafos iniciais e finais dos capítulos
• Títulos das seções
• Notas explicativas

Atenção:
• não é aconselhável indexar apenas pelo exame desses itens, eles
são complementares
•Não basear-se apenas no título e no resumo pois podem ser
insuficientes para identificação co tema
• Determinar o assunto principal do documento
• Analisar o conjunto do documento em função do
nível de indexação desejado
• A indexação dos termos significativos deve ser
feita de acordo com a organização do
documento.
• O indexador deve extrair todos os termos que
julga úteis para descrever completamente todos
os conceitos e todos os objetos tratados no
documento capazes de interessar aos usuários.
Atenção
• Ao indexar um relatório de pesquisa para uma
unidade de informação de um centro de
pesquisa, por exemplo, deve-se ressaltar não
apenas o problema abordado e suas conclusões,
mas também o método e o universo estudado
• A indexação deve responder às questões que o
usuário faz para saber qual é o objetivo de um
documento e em que este documento pode
servir.
• Pode-se lembrar estes objetivos
sistematicamente pelas seguintes perguntas:
Perguntas que ajudam
• O que? – ajuda a determinar os assuntos ou
temas tratados pelo documento ou pela
pergunta.
▫ Ex. as técnicas de irrigação,
▫ os fertilizantes e
▫ as técnicas culturais
• De que forma? – leva a precisar a forma como
os assuntos apresentam-se.
▫ Ex. estudo de uma rede de irrigação
▫ Cálculo das necessidades de água
Perguntas que ajudam
• Como? - Leva a precisar as diversas circunstâncias que
cercam a ação, as causas, as consequências, os objetivos.
▫ Ex.introdução de novas culturas e a seca persistente,
assim como certas formas práticas de realizar uma
ação, como a irrigação por aspersão e a utilização de
um modelo para estudo
• Quando? – leva a precisar a data ou o período em que
se desenvolve a ação. É diferente da data de publicação
do documento.
• Onde? – local onde a ação se desenvolve. Nem sempre
há uma zona geográfica determinada. Identificar o pais
ou em escala menor como estado, município, bairro,
região agrícola etc.
Identificação dos conceitos
• Seleção dos conceitos indicativos do assunto
• Considerar os pontos básicos no campo do
conhecimento ao qual se refere o conteúdo do
documento:
▫ Os fenômenos mencionados
▫ Os processos utilizados
▫ As propriedades inerentes aos objetos
▫ As operações efetuadas
▫ O equipamento empregado etc.
Seleção dos conceitos
• Após a análise do documento e a identificação dos
conceitos, o indexador pode concluir pela inclusão:
▫ de todos os conceitos identificados
▫ apenas alguns conceitos identificados
• Esta decisão está relacionada:
▫ com o uso ao qual destina-se o índice
▫ tipo de sistema de informação desenvolvido
• Considerar dois aspectos
▫ Exaustividade
▫ Especificidade
• Há sistemas que definiram em sua política de
indexação:
▫ Utilizar os descritores específicos
▫ Utilizar os descritores genéricos e
▫ Utilizar os termos relacionados
• Ex. redes de irrigação incluir também
infraestrutura agrícola
Exaustividade
• É a relação entre o número dos documentos
pertinentes fornecidos em resposta a uma
pergunta e o número total de documentos
pertinentes que responderiam à pergunta
formulada.
• É a profundidade de análise de um documento,
objetivando a indicação do assunto a ser
especificado.
Exaustividade
A seleção de descritores visando a exaustividade baseia-se nos
seguintes pontos:
• O processo de análise do documento permite a identificação dos
temas ou conceitos passíveis de interessar os utilizadores de um
determinado sistema de informação;
• Os textos podem tratar de mais de um assunto e todos devem ser
indicados;
• Os assuntos devem ser indexados sob todos os aspectos abordados.
Caso não interessem aos usuários atuais podem atender a usuários
potenciais
• O número de descritores utilizados para indicação dos temas
identificados num documento é condicionado pela quantidade de
informação encontrada no texto.
Especificidade
• É o grau de precisão de um sistema de indexação
quando aplicado aos assuntos de um documento
Especificidade
A seleção de descritores visando a especificidade
baseia-se nos seguintes pontos:
• A indexação deve particularizar ao máximo a
informação, escolhendo os conceitos mais
específicos
• Quando for do interesse dos usuários, os
conceitos genéricos podem ser indexados.
• Ponderação – atribuída a termos que indicam o
nível de especificidade
Especificidade - Ponderação
• Consiste na atribuição de símbolos para marcar a
importância de um assunto no contexto do documento
• Esses símbolos auxiliam o leitor/usuário a selecionar o
tema mais apropriado a seus objetivos
• Podem ser utilizados números, letras, sinais diacríticos,
pontuação
• Ex. aos números 3, 2, 1 são atribuídos um valor: maior,
médio e menor respectivamente
• A presença de um número desses junto ao descritor
indica que o assunto é tratado com maior ou menor
profundidade, de acordo com o ponderador
Critérios de avaliação da qualidade
da indexação
• Exaustividade – se todos os temas, objetos e conceitos
tratados no documento foram bem representados na
indexação
• Seletividade – verificar se foram retidas apenas as
informações que interessam ao usuário
• Especificidade – ver se a descrição traduz da forma mais
precisa possível, o conteúdo do documento e que não utiliza
descritores muito gerais ou muito específicos em relação às
noções expressas no documento
• Uniformidade ou consistência – verificar se os
indexadores descrevem um mesmo documento ou
documentos sobre um mesmo assunto da mesma forma.
Tradução
• É a etapa da tradução dos conceitos na linguagem
utilizada pelo sistema
• É um processo que envolve a representação da análise
conceitual mediante um termo ou termos extraídos de
um vocabulário
• Instrumentos indexadores:
▫ Tipo alfabético combinatório – cabeçalhos de assunto
e tesauros
▫ Tipo numérico ou alfanumérico – sistemas de
classificação
• Para um bom desempenho do indexador é necessário
conhecimento prévio do instrumento a ser utilizado e de
sua filosofia, metodologia, organização etc.
Tradução
Tradução
• As listas de cabeçalhos de assunto são
linguagens pré-coordenadas, não registram
termos para todos os conceitos. É necessário
criá-los em alguns casos, para atender às
exigências da análise.
• Os tesauros são linguagem pós-coordenadas,
permitindo combinações posteriores tornam
possível a indicação de grande número de
conceitos que não se encontram registrados
diretamente na lista.
Tradução

• Elos (links) – são elementos de ligação entre assuntos subordinados


• Indicadores
▫ Sinônimos: identificadores ou indicador de função ou
modificadores ou modulantes ou indicador de função ou notas
explicativas
▫ são termos ou símbolos empregados para alterar o significado de
um descritor
▫ O identificador, de acordo com Lancaster é o nome de alguma
coisa: navio, aeronave, pessoa, acidentes geográficos, obras de
engenharia etc.
▫ Alguns sistemas utilizam a lista de identificadores separada do
tesauro
Inclusão de novos termos
• Quando não encontrar o termo que representa o
conceito que está procurando, verificar todas as
possibilidades de sinônimos
• Inclusão de termos novos pode ser efetuada:
▫ Imediatamente, escolhendo o termo específico
mais apropriado para representação do conceito e
inclusão na linguagem de indexação
▫ Imediatamente por meio de um termo mais
genérico existente na linguagem, ao qual o
conceito está subordinado.
Candidatos a descritor
• Esta é a forma mais adequada
• Tratar como candidatos a descritor os termos
que traduzem conceitos novos, não existentes no
tesauro
• Rotina de inclusão:
▫ Análise dos termos
▫ Relacionamento com outros já existentes no
tesauro, caso essa relação seja aconselhável
▫ Registro, do termo, no tesauro para que apareça
em futuras edições.
Descrição
População
dos documentos
de usuários
População
de documentos

Vocabulário
Acervo do sistema
Produto da indexação
• Os produtos da indexação são índices, ou seja,
lista de termos significativos
• Índice – objetivos
▫ Recuperar informações
▫ Selecioná-las para atender às necessidades dos
usuários
Conceito - Índice
• O sinal ou símbolo adotado para caracterizar a informação é, em
todos os casos e sistemas, um indicador – um dispositivo de
identificação – a que se tem chamado de várias maneiras. O nome
genérico é índice.
• Índice – é o roteiro ordenado, alfabético ou sistemático, dos itens de
uma coleção
• O profissional da informação identifica e isola no texto cada
informação, ou extrai dele um índice para servir de guia
• Esse índice (frase-chave, palavra-chave) funciona a maneira de
chave, sempre que quiser recuperar ou obter a informação
• É um mecanismo ou instrumento auxiliar empregado na busca,
localização e recuperação de informações
Índice
• A composição do índice baseia-se nas entradas que são
suas unidades de informação.
• Cada entrada apresenta:
▫ Identificação do conceito – por meio de símbolos:
 Alfabéticos (cabeçalhos de assunto, descritor, palavras-chave)
 Numéricos (classificações puras)
 Alfanuméricos (classificações alfabéticas e alfanuméricas
▫ Localização do item relacionado com o conceito
indexado ou com os autores indicados – remete ao
setor do documento onde se encontra o conceito
Índices – rótulos semânticos
• Rótulos semânticos ou termos
• São as entradas que compõem o índice
• São informações impressas ou escritas (alfabéticas ou
codificadas), transmitidas a um sistema de informação
para processamento
• São as técnicas, mecanismos e meios utilizados para a
comunicação com o equipamento de processamento de
dados e para os próprios dados compreendidos ou
envolvidos nessa comunicação.
Índice
• A natureza de um índice é determinada pelo
conteúdo do material que está sendo indexado,
pelos objetivos do sistema e pela formação
acadêmica de seus usuários.
Tipos de índices
• De acordo com diferentes parâmetros (elemento
cuja modificação de valor altera o resultado de
um problema, sem alterar sua natureza) os
índices podem se incluir nas espécies a seguir:
▫ Índices conforme seu arranjo
▫ Índices conforme o tipo de entrada
▫ Índices de acordo com a forma de apresentação
▫ Índices de acordo com a forma de consulta
▫ Índices conforme a estrutura
Índices conforme seu arranjo
• Alfabético
• Cronológico
• Hierárquico
• Numérico
• Concordâncias
Índices conforme o tipo de entrada
• Autor (onomástico)
• Cabeçalho de assunto
• Citações
• Descritores
• Palavra-chave
• Título (biblionímico)
Índices de acordo com a forma de
apresentação
• Em fichas
• Impressos
• Computadorizados
▫ Fitas magnéticas (acesso sequencial)
▫ Discos magnéticos (acesso em linha)
Índices de acordo com a forma de
consulta
• Sequencial
• Seletivo
Índices conforme a estrutura
• Acesso único
• Conjuntivo
▫ Subordinado
▫ Coordenado
 Convencional
 Invertido
67

KWIC
• Key word in context
• Criado por Hans Peter Luhn, em 1957
• Peter Luhn apresentou seu trabalho em 1958 na
International Conference on Scientific
Information
• Lista elaborada pelo computador, composta por
palavras chave retiradas do título do
documento (palavras significativas),
apresentados em ordem alfabética
68

Exemplo
• Termos não significativos
▫ Geral
▫ Da
• Esses termos não
desempenham função
especificamente descritiva do
texto indexado são incluídos
em uma lista especial a que
deram o nome de stoplist,
stopword, termos não
significativos
71

KWOC
• Key word out of context
• Lista de palavras chave, dispostas em ordem
alfabética, colocadas à margem esquerda do
papel, seguidas dos títulos das obras
73

Atenção – Kwic e Kwoc


• Para o uso eficaz e eficiente desses tipos de
índices é importante que os títulos realmente
representem o conteúdo dos documentos, que
não façam uso de neologismos e linguagens
metafóricas

Você também pode gostar