Escolar Documentos
Profissional Documentos
Cultura Documentos
INDEXAÇÃO
Indexação
• Uma das formas de descrição de conteúdo.
• É o processo por meio do qual o conteúdo de um recurso
informacional é analisado e seu assunto (aboutness) é
determinado e expresso de uma maneira concisa.
• Escolhe-se os termos mais apropriados para descrever o
conteúdo de um documento.
• Esses termos são extraídos da linguagem adotada pelo
sistema de informação.
• Os termos são ordenados para constituir índices que
serão utilizados para pesquisa.
Indexação
• A indexação é a operação central do sistema para
a armazenagem e pesquisa das informações
• Está inserida no ciclo documentário
• O produto da indexação é utilizado:
▫ Na entrada do documento no sistema
▫ Na consulta ao documento no sistema
Ciclo documentário - indexação
• Identificam-se os conceitos de que trata o
documento, expressando-os:
▫ na terminologia utilizada pelo autor (linguagem
natural) ou
▫ com ajuda de vocábulos ou termos de significação
unívoca ou ainda por meio de códigos
(linguagens documentárias, descritores,
sistemas de classificação etc.)
(Robredo, 2005)
Vocabulário
Termo A
Termo A – Doc. 3;
Termo B
Termo B – Doc. 1, 2;
Documento 1 Termo C
Termo C – Doc. 3
Documento 2 Termo D
Termo D – Doc. 2
Documento 3 Termo E
Termo E – Doc 1, 3;
.... Termo F
Termo F – Doc. 2
Termo G
Termo G – Doc. 1
...
Termo A Termo A – Doc. 3;
Termo C Termo B – Doc. 1, 2;
Termo E Termo C – Doc. 3
Termo D – Doc. 2
Termo E – Doc 1, 3;
Termo F – Doc. 2
Termo G – Doc. 1
Doc 3
Atenção
• Tudo é decidido no nível da entrada, input.
• Se a arquitetura dos registros dos
documentos e a indexação são de má
qualidade, a quantidade de informação
perdida para sempre será inimaginável.
Rostos
(faces)
Comida
(food)
• Na medida em que o indivíduo vai crescendo
várias categorias vão sendo construídas em sua
mente de acordo com o que ele aprende,
conhece, entra em contato com o mundo etc.
Sensação – Percepção - Cognição
Objeto
Cérebro
Interpretação e
integração das
características do
objeto aos R
conhecimentos do e
sujeito s
Captação
pelo p
sistema Estruturas corticais o
sensorial Memória s
Categorização
t
Atenção
Resolução de
a
• Características: Sistema cognição problemas de s
▫ cor raciocínio
▫ textura Linguagem
▫ tamanho
▫ formato
▫ profundidade
Processo cognitivo
Processo perceptivo
Nível da indexação
• O nível da indexação varia de acordo com as
necessidades e as possibilidades da unidade de
informação
• Indexação genérica
▫ é a indexação que referir-se apenas aos assuntos
principais
▫ Assemelha-se a classificação com diferenças:
Indexação é múltipla, pode identificar vários
assuntos
Classificação é única – identifica apenas o assunto
principal
Nível da indexação
• Indexação média
▫ A indexação refere-se ao conjunto de assuntos
tratados no documento, identificando-o com
termos relativamente gerais
▫ Pode conter até dez descritores
• Indexação em profundidade
▫ Refere-se aos assuntos descritos de forma
bastante detalhado
▫ Utiliza mais de dez descritores
Nível da indexação
• Indexação exaustiva
▫ Refere-se à totalidade do documento
▫ praticamente frase por frase
▫ Utilizada para um trabalho aprofundado nos
textos
▫ Ex. como em decisões de justiça
Atenção:
• não é aconselhável indexar apenas pelo exame desses itens, eles
são complementares
•Não basear-se apenas no título e no resumo pois podem ser
insuficientes para identificação co tema
• Determinar o assunto principal do documento
• Analisar o conjunto do documento em função do
nível de indexação desejado
• A indexação dos termos significativos deve ser
feita de acordo com a organização do
documento.
• O indexador deve extrair todos os termos que
julga úteis para descrever completamente todos
os conceitos e todos os objetos tratados no
documento capazes de interessar aos usuários.
Atenção
• Ao indexar um relatório de pesquisa para uma
unidade de informação de um centro de
pesquisa, por exemplo, deve-se ressaltar não
apenas o problema abordado e suas conclusões,
mas também o método e o universo estudado
• A indexação deve responder às questões que o
usuário faz para saber qual é o objetivo de um
documento e em que este documento pode
servir.
• Pode-se lembrar estes objetivos
sistematicamente pelas seguintes perguntas:
Perguntas que ajudam
• O que? – ajuda a determinar os assuntos ou
temas tratados pelo documento ou pela
pergunta.
▫ Ex. as técnicas de irrigação,
▫ os fertilizantes e
▫ as técnicas culturais
• De que forma? – leva a precisar a forma como
os assuntos apresentam-se.
▫ Ex. estudo de uma rede de irrigação
▫ Cálculo das necessidades de água
Perguntas que ajudam
• Como? - Leva a precisar as diversas circunstâncias que
cercam a ação, as causas, as consequências, os objetivos.
▫ Ex.introdução de novas culturas e a seca persistente,
assim como certas formas práticas de realizar uma
ação, como a irrigação por aspersão e a utilização de
um modelo para estudo
• Quando? – leva a precisar a data ou o período em que
se desenvolve a ação. É diferente da data de publicação
do documento.
• Onde? – local onde a ação se desenvolve. Nem sempre
há uma zona geográfica determinada. Identificar o pais
ou em escala menor como estado, município, bairro,
região agrícola etc.
Identificação dos conceitos
• Seleção dos conceitos indicativos do assunto
• Considerar os pontos básicos no campo do
conhecimento ao qual se refere o conteúdo do
documento:
▫ Os fenômenos mencionados
▫ Os processos utilizados
▫ As propriedades inerentes aos objetos
▫ As operações efetuadas
▫ O equipamento empregado etc.
Seleção dos conceitos
• Após a análise do documento e a identificação dos
conceitos, o indexador pode concluir pela inclusão:
▫ de todos os conceitos identificados
▫ apenas alguns conceitos identificados
• Esta decisão está relacionada:
▫ com o uso ao qual destina-se o índice
▫ tipo de sistema de informação desenvolvido
• Considerar dois aspectos
▫ Exaustividade
▫ Especificidade
• Há sistemas que definiram em sua política de
indexação:
▫ Utilizar os descritores específicos
▫ Utilizar os descritores genéricos e
▫ Utilizar os termos relacionados
• Ex. redes de irrigação incluir também
infraestrutura agrícola
Exaustividade
• É a relação entre o número dos documentos
pertinentes fornecidos em resposta a uma
pergunta e o número total de documentos
pertinentes que responderiam à pergunta
formulada.
• É a profundidade de análise de um documento,
objetivando a indicação do assunto a ser
especificado.
Exaustividade
A seleção de descritores visando a exaustividade baseia-se nos
seguintes pontos:
• O processo de análise do documento permite a identificação dos
temas ou conceitos passíveis de interessar os utilizadores de um
determinado sistema de informação;
• Os textos podem tratar de mais de um assunto e todos devem ser
indicados;
• Os assuntos devem ser indexados sob todos os aspectos abordados.
Caso não interessem aos usuários atuais podem atender a usuários
potenciais
• O número de descritores utilizados para indicação dos temas
identificados num documento é condicionado pela quantidade de
informação encontrada no texto.
Especificidade
• É o grau de precisão de um sistema de indexação
quando aplicado aos assuntos de um documento
Especificidade
A seleção de descritores visando a especificidade
baseia-se nos seguintes pontos:
• A indexação deve particularizar ao máximo a
informação, escolhendo os conceitos mais
específicos
• Quando for do interesse dos usuários, os
conceitos genéricos podem ser indexados.
• Ponderação – atribuída a termos que indicam o
nível de especificidade
Especificidade - Ponderação
• Consiste na atribuição de símbolos para marcar a
importância de um assunto no contexto do documento
• Esses símbolos auxiliam o leitor/usuário a selecionar o
tema mais apropriado a seus objetivos
• Podem ser utilizados números, letras, sinais diacríticos,
pontuação
• Ex. aos números 3, 2, 1 são atribuídos um valor: maior,
médio e menor respectivamente
• A presença de um número desses junto ao descritor
indica que o assunto é tratado com maior ou menor
profundidade, de acordo com o ponderador
Critérios de avaliação da qualidade
da indexação
• Exaustividade – se todos os temas, objetos e conceitos
tratados no documento foram bem representados na
indexação
• Seletividade – verificar se foram retidas apenas as
informações que interessam ao usuário
• Especificidade – ver se a descrição traduz da forma mais
precisa possível, o conteúdo do documento e que não utiliza
descritores muito gerais ou muito específicos em relação às
noções expressas no documento
• Uniformidade ou consistência – verificar se os
indexadores descrevem um mesmo documento ou
documentos sobre um mesmo assunto da mesma forma.
Tradução
• É a etapa da tradução dos conceitos na linguagem
utilizada pelo sistema
• É um processo que envolve a representação da análise
conceitual mediante um termo ou termos extraídos de
um vocabulário
• Instrumentos indexadores:
▫ Tipo alfabético combinatório – cabeçalhos de assunto
e tesauros
▫ Tipo numérico ou alfanumérico – sistemas de
classificação
• Para um bom desempenho do indexador é necessário
conhecimento prévio do instrumento a ser utilizado e de
sua filosofia, metodologia, organização etc.
Tradução
Tradução
• As listas de cabeçalhos de assunto são
linguagens pré-coordenadas, não registram
termos para todos os conceitos. É necessário
criá-los em alguns casos, para atender às
exigências da análise.
• Os tesauros são linguagem pós-coordenadas,
permitindo combinações posteriores tornam
possível a indicação de grande número de
conceitos que não se encontram registrados
diretamente na lista.
Tradução
Vocabulário
Acervo do sistema
Produto da indexação
• Os produtos da indexação são índices, ou seja,
lista de termos significativos
• Índice – objetivos
▫ Recuperar informações
▫ Selecioná-las para atender às necessidades dos
usuários
Conceito - Índice
• O sinal ou símbolo adotado para caracterizar a informação é, em
todos os casos e sistemas, um indicador – um dispositivo de
identificação – a que se tem chamado de várias maneiras. O nome
genérico é índice.
• Índice – é o roteiro ordenado, alfabético ou sistemático, dos itens de
uma coleção
• O profissional da informação identifica e isola no texto cada
informação, ou extrai dele um índice para servir de guia
• Esse índice (frase-chave, palavra-chave) funciona a maneira de
chave, sempre que quiser recuperar ou obter a informação
• É um mecanismo ou instrumento auxiliar empregado na busca,
localização e recuperação de informações
Índice
• A composição do índice baseia-se nas entradas que são
suas unidades de informação.
• Cada entrada apresenta:
▫ Identificação do conceito – por meio de símbolos:
Alfabéticos (cabeçalhos de assunto, descritor, palavras-chave)
Numéricos (classificações puras)
Alfanuméricos (classificações alfabéticas e alfanuméricas
▫ Localização do item relacionado com o conceito
indexado ou com os autores indicados – remete ao
setor do documento onde se encontra o conceito
Índices – rótulos semânticos
• Rótulos semânticos ou termos
• São as entradas que compõem o índice
• São informações impressas ou escritas (alfabéticas ou
codificadas), transmitidas a um sistema de informação
para processamento
• São as técnicas, mecanismos e meios utilizados para a
comunicação com o equipamento de processamento de
dados e para os próprios dados compreendidos ou
envolvidos nessa comunicação.
Índice
• A natureza de um índice é determinada pelo
conteúdo do material que está sendo indexado,
pelos objetivos do sistema e pela formação
acadêmica de seus usuários.
Tipos de índices
• De acordo com diferentes parâmetros (elemento
cuja modificação de valor altera o resultado de
um problema, sem alterar sua natureza) os
índices podem se incluir nas espécies a seguir:
▫ Índices conforme seu arranjo
▫ Índices conforme o tipo de entrada
▫ Índices de acordo com a forma de apresentação
▫ Índices de acordo com a forma de consulta
▫ Índices conforme a estrutura
Índices conforme seu arranjo
• Alfabético
• Cronológico
• Hierárquico
• Numérico
• Concordâncias
Índices conforme o tipo de entrada
• Autor (onomástico)
• Cabeçalho de assunto
• Citações
• Descritores
• Palavra-chave
• Título (biblionímico)
Índices de acordo com a forma de
apresentação
• Em fichas
• Impressos
• Computadorizados
▫ Fitas magnéticas (acesso sequencial)
▫ Discos magnéticos (acesso em linha)
Índices de acordo com a forma de
consulta
• Sequencial
• Seletivo
Índices conforme a estrutura
• Acesso único
• Conjuntivo
▫ Subordinado
▫ Coordenado
Convencional
Invertido
67
KWIC
• Key word in context
• Criado por Hans Peter Luhn, em 1957
• Peter Luhn apresentou seu trabalho em 1958 na
International Conference on Scientific
Information
• Lista elaborada pelo computador, composta por
palavras chave retiradas do título do
documento (palavras significativas),
apresentados em ordem alfabética
68
Exemplo
• Termos não significativos
▫ Geral
▫ Da
• Esses termos não
desempenham função
especificamente descritiva do
texto indexado são incluídos
em uma lista especial a que
deram o nome de stoplist,
stopword, termos não
significativos
71
KWOC
• Key word out of context
• Lista de palavras chave, dispostas em ordem
alfabética, colocadas à margem esquerda do
papel, seguidas dos títulos das obras
73