Você está na página 1de 16

Planejamento e políticas de indexação

 Partes do texto que devem ser examinadas para


fazer a indexação:
 Título
 Resumo, se houver
 Sumário
 Introdução, frases e parágrafos de abertura de
capítulos e as conclusões
 Gráficos, ilustrações, tabelas
 Palavras ou grupo de palavras que apareçam
sublinhados ou com grafia diferente
 Fatores que influem no desempenho de um
sistema de recuperação da informação e que são
diretamente atribuíveis a indexação:
 Política de indexação
 Exatidão da indexação
 Análise conceitual
 Tradução
 Política de indexação

 Principal decisão: exaustividade da indexação


 número de termos em média atribuídos
 emprego de termos em número suficiente
para abranger o conteúdo temático do
documento de modo bastante completo
 quanto mais termos forem usados para
indexar um documento mais acessível ele se
tornará
 na indexação exaustiva será recuperado um
número maior de itens que o usuário considera
como não sendo pertinentes
 Política de indexação

o número de falsas associações aumentará


conforme aumente o número de termos
 quanto mais termos forem empregados para
indexar um documento, mais ele será
recuperado em resposta a tópicos de busca
que nele são tratados de forma apenas
secundária
 Política de indexação

 Especificidade da indexação: extensão com que


o sistema permite que sejamos precisos ao
especificarmos o assunto do documento
 em geral é melhor utilizar vários termos
específicos, ao invés de um termo mais
genérico
 Cultivo de laranjas
 LARANJAS
 FRUTAS CÍTRICAS OU FRUTAS
Política de indexação
 Cobertura: proporção do total de literatura
útil sobre um assunto que foi coletada e
indexada no sistema
 Utilidade: valor da literatura em relação a
idade, confiabilidade e nível de entendimento
do usuário
 Relevância: grau de coincidência entre os
itens recuperados e a pergunta do usuário
 probabilidade dos documentos
recuperados coincidirem com as exigências
do leitor
 Exatidão da indexação

 incluir todos os tópicos reconhecidamente de


interesse para os usuários do serviço de
informação, que sejam tratados
substantivamente no documento
 indexar cada um desses tópicos tão
especificamente quanto o permita o vocabulário
do sistema e justifiquem as necessidades e
interesse dos usuários
 Exatidão da indexação

 revocação: extensão com que ocorre a


recuperação de itens relevantes (pertinentes).
Capacidade de recuperar todos os documentos
sobre determinado assunto.
 IR=NUI/NTU
 IR = índice de revocação
 NUI = número de itens úteis recuperados
 NTU = número total de itens úteis contidos
na base de dados
 Exatidão da indexação

 precisão: capacidade de recuperar todos os


documentos sobre determinado assunto.
 CP=NUI/NTU
 CP = coeficiente de precisão
 NUI = número de itens úteis recuperados
 NTU = número total de itens recuperados
 Exatidão da indexação

 Revocação x Precisão
 O problema em todas as buscas é tentar
manter o equilíbrio entre revocação e
precisão. O que é comumente preciso é obter
o máximo de revocação, porém, mantendo um
nível aceitável de precisão.
Quanto mais pontos de acesso forem providos para a
recuperação, mais alta será a revocação possível, porém,
menor será a precisão. Um dos motivos disso é o fato de que
quanto mais pontos de acesso são providos, maior será a
possibilidade de que alguns deles digam respeito a aspectos
bastante secundários do documento.
 Exatidão da indexação

 Revocação x Precisão
 Quanto mais pontos de acesso forem
providos para a recuperação, mais alta será a
revocação possível, porém, menor será a
precisão. Um dos motivos disso é o fato de
que quanto mais pontos de acesso são
providos, maior será a possibilidade de que
alguns deles digam respeito a aspectos
bastante secundários do documento.
 Exatidão da indexação

 Mecanismos para aumentar a revocação:


 controle de sinônimos: remissiva USE
 aumenta a revocação, porém afeta a
precisão (falsa combinação)
controle da forma dos descritores: número,
forma gramatical, ordem da palavra, etc
 classificação: agrupamento hierárquico dos
termos permite identificar conceitos mais
genéricos e ampliar a pesquisa
 Exatidão da indexação

 Mecanismos para aumentar a revocação:


 relações estruturais, relações hierárquicas e
não-hierárquicas: introdução de termos
relacionados
 grupamento de termos ou aglomerados: técnica
usada em indexação automática, a partir da co-
ocorrência de palavras estabelecem-se classes
para o agrupamento dos termos
 Exatidão da indexação

 Mecanismos para aumentar a precisão:


 especificidade da linguagem de indexação:
quanto maior a profundidade da linguagem, o
assunto dos documentos poderá ser descrito mais
profundamente
 coordenação: combinação de termos.
Aumentando o número de termos de indexação
em combinação na indexação ou busca, os
conceitos desejados serão definidos com maior
acuidade e documentos não satisfatórios serão
eliminados
 Exatidão da indexação

 Mecanismos para aumentar a precisão:


 elos: usados para evitar falsa combinação ou
falsa coordenação de termos
 indicadores de função: símbolos agregados aos
termos, no momento da indexação, para indicar a
função e o uso do termo em um determinado
contexto
 indicadores relacionais: seqüência, pontuação,
inversão e gramática utilizados para indicar
relações entre os termos
 Exatidão da indexação

 Mecanismos para aumentar a precisão:


 ponderação (peso): atribuição de peso aos
termos de indexação para indicar a sua
importância na representação dos assuntos de um
documento

Você também pode gostar