Escolar Documentos
Profissional Documentos
Cultura Documentos
1aulaindexacao2013 130515205248 Phpapp01
1aulaindexacao2013 130515205248 Phpapp01
da representação temática
Homens Mulheres
____________ _____________
Crianças Adolescentes Adultos Crianças Adolescentes Adultos
Classificação cruzada
Exemplo incorreto: Se empregássemos, ao
mesmo tempo duas características (Língua e
lugar)
Literatura
____________________________________
Em língua Do Brasil De Portugal Em língua Do Chile Do Peru etc.
portuguesa espanhola
Característica, classe, categoria
Classe
É o conjunto de coisas ou ideias que possuem
um ou vários atributos, predicados ou
qualidades em comum. Ex.: Mamíferos,
Vertebrados, Canários, Animais.
Categoria
São as maiores classes de fenômenos, as
classes mais gerais que podem ser formadas.
São as grandes classes. Ex: na categoria Lugar,
pode-se distinguir as facetas: Lugar físico,
Lugar político, Orientação (norte, sul etc.).
Aristóteles e a classificação
Aristóteles dividiu o conhecimento com base
em três critérios (NUNES, 2007):
Critério de ausência ou presença do homem
nos seres investigados;
critério de imutabilidade e
critério de modalidade prática.
Foi a base
para a criação
da CDD
Indexação - conceito
Etapas do tratamento temático
Análise de assunto
Processo de ler um documento para extrair
conceitos que traduzam a essência do seu
conteúdo. (DIAS, NAVES, 2007, p. 9)
Envolve cultura do indexador, experiência,
conhecimento linguístico, cognitivo e lógico.
Também chamada de análise conceitual,
análise documentária, análise da informação e
subject analysis.
Etapas do tratamento temático
2) Tradução
Passagem dos termos de linguagem natural
(LN) para linguagem artificial/documentária
(LA/LD).
Eleição descritores autorizados pela LD
(cabeçalhos de assunto, palavras-chave,
termos de indexação).
Tipos de leitura
Como apreensão do documento (literal)
Como leitura interpretativa
Subordinação, superordenação e
coordenação
Superordenação Meio de transporte Subordinação
Coordenação
Carro Moto
Recuperação da Informação - RI
Information Retrieval: Termo cunhado por Calvin
Mooers (década de 1950) que engloba aspectos
intelectuais da descrição de informações e suas
especificidades para a busca, além de quaisquer
sistemas, técnicas ou máquinas empregados para o
desempenho da operação.
É a responsável pela criação e desenvolvimento da
Ciência da Informação. (SARACEVIC, 1996)
O objetivo é recuperar informações através da busca
por alguma entrada catalogada a priori.
Sistema de Recuperação da
Informação - SRI
Um sistema de informação coleta, processa,
armazena, analisa e dissemina informações e é
constituído por um conjunto de componentes
relacionados entre si. (GROSSI, 2008).
São sistemas de operações interligadas para
identificar dentre um grande conjunto de
informações, aquelas que sejam úteis, de acordo
com a demanda expressa pelo usuário. (LOPES,
2002)
Objetivo de um SRI é permitir que um usuário
recupere documentos através de características
como: autor, título, assunto ou qualquer combinação
desses elementos.
Atividades em um SRI
Representação das informações contidas nos
documentos;
Armazenamento;
Gestão física e/ou lógica desses documentos
e de suas representações;
Recuperação da informação representada e
dos próprios documentos armazenados
(links).
Disseminação da informação.
Sistema de Recuperação da
Informação - SRI
“Localização de documentos e itens de
informação que tenham sido objeto de
armazenamento.” (ROWLEY, 2002, p. 114)
Para Cendón (2006) catálogos de bibliotecas,
bases de dados bibliográficas, e motores de
busca na internet são exemplos de SRI.
(GROSSI, 2008)
Subsistemas dos SRIs
Subsistemas de entrada:
Seleção/aquisição, descrição, representação,
organização de arquivos, armazenamento.
Subsistemas de saída:
Análise e negociação de questões, estratégia de
busca/recuperação, disseminação/acesso ao
documento.
Subsistema de avaliação:
Não se refere especificamente nem à entrada, nem à
saída, mas a ambos, ao sistema como um todo.
Avaliação dos SRI
Cobertura:
Representa quanto o sistema contém informações
relevantes.
Exaustividade:
Este conceito relaciona-se ao grau de profundidade
com que os assuntos dos documentos são
representados.
Precisão:
Relaciona-se com a proporção de itens recuperados
que são relevantes.
Avaliação dos SRI
Tempo de resposta:
É o intervalo médio entre o momento da consulta e a
apresentação do resultado.
Esforço do usuário:
É o esforço despendido para obter resultados na
busca.
OR OU
NOT NÃO
2. 4.
Linguagem de indexação e de busca
Linguagem de indexação:
Termos ou códigos usados como pontos de acesso em
um índice.
Geralmente adota linguagem controlada (LC)
Linguagem de busca:
Termos que são usados por um consulente ao
especificar uma necessidade de busca.
Podem ser Linguagem natural (LN) ou LC, desde que o
usuário tenha acesso à linguagem documentária
adotada pelo sistema de recuperação da informação.
Linguagem natural e linguagem
artificial ou controlada (LOPES, 2002)
CONCEITUE LINGUAGEM NATURAL
É a linguagem usada habitualmente na fala e na escrita
representadas na base de dados pelos termos do título e
resumo.
Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases
de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002 e
CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: próxima aula.
Revocação e Relevância (Lancaster, 2004)
Revocação (recall)
Capacidade de um SRI em recuperar itens
existentes na base de dados.
Precisão mede quantos documentos
relevantes foram recuperados
Relevância (Precisão)
Capacidade de um SRI em recuperar itens
úteis ao usuário e minimizar a recuperação de
documentos inúteis.
Fórmulas para avaliar um SRI
(Revocação e Relevância)
Itens não Itens
recuperados
Itens não recuperados Revocação R= A / (A+D)
Relevantes (D)
recuperados Relevantes (A)
Relevantes (D)