Você está na página 1de 47

Relembrando fundamentos

da representação temática

Universidade Federal do Rio Grande (FURG) Disciplina


Indexação: T & P (2013)
Profa. Gisele Dziekaniak
giseledziekaniak@yahoo.com.br
http://indexacaoteoriaepraticafurg.blogspot.com.br/
Classificação
 Para James Duff Brown a classificação é um
“processo mental” constantemente executado de
forma consciente e inconsciente por qualquer ser
humano, ainda que não reconhecido como tal.

 Para Piedade (1983, p. 16) “Classificar é dividir em


grupos ou classes, segundo as semelhanças e
diferenças.”

 Para Ranganathan classificar era traduzir o nome


dos assuntos dos documentos da linguagem natural
para a linguagem artificial adotada pelos sistemas de
classificação bibliográfica. (PIEDADE, 1983)
Característica, classe e categoria
 Característica
 Qualidade ou atributo escolhido para servir de base à
classificação ou à divisão.
 Pode-se classificar adotando características distintas
para o mesmo objeto. Exemplos:
 Livros ■ Literatura
- Tamanho
- Lugar
- Cor
- Língua - Língua
- Assunto
- Período
“Há tantas possibilidades de classificar quantas forem as
semelhanças e diferenças existentes entre os objetos
ou ideias a classificar.” (PIEDADE, 1983, p. 17)
Classificação cruzada
 Pode-se classificar adotando várias
características, mas empregando uma de
cada vez e aplicando-a a todos os membros
da classe. Ex.: característica Sexo para
dividir animais racionais, não poderemos
empregar, ao mesmo tempo, a característica
faixa etária.
 O emprego simultâneo de mais de uma
característica se chama Classificação
cruzada, quando as classes não são
mutuamente excludentes, gerando confusão.
Classificação cruzada
Exemplo correto:
Animais Racionais
_________________________

Homens Mulheres
____________ _____________
Crianças Adolescentes Adultos Crianças Adolescentes Adultos
Classificação cruzada
Exemplo incorreto: Se empregássemos, ao
mesmo tempo duas características (Língua e
lugar)
Literatura
____________________________________
Em língua Do Brasil De Portugal Em língua Do Chile Do Peru etc.
portuguesa espanhola
Característica, classe, categoria
 Classe
É o conjunto de coisas ou ideias que possuem
um ou vários atributos, predicados ou
qualidades em comum. Ex.: Mamíferos,
Vertebrados, Canários, Animais.
 Categoria
São as maiores classes de fenômenos, as
classes mais gerais que podem ser formadas.
São as grandes classes. Ex: na categoria Lugar,
pode-se distinguir as facetas: Lugar físico,
Lugar político, Orientação (norte, sul etc.).
Aristóteles e a classificação
 Aristóteles dividiu o conhecimento com base
em três critérios (NUNES, 2007):
 Critério de ausência ou presença do homem
nos seres investigados;
 critério de imutabilidade e
 critério de modalidade prática.

 Trata-se de uma hierarquização conceitual


que divide um tema geral em espécies a
partir de uma característica classificatória.
Aristóteles e a classificação
 Aristóteles desenvolveu um sistema filosófico
baseado em uma concepção rigorosa do Universo.
Em seus tratados biológicos, apresentou o sistema
de classificação dos animais que não se encontrava
completo e que, originariamente em número de
quatro, foram os seguintes:
 Gênero
 Espécie
 Diferença
 Propriedade, e
 Acidente.
Aristóteles e a classificação
 Metafísica
Porfírio e a classificação
 A partir de Aristóteles, Porfírio descreve como as
qualidades atribuídas às coisas
podem ser classificadas,
quebrando o conceito filosófico
da substância como um
genus/espécie do
relacionamento:
Bacon e a classificação
 Na classificação baconiana, apesar de
algumas de suas classes e divisões se
tornarem imbricadas, este sistema foi
considerado um dos mais influentes nas
diversas tentativas feitas para classificar o
conhecimento. A classificação de Bacon está
baseada na figura abaixo:
Bacon e sua classificação
 MIR (Memória, Imaginação e Razão)

Foi a base
para a criação
da CDD
Indexação - conceito
Etapas do tratamento temático
 Análise de assunto
 Processo de ler um documento para extrair
conceitos que traduzam a essência do seu
conteúdo. (DIAS, NAVES, 2007, p. 9)
 Envolve cultura do indexador, experiência,
conhecimento linguístico, cognitivo e lógico.
 Também chamada de análise conceitual,
análise documentária, análise da informação e
subject analysis.
Etapas do tratamento temático

1) Fases da Análise de assunto


 Leitura técnica do documento (leitura
documental)
 Extração de conceitos que representam a obra
 Atinência - termos em LN (do que trata a obra?)

Sugestão de leitura: Dias e Naves (2007)


Etapas do tratamento temático

2) Tradução
 Passagem dos termos de linguagem natural
(LN) para linguagem artificial/documentária
(LA/LD).
 Eleição descritores autorizados pela LD
(cabeçalhos de assunto, palavras-chave,
termos de indexação).

Sugestão de leitura: Lancaster (2004)


Análise documentária
 “A análise documentária é definida como um
conjunto de procedimentos efetuados com o
fim de expressar o conteúdo dos
documentos, sob formas destinadas a
facilitar a recuperação da informação.” (DIAS,
NAVES, 2007, p. 11)
 Metainformação (informação da informação)
Leitura do bibliotecário (LUCAS, 2000)
 Questões ideológicas
 Equívoco da neutralidade
Dica de leitura:
 Ilusão da completude Lucas (2000)
 Sujeitos leitores
 Organizam arquivos
 Autorizados a ler, escrever e interpretar

 Tipos de leitura
 Como apreensão do documento (literal)
 Como leitura interpretativa
Subordinação, superordenação e
coordenação
Superordenação Meio de transporte Subordinação

Terrestre Aéreo Aquático

Coordenação
Carro Moto
Recuperação da Informação - RI
 Information Retrieval: Termo cunhado por Calvin
Mooers (década de 1950) que engloba aspectos
intelectuais da descrição de informações e suas
especificidades para a busca, além de quaisquer
sistemas, técnicas ou máquinas empregados para o
desempenho da operação.
 É a responsável pela criação e desenvolvimento da
Ciência da Informação. (SARACEVIC, 1996)
 O objetivo é recuperar informações através da busca
por alguma entrada catalogada a priori.
Sistema de Recuperação da
Informação - SRI
 Um sistema de informação coleta, processa,
armazena, analisa e dissemina informações e é
constituído por um conjunto de componentes
relacionados entre si. (GROSSI, 2008).
 São sistemas de operações interligadas para
identificar dentre um grande conjunto de
informações, aquelas que sejam úteis, de acordo
com a demanda expressa pelo usuário. (LOPES,
2002)
 Objetivo de um SRI é permitir que um usuário
recupere documentos através de características
como: autor, título, assunto ou qualquer combinação
desses elementos.
Atividades em um SRI
 Representação das informações contidas nos
documentos;
 Armazenamento;
 Gestão física e/ou lógica desses documentos
e de suas representações;
 Recuperação da informação representada e
dos próprios documentos armazenados
(links).
 Disseminação da informação.
Sistema de Recuperação da
Informação - SRI
 “Localização de documentos e itens de
informação que tenham sido objeto de
armazenamento.” (ROWLEY, 2002, p. 114)
 Para Cendón (2006) catálogos de bibliotecas,
bases de dados bibliográficas, e motores de
busca na internet são exemplos de SRI.
(GROSSI, 2008)
Subsistemas dos SRIs
 Subsistemas de entrada:
Seleção/aquisição, descrição, representação,
organização de arquivos, armazenamento.

 Subsistemas de saída:
Análise e negociação de questões, estratégia de
busca/recuperação, disseminação/acesso ao
documento.

 Subsistema de avaliação:
Não se refere especificamente nem à entrada, nem à
saída, mas a ambos, ao sistema como um todo.
Avaliação dos SRI
 Cobertura:
Representa quanto o sistema contém informações
relevantes.

 Exaustividade:
Este conceito relaciona-se ao grau de profundidade
com que os assuntos dos documentos são
representados.

 Precisão:
Relaciona-se com a proporção de itens recuperados
que são relevantes.
Avaliação dos SRI
 Tempo de resposta:
É o intervalo médio entre o momento da consulta e a
apresentação do resultado.
 Esforço do usuário:
É o esforço despendido para obter resultados na
busca.

 Formato: como os resultados são apresentados. São


várias as características e tipologias comuns aos
diversos sistemas de recuperação da informação,
porém um módulo que todos devem possuir, por ser
fundamental, é o módulo de interface com o usuário.
(ARAUJO, 1994).
Estratégias de busca em um SRI
 Estratégia de busca é o conjunto de decisões
tomadas e de procedimentos adotados durante uma
busca.
 É a técnica ou conjunto de regras para tornar
possível o encontro entre uma pergunta formulada e
a informação armazenada em uma base de dados.
(LOPES, 2002).
 É a técnica ou conjunto de regras para tornar
possível o encontro entre uma pergunta formulada e
a informação armazenada em uma base de dados.
 Uma boa estratégia de busca implica em conhecer a
base de dados, as fórmulas de busca, o assunto que
se busca e/ou a bibliografia que é objeto de busca.
 Identificar a Necessidade de Informação (NI).
Estratégia de busca
NI fórmula de busca = resultado SRI
Resposta insatisfatória = RUÍDO
= Usuário insatisfeito
= Nova estratégia de busca

Resposta satisfatória = NI satisfeita


= Item recuperado
= usuário satisfeito
Objetivos da estratégia de busca
 Recuperar um número suficiente de registros
relevantes e evitar que:
 Sejam recuperados itens irrelevantes;
 Sejam recuperados um número excessivo de
itens;
 Sejam recuperados um número insignificante
de registros.
Problemas em recuperação da
informação
 Os autores nem sempre usam as mesmas
palavras que os usuários para descrever o
mesmo conceito.
 Má formulação da consulta.
Lógica de busca: Operadores
booleanos
AND E

OR OU

NOT NÃO

Os operadores booleanos tem por objetivo definir como será a combinação


feita entre os termos ou expressões de uma pesquisa.
Lógica de busca: Operadores
booleanos
 OR/OU Amplia a pesquisa e tem a
intenção de buscar ou esse ou aquele
termo. Ou seja, qualquer uma das
palavras.
 Exemplo:
A or B
A B
Lógica de busca: Operadores
booleanos
 AND/E Restringe a pesquisa e
significa a expressão que tenha todas as
palavras. O resultado da busca deve
recuperar ambos os termos.
 Exemplo:
A and B
Lógica de busca: Operadores
booleanos
 NOT/NÃO Exclui um dos termos da
pesquisa. Equivale dizer: sem a seguinte
palavra.
 Exemplo:
A not B
Lógica de busca: Operadores
booleanos
 Podem ser usados em expressões mais
complexas, onde se adotam os parênteses.
 Ex: (A or B) and C
A pesquisa será feita 1º combinando a OR b e o
resultado se combina com AND
Exercícios Operadores booleanos
Crie buscas usando assuntos que representem
os seguintes conjuntos:
1. 3.

2. 4.
Linguagem de indexação e de busca
 Linguagem de indexação:
 Termos ou códigos usados como pontos de acesso em
um índice.
 Geralmente adota linguagem controlada (LC)

 Linguagem de busca:
 Termos que são usados por um consulente ao
especificar uma necessidade de busca.
 Podem ser Linguagem natural (LN) ou LC, desde que o
usuário tenha acesso à linguagem documentária
adotada pelo sistema de recuperação da informação.
Linguagem natural e linguagem
artificial ou controlada (LOPES, 2002)
 CONCEITUE LINGUAGEM NATURAL
É a linguagem usada habitualmente na fala e na escrita
representadas na base de dados pelos termos do título e
resumo.

 CONCEITUE A LINGUAGEM CONTROLADA


É o conjunto de termos organizados de forma
hierarquizadas e/ou alfabética, com o objetivo de
possibilitar a recuperação de informação temáticas,
reduzindo substancialmente a diversidade de
terminologia.
Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informação
da área. Entrega: Próxima aula. (não esquecer de referenciar as fontes
adotadas).
Diferenças entre Linguagem natural
(LN) e linguagem controlada (LC, LC)
Linguagem natural ou livre Linguagem controlada (LC, LA,
(LN) LD)
Busca direta no texto Depende de uma LD
Usa linguagem comum do Distancia-se da linguagem do
usuário usuário
Oferece mais pontos de Os pontos de acesso são
acesso limitados pelo indexador
Oferece maior revocação Oferece menor revocação
Oferece menos precisão Oferece maior precisão

Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases
de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002 e
CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: próxima aula.
Revocação e Relevância (Lancaster, 2004)
 Revocação (recall)
 Capacidade de um SRI em recuperar itens
existentes na base de dados.
 Precisão mede quantos documentos
relevantes foram recuperados

 Relevância (Precisão)
 Capacidade de um SRI em recuperar itens
úteis ao usuário e minimizar a recuperação de
documentos inúteis.
Fórmulas para avaliar um SRI
(Revocação e Relevância)
Itens não Itens
recuperados
Itens não recuperados Revocação R= A / (A+D)
Relevantes (D)
recuperados Relevantes (A)
Relevantes (D)

Itens não Itens


recuperados não recuperados não Relevância P = A / (A+B)
Relevantes (C) Relevantes (B)

Revocação = relevantes recuperados/ total de itens relevantes


que existem no sistema

Precisão = relevantes recuperados/ total de itens recuperados


Revocação e Relevância
 Esses dois parâmetros são inversamente
relacionados, significando que a melhoria de um
implica na piora do outro.
 Tradicionalmente, existem dois fatores muito
importantes que governam a eficiência da indexação
de um documento e consequentemente, influenciam
na revocação e na precisão:
 Exaustividade: Define o número de diferentes
conceitos (tópicos) que estão indexados.
 Especificidade: Define o grau de precisão da
linguagem de indexação em descrever um dado
documento.
Referências
 ARAUJO JUNIOR, R. H. Precisão no processo de busca e
recuperação da informação. Brasília: Thesaurus, 2004.
 DIAS, M. M. L.; DIAS, E. W. Análise de assunto: teoria e
prática. Brasília: Briquet de Lemos, 2007.
 GROSSI, M.G. R. Estudo das características de software e
implantação de um software livre para gerenciamento de
bibliotecas universitárias federais brasileiras. 2008. Tese
(Doutorado em Ciência da Informação) – UFMG, Belo
Horizonte, 2008.
 LANCASTER, F. W. Indexação e resumos: teoria e prática.
2.ed. Brasília: Briquet de Lemos, 2004.
 LOPES, I. L. Uso das linguagens controlada e natural em bases
de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-
52, jan./abr. 2002.
Referências
 NUNES, L. Da Classificação das Ciências à
classificação da Informação: uma análise do acesso
ao conhecimento. 2007. Dissertação (Mestrado em
Ciência da Informação) - PUC de Campinas, 2007.
Disponível em <
http://www.bibliotecadigital.puc-campinas.edu.br/tde_busc
php?codArquivo=340 > Acesso em 22 nov. 2009
 PIEDADE, M. A. R. Introdução à teoria da
classificação. Rio de Janeiro: Interciência, 1977.
 ROWLEY, J. A biblioteca eletrônica. 2.ed. Brasília:
Briquet de Lemos, 2002.
 SARACEVIC, T. Ciência da informação: origem,
evolução e relações. Perspec. Ci. Inf., Belo
Horizonte, v. 1, n.1, p.41-62, jan./jun. 1996.

Você também pode gostar