Escolar Documentos
Profissional Documentos
Cultura Documentos
Universidade Federal do Rio Grande (FURG) Disciplina Indexao: T & P (2013) Profa. Gisele Dziekaniak giseledziekaniak@yahoo.com.br
http://indexacaoteoriaepraticafurg.blogspot.com.br/
Classificao
Para James Duff Brown a classificao um
processo mental constantemente executado de forma consciente e inconsciente por qualquer ser humano, ainda que no reconhecido como tal. grupos ou classes, segundo as semelhanas e diferenas.
dos assuntos dos documentos da linguagem natural para a linguagem artificial adotada pelos sistemas de classificao bibliogrfica. (PIEDADE, 1983)
H tantas possibilidades de classificar quantas forem as semelhanas e diferenas existentes entre os objetos ou ideias a classificar. (PIEDADE, 1983, p. 17)
Classificao cruzada
Pode-se classificar adotando vrias
caractersticas, mas empregando uma de cada vez e aplicando-a a todos os membros da classe. Ex.: caracterstica Sexo para dividir animais racionais, no poderemos empregar, ao mesmo tempo, a caracterstica faixa etria. O emprego simultneo de mais de uma caracterstica se chama Classificao cruzada, quando as classes no so mutuamente excludentes, gerando confuso.
Classificao cruzada
Exemplo correto: Animais Racionais _________________________ Homens ____________
Crianas Adolescentes Adultos
Mulheres _____________
Crianas Adolescentes Adultos
Classificao cruzada
Exemplo incorreto: Se empregssemos, ao mesmo tempo duas caractersticas (Lngua e lugar) Literatura ____________________________________
Em lngua portuguesa Do Brasil De Portugal Em lngua espanhola Do Chile Do Peru etc.
Aristteles e a classificao
Aristteles dividiu o conhecimento com base
Critrio de ausncia ou presena do homem nos seres investigados; critrio de imutabilidade e critrio de modalidade prtica.
Aristteles e a classificao
Aristteles desenvolveu um sistema filosfico
baseado em uma concepo rigorosa do Universo. Em seus tratados biolgicos, apresentou o sistema de classificao dos animais que no se encontrava completo e que, originariamente em nmero de quatro, foram os seguintes: Gnero Espcie Diferena Propriedade, e Acidente.
Aristteles e a classificao
Metafsica
Porfrio e a classificao
A partir de Aristteles, Porfrio descreve como as
qualidades atribudas s coisas podem ser classificadas, quebrando o conceito filosfico da substncia como um genus/espcie do relacionamento:
Bacon e a classificao
Na classificao baconiana, apesar de
algumas de suas classes e divises se tornarem imbricadas, este sistema foi considerado um dos mais influentes nas diversas tentativas feitas para classificar o conhecimento. A classificao de Bacon est baseada na figura abaixo:
Indexao - conceito
Processo de ler um documento para extrair conceitos que traduzam a essncia do seu contedo. (DIAS, NAVES, 2007, p. 9) Envolve cultura do indexador, experincia, conhecimento lingustico, cognitivo e lgico. Tambm chamada de anlise conceitual, anlise documentria, anlise da informao e subject analysis.
Passagem dos termos de linguagem natural (LN) para linguagem artificial/documentria (LA/LD). Eleio descritores autorizados pela LD (cabealhos de assunto, palavras-chave, termos de indexao).
Anlise documentria
A anlise documentria definida como um
conjunto de procedimentos efetuados com o fim de expressar o contedo dos documentos, sob formas destinadas a facilitar a recuperao da informao. (DIAS, NAVES, 2007, p. 11) Metainformao (informao da informao)
Organizam arquivos Autorizados a ler, escrever e interpretar Como apreenso do documento (literal) Como leitura interpretativa
Tipos de leitura
Terrestre
Areo
Aqutico
Carro
Moto
Coordenao
Recuperao da Informao - RI
Information Retrieval: Termo cunhado por Calvin
Mooers (dcada de 1950) que engloba aspectos intelectuais da descrio de informaes e suas especificidades para a busca, alm de quaisquer sistemas, tcnicas ou mquinas empregados para o desempenho da operao. a responsvel pela criao e desenvolvimento da Cincia da Informao. (SARACEVIC, 1996) O objetivo recuperar informaes atravs da busca por alguma entrada catalogada a priori.
armazena, analisa e dissemina informaes e constitudo por um conjunto de componentes relacionados entre si. (GROSSI, 2008). So sistemas de operaes interligadas para identificar dentre um grande conjunto de informaes, aquelas que sejam teis, de acordo com a demanda expressa pelo usurio. (LOPES, 2002) Objetivo de um SRI permitir que um usurio recupere documentos atravs de caractersticas como: autor, ttulo, assunto ou qualquer combinao desses elementos.
Atividades em um SRI
Representao das informaes contidas nos
documentos; Armazenamento; Gesto fsica e/ou lgica desses documentos e de suas representaes; Recuperao da informao representada e dos prprios documentos armazenados (links). Disseminao da informao.
informao que tenham sido objeto de armazenamento. (ROWLEY, 2002, p. 114) Para Cendn (2006) catlogos de bibliotecas, bases de dados bibliogrficas, e motores de busca na internet so exemplos de SRI. (GROSSI, 2008)
No se refere especificamente nem entrada, nem sada, mas a ambos, ao sistema como um todo.
Este conceito relaciona-se ao grau de profundidade com que os assuntos dos documentos so representados.
Preciso:
o intervalo mdio entre o momento da consulta e a apresentao do resultado. Esforo do usurio: o esforo despendido para obter resultados na busca.
Formato: como os resultados so apresentados. So
vrias as caractersticas e tipologias comuns aos diversos sistemas de recuperao da informao, porm um mdulo que todos devem possuir, por ser fundamental, o mdulo de interface com o usurio. (ARAUJO, 1994).
tomadas e de procedimentos adotados durante uma busca. a tcnica ou conjunto de regras para tornar possvel o encontro entre uma pergunta formulada e a informao armazenada em uma base de dados. (LOPES, 2002). a tcnica ou conjunto de regras para tornar possvel o encontro entre uma pergunta formulada e a informao armazenada em uma base de dados. Uma boa estratgia de busca implica em conhecer a base de dados, as frmulas de busca, o assunto que se busca e/ou a bibliografia que objeto de busca. Identificar a Necessidade de Informao (NI).
Estratgia de busca
NI frmula de busca = resultado SRI
Sejam recuperados itens irrelevantes; Sejam recuperados um nmero excessivo de itens; Sejam recuperados um nmero insignificante de registros.
Os operadores booleanos tem por objetivo definir como ser a combinao feita entre os termos ou expresses de uma pesquisa.
Amplia a pesquisa e tem a inteno de buscar ou esse ou aquele termo. Ou seja, qualquer uma das palavras. Exemplo:
A or B
A
B
Restringe a pesquisa e significa a expresso que tenha todas as palavras. O resultado da busca deve recuperar ambos os termos. Exemplo:
A and B
Exclui um dos termos da pesquisa. Equivale dizer: sem a seguinte palavra. Exemplo: A not B
2.
4.
Linguagem de busca: Termos que so usados por um consulente ao especificar uma necessidade de busca. Podem ser Linguagem natural (LN) ou LC, desde que o usurio tenha acesso linguagem documentria adotada pelo sistema de recuperao da informao.
a linguagem usada habitualmente na fala e na escrita representadas na base de dados pelos termos do ttulo e resumo.
CONCEITUE A LINGUAGEM CONTROLADA
o conjunto de termos organizados de forma hierarquizadas e/ou alfabtica, com o objetivo de possibilitar a recuperao de informao temticas, reduzindo substancialmente a diversidade de terminologia.
Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informao da rea. Entrega: Prxima aula. (no esquecer de referenciar as fontes adotadas).
Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: reviso de literatura. Ci. Inf., v. 31, n.1, Braslia, p.41-52, jan./abr. 2002 e CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: prxima aula.
Capacidade de um SRI em recuperar itens existentes na base de dados. Preciso mede quantos documentos relevantes foram recuperados
Relevncia (Preciso)
Capacidade de um SRI em recuperar itens teis ao usurio e minimizar a recuperao de documentos inteis.
Revocao R= A / (A+D)
Relevncia P = A / (A+B)
Revocao = relevantes recuperados/ total de itens relevantes que existem no sistema Preciso = relevantes recuperados/ total de itens recuperados
Revocao e Relevncia
Esses dois parmetros so inversamente
relacionados, significando que a melhoria de um implica na piora do outro. Tradicionalmente, existem dois fatores muito importantes que governam a eficincia da indexao de um documento e consequentemente, influenciam na revocao e na preciso:
Exaustividade: Define o nmero de diferentes conceitos (tpicos) que esto indexados. Especificidade: Define o grau de preciso da linguagem de indexao em descrever um dado documento.
Referncias
ARAUJO JUNIOR, R. H. Preciso no processo de busca e
recuperao da informao. Braslia: Thesaurus, 2004. DIAS, M. M. L.; DIAS, E. W. Anlise de assunto: teoria e prtica. Braslia: Briquet de Lemos, 2007. GROSSI, M.G. R. Estudo das caractersticas de software e implantao de um software livre para gerenciamento de bibliotecas universitrias federais brasileiras. 2008. Tese (Doutorado em Cincia da Informao) UFMG, Belo Horizonte, 2008. LANCASTER, F. W. Indexao e resumos: teoria e prtica. 2.ed. Braslia: Briquet de Lemos, 2004. LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: reviso de literatura. Ci. Inf., v. 31, n.1, Braslia, p.4152, jan./abr. 2002.
Referncias
NUNES, L. Da Classificao das Cincias
classificao da Informao: uma anlise do acesso ao conhecimento. 2007. Dissertao (Mestrado em Cincia da Informao) - PUC de Campinas, 2007. Disponvel em <http://www.bibliotecadigital.puccampinas.edu.br/tde_busca/arquivo.php?codArquivo =340 > Acesso em 22 nov. 2009 PIEDADE, M. A. R. Introduo teoria da classificao. Rio de Janeiro: Intercincia, 1977. ROWLEY, J. A biblioteca eletrnica. 2.ed. Braslia: Briquet de Lemos, 2002. SARACEVIC, T. Cincia da informao: origem, evoluo e relaes. Perspec. Ci. Inf., Belo Horizonte, v. 1, n.1, p.41-62, jan./jun. 1996.