Você está na página 1de 7

PROCESSOS DE INDEXAO E ANLISE DE ASSUNTO: UMA ABORDAGEM BASEADA NA AVALIAO DOS FATORES INTERVENIENTES NESTES PROCESSOS

Elizabeth Andrade Duarte* Resumo O presente artigo promove reflexo indexao e a anlise de assunto em termos dos processos e caractersticas que os envolvem, considerando o usurio como parte do produto final. O texto se divide em trs partes: a indexao conceituao e caracterizao, a anlise de assunto e a representao da informao. Destaque para a indexao enquanto processo intelectual e subjetivo que tem como uma das suas etapas a anlise de assunto. Aborda a recuperao da informao eficaz como conseqncia dos dois processos bem trabalhados. PALAVRAS-CHAVE: INDEXAO ANLISE DE ASSUNTO RECUPERAO DA INFORMAO 1 INTRODUO

A literatura na rea da Cincia da Informao mostra que a indexao uma forma de representao do conhecimento que faz uso da anlise de assunto para identificar e selecionar os conceitos que representam a essncia de um documento. Consiste em uma das etapas mais importantes do trabalho do indexador, isto porque, objetiva representar o contedo de um documento por meio de termos extrados de um texto original. Para se atingir a recuperao da informao necessrio um trabalho criterioso de anlise dos documentos para extrair os assuntos que devero ser indexados. Sendo assim, o objetivo deste artigo sistematizar as principais contribuies da indexao e da anlise de assunto em termos da cincia da informao, proporcionando uma viso geral da rea apresentando ao leitor a relevncia da mesma. Neste contexto, pode-se ressaltar que a identificao de conceitos realizada durante a leitura documentria, envolve esforo adicional de compreenso de texto e as dificuldades apresentadas possibilitaram a motivao para investigar, por meio de reviso de literatura, a identificao de conceitos a partir da leitura documentria, da tematicidade e das concepes de anlise de assunto. Pelas anlises obtidas, considerase que as concepes de anlise orientadas para o contedo e para a demanda so
1 Trabalho apresentado disciplina Estudo Especial, ministrada pelo Professor Doutor Eduardo Wense Dias. Curso de Mestrado do PPGCI da UFMG * Mestre em Cincia da Informao pelo Programa de Ps-Graduao em Cincia da Informao da UFMG. Bibliotecria Coordenadora do Sistema Integrado de Bibliotecas da Faculdade Pitgoras de Belo Horizonte, MG. Ps-Graduada em Didtica do Ensino Superior pela Ps-Graduao da Faculdade Pitgoras. calazbedt@yahoo.com.br

Biblionline, Joo Pessoa, v. 3, n. 2, 2007

decisivas para o bom desempenho do indexador durante a leitura para a identificao de conceitos na medida em que se vincula busca pela tematicidade do texto. 2 INDEXAO - CONCEITUAO, CARACTERIZAO A indexao enquanto um processo de anlise documentria, definido como ato de descrio ou identificao em um documento de termos de seu contedo temtico, ou seja, consiste na representao dos documentos por meio de termos (descritores ou palavras-chave) extrados tanto do texto original quanto dos termos escolhidos atravs de uma linguagem de informao ou indexao. importante ressaltar que a indexao trata-se de um processo subjetivo, pois lida com anlise, interpretao e definio do que ser indexado, ou seja, com a tomada de deciso, envolvendo inclusive o contexto para o qual o documento est sendo indexado. Nesse mbito, a atribuio de descritores que permite que se faa uma busca por assunto, ou seja, reflete diretamente na recuperao da informao. Desse modo, considervel destacar que a recuperao da informao eficaz resultado de uma indexao de qualidade com identificao de conceitos (termos) mais pertinentes com o contedo de um documento, produzindo uma correlao precisa entre o assunto pesquisado nos ndices de busca. Como fatores que influenciam na qualidade da indexao Lancaster (2004, p. 81) destaca: fatores ligados ao indexador (conhecimento do assunto - conhecimento por parte do indexador sobre o contedo temtico tratado e entendimento da terminologia abordada, das necessidades dos usurios, experincia, concentrao, capacidade e compreenso de leitura), fatores ligados ao documento (contedo temtico, complexidade, lngua e linguagem, expresso, apresentao e sumarizao), fatores ligados ao vocabulrio (especificidade, ambigidade, qualidade da estrutura, qualidade do vocabulrio, disponibilidade de instrumentos auxiliares fins), fatores ligados ao processo (tipo de indexao, regras e instrues, produtividade exigida, exaustividade da indexao) e fatores ambientais (refrigerao, iluminao, rudo). Todos esses fatores quando bem aplicados refletem na recuperao da informao de qualidade por parte do usurio. Nesse mbito, Chaumier (1988) argumenta que a indexao enquanto operao que consiste na descrio e caracterizao de um documento com o auxlio da representao dos conceitos nela contidos, caracteriza-se como importante parte da anlise documentria, condicionando o valor de um sistema documentrio. O mesmo autor enfatiza que a mesma pode ser compreendida dentro de trs aspetos bsicos que so: o seu conceito, as suas etapas e os instrumentos que utiliza. Em termos de estruturao clara, a indexao possui como etapas: o conhecimento do contedo do documento (leitura rpida do documento atravs do ttulo, subttulo, introduo, concluso, dentre outros), a escolha dos conceitos a serem representados - consistindo na anlise conceitual do documento para condensar o documento (destaque para a seletividade e para exaustividade), a traduo dos conceitos escolhidos e incorporao de elementos sintticos eventuais (levantamento dos descritores adequados considerando a importncia dos conceitos em relao ao conjunto do documento a indexar). Nesta ltima etapa questionamentos importantes devem ser considerados: fontes dos termos de indexao, preciso, fidelidade e linguagem do usurio, uma vez que, todos interferem na representao dos contedos a serem indexados. Como Chaumier (1988) considera a indexao como uma operao essencial para que se possa recuperar documentos do acervo documentrio, respondendo de forma Biblionline, Joo Pessoa, v. 3, n. 2, 2007

adequada e eficaz a todo pedido ou questo solicitada por um usurio, sem que ocorram rudos ou silncios, o mesmo destaca a relevncia dos ento considerados instrumentos de indexao na composio deste processo, podendo ento citar os sistemas de classificao e o thesaurus. Os tesauros so considerados importantes instrumentos que possibilitam o controle terminolgico e uniformizao das linguagens utilizadas por indexadores e usurios quando construdos, preferencialmente, conforme a realidade na qual se inserem. De acordo com Silva e Milidi (1991) a Teoria de Funes de Crena envolvendo o contedo semntico de documentos/consulta do usurio base de documentos (representados por funes de crena distintas) e as propostas na busca de conveniente sistema de representao do contedo sistemtico de documentos atuam com o uso de termos: associados manualmente por leitor que l o documento, de termos que aparecem no ttulo do documento com o conceito de KWIC e KWOC, dos que aparecem nos nomes das sees do documento e dos que so estatisticamente significantes que aparecem no documento. Para os autores esta funo de crena possibilita a indexao automtica e escalonamento de documentos e calcula o grau de concordncia de cada documento com uma dada consulta ponderada do usurio, sempre se baseando na representao semntica de cada documento. J Pinto (2001) considera a indexao como sendo:
Uma atividade que desconstri o discurso montado pelo autor do conhecimento, medida que faz recortes nestes discursos. A mesma coloca em cena trs atores: o autor do documento, a indexao e o usurio. Para cada um a noo de pertinncia informacional ser percebida diferentemente segundo as suas experincias, os seus interesses no momento da produo ou da leitura do texto. Ao indexador e usurio desejvel que a taxa de cobertura dos termos seja tima, pois isto influenciar a pertinncia das respostas fornecidas no momento da recuperao da informao.

Essas consideraes mostram que a indexao no um processo isolado, sob a responsabilidade de somente um ator, mas de um conjunto de atores co-responsveis. como a autora salienta em suas anlises: qualquer que seja o mtodo de indexao utilizado, a indexao dever permitir aos clientes o acesso ao documento que contm a informao de que necessitam. O seu resultado constituir em um dispositivo chave entre o documento primrio a ser lido e compreendido, e um documento secundrio (ndice) a ser construdo, de tal modo que a representao dos elementos indicadores do contedo do primeiro sejam encontrados no segundo documento de maneira mais completa e fiel possvel. Enquanto processo, a indexao possui trs fases importantes para destaque que so: o exame do documento e estabelecimento do assunto de seu contedo (compreenso do contedo do documento); a identificao dos conceitos presentes no assunto; e a traduo desses conceitos nos termos de uma linguagem de indexao. De acordo com Neves; Dias; Pinheiroa indexao envolve a leitura de documentos, a identificao do contedo de um documento, a gerao de respectivos textos dos assuntos/resumos. J a anlise de assunto a etapa em que um documento analisado para determinar de qual ou de quais assuntos trata. Relacionando esse processo com questes do processo de leitura os autores argumentam que conhecimentos anteriores do indexador facilitam o processamento de um texto, bem como de sua compreenso. Assim, a leitura envolve processos como construo de imagens, monitoramento da compreenso, releitura e interpretao. Os mesmos ressaltam ainda que o indexador necessita de uma leitura que exija a incorporao de uma srie de atitudes, exigindo um profissional com adaptao Biblionline, Joo Pessoa, v. 3, n. 2, 2007

freqente. Ento importante ressaltar que durante a leitura, os indexadores variam na sua expresso de julgamento sobre o texto e seu autor, constroem hipteses (importncia da experincia de uma leitura em lidar com a organizao textual) e um procedimento marcado produz maior nmero de comentrios do que um no marcado. 3 ANLISE DE ASSUNTO Conforme argumenta Foskett (1973), a anlise de assunto envolve paradigmas (um assunto pode incluir outro, fazer parte de outro ou ser da mesma categoria de outro) e sintagmas (so relaes direcionais, indica relaes entre os assuntos para se conseguir especificidade), sinnimos, homgrafos (uma mesma grafia usada vezes para diferentes palavras que podem ser pronunciadas de modo idntico ou no), um palavras ou mais de uma, assuntos compostos, linguagens de indexao (vocabulrio controlado, linguagem artificial, sintaxe, linguagem natural) sistemas pr-coordenados e ps-coordenados, sistemas abertos e sistemas fechados, enumerao e sntese, bem como a classificao crtica (imposio ao usurio do ponto de vista do indexador). Para o mesmo autor uma coleo de documentos indexados no se modificar caso exista modificao no mtodo de indexao, tampouco sofrero mudanas s demandas feitas pelos usurios, isto porque, independente do sistema adotado, os critrios de avaliao devero ser os mesmos. Conforme o autor argumenta, uma coleo indexada no se modificar caso exista modificao no mtodo de indexao, como tampouco sofrero mudanas as demandas feitas pelos usurios. Independente do sistema adotado, os critrios de avaliao devero ser os mesmos. Cesarino; Pinto (1980) consideram a anlise de assunto como a operao base para processos de recuperao de informaes. Segundo as autoras, no processo de anlise de documentos ao se dar entrada em um sistema de recuperao de informaes os documentos so analisados de duas maneiras: bibliogrfica ou objetivamente e intelectual ou subjetivamente. A primeira tem foco para a descrio do documento em termos de suas caractersticas fsicas. A segunda direciona para a descrio do documento em termos de seu contedo informativo (assunto abordado). As mesmas autoras apontam que no estabelecimento do assunto de um documento tm-se como etapas:
A compreenso do texto como um todo (relacionada forma fsica) ateno para ttulo, subttulos, introduo, captulos, concluses, ilustraes, tabelas, etc. A identificao de conceitos: seguir procedimento lgico na seleo dos conceitos que melhor expressaro o assunto do documento. A escolha dos conceitos poder espelhar a configurao das categorias fundamentais reconhecidas como importantes para o assunto abordado pelo documento. E a seleo de conceitos: vlidos para serem indexados. Depender exclusivamente do objetivo para o qual o documento est sendo indexado.

Para Dias (2004) a anlise de assunto consiste em etapa do tratamento temtico da informao na qual um documento a ser incorporado a uma coleo analisado para se determinar de qual ou quais assuntos trata. De acordo com o autor, estudos sobre tal anlise so feitos sob trs principais perfectivas: a dos profissionais de informao, a dos usurios e a dos autores. A primeira feita por classificadores e catalogadores, baseando-se no fato de que so estes que comandam o processo de anlise de assunto e que tm conhecimento e vivncia para a execuo de tal processo. A segunda baseia-se no pressuposto de que os usurios so importante fonte para subsidiar aes que vivem o aperfeioamento do processo de anlise de assunto. J a terceira e ltima, Biblionline, Joo Pessoa, v. 3, n. 2, 2007

fundamenta-se na lgica de que ningum melhor do que o prprio autor par identificar do que trata o documento que produziu. Segundo Kobashi (1996) a anlise documentria pode ser compreendida sob a tica da organizao e da representao da informao organizao. Essa representao documentria considera que um texto enquanto objeto, envolve as seguintes abordagens: a anlise de contedo, a anlise do discurso e a lingstica do texto, a anlise logicista e a anlise de texto na perspectiva da inteligncia artificial. Em termos da anlise de contedo, pode-se considerar um conjunto de procedimentos de anlise e interpretao de textos de natureza diversa baseados na descrio e quantificao de palavras, termos ou frases desses textos. Tem-se aqui uma relao com a anlise do discurso e da lingstica do texto. Estas se constituem na teoria que integra por meio da enunciao, uma abordagem interna do texto, indispensvel para que se reconheam os mecanismos e regras de engendramento do discurso. A anlise logicista faz uso da metodologia de anlise de textos cientficos produzidos pelas cincias humanas na qual a representao faz-se por meio de um sistema simblico cujo produto se expressa sob forma de proposies, que articulam dados e raciocnios do texto. Finalmente a anlise de texto na perspectiva da inteligncia artificial uma rea que se preocupa com o comportamento inteligente e com sua simulao computacional. Procura descobrir formas de programar computadores para que os mesmos possam executar as funes que caracterizam a inteligncia humana. O autor acredita que a anlise documentria capaz de aproximar de outras categorias de anlise de textos, sempre propondo elaborar diversas categorias de informaes sob a tica de novos textos (resumos) ou de representaes padronizadas (tesauros, sistemas classificatrios). Em termos da indexao automtica, Rodredo (1991) considera que cada vez mais esta ocupa espao em obras de carter geral (tambm livros didticos) e no somente preocupao exclusiva de pesquisadores, na qual a abordagem de seleo por Excluso permite desenvolver mecanismos simples e eficazes com grande versatilidade de aplicao. A associao dos avanos da inteligncia artificial aos mtodos de indexao automtica tem aberto grandes perspectivas aplicao de tcnicas de anlise e indexao automtica de textos. Considerando a indexao uma ao capaz de identificar e descrever um documento de acordo com seu assunto, Naves (2006) ressalta que os conceitos so extrados do documento atravs de processo de anlise e traduzidos para os termos de instrumentos de indexao (tesauros, listas de cabealhos de assunto, esquemas de classificao, etc), existindo um destaque para a anlise de assunto, etapa esta considerada mais importante no trabalho do indexador (atividade intelectual e subjetiva). De acordo com Naves (1996) na anlise de assunto consiste no processo de extrair conceitos que traduzam a essncia de um documento (anlise de assunto ou anlise temtica). A mesma enfatiza que:
A compreenso diferentes concepes e abordagens sobre a anlise de assunto vlida na medida em que serve como subsdio par estudos na rea de tratamento da informao, mais especificamente em indexao. E a presena da subjetividade do analista, mais impreciso terminolgica torna a anlise de assunto tema merecedor de ateno por especialistas, lingistas e demais interessados.

Isto porque a anlise de assunto, enquanto importante etapa da indexao lida com fatores cognitivos, lingsticos, lgicos, j que um processo desenvolvido por um Biblionline, Joo Pessoa, v. 3, n. 2, 2007

indivduo que conforme Naves afirma segue um raciocnio lgico, numa determinada lngua, tudo isso regado de uma grande dose de subjetividade, conforme j destacado anteriormente. 4 RECUPERANDO A INFORMAO - PROCESSO Para Naves (1998) a classificao de assuntos pode ser considerada importante instrumento de organizao de livros nas estantes e sua relao tcnica de busca chamada browsing que consiste no processo de explorao entre pilhas e pilhas de documentos os quais podem ser examinados pela utilizao dos sentidos. Tal tcnica envolve a interao entre o estoque de informao do indivduo e a assimilao da nova informao. O autor defende a idia de que a classificao uma ferramenta que favorece o browsing, isto porque o Browsing: tcnica de busca que necessita das classificaes, tanto na ordenao dos livros nas estantes, quanto no arranjo de registros bibliogrficos em bases de dados automatizadas. 5 CONSIDERAES FINAIS A indexao um processo intelectual que envolve atividades cognitivas na compreenso do texto e a composio da representao do documento. A anlise de assunto ao identificar e selecionar conceitos que representam a essncia de um documento necessita atuar com o foco no usurio. Portanto, para se recuperar uma informao preciso que dois processos anteriores sejam bem trabalhados: a organizao da informao e a sua recuperao. De tal forma que uma entrada de dados ineficaz implicar uma sada de dados tambm ineficaz. Cabe aqui, o desenvolvimento de uma indexao de qualidade, permitindo aos clientes (usurios) o acesso ao documento que contm a informao que ele necessita.

INDEXING AND SUBJECT ANALYSIS: AN APPROACH BASED ON THE EVALUATION OF INTERVENING FACTORS IN THESE PROCESSES
ABSTRACT The article promotes reflection to the indexing and the subject analysis in terms of the processes and characteristics that involve them, considering the user as part of the final product. The text ha been divided in three parts: the indexing conceptualization and characterization, the subject analysis and the representation of the information. Detach for the indexing while an intellectual and subjective process that has as one of their stages the subject analysis. It approaches the recovery of the effective information as a consequence of the two processes worked. KEYWORDS: INDEXING SUBJECT ANALYSIS INFORMATION RETRIEVAL Biblionline, Joo Pessoa, v. 3, n. 2, 2007

REFERNCIAS CESARINO, Maria Augusta da Nbrega; PINTO, Maria Cristina Mello Ferreira. Anlise de assunto. Revista de Biblioteconomia de Braslia, Braslia, v. 8, n.1, jan./jun. 1980. p. 32-43. CHAUMIER, Jacques. Indexao: conceito, etapas e instrumentos. Revista Brasileira de Biblioteconomia e Documentao, So Paulo, v. 21, n.1/2 p. 63-79, jan./jun. 1988. DIAS, Eduardo Wense. Anlise de assunto: percepo do usurio quanto ao contedo de documentos. Perspectivas em Cincia da Informao, Belo Horizonte, v. 9, n.2, jul./dez. 2004. p.146-157. DIAS, Eduardo Wense, NAVES, Madelena Martins Lopes; MOURA, Maria Aparecida. O usurio-pesquisador e a anlise de assunto. Perspectivas em Cincia da Informao, Belo Horizonte, v. 6, n. 2, p. 2005-221, jul./dez. 2001. FUJITA, Maringela Spotti Lopes. A identificao de conceitos no processo de anlise de assunto para a indexao. Revista Digital de Biblioteconomia e Cincia da Informao, Campinas, v. 1, n.1, 2003. Disponvel em:< http://server01.bc.unicamp.br/seer/ojs/viewarticle.php?id=9&layout=abstract>. Acesso em: 10/12/06. KOBASHI, Nair Yumiko. Informare Cadernos do Programa de Ps-Graduao em Cincia da Informao, Rio de Janeiro, v.2, n.2 p.5-27, jul./dez. 1996. LANCASTER, F. W. Indexao e resumos: teoria e prtica. 2. ed. rev. atua. Braslia: Briquet de Lemos, 2004. NAVES, Madalena Martins Lopes. Anlise de assunto: concepes. Revista de Biblioteconomia de Braslia, Braslia, v. 20, n.2, jul./dez. 1996. p. 215-226. NAVES, Madalena Martins Lopes. Aspectos conceituais do browsing na recuperao da informao. Cincia da Informao, Braslia, v.27, n.3 p.279-283, set./dez. 1998. NEVES, Dulce Amlia de Brito; DIAS, Eduardo Wense; PINHEIRO, ngela Maria Vieira Pinheiro. Aspectos cognitivos na leitura do indexador. Artigo a ser publicado. PINTO, Virgnia Bentes. Indexao documentria: uma forma de representao do conhecimento registrado. Perspectivas em Cincia da Informao, Belo Horizonte, v.6, n.2 p.223-234, jul./dez. 2001. RODREDO, Jaime. Indexao automtica de textos: uma abordagem otimizada e simples. Cincia da Informao, Braslia, v. 20, n.2, jul./dez. 1991. p. 130-136 SILVA, Wagner Teixeira da; MILIDI, Ruy Luiz. Cincia da Informao, Braslia, v.20, n.2 p.155-164, jul./dez. 1991.

Biblionline, Joo Pessoa, v. 3, n. 2, 2007

Você também pode gostar