Você está na página 1de 12

Metodologia de elaborao de tesauro conceitual: a categorizao como princpio norteador

Maria Luiza Almeida Campos


Doutora em Cincia da Informao, professora do Departamento de Cincia da Informao e da Ps Graduao em Cincia da Informao UFF/IBICT

Hagar Espanha Gomes

Livre docente

Historicamente, o tesauro documentrio surgiu como uma relao estruturada de termos constitudos, quase exclusivamente, de uma nica palavra. Posteriormente evoluiu para algumas palavras compostas sem, no entanto, estabelecer bases para isso. A elaborao de um tesauro implica bases classificatrias e as categorias fundamentais permitem correto posicionamento dos conceitos nas classes e a organizao de domnio; e a definio de cada conceito o elemento que vai comprovar objetivamente tanto as relaes hierrquicas como as partitivas e associativas com outros conceitos. Palavras chave: Tesauro conceitual; Metodologia; Categorizao Recebido em 01.07.2006 Aceito em 19.092006

348

Maria Luiza Almeida Campos, Hagar Espanha Gomes

1 Introduo
Tesauro tem sido definido como linguagem documentria. Um olhar mais atento sobre o objeto/referente, evidencia que se trata de uma relao de termos de um domnio, relacionados entre si, com objetivo de indexao/ recuperao em um sistema de recuperao de informao. A palavra linguagem est sendo tomada em sentido figurado, pois no lida com discursos, apenas deles extrai um vocabulrio especializado, visando garantia literria. O tesauro em ao num servio de recuperao de informao requer instrues que poderiam ser, tambm, numa linguagem figurada, uma gramtica; esse conjunto vocabulrio e gramtica se constituiriam, ento, numa linguagem documentria. Este texto se limita ao vocabulrio: sua natureza e estrutura. De fato, o vocabulrio do tesauro no constitudo de palavras da linguagem natural como ocorreu nos primeiros tempos de seu surgimento mas de uma lista de termos1, entendendo-se aqui como termo o signo verbal que designa um referente, ou, num nvel maior de abstrao, que denota o conceito. A anlise de tal referente se d a partir de um determinado domnio. Assim, o contexto do tesauro o domnio e no o discurso. Aps anlise do objeto/referente a que aquelas palavras ou expresses se referem, tem-se o termo, com sua forma final estabelecida, bem como as relaes entre ele e outros conceitos, revelados na anlise. Por sua natureza verbal, a denominao do objeto/referente mascara, por vezes, sua verdadeira natureza, dificultando sua posio na estrutura do tesauro e a anlise conceitual que ir revel-la. Tesauro conceitual seria, ento, um tesauro com base em conceitos: seu nome indica que cada termo denota um conceito, ou seja, uma unidade de conhecimento. Na construo de um tesauro conceitual so necessrios princpios para: Estabelecimento do termo/conceito, e Estabelecimento das relaes entre eles. As bases terico-metodolgicas aqui apresentadas se propem a fornecer elementos para a elaborao de tesauros, sem descurar, no entanto, a dinmica que ocorre no conhecimento, de cujos conceitos os termos decorrem quando se requer neonmia -, dinmica que afeta ou a prpria denominao ou o contedo dos termos. So clssicos os exemplos de tomo e hipnose. A teoria do conceito, voltada para o referente, e a teoria da classificao facetada contribuem para a elaborao de tesauros conceituais porque estabelecem bases para identificao dos conceitos, dos termos e das relaes entre eles, e, ainda, para sua ordenao sistemtica. Desde os anos oitenta temos associado a teoria do conceito teoria da classificao para a elaborao de tesauros, (GOMES, 1990). De fato, Campos (CAMPOS, 1986) j havia alertado para o sistema de classificao subjacente ao tesauro. Mas, ao contrrio de tesauros que consideram a parte sistemtica como uma parte alfabtica dos termos gerais com sua respectiva hierarquia, preconizamos o uso das categorias Ranganathianas para ordenar as classes gerais (facetas) no interior de cada uma delas, construindo um verdadeiro sistema e revelando, assim, a estrutura conceitual de um dado domnio. A definio construda para cada termo/conceito torna explcito o

A maioria dos tesauros atualmente se refere a termos, mas as decises adotadas para o tratamento de grupos de palavras impropriamente chamados de termos compostos mostra que a abordagem ainda lingstica e no conceitual.

349

Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Metodologia de Elaborao de Tesauro Conceitual: a categorizao como princpio norteador

contedo do conceito e fornece os elementos para o relacionamento entre os termos/conceitos. O conceito , de fato, o ponto de partida para estabelecer as relaes conceituais e determinar a forma verbal mais adequada para represent-lo. O conceito entendido como unidade de conhecimento, como prope Dahlberg (1978), incluindo a definio como elemento essencial para a fixao do conceito. Este novo tesauro, ou melhor, esta nova metodologia para a elaborao de tesauros, est, assim, fundamentada nas questes que envolvem o conceito e as categorias. Como toma por base o termo, denominado, por alguns estudiosos, tesauro terminolgico. Embora Currs (1995) em seu livro Tesauros, inclua o subttulo linguagens terminolgicas, ela no integra a terminologia na construo do tesauro, limitando-se a apresentar o tema num captulo isolado. Considera-se que a expresso tesauro terminolgico no apropriada, pois o que se quer evidenciar o contedo conceitual de uma etiqueta lingstica e no a palavra ou a expresso verbal. Assim, as bases para a elaborao do tesauro conceitual se encontram fundamentalmente nos princpios que enfatizam o processo de conceituao e em sua ordenao sistemtica.

2 A elaborao de tesauros: um histrico


A palavra thesaurus etimologicamente vem do grego e do latim e significa tesouro tendo sido usado durante muitos sculos para designar lxico, ou tesouro de palavras. Esta palavra popularizou-se a partir da publicao do Thesaurus of English Words and Phrases, de Peter Mark Roget, em Londres, 1852. O subttulo de seu dicionrio expressa bem o objetivo: classsified and arranged so as to facilitate the expression of ideas and to assist in literary composition (ROGET, 1925) Em 1950, Hans Peter Luhn, do Research Center da IBM nos Estados Unidos, foi o primeiro a utilizar o termo Thesaurus para nomear seu sistema de palavras autorizadas com uma estrutura de referncias cruzadas (FOSKETT, 1985, p. 270). Ao organizar seu sistema ele percebeu que uma simples listagem alfabtica no solucionaria o problema de localizar a palavra/ idia mais adequada recuperao. Alguma relao entre estas palavras deveria ser estabelecida, para que a lista pudesse apresentar uma estrutura mais slida de referncias cruzadas; era necessrio definir, de alguma forma, as famlias de noes entre as palavras, isto , evidenciar que idias afins estavam ligando uma palavra outra. Ao nomear esta nova lista de palavras autorizadas deu o nome de thesaurus, influenciado pelo trabalho de Roget que, em seu dicionrio analgico, expe esta questo da seguinte forma: a reviso de um catlogo de palavras de significado anlogo vai sugerir, com freqncia, por associao, outras sucesses de pensamento. A apresentao dos assuntos sob aspectos novos e variados pode expandir grandemente a esfera de nossa viso mental (ROGET, 1925, p. XVIII). Deste modo, um novo tipo de linguagem documentria est nomeado - o tesauro de recuperao de informao - que veio se contrapor s listas de cabealhos de assunto e servir como instrumento de auxlio aos sistemas que utilizavam um nico termo (unitermo). Outras listas de
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

350

Maria Luiza Almeida Campos, Hagar Espanha Gomes

termos que apresentavam alguma relao entre eles passaram a chamarse, tambm, tesauro. Vickery, nos anos 60, demonstra quatro significados diferentes usados na literatura de cincia da informao para o termo tesauro , sendo a interpretao mais comum a de uma lista alfabtica de palavras, onde cada palavra seguida de outras que a ela se relacionam (VICKERY, apud FOSKETT, 1985, p. 270). No incio da dcada de 70, atravs do programa UNISIST (UNESCO, 1973, p. 6), a Unesco, define tesauro para a rea de cincia da informao, sob dois aspectos: a) Segundo a estrutura: um vocabulrio controlado e dinmico de termos relacionados semntica e genericamente cobrindo um domnio especfico do conhecimento. b) Segundo a funo: um dispositivo de controle terminolgico usado na traduo da linguagem natural dos documentos, dos indexadores ou dos usurios numa linguagem do sistema (linguagem de documentao, linguagem de informao) mais restrita. Percebe-se a preocupao da Unesco em apresentar definies que pudessem atender tanto rea de elaborao de tesauro (definio a), quanto rea de organizao e recuperao de informao (definio b). Estas definies, de alguma forma, vm sendo utilizadas na literatura at os dias atuais. A evoluo histrica do tesauro de recuperao pode ser traada a partir de duas vertentes: uma, que toma nitidamente como base o Unitermo uma nica palavra -, e outra, influenciada pela teoria da classificao facetada. Lancaster apresenta um diagrama FIG. 1 - em que evidencia a evoluo histrica do tesauro. De um lado, a influncia da Amrica do Norte, caracterizada pela abordagem alfabtica, e, de outro, a abordagem sistemtica, de influncia inglesa principalmente.

2.1 A vertente norte-americana


Os tesauros elaborados na Amrica do Norte, especificamente nos Estados Unidos, foram fruto do desenvolvimento que ocorreu a partir do cabealho de assuntos para o unitermo; talvez fosse mais adequado fazer referncia a uma ruptura, porque se introduziu um novo modelo, estranho ao anterior: de um sistema pr-coordenado para sistemas pscoordenados. Durante a dcada de 60, os tesauros foram sistematicamente aperfeioados. Em 1960, o Centro de Informao do Ministrio da Defesa dos Estados Unidos (anteriormente Armed Services Technical Information Agency - ASTIA) produz seu primeiro tesauro. Em 1961, o American Institute of Chemical Engineers AICHE - publica o Chemical Engineering Thesaurus, que era um derivado direto do trabalho da Dupont, primeiro tesauro a ser colocado venda (LANCASTER, 1986, p. 31). Baseado no AICHE, o Thesaurus of Engineering Terms publicado, em 1964, pelo

351

Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Metodologia de Elaborao de Tesauro Conceitual: a categorizao como princpio norteador

CLASSIFICATION BIBLIOGRAPHIC
Analytic-synthetic (faceted) (Ranganathan [1930s] )

ALPHABETIC SUBJECT

(Cutter Rules [1876]. Lists of subject headings [1895] )

Uniterm (Taube [1951] )

Dupont (1959) Alphabetic subject indexing (Coates [1969] )

U. S. Departament of Defense (1960)

Alche (1961)

EJC (1964)

Project LEX (1965-1967)

Thesaurofacet (1969)

COSATI (1967)

TEST (1967)

PRECIS (1974)

ANSI Z39-19 (1974)

Unesco Monlingual

BS 5723 (1979)

ISO 2788 (1974)

DIN 1463 (1976)

AFNOR Z 47-100 (1973)

Unesco monolingual Guidelines (1981)

Unesco Monlingual guidelines (1976) (Revised version, 1980)

ISO 2788 (draft 2

nd

Edition, 1983)

ISO 5964 (1985)

Figura 1 Evoluo histrica Fonte: LANCASTER, 1986

Engineers Joint Council - EJC - , com a finalidade de cobrir toda a rea de engenharia. No ano seguinte, o Engineers Joint Council e o Department of Defense - DoD - dos Estados Unidos estabeleceram um acordo visando a reunir ambos os tesauros, que abarcavam temas ligados engenharia, com considervel participao da indstria. Atravs do projeto Lex , cuja meta era estabelecer princpios comuns de construo e uso e, tambm, criar um nico instrumento para ambas as instituies, prepara-se um manual de construo de tesauros e publica-se o Thesaurus of Engineering and Scientific Terms - TEST - , em 1967. Endossado e publicado pelo Committee on Science and Technical Information - COSATI -, rgo oficial do Federal Council for Science and

352
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Maria Luiza Almeida Campos, Hagar Espanha Gomes

Technology dos Estados Unidos, o manual foi recomendado como fonte para a construo de tesauros, tendo servido de base para as diretrizes e normas produzidas, posteriormente, pela ANSI - American National Standardization Institute (ANSI, 1981) e pela Unesco (1973). Por sua vez, as diretrizes da Unesco deram origem s normas nacionais e internacionais. (LANCASTER, 1986).

2.2 A vertente europia


At o final dos anos 50 e incio dos anos 60, os tesauros possuam somente arranjo alfabtico, tipo de arranjo incapaz de representar bem as relaes teis entre os termos (RIVIER, 1992, p. 72). Suas limitaes levaram ao emprego, mais tarde, de princpios de classificao. Esta vertente, mostrada no diagrama de Lancaster FIG.1, produziu vrios tesauros e contribuiu para o desenvolvimento terico dos tesauros. De especial relevncia a criao do Classification Research Group - CRG -, em Londres, voltado para desenvolver estudos e pesquisas voltadas para a classificao facetada, de Ranganathan, do qual fizeram parte expoentes como Vickery, Foskett, Aitchison, Farradane, Austin, Mills e tantos outros, que influenciaram toda uma gerao de profissionais interessados em representao e recuperao da informao. As bases classificatrias do tesauro foram expostas por Jean Aitchison, a partir de sua experincia no desenvolvimento do Thesaurofacet, dedicado engenharia eltrica. A partir da teoria da classificao de Ranganathan ela constri o esquema de classificao, com orientao para a organizao de uma sintaxe (uso da notao para construir a classificao de um documento) tendo um ndice alfabtico, sob forma de tesauro, decorrente do prprio sistema de classificao. O pressuposto das categorias, presente na abordagem analticosinttica de Ranganathan tambm teve impacto nos sistemas prcoordenados, ao oferecer uma sintaxe mais adequada organizao e recuperao da informao. So representativos os princpios da indexao alfabtica de assunto, desenvolvidos por Coates para o catlogo de assuntos do British Technology Index , e o PRECIS - Preserved Context Indexing System - , de Austin, desenvolvido para o ndice impresso da British National Bibliography. Apesar dessa vertente avanar quanto aos aspectos relacionados a uma apresentao sistemtica, muitos tesauros apresentam um comportamento semelhante ao dos tesauros americanos, que adotam base lingstica na construo do vocabulrio. Esta afirmativa pode ser comprovada em normas nacionais (AFNOR Z 47-100, BSI 5723, ANSI/NISO Z 39-2005) e internacionais (UNESCO e ISO 2788), entre outras.

2.3 O tesauro conceitual: o conceito e as categorias


Como apresentado por Lancaster (1986), o tesauro surgiu como uma ruptura em relao ao cabealho de assunto, tomando por unidade a palavra, em geral uma palavra tcnica, ou term em ingls. No entanto, logo se percebeu que algumas palavras sozinhas eram insuficientes para

353

Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Metodologia de Elaborao de Tesauro Conceitual: a categorizao como princpio norteador

designar um contedo de informao. A soluo foi considerar a possibilidade de que, em alguns casos, a unidade seria uma expresso verbal; as bases tericas para seu estabelecimento, no entanto, no foram desenvolvidas de forma satisfatria (GOMES & CAMPOS, 2004). Diretrizes e normas continuam a se referir a pr-coordenao e fatorao sinttica, abordagens lingsticas que privilegiam a forma lexical e, portanto, variam de tesauro para tesauro, de norma para norma e de lngua para lngua. E interferem no relacionamento entre os termos. De fato, a maioria dos tesauros produzidos nos Estados Unidos, dentro da linha tradicional americana que privilegia a organizao alfabtica dos termos, no apresentam uma base terica explcita. Mas seus autores avanam em relao ao modelo anterior, o cabealho de assunto: a unidade de trabalho passa a ser o termo e no o assunto; os diferentes tipos de relao, que nos cabealhos vinham sob forma de referncia cruzada, se apresentam de forma mais estruturada. No entanto, as instrues para a seleo da unidade de trabalho ainda apresentam fortes bases lingsticas; aproveit-las em outras lnguas sempre problemtico, porque no h uma correspondncia lexical nas diferentes lnguas para a denominao de um mesmo conceito. A norma para elaborao de vocabulrios controlados (ANSI/ NISO Z39.19-2005) sugere, inclusive, o uso de adjetivos, em algumas circunstncias, evidenciando seu divrcio do conceito como unidade de representao. Este aspecto, o da unidade de representao, no resolvido pelas duas grandes vertentes - a americana e a dos classificacionistas - parece encontrar soluo a partir da dcada de 70 com Dahlberg em sua Teoria Analtica do Conceito voltada para o Referente (aqui referenciada apenas como teoria do conceito) (DAHLBERG, 1978). Dahlberg afirma que o conceito se estabelece quando trs elementos esto presentes: o referente/objeto, suas propriedades e um termo que o sintetize, ou seja, que carregue com ele todas as propriedades do referente. Diz-se, ento, que o termo denota o conceito. Ento, por meio do conceito que se estabelece a relao do termo com o objeto/referente. Influenciada pelos analticos, ela desenvolve sua teoria que fornece bases seguras para estruturar as hierarquias (relaes lgicas). Posteriormente, tendo tomado conhecimento do mtodo analticosinttico de Ranganathan, incorpora o princpio de categorizao como uma soluo para a organizao dos conceitos num sistema de conceitos, no importando a finalidade de aplicao e prope princpios para o estabelecimento de relacionamentos associativos. (DAHLBERG, 1978a). Seu mtodo leva elaborao da definio analtica ou conceitual. De fato, segundo Dahlberg, existe uma relao de equivalncia entre o termo e sua definio. Como os tesauros se inserem num domnio, este que vai delimitar os aspectos, as propriedades - ou seja, as caractersticas dos conceitos - que figuraro na definio. Dahlberg, como Ranganathan, parte da lgica, para o estabelecimento das relaes hierrquicas; mas avana fornecendo os elementos para outros relacionamentos, desnecessrios num esquema de classificao. Em nosso ponto de vista, o tesauro conceitual rene dois princpios fundamentais para sua elaborao: o conceito, como unidade de representao, e o uso de categorias, como base para organizao de sistemas de conceitos. No Brasil, as primeiras tentativas tm incio na dcada de 80. (GOMES, 1990).

354
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Maria Luiza Almeida Campos, Hagar Espanha Gomes

3 O mtodo de categorizao e sua importncia para a elaborao de tesauros conceituais


Categorizao, simplesmente, o processo cognitivo de dividir o mundo da experincia humana em grupos gerais ou categorias amplas compreendendo certos componentes que compartilham similaridade imediata em termos de atributos num dado contexto (BINWAL, 2001) . O uso das categorias para a organizao de conceitos em uma determinada rea de interesse foi introduzido por Ranganathan no mbito da documentao, a partir de sua teoria da classificao facetada, na qual utiliza a noo de categoria para a anlise dos assuntos contidos nos documentos e para a organizao dos componentes desses assuntos (isolados) em um esquema de classificao. Dahlberg utiliza, tambm, a noo de categoria sob dois aspectos: como um recurso para o entendimento da natureza do conceito e para a formao de estruturas conceituais. Entretanto, Dahlberg no considera estes dois aspectos de forma excludente, muito pelo contrrio, ela os v como complementares. As categorias possuem a propriedade de possibilitar a sistematizao de todo o conhecimento da realidade e podem ser identificadas no momento da determinao do conceito, ao serem inferidas predicaes verdadeiras e finais a respeito de um item de referncia desta realidade observada. (DAHLBERG, 1978a, p. 21). Mas fornecem, ainda, princpios para estruturar todas as classes de conceitos de um domnio. Na elaborao de tesauros, esta metodologia fornece os princpios para agrupar conceitos de mesma natureza em classes gerais ou facetas para construir cadeias e renques, sries verticais e horizontais de conceitos, respectivamente. O entendimento das classes que compem um dado domnio de suma importncia para a elaborao de tesauros, pois permite uma maior compreenso do conceito e da organizao das relaes entre os conceitos. Dahlberg enfatiza a importncia fundamental da categoria na estruturao do conceito e do sistema de conceitos: Podemos ver que as categorias tm uma capacidade de estrutura: no apenas estruturam, de fato, todos os nossos elementos de conhecimento e unidades do conhecimento; elas fornecem, ao mesmo tempo, por este meio, o esqueleto, os ossos e tendes para estruturar todo o nosso conhecimento. Com seu uso consciencioso, ento, o corpo do nosso conhecimento pode se manter unido, pode se mover, pode se manter flexvel - e pode crescer organicamente (DAHLBERG, 1978a. p. 34). Inicialmente, Ranganathan concebeu cinco categorias fundamentais: personalidade, matria, energia, espao e tempo. Ele inicia definindo a categoria Tempo, que apresenta a menor dificuldade em sua identificao. Esta categoria est de acordo com o que geralmente entendemos por aquele tempo. A categoria Espao segue a categoria Tempo em sua dificuldade de identificao. E tambm est de acordo com o que geralmente entendemos por aquele termo. A categoria Energia um pouco mais difcil do que espao e tempo. Falando geralmente, sua

355

Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Metodologia de Elaborao de Tesauro Conceitual: a categorizao como princpio norteador

manifestao ao de uma espcie ou outra. A identificao da categoria fundamental Matria mais difcil ainda do que Energia. Suas manifestaes so de duas espcies material e propriedade. Aqui ele explica que madeira tanto uma propriedade de mesa de madeira, como material de que feita. (Mas no vale aprofundar esta questo aqui). Finalmente, sobre a categoria Personalidade ele no apresenta uma definio; diz que a que apresenta a maior dificuldade. It is too elusive. It is ineffable 2. E explica: Se uma certa manifestao facilmente determinada como no sendo tempo, espao, ou energia, ou matria, pode-se dizer que uma manifestao da categoria fundamental Personalidade. Este o mtodo dos resduos. Qualquer entidade que no seja uma manifestao de tempo ou espao, energia ou matria, deve ser uma manifestao de Personalidade. (RANGANATHAN, 1967, p. 399-401). Em relao a esta ltima categoria fundamental Ranganathan parece usar um princpio do hinduismo: No isso, no isso. Na verdade, aplicar a categorizao analisar o domnio a partir de recortes conceituais que permitem determinar a identidade dos conceitos (categorias) que fazem parte deste domnio. Por exemplo: na engenharia mecnica: mquinas operatrizes (personalidade); seus componentes (partes); esmerilhamento, polimento, frezamento (processos); os profissionais envolvidos (agentes); e assim por diante. na economia: teorias, poltica econmica (instrumentos/agentes); planejamento (operaes); e assim por diante. na construo civil: edificaes, como casas, edifcios, teatros, praas (personalidade); tcnicas de edificao (tcnicas); cimento, pedra, cermica, vidro (materiais); os profissionais envolvidos (agentes); e assim por diante. na biblioteconomia: instituies e organizaes, bibliotecas, documentos, usurios, suporte documental (personalidade); tratamento documentrio, recuperao de informao, aquisio (processos); linguagens documentrias (agentes dos processos); profissionais envolvidos (agentes dos processos); e assim por diante. (CAMPOS; ). GOMES; MOTTA, 2004). A etapa de categorizao auxilia no processo de pensar o domnio, no gerando qualquer registro e serve para orientar os profissionais no levantamento dos termos. Ela consiste em identificar as possveis classes gerais (categorias) de conceitos que a rea do conhecimento, objeto do tesauro, comporta. O exerccio de categorizao torna claro o domnio temtico do tesauro e, como conseqncia, estabelece as bases para seleo dos termos, nas fontes de onde eles sero retirados. Posteriormente, o Classification Research Group - CRG - na Inglaterra, desdobrou estas categorias para a elaborao de classificaes facetadas. Mas elas podem ser aplicveis a qualquer temtica de tesauros. So, na verdade desdobramentos das categorias fundamentais: Coisas, substncias, entidades que ocorrem naturalmente produtos instrumentos constructos mentais

356

Preferimos manter o texto em ingls pela dificuldade de uma traduo exata.


2

Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Maria Luiza Almeida Campos, Hagar Espanha Gomes

Suas partes constituintes rgos Sistemas de coisas Atributos de coisas qualidades, propriedades, incluindo estrutura medidas processo, comportamento Objeto da ao (paciente) Relaes entre coisas, interaes efeitos reaes Operaes sobre coisas experimentos, ensaios operaes mentais Propriedades de atributos, relaes e operaes Lugar, condio Tempo Tal lista facilita a anlise de qualquer rea de assunto ou de qualquer documento. Como se pode observar, os desdobramentos seguem a ordem PMEST. Como exemplo, citamos algumas facetas - e suas manifestaes - que integrariam o sistema de conceitos relativos a Proteo Sanitria: F aceta Faceta Coisas Manifestaes Resduos, efluentes, lodo, substncias perigosas, substncias txicas Tratamento de guas residuais, tratamento de resduos, tratamento de lodo, disposio final, processos de decomposio da matria orgnica, processos de estabilizao da matria orgnica Agentes de biodegradao/decomposio, poluentes, instrumentos utilizados no tratamento de resduos Unidades de tratamento de resduos

Operaes sobre coisas

Agentes do processo Equipamento/Instalaes

357

Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Metodologia de Elaborao de Tesauro Conceitual: a categorizao como princpio norteador

O exemplo acima permite perceber, em extenso, a realidade emprica que est sendo objeto de representao conceitual. Esse um dos aspectos mais interessantes do mtodo de faceta. Quando se consegue fazer este exerccio, compreende-se melhor quais as facetas relevantes para uma rea. Como se pode verificar, o mtodo dedutivo: ele fornece as bases para estabelecer as grandes classes, no interior das quais so includas as classes de conceitos, com suas cadeias e renques. Exemplo recente desta abordagem a elaborao do Tesauro de folclore e cultura popular brasileira (IPHAN, 2005). Graas tecnologia disponvel, possvel apresentar o tesauro em suas formas alfabtica e sistemtica. Nesta ltima, a ordem dos conjuntos se baseia nas categorias fundamentais (PMEST). As definies e as relaes entre os termos esto presentes na parte alfabtica.

4 Consideraes finais ou uma abertura para questes tericas que fundamentam a metodologia de tesauros conceituais
O mtodo de categorias preconizado por Ranganathan trouxe para o campo da documentao o princpio norteador para a organizao de conceitos em um dado domnio. O tesauro, entendido em finais da dcada de 70 como um sistema de conceitos, agrega este princpio atravs da elaborao do Thesaurofacet de Aitchison (AITCHISON, 1972). Na dcada de 80 Dalhberg traz para o fazer tesaurogrfico a teoria do conceito (1978), agregando princpios terminolgicos relacionados ao contedo conceitual e sua definio, estabelecendo assim uma teoria consolidada para a determinao do que se entenderia por menor unidade em um tesauro, ou seja, o conceito representado por um termo. Dahlberg agrega princpios Ranganathianos relacionados categorizao de um domnio como o mtodo que permite estruturar todo o domnio. Pode-se afirmar que o mtodo de categorizao e o exerccio de entendimento do contedo conceitual do termo, ou seja, sua definio, so considerados os elementos norteadores para a elaborao de tesauros conceituais. Entretanto, esta afirmativa nos leva a uma pergunta clssica: Definese para classificar (categorizar) ou classifica-se (categoriza-se) para definir? Fica a questo.

Methodology for construction of conceptual thesaurus : categorization as a theoretical principle.


Historically, thesaurus documentation consisted of a structured list of terms constituted almost of one-worded terms. Later, it evolved to include some compound words but no guidance was offered as to when to use them or not. A thesaurus is viewed as a classifying system and the Fundamental Categories provide the basis for a correct positioning of the concepts in their classes and organization of the domain. Definition of each concept is the element that will objectively prove the different relationships with other concepts, be it hierarchical, partitive or associative .

358

Key-words Key-words: Conceptual thesaurus; Methodology; Categorization


Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Maria Luiza Almeida Campos, Hagar Espanha Gomes

6 Referncias
AFNOR Z 47-100:1981. Rgles dtablissement des thsaurus monolingues. Paris,AFNOR, 1981. 20 p. AITCHISON, Jean. Thesaurofacet: a new concept in subject retrieval schemes. In: WELLISCH, H. (Ed.). Subject retrieval in the seventies. Connecticut: Greenwood, 1972. p. 72-98. ANSI Z39.19:1980. American National Standard Guidelines for Thesaurus Structure, Construction, and Use. Bethesda, Md, NISO, 1980. 20p. ANSI/NISO Z 39.19: 2005 Guidelines for the construction, format and management of monolingual controlled vocabularies. Bethesda, Md, NISO, 2005. 176 p. BINWAL, J. C.; LALHMACHHUANA, C. Knowledge representation: concept, techniques and analytico-synthetic paradigm. Knowledge organization, v. 28, n. 1, p. 5-16, 2001. BSI BS5723:1979. Guidelines for the establishment and development of monolinguall thesauri. London, BSI, 1979. 36 p. CAMPOS, Astrio T. Linguagens documentrias. Revista de Biblioteconomia de Braslia, v. 14, n. 1 p. 85-88, jan./jun. 1986. CAMPOS, Maria Luiza de Almeida. Linguagem documentria: teorias que fundamentam sua elaborao. Niteri, RJ: Eduff, 2001a. CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha; MOTTA, Dilza Fonseca. Elaborao de tesauro documentrio -Tutorial. Disponvel em: < http:/ /www.conexaorio.com/biti/tesauro/index.htm> Acesso em 29 ago. 2006. DAHLBERG, I. A Referent-oriented analytical concept theory of interconcept. International Classification. v. 5, n. 3, p. 142-150, 1978. DAHLBERG, I. Ontical structures and universal classification. Bangalore: Sarada Ranganthan Endowment, 1978a. 64p. FOSKETT, D. Thesaurus. In: Subject and information analysis. New York: M. Dekker, 1985. p. 270-316. GOMES, Hagar Espanha. et alii. Manual de Elaborao de Tesauros Monolngues. Braslia: CNPq/PNBU, 1990. 78p. GOMES, Hagar Espanha; CAMPOS, Maria Luiza de Almeida. Tesauro e normalizao terminolgica: o termo como base para o intercmbio de informaes. DatagramaZero, dez. 2004. Disponvel em: http://www.datagramazero.org.br Acesso em 29 ago. 2006.. GOMES, Hagar Espanha; MOTTA, Dilza Fonseca da; CAMPOS, Maria Luiza de Almeida. Revisitando Ranganathan. Rio de Janeiro, ago. 2006. Disponvel em: <http://www.conexaorio.com/biti/revisitando/revisitando.htm> Acesso em 29 ago. 2006. IPHAN.Centro Nacional de Folclore e Cultura Popular. Tesauro de Folclore e Cultura Popular Brasileira .Rio de janeiro, 2005. Disponvel em http:// www.museudofolclore.com.br/tesauro. Acesso em 28 ago. 2006. LANCASTER, F. W. Vocabulary control for information retrieval. 2nd ed. Arlington: Information Resources, 1986. 270p. RANGANTHAN, S.R. Prolegomena to library classification. Bombay: Asia Publishing House, 1967. 640p. RIVIER, A. Construo de Linguagens de Indexao: aspectos tericos. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 21, n. 1, p. 5699, jan./jun. 1992. ROGET, P. M. Thesaurus of English words and phrases. New York: Longmans, 1925. 691p. UNESCO. Guidelines for the establishment and development of monolingual thesauri. [s.n.t]. 37p. WUESTER, E. Ltude scientifique gnrale de la Terminologie, zone frontalire entre la Linguistique, la Logique, lOntologie, lInformatique et les Sciences des Choses. In: RONDEAU, G.; FELBER, F. (Org.). Textes Choisis de Terminologie. I. Fondments thoriques de la terminologie. Qubec: Girsterm, 1981. p. 57114.

359

Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006

Interesses relacionados