Você está na página 1de 21

ARTIGOS

Sistemas de Organizao do Conhecimento na viso da Cincia


da Informao
Knowledge Organization Systems in the Information Science's approach
MSc. Eliana Carlan1
Dra. Marisa Brscher Baslio Medeiros 2

53

Resumo o artigo apresenta os sistemas de organizao do conhecimento e a relao com as bases


tericas utilizadas na construo de tesauros, taxonomias, ontologias e sistemas de classificao na
literatura da rea de Cincia da Informao. O estudo utiliza a metodologia de reviso de literatura na
rea de organizao e representao do conhecimento, alm de pesquisa nas bases de dados, a fim de
investigar a produo bibliogrfica sobre o tema, entre 1998 e 2009. Identifica um caminho terico
percorrido na construo desses sistemas passando pela teoria da classificao, teoria do conceito,
relacionamentos entre conceitos e princpios da Lingustica e Terminologia. A partir de amostra
representativa, faz-se anlise nas suas caractersticas extrnsecas e intrnsecas. Conclui-se que tesauros e
sistemas de classificao so mais citados na literatura, inclusive servindo de referncia terica para o
desenvolvimento desses sistemas. Apesar dessa base terica proveniente dos estudos sobre tesauros e
classificaes com normas e padres reconhecidos internacionalmente, evidencia-se a necessidade da
consolidao de padres comuns para o desenvolvimento dos diferentes tipos de SOC. Aponta-se a
necessidade de congregar interesses multidisciplinares pela convergncia de objetivos e, com isso, gerar
melhores prticas de organizao e representao do conhecimento.
Palavras-chave: Sistemas de Organizao do Conhecimento. Tesauros. Taxonomias. Ontologias.
Sistemas de Classificao.
Abstract - This article presents the knowledge organization systems related to theories to build
thesaurus, taxonomies, ontologies and classification systems in the literature field of Information
Science. It uses the methodology of literature review and a research on the same field databases in
order to investigate the bibliographic production about the theme, from 1998 up to July 2009. It
identifies the same theoretical way to build KOS through the classification theory, concept theory, the
relationship between the concepts and the foundation of Linguistics and Terminology. Extrinsic and
intrinsic characteristics were analysed from the representative sample of the bibliographic production
about KOS. The last chapter verifies that the thesaurus and classification systems are the most quoted in
the literature about KOS, being a theoretical reference to the development of these systems based on
the international standards and rules. It highlights the importance of consolidating common standards to
build different types of KOS and shows the need of gathering the multidisciplinary interests linked by
the same goals and also getting better practices in the knowledge organization and representation.
Keywords: Knowledge Organization System. Thesaurus. Taxonomy. Ontology. Classification Systems
Resumem - El artculo presenta los sistemas de organizacin del conocimiento y la relacin com os
fundamentos tericos utilizados en la construccin de tesauros, taxonomias, ontologias y sistemas de
classificacin en la literatura de Ciencia de la Informacin. El estudio utiliza la metodologa de revisin
de la literatura en el rea de organizacin y representacin del conocimiento, y la bsqueda de las bases
de datos con el fin de investigar la produccin de la literatura sobre el tema entre 1998 y 2009.
Identifica un camino recorrido terico en la construccin de estos sistemas a travs de la teora de la
clasificacin, la teora del concepto, las relaciones entre los conceptos y principios de la Lingstica y
1

Mestre em Cincia da Informao. Consultora OPAS/OMS - rea de disseminao da informao.


E-mail: eliana.carlan@gmail.com
2
Doutora em Cincia da Informao. Professora da Faculdade de Cincia da Informao da Universidade
e Braslia. E-mail: marisab@unb.br

RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia,v. 4, n. 2, p. 53-73, ago./dez.2011.

Terminologa. De una muestra representativa, es el anlisis de sus caractersticas intrnsecas y


extrnsecas. Se concluye que los sistemas de tesauros y la clasificacin son los ms citados, incluyendo
servir como marco terico para el desarrollo de tales sistemas. A pesar de esta base terica de los
estudios de las normas de tesauros y la clasificacin y con las normas reconocidas internacionalmente,
pone de relieve la necesidad de consolidacin de las normas comunes para el desarrollo de diferentes
tipos de SOC. Este artculo pone de relieve la necesidad de poner en comn la convergencia de intereses
y objetivos multidisciplinario, lo que genera las mejores prcticas en la organizacin y representacin del
conocimiento.
Palabra-clave: Sistemas de Organizacin del Conocimiento, Tesauro, Taxonoma, Ontologa, Sistemas de
Classificacin.

1.

Introduo

Este trabalho3 apresenta a representao do conhecimento por meio dos Sistemas de


Organizao do Conhecimento (SOC)4, os quais abrangem todos os tipos de esquemas que
organizam e representam o conhecimento, por exemplo, as classificaes, taxonomias,
tesauros e ontologias. SOC so sistemas conceituais semanticamente estruturados que
contemplam termos, definies, relacionamentos e propriedades dos conceitos. Na
organizao e recuperao da informao, os SOC cumprem o objetivo de padronizao
terminolgica para facilitar e orientar a indexao e os usurios. Quanto estrutura variam de
um esquema simples at o multidimensional, enquanto que suas funes incluem a eliminao
da ambiguidade, controle

de

sinnimos ou equivalentes

estabelecimento de

relacionamentos semnticos entre conceitos. A pesquisa foi realizada por meio de reviso de
literatura sobre SOC observando seus progressos cientficos e os aspectos conceituais e
estruturais de elaborao desses sistemas. O objetivo da investigao foi relacionar os
fundamentos tericos indicados na literatura da rea e os princpios tericos encontrados nas
publicaes sobre o tema, desde seu surgimento at a realizao deste trabalho, por meio das
anlises bibliomtrica e de contedo. Contemplando tambm a relao dos SOC, no mbito da
Cincia da Informao (CI), e os princpios tericos que orientam a construo de tesauros,
taxonomias, ontologias e sistemas de classificao.
Para atingir os objetivos foi feito um levantamento bibliogrfico na rea com a opinio dos
diversos autores percorrendo um caminho terico fundamentado na Teoria da Classificao,
Teoria do Conceito, nos relacionamentos entre conceitos, nos princpios da Lingustica e da
3 Artigo decorrente da dissertao de mestrado: Sistemas de Organizao do Conhecimento: uma
reflexo no contexto da Cincia da Informao, de Eliana Carlan sob a orientao da Dra. Marisa
Brscher,
Universidade
de
Braslia,
Fev.
de
2010.
Disponvel
em:
http://bdtd.bce.unb.br/tedesimplificado/tde_busca/processaPesquisa.php?pesqExecutada=1&id=5381
4 O termo Sistema de Organizao do Conhecimento a traduo para o portugus do original ingls
Knowledge Organization System (KOS), proposto pelo Networked Knowledge Organization Systems
Working Group na 1 Conferncia da ACM Digital Libraries em 1998, Pittsburgh, Pennsylvania. Assim
como a sigla KOS, adotou-se o correspondente SOC em portugus.
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

54

Terminologia. Dos diferentes tipos de SOC, deu-se destaque aos tesauros, pelo uso ainda
frequente na rea de organizao de informao e por sua existncia consolidada e
padronizada por normas internacionais (ISO, ANSI/NISO); as taxonomias, por sua importncia
na organizao de informaes em empresas e instituies, principalmente, no
desenvolvimento de portais no ambiente web; as ontologias, pelo interesse da comunidade de
pesquisa na rea, em funo das promessas da web semntica e, ainda pelo potencial que
oferecem em relao capacidade de representao do conhecimento de forma complexa e
completa e os sistemas de classificao, pela ampla utilizao na organizao da informao
em bibliotecas, onde so empregadas at hoje.

2. Sistemas de Organizao do Conhecimento


O conhecimento est em eterno crescimento, transformando-se e acumulando-se.
Quando se adquire conhecimento relaciona-se com algo j existente, e sobre o qual somos
capazes de raciocinar e chegar a concluses. A criao de conhecimento sobre os objetos que
nos cercam constitui uma prerrogativa essencial da racionalidade humana. Desenvolve-se, por
instinto, num processo cognitivo que leva a identificar caractersticas do objeto percebido e
comparar com caractersticas identificadas em outros objetos j conhecidos. A partir desse
conhecimento, inicia-se um processo classificatrio do objeto.
Para Dahlberg (2006), a organizao do conhecimento a cincia que ordena a
estruturao e sistematizao dos conceitos, de acordo com suas caractersticas, que podem
ser definidas como elementos de herana do objeto, e a aplicao dos conceitos e classes dos
conceitos ordenados pela indicao de valores, dos referentes contedos dos objetos ou
assuntos. A partir dessa organizao do conhecimento criam-se ferramentas que apresentam a
interpretao organizada e estruturada do objeto, chamados de SOC. No contexto da Cincia
da Informao, os SOC ou esquemas de representao do conhecimento so instrumentos que
fazem a traduo dos contedos dos documentos originais e completos, para um esquema
estruturado sistematicamente, que representa esse contedo, com a finalidade principal de
organizar a informao e o conhecimento e, consequentemente, facilitar a recuperao das
informaes contidas nos documentos. A infraestrutura que d suporte ao desenvolvimento
dos SOC requer, antes de tudo, uma anlise das necessidades dos usurios dos sistemas; a
identificao do tipo de SOC apropriado e o desenvolvimento do hardware e do software
adequado arquitetura de rede, sua integrao e manuteno. Portanto, pode-se dizer que
sistema de organizao do conhecimento uma denominao nova para as linguagens
documentrias que agregam elementos incorporados nas inovaes tecnolgicas da era
digital.
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

55

Os SOC so ferramentas semnticas com vocabulrios estruturados e formalizados,


usadas para o tratamento e a recuperao da informao, tanto no ambiente web como no
tradicional, inclusive no desenvolvimento da web semntica. Para Hodge (2000) os SOC
constituem o corao dos Sistemas de Recuperao da Informao das bibliotecas, museus e
arquivos. No existe um esquema de classificao do conhecimento sobre o qual todos
concordem. Um SOC pode ser significativo e vantajoso para uma cultura, uma coleo ou um
domnio e para outros pode no ser.
O World Wide Web Consortium (W3C) desenvolveu um modelo e especificao,
denominado Simple Knowledge Organization System (SKOS), para dar suporte aos tradicionais
SOC (tesauro, taxonomia, vocabulrio controlado e sistemas de classificao) de forma que
seja entendido pela mquina. SKOS usa uma sintaxe flexvel de XML/RDF que fornece estrutura
para publicao dos termos usados nos SOC e seus relacionamentos para dar suporte s
buscas, mapeamentos e conexes entre os diferentes SOC.
No final da dcada de 50 do sculo XX, inicia-se o desenvolvimento e utilizao dos
sistemas de indexao e classificao por meio de palavras chave. Cavalcanti (1978, p. 27)
define tesauro como uma lista estruturada de termos associados empregada por analistas de
informao e indexadores, para descrever um documento com a desejada especificidade, em
nvel de entrada, e para permitir aos pesquisadores a recuperao da informao que
procuram. No contexto da Documentao, o tesauro considerado um instrumento de
controle terminolgico eficaz para a organizao do conhecimento e importante ferramenta
no tratamento e recuperao da informao. Os tesauros so estruturas consolidadas e
padronizadas por normas internacionais, como a ISO 2788 (1986), a ISO 5964 (1985) e a
ANSI/NISO Z39.19-2003 que tratam da construo, formatao e manuteno de tesauros
monolingues e multilingues. Com base nessas normas pode-se sintetizar a estrutura de
tesauros em duas partes: Base terica a essncia e a fundamentao para a construo de
tesauros: conceito, termo, categorias e faceta. Base tcnico-operacional abordagem mais
prtica no desenvolvimento de tesauros: planejamento, coleta de termo, controle
terminolgico, estabelecimento de relaes entre conceitos e formas de divulgao e
publicao. A construo de tesauros uma tarefa difcil, que exige um esforo coletivo, pois
as linguagens construdas so nicas em cada domnio do conhecimento e, portanto, sofrem
constantes modificaes medida que as lnguas evoluem.
O ponto de partida das taxonomias a classificao, por semelhanas e diferenas
entre caractersticas do objeto num dado domnio, em que objetos e fenmenos so divididos
em classes, essas subdivididas em subclasses, e em sub-subclasses e assim sucessivamente.
Embora as taxonomias tenham suas razes nos trabalhos de Aristteles, Linnaeus e Darwin
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

56

(CONWAY e SLIGAR, 2002; TERRA, 2005) o conceito de taxonomia sofreu uma transformao
nos tempos da informtica, chegando ao mbito da CI e da Documentao, no que se refere
aos sistemas de classificao. As taxonomias vm sendo usadas para a criao de metadados
ou termos comuns para descrever um objeto, com foco na recuperao da informao e na
categorizao, como suporte de navegao e esquemas que organizam contedos das pginas
na web e lista de controle de dados usados para suporte de minerao de dados. Uma
taxonomia bem definida e bem construda racionaliza o processo de busca, reflete a
necessidade dos usurios e o contedo que ela organiza.
As taxonomias no so documentos estticos, pelo contrrio, adaptam-se s
influncias do contedo e conhecimento dos trabalhadores que as utilizam. Quanto
estrutura, devem ser objetivas e estratgicas. O ponto de partida a busca pela existncia de
taxonomias, assim como outros documentos j existentes, do mesmo domnio, resultando em
economia de tempo e esforos. Conway e Sligar (2002) afirmam que uma taxonomia bem
formada no s reflete a necessidade de seus usurios como o contedo que ela organiza.
Ao contrrio do princpio dicotmico adotado por Aristteles, pode-se, atualmente,
construir taxonomias policotmicas, ou seja, um termo associado a tantas classes e
subclasses quantas se fizerem necessrias, em um domnio especializado. Com isso, evidenciase a grandeza do problema de mapeamento multidimensional de qualquer rea especializada
(CAMPOS e GOMES, 2008). Conway e Sligar (2002), descrevem trs tipos de taxonomias:
descritiva, construda nos modelos de tesauros ou vocabulrios controlados; navegacional5,
inerente neste conceito a ideia da relao gnero/espcie entre vrios documentos; e
gerenciamento de dados, que contm um pequeno conjunto de termos controlados
rigidamente e tem particular significncia enumerativa. Svenonious (2000) estabeleceu cinco
metas centrais para a classificao de documentos em um sistema de informao: encontrar;
identificar; selecionar; obter e navegar no acervo documental. As taxonomias criam uma rede
semntica comum baseada na necessidade dos negcios e considera os bens intelectuais e a
maneira pela qual os funcionrios procuram pela informao.
O desenvolvimento de ontologias cresce e ganha papel especfico em diversas
comunidades cientficas, como a Cincia da Computao, Cincia da Informao, Medicina,
para citar algumas. Uma ontologia define os termos usados para descrever e representar uma
rea do conhecimento. Pode ser usada por pessoas, bancos de dados, em tcnicas e aplicaes
de raciocnio indutivo e inferncias que necessitam compartilhar informaes dentro de um
domnio. Assim, Robredo (2005, p. 321) define uma ontologia como o resultado da
5
Sugere-se a leitura do artigo: Princpios classificatrios para a construo de taxonomias
disponvel em: http://www.portalseer.ufba.br/index.php/revistaici/article/viewArticle/3626
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

57

formulao, to rigorosa e completa quanto possvel, de um esquema conceitual sobre um


domnio. O fato que existe uma multiplicidade de acepes e definies para ontologia, que
refletem em diferentes tipos, pois so objetos de estudo de diferentes reas do conhecimento.
Noy e McGuinness (2001) apresentam cinco motivos pelos quais o desenvolvimento de
ontologias torna-se algo importante e considervel: a) compartilhamento de conhecimento
comum em estruturas de informao entre outros povos ou para os agentes de software; b)
permite o reuso do conhecimento; c) realiza inferncias em um domnio de conhecimento; d)
separa o conhecimento de domnio do conhecimento operacional; e e) realiza a anlise do
conhecimento estruturado tendo como resultado respostas mais relevantes.
As ontologias promovem e facilitam a interoperabilidade entre sistemas de
informao. Por meio de um processo inteligente dos computadores, possvel compartilhar
e reutilizar o conhecimento entre os sistemas. Na literatura alguns autores definem ontologias
como linguagens documentrias pelos seus elementos de formao: termos, definies e
relaes. Porm, apesar de possurem elementos comuns que outros SOC, as ontologias so
mais que linguagens documentrias, elas possuem funcionalidades que permitem que
mquinas possam processar o raciocnio automatizado por meio de regras e inferncias
(SALES, CAMPOS e GOMES, 2008 p. 63). As ontologias so o elemento da web semntica que
possibilita o nvel de representao semntico Por meio delas os softwares usados na web
semntica, como agentes inteligentes e web services, so capazes de utilizar o conhecimento
codificado para, ao menos parcialmente, entender e interpretar semanticamente, os
documentos e objetos. Para isso, as ontologias so usadas com linguagens OWL (Web
Ontology Language), XML (eXtensible Marckup Language) e XML Scheme, RDF (Resource
Description Framework )e RDF Scheme, que so tecnologias capazes de pesquisar e/ou captar
informaes de diferentes comunidades.
Os sistemas de classificao bibliogrfica foram desenvolvidos com o objetivo de
organizar os acervos de bibliotecas facilitando o acesso s informaes pelos usurios. A
Classificao Decimal de Dewey (CDD) foi o primeiro sistema de classificao elaborado e
influenciou a construo de muitos outros sistemas. Surgiu em um determinado contexto
histrico-cientfico de muitas dcadas atrs, e vem sendo atualizado, revisado e mantido pelo
comit editorial da CDD, localizado na Biblioteca do Congresso dos Estados Unidos desde 1972.
A CDD atualizada a cada sete anos e a sua verso impressa est agora na 22 edio.
Alm da CDD existem outros sistemas de classificao citados na literatura e usados
em bibliotecas de todo o mundo: Classificao da Biblioteca do Congresso dos Estados Unidos
pouco sistemtica e o seu esquema enumerativo resulta em rigidez e falta de hospitalidade,

RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

58

criada para atender especialmente as necessidades organizacionais da prpria Biblioteca;


Classificao Decimal Universal, criada a partir da CDD com alteraes e adies, como o uso
de um enfoque facetado para possibilitar a anlise de assunto mais detalhada; Classificao de
dois pontos, primeiro sistema de classificao bibliogrfica com bases no princpio analticosinttico ou anlise por facetas, priorizando as categorias - Personality, Matter, Energy, Space e
Time (PMEST); e Classificao de Bliss, primeiro a dizer que um esquema de classificao
representava a organizao do conhecimento e estabeleceu sua base filosfica e terica
tendo os seguintes princpios bsicos: consenso, arranjo de assuntos correlatos, gradao em
especificidade, localizao alternativa e brevidade da notao.
Um grupo de informaes pode ser organizado de vrias formas, seguindo diferentes
esquemas de organizao. As notcias de um jornal, por exemplo, podem ser organizadas pelo
seu assunto (poltica, economia, etc.), cronologicamente pela data de publicao ou
alfabeticamente pelo nome do reprter. A classificao desse conjunto de informaes em
diferentes esquemas chamada de classificao facetada ou multidimensional. Cada esquema
representa uma dimenso na estrutura que organiza a informao. A web, por ser um
ambiente virtual, permite facilmente apresentar a mesma informao organizada de vrias
formas. No mundo fsico, ao contrrio, isso praticamente impossvel. As longas notaes
criadas em esquemas multidimensionais no so fceis de usar para fazer o arranjo de pacotes
de informao fsica em prateleiras. Entretanto, em catlogos elas so muito teis, uma vez
que cada dimenso pode ser buscada independentemente.
A definio de classificao, ainda que possa variar de acordo com outros autores, tem
elementos essenciais que caracterizam o processo de classificar, que a formao metdica e
sistemtica de grupos onde se estabelecem critrios para a diviso. , provavelmente, o
mtodo mais simples de descobrir ordem na mltipla e confusa diversidade da natureza.
usada como instrumento de representao do conhecimento com a finalidade de organizar e
recuperar informaes. Processo mental que est incorporado ao nosso cotidiano, desde
quando temos conscincia e armazenamos algum conhecimento. Enquanto fenmeno social,
as pessoas classificam intuitivamente as coisas, o tempo todo. Com isso, a proposta inicial da
classificao facilitar as operaes da mente quando se percebe e guarda na memria as
caractersticas dos objetos em questo.

2.1 Princpios de hierarquia


Herana de Aristteles que dividiu toda a natureza unificada em um todo e o todo em
partes: classes naturais, subclasses, sub-subclasses e assim por diante, diz respeito diviso
dicotmica dos objetos em gnero e espcie. Esse processo segue uma srie de regras de
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

59

associao e distino ordenadas e sistematizadas. De acordo com Aristteles, somente uma


observao exaustiva pode revelar cada atributo verdadeiro de uma entidade e somente a
filosofia pode nos guiar em determinar os atributos necessrios e suficientes para os membros
de uma classe. Somente quando a entidade classificada corretamente e suas propriedades
essenciais so identificadas que podemos dizer que a conhecemos verdadeiramente.
Kwasnik (1999) acrescenta que o legado de Aristteles sobrevive no esprito das
modernas aplicaes de classificao e sugere alguns requisitos para uma estrutura
hierrquica adequada: inclusividade, gnero/espcie, herana, transitividade, regras
sistemticas e predeterminadas para associao e distino, mtua exclusividade, critrio
necessrio e suficiente, informao completa e compreensvel, herana e economia nas
notaes, inferncia, definies reais e viso de nvel elevado e perspectiva holstica. Em
resumo, hierarquias so excelentes representaes para o conhecimento de domnios em que
a natureza das entidades e a natureza do significado dos relacionamentos so conhecidas com
classes de limites claros.

2.2 Teoria do Conceito e Relaes entre Conceitos


A Teoria do Conceito foi desenvolvida por Ingertraut Dahlberg na dcada de 1970 que
viabiliza uma fundamentao slida para a determinao e o entendimento dos conceitos,
assim denominados, com a finalidade de representao e recuperao da informao.
Dahlberg (1978) define conceito como unidades do conhecimento, identificadas por meio de
enunciados verdadeiros de um determinado objeto representado na forma verbal.
Interpretando o tringulo conceitual de Dahlberg, temos no pice o referente (aquilo que se
quer conceituar), as caractersticas (predicao verdadeira sobre o referente) e a forma verbal
(denominao do referente) representado por um termo. O conceito individual acontece
basicamente por meio de analogia. Quando nos deparamos com algo desconhecido tentamos
aproximar com algum contedo j presente em nossos registros mentais. Dahlberg (1978),
define como algo nico, diferente dos demais, constituindo uma unidade inconfundvel e
caracterizado pela presena de tempo e espao, por exemplo, exploso da bomba atmica.
Enquanto que o conceito geral se situa fora do tempo e do espao e se refere a uma
multiplicidade de coisas, podendo tambm ser algo abstrato. Para cada item de referncia so
elaborados enunciados verdadeiros que formaro o conceito desse objeto, representado por
um signo lingustico (termo). A partir disso, atribuem-se predicados ao referente denominados
de caractersticas, que so propriedades dos objetos e, no nvel do conceito, passam a ser
caractersticas do conceito. Essas caractersticas podem ser de dois tipos: as essenciais e as
acidentais. As caractersticas essenciais definem os conceitos gerais e os conceitos individuais
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

60

so determinados a partir das caractersticas essenciais acrescentando as acidentais. Para


Dahlberg (1978, p. 24-25), a intenso de um conceito a soma total de suas caractersticas,
bem como a soma total de seus conceitos genricos e das caractersticas especificadoras.
Numa definio, nem todos os conceitos genricos precisam ser mencionados, para
representar a intenso do conceito. Apenas o mais prximo suficiente, uma vez que este
necessariamente contm os demais. Por ex.: a intenso do conceito casa a seguinte: construo; - feita de tijolo ou madeira; - contm sala e dormitrios; etc.
A extenso do conceito pode ser entendida como a soma dos conceitos mais
especficos para os quais a intenso verdadeira. Isto , a classe dos conceitos de tais objetos
dos quais se pode dizer que possuem aquelas caractersticas em comum que se encontram na
intenso do mesmo conceito. A extenso do conceito pode ser de dois tipos: a) extenso de
um conceito genrico em relao com os conceitos especficos. Por ex.: Casa - casa de pedra;
b) extenso dos possveis conceitos individuais. Compreende os indivduos para os quais
vlida a predicao genrica do conceito. Por ex.: Casa - casa do Presidente da Repblica.
Com a evoluo tecnolgica e a demanda por formas de organizao e recuperao de
informaes mais complexas, a categorizao e as relaes entre conceitos so fundamentais
e encontram-se cada vez mais detalhadas nos SOC. Considerando que o conceito, geral ou
individual, uma sntese de caractersticas, Dahlberg (1978, p. 18) afirma que h relao entre
conceitos quando conceitos diferentes possuem uma ou mais caractersticas em comum. Para
tal comparao pode-se valer de dois tipos de abordagem: quantitativa (ponto de vista da
lgica formal) e qualitativa (aspectos formais e materiais).
As relaes quantitativas medem as similaridades das caractersticas de diferentes
conceitos, por meio de uma viso lgica. Na relao de identidade conceitual as caractersticas
de dois conceitos so as mesmas; na relao de incluso conceitual as caractersticas de um
conceito A esto contidas em um conceito B, acrescida de uma ou mais caracterstica; na
relao de interseo conceitual as caractersticas de dois conceitos se sobrepem; e na
disjuno conceitual as caractersticas de dois conceitos no tm nada em comum.
As relaes qualitativas consideram os aspectos formais e materiais e est subdividida
em: relao formal/categorial acontece entre o tipo de item de referncia, que est sendo
analisado e uma categoria. As caractersticas podem, s vezes, corresponder a uma hierarquia
de caractersticas, sendo que o predicado de um enunciado pode tornar-se sujeito de um novo
enunciado, e assim sucessivamente at atingir uma caracterstica to geral, na sua mais ampla
extenso, tornando-se uma categoria. A relao material/paradigmtica acontece entre
conceitos que tm caractersticas da mesma natureza no interior de uma categoria. Pode ser
de trs tipos: hierrquica, numa relao lgica de implicao. Quando o conceito mais
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

61

especfico possui caractersticas adicionais em relao ao conceito mais genrico do tipo


gnero-espcie ou relao de abstrao ou de subordinao. Quando dois conceitos diferem
em uma caracterstica, e so especializaes de um mesmo conceito mais genrico, a relao
hierrquica dita relao lateral ou relao em renques ou de coordenao. A relao
hierrquica partitiva existe entre o todo e suas partes, sendo que as partes tambm podem
estar relacionadas entre si. Podendo ocorrer em: a) sistema natural - um organismo vivo animal ou vegetal (todo) e as partes desse organismo (partes); b) sistema artificial - uma
mquina (todo) e a partes da mquina (partes); c) organizao humana - um pas (todo) e os
estados, municpios (partes); e d) assunto ou rea do conhecimento - uma disciplina (todo) e
os diferentes sub-campos (partes). A relao de oposio pode ser de trs tipos: relao de
oposio contraditria (numrico - no numrico), relao de oposio contrria (preto
branco), relao de oposio positivo neutro negativo (favorvel neutro desfavorvel).
As relaes funcionais/sintagmticas ocorrem entre conceitos de diferentes
categorias. As relaes funcionais aplicam-se, sobretudo, a conceitos que expressam processo
ou operao. No plano da linguagem, os conceitos podem ser expressos por verbos ou pela
derivao de verbos. Num primeiro nvel de relacionamento pode-se trabalhar com as
perguntas Quem? Fez o que? Num segundo nvel as relaes envolvem tambm, proposta,
condio, tempo, lugar, pessoa, objeto e correspondem s questes: Porque? Como? Quando?
Onde? Quem? e O que? por ex.: o conceito medio (verbo medir), relaciona-se com objeto
medido, propsito da medio, instrumento de medio, unidade de medio, etc. A
grande dificuldade de definir as relaes funcionais/sintagmticas deve-se ao fato de que as
relaes entre os conceitos ocorrem em diferentes categorias e podem se relacionar entre si
em algum momento. Isso, porque as associaes dependem, em larga escala, do universo de
referncia considerado e da organizao dos domnios de especificidade. O Quadro 1 rene
exemplos passveis de esclarecer as complexas relaes entre termos. Sobre as relaes
associativas Saussure (1977, p. 145) aponta que os grupos formados por associao mental,
no se limitam a aproximar os termos que apresentam algo em comum, mas o esprito capta
a natureza das relaes que os unem em cada caso e cria, com isso, tantas sries associativas
quantas relaes diversas existam.

RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

62

Quadro 1. Relaes associativas entre termos


Relao

Exemplos

Atributiva

economia / nvel de atividade econmica

Disciplina /Objeto

entomologia / insetos

Processo / instrumento

iluminao / lmpadas

Influncia

poltica monetria / inflao

Matria-prima / produto

bauxita / alumnio

Coisa / aplicao

abastecimento de gua / irrigao

Ao / resultado da ao

tecelagem / tecido

Causalidade ou causa / consequncia

crescimento econmico / desenvolvimento econmico

Efeito / causa

medicamento / cura da doena

Dependncia causal

doenas patognicas / agentes

Atividade / agente

tabagismo / fumo

Produto / propriedade

veneno / toxidade

Atividades complementares

compra / venda

Opostos

vida / morte

Ao / seu paciente

priso / criminoso

Coisa / seu contra-agente

insetos / inseticidas

Atividade / produto

tecelagem / tecido

Pessoas ou coisas / suas origens

brasileiro / Brasil

Fonte: Cintra e co-autores, 2000, p. 48-51, com adaptao

Existe ainda os sistemas de conceitos multidimensionais ou polihierarquia em que um


assunto pode ser classificado em hierarquias diferentes. Campos (2001, p. 88) afirma que
nesse tipo de sistema no pode haver simplificao, a maneira de representao reflete que a
realidade pode ser percebida e concebida em diferentes contextos conceituais. Contudo,
quando as polihierarquias so complexas, sugere-se que sejam divididas em vrias
monohierarquias, com referncias cruzadas entre elas. A polihierarquia permite que um
mesmo termo especfico possa estar subordinado a mais de um termo genrico, podendo ser
representadas nos diagramas em linha e diagramas em linha bidirecional, chamados de rvore
de Busca. Esse tipo de relao comum em taxonomias navegacionais, pois oferecem ao
usurio mais de um caminho para a localizao de um mesmo produto, considerando que esse
produto tenha carter multidimensional. Com isso, facilitando a recuperao da informao.

2.3 Lingustica, Terminologia e os SOC


RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

63

Os SOC so constitudos de elementos que delimitam uma determinada rea do


conhecimento, sendo o termo, um dos elementos. Esses termos so subordinados a uma
terminologia contextualizada pelo contedo informacional dentro de um domnio especfico
do conhecimento. No obstante, a noo semitica de signo, significado e significante,
postulada por Ferdinand de Saussure so fatores relevantes na elaborao dos SOC. O signo
lingustico dito por Saussure (1977, p. 80-87) no une uma coisa e uma palavra, mas um
conceito e uma imagem acstica. Esta imagem acstica no o som material e sim a
representao deste na nossa mente e nos nossos sentidos. O conceito e a imagem acstica
podem ser substitudos por significado e significante, respectivamente. Da, utilizou-se a
palavra smbolo para designar o signo lingustico ou significante que tem uma relao racional
com o significado.
Quando se fala em significado, no contexto da organizao e representao do
conhecimento, logo pensamos em semntica. Na Lingustica, semntica o estudo dos
significados. Aqui, toma-se como definio para significado a descrita por Lyons (1987, p. 133)
onde diz que os significados so ideias ou conceitos que se podem transferir da mente do
falante para a do ouvinte por encarnar-se, por assim dizer, nas formas de uma ou outra
lngua. Assim, os signos para os SOC so descritores resultantes de uma construo
pertinente para a significao, ou seja, formas lingusticas que expressam conceitos que
representam o contedo de documentos. Portanto, a Lingustica fornece o aporte terico que
possibilita o desenvolvimento desses instrumentos e permite que se estabelea uma ponte
entre, pelo menos, duas linguagens: a linguagem do sistema e a linguagem do usurio. Os SOC
so constitudos de termos, conceitos e relaes semnticas e uma teoria para os SOC deve
explicar como esses elementos semnticos devem ser selecionados e relacionados.
A Terminologia nasceu na dcada de 1930 com Eugne Wster, a quem se atribui o
papel de fundador da Teoria Geral da Terminologia (TGT). Wster tem o foco na preciso da
linguagem, com a criao de uma teoria e de uma metodologia da terminologia a fim de
conseguir uma comunicao inequvoca e sem ambiguidade sobre os assuntos especializados.
O prprio termo terminologia polissmico, refere-se tanto Terminologia6 terica quanto
terminologia concreta. Na primeira acepo, a Terminologia trata de uma rea do
conhecimento, que denomina conceitos, ou seja, conjunto de metodologias e diretrizes que
regem a descrio, formao dos termos e estruturao de campos conceituais. Na segunda
acepo, refere-se a um conjunto de termos de um campo especfico do conhecimento
relacionados com uma lngua de especialidade, so produtos gerados pela prtica. Nesse
6 Para distinguir, optou-se pela grafia de Terminologia, com T maisculo, para a Terminologia tericometodolgica, e com t minsculo, a terminologia concreta ou produto.
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

64

contexto, os termos esto relacionados e definidos rigorosamente para designar os conceitos


que lhe so teis, usados na construo de linguagens especializadas, linguagens
documentrias e na elaborao dos SOC. A Terminologia como campo inter e transdisciplinar
trabalha com a descrio e ordenamento do conhecimento no nvel cognitivo, com a
transferncia do conhecimento em nvel comunicacional e com os elementos centrais,
conceitos, termos e reas de experincias no nvel de normas internacionais (ISO).
De fato, a transferncia de informao, requer um sistema de significao claro e
explcito, pois um sistema de comunicao no existe sem um repertrio de signos e sem um
corpo de regras que definam como se selecionam e se combinam esses signos para formar as
mensagens transmissveis. A terminologia de uma rea especfica, como se sabe, constituda
pelo conjunto de palavras especializadas de uma determinada disciplina. Os termos, que so as
unidades de base da terminologia, designam os conceitos prprios de cada disciplina
especializada (CABR, 1993, p. 169). Com isso, proporcionando um maior entendimento entre
pesquisadores e demais usurio dos sistemas de comunicao nas cincias. Um princpio
fundamental da comunicao relaciona-se entre o entendimento da mensagem e o receptor,
ou seja, no ser possvel estabelecer comunicao sem a compreenso mtua. A CI manifesta
preocupao quando toma a informao como objeto de estudo em seu aspecto de
construo, comunicao e uso da informao. Nos contextos tcnico-cientficos, a
terminologia assume papel fundamental por trabalhar com as lnguas de especialidades,
responsveis por garantir a comunicao rpida e precisa entre os interlocutores.
Estudos atuais na organizao e representao do conhecimento recomendam a
escolha de uma das teorias da Terminologia para a construo de SOC, de acordo com o
campo do conhecimento a ser trabalhado. Algumas teorias da Terminologia merecem
destaque: a TGT, pioneira e responsvel pela base do trabalho terminolgico, possui uma
perspectiva prescritiva e normativa que visa rotular e padronizar definitivamente o uso de
termos e conceitos, sem considerar as inmeras variaes possveis em um contexto
comunicacional. A Teoria da Socioterminologia de Franois Gaudin, sob uma perspectiva
descritiva com nfase ao uso social da lngua, aceita a variao e a flexibilidade lexical e
conceitual, proporcionando uma aproximao entre mecanismos de informao e usurios. E a
Teoria Comunicativa da Terminologia de Maria Teresa Cabr fundamenta aspectos
comunicativos das lnguas naturais para melhor conduzir a comunicao entre especialistas.

3.

Procedimentos Metodolgicos
O processo de anlise valeu-se de mtodos quantitativos e qualitativos. O perodo

definido para a pesquisa foi entre 1998, ano em que foi sugerida a adoo da expresso
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

65

sistema de organizao do conhecimento e o ms de julho de 2009. O caminho


metodolgico teve incio com uma reviso bibliogrfica, nas reas de organizao e
representao da informao e do conhecimento, fundamentada nos conhecimentos de
Biblioteconomia, Documentao e CI. Dentre as diversas bases de dados da Cincia da
Informao, optou-se por quatro bases especficas: LISA, LISTA, ISTA e WILSON7. Alm das
bases de dados, foi includo um repositrio de acesso livre, na rea de CI: o E-LIS e a base de
dados de trabalhos acadmicos, Base de Dados de teses e Dissertaes (BDTD).
A estratgia de busca, nas bases de dados internacionais foi pela expresso
Knowledge Organization System e Knowledge Organization Systems. Na base BDTD
decidiu-se pela expresso Sistema de Organizao do Conhecimento. Apenas para obteno
de dados complementares ou busca de textos completos, no includos nas bases citadas,
optou-se por consultar o google acadmico. A delimitao das bases de dados, o perodo da
busca, as estratgias de busca, a seleo dos indicadores para a anlise bibliomtrica e de
contedo e a determinao das inconsistncias nos registros, constituram os elementos que
estabeleceram os critrios para a definio do escopo das amostras representativas.
Para a anlise dos dados, foram observados dois conjuntos de dados: o primeiro
relativo aos aspectos de forma ou extrnsecos numa anlise bibliomtrica e privilegiou os
indicadores: ano de publicao, autoria, ttulo do documento, publicao, idioma, pas de
publicao, palavra-chave e resumo. O segundo relativo aos aspectos de contedo ou
intrnsecos, numa anlise de contedo. As anlises bibliomtricas e de contedo so realizadas
a partir de levantamento estatstico e frequncia. A escolha do mtodo da anlise de contedo
se deve a dois motivos principais: a) os procedimentos possibilitam uma anlise com base em
interpretaes dos indicadores; e b) por ser uma anlise para observar a relao entre a
produo tcnico-cientfica sobre SOC e os princpios tericos para a construo dos SOC, em
que os documentos tm caractersticas semelhantes e homogneas. Dividida em trs etapas:
pr-anlise, especulao e anlise do material e tratamento dos resultados obtidos e
interpretaes.
Na coleta de dados nas bases LISA, ISTA, LISTA e H. W. Wilson ocorreu os seguintes
resultados: LISA 30 registros; ISTA 33; LISTA 49; WILSON 13; E-LIS 70 e BDTD zero, totalizando o
universo de 195 registros. Do resultado obtido da busca verificou-se baixa revocao8.

7 LISA Library and Information Science Abstracts; H. W. WILSON Library Literature and Information
Science Full Text; LISTA Library, Information Science & Technology Abstracts with Full Text; ISTA
Information Science & Technology Abstracts.
8 Habilidade de recuperar informaes relevantes para um assunto especfico, quando uma solicitao
sobre esse assunto feita ao sistema. (LANCASTER, 1977)
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

66

oportuno ressaltar que as expresses usadas na estratgia de busca, no constam em nenhum


tesauro, ndice ou glossrio das bases de dados.

3.1 Consideraes acerca dos resultados encontrados nas bases de dados


A partir da primeira anlise para a seleo da amostra significativa observou-se
algumas inconsistncias como: trabalhos com apenas o nome do autor, afiliao e pas; artigos
sem autoria; programao de eventos; trabalhos repetidos; dados insuficientes para anlise;
documentos no publicados; apresentaes de trabalhos; um manual e um livro que no foi
possvel acessar; um estudo de caso; artigos identificados em lnguas estrangeiras diferentes
do ingls. A BDTD foi descartada para o estudo por obter resultado zero ou busca vazia na
pesquisa. Pela falta de elementos, esses itens no foram computados. O total de registros
recuperados foi de 195. No entanto, aps este levantamento inicial e descartados os registros
considerados inconsistentes, delimitou-se a amostra representativa da pesquisa em 90
registros para a anlise.

Anlise dos Dados


Para a anlise dos aspectos extrnsecos, foram levantados os itens: base de dados,

ano de publicao, autor, ttulo do documento, publicao, palavra-chave, idioma e pas de


publicao. Porm, no decorrer da pesquisa observou-se que nem todas as bases de dados
indexam o idioma do documento e o pas de publicao. Das bases consideradas para anlise
apenas a LISA indexa o idioma e o pas de publicao. As bases E-LIS e Wilson indexam,
somente, o idioma e as bases ISTA e LISTA no indexam idioma nem pas de publicao. Pela
falta de dados para analisar o conjunto, esses itens no foram analisados. Embora o idioma
para a indexao dos documentos nas bases de dados seja, predominantemente, o ingls.
Ano de publicao - no perodo de 1998 at julho de 2009 observa-se que nos primeiros anos
houve modesta contribuio de publicaes sobre o tema. Mas, a partir de 2002 existe uma
tendncia crescente de publicaes sobre SOC. Os anos 2006 e 2007 apresentam maior
nmero de publicaes, que somados atingem 41% da produo. Em 2008, a produo foi de
13%, porm at meados de 2009 houve diminuio no nmero de publicaes.
Publicao - foram selecionados e examinados 53 diferentes tipos de publicaes. As
publicaes sobre o tema encontram-se distribudas em vrios tipos, o que aponta para a
disperso de publicaes. Sendo que o menor nmero de trabalhos produzidos estava em 35
publicaes diferentes e o de maior nmero de trabalhos ocorreu em duas publicaes.
Quanto maior o nmero de publicao, menor o nmero de produo e vice-versa. Devido
diversidade de publicaes encontrada, optou-se por dividir em trs categorias, para facilitar a
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

67

visualizao. As categorias so: peridicos (67,92%), que fazem parte os jornais, boletins e
revistas; eventos (26,41%) englobam as conferncias, congressos, seminrios, anais, fruns e
workshop e acadmicos (5,66%) so as teses, dissertaes e monografias.
Autores - houve a ocorrncia de 141 autores. Desse total, 125 autores aparecem com uma
nica produo sobre o tema, sendo 62 citados como autor principal e 63 como autores
secundrios. Os autores com mais produo so Marcia Lei Zeng, Katrin Weller, Nez Paula e
Israel Adrin, Claudio Gnoli e Douglas Tudhope.
Palavra-chave - buscou-se identificar os termos mais frequentes no campo palavra-chave dos
registros recuperados e, tambm identificar as reas s quais o termo Knowledge
Organization System pode estar relacionado. No total foram computadas 404 palavras-chave,
sendo 225 termos diferentes. Dentre os artigos recuperados o termo Knowledge sozinho ou
associado a outros termos aparece como palavra-chave desde 1998, mas somente em 1999 a
expresso knowledge organization system aparece como palavra-chave. Information
retrieval e digital libraries apareceram pela primeira vez em 1998 e 2002 respectivamente.
O primeiro artigo com o termo semantic data de 2001, sendo que a expresso web
semantic aparece apenas em 2005 e em 2006 observa-se a expresso semantic relation.
A anlise dos aspectos intrnsecos ou de contedo foi desenvolvida em:
Pr-anlise - foram selecionados os trabalhos que mencionam em seus contedos, algum tipo
de relao com a base terica apresentada na reviso de literatura. Esta seleo foi feita por
meio de leituras dos campos: ttulo, palavra-chave e resumo. Com base nesse critrio foram
identificados 43 documentos para a anlise temtica e selecionados para a leitura na ntegra.
Exceto algumas inconsistncias que foram apontadas: artigos no localizados na ntegra;
artigos completos no idioma desconhecimento da autora. Portanto, esses quatro trabalhos
no fizeram parte do cmputo da anlise de contedo totalizando para anlise temtica 39
documentos.
Especulao e anlise do material - leitura na ntegra dos documentos relevantes. Os
diferentes tipos de SOC foram classificados de acordo com o nmero de vezes que foram
abordados nos documentos com relao ao desenvolvimento de tesauro e/ou taxonomia e/ou
ontologia e/ou sistemas de classificao e/ou outro tipo de SOC9 e as categorias prestabelecidas: princpios da classificao; conceitos e relaes entre conceitos; lingustica e
terminologia. No nmero de publicaes por ano verificou-se apenas uma publicao nos anos

9 No decorrer da pesquisa observou-se que muitos autores no especificam o tipo de SOC, por isso a
necessidade de criar o grupo outro tipo de SOC.
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

68

de 1999 e 2000. Uma modesta contribuio at 2004 e obtendo um crescimento na produo


com o auge em 2006, seguindo em 2008 e 2007.
Tratamento dos resultados obtidos e interpretaes - anlise e discusso de resultados,
desdobradas em dois conjuntos principais que tratam em seus contedos, sobre os tipos de
SOC e as categorias abordadas nos trabalhos. As categorias foram pr-determinadas na
metodologia e so baseadas na fundamentao terica desenvolvida na reviso de literatura.
Grfico 2.

Nmero de citao dos tipos de SOC

Fonte: elaborao prpria

O grfico mostra que os tesauros so os mais citados com 87% de frequncia dos
documentos analisados. Seguida dos sistemas de classificao com 77%, as ontologias com
61%, os outros tipos de SOC com 54% e as taxonomias com o menor ndice de frequncia 49%.
O fato dos tesauros e os sistemas de classificao estarem nos tipos de SOC que apresentam
maior ndice de ocorrncia permitem refletir, que tal fato pode ser justificado por esses dois
sistemas possurem estruturas de construo consolidadas por normas e padres
internacionais, enquanto que as taxonomias e ontologias ainda no. Alm disso, no se pode
deixar de mencionar a preocupao com a prpria rea de CI em refletir sobre a necessidade
da consolidao de uma base terica comum para a construo de tais sistemas.
Dentre os sistemas de classificao os que mais se destacam so CDD e CDU com 14
citaes, LCC com 9, classificao facetada 7 e classificao de Bliss uma. Sobre os outros tipos
de SOC identificados na anlise ressaltam os vocabulrios controlados, lista de cabealho de
assunto, gazetteer, glossrio, dicionrio, mapa conceitual e folksonomia. Na anlise por
categorias, foram evidenciadas as influncias tericas quando a temtica SOC, de acordo
com o grfico a seguir.

RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

69

Grfico 2.

Nmero de citao por categorias da base terica

A categoria que representa a base terica com maior frequncia nos artigos analisados
foi teoria do conceito e relaes entre conceitos. Como parte dessa categoria, os temas
especficos mencionados so: teoria do conceito (frequncia 20), relao hierrquica (17),
relao associativa (12) e categorizao (12). No entanto, alguns autores referem-se a
relaes entre conceitos (7) sem especificar qual o tipo de relacionamento. Os resultados
apontam com clareza a influncia da fundamentao terica para o melhor entendimento e
preciso do conceito do objeto a ser representado, fornecendo bases seguras tanto para
estabelecer relacionamentos quanto para a determinao dos termos. A terminologia
representa o aporte terico com o segundo maior nmero de ocorrncias. Conforme
constatado, o tema predominante relatado nos documentos o controle terminolgico (19),
que engloba o controle da polissemia, as estruturas sintticas e semnticas e os termos de
origem mais complexa. Observou-se em muitos trabalhos o interesse em identificar e discutir
os desafios para o desenvolvimento geral de estruturas de conceitualizao, que abrange os
conceitos e as terminologias a fim de melhorar as informaes cruzadas e a representao de
conceitos entre diferentes sistemas usados para fins da recuperao de informaes.
Na categoria lingustica identificou-se os temas sobre significado e significante,
relao de sinonmia, hiponmia, homonmia, hiperonmia, meronmia e equivalncia.
Verificou-se, tambm, que diversos autores mencionam apenas relaes semnticas (23) sem
especificar o tipo de relacionamento. Por outro lado, o nmero de ocorrncias bastante
elevado, merecendo ser destacado, inclusive, se considerados os relacionamentos
especificados nas categorias conceitos e relaes entre conceitos e lingustica. Percebe-se
que a natureza de diferentes relaes semnticas, seu uso apropriado e bem definido podem
ajudar na construo dos SOC consistentes. Finalmente, princpios de classificao foi a
categoria com o menor ndice de ocorrncia, porm no menos significativo. Durante a
anlise, observou-se os fundamentos tericos da teoria da classificao, os princpios da
diviso de classes, das facetas e das hierarquias. O estudo evidenciou a baixa frequncia com
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

70

que os autores tratam o assunto, mas ao mesmo tempo, alguns autores concordam que o
ncleo das relaes semnticas para todos os SOC a hierarquia.
A anlise dos temas associados aos SOC sugere a tendncia de estudos sobre o
assunto no campo da CI. Web semntica e interoperabilidade aparecem como os temas mais
frequentes, juntamente com as bibliotecas digitais para fins de recuperao de informao. A
folksonomia, por ser tema novo, surpreende pela frequncia de ocorrncia desse tema
relacionado com os SOC. Porm, com a ocorrncia mais baixa, destacam-se cincia da
informao, teoria da informao, softwares para construo de SOC, construo automtica e
semi-automtica de tesauros, rede semntica, bibliometria, abstrao automtica de termos,
mapeamento de diferentes SOC e e-comrcio. As palavras-chave mais usadas pelos autores
so knowledge organization, thesauri, knowledge organization system, knowledge
management e information retrieval. E o caminho terico percorrido para o desenvolvimento
dos SOC passa pela teoria do conceitos, da terminologia, da lingustica, dos princpios de
classificao e com destaque os relacionamentos entre conceitos. Os SOC esto diretamente
relacionados com os temas da web semntica, interoperabilidade entre diferentes sistemas,
recuperao da informao e bibliotecas digitais.

Consideraes finais
Quanto ao objetivo geral proposto pela pesquisa a investigao realizada evidenciou

que os SOC so estruturas sistematizadas que tm no seu desenvolvimento uma relao muito
estreita com os princpios tericos que subsidiam a construo de taxonomias, ontologias e,
principalmente, tesauros e sistemas de classificao. As mudanas so inerentes aos processos
de evoluo. Alguns elementos so agregados enquanto outros se tornam obsoletos,
substitudos ou transformados. Na organizao e representao do conhecimento, no
diferente. Com base no que foi verificado na pesquisa, principalmente, na reviso de literatura,
estima-se que haja uma probabilidade para a tendncia da evoluo, que acontece
naturalmente das linguagens documentrias para os SOC, acrescidos de elementos prprios da
tecnologia moderna para atuar no ambiente web. Outra observao significativa que os SOC,
mesmo empregados no ambiente informatizado, herdam caractersticas no desenvolvimento
de suas estruturas que esto fundamentadas em teorias que os profissionais da informao
testemunham h pelo menos um sculo. Como a influncia dos sistemas de classificao na
construo de outros sistemas, apontada na anlise de contedo. Porm, no simplesmente
uma repetio do passado, uma verso nova, incorporada de linguagens novas, softwares e
ferramentas tecnolgicas, que criam estruturas de elevada representatividade conceitual e
permitem estabelecer ricas e exaustivas redes semnticas. Os SOC so instrumentos que
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

71

dependem de padronizao para melhor interagirem, integrarem e interoperarem entre eles e


entre humanos, sejam usurios, provedores de informaes ou mquinas. Esses sistemas
contribuem para diminuir o abismo na comunicao entre pesquisadores, bancos de dados e
documentos armazenados, criados pelas dificuldades na organizao das informaes e do
conhecimento.
Na anlise de contedo ficou evidente que existe um caminho terico a ser percorrido
para a construo de SOC que tambm fundamenta a construo de taxonomias e ontologias.
Esse caminho passa pela teoria da classificao, teoria do conceito, os relacionamentos entre
conceitos e os princpios da Lingustica e da Terminologia para o tratamento dos termos. Esse
percurso terico fundamenta e garante a consistncia nas estruturas dos SOC e nas relaes
semnticas para o melhor desempenho de suas funes.
importante destacar alguns problemas detectados no decorrer da pesquisa que, no
entendimento da autora, prejudicaram o seu desenvolvimento, como a baixa revocao no
resultado das buscas nas bases de dados. A ausncia de recuperao de publicaes nacionais
outra limitao do estudo, uma vez que se obteve resultado zero nas buscas da BDTD. A
falta de uma base de dados atualizada que indexe e recupere artigos de peridicos brasileiros
na rea de CI tambm contribuiu para ausncia de anlise de publicaes brasileiras.
Referncias
American National Standard Institute / National Information Standards Organization.
ANSI/NISO Z39.19. Guidelines for the Construction, Format, and Management of Monolingual
Controlled Vocabularies. 2005. Disponvel em: <http://www.niso.org/kst/reports/standards/>.
Acesso em: out. 2009.
CABR, M. T. La Terminologa: Teoria, metodologia, aplicaciones. Barcelona: Editorial
Antrtida/Empries, 1993. 529 p.
CAMPOS, M. L. de A. A Organizao de Unidades do Conhecimento em Hipertextos: o modelo
conceitual como um espao comunicacional para a realizao da autoria. 2001, 198 fl. Tese.
(Doutorado em Cincia da Informao) Programa de Ps-Graduao e Cincia da Informao
da Escola de Comunicao da Universidade Federal do Rio de Janeiro. Rio de Janeiro, 2001.
CAMPOS, M. L. de A. ; GOMES, H. E. Taxonomia e Classificao: o princpio de categorizao.
DataGramaZero Revista de Cincia da Informao, v. 9, n. 4, ago. 2008. Disponvel em:
<http://www.dgz.org.br/ago08/F_I_art.htm> Acesso em: abril 2009.
CAVALCANTI, C.R. Indexao e tesauro: metodologia e tcnicas. Braslia, ABDF, 1978.
CINTRA, A.M.M.; et al. Para entender as linguagens documentrias. So Paulo: Polis, 2002.
CONWAY, S.; SLIGAR, C. Building Taxonomy. In: Unlocking Knowledge Assets. Washington,
Microsoft Press, 2002. 256 p.
DAHLBERG, I. Teoria do conceito. Cincia da Informao, Rio de Janeiro, v.7, n.2, p.101-107,
1978.

RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

72

DAHLBERG, I. Knowledge Organization. 2006. Disponvel em:


http://www.db.dk/bh/lifeboat_ko/CONCEPTS/knowledge_organization_Dahlberg.htm> Acesso
em: mar. 2008.
HODGE, G. Systems of Knowledge Organization for Digital Libraries: beyond traditional
authorities files. Washington, DC, the Council on Library and Information Resources. 2000.
Disponvel em: <http://www.clir.org/pubs/reports/pub91/contents.htm> Acesso em: 24 maio
2008.
KWASNIK, B. H. The Role of Classification in Knowledge Representation and Discovery 1.
Library Trends. FindArticles.com. 1999. Disponvel em:
<http://findarticles.com/p/articles/mi_m1387/is_1_48/ai_57046525>. Acesso em: mar 2009.
LYON, J. Linguagem e Lingustica: uma introduo. Rio de Janeiro: Guanabara Koogan, 1987.
322 p.
NOY, N. F.; McGUINNESS, D. L. Ontology Development 101: A Guide to Creating Your First
Ontology. Stanford University: Stanford, 2001. Disponvel em:
<http://www.ksl.stanford.edu/people/dlm/papers/ontology101/ontology101- noymcguinness.html> Acesso em: maio 2008.
ROBREDO, J. Documentao de Hoje e de Amanh. 4 ed. rev. e ampl. Braslia: Edio de
autor, 2005, 409 p.
SALES, L. F.; CAMPOS, M. L. de A.; GOMES, H. E. Ontologias de domnio: um estudo das
relaes conceituais. Perspectivas em Cincia da Informao, v. 13, n. 2, p. 62-76, maio/ago.
2008.
SAUSSURE, F. 1977. Curso de Lingstica Geral. So Paulo: Cultrix/USP, 1977.
SVENONIOUS, E. The Intellectual Foundation of Information Organization. London: The MIT
Press, 2000. 254 p.
W3C World Wide Web Consortium. KOS. Disponvel em:
<http://www.w3.org/2004/02/skos/> Acesso em: jan. 2009.

RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.

73

Você também pode gostar